FAIR数据的优势和挑战:植物表型数据再利用案例


发布时间:

2025-11-28

来源:

作者:

植物表型试验为达到不同目的通常设置各种参数。因此,植物表型试验产生的数据是异类、复杂的,通常存档程度低,因此难以重复使用。当前需要更有效的方法实现数据的集成和再利用。
 
为了改善全球数据状况,本研究探讨了创建可查找、可扩展、可交互、可再利用(Findable, Accessible, Interoperable, Reusable, FAIR)数据的必要性。其研究思路为:假设在FAIR数据点上发现一个表型数据集,利用环境数据验证相关数据集的存在,获取两者并进行整合。作者以马铃薯基因型-环境互作和QTL-环境互作的性状为例,探讨了FAIR数据的再利用和创建FAIR数据的优势和挑战,以及利用MIAPPE等元数据标准对现有数据集进行FAIR化的再利用和可重复性潜力。
 

 图1. 以FAIR的方式定位、获取、检查和重用数据的步骤

 

 图2. FDP元数据规范数据集级别的图示(左图),以及本文使用MIAPPE元数据对其进行的扩展(右图-不完整)

 

 图3. FDP的结构

 

 图4. 在实验的图中比较/总结性状需要采取必要步骤

 

 图5. (a) 每次实验中292个基因型平均产出的块茎总重; (b)每个实验中每个基因型平均产生的块茎总重的图表

 

 图6. 每个基因型的最佳和最差性能

 

 图7. 2010年埃塞俄比亚实验的部分实验数据文件

 

图8. 数据集1的元数据。黑框表示FDP数据集元数据规范。其他所有内容(绿框)均来自MIAPPE(不完整),在此处添加是为了表示此数据集的具体内容。最后,通过指向SPARQL分发的链接找到托管相关数据集的SPARQL端点的URL用于检索。

 

表1. 两个数据集及其构成要素和其他属性

 

 表2. 获取每项研究的特定研究值

 

 表3. 计算每个实验和每个气象站的坐标之间的差值的查询

 
来 源

Papoutsoglou E. A., Athanasiadis I. N., Visser R. G. F., Finkers R., 2023. The benefits and struggles of FAIR data: the case of reusing plant phenotyping data. Scientific Data, 10(1): 457.

 

编辑

JAYz

推荐新闻

石时之约|韩志国:透过表型数据,看见植物的喜怒哀乐!

本期石时之约,我们将对话慧诺瑞德(北京)科技有限公司总经理、国际植物表型学会(IPPN)执委会委员/工业分会副主席韩志国,一起从表型数据的科学角度,去读懂农作物的喜怒哀乐和前世今生。

慧科研、慧育种、慧种田——慧聚改变的力量

让我们“慧聚”在一起,为“慧科研、慧育种、慧种田”赋能。

高通量植物表型平台建设注意事项

育种,是在给定的环境条件下,选择各种表型指标(产量、品质、抗性)最优的基因型材料的过程(AI育种,从这里起步)。育种工作中大约70%的工作量来自表型观察测量和筛选,是最耗人力物力的过程。

作物生理表型测量基础原理

生理表型测量的核心在于“早、快”,要在肉眼可见之前就能测量并预判出变化趋势,才是这个技术的核心价值。叶绿素荧光成像,恰好满足了这个要求。