大数据时代的农业科学:基因型与表型数据的标准化、利用与整合


发布时间:

2023-07-05

来源:

植物表型资讯

作者:

PhenoTrait

基因型-表型工作组成立于2021年11月,是AgBioData联盟(https://www.agbiodata.org)的一部分,旨在确定当前在注释和整合大规模基因型和表型数据方面面临的挑战。在这一年中,该工作组成员确定了不同类型的数据集,探索了数据生成的实验平台和方法,并研究了如何对这些数据进行注释,包括元数据要求。我们对每种数据类型的原始数据和处理过的数据的公共资助存储库进行了彻底的审查。我们还研究了几个二级数据库和知识库,这些数据库和知识库能够在基因组浏览器、通路网络和组织特异性基因表达的背景下整合异构数据类型。该综述显示,需要额外的基础设施支持、标准和工具来连接基因型和表型数据,并加强知识合成的数据互操作性,促进转化研究。

 

 图1 基因型与表型数据整合的现状。左边是不同基因型和表型数据的摘要,而右边是植物研究人员使用不同数据类型可以进行的潜在综合分析的列表。

 

图2 活跃、维护和更新的基因组、基因分型和转录数据的公共存储库列表。“+”和“-”符号分别表示支持的数据类型和数据格式的存在和不存在。支持除指定的最常见类型之外的任何数据类型的数据库用“¥”标记。INSDC的源数据库由中国国家基因组学数据中心和中国国家生物信息中心建立和维护;b,印度生物数据中心;c、新西兰商业创新和就业部;d,北卡罗来纳大学教堂山分校,加州数字图书馆;d,欧洲核子研究中心;6、数字科学。hol布里克出版集团,麦克米伦出版有限公司。

 

图3 整合了全基因组数据、基因型、表型、QTL、GWAS和种质数据等各类数据的作物/覆层群落GGB数据库列表。

 

图4 公共存储库,数据库和二级知识库列表托管或整合各种类型的表型,表型组学和分子表型数据。

 

 
来 源

Deng, C.H.; Naithani, S.; Kumari, S.; Cobo-Simon, I.; Quezada-Rodriguez, E.H.; Skrabisova, M.; Gladman, N.; Correll, M.J.; Sikiru, A.B.; Afuwape, O.O.; Marrano, A.; Rebollo, I.; Zhang, W.; Jung, S. Agricultural Sciences in the Big Data Era: Genotype and Phenotype Data Standardization, Utilization and Integration. Preprints.org 2023, 2023061013. https://doi.org/10.20944/preprints202306.1013.v1

 

编辑

王春颖
 

扩展阅读

推荐新闻

石时之约|韩志国:透过表型数据,看见植物的喜怒哀乐!

本期石时之约,我们将对话慧诺瑞德(北京)科技有限公司总经理、国际植物表型学会(IPPN)执委会委员/工业分会副主席韩志国,一起从表型数据的科学角度,去读懂农作物的喜怒哀乐和前世今生。

慧科研、慧育种、慧种田——慧聚改变的力量

让我们“慧聚”在一起,为“慧科研、慧育种、慧种田”赋能。

高通量植物表型平台建设注意事项

育种,是在给定的环境条件下,选择各种表型指标(产量、品质、抗性)最优的基因型材料的过程(AI育种,从这里起步)。育种工作中大约70%的工作量来自表型观察测量和筛选,是最耗人力物力的过程。

作物生理表型测量基础原理

生理表型测量的核心在于“早、快”,要在肉眼可见之前就能测量并预判出变化趋势,才是这个技术的核心价值。叶绿素荧光成像,恰好满足了这个要求。