学术中心
大数据时代的农业科学:基因型与表型数据的标准化、利用与整合
发布时间:
2023-07-05
来源:
植物表型资讯
作者:
PhenoTrait
基因型-表型工作组成立于2021年11月,是AgBioData联盟(https://www.agbiodata.org)的一部分,旨在确定当前在注释和整合大规模基因型和表型数据方面面临的挑战。在这一年中,该工作组成员确定了不同类型的数据集,探索了数据生成的实验平台和方法,并研究了如何对这些数据进行注释,包括元数据要求。我们对每种数据类型的原始数据和处理过的数据的公共资助存储库进行了彻底的审查。我们还研究了几个二级数据库和知识库,这些数据库和知识库能够在基因组浏览器、通路网络和组织特异性基因表达的背景下整合异构数据类型。该综述显示,需要额外的基础设施支持、标准和工具来连接基因型和表型数据,并加强知识合成的数据互操作性,促进转化研究。
图1 基因型与表型数据整合的现状。左边是不同基因型和表型数据的摘要,而右边是植物研究人员使用不同数据类型可以进行的潜在综合分析的列表。
图2 活跃、维护和更新的基因组、基因分型和转录数据的公共存储库列表。“+”和“-”符号分别表示支持的数据类型和数据格式的存在和不存在。支持除指定的最常见类型之外的任何数据类型的数据库用“¥”标记。INSDC的源数据库由中国国家基因组学数据中心和中国国家生物信息中心建立和维护;b,印度生物数据中心;c、新西兰商业创新和就业部;d,北卡罗来纳大学教堂山分校,加州数字图书馆;d,欧洲核子研究中心;6、数字科学。hol布里克出版集团,麦克米伦出版有限公司。

图3 整合了全基因组数据、基因型、表型、QTL、GWAS和种质数据等各类数据的作物/覆层群落GGB数据库列表。



图4 公共存储库,数据库和二级知识库列表托管或整合各种类型的表型,表型组学和分子表型数据。
Deng, C.H.; Naithani, S.; Kumari, S.; Cobo-Simon, I.; Quezada-Rodriguez, E.H.; Skrabisova, M.; Gladman, N.; Correll, M.J.; Sikiru, A.B.; Afuwape, O.O.; Marrano, A.; Rebollo, I.; Zhang, W.; Jung, S. Agricultural Sciences in the Big Data Era: Genotype and Phenotype Data Standardization, Utilization and Integration. Preprints.org 2023, 2023061013. https://doi.org/10.20944/preprints202306.1013.v1
编辑
扩展阅读
推荐新闻
视频展示