DNNGP——基于深度学习的全基因组选择新方法


发布时间:

2022-12-06

来源:

植物表型资讯

作者:

PhenoTrait

近日,中国农业科学院作物科学研究所/三亚南繁研究院大数据智能设计育种创新团队联合多家单位提出利用植物海量多组学数据进行全基因组预测的深度学习方法(Deep Neural Network for Genomic Prediction, 简称DNNGP),可以实现育种大数据的高效整合与利用,将助力深度学习在全基因组选择中的应用,为智能设计育种及平台构建提供有效工具。相关研究成果在《分子植物(Molecular Plant)》上在线发表。

 

全基因组选择作为新一代育种技术,通过构建预测模型,根据基因组估计育种值进行早期个体的预测和选择,从而缩短育种世代间隔,加快育种进程,节约成本,推动现代育种向精准化和高效化方向发展。统计模型作为全基因组选择的核心,极大地影响了全基因组预测的准确度和效率。传统预测方法基于线性回归模型,难以捕捉基因型和表型间的复杂关系。相较于传统模型,非线性模型(如深度网络神经)具备分析复杂非加性效应的能力,人工智能和深度学习算法为解决大数据分析和高性能并行运算等难题提供了新的契机,深度学习算法的优化将会提高全基因组选择的预测能力。

 

研究团队以玉米、小麦和番茄四种不同维度的群体数据为测试材料,通过创新深度学习算法框架开发了全基因组选择新方法DNNGP。与其他五种主流预测方法(即:基于线性模型的GBLUP;基于机器学习的LightGBM和SVR;基于深度学习的DeepGS和DLGWAS)相比,DNNGP有以下优点:可以利用多组学数据开展全基因组预测;算法设计中包含批归一化层、回调函数和校正线性激活函数等结构,可以有效降低模型错误率,提高运行速度;预测精度稳健,在小型数据集上的表现与目前主流预测模型相当,在大规模数据集上预测优势更加明显;计算时间与传统方法相近,比已有深度学习方法提速近10倍;超参数调整对用户更加友好。DNNGP针对具有复杂结构的海量数据进行高效数学建模,实现了育种大数据的高效整合与利用,将助力深度学习在全基因组选择中的应用,为智能设计育种及平台构建提供有效工具。

DNNGP与DeepGS和DLGWAS的算法框架对比

 

来 源

Wang K., Abid M.A., Rasheed A., Crossa J., Hearne S., and Li H. (2022). DNNGP, a deep neural network-based method for genomic prediction using multi-omics data in plants. Mol. Plant. doi: https://doi.org/10.1016/j.molp.2022.11.004.

 

作者介绍

作科所已毕业硕士研究生王轲麟为本文第一作者,团队首席李慧慧研究员为通讯作者。研究得到了国家重点研发计划、国家自然科学基金、海南崖州湾种子实验室和中国农业科学院科技创新工程等项目资助。

 

扩展阅读

推荐新闻

石时之约|韩志国:透过表型数据,看见植物的喜怒哀乐!

本期石时之约,我们将对话慧诺瑞德(北京)科技有限公司总经理、国际植物表型学会(IPPN)执委会委员/工业分会副主席韩志国,一起从表型数据的科学角度,去读懂农作物的喜怒哀乐和前世今生。

慧科研、慧育种、慧种田——慧聚改变的力量

让我们“慧聚”在一起,为“慧科研、慧育种、慧种田”赋能。

高通量植物表型平台建设注意事项

育种,是在给定的环境条件下,选择各种表型指标(产量、品质、抗性)最优的基因型材料的过程(AI育种,从这里起步)。育种工作中大约70%的工作量来自表型观察测量和筛选,是最耗人力物力的过程。

作物生理表型测量基础原理

生理表型测量的核心在于“早、快”,要在肉眼可见之前就能测量并预判出变化趋势,才是这个技术的核心价值。叶绿素荧光成像,恰好满足了这个要求。