小麦育种中的表型组选择:识别和优化影响预测精度的因素及与基因组选择的比较


发布时间:

2022-01-22

来源:

本站

作者:

PhenoTrait

  本文利用四个冬小麦数据集评估了表型组选择对产量(GY)和抽穗期(HD)性状的预测能力,并确定了可能影响其预测能力的因素。在同一自交系(A)的不同阶段(不同世代)采集了三类近红外光谱:与获取表型获相同环境(地点×年)、不同地点、上一年份的光谱S、D和Y,并以这三类光谱作为预测变量,建立了三个预测模型(S,D,Y)。

 

  图1.三类光谱及表型数据采集、筛选、模型预测图

 

  利用建成的两类模型(H-BLUP、PS-LASSO)对四个小麦数据集(Set1-Set4)的产量(GY)和抽穗期(HD)性状进行预测。模型预测基于5次交叉验证,重复25次。结果表明,特定的波长可能与HD特征有关。PS-Lasso对Set1-3的抽穗期性状平均预测能力(PA)比H-BLUP高13.4%,其PA的四分位数范围较H-BLUP窄。此外,H-BLUP和PSLASSO对GY具有相似的PA,且每组小麦基因型的方差相似。

 

  图2. H-BLUP、PS-LASSO模型对四组小麦产量和抽穗期性状的预测能力。其中,粗横线表示平均值、箱体表示上三分位数、箱线表示上九分位数,N为用于评价预测能力的环境变量

 

  利用三类近红外光谱及其组合建模并进行性状预测。在子集SD上,相同环境下的光谱比光谱D和光谱Y对产量性状预测能力高,组合光谱CbSD和光谱S对产量的预测准确性趋于一致(图3A);光谱S和光谱D对抽穗期性状具有相近预测能力(图3B)。在子集SDY上,两个性状的预测精度大多与单一数据的模型相当(图3C-D)。

 

  图3. 不同近红外光谱数据及组合的预测性能

 

  在多近红外光谱模型中增加近红外光谱可以提高PA,但在PA的边际增益随着引入更多的近红外光谱而降低。对于GY,在模型原始近红外光谱中连续增加一个近红外光谱分别使PA增加12.0%、3.7%、1.4%和2.0%。HD具有相同且增益更高的趋势,分别为57.0%,22.0%,15.0%和2.5%。

 

  图4.引入近红外光谱数对多个近红外光谱模型组合预测能力的影响

 

  利用多近红外光谱模型(CbSD,CbSY)和基于分子标记的G-BLUP模型(M)进行预测。该模型结合了来自标记和近红外光谱(CBSD+M,CbSY+M)的信息。对于这两个性状,模型CbSD和CbSY在子集SDM上优于M(图5)。考虑所有组别,48%的PS预测GY优于GS,62%的PS预测HD优于GS。另外,结合了标记和近红外光谱数据的GH-BLUP模型在所有组别中是预测精度最高的模型(预测能力为0.31~0.73)。

 

  图5. GS和PS预测能力的比较

 

  本文建立了结合不同环境和结合基因标记与光谱数据的模型,突出了光谱来源的关键性,表明在统计模型中集成不同类型的高通量表型和多组学信息可以作为提高非基因型个体选择准确率的有效方法。

 

  来源:Robert, P., Auzanneau, J., Goudemand, E. et al. Phenomic selection in wheat breeding: identification and optimisation of factors influencing prediction accuracy and comparison to genomic selection. Theor Appl Genet (2022). https://doi.org/10.1007/s00122-021-04005-8

  

  编辑:李红叶

推荐新闻

石时之约|韩志国:透过表型数据,看见植物的喜怒哀乐!

本期石时之约,我们将对话慧诺瑞德(北京)科技有限公司总经理、国际植物表型学会(IPPN)执委会委员/工业分会副主席韩志国,一起从表型数据的科学角度,去读懂农作物的喜怒哀乐和前世今生。

慧科研、慧育种、慧种田——慧聚改变的力量

让我们“慧聚”在一起,为“慧科研、慧育种、慧种田”赋能。

高通量植物表型平台建设注意事项

育种,是在给定的环境条件下,选择各种表型指标(产量、品质、抗性)最优的基因型材料的过程(AI育种,从这里起步)。育种工作中大约70%的工作量来自表型观察测量和筛选,是最耗人力物力的过程。

作物生理表型测量基础原理

生理表型测量的核心在于“早、快”,要在肉眼可见之前就能测量并预判出变化趋势,才是这个技术的核心价值。叶绿素荧光成像,恰好满足了这个要求。