影响表型预测的因素:以大型高粱 BCNAM 种群为例


发布时间:

2025-05-28

来源:

作者:

植物育种效率对于开发能够应对气候变化并支持品种选育至关重要。基因组预测(Genomic prediction,GP)是提高这一效率的重要一步,现已用于育种计划中。最近,表型预测(Phenomic prediction,PP)作为GP的一种有前途的补充方法而受到关注,进一步提高了育种计划的效率。已经在许多物种上研究了影响PP预测能力(Predictive ability,PA)的因素,但是还没有完全阐明。在此背景下,研究了光谱预处理、预测方法、群体结构、训练集大小、NIRS获取环境和波长选择对包括2498个基因型的多亲本高粱群体的影响。结果表明,PP可以与GP竞争,它受种群结构的影响较小,并且可以用比GP更少的训练集达到其最大PA,但其性能是性状依赖的。并且,可以在参考环境中获得NIRS,以在其他环境中进行预测,并且可以随机选择少至10个波长来进行预测。最后,光谱预处理和统计方法对PA的影响有限且不明确。研究证实,为优化育种方案,PP是一种值得关注的性状预测方法。未来的主要挑战将是更好地理解光谱中包含的信息,并理清它们的遗传和代理成分,以优化PP在育种计划中的使用。

  

图1  数据、交叉验证方案和研究因素的示意图。

 

图2  2012年和2013年所研究性状和波长沿光谱的方差划分。RESIDUAL、ENV、CROSS和GENO代表对表型变异有贡献的因子。黑色的数字是性状的遗传度。

 

图3  光谱预处理对物候预测能力的影响。预测能力是在CV2情景中使用GBLUP计算的,2012年的训练集规模为1000,2013年为450。字母代表通过Bonferroni方法校正的阈值为5%的成对Wilcoxon检验的结果。GENO =基因组预测,RAW =用原始光谱的现象预测,DER1和DER2 =用光谱的一阶和二阶导数的现象预测,DET =用去趋势处理的光谱的现象预测,SNV =用标准正态变量方法处理的光谱的现象预测。水平虚线处于0值。FLAG =旗叶外观,NIN =节间数,PAN =穗长,PED =花序梗长,PH =株高,STEM=茎长,YIELD=产量。

 

图4  统计方法对预测能力的影响。预测能力是在CV2方案中计算的,2012年的训练集规模为1000,2013年为450,光谱用SNV预处理。字母代表通过Bonferroni方法校正的阈值为5%的成对Wilcoxon检验的结果。水平虚线处于0值。

 

图5  训练集大小对预测能力的影响。预测能力是用2012年的数据计算的,在CV2情景中使用GBLUP,光谱用SNV预处理。水平虚线处于0值。

 

图6  群体结构对预测能力的影响。预测能力使用2012年的数据进行计算,使用GBLUP情景,训练集大小为100,光谱用SNV预处理。水平虚线处于0值。字母代表通过Bonferroni方法校正的阈值为5%的成对Wilcoxon检验的结果。CV1 =内部交叉5重交叉验证,CV2 =内部轮回亲本留一个交叉验证,CV3 =内部轮回亲本交叉验证。

 

图7  NIRS采集环境对预测能力的影响。使用训练集大小为600的GBLUP和用SNV预处理的光谱计算预测能力。CV2_2012是参考模型,在2012年数据的CV2场景中,训练集中有600个人,光谱用SNV预处理。CV4_2012 =根据2013年数据训练并根据2012年数据验证的模型,CV4_2013 =根据2012年数据训练并根据2013年数据验证的模型。

 

 图8  波长选择对预测能力的影响。预测能力在CV2情景中使用GBLUP,2012年训练集规模为1000,2013年为450,光谱用SNV预处理。波长随机选择(RAND),或使用LASSO和PLS模型选择。PHENO_ALL是对所有波长的现象预测,GENO是基因组预测。

 
来 源

ClémentBienvenu, Vincent Garin, Nicolas Salas, et al. Factors Influencing Phenomic Prediction: A Case Study on a Large Sorghum BCNAM Population. bioRxiv. 

 

编辑

王春颖

推荐新闻

石时之约|韩志国:透过表型数据,看见植物的喜怒哀乐!

本期石时之约,我们将对话慧诺瑞德(北京)科技有限公司总经理、国际植物表型学会(IPPN)执委会委员/工业分会副主席韩志国,一起从表型数据的科学角度,去读懂农作物的喜怒哀乐和前世今生。

慧科研、慧育种、慧种田——慧聚改变的力量

让我们“慧聚”在一起,为“慧科研、慧育种、慧种田”赋能。

高通量植物表型平台建设注意事项

育种,是在给定的环境条件下,选择各种表型指标(产量、品质、抗性)最优的基因型材料的过程(AI育种,从这里起步)。育种工作中大约70%的工作量来自表型观察测量和筛选,是最耗人力物力的过程。

作物生理表型测量基础原理

生理表型测量的核心在于“早、快”,要在肉眼可见之前就能测量并预判出变化趋势,才是这个技术的核心价值。叶绿素荧光成像,恰好满足了这个要求。