学术中心
影响表型预测的因素:以大型高粱 BCNAM 种群为例
发布时间:
2025-05-28
来源:
作者:
植物育种效率对于开发能够应对气候变化并支持品种选育至关重要。基因组预测(Genomic prediction,GP)是提高这一效率的重要一步,现已用于育种计划中。最近,表型预测(Phenomic prediction,PP)作为GP的一种有前途的补充方法而受到关注,进一步提高了育种计划的效率。已经在许多物种上研究了影响PP预测能力(Predictive ability,PA)的因素,但是还没有完全阐明。在此背景下,研究了光谱预处理、预测方法、群体结构、训练集大小、NIRS获取环境和波长选择对包括2498个基因型的多亲本高粱群体的影响。结果表明,PP可以与GP竞争,它受种群结构的影响较小,并且可以用比GP更少的训练集达到其最大PA,但其性能是性状依赖的。并且,可以在参考环境中获得NIRS,以在其他环境中进行预测,并且可以随机选择少至10个波长来进行预测。最后,光谱预处理和统计方法对PA的影响有限且不明确。研究证实,为优化育种方案,PP是一种值得关注的性状预测方法。未来的主要挑战将是更好地理解光谱中包含的信息,并理清它们的遗传和代理成分,以优化PP在育种计划中的使用。
图1 数据、交叉验证方案和研究因素的示意图。
图2 2012年和2013年所研究性状和波长沿光谱的方差划分。RESIDUAL、ENV、CROSS和GENO代表对表型变异有贡献的因子。黑色的数字是性状的遗传度。
图3 光谱预处理对物候预测能力的影响。预测能力是在CV2情景中使用GBLUP计算的,2012年的训练集规模为1000,2013年为450。字母代表通过Bonferroni方法校正的阈值为5%的成对Wilcoxon检验的结果。GENO =基因组预测,RAW =用原始光谱的现象预测,DER1和DER2 =用光谱的一阶和二阶导数的现象预测,DET =用去趋势处理的光谱的现象预测,SNV =用标准正态变量方法处理的光谱的现象预测。水平虚线处于0值。FLAG =旗叶外观,NIN =节间数,PAN =穗长,PED =花序梗长,PH =株高,STEM=茎长,YIELD=产量。
图4 统计方法对预测能力的影响。预测能力是在CV2方案中计算的,2012年的训练集规模为1000,2013年为450,光谱用SNV预处理。字母代表通过Bonferroni方法校正的阈值为5%的成对Wilcoxon检验的结果。水平虚线处于0值。
图5 训练集大小对预测能力的影响。预测能力是用2012年的数据计算的,在CV2情景中使用GBLUP,光谱用SNV预处理。水平虚线处于0值。
图6 群体结构对预测能力的影响。预测能力使用2012年的数据进行计算,使用GBLUP情景,训练集大小为100,光谱用SNV预处理。水平虚线处于0值。字母代表通过Bonferroni方法校正的阈值为5%的成对Wilcoxon检验的结果。CV1 =内部交叉5重交叉验证,CV2 =内部轮回亲本留一个交叉验证,CV3 =内部轮回亲本交叉验证。
图7 NIRS采集环境对预测能力的影响。使用训练集大小为600的GBLUP和用SNV预处理的光谱计算预测能力。CV2_2012是参考模型,在2012年数据的CV2场景中,训练集中有600个人,光谱用SNV预处理。CV4_2012 =根据2013年数据训练并根据2012年数据验证的模型,CV4_2013 =根据2012年数据训练并根据2013年数据验证的模型。
图8 波长选择对预测能力的影响。预测能力在CV2情景中使用GBLUP,2012年训练集规模为1000,2013年为450,光谱用SNV预处理。波长随机选择(RAND),或使用LASSO和PLS模型选择。PHENO_ALL是对所有波长的现象预测,GENO是基因组预测。
ClémentBienvenu, Vincent Garin, Nicolas Salas, et al. Factors Influencing Phenomic Prediction: A Case Study on a Large Sorghum BCNAM Population. bioRxiv.
编辑
王春颖
推荐新闻
视频展示