高粱育种计划中持绿性状的高通量表型分析


发布时间:

2025-04-17

来源:

作者:

随着气候变化继续影响全球天气模式,干旱情况的频率和严重程度预计会增加,对作物生产构成重大挑战。对于一种重要的谷类作物高粱 (Sorghum bicolor L. Moench) 来说,持绿性状尤为重要,因为它可以衡量一种基因型对开花后干旱条件的耐受程度,而干旱条件对可收获产量至关重要。尽管持绿性状很重要,但迫切需要一种更有效、更准确、更精确的方法来对高粱的持绿性状进行表型分析,以加强育种工作。为了满足这一需求,本研究探索了随机森林和 XGBoost 机器学习模型在高粱持绿性状表型分析中的应用。这些模型提供了定量测量,有可能增强基因组研究并提供额外的好处。虽然与植被指数的相关性有时很高,但它们的可靠性不足以单独使用。相比之下,机器学习模型显示出高比例的遗传变异解释,并且具有很高的可重复性。这些算法生成的值,使植物育种者能够有效地在其持绿育种计划中进行选择。需要进一步研究来评估这些模型在不同环境和遗传物质中的稳健性。此外,将这些模型与其他机器学习方法进行比较将有助于确定基于决策树的模型是否最适合此应用。总体而言,本研究中提出的模型为提高高粱持绿育种计划的效率奠定了良好的基础,但它们需要进一步验证和与其他方法进行比较。

 

图1  实验的空中田野地图。该空中地图显示了用于本研究的持绿试验的视觉概览。红色框勾勒出研究的具体区域。
 
  图2  持绿摄影测量和机器学习的工作流程。该图概述了通过遥感收集图像的过程。原始飞行数据通过此工作流程传输,并用于生成机器学习模型。这些机器学习模型生成预测的持绿值,用于下游分析。
 
图3  地块提取和植被指数计算的工作流程。使用 QGIS 中的栅格处理掩模提取地块,然后使用植被掩模。最后,使用红、绿、蓝光谱带在最终图像掩模上计算植被指数数组。CIVE,植被提取的颜色指数;ExG,过量绿色指数;ExGR,过量绿色减去过量红色;GLI,绿叶指数;NGBDI,归一化蓝红差异指数;NGRDI,归一化绿红差异指数。
 
图4  高粱光谱带和指数与持绿性的相关热图。这可以直观比较各种植被指数或遥感特征与高粱持绿性或花后耐旱性的皮尔逊相关系数(-1.00 到 1.00)。这些数据显示了无人机 (UAV) 飞行与种植后 85 天(DAP)获得的持绿地面真实估计值的相关性。CIVE,植被提取的颜色指数;ExG,过量绿色指数;ExGR,过量绿色减去过量红色;ExR,过量红色指数;GBRI,绿蓝比率指数;GLI,绿叶指数;MGRVI,修改后的绿红植被指数;NGBDI,归一化蓝红差异指数;NGRDI,归一化绿红差异指数;RGBVI,红绿蓝植被指数;RGRI,红绿比率指数;VARI,可见大气抗性指数; VEG,植被指数;TGI,三角绿度指数。
 
图5  高粱持绿性地面实况 (GT) 测量值和随机森林预测值的变异百分比。此堆叠条形图显示了使用随机森林 (RF) 模型时,每个方差分量解释高粱持绿性的总方差百分比。这些数据来自一个全随机模型,其中包括基因型、重复、行、范围和未分区误差。针对三个数据收集日期(早期、中期和晚期)及其组合,比较地面实况测量值(持绿性 GT)、基本模型(红色、绿色和蓝色光谱带)、增强模型(RGB 和来自数字表面地图的植物高度)或增强型 T 模型(通过添加热数据进行增强)。
 
图6  高粱持绿性地面实况 (GT) 测量值和极端梯度提升 (XGBoost) 预测值的变异百分比。此堆叠条形图显示了使用 XGBoost 模型对高粱持绿性进行解释时,每个方差分量占总方差的百分比。
 
图7  高粱持绿随机森林模型的混淆矩阵。这些混淆矩阵显示了随机森林 (RF) 机器学习模型得出的预测保绿值与种植后 85 天 (DAP) 在田间收集的持绿真实值 (保绿 GT) 之间的比较。模型包括一次 (85 DAP)、两次 (24 DAP 和 85 DAP) 或三次飞行 (24 DAP、50 DAP 和 85 DAP)。用于训练 RF 模型的特征集是基本 (仅红色、绿色和蓝色像素数据) 或增强 (RGB 和从数字表面地图得出的冠层高度估计值)。保绿分数分为高度保绿、中度保绿、中度衰老或高度衰老类别。RGB,红-绿-蓝。
 
 图8  高粱持绿的极端梯度提升 (XGBoost) 模型的混淆矩阵。这些混淆矩阵显示了 XGBoost (XGB) 机器学习模型得出的预测持绿值与种植后 85 天 (DAP) 在田间收集的持绿真实值 (持绿 GT) 之间的比较。
 

来源

Pugh, N. A., Young, A., Emendack, Y., Sanchez, J., Xin, Z., & Hayes, C. (2025). High-throughput phenotyping of stay-green in a sorghum breeding program using unmanned aerial vehicles and machine learning. The Plant Phenome Journal, 8, e70014. 

 

编辑

王春颖

推荐新闻

石时之约|韩志国:透过表型数据,看见植物的喜怒哀乐!

本期石时之约,我们将对话慧诺瑞德(北京)科技有限公司总经理、国际植物表型学会(IPPN)执委会委员/工业分会副主席韩志国,一起从表型数据的科学角度,去读懂农作物的喜怒哀乐和前世今生。

慧科研、慧育种、慧种田——慧聚改变的力量

让我们“慧聚”在一起,为“慧科研、慧育种、慧种田”赋能。

高通量植物表型平台建设注意事项

育种,是在给定的环境条件下,选择各种表型指标(产量、品质、抗性)最优的基因型材料的过程(AI育种,从这里起步)。育种工作中大约70%的工作量来自表型观察测量和筛选,是最耗人力物力的过程。

作物生理表型测量基础原理

生理表型测量的核心在于“早、快”,要在肉眼可见之前就能测量并预判出变化趋势,才是这个技术的核心价值。叶绿素荧光成像,恰好满足了这个要求。