高光谱成像结合机器学习用于冬小麦高通量表型分析


发布时间:

2024-08-02

来源:

作者:

无人驾驶飞行器(UAV)是一种非常成功和有效的植物育种计划表型分析方法。本研究探索了使用配备高光谱传感器的无人机来加快育种者在选择生长、生物量、叶面积和冠层覆盖率得到改善的冬小麦基因型方面的决策。该研究对2145个冬小麦基因型进行了研究,并使用基于无人机的高光谱测量来预测表型。反射率测量在窄波长间隔下进行,跨越400-2500 nm。为了进行地面实况调查,从该领域的不同部分收集了样本。这些样品被用来评估各种植物属性,包括CC,叶面积指数,株高,和干生物量。高光谱数据用于计算多个植被指数(维斯),并提高植物性状的预测,采用偏最小二乘回归(PLSR)和随机森林(RF)回归技术的高光谱变量的完整集合和前10个派生的维斯。研究结果显示,双峰冠层氮指数和归一化红边差异指数是预测冬小麦生长参数的有效植被指数,且完整高光谱变量构建的模型在预测性能上优于仅使用植被指数的模型,表明高光谱成像与机器学习结合为高通量表型分析提供了强大工具。

 

图1  位于俄克拉荷马州斯蒂尔沃特的实验地点。这项研究是在俄克拉荷马州州立大学的农学研究站进行的。右边的插图提供了实验场的详细视图。

 

图2  种植后44周的每周温度(最高温度、最低温度、平均温度,单位:℃)和降雨量(mm)数据,描述了整个生长季节环境条件的波动和变化。

 

图3  无人机遥感平台,搭载推扫式高光谱传感器。

 

表1  高光谱共对准可见光和近红外-短波红外(VNIR-SWIR)成像传感器。

 

图4  UF HiperGator-RV上用于高光谱成像的图像处理管道。

 

图5 原始图像到反射图像的转换。顶行从左到右示出了来自高光谱传感器的原始图像、辐射图像和反射图像。最下面一行显示了它们相应的光谱曲线,绘制了强度或反射率(y轴)与波长(x轴)的关系。

 

图6  冬小麦研究区的原始和后处理(平滑轨迹的最佳估计[SBET])轨迹。原始轨迹(粉红色)表示飞行期间收集的初始未细化数据。使用POSPac无人机软件处理的SBET轨迹(绿色)显示了精确的位置路径。

 

表2  本研究中使用的光谱指数。

 

图7 冬小麦育种苗圃的多重正射校正图像。

 

图8 冬小麦育种圃地块的形状文件。

 

表3  现场测量的基本数据。

缩写:LAI,叶面积指数。

 

图9 综合各时期数据得出的各性状与植被指数的相关系数。DCNI,双峰冠层氮指数; DVI 1,800和680 nm的反射率差异; DVI 2,750和680 nm的反射率差异; DVI 3,550和680 nm的反射率差异; EVI,增强植被指数; EVI 2,增强植被指数2; GI,绿度指数; LAIDI,LAI决定指数; LAI,叶面积指数; MSAVI,修正的土壤调整植被指数; MTVI 1,修正的三角植被指数1; MTVI 2,修正的三角植被指数2; NDII,归一化差分红外线指数; NDRE,归一化差分红边指数; NDVI,归一化差分植被指数; NDWI,归一化差分水指数; OSAVI,优化土壤调整植被指数; PSND,色素特异性归一化差异; RVI,比率植被指数; SAVI,土壤调整植被指数; SLAIDI,标准化LAI确定指数; SPVI,光谱多边形植被指数; TVI,转换植被指数; WDRVI,宽动态范围植被指数。

 

表4 利用普通最小二乘模型计算不同响应变量与光谱指数之间Pearson相关系数的平方。

 

表5 偏最小二乘回归(PLSR)和随机森林(RF)模型的建模变量和统计量,包括PLSR的分量数、RF的ntree和mtry值,以及PLSR和RF模型两者的R2和均方根误差(RMSE)值与所有高光谱变量,比较测试数据的观察和预测的植物性状。

 

表6偏最小二乘回归(PLSR)和随机森林(RF)模型的建模变量和统计量,包括PLSR的分量数、RF的ntree和mtry值,以及PLSR和RF模型的R2和均方根误差(RMSE)值,其中植被指数(维斯)作为预测变量,比较了试验数据的观察和预测植物性状。

 

图10 使用偏最小二乘回归(PLSR)模型与所有高光谱变量的不同性状的预测值和观察值之间的关系。(A)LAI(r)(叶面积指数),(B)生物量,(C)冠层覆盖度,(D)LAI(s),(E)株高。不同颜色的数据点代表在不同日期采集的样本。LAI(s)表示使用LAI-2200植物冠层分析仪收集的非破坏性数据,而LAI(r)表示通过LI-3100 C面积计获得的破坏性数据。RMSE,均方根平均误差。

 

图11 以植被指数(维斯)作为预测变量,使用偏最小二乘回归(PLSR)模型,不同性状的预测值与观测值之间的关系。(A)LAI(r)(叶面积指数),(B)生物量,(C)冠层覆盖度,(D)LAI(s),(E)株高。不同颜色的数据点代表在不同日期采集的样本。LAI(s)表示使用LAI-2200植物冠层分析仪收集的非破坏性数据,而LAI(r)表示通过LI-3100 C面积计获得的破坏性数据。RMSE,均方根平均误差。

 

图12 使用具有所有高光谱变量的随机森林(RF)模型的不同性状的预测值和观察值之间的关系。(A)LAI(r)(叶面积指数),(B)生物量,(C)冠层覆盖度,(D)LAI(s),(E)株高。不同颜色的数据点代表在不同日期采集的样本。LAI(s)表示使用LAI-2200植物冠层分析仪收集的非破坏性数据,而LAI(r)表示通过LI-3100 C面积计获得的破坏性数据。RMSE,均方根平均误差。

 

图13 以植被指数(维斯)为预测变量的随机森林(RF)模型中不同性状的预测值与观测值之间的关系。(A)LAI(r)(叶面积指数),(B)生物量,(C)冠层覆盖度,(D)LAI(s),(E)株高。不同颜色的数据点代表在不同日期采集的样本。LAI(s)表示使用LAI-2200植物冠层分析仪收集的非破坏性数据,而LAI(r)表示通过LI-3100 C面积计获得的破坏性数据。RMSE,均方根平均误差。

 

来 源

Kaur, S., Kakani, V. G., Carver, B., Jarquin, D., & Singh, A. (2024). Hyperspectral imaging combined with machine learning for high-throughput phenotyping in winter wheat. The Plant Phenome Journal, 7, e20111. https://doi.org/10.1002/ppj2.20111 

 

编辑

小丸子

推荐新闻

石时之约|韩志国:透过表型数据,看见植物的喜怒哀乐!

本期石时之约,我们将对话慧诺瑞德(北京)科技有限公司总经理、国际植物表型学会(IPPN)执委会委员/工业分会副主席韩志国,一起从表型数据的科学角度,去读懂农作物的喜怒哀乐和前世今生。

慧科研、慧育种、慧种田——慧聚改变的力量

让我们“慧聚”在一起,为“慧科研、慧育种、慧种田”赋能。

高通量植物表型平台建设注意事项

育种,是在给定的环境条件下,选择各种表型指标(产量、品质、抗性)最优的基因型材料的过程(AI育种,从这里起步)。育种工作中大约70%的工作量来自表型观察测量和筛选,是最耗人力物力的过程。

作物生理表型测量基础原理

生理表型测量的核心在于“早、快”,要在肉眼可见之前就能测量并预判出变化趋势,才是这个技术的核心价值。叶绿素荧光成像,恰好满足了这个要求。