利用机器学习模型和时间无人机数据进行大豆新鲜生物量无损估计的高通量表型分析


发布时间:

2023-10-01

来源:

本站

作者:

PhenoTrait

背景:生物量积累作为一个生长指标,对实现大豆高产稳产具有重要意义。更健壮的基因型更有潜力利用可利用的资源,如水或阳光。生物量数据作为大豆育种计划中的一个新性状,可能有利于选择对杂草更具竞争力和辐射利用效率更高的品种。生物量测定的标准技术是损害性的、低效的,并且局限于每个地块的一个时间点。基于多光谱(Ms)图像的机器学习模型(MLMs)被创建,以克服这些问题,并为大豆鲜生物量(FB)的季节估计提供无损、快速和准确的工具。MS照片是在10个大豆品种的两个生长季节期间,使用安装在无人机(UAV)上的六传感器数码相机拍摄的。对于模型校准,从图像中提取冠层覆盖(CC)、植物高度(PH)和31个植被指数(VI ),并在随机森林(RF)和偏最小二乘回归(PLSR)算法中用作预测因子。为了创建一个更有效的模型,高度相关的视觉指数被排除,只有三角形绿色指数(TGI)和绿色叶绿素指数(GCI)仍然存在。

 

结果:与PLSR(平均绝对误差= 0.20 kg/m²)相比,射频(平均绝对误差= 0.17 kg/m²)获得了更精确的结果,且平均绝对误差(MAE)更低。仅使用四个预测器(CC、PH和两个VIs)就实现了大豆FB预测的高准确度。在干旱模拟环境中对一组独立的大豆基因型进行了为期两年的试验,对所选择的模型进行了额外的测试。结果表明,在干旱条件下生长的大豆比对照积累的生物量少,这是由于资源有限而预期的。

 

结论:本研究证明利用无人机照片和MLM可以成功预测大豆食糜泻。高度相关变量的筛选减少了最终预测因子的数量,提高了远程生物量估算的效率。在独立环境中进行的额外测试证明,该模型能够区分干旱导致的大豆FB的不同值。作为一种非破坏性估计大豆FB的新工具,对FB可变性的评估表明了所提出模型的稳健性和有效性。

 

图1  单个大豆地块的感兴趣区域(ROI)示例(黄色方框),(a)单个通道的原始图像(如示例NIR),(b)使用掩蔽程序过滤掉土壤像素后的图像。

 

图2  (a)数字地形模型(DTM)和(b)数字表面模型(DSM)的例子

 

图3  评估植被指数之间关系的相关矩阵。图上的十字表示不显著的相关系数(p < 0.05)。

 

图4  实际和预测鲜大豆生物量之间的相关性(kg/m2)。(a)在RF,CC和PH与31 VIs相结合,(b)在PLSR,CC和PH与31 VIs相结合,(c)在RF,CC和PH与TGI和GCI相结合,(d)在PLSR,CC和PH与TGI和GCI相结合。冠层覆盖——CC,植物高度——PH,植被指数——VIs,随机森林——RF,偏最小二乘回归——PLSR,决定系数——R2,均方根误差——RMSE,平均绝对误差——MAE

 

图5  使用随机森林(RF)和具有减少预测集的偏最小二乘回归(PLSR)获得的实际和预测鲜大豆生物量(kg/m2)之间的差异箱线图。误差线表示95%的置信区间,而方框内的线表示中值。

 

图6  预测大豆鲜生物量的(a)随机森林(RF)和(b)偏最小二乘回归(PLSR)模型中每个预测变量的重要性。冠层覆盖——CC,植物高度——PH,三角形绿色指数——TGI,绿色叶绿素指数——GCI。

 

图7 用于评估四个选定预测变量(植物高度(PH)、冠层覆盖(CC)、绿色叶绿素指数(GCI)和三角形绿色指数(TGI))之间关系的相关矩阵。图上的十字表示不显著的相关系数(p < 0.05)。

 

图8 基于随机森林模型结果的不同环境下大豆基因型生物量积累的时间变化。每个方框图中的线代表中值。误差条代表95%的置信区间,异常值由点表示。在干旱模拟中生长的早期组-ED,在干旱模拟中生长的晚期组-LD,早期对照-EC和晚期对照-LC,出苗后的生长程度天数-GDD(°C)。

 

来 源

Ranđelović, P., Đorđević, V., Miladinović, J. et al. High-throughput phenotyping for non-destructive estimation of soybean fresh biomass using a machine learning model and temporal UAV data. Plant Methods 19, 89 (2023). https://doi.org/10.1186/s13007-023-01054-6

 

编辑

锦銎

推荐新闻

石时之约|韩志国:透过表型数据,看见植物的喜怒哀乐!

本期石时之约,我们将对话慧诺瑞德(北京)科技有限公司总经理、国际植物表型学会(IPPN)执委会委员/工业分会副主席韩志国,一起从表型数据的科学角度,去读懂农作物的喜怒哀乐和前世今生。

慧科研、慧育种、慧种田——慧聚改变的力量

让我们“慧聚”在一起,为“慧科研、慧育种、慧种田”赋能。

高通量植物表型平台建设注意事项

育种,是在给定的环境条件下,选择各种表型指标(产量、品质、抗性)最优的基因型材料的过程(AI育种,从这里起步)。育种工作中大约70%的工作量来自表型观察测量和筛选,是最耗人力物力的过程。

作物生理表型测量基础原理

生理表型测量的核心在于“早、快”,要在肉眼可见之前就能测量并预判出变化趋势,才是这个技术的核心价值。叶绿素荧光成像,恰好满足了这个要求。