学术中心
支持高通量植物表型的叶片尺度光谱库:预测精度和模型迁移
发布时间:
2023-04-14
来源:
植物表型资讯
作者:
PhenoTrait
叶片尺度的高光谱反射率具有快速、低成本、多传感、无损等特点,已成为植物叶片性状高通量表型分析的有效工具。然而,为模型校准收集样品仍然价格高昂,模型显示不同数据集之间的可移植性较差。本文构建了一个叶片尺度的VIS-NIR-SWIR(可见光-近红外-短波红外)光谱库,该光谱库可用于多种植物叶片生理生化性状的高通量表型分析。
Spiking算法的核心概念是将研究人员自己试验中的少量“本地”样本添加到库样本中,形成校准样本集,即结合自己试验的光谱库和代表性光谱建立校正模型, 从而显著提高模型的泛化性能,使模型的性能优于仅从光谱库样本校准的模型。Spiking算法可提高局部实验样本的预测精度,局部采样数量越多,Spiking算法获得的精度越高,但同时工作量较大, 成本较高,短期难以实现。作为一种替代方法,额外加权Spiking算法通过添加几个Spiking集的副本来匹配原始光谱库中的样本数量,从而增加Spiking集的统计权重,使校准更好地适应额外加权样本(即“本地”样本),从而获得更准确的预测。本文探索了额外加权Spiking算法提取叶片尺度表型特征的光谱分析应用。
本研究有三个目标:(1)收集玉米和高粱的大型叶片高光谱数据库(n=2460),(2)评估两种机器学习方法来估计9种叶片特性(叶绿素、厚度、含水量、氮、磷、钾、钙、镁和硫),(3)研究该光谱库预测外部数据集(n=445)的潜力,包括使用额外加权Spiking算法的大豆和亚麻荠。为了找到一种评估叶片表型性状综合性能最好的方法,使用两种机器学习建模技术进行了比较,结果表明偏最小二乘回归PLSR优于深度神经网络DNN。内部交叉验证表明,叶片尺度光谱库在估计所有9个特征时表现令人满意(平均R2 为0.688), PLSR模型性能优于DNN模型。仅使用光谱库校准的模型在外部数据集上表现出较差的性能(亚麻荠的平均R2为0.159,大豆的平均R2为0.337)。当小部分外部样本(n=20)通过额外加权Spiking算法添加到库中时,模型显著改善,亚麻荠的平均R2为0.574,大豆的平均R2为0.536。叶片尺度光谱库有利于植物生理生化表型的研究,而额外加权Spiking算法提高了模型的可移植性并扩展了其实用性。
本文的研究结果表明额外加权Spiking算法可以有效地利用不同条件下的光谱库,快速和低成本地分析叶片的重要生理生化性状,展现了VIS-NIR-SWIR数据对更多作物品种和实验条件下获取表型信息的潜力。
图1 不同植物品种和数据集之间的叶片特征差异性
(Sghm=高粱,Cam=亚麻荠,大豆=大豆,LWC=叶片含水量,CHL=叶绿素,LMA=单位面积叶片质量,库=光谱库,测试=外部测试集)
图2 光谱库和外部测试数据集的光谱(第一行),以及波长域(第一列)和主成分空间(第二列),不同植物种类(第二行)的光谱(Sghm=高粱,大豆=大豆,Cam=亚麻荠)
图3 对不同作物品种(Sghm=高粱,Cam=亚麻荠,大豆=大豆)的不同叶片特征(LWC=叶片含水量,CHL=叶绿素,LMA=叶片质量面积)进行R2(R2test)测试,使用偏最小二乘回归PLSR模型仅对光谱库(Lib),仅对Spike集(Spk),额外加权Spike光谱库(Lib+Spk)进行校准
作者介绍
扩展阅读
推荐新闻
视频展示