支持高通量植物表型的叶片尺度光谱库:预测精度和模型迁移


发布时间:

2023-04-14

来源:

植物表型资讯

作者:

PhenoTrait

叶片尺度的高光谱反射率具有快速、低成本、多传感、无损等特点,已成为植物叶片性状高通量表型分析的有效工具。然而,为模型校准收集样品仍然价格高昂,模型显示不同数据集之间的可移植性较差。本文构建了一个叶片尺度的VIS-NIR-SWIR(可见光-近红外-短波红外)光谱库,该光谱库可用于多种植物叶片生理生化性状的高通量表型分析。

 

Spiking算法的核心概念是将研究人员自己试验中的少量“本地”样本添加到库样本中,形成校准样本集,即结合自己试验的光谱库和代表性光谱建立校正模型, 从而显著提高模型的泛化性能,使模型的性能优于仅从光谱库样本校准的模型。Spiking算法可提高局部实验样本的预测精度,局部采样数量越多,Spiking算法获得的精度越高,但同时工作量较大, 成本较高,短期难以实现。作为一种替代方法,额外加权Spiking算法通过添加几个Spiking集的副本来匹配原始光谱库中的样本数量,从而增加Spiking集的统计权重,使校准更好地适应额外加权样本(即“本地”样本),从而获得更准确的预测。本文探索了额外加权Spiking算法提取叶片尺度表型特征的光谱分析应用。

 

本研究有三个目标:(1)收集玉米和高粱的大型叶片高光谱数据库(n=2460),(2)评估两种机器学习方法来估计9种叶片特性(叶绿素、厚度、含水量、氮、磷、钾、钙、镁和硫),(3)研究该光谱库预测外部数据集(n=445)的潜力,包括使用额外加权Spiking算法的大豆和亚麻荠。为了找到一种评估叶片表型性状综合性能最好的方法,使用两种机器学习建模技术进行了比较,结果表明偏最小二乘回归PLSR优于深度神经网络DNN。内部交叉验证表明,叶片尺度光谱库在估计所有9个特征时表现令人满意(平均R2 为0.688), PLSR模型性能优于DNN模型。仅使用光谱库校准的模型在外部数据集上表现出较差的性能(亚麻荠的平均R2为0.159,大豆的平均R2为0.337)。当小部分外部样本(n=20)通过额外加权Spiking算法添加到库中时,模型显著改善,亚麻荠的平均R2为0.574,大豆的平均R2为0.536。叶片尺度光谱库有利于植物生理生化表型的研究,而额外加权Spiking算法提高了模型的可移植性并扩展了其实用性。

 

本文的研究结果表明额外加权Spiking算法可以有效地利用不同条件下的光谱库,快速和低成本地分析叶片的重要生理生化性状,展现了VIS-NIR-SWIR数据对更多作物品种和实验条件下获取表型信息的潜力。

 

图1 不同植物品种和数据集之间的叶片特征差异性

(Sghm=高粱,Cam=亚麻荠,大豆=大豆,LWC=叶片含水量,CHL=叶绿素,LMA=单位面积叶片质量,库=光谱库,测试=外部测试集)

 

图2 光谱库和外部测试数据集的光谱(第一行),以及波长域(第一列)和主成分空间(第二列),不同植物种类(第二行)的光谱(Sghm=高粱,大豆=大豆,Cam=亚麻荠)

 

图3 对不同作物品种(Sghm=高粱,Cam=亚麻荠,大豆=大豆)的不同叶片特征(LWC=叶片含水量,CHL=叶绿素,LMA=叶片质量面积)进行R2(R2test)测试,使用偏最小二乘回归PLSR模型仅对光谱库(Lib),仅对Spike集(Spk),额外加权Spike光谱库(Lib+Spk)进行校准

 
 
来 源
Nuwan K. Wijewardane, Huichun Zhang, Jinliang Yang, James C. Schnable, Daniel P. Schachtman, Yufeng Ge. A leaf-level spectral library to support high throughput plant phenotyping: predictive accuracy and model transfer. Journal of Experimental Botany. 2023
 

作者介绍

美国内布拉斯加大学林肯分校的葛玉峰教授团队和南京林业大学的张慧春教授团队长期从事植物表型平台和技术研究,开展了植物生理、生化特性的高通量表型研究,致力于将工程技术引入表型分析,从而推动育种改良和精确农业的发展。
 

扩展阅读

推荐新闻

石时之约|韩志国:透过表型数据,看见植物的喜怒哀乐!

本期石时之约,我们将对话慧诺瑞德(北京)科技有限公司总经理、国际植物表型学会(IPPN)执委会委员/工业分会副主席韩志国,一起从表型数据的科学角度,去读懂农作物的喜怒哀乐和前世今生。

慧科研、慧育种、慧种田——慧聚改变的力量

让我们“慧聚”在一起,为“慧科研、慧育种、慧种田”赋能。

高通量植物表型平台建设注意事项

育种,是在给定的环境条件下,选择各种表型指标(产量、品质、抗性)最优的基因型材料的过程(AI育种,从这里起步)。育种工作中大约70%的工作量来自表型观察测量和筛选,是最耗人力物力的过程。

作物生理表型测量基础原理

生理表型测量的核心在于“早、快”,要在肉眼可见之前就能测量并预判出变化趋势,才是这个技术的核心价值。叶绿素荧光成像,恰好满足了这个要求。