小麦产量和籽粒蛋白质含量的同时预测模型


发布时间:

2022-04-03

来源:

本站

作者:

PhenoTrait

  小麦产量和籽粒蛋白质含量(grain protein content,GPC)是育种和栽培的两个主要优化指标。遥感分别提供了产量和GPC的非破坏性和早期预测。然而,能否在一个模型中同时预测产量和GPC,其准确性和影响因素尚不清楚1。

 

  在本研究中,实验设计、特征提取和建模的工作流程如图1,从数据融合、时间序列特征提取和多任务学习三个方面对不同的深度学习模型进行了系统的比较。结果表明,时间序列数据融合显著提高了产量和GPC预测精度,R2值分别为0.817和0.809。多任务学习实现了产量和GPC的同时预测,精度可与单任务模型相媲美。进一步提出了一种将数据融合(两种数据源作为输入)和多任务学习(两种输出)相结合的二对二模型(图2),并比较了不同的特征提取层,包括循环神经网络 (recurrent neural network,RNN)、长短期记忆网络(long short-term memory,LSTM)、卷积神经网络(convolutional neural network,CNN)和注意力模块。二对二模型的产量(R2 = 0.833)和GPC (R2 = 0.846)预测精度最高(图3-图6)。基于注意特征值,可视化了特征重要度的时间分布,如图7。虽然结构性状和光谱性状的时间格局不一致,但结构性状和光谱性状在花后阶段的总体重要性均大于花前阶段。

 

  本研究为基于时间序列近端遥感,利用深度学习同时预测产量和GPC提供了新的思路,为农业生产的准确、高效预测提供了依据。

 

  图1 实验设计、特征提取和建模的工作流程图。(a)研究领域和数据收集; (b)原始数据预处理和表型性状提取; (c)深度学习数据集构建和模型构建; (d)深度学习模型构建及模型比较分析。

 

  图2 模型结构。(a)一对一的模式;(b)一对二模型;(c)二对一模型;(d)二对二模型。

 

  图3 利用一对一模型比较不同性状对产量和GPC的预测效果

 

  图4 预测值与地面真实值之间的散点图。(a)-(c)一对一、二对一、一对二模型的产量预测结果; (d)-(f) 一对一、二对一、一对二模型的GPC预测结果。绿色虚线表示1:1拟合线。

 

  图5使用两到两种不同特征提取方法的模型,包括(a) FC, (b) RNN, (c) LSTM, (d) 1D CNN和(e)注意模型,预测和实际产量之间的散点图。

 

  图6 使用两到两种不同特征提取方法的模型,包括(a) FC, (b) RNN, (c) LSTM, (d) 1D CNN, (e)注意模型,预测和实际GPC的散点图。

 

  图7 来自沿时间维度的特征关注分析(a)GNDVI和(b) Hmean的日注意值柱状图。

 

  来源:Sun Z, Li Q, Jin S, et al. Simultaneous prediction of wheat yield and grain protein content from time-series proximal sensing. Plant Phenomics, 2022, 9757948.

  

  编辑:王春颖

推荐新闻

石时之约|韩志国:透过表型数据,看见植物的喜怒哀乐!

本期石时之约,我们将对话慧诺瑞德(北京)科技有限公司总经理、国际植物表型学会(IPPN)执委会委员/工业分会副主席韩志国,一起从表型数据的科学角度,去读懂农作物的喜怒哀乐和前世今生。

慧科研、慧育种、慧种田——慧聚改变的力量

让我们“慧聚”在一起,为“慧科研、慧育种、慧种田”赋能。

高通量植物表型平台建设注意事项

育种,是在给定的环境条件下,选择各种表型指标(产量、品质、抗性)最优的基因型材料的过程(AI育种,从这里起步)。育种工作中大约70%的工作量来自表型观察测量和筛选,是最耗人力物力的过程。

作物生理表型测量基础原理

生理表型测量的核心在于“早、快”,要在肉眼可见之前就能测量并预判出变化趋势,才是这个技术的核心价值。叶绿素荧光成像,恰好满足了这个要求。