利用RGB图像和反向传播神经网络对橄榄果实关键品质性状进行表型分析


发布时间:

2023-08-09

来源:

本站

作者:

PhenoTrait

为了预测橄榄果实中的油和酚浓度,采用反向传播神经网络(BPNN)和非接触式植物表型技术相结合的方法,获取基于RGB图像的油和酚浓度的数字指标。对于不同成熟期的3个栽培品种(间隔约10天,连续两年)的果实进行采样、拍照和分析其酚和油的浓度。在此之前,对果实样本进行拍照,并对图像进行分割,提取红色(R)、绿色(G)和蓝色(B)的平均像素值,将其重新排列成35个基于RGB的色度指数。设计了三个BPNN,分别使用以下输入变量:(a)原始的35个RGB指数,(b)在进行主成分分析(PCA)预处理后的主成分得分,(c)在稀疏主成分分析后得到的28个RGB指数。结果显示,预测结果在BPNN中达到的平均R2值最高,范围从0.87到0.95(油)和从0.81到0.90(酚)。除了R2值之外,还计算了其他性能指标(均方根误差和平均绝对误差),并将它们结合成一个综合性能指标(GPI)。GPI的排名结果表明,可以为根据成熟期分组的品种设计特定拓扑结构的BPNN。本研究证明,基于RGB图像的表型技术能够有效预测橄榄果实的关键品质特征,支持数字农业领域中橄榄种植业的发展。

图1 实验设计的流程图,包括成像、分割、果实质量(油和总酚)测定以及通过反向传播神经网络(BPNN)进行建模。在分割之后,感兴趣区域(ROI)被切割成红色(R)、绿色(G)和蓝色(B)通道(灰度),并测量每个通道中ROI的光强度分布的平均值。BPNN的输入(红色文本)包括基于RGB的色度指数(BPNN)、通过主成分分析(PCA)得到的PC1和PC2的得分(PCA_BPNN),以及经稀疏主成分分析(SPCA)选择出具有非零加载的RGB指数(NNZL)(SPCA_BPNN)。主成分的数量(2个)和原始RGB指数被馈送给遗传算法(GA),以确定具有非零加载的特征数量(NNZL)的目标,作为稀疏主成分分析的输入参数;红色星号表示在稀疏主成分分析之后未使用的指数,因为它们的加载值为0。

 

图2 2020年和2021年期间记录的3个橄榄栽培品种中平均油浓度和总酚浓度的季节趋势。

 

图3 2020年(顶行)和2021年(底行)期间拍摄的Coratina、Frantoio和Leccino品种橄榄果实图像中提取的平均(±SE)(A和D)红色、(B和E)绿色和(C和F)蓝色像素值的季节趋势。

 

图4. Frantoio、Coratina和Leccino橄榄栽培品种果实中油和总酚的平均(±SE)浓度在相同时间点(2021年10月19日,83天后)进行测量。底部显示了经过图像分割程序后的相应橄榄样本。在相同的变量下比较品种,不同的字母表示根据Tukey's HSD检验在P值=0.05的情况下存在统计上显著的差异。

 

图5. 2021年期间拍摄的三个品种的一些RGB图像示例。

 

图6 Frantoio品种的红色(顶行)、绿色(中间行)和蓝色(底行)图像的平均像素值与油(A、G和M)、Leccino品种的平均像素值与油(B、H和N)以及Coratina品种的平均像素值与油(C、I和O)之间的相关性,以及Frantoio品种的平均像素值与总酚(D、J和P)、Leccino品种的平均像素值与总酚(E、K和Q)以及Coratina品种的平均像素值与总酚(F、L和R)之间的相关性,在2020年(○)和2021年(•)期间。箭头表示采样的开始和时间线(从早到晚),ρ = 斯皮尔曼等级相关系数。

 

图7 油浓度与Coratina品种中GR = G × R的平均像素值(A)、Frantoio品种中NG = 正则化的G的平均像素值(B)以及Leccino品种中RG = R + G的平均像素值(C)之间的相关性示例。在计算相关系数ρ(斯皮尔曼等级检验)之前,将来自2020年和2021年的数据进行合并。

 

图8 (A)RGB-based色度指数与油浓度之间的相关系数(斯皮尔曼等级检验)热力图,以及(B)在3个品种中确定的总酚浓度。

 

图9 在预测发展中的Coratina(A)、Frantoio(B)和Leccino(C)品种中油(•,上行)和总酚(•,下行)浓度的各个BPNNs进行5次迭代后得到的决定系数(R2,左列)、均方根误差(RMSE,中列)和平均绝对误差(MAE,右列)的点图。相同的训练和测试基准集在各个BPNNs之间使用。在相同参数和品种下比较不同的BPNNs,不同的字母表示统计上显著差异(P < 0.05,Kruskal–Wallis检验)。水平线代表中位数,最大的黑色点代表均值。

 

图10 在(A至C)Coratina、(D至F)Frantoio和(G至I)Leccino品种中,对BPNN、PCA_BPNN和SPCA_BPNN模型进行残差图的绘制,用于估计油浓度。残差是在经过各个BPNNs进行5次迭代后得到的估计值上计算的;Coratina和Frantoio样本量为75,Leccino样本量为85。粗的水平线表示纵坐标值为零,虚线水平线定义了在残差上计算的±2个标准差的区间,红线是局部加权散点平滑线。

 

图11 在(A至C)Coratina、(D至F)Frantoio和(G至I)Leccino品种中,对BPNN、PCA_BPNN和SPCA_BPNN模型进行残差图的绘制,用于估计酚浓度。残差是在经过各个BPNNs进行5次迭代后得到的估计值上计算的;Coratina和Frantoio样本量为75,Leccino样本量为85。粗的水平线表示纵坐标值为零,虚线水平线定义了在残差上计算的±2个标准差的区间,红线是局部加权散点平滑线。

 

图12 经过各种BPNN模型计算得出的(A、C和E)油浓度和(B、D和F)酚浓度估计值的残差值分布(jittered dots)。水平虚线表示0。在分布旁边报告了四分位距(IQR)

 

来 源

Montanaro G, Petrozza A, Rustioni L, et al. Phenotyping key fruit quality traits in olive using RGB images and back propagation neural networks[J]. Plant Phenomics, 2023.

DOI:10.34133/plantphenomics.006

 

编辑

小王博士在努力

推荐新闻

石时之约|韩志国:透过表型数据,看见植物的喜怒哀乐!

本期石时之约,我们将对话慧诺瑞德(北京)科技有限公司总经理、国际植物表型学会(IPPN)执委会委员/工业分会副主席韩志国,一起从表型数据的科学角度,去读懂农作物的喜怒哀乐和前世今生。

慧科研、慧育种、慧种田——慧聚改变的力量

让我们“慧聚”在一起,为“慧科研、慧育种、慧种田”赋能。

高通量植物表型平台建设注意事项

育种,是在给定的环境条件下,选择各种表型指标(产量、品质、抗性)最优的基因型材料的过程(AI育种,从这里起步)。育种工作中大约70%的工作量来自表型观察测量和筛选,是最耗人力物力的过程。

作物生理表型测量基础原理

生理表型测量的核心在于“早、快”,要在肉眼可见之前就能测量并预判出变化趋势,才是这个技术的核心价值。叶绿素荧光成像,恰好满足了这个要求。