基于Copula熵的可解释ResNet50学习模型在棉花植物病害预测中的应用


发布时间:

2024-09-22

来源:

作者:

本文提出了一种新颖的基于可解释人工智能(XAI)和基于Copula熵的灰狼优化(GWO)算法的棉花植物病害预测深度学习(DL)框架。该框架使用棉花植株图像作为输入,经过预处理以生成对比度增强的图像。随后,通过ResNet50卷积神经网络(CNN)模型从叶片图像中提取特征。特征选择作为一个关键的预处理模型,通过删除多余或不相关的特征来提高图像分类的有效性。因此,本文采用了灰狼优化(GWO)算法,这是一种具有特征选择潜力的全局搜索方法。所提出的框架引入了Copula熵(CE)作为关联指标,用于创建GWO的初始种群并增强GWO的特征工程过程。在GWO的初始化过程中,CE被用于选择最显著的特征,从而显著提高了GWO初始种群的质量。根据时间复杂度分析,所提出的基于CE的GWO算法比传统GWO快78.57%。此外,使用XAI层来确定特征的重要性解释。最终分类采用了一种集成学习方法—随机森林(RF)分类器。实验结果表明,所提出的模型具有99%的分类准确率和0.0383的均方误差。此外,将该模型与最新的算法进行了比较,结果表明,所提出的模型具有优越的性能。因此,所提出的模型可用于监测不同的棉花区域,以实现更快速的分析和响应,从而提高生产力。

 

图1 残差学习

 

图2 所提出模型的详细结构

 

图3数据集的不同类别

 

图4 基于灰狼结构的Copula熵。

 

图5 预处理结果

 

图6 对比度增强直方图分析。

 

图7 任意特征6的嵌入图。

 

图8 特征汇总图。

 

图9 高斯Copula下的联合累积分布。

 

图10 克莱顿Copula下的联合累积分布。

 

图11 基于Copula熵的前25个重要特征。

 

图12 输入随机森林的前25个特征。

 

图13 均方根误差(RMSE)与树的数量的关系。

 

图14 节点大小与运行时间的关系

 

图15 节点大小与误差的关系

 

图16 所提出模型的混淆矩阵

 

图17 正确预测图像的样本。

 

图18 错误预测图像的样本

 

图19 根据准确性、可解释人工智能(XAI)和特征选择优化,对所提出模型与其他相关模型的比较。

 

来 源

Askr H, El-dosuky M, Darwish A, et al. Explainable ResNet50 learning model based on copula entropy for cotton plant disease prediction[J]. Applied Soft Computing, 2024, 164: 112009.

https://doi.org/10.1016/j.asoc.2024.112009

 

编辑

小王博士在努力

推荐新闻

石时之约|韩志国:透过表型数据,看见植物的喜怒哀乐!

本期石时之约,我们将对话慧诺瑞德(北京)科技有限公司总经理、国际植物表型学会(IPPN)执委会委员/工业分会副主席韩志国,一起从表型数据的科学角度,去读懂农作物的喜怒哀乐和前世今生。

慧科研、慧育种、慧种田——慧聚改变的力量

让我们“慧聚”在一起,为“慧科研、慧育种、慧种田”赋能。

高通量植物表型平台建设注意事项

育种,是在给定的环境条件下,选择各种表型指标(产量、品质、抗性)最优的基因型材料的过程(AI育种,从这里起步)。育种工作中大约70%的工作量来自表型观察测量和筛选,是最耗人力物力的过程。

作物生理表型测量基础原理

生理表型测量的核心在于“早、快”,要在肉眼可见之前就能测量并预判出变化趋势,才是这个技术的核心价值。叶绿素荧光成像,恰好满足了这个要求。