用于植物病害检测的机器学习技术:基于定制数据集的评估


发布时间:

2023-05-06

来源:

植物表型资讯

作者:

PhenoTrait

​病害仍然是口粮作物和经济作物的主要问题。及时、准确和自动化的疾病检测是目前减轻其影响的措施之一。本文利用一个涵盖32种不同植物和74种疾病的叶片图像的定制数据集,以7:3的比例将其分为训练集和测试集,基于迁移学习评估VGG-16,VGG-19,ResNet-50和ResNet-101自动检测植物疾病的效果。

 

为了评估和比较用于检测植物病害的深度迁移学习模型的性能,本文绘制了每个模型的准确率/损失与迭代的关系图,并使用总准确率、精确度、F1分数和召回率作为评估指标。如表1所示,在准确率、精确度、召回率和F1-Score方面,VGG-16和VGG-19的表现优于ResNet-50和ResNet-101。VGG-16和VGG-19的准确率和F1分数大致相似。鉴于本研究定制数据集中存在不平衡的类分布,F1-Score是评估模型的理想指标。从表1可以看出,VGG和ResNet模型的F1得分有很大的差异。ResNet-50和ResNet-101的F1得分分别比VGG模型低41.36%和60.11%。因此,本文得出以下结论:与ResNet-50和ResNet-101相比,VGG-16和VGG-19具有最好的性能,准确率约为86%,F1得分为87%。RESNET-50的准确率和F1得分分别为46.9%和45.6%,而ResNet-101的准确率和F1得分分别为40.7%和26.9%。

 

常见的相关数据集不仅存在类不平衡问题,而且包含的记录较少。因此,本文提出未来可以通过减少类的不平衡问题来提高所实现模型的性能,从而确定每一类中存在相同数量的图像。本文定制的数据集包含了迄今为止最多的记录和最广泛的患病植物类别,本研究将对实际栽培领域的植物病害诊断做出巨大贡献。此外,迭代数、层数、图像大小、学习率和优化器可以根据实际需求调试。

 

图1.解决方案的高层架构

 

图2. 来自定制数据集中的部分叶片

 

图3. 常见植物数据集和自定义数据集的类别不平衡

 

图4. 每个模型的精度/损失随迭代的变化

 

表1. 比较模型实现的结果

 

表2.植物病害检测深度学习研究之间的比较

 
 
来 源
MAHOMODALLY A, SUDDUL G, ARMOOGUM S, 2023. Machine learning techniques for plant disease detection: an evaluation with a customized dataset. International Journal of Informatics and Communication Technology (IJ-ICT): 127-139. DOI: 10.11591/ijict.v12i2.pp127-139.
 

编辑

 

扩展阅读

推荐新闻

石时之约|韩志国:透过表型数据,看见植物的喜怒哀乐!

本期石时之约,我们将对话慧诺瑞德(北京)科技有限公司总经理、国际植物表型学会(IPPN)执委会委员/工业分会副主席韩志国,一起从表型数据的科学角度,去读懂农作物的喜怒哀乐和前世今生。

慧科研、慧育种、慧种田——慧聚改变的力量

让我们“慧聚”在一起,为“慧科研、慧育种、慧种田”赋能。

高通量植物表型平台建设注意事项

育种,是在给定的环境条件下,选择各种表型指标(产量、品质、抗性)最优的基因型材料的过程(AI育种,从这里起步)。育种工作中大约70%的工作量来自表型观察测量和筛选,是最耗人力物力的过程。

作物生理表型测量基础原理

生理表型测量的核心在于“早、快”,要在肉眼可见之前就能测量并预判出变化趋势,才是这个技术的核心价值。叶绿素荧光成像,恰好满足了这个要求。