ChatLeafDisease:一种基于思维链提示法和大语言模型的作物病害分类方法


发布时间:

2025-10-16

来源:

作者:

准确的农作物病害分类对于病害管理和保障粮食安全至关重要。深度学习在基于图像的病害识别中表现出较高的分类精度,但通常需要大量训练数据才能获得满意的性能,这限制了其在不同作物上的应用与可扩展性。大语言模型(LLMs)具备强大的生成能力与零样本推理能力,但其在农作物病害分类中的利用方式尚不明确。本研究提出了一种无需训练的框架——ChatLeafDisease(ChatLD),基于GPT-4o模型并结合链式思维(CoT)提示实现农作物病害分类。该框架包含一个提供作物病害知识的病害描述数据库,以及一个由CoT提示引导的病害分类智能体,用于理解叶片感染病害的模式并对病害进行分类。以原始GPT-4o模型和对比语言-图像预训练(CLIP)模型为基准,结果显示,ChatLD框架在六种番茄病害分类中的平均精度(88.9%)显著高于GPT-4o(45.9%)和CLIP(64.3%)。研究发现,评分规则使ChatLD能够捕捉病害间的典型差异,且消融实验表明,将评分规则与关键提示相结合可有效提升分类精度。不同描述文本的比较结果显示,精炼的病害描述有助于提升分类性能。ChatLD框架在新作物病害分类中同样表现出较高的准确率,体现了其跨作物病害的可扩展性。本研究提出的框架仅依赖病害文本描述即可实现分类,无需训练过程,为农作物病害分类提供了一种基于LLM的新方法。
  

图1 用于作物病害分类的 ChatLeafDisease 框架。

 

  图2 用于评估与解析 ChatLD 框架性能的实验设计。

 

  图3 番茄病害分类精度评估。柱状图表示五次重复实验的平均精度,误差棒表示五次重复中的最大值与最小值。

 

 图4 番茄病害分类结果的混淆矩阵。

  

图5 ChatLD 框架输出的各病害类别评分。每个子图标题对应真实类别样本,横轴上的箱形图表示 ChatLD 生成的分数,用于反映输入图像与相应病害描述的一致性。

 

  图6 番茄病害分类的消融实验结果。

 

  图7 使用不同病害描述文本的 ChatLD 框架在番茄病害分类中的性能表现。

 

 图8 基于原始与精炼病害描述文本的ChatLD框架在早疫病上的评分过程示例。

 

  图9 不同微调数据量的 CLIP 模型与 ChatLD 模型的可扩展性性能比较。括号内数字表示用于微调 CLIP 模型的每个病害类别样本数量。

 

  图10ChatLD 模型可扩展性分类结果的混淆矩阵。

  

图11 PlantSeg 数据集中叶片病害分类的性能评估结果。

 

 图12 ChatLeafDisease 框架的未来研究方向。

 
来 源

Pan J, Zhong R, Xia F, et al. ChatLeafDisease: a chain-of-thought prompting approach for crop disease classification using large language models[J]. Plant Phenomics, 2025: 100094.

https://doi.org/10.1016/j.plaphe.2025.100094

 

编辑

王永贤

推荐新闻

石时之约|韩志国:透过表型数据,看见植物的喜怒哀乐!

本期石时之约,我们将对话慧诺瑞德(北京)科技有限公司总经理、国际植物表型学会(IPPN)执委会委员/工业分会副主席韩志国,一起从表型数据的科学角度,去读懂农作物的喜怒哀乐和前世今生。

慧科研、慧育种、慧种田——慧聚改变的力量

让我们“慧聚”在一起,为“慧科研、慧育种、慧种田”赋能。

高通量植物表型平台建设注意事项

育种,是在给定的环境条件下,选择各种表型指标(产量、品质、抗性)最优的基因型材料的过程(AI育种,从这里起步)。育种工作中大约70%的工作量来自表型观察测量和筛选,是最耗人力物力的过程。

作物生理表型测量基础原理

生理表型测量的核心在于“早、快”,要在肉眼可见之前就能测量并预判出变化趋势,才是这个技术的核心价值。叶绿素荧光成像,恰好满足了这个要求。