农业中的标签高效学习:全面综述


发布时间:

2023-07-26

来源:

本站

作者:

PhenoTrait

过去十年,机器学习(ML)和深度学习(DL)在农业系统中的应用取得了许多巨大的成功,包括杂草控制、植物疾病诊断、农业机器人和精准畜牧管理。尽管取得了巨大的进步,但这类ML/DL模型的一个缺点是,它们通常依赖于大规模的标记数据集进行训练,而这类模型的性能受到可用的标记数据样本的大小和质量的强烈影响。此外,收集、处理和标注这种大规模的数据集是非常昂贵和耗时的,部分原因是人力成本的上升。因此,为农业应用开发具有高效标签的ML/DL方法受到研究人员和从业人员的极大关注。事实上,自2016年以来,有超过50篇关于开发和应用基于深度学习的标签高效技术来解决各种农业问题的论文,这促使作者对最近农业应用中的标签高效式ML/DL方法进行及时和全面的回顾。为此,我们首先制定了一个原则性的分类法,根据监督程度来组织这些方法,包括弱监督(即主动学习和半/弱监督学习),以及无监督(即无/自我监督学习),并辅以具有代表性的最先进的标签高效ML/DL方法。此外,我们还系统地回顾了利用这些标签高效算法的各种农业应用,如精准农业、植物表型和收获后质量评估。最后,我们讨论了当前的问题和挑战,以及未来的研究方向。

 

图1 本综述中使用的PRISMA指南流程图。图中第一行说明了在应用其他排除标准之前,根据加强初步过滤的关键词初步选择的文章。

 

图2 多年来的出版物数量。

 

图3 代表性标签高效学习技术的综合分类。我们的分类法包括两个主要类别(显示在蓝色框中),每个类别由多个子区域组成(显示在绿色框中)。

 

 图4. 主动学习算法示意图:基于流的选择性采样和基于池的采样主动学习。

 

图5. 基于不确定性的查询策略框架。

 

图6 “noisy student”算法的框架。

 

图7 不同注释类型的标签成本示例。

 

 图8 多实例学习(MIL)的实例生成过程。

 

 图9 应用类激活映射的可视化(CAM)(Zhou et al.,2016)关于“Sicklepod”杂草图像。

 

图10 Grad-CAM的可视化。 

 

图11 自监督学习流程。

图12 DeepCluster算法的框架。

 

图13 SimCLR算法的框架。

图14 BYOL算法的框架。

 

图15 SwAV算法的框架。

图16 JULE算法的框架。

 

 图17 基于注意力的多实例学习指导方法用于柑橘螨和害虫分类的步骤。

 

图18 用于估计产量的苹果计数的半/无监督学习算法的流程。

 

图19 用于检测、分割和跟踪表葡萄的弱监督学习算法的框架。

 

 图20 一种基于主动学习的鱼类饲养状态分类算法的框架。

 

 图21 领域转移的无监督表示学习。

图22 检测和分割马铃薯缺陷的弱监督方法的中间结果示例。

 

 图23 所提出的草莓异常检测自监督方法的架构。

 

 

 

来 源

Li J, Chen D, Qi X, et al. Label-Efficient Learning in Agriculture: A Comprehensive Review[J]. arXiv preprint arXiv:2305.14691, 2023.

 

https://doi.org/10.48550/arXiv.2305.14691

 

 

编辑

小王博士在努力

推荐新闻

石时之约|韩志国:透过表型数据,看见植物的喜怒哀乐!

本期石时之约,我们将对话慧诺瑞德(北京)科技有限公司总经理、国际植物表型学会(IPPN)执委会委员/工业分会副主席韩志国,一起从表型数据的科学角度,去读懂农作物的喜怒哀乐和前世今生。

慧科研、慧育种、慧种田——慧聚改变的力量

让我们“慧聚”在一起,为“慧科研、慧育种、慧种田”赋能。

高通量植物表型平台建设注意事项

育种,是在给定的环境条件下,选择各种表型指标(产量、品质、抗性)最优的基因型材料的过程(AI育种,从这里起步)。育种工作中大约70%的工作量来自表型观察测量和筛选,是最耗人力物力的过程。

作物生理表型测量基础原理

生理表型测量的核心在于“早、快”,要在肉眼可见之前就能测量并预判出变化趋势,才是这个技术的核心价值。叶绿素荧光成像,恰好满足了这个要求。