油菜计数:可推广的植物检测模型


发布时间:

2024-11-25

来源:

作者:

作物生产者高度重视植物种群数量,认为它是田间健康状况的重要季前指标。传统上,通过人工计数获得出苗率估计数,这是一种劳动密集型方法,严重依赖抽样技术。通过将基于深度学习的目标检测模型应用于航空野外图像,可以在田野的更大区域获得准确的植物种群计数。不幸的是,当前的检测模型在面对与训练集中发现的数据不太相似的图像条件时,往往表现不佳。在本文中,探讨了植物探测器的训练集的特定方面如何影响其推广到未知图像集的能力。特别是,研究了植物检测模型的泛化性如何受到其训练数据的大小、多样性和质量的影响。实验表明,分布内和分布外性能之间的差距不能仅仅通过增加模型的训练集的大小来缩小。还展示了训练集多样性在生成可推广模型中的重要性,并展示了不同类型的注释噪声如何在分布外测试集中引发不同的模型行为。我们利用多年来收集的油菜籽田图像的庞大而多样的数据集进行调查。还提出了一个新的网络工具,Canola计数器,这是专门为遥感植物检测任务而设计的。使用Canola Counter工具准备了我们标注的油菜籽幼苗数据集并进行了实验。

 

图1  Canola Counter网络工具的截图,注释的油菜幼苗数据集并测试。

 

图2  训练集和四个OOD测试集中提取的样本416x416图像补丁。

 

图3  分布内(蓝色)和分布外(红色)测试集的检测精度与训练集大小的关系。水平条表示五个模型重复的平均性能。竖线表示平均值的标准误差。

 

图4  具有多样化(红色)和非多样化(黑色)训练集的模型的分布外测试精度。水平条表示五个模型重复的平均性能。竖线表示平均值的标准误差。

 

图5  随着用于OOD评估的图像集数量的增加,具有多样化训练集的模型迅速优于具有非多样化训练集的模型。

 

图6  分布外测试集的检测精度(a)和计数精度(b)与训练数据中的膨胀噪声水平。水平条表示五个模型重复的平均性能。竖线表示平均值的标准误差。

 

图7  分布外测试集的检测精度(a)和计数精度(b)与从训练数据中移除的边界框百分比。水平条表示五个模型重复的平均性能。竖线表示平均值的标准误差。

 

来 源

Erik Andvaag, Kaylie Krys, Steve Shirtliffe, Ian Stavness. Counting Canola: Towards Generalizable Aerial Plant Detection Models. Plant Phenomics. 2024, 0268.

 

编辑

王春颖

推荐新闻

石时之约|韩志国:透过表型数据,看见植物的喜怒哀乐!

本期石时之约,我们将对话慧诺瑞德(北京)科技有限公司总经理、国际植物表型学会(IPPN)执委会委员/工业分会副主席韩志国,一起从表型数据的科学角度,去读懂农作物的喜怒哀乐和前世今生。

慧科研、慧育种、慧种田——慧聚改变的力量

让我们“慧聚”在一起,为“慧科研、慧育种、慧种田”赋能。

高通量植物表型平台建设注意事项

育种,是在给定的环境条件下,选择各种表型指标(产量、品质、抗性)最优的基因型材料的过程(AI育种,从这里起步)。育种工作中大约70%的工作量来自表型观察测量和筛选,是最耗人力物力的过程。

作物生理表型测量基础原理

生理表型测量的核心在于“早、快”,要在肉眼可见之前就能测量并预判出变化趋势,才是这个技术的核心价值。叶绿素荧光成像,恰好满足了这个要求。