学术中心
油菜计数:可推广的植物检测模型
发布时间:
2024-11-25
来源:
作者:
作物生产者高度重视植物种群数量,认为它是田间健康状况的重要季前指标。传统上,通过人工计数获得出苗率估计数,这是一种劳动密集型方法,严重依赖抽样技术。通过将基于深度学习的目标检测模型应用于航空野外图像,可以在田野的更大区域获得准确的植物种群计数。不幸的是,当前的检测模型在面对与训练集中发现的数据不太相似的图像条件时,往往表现不佳。在本文中,探讨了植物探测器的训练集的特定方面如何影响其推广到未知图像集的能力。特别是,研究了植物检测模型的泛化性如何受到其训练数据的大小、多样性和质量的影响。实验表明,分布内和分布外性能之间的差距不能仅仅通过增加模型的训练集的大小来缩小。还展示了训练集多样性在生成可推广模型中的重要性,并展示了不同类型的注释噪声如何在分布外测试集中引发不同的模型行为。我们利用多年来收集的油菜籽田图像的庞大而多样的数据集进行调查。还提出了一个新的网络工具,Canola计数器,这是专门为遥感植物检测任务而设计的。使用Canola Counter工具准备了我们标注的油菜籽幼苗数据集并进行了实验。
图1 Canola Counter网络工具的截图,注释的油菜幼苗数据集并测试。
图2 训练集和四个OOD测试集中提取的样本416x416图像补丁。
图3 分布内(蓝色)和分布外(红色)测试集的检测精度与训练集大小的关系。水平条表示五个模型重复的平均性能。竖线表示平均值的标准误差。
图4 具有多样化(红色)和非多样化(黑色)训练集的模型的分布外测试精度。水平条表示五个模型重复的平均性能。竖线表示平均值的标准误差。
图5 随着用于OOD评估的图像集数量的增加,具有多样化训练集的模型迅速优于具有非多样化训练集的模型。
图6 分布外测试集的检测精度(a)和计数精度(b)与训练数据中的膨胀噪声水平。水平条表示五个模型重复的平均性能。竖线表示平均值的标准误差。
图7 分布外测试集的检测精度(a)和计数精度(b)与从训练数据中移除的边界框百分比。水平条表示五个模型重复的平均性能。竖线表示平均值的标准误差。
Erik Andvaag, Kaylie Krys, Steve Shirtliffe, Ian Stavness. Counting Canola: Towards Generalizable Aerial Plant Detection Models. Plant Phenomics. 2024, 0268.
编辑
王春颖
推荐新闻
视频展示