YOLO-TBD:采用三分支注意机制和自校正卷积的茶芽检测


发布时间:

2025-04-29

来源:

作者:

茶芽自动检测(Automatic Tea Bud Detection,TBD)是智能茶叶采摘系统的核心技术之一。由于茶芽小、密集、高度重叠、颜色接近背景,准确检测茶叶芽面临巨大挑战。本文提出了一种以YOLOv8为基本框架的茶芽检测方法,命名为YOLO-TBD。

 

首先,作者将YOLOv8的第二层特征合并到聚合特征金字塔网络(Path Aggregation Feature Pyramid Network,PAFPN),使其能够更好地利用低级别特征(如纹理和颜色信息)增强网络的特征表示能力。其次,设计了三分支注意机制(Triple-Branch Attention Mechanism, TBAM),并将其集成到主干网络和C2f模块的输出中。这种注意机制在不增加模型参数的情况下,通过特征通道的相互作用,强化了茶芽对象的特征,抑制了背景噪声。最后,提出一种自校正卷积(Self-Correction Group Convolution, SCGC)取代了C2f模块中的传统卷积。此卷积建立了围绕每个空间位置的长距离空间和通道依赖性,使得能够用更少的参数获得更大的感受野和更好的上下文信息捕获,从而减少茶芽对象的错误检测和遗漏检测。拟议的模块被纳入YOLOv8网络架构,从而构建了三个具有不同参数的探测模型,分别是YOLO-TBD-L、YOLOTBD-M和YOLO-TBD-S。
 
在本文自建的茶芽检测数据集和公开的GWHD_2021数据集上的试验结果表明,与现有方法相比,YOLOTBD-L方法可以达到最高准确率,mAP值分别达到87.04%和94.5%,分别比最先进的方法高出1.9%和0.7%。YOLO-TBD-S模型以低得多的模型参数和计算复杂度实现了与YOLOv8-L模型相当的检测精度。
 
本研究提出的特征增强策略有效地提高了网络特征表示能力,实现了茶芽目标的准确定位。但仍然存在一定的局限性:①本研究采用的是自建茶芽数据集,目前还没有公开可用的数据集,这严重阻碍了智能茶芽采摘的未来发展;②轻量级和高精度的检测模型需要进一步研究。未来工作计划:①结合具有代表性的茶树品种,建立一个公开可用的茶芽数据集,为后续研究提供基础;②将探索设计损失函数和利用多核深度卷积等策略,以进一步实现模型轻量化并提高检测性能,从而在实际场景中更好地应用。

 

图1. YOLO-TBD的网络结构

 

图2. PAFPN的结构和改进的PAFPN

 

 图3. TBAM结构

 

图4. SCGC结构

 

图5. C2f_TBAM_SCGC结构

 

图6. 使用不同方法的可视化检测结果

 

 图7. XGrad - CAM特征图的可视化比较

 

表1. 在自建数据集上比较各种目标检测方法的结果

 

表2. GWHD_2021数据集上不同目标检测方法的比较结果

  

表3. 各种检测方法的参数和计算复杂度的比较

 
来 源

LIU Z, ZHUO L, DONG C, et al. YOLO-TBD: Tea Bud Detection with Triple-Branch Attention Mechanism and Self-Correction Group Convolution[J]. Industrial Crops and Products, 2025, 31 1. DOI:10.1016/j.indcrop.2025.120607.

 

编辑

JAYz

推荐新闻

石时之约|韩志国:透过表型数据,看见植物的喜怒哀乐!

本期石时之约,我们将对话慧诺瑞德(北京)科技有限公司总经理、国际植物表型学会(IPPN)执委会委员/工业分会副主席韩志国,一起从表型数据的科学角度,去读懂农作物的喜怒哀乐和前世今生。

慧科研、慧育种、慧种田——慧聚改变的力量

让我们“慧聚”在一起,为“慧科研、慧育种、慧种田”赋能。

高通量植物表型平台建设注意事项

育种,是在给定的环境条件下,选择各种表型指标(产量、品质、抗性)最优的基因型材料的过程(AI育种,从这里起步)。育种工作中大约70%的工作量来自表型观察测量和筛选,是最耗人力物力的过程。

作物生理表型测量基础原理

生理表型测量的核心在于“早、快”,要在肉眼可见之前就能测量并预判出变化趋势,才是这个技术的核心价值。叶绿素荧光成像,恰好满足了这个要求。