PlaneSegNet:一种具备平面注意力的深度学习网络用于农业环境中的植物点云分割


发布时间:

2025-12-13

来源:

作者:

在复杂农业环境中精准提取植物点云对智慧农业的高通量表型分析至关重要。然而,由于存在高噪声干扰、密集空间分布以及植物与非植物区域结构边界模糊等问题,现有方法在处理大规模农业点云时面临重大挑战。为此,本研究提出PlaneSegNet——一种基于体素的语义分割网络,其创新性地融合了平面注意力模块。该模块通过聚合XZ与YZ平面的投影特征,增强了模型对垂直几何特征变化的检测能力,从而提升边界区域的分割性能。在涵盖开放大田群体、温室栽培环境及大型乡村景观等多尺度典型农业场景的广泛实验中,PlaneSegNet在植物与非植物分离任务上显著优于传统几何方法与深度学习模型。通过直接生成高质量纯植物点云,本方法大幅降低了对人工预处理的依赖,为跨领域农业应用中的植物自动提取提供了通用性强的实用解决方案。本研究使用的数据集与源代码已公开于:https://github.com/yangxin6/PlaneSegNet。
 

图1. 田间玉米种群点云数据。子图(a)-(p)显示了作者在不同种植密度和生长阶段下收集的玉米种群点云。子图(q)–(t)描述了公开可用的数据集。非植物点注释为0 类(蓝色),植物点注释为1 类(红色)。(有关此图例中对颜色的引用的解释,读者请参阅本文的网络版本。)

 

 图2. 用于训练和测试的数据分区策略。(a)生玉米种群点云,垂直分为两等半:上半部分用于训练,下半部分用于测试。(b)随机裁剪的4×4 m 的示例2训练集中的子区域,用于模型输入。

 

 图3. Crop3D 数据集显示了三个物种的盆栽点云:(a)玉米、(b)马铃薯和(c)油菜。

 

  图4. DALES数据集。不同的颜色表示不同的语义类。

 

图5. 不同数据集中植物点和非植物点的比例分布。(a)20个大田玉米种群点云中植物点与非植物点(主要是地面)的比率;(b)温室数据集中盆栽点与非植物点(包括地面和结构元素)的比例;(c)在DALES数据集中,红色表示植被点,蓝色表示地面和其他语义类别。(有关此图例中对颜色的引用的解释,读者请参阅本文的网络版本。

 

 图6. PlaneSegNet的网络架构:(a)所提模型的整体结构。(b)平面注意力模块的详细架构。

 

图7. 分割结果是室外农田植物点云与非植物点云之间的边界区域。裁剪区域显示植物和非植物界面周围有 0.3 m 的垂直切片;后续数字中省略了灰色区域。红色、蓝色和绿色点分别表示正确预测的植物点、地面点和错误分类点。

 

 图8. Crop3D 数据集上的分割结果。红点表示正确预测的植物点,蓝点表示正确预测的非植物(例如地面或结构)点,绿点表示错误分类的点。

 

图9. PlaneSegNet在DALES数据集上的定性结果。(a–c) 全场景语义分割预测结果;(d–f) 对应(a–c)中矩形标注区域的局部放大预测展示;(g–i) 相应区域的真实标注放大图。黑色高亮显示错误分割点。

 

 图10. DALES定性比较。(a-d)基本事实标签;(e-h)Sparse3D U-Net 的预测;(i–l)PlaneSegNet 的预测。黑色轮廓突出显示了Sparse3D U-Net 错误分割的区域。

 

 图11. 成熟玉米地块的无人机多视图重建。

 

 图12. 玉米成熟数据集上分割输出的定性比较。

 
来 源

Yang X, Xu C, Wang Y, et al. PlaneSegNet: A deep learning network with plane attention for plant point cloud segmentation in agricultural environments[J]. Artificial Intelligence in Agriculture, 2025.

https://doi.org/10.1016/j.aiia.2025.10.015
 
 

编辑

王永贤

推荐新闻

石时之约|韩志国:透过表型数据,看见植物的喜怒哀乐!

本期石时之约,我们将对话慧诺瑞德(北京)科技有限公司总经理、国际植物表型学会(IPPN)执委会委员/工业分会副主席韩志国,一起从表型数据的科学角度,去读懂农作物的喜怒哀乐和前世今生。

慧科研、慧育种、慧种田——慧聚改变的力量

让我们“慧聚”在一起,为“慧科研、慧育种、慧种田”赋能。

高通量植物表型平台建设注意事项

育种,是在给定的环境条件下,选择各种表型指标(产量、品质、抗性)最优的基因型材料的过程(AI育种,从这里起步)。育种工作中大约70%的工作量来自表型观察测量和筛选,是最耗人力物力的过程。

作物生理表型测量基础原理

生理表型测量的核心在于“早、快”,要在肉眼可见之前就能测量并预判出变化趋势,才是这个技术的核心价值。叶绿素荧光成像,恰好满足了这个要求。