CVRP:一个高质量标注的水稻图像数据集


发布时间:

2025-05-14

来源:

作者:

作物图像分析和表型组学的机器学习模型对精准农业和育种具有重要意义,一直是研究的热点。然而,缺乏公开的具有详细标注的高质量图像数据集严重阻碍了这些模型的发展。在本研究中,我们展示了一个由231个地方品种和50个现代品种在稻田密植条件下创建的多品种多视角水稻植株图像数据集(CVRP)。该数据集包含了在自然环境中拍摄的水稻植株图像,以及专门针对稻穗的室内图像,从而能够对品种间的差异进行详细研究。针对注释设计了使用深度学习模型的半自动注释流程,随后进行了严格的人工策展。我们通过评估四种最先进的(SOTA)语义分割模型的性能来证明CVRP的实用性。我们还通过图像和标注进行了3D目标重建。该数据库不仅支持通用的基于图像的稻穗识别与分割,还为具有挑战性的任务(如水稻品种自动识别、稻穗与籽粒计数以及3D植株重建)提供了宝贵的资源。数据库及图像标注模型可通过以下链接获取:https://bic.njau.edu.cn/CVRP.html。

  

图1 展示了研究中使用的8种具有独特稻穗特征的水稻地方品种

这些品种分别是:(A)水牛皮、(B)芦干白、(C)金中粳、(D)甘科青、(E)柳石紫粳、(F)襄樊稻、(G)红壳糯、(H)哈哈笑。例如,水牛皮的籽粒呈深褐色,水牛皮和金中粳具有长芒,而其他品种的芒则非常短。

  

图2 展示了稻田中的水稻稻穗,植株处于两个不同的生长阶段

(A)、(B)、(C)和(D)代表开花期,(E)、(F)、(G)和(H)代表成熟期。

  

图3 从四个不同视角拍摄的带有稻穗的水稻植株图像

这四个视角包括:(A)正视图(俯视视角),(B)斜视图,(C)侧视图,(D)特写视图。正视图提供了自上而下的视角,突出了稻穗的排列和密度;斜视图是带有一定倾斜角度的俯视视角;侧视图为水平视角;斜视图和侧视图均有助于观察稻穗的结构特征及其与植株的空间关系;特写视图展示单根稻穗的自然状态。

  

图4 室内拍摄的单根稻穗图像

(A)地方品种金中粳稻穗的自然下垂状态;(B)地方品种金中粳稻穗展开状态的细节图像;(C)地方品种哈哈笑稻穗的自然下垂状态;(D)地方品种哈哈笑稻穗展开状态的图像。

    

 图5 展示了田间种植的多个水稻品种图像的标注工作流程

为了优化标注过程,我们将深度学习方法与人工校对相结合。该工作流程包括两个阶段:人工标注和基于模型的预测后的人工校对。首先,选择一部分具有代表性的田间图像,并通过LabelMe进行人工标注。这些标注后的图像用于训练语义分割模型。随后,使用训练好的模型对剩余图像进行分割,并对分割结果进行人工校对。

  

图6 展示了田间图像及其对应的标注

(A)、(B)、(C)和(D)是同一地方品种的四个视角图像及其详细标注;(E)、(F)、(G)和(H)是包含多个稻穗的田间场景及其各自的标注,这些标注捕捉了复杂环境中的细节。

 

 表1 对CVRP数据集进行详细统计

  

表2 四个SOTA语义分割模型在多品种数据上的性能度量

 

  图7 4种先进语义分割模型(SOTA)的分割结果

(A)模型成功识别了几乎所有的稻穗;(B)在区分颜色与稻穗相似的杂草时存在挑战;(C)由于稻穗与叶片颜色相似,部分稻穗未被标注;(D)背景中较小且密集的稻穗为分割带来了额外的挑战。

 

表3 4种先进语义分割模型(SOTA)在田间场景数据上的性能指标

 

图8 展示了植株的3D目标重建结果

(A)、(B)和(C)分别展示了三个品种的重建结果;在每组图像中,左侧显示未经标注或分割的植株重建结果,右侧显示通过稻穗标注实现的目标重建结果,其中亮黄色部分代表分割出的稻穗。

 
来 源

Zhiyan Tang, Jiandong Sun, Yunlu Tian, Jiexiong Xu, Weikun Zhao, Gang Jiang, Jiaqi Deng, Xiangchao Gan,. CVRP: A Rice Image Dataset with High-Quality Annotations for Image Segmentation and Plant Phenomics Research, Plant Phenomics, 2025, 100025.

 

编辑

郑静文

推荐新闻

石时之约|韩志国:透过表型数据,看见植物的喜怒哀乐!

本期石时之约,我们将对话慧诺瑞德(北京)科技有限公司总经理、国际植物表型学会(IPPN)执委会委员/工业分会副主席韩志国,一起从表型数据的科学角度,去读懂农作物的喜怒哀乐和前世今生。

慧科研、慧育种、慧种田——慧聚改变的力量

让我们“慧聚”在一起,为“慧科研、慧育种、慧种田”赋能。

高通量植物表型平台建设注意事项

育种,是在给定的环境条件下,选择各种表型指标(产量、品质、抗性)最优的基因型材料的过程(AI育种,从这里起步)。育种工作中大约70%的工作量来自表型观察测量和筛选,是最耗人力物力的过程。

作物生理表型测量基础原理

生理表型测量的核心在于“早、快”,要在肉眼可见之前就能测量并预判出变化趋势,才是这个技术的核心价值。叶绿素荧光成像,恰好满足了这个要求。