基于合成数据集的实例分割网络用于高通量大豆荚表型考种


发布时间:

2022-03-04

来源:

本站

作者:

PhenoTrait

  本文提出一种基于域随机化的图像合成方法用于合成高通量大豆豆荚实例分割数据集,并提出用合成数据集训练实例分割网络用于高通量大豆豆荚表型考种,植物表型资讯介绍如下。    

 

  高通量大豆豆荚的实例分割是获得荚长、荚宽和荚粒数等表型性状的前提。然而,大豆豆荚的形态各异,基于人工设计特征的分割方法存在鲁棒性差、泛化能力弱等问题。虽然基于深度学习的分割算法可以实现准确的训练和强大的泛化能力,但需要大量的标注数据集,尤其是在农业领域。因此,我们提出了一种新的图像合成方法,用于快速生成标注好的高通量大豆荚实例分割数据集,其中对大豆荚进行密集采样以模拟真实豆荚表型考种过程中存在的豆荚之间的遮挡。然后,我们提出仅用合成数据集训练实例分割模型,并用平均精度和平均召回率在合成测试图像数据集和真实的测试图像数据集上评估训练好的模型。最后,提出一种新的基于分割掩模的方法来计算豆荚的长度和宽度,并进行了验证。实验结果表明,所提出的方法可用于快速高效且准确地分割和计算每个豆荚的形态参数。且该方法可以很容易地扩展到其他植物表型分析任务,如叶片分割。 

 

  高通量大豆豆荚表型考种的RGB图像采集平台

 

  合成图像对(原始大豆豆荚图像和标注图像)生成和增强方法的流程图

 

  合成的标注图像数据集示例

 

  大豆豆荚Bounding Box的修正过程

 

  实例分割结果。(a) 合成高通量大豆豆荚图像;(b) (a)的实例分割结果;(c) 真实大豆豆荚图像;(d) (c)的实例分割结果。

 

  不同实例分割网络模型的分割结果可视化。未正确分割的豆荚由黄色星星标记。

 

  系统测量和人工测量数据分布和拟合结果。(a) 荚长;(b) 荚宽

 

  基于合成数据集的实例分割模型泛化能力验证。用合成图像数据集训练的模型对合成测试图像、真实单株叶菜图像和真实多株叶菜图像进行叶片分割。

 

  综上,该方法可用于高通量大豆豆荚自动化表型考种,解决了传统人工表型考种成本高、效率低、精度差等问题,为育种专家进行育种设计提供了更丰富、更准确的表型参数参考。在实例分割研究领域,研究人员在准备实例分割数据集时,该方法可以合成大量标注的图像数据集用于训练实例分割网络模型,大大减小了人工标注成本。

 

  作者介绍:论文第一作者为中国农业大学信息与电气工程学院(“智慧农业系统集成研究”教育部重点实验室)博士研究生杨斯,论文通讯作者为王敏娟副教授和郑立华教授,合作作者包括中国农业科学院作物所孙石研究员和武婷婷副研究员等。研究工作得到国家自然科学基金项目、大豆产业体系项目和国家重点研发计划项目资助。

 

  来源:Yang, S., Zheng, L., Yang, H., Zhang, M., Wu, T., Sun, S., ... & Wang, M. (2021). A synthetic datasets based instance segmentation network for High-throughput soybean pods phenotype investigation. Expert Systems with Applications, 116403.

推荐新闻

石时之约|韩志国:透过表型数据,看见植物的喜怒哀乐!

本期石时之约,我们将对话慧诺瑞德(北京)科技有限公司总经理、国际植物表型学会(IPPN)执委会委员/工业分会副主席韩志国,一起从表型数据的科学角度,去读懂农作物的喜怒哀乐和前世今生。

慧科研、慧育种、慧种田——慧聚改变的力量

让我们“慧聚”在一起,为“慧科研、慧育种、慧种田”赋能。

高通量植物表型平台建设注意事项

育种,是在给定的环境条件下,选择各种表型指标(产量、品质、抗性)最优的基因型材料的过程(AI育种,从这里起步)。育种工作中大约70%的工作量来自表型观察测量和筛选,是最耗人力物力的过程。

作物生理表型测量基础原理

生理表型测量的核心在于“早、快”,要在肉眼可见之前就能测量并预判出变化趋势,才是这个技术的核心价值。叶绿素荧光成像,恰好满足了这个要求。