开源数据、软件和硬件推进植物科学的发展


发布时间:

2023-05-01

来源:

植物表型资讯

作者:

PhenoTrait

植物科学领域的一个重要挑战是如何利用图像处理技术自动分析植物的形态、生理、生化和生态特征,以促进植物表型和精准农业技术的发展,例如定点除草。然而,目前植物科学领域在图像分析方面缺乏合作,导致技术的发展受阻。本文的目的是强调植物表型和除草识别领域在使用深度学习进行图像分析时存在的重叠,并提出通过开源协作来克服当前瓶颈并实现互利共赢的方法。

 

开源技术是指源代码和数据对用户开放,可以进行自主开发和自由交流的技术。开源技术有利于避免重复劳动,提高效率和质量,并促进创新和标准化。深度学习是一种基于人工神经网络的机器学习方法,它可以自动提取图像中的特征,并进行分类、检测、分割等任务。深度学习在图像分析方面取得了巨大的成功,很大程度上得益于开源技术的推动。例如,有许多开源的Python库、算法架构和标注数据集可以供植物科学领域的研究者使用和改进。

 

植物表型和除草识别领域在使用深度学习进行图像分析时有很多相似之处,包括数据结构、软硬件需求和输出。两个领域都需要收集大量的高质量图像数据,并进行标注、训练和测试。两个领域都面临着数据量不足、数据质量不高、数据标注耗时、算法泛化能力不强、算法部署困难等挑战。两个领域都可以利用现有的开源算法架构,如YOLO(You Only Look Once)系列,来实现植物或杂草的检测、计数、分割等任务。然而,两个领域之间的交流和合作却很少发生,导致了研究孤岛和资源浪费。

 

为了促进植物表型和除草识别领域的开源协作,本文提出了从数据到决策的四个步骤,分别是数据收集、数据处理、模型训练和部署、算法输出分析,并定义了每个步骤中的重叠领域。通过开源协作,可以提高每个步骤的效率和质量,并实现更好的结果。有三个关键的合作领域分别是:(1)建立标准化、开源、带有一致元数据报告的标注数据集;(2)建立可靠且易于使用的深度学习算法的训练和测试平台;(3)共享研究过程中使用的所有源代码。这种开源的方法可以避免不必要的重复,让基础和应用科学的研究团队能够利用最新的进展,解决各自的难题。

 

图1 在数据收集、数据处理(注释)、算法开发和部署以及算法输出阶段,对杂草识别和植物表型的深度学习进行比较。在许多方面是可以共享的,共享注释、元数据、数据集、培训或部署基础设施。在数据模式、过程意图和所需输出方面,重叠明显减少。低性能计算(LPC)意味着使用嵌入式设备(例如Raspberry Pi);高性能计算(HPC)是指在需要质量、数量的高性能设备上进行数据处理。单独的颜色表示特定的工作流程或深度学习阶段。圆圈表示聚集在阶段周围的管道的各个组件,元数据以虚线表示为数据集的附录,方框表示输出注释的图像数据集。

 

图2 使用 RootPainter (Smith et al., 2022) 开源软件提供的一种纠正性注释方法的示例。随着提供更多的注释数据(显示图像 1、5、10 和 150),性能提高,而不需要手动注释整个图像。可以纠正青色预测,只需进行少量更改和相对较少的图像进行训练,而无需注释高置信度区域。底部框中提供了棉花(Gossypium hirsutum)、帕尔默苋(Amaranthus palmeri)、小麦(Triticum aestivum)和硬质黑麦草(Lolium rigidum)的示例输出,与 RootPainter 用于根表型的原始意图形成对比。

 
 
来 源
Coleman G R Y, Salter W. More eyes on the prize: Open-source data, software and hardware for advancing plant science through collaboration[J]. AoB PLANTS, 2023: plad010.
 

编辑

刘昕哲
 

扩展阅读

推荐新闻

石时之约|韩志国:透过表型数据,看见植物的喜怒哀乐!

本期石时之约,我们将对话慧诺瑞德(北京)科技有限公司总经理、国际植物表型学会(IPPN)执委会委员/工业分会副主席韩志国,一起从表型数据的科学角度,去读懂农作物的喜怒哀乐和前世今生。

慧科研、慧育种、慧种田——慧聚改变的力量

让我们“慧聚”在一起,为“慧科研、慧育种、慧种田”赋能。

高通量植物表型平台建设注意事项

育种,是在给定的环境条件下,选择各种表型指标(产量、品质、抗性)最优的基因型材料的过程(AI育种,从这里起步)。育种工作中大约70%的工作量来自表型观察测量和筛选,是最耗人力物力的过程。

作物生理表型测量基础原理

生理表型测量的核心在于“早、快”,要在肉眼可见之前就能测量并预判出变化趋势,才是这个技术的核心价值。叶绿素荧光成像,恰好满足了这个要求。