HairNet2:利用深度学习量化棉花叶毛茸度


发布时间:

2024-04-23

来源:

作者:

背景:棉花占全球天然纤维产量的80%。其叶毛茸度影响着抗虫性、纤维产量和经济价值。然而,这一表型仍然通过目视给叶/植株赋予基因型毛茸度评分(GHS),或者使用同样输出GHS的HairNet深度学习模型。在这里,我们介绍一种定量深度学习模型HairNet2,它可以从图像中检测叶毛(毛茸),并输出分割掩模和叶毛茸度评分(LTS)。

 

结果:对1250幅图像的毛茸进行了标注(AnnCoT),并结合一系列损失函数和数据增强技术对六个特征提取模块和五个分割模块的组合进行了测试。HairNet2还在用于构建HairNet的数据集(CotLeaf-1)、在随后两个季节收集的类似数据集(CotLeaf-2)以及在两个不同基因种群收集的数据集(CotLeaf-X)上进行了进一步验证。本研究的主要发现包括:(1)叶数、环境和图像位置对结果没有显著影响;(2)虽然GHS和LTS在个别GHS类别上大多呈现相关性,但在基因型水平上的结果揭示了在给定GHS类别内的LTS异质性较强,(3)LTS与个别图像的专家评分密切相关。

 

结论:HairNet2是第一个能够量化和可扩展地测量叶毛茸度的深度学习模型。HairNet2获得的结果与育种者在量表两个极端(GHS 1-2和5-5+)上使用的定性值一致,但有趣的是,它提示了具有中间值(GHS 3-4+)的基因型的重新排序。精确排列轻微表型对人类来说是一项困难的任务。除了为这项任务提供帮助外,HairNet2还为选择具有特定叶毛茸度特征的植株打开了大门,这些特征可能与其他有益特性相关,以生产更好的品种。

 

图1 在 CotLeaf-1(A)、CotLeaf-2(B)和 CotLeaf-X(C)数据集中拍摄的叶片位置描述。

 

图2 HairNet2模型的架构。(A)图像捕获。特征提取模块(B)处理输入图像,提取捕捉叶片表面细微差异的关键视觉特征。得到的精炼特征被馈送到分割模块(C),该模块区分棉叶表面的毛茸,并生成分割掩模。输出(D)包括两部分:突显毛茸的预测分割掩模和从分割掩模计算出的用于量化叶毛茸度的叶毛茸度评分。

 

图3 AnnCoT 测试分组的 251 张图像上人工注释和 HairNet2 预测的 LTS 比较。散点图(A)和小提琴图(B)显示,HairNet2 倾向于返回比人工标注者更高的 LTS。这不是由于检测到了假阳性,而更可能是由于 HairNet2 检测到了人工标注者漏掉的毛茸(C,红色:人工注释,绿色:HairNet2 预测)。HairNet2 的注释可能也略宽于人工注释,但这无法量化。

 

图4 在玻璃温室(GH)和田间(FD)条件下,叶片数量(A、C)和图像位置(B、D)对各个 GHS 类别的 LTS 预测的影响。这些图表突出显示,LTS 随着 GHS 的增加的整体趋势不受叶片数量或图像位置的影响。然而,在 GHS 4 处观察到了明显的 LTS 下降。

 

图5 在玻璃温室(GH)和田间(FD)环境中,年度变化对各个 GHS 类别的 LTS 的影响。这项分析只考虑了 L3 和第一张图像。尽管在 LTS 的绝对数值方面观察到了年度间的变化,但各年的趋势(A-D)以及所有年份的趋势(E)是相似的。在所有年份中,无论是在哪种环境中,都观察到了 GHS 4 处的 LTS 下降,有些年份还在 GHS 4+ 处出现了额外的 LTS 下降。A-D 面板上的 X 轴与 E 面板上的 x 轴相同。

 

图6 HairNet2 对不同年份(A-D)和环境(GH:玻璃温室,FD:田间)中各个基因型的 LTS 预测结果。面板 D 的 x 轴上对 GHS 类别进行了颜色编码,并在面板 E 中展示了四个 4+ 基因型的定性示例,以突出单个类别内 LTS 的变化。

 

图7 玻璃温室(GH,A)和田间(FD,B)基于 LTS 的基因型排名提议。在两个面板的 x 轴上,GHS 类别被颜色编码,灰色和黑色用彩色箭头突出显示,以突出它们在基于 LTS 的排名中的显著变化。这张图显示,对于无毛(GHS 1-2)和有毛(5-5+)的基因型,LTS 和 GHS 高度一致,但具有中间 GHS 的基因型在基于 LTS 的排名中大部分被重新组织。

 

图8 在玻璃温室(GH,A)和田间(FD,B)中,分别对在 Y1、Y2 和 Y3 中共有的 10 个基因型的 LTS 分布进行分析。在每个面板中,左图显示较少毛的基因型,而右图显示毛较多的基因型,使用了不同的 y 轴范围。

 

图9 HairNet2 在 CotLeaf-X 数据集上的 LTS 和专家视觉图像排名高度相关。CotLeaf-X 包括来自 A 种群的第一和叶片图像(A-C)以及来自 B 种群的第一图像(A)。图 D-G 显示,对于两个种群,预测的 LTS 与专家对图像的视觉评分高度相关。

 

来 源

Farazi M, Conaty W C, Egan L, et al. HairNet2: deep learning to quantify cotton leaf hairiness, a complex genetic and environmental trait[J]. Plant Methods, 2024, 20(1): 1-19.

https://doi.org/10.1186/s13007-024-01149-8

 

编辑

小王博士在努力

推荐新闻

石时之约|韩志国:透过表型数据,看见植物的喜怒哀乐!

本期石时之约,我们将对话慧诺瑞德(北京)科技有限公司总经理、国际植物表型学会(IPPN)执委会委员/工业分会副主席韩志国,一起从表型数据的科学角度,去读懂农作物的喜怒哀乐和前世今生。

慧科研、慧育种、慧种田——慧聚改变的力量

让我们“慧聚”在一起,为“慧科研、慧育种、慧种田”赋能。

高通量植物表型平台建设注意事项

育种,是在给定的环境条件下,选择各种表型指标(产量、品质、抗性)最优的基因型材料的过程(AI育种,从这里起步)。育种工作中大约70%的工作量来自表型观察测量和筛选,是最耗人力物力的过程。

作物生理表型测量基础原理

生理表型测量的核心在于“早、快”,要在肉眼可见之前就能测量并预判出变化趋势,才是这个技术的核心价值。叶绿素荧光成像,恰好满足了这个要求。