Seeing the Unseen:数字图像中提取植物潜在根系特征的新方法


发布时间:

2025-08-29

来源:

作者:

一种新的方法,植物根系性状(Algorithmic Root Trait,ART)提取方法,识别和量化计算衍生的植物根系性状,揭示数字图像中与密集根簇相关的潜在模式。使用多种无监督机器学习算法和自定义算法的集成,提取了27个ART,反映了密集根簇的大小和空间位置。然后将这些ART单独使用或与传统根系性状(Traditional Root Traits,TRT)结合使用,对耐旱性不同的小麦基因型进行分类。基于ART的模型在干旱分类方面优于仅TRT的模型(96.3% vs. 准确率85.6%)。结合ART和TRT进一步将准确度提高到97.4%。值得注意的是,4个选定的ART与所有23个TRT的性能相匹配,提供了5.8倍的信息密度(0.213 vs. 0.037准确度/特征)。这种优越性反映了ART捕捉更丰富、更复杂的架构信息的能力,这可以通过更高的内部变异性(35.59±11.41 vs. TRT为28.91±14.28)和多变量分析中不同的数据结构;PERMANOVA证实,ART和TRT提供了互补的见解。通过在受控环境和田间条件下对小麦耐旱和敏感基因型进行实验验证,ART为植物根系的高通量表型分析提供了可扩展、可定制的工具集。通过将传统的视觉衍生特征与自主计算分析相结合,这种方法拓宽了根表型分析流程,并强调了利用超越人类感知的传感器数据的价值。因此,ART成为揭示植物成像中隐藏特征的一个有前途的框架,在植物科学中具有更广泛的应用,以加深对作物适应性和恢复力的理解。
 

 图1  实验设置和工作流程。(A)ART和TRT提取以及耐旱性分类的示意性工作流程。(1)实验设置(2)图像采集:自定义成像设置为温室和C-600根系成像仪为领域。(3)图像预处理和分割。(4)ART和TRT提取。(5)耐旱性分类与随机森林算法。(6)分类结果比较和验证。(B)ART和TRT提取流程:使用RIMPACT视觉的TRT提取和使用K均值聚类算法的TRT提取。

  

图2  小麦基因型的耐旱性表征和验证。(A)凹凸图说明了基于三种生理排名方法的耐旱(DT,绿色色调)和耐旱(DS,蓝色色调)基因型的排名。DT基因型的排名始终高于(1-3)DS基因型。

 

 图3 植物根系性状(ART)的可视化。Panel 1显示了温室根管图像的结果,而Panel 2显示了田间微型根管图像。这些图突出了最大的密集根簇(_density_points)为绿色,蓝色点表示聚类质心(_centre_x和_centre_y)。算法包括:1.DBSCAN,2.Custom,3.FCM,4.GMM,5.HDBSCAN,6. K-means,7. Mean-shift,8.OPTICS,和9.SLIC。在每一组中,(A)对应于耐旱基因型DT_1,和(B)对应于干旱敏感基因型DS_3。例如,图1(6A)显示了应用于耐旱基因型DT_1的K-均值算法,图1(6 B)显示了应用于干旱敏感基因型DS_3的相同算法。绿色区域代表最大的密集根簇,而蓝点表示由各自算法识别的它们的中心。

 

 图4  ART和TRT数据集的比较。(A)ART的相关矩阵热图。(B)TRT的相关矩阵热图。(C)ART的欧氏距离矩阵热图。(D)TRT的欧氏距离矩阵热图。(E)组合数据集的欧几里得距离矩阵热图。(F)ART的PCA图。(G)TRT的PCA图。(H)比较ART和TRT的MDS图。

 

 图5  分类算法和最终模型验证的比较性能。(A-C)分组条形图比较了(A)TRT、(B)ART和(C)组合数据集上六个关键指标的八种分类算法的性能。对于每个指标,随机森林和CatBoost始终排名最高。(D-E)累积分布函数(CDF)图显示了(D)ROC AUC和(E)精度分数的分布,显示在组合数据集上训练的模型始终优于单独在ART或TRT上训练的模型。(F)最终选择的随机森林模型的性能,比较其在内部开发数据上的得分(“模型得分”)与其在完全独立的验证集上的得分(“验证得分”),证明了稳健的泛化能力。

 

 图6  随机森林分类器在使用不同数据集进行耐旱性分类中的性能。(A)分组条形图说明了随机森林模型性能的逐步改进。对于每种数据类型(TRT、ART、Combine),显示了基线、微调和增强(A_B)模型版本的性能。(B)TRT、ART和组合数据集的最终优化模型的条形图比较,突出显示在组合数据集上训练的模型的上级性能。(C)内部测试集上表现最好的模型的混淆矩阵。(D)独立验证集上表现最好的模型的混淆矩阵。(E)最好的-在开发期间执行模型的度量分数(“模型分数”)并在验证数据集上执行模型的度量分数(“验证分数”)。(F)验证数据集的累积增益曲线。(G)验证数据集的提升曲线。(H)最终模型的排列特征重要性。

 

 图7  ART的生物相关性和性能优势。(A)ART特征捕获的干旱适应机制,显示与已建立的生理过程的联系;(B)ART和TRT之间在多个评估标准上的性能指标比较;(C)ART特征和已建立的TRT指标之间的显著相关性(|r| ≥ 0.6,p < 0.05);(D)性状稳定性比较显示在实验条件下ART与TRT较低的验证相关性(p = 0.0137);(D)模型精度与特征数,证明ART的信息密度高于TRT;(F)算法消融研究结果,显示了不同算法对模型性能的相对贡献,其中FCM、HDBSCAN和Mean-shift 的贡献最大。

 
来 源

M. Shoaib, A.M. Dimech, S.J Rochfort, C. Topp, M.J. Hayden, S. Kant, (2025) Seeing the Unseen: A Novel Approach to Extract Latent Plant Root Traits from Digital Images, Plant Phenomics. 2025, 100088.

 

编辑

王春颖

推荐新闻

石时之约|韩志国:透过表型数据,看见植物的喜怒哀乐!

本期石时之约,我们将对话慧诺瑞德(北京)科技有限公司总经理、国际植物表型学会(IPPN)执委会委员/工业分会副主席韩志国,一起从表型数据的科学角度,去读懂农作物的喜怒哀乐和前世今生。

慧科研、慧育种、慧种田——慧聚改变的力量

让我们“慧聚”在一起,为“慧科研、慧育种、慧种田”赋能。

高通量植物表型平台建设注意事项

育种,是在给定的环境条件下,选择各种表型指标(产量、品质、抗性)最优的基因型材料的过程(AI育种,从这里起步)。育种工作中大约70%的工作量来自表型观察测量和筛选,是最耗人力物力的过程。

作物生理表型测量基础原理

生理表型测量的核心在于“早、快”,要在肉眼可见之前就能测量并预判出变化趋势,才是这个技术的核心价值。叶绿素荧光成像,恰好满足了这个要求。