高通量植物表型:代谢组学的作用?


发布时间:

2022-03-11

来源:

本站

作者:

PhenoTrait

  高通量植物表型分析方法正在迅速发展,并且已经有助于弥合基因型-表型差异。在开发大规模高通量植物表型鉴定设施方面,最近取得了相当大的进展——现在也用于大型作物(图1)。然而,技术的发展应该超越目前的物理光谱评估,将分析能力扩展到亚细胞水平,能够将大量的物理和光谱数据与跨时间的其他化学数据结合起来,将是非常有价值的。

 

  图1 荷兰植物生态表型鉴定中心(The Netherlands Plant Eco-phenotyping Centre,NPEC)安装的自动化植物表型鉴定设施示例。六个模块共同构成了一个完整的表型分析链,从分子水平到微观表型和生理表型。该链旨在将受控条件下的机械输出转化为开放场情况,并将场结果反馈到更受控的条件下,从而揭示基本机制。

 

  代谢物定义并决定了植物的许多关键生理和农艺特征,在当前高通量表型平台中整合代谢组学方法的能力具有巨大的附加值潜力。虽然关键的挑战仍在几个方面,新的技术创新即将到来,但在表型背景下尚未得到充分利用。在这篇综述中,概述了最新技术,以及如何克服目前的局限性,以便在不久的将来将代谢组学方法完全整合到通用表型分析流程中。

 

  挥发性有机化合物在植物生命周期中发挥着重要作用。它们可以持续存在,通过抗虫或抗菌生物活性具有保护功能。针对体内表型的VOCs的一个优势是它们从植物中自然释放,这使得非破坏性分析方法相对简单。最低限度的处理带来最小的伤害,产生真实的体内轮廓。采样可以使用小型泵从所选器官中吸走空气,由定位机器人(图2)驱动,精确定位动态顶空捕获。

 

  图2 在一个标准的自动植物表型鉴定设施内,在线挥发性有机化合物(Volatile organic compound,VOC)分析管道的概念化。所有技术基本上都是可用的,但尚未安装并集成到这样的设置中,以测试其可行性和适用性。(1) 通过温室循环植物的标准传送带系统,这是大多数植物表型鉴定设施的典型特征;(2) 可编程、图像驱动的机械臂,用于(重新)定位每株植物上的特定器官,以局部收集自然释放的挥发物;(3) 用于快速挥发性有机化合物分析的移动气相色谱-质谱法(Gas chromatography–mass

  Spectrometry,GC-MS)设备;(4) 基于实验室的数据分析和解释。

 

  非挥发性代谢组代表了反映过去(例如,因过去的压力而积累的缓慢代谢产物)、现在(例如,高代谢中间产物)和未来(例如,在建生物量的前体)事件的丰富信息。因此,越来越多的自上而下的研究表明,这种代谢组可以与遗传多样性群体的表现相关联,当代谢特征从受控条件下生长的植物中获得时,就有可能预测产量或田间抗逆性。具有高预测价值、能够与基因组选择竞争的信息可以通过光谱方法(如NIR)以非破坏性方式获得。然而,这种非侵入性方法仅限于某些聚合物和丰富的分子。使用有限的、有针对性的组织采样进行有效分析,以最大程度地覆盖非挥发性代谢组。直到最近,成本问题限制了代谢组学在大规模表型分析中的应用。然而,高分辨率MS [TOF-MS、Orbitrap和傅里叶变换离子回旋共振质谱(Fourier transform ion cyclotron resonance mass spectrometry,FT-ICR-MS)],使人们能够区分具有相同标称质量的不同结构,现在使用超快色谱法可以将高通量与高分辨率结合起来。系统生物学方法和大样本数量的工作(图3)已成为可能,增加观测数量将使基于预测模型的新预育种策略的开发成为可能。

 

  图3 当前的样本采集和基于液相色谱-质谱法(liquid chromatography-mass spectrometry,LC-MS)的分析能力,以及需要在哪些方面进行额外开发,以满足集成到活体HTP(分子)表型鉴定设施的需要。

 

  代谢组学不仅仅是一种新的性能预测指标,而且有可能促进深入了解基因型-表型之间的相互关系。尽管在植物中通过多种基于组学的方法收集了大量数据,但这些数据的更高层次整合仍然需要一套跨学科的策略和方法。为了更好地掌握在生物相关背景下组合多个数据集这一具有挑战性的任务,从根本上描述三个层次的数据集成至关重要:概念、统计和基于模型的方法。概念整合是指对组学数据集进行单独分析,并对结果进行比较和匹配,以得出与生物学相关的结论。统计整合通常用于转录组学和代谢组学数据分析。这些方法包括基于相关性、基于串联和基于多变量的方法(图4A-C)。这也带来了更先进的基于网络的解决方案(图4D)和机器学习方法(图4E)。基于模型的方法包括一些用于路径分析和反应通量建模的综合工具(图4F)。不管进一步的下游分析如何,整合转录组学、蛋白质组学和代谢组学数据的第一步是数据处理。该步骤实施质量检查(例如,去除异常值、缺失值、基因和代谢物符号或名称的统一)以及统计标准化和转换程序。

 

  图4 转录组学和代谢组学数据整合的替代方法(A)基于相关性;(B) 基于级联的;(C) 多元统计;(D) 网络化;(E) 基于机器学习和(F)基于路径。

 

  如何将植物组织的上调/下调转录谱与代谢物水平的变化联系起来?在这里,可以解决这些问题的基于相关性的方法包括皮尔逊或斯皮尔曼的相关性检验和更先进的相关性测量方法:古德曼和克鲁斯卡尔的伽马检验、偏相关、线性模型或典型相关分析(CCA)。所有这些方法都关注成对转录物之间的关系——代谢物水平,以发现成对转录物之间正相关(两个变量均增加)或负相关(一个增加一个减少)。R软件包IntLIM支持这些类型的计算,该软件包采用基于线性模型的方法。一种简单的数据集成方法是基于串联的方法,它应用随机森林、自组织映射和k均值聚类来组合两个数据矩阵。

 

  在目前最先进的高通量设备中,用于植物实时物理化学分析的广泛集成传感器之一是近红外等光学分子光谱。光学分子光谱传感为代谢组学方法提供补充信息,尤其是物理化学性质。在未来的发展中,多种传感模式也被整合在一起,联合分析光谱和代谢物数据以了解不同传感模式产生的互补和不同信息至关重要。此外,一些代谢物可能与植物的光学分子光谱信号直接或间接相关。因此,为了有效探索含有(非)挥发物的光谱数据,最近建议采用先进的数据集成技术,如多块数据分析。机器学习方法的应用是多组学数据集成和系统生物学的未来。

 

  综上所述,继高通量分子基因分型这一革命性的植物育种和植物生理学研究之后,进行全植物物理化学表型分析是下一个关键目标。无创成像技术已经取得了成功,但现在需要进一步发展我们的能力,并开始实施分子深层表型分析,以便整合到管道中进行真正的系统分析。最近的分析发展显示出巨大的前景,而许多还没有在(作物)植物分析的背景下进行严格的测试。关键的挑战仍然存在(见悬而未决的问题),但事态发展正在迅速进展。

 

  来源:Hall RD, D’Auria JC, Silva Ferreira AC, Gibon Y, Kruszka D, Mishra P, van de Zedde R: High-throughput plant phenotyping: a role for metabolomics? Trends in Plant Science 2022.

  

  编辑:王春颖

推荐新闻

石时之约|韩志国:透过表型数据,看见植物的喜怒哀乐!

本期石时之约,我们将对话慧诺瑞德(北京)科技有限公司总经理、国际植物表型学会(IPPN)执委会委员/工业分会副主席韩志国,一起从表型数据的科学角度,去读懂农作物的喜怒哀乐和前世今生。

慧科研、慧育种、慧种田——慧聚改变的力量

让我们“慧聚”在一起,为“慧科研、慧育种、慧种田”赋能。

高通量植物表型平台建设注意事项

育种,是在给定的环境条件下,选择各种表型指标(产量、品质、抗性)最优的基因型材料的过程(AI育种,从这里起步)。育种工作中大约70%的工作量来自表型观察测量和筛选,是最耗人力物力的过程。

作物生理表型测量基础原理

生理表型测量的核心在于“早、快”,要在肉眼可见之前就能测量并预判出变化趋势,才是这个技术的核心价值。叶绿素荧光成像,恰好满足了这个要求。