学术中心
Mol Plant | 前瞻性评述:卫星赋能环境组学强化作物改良
发布时间:
2024-04-20
来源:
作者:
2024年4月17日,中国农业科学院作物科学研究所徐云碧团队联合多家单位在Molecular Plant发表题为“Satellite-enabled Enviromics to Enhance Crop Improvement”的前瞻性评述,讨论了如何通过卫星和遥感系统助力作物改良。
与环境相关的互作和环境组学
文章首先讨论了全球气候变化对作物生产的影响及其可能导致的食品安全问题。环境组学解析影响植物生长和发育的众多环境变量,通过解读基因型、环境和管理复杂的基因型X环境X管理(GXEXM)互作,可以提升作物改良效率,从而让作物更有效地适应气候变化。陆地和大气因素直接影响作物生长、发育和生产力。在特定环境条件下,在某一区域表现优良的基因型或品种在另一个区域可能表现得差强人意。理解这种基因型×环境(GXE)互作以及环境的变量特征,可以为基因组预测、遗传改良、农业生产力提供有关的作物管理策略。
评估GXE和 GXEXM互作通常需要在特定地理位置和年份重复种植各种基因型或品种。通过多环境试验(MET),使用统计模型分析环境间的方差和协方差结构,可以详细描述基因型在精确的种植和管理条件下的表现。而环境组学通过评估GXE和 GXEXM互作,则提供了与众不同的方法。环境组学这个术语于1990年代中期出现在精神病学文献中。在植物育种中,“环境信息”概念最早出现在《Molecular Plant Breeding》(徐云碧 2010)一书中,2016年“环境型鉴定”概念得到全面而完整的表述。自那时开始,环境组学概念在遗传育种界得到迅速流行。
环境组学研究流程的第一步就是识别目标环境类群 (TPE) (图 1)。TPE代表目标区域内环境类型的构成和频率,可在不同生长条件下评估基因型的表现。识别了TPE之后,就需要在不同的环境中收集表型数据。同时,需要获得足够的环境型变异以进行环境组学分析。
图1. 环境组学和地理信息系统(GIS)
最终,环境型鉴定需要扩展到小区尺度下的试验地块甚至单个植物,从而达到与基因型和表型鉴定同等的分辨率。要实现这个目标,需要三方面的技术发展和科学进步。首先,通过卫星装载的传感器与地面传感器和探测器耦合,实现对所有环境因子的采集。其次,所有传感器和检测器必须价格适中,具有足够的分辨率、通量和效率,可在小区或单个植物水平上进行环境型鉴定。第三,配备计算能力强大和人工智能辅助建模和预测系统所需的环境信息管理工具。
图2. 位于美国印第安纳州、与环境型有关的预测区域(包含25个采样点以及该区域的不同层次的环境型数据)
卫星和遥感系统与环境型鉴定
随着技术的进步,卫星和遥感技术在环境型鉴定中发挥着巨大的作用,为育种模型提供深入的理解。卫星可以按照其任务目标进行分类,比如天文卫星、通信卫星、地球观测卫星、气象卫星等。其中,最适合环境组学研究的是地球观测卫星和气象卫星。这些卫星可以搭载各种传感器,例如光学传感器、雷达传感器和光探测-测距(LiDAR)传感器,以满足不同的需求(图3)。
图3. 光学、雷达和光探测-测距(LiDAR)传感器所捕获的图像。A)不同传感器覆盖的光谱范围;B)光学传感器,C) 雷达传感器和D)LiDAR所捕获的图像。UV:紫外线;NIR:近红外线;MIR:中红外线;FIR:远红外线。
光学传感器主要捕获地球表面图像,利用电磁光谱线进行分析,通过监测叶面积指数、土壤湿度和植物健康,为环境组学提供强大的数据支持。而雷达传感器则以辐射方式发射微波并检测反射辐射,能够在恶劣天气条件下对地表环境进行立体制图,尤其适合大规模监测和精确估计土壤湿度、水分供应等信息。LiDAR传感器作为远程传感器,以绿色和近红外波长发射激光光束,精确模拟地球表面,为气候研究和环境监测提供绝佳优势。
同时,装备各种特定范围传感器的气象卫星可以监测大气条件,并提供有关太阳辐射和气候的重要信息。地面和天气传感器互为补充,方便研究和监视地表和大气环境。通过光学摄像头、多光谱和高光谱传感器、合成孔径雷达、辐射和大气传感器等先进技术的综合应用,为我们提供详尽、准确的地球和气候信息,并深化我们对基因型与农业气候条件相互作用的深入理解,为农业、气候科学、气象学和环境政策等环境组学相关领域提供强大的决策支持。
选择最佳的遥感工具需要了解环境因素如何影响作物的生产能力。在评估环境组学方面要考虑地球和植物两个方面。其中基于地球的评估侧重于物理属性,如气候、地形和土壤,而基于植物的评估则使用光学传感器来评估作物相关特性,以确定光谱频率和特定波段对作物生产力和胁迫因素的影响。
由于环境组学所涉数据的多样性和复杂性,需要进行有效的信息处理,比如使用提取、转换和加载的ETL过程。包括从卫星、传感器、气象站和气候数据集等提取信息,然后进行清洗、标准化、整合、特征提取和相关指数计算,最后将处理过的数据加载到适当的分析环境,为深入分析提供基础。管理这类数据的过程包括提取(对应图1的步骤1至2)、转换(对应图1的步骤3至5)和加载(对应图1的步骤6)。
整合气候、辐射、土壤、植被和地形等数据通常需要具有完整历史信息的信息管理平台或知识库。利用这样的平台,可以整合各种数据源,提取具体的环境类型信息,比如气象变量、全球或区域内的气候信息。例如,利用谷歌地球引擎可以对EOS、LANDSAT、Sentinel、ALOS、GEDI和RADARSAT等项目的数据进行处理。MERRA-2和ERA5是两个长期气候数据集,前者提供了全面的回顾性评估,后者提供了高分辨率的全球数据,尤其适合全球范围的气候分析。NCEP/NCAR的重分析数据集包括几十年的气候信息,提供连续而全面的数据,Copernicus气候变化服务则提供关键的气候数据,这些对于气候变化及其影响的研究十分重要。而MODIS项目则通过卫星获取地球表面的光谱数据和高分辨率图像,从而提供全面、详细的地球视觉。在处理数据时,需要用到许多Python和R库,如Python的'Requests'库、'pyModis'库、'Sentinelsat'包和'Geopy'以及R包'nasapower'、'raster'和'terra'等,它们能帮助研究人员从多种来源提取数据,进一步实现环境型建模。
甚至可以从一些整合数据集和分析系统的平台,如SoilGrids、nasapower和环境数据计划等,获取环境数据。NASA基因实验收集和组织组学数据,并为空间任务和类似的实验提供数据接入。总的来说,这些不同的资源让研究人员能够考虑到众多的环境因素,从而增进我们对GXE的理解,并帮助选择和培育最适合可持续农业和生物多样性保护的作物新品种。
此外,处理和分析大量数据需要强大的算力和有关地球数据科学的专门知识。目前,我们需要的网络基础设施包括高性能计算和云服务,如Amazon Web Services、Planetary Computer/Azure,以及谷歌地球引擎。未来十年内,预期谷歌地球引擎应用程序和R Shiny Dashboards等网络工具的使用将会显著增加。在大数据分析时代,对于提高数据分析可接近性的先进工具的需求会持续增长,善用目标驱动的环境型鉴定产品将使研究人员有能力参与正在进行的卫星数据革命,从而作出相应的环境和农业决策。
随着统一数据访问、存储解决方案以及应用程序界面和中间件等平台的发展,我们已经可以无缝地整合来自各种不同来源的数据。如今,人工智能(AI)和深度学习已经成为处理复杂环境组学数据,并融合基因型-环境型-表现型(G-E-P)数据的重要工具。这些工具部署数据挖掘算法,将各种不同的数据流相互编织,形成全面的知识网络。但这些过程正在面临一系列挑战,比如数据集的格式、尺度和维度的多样性、数据的噪音和收集条件的变动等。通过国际标准和深度学习算法,我们有能力管理这些挑战,并满足数据集成的需求。
AI不仅帮助我们超越环境组学数据集的复杂性,更通过整合G-E-P数据,提高植物育种的预测精度。AI的应用考虑了育种数据的细微结构差别并利用数学方法优化其预测过程。除此之外,AI和机器学习方法还通过增强基因型预测能力,助力植物育种。AI和ML技术的发展,使得地理信息系统和植物育种的范式发生转变。利用先进的算法和机器学习模型,AI可以从空间数据中获得有价值的信息,从而帮助提高决策的准确性,并导致我们对地理信息的理解和交互方式发生变化。
现代AI技术,如XGBoost和随机森林,在预测地质属性上表现出色。与此同时,AI所提供的重要工具可以用来从基因组数据集中识别和选择理想特性。人工神经网络和其他AI技术已经成功地应用于不同目的,包括改进基因型选择、优化作物产量以及应对气候变化,现已成为提高作物产量、实现农业飞跃的关键。
环境目标的确定、表型数据的收集、环境数据的获取以及不同数据集的整合是环境组学应用于作物改良的关键。在涉及环境信息的多源数据的整合中,维持统一的地理坐标系统至关重要。有效的数据整合为深度环境组学分析搭建了基础,大数据技术与人工智能为开发智能集成的G-E-P育种方案提供支持。通过集成育种平台和采纳开源育种倡议,可以实现更精确的表型预测并获得更大的遗传增益。然而,挑战来自于复杂的遗传以及GXE互作。随着遗传学、基因组学和遥感技术的发展,环境组学在复杂性状预测中的作用可能会变得越来越重要。图4显示环境组学分析及其育种应用,包括环境组学或目标环境类群(TPE)的预测区域、环境型标记与基因型预测、基因型推荐、潜在生产力、育种分区和潜在遗传增益。
图4. 环境组学分析及其育种应用。A)环境组学和目标环境类群(TPE)的预测区域;B)环境型标记与基因型预测;C)基因型推荐:最佳的遗传评价材料;D)平均潜在生产力/产量;E)使GXE互作最小化的育种分区;F)潜在遗传增益:鉴定最佳育种环境。
环境组学将从生理生态数据的集成中获益,从而为智能农业、成本效益的田间实践和未来植物育种提供解决方案。把概率论引入贝叶斯相关的模型中,为优化多环境试验(MET)和品种区试提供帮助,并提升我们深入理解GXE互作的能力。澳大利亚等国以及在国际小麦改良网络中的其他国家,已经通过遥感技术和基因组选择,获得了显著的遗传增益。
环境组学与育种预测密切相关。比如,随机回归模型提供了在环境标记梯度上的预测试验。基于这个模型,使用所有像素位置进行推理,可以预测不同基因型的表现及其排列顺序。主要环境因素,如季节性的昼夜长度、温度变化和管理措施,通常是一致的、在很大程度上是可预测的,而次要的环境因素则经常是不可预测的。基于环境因素对总环境型变异的单一贡献和环境型关系,可以从所有环境因素中提取信息以构建环境指数。此外,卫星数据所能提供的时间信息增强了我们的动态测量能力,并加深我们对作物不同生长阶段和地点的理解。
在田间尺度上,通过一个可扩展框架测量耕地的温室气体N2O和CH4排放以及土壤碳库的变化。相关解决方案包括:便于扩展的原始数据收集、先进模型的支持、系统的模型-数据集成、高计算效率和AI、稳固的多级验证系统和基础架构。此外,Climate Corporation和地球观测系统数据分析(EOSDA)平台,为作物监测提供了海量数据,包括气象和土壤观测数据,以帮助推动遗传改良和农业可持续发展。
结论
环境组学作为强化植物育种的重要一环,从饱含丰富信息的卫星遥感数据中受益匪浅。这门学科通过融合统计学、大数据和人工智能,从多种卫星传感器所获取的环境数据中提取和构建精确的GXEXM互作。据此,我们得以进行更精准的表型预测并获得更高的遗传增益并降低育种成本。环境组学在基因组学和表型组学的基础上提供了一个额外的维度,能在面临气候变化时对农作物生产作出精准的预测。环境组学为育种家提供了强大的能力,使之能够基于详细信息进行决策,理解在不同种植条件下如何优化遗传材料的选择。环境组学的一个重要发展是“育种分区”的概念,这个概念代表了一个地理多边形,可以在某种程度上使GXE互作最小化(图4)。此外,环境组学还有助于预测整个地区以及其他表型特征的潜在生产能力,为未来不同气候条件下的作物生产提供重要信息。育种项目应该利用卫星数据,并采用简化和集成的方法,减少处理高精度卫星和无人机数据的成本。此外,复杂模型和先进的人工智能可以进一步提高数据增强和数据融合的效果。这需要深耕和挖掘卫星数据的巨大潜力,并有赖于农学家、生理学家、育种家以及地理信息专家之间的通力协作。
中国农业科学院作物科学研究所研究员、北京大学现代农业研究院资深研究员、深圳华大万物科技有限公司“玉米快速育种团队”首席科学家徐云碧博士、澳大利亚昆士兰大学Lee Hickey博士为该前瞻性评述的通讯作者。巴西戈亚斯联邦大学的Rafael T. Resende博士为第一作者。其他合作作者包括科罗拉多大学博尔德分校的Cibele H. Amaral博士, 巴西戈亚斯联邦大学的Lucas L. Peixoto, 巴西圣若瑟德雷联邦大学的Gustavo E. Marcatti博士。
Rafael T. Resende, Lee Hickey, Cibele H. Amaral, Lucas L. Peixoto, Gustavo E. Marcatti, Yunbi Xu,Satellite-enabled Enviromics to Enhance Crop Improvement,Molecular Plant,2024,ISSN 1674-2052,https://doi.org/10.1016/j.molp.2024.04.005.
编辑
推荐新闻
视频展示