基于高光谱成像技术和全基因组关联研究的稻米蛋白质含量分析


发布时间:

2024-08-01

来源:

作者:

高效、准确地获取水稻谷物蛋白质含量(GPC)对于选育高品质水稻品种至关重要,遥感技术是实现这一目标的有吸引力的方法。然而,大多数多光谱传感器由于其宽谱带限制,无法准确预测GPC。高光谱技术为弥合表型学和基因组学之间的差距提供了一种新方法。然而,典型数据集的规模较小,这限制了用于估计GPC的模型构建的准确性,并降低了其在广泛品种中推广的能力。在本研究中,我们使用了515种粳稻品种的谷物高光谱数据,并利用深度卷积生成对抗网络(DCGANs)生成模拟数据以提高模型的准确性。在应用连续小波变换(CWT)后,提取了对GPC敏感的特征,并通过偏最小二乘回归(PLSR)构建了GPC估计模型。最后,将全基因组关联研究(GWAS)应用于测量和生成的数据集中,以检测GPC位点。结果表明,经过8000次训练生成的模拟GPC值最接近测量值。通过添加200个模拟样本获得的数据中的小波特征(WF ,743,2)展示了最高的GPC估计准确性(R² = 0.58,RRMSE = 6.70%)。GWAS分析显示,基于模拟数据的估计值检测到的位点与测量值相同,包括与谷物储存蛋白相关的OsmtSSB/L基因。本研究基于高光谱技术,为水稻表型性状的高效遗传研究提供了一种新技术。

 

图1 GPC 估计和 GWAS 的工作流程。

 

图2 DCGAN 结构图,包括判别器 (D) 和生成器 (G)。

 

图3 谷物的原始和归一化平均吸光谱曲线。

 

图4 不同时间段后测量样本与模拟样本的对比。

 

图5 迭代次数增加后生成的测量和模拟 GPC 数据的箱形图(a)以及 8000 次迭代后测量和模拟 GPC 的频率直方图(b)。

 

图6 基于原始数据和测量数据的 GPC 敏感特征分布(a)、数据增强后(b)以及平均归一化光谱曲线(c)。

 

图7 基于小波特征的 GPC 测量值和估计值之间的关系。

 

图8 测得的 GPC 估计值 1 和估计值 2 的曼哈顿图(a、c、e)和预测结果图(b、d、f)。

 

来 源

Zheng H, Tang W, Yang T, et al. Grain protein content phenotyping in rice with hyperspectral imaging technology and genome-wide association study[J]. Plant Phenomics.

DOI: 10.34133/plantphenomics.0200

 

编辑

小王博士在努力

推荐新闻

石时之约|韩志国:透过表型数据,看见植物的喜怒哀乐!

本期石时之约,我们将对话慧诺瑞德(北京)科技有限公司总经理、国际植物表型学会(IPPN)执委会委员/工业分会副主席韩志国,一起从表型数据的科学角度,去读懂农作物的喜怒哀乐和前世今生。

慧科研、慧育种、慧种田——慧聚改变的力量

让我们“慧聚”在一起,为“慧科研、慧育种、慧种田”赋能。

高通量植物表型平台建设注意事项

育种,是在给定的环境条件下,选择各种表型指标(产量、品质、抗性)最优的基因型材料的过程(AI育种,从这里起步)。育种工作中大约70%的工作量来自表型观察测量和筛选,是最耗人力物力的过程。

作物生理表型测量基础原理

生理表型测量的核心在于“早、快”,要在肉眼可见之前就能测量并预判出变化趋势,才是这个技术的核心价值。叶绿素荧光成像,恰好满足了这个要求。