学术中心
基于高光谱成像技术和全基因组关联研究的稻米蛋白质含量分析
发布时间:
2024-08-01
来源:
作者:
高效、准确地获取水稻谷物蛋白质含量(GPC)对于选育高品质水稻品种至关重要,遥感技术是实现这一目标的有吸引力的方法。然而,大多数多光谱传感器由于其宽谱带限制,无法准确预测GPC。高光谱技术为弥合表型学和基因组学之间的差距提供了一种新方法。然而,典型数据集的规模较小,这限制了用于估计GPC的模型构建的准确性,并降低了其在广泛品种中推广的能力。在本研究中,我们使用了515种粳稻品种的谷物高光谱数据,并利用深度卷积生成对抗网络(DCGANs)生成模拟数据以提高模型的准确性。在应用连续小波变换(CWT)后,提取了对GPC敏感的特征,并通过偏最小二乘回归(PLSR)构建了GPC估计模型。最后,将全基因组关联研究(GWAS)应用于测量和生成的数据集中,以检测GPC位点。结果表明,经过8000次训练生成的模拟GPC值最接近测量值。通过添加200个模拟样本获得的数据中的小波特征(WF ,743,2)展示了最高的GPC估计准确性(R² = 0.58,RRMSE = 6.70%)。GWAS分析显示,基于模拟数据的估计值检测到的位点与测量值相同,包括与谷物储存蛋白相关的OsmtSSB/L基因。本研究基于高光谱技术,为水稻表型性状的高效遗传研究提供了一种新技术。
图1 GPC 估计和 GWAS 的工作流程。
图2 DCGAN 结构图,包括判别器 (D) 和生成器 (G)。
图3 谷物的原始和归一化平均吸光谱曲线。
图4 不同时间段后测量样本与模拟样本的对比。
图5 迭代次数增加后生成的测量和模拟 GPC 数据的箱形图(a)以及 8000 次迭代后测量和模拟 GPC 的频率直方图(b)。
图6 基于原始数据和测量数据的 GPC 敏感特征分布(a)、数据增强后(b)以及平均归一化光谱曲线(c)。
图7 基于小波特征的 GPC 测量值和估计值之间的关系。
图8 测得的 GPC 估计值 1 和估计值 2 的曼哈顿图(a、c、e)和预测结果图(b、d、f)。
Zheng H, Tang W, Yang T, et al. Grain protein content phenotyping in rice with hyperspectral imaging technology and genome-wide association study[J]. Plant Phenomics.
DOI: 10.34133/plantphenomics.0200
编辑
小王博士在努力
推荐新闻
视频展示