通过高通量表型组学、线性回归和机器学习神经网络模型提高水稻产量和品质


发布时间:

2024-11-18

来源:

作者:

为了探索高通量植物表型组学在水稻育种中的应用潜力,对中国南方水稻产区的100个优良水稻品种进行了高通量表型分析。利用RGB成像、荧光成像和高光谱成像技术,对水稻分蘖、拔节、灌浆和灌浆后20 d 4个关键生育期的88个参数进行了测定。利用子集选择回归和深度学习神经网络模型,对包括RGB颜色和形态特征、叶绿素荧光特征和水稻表面反射光谱在内的88个参数进行分析,以表征水稻的高产和高品质。共获得39个水稻产量和籽粒品质的显著线性回归模型,r平方值为0.86 ~ 0.15,平均r平方值为0.41。将100个水稻品种的数据分为训练集和测试集,利用预测值与实际值之间的平均绝对误差来评估模型的预测精度。结果表明,深度学习神经网络模型可用于改进线性回归模型,提高预测精度。这些结果表明,高通量植物表型组学可以有效地应用于水稻育种计划中,以选择高产、优质的水稻品种。

 

图1  工作流图像采集,背景减法,颜色分割,和形态参数计算。

 

图2  100个水稻品种的特性评价。(A)获得省级品种证书的75个水稻品种的地理分布情况。另有23个品种已获得国家品种证书,未在此地图上显示。地图上的数字表示本研究中使用的各省认证品种的数量。(二)98个水稻品种获得省级或国家级品种证书的年份。超过三分之二(66.3%)的获证品种是在2014年或之后获得证书的。(C) 100个水稻品种成熟期测定的10个产量和品质性状的频率分布。茎重、叶重、穗重、干物质重和精米率呈正态分布,穗数、糙米率、精米率、白垩米率和垩白度不服从正态分布

 

图3  不同生育期水稻品种RGB图像的颜色分割。(A)三个水稻品种在四个生长阶段的RGB照片说明。(B)九种颜色的演示,包括RGB(34,38,22), RGB(45,54,13), RGB(45,55,36), RGB(57,71,46), RGB(59,71,20), RGB(72,84,58), RGB(73,86,36), RGB(90,98,58)和RGB(110,111,90)。(C) HuRuan 1212水稻4个生育期9种颜色属性的像元值。(D) HuRuan1212水稻像元颜色的百分比分布。第1 ~ 4阶段分别为分蘖、拔节、灌浆和灌浆后20天。

 

图4  分蘖期88个高通量表型性状的频率分布。

 

图5  不同荧光参数下,荧光成像站获得的ZhongZheYou 8号水稻俯视图。

 

图6  5个产量相关性状与水稻不同生育期88个高通量表型性状的相关系数(A)分蘖期。(B)拔节阶段。(C)灌浆阶段。(D)灌浆期后20天。

 

图7  5个籽粒品质相关性状与水稻不同生育期88个高通量表型性状的相关系数。(A)分蘖期。(B)拔节阶段。(C)灌浆阶段。(D)灌浆期后20天。

 

图8  SWIR成像(光谱范围900-1700 nm)用于测量水稻叶片水分状况。每张图片上方都标示了品种名称和含水量。WATER1 = R1440 / R960,其中R1440和R960分别表示1440 nm和960 nm处的反射率值。WATER1后面的“avg”后缀表示基于逐像素检查水稻掩膜所定义区域的反射率的平均值。

 

图9  采用子集选择回归方法确定水稻分蘖、拔节、抽穗和灌浆4个生育期的最佳回归模型,预测水稻成熟期的最终产量和稻米品质。

 

图10  利用平均绝对误差(MAE)预测分蘖期7个产量和品质相关性状的线性回归与机器学习模型的比较这些性状包括穗重(A)、穗数(B)、糙米百分率(C)、精米百分率(D)、抽穗百分率(E)、白垩米百分率(F)和白垩度(G)。

 

来 源

Haoran Su, Yiding Wang, Weimeng Fu et al. Improving rice yield and quality through high-throughput phenomics, linear regression, and machine learning neural network models, 02 October 2024, under review.

 

编辑

王春颖

推荐新闻

石时之约|韩志国:透过表型数据,看见植物的喜怒哀乐!

本期石时之约,我们将对话慧诺瑞德(北京)科技有限公司总经理、国际植物表型学会(IPPN)执委会委员/工业分会副主席韩志国,一起从表型数据的科学角度,去读懂农作物的喜怒哀乐和前世今生。

慧科研、慧育种、慧种田——慧聚改变的力量

让我们“慧聚”在一起,为“慧科研、慧育种、慧种田”赋能。

高通量植物表型平台建设注意事项

育种,是在给定的环境条件下,选择各种表型指标(产量、品质、抗性)最优的基因型材料的过程(AI育种,从这里起步)。育种工作中大约70%的工作量来自表型观察测量和筛选,是最耗人力物力的过程。

作物生理表型测量基础原理

生理表型测量的核心在于“早、快”,要在肉眼可见之前就能测量并预判出变化趋势,才是这个技术的核心价值。叶绿素荧光成像,恰好满足了这个要求。