学术中心
整合无人机表型与全基因组关联研究揭示棉花株高的遗传机制
发布时间:
2025-05-19
来源:
作者:
株高(Plant height, PH)是决定棉花株型结构的关键农艺性状。适宜的株高对增强棉花抗倒伏性、提高种植密度及实现机械化采收具有重要意义,因此解析株高的遗传调控机制具有重要研究价值。传统田间株高表型鉴定主要依赖人工测量,难以满足大规模群体研究需求。本研究构建了基于无人机搭载RGB传感器与激光雷达(LiDAR)的高通量表型平台,实现了419份棉花种质资源田间时序株高的高效精准获取。针对两种传感器数据特征分别建立株高提取策略,通过线性回归与机器学习方法构建预测模型,结果显示基于LiDAR(R²=0.934)和RGB(R²=0.914)数据的预测值与实测值均呈现高度一致性。基于表型预测值开展全基因组关联分析(GWAS),共鉴定到34个株高相关基因,其中GhPH1和GhUBP15已被证实参与棉花株高调控。进一步研究发现,陆地棉栽培种ZM24在播种后15天、35天和70天的茎秆中,新基因GhPH_UAV1的表达量相较于茎节缩短的矮化突变体pag1存在显著差异。过表达GhPH_UAV1显著促进棉花茎秆发育,而利用CRISPR-Cas9技术敲除该基因则导致茎生长受到显著抑制,证实GhPH_UAV1在棉花株高调控中发挥正向作用。本研究所建立的田间尺度高通量表型监测平台,显著提升了大规模群体高质量表型数据获取能力,有助于破解基因型数据海量化与表型数据稀缺化之间的失衡难题,为作物遗传改良中的基因型-表型数据整合提供了技术支撑。
表1 无人机的详细飞行参数。
图1 研究区域的正射影像图和无人机图像采集。(A) 实验区 419 块高地棉田的正射影像图。(B) 无人机系统和集成传感器。(C) 棉花五个时间点的植株高度无人机图像采集方案。
图2 本研究的流程图。(A) RGB 和激光雷达数据的处理步骤。(B) 419 块棉花地块中的每一块都被精确划定。利用第一百分位数和第 95 百分位数之间的差值,从地块 RGB 图像的当季数字地表模型(DSM)中提取 PH 值。PH 值是根据地块激光雷达数据的 DSM 与数字地形模型 (DTM) 之差计算得出的。(C) 基于无人机的 PH 被用于 K-means 聚类和全基因组关联研究 (GWAS)。
图3 利用线性回归和相关分析预测从 RGB 和激光雷达数据中提取的 PH 值。基于 RGB 的 PH 值(A)/基于激光雷达的 PH 值(E)与人工测量 PH 值之间关系的线性回归分析中的三个拟合方程。基于 RGB 的 PH 值(B)/基于激光雷达的 PH 值(F)与人工测量的 PH 值之间的二度多项式回归拟合效果最佳。基于 RGB 的 PH 值预测值(C-D)/基于激光雷达的 PH 值预测值(G-H)与 419 个棉花品种在第 4 和第 5 时间点的人工测量 PH 值线性拟合后的相关性。
图4 使用机器学习方法和相关性分析预测从 RGB 和 LiDAR 数据中提取的 PH 值。(A) 使用 12 种机器学习方法通过 RGB (A)/LiDAR (D) 估算 PH 值。最小角度回归和 Huber 回归在预测 419 个棉花品种在不同生长阶段的 PH 值方面可能具有更大的潜力。基于 RGB 的 PH 预测值(B-C)/基于激光雷达的 PH 预测值(E-F)与 419 个棉花品种在第 4 次和第 5 次分别进行最小角度回归和Huber回归分析后的人工测量 PH 值之间的相关性。
图5 419个棉花品种在不同生长阶段的聚类分析和 PH 动态变化。(A) 不同 k 值的平方和。在斜率变化不明显的情况下(k = 5),选择了最佳集群数。(B) 不同 k 值的差距统计。在差距值最大的地方(k = 5)选择最佳聚类编号。(C) 419 个棉花品种的 K-均值聚类结果,不同颜色代表不同聚类。(D) 基于 K-means 聚类的五个聚类中棉花株高随时间变化的动态。
图6 五个阶段植株高度(PH)和转录组结果的曼哈顿图和 QQ 图。全基因组关联研究(GWAS)结果的曼哈顿图(A)和 QQ 图(B)基于激光雷达的 PH 预测值,在最小角度回归分析后具有最高置信度。虚线对应的是经 Bonferroni 校正的 p = 1.00 × 10-5 临界值(-log10 p = 5)。箭头表示与 PH 相关的重要数量性状位点。(C)干组织设计示意图。(D) 热图显示 GhPH_UAV1 基因在 pag1 及其野生型中棉 24(ZM24)五个阶段的棉花茎中的表达模式。第 15 天的 ZM24 茎(Z15D)或 pag1 茎(P15D);第 35 天的 ZM24 茎(Z35D)或 pag1 茎(P35D);以及第 70 天的 ZM24 茎(Z70D)或 pag1 茎(P70D)。
图7 GhPH_UAV1 基因正向调控棉花茎的发育。(A)Ghicr24_D11G117900(GhPH_UAV1)的基因结构。列出了在棉花品种中观察到的两种单倍型。(B) 根据 GhPH_UAV1 中两个 SNPs 的两个单倍型绘制的不同时间点 PH 的方框图(**P< 0.01,方差分析)。(C) CRISPR/Cas9 载体构建示意图。(D)GhPH_UAV1-OE(过表达)品系茎组织中GhPH_UAV1 的表达。(E)GhPH_UAV1-OE/Cas9 及其野生型(WT)中棉 24(ZM24)的茎高。误差条代表 GhPH_UAV1-OE/Cas9 和 ZM24 的 30 个不同茎的 SD。(F)GhPH_UAV1-OE/Cas9 和 ZM24 茎的表型。条 =20 厘米。(G)GhPH_UAV1-OE/Cas9 植株的茎细胞长度。刻度线 = 50μm。(H)细胞长度统计。数据来自三个独立实验。结果以一式三份实验的平均值 ± SD 表示。统计意义通过单因素方差分析结合 t 检验确定(**P < 0.01,**P < 0.001)。
Fan, Liqiang et al. “Combining UAV multisensor field phenotyping and genome-wide association studies to reveal the genetic basis of plant height in cotton (Gossypium hirsutum).” Plant Phenomics (2025): n. pag.
编辑
小安
推荐新闻
视频展示