学术中心
结合高通量深度学习表型和GWAS揭示陆地棉果枝角遗传变异
发布时间:
2024-08-17
来源:
作者:
棉花(Gossypium spp.)是中国一种具有重要经济和战略意义的作物,它面临着种植成本上升以及粮食和棉花种植之间的冲突等挑战。这些挑战凸显了提高单位面积产量的必要性。为此,本研究采用深度学习技术,结合高通量角度检测,对355份陆地棉花材料进行了全基因组关联研究(genome-wide association studies,GWAS),通过果枝角度(fruit branch angle,FBA)对种植密度、产量和机械化收获的影响,确定了影响植株结构的关键SNPs和候选基因。开发了基于卷积神经网络(convolutional neural network,CNN)的分支角度快速准确检测软件,与AutoCAD和手动测量结果均具有较高的相关性。不同棉花种植区的FBA表型差异显著,西北内陆区(Northwest Inland Region,NIR)的FBA表型差异显著。在45个数量性状位点(quantitative trait loci,QTL)中共检测到107个显著单核苷酸多态性(Single Nucleotide Polymorphisms,SNPs),并鉴定出3个潜在候选基因(Ghir_A11G034910、Ghir_D05G007790和Ghir_D05G031350),为棉花FBA的遗传基础提供了深入了解,为棉花育种提供了宝贵的遗传资源。
图1 使用高通量软件“Angle_Measurement”(AM, v1.0)进行角度提取的工作流程。(a-b)棉花果枝的收集和摄影;(c)利用YOLOv5进行目标检测,并辅以灰度转换、边缘检测和霍夫变换等图像处理技术;(d)利用Hough变换方法计算果枝角。
图2 不同棉花种植区FBA的综合变化。(a-f) 6个环境中FBA的分布(E1:聊城-2021;E2:黄冈- 2021;E3:三亚- 2021 - 2022;E4:聊城- 2022;E5:黄冈- 2022;E6:三亚- 2022 - 2023);(g) 6种环境下FBA的相关性分析;有显著性差异(*P < 0.05,** P < 0.01);(h)五个生态区内FBA的小提琴样地,由AutoCAD进行表型采集;(i) 5个生态区FBA的小提琴样地,其表型采集方法为angle_measurement (NIR:西北内陆地区;NSER:北方特定早成熟区;YRR:黄河地区;YZRR:长江流域,P < 0.05) )。
图3 FBA在E1-E3和BLUP-AutoCAD中的全基因组关联研究结果。(a-d) E1-E3和BLUP-AutoCAD中FBA的曼哈顿样地。显著SNP标记用红线区分(E1:聊城-2021;E2:黄冈- 2021;E3:三亚- 2021 - 2022);(e-h) FBA分位数-分位数(QQ)图。
图4 FBA在E4-E6和BLUP-AM中的全基因组关联研究结果。(a-d) E4-E6和BLUP-AM的FBA曼哈顿地块。显著SNP标记用红线区分(E4:聊城-2022;E5:黄冈- 2022;E6:三亚- 2022 - 2023);(e-h) FBA分位数-分位数(QQ)图。
图5 A11染色体qFBA-A11-5 QTL区间候选基因的鉴定。(a)显示fba相关基因的局部曼哈顿图和562.3 kb候选区域内的连锁不平衡热图;(b)三种单倍型FBA的小提琴图;以字母表示的统计学显著性(LSD检验;P < 0.05);(c) Ghir_A11G034910在四个地理区域的遗传多样性分布差异;(d) Ghir_A11G034910基因结构;(e) Ghir_A11G034910启动子区顺式作用元素分析;(f) Ghir_A11G034910蛋白三维结构变化示意图;(g)利用公开RNA-seq数据比较“新陆中45”(大FBA)与“新陆早2”(小FBA)的Ghir_A11G034910基因表达分析(**P < 0.01, *P < 0.05);(h) Ghir_A11G034910在携带hap1基因的‘CRI30’与‘CPB12-1-7’、携带hap2基因的‘吉尔吉斯’与‘Zhong416’之间的表达水平分析(**P < 0.01, *P < 0.05)。
图6 D05染色体FBA-D05-2 QTL区间候选基因的鉴定。(a)说明fba相关基因的局部曼哈顿图和1029.6 kb候选区域的LD热图;(b)四个育种阶段的LD块的多样性,紧密联系的区域用红色突出显示;(c)四个区域Ghir_D05G007790遗传多样性的地理分异;(d)“Angle_Measurement”识别下Ghir_D05G007790单倍型分析小提琴图;(e) AutoCAD测量下Ghir_D05G007790单倍型分析小提琴图;(f) Ghir_D05G007790启动子区顺式作用元素分析;(g)利用公开RNA-seq数据对‘新陆中45’(大FBA)和‘新陆早2’(小FBA)进行基因表达分析(**P < 0.01, *P < 0.05);(h) Ghir_D05G0077900在携带hap1基因的‘CRI30’和‘CPB12-1-7’以及携带hap2基因的‘Han9609’和‘Xinluzhong34’之间的表达水平分析(**P < 0.01, *P < 0.05)。
图7 D05染色体qFBA-D05-4 QTL区间内候选基因的鉴定(a-b) E2和E5中D05染色体fba相关基因的局部曼哈顿图;(c)显著SNP rsD05_35048943在野生种和栽培种之间遗传多样性分布的差异,单倍型分别为hap1和hap2;(d) Ghir_D05G031350在4个育种阶段的多样性(红色部分为强LD块区);(e) “Angle_Measurement” 识别下显著SNP rsD05_35048943单倍型分析小提琴图(**P < 0.01);(f) AutoCAD测量下显著SNP rsD05_35048943单倍型分析小提琴图(**P < 0.01);(g) Ghir_D05G031350的启动子结构;(h)公开RNA-seq数据比较‘新陆中45’(大FBA)与‘新陆早2’(小FBA)的基因表达分析(**P < 0.01, *P < 0.05);(i) Ghir_D05G031350在携带hap1基因的‘CRI30’和‘CPB12-1-7’以及携带hap2基因的‘Han9609’和‘Xinluzhong34’之间的表达水平分析(**P < 0.01, *P < 0.05)。
Li, L., Chang, H., Zhao, S., Liu, R., Yan, M., Li, F., El-Sheery, N.I., Feng, Z., & Yu, S. (2024). Combining high-throughput deep learning phenotyping and GWAS to reveal genetic variants of fruit branch angle in upland cotton. Industrial Crops and Products. 119180.
编辑
王春颖
推荐新闻
视频展示