学术中心
利用无人机表型预测马铃薯形态和产量
发布时间:
2025-03-11
来源:
作者:
精准农业旨在利用先进的分析工具改善作物管理。在此背景下,本研究的目标是开发一种创新的预测模型,以根据植物的表型特征和通过配备光谱相机的无人机(UAV)捕获的数据,估计土豆块茎的产量和形态质量,如圆度和长宽比。为此,实验于2023年12月在秘鲁中部安第斯山脉的圣安娜实验站进行,种植了先进马铃薯克隆品种,并设置了三种不同施肥水平。研究采用随机森林(Random Forest)、XGBoost和支持向量机(Support Vector Machine)模型预测产量和质量参数,如圆度及长宽比。
图1 本研究中实验地块的位置
图2 实验设计包含6个采样行(S)和3个处理(T),每个处理都有3个重复(R),形成一个随机完全区组设计
图3 本研究的全球方法论
图4 (A) 无人机 Matrice 300,(B) 飞行计划,(C) DJI RTK V2 GNSS,(D) 尼康 D7500 18–140 mm f/3.5–5.6 G 摄影相机,(E) 评估的土豆样本,(F) 校准反射面板(CRP),(G) 作物地块,(H) MicaSense Red Edge M 相机, (I) 地面控制点
图5 对三种处理(T1、T2 和 T3)下土豆植物的高度和叶面积进行比较
图5展示了植株高度和叶面积。处理T2在高度方面的中位数最高,而T3在叶面积上表现突出,具有该变量的最高中位数。尽管T2在高度上表现优异,T3在这两个指标上均表现良好,表明其可能是优化马铃薯作物生长最均衡且最有效的处理方式
图6 马铃薯无性系和参薯品种的光谱特征
每个马铃薯克隆在不同波长的辐射下表现出不同的反应,这可能与其叶片的组成和结构有关,如叶绿素含量和其他色素。在700至900纳米的波长范围内,观察到反射率显著增加,这是“红边”现象的特征。红边现象在植物中具有典型性,反映了可见光和近红外光谱区域之间的过渡,通常与植物的物候、健康状况和活力相关。特别是克隆13PNTN83103对应的曲线在整个波长范围内呈现最高的反射率,这可能表明与其他克隆相比,其具有更强的光吸收能力或结构差异
图7 用于比较摄影测量和手动测量的散点图
揭示了马铃薯表型变量的摄影测量与人工测量之间的强相关性。在图中,手工测量和摄影测量的决定系数(R²)分别为0.76和0.88,表明二者之间存在积极且显著的关系。这些结果表明,摄影测量是估算这些尺寸的可靠工具
图8 表型变量与光谱变量之间的相关矩阵
展示了与块茎生长和特征相关的表型和光谱变量的皮尔逊相关矩阵。形态质量变量圆度(CIR)与大多数变量的相关性较低或没有相关性,表明块茎形状与评估的生长特征之间没有显著依赖关系。然而,CIR与NDI 86(-0.50)和NPCI 86(-0.40)指数之间显示出中等的负相关,表明这些指数可能会影响块茎的圆形形态。类似地,与块茎形状相关的长度和宽度(LW)变量也与相同的指数呈负相关,表明形状的变化部分与这些光谱指标相关。
另一方面,总块茎重量(W)与多个变量之间表现出较强的正相关,特别是与叶面积(LA,0.70)、植株高度(H,0.50)以及光谱指数RDVI 86(0.70)和VDV 108(0.50)之间的相关性。这些相关性表明,植物生长特征以及与红外反射相关的一些植被指数是块茎产量的良好预测因子。此外,这些结果表明,虽然农艺质量(块茎形状)似乎受测量变量的影响较小,但产量(块茎重量)则与植株活力和某些光谱指数密切相关。
图9 使用随机森林(Random Forest)、支持向量机(SVM)和XGBoost预测模型估算马铃薯作物产量的比较
上图展示了使用三种预测模型(随机森林(RF)、支持向量机(SVM)和XGBoost)估算马铃薯作物产量的比较。在训练集中,RF模型表现出较高的准确性,R²值为0.82,RMSE为0.14,表明拟合良好。然而,在测试集中,其表现略有下降,R²值为0.74,表明该模型仍然可靠地预测马铃薯作物的产量。另一方面,SVM模型在训练集中的准确性适中(R²值为0.72),但在测试集中的表现显著下降,R²值为0.56,表明该模型可能不太适合用于马铃薯作物产量的推广预测。XGBoost模型提供了更强的平衡性,在训练集(R²值为0.80)和测试集(R²值为0.75,RMSE为0.17)中均表现出良好的拟合,因此成为三者中最有效的马铃薯作物产量估算模型。这些结果表明,虽然所有模型都有一定的实用性,但XGBoost在准确预测新样本的产量方面表现更佳,使其在精准农业中的预测应用中更为适用
图10 马铃薯作物估产比较:( a )采用随机森林( RF )、支持向量机
机器( SVM )和XGBoost预测模型,包括表型性状和光谱指数,( b )仅使用表型性状
马铃薯圆度预测的评估使用了两个不同的数据集:第一个数据集包含农艺数据和光谱指数,第二个数据集仅基于表型特征。模型使用79天和95天的数据进行评估,这些数据接近收获期。圆度是马铃薯块茎形态质量的关键指标,对于第一个数据集,结果显示随机森林模型是最有效的。在训练集中,R²值为0.76,在测试集中为0.55,表明随机森林具有较强的数据拟合能力,并能较好地推广到新的数据集,具有中等的马铃薯圆度预测能力(图10a)。相比之下,SVM和XGBoost的表现较差。SVM在训练集中的R²值为0.44,测试集为0.38,表明其在预测上存在显著困难。尽管XGBoost在训练集中的R²值为0.63,但它出现了过拟合问题,测试集中的R²值仅为0.06,这限制了其在预测马铃薯圆度方面的有效性,说明随机森林作为评估块茎形态质量最可靠的选择。对于第二个数据集,马铃薯圆度估算仅使用了表型特征。图10b展示了模型在训练集和测试集中的预测准确性结果。随机森林(RF)模型在训练集中的R²值较高(0.79),但在测试集中的R²值显著下降(0.25),表明可能存在过拟合现象。相比之下,XGBoost在两个数据集之间表现出更大的稳定性,训练集的R²值为0.77,测试集为0.27。SVM模型的表现较差,训练集中的R²值为0.35,测试集为0.27。误差指标,如RMSE和MAE,在模型之间相似,表明它们的预测能力差异较小。
图11 马铃薯作物长宽比的比较:( a )采用随机森林、支持度
向量机( SVM )和XGBoost预测模型,包括表型性状和光谱指数,( b )仅使用表型性状
马铃薯长度宽度比预测的评估使用了两个不同的数据集:第一个数据集包含农艺数据和光谱指数,第二个数据集仅基于表型特征。模型使用79天和95天的数据进行评估,这些数据接近收获期。图11展示了随机森林(RF)、支持向量机(SVM)和XGBoost模型在预测马铃薯长度宽度比方面的比较。在训练集中,RF和XGBoost均表现出较好的拟合,R²值分别为0.78和0.75,而支持向量机的R²值为0.76。然而,所有模型均呈现中等误差(RMSE和MAE),表明尽管它们与训练数据拟合良好,但预测结果仍存在一定的分散性。在测试集中,所有三个模型的表现都有所下降。随机森林(RF)的R²值显著下降至0.42,而支持向量机(SVM)和XGBoost分别降至0.28和0.38。这表明模型在新数据上的泛化能力较差,可能是由于过拟合所致。尽管随机森林和XGBoost表现稍好,但所有模型在正确预测未见数据的马铃薯长度宽度比方面都遇到困难。在第二组数据中,训练时,XGBoost的R²值最高,为0.77,其次是随机森林(RF),R²值为0.75,且RMSE和MAE误差较低,表明拟合良好。另一方面,SVM的R²值为0.41,反映了在预测马铃薯长度宽度比方面的困难。在测试中,随机森林的R²值为0.44,XGBoost降至0.27,SVM则获得最差结果,仅为0.19。这表明,尽管模型在训练中表现有效,但它们未能在新数据中良好泛化,尤其是XGBoost可能存在过拟合的情况。
图12 最终的块茎重预测图
图12展示了块茎最终重量的预测图,突出了不同处理(T1、T2和T3)的表现。重量是通过随机森林(Random Forest)模型估算的,该模型在预测产量和质量方面表现最佳。结果通过色标表示,范围从红色(0.05-0.2千克)到深绿色和蓝色(0.9-1.066千克),表示每个0.5米²区域内的预测值,单位为千克。这些区域是根据马铃薯作物的最大叶面积(LA)进行了矢量化处理的,块茎重量(W)的描述性统计数据,如中位数和平均值分别为0.56千克和0.52千克。这些值反映了随机森林(RF)模型的预测能力,因为它们在整个预测图中占主导地位。这一表现进一步加强了模型的效果,模型在测试阶段获得了R²值为0.72,显示出较高的预测能力。此外,观察到的最小值和最大值与描述性统计数据之间没有显著的离散,进一步确认了模型的准确性
Ccopi D, Ortega K, Castañeda I, Rios C, Enriquez L, Patricio S, Ore Z, Casanova D, Agurto A, Zuñiga N, et al. Using UAV Images and Phenotypic Traits to Predict Potato Morphology and Yield in Peru. Agriculture. 2024; 14(11):1876. https://doi.org/10.3390/agriculture14111876
编辑
wrd
推荐新闻
视频展示