本发明涉及农业生产技术领域,具体为一种基于机器学习算法的多植被指数的水稻产量估测方法。
背景技术:
目前,大范围的作物估产多使用卫星遥感方法,但卫星遥遥感受天气、空间分辨率和气候影响较大。对于农田管理角度而言,卫星遥感难以实现高精度的产量估测,特别是在多雨寡照的水稻种植区域,采用合适的时期获取高分辨率的卫星图像,实现高精度产量估测具有一定难度。近几年,具有低成本、机动性强、操作简单、观测范围大等优点的无人机平台发展迅速,遥感能够提供高时空分辨率的遥感影像基于无人机遥感的系统,可以提供精度较高的合适图像,为农田信息获取和田块尺度的产量估测提供了新途径。
另外,国内外很多学者展开了遥感技术估测作物产量主要通过建立植被指数与产量之间的统计模型运用遥感数据进行产量估测的研究。但单一植被指数估测方法未能综合考虑其他植被指数的影响,同时也造成了其他植被遥感数据的浪费,有待解决。
技术实现要素:
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种基于机器学习算法的多植被指数的水稻产量估测方法,解决了现今单一植被指数估测方法未能综合考虑其他植被指数的影响,同时也造成了其他植被遥感数据的浪费的问题。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:一种基于机器学习算法的多植被指数的水稻产量估测方法,以寒地水稻主要种植区—黑龙江省建三江七星农场典型规模化农田田块为对象,通过设置不同氮素水平的田块尺度试验,结合无人机遥感技术获取寒地2017年、2018年水稻拔节期(se)和抽穗期(hd)的光谱数据,构建了基于这两个时期多植被指数与寒地水稻实测产量的回归模型,并结合作物实测产量进行模型评价,包括以下步骤:
①研究区域的实验设置:我国东北地区黑龙江省农垦总局佳木斯市建三江分局管理局七星农场(47.01°n~47.29°n,132.31°e~134.14°e),主要气候类型属于寒温带大陆性季风气候,全年平均日照时数2300-2600h,无霜期110-135天,全年降水量500~600mm,72%集中在6月至9月,于在2017年和2018年,开展了不同氮水平、品种(龙粳21、龙粳31)、密度(27穴/m2、33穴/m2)的小区试验,并设置3个重复,每个处理小区田块面积为7×9m2,当地水稻通常4月中旬左右在温室大棚内进行育秧,移栽时间为5月中旬,收获时间为9月下旬,氮肥分别在移栽期、分蘖期和拔节期施入,其中基肥:蘖肥:穗肥为4:3:3,所有处理磷肥和钾肥的施用量相同,在水稻移栽前全部施入磷肥50kgp2o5ha-1。钾肥施用量为105kgk2oha-1,分别在水稻移栽前和拔节期各施入50%。
②遥感数据采集:使用无人机同步搭载多光谱相机,相机包括绿光(中心波长g550nm,波段宽度40nm)、红光(r660nm,40nm)、红边(re735nm,10nm)、近红外(nir790nm,40nm)四个波段,另外还配有rgb传感器,相机多光谱传感器镜头焦距为3.98nm,图像像素大小为1280×960,另外,该相机还同时搭配有光照传感器和标定白板,起飞前先采集白板图像进行辐射定标,每次拍摄时获取辐射照度信息,便于后期处理时数据的辐射矫正,航测时间选择在正午10:00—14:00左右,要求测量时晴朗无风少云;数据采集时,采用飞行控制软件来规划航线和设置飞行参数,飞行结束后,导出带有高精度位置信息的图像数据,并复制到拼接软件中进行自动拼接,获取能够覆盖整个实验区域,并且经过辐射矫正的光谱反射率图像文件,再利用高精度gps测定的已知点坐标数据进行正射矫正,让图像数据显示相对正确的坐标位置信息。
③产量数据采集:在水稻成熟期,选取各处长势均匀的1平方米样方3个,割下样方内全部水稻植株,风干并脱粒,再运用风选除去杂质及空瘪粒,称重后获得实收每平米产量,同时,运用快速水分测定仪测定谷粒样品含水量,将产量折算为14%的含水量状态下的标准产量。
产量计算公式:产量采用单位t/ha,产量(t/ha)=实收平米产量(g)*(1-实际含水量)/(1-标准含水量0.14)*0.01。
④基于机器学习算法的多植被指数组合估产模型的构建与验证:通过多次测试,选用了在估测产量上表现较好的十种植被指数,即ndvi、rvi、dvi、savi、gosavi、gndvi、grvi、osavi、nrei、mndi、ndre、wdrvi。
将2017年和2018年两年试验数据随机划分,其中70%数据集用做模型构建,30%数据集用做模型验证,构建不同时期、不同植被指数与水稻产量间的回归模型,建模采用机器学习方法。
选用随机森林(rf)和支持向量机(svm)两种现在非常流行的机器学习算法进行建模分析,这两种算法能够很好地解决小样本数据的分类和预测问题,采用十次交叉验证,并通过网络搜索给rf和svm寻找最优的参数。
分别将拔节期、抽穗期期水稻的实测产量作为因变量,将所有的植被指数作为自变量,使用随机森林算法回归算法构建产量的遥感反演模型;再利用支持向量机构建与产量的遥感反演模型,选用决定系数(r2)、均方根误差(rmse)和相对误差(re)三个指标对构建的模型效果进行评价和验证,r2越接近1,且rmse和re越接近0,说明模型效果越好,其中re小于10%表明模型表现优秀;在20~30%之间表明模型表现一般;大于30%则表明较差。具体公式如式(1)、式(2)和式(3)所示。
其中,yi为第i个样本点的作物产量的实际测量值(t/hm2);ei为根据模型算出的第i个样本点的作物产量估算值(t/hm2);
无人机为ebeesq无人机,其搭载的多光谱相机为sequoia多光谱相机。
飞行控制软件为emotionag3.5.0飞行控制软件,飞行高度设置为106.1米,旁向重叠率设置为75%,图像像素分辨率为0.1米。
拼接软件为pix4dag3.2.23拼接软件,利用gps的精准定位拼接,获取能够覆盖整个实验区域,并且经过辐射矫正的光谱反射率图像文件。
(三)有益效果
本发明提供了一种基于机器学习算法的多植被指数的水稻产量估测方法新型三圆一体球磨机。具备以下有益效果:
本发明使用机器学习的方法可以显著提高估产模型的精度,随机森林算法较支持向量机算法模型精度更高,在抽穗期的训练集r2可达0.94,验证集rmse为0.59t/hm2,基于机器学习算法的多植被指数的水稻产量估测方法,可以快速有效地诊断和评估作物长势和产量,为规模化种植经营提供快捷高效的管理工具,有效解决了单一植被指数估测方法未能综合考虑其他植被指数影响的问题,同时利用多植被指数的估测方法也充分应用了遥感所采集的数据,解决了只利用单一植被其他植被遥感数据浪费的现象,实用性更强,精确度更高。
附图说明
图1为2018年抽穗期无人机获取的多光谱图像;
图2为基于无人机遥感的不同建模算法下不同生育时期的估测产量与实际产量的比较图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种基于机器学习算法的多植被指数的水稻产量估测方法,以寒地水稻主要种植区—黑龙江省建三江七星农场典型规模化农田田块为对象,通过设置不同氮素水平的田块尺度试验,结合无人机遥感技术获取寒地2017年、2018年水稻拔节期(se)和抽穗期(hd)的光谱数据,构建了基于这两个时期多植被指数与寒地水稻实测产量的回归模型,并结合作物实测产量进行模型评价,包括以下步骤:
①研究区域的实验设置:我国东北地区黑龙江省农垦总局佳木斯市建三江分局管理局七星农场(47.01°n~47.29°n,132.31°e~134.14°e),主要气候类型属于寒温带大陆性季风气候,全年平均日照时数2300-2600h,无霜期110-135天,全年降水量500~600mm,72%集中在6月至9月,于在2017年和2018年,开展了不同氮水平、品种(龙粳21、龙粳31)、密度(27穴/m2、33穴/m2)的小区试验,并设置3个重复,每个处理小区田块面积为7×9m2,当地水稻通常4月中旬左右在温室大棚内进行育秧,移栽时间为5月中旬,收获时间为9月下旬,氮肥分别在移栽期、分蘖期和拔节期施入,其中基肥:蘖肥:穗肥为4:3:3,所有处理磷肥和钾肥的施用量相同,在水稻移栽前全部施入磷肥50kgp2o5ha-1。钾肥施用量为105kgk2oha-1,分别在水稻移栽前和拔节期各施入50%。
表12017和2018年试验田各处理施肥量
表1为2017和2018年试验田各处的施肥量。
②遥感数据采集:使用无人机同步搭载多光谱相机,相机包括绿光(中心波长g550nm,波段宽度40nm)、红光(r660nm,40nm)、红边(re735nm,10nm)、近红外(nir790nm,40nm)四个波段,另外还配有rgb传感器,相机多光谱传感器镜头焦距为3.98nm,图像像素大小为1280×960,另外,该相机还同时搭配有光照传感器和标定白板,起飞前先采集白板图像进行辐射定标,每次拍摄时获取辐射照度信息,便于后期处理时数据的辐射矫正,航测时间选择在正午10:00—14:00左右,要求测量时晴朗无风少云;数据采集时,采用飞行控制软件来规划航线和设置飞行参数,飞行结束后,导出带有高精度位置信息的图像数据,并复制到拼接软件中进行自动拼接,获取能够覆盖整个实验区域,并且经过辐射矫正的光谱反射率图像文件,再利用高精度gps测定的已知点坐标数据进行正射矫正,让图像数据显示相对正确的坐标位置信息。
③产量数据采集:在水稻成熟期,选取各处长势均匀的1平方米样方3个,割下样方内全部水稻植株,风干并脱粒,再运用风选除去杂质及空瘪粒,称重后获得实收每平米产量,同时,运用快速水分测定仪测定谷粒样品含水量,将产量折算为14%的含水量状态下的标准产量,水稻成熟期是指稻穗开花后到谷粒成熟的时期,按时段又分为乳熟期、蜡熟期和完熟期,选取样方需注意选取完熟期样方,避免产量数据采集的误差产生误导信息。
产量计算公式:产量采用单位t/ha,产量(t/ha)=实收平米产量(g)*(1-实际含水量)/(1-标准含水量0.14)*0.01。
④基于机器学习算法的多植被指数组合估产模型的构建与验证:通过多次测试,选用了在估测产量上表现较好的十种植被指数,即ndvi、rvi、dvi、savi、gosavi、gndvi、grvi、osavi、nrei、mndi、ndre、wdrvi。
表2所选用的植被指数
表2为植被指数名称和计算方法,其中re为红波段,g为绿波段,nir为近红外波段。
将2017年和2018年两年试验数据随机划分,其中70%数据集用做模型构建,30%数据集用做模型验证,构建不同时期、不同植被指数与水稻产量间的回归模型,建模采用机器学习方法。
表3样本水稻产量统计
表3为样本水稻的产量统计表。
选用随机森林(rf)和支持向量机(svm)两种现在非常流行的机器学习算法进行建模分析,这两种算法能够很好地解决小样本数据的分类和预测问题,采用十次交叉验证,并通过网络搜索给rf和svm寻找最优的参数。
分别将拔节期、抽穗期期水稻的实测产量作为因变量,将所有的植被指数作为自变量,使用随机森林算法回归算法构建产量的遥感反演模型;再利用支持向量机构建与产量的遥感反演模型,选用决定系数(r2)、均方根误差(rmse)和相对误差(re)三个指标对构建的模型效果进行评价和验证,r2越接近1,且rmse和re越接近0,说明模型效果越好,其中re小于10%表明模型表现优秀;在20~30%之间表明模型表现一般;大于30%则表明较差。具体公式如式(1)、式(2)和式(3)所示。
其中,yi为第i个样本点的作物产量的实际测量值(t/hm2);ei为根据模型算出的第i个样本点的作物产量估算值(t/hm2);
根据模型构建和检验方法,构建了拔节期和抽穗期水稻产量的估算模型,利用r2、rmse及re对2种机器学习算法的学习能力进行评价,结果表明,和经验模型结果类似,在抽穗期r2、rmse及re都表现的较为理想,其中随机森林回归算法的表现均优于支持向量机算法,在抽穗期的训练集建模精度r2达到了0.94,验证集的检验中rmse为0.59t/hm2,表现较为理想;svr算法在抽穗期训练集的建模精度r2达到了0.85,验证集的rmse为0.65t/hm2,同样优于单一植被指数的经验模型。
表4不同估算模型下水稻不同生育期产量和植被指数的相关关系
表4中rf:随机森林;svr:支持向量机回归。
本发明中水稻不同生育期对植被指数估产的影响——地面空间异质性随作物的生长阶段不同而发生改变,因此基于作物不同生育期的植被指数估产模型的精度存在显著差异,水稻拔节期主要进行营养生长,该时期的植被指数不能反映产量形成器官的干物质积累过程,导致估产精度不高,抽穗灌浆期是水稻将光合作用产生的淀粉、蛋白质等有机物从营养器官转移到籽粒中的阶段,因为抽穗期水稻苗己经长成,不再继续长高,是水稻营养吸收最完全的时期,所以抽穗期是产量形成的最关键时期。
本发明中不同植被指数的估产精度——归一化植被指数ndvi作为一种经济、有效的实用地表植被覆盖和长势的参考量,是目前应用最广泛的植被指数,但在植被覆盖度较低的时候能够较好指示植物长势和生物量,但在高植被覆盖区表现出饱和特性,指示能力下降,本发明中基于寒地水稻抽穗期nnir的估产模型预测精度最高,r2(n=80)达到0.8。
本发明中不同建模方法的估产精度——由于多元线性回归融合了一些表现不好的植被指数,原则上应该优选不同的植被指数组合来达到提高估产模型的精度。本发明使用随机森林和向量机回归对多生育期多种植被指数与产量进行建模,利用了全子集的方法,基于抽穗期得到的训练样本r2可达到0.94,检验样本的r2也有0.83,可见在抽穗期使用随机森林的方法估测水稻产量有很大潜力。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下。由语句“包括一个......限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素”。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
1.一种基于机器学习算法的多植被指数的水稻产量估测方法,以寒地水稻主要种植区—黑龙江省建三江七星农场典型规模化农田田块为对象,通过设置不同氮素水平的田块尺度试验,结合无人机遥感技术获取寒地2017年、2018年水稻拔节期(se)和抽穗期(hd)的光谱数据,构建了基于这两个时期多植被指数与寒地水稻实测产量的回归模型,并结合作物实测产量进行模型评价,包括以下步骤:
①研究区域的实验设置:我国东北地区黑龙江省农垦总局佳木斯市建三江分局管理局七星农场(47.01°n~47.29°n,132.31°e~134.14°e),主要气候类型属于寒温带大陆性季风气候,全年平均日照时数2300-2600h,无霜期110-135天,全年降水量500~600mm,72%集中在6月至9月,于在2017年和2018年,开展了不同氮水平、品种(龙粳21、龙粳31)、密度(27穴/m2、33穴/m2)的小区试验,并设置3个重复,每个处理小区田块面积为7×9m2,当地水稻通常4月中旬左右在温室大棚内进行育秧,移栽时间为5月中旬,收获时间为9月下旬,氮肥分别在移栽期、分蘖期和拔节期施入,其中基肥:蘖肥:穗肥为4:3:3,所有处理磷肥和钾肥的施用量相同,在水稻移栽前全部施入磷肥50kgp2o5ha-1。钾肥施用量为105kgk2oha-1,分别在水稻移栽前和拔节期各施入50%。
②遥感数据采集:使用无人机同步搭载多光谱相机,相机包括绿光(中心波长g550nm,波段宽度40nm)、红光(r660nm,40nm)、红边(re735nm,10nm)、近红外(nir790nm,40nm)四个波段,另外还配有rgb传感器,相机多光谱传感器镜头焦距为3.98nm,图像像素大小为1280×960,另外,该相机还同时搭配有光照传感器和标定白板,起飞前先采集白板图像进行辐射定标,每次拍摄时获取辐射照度信息,便于后期处理时数据的辐射矫正,航测时间选择在正午10:00—14:00左右,要求测量时晴朗无风少云;数据采集时,采用飞行控制软件来规划航线和设置飞行参数,飞行结束后,导出带有高精度位置信息的图像数据,并复制到拼接软件中进行自动拼接,获取能够覆盖整个实验区域,并且经过辐射矫正的光谱反射率图像文件,再利用高精度gps测定的已知点坐标数据进行正射矫正,让图像数据显示相对正确的坐标位置信息。
③产量数据采集:在水稻成熟期,选取各处长势均匀的1平方米样方3个,割下样方内全部水稻植株,风干并脱粒,再运用风选除去杂质及空瘪粒,称重后获得实收每平米产量,同时,运用快速水分测定仪测定谷粒样品含水量,将产量折算为14%的含水量状态下的标准产量。
产量计算公式:产量采用单位t/ha,产量(t/ha)=实收平米产量(g)*(1-实际含水量)/(1-标准含水量0.14)*0.01。
④基于机器学习算法的多植被指数组合估产模型的构建与验证:通过多次测试,选用了在估测产量上表现较好的十种植被指数,即ndvi、rvi、dvi、savi、gosavi、gndvi、grvi、osavi、nrei、mndi、ndre、wdrvi。
将2017年和2018年两年试验数据随机划分,其中70%数据集用做模型构建,30%数据集用做模型验证,构建不同时期、不同植被指数与水稻产量间的回归模型,建模采用机器学习方法。
选用随机森林(rf)和支持向量机(svm)两种现在非常流行的机器学习算法进行建模分析,这两种算法能够很好地解决小样本数据的分类和预测问题,采用十次交叉验证,并通过网络搜索给rf和svm寻找最优的参数。
分别将拔节期、抽穗期期水稻的实测产量作为因变量,将所有的植被指数作为自变量,使用随机森林算法回归算法构建产量的遥感反演模型;再利用支持向量机构建与产量的遥感反演模型,选用决定系数(r2)、均方根误差(rmse)和相对误差(re)三个指标对构建的模型效果进行评价和验证,r2越接近1,且rmse和re越接近0,说明模型效果越好,其中re小于10%表明模型表现优秀;在20~30%之间表明模型表现一般;大于30%则表明较差。具体公式如式(1)、式(2)和式(3)所示。
其中,yi为第i个样本点的作物产量的实际测量值(t/hm2);ei为根据模型算出的第i个样本点的作物产量估算值(t/hm2);
2.根据权利要求1所述的一种基于机器学习算法的多植被指数的水稻产量估测方法的步骤中,无人机为ebeesq无人机,其搭载的多光谱相机为sequoia多光谱相机。
3.根据权利要求1所述的一种基于机器学习算法的多植被指数的水稻产量估测方法的步骤中,飞行控制软件为emotionag3.5.0飞行控制软件,飞行高度设置为106.1米,旁向重叠率设置为75%,图像像素分辨率为0.1米。
4.根据权利要求1所述的一种基于机器学习算法的多植被指数的水稻产量估测方法的步骤中,拼接软件为pix4dag3.2.23拼接软件,利用gps的精准定位拼接,获取能够覆盖整个实验区域,并且经过辐射矫正的光谱反射率图像文件。
技术总结