本发明涉及遥感数据分类技术领域,更具体的涉及一种基于无人机提取分类样本点的多源遥感数据分类方法。
背景技术:
全球喀斯特地貌面积较大,相当一部分的全球人口水源依赖于喀斯特区域的含水层。喀斯特生态系统十分脆弱,特别容易受到环境变化的侵袭,导致区域内地表植被发生破坏,进而造成其地表景观退化为裸土区域,甚至退化为岩石区域,而这种石漠化现象又是一种严重的生态系统短期不可逆过程。在我国西南喀斯特地区石漠化面积较大,其中作为岩溶中心的贵州省,其表层土壤在1974年到2001年间退化为石漠化区域的速度较快,不过这种趋势在最近20年开始转为良性,许多地区的植被开始变得比以前更绿。尽管如此,对喀斯特区域,特别是位于岩溶中心贵州省的长期监测依然不容忽视。
随着多源遥感数据的发展,遥感影像在时空分辨率和光谱分辨率方面都有极大提升,特别是针对喀斯特区域的植被动态和地物类型监测研究越来越成熟。现有的地表类型分类方法日益精准,但是作为任意一种分类模型必要输入条件的野外实测分类样本点获取较为困难。特别是在较大尺度范围内,如果通过传统野外调查法收集分类样本点,人力、物力和时间成本的花费极高,严重阻碍大范围地表分类研究的发展。
技术实现要素:
本发明实施例提供一种基于无人机提取分类样本点的多源遥感数据分类方法,用以解决上述背景技术中提出的问题。
本发明实施例提供一种基于无人机提取分类样本点的多源遥感数据分类方法,包括:
从无人机航拍相片中均匀提取分类样本点,并对每类样本点进行准备标定;其中,准备标定的样本点类型包括:农田和草地、林地和灌木、空地和裸地、道路、建筑物;
获取分类遥感数据集,所述分类遥感数据集包括:微波数据sentinel-1数据集、多光谱sentinel-2数据集、基于sentinel-2数据集的植被指数数据集、数字高程模型数据集;
对遥感数据集进行处理,获得分类遥感影像数据集;并根据分类遥感影像数据集对分类样本点进行地理空间定位;
通过地理空间信息定位后的分类样本点,利用随机森林分类模型,获得分类结果。
进一步地,所述从无人机航拍相片中提取分类样本点,包括:
通过目视解译方法,从无人机航拍相片影像中均匀提取分类样本点。
进一步地,所述从无人机航拍相片中提取分类样本点,包括:
剔除不同地表类型边缘处的样本点。
进一步地,基于10m分辨率,采用snap软件对sentinel-1数据集进行轨道修正、热噪声去除、辐射校正、散斑滤波、距离-多普勒地形校正处理,获得vv极化影像数据集和vh极化影像数据集。
进一步地,所述sentinel-2数据集包含13个波段数据,涵盖可见光、近红外和短波红外光谱波段;采用sen2cor软件对sentinel-2数据集进行地形校正、大气校正和辐射校正处理,获得除第10波段外的12层影像数据集,并对12层影像数据集重采样至10m分辨率。
进一步地,所述植被指数数据集包括:ndvi、evi、savi,计算公式如下所示:
ndvi=(nir–red)/(nir red)
evi=2.5×(nir-red)/(nir 6.0red–7.5blue 1)
savi=(nir-red)(1 l)/(nir red l)
式中,nir、red和blue分别对应近红外、红波段和蓝波段的数据;l为土壤调节系数,由实际区域条件确定;nir、red和blue波段的数据分别对应sentinel-2数据集的第8波段、第4波段和第2波段的数据。
进一步地,所述土壤调节系数l=0.5。
进一步地,所述dem数据集采用srtmdem数据集,对srtmdem数据集重采样至10m分辨率后,获取高程dem影像数据集、坡度slope影像数据集、坡向aspect影像数据集、剖面曲率profilecurvature影像数据集。
进一步地,所述随机森林分类模型,包括:
利用readogr()和brick()命令读取分类样本点影像和分类遥感数据集于r语言环境中;
利用如下代码搭建随机森林分类模型;
rf<-randomforest(lc~b1 b2 b3 b4 b5 b6 b7 b8 b9 b8a b11 b12,
data=rois,
ntree=500,
importance=true)
其中,b1~b12为随机森林分类模型中的参数层影像,不同数据集对应不同的参数层影像;
利用tunerf()和randomforest()命令完成随机森林分类模型的调参训练;
利用writeraster()命令对分类结果进行出图,生成分类结果影像。
进一步地,所述地表类型分类结果的准确率指标包括:总体准确率oa和kappa系数,计算公式如下:
oa=(tp tn)/(tp fn fp tn)
式中,tp为真正,即被随机森林分类模型分类正确的正样本;fn为假负,即被随机森林分类模型分类错误的正样本;fp为假正,即被随机森林分类模型分类错误的负样本;tn为真负,即被随机森林分类模型分类正确的负样本;oa为总体分类精度,即分类正确的样本个数占所有样本个数的比例。
kappa=(po-pe)/(1-pe)
式中,po为对角线单元中观测值的总和,即总体分类精度oa;pe为对角线单元中期望值的总和;kappa为评价一致性的测量值,表示分类与完全随机的分类产生错误减少的比例。
本发明实施例提供一种基于无人机提取分类样本点的多源遥感数据分类方法,与现有技术相比,其有益效果如下:
本发明中基于无人机提取分类样本点的多源遥感数据随机森林分类方法,可以快速、有效、廉价地实现地表类型分类制图过程,同时也可为今后上万、上百万级的海量样本点提取过程提供技术支持和方法基础。但是涉及混合像元的分类样本点存在问题,在剔除边缘分类样本点(混合像元)的影响后,分类精度明显提高,特别是kappa系数的精度更优。因此,在以后的相关研究中进行布点时,尽量避免提取边缘处的分类样本点,应选取地物类型均匀一致的区域提取样本点。该方法能够有效区分枯萎植被和裸露土地,即使仅使用可见光波段组合生成的影像,也可以参考无人机影像很方便的分辨各类地表类型;可以扩大分类样本点的采集时间,不只局限于植物生长最旺季(如7到9月);该方法也减少对植物生长季运算过程的时间消耗,不需利用长时间序列的植被研究数据反演整个植被物候过程来完成分类。
附图说明
图1为本发明实施例提供的随机森林分类结果;
图2a为本发明实施例提供的s2数据集的分类结果混淆矩阵图;
图2b为本发明实施例提供的s2&vi数据集的分类结果混淆矩阵图;
图2c为本发明实施例提供的s2&vi&dem数据集的分类结果混淆矩阵图;
图2d为本发明实施例提供的s2&vi&s1数据集的分类结果混淆矩阵图;
图2e为本发明实施例提供的b3&b2&b4&b6数据集的分类结果混淆矩阵图;
图3a为本发明实施例提供的s2数据集的基尼指数图;
图3b为本发明实施例提供的s2&vi数据集的基尼指数图;
图3c为本发明实施例提供的s2&vi&dem数据集的基尼指数图;
图3d为本发明实施例提供的s2&vi&s1数据集的基尼指数图;
图3e为本发明实施例提供的b3&b2&b4&b6数据集的基尼指数图;
图4a为本发明实施例提供的数据集s2数据集的随机森林分类结果和混淆矩阵;
图4b为本发明实施例提供的数据集s2&vi数据集的随机森林分类结果和混淆矩阵;
图4c为本发明实施例提供的数据集s2&vi&s1数据集的随机森林分类结果和混淆矩阵;
图5为本发明实施例提供的枯萎植被和裸地区分图;
图6为本发明实施例提供的细小、杂乱斑块图;
图7为本发明实施例提供的一种基于无人机提取分类样本点的多源遥感数据分类方法流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图7,本发明实施例提供一种基于无人机提取分类样本点的多源遥感数据分类方法,该方法包括:
步骤s1,从无人机航拍相片中均匀提取分类样本点,并对每类样本点进行准备标定;其中,准备标定的样本点类型包括:农田和草地、林地和灌木、空地和裸地、道路、建筑物。
步骤s2,获取分类遥感数据集,分类遥感数据集包括:微波数据sentinel-1数据集、多光谱sentinel-2数据集、基于sentinel-2数据集的植被指数数据集、数字高程模型数据集。
步骤s3,对遥感数据集进行处理,获得分类遥感影像数据集;并根据分类遥感影像数据集对分类样本点进行地理空间定位。
步骤s4,通过地理空间信息定位后的分类样本点,利用随机森林分类模型,获得分类结果。
对于上述步骤s1~s4的具体说明如下:
详细的地表类型分类及监测是我国西南喀斯特区域关键的防治石漠化手段。目前多种多样的遥感数据广泛应用于地物分类制图研究中,但是稀少的野外实测样本点一直以来都是准确、有效感知地表类型的技术瓶颈之一。因此,本发明利用无人机航拍相片提取大量野外实测样本点的方法,完成地表类型分类过程,为后期的廉价海量分类样本点提取提供切实可行的方法。
本发明中均匀提取分布于研究区内的982个分类样本点,利用包括sentinel-1/2(s1/2)数据集、s2数据计算获得的植被指数(vegetationindex,vi)数据集和数字高程模型(digitalelevationmodel,dem)数据集的遥感影像资料,然后借助随机森林分类模型完成研究区地表类型分类。上述遥感数据集不仅涵盖可见光数据,还包括近红外、短波红外和微波光谱波段数据资料。分类后的结果显示,除包含dem数据集的分类结果外(总体精度和kappa系数分别为74.54%和61.73%),其他4种数据集组合(仅用s2数据集、s2&vi数据集、s2&vi&dem数据集,以及4个s2波段b3&b2&b4&b6组成的数据集)的制图总体精度(overallaccuracy,oa)和kappa系数精度都在75%和65%以上。此外,在不考虑位于边缘的样本点(即混合像元)后,分类制图结果具有更好的鲁棒,3种分类精度最高的数据集(仅用s2数据集、s2&vi数据集和s2&vi&dem数据集)oa和kappa系数精度都提高至85%和79%以上。特别是kappa系数的精度更优,提高了近15%。以上研究结果能够为喀斯特地区的地表类型制图提供准确而有效的技术手段和方法支持。
另外,本发明还对分类制图的边缘分类样本点(混合像元)、枯萎植被和裸露土地的有效区分能力,并着重强调航拍影像分类采样点自动化过程实现的必要性,展望其将会成为未来研究的一个热点方向。
需要说明的是,现有的遥感数据源种类繁多,分类方法也各式各样。为充分展示利用无人机提取海量、廉价分类样本点的可能性,选取开源数据集作为分类的遥感数据源,如sentinel-1/2和srtmdem。上述数据的优势是提供免费的,涵盖可见光、近红外、短波红外和微波范围的影像资料,为分类方法研究提供了广泛的光谱数据。同时,分类方法选用对遥感数据分类具有较优精度的随机森林,相比其他机器学习分类方法(除硬件要求极高的深度学习外),随机森林具有更好的鲁棒。
研究区概括
本发明实施例的研究区地处贵州省威宁县北部,位于104.100°e-104.118°e和27.179°n-27.191°n之间,面积1.7km×1.4km,采集无人机照片120张,提取分类采样点982个。
uav航拍相片及分类样本点数据获取
无人机航拍相片采集于2018年4月21日,使用大疆精灵4拍摄,共采集120张,飞行高度近300米,相片分辨率为1200万像素,使用fragmap软件完成操作拍摄过程。采样点通过arcgis软件,设置均匀分布于研究区内的矢量点完成,共计982个。如果利用传统的生态样方框完成本实验中近千个点位、甚至后续研究中上万、上百万点位的植被调查,所需的人工和时间成本花费极大,因此本发明利用无人机影像完成分类样本点数据的提取过程。
仅用开源遥感影像来目视解译,即使分辨率已达10m,仍难以清晰分辨各类地表类型。举例来说,研究区内某些裸露土地的颜色与生长不茂盛的树林颜色极为相近,十分容易解译错误为林地,但是如果有无人机航拍数据作为参考,地表类型就不会解译错误。所有分类样本点都是通过目视解译,将无人机影像定位至sentinel-2影像上,然后完成样本点提取过程。
遥感数据源
sentinel-1/2数据来源于欧空局(http://scihub.copernicus.ed/)。sentinel-2(s2)数据共包含13个波段数据,涵盖可见光、近红外和短波红外光谱波段,其中有5个近红外波段的数据可应用于植被相关的研究。经过sen2cor软件处理后,完成地形校正、大气校正和辐射校正等基础影像处理过程,最后得到除第10波段外的12层影像数据集,全部重采样至10m分辨率与第2(蓝)、3(绿)、4(红)和8(近红外)波段分辨率一致。sentinel-1(s1)grd数据(c波段,vv和vh极化)分辨率也为10m,使用snap软件进行轨道修正、热噪声去除、辐射校正、散斑滤波和距离-多普勒地形校正操作后得到vv和vh2层数据影像。本发明所使用的s2和s1数据分别获取于2018年4月17日和2018年4月20日。dem数据使用srtmdem,重采样至10m分辨率后计算获取高程(dem)、坡度(slope)、坡向(aspect)和剖面曲率(profilecurvature)4层数据影像。经过处理,上述所有遥感影像和无人机航拍数据全部使用wgs_1984_utm_zone_48n投影。
植被指数的计算
为提高分类精度,引入植被指数数据(vegetationindices,vi),主要包括ndvi(normalizeddifferencevegetationindex)evi(enhancedvegetationindex)和savi(soil-adjustedvegetationindex),其计算公式如下所示:
ndvi=(nir–red)/(nir red)(1)
evi=2.5×(nir-red)/(nir 6.0red–7.5blue 1)(2)
savi=(nir-red)(1 l)/(nir red l)(3)
式中nir、red和blue分别对应近红外、红和蓝波段的数值,l是土壤调节系数,由实际区域条件确定,一般情况都采用l=0.5来完成运算。其中,nir、red和blue波段数据分别对应s2数据的第8、4和2波段结果。
随机森林分类模型的构建
随机森林是一种组成式的监督分类法,以决策树为基础,实现对多决策树的集成。随机森林方法在遥感数据分类研究中应用较为广泛,该分类模型从原始的训练数据集中采取有放回的抽样(bagging)方法完成子数据集的构造过程。该过程中不同子数据集的元素可以重复,同一子数据集中的元素也可以重复。同时,因其引入两个随机性属性(样本随机,特征随机),所以分类结果不容易陷入过拟合。随机森林特征重要性的大小正相关于该特征对森林中每棵树的贡献大小,当平均该特征对每个树的贡献之后,得到基尼指数(giniindex)。此外,袋外数据(outofbag,oob)错误率可以作为评估指标来衡量特征集贡献大小,通常优先选择袋外误差率最低的特征集。
随机森林分类模型通过r语言实现。
首先,需要加载的工具包包括randomforest、raster、rgdal、lattice、ggplot2、caret和e1071。
然后利用readogr()和brick()命令读取分类样本点影像和用于分类的遥感基础数据集于r语言环境中。
第三步,利用下述代码搭建随机森林模型。
rf<-randomforest(lc~b1 b2 b3 b4 b5 b6 b7 b8 b9 b8a b11 b12,
data=rois,
ntree=500,
importance=true)
其中,b1到b12为本次分类模型中的参数层影像,不同数据集对应于不同的参数层影像。如本示例针对s2数据集,对应权利5所述sen2cor软件对其地形校正、大气校正和辐射校正处理后的12个参数层影像。而s2&vi不仅包括s2数据集,还包括权利6所示的ndvi、evi、savi3个植被参数层影像。s2&vi&dem不仅包括s2和权利6中的3个植被参数层影像,还包括权利8所示的高程、坡度、坡向和剖面曲率4个地形参数影像。s2&vi&s1包括s2和权利6中的3个植被参数层影像,还包括权利4所述的vv和vh2个极化参数层影像。而b3&b2&b4&b6仅包括s2数据集的第3、2、4和6这4个波段参数层影像。
第四步,利用tunerf()和randomforest()命令完成模型的调参训练。
最后,利用writeraster()命令对分类结果进行出图,生成分类结果影像。
本发明实施例中,主要区分5种地表类型,如表1所示。
表1实验研究区地表类型分类样本点概况
验证分类结果的准确率指标主要包括总体准确率(overallaccuracy,oa)和kappa系数两种,其计算公式如下:
oa=(tp tn)/(tp fn fp tn)(4)
式中,tp为真正,即被模型分类正确的正样本;fn为假负,即被模型分类错误的正样本;fp为假正,即被模型分类错误的负样本;tn为真负,即被模型分类正确的负样本;oa为总体分类精度,即分类正确的样本个数占所有样本个数的比例。
kappa=(po-pe)/(1-pe)(5)
式中,po为对角线单元中观测值的总和,也就是总体分类精度oa;pe为对角线单元中期望值的总和;kappa为评价一致性的测量值,表示分类与完全随机的分类产生错误减少的比例。
依据上述数据和随机森林分类模型完成的制图结果如图1所示,除s2&vi&dem数据集的分类结果较差外(表2),其余分类结果都有相对稳定的结果,oa在75%以上,kpppa系数在65%以上,同时各分类结果的空间分布位置基本一致。其中,2个数据集s2&vi的分类精度最高,但是oob的数值以3个数据集s2&vi&s1的分类结果为最高。本发明的研究结果基本呈现数据资料越多,分类精度越高的规律。不过,本发明中dem及其相关计算结果的引入会明显产生噪声,导致分类结果降低。因此,分类研究也应注意筛选变量,以免冗余变量的引入产生误差,导致分类精度降低。
表2分类结果精度评价指标表
根据图2a~2e可以发现,分类样本点越多的地表类型,分类精度越高;分类样本点越少的地表类型,最终分类精度越低。特别是具有最少采样本点的建筑物分类,在测试集的5种分类结果中都没能正确区分。
图3a~3e展示了各分类数据集中,不同遥感图层的基尼指数值。在前4种数据集中,s2数据的第2、3、4和6波段都具有较高的基尼指数数据值,因此仅用上述4层数据波段完成分类后发现,其分类后的空间分布形式基本同其他多数据图层分类结果相似(图1)。特别是仅用以上4层数据波段完成的分类结果精度略低于最高分类数据集的结果精度,远高于引入冗余数据集(dem)后的分类精度(表2和图2a~2e)。以上结果也说明,数据降维的操作方式,在大数据量处理时会有效的节约时间,同时又保证较高的分类精度。
边缘分类样本点(混合像元)对分类结果准确率的影响
本发明中分类样本点是按照均匀分布规则设置的,因此有接近1/3的样本点位于不同地表类型的边缘处(即混合像元),如表1所示。在此,通过剔除表1中318个边缘样本点,使所有样本点只是位于一致性极高区域后的分类精度。将位于一致性较高地表类型的664个样本点输入分类模型中分类结果精度最高的3个数据集进行分类,结果如图4a~4c所示,其分类精度存在明显提升(表3),oa和kappa都在85%和79%以上。因此,剔除边缘分类样本点(混合像元)对分类精度的提高十分重要,本发明中对oa和kappa的提升,一个接近10%,一个接近15%。
表3数据集s2、s2&vi和s2&vi&s1分类结果精度评价指标表
基于无人机提取分类样本点的分类方法能够有效识别枯萎植被
常规目视解译,特别是没有无人机航拍相片作为参考资料时,可见光遥感影像目视解译对枯萎林地和某些裸地的区分相对困难,如图5a所示从s2的合成图像上判读枯萎林地和裸地的颜色十分接近。不过,本发明利用无人机提取分类样本点完成分类后,对枯萎林地和裸地的区分会准确很多,如图5b所示。特别是图5b从上到下第二个圈中对枯萎林地的分类,基本可以有效地衔接旁边的旺盛林地。其中,图5a中从上到下圈内地表类型依次为森林、森林、裸地;图5b中从上到下圈内地表类型依次为森林、森林、裸地。
细小斑块和杂乱斑块
图6展示了分类对细小、杂乱斑块的区分效果。图6中地表类型为森林的圈中的分类效果基本可以满足常规地表类型分类需求,不过该结果也存在部分椒盐效应现象,而且部分道路也存在不连贯现象。此外,需要着重关注的是对建筑物区分效果很差,如图6红色圆圈中的房屋完全没有区分出来,在图5中更多的建筑物中也仅区分出部分样本。造成这种现象的原因主要有两方面:1)分类样本点过少,如表1所示,建筑物的分类样本点仅有4个,而且全部是边缘样本点;2)建筑物面积小,多数个体难以覆盖一个2×2的像素单元。根据实际分类制图需求,如果确实需要对这类个数少、面积小的地表类型进行分类,建议人为加大采样样本点,而不单纯依靠均匀布点所设置的样本点。此外,如果条件允许,考虑使用更高分辨率的遥感影像(一般非开源)进行分类制图,加强对小面积样本的识别能力。其中,图6a为s2合成图像上的细小斑块和杂乱斑块;图6a为本发明利用无人机提取分类样本点完成分类后的细小斑块和杂乱斑块;图6a中从上到下圈内地表类型依次为森林、森林、裸地;图6b中从上到下圈内地表类型依次为森林、森林、裸地。
以上公开的仅为本发明的几个具体实施例,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
1.一种基于无人机提取分类样本点的多源遥感数据分类方法,其特征在于,包括:
从无人机航拍相片中均匀提取分类样本点,并对每类样本点进行准备标定;其中,准备标定的样本点类型包括:农田和草地、林地和灌木、空地和裸地、道路、建筑物;
获取分类遥感数据集,所述分类遥感数据集包括:微波数据sentinel-1数据集、多光谱sentinel-2数据集、基于sentinel-2数据集的植被指数数据集、数字高程模型数据集;
对遥感数据集进行处理,获得分类遥感影像数据集;并根据分类遥感影像数据集对分类样本点进行地理空间定位;
通过地理空间信息定位后的分类样本点,利用随机森林分类模型,获得分类结果。
2.如权利要求1所述的基于无人机提取分类样本点的多源遥感数据分类方法,其特征在于,所述从无人机航拍相片中提取分类样本点,包括:
通过目视解译方法,从无人机航拍相片影像中均匀提取分类样本点。
3.如权利要求1或2所述的基于无人机提取分类样本点的多源遥感数据分类方法,其特征在于,所述从无人机航拍相片中提取分类样本点,包括:
剔除不同地表类型边缘处的样本点。
4.如权利要求1所述的基于无人机提取分类样本点的多源遥感数据分类方法,其特征在于,基于10m分辨率,采用snap软件对微波数据sentinel-1数据集进行轨道修正、热噪声去除、辐射校正、散斑滤波、距离-多普勒地形校正处理,获得vv极化影像数据集和vh极化影像数据集。
5.如权利要求1所述的基于无人机提取分类样本点的多源遥感数据分类方法,其特征在于,所述多光谱sentinel-2数据集包含13个波段数据,涵盖可见光、近红外和短波红外光谱波段;采用sen2cor软件对多光谱sentinel-2数据集进行地形校正、大气校正和辐射校正处理,获得除第10波段外的12层影像数据集,并对12层影像数据集重采样至10m分辨率。
6.如权利要求1或5所述的基于无人机提取分类样本点的多源遥感数据分类方法,其特征在于,所述植被指数数据集包括:ndvi、evi、savi,计算公式如下所示:
ndvi=(nir–red)/(nir red)
evi=2.5×(nir-red)/(nir 6.0red–7.5blue 1)
savi=(nir-red)(1 l)/(nir red l)
式中,nir、red和blue分别对应近红外、红波段和蓝波段的数据;l为土壤调节系数,由实际区域条件确定;nir、red和blue波段的数据分别对应sentinel-2数据集的第8波段、第4波段和第2波段的数据。
7.如权利要求6所述的基于无人机提取分类样本点的多源遥感数据分类方法,其特征在于,所述土壤调节系数l=0.5。
8.如权利要求1所述的基于无人机提取分类样本点的多源遥感数据分类方法,其特征在于,所述dem数据集采用srtmdem数据集,对srtmdem数据集重采样至10m分辨率后,获取高程dem影像数据集、坡度slope影像数据集、坡向aspect影像数据集、剖面曲率profilecurvature影像数据集。
9.如权利要求1所述的基于无人机提取分类样本点的多源遥感数据分类方法,其特征在于,所述随机森林分类模型,包括:
利用readogr()和brick()命令读取分类样本点影像和分类遥感数据集于r语言环境中;
利用如下代码搭建随机森林分类模型;
rf<-randomforest(lc~b1 b2 b3 b4 b5 b6 b7 b8 b9 b8a b11 b12,
data=rois,
ntree=500,
importance=true)
其中,b1~b12为随机森林分类模型中的参数层影像,不同数据集对应不同的参数层影像;
利用tunerf()和randomforest()命令完成随机森林分类模型的调参训练;
利用writeraster()命令对分类结果进行出图,生成分类结果影像。
10.如权利要求1或9所述的基于无人机提取分类样本点的多源遥感数据分类方法,其特征在于,所述地表类型分类结果的准确率指标包括:总体准确率oa和kappa系数,计算公式如下:
oa=(tp tn)/(tp fn fp tn)
式中,tp为真正,即被随机森林分类模型分类正确的正样本;fn为假负,即被随机森林分类模型分类错误的正样本;fp为假正,即被随机森林分类模型分类错误的负样本;tn为真负,即被随机森林分类模型分类正确的负样本;oa为总体分类精度,即分类正确的样本个数占所有样本个数的比例;
kappa=(po-pe)/(1-pe)
式中,po为对角线单元中观测值的总和,即总体分类精度oa;pe为对角线单元中期望值的总和;kappa为评价一致性的测量值,表示分类与完全随机的分类产生错误减少的比例。
技术总结