本发明涉及高光谱图像分类
技术领域:
,更具体的说是涉及一种最大-最小距离嵌入的无监督高光谱图像分类方法。
背景技术:
:遥感技术的飞速发展使得高光谱图像的采集越来越容易。高光谱图像包含上百个连续的波段,能够更加精确的表达物质的特征。因此,高光谱图像被广泛地应用到各个领域,如地表观测、气体泄漏等。高光谱图像分类作为高光谱图像应用的一个关键问题,得到广泛的关注和研究。目前,高光谱图像分类主要基于监督的方法,如svm,knn,深度学习等。早期,主要以像素级的分类为主,通过比较像素的光谱特征得到分类结果。后来,人们将空间上下文信息和光谱信息融合,采用空谱融合的方法对高光谱图像进行分类。但是,这些方法都需要大量的标注样本。由于高光谱应用场景复杂,有些不适合实地考察。人工标注样本的人力成本和时间代价较大。因此,虽然监督分类方法的效果很好,但是无法将方法直接应用到实际问题中。无监督分类方法无需先验知识,将相似性高的元素组成一组,实现物体的自动分类。因此,虽然分类性能不如监督分类方法,但是也被应用到计算机视觉、模式识别、信息检索等领域。高光谱图像分类作为一种特殊的视觉问题,也有很多学者采用无监督分类方法。其中,基于图分割的方法和基于密度的聚类方法是两类比较常见的无监督方法。但是,由于高光谱图像类内差异较大、类间差异较小,这些方法的分类效果有待提高。众所周知,数据的判别性和维度是影响聚类结果的两个重要因素。高光谱图像不但数据量大,而且维度高,类别之间的差别不明显,给聚类算法的应用带来挑战。因此,如何提供一种增强数据的判别性和克服聚类中的高维度无监督高光谱图像分类方法是本领域技术人员亟需解决的问题。技术实现要素:有鉴于此,本发明提供了一种最大-最小距离嵌入的无监督高光谱图像分类方法,充分利用空间上下文信息,采用多尺度空间特征以便增强数据的判别性。为了克服聚类中的高维度问题,采用最大-最小距离嵌入的深度自编码器实现特征表示和降维处理,同时也降低了聚类时间。最后,将kmeans聚类结果采用引导滤波进行优化,进一步提高了分类性能。为了实现上述目的,本发明提供如下技术方案:一种最大-最小距离嵌入的无监督高光谱图像分类方法,包括如下具体步骤:s1:采取多尺度空间特征代替原始特征,得到多尺度特征向量;s2:将所述多尺度特征向量输入最大-最小距离嵌入的深度自编码器模型,进行特征提取和降维;s3:通过k-means聚类得到初始聚类结果;s4:利用引导滤波对所述初始聚类结果进行优化。优选的,在上述的一种最大-最小距离嵌入的无监督高光谱图像分类方法中,所述s1的具体步骤如下:s11:原始图像的维度为α×β×s,其中,α×β为空间尺度,s为光谱通道;将原始图像用主成分分析法降维,得到引导图像g和降维后高光谱图像i;s12:以降维后高光谱图像i的分量为被引导图像,设置e次不同的引导滤波半径re,其中re取3,5,7…像素,正则项ε=0.001,得到引导后的图像分量;以同样的方式为降维后高光谱图像i的其他分量做滤波,得到降维后高光谱图像i的滤波后的图像;s13:设置不同的引导滤波半径re得到降维后高光谱图像i的e个滤波后的图像,分别为a1,a2,...,ae;s14:将每个不同的滤波后的图像中对应的分量进行拼接得到一个像素的光谱分量fi,进一步将每个光谱分量fi组合得到多尺度空间特征向量f。优选的,在上述的一种最大-最小距离嵌入的无监督高光谱图像分类方法中,所述s2中,所述深度自编码器模型包括编码器和解码器;所述编码器和所述解码器为对称结构;所述编码器依次将输入层、第一隐藏层、第二隐藏层、第三隐藏层和输出层连接;所述编码器的输出作为所述解码器的输入进行解码。优选的,在上述的一种最大-最小距离嵌入的无监督高光谱图像分类方法中,所述s2中,输入和输出值尽量保持一致,即输入和输出之间的均方差最小,损失函数为:其中,fw(·),gu(·)分别表示编码器和解码器。优选的,在上述的一种最大-最小距离嵌入的无监督高光谱图像分类方法中,所述s2中,选出每个元素的最近邻和最远邻,并组成最近、最远输入对;其中一个输入为x,则其对应的最近输入对为(x,xnear),最远输入对为(x,xfar),分别将(x,xnear),(x,xfar)数据对作为输入,损失函数如下:其中,lnear为最近输入对的损失函数;lfar为最远输入对的损失函数;引入最近输入对和最远输入对的损失函数,总的损失函数为:l=lae λ(lnear-lfar);其中,λ为最大-最小距离嵌入的权重参数。通过上述技术方案,本发明的技术效果:引入损失函数,让相似的元素,提取的特征更相似;让不相近的元素,提取的特征区别更大。优选的,在上述的一种最大-最小距离嵌入的无监督高光谱图像分类方法中,所述s4中,将采用k-means聚类方法得到初始的分类图c转化成一个概率图p=[p1,p2,...,pm],其中,pi=[pi1,pi2,...,pin]是一个与概率图大小一样的矩阵;m代表的是高光谱图像的不同分类;其中,概率图中的每个值的定义如下:采用引导滤波对概率图p进行过滤,得到每个pi的概率;通过pca得到三维彩色引导图像;最后,在概率图p的像素点上,选择具有最大概率值的点作为该像素点的分类,得到的新分类图即为最终结果。经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种最大-最小距离嵌入的无监督高光谱图像分类方法,充分利用空间上下文信息,采用多尺度空间特征以便增强数据的判别性。为了克服聚类中的高维度问题,采用最大-最小距离嵌入的深度自编码器实现特征表示和降维处理,同时也降低了聚类时间。最后,将kmeans聚类结果采用引导滤波进行优化,进一步提高了分类性能。(1)采用多尺度空间特征代替原始特征,以便增加数据的判别性;(2)采用最大-最小距离嵌入的深度自编码器提取特征和降低维度,以便提高聚类算法的精度和运行时间;(3)采用传统的k-means聚类方法得到初始的聚类结果;(4)采用引导滤波对聚类结果进行优化处理。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1附图为本发明的框架示意图;图2附图为本发明的自编码器网络结构示意图;图3附图为本发明的salinas数据集分类图;其中,(a)kmeans,(b)msf,(c)pca,(d)mspca,(e)ae,(f)msae,(g)mmdc,(h)真实分类图;图4附图为本发明的paviauniversity数据集分类图;其中,(a)kmeans,(b)msf,(c)pca,(d)mspca,(e)ae,(f)msae,(g)mmdc,(h)真实分类图。具体实施方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。本发明实施例公开了一种最大-最小距离嵌入的无监督高光谱图像分类方法,充分利用空间上下文信息,采用多尺度空间特征以便增强数据的判别性。为了克服聚类中的高维度问题,采用最大-最小距离嵌入的深度自编码器实现特征表示和降维处理,同时也降低了聚类时间。最后,将kmeans聚类结果采用引导滤波进行优化,进一步提高了分类性能。首先采用主成分分析法实现对高光谱图像降维,取其前三个主成分作为彩色的引导图像。然后,分别取salinas、paviauniversity数据集主成分分析的前50、25个主向量作为待输入的图像s、u。然后,分别以不同的滤波半径对高光谱图像s、u的每一层光谱信息进行过滤,并得到过滤后的图像。最后,将s、u及其不同滤波过滤后的图像进行拼接,得到一个融合多尺度空间特征的高光谱图像。以salinas数据集为例,以单个光谱通道图像s1作为输入图像、g为引导图像,以得到滤波后的输出u1。采用同样的方式,可以得到所有的ui并构成一个新的高光谱图像u={u1,u2,...,uk}。对于不同的滤波半径r=3,5,7,可以得到三个输出图像a,b,c。最后,以光谱信息为基本单位重新组织高光谱图像为其中,即,第i个像素的k个光谱信息;然后,多尺度空间特征向量被定义成如公式(6-1)的形式。其中,n为高光谱图像的像素个数。因此,特征f不仅包含了光谱特征s,也包含了不同尺度的空间特征。为了进一步增强高光谱图像数据的判别性,并能够更好地、降低聚类算法的空间和时间代价,本发明提出最大-最小距离嵌入的深度自编码器模型。该模型以聚类的定义为出发点,使距离近的元素经过编码后,能够更近;距离较远的对象,编码后区分度更大。并且,经过编码后的数据应该最大限度地保留原始数据的结构特征,确保数据不会产生扭曲,而影响聚类结果。为了能够使数据保持原有的数据特征,构造了一个对称的自编码器。该自编码器的编码阶段和解码阶段具有对称的网络结构,如图2所示。编码器的网络结构有五层,分别为一个输入层、一个输出层、三个隐层(节点个数分别问500,500,2000)。对于salinas和paviauniversity两个数据集,输入层的节点个数分别为200和100,输出层的节点个数分别为16和9(即,数据集的类别个数)。将编码器和解码器分别设为fw(·),gu(·)。在训练阶段,使得所有样本的输入和输出值尽量保持一致,即输入和输出之间的均方差最小。其损失函数如公式6-2所示。其次,为了能够使距离相近数据输出特征更接近,距离较远的数据输出特征更远,采用最大-最小距离嵌入的方法对自编码器进行微调。选出每个元素的最近邻和最远邻,并组成最近、最远输入对。其中一个输入为x,则其对应的最近输入对为(x,xnear),最远输入对为(x,xfar),分别将(x,xnear),(x,xfar)数据对作为输入,损失函数如下:为了能够嵌入最大-最小距离,我们对自编码器的训练结果进行微调,将最大-最小距离嵌入训练过程中。其中,lnear为最近输入对的损失函数,其值越小越好;lfar为最远输入对的损失函数,其值越大越好。因此,将最近输入对和最远输入对的损失函数引入之后,损失函数改为公式(6-4)。l=lae λ(lnear-lfar)公式(6-4)其中,λ为最大-最小距离嵌入的权重参数,本实验将其设置为0.01。引导滤波优化方法,将采用k-means聚类方法得到初始的分类图c转化成一个概率图p=[p1,p2,...,pm],其中,pi=[pi1,pi2,...,pin]是一个与概率图大小一样的矩阵;m代表的是高光谱图像的不同分类;其中,概率图中的每个值的定义如下:采用引导滤波对概率图p进行过滤,得到每个pi的概率;通过pca得到三维彩色引导图像;最后,在概率图p的像素点上,选择具有最大概率值的点作为该像素点的分类,得到的新分类图即为最终结果。进一步,假设分类有16类,分类图c可以转化为p1,……,p16十六层与c大小一样的图(矩阵)。然后用引导滤波分别对p1,……,p16,进行过滤,得到p1,……,p16过滤后的图像。过滤后的每个元素是0到1的一个数,即概率。然后选p1到p16的第一个像素,比较p1到p16哪个层上的值最大,如果p3的值最大,那么就说第一个像素属于第三类,依次类推,计算出所有像素点的分类。本发明采用python语言,使用keras深度学习库实现了最大-最小嵌入的自编码器。kmeans聚类算法采用的是sklearn数据包,并采用kmeans 初始化方法增加算法的稳定性。选用salinas和paviauniversity两个数据集作为研究对象,采用oa、aa和ka三个指标评价了算法的性能。为了验证提出的多尺度空间特征的判别性,采用k-means聚类方法比较了原始数据(k-means)和多尺度空间特征数据(msf)的分类结果;为了验证最大-最小距离嵌入自编码提取特征的特征,将原始数据、多尺度空间特征数据进行pca降维,并与最大-最小距离嵌入的自编码特征进行比较;最后,我们比较了无监督高光谱分类框架(mmdc)的结果。salinas实验结果及分析:本实验采用oa、aa和ka三个指标对算法进行了评价。每个算法运行10次,选用平均值±方差的表示方式作为最终的结果。详细的分类结果如表6-1所示。首先,比较msf和kmeans两个算法的结果。针对oa、aa两个指标,msf方法比kmeans方法分别提升了6%,8%。这说明,提出的多尺度空间特征融合方法能够增加高光谱像素点的判别性,有利于高光谱图像分类精度的提升。分别比较pca与ae,mspca与msae方法,以证明提出的自编码器有利于高光谱图像的特征提取。采用主成分分析方法对高光谱图像降维,降维后的结果(pca)64.28±3.44%略低于原始图像分类结果65.13±2.62%。降维后的多尺度空间特征的结果72.67±0.28%反而高于原始图像分类结果71.65±3.03%,而且稳定性更好。最大-最小嵌入自编码器不但能够降低高光谱图像的光谱维度(由200维降到16维),而且还能提升高光谱图像分类结果。如,原始特征分类结果从65.13±2.62%提升到67.63±0.2%,并增强了算法的稳定性。多尺度空间特征分类结果从71.65±3.03%提升到73.13±1.77%。采用引导滤波对高光谱图像进行优化,进一步提升了分类性能。与原始数据的oa结果相比,mmdc方法由原来的65.13±2.62提升到76.17±1.79%。可见,本发明提出的无监督高光谱图像分类框架能够很大程度提升其分类性能。表6-1salinas数据集的分类结果sk-meansmsfpcamspcaaemsaemmdcc165.29±.1484.96±.065.27±.0584.94±.0183.88±.089.25±2.990.13±3.7c299.40±.099.38±.099.40±.0199.38±.099.32±.099.32±.2100.0±.0c30±.00±.00±.00±.00±.00±.00±.0c494.74±.0695.99±.0494.76±.0895.97±.096.37±.096.57±.098.17±.0c573.25±.0574.93±.1173.22±.0874.94±.0969.39±.070.64±.4470.75±.37c6100.0±.0100.0±.0100.0±.0100.0±.0100.0±.0100.0±.0100.0±.0c790.10±.0192.64±.0190.10±.0192.62±.0296.15±.0193.44±1.697.2±1.05c868.7±1.7670.29±.669.28±2.270.48±.0376.41±.5675.40±.0479.31±.09c984.41±7.289.14±9.982.02 9.591.27±5.083.27±.085.42±6.685.68±7.1c1047.8±17.162.9±25.542.2±22.672.6±13.185.60±.074.4±29.879.9±32.6c110±.00±.00±.00±.00±.00±.00±.0c1259.06±.3958.3±.1758.93±5.258.37±.267.19±.063.03±6.265.65±7.2c1336.5±1.8140.89±.8237.2±2.4540.63±.0439.77±.5841.74±.0644.29±.15c1491.73±.0693.87±.2391.73±.0493.80±.0893.71±.094.85±.0597.17±.12c1551.93±.9457.93±.7951.63±1.357.68±.0246.68±.8858.43±.0263.11±.04c1674.41±1.591.12±.0374.74±1.891.11±.096.19±.4292.11±0.098.01±.0oa65.13±2.671.65±3.064.28±3.472.67±.2867.63±.273.13±1.876.17±1.8aa61.42±1.369.5±1.9664.40±1.770.24±.5370.87±.0470.91±2.273.08±2.3ka64.84±2.768.5±3.2560.52±3.669.61±.2964.54±.270.16±2.073.51±2.0paviauniversity实验结果及分析,采用oa、aa和ka对各种分类算法进行评估。表6-2给出了三个评价指标和每个分类的正确率。从表6-2可见,对于该数据集,多尺度空间特征没有增加高光谱图像的分类精度,原始数据的分类(kmeans)精度为51.76%,多尺度空间特征的分类精度为51.51%。经过主成分分析降维,将高光谱的光谱信息由103维降到9维,其分类精度几乎没有太大变化。但是,经过最大-最小距离嵌入自编码提取特征之后,输出的特征更具有判别性。其中,原始光谱信息经过自编码提取特征之后,其oa分类精度由51.76%上升到54.58%;多尺度空间特征经过自编码提取特征之后,其oa分类精度由51.51%提升到了57.6%。比较ae和msae可知,多尺度空间特征经过自编码器提取特征之后,比原始特征分类结果(54.58%)提升了3%。提出mmdc无监督高光谱分类框架的oa结果达到59.76%,优于其他方法。表6-2paviauniversity数据集的分类结果k-meansmsfpcamspcaaemsaemmdcc176.94±.077.16±.076.95±.0177.16±.0178.00±.0176.98±.0176.37±.01c279.13±.0178.22±.0279.14±.1178.24±.0281.08±.1183.22±.0184.46±.03c30±.00±.00±.00±.04.65±.0020±.00±.0c449.43±.0144.12±.049.44±.0344.18±.0244.52±.02541.9±.06345.46±.08c588.0±.090.14±.087.95±.0690.14±.097.96±.090.04±.090.56±.0c626.90±.0128.13±.0126.89±.0428.12±.1921.20±.08628.0±.00530.46±.02c70±.00±.00±.00±.00±.00±.00±.0c847.61±.0148.73±.0147.62±.0148.75±.0150.40±.03947.76±.0251.08±.01c999.68±.099.79±.099.68±.099.79±.098.96±.099.27±.0100.0±.0oa51.76±.0151.5±.00151.76±.0051.51±.0254.58±.1357.6±.02659.76±.03aa51.97±.051.8±.00451.96±.0151.82±.0252.98±.02151.91±.0153.36±.01ka42.0±.0141.80±.0142.01±.0141.80±.0244.77±.1347.46±.0350.05±.03本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。当前第1页1 2 3 
技术特征:1.一种最大-最小距离嵌入的无监督高光谱图像分类方法,其特征在于,包括如下具体步骤:
s1:采取多尺度空间特征代替原始特征,得到多尺度特征向量;
s2:将所述多尺度特征向量输入最大-最小距离嵌入的深度自编码器模型,进行特征提取和降维;
s3:通过k-means聚类得到初始聚类结果;
s4:利用引导滤波对所述初始聚类结果进行优化。
2.根据权利要求1所述的一种最大-最小距离嵌入的无监督高光谱图像分类方法,其特征在于,所述s1的具体步骤如下:
s11:原始图像的维度为α×β×s,其中,α×β为空间尺度,s为光谱通道;将原始图像用主成分分析法降维,得到引导图像g和降维后高光谱图像i;
s12:以降维后高光谱图像i的分量为被引导图像,设置e次不同的引导滤波半径re,其中re取3,5,7…像素,正则项ε=0.001,得到引导后的图像分量;以同样的方式为降维后高光谱图像i的其他分量做滤波,得到降维后高光谱图像i的滤波后的图像;
s13:设置不同的引导滤波半径re得到降维后高光谱图像i的e个滤波后的图像,分别为a1,a2,...,ae;
s14:将每个不同的滤波后的图像中对应的分量进行拼接得到一个像素的光谱分量fi,进一步将每个光谱分量fi组合得到多尺度空间特征向量f。
3.根据权利要求1所述的一种最大-最小距离嵌入的无监督高光谱图像分类方法,其特征在于,所述s2中,所述深度自编码器模型包括编码器和解码器;所述编码器和所述解码器为对称结构;所述编码器依次将输入层、第一隐藏层、第二隐藏层、第三隐藏层和输出层连接;所述编码器的输出作为所述解码器的输入进行解码。
4.根据权利要求3所述的一种最大-最小距离嵌入的无监督高光谱图像分类方法,其特征在于,所述s2中,输入和输出值尽量保持一致,即输入和输出之间的均方差最小,损失函数为:
其中,fw(·),gu(·)分别表示编码器和解码器。
5.根据权利要求4所述的一种最大-最小距离嵌入的无监督高光谱图像分类方法,其特征在于,所述s2中,选出每个元素的最近邻和最远邻,并组成最近、最远输入对;其中一个输入为x,则其对应的最近输入对为(x,xnear),最远输入对为(x,xfar),分别将(x,xnear),(x,xfar)数据对作为输入,损失函数如下:
其中,lnear为最近输入对的损失函数;lfar为最远输入对的损失函数;引入最近输入对和最远输入对的损失函数,总的损失函数为:
l=lae λ(lnear-lfar);
其中,λ为最大-最小距离嵌入的权重参数。
6.根据权利要求1所述的一种最大-最小距离嵌入的无监督高光谱图像分类方法,其特征在于,所述s4中,将采用k-means聚类方法得到初始的分类图c转化成一个概率图p=[p1,p2,...,pm],其中,pi=[pi1,pi2,...,pin]是一个与概率图大小一样的矩阵;m代表的是高光谱图像的不同分类;其中,概率图中的每个值的定义如下:
采用引导滤波对概率图p进行过滤,得到每个pi的概率;通过pca得到三维彩色引导图像;最后,在概率图p的像素点上,选择具有最大概率值的点作为该像素点的分类,得到的新分类图即为最终结果。
技术总结本发明公开了一种最大‑最小距离嵌入的无监督高光谱图像分类方法,包括如下具体步骤:S1:采取多尺度空间特征代替原始特征,得到多尺度特征向量;S2:将所述多尺度特征向量输入最大‑最小距离嵌入的深度自编码器模型,进行特征提取和降维;S3:通过K‑means聚类得到初始聚类结果;S4:利用引导滤波对所述初始聚类结果进行优化。本发明充分利用空间上下文信息,采用多尺度空间特征以便增强数据的判别性。为了克服聚类中的高维度问题,采用最大‑最小距离嵌入的深度自编码器实现特征表示和降维处理,同时也降低了聚类时间,将kmeans聚类结果采用引导滤波进行优化,进一步提高了分类性能。
技术研发人员:曹菡;郭延辉
受保护的技术使用者:陕西师范大学
技术研发日:2020.01.16
技术公布日:2020.06.05