本发明属于遥感图像处理技术领域,涉及基于迁移学习和主动学习的sar图像变化检测方法。
背景技术:
变化检测的目的是通过分析研究区域在两个不同时间获取的图像来识别土地覆盖变化。这一技术是从不同领域的大量应用中派生而来的,如环境监测,城市研究,医学诊断,视频监控,运动检测等。特殊地,由于合成孔径雷达(sar)图像具有全天候、全天时的特性,即:sar能够在恶劣的天气条件下工作,无论是白天还是夜晚,这使得sar图像变化检测问题是一个非常活跃的研究领域。然而,由于sar图像中斑点噪声的存在给变化检测问题带来了一定的困难。
实际上,sar图像变化检测可以划分为图像分类问题,即:sar图像中所有像素被划分为变化类和非变化类。随着图像分类技术的发展,可以采用许多新的方法来解决变化检测问题。目前流行的处理该问题的机器学习方法基本上是非监督的方法,但该类方法需要挖掘数据自身的特性进行自动的分类,对于分类算法的设计要求较高,且往往不能达到最佳的检测效果。而另一类监督分类的方法则需要使用标记样本作为训练样本进行模型的训练,这种技术可以利用训练样本的信息获得更加有效的分类模型,但是并不适用于sar图像变化检测问题,在实际应用中去获取标记样本需要大量的人力、物力及财力,且往往不能具有较好的实时性,这与去利用变化检测技术去解决实际应用问题的动机及目标相距甚远。但鉴于训练集能够提供更加丰富、精确的分类信息,因此可以采用迁移学习的方法,利用已检测数据集去训练更加有效的分类模型,同时,为了使样本的使用更加有效,可以通过设计样本选择策略,来达到利用少量样本获取精确分类模型,进而提高分类精度的目的。
在大多数变化检测应用中,通常都会产生差异图像,因为差异图像是潜在变化信息的主要来源之一,包含了关于真实变化的各种信息,如纹理、边缘轮廓、梯度、方向等。从大量的文献中可以看出,sar图像变化检测的性能主要取决于差异图像的质量和分类方法的准确性。
技术实现要素:
本发明的目的是提供一种基于迁移学习和主动学习的sar图像变化检测方法,提出的smi样本选择方法通过考虑上下文信息来提高样本选择的有效性,进而可以利用更少的训练样本获取更加有效的分类模型,提高分类精度。
本发明所采用的技术方案是,基于迁移学习和主动学习的sar图像变化检测方法,具体包括如下步骤:
步骤1,选取窗口大小为3×3的lee滤波器分别对训练数据集中两幅原始的获取于不同时间的sar图像x1,x2进行滤波预处理,有效去除斑点噪声;
步骤2,利用log-ratio运算符获取差异图像x,与训练数据集中的变化检测参考图一同构成样本集;
步骤3,在样本集中随机选择变化类和非变化类样本共li个组成训练样本集,使用训练样本集训练初始svm分类器;
步骤4,主动学习:利用smi样本选择方法在样本集中选择n个样本进行标记,并加入到训练样本集li中,获得新的训练样本集,利用新的训练样本集重新训练svm分类器,利用训练得到的svm分类器对所有样本进行分类;得到判别函数f(x);利用sigmoid函数将判别函数f(x)转化为后验概率pdata;
步骤5,不断循环步骤4的主动学习过程,当循环次数达到规定的循环次数最大上限smax,停止循环并转步骤6;否则,转步骤4;
步骤6,迁移学习:利用log-ratio运算符获取待检测数据集的差异图像,利用主动学习过程训练获得的svm分类器对待检测数据集的差异图像进行分类,得到待检测数据集二类判别函数g(x);利用sigmoid函数将g(x)转化为二类后验概率pdata2;
步骤7,构造能量函数:采用二阶mrf随机场作为能量函数中的空间先验,并与步骤6获得的后验概率pdata2相结合构造能量函数e,然后利用α-expansion对能量函数e进行优化得最终变化检测结果,对变化类像素标记为“1”,非变化类像素标记为“0”,输出检测结果。
本发明的特点还在于,
步骤2中,采用log-ratio运算符获取的差异图像x为:
其中,x1,x2分别为获取于不同时间的sar图像。
步骤3的具体过程如下:
{(x1,y1),(x2,y2),…,(xi,yi)}是一组从训练数据集中随机抽取获得的训练样本,xi∈li为任意训练样本,yi∈ω为相关的标签,ω≡{1,...,k}为标签集合,共包含k类;采用拉格朗日优化理论将分类问题转换成为一个优化问题对分类器进行训练,得到初始svm分类器。
步骤4中判别函数f(x)定义为
其中:sv表示支持向量的集合,xi作为支持向量,k(xi,x)是rbf核函数,αi是拉格朗日因子,如果相应的αi有一个非零值,对于给定的测试样本x,用判别函数f(x)来预测样本的类标签。
步骤4中,使用sigmoid函数将svm输出转换为后验概率pdata,如下式:
其中,f(xi)为样本xi的判别函数。
步骤4中,smi样本选择方法具体如下:
采用smi样本选择方法选择新的样本
其中,h为后验精度矩阵,su为从样本集中移除训练样本集样本所剩下的所有样本组成的集合;这里,采用定义在二阶邻域系统上的空间关系来修正样本的统计模型,令ni为与xi相邻的样本集合;由于ni={dist(xi,xj)2≤2,i≠j},dist(xi,xj)表示样本xi和样本xj之间的欧氏距离,因此,在获得后验概率的基础上,给定标签样本的条件分布pcontext的马尔科夫模型表示为:
其中,δk(yi,yj)是kroneckerdelta函数,xi和xj对应的类标签分别为yi和yj,这里当两个变量yi和yj有不同的取值时函数等于零,当两个变量yi和yj具有相同的值时,pcontext函数等于1;β是一个常数,z为归一化常数。
步骤7中优化后的能量函数为:
利用α-expansion对能量函数进行优化得最终变化检测结果。
本发明的有益效果是,本发明提供的基于迁移学习和主动学习的sar图像变化检测方法,采用结合迁移学习和主动学习的策略,能够提高训练数据集的使用效率。此外本发明采用加入了空间信息的样本选择策略提高样本选择的效率,进而提高变化检测的精度,可用于对环境变化的自动检测。仿真实验证明,本发明对sar图像可以准确的检测变化区域。
附图说明
图1是采用本发明基于迁移学习和主动学习的sar图像变化检测方法流程图;
图2(a)-(c)是采用本发明基于迁移学习和主动学习的sar图像变化检测方法进行实验的原始sar的图像训练数据集;
图3(a)-(c)是本发明的基于迁移学习和主动学习的sar图像变化检测方法进行实验的原始sar的图像检测数据集;
图4本发明的基于迁移学习和主动学习的sar图像变化检测方法在检测数据集上获取的变化区域结果图。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
步骤1,选取窗口大小为3×3的lee滤波器分别对两幅原始的获取于不同时间的sar图像x1,x2进行滤波预处理,有效去除斑点噪声;
步骤2,利用log-ratio运算符获取差异图像x,与训练数据集中的变化检测参考图一同构成样本集;
采用log-ratio运算符获取的差异图像x为:
其中,x1,x2分别为获取于不同时间的sar图像,log为log运算符。
步骤3,在样本集中随机选择变化类和非变化类样本共li个组成训练样本集,使用训练样本集训练初始svm分类器:
{(x1,y1),(x2,y2),…,(xi,yi)}是一组从训练数据集中随机抽取获得的训练样本,xi∈li为任意训练样本,yi∈ω为相关的标签,ω≡{1,...,k}为标签集合,共包含k类;
二值svm(支撑向量机)的目标是找到一个超平面,将d维特征空间分成两个子空间(每个类对应一个子空间)。分类器的训练阶段采用拉格朗日优化理论将分类问题转换成为一个优化问题,得到如下对偶表示
αi拉格朗日因子,c是一个用户选择常数,和k(xixj)是一个内核函数满足mercer条件。在本发明中,采用rbf核函数k(x,z)=exp(-γ||x-z||2),参数γ设置为0.0005;利用该核函数,svm可以隐式地将数据映射到高维空间中进行处理。
步骤4,主动学习:利用smi样本选择方法在样本集中选择n个样本进行标记,并加入到训练样本集li中,获得新的训练样本集,利用新的训练样本集重新训练svm分类器,利用训练得到的svm分类器对所有样本进行分类;得到判别函数f(x);利用sigmoid函数将判别函数f(x)转化为后验概率pdata;
svm的解是全局解,判别函数f(x)定义为
其中,sv表示支持向量的集合,xi为通过svm分类器选择出的样本,并将它作为支持向量,k(xi,x)是rbf核函数,αi是拉格朗日因子,如果相应的αi有一个非零值,对于给定的测试样本x,用判别函数f(x)的来预测样本的标签。
因为支持向量机的输出分数不是概率,而是样本x到分离超平面的距离;因此,需要一种将svm输出分数转换成概率的方法。存在许多从训练样本中估计概率的方法,在本发明中使用sigmoidal函数将svm输出转换为后验概率,如下式:
通过本发明提出的smi主动样本选择方法选择新的样本
其中,h为后验精度矩阵,su为从样本集中移除训练样本集样本所剩下的所有样本组成的集合;这里,采用定义在二阶邻域系统上的空间关系来修正样本的统计模型,令ni为与xi相邻的样本集合;由于ni={dist(xi,xj)2≤2,i≠j},dist(xi,xj)表示样本xi和样本xj之间的欧氏距离,因此,再获得后验概率pdata的基础上,给定标签样本的条件分布pcontext的马尔科夫模型表示为:
其中,δk(yi,yj)是kroneckerdelta函数,xi和xj对应的标签分别为yi和yj,这里当两个变量yi和yj有不同的取值时函数等于零,当两个变量yi和yj具有相同的值时,pcontext函数等于1;β是一个常数,z为归一化常数。
步骤6,迁移学习:利用log-ratio运算符获取待检测数据集的差异图像,利用主动学习过程训练获得的svm分类器对待检测数据集的差异图像进行分类,得到待检测数据集判别函数g(x);利用sigmoid函数将g(x)转化为后验概率二类后验概率pdata2;
步骤7,构造能量函数:采用二阶mrf随机场作为能量函数中的空间先验,并与步骤6获得的后验概率pdata2相结合构造能量函数e,然后利用α-expansion对能量函数e进行优化得最终变化检测结果,优化后的能量函数如下:
利用α-expansion对能量函数进行优化得最终变化检测结果,对变化类像素标记为“1”,非变化类像素标记为“0”,输出检测结果。
本发明的效果可以通过仿真实验具体说明,
1.实验条件
实验所用微机cpu为intelpentium43.0ghz内存1gb,编程平台是matlab7.0.1,实验中采用的图像数据为分辨率为12.5m的c波段sar图像。
2.实验内容
首先对在不同时间获取到的同一地理位置区域的sar图像数据集(如图2(a)-2(b)所示)进行预处理,利用log-ratio运算符产生差异图像(如图2(c))所示,接着采用主动学习的方法训练分类器,其中信息样本的选择采用本发明中提出的结合了空间上下文的smi方法,再利用学习到的分类器对待检测数据集(如图3所示)进行分类,最后对获得待检测数据集的能量函数,产生变化检测结果图(如图4所示)并输出。
循环次数最大上限smax根据实际情况人为定义。
测试参考图(如图3(c)所示)由先验的信息和图像判读获得的,通过对变化检测测试参考图和实验得到的变化检测结果图对比,来评价本发明的效果。
3.实验结果
图2(a)、(b)和图3(a)、(b)的原始sar图像受到斑点噪声的影响,通过比较图3(c)和图4,可以看出,该数据集的变化区域可以被准确的检测出来。
本发明将迁移学习的思想应用于sar图像变化检测问题,使得可以利用更多的监督学习方法获取更加有效的用于变化检测的分类模型;其次,本发明提出了一种主动样本选择方法,该方法通过考虑上下文信息来提高样本选择的有效性,进而可以利用更少的训练样本获取更加有效的分类模型,提高分类精度。
1.基于迁移学习和主动学习的sar图像变化检测方法,其特征在于:具体包括如下步骤:
步骤1,选取窗口大小为3×3的lee滤波器分别对训练数据集中两幅原始的获取于不同时间的sar图像x1,x2进行滤波预处理,有效去除斑点噪声;
步骤2,利用log-ratio运算符获取差异图像x,与训练数据集中的变化检测参考图一同构成样本集;
步骤3,在样本集中随机选择变化类和非变化类样本共li个组成训练样本集,使用训练样本集训练初始svm分类器;
步骤4,主动学习:利用smi样本选择方法在样本集中选择n个样本进行标记,并加入到训练样本集li中,获得新的训练样本集,利用新的训练样本集重新训练svm分类器,利用训练得到的svm分类器对所有样本进行分类;得到判别函数f(x);利用sigmoid函数将判别函数f(x)转化为后验概率pdata;
步骤5,不断循环步骤4的主动学习过程,当循环次数达到规定的循环次数最大上限smax,停止循环并转步骤6;否则,转步骤4;
步骤6,迁移学习:利用log-ratio运算符获取待检测数据集的差异图像,利用主动学习过程训练获得的svm分类器对待检测数据集的差异图像进行分类,得到待检测数据集二类判别函数g(x);利用sigmoid函数将g(x)转化为二类后验概率pdata2;
步骤7,构造能量函数:采用二阶mrf随机场作为能量函数中的空间先验,并与步骤6获得的后验概率pdata2相结合构造能量函数e,然后利用α-expansion对能量函数e进行优化得最终变化检测结果,对变化类像素标记为“1”,非变化类像素标记为“0”,输出检测结果。
2.根据权利要求1所述的基于迁移学习和主动学习的sar图像变化检测方法,其特征在于:
步骤2中,采用log-ratio运算符获取的差异图像x为:
其中,x1,x2分别为获取于不同时间的sar图像。
3.根据权利要求1所述的基于迁移学习和主动学习的sar图像变化检测方法,步骤3的具体过程如下:
{(x1,y1),(x2,y2),…,(xi,yi)}是一组从训练数据集中随机抽取获得的训练样本,xi∈li为任意训练样本,yi∈ω为相关的标签,ω≡{1,...,k}为标签集合,共包含k类;采用拉格朗日优化理论将分类问题转换成为一个优化问题对分类器进行训练,得到初始svm分类器。
4.根据权利要求3所述的基于迁移学习和主动学习的sar图像变化检测方法,步骤4中判别函数f(x)定义为
其中:sv表示支持向量的集合,xi作为支持向量,k(xi,x)是rbf核函数,αi是拉格朗日因子,如果相应的αi有一个非零值,对于给定的测试样本x,用判别函数f(x)来预测样本的类标签。
5.根据权利要求1所述的基于迁移学习和主动学习的sar图像变化检测方法,步骤4中,使用sigmoid函数将svm输出转换为后验概率pdata,如下式:
其中,f(xi)为样本xi的判别函数。
6.根据权利要求5所述的基于迁移学习和主动学习的sar图像变化检测方法,步骤4中,smi样本选择方法具体如下:
采用smi样本选择方法选择新的样本
其中,h为后验精度矩阵,su为从样本集中移除训练样本集样本所剩下的所有样本组成的集合;这里,采用定义在二阶邻域系统上的空间关系来修正样本的统计模型,令ni为与xi相邻的样本集合;由于ni={dist(xi,xj)2≤2,i≠j},dist(xi,xj)表示样本xi和样本xj之间的欧氏距离,因此,在获得后验概率的基础上,给定标签样本的条件分布pcontext的马尔科夫模型表示为:
其中,δk(yi,yj)是kroneckerdelta函数,xi和xj对应的类标签分别为yi和yj,这里当两个变量yi和yj有不同的取值时函数等于零,当两个变量yi和yj具有相同的值时,pcontext函数等于1;β是一个常数,z为归一化常数。
7.根据权利要求1所述的基于迁移学习和主动学习的sar图像变化检测方法,步骤7中优化后的能量函数为:
利用α-expansion对能量函数进行优化得最终变化检测结果。
技术总结