本发明属于雷达遥感应用技术领域,具体涉及一种基于注意力机制的合成孔径雷达舰船目标检测方法。
背景技术:
合成孔径雷达(syntheticapertureradar,以下简称sar)具有全天时、全天候等特点,是一种重要的对地观测手段。sar图像目标检测利用sar图像信息来实现目标位置和类别的判定,已广泛应用到海洋检测、资源勘探等领域,是提升sar传感器信息感知能力、实现sar技术应用的关键技术之一。
sar图像目标检测性能和特征提取的好坏及与测试目标的相似性有密切关系。随着sar成像技术的发展,sar图像分辨率逐渐提高,数据集也逐渐丰富。然而在舰船检测方面,目前的方法检测效果不理想,虚警问题严重。因此,有必要研究更好的特征提取方法,减少特征损失,以在sar图像舰船目标检测中获得更好的性能。
现有的有效提升目标检测性能的研究主要有:(1)设计更深层的神经网络,来提取更具语义性的特征。随着层深度的增加,特征图变得高度语义化但更抽象化。但同时在下采样过程中,在最后特征图上小型目标几乎没有用于位置细化和分类的信息,随着层深度的增加,计算量大大增加,并且容易造成小型目标的丢失。(2)通过fpn结构,将浅层特征与深层语义特征结合,来获得更能表示目标特性的特征,最终结合各层特征将其送入检测网络得到最终的检测结果。但是上述这些研究都是基于光学图像数据。sar图像成像机理与普通光学传感器有很大的差异,导致sar图像不能像光学图像那样能直观地被理解,同时导致sar图像的特征提取与特征融合变得困难。
在此基础上,注意力机制被提出,它主要关注候选区域,使得候选区域学习权重更大,从而更多的关注目标的特征。近年来,各类注意力模型被提出来提高特征提取的能力,从而在目标检测时能够有效减少虚警,获得更好的检测率。在sar图像舰船目标检测中,小型舰船目标像素很少,所占比例很小,同时舰船大小不定,注意力模型可以获得更多的关注候选区域,提取更有效的特征。因此,本发明提出一种新型注意力模块,提取更具语义性的特征,使后续的检测率提高,虚警减少。
技术实现要素:
本发明的目的,就是针对上述存在的问题及不足,为了克服目前基于卷积神经网络的方法在大场景sar图像舰船目标中,对小型舰船检测效果差,虚警较多的问题,提供了一种新的注意力模块spatialshuffle-groupenhance(sse),将其应用于基于中心点的目标检测网络中,在sar图像舰船目标检测取得了很好的效果。
本发明的技术方案为:一种基于注意力机制的合成孔径雷达舰船目标检测方法,如图1所示,包括:
步骤1、获取sar-ship-dataset数据集,对其进行预处理,得到训练集和验证集数据;
步骤2、构建基于spatialshuffle-groupenhance(sse)的网络模型,包括:
1)首先将得到得到c通道,h×w的卷积特征图,将其按通道维度分为g个组,组卷积可以显著降低计算损失,但当多个组卷积堆叠在一起,某个通道输出仅从一小部分输入通道中导出,这样降低了通道组之间的信息流通和信息表示能力,因此,对卷积层输出的通道进行通道混洗,再分成g个组,输出到下一层卷积层。通道混洗操作可由以下步骤来完成
(1)将一个卷积层的channel分为g组,则每组有c/g个通道。
(2)reshape为(g,c/g)
(3)转置为(c/g,g)
(4)平坦化,再分为g组作为下一层的输入
对于g个组,每个组都有子特征,但是由于噪声和相似特征的存在,特征很难有好的分布。所以利用全局信息来进一步加强关键区域的语义特征,使用空间平均函数
其中,
其中ε是为了增加数值稳定性而添加的常数。
为了确保在网络中插入的归一化可以表示身份转化,对每个系数ci引入一组参数γ,β来缩放和转换归一化值。
其中γ,β是sse模型中引入的参数。
最后,为了获得增强的特征向量
所有增强的特征组成了最终结果特征图
2)检测框架模块:本发明网络框架采用基于中心点的centernet检测框架。
该框架将目标建模为一个点(边界框的中心点),目标检测问题转化为关键点估计问题。
该检测框架的流程如下:
首先,若i∈rw×h×3是一张输入宽为h,高为w的图片。送入dla网络后得到一个关键点热图服从
其中,
步骤3、将训练集输入构建好的基于sse注意力模块的centernet网络模型进行训练,得到学习后的卷积神经网络模型,并在验证集上进行调参,得到最优的模型及其对应参数,获得训练好的基于sse注意力模块的网络;
步骤4、将需要检测的sar图像输入训练好的基于注意力模块的centernet网络,获得检测结果。同时,将加入注意力模块的目标检测结果和未加注意力模块的网络结果进行比较,说明本发明的有效性。
本发明的有益效果为,在传统基于卷积神经网络的目标检测的基础上,提出了一种基于注意力的sar图像目标检测方法。它的一个重要创新点就是在几乎不增加参数量和计算量的情况下也能让检测性能得到极强的增益。同时与其它注意力模块相比,它首先通过通道分组来减少计算量,然后通过通道shuffle关注通道之间的联系,同时通过生成注意力重要性因子聚集了空间中的全局和局部语义信息。该注意力模块是非常轻量级的,且对于一些高级语义非常有效,可以显著提高目标检测任务性能。
附图说明
图1为本发明注意力模块;
图2为含有舰船目标的sar图像;
图3为将注意力模块加入目标检测网络;
图4为注意力模块的性能验证图。
具体实施方式
本发明是为了提高sar图像检测目标检测的能力,因此,将本发明的注意力模块应用于基于中心点的centernet检测框架中。为了评价本发明注意力模块ssge的好坏,将该模块应用于sar图像舰船目标检测框架中。该模块放在dla34网络结构每个bottleneck的最后一个batchnorm层之后,同时将g设置为64。实验首先将如附图2所示的sar-ship-dataset数据集按8:1:1分为训练,验证,和测试三个部分。通过将附图1的注意力模块加入检测网络centernet进行sar图像舰船目标检测的训练,模块在网络结构中的位置如附图3所示。以512×512的输入分辨率进行训练,所有模块的输出分辨率均为128×128。使用随机翻转,随机缩放(介于0.6到1.3之间),裁剪和颜色抖动作为数据增强,并使用adam优化整体目标。学习率设置为1.25e-4,训练100个epoch,且分别在60和80个epoch时将学习率下降10倍。batch-size设置为16。
将训练好的模型来验证本发明有效性,实验结果对比如附图4所示。
本发明的优势主要体现在该注意力模块是轻量级的,同时它既关注了通道之间的联系,又很好的整合了空间信息,学习到了更高级的语义,使得提取到的特征更能表示目标真实特性。同时基于中心点的目标检测是新颖并且使用轻量级的backbone,两者结合,在提高检测效果的同时,加快了检测速度,为后续的实际应用打下了基础。
1.一种基于注意力机制的合成孔径雷达舰船目标检测方法,其特征在于,包括以下步骤:
步骤1、获取sar-ship-dataset数据集,对其进行预处理,得到训练集和验证集数据;
步骤2、构建基于spatialshuffle-groupenhance(sse)的网络模型,包括:
1)注意力模块:首先将获得的c通道,h×w的卷积特征图,将其按通道维度分为g个组,进行卷积,然后对卷积层输出的通道进行通道混洗,再分成g个组,然后继续进行卷积,通道混洗操作由以下步骤来完成
(1)将一个卷积层的channel分为g组,则每组有c/g个通道;
(2)reshape为(g,c/g)
(3)转置为(c/g,g)
(4)平坦化,再分为g组作为下一层的输入;
对g个分组,使用空间平均函数
其中,x={x1...m},
其中,ε是为了增加数值稳定性而添加的常数;
对每个系数ci引入一组参数γ,β来缩放和转换归一化值:
其中γ,β是sse注意力模型中引入的参数;
将原始的xi通过sigmoid函数门限σ(·)在空间上按生成的重要性系数ai进行缩放,获得增强的特征向量
所有增强的特征组成了最终结果特征图
2)检测框架模块,采用基于中心点的centernet检测框架:
该框架将目标建模为一个点,即边界框的中心点,目标检测问题转化为关键点估计问题;该检测框架的流程如下:
首先,令i∈rw×h×3是一张输入宽为h,高为w的图片,送入dla网络后得到一个关键点热图服从
其中,
步骤3、将训练集输入构建好的基于sse注意力模块的centernet网络模型进行训练,得到学习后的卷积神经网络模型,并在验证集上进行调参,得到最优的模型及其对应参数,获得训练好的基于sse注意力模块的网络;
步骤4、将需要检测的sar图像输入训练好的基于注意力模块的centernet网络,获得检测结果。
技术总结