本发明涉及计算机软件领域,尤其是一种基于视觉注意的显著区域检测方法及装置。
背景技术:
如今关于通过视觉注意机制模仿人类视觉的感知原理从场景中快速定位显著区域进行下一步的处理,从而减少需要处理的数据量的研究越来越多,视觉注意计算模型已经被应用于目标检测、识别及跟踪等领域。
现有主要的视觉注意检测方法有以下几种,1)例如itti的认知注意模型根据早期原始视觉系统的行为和网络结构,对于一幅输入的图像,该模型提取初级的颜色、亮度及方位等特征,并在多个尺度下使用中央周边操作产生体现显著性度量的特征图,最后将这些特征图合并得到最终的显著图。2)gao等提出的判别显著性模型把显著性问题看作是两类视觉刺激的最优决策,这两类刺激为:感兴趣的刺激和包含了不显著刺激的背景,显著性的计算通过确定一个二分类问题得以实现,视野内每个位置的显著性等同于一个视觉特征集在该位置上的判别力,对一个具体位置或点而言,其期望分类误差越小,显著度就越大。3)基于频域分析的显著性模型在频域上计算图像的显著性,如谱残差法、相位谱傅里叶变换法、频率调谐法等。4)基于图论的视觉注意模型将视觉注意测试中的眼动数据看做一个时间序列,由于有大量的隐变量影响眼动,使用隐马尔科夫模型、动态贝叶斯网络或条件随机场等方法实现。
但是上述各方法均采用对整个场景或图像采用遍历式的处理方法计算每个区域或像素的显著度值,最终的输出都是一幅完整的显著图,这不光增加了计算量,并且也不符合真实的视觉注意选择性的处理机制。因此需要提出一种无需遍历图像或场景全部区域,充分模拟人类视觉注意机制快速定位场景中显著区域的基于视觉注意的显著区域检测方法。
技术实现要素:
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明的目的是提供一种基于视觉注意的显著区域检测方法。
本发明所采用的技术方案是:
第一方面,本发明提供一种基于视觉注意的显著区域检测方法,包括:
对输入场景进行超像素分割得到多个超像素;
利用群体智能优化算法进行显著性评估,选取并计算所述超像素的显著度,并根据所述显著度进行超像素分类;
根据分类结果选择新的超像素进行显著性评估,迭代多次直至达到终止条件,生成所述输入场景的显著图。
进一步地,计算所述超像素的显著度具体包括:
以所述输入场景的中心为圆心以第一预设距离为半径的选择范围内,选择第一预设数量的超像素作为待评估超像素;
结合衰减系数和所述待评估超像素的特征向量,计算得到所述待评估超像素的空间显著度;
根据焦点偏差和所述空间显著度,计算得到所述待评估超像素的显著度。
进一步地,对所述待评估超像素根据所述显著度进行排序,根据第二预设概率将所述待评估超像素分类成第一类超像素和第二类超像素。
进一步地,根据分类结果选择新的超像素具体包括:一次选择和/或二次选择;
所述一次选择为:
根据第一预设规则从所述第一类超像素或所述第二类超像素中选取新的超像素;
所述二次选择为:
根据第二预设规则判断利用一个超像素或多个超像素;
如果选择一个超像素,则所述超像素作为中心超像素,以所述中心超像素为圆心,以第二预设距离为半径,选取新的超像素;
如果选择多个超像素,则在多个所述超像素的中心连线范围内选取一个超像素作为中心超像素,以所述中心超像素为圆心,以第三预设距离为半径,选取新的超像素。
进一步地,还包括对所述显著图进行填补盲区,具体包括:
获取与未进行显著性评估超像素相邻的已进行显著性评估超像素的显著度;
对所述显著度进行平均的值作为所述未进行显著性评估超像素的显著度。
进一步地,还包括对所述显著图进行归一化。
进一步地,进行超像素分割之前还包括:初始化超像素提取参数和所述头脑风暴优化算法的参数。
第二方面,本发明还提供一种基于视觉注意的显著区域检测装置,包括:
超像素分割模块:用于对输入场景进行超像素分割得到多个超像素;
显著性评估模块:用于利用群体智能优化算法进行显著性评估,选取并计算所述超像素的显著度,并根据所述显著度进行超像素分类;
生成显著图模块:用于根据分类结果选择新的超像素进行显著性评估,迭代多次直至达到终止条件,生成所述输入场景的显著图。
第三方面,本发明提供一种基于视觉注意的显著区域检测设备,包括:
至少一个处理器,以及与所述至少一个处理器通信连接的存储器;
其中,所述处理器通过调用所述存储器中存储的计算机程序,用于执行如第一方面任一项所述的方法。
第四方面,本发明提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如第一方面任一项所述的方法。
本发明的有益效果是:
本发明通过对输入场景进行超像素分割得到多个超像素,利用头脑风暴优化算法进行显著性评估,选取并计算超像素的显著度,并根据显著度进行超像素分类,根据分类结果选择新的超像素进行显著性评估,迭代多次直至达到终止条件,生成输入场景的显著图。利用头脑凤白优化算法的聚类特征,在迭代过程中引导显著区域的搜索向显著区域收敛,不需要遍历图像或场景的全部区域,选取部分超像素进行显著性评估,最终输出的非完整的显著图,充分模拟人类的视觉注意机制,实现自下而上的显著区域检测,快速定位输入场景中的显著区域。可广泛应用于视觉检测领域。
附图说明
图1是本发明中基于视觉注意的显著区域检测方法的一具体实施例的实现流程图;
图2是本发明中基于视觉注意的显著区域检测方法的一具体实施例的计算显著性流程示意图;
图3是本发明中基于视觉注意的显著区域检测方法的一具体实施例的根据分类结果选择新的超像素的一种示意图;
图4是本发明中基于视觉注意的显著区域检测方法的一具体实施例的具体流程图;
图5是本发明中基于视觉注意的显著区域检测装置的一具体实施例的结构框图。
具体实施方式
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
实施例一:
本发明实施例一提供一种基于视觉注意的显著区域检测方法,下面是本实施例中用到的名词解释。
1)视觉注意——从视野中众多视觉信息中快速地选择最重要、最有用以及与当前目的最相关的视觉信息;2)群体智能优化算法主要模拟了昆虫、兽群、鸟群和鱼群的群体行为,这些群体按照一种合作的方式寻找食物,群体中的每个成员通过学习它自身的经验和其他成员的经验来不断地改变搜索的方向,任何一种由昆虫群体或者其他动物社会行为机制而激发设计出的算法或分布式解决问题的策略均属于群体智能优化算法;3)头脑风暴优化算法——头脑风暴优化(brainstromoptimization,bso)算法是一种新兴的群体智能优化方法,以众人集思广益解决问题为原型,抽取其中解决问题的模式,将其抽象为智能优化算法;4)显著图——用于表示场景中每个区域(或像素)显著程度的图像。
本实施例中群体智能优化算法包括:头脑风暴优化算法、粒子群优化方法或蚁群算法等,实现利用群体智能搜索显著区域,下面以头脑风暴优化算法为例进行说明。
图1为本发明实施例提供的一种基于视觉注意的显著区域检测方法的实现流程图,如图1所示,该方法包括以下步骤:
s1:对输入场景进行超像素分割得到多个超像素。
s2:利用头脑风暴优化算法进行显著性评估,选取并计算超像素的显著度,并根据显著度进行超像素分类。
s3:根据分类结果选择新的超像素进行显著性评估,迭代多次直至达到终止条件,生成输入场景的显著图。
进一步地,还包括s0:初始化超像素提取参数和头脑风暴优化算法的参数,本实施例中超像素提取参数包括:超像素数量n,头脑风暴优化算法的参数包括:第一预设数量(即头脑风暴优化算法的种群数量)ns、第二预设概率perce、第一概率值pe、第二概率值pone、第一预设距离r1、第二预设距离r2、第三预设距离r3。
下面详细描述上述步骤。
具体的,步骤s1中,为了降低显著区域提取的计算量,本实施例采用超像素分割的方式将输入场景进行超像素分割得到多个超像素,超像素分割将场景中的一系列位置相邻且颜色、亮度、纹理等特征的相邻像素构成的有一定视觉意义的不规则像素块,称为超像素,大多保留了进一步进行图像分割的有效信息,且一般不会破坏图像中物体的边界,利用像素之间特征的相似性将像素分组,用少量的超像素代替大量的像素来表达图片特征,很大程度上降低图像后处理的复杂度,本实施例后续步骤均以超像素为单位进行。常见的很多算法均能实现超像素分割,例如slic(simplelineariterativeclustering)简单的线性迭代聚类即可实现超像素分割。
步骤s2中,计算超像素的显著度具体包括:
s21:以输入场景的中心为圆心以第一预设距离r1为半径的选择范围内,选择第一预设数量ns的超像素作为待评估超像素,进一步地,通过随机选择的方式选择待评估超像素。
s22:结合衰减系数和待评估超像素的特征向量,计算得到待评估超像素的空间显著度,具体为:
设
其中,ds[spi,spj]表示超像素spi和spj之间的空间距离,σ2表示衰减速度,可以进行预先设置。
s23:根据焦点偏差和空间显著度,计算得到待评估超像素的显著度,由于现有的方案生成显著图时,引入中心偏移量,即认为图像或场景的中心比周边更加显著,这与实际的人类视觉注意不符,因此本实施例中引入焦点偏差来评估超像素的显著度,表示为:
其中,xi表示显著区域的中心位置,xmsr(t)表示第t次迭代时,显著度最高的区域位置,初始迭代时,xmsr(t)为输入场景的中心位置xc,z表示对角线长度。
如图2所示,为本实施例计算显著性流程示意图,从图中可以看出,初始化参数后选取待评估超像素,计算在第一预设距离r1为半径的选择范围内,每个待评估超像素的跟其他待评估超像素之间的衰减系数,计算该待评估超像素的空间显著度,然后根据焦点偏差和空间显著度,计算得到待评估超像素的显著度。
s24:对待评估超像素根据显著度进行排序,根据第二预设概率将待评估超像素分类成第一类超像素和第二类超像素。
在一种具体场景中,对数量为ns的待评估超像素根据显著度进行排序,其中显著度的值位于前ns×perce%的部分作为第一类超像素(或者称为精英超像素),剩余的ns×(1-perce%)作为第二类超像素(或者称为普通超像素)。
步骤s3中,根据分类结果选择新的超像素具体包括:一次选择和/或二次选择。本实施例可以仅采用一次选择或者二次选择,也可以在一次选择后再进行二次选择。
一次选择为:根据第一预设规则从第一类超像素或第二类超像素中选取新的超像素。
二次选择为:根据第二预设规则判断利用一个超像素或多个超像素,如果选择一个超像素,则超像素作为中心超像素,以中心超像素为圆心,以第二预设距离为半径,选取新的超像素;如果选择多个超像素,则在多个超像素的中心连线范围内选取一个超像素作为中心超像素,以中心超像素为圆心,以第三预设距离为半径,选取新的超像素。
可选的,当仅进行一次选择时,根据第一预设规则的判断结果选择一个超像素作为中心像素,以中心像素为圆心,设置选取半径,选择对应数量的超像素进行显著性评估。可选的,当仅进行二次选择时,随机从精英超像素或者普通超像素中选择一个或多个超像素。
如图3所示,为本实施例根据分类结果选择新的超像素的一种示意图,在该实施场景中,该实施方式中进行一次选择后,根据一次选择的结果进行二次选择,其流程为初始化参数后,生成一个随机数rand,第一预设规则描述为:判断随机数rand是否小于第一概率值pe,如果小于则从精英超像素中选取新的超像素进行显著性评估,反之从普通超像素中选取新的超像素进行显著性评估。
第二预设规则描述为:判断随机数rand是否小于第二概率值pone,如果是则选取一个超像素作为中心超像素,以该超像素为圆心,以第二预设距离r2为半径,选取数量为ns(该数量不做限定,可以根据实际需要进行更改)的超像素进行显著性评估,否则选取多个超像素,在多个超像素的中心连线范围内,选取一个超像素作为中心超像素,以第三预设距离为r3半径,选取数量为ns(该数量不做限定,可以根据实际需要进行更改)的超像素进行显著性评估。
进一步地,本实施例中,第一预设距离r1、第二预设距离r2、第三预设距离r3可以取相同的值。
步骤s3还包括填补盲区,利用上述搜索策略,显著度被评估过的超像素将有对应的显著度,对于没有进行显著性评估过的超像素,称为盲区超像素,由于相邻区域将具有类似的显著特征,即利用周边区域的相似性获得盲区超像素的显著度,因此本实施例中对显著图进行填补盲区,具体包括:获取与盲区超像素相邻的已进行显著性评估超像素的显著度,对显著度进行平均的值作为盲区超像素的显著度,表示为:
上式中,s′(spb)表示盲区超像素的显著度,spadj表示与盲区超像素spb相邻的具有显著度的超像素,nadj表示其数量。
值得注意的是,由于部分盲区超像素的相邻部分可能也是盲区超想去,因此即便经过本实施例的填补盲区,最终生成的显著图依然是具有盲区的非完整图。
进一步地,步骤s3还包括对显著图进行归一化,目的是显示方便,将获得的各个超像素的显著度进行归一化,表示为:
上式中,sn(spi)表示归一化后的显著图,n表示具有显著度的超像素数量,s(spi)表示超像素的显著度,smax、smin分别表示未归一化的显著图中显著度的最大值和最小值。
步骤s3中的终止条件包括:1)达到预设迭代次数;或者2)虽然未达到预设迭代次数但是迭代预设次数后显著图不改变。当达到终止条件时,即停止迭代,生成显著图。
如图4所示,为本实施例的基于视觉注意的显著区域检测方法具体流程图,从图中可见,首先初始化头脑风暴优化算法的种群,选取初次迭代的待评估超像素,对其进行显著性评估,然后按照评估结果进行超像素分类,根据分类结果选择新的超像素,继续进行显著性评估,在此过程中更新超像素分类,对应的更新最显著区域,判断是否达到终止条件,如果未达到则继续进行显著性评估,否则对生成的显著图进行填补盲区,对填补后的显著图进行归一化得到最终的显著图。
本实施例采用头脑风暴优化算法进行显著区域反复迭代式搜索,采用随机选择的方式,逐步引导搜索往显著区域收敛,无需遍历所有区域,同时引入焦点偏差,即该中心位置为每一步搜索中的最显著区域,更符合真实视觉注意特征,减少计算量。
实施例二:
本实施例提供一种基于视觉注意的显著区域检测装置,如图5所示,为本实施例的基于视觉注意的显著区域检测装置结构框图,包括:
超像素分割模块10:用于对输入场景进行超像素分割得到多个超像素;
显著性评估模块20:用于利用群体智能优化算法进行显著性评估,选取并计算超像素的显著度,并根据显著度进行超像素分类;
生成显著图模块30:用于根据分类结果选择新的超像素进行显著性评估,迭代多次直至达到终止条件,生成输入场景的显著图。
上述基于视觉注意的显著区域检测装置模块的具体细节已经在实施例一对应的基于视觉注意的显著区域检测方法中进行了详细的描述,因此此处不再赘述。
实施例三:
本发明还提供基于视觉注意的显著区域检测设备,包括:
至少一个处理器,以及与所述至少一个处理器通信连接的存储器;
其中,所述处理器通过调用所述存储器中存储的计算机程序,用于执行如实施例一所述的方法。计算机程序即程序代码,当程序代码在基于视觉注意的显著区域检测设备上运行时,程序代码用于使基于视觉注意的显著区域检测设备执行本说明书上述实施例一部分描述的基于视觉注意的显著区域检测方法中的步骤。
另外,本发明还提供一种计算机可读存储介质,计算机可读存储介质存储有计算机可执行指令,其中计算机可执行指令用于使计算机执行如实施例一所述的方法。
本发明通过对输入场景进行超像素分割得到多个超像素,利用头脑风暴优化算法进行显著性评估,选取并计算超像素的显著度,并根据显著度进行超像素分类,根据分类结果选择新的超像素进行显著性评估,迭代多次直至达到终止条件,生成输入场景的显著图。利用头脑凤白优化算法的聚类特征,在迭代过程中引导显著区域的搜索向显著区域收敛,不需要遍历图像或场景的全部区域,选取部分超像素进行显著性评估,最终输出的非完整的显著图,充分模拟人类的视觉注意机制,实现自下而上的显著区域检测,快速定位输入场景中的显著区域。可广泛应用于视觉检测领域。
以上各实施例仅用以说明本发明的技术方案,而非对其限制,尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。
1.一种基于视觉注意的显著区域检测方法,其特征在于,包括:
对输入场景进行超像素分割得到多个超像素;
利用群体智能优化算法进行显著性评估,选取并计算所述超像素的显著度,并根据所述显著度进行超像素分类;
根据分类结果选择新的超像素进行显著性评估,迭代多次直至达到终止条件,生成所述输入场景的显著图。
2.根据权利要求1所述的一种基于视觉注意的显著区域检测方法,其特征在于,计算所述超像素的显著度具体包括:
以所述输入场景的中心为圆心以第一预设距离为半径的选择范围内,选择第一预设数量的超像素作为待评估超像素;
结合衰减系数和所述待评估超像素的特征向量,计算得到所述待评估超像素的空间显著度;
根据焦点偏差和所述空间显著度,计算得到所述待评估超像素的显著度。
3.根据权利要求2所述的一种基于视觉注意的显著区域检测方法,其特征在于,对所述待评估超像素根据所述显著度进行排序,根据第二预设概率将所述待评估超像素分类成第一类超像素和第二类超像素。
4.根据权利要求3所述的一种基于视觉注意的显著区域检测方法,其特征在于,根据分类结果选择新的超像素具体包括:一次选择和/或二次选择;
所述一次选择为:
根据第一预设规则从所述第一类超像素或所述第二类超像素中选取新的超像素;
所述二次选择为:
根据第二预设规则判断利用一个超像素或多个超像素;
如果选择一个超像素,则所述超像素作为中心超像素,以所述中心超像素为圆心,以第二预设距离为半径,选取新的超像素;
如果选择多个超像素,则在多个所述超像素的中心连线范围内选取一个超像素作为中心超像素,以所述中心超像素为圆心,以第三预设距离为半径,选取新的超像素。
5.根据权利要求1所述的一种基于视觉注意的显著区域检测方法,其特征在于,还包括对所述显著图进行填补盲区,具体包括:
获取与未进行显著性评估超像素相邻的已进行显著性评估超像素的显著度;
对所述显著度进行平均的值作为所述未进行显著性评估超像素的显著度。
6.根据权利要求1所述的一种基于视觉注意的显著区域检测方法,其特征在于,还包括对所述显著图进行归一化。
7.根据权利要求1至6任一项所述的一种基于视觉注意的显著区域检测方法,其特征在于,所述群体智能优化算法包括以下任意一种:头脑风暴优化算法、粒子群优化方法、蚁群算法;
进行超像素分割之前还包括:初始化超像素提取参数和所述群体智能优化算法的参数。
8.一种基于视觉注意的显著区域检测装置,其特征在于,包括:
超像素分割模块:用于对输入场景进行超像素分割得到多个超像素;
显著性评估模块:用于利用群体智能优化算法进行显著性评估,选取并计算所述超像素的显著度,并根据所述显著度进行超像素分类;
生成显著图模块:用于根据分类结果选择新的超像素进行显著性评估,迭代多次直至达到终止条件,生成所述输入场景的显著图。
9.一种基于视觉注意的显著区域检测设备,其特征在于,包括:
至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;
其中,所述处理器通过调用所述存储器中存储的计算机程序,用于执行如权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1至7任一项所述的方法。
技术总结