基于目标提取的图像检索方法与流程

专利2022-06-29  47


本发明涉及计算机视觉与图像检索技术领域,具体而言,涉及一种基于目标提取的图像检索方法。



背景技术:

图像检索是基于待检索图像的图像特征在预设图像数据库中寻找最相似的图像的过程,常用的图像检索方法是将待搜索图像的图像特征与图像数据库中图像的图像特征进行一一比对,从而确定相似度最高的图像。图像检索技术具有广泛的应用场景,在商品检索、身份识别、图像信息管理等领域具有重要的研究意义。

随着多媒体和互联网技术的快速发展,图像资源日益丰富,图像数据量越来越大,如何在大规模的图像资源中准确检索到用户需要的图像成为了亟需解决的关键问题,因此,建立一种精确的图像检索方法成为了当下的研究热点。



技术实现要素:

为了解决上述技术问题至少之一,本发明的实施例提出一种基于目标提取的图像检索方法,通过提取待检索图像中的目标局部图像,可以有效地减少待检索图像中背景内容造成的干扰,特别是大量文字内容的干扰,从而提高复杂图像检索效率和检索准确率

有鉴于此,本发明提出了一种基于目标提取的图像检索方法,包括以下步骤:确定图像数据库中每一图像的局部特征聚合描述子;提取待检索图像中的目标区域图像;确定待检索图像中目标区域图像的局部特征聚合描述子;根据待检索图像中目标区域图像的局部特征聚合描述子与图像数据库中每一图像的局部特征聚合描述子之间的距离,在图像数据库中确定与待检索图像匹配的图像。

优选地,确定图像数据库中每一图像的局部特征聚合描述子的步骤之前,还包括:提取所述图像数据库中每一图像的局部特征点;通过聚类算法对所述提取到的所有图像的局部特征点进行聚类,确定k个聚类中心,其中,k为自然数,且1≤k≤1000。

优选地,确定图像数据库中每一图像的局部特征聚合描述子的步骤,具体为:根据所述图像数据库中每一图像的局部特征点及所述k个聚类中心,通过如下表达式确定所述图像中的每一个局部特征点所属的聚类,得到所述图像中的局部特征点对应的n个聚类:

i=argminj||xt-μj||

其中,xt表示所述图像局部特征点集合{x1,x2,...xn}中的第t个局部特征点,n表示所述图像中局部特征点数量,t=1,2,...n,μj表示第j个聚类中心,j=1,2,...k,则i表示特征点xt所属的聚类;

根据以下表达式确定所述n个聚类中的每个聚类的残差向量:

其中,μi表示第i个聚类中心,表示所述图像中属于第i个聚类的局部特征点集合中的第k个局部特征点,m表示所述图像中属于第i个聚类的局部特征点数量;

将所述n个聚类中每个聚类的残差向量合成为一个一维向量v;

根据以下表达式对所述一维向量v中的每一个分量进行幂律归一化处理,得到一维向量v′:

vh=sign(vh)·|vh|α

其中,vh表示所述一维向量v中的第h个分量,h=1,2,...n,α为归一化参数,α≤1;

根据如下表达式对所述一维向量v′进行l2范数归一化处理,得到所述图像的局部特征聚合描述子v″:

优选地,提取待检索图像中的目标区域图像的步骤,具体为:对所述待检索图像进行二维haar小波分解,得到所述待检索图像的低频分量图像;对所述待检索图像的低频分量图像进行二值化处理,得到所述待检索图像的二值图像;对所述待检索图像的二值图像进行形态学滤波除去所述二值图像中的空洞;识别所述二值图像中的面积最大区域,在所述待检索图像中确定所述区域对应的图像为目标区域图像。

优选地,确定所述待检索图像中目标区域图像的局部特征聚合描述子的步骤,具体为:提取所述待检索图像中目标区域图像的局部特征点;根据所述待检索图像中目标区域图像的局部特征点及所述图像数据库中所有图像的局部特征点对应的k个聚类中心,确定所述待检索图像中目标区域图像的局部特征聚合描述子。

优选地,根据所述待检索图像中目标区域图像的局部特征聚合描述子与所述图像数据库中每一图像的局部特征聚合描述子之间的距离,在所述图像数据库中确定与所述待检索图像匹配的图像的步骤,具体为:计算所述待检索图像中目标区域图像的局部特征聚合描述子与所述图像数据库中每一图像的局部特征聚合描述子之间的距离,确定最小距离对应的所述图像数据库中的图像为与所述待检索图像匹配的图像。

优选地,提取图像数据库中每一图像的局部特征点的步骤,具体为:根据sift特征提取算子vl_sift,提取所述图像数据库中每一图像的sift特征点。

优选地,提取所述图像数据库中每一图像的局部特征点的步骤中,所述局部特征点为sift特征点、surf特征点、orb特征点、hog特征点、fast特征点、brisk特征点及lbp特征点中的至少一个。

优选地,提取所述待检索图像中目标区域图像的局部特征点的步骤中,所述局部特征点为sift特征点、surf特征点、orb特征点、hog特征点、fast特征点、brisk特征点及lbp特征点中的至少一个。

本发明提出的基于目标提取的图像检索方法,对检索图像的目标区域图像进行识别与提取,通过计算检索目标区域图像的局部特征聚合描述子进行检索,有效减少了检索图像背景内容的干扰,提高了图像局部特征聚合描述子计算的准确性,从而有效改善了因检索图像中存在较多的背景内容,特别是文字背景时,导致图像特征量化时出现较大误差,影响图像检索准确率的情况。

本发明的附加方面和优点将在下面的描述部分中变得明显,或通过本发明的实践了解到。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图:

图1是本发明实施例的基于目标提取的图像检索方法的流程示意图。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。

实施例一

本发明实施例的一种基于目标提取的图像检索方法,如图1所示,包括以下步骤:s101.确定图像数据库中每一图像的局部特征聚合描述子;s102.提取待检索图像中的目标区域图像;s103.确定所述待检索图像中目标区域图像的局部特征聚合描述子;s104.根据所述待检索图像中目标区域图像的局部特征聚合描述子与所述图像数据库中每一图像的局部特征聚合描述子之间的距离,在所述图像数据库中确定与所述待检索图像匹配的图像。

在该技术方案中,确定图像数据库中每一图像的局部特征聚合描述子(vectoroflocallyaggregateddescriptor,vlad),通过图像的局部特征聚合描述子表征该图像的图像特征,对待检索图像中的目标区域图像进行识别提取,确定待检索图像中的目标区域图像的局部特征聚合描述子,通过计算待检索图像中目标区域图像的局部特征聚合描述子与图像数据库中每一图像的局部特征聚合描述子之间的距离,确定图像数据库中与待检索图像匹配的图像,从而得到图像检索结果。

在上述技术方案中,步骤s101之前,还包括:提取所述图像数据库中每一图像的局部特征点;通过聚类算法对所述提取到的所有图像的局部特征点进行聚类,确定k个聚类中心,其中,k为自然数,且1≤k≤1000。

在该技术方案中,对图像数据库中每一图像进行局部特征点提取,其中,局部特征点可以是sift特征点、surf特征点、orb特征点、hog特征点、fast特征点、brisk特征点或lbp特征点,例如,根据sift特征提取算子vl_sift,提取图像数据库中所有图像的sift特征点。通过聚类算法对图像数据库中所有图像的局部特征点进行聚类,确定k个聚类中心,其中,k为自然数,且1≤k≤1000。

在上述技术方案中,步骤s101,具体为:根据所述图像数据库中图像q的局部特征点及所述k个聚类中心,通过如下表达式确定所述图像q中的每一个局部特征点所属的聚类,得到所述图像q中的局部特征点对应的n个聚类:

i=argminj||xt-μj||

其中,xt表示图像q的局部特征点集合{x1,x2,...xn}中的第t个特征点,n表示所述图像q中局部特征点数量,t=1,2,...n,μj表示第j个聚类中心,j=1,2,...k,则i表示局部特征点xt所属的聚类,i∈{1,2,...k};

根据所述图像q中的局部特征点对应的n个聚类,通过以下表达式确定所述n个聚类中的每个聚类的残差向量:

其中,μi表示第i个聚类中心,表示所述图像q中属于第i个聚类的局部特征点集合中的第k个局部特征点,m表示所述图像q中属于第i个聚类的局部特征点数量;

将所述n个聚类中每个聚类的残差向量合成为一个一维向量v;

根据以下表达式对所述一维向量v中的每一个分量进行幂律归一化处理,得到一维向量v′:

vh=sign(vh)·|vh|α

其中,vh表示所述一维向量v中的第h个分量,h=1,2,...n,α为归一化参数,α≤1;

根据如下表达式对所述一维向量v′进行l2范数归一化处理,得到所述图像q的局部特征聚合描述子v″:

对图像数据库中每一图像执行上述步骤,确定图像数据库中每一图像的局部特征聚合描述子。

在上述技术方案中,步骤s102,具体为:对所述待检索图像进行二维haar小波分解,得到所述待检索图像的低频分量图像;对所述待检索图像的低频分量图像进行二值化处理,得到所述待检索图像的二值图像;对所述待检索图像的二值图像进行形态学滤波除去所述二值图像中的空洞;识别所述二值图像中的面积最大区域,在所述待检索图像中确定所述区域对应的图像为目标区域图像。

在该技术方案中,对待检索图像p进行二维haar小波分解,得到待检索图像p对应的低频分量图像p1;对低频分量图像p1进行二值化处理,得到待检索图像p对应的二值图像p2;对二值图像p2进行膨胀、腐蚀等形态学滤波处理,除去二值图像p2中存在的空洞;在经过形态学处理后的二值图像p2中,识别其中面积最大的区域,该面积最大区域即为检索目标图像所在区域,在待检索图像p中提取该区域的图像,确定该区域图像为待检索图像p的目标区域图像。

在上述技术方案中,步骤s103,具体为:提取所述待检索图像中目标区域图像的局部特征点;根据所述待检索图像中目标区域图像的局部特征点及所述图像数据库中所有图像的局部特征点对应的k个聚类中心,确定所述待检索图像中目标区域图像的局部特征聚合描述子。

在该技术方案中,具体地,对待检索图像中目标区域图像进行局部特征点提取,其中,局部特征点可以是sift特征点、surf特征点、orb特征点、hog特征点、fast特征点、brisk特征点或lbp特征点,例如,根据sift特征提取算子vl_sift,提取待检索图像中目标区域图像的sift特征点。根据图像数据库中所有图像的局部特征点对应的k个聚类中心,通过如下表达式确定待检索图像中目标区域图像的每一个特征点所属的聚类,得到待检索图像中目标区域图像的特征点对应的n′个聚类:

e=argminf||xs-μf||

其中,xs表示待检索图像中目标区域图像的特征点集合{x1,x2,...xw}中的第s个特征点,w表示待检索图像中目标区域图像的特征点数量,s=1,2,...w,μf表示第f个聚类中心,f=1,2,...k,则e表示特征点xs所属的聚类,e∈{1,2,...k};

根据待检索图像中目标区域图像的局部特征点对应的n′个聚类,通过以下表达式确定所述n′个聚类中的每个聚类的残差向量:

其中,μe表示第e个聚类中心,表示待检索图像的目标区域图像中属于第e个聚类的局部特征点集合中的第g个局部特征点,m′表示待检索图像的目标区域图像中属于第e个聚类的局部特征点数量;

将所述n′个聚类中每个聚类的残差向量合成为一个一维向量v1;

根据以下表达式对所述一维向量v1中的每一个分量进行幂律归一化处理,得到一维向量v1′:

vu=sign(vu)·|vu|α′

其中,vu表示所述一维向量v1中的第u个分量,u=1,2,...n′,α′为归一化参数,α′≤1;

根据如下表达式对所述一维向量v1′进行l2范数归一化处理,得到待检索图像中目标区域图像的局部特征聚合描述子v1″:

在上述技术方案中,步骤s104,具体为:计算所述待检索图像中目标区域图像的局部特征聚合描述子与所述图像数据库中每一图像的局部特征聚合描述子之间的距离,确定最小距离对应的所述图像数据库中的图像为与所述待检索图像匹配的图像。

在该技术方案中,计算所述待检索图像中目标区域图像的局部特征聚合描述子与所述图像数据库中每一图像的局部特征聚合描述子之间的距离,确定图像数据库中与待检索图像中目标区域图像的距离最小的图像为与待检索图像匹配的图像,作为图像检索的结果。

根据本发明实施例的基于目标提取的图像检索方法,基于对图像数据库中的图像特征点进行聚类,采用图像局部特征聚合描述子表征图像数据库中每一图像的图像特征,同时对待检索图像中的目标区域图像进行提取,确定目标区域图像的局部特征聚合描述子,通过计算待检索图像的目标区域图像与图像数据库中图像之间局部特征聚合描述子的距离,确定图像检索结果。通过本发明实施例的基于目标提取的图像检索方法,提取待检索图像中的目标图像区域,有效地避免待检索图像中的背景图像,特别是文字内容对目标图像区域检索造成的干扰,提高图像检索的准确性与成功率,同时,通过局部特征聚合描述子表述图像特征,将图像检索转化为图像局部特征聚合描述子之间的距离计算,进一步提升了图像检索效率。

在本发明中,术语“多个”则指两个或两个以上,除非另有明确的限定。术语“安装”、“相连”、“连接”、“固定”等术语均应做广义理解,例如,“连接”可以是固定连接,也可以是可拆卸连接,或一体地连接;“相连”可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。

在本说明书的描述中,术语“一个实施例”、“一些实施例”、“具体实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或实例。而且,描述的具体特征、结构、材料或特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。


技术特征:

1.一种基于目标提取的图像检索方法,其特征在于,包括以下步骤:

s101.确定图像数据库中每一图像的局部特征聚合描述子;

s102.提取待检索图像中的目标区域图像;

s103.确定所述待检索图像中目标区域图像的局部特征聚合描述子;

s104.根据所述待检索图像中目标区域图像的局部特征聚合描述子与所述图像数据库中每一图像的局部特征聚合描述子之间的距离,在所述图像数据库中确定与所述待检索图像匹配的图像。

2.根据权利要求1所述的基于目标提取的图像检索方法,其特征在于,所述步骤s101之前,还包括:

提取所述图像数据库中每一图像的局部特征点;

通过聚类算法对所述提取到的所有图像的局部特征点进行聚类,确定k个聚类中心,其中,k为自然数,且1≤k≤1000。

3.根据权利要求2所述的基于目标提取的图像检索方法,其特征在于,所述步骤s101,具体为:

根据所述图像数据库中每一图像的局部特征点及所述k个聚类中心,通过如下表达式确定所述图像中的每一个局部特征点所属的聚类,得到所述图像中的局部特征点对应的n个聚类:

i=argminj||xt-μj||

其中,xt表示所述图像局部特征点集合{x1,x2,...xn}中的第t个局部特征点,n表示所述图像中局部特征点数量,t=1,2,...n,μj表示第j个聚类中心,j=1,2,...k,则i表示局部特征点xt所属的聚类;

根据以下表达式确定所述n个聚类中的每个聚类的残差向量:

其中,μi表示第i个聚类中心,表示所述图像中属于第i个聚类的局部特征点集合中的第k个局部特征点,m表示所述图像中属于第i个聚类的局部特征点数量;

将所述n个聚类中每个聚类的残差向量合成为一个一维向量v;

根据以下表达式对所述一维向量v中的每一个分量进行幂律归一化处理,得到一维向量v′:

vh=sign(vh)·|vh|α

其中,vh表示所述一维向量v中的第h个分量,h=1,2,...n,α为归一化参数,α≤1;

根据如下表达式对所述一维向量v′进行l2范数归一化处理,得到所述图像的局部特征聚合描述子v″:

4.根据权利要求3所述的基于目标提取的图像检索方法,其特征在于,所述步骤s102,具体为:

对所述待检索图像进行二维haar小波分解,得到所述待检索图像的低频分量图像;

对所述待检索图像的低频分量图像进行二值化处理,得到所述待检索图像的二值图像;

对所述待检索图像的二值图像进行形态学滤波除去所述二值图像中的空洞:

识别所述二值图像中的面积最大区域,在所述待检索图像中确定所述区域对应的图像为目标区域图像。

5.根据权利要求4所述的基于目标提取的图像检索方法,其特征在于,所述步骤s103,具体为:

提取所述待检索图像中目标区域图像的局部特征点;

根据所述待检索图像中目标区域图像的局部特征点及所述图像数据库中所有图像的局部特征点对应的k个聚类中心,确定所述待检索图像中目标区域图像的局部特征聚合描述子。

6.根据权利要求5所述的基于目标提取的图像检索方法,其特征在于,所述步骤s104,具体为:

计算所述待检索图像中目标区域图像的局部特征聚合描述子与所述图像数据库中每一图像的局部特征聚合描述子之间的距离,确定最小距离对应的所述图像数据库中的图像为与所述待检索图像匹配的图像。

7.根据权利要求6所述的基于目标提取的图像检索方法,其特征在于,所述提取所述图像数据库中每一图像的局部特征点的步骤,具体为:

根据sift特征提取算子vl_sift,提取所述图像数据库中每一图像的sift特征点。

8.根据权利要求6所述的基于目标提取的图像检索方法,其特征在于,所述提取所述图像数据库中每一图像的局部特征点的步骤中,所述局部特征点为sift特征点、surf特征点、orb特征点、hog特征点、fast特征点、brisk特征点及lbp特征点中的至少一个。

9.根据权利要求6所述的基于目标提取的图像检索方法,其特征在于,所述提取所述待检索图像中目标区域图像的局部特征点的步骤中,所述局部特征点为sift特征点、surf特征点、orb特征点、hog特征点、fast特征点、brisk特征点及lbp特征点中的至少一个。

技术总结
本发明提供了一种基于目标提取的图像检索方法,包括以下步骤:确定图像数据库中每一图像的局部特征聚合描述子;确定待检索图像中的目标区域图像;确定所述待检索图像中目标区域图像的局部特征聚合描述子;根据所述待检索图像中目标区域图像的局部特征聚合描述子与所述图像数据库中每一图像的局部特征聚合描述子之间的距离,在所述图像数据库中确定与所述待检索图像匹配的图像。本发明提供的基于目标提取的图像检索方法,通过提取待检索图像中的目标局部图像,可以有效地减少待检索图像中背景内容造成的干扰,特别是大量文字内容的干扰,从而提高复杂图像的检索效率和检索准确率。

技术研发人员:周潞;史凌波
受保护的技术使用者:北京易讯理想科技有限公司
技术研发日:2018.11.29
技术公布日:2020.06.05

转载请注明原文地址: https://bbs.8miu.com/read-53278.html

最新回复(0)