本发明涉及信息处理技术领域,尤其涉及一种数据处理方法、装置及计算机存储介质和电子设备。
背景技术:
随着自动化科技的发展,生产中对产品设备进行检测的工作也逐渐被自动化手段替代,对产品表面进行检测是保证产品质量和获取信息的一个重要手段。对于很多产品如笔记本,需要对产品标签进行检测,笔记本标签包括处理器标签等种类较多,大小不一,且粘贴位置不固定,如何精准定位标签在表面的位置是对笔记本进行检测的一个重要步骤。
标签定位问题可以理解为图像分割问题,通过将图像中的不同物体,如前景(标签)和背景(笔记本掌托区域)分割为不同的区域,从而确定标签在笔记本掌托区域的位置。图像分割问题可以采用图像聚类技术来解决,根据图像中各个相邻像素之间的相似性来进行图像聚类,进而将图像的不同区域进行标记。k-means(k均值聚类)算法是一种经典的非监督学习图像聚类算法,原理简单,计算复杂度低,受到了广泛的使用。
但是k-means算法运行时需要指定初始聚类中心和聚类数目,初始聚类中心或者聚类数目的不同会影响最终的分割结果。将k-means算法应用到笔记本掌托区域标签定位,标签的多样性、掌托区域背景的复杂性使得聚类过程中初始聚类中心和聚类数目难以准确确定,容易造成聚类效果局部最优,导致聚类结果不稳定,准确性下降。若直接采用k-means算法对掌托区域图像聚类的结果来确定标签的位置,会造成标签定位效果不理想。
技术实现要素:
本发明实施例为了有效克服现有技术所存在的上述缺陷,创造性地提供一种数据处理方法,包括:对原始区域图像进行初分割,得到原始区域集合;计算对应于所述原始区域集合中相邻区域的相似度集合;根据所述相似度集合对所述原始区域集合中的相邻区域进行合并,得到候选区域集合;对所述候选区域集合进行筛选,得到标签区域。
在一可实施方式中,所述对原始区域图像进行初分割,得到多个原始区域集合包括:采用k均值聚类算法对所述原始区域图像进行初次聚类,得到初聚类结果;将所述初聚类结果中属于同一聚类中心的相邻像素点进行合并,得到原始区域集合。
在一可实施方式中,所述计算对应于所述原始区域集合中相邻区域的相似度集合包括:根据所述原始区域集合中相邻区域的颜色直方图、颜色矩、尺寸和交叠比例中的一种或多种信息计算相似度集合。
在一可实施方式中,所述根据所述相似度集合对所述原始区域集合中的相邻区域进行合并,得到候选区域集合包括:根据所述相似度集合合并所述原始区域集合中相似度最大的两个相邻区域,得到候选区域和包括有所述候选区域的候选区域集合;判断所述候选区域集合中是否存在满足合并条件的相邻区域,若存在,则合并所述满足合并条件的相邻区域并更新所述候选区域集合。
在一可实施方式中,根据标签特征信息对所述候选区域集合进行筛选。
本发明实施例另一方面提供一种数据处理装置,包括:粗分割模块,用于对原始区域图像进行初分割,得到原始区域集合;相似度计算模块,用于计算对应于所述原始区域集合中相邻区域的相似度集合;区域合并模块,用于根据所述相似度集合对所述原始区域集合中的相邻区域进行合并,得到候选区域集合;筛选模块,用于对所述候选区域集合进行筛选,得到标签区域。
在一可实施方式中,所述粗分割模块包括:初聚类单元,用于采用k均值聚类算法对所述原始区域图像进行初次聚类,得到初聚类结果;聚类合并单元,用于将所述初聚类结果中属于同一聚类中心的相邻像素点进行合并,得到原始区域集合。
在一可实施方式中,所述相似度计算模块包括:相似度计算子单元,用于根据所述原始区域集合中相邻区域的颜色直方图、颜色矩、尺寸和交叠比例中的一种或多种信息计算相似度集合。
在一可实施方式中,所述区域合并模块包括:区域合并单元,用于根据所述相似度集合合并所述原始区域集合中相似度最大的两个相邻区域,得到候选区域和包括有所述候选区域的候选区域集合;区域判断单元,用于判断所述候选区域集合中是否存在满足合并条件的相邻区域,若存在,则合并所述满足合并条件的相邻区域并更新所述候选区域集合。
本发明实施例另一方面提供一种计算机可读存储介质,所述计算机存储介质中存储有计算机可执行指令,当所述指令被执行时用于执行上述中任一项所述的数据处理方法。
本发明实施例另一方面提供一种电子设备,包括存储器和处理器,所述存储器中储存有计算机程序指令,所述指令由所述处理器加载并执行以实现上述中任一项所述的数据处理方法。
本发明实施例提供的数据处理方法、装置及计算机存储介质和电子设备,先通过对原始区域图像进行初分割,得到一些相对细碎、零散的原始分割区域,形成原始区域集合,然后利用原始分割区域中每个区域中所包含的信息来合并粗分割的原始区域,获得更为正确的图像分割结果,提高了标签定位结果的准确率。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
在附图中,相同或对应的标号表示相同或对应的部分。
图1为本发明一实施例所提供的一种数据处理方法的一种实现流程示意图;
图2为本发明一实施例所提供的一种数据处理装置的一种组成结构图。
具体实施方式
为使本发明的目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而非全部实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
以下示例性实施例中所描述的实施方式并不代表与本说明书相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书中的一些方面相一致的方法、装置或设备的例子。
请参考图1,本发明实施例一方面提供一种数据处理方法,包括:
步骤101,对原始区域图像进行初分割,得到原始区域集合;
步骤102,计算对应于原始区域集合中相邻区域的相似度集合;
步骤103,根据相似度集合对原始区域集合中的相邻区域进行合并,得到候选区域集合;
步骤104,对候选区域集合进行筛选,得到标签区域。
本发明实施例先通过步骤101对包括有标签区域的原始区域图像进行粗分割,得到原始区域集合,实现背景和前景,也即背景和标签的初步分割,即粗略分割,其中分割所采用的方法可以为k-means算法或其他能够实现同等效果的方法,本发明实施例在此不对原始区域图像的分割方法进行具体限定。然后通过步骤102计算原始区域集合中各个相邻区域的相似度,得到相似度集合,其中,各个相邻区域的形似度具体可以通过计算区域之间的颜色空间阈值、区域尺度等信息进行计算,也可以利用其他区域特征进行计算,本发明实施例在此不对相似度计算的具体方法进行限制。然后通过步骤103根据计算得到的相似度集合来对原始区域集合中的相邻区域进行合并,以准确的分别合并零散标签区域和零散背景区域,将零散的标签区域合并成较为完整的标签区域,以提高标签区域的提取准确性;最后再在合并得到的候选区域集合基础上通过步骤104进行标签区域筛选,便能得到分割准确的标签区域。
本发明实施例先通过对原始区域图像进行初分割,得到一些相对细碎、零散的原始分割区域,形成原始区域集合,然后利用原始分割区域中每个区域中所包含的信息来合并粗分割的原始区域,获得更为正确的图像分割结果,提高了标签定位结果的准确率。
在一可实施方式中,对原始区域图像进行初分割,得到多个原始区域集合包括:
采用k均值聚类算法对原始区域图像进行初次聚类,得到初聚类结果;
将初聚类结果中属于同一聚类中心的相邻像素点进行合并,得到原始区域集合。
本发明实施例中,通过k-means算法对原始区域图像进行初次聚类,初始k值和聚类中心根据颜色规律选择,以提高聚类结果的确定性和准确性。其中,图像宽为w,图像高为h,聚类数目k,k个聚类中心点zj(i)(r,g,b),j=1,2,3,...,k,i表示第i次迭代。
(1)首先可以设定聚类数目k为27,选择如下r(red,红)、g(green,绿)、b(blue,蓝)像素值的像素点作为初始聚类中心点z1(1)(r,g,b),z2(1)(r,g,b),z3(1)(r,g,b),...,zk(1)(r,g,b):
(0,0,0),(0,0,128),(0,0,255),
(0,128,0),(0,128,128),(0,128,255),
(0,255,0),(0,255,128),(0,255,255),
(128,0,0),(128,0,128),(128,0,255),
(128,128,0),(128,128,128),(128,128,255),
(128,255,0),(128,255,128),(128,255,255),
(255,0,0),(255,0,128),(255,0,255),
(255,128,0),(255,128,128),(255,128,255),
(255,255,0),(255,255,128),(255,255,255)。
这27个初始聚类中心点均匀分布在原始区域图像像素rgb值上。
(2)然后计算每个原始区域图像,如电脑掌托区域图像像素点xi(r,g,b)与初始聚类中心zj(i)(r,g,b)的距离
若满足
d(xi(r,g,b),zj(i)(r,g,b))=min{d(xi(r,g,b),zj(i)(r,g,b)),i=1,2,3,...,m×n},那么像素点xi属于聚类中心zj(i)(r,g,b)。
(3)然后根据属于聚类中心zj(i)(r,g,b)所有pj个像素点,计算聚类准则函数j(i)
其中,xp(r,g,b)为属于聚类中心zj(i)(r,g,b)的像素点,j=1,2,3,...,k。
(4)所有像素点都重新归类后,令i=i 1,根据属于聚类中心zj(i)(r,g,b)所有pj个像素点计算新的聚类中心zj(i 1)(r,g,b)
其中,j=1,2,3,...,k。
(5)然后判断:如果j(i 1)和j(i)的差值小于给定的阈值或者迭代次数i等于给定的阈值,算法结束,得到初聚类结果;否则,返回第(2)步继续执行,直至j(i 1)和j(i)的差值小于给定的阈值或者迭代次数i等于给定的阈值,算法结束,得到初聚类结果。得到初聚类结果后,将结果中属于同一个聚类中心且相邻的像素点合并成一个区域,得到粗分割区域ci,i=1,2,3,...,q,q表示粗分割区域的个数,将粗分割区域ci加入到原始区域集合。
在一可实施方式中,计算对应于原始区域集合中相邻区域的相似度集合包括:
根据原始区域集合中相邻区域的颜色直方图、颜色矩、尺寸和交叠比例中的一种或多种信息计算相似度集合。
本发明实施例通过计算每两个相邻粗分割区域的颜色直方图、颜色矩、尺寸的相似度和交叠程度中的一种或多种信息计算相似度,并得到相似度集合,以充分利用原始区域集合中的区域特征信息,从而克服了由于初始k值和聚类中心的随机性而造成聚类结果的不确定性,难以满足实现全部种类标签的图像分割,不能保证每次分割结果的可靠性的问题。
具体的,计算颜色直方图相似度时,将粗分割区域ci转换到hsv颜色空间,分别将h、s、v颜色通道划分为20个小区间,统计颜色落在20个小区间内的像素数量分别得到h、s、v的颜色直方图,并使用l1范数归一化,组合得到一个60维的向量vi,hist’作为区域ci的颜色直方图特征向量。计算相邻区域ci和cj的颜色直方图相似度scolor_hist(ci,cj)
其中,
当计算颜色矩相似度时,对粗分割区域ci计算rgb颜色空间的颜色矩。
一阶颜色矩μt,μt表示第t个颜色通道上所有像素的均值,反映图像明暗程度:
二阶颜色矩σt,σt表示第t个颜色通道上所有像素的方差,反映图像颜色分布范围:
三阶颜色矩st,st表示第t个颜色通道上所有像素的斜度,反映图像颜色分布对称性:
其中,n表示原始区域集合中粗分割区域ci总的像素数,pt,k表示第t个颜色通道在第k个像素值。
将原始区域集合中粗分割区域ci图像r通道的颜色矩μr,σg,sg,r通道的颜色矩,r通道的颜色矩组合成向量vi,moment=[μr,σg,sg,μg,σg,sg,μb,σb,sb],作为区域ci的颜色矩特征向量。计算相邻区域ci和cj的颜色矩相似度scolor_moment(ci,cj)
其中,
当计算尺寸相似度时,根据相邻区域ci和cj的面积大小来计算相邻区域ci和cj的尺寸相似度ssize(ci,cj)
其中,size(ci)表示区域ci的面积,size(im)表示掌托区域的面积。
当计算交叠程度时,先构造相邻区域ci和cj的外接矩形bbij,计算相邻区域ci和cj的交叠程度:
采用线性组合的方式将区域之间四种相似性度量的结果融合,计算相邻区域ci和cj的相似度s(ci,cj):
s(ci,cj)=α1scolor_hist(ci,cj) α2scolor_moment(ci,cj) α3ssize(ci,cj)
α4fill(ci,cj)
当s(ci,cj)越趋于0时,区域ci和cj相似度最大。
本发明实施例充分结合图像特征,不单单采用图像像素值,融合了图像颜色分布、尺寸大小、交叠信息等特征,解决了k-means方法的不稳定性问题,有效提高了标签定位的准确率。
在一可实施方式中,根据相似度集合对原始区域集合中的相邻区域进行合并,得到候选区域集合包括:
根据相似度集合合并原始区域集合中相似度最大的两个相邻区域,得到候选区域和包括有候选区域的候选区域集合;
判断候选区域集合中是否存在满足合并条件的相邻区域,若存在,则合并满足合并条件的相邻区域并更新候选区域集合。
本发明实施例得到相似度集合后,从相似度集合中找出相似度最大值所对应的两个相邻区域,将其进行合并,得到合并后的候选区域以及包括有候选区域和未进行合并区域的候选区域集合;然后将此次相似度值从相似度集合中删除,重新计算包括有候选区域的候选区域集合中的相似度值,判断其中是否存在相似度最大值,若存在,则将其对应的相邻区域进行合并后更新候选区域集合;然后重复上述步骤,直至相似度集合中不存在相似度最大值,此时已不存在可合并区域,也即区域合并完成。本发明实施例通过根据相邻区域之间的相似度值来进行区域合并,克服了聚类结果不稳定,准确性下降的问题,将原始粗分割结果中大小不一分布零散的区域进行了整合,提高了标签分割结果的稳定性和准确性。
在一可实施方式中,根据标签特征信息对候选区域集合进行筛选。
本发明实施例中,在已经完成背景和标签分割的基础上,根据标签特征信息,如标签尺寸,标签背景颜色空间值等一种或多种标签特征信息即能够较快的从候选区域集合中筛选出标签;具体的,当采用标签尺寸作为标签特征信息时,根据需要定位标签的尺寸,设定可接受的区域尺寸阈值,然后在候选区域集合中删除尺寸不满足可接受的区域尺寸阈值,余下的区域记为标签的真实位置,完成对笔记本掌托区域中的标签定位。本发明实施例的筛选方法简单,准确率较高。
请参考图2,本发明实施例另一方面提供一种数据处理装置,包括:
粗分割模块201,用于对原始区域图像进行初分割,得到原始区域集合;
相似度计算模块202,用于计算对应于原始区域集合中相邻区域的相似度集合;
区域合并模块203,用于根据相似度集合对原始区域集合中的相邻区域进行合并,得到候选区域集合;
筛选模块204,用于对候选区域集合进行筛选,得到标签区域。
本发明实施例先通过粗分割模块201对包括有标签区域的原始区域图像进行粗分割,得到原始区域集合,实现背景和前景,也即背景和标签的粗略分割,其中分割所采用的方法可以为k-means算法或其他能够实现同等效果的方法,本发明实施例在此不对原始区域图像的分割方法进行具体限定。然后通过相似度计算模块202计算原始区域集合中各个相邻区域的相似度,得到相似度集合,其中,各个相邻区域的形似度具体可以通过计算区域之间的颜色空间阈值、区域尺度等信息进行计算,也可以利用其他区域特征进行计算,本发明实施例在此不对相似度计算的具体方法进行限制。然后通过区域合并模块203根据计算得到的相似度集合来对原始区域集合中的相邻区域进行合并,以准确的分别合并零散标签区域和零散背景区域,将零散的标签区域合并成较为完整的标签区域,以提高标签区域的提取准确性;最后再在合并得到的候选区域集合基础上通过筛选模块204进行标签区域筛选,便能得到分割准确的标签区域。
本发明实施例先通过对原始区域图像进行初分割,得到一些相对细碎、零散的原始分割区域,形成原始区域集合,然后利用原始分割区域中每个区域中所包含的信息来合并粗分割的原始区域,获得更为正确的图像分割结果,提高了标签定位结果的准确率。
在一可实施方式中,粗分割模块201包括:
初聚类单元,用于采用k均值聚类算法对原始区域图像进行初次聚类,得到初聚类结果;
聚类合并单元,用于将初聚类结果中属于同一聚类中心的相邻像素点进行合并,得到原始区域集合。
本发明实施例中,通过k-means算法对原始区域图像进行初次聚类,初始k值和聚类中心的根据颜色规律选择,以提高聚类结果的确定性和准确性。其中,具体的,图像宽为w高为h,聚类数目k,k个聚类中心点zj(i)(r,g,b),j=1,2,3,...,k,i表示第i次迭代。
(1)初聚类单元首先可以设定聚类数目k为27,选择如下r(red,红)、g(green,绿)、b(blue,蓝)像素值的像素点作为初始聚类中心点z1(1)(r,g,b),z2(1)(r,g,b),z3(1)(r,g,b),...,zk(1)(r,g,b):
(0,0,0),(0,0,128),(0,0,255),
(0,128,0),(0,128,128),(0,128,255),
(0,255,0),(0,255,128),(0,255,255),
(128,0,0),(128,0,128),(128,0,255),
(128,128,0),(128,128,128),(128,128,255),
(128,255,0),(128,255,128),(128,255,255),
(255,0,0),(255,0,128),(255,0,255),
(255,128,0),(255,128,128),(255,128,255),
(255,255,0),(255,255,128),(255,255,255)。
这27个初始聚类中心点均匀分布在原始区域图像像素rgb值上。
(2)然后计算每个原始区域图像,如电脑掌托区域图像像素点xi(r,g,b)与初始聚类中心zj(i)(r,g,b)的距离
若满足
d(xi(r,g,b),zj(i)(r,g,b))=min{d(xi(r,g,b),zj(i)(r,g,b)),i=1,2,3,...,m×n},那么像素点xi属于聚类中心zj(i)(r,g,b)。
(3)然后根据属于聚类中心zj(i)(r,g,b)所有pj个像素点,计算聚类准则函数j(i)
其中,xp(r,g,b)为属于属于聚类中心zj(i)(r,g,b)的像素点,j=1,2,3,...,k。
(4)所有像素点都重新归类后,令i=i 1,根据属于聚类中心zj(i)(r,g,b)所有pj个像素点计算新的聚类中心zj(i 1)(r,g,b)
其中,j=1,2,3,...,k。
(5)然后判断:如果j(i 1)和j(i)的差值小于给定的阈值或者迭代次数i等于给定的阈值,算法结束,得到初聚类结果;否则,返回第(2)步继续执行,直至j(i 1)和j(i)的差值小于给定的阈值或者迭代次数i等于给定的阈值,算法结束,得到初聚类结果。得到初聚类结果后,聚类合并单元将结果中属于同一个聚类中心且相邻的像素点合并成一个区域,得到粗分割区域ci,i=1,2,3,...,q,q表示粗分割区域的个数,将粗分割区域ci加入到原始区域集合。
在一可实施方式中,相似度计算模块202包括:
相似度计算子单元,用于根据原始区域集合中相邻区域的颜色直方图、颜色矩、尺寸和交叠比例中的一种或多种信息计算相似度集合。
本发明实施例通过相似度计算子单元计算每两个相邻粗分割区域的颜色直方图、颜色矩、尺寸的相似度和交叠程度中的一种或多种信息计算相似度,并得到相似度集合,以充分利用原始区域集合中的区域特征信息,从而克服了由于初始k值和聚类中心的随机性而造成聚类结果的不确定性,难以满足实现全部种类标签的图像分割,不能保证每次分割结果的可靠性的问题。
具体的,计算颜色直方图相似度时,将粗分割区域ci转换到hsv颜色空间,分别将h、s、v颜色通道划分为20个小区间,统计颜色落在20个小区间内的像素数量分别得到h、s、v的颜色直方图,并使用l1范数归一化,组合得到一个60维的向量vi,hist,作为区域ci的颜色直方图特征向量。计算相邻区域ci和cj的颜色直方图相似度scolor_hist(ci,cj)
其中,
当计算颜色矩相似度时,对粗分割区域ci计算rgb颜色空间的颜色矩。
一阶颜色矩μt,μt表示第t个颜色通道上所有像素的均值,反映图像明暗程度:
二阶颜色矩σt,σt表示第t个颜色通道上所有像素的方差,反映图像颜色分布范围:
三阶颜色矩st,st表示第t个颜色通道上所有像素的斜度,反映图像颜色分布对称性:
其中,n表示原始区域集合中粗分割区域ci总的像素数,pt,k表示第t个颜色通道在第k个像素值。
将原始区域集合中粗分割区域ci图像r通道的颜色矩μr,σg,sg,r通道的颜色矩,r通道的颜色矩组合成向量vi,moment=[μr,σg,sg,μg,σg,sg,μr,σb,sb],作为区域ci的颜色矩特征向量。计算相邻区域ci和cj的颜色矩相似度scolor_moment(ci,cj)
其中,
当计算尺寸相似度时,根据相邻区域ci和cj的面积大小来计算相邻区域ci和cj的尺寸相似度ssize(ci,cj)
其中,size(ci)表示区域ci的面积,size(im)表示掌托区域的面积。
当计算交叠程度时,先构造相邻区域ci和cj的外接矩形bbij,计算相邻区域ci和cj的交叠程度:
采用线性组合的方式将区域之间四种相似性度量的结果融合,计算相邻区域ci和cj的相似度s(ci,cj):
s(ci,cj)=α1scolor_hist(ci,cj) α2scolor_moment(ci,cj) α3ssize(ci,cj)
α4fill(ci,cj)
当s(ci,cj)越趋于0时,区域ci和cj相似度最大。
本发明实施例充分结合图像特征,不单单采用图像像素值,融合了图像颜色分布、尺寸大小、交叠信息等特征,解决了k-means方法的不稳定性问题,有效提高了标签定位的准确率。
在一可实施方式中,区域合并模块203包括:
区域合并单元,用于根据相似度集合合并原始区域集合中相似度最大的两个相邻区域,得到候选区域和包括有候选区域的候选区域集合;
区域判断单元,用于判断候选区域集合中是否存在满足合并条件的相邻区域,若存在,则合并满足合并条件的相邻区域并更新候选区域集合。
本发明实施例得到相似度集合后,区域合并单元从相似度集合中找出相似度最大值所对应的两个相邻区域,将其进行合并,得到合并后的候选区域以及包括有候选区域和未进行合并区域的候选区域集合;然后将此次相似度值从相似度集合中删除,重新计算包括有候选区域的候选区域集合中的相似度值,区域判断单元判断其中是否存在相似度最大值,若存在,则将其对应的相邻区域进行合并后更新候选区域集合;然后重复上述步骤,直至相似度集合中不存在相似度最大值,此时已不存在可合并区域,也即区域合并完成。本发明实施例通过根据相邻区域之间的相似度值来进行区域合并,克服了聚类结果不稳定,准确性下降的问题,将原始粗分割结果中大小不一分布零散的区域进行了整合,提高了标签分割结果的稳定性和准确性。
在一可实施方式中,根据标签特征信息对候选区域集合进行筛选。
本发明实施例中,在已经完成背景和标签分割的基础上,根据标签特征信息,如标签尺寸,标签背景颜色空间值等一种或多种标签特征信息即能够较快的从候选区域集合中筛选出标签;具体的,当采用标签尺寸作为标签特征信息时,根据需要定位标签的尺寸,设定可接受的区域尺寸阈值,然后在候选区域集合中删除尺寸不满足可接受的区域尺寸阈值,余下的区域记为标签的真实位置,完成对笔记本掌托区域中的标签定位。本发明实施例的筛选方法简单,准确率较高。
本发明实施例另一方面提供一种计算机可读存储介质,计算机存储介质中存储有计算机可执行指令,当指令被执行时用于执行上述中任一项的数据处理方法。
本发明实施例另一方面提供一种电子设备,包括存储器和处理器,存储器中储存有计算机程序指令,指令由处理器加载并执行以实现上述中任一项的数据处理方法。
这里需要指出的是:以上两实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果,对于本发明实施例中未披露的技术细节,请参照本发明方法实施例的描述而理解,为节约篇幅,因此不再赘述。
本发明实施例中,多个步骤之间的实现顺序在不影响实现目的的情况下可以替换。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
1.一种数据处理方法,其特征在于,包括:
对原始区域图像进行初分割,得到原始区域集合;
计算对应于所述原始区域集合中相邻区域的相似度集合;
根据所述相似度集合对所述原始区域集合中的相邻区域进行合并,得到候选区域集合;
对所述候选区域集合进行筛选,得到标签区域。
2.根据权利要求1所述的方法,其特征在于,所述对原始区域图像进行初分割,得到多个原始区域集合包括:
采用k均值聚类算法对所述原始区域图像进行初次聚类,得到初聚类结果;
将所述初聚类结果中属于同一聚类中心的相邻像素点进行合并,得到原始区域集合。
3.根据权利要求1或2所述的方法,其特征在于,所述计算对应于所述原始区域集合中相邻区域的相似度集合包括:
根据所述原始区域集合中相邻区域的颜色直方图、颜色矩、尺寸和交叠比例中的一种或多种信息计算相似度集合。
4.根据权利要求1或2所述的方法,其特征在于,所述根据所述相似度集合对所述原始区域集合中的相邻区域进行合并,得到候选区域集合包括:
根据所述相似度集合合并所述原始区域集合中相似度最大的两个相邻区域,得到候选区域和包括有所述候选区域的候选区域集合;
判断所述候选区域集合中是否存在满足合并条件的相邻区域,若存在,则合并所述满足合并条件的相邻区域并更新所述候选区域集合。
5.根据权利要求1或2所述的方法,其特征在于,根据标签特征信息对所述候选区域集合进行筛选。
6.一种数据处理装置,其特征在于,包括:
粗分割模块,用于对原始区域图像进行初分割,得到原始区域集合;
相似度计算模块,用于计算对应于所述原始区域集合中相邻区域的相似度集合;
区域合并模块,用于根据所述相似度集合对所述原始区域集合中的相邻区域进行合并,得到候选区域集合;
筛选模块,用于对所述候选区域集合进行筛选,得到标签区域。
7.根据权利要求6所述的装置,其特征在于,所述粗分割模块包括:
初聚类单元,用于采用k均值聚类算法对所述原始区域图像进行初次聚类,得到初聚类结果;
聚类合并单元,用于将所述初聚类结果中属于同一聚类中心的相邻像素点进行合并,得到原始区域集合。
8.根据权利要求6或7所述的装置,其特征在于,所述相似度计算模块包括:
相似度计算子单元,用于根据所述原始区域集合中相邻区域的颜色直方图、颜色矩、尺寸和交叠比例中的一种或多种信息计算相似度集合。
9.根据权利要求6或7所述的装置,其特征在于,所述区域合并模块包括:
区域合并单元,用于根据所述相似度集合合并所述原始区域集合中相似度最大的两个相邻区域,得到候选区域和包括有所述候选区域的候选区域集合;
区域判断单元,用于判断所述候选区域集合中是否存在满足合并条件的相邻区域,若存在,则合并所述满足合并条件的相邻区域并更新所述候选区域集合。
10.一种计算机可读存储介质,所述计算机存储介质中存储有计算机可执行指令,当所述指令被执行时用于执行权利要求1-5中任一项所述的数据处理方法。
11.一种电子设备,包括存储器和处理器,所述存储器中储存有计算机程序指令,所述指令由所述处理器加载并执行以实现权利要求1-5中任一项所述的数据处理方法。
技术总结