基于局部高频次特征和混合度量学习的行人重识别方法与流程

专利2022-06-29  138


本发明属于信息技术计算机视觉技术领域,具体涉及一种基于局部高频次特征和混合度量学习的行人重识别方法。



背景技术:

在多摄像头监控场景下利用行人外观特征识别出与给定行人相关图像的问题,称为行人重识别(personre-identification)。通过对多摄像头监控数据的自动分析、检测、识别和跟踪,可匹配不同摄像机在不同时间、地点拍摄的行人目标。近年来,行人重识别问题一直是视频监控技术的研究热点,广泛应用于智能监控、智能安保、刑事侦查、行人检索、行人跟踪和行为分析等领域,对它的深入研究极大地推动计算机视觉、机器学习和多媒体信号处理等学科的发展。

行人重识别包括监控视频行人检测,特征提取和相似性度量等一系列的过程,其中特征提取和相似性度量是两个基本问题。目前,行人重识别技术研究主要集中在如下几个方面:

1)产生鲁棒的特征表示或特征描述子;

2)建立高效的信息相似性度量或度量学习机制。

特征表示需要计算行人样本的局部颜色和纹理特征,有效的特征表示既对目标有较强的区分力,又对光照和视角变化具有鲁棒性。用于描述行人外貌形态的特征有很多,如基于整体和基于部分的特征描述以及基于区域的特征描述。相似性度量学习目的是比较特征向量之间的距离,将其转化为图像对之间的相似度,通过对该相似度进行排序,找到最相似的图像。度量学习包括两个阶段,首先基于主成分分析(pca)方法将原始特征或特征维映射到低维子空间,然后在子空间上学习判定相应距离。这种两阶段处理方法能够有效提取一些在光照、位姿和视角都发生严重畸变的情况下提取显著特征。

大多数方法采用颜色直方图来表示局部或全局特征提取差异特征,计算查询图像之间的相似度然后排序,此时得到的往往不是最优结果。常见的特征提取方法包括显著特征匹配、局部特征的集成(elf),对称局部特征累加(sdalf),fisher矢量(ldfv),局部最大重现特征(lomo)和中级滤波等方法。无论是基于外貌的方法,还是基于形态的方法,充分利用目标的空间信息可以增强提取特征的鲁棒性,进而获得较好的再识别率。一些文献对于近年行人重识别工作进行了综述,提出纹理和形态是颜色特征的有益补充。有些研究提出了缩影特征(epitome)作为模板或基函数。局部特征对行人图像的旋转、视角、光照条件具有较好适应性。由于行人重识别的训练集和测试集之间id不重叠,并且大多数场景下,行人处于非合作状态,关键部位有时还会被遮挡住。因此,完全依赖特征描述解决行人目标再识别问题非常困难。



技术实现要素:

本发明所要解决的技术问题在于针对上述现有技术中的不足,提供一种基于局部高频次特征和混合度量学习的行人重识别方法,基于局部高频次特征提取目标图像的特征描述符,并进行全局和局部特征混合度量学习,在匹配准确程度方面做出改进,同时对计算速度方面没有显著影响。

本发明采用以下技术方案:

基于局部高频次特征和混合度量学习的行人重识别方法,包括以下步骤:

s1、在光照和视角变化条件下提取目标图像的颜色特征,使用基于中心环绕多尺度retinex算法预处理人物图像,进行图像颜色增强来消除光照不均;

s2、在光照不变条件下使用尺度不变局部三值模式提取图像纹理的特征描述;

s3、使用基于hsv的颜色直方图对于msr增强以后的图像提取颜色特征,经hsv颜色直方图提取并量化,计算颜色落在每个小区间内的像素数量得到颜色直方图;

s4、采用滑动窗口来描述局部细节特征,设定子窗口步长,沿水平方向和垂直方向在整张图片中重叠滑动描述一个图像的局部,提取每块的siltp和hsv特征,对同一水平滑窗带上图像块采用叠加的最大化操作捕获图像区域的局部高频次数特征,最后采用三尺度金字塔级联表示上述特征获得局部高频次特征描述符;

s5、寻找子空间对特征进行降维处理,要求样本投影在该空间实现类内距离最小,类间距离最大,选取低维空间w=(w1,w2,…wr)∈rd×r,求解度量学习矩阵,得到低维空间;

s6、构造度量学习矩阵mh(xi,xj),训练得到局部度量矩阵和全局度量矩阵的权重,求解马氏距离获得行人重识别依据,实现行人重识别。

具体的,步骤s1具体为:

s101、预读原图s(x,y),如原图为灰度图,将各像素的灰度值转换为浮点数,如原图为彩色图,将颜色分rgb三通道处理,每个通道分量的像素值转换为浮点数;

s102、输入尺度参数σ,计算高斯滤波器f;

s103、单尺度ssr算法处理后,输出r(x,y);

s104、将logr(x,y)量化到0~255之间的像素值作为输出像素,输出灰度值或者彩色像素值;

s105、如果原图是灰度图,直接输出,如果原图是rgb图,计算每个尺度下累加的logr(x,y)。

进一步的,步骤s105中,logr(x,y)具体为:

其中,为原图在某个通道的输出,wi为第i个尺度的权重系数

具体的,步骤s2具体为:

s201、预读msr处理后的图像r(x,y);

s202、逐行逐列扫描图像,获得每个像素点(xc,yc)的灰度值ic,设置邻域半径r,设置比例系数t;

s203、根据获得对应像素点的二值串联,(xc,yc)是像素点c,ic是像素c的灰度值;ik是c点周围以r为半径的圆上n个相邻点的灰度值;t是比较范围的比例系数;符号的作用是将st(ic,ik)得到的二进制数值串联成一个二进制字符串;

s204、c点周围像素点原始值经过分段函数st(ic,ik)运算后得到一个两位数的二进制字符串。

具体的,步骤s4具体为:

s401、采用滑动窗口提取局部特征,沿水平方向和垂直方向在整张图片中重叠滑动,描述一个128×48的行人图像;

s402、分别统计每个子窗口中两个尺度的siltp直方图和一个hsv直方图8×8×8(bin),每个直方图的bin表示该模式出现的概率;

s403、构建一个三尺度金字塔,通过两个2×2局部平均pooling操作对原始的128×48图像进行下采样,然后重复上述纹理和颜色特征提取过程;

s404、为抑制大的bin值,使hsv和siltp特征规范化为单位长度,对上述值取log,得到局部高频次特征的标准化值。

具体的,步骤s5具体为:

s501、根据马氏距离推导相似度函数,xi和xj是进行比较的两个样本,定义两个样本的距离hi表示两个样本属于同一个人,he表示两个样本属于不同人;若r(xij)≥1则p(hi|xij)>p(he|xij);

s502、寻找子空间,要求样本投影在该子空间实现类内距离最小而类间距离最大,进行降维处理;

s503、则距离相似度公式可变为求解上述公式中最大特征值对应的特征向量,得到低维空间;

s504、计算代表c类样本的类内离散度sw和类间离散度sb;

s505、为最大化距离j(w),满足约束s.t.wt∑iw=1条件下,求解

进一步的,步骤s504中,c类样本的类内离散度sw和类间离散度sb计算如下:

其中,m是总训练样本数,mi是类i中训练样本数,表示类i中第j个训练向量,mi是类i中训练样本均值向量,m0是所有训练样本的均值向量。

更进一步的,满足fisher准则的投影距离为:

其中,sw=∑i,sb=∑e,w为投影平面,wt为投影平面的法向量。

具体的,步骤s6中,度量学习矩阵mh(xi,xj)为:

其中,w0为全局度量矩阵的权重,m是全局度量矩阵,wk为局部度量矩阵及其权重参数,k为局部度量矩阵个数,xi,xj为样本;当w0=0时,采用局部度量学习方法,当k=0时,模型退化为全局度量学习。

进一步的,度量矩阵构造包括训练和学习两个阶段,训练阶段使用全部样本,使用高斯混合模型进行聚类,k是无监督的聚类结果,wk=p(k|xi);最终学习阶段,将训练得到的m和mk两个矩阵加权结合构造度量学习矩阵,学习阶段的任务是参数修正,为修正wk的值,训练集初步划分后,对每个训练集内样本单独学习,得到一系列局部度量矩阵;当样本出现交叉时,第一个参数属于样本i,第二个参数属于样本类别j,此时样本分类重叠,允许一个目标的图像属于多个聚类,并根据各个样本在混合模型中后验概率的最大值,判定局部子集;在局部高频次特征提取的基础上,利用高斯混合模型将局部相似划分在同一训练集,单独进行度量学习。

与现有技术相比,本发明至少具有以下有益效果:

本发明提出了一种基于局部高频次特征和混合度量学习的行人重识别方法,可以在多摄像头监控场景下利用行人外观特征识别出与给定行人相关图像,在智能监控、智能安保、刑事侦查、行人检索、行人跟踪和行为分析等领域具有较好应用价值。

进一步的,步骤s1中使用msr颜色增强算法预处理图像来消除光照不均,考虑到可相同人物的感知颜色可能因摄像机视图不同产生很大变化,而基于中心环绕模型的msr算法不仅仅补偿光照的变化,同时兼顾不同尺度retinex算法中细节增强和颜色恒常优点

进一步的,步骤s2的siltp算法继承了局部二值模式(localbinarypattern,lbp)算法尺度不变的特性,能够适应光照突然变化的情况,具有尺度不变和对噪声的鲁棒性,可处理图像局部光照变化,并消除阴影。

进一步的,步骤s3将颜色空间划分成若干个小的颜色区间,每个小区间成为直方图的一个bin。经颜色量化(colorquantization)以后,计算颜色落在每个小区间内的像素数量得到颜色直方图。hsv模型中,参数h表示色彩信息,即所处的光谱颜色的位置,该参数用一角度量来表示,红、绿、蓝分别相隔120度,互补色分别相差180度;参数s表示纯度,为一比例值,范围从0到1。表示所选颜色纯度和该颜色最大纯度之间的比例,s=0时,只有灰度;参数v表示色彩明亮程度,范围从0到1,该值和光强度之间并没有直接的联系。

进一步的,步骤s4采用滑动窗口来描述行人局部细节,设定子窗口步长,沿着水平方向和垂直方向在整张图片中重叠滑动,来描述一个图像的局部。在每个子窗口中分别统计两个尺度的siltp直方图和一个hsv直方图8×8×8(bin),每个直方图的bin表示该种模式出现的概率,为了最大化局部特征,对同一水平滑窗带上图像块采用叠加的最大化操作来捕获图像区域的局部高频次数特征(如图2所示),最后采用三尺度金字塔级联表示上述特征获得局部高频次特征描述符;

进一步的,步骤s5寻找子空间对特征进行降维处理,要求样本投影在该空间实现类内距离最小,类间距离最大,选取低维空间w=(w1,w2,…wr)∈rd×r,求解度量学习矩阵,得到低维空间;

进一步的,步骤s6基于mahalanobis距离构建混合度量学习矩阵,并基于kissme算法将求解马氏距离的问题转化为对高斯分布协方差矩阵的求参数问题,并将其应用于行人重识别判定。要求同一个行人不同设备不同图像距离小于不同人间图像距离,对相似程度给出了一个度量。

综上所述,本发明的行人重识别包括局部频次特征提取和混合度量学习两个重要过程,在图像滤噪和msr增强基础上,本文提取了行人样本的高频次局部颜色和纹理特征,该特征对光照和视角变化具有较强鲁棒性。在最大化局部特征后,在子空间降维构建度量学习矩阵,根据样本出现后验概率学习获得相应权重,得到混合度量学习矩阵权重。实验基于不同数据库验证了本发明的累计匹配曲线(cumulativematchingcurve,cmc)cmc曲线和和一级识别率)rank-1识别率。并比较了其他方法得到本发明所提方法具有较高匹配度和与之相应的时间开销。

下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

附图说明

图1为本发明一种基于局部高频次特征和混合度量学习方法的框架图;

图2为本发明过程示意图;

图3为market-1501数据msr处理前后对比图,(a)是market-1501行人数据的原始图像;(b)market-1501行人数据msr处理后图像;

图4siltp算法示意图;

图5采用滑动子窗口实现局部特征最大提取得到的直方图;

图6多数据集下行人重识别的cmc曲线。

具体实施方式

行人重识别技术利用计算机视觉和图像检索技术判断跨设备下图像或者视频序列中是否存在特定行人图像。在非重叠场景下,受光照条件、背景变化、遮挡、视角和位姿变化等因素影响,导致不同摄像机下的同一目标体貌存在着很大的差异,这种差异甚至大于衣着相近的不同个体差异。

本发明提供一种基于局部高频次特征和混合度量学习的行人重识别方法,采用局部频次特征表示方法,在光照和视角变化条件下提取目标图像的颜色和纹理特征集合,并采用滑动窗口来描述局部细节提取图像特征,取局部频次出现的最大概率值作为最后特征值,获得多尺度的特征描述符。在子空间降维以后,根据样本出现的后验概率得到度量学习矩阵及其权重系数,根据相应马氏距离得到相似程度作为重识别的依据。本发明可以在多摄像头监控场景下利用行人外观特征识别出与给定行人相关图像,在智能监控、智能安保、刑事侦查、行人检索、行人跟踪和行为分析等领域具有较好应用价值。

请参阅图1,本发明一种基于局部高频次特征和混合度量学习的行人重识别方法,主要处理对象为公开数据集,图像由图像检测器从监控视频中提取并自动检测切割出行人图像,数据库被划分为一个训练集和一个测试集,具体步骤如下:

s1、在光照和视角变化条件下提取目标图像的颜色特征,使用基于中心环绕多尺度retinex算法(multiscaleretinex,msr)预处理人物图像,进行图像颜色增强来消除光照不均;

s101、预读原图s(x,y),如原图为灰度图,将各像素的灰度值转换为浮点数,如原图为彩色图,将颜色分rgb三通道处理,每个通道分量的像素值转换为浮点数;

s102、输入尺度参数σ,计算高斯滤波器f如下:

其中,r2为x2 y2

s103、单尺度ssr算法处理后,输出r(x,y),具体计算如下:

logr(x,y)=logs(x,y)-logl(x,y)

其中,表示光照,f(x,y)是环绕函数,其本质是高斯模糊的滤波器,表示卷积运算,中心环绕函数与高斯滤波函数的卷积。

多尺度的r(x,y)有多个分量ri,如原图为灰度图,为灰度图输出,如原图为彩色图为彩色图在某个通道的输出,f(x,y)则是环绕函数,其本质是高斯模糊的滤波器。

s104、将logr(x,y)量化到0~255之间的像素值作为输出像素,输出灰度值或者彩色像素值;

s105、如果原图是灰度图,直接输出,如果原图是rgb图,计算每个尺度下累加的logr(x,y),logr(x,y)是根据权重调整合成的输出rgb图,计算如下:

其中,wi为第i个尺度的权重系数为灰度图输出。

s2、在光照不变条件下使用尺度不变局部三值模式(scaleinvariantlocalternarypattern,siltp)提取图像纹理的特征描述,siltp算法能够适应光照突然变化的情况,能通过纹理特征将人物的阴影与背景区分,可处理图像局部光照变化,消除阴影;

s201、预读msr处理后的图像r(x,y);

siltp(scaleinvariantlocalternarypattern)是尺度不变局部三值模式,该算法继承了局部二值模式lbp(localbinarypattern,lbp)算法尺度不变的特性,能够适应光照突然变化的情况,还能够通过纹理特征将人物的阴影与背景区分开;

siltp具有尺度不变性和对噪声的鲁棒性,可处理图像局部光照变化,并消除阴影。

s202、逐行逐列扫描图像,获得每个像素点(xc,yc)的灰度值ic,设置邻域半径r,设置比例系数t;

s203、根据计算方法获得对应像素点的二值串联;

其中,(xc,yc)是像素点c,ic是像素c的灰度值;ik是c点周围以r为半径的圆上n个相邻点的灰度值;t是比较范围的比例系数;符号的作用是将st(ic,ik)得到的二进制数值串联成一个二进制字符串。

变换函数st是一个分段函数,计算方法如:

s204、c点周围像素点原始值经过分段函数st(ic,ik)运算后得到一个两位数的二进制字符串。

请参阅图4,t=0.1,邻域为8,则st使用了周围8个2位二进制数来表示像素点c附近的纹理特征(00,00,10,00,_10,00,01,01)。

s3、使用基于hsv(huesaturationvalue,hsv)的颜色直方图对于msr增强以后的图像提取颜色特征,经hsv(hue,saturationvalue,hsv)颜色直方图提取并量化,计算颜色落在每个小区间内的像素数量得到颜色直方图;

颜色特征基于hsv(hue,saturationvalue,hsv)颜色直方图提取。将颜色空间划分成若干个小的颜色区间,每个小区间成为直方图的一个bin。经颜色量化(colorquantization)以后,计算颜色落在每个小区间内的像素数量得到颜色直方图。

hsv模型中,参数h表示色彩信息,即所处的光谱颜色的位置;参数s表示纯度,为一比例值,范围从0到1,表示所选颜色纯度和该颜色最大纯度之间的比例,s=0就只有灰度;参数v表示色彩明亮程度,范围从0到1,该值和光强度之间并没有直接的联系。

s4、采用滑动窗口来描述局部细节特征,设定子窗口步长,沿着水平方向和垂直方向在整张图片中重叠滑动,来描述一个图像的局部。提取每块的siltp和hsv特征,对同一水平滑窗带上图像块采用叠加的最大化操作来捕获图像区域的局部高频次数特征,如图2所示,最后采用三尺度金字塔级联表示上述特征获得局部高频次特征描述符;

s401、采用滑动窗口来提取局部特征,通常定义子窗口大小为10×10,设步长为5,沿着水平方向和垂直方向在整张图片中重叠滑动,来描述一个128×48行人图像;

s402、分别统计每个子窗口中两个尺度的siltp直方图和一个hsv直方图8×8×8(bin),每个直方图的bin表示该种模式出现的概率;

为了弱化视角差异,对同一水平位置的所有滑动窗口中的特征取最大概率值进行局部最大操作,提取过程如图5所示。

s403、构建一个三尺度金字塔,通过两个2×2局部平均pooling操作对原始的128×48图像进行下采样,然后重复上述纹理和颜色特征提取过程;

对每张图片,可扫描出24个组,由于多尺度对图片缩放了两次,得到24×64和12×32两种图片。三张图片有24 11 5组,局部特征级联一共(8×8×8bin 34×2bin)×(24 11 5)=26,960维描述符。

s404、为抑制大的bin值,使hsv和siltp特征规范化为单位长度,对上述值取log,得到局部高频次特征的标准化值。

s5、寻找子空间对特征进行降维处理,要求样本投影在该空间实现类内距离最小,类间距离最大,选取低维空间w=(w1,w2,…wr)∈rd×r,求解度量学习矩阵,得到低维空间;

s501、根据马氏距离推导相似度函数,xi和xj是进行比较的两个样本,r(xij)则是两个样本的距离,定义hi表示两个样本属于同一个人,he表示两个样本属于不同人;若r(xij)≥1则p(hi|xij)>p(he|xij),可以认为是样本图片属于同一人。

根据零均值高斯分布假设,代入r(xij)如下:

其中,∑i是hi协方差矩阵,∑h是he协方差矩阵,θe和θi为高斯分布参数,用∑h,∑i表示。

形式化和约简距离相似度函数r(xij)如下:

r(xij)=d(xi,xj)=(xi-xj)tm(xi-xj)mt(xi-xj)

其中,是映射矩阵和距离度量矩阵。

s502、特征级联以后的原始特征维度非常大导致计算开销增大,降维首先需要寻找子空间,要求样本投影在该子空间实现类内距离最小而类间距离最大;

w=(w1,w2,…wr)∈rd×r,(r<d)是选取的低维空间,令两个训练集{x,z},x=(x1,…xn)包括一个视角d维特征n个样本,y=(y1,…yn)则是另一个视角样本。

s503、则距离相似度公式可变为求解上述公式中最大特征值对应的特征向量,得到低维空间;

上述实现多分类基于c类样本,得到满足fisher准则的投影距离如式所示:

s504、sw,sb分别代表c类样本的类内离散度和类间离散度,计算方式如下:

其中,m是总训练样本数,mi是类i中训练样本数,表示类i中第j个训练向量,mi是类i中训练样本均值向量,m0是所有训练样本的均值向量。

sw=∑i,sb=∑e,则:

其中,w为投影平面,wt为投影平面的法向量;

s505、为最大化距离j(w),满足约束s.t.wt∑iw=1条件下,求解

的最大特征值对应j(w)最大值特征向量w1,第二大特征值对应特征向量w2,最后就组成了子空间w=(w1,w2,…wr),对原始数据做投影,即可计算出最终的距离。

s6、构造度量学习矩阵mh(xi,xj),训练得到局部度量矩阵和全局度量矩阵的权重,求解马氏距离获得行人重识别依据。

度量学习矩阵mh(xi,xj)为:

其中,w0为全局度量矩阵的权重,用于平滑全局度量矩阵对整体度量的影响,wk为局部度量矩阵及其权重参数,m为全局度量矩阵,k为局部度量矩阵个数,xi,xj为样本。当w0=0时,算法采用局部度量学习方法,当k=0时,模型退化为全局度量学习。

本度量矩阵构造分训练和学习两个阶段,训练阶段使用全部样本,使用高斯混合模型进行聚类,k是无监督的聚类结果,k越大,则体现在局部特征区分性越高,但容易产生过拟合,其中wk=p(k|xi)。最终学习阶段,将训练得到的m和mk两个矩阵加权结合构造度量学习矩阵。学习阶段的重要任务是参数修正,为修正wk的值,训练集初步划分后,对每个训练集内样本单独学习,得到一系列局部度量矩阵。当样本出现交叉时,如样本(xi,yj),其中第一个参数属于样本i,第二个参数属于样本类别j,此时样本分类重叠,原因在于不同相机下同一个目标表现差异较大。处理措施是允许一个目标的图像可属于多个聚类,并根据各个样本在混合模型中后验概率的最大值,判定局部子集。构造度量矩阵目的是在局部高频次特征提取的基础上,利用高斯混合模型将局部相似划分在同一训练集,单独进行度量学习,更好地区分这些相似的目标,从而提高匹配准确率。

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中的描述和所示的本发明实施例的组件可以通过各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明一种基于局部高频次特征和混合度量学习的行人重识别方法,使用公开数据viper,cuhk校园,cuhk03和market-1501对实验进行仿真,对发明的可行性与效果评估如下:

viper是被广泛用做基准评估的行人重识别数据库。它包含632对行人图像,由室外一对摄像头拍摄。其中图像在背景,照明和视点变化中差异很大。

香港中文大学校园数据集是校园两个摄影机视角拍摄的,包含971人两个图像,包括一个正视图或背视图,另一个是侧视图,图像分辨率是160×60像素。其中,485人进行训练,486人进行测试(多镜头)。而港中文3号数据集包括1,316个行人13,164幅图像。这是目前最大的公开数据集。包括六台监视摄像机,每个人包括两个不相交摄像机视图,图像手动检测切割。

market-1501数据集在清华大学采集,图像来自6个摄像头,其中一个为低像素。训练集有751人,包含12,936张图像,测试集750人,包含19,732张图像。

在实验过程中,本发明将viper的632对图像随机分为两部分,一半进行训练,另一半进行测试,重复10次以获得平均性能,将香港中文大学校园数据集数据集划分为一个1,160人的训练集和一个100人的测试集。

实验结果表明:

1、本发明在预处理阶段,以market-1501数据集的一些样本图像为例进行颜色和纹理增强,图3(a)显示了,两个摄像机视图中同一人的图像在照明和颜色外观上具有很大差异。图3(b)是(a)msr增强后的结果。摄像机上同一行人经msr增强后在照明和颜色上的一致性更好,使得行人重识别比使用原始图像更容易。

2、请参阅图4,该图显示了局部频次特征提取的过程,图片来自viper数据集;

3、图5显示了在四个数据集上的一级识别率(rank-1)结果。横坐标为rank数目,纵坐标为cmc准确率。当r=1时,显示一级识别率表示训练集中目标匹配结果在测试集上的比例,可以看到,viper数据集的一次识别率是41%,而cuhk和cuhk03的rank-1在10%。由于这两个数据测试图像大量的光照和视点变化,导致一次识别率较低。而market-1501介于二者之间;

4、图6表示本方法综合了局部频次特征和混合度量学习方法,在viper数据集上进行实验,方法包括仅仅采用基于高斯模型的度量矩阵学习算法(keepitsimpleandstraightforward,kissme),lomo-xqda方法(cvpr2015)和本发明所采用的方法三种,本发明所采用的方法再略高于其他两种方法。

综上所述,本发明在系统开销、稳定性以及准确性方面都具有较强的有效性,并且在多种场景下的适应性较好。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上内容仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明权利要求书的保护范围之内。


技术特征:

1.基于局部高频次特征和混合度量学习的行人重识别方法,其特征在于,包括以下步骤:

s1、在光照和视角变化条件下提取目标图像的颜色特征,使用基于中心环绕多尺度retinex算法预处理人物图像,进行图像颜色增强来消除光照不均;

s2、在光照不变条件下使用尺度不变局部三值模式提取图像纹理的特征描述;

s3、使用基于hsv的颜色直方图对于msr增强以后的图像提取颜色特征,经hsv颜色直方图提取并量化,计算颜色落在每个小区间内的像素数量得到颜色直方图;

s4、采用滑动窗口来描述局部细节特征,设定子窗口步长,沿水平方向和垂直方向在整张图片中重叠滑动描述一个图像的局部,提取每块的siltp和hsv特征,对同一水平滑窗带上图像块采用叠加的最大化操作捕获图像区域的局部高频次数特征,最后采用三尺度金字塔级联表示上述特征获得局部高频次特征描述符;

s5、寻找子空间对特征进行降维处理,要求样本投影在该空间实现类内距离最小,类间距离最大,选取低维空间w=(w1,w2,…wr)∈rd×r,求解度量学习矩阵,得到低维空间;

s6、构造度量学习矩阵mh(xi,xj),训练得到局部度量矩阵和全局度量矩阵的权重,求解马氏距离获得行人重识别依据,实现行人重识别。

2.根据权利要求1所述的基于局部高频次特征和混合度量学习的行人重识别方法,其特征在于,步骤s1具体为:

s101、预读原图s(x,y),如原图为灰度图,将各像素的灰度值转换为浮点数,如原图为彩色图,将颜色分rgb三通道处理,每个通道分量的像素值转换为浮点数;

s102、输入尺度参数σ,计算高斯滤波器f;

s103、单尺度ssr算法处理后,输出r(x,y);

s104、将logr(x,y)量化到0~255之间的像素值作为输出像素,输出灰度值或者彩色像素值;

s105、如果原图是灰度图,直接输出,如果原图是rgb图,计算每个尺度下累加的logr(x,y)。

3.根据权利要求2所述的基于局部高频次特征和混合度量学习的行人重识别方法,其特征在于,步骤s105中,logr(x,y)具体为:

logr(x,y)=wilog(rimsr(x,y)) wilog(rimsr(x,y)) wilog(rimsr(x,y))

其中,rimsr(x,y)为原图在某个通道的输出,wi为第i个尺度的权重系数

4.根据权利要求1所述的基于局部高频次特征和混合度量学习的行人重识别方法,其特征在于,步骤s2具体为:

s201、预读msr处理后的图像r(x,y);

s202、逐行逐列扫描图像,获得每个像素点(xc,yc)的灰度值ic,设置邻域半径r,设置比例系数t;

s203、根据获得对应像素点的二值串联,(xc,yc)是像素点c,ic是像素c的灰度值;ik是c点周围以r为半径的圆上n个相邻点的灰度值;t是比较范围的比例系数;符号的作用是将st(ic,ik)得到的二进制数值串联成一个二进制字符串;

s204、c点周围像素点原始值经过分段函数st(ic,ik)运算后得到一个两位数的二进制字符串。

5.根据权利要求1所述的基于局部高频次特征和混合度量学习的行人重识别方法,其特征在于,步骤s4具体为:

s401、采用滑动窗口提取局部特征,沿水平方向和垂直方向在整张图片中重叠滑动,描述一个128×48的行人图像;

s402、分别统计每个子窗口中两个尺度的siltp直方图和一个hsv直方图8×8×8(bin),每个直方图的bin表示该模式出现的概率;

s403、构建一个三尺度金字塔,通过两个2×2局部平均pooling操作对原始的128×48图像进行下采样,然后重复上述纹理和颜色特征提取过程;

s404、为抑制大的bin值,使hsv和siltp特征规范化为单位长度,对上述值取log,得到局部高频次特征的标准化值。

6.根据权利要求1所述的基于局部高频次特征和混合度量学习的行人重识别方法,其特征在于,步骤s5具体为:

s501、根据马氏距离推导相似度函数,xi和xj是进行比较的两个样本,定义两个样本的距离hi表示两个样本属于同一个人,he表示两个样本属于不同人;若r(xij)≥1则p(hi|xij)>p(he|xij);

s502、寻找子空间,要求样本投影在该子空间实现类内距离最小而类间距离最大,进行降维处理;

s503、则距离相似度公式可变为求解上述公式中最大特征值对应的特征向量,得到低维空间;

s504、计算代表c类样本的类内离散度sw和类间离散度sb;

s505、为最大化距离j(w),满足约束s.t.wt∑iw=1条件下,求解

7.根据权利要求6所述的基于局部高频次特征和混合度量学习的行人重识别方法,其特征在于,步骤s504中,c类样本的类内离散度sw和类间离散度sb计算如下:

其中,m是总训练样本数,mi是类i中训练样本数,表示类i中第j个训练向量,mi是类i中训练样本均值向量,m0是所有训练样本的均值向量。

8.根据权利要求7所述的基于局部高频次特征和混合度量学习的行人重识别方法,其特征在于,满足fisher准则的投影距离为:

其中,sw=∑i,sb=∑e,w为投影平面,wt为投影平面的法向量。

9.根据权利要求1所述的基于局部高频次特征和混合度量学习的行人重识别方法,其特征在于,步骤s6中,度量学习矩阵mh(xi,xj)为:

其中,w0为全局度量矩阵的权重,m是全局度量矩阵,wk为局部度量矩阵及其权重参数,k为局部度量矩阵个数,xi,xj为样本;当w0=0时,采用局部度量学习方法,当k=0时,模型退化为全局度量学习。

10.根据权利要求9所述的基于局部高频次特征和混合度量学习的行人重识别方法,其特征在于,度量矩阵构造包括训练和学习两个阶段,训练阶段使用全部样本,使用高斯混合模型进行聚类,k是无监督的聚类结果,wk=p(k|xi);最终学习阶段,将训练得到的m和mk两个矩阵加权结合构造度量学习矩阵,学习阶段的任务是参数修正,为修正wk的值,训练集初步划分后,对每个训练集内样本单独学习,得到一系列局部度量矩阵;当样本出现交叉时,第一个参数属于样本i,第二个参数属于样本类别j,此时样本分类重叠,允许一个目标的图像属于多个聚类,并根据各个样本在混合模型中后验概率的最大值,判定局部子集;在局部高频次特征提取的基础上,利用高斯混合模型将局部相似划分在同一训练集,单独进行度量学习。

技术总结
本发明公开了一种基于局部高频次特征和混合度量学习的行人重识别方法,采用局部频次特征表示方法,在光照和视角变化条件下提取目标图像的颜色和纹理特征集合,并采用滑动窗口来描述局部细节提取图像特征,取局部高频次出现的特征最大值作为特征值,获得多尺度的特征描述符级联。在子空间降维以后,根据样本出现的后验概率得到度量学习矩阵及其混合度量学习矩阵的权重系数,最终得到相似程度作为行人重识别的依据。本发明可以在多摄像头监控场景下利用行人外观特征识别出与给定行人相关图像,在智能监控、智能安保、刑事侦查、行人检索、行人跟踪和行为分析等领域具有较好应用价值。

技术研发人员:赵增辉;林青
受保护的技术使用者:西安培华学院
技术研发日:2020.01.10
技术公布日:2020.06.09

转载请注明原文地址: https://bbs.8miu.com/read-18673.html

最新回复(0)