本发明涉及机器学习中的分类识别领域,特别涉及一种基于分数阶稀疏表示的多视角人脸识别方法。
背景技术:
随着现代信息技术的快速发展,进行身份认证的技术转到了生物特征层面。现代生物识别技术主要是通过计算机与高科技手段密切结合,利用人体固有的生理特性和行为特征来进行个人身份的鉴定。人脸识别是基于人的面部特征信息进行的一种技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,然后再利用已有的人脸数据库,确定场景里的一个人或者多个人。目前人脸识别研究范围主要包括几个方面:人脸检测与定位、人脸特征表示、人脸识别、表情与姿态分析与分类。目前,人脸识别的研究方法有基于几何特征的方法、特征脸法、局部特征分析方法以及最新的深度神经网络方法。
人脸识别系统的研究始于20世纪60年代,80年代后随着计算机技术和光学成像技术的发展得到提高,而真正进入初级的应用阶段则在90年代后期,并且以美国、德国和日本的技术实现为主。人脸识别系统成功的关键在于是否拥有尖端的核心算法,并使识别结果具有实用化的识别率和识别速度。人脸识别系统集成了人工智能、机器学习、模型理论、专家系统、视频图像处理等多种专业技术,同时需结合中间值处理的理论与实现,是生物特征识别的最新应用,其核心技术的实现,展现了弱人工智能向强人工智能的转化。
高维数据的稀疏表示是近些年是机器学习和计算机视觉研究领域的热点之一,其基本假设是:自然图像本身为稀疏信号,用一组过完备基将输入信号线性表达出来,展开系数可以在满足一定的稀疏度条件下,获取对原始信号的良好近似。研究人员发现,尽管稀疏表示的优化模型是从信号重建的角度建立的,但其表示结果在模式识别中都有很好的表现,许多当前最好的分类系统往往都会选用稀疏表示作为其关键模块。
基于超完备字典的信号稀疏分解是一种新的信号表示理论,其采用超完备的冗余函数系统代替传统的正交基函数,为信号自适应的稀疏扩展提供了极大的灵活性。稀疏分解可以实现数据压缩的高效性,更重要的是可以利用字典的冗余特性捕捉信号内在的本质特征。信号稀疏分解的基本思想是:使用超完备的冗余函数字典作为基函数,字典的选择尽可能地符合被逼近信号的结构,字典中的元素被称为原子。利用贪婪算法或者自适应追踪算法,从字典中找到具有最佳线性组合的很少的几项原子来表示一个信号,也称作高度非线性逼近。
传统的基于稀疏表示的人脸识别方法随着人脸样本维度增大,计算代价也会随之增大,有时人脸图像不清晰或者有遮挡,会影响识别速度以及效果。
技术实现要素:
本发明的目的是克服现有技术缺陷,提供一种基于分数阶稀疏表示的多视角人脸识别方法,通过分数阶嵌入构造人脸的训练字典矩阵,用优化方法将字典引入稀疏表示分类的框架之中,这样提取出的人脸特征不仅减少了面部的细节变化,而且消除了因遮挡引起的噪声数据,提高了人脸识别能力和稳定性。
本发明的目的是这样实现的:一种基于分数阶稀疏表示的多视角人脸识别方法,包括以下步骤:
步骤1:输入多视角人脸图像集a和多视角测试图像集y;
步骤2:对a执行奇异值分解;
步骤3:对于给定的非负分数阶参数α,计算相应的分数阶训练字典矩阵aα;
步骤4:用新的分数阶训练字典求解联合稀疏表示系数矩阵x;
步骤5:使用classi(y)公式对多视角测试图像集y进行分类;
步骤6:输出y的人脸类别。
作为本发明的进一步限定,步骤1中所述多视角人脸图像集a是包含了各个人脸多视角图像的训练字典,定义为:
作为本发明的进一步限定,所述步骤2具体包括:a=pλqt,λ=diag(λ1,λ2,...,λr),其中r是a的秩,p=(p1,p2,...,pr)和q=(q1,q2,...,qr)分别是a的左右奇异值矩阵。
作为本发明的进一步限定,所述步骤3具体包括:假设α是一个分数并且满足0≤α≤1,矩阵aα是分数阶训练字典矩阵,它被定义为
作为本发明的进一步限定,所述步骤4具体包括:将分数阶训练字典矩阵aα嵌入到联合稀疏表示中,根据联合稀疏表示的目标函数,可以得到:
其中||·||f表示矩阵的f范数,
其中xi是x的第i个行向量并且μ是正则化参数,令
然后将式(3)改写成迹的形式,得到:
其中tr(·)表示矩阵的迹,然后对x求导并将导数置为0,可得:
x=((aα)taα μη)-1aαy(6)。
作为本发明的进一步限定,所述步骤5具体包括:使用如下分类规则对多视角测试图像集y进行分类,
其中ψi(x*)表示x*中所有对应第i类的行元素均保持不变,其余元素均被设置为0。
与现有技术相比,本发明的有益效果在于:本发明以基于稀疏表示的人脸识别为基础,引入了分数阶嵌入,其主要思想是先通过分数阶嵌入构造人脸的训练字典矩阵,用优化方法将字典引入稀疏表示分类的框架之中,这样提取出的人脸特征不仅减少了面部的细节变化,而且消除了因遮挡引起的噪声数据,提高了人脸识别能力和稳定性,进一步提高了用户体验。
附图说明
图1是本发明的实现流程图。
具体实施方式
如图1所示的一种基于分数阶稀疏表示的多视角人脸识别方法,包括以下步骤:
步骤1:输入多视角人脸图像集a和多视角测试图像集y,多视角人脸图像集a是包含了各个人脸多视角图像的训练字典,定义为:
步骤2:对a执行奇异值分解,a=pλqt,λ=diag(λ1,λ2,...,λr),其中r是a的秩,p=(p1,p2,...,pr)和q=(q1,q2,...,qr)分别是a的左右奇异值矩阵。
步骤3:对于给定的非负分数阶参数α,计算相应的分数阶训练字典矩阵aα,假设α是一个分数并且满足0≤α≤1,矩阵aα是分数阶训练字典矩阵,它被定义为
步骤4:用新的分数阶训练字典求解联合稀疏表示系数矩阵x,将分数阶训练字典矩阵aα嵌入到联合稀疏表示中,根据联合稀疏表示的目标函数,可以得到:
其中||·||f表示矩阵的f范数,
其中xi是x的第i个行向量并且μ是正则化参数,令
然后将式(3)改写成迹的形式,得到:
其中tr(·)表示矩阵的迹,然后对x求导并将导数置为0,可得:
x=((aα)taα μη)-1aαy(6)。
步骤5:使用如下classi(y)公式对多视角测试图像集y进行分类,
其中ψi(x*)表示x*中所有对应第i类的行元素均保持不变,其余元素均被设置为0。
步骤6:输出y的人脸类别。
本发明可通过以下实验进一步说明:
为了测试本发明的有效性,实验采用了cmupie人脸数据库和eyaleb人脸数据库。
cmupie人脸数据集:该cmupie数据库是一个多视图人脸数据集,逐渐成为人脸识别领域的重要测试集,有6836名志愿者的41368多姿势,光和面部表情图像,每个人有13个照明,43个照明条件和4个表达。pie是pose、illumination和expression的缩写,在严格控制的条件下收集姿势和照明变化图像,每个图像的大小为640×486像素,对于cmu数据库,本实验选择部分图像作为我们的训练集和测试集。
eyaleb人脸数据库:扩展的yale是一个多视图人脸数据库,包含16128张28人的灰色脸部图片,这些图像分别以9种不同的姿势和64种不同的拍摄参数拍摄,每个图像的大小为640×480像素,由于原始数据库数量众多,为了提高分类效率,本实验选择部分图像作为训练集和测试集。
表1和表2分别给出了人脸特征维度变化下cmupie和eyale上人脸识别率。结果表明,这些算法的准确性随着特征维数的增加而增加,最终会相对稳定。典型相关分析(cca)和基于稀疏表示的分类方法(src)的不良表现表明两个视图之间的相关性未得到充分利用。总体而言,基于联合稀疏表示的分类方法(jsrc)的性能与本发明方法具有可比性,但本发明提出的基于分数阶稀疏表示的多视角人脸识别方法可以在低维度上显示出高识别率,这表明本发明可以提高识别效率并减少时空消耗。
表1人脸特征维度变化下的cmupie人脸识别率(d)(m=2).
表2人脸特征维度变化下的eyaleb人脸识别率(d)(m=2).
表3和表4中分别给出了视角个数变化下在cmupie和eyale上的人脸识别率结果。从两个表中可以看出,多视图分类算法在很大程度上优于对应的单视图,这表明多视图识别算法的优越性,随着视图数量的增加,性能也会提高,此外,本发明在所有不同数量的视图下优于所有其他两种方法,这表明由分数阶svd表示的图像消除了一些敏感变化并且变得更适合于多视图分类任务。
表3视角个数变化下的cmupie人脸识别率(m)(d=40).
表4视角个数变化下的eyaleb人脸识别率(m)(d=20).
综上所述,本发明以基于稀疏表示的人脸识别为基础,引入了分数阶嵌入,其主要思想是先通过分数阶嵌入构造人脸的训练字典矩阵,用优化方法将字典引入稀疏表示分类的框架之中,这样提取出的人脸特征不仅减少了面部的细节变化,并且消除了因遮挡引起的噪声数据,提高了人脸识别能力和稳定性。
本发明并不局限于上述实施例,在本发明公开的技术方案的基础上,本领域的技术人员根据所公开的技术内容,不需要创造性的劳动就可以对其中的一些技术特征作出一些替换和变形,这些替换和变形均在本发明的保护范围内。
1.一种基于分数阶稀疏表示的多视角人脸识别方法,其特征在于,包括以下步骤:
步骤1:输入多视角人脸图像集a和多视角测试图像集y;
步骤2:对a执行奇异值分解;
步骤3:对于给定的非负分数阶参数α,计算相应的分数阶训练字典矩阵aα;
步骤4:用新的分数阶训练字典求解联合稀疏表示系数矩阵x;
步骤5:使用classi(y)公式对多视角测试图像集y进行分类;
步骤6:输出y的人脸类别。
2.根据权利要求1所述的一种基于分数阶稀疏表示的多视角人脸识别方法,其特征在于,步骤1中所述多视角人脸图像集a是包含了各个人脸多视角图像的训练字典,定义为:
3.根据权利要求1所述的一种基于分数阶稀疏表示的多视角人脸识别方法,其特征在于,所述步骤2具体包括:a=pλqt,λ=diag(λ1,λ2,...,λr),其中r是a的秩,p=(p1,p2,...,pr)和q=(q1,q2,...,qr)分别是a的左右奇异值矩阵。
4.根据权利要求1所述的一种基于分数阶稀疏表示的多视角人脸识别方法,其特征在于,所述步骤3具体包括:假设α是一个分数并且满足0≤α≤1,矩阵aα是分数阶训练字典矩阵,它被定义为
5.根据权利要求1所述的一种基于分数阶稀疏表示的多视角人脸识别方法,其特征在于,所述步骤4具体包括:将分数阶训练字典矩阵aα嵌入到联合稀疏表示中,根据联合稀疏表示的目标函数,可以得到:
其中||·||f表示矩阵的f范数,
其中xi是x的第i个行向量并且μ是正则化参数,令
然后将式(3)改写成迹的形式,得到:
其中tr(·)表示矩阵的迹,然后对x求导并将导数置为0,可得:
x=((aα)taα μη)-1aαy(6)。
6.根据权利要求1所述的一种基于分数阶稀疏表示的多视角人脸识别方法,其特征在于,所述步骤5具体包括:使用如下分类规则对多视角测试图像集y进行分类,
其中ψi(x*)表示x*中所有对应第i类的行元素均保持不变,其余元素均被设置为0。
技术总结