本申请涉及网络安全领域,具体而言,涉及一种活体检测方法。
背景技术:
人脸活体检测技术从检测流程上可以分为配合式活体检测和非配合式(静默)活体检测。配合式活体检测,其安全性能较高,主要应用于安全等级较高的场景(如支付场景),但因需要人机交互配合,对于时效性较高的场景,其用户体验效果不是很好。非配合式即静默活体,用户体验好,广泛的应用于安全等级不是很高的场景(如门禁、打卡签到等场景)。
从传感器种类及其组合方面可以将人脸活体检测分为可见光(rgb)、红外单目活体及其组合的双目活体,基于结构光的活体检测是双目活体的一种。基于单目的活体检测方案(如单目rgb,单目红外)由于其输入源比较单一,对于诸如光线变化、距离远近、人脸角度变化等复杂场景抗干扰性能以及精度较差;基于结构光的活体检测,其性能较好,但是受限其价格较贵、识别距离较短等因素,很难覆盖较多的实际应用场景。基于双目的活体检测算法,目前主要是通过双目图像估计深度信息,进行人脸活体识别,但是对于3d人脸面具识别效果不好。
技术实现要素:
本申请的主要目的在于提供一种活体检测方法,包括:
获取可见光人脸图像;
根据所述可见光人脸图像生成仿红外人脸图像;
根据所述可见光人脸图及所述仿红外人脸图像分别生成人脸伪深度图像及人脸特征图像;
融合所述人脸伪深度图像的特征及所述人脸特征图像的特征,获得容和特征图像;
根据所述融合特征图像生成检测结果。
可选地,根据所述可见光人脸图像生成仿红外人脸图像包括:
通过gan生成诱导损失函数;
通过所述诱导损失函数及所述可见光人脸图像生成所述仿红外人脸图像。
可选地,其中所述诱导损失函数包括:
与预设的第一训练集中的红外人脸图像基准的拟合;及
与预设的第二训练集中的可见光人脸图像标签的拟合。
可选地,根据所述可见光人脸图及所述仿红外人脸图像分别生成人脸伪深度图像及人脸特征图像包括:
通过反向残差模块及senet模块,采用3x3卷积层,共同组成四个特征提取模块,以提供不同深度和尺度的特征;
根据所述不同深度和尺度的特征生成所述人脸伪深度图像及所述人脸特征图像。
可选地,融合所述人脸伪深度图像的特征及所述人脸特征图像的特征,获得容和特征图像,获得容和特征图像包括:
对所述不同深度和尺度的特征反卷积,并输出与人脸深度图基准相同的尺寸;
连接并融合所述人脸伪深度图像的特征及所述人脸特征图像的特征,获得多尺度语义特征;
可选地,通过gan生成诱导损失函数为:通过gan及预设的人脸图像标签生成所述诱导损失函数。
根据本申请的另一个方面,提供了一种活体检测系统,包括:
获取模块,用于获取可见光人脸图像;
仿红外人脸生成模块,用于根据所述可见光人脸图像生成仿红外人脸图像;
主干网络模块,用于根据所述可见光人脸图及所述仿红外人脸图像分别生成人脸伪深度图像及人脸特征图像;
特征融合模块,用于融合所述人脸伪深度图像的特征及所述人脸特征图像的特征,获得容和特征图像;
输出模块,用于根据所述融合特征图像生成检测结果。
本申请还公开了一种计算机设备,包括存储器、处理器和存储在所述存储器内并能由所述处理器运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述的方法。
本申请还公开了一种计算机可读存储介质,非易失性可读存储介质,其内存储有计算机程序,所述计算机程序在由处理器执行时实现上述任一项所述的方法。
本申请还公开了一种计算机程序产品,包括计算机可读代码,当所述计算机可读代码由计算机设备执行时,导致所述计算机设备执行上述任一项所述的方法。
与现有技术相比,本申请具有如下有益效果:
本技术方案采用端到端的深度学习神经网络的方法,提出gan生成红外人脸技术,为单目活体检测提供可见光和红外两种图像信息特征,模拟双目活体检测架构,实现不同深度的网络层融合特征的提取以及伪深度图的生成,同时提出诱导gan生成真人脸和伪人脸特征的方法,提高活体检测算法效果。
即本申请应用gan技术生成红外人脸数据,与可见光人脸数据一起模拟出双目活体检测输入源,实现双目活体检测,大大提高了单目活体检测精度,真强其泛化能力,加速具体应用场景的落地。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和有益效果变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请一个实施例的活体检测方法的流程示意图;
图2是根据本申请一个实施例的活体检测方法的流程方框示意图;
图3是根据本申请一个实施例的计算机设备的示意图;以及
图4是根据本申请一个实施例的计算机可读存储介质的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
请参照图1,本申请一实施例提供了一种活体检测方法,包括:
s2:获取可见光人脸图像;
s4:根据所述可见光人脸图像生成仿红外人脸图像;
s6:根据所述可见光人脸图及所述仿红外人脸图像分别生成人脸伪深度图像及人脸特征图像;
s8:融合所述人脸伪深度图像的特征及所述人脸特征图像的特征,获得容和特征图像;
s10:根据所述融合特征图像生成检测结果。
在本申请一实施例中,根据所述可见光人脸图像生成仿红外人脸图像包括:
通过gan生成诱导损失函数;
通过所述诱导损失函数及所述可见光人脸图像生成所述仿红外人脸图像。
在本申请一实施例中,其中所述诱导损失函数包括:
与预设的第一训练集中的红外人脸图像基准的拟合;及
与预设的第二训练集中的可见光人脸图像标签的拟合。
在本申请一实施例中,根据所述可见光人脸图及所述仿红外人脸图像分别生成人脸伪深度图像及人脸特征图像包括:
通过反向残差模块及senet模块,采用3x3卷积层,共同组成四个特征提取模块,以提供不同深度和尺度的特征;
根据所述不同深度和尺度的特征生成所述人脸伪深度图像及所述人脸特征图像。
在本申请一实施例中,融合所述人脸伪深度图像的特征及所述人脸特征图像的特征,获得容和特征图像,获得容和特征图像包括:
对所述不同深度和尺度的特征反卷积,并输出与人脸深度图基准相同的尺寸;
连接并融合所述人脸伪深度图像的特征及所述人脸特征图像的特征,获得多尺度语义特征;
在本申请一实施例中,通过gan生成诱导损失函数为:通过gan及预设的人脸图像标签生成所述诱导损失函数。
本申请还提供了一种活体检测系统,包括:
获取模块,用于获取可见光人脸图像;
仿红外人脸生成模块,用于根据所述可见光人脸图像生成仿红外人脸图像;
主干网络模块,用于根据所述可见光人脸图及所述仿红外人脸图像分别生成人脸伪深度图像及人脸特征图像;
特征融合模块,用于融合所述人脸伪深度图像的特征及所述人脸特征图像的特征,获得容和特征图像;
输出模块,用于根据所述融合特征图像生成检测结果。
请参照图2,例如,整个流程框架主要分为两大部分:生成网络和判别网络。
输入为可见光人脸图像,输出为该帧人脸是活体(live)还是攻击的非活体(fake),实现端到端的活体检测。
生成网络主要实现红外人脸图像的生成。输入为可见光人脸图像,输出为生成的红外人脸图像,利用残差模块与反卷积模块实现多尺度、多深度特征的融合。利用诱导函数诱导生成网络生成区分度更明显的live和fake特征的红外人脸图像,提高对光线变化的抗干扰能力,其中诱导损失函数包括两部分:一是与红外人脸图像基准的拟合,该部分在训练过程完成。二是与可见光人脸图像标签(真人1,照片0)的拟合,该部分在训练过程完成。加权实现对生成网络的控制。
判别网络,包含主干网络和输出网络。主干网络采用反向残差模块以及senet(squeeze-and-excitationnetworks)模块,同时采用3x3卷积层,共同组成四个特征提取模块,主要为输出网络提供多尺度特征(输入图像的1/2、1/4、1/8、1/16),包括丰富的浅层特征(如颜色、纹理、线条、轮廓、亮度等特征)和区分度更大的深层特征(即高级语义特征,活体和伪活体的抽象特征)。主干网络主要为输出网络提供多尺度特征,包括丰富的浅层特征和区分度更大的深层特征。输出网络主要实现人脸深度图特征和人脸特征的提取,并进行特征融合和分类。人脸伪深度图生成网络将主干网络中不同深度和尺寸的特征进行反卷积,输出与人脸深度图算法生成的人脸深度图基准相同的尺寸,用于后续辅助loss的回归计算以及特征融合;人脸特征提取网络将主干网络不同层的特征进行连接与融合,得到多尺度丰富的语义特征;特征融合层主要是将人脸特征和人脸伪深度图特征进行融合,输出更为丰富的特征图,用于后续的主loss计算以及为分类网络提供输入特征。
本申请中的主loss函数用来合成融合特征图像的特征以及训练时生成的人脸图像标签,使得仿红外人脸图像越来越逼真。
本申请中所提到的gan为生成式对抗网络(generativeadversarialnetworks)是一种深度学习模型,是近年来复杂分布上无监督学习最具前景的方法之一。模型通过框架中(至少)两个模块:生成模型(generativemodel)和判别模型(discriminativemodel)的互相博弈学习产生相当好的输出。原始gan理论中,并不要求g和d都是神经网络,只需要是能拟合相应生成和判别的函数即可。但实用中一般均使用深度神经网络作为g和d。一个优秀的gan应用需要有良好的训练方法,否则可能由于神经网络模型的自由性而导致输出不理想。
与现有技术相比本申请有如下有益效果:
采用深度学习神经网络的方法,端到端训练,实现可见光、红外双目图像融合特征的提取以及伪深度图的生成技术;
诱导gan生成真人和伪人脸技术,扩大生成的真人脸和伪人脸特征差异性,提高人脸活体检测效果。
请参照图3,本申请还提供了一种计算机设备,包括存储器、处理器和存储在所述存储器内并能由所述处理器运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述的方法。
请参照图4,一种计算机可读存储介质,非易失性可读存储介质,其内存储有计算机程序,所述计算机程序在由处理器执行时实现上述任一项所述的方法。
一种计算机程序产品,包括计算机可读代码,当所述计算机可读代码由计算机设备执行时,导致所述计算机设备执行上述任一项所述的方法。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
1.一种活体检测方法,其特征在于,包括:
获取可见光人脸图像;
根据所述可见光人脸图像生成仿红外人脸图像;
根据所述可见光人脸图及所述仿红外人脸图像分别生成人脸伪深度图像及人脸特征图像;
融合所述人脸伪深度图像的特征及所述人脸特征图像的特征,获得容和特征图像;
根据所述融合特征图像生成检测结果。
2.根据权利要求1所述的活体检测方法,其特征在于,根据所述可见光人脸图像生成仿红外人脸图像包括:
通过gan生成诱导损失函数;
通过所述诱导损失函数及所述可见光人脸图像生成所述仿红外人脸图像。
3.根据权利要求2所述的活体检测方法,其特征在于,其中所述诱导损失函数包括:
与预设的第一训练集中的红外人脸图像基准的拟合;及
与预设的第二训练集中的可见光人脸图像标签的拟合。
4.根据权利要求3所述的活体检测方法,其特征在于,根据所述可见光人脸图及所述仿红外人脸图像分别生成人脸伪深度图像及人脸特征图像包括:
通过反向残差模块及senet模块,采用3x3卷积层,共同组成四个特征提取模块,以提供不同深度和尺度的特征;
根据所述不同深度和尺度的特征生成所述人脸伪深度图像及所述人脸特征图像。
5.根据权利要求4所述的活体检测方法,其特征在于,融合所述人脸伪深度图像的特征及所述人脸特征图像的特征,获得容和特征图像,获得容和特征图像包括:
对所述不同深度和尺度的特征反卷积,并输出与人脸深度图基准相同的尺寸;
连接并融合所述人脸伪深度图像的特征及所述人脸特征图像的特征,获得多尺度语义特征。
6.根据权利要求5所述的活体检测方法,其特征在于,通过gan生成诱导损失函数为:通过gan及预设的人脸图像标签生成所述诱导损失函数。
7.一种活体检测系统,其特征在于,包括:
获取模块,用于获取可见光人脸图像;
仿红外人脸生成模块,用于根据所述可见光人脸图像生成仿红外人脸图像;
主干网络模块,用于根据所述可见光人脸图及所述仿红外人脸图像分别生成人脸伪深度图像及人脸特征图像;
特征融合模块,用于融合所述人脸伪深度图像的特征及所述人脸特征图像的特征,获得容和特征图像;
输出模块,用于根据所述融合特征图像生成检测结果。
8.一种计算机设备,包括存储器、处理器和存储在所述存储器内并能由所述处理器运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-6中任一项所述的方法。
9.一种计算机可读存储介质,非易失性可读存储介质,其内存储有计算机程序,其特征在于,所述计算机程序在由处理器执行时实现如权利要求1-6中任一项所述的方法。
10.一种计算机程序产品,包括计算机可读代码,其特征在于,当所述计算机可读代码由计算机设备执行时,导致所述计算机设备执行权利要求1-6中任一项所述的方法。
技术总结