本申请属于信息识别、防伪鉴别技术领域,尤其涉及一种证件信息鉴别方法、装置及计算机设备。
背景技术:
机动车车证、身份证、学历/资历证等各种证件,是用户身份或资格的重要凭证,证件造假是非常严重的一种欺诈行为,往往会为涉及这些证件的社会活动或经济活动带来风险或导致不良后果。
目前,对于上述的车证等证件,主要采用人工审查方式或ocr(opticalcharacterrecognition,光学字符识别)自动识别方式实现真假鉴别。人工审查是指由工作人员根据工作经验来人为核对证件信息是否虚假,该审查方式效率低下,且受工作人员自身工作经验限制,难以保证一个较高准确度的鉴别结果;ocr自动识别方式,主要是通过自动识别证件编码(如车证编号)是否为真实存在的编码,来判断证件是否真实存在,而对于编码伪造、涂改等类型的造假证件,则没有鉴别能力。
综上,目前的证件信息鉴别方法效率有限,准确度不足,存在较大改进空间,需要一个有效的方法来进行证件信息的真伪鉴别。
技术实现要素:
有鉴于此,本申请提供了一种证件信息鉴别方法、装置及计算机设备,以自动、高效、高准确度地对伪造、涂改等类型的证件信息进行真伪鉴别。
为此,本申请公开如下技术方案:
一种证件信息鉴别方法,包括:
获得证件中目标编码页的图片;
从所述目标编码页的图片中提取目标编码集对应的整体编码区域图片及至少一个单编码对应的至少一个单编码区域图片;所述目标编码集包括至少一个单编码;
提取所述整体编码区域图片的特征,得到目标编码集的全局特征;
提取至少一个单编码区域图片的特征,得到目标编码集的局部特征;
基于所述全局特征和所述局部特征,鉴别所述目标编码集的真伪。
上述方法,优选的,所述获得证件中目标编码页的图片,包括:
获得证件的至少一个页的至少一个图片;
利用第一处理模型从所述至少一个图片中识别出目标编码页的图片,所述目标编码页的图片中包括目标编码集。
上述方法,优选的,所述从所述目标编码页的图片中提取目标编码集对应的整体编码区域图片及至少一个单编码对应的至少一个单编码区域图片,包括:
识别所述目标编码页的图片中目标编码集对应的第一区域;
从所述目标编码页的图片中提取所述第一区域的图片,得到目标编码集的整体编码区域图片;
识别所述整体编码区域图片中各个单编码对应的各个第二区域;
基于识别出的各个第二区域,对所述整体编码区域图片进行切分,得到至少一个单编码对应的至少一个单编码区域图片。
上述方法,优选的,所述提取所述整体编码区域图片的特征,得到目标编码集的全局特征,提取至少一个单编码区域图片的特征,得到目标编码集的局部特征,包括:
将所述整体编码区域图片输入第二处理模型的特征提取层的第一特征提取子网络,得到所述第一特征提取子网络输出的目标编码集的全局特征;
将至少一个单编码区域图片输入第二处理模型的特征提取层的第二特征提取子网络,得到所述第二特征提取子网络输出的目标编码集的局部特征。
上述方法,优选的,所述基于所述全局特征和所述局部特征,鉴别所述目标编码集的真伪,包括:
利用所述第二处理模型中除所述特征提取层之外的其他功能层,对所述全局特征及所述局部特征进行真伪识别处理,得到目标编码集的整体编码的第一识别结果,及至少一个单编码的至少一个第二识别结果;
基于所述第一识别结果和所述至少一个第二识别结果,确定所述目标编码集的真伪。
上述方法,优选的,还包括:
获得鉴别错误的目标编码页的图片;
利用鉴别错误的目标编码页的图片,对所述第二处理模型进行迭代训练,以提升所述第二处理模型的准确率。
一种证件信息鉴别装置,包括:
获取单元,用于获得证件中目标编码页的图片;
第一提取单元,用于从所述目标编码页的图片中提取目标编码集对应的整体编码区域图片及至少一个单编码对应的至少一个单编码区域图片;所述目标编码集包括至少一个单编码;
第二提取单元,用于提取所述整体编码区域图片的特征,得到目标编码集的全局特征;以及提取至少一个单编码区域图片的特征,得到目标编码集的局部特征;
鉴别单元,用于基于所述全局特征和所述局部特征,鉴别所述目标编码集的真伪。
上述装置,优选的,所述第一提取单元,具体用于:
识别所述目标编码页的图片中目标编码集对应的第一区域;
从所述目标编码页的图片中提取所述第一区域的图片,得到目标编码集的整体编码区域图片;
识别所述整体编码区域图片中各个单编码对应的各个第二区域;
基于识别出的各个第二区域,对所述整体编码区域图片进行切分,得到至少一个单编码对应的至少一个单编码区域图片。
上述装置,优选的,所述第二提取单元,具体用于:
将所述整体编码区域图片输入第二处理模型的特征提取层的第一特征提取子网络,得到所述第一特征提取子网络输出的目标编码集的全局特征;
将至少一个单编码区域图片输入第二处理模型的特征提取层的第二特征提取子网络,得到所述第二特征提取子网络输出的目标编码集的局部特征;
所述鉴别单元,具体用于:
利用所述第二处理模型中除所述特征提取层之外的其他功能层,对所述全局特征及所述局部特征进行真伪识别处理,得到目标编码集的整体编码的第一识别结果,及至少一个单编码的至少一个第二识别结果;
基于所述第一识别结果和所述至少一个第二识别结果,确定所述目标编码集的真伪。
一种计算机设备,包括:
存储器,用于至少存储一组指令集;
处理器,用于调用并执行所述存储器中的所述指令集,通过执行所述指令集执行如上任一项所述的证件信息鉴别方法。
由以上方案可知,本申请提供的证件信息鉴别方法,在对证件中的目标编码集(如车证编号)进行真伪鉴别时,从目标编码页的图片中提取目标编码集对应的整体编码区域图片,以及目标编码集包括的至少一个单编码的单编码区域图片,之后,进一步对整体编码区域图片及单编码区域图片进行特征提取,分别得到目标编码集的全局特征及局部特征,并结合目标编码集的全局特征及局部特征来鉴别目标编码集的真伪,以此实现对造假证件的识别。本申请中,基于证件中目标编码集的特征,可实现自动、高效地识别出编码伪造、涂改等类型的造假证件,另外,综合编码集的全局及局部等不同维度的特征进行真伪鉴别,还可以进一步提升造假证件信息的识别准确度。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1是本申请实施例提供的证件信息鉴别方法的一种流程示意图;
图2是本申请实施例提供的证件信息鉴别方法的另一种流程示意图;
图3是本申请实施例提供的从证件的至少一个图片中识别目标编码页的图片的示意图;
图4是本申请实施例提供的从车证信息页中识别出车证编号对应的整体编码区域的示例图;
图5是本申请实施例提供的从整体编码区域图片中切分出各个单编码区域图片的示例图;
图6是本申请实施例提供的multi-densenet模型的结构图;
图7是本申请实施例提供的基于相应判定策略确定目标编码集的真伪的处理过程示例图;
图8是本申请实施例提供的证件信息鉴别方法的又一种流程示意图;
图9是本申请实施例提供的证件信息鉴别装置的一种结构示意图;
图10是本申请实施例提供的证件信息鉴别装置的另一种结构示意图;
图11是本申请实施例提供的计算机设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请提供了一种证件信息鉴别方法、装置及计算机设备,目的在于自动、高效、高准确度地鉴别出编码伪造、涂改等类型的造假证件。现实中证件造假行为/造假类型有很多种,本申请实施例主要针对其中最为常见、影响最为严重的证件编码(如车证编号)造假行为进行识别。以下将通过多个实施例对本申请的证件信息鉴别方法、装置及计算机设备进行说明。
在本申请一可选实施例中,公开了一种证件信息鉴别方法,该方法可应用于计算机设备中,所述计算机设备可以是但不限于手机、平板电脑、个人数字助理、手持扫描终端等便携式终端,或者还可以是通用/专用计算或配置环境中的便携式计算机(如笔记本)、台式计算机或大中型计算机、甚至服务器等设备。
参阅图1,为本实施例提供的证件信息鉴别方法的一种流程示意图,本实施例中,该证件信息鉴别方法包括:
步骤101、获得证件中目标编码页的图片。
上述的证件,可以是但不限于车证、身份证、学历/资历证等任意类型的证件。目标编码页,则可以是上述证件中具有车证编号、身份证号或学历证书编号等证件编码(这里,称之为目标编码集)的信息页。
本申请实施例中,将主要以对车证编号这一典型目标编码集的真伪(伪造、涂改等造假行为)进行鉴别为例,来对本申请的证件信息鉴别方法进行介绍。
当需要对车证编号等证件信息进行真伪鉴别时,可首先基于拍照、复印或扫描等技术获得当前待识别证件的至少一张信息页所对应的至少一个图片,并基于相应信息识别技术,如ocr(opticalcharacterrecognition,光学字符识别)等,从证件的至少一个图片中识别出具备车证编号等目标编码集的目标编码页,为车证编号等目标编码集的真伪鉴别做好准备。
步骤102、从所述目标编码页的图片中提取目标编码集对应的整体编码区域图片及至少一个单编码对应的至少一个单编码区域图片。
容易理解的是,车证编号等目标编码集包括至少一个单编码,所包括的单编码可以是但不限于数字、字母或其他特殊字符。
车证编号等目标编码集作为一个整体,其具备全局特征(整体特征),而目标编码集中的各个单编码又具备单编码自身特征,可构成目标编码集的局部特征,为了准确地鉴别车证编号等目标编码集的真伪,有效对证件信息的伪造、涂改等造假行为进行识别,本申请提出了结合目标编码集的全局特征及局部特征对目标编码集进行真伪鉴别的技术思路。
基于该思路,在获得证件中目标编码页的图片后,可进一步从目标编码页的图片中裁剪出目标编码集对应的整体编码区域图片,以用于目标编码集全局特征的提取,以及切割出至少一个单编码对应的至少一个单编码区域图片,以用于目标编码集局部特征的提取。
步骤103、提取所述整体编码区域图片的特征,得到目标编码集的全局特征。
步骤104、提取至少一个单编码区域图片的特征,得到目标编码集的局部特征。
发明人经研究发现,对于造假的证件来说,一方面,假证件的车证编号等目标编码集,在整体画质、字符间距、数字排列形状等特征上都会与真正的车证有所不同,本实施例将目标编码集的画质、字符间距和/或数字排列形状等特征,作为目标编码集的全局特征(整体特征);另一方面,假证件在单编码的印刷、绘制细节上往往会与真正证件的编码存在不一致之处,如假证件的编码字体、字号、风格(笔画粗细,如是否加粗)等可能与真正证件的编码存在细微差异,又例如,假证件可能会在某些字符的下面多出来/少绘制一个/一些短横线等,本实施例将上述细节特征中的任一种或多种作为目标编码集的局部特征。
实施中,可通过从目标编码集对应的整体编码区域图片中,提取上述的画质、字符间距和/或数字排列形状等特征,得到目标编码集的全局特征。相对应地,从各个单编码对应的单编码区域图片中提取字体、字号、风格(笔画粗细,如是否加粗)和/或特殊附加/缺省符号(如下划线)等特征,得到目标编码集的局部特征。
步骤105、基于上述的全局特征和局部特征,鉴别目标编码集的真伪。
在提取得到待识别证件的目标编码集的全局特征和局部特征后,进一步结合目标编码集的全部特征和局部特征,鉴别目标编码集的真伪,确定其是否存在伪造、涂改等造假行为。
其中,作为一种可选的实现方式,可基于特征匹配手段进行目标编码集的真伪鉴别,在该方式中,预先提取并存储真正证件的目标编码集(如车证编号)的全局特征和局部特征,将其视为基准特征,以提供特征匹配的依据,后续通过将待识别证件的目标编码集的全局特征与预置的全局基准特征进行匹配,将待识别证件的目标编码集的局部特征与预置的局部基准特征进行匹配,来鉴别目标编码集的真伪。
作为另一种可选的实现方式,还可以预先基于批量的真假证件样本,训练一识别模型,并利用预先训练的模型进行目标编码集的全局特征和局部特征提取以及特征提取基础上的真伪鉴别。本实施例在此不对鉴别目标编码集的真伪的实现方式进行限制。
由以上方案可知,本实施例提供的证件信息鉴别方法,在对证件中的目标编码集(如车证编号)进行真伪鉴别时,从目标编码页的图片中提取目标编码集对应的整体编码区域图片,以及目标编码集包括的至少一个单编码的单编码区域图片,之后,进一步对整体编码区域图片及单编码区域图片进行特征提取,分别得到目标编码集的全局特征及局部特征,并结合目标编码集的全局特征及局部特征来鉴别目标编码集的真伪,以此实现对造假证件的识别。基于证件中目标编码集的特征,可实现自动、高效地识别出编码伪造、涂改等类型的造假证件,另外,综合编码集的全局及局部等不同维度的特征进行真伪鉴别,还可以进一步提升造假证件信息的识别准确度。
在本申请接下来的一实施例中,提供所述证件信息鉴别方法的一细化处理过程,如图2所示,该证件信息鉴别方法可进一步通过以下的处理过程实现:
步骤201、获得证件的至少一个页的至少一个图片。
可通过拍照、复印或扫描等手段,获得待识别证件的至少一个页对应的至少一个图片;其中,可选地,每一页对应一个图片,或者,也可以有选择性地仅拍照部分页,得到部分页对应的图片。
步骤202、利用第一处理模型从所述至少一个图片中识别出目标编码页的图片,所述目标编码页的图片中包括目标编码集。
在获得待识别证件的至少一个页的至少一个图片后,如图3所示,从证件的至少一个图片中识别出具备车证编号等目标编码集的目标编码页,为车证编号等目标编码集的真伪鉴别做好准备。
本实施例中,对于目标编码页的识别,预先训练了第一处理模型,该第一处理模型可以是但不限于densenet模型。
实施中,以对车证编号进行真伪鉴别为例,可将大量车证的不同页的照片作为输入进行模型训练,模型的输出为照片所对应页码的类型/类别信息(如,是否为“目标编码页”、或者属于“目标编码页”/“非目标编码页”的置信度等),也即,实际实施中,可将目标编码页的识别问题抽象化为一个多分类问题。
本实施例中,在进行第一处理模型的训练时,优先采用densenet模型,其中,densenet是一种稠密卷积神经网络(denseconvolutionalnetwork),它可以让每一层节点都接受前面所有层的输出,这相应可以使其具有传统卷积网络不具备的以下优势:解决梯度消失问题,加强特征传播,鼓励特征复用,减少计算量等;经发明人验证,将densenet模型应用于本申请中的目标编码页图片的识别,准确度可以达到99%。
步骤203、识别所述目标编码页的图片中目标编码集对应的第一区域。
可以但不限于采用ocr等技术先从目标编码页的图片中识别出目标编码集如车证编号所对应的整体编码区域,这里将该整体编码区域称为第一区域,参阅图4,提供了从车证信息页中识别出车证编号对应的整体编码区域的示例图。
实际应用中,在进行车证编号的整体编码区域的识别时,车主提供的图片通常是多样化的,比如有拍照所得的彩色照片,有复印照片,有翻拍照片,有扫描文件等等,而且图片的背景内容也是非常杂乱多样的。这些不确定的扰乱因素会大大降低识别准确率,因此,本实施例在使用ocr技术进行整体编码区域识别之前,预先对图片进行了一些预处理,以尽可能降低这些扰乱因素对识别准确率的不利影响。其中,所进行的预处理包括但不限于以下的任意一种或多种:加灰、二值化、膨胀、hsv(hue-saturation-value,色调-饱和度-明度)提取、筛选区域块等。
上述的图片预处理操作可以借助opencv库完成,实验证明,未进行预处理的图片ocr识别准确率为68%,加上预处理之后准确率可以达到95%以上。
步骤204、从所述目标编码页的图片中提取所述第一区域的图片,得到目标编码集的整体编码区域图片。
之后,可进一步基于抠图、图片裁剪等技术,从目标编码页的图片中提取出目标编码集对应的整体编码区域,即提取出所述第一区域,得到目标编码集对应的整体编码区域图片。
步骤205、识别所述整体编码区域图片中各个单编码对应的各个第二区域。
步骤206、基于识别出的各个第二区域,对所述整体编码区域图片进行切分,得到至少一个单编码对应的至少一个单编码区域图片。
识别出目标编码集的第一区域,并提取得到相应的整体编码区域图片后,为了更加精确的对车证编号等目标编码集的单编码的局部特征(如字体、字号、风格)进行确定,可以针对该整体编码区域图片,进一步识别并切分出单个字符(单编码)。
此过程依然使用的是ocr文字识别技术,即具体基于ocr技术识别出每个单编码的坐标,确定出每个单编码对应的第二区域,进而切分出若干个单编码区域图片,以作为后续目标编码集的局部特征提取的基础,具体可参阅图5所示,图5中,在对目标编码集为“320702207203”的整体编码区域图片进行单编码识别及切分后,具体可得到“3”、“2”、“0”…等一系列单编码的对应的单编码区域图片。
需要说明的是,图5的示例中,虽然示出了从整体编码区域图片中识别并切分出所有的单编码,但这仅作为本申请的一优选实施方式,具体实施中可以并不以此为限,可以结合实际的处理复杂度需求、鉴别性能需求,仅选择性地从整体编码区域图片中切分出超出数量阈值(而非全部)的单编码图片,来用作局部特征提取,本实施例对此不加限制。
步骤207、将所述整体编码区域图片输入第二处理模型的特征提取层的第一特征提取子网络,得到所述第一特征提取子网络输出的目标编码集的全局特征。
在提取得到待识别证件的目标编码集的全局特征和局部特征后,进一步结合目标编码集的全部特征和局部特征,鉴别目标编码集的真伪,确定其是否存在伪造、涂改等造假行为。
本实施例中,对于目标编码集的真伪鉴别,预先训练了第二处理模型,该第二处理模型同样可以是但不限于densenet模型。
传统的densenet模型包括一特征提取层,通过将待识别图片输入densenet模型的特征提取层,使得由特征提取层提取相应图片特征,之后,则进一步基于提取的图片特征实现对图片进行所需的分类处理。
本申请实施例中,为了更加精确的对车证编号等目标编码集进行真伪鉴别,对传统的densenet模型进行了改进,将其特征提取层改进为两个子网络结构,具体地,如图6所示,改进后的特征提取层包括用于全局特征提取的第一特征提取子网络以及用于局部特征提取的第二特征提取子网络(传统densenet模型的特征提取层为一个整体,未加细分)。本申请实施例中,将提出的该前端特征提取层由两个子网络构成的densenet模型称为multi-densenet模型。
其中,参阅图6,用于进行全局特征(整体特征)提取的所述第一特征提取子网络,可以由连接层、池化层和denseblock(稠密块)层组成。
除了包括具有两个特征提取子网络的特征提取层之外,本申请中的multi-densenet模型还包括若干个连接层及若干个denseblock层。其中,连接层的作用主要为特征融合和降维取样,denseblock层里有多层卷积网络,用来提取图片中的抽象特征,denseblock层的每层卷积网络的输入都包含了前面所有层卷积网络的输出。
基于本申请实施例提出的上述multi-densenet模型,可将目标编码集对应的整体编码区域图片,如图5中目标编码集为“320702207203”的整体编码区域图片,作为第二处理模型的特征提取层的第一特征提取子网络的输入,输入至该第一特征提取子网络,相应得到第一特征提取子网络输出的目标编码集的全局特征,如目标编码集在画质、字符间距、数字排列形状等方面的特征等。
具体实施中,第一特征提取子网络在对目标编码集的整体编码区域图片进行特征提取处理后,所得的目标编码集的全局特征/整体特征会进一步作为与特征提取层相连接的下一功能层的输入,如图6所示,会将提取的目标编码集的全局特征/整体特征继续输入与第一特征提取子网络相连接的连接层。
步骤208、将至少一个单编码区域图片输入第二处理模型的特征提取层的第二特征提取子网络,得到所述第二特征提取子网络输出的目标编码集的局部特征。
相对应地,将各个单编码对应的各个单编码区域图片,如图5中“3”、“2”、“0”…等一系列单编码对应的一系列单编码区域图片,作为第二处理模型的特征提取层的第二特征提取子网络的输入,输入至该第二特征提取子网络,相应可得到第二特征提取子网络输出的目标编码集的局部特征,如目标编码集的单编码在字体、字号、风格(笔画粗细,如是否加粗)和/或特殊附加/省略符号(如下划线)等方面的特征等。
相类似地,第二特征提取子网络在对目标编码集的单编码区域图片进行特征提取处理后,所得的单编码的局部特征会进一步作为与特征提取层相连接的下一功能层的输入,如图6所示,会将提取的局部特征继续输入与第二特征提取子网络相连接的连接层。
由此,输入网络的总体特征可以表示为:
f=h(hall(xall),hpart(xpart))),其中,f为进入网络的所有特征,xall、xpart,分别指全局特征、局部特征,h为变换函数(对应于一组或两组batch-normalization,relu和convolution的操作),hall指的是针对于全局特征的变换函数,hpart指的是针对于局部特征的变换函数。
步骤209、利用所述第二处理模型中除所述特征提取层之外的其他功能层,对所述全局特征及局部特征进行真伪识别处理,得到目标编码集的整体编码的第一识别结果,及至少一个单编码的至少一个第二识别结果。
具体地,如图6所示,在利用本申请实施例的第二处理模型即上述的multi-densenet模型提取得到目标编码集的全局特征及局部特征后,可继续利用multi-densenet模型的至少一个连接层及至少一个denseblock层,对提取的全局特征及局部特征进行真伪鉴别处理。
对应于multi-densenet模型的两部分的输入,模型的输出也可以分为两部分,即对应于目标编码集的整体编码的第一识别结果,以及对应于各个单编码的各个第二识别结果。
其中,第一识别结果、第二识别结果,可以是针对相应待识别对象(如整体编码、单编码)给出的一个类别结果,如给出0类别结果或1类别结果等,这里可选地,可以假设0类别表示待识别对象为真正车证编号、1类别表示待识别对象为经伪造、涂改等造假行为所得的非真正车证编号;或者,第一识别结果、第二识别结果,还可以是针对相应待识别对象(如整体编码、单编码),给出的其属于某个类别的置信度,如给出待识别对象属于0类别的置信度为10%,属于1类别的置信度为90%等,后续可基于预置的识别策略识别出待识别对象所属的类别,如,根据属于1类别的置信度90%超出设定的置信度阈值60%,判定出待识别对象所属的类别为1等。
步骤210、基于所述第一识别结果和所述至少一个第二识别结果,确定所述目标编码集的真伪。
最终,可结合目标编码集的整体编码对应的第一识别结果以及各个单编码对应的各个第二识别结果,并基于预置的识别策略,确定目标编码集的真伪。
可选地,可以在目标编码集的整体编码对应的第一识别结果表示目标编码集为假,和/或单编码对应的第二识别结果表示单编码为假的数目超过设定数值(如3个)时,判定目标编码集为假,相应地,待识别证件则为造假证件,参阅图7,提供了一基于相应判定策略确定目标编码集是否为造假证件编码集的处理过程示例,当然,实际应用中,还可以采用其他的判定策略,如只要存在一个单编码被识别为假,即直接判定目标编码集为假等,这里不再一一举例。
本实施例中,通过提出前端特征提取层具有两个子网络的multi-densenet模型,并将其应用于证件编码的真伪识别中,既可以保留证件图片中证件编码的整体特征也可以得到证件编码中各个单编码的细节特征,从而可以高准确度地识别出假的证件编码,能准确有效地鉴别车证等证件的造假行为。
在本申请一可选实施例中,参阅图8示出的证件信息鉴别方法的流程示意图,该证件信息鉴别方法还可以包括以下处理:
步骤211、获得鉴别错误的目标编码页的图片;
步骤212、利用鉴别错误的目标编码页的图片,对所述第二处理模型进行迭代训练,以提升所述第二处理模型的准确率。
为了提高第二处理模型的模型准确率,本实施例中,对判定失误的目标编码页的图片进行收集,并将其作为输入信息对第二处理模型(如上述的multi-densenet模型)进行迭代训练,以针对性地提高第二处理模型对证件信息的鉴别准确率。
对应于上述的证件信息鉴别方法,本申请实施例还提供了一种证件信息鉴别装置,参阅图9示出的证件信息鉴别装置的结构示意图,该证件信息鉴别装置可以包括:
获取单元901,用于获得证件中目标编码页的图片;
第一提取单元902,用于从所述目标编码页的图片中提取目标编码集对应的整体编码区域图片及至少一个单编码对应的至少一个单编码区域图片;所述目标编码集包括至少一个单编码;
第二提取单元903,用于提取所述整体编码区域图片的特征,得到目标编码集的全局特征;以及提取至少一个单编码区域图片的特征,得到目标编码集的局部特征;
鉴别单元904,用于基于所述全局特征和所述局部特征,鉴别所述目标编码集的真伪。
在本申请实施例的一可选实施方式中,获取单元901,具体用于:获得证件的至少一个页的至少一个图片;利用第一处理模型从所述至少一个图片中识别出目标编码页的图片,所述目标编码页的图片中包括目标编码集。
在本申请实施例的一可选实施方式中,第一提取单元902,具体用于:识别所述目标编码页的图片中目标编码集对应的第一区域;从所述目标编码页的图片中提取所述第一区域的图片,得到目标编码集的整体编码区域图片;识别所述整体编码区域图片中各个单编码对应的各个第二区域;基于识别出的各个第二区域,对所述整体编码区域图片进行切分,得到至少一个单编码对应的至少一个单编码区域图片。
在本申请实施例的一可选实施方式中,第二提取单元903,具体用于:将所述整体编码区域图片输入第二处理模型的特征提取层的第一特征提取子网络,得到所述第一特征提取子网络输出的目标编码集的全局特征;将至少一个单编码区域图片输入第二处理模型的特征提取层的第二特征提取子网络,得到所述第二特征提取子网络输出的目标编码集的局部特征;
鉴别单元904,具体用于:利用所述第二处理模型中除所述特征提取层之外的其他功能层,对所述全局特征及局部特征进行真伪识别处理,得到目标编码集的整体编码的第一识别结果,及至少一个单编码的至少一个第二识别结果;基于所述第一识别结果和所述至少一个第二识别结果,确定所述目标编码集的真伪。
在本申请实施例的一可选实施方式中,参阅图10,该证件信息鉴别装置还可以包括:
反馈单元905,用于获得鉴别错误的目标编码页的图片;并利用鉴别错误的目标编码页的图片,对所述第二处理模型进行迭代训练,以提升所述第二处理模型的准确率。
与本申请的证件信息鉴别方法相对应,本申请实施例的证件信息鉴别装置,同样可应用于但不限于上文所列举的任意类型的计算机设备中。
对于本申请实施例公开的证件信息鉴别装置而言,由于其与以上各实施例公开的证件信息鉴别方法相对应,所以描述的比较简单,相关相似之处请参见以上各实施例中证件信息鉴别方法部分的说明即可,此处不再详述。
与上述的证件信息鉴别方法及装置相对应,本申请实施例还公开了一种计算机设备,该计算机设备可以是但不限于上文所列举的任意类型的计算机设备,如图11所示,该计算机设备至少包括:
存储器1101,用于至少存储一组指令集;
处理器1102,用于调用并执行所述存储器中的所述指令集,通过执行所述指令集执行如以上任一实施例所示的证件信息鉴别方法的处理过程,或任一实施例所示的证件信息鉴别装置的功能。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
为了描述的方便,描述以上系统或装置时以功能分为各种模块或单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
最后,还需要说明的是,在本文中,诸如第一、第二、第三和第四等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
1.一种证件信息鉴别方法,其特征在于,包括:
获得证件中目标编码页的图片;
从所述目标编码页的图片中提取目标编码集对应的整体编码区域图片及至少一个单编码对应的至少一个单编码区域图片;所述目标编码集包括至少一个单编码;
提取所述整体编码区域图片的特征,得到目标编码集的全局特征;
提取至少一个单编码区域图片的特征,得到目标编码集的局部特征;
基于所述全局特征和所述局部特征,鉴别所述目标编码集的真伪。
2.根据权利要求1所述的方法,其特征在于,所述获得证件中目标编码页的图片,包括:
获得证件的至少一个页的至少一个图片;
利用第一处理模型从所述至少一个图片中识别出目标编码页的图片,所述目标编码页的图片中包括目标编码集。
3.根据权利要求1所述的方法,其特征在于,所述从所述目标编码页的图片中提取目标编码集对应的整体编码区域图片及至少一个单编码对应的至少一个单编码区域图片,包括:
识别所述目标编码页的图片中目标编码集对应的第一区域;
从所述目标编码页的图片中提取所述第一区域的图片,得到目标编码集的整体编码区域图片;
识别所述整体编码区域图片中各个单编码对应的各个第二区域;
基于识别出的各个第二区域,对所述整体编码区域图片进行切分,得到至少一个单编码对应的至少一个单编码区域图片。
4.根据权利要求1所述的方法,其特征在于,所述提取所述整体编码区域图片的特征,得到目标编码集的全局特征,提取至少一个单编码区域图片的特征,得到目标编码集的局部特征,包括:
将所述整体编码区域图片输入第二处理模型的特征提取层的第一特征提取子网络,得到所述第一特征提取子网络输出的目标编码集的全局特征;
将至少一个单编码区域图片输入第二处理模型的特征提取层的第二特征提取子网络,得到所述第二特征提取子网络输出的目标编码集的局部特征。
5.根据权利要求4所述的方法,其特征在于,所述基于所述全局特征和所述局部特征,鉴别所述目标编码集的真伪,包括:
利用所述第二处理模型中除所述特征提取层之外的其他功能层,对所述全局特征及所述局部特征进行真伪识别处理,得到目标编码集的整体编码的第一识别结果,及至少一个单编码的至少一个第二识别结果;
基于所述第一识别结果和所述至少一个第二识别结果,确定所述目标编码集的真伪。
6.根据权利要求4所述的方法,其特征在于,还包括:
获得鉴别错误的目标编码页的图片;
利用鉴别错误的目标编码页的图片,对所述第二处理模型进行迭代训练,以提升所述第二处理模型的准确率。
7.一种证件信息鉴别装置,其特征在于,包括:
获取单元,用于获得证件中目标编码页的图片;
第一提取单元,用于从所述目标编码页的图片中提取目标编码集对应的整体编码区域图片及至少一个单编码对应的至少一个单编码区域图片;所述目标编码集包括至少一个单编码;
第二提取单元,用于提取所述整体编码区域图片的特征,得到目标编码集的全局特征;以及提取至少一个单编码区域图片的特征,得到目标编码集的局部特征;
鉴别单元,用于基于所述全局特征和所述局部特征,鉴别所述目标编码集的真伪。
8.根据权利要求7所述的装置,其特征在于,所述第一提取单元,具体用于:
识别所述目标编码页的图片中目标编码集对应的第一区域;
从所述目标编码页的图片中提取所述第一区域的图片,得到目标编码集的整体编码区域图片;
识别所述整体编码区域图片中各个单编码对应的各个第二区域;
基于识别出的各个第二区域,对所述整体编码区域图片进行切分,得到至少一个单编码对应的至少一个单编码区域图片。
9.根据权利要求7所述的装置,其特征在于,所述第二提取单元,具体用于:
将所述整体编码区域图片输入第二处理模型的特征提取层的第一特征提取子网络,得到所述第一特征提取子网络输出的目标编码集的全局特征;
将至少一个单编码区域图片输入第二处理模型的特征提取层的第二特征提取子网络,得到所述第二特征提取子网络输出的目标编码集的局部特征;
所述鉴别单元,具体用于:
利用所述第二处理模型中除所述特征提取层之外的其他功能层,对所述全局特征及所述局部特征进行真伪识别处理,得到目标编码集的整体编码的第一识别结果,及至少一个单编码的至少一个第二识别结果;
基于所述第一识别结果和所述至少一个第二识别结果,确定所述目标编码集的真伪。
10.一种计算机设备,其特征在于,包括:
存储器,用于至少存储一组指令集;
处理器,用于调用并执行所述存储器中的所述指令集,通过执行所述指令集执行如权利要求1-6任一项所述的证件信息鉴别方法。
技术总结