本发明涉及信息安全领域,具体涉及在线笔迹认证中一种笔画动态特征的提取及认证方法。
背景技术:
在线笔迹认证是指利用专门输入设备在线获取用户的手写笔迹,经比较其中所蕰涵的个性化特征从而实现用户身份鉴别的一项技术。计算机和电子技术的发展使得人们能够获取除字形图像这样常见的静态信息,还能获取书写过程中产生的速度、用力等动态信息。对摹仿者而言摹仿上述两种信息达到神形皆备是非常困难的,往往会顾此失彼。因此,在线笔迹认证受到广泛关注。
通常人们以整个笔迹作为特征提取对象来提取各种动态特征,例如采用各种变换计算频域特征,计算各种极值、均值、方差这种时域上统计特征,采用动态规划方法度量各种差异值特征等。以整个笔迹作为对象提取特征面临的最大问题是局部显著的差异被平滑了,即局部笔画间显著的差异,当被置于整体之中时不再显著或完全消失,例如某个局部笔画的差异经全局求和再平均后就消失了,导致笔画中那些细小的具有高度个性化的特征提取不出来。解决该问题的方法是以笔画为对象来提取特征,但这样又面临笔迹分割、笔画匹配、笔画类型识别等一系列难题。
技术实现要素:
本发明的目的就是针对上述技术的不足,提供在线笔迹认证中一种笔画动态特征的提取及认证方法,进一步依据特征的稳定性和特殊性估算所提取笔画动态特征的鉴别价值,选取具有高鉴别价值的笔画动态特征进行认证,新方法有助于识别出那些存在于局部具有高鉴别价值的笔画书写动作和习惯,为提升笔迹认证性能打下基础。
为实现上述目的,本发明所设计的在线笔迹认证中一种笔画动态特征的提取及认证方法,包括如下步骤:
a)手写笔迹笔画书写动态特征预学习:收集人群关于标准汉字c的手写笔迹样本,识别所有手写笔迹样本中的笔画类型,以手写笔迹样本中的笔画类型,提取所有具有相同笔画类型的各种笔画书写动态特征,包括笔画书写用力、书写速度的波形类型,书写用力波形和书写速度波形在波峰、波谷以及在x、y方向上增量的最大、最小值、均值和方差,笔画书写耗时,书写用力和书写速度的截断频域特征,再对所提取的笔画书写动态特征中的离散型笔画特征,包括笔画类型、书写速度的波形类型,统计离散型笔画特征在人群中的分布律,对所提取的连续型笔画特征,包括波峰、波谷的最大、最小值,估算连续笔画型特征在人群中出现的联合概率密度函数;
书写动态特征是指手写设备采集到的书写过程中产生的动作笔画特征,包括书写用力和书写速度,所述笔画书写动态特征是以笔画为单位提取的书写动态特征;
手写笔迹是指通过专用的数据传感设备实时采集书写过程中笔尖运动产生的各种信息所获得的与时间相关的时序信号序列,数据传感设备在每个采样时刻采集的数据包括笔尖的二维位置信息、笔尖施加在书定平面上的压力、笔杆与书写平面的转动角及夹角信息;
所述标准汉字c的手写笔迹样本是指书写人手写的可被其他人正确辩识的或只能被少数人辩识的或只能被书写者自己辩识为标准汉字c的非标准手写体笔迹,所谓辩识是指建立手写体笔迹与标准汉字之间的对应关系;
所述识别手写笔迹样本中的笔画类型是指建立手写笔迹样本中笔画与标准汉字中笔画的对应关系;
所述标准汉字c是目前已被广泛使用的具有标准书写样式和表现形式的汉字;
b)手写笔迹笔画书写动态特征注册:注册用户书写并提交关于标准汉字c的若干注册手写笔迹样本,组成注册手写笔迹样本集合,采用与手写笔迹笔画书写动态特征预学习阶段相同的方法,识别所有注册手写笔迹样本中的笔画类型,按注册手写笔迹样本中的笔画类型,提取所有具有相同笔画类型的各种笔画书写动态特征,所述笔画书写动态特征与在手写笔迹笔画书写动态特征预学习阶段所提取的笔画书写动态特征种类相同,统计笔画书写动态特征中各种离散型笔画特征在所有注册手写笔迹样本集合中出现和未出现的次数,统计笔画书写动态特征中各种连续型笔画特征在注册手写笔迹样本集合中的最大、最小值;
所述注册手写笔迹样本是指在注册阶段注册用户书写并提交的用户身份已知的手写笔迹,所述用户身份已知是指手写笔迹书写者的身份是已知的;
c)笔画书写动态特征认证:待认证用户提交一个关于标准汉字c的测试手写笔迹样本,采用与手写笔迹笔画书写动态特征预学习阶段相同的方法,识别测试手写笔迹样本中的笔画类型,按测试手写笔迹样本中的笔画类型,提取所有具有相同笔画类型的各种笔画书写动态特征,找出注册手写笔迹样本中稳定且一致的各种笔画书写动态特征,依据在手写笔迹笔画书写动态特征预学习阶段计算得到的标准汉字c所有各种笔画书写动态特征在人群中的统计数据,计算观测到测试手写笔迹样本与注册手写笔迹样本中所有稳定且一致的各种笔画书写动态特征的概率,依据计算得到的所述概率,结合其它笔画特征,包括笔画布局、笔顺、书写节奏,综合判断测试手写笔迹样本是否为真实笔迹;
所述稳定且一致笔画书写动态特征包括离散型稳定且一致笔画书写动态特征和连续型稳定且一致笔画书写动态特征;各种所述笔画书写动态特征在人群中的统计数据包括离散型笔画特征的分布律和连续型笔画特征的联合概率密度函数;
所述离散型稳定且一致笔画书写动态特征是指,在测试手写笔迹样本中提取的离散型笔画书写动态特征取值与在注册手写笔迹样本集合中提取的稳定的离散型笔画书写动态特征取值是相同的,所述稳定的离散型笔画书写动态特征是指具有相同离散型笔画书写动态特征的特征取值在注册手写笔迹样本集合上出现次数大于一定阈值;
所述连续型稳定且一致笔画书写动态特征是指,在测试手写笔迹样本中提取的连续型笔画书写动态特征取值处于在注册手写笔迹样本集合上提取的稳定的连续型笔画书写动态特征取值的最大最小值之间,所述稳定的连续型笔画书写动态特征是指在注册手写笔迹样本集合上提取的连续型笔画书写动态特征取值的最大最小值之间的距离小于一定阈值;
所述测试手写笔迹样本是指在认证阶段待认证用户书写并提交的用户身份未知且有待确认的手写笔迹,所述用户身份未知是指还未确认书写手写笔迹的用户身份与模板笔迹的用户身份是否相一致,有待进一步确认;
所述待认证用户是指真实身份未得到确认的用户。
优选地,所述步骤a)中,手写笔迹笔画书写动态特征预学习包括如下步骤:
a1)预学习开始:设s={s1,s2,...,sn}表示海量的足够多书写者手写的关于标准汉字c的手写笔迹样本集合,每位书写者提供了1至3个样本,n表示集合s中包含的笔迹个数,设t={t1,t2,...,to}表示标准汉字c包含的所有笔画集合,o表示标准汉字c包含的笔画数;所述足够多是指集合s中的手写笔迹样本所包含的动态特征具有广泛的代表性,涵盖了手写汉字c各种动态特征在人群中所有可能的变化;所述标准汉字是目前已被广泛使用的具有标准书写样式和表现形式的汉字;
a2)初始化:初始化循环变量i=1,初始化人群书写的关于标准汉字c的手写笔迹中被识别为tj笔画类型的计数变量
a3)识别第i个手写笔迹样本si中的笔画类型:识别笔迹
a4)初始化j=1;
a5)笔画特征提取;提取手写笔迹样本si中与第j段被识别笔画类型tj对应的笔画书写速度和用力特征,以笔迹si∈s中被识别为tj的笔画
a6)更新笔画类型计数变量:根据手写笔迹样本si中笔画的被识别笔画类型tj∈t,将计数变量
a7)更新笔画书写用力和实现书写速度波形类型计数变量:设特征向量
a8)将笔画书写用力和书写速度波形特征数据放到相应的集合中:对从第i个手写笔迹样本被识别为tj笔画类型的笔画中提取的书写速度和书写用力特征向量
a9)j=j 1,若j≤xi,则跳转至步骤a5),提取下一段笔画书写用力和书写速度特征,并更新相关的统计变量,否则,跳转至步骤a10);
a10)i=i 1,若i≤n,则跳转至步骤a3),识别下一个手写笔迹样本类型,否则,跳转至步骤a11);
a11)统计各种笔画类型在人群中的分布律:计算人群书写的关于标准汉字c的手写笔迹中被识别为tj笔画类型的分布律
a12)统计各种笔画类型的书写用力和书写速度波型类型在人群中的分布律:计算人群书写的所有关于标准汉字c的手写笔迹中被识别为tj类型的笔画中,所述笔画的书写用力和书写速度波形类型分别为fa和la的分布律
a13)估算各种笔画类型的书写用力和书写速度特征的概率密度函数:基于每一组特征向量集合
a14)结束:返回计算得到的人群手写的关于标准汉字c的手写笔迹中存在笔画被识别为tj笔画类型的分布律
优选地,所述步骤b)中,手写笔迹笔画书写动态特征注册包括如下步骤:
b1)注册开始:注册用户提交关于标准汉字c的注册手写笔迹样本集合h={h1,h2,...,hp},p≥3;
b2)统计笔画出现和未出现的次数:计算注册手写笔迹样本集合h中每个笔迹样本的笔画类型,然后统计标准汉字c的每个笔画tj∈t在h中出现和未出现的次数,设
b3)初始化,j=1;
b4)若
b5)提取所有注册手写笔迹样本中被识别tj笔画类型的书写用力和书写速度特征,设
所述包含笔画类型tj是指注册手写笔迹样本中存在笔画被识别为tj笔画类型;
b6)统计除书写用力和书写速度波型类型分量的每个分量上的最大最小值;设
b7)j=j 1,若j≤o,则跳转至步骤b4),提取被识别为下一段笔画类型的笔画书写用力和书写速度特征;否则,跳转至步骤b8);
b8)结束:返回注册手写笔迹样本集h中包含和未包含被识别为tj类型的笔画的样本个数
优选地,所述步骤c)中,笔画书写动态特征认证包括如下步骤:
c1)认证阶段开始:待认证用户输入关于标准汉字c的测试手写笔迹样本w;
c2)识别测试笔迹样本中w每段笔画的类型:采用笔画识别算法识别w中每段笔画的类型,设
c3)估算稳定且一致的出现和未出现笔画的概率:估算同时观察到测试手写笔迹样本w中稳定且一致出现和未出现笔画的概率,对于出现笔画类型
所述稳定出现笔画类型是指笔画类型在注册手写笔迹样本集合中出现的次数大于所述该笔画类型在注册手写笔迹样本集合中未出现的次数;
所述稳定未出现笔画类型是指笔画类型在注册手写笔迹样本集合中未出现的次数大于所述该笔画类型在注册手写笔迹样本集合中出现的次数;
所述一致出现笔画类型是指在测试手写笔迹样本中出现的笔画类型在注册手写笔迹样本集合中是稳定出现的笔画类型;
所述一致未出现笔画类型是指在测试手写笔迹样本中未出现的笔画类型在注册手写笔迹样本集合中是稳定未出现的笔画类型;
用符号t1w表示稳定且一致的出现笔画类型,
所述稳定的书写用力和速度波形类型特征是指在注册手写笔迹样本集合的稳定出现笔画类型中,至少在给定阈值的注册手写笔迹样本中,所述笔画的书写用力和速度波形类型是相同的;
所述一致书写用力和速度特征分量是指对测试手写笔迹稳定且一致出现笔画类型,从与所述笔画类型对应的手写笔画中提取的书写用力和速度特征分量处于相应注册手写笔迹特征分量的最大最小值之间;
所述笔画类型为
c4)置循环变量k=1,开始计算观察到测试样本笔迹w中所有一致书写用力和书写速度特征分量的联合概率;
c5)取出第k个被识别笔画类型:从集合t1w中取出第k个被识别笔画类型tk,所述集合t1w表示测试手写笔迹样本中稳定且一致的出现笔画类型集合,
c6)提取测试笔迹中相应笔画的动态特征向量:从测试手写笔迹样本中截取被识别为tk类型的笔画
c7)估算观测到稳定且一致的动态特征波形类型的概率:从特征向量
c8)估算观测到稳定且一致的动态特征值的联合概率:在预学习阶段获得的所有联合概率密度函数数据中查找与笔画类型tk相对应的书写用力和书写速度特征联合概率密度函数
c9)k=k 1,若k大于集合t1w中元素的个数,则跳转至步骤c10),否则,跳转至步骤c5);
c10)估算观测到测试笔迹中所有稳定且一致特征的概率:计算观察到测试样本笔迹w中所有一致书写用力和书写速度特征分量的联合概率
c11)结合其它笔画特征进行判别:计算p(w)=p1(w)×p2(w),将笔画书写用力和书写速度特征观测概率p(w),融合笔画的其它特征,包括笔顺、布局、书写节奏,综合判断该测试样本笔迹w是否为真实笔迹。
优选地,笔画动态特征的提取包括如下步骤:
1)开始:设
所述笔画动态特征是指手写设备采集到的笔画书写过程中产生的动作特征,主要包括书写用力和书写速度两类特征;
2)计算书写用力和书写速度信息的极大极小值:设mf={mf1,mf2,...,mfn1},mf={mf1,mf2,...,mfn2}分别表示书写用力极大极小值在笔画a中的书写用力序列
3)计算书写用力和书写速度波形的类型:设a1={a1,a2,...,an5 n6}=maxf∪minf表示合并集合maxf、minf后并按从小到大顺序排列的下标集合,其中ai∈minf或ai∈maxf,1=a1<ai<ai 1<an5 n6=na,1<i<n5 n6,n5,n6分别表示集合maxf、minf中元素的个数,对集合a1中任意两个相邻的元素ai-1、ai,若
对书写速度时间序列
4)计算由极大值下标集合maxf定义的书写用力峰值点向量
5)计算由向量uf中所有分量构成集合的关于书写用力极大值的最大值、最小值、极大值均值,极大值标准差{maxmf,minmf,avgmf,stdmf},计算由向量vf中所有分量构成集合的关于书写用力极小值的最大值、最小值、极大值均值,极大值标准差{maxmf,minmf,avgmf,stdmf},计算由向量dxf中所有分量构成集合的关于书写用力序列在x轴方向上增量的最大值、最小值、极大值均值,极大值标准差
6)计算由向量ul中所有分量构成集合的关于书写速度极大值的最大值、最小值、极大值均值,极大值标准差{maxml,minml,avgml,stdml},计算由向量vl中所有分量构成集合的关于书写速度极小值的最大值、最小值、极大值均值,极大值标准差{maxml,minml,avgml,stdml},计算由向量dxl中所有分量构成集合的关于书写速度序列在x轴方向上增量的最大值、最小值、极大值均值,极大值标准差
7)取笔画序列a中采样点个数na作为书写耗时特征;
8)提取笔画a的频域特征:将书写用力时间序列
9)结束:返回关于笔画a的动态特征向量,包括书写用力和书写速度波型的类型,书写用力波形在波峰、波谷以及在x、y方向上增量的最大、最小值以及均值和方差,书写速度波形在波峰、波谷以及在x、y方向上增量的最大、最小值以及均值和方差,笔画书写耗时,以及书写用力和书写速度的截断频域特征,共五类特征值构成的特征向量。
本发明与现有技术相比,具有以下优点:对已知书写内容的非标准任意手写体笔迹,能有效提取出那些处于局部的笔画书写动态特征,有助于识别出那些存在于局部细小的书写动作和习惯,并估算稳定且一致笔画书写力和书写速度特征在人群中出现的概率,从而达到提升认证准确性的目的。
附图说明
图1为本发明在线笔迹认证中一种笔画动态特征的提取及认证方法的流程图;
图2为图1中步骤a)的具体流程图;
图3为图1中步骤b)的具体流程图;
图4为图1中步骤c)的具体流程图;
图5为本发明在线笔迹认证中一种笔画动态特征的提取及认证方法中笔画动态特征提取的具体流程图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步的详细说明。
在线笔迹认证中一种笔画动态特征的提取及认证方法,如图1所示,包括如下步骤:
a)手写笔迹笔画书写动态特征预学习:收集人群关于标准汉字c的手写笔迹样本,识别所有手写笔迹样本中的笔画类型,以手写笔迹样本中的笔画类型,提取所有具有相同笔画类型的各种笔画书写动态特征,包括笔画书写用力、书写速度的波形类型,书写用力波形和书写速度波形在波峰、波谷以及在x、y方向上增量的最大、最小值、均值和方差,笔画书写耗时,书写用力和书写速度的截断频域特征,再对所提取的笔画书写动态特征中的离散型笔画特征,包括笔画类型、书写速度的波形类型,统计离散型笔画特征在人群中的分布律,对所提取的连续型笔画特征,包括波峰、波谷的最大、最小值,估算连续型笔画特征在人群中出现的联合概率密度函数;
书写动态特征是指手写设备采集到的书写过程中产生的动作特征,包括书写用力和书写速度,笔画书写动态特征是以笔画为单位提取的书写动态特征;
手写笔迹是指通过专用的数据传感设备实时采集书写过程中笔尖运动产生的各种信息所获得的与时间相关的时序信号序列,数据传感设备在每个采样时刻采集的数据包括笔尖的二维位置信息、笔尖施加在书定平面上的压力、笔杆与书写平面的转动角及夹角信息;
汉字c的手写笔迹样本是指书写人手写的可被其他人正确辩识的或只能被少数人辩识的或只能被书写者自己辩识为标准汉字c的非标准手写体笔迹,所谓辩识是指建立手写体笔迹与标准汉字之间的对应关系;
识别手写笔迹样本中的笔画类型是指建立手写笔迹样本中笔画与标准汉字中笔画的对应关系;
所述标准汉字是目前已被广泛使用的具有标准书写样式和表现形式的汉字;
具体而言,如图2图所示,手写笔迹笔画书写动态特征预学习包括如下步骤:
a1)预学习开始:设s={s1,s2,...,sn}表示海量的足够多书写者手写的关于标准汉字c的手写笔迹样本集合,每位书写者提供了1至3个样本,n表示集合s中包含的笔迹个数,设t={t1,t2,...,to}表示标准汉字c包含的所有笔画集合,o表示标准汉字c包含的笔画数;所述足够多是指集合s中的手写笔迹样本所包含的动态特征具有广泛的代表性,涵盖了手写汉字c各种动态特征在人群中所有可能的变化;
a2)初始化:初始化循环变量i=1,初始化人群书写的关于标准汉字c的手写笔迹中被识别为tj类型的计数变量
a3)识别第i个手写笔迹样本si中的笔画类型:识别笔迹
a4)初始化j=1;
a5)笔画特征提取;提取手写笔迹样本si中与第j段被识别笔画类型tj对应的笔画书写速度和用力特征,以笔迹si∈s中被识别为tj的笔画
a6)更新笔画类型计数变量:根据手写笔迹样本si中笔画的被识别笔画类型tj∈t,将计数变量
a7)更新笔画书写用力和实现书写速度波形类型计数变量:设特征向量
a8)将笔画书写用力和书写速度波形特征数据放到相应的集合中:对从第i个手写笔迹样本被识别为tj笔画类型的笔画中提取的书写速度和书写用力特征向量
a9)j=j 1,若j≤xi,则跳转至步骤a5),提取下一段笔画书写用力和书写速度特征,并更新相关的统计变量,否则,跳转至步骤a10);
a10)i=i 1,若i≤n,则跳转至步骤a3),识别下一个手写笔迹样本类型,否则,跳转至步骤a10);
a11)统计各种笔画类型在人群中的分布律:计算人群书写的关于标准汉字c的手写笔迹中笔画被识别为tj笔画类型的分布律
a12)统计各种笔画类型的书写用力和书写速度波型类型在人群中的分布律:计算人群书写的所有关于标准汉字c的手写笔迹中被识别为tj类型的笔画中,笔画的书写用力和书写速度波形类型分别为fa和la的分布律
a13)估算各种笔画类型的书写用力和书写速度特征的概率密度函数:基于每一组特征向量集合
a14)结束:返回计算得到人群手写的关于标准汉字c的手写笔迹中存在笔画被识别为tj笔画类型的分布律
b)手写笔迹笔画书写动态特征注册:注册用户书写并提交关于标准汉字c的若干注册手写笔迹样本,组成注册手写笔迹样本集合,采用与手写笔迹笔画书写动态特征预学习阶段相同的方法,识别所有注册手写笔迹样本中的笔画类型,按注册手写笔迹样本中的笔画类型,提取所有具有相同笔画类型的各种笔画书写动态特征,笔画书写动态特征与在手写笔迹笔画书写动态特征预学习阶段所提取的笔画书写动态特征种类相同,统计笔画书写动态特征中各种离散型笔画特征在所有注册手写笔迹样本集合中出现和未出现的次数,统计笔画书写动态特征中各种连续型笔画特征在注册手写笔迹样本集合中的最大、最小值;
注册手写笔迹样本是指在注册阶段注册用户书写并提交的用户身份已知的手写笔迹,用户身份已知是指手写笔迹书写者的身份是已知的;
具体而言,如图3所示,手写笔迹笔画书写动态特征注册包括如下步骤:
b1)注册开始:注册用户提交关于标准汉字c的注册手写笔迹样本集合h={h1,h2,...,hp},p≥3;
b2)统计笔画出现和未出现的次数:计算注册手写笔迹样本集合h中每个笔迹样本的笔画类型,然后统计标准汉字c的每个笔画tj∈t在h中出现和未出现的次数,设
b3)初始化,j=1;
b4)若
b5)提取所有注册手写笔迹样本中被识别tj笔画类型的书写用力和书写速度特征,设
包含笔画类型tj是指注册手写笔迹样本中存在笔画被识别为tj笔画类型;
b6)统计除书写用力和书写速度波型类型分量的每个分量上的最大最小值;设
b7)j=j 1,若j≤o,则跳转至步骤b4),提取被识别为下一段笔画类型的笔画书写用力和书写速度特征;否则,跳转至步骤b8);
b8)结束:返回注册手写笔迹样本集h中包含和未包含被识别为tj类型的笔画的样本个数
c)笔画书写动态特征认证:待认证用户提交一个关于标准汉字c的测试手写笔迹样本,采用与手写笔迹笔画书写动态特征预学习阶段相同的方法,识别测试手写笔迹样本中的笔画类型,按测试手写笔迹样本中的笔画类型,提取所有具有相同笔画类型的各种笔画书写动态特征,找出注册手写笔迹样本中稳定且一致的各种笔画书写动态特征,依据在手写笔迹笔画书写动态特征预学习阶段计算得到的标准汉字c所有各种笔画书写动态特征在人群中的统计数据,计算观测到测试手写笔迹样本与注册手写笔迹样本中所有稳定且一致的各种笔画书写动态特征的概率,依据计算得到的概率,结合其它笔画特征,包括笔画布局、笔顺、书写节奏,综合判断测试手写笔迹样本是否为真实笔迹;
所述稳定且一致笔画书写动态特征包括离散型稳定且一致笔画书写动态特征和连续型稳定且一致笔画书写动态特征;所述各种笔画书写动态特征在人群中的统计数据包括离散型笔画特征的分布律和连续型笔画特征的联合概率密度函数;
离散型稳定且一致笔画书写动态特征是指,在测试手写笔迹样本中提取的离散型笔画书写动态特征取值与在注册手写笔迹样本集合中提取的稳定的离散型笔画书写动态特征取值是相同的,稳定的离散型笔画书写动态特征是指具有相同离散型笔画书写动态特征的特征取值在注册手写笔迹样本集合上出现次数大于一定阈值;
连续型稳定且一致笔画书写动态特征是指,在测试手写笔迹样本中提取的连续型笔画书写动态特征取值处于在注册手写笔迹样本集合上提取的稳定的连续型笔画书写动态特征取值的最大最小值之间,稳定的连续型笔画书写动态特征是指在注册手写笔迹样本集合上提取的连续型笔画书写动态特征取值的最大最小值之间的距离小于一定阈值;
测试手写笔迹样本是指在认证阶段待认证用户书写并提交的用户身份未知且有待确认的手写笔迹,用户身份未知是指还未确认书写手写笔迹的用户身份与模板笔迹的用户身份是否相一致,有待进一步确认;
待认证用户是指真实身份未得到确认的用户;
具体而言,如图4所示,笔画书写动态特征认证包括如下步骤:
c1)认证阶段开始:待认证用户输入关于标准汉字c的测试手写笔迹样本w;
c2)识别测试笔迹样本w中每段笔画的类型:采用笔画识别算法识别w中每段笔画的类型,设
c3)估算稳定且一致的出现和未出现笔画的概率:估算同时观察到测试手写笔迹样本w中稳定且一致出现和未出现笔画的概率,对于出现笔画类型
稳定出现笔画类型是指笔画类型在注册手写笔迹样本集合中出现的次数大于该笔画类型在注册手写笔迹样本集合中未出现的次数;
稳定未出现笔画类型是指笔画类型在注册手写笔迹样本集合中未出现的次数大于该笔画类型在注册手写笔迹样本集合中出现的次数;
一致出现笔画类型是指在测试手写笔迹样本中出现的笔画类型在注册手写笔迹样本集合中是稳定出现的笔画类型;
一致未出现笔画类型是指在测试手写笔迹样本中未出现的笔画类型在注册手写笔迹样本集合中是稳定未出现的笔画类型;
用符号t1w表示稳定且一致的出现笔画类型,
稳定的书写用力和速度波形类型特征是指在注册手写笔迹样本集合的稳定出现笔画类型中,至少在给定阈值的注册手写笔迹样本中,笔画的书写用力和速度波形类型是相同的;
一致书写用力和速度特征分量是指对测试手写笔迹稳定且一致出现笔画类型,从与笔画类型对应的手写笔画中提取的书写用力和速度特征分量处于相应注册手写笔迹特征分量的最大最小值之间;
c4)置循环变量k=1,开始计算观察到测试样本笔迹w中所有一致书写用力和书写速度特征分量的联合概率;
c5)取出第k个被识别笔画类型:从集合t1w中取出第k个被识别笔画类型tk,集合t1w表示测试手写笔迹样本中稳定且一致的出现笔画类型集合,
c6)提取测试笔迹中相应笔画的动态特征向量:从测试手写笔迹样本中截取被识别为tk类型的笔画
c7)估算观测到稳定且一致的动态特征波形类型的概率:从特征向量
c8)估算观测到稳定且一致的动态特征值的联合概率:在预学习阶段获得的所有联合概率密度函数数据中查找与笔画类型tk相对应的书写用力和书写速度特征联合概率密度函数
c9)k=k 1,若k大于集合t1w中元素的个数,则跳转至步骤c10),否则,跳转至步骤c5);
c10)估算观测到测试笔迹中所有稳定且一致特征的概率:计算观察到测试样本笔迹w中所有一致书写用力和书写速度特征分量的联合概率
c11)结合其它笔画特征进行判别:计算p(w)=p1(w)×p2(w),将笔画书写用力和书写速度特征观测概率p(w),融合笔画的其它特征,包括笔顺、布局、书写节奏,综合判断该测试样本笔迹w是否为真实笔迹。
本实施例中,笔画动态特征的提取包括如下步骤:
1)开始:设
笔画动态特征是指手写设备采集到的笔画书写过程中产生的动作特征,主要包括书写用力和书写速度两类特征;
2)计算书写用力和书写速度信息的极大极小值:设mf={mf1,mf2,...,mfn1},mf={mf1,mf2,...,mfn2}分别表示书写用力极大极小值在笔画a中的书写用力序列
3)计算书写用力和书写速度波形的类型:设a1={a1,a2,...,an5 n6}=maxf∪minf表示合并集合maxf、minf后并按从小到大顺序排列的下标集合,其中ai∈minf或ai∈maxf,1=a1<ai<ai 1<an5 n6=na,1<i<n5 n6,n5,n6分别表示集合maxf、minf中元素的个数,对集合a1中任意两个相邻的元素ai-1、ai,若
对书写速度时间序列
4)计算由极大值下标集合maxf定义的书写用力峰值点向量
5)计算由向量uf中所有分量构成集合的关于书写用力极大值的最大值、最小值、极大值均值,极大值标准差{maxmf,minmf,avgmf,stdmf},计算由向量vf中所有分量构成集合的关于书写用力极小值的最大值、最小值、极大值均值,极大值标准差{maxmf,minmf,avgmf,stdmf},计算由向量dxf中所有分量构成集合的关于书写用力序列在x轴方向上增量的最大值、最小值、极大值均值,极大值标准差
6)计算由向量ul中所有分量构成集合的关于书写速度极大值的最大值、最小值、极大值均值,极大值标准差{maxml,minml,avgml,stdml},计算由向量vl中所有分量构成集合的关于书写速度极小值的最大值、最小值、极大值均值,极大值标准差{maxml,minml,avgml,stdml},计算由向量dxl中所有分量构成集合的关于书写速度序列在x轴方向上增量的最大值、最小值、极大值均值,极大值标准差
7)取笔画序列a中采样点个数na作为书写耗时特征;
8)提取笔画a的频域特征:将书写用力时间序列
9)结束:返回关于笔画a的动态特征向量,包括书写用力和书写速度波型的类型,书写用力波形在波峰、波谷以及在x、y方向上增量的最大、最小值以及均值和方差,书写速度波形在波峰、波谷以及在x、y方向上增量的最大、最小值以及均值和方差,笔画书写耗时,以及书写用力和书写速度的截断频域特征,共五类特征值构成的特征向量。
本发明在线笔迹认证中一种笔画动态特征的提取及认证方法,对已知书写内容的非标准任意手写体笔迹,能有效提取出那些处于局部的笔画书写动态特征,有助于识别出那些存在于局部细小的书写动作和习惯,并估算稳定且一致笔画书写力和书写速度特征在人群中出现的概率,从而达到提升认证准确性的目的。
1.在线笔迹认证中一种笔画动态特征的提取及认证方法,其特征在于:包括如下步骤:
a)手写笔迹笔画书写动态特征预学习:收集人群关于标准汉字c的手写笔迹样本,识别所有手写笔迹样本中的笔画类型,以手写笔迹样本中的笔画类型,提取所有具有相同笔画类型的各种笔画书写动态特征,包括笔画书写用力、书写速度的波形类型,书写用力波形和书写速度波形在波峰、波谷以及在x、y方向上增量的最大、最小值、均值和方差,笔画书写耗时,书写用力和书写速度的截断频域特征,再对所提取的笔画书写动态特征中的离散型笔画特征,包括笔画类型、书写速度的波形类型,统计离散型笔画特征在人群中的分布律,对所提取的连续型笔画特征,包括波峰、波谷的最大、最小值,估算连续型笔画特征在人群中出现的联合概率密度函数;
书写动态特征是指手写设备采集到的书写过程中产生的动作特征,包括书写用力和书写速度,所述笔画书写动态特征是以笔画为单位提取的书写动态特征;
手写笔迹是指通过专用的数据传感设备实时采集书写过程中笔尖运动产生的各种信息所获得的与时间相关的时序信号序列,数据传感设备在每个采样时刻采集的数据包括笔尖的二维位置信息、笔尖施加在书定平面上的压力、笔杆与书写平面的转动角及夹角信息;
所述汉字c的手写笔迹样本是指书写人手写的可被其他人正确辩识的或只能被少数人辩识的或只能被书写者自己辩识为标准汉字c的非标准手写体笔迹,所谓辩识是指建立手写体笔迹与标准汉字之间的对应关系;
所述识别手写笔迹样本中的笔画类型是指建立手写笔迹样本中笔画与标准汉字中笔画的对应关系;
所述标准汉字是目前已被广泛使用的具有标准书写样式和表现形式的汉字;
b)手写笔迹笔画书写动态特征注册:注册用户书写并提交关于标准汉字c的若干注册手写笔迹样本,组成注册手写笔迹样本集合,采用与手写笔迹笔画书写动态特征预学习阶段相同的方法,识别所有注册手写笔迹样本中的笔画类型,按注册手写笔迹样本中的笔画类型,提取所有具有相同笔画类型的各种笔画书写动态特征,所述笔画书写动态特征与在手写笔迹笔画书写动态特征预学习阶段所提取的笔画书写动态特征种类相同,统计笔画书写动态特征中各种离散型笔画特征在所有注册手写笔迹样本集合中出现和未出现的次数,统计笔画书写动态特征中各种连续型笔画特征在注册手写笔迹样本集合中的最大、最小值;
所述注册手写笔迹样本是指在注册阶段注册用户书写并提交的用户身份已知的手写笔迹,所述用户身份已知是指手写笔迹书写者的身份是已知的;
c)笔画书写动态特征认证:待认证用户提交一个关于标准汉字c的测试手写笔迹样本,采用与手写笔迹笔画书写动态特征预学习阶段相同的方法,识别测试手写笔迹样本中的笔画类型,按测试手写笔迹样本中的笔画类型,提取所有具有相同笔画类型的各种笔画书写动态特征,找出注册手写笔迹样本中稳定且一致的各种笔画书写动态特征,依据在手写笔迹笔画书写动态特征预学习阶段计算得到的标准汉字c所有各种笔画书写动态特征在人群中的统计数据,计算观测到测试手写笔迹样本与注册手写笔迹样本中所有稳定且一致的各种笔画书写动态特征的概率,依据计算得到的所述概率,结合其它笔画特征,包括笔画布局、笔顺、书写节奏,综合判断测试手写笔迹样本是否为真实笔迹;
所述稳定且一致笔画书写动态特征包括离散型稳定且一致笔画书写动态特征和连续型稳定且一致笔画书写动态特征;所述各种笔画书写动态特征在人群中的统计数据包括离散型笔画特征的分布律和连续型笔画特征的联合概率密度函数;
所述离散型稳定且一致笔画书写动态特征是指,在测试手写笔迹样本中提取的离散型笔画书写动态特征取值与在注册手写笔迹样本集合中提取的稳定的离散型笔画书写动态特征取值是相同的,所述稳定的离散型笔画书写动态特征是指具有相同离散型笔画书写动态特征的特征取值在注册手写笔迹样本集合上出现次数大于一定阈值;
所述连续型稳定且一致笔画书写动态特征是指,在测试手写笔迹样本中提取的连续型笔画书写动态特征取值处于在注册手写笔迹样本集合上提取的稳定的连续型笔画书写动态特征取值的最大最小值之间,所述稳定的连续型笔画书写动态特征是指在注册手写笔迹样本集合上提取的连续型笔画书写动态特征取值的最大最小值之间的距离小于一定阈值;
所述测试手写笔迹样本是指在认证阶段待认证用户书写并提交的用户身份未知且有待确认的手写笔迹,所述用户身份未知是指还未确认书写手写笔迹的用户身份与模板笔迹的用户身份是否相一致,有待进一步确认;
所述待认证用户是指真实身份未得到确认的用户。
2.根据权利要求1所述在线笔迹认证中一种笔画动态特征的提取及认证方法,其特征在于:所述步骤a)中,手写笔迹笔画书写动态特征预学习包括如下步骤:
a1)预学习开始:设s={s1,s2,...,sn}表示海量的足够多书写者手写的关于标准汉字c的手写笔迹样本集合,每位书写者提供了1至3个样本,n表示集合s中包含的笔迹个数,设t={t1,t2,...,to}表示标准汉字c包含的所有笔画集合,o表示标准汉字c包含的笔画数;所述足够多是指集合s中的手写笔迹样本所包含的动态特征具有广泛的代表性,涵盖了手写汉字c各种动态特征在人群中所有可能的变化;所述标准汉字是目前已被广泛使用的具有标准书写样式和表现形式的汉字;
a2)初始化:初始化循环变量i=1,初始化人群书写关于标准汉字c的手写笔迹中被识别为tj类型的计数变量ntj=0,tj∈t,1≤j≤o,初始化人群书写关于标准汉字c的手写笔迹中被识别为tj类型的笔画且所述笔画的书写用力和速度波形类型分别为fa和la的计数变量
a3)识别第i个手写笔迹样本si中的笔画类型:识别笔迹
a4)初始化j=1;
a5)笔画特征提取;提取手写笔迹样本si中与第j段被识别笔画类型tj对应的笔画书写速度和用力特征,以笔迹si∈s中被识别为tj的笔画
a6)更新笔画类型计数变量:根据手写笔迹样本si中笔画的被识别笔画类型tj∈t,将计数变量
a7)更新笔画书写用力和实现书写速度波形类型计数变量:设特征向量
a8)将笔画书写用力和书写速度波形特征数据放到相应的集合中:对从第i个手写笔迹样本被识别为tj笔画类型的笔画中提取的书写速度和书写用力特征向量
a9)j=j 1,若j≤xi,则跳转至步骤a5),提取下一段笔画书写用力和书写速度特征,并更新相关的统计变量,否则,跳转至步骤a10);
a10)i=i 1,若i≤n,则跳转至步骤a3),识别下一个手写笔迹样本类型,否则,跳转至步骤a11);
a11)统计各种笔画类型在人群中的分布律:计算人群书写的关于标准汉字c的手写笔迹中被识别为tj笔画类型的概率
a12)统计各种笔画类型的书写用力和书写速度波型类型在人群中的分布律:计算人群书写的所有关于标准汉字c的手写笔迹中被识别为tj类型的笔画中,所述笔画的书写用力和书写速度波形类型分别为fa和la的分布律
a13)估算各种笔画类型的书写用力和书写速度特征的概率密度函数:基于每一组特征向量集合
a14)结束:返回计算得到人群书写的关于标准汉字c的手写笔迹中存在笔画被识别为tj笔画类型的分布律
3.根据权利要求2所述在线笔迹认证中一种笔画动态特征的提取及认证方法,其特征在于:所述步骤b)中,手写笔迹笔画书写动态特征注册包括如下步骤:
b1)注册开始:注册用户提交关于标准汉字c的注册手写笔迹样本集合h={h1,h2,...,hp},p≥3;
b2)统计笔画出现和未出现的次数:计算注册手写笔迹样本集合h中每个笔迹样本的笔画类型,然后统计标准汉字c的每个笔画tj∈t在h中出现和未出现的次数,设
b3)初始化,j=1;
b4)若
b5)提取所有注册手写笔迹样本中被识别tj笔画类型的书写用力和书写速度特征,设
所述包含笔画类型tj是指注册手写笔迹样本中存在笔画被识别为tj笔画类型;
b6)统计除书写用力和书写速度波型类型分量的每个分量上的最大最小值;设
b7)j=j 1,若j≤o,则跳转至步骤b4),提取被识别为下一段笔画类型的笔画书写用力和书写速度特征;否则,跳转至步骤b8);
b8)结束:返回注册手写笔迹样本集h中包含和未包含被识别为tj类型的笔画的样本个数
4.根据权利要求3所述在线笔迹认证中一种笔画动态特征的提取及认证方法,其特征在于:所述步骤c)中,笔画书写动态特征认证包括如下步骤:
c1)认证阶段开始:待认证用户输入关于标准汉字c的测试手写笔迹样本w;
c2)识别测试笔迹样本w中每段笔画的类型:采用笔画识别算法识别w中每段笔画的类型,设
c3)估算稳定且一致的出现和未出现笔画的概率:估算同时观察到测试手写笔迹样本w中稳定且一致出现和未出现笔画的概率,对于出现笔画类型
所述稳定出现笔画类型是指笔画类型在注册手写笔迹样本集合中出现的次数大于所述该笔画类型在注册手写笔迹样本集合中未出现的次数;
所述稳定未出现笔画类型是指笔画类型在注册手写笔迹样本集合中未出现的次数大于所述该笔画类型在注册手写笔迹样本集合中出现的次数;
所述一致出现笔画类型是指在测试手写笔迹样本中出现的笔画类型在注册手写笔迹样本集合中是稳定出现的笔画类型;
所述一致未出现笔画类型是指在测试手写笔迹样本中未出现的笔画类型在注册手写笔迹样本集合中是稳定未出现的笔画类型;
用符号t1w表示稳定且一致的出现笔画类型,
所述稳定的书写用力和速度波形类型特征是指在注册手写笔迹样本集合的稳定出现笔画类型中,至少在给定阈值的注册手写笔迹样本中,所述笔画的书写用力和速度波形类型是相同的;
所述一致书写用力和速度特征分量是指对测试手写笔迹稳定且一致出现笔画类型,从与所述笔画类型对应的手写笔画中提取的书写用力和速度特征分量处于相应注册手写笔迹特征分量的最大最小值之间;
c4)置循环变量k=1,开始计算观察到测试样本笔迹w中所有一致书写用力和书写速度特征分量的联合概率;
c5)取出第k个被识别笔画类型:从集合t1w中取出第k个被识别笔画类型tk,所述集合t1w表示测试手写笔迹样本中稳定且一致的出现笔画类型集合,
c6)提取测试笔迹中相应笔画的动态特征向量:从测试手写笔迹样本中截取被识别为tk类型的笔画
c7)估算观测到稳定且一致的动态特征波形类型的概率:从特征向量
c8)估算观测到稳定且一致的动态特征值的联合概率:在预学习阶段获得的所有联合概率密度函数数据中查找与笔画类型tk相对应的书写用力和书写速度特征联合概率密度函数
c9)k=k 1,若k大于集合t1w中元素的个数,则跳转至步骤c10),否则,跳转至步骤c5);
c10)估算观测到测试笔迹中所有稳定且一致特征的概率:计算观察到测试样本笔迹w中所有一致书写用力和书写速度特征分量的联合概率
c11)结合其它笔画特征进行判别:计算p(w)=p1(w)×p2(w),将笔画书写用力和书写速度特征观测概率p(w),融合笔画的其它特征,包括笔顺、布局、书写节奏,综合判断该测试样本笔迹w是否为真实笔迹。
5.根据权利要求4所述在线笔迹认证中一种笔画动态特征的提取及认证方法,其特征在于:笔画动态特征的提取包括如下步骤:
1)开始:设
所述笔画动态特征是指手写设备采集到的笔画书写过程中产生的动作特征,主要包括书写用力和书写速度两类特征;
2)计算书写用力和书写速度信息的极大极小值:设mf={mf1,mf2,...,mfn1},mf={mf1,mf2,...,mfn2}分别表示书写用力极大极小值在笔画a中的书写用力序列
3)计算书写用力和书写速度波形的类型:设a1={a1,a2,...,an5 n6}=maxf∪minf表示合并集合maxf、minf后并按从小到大顺序排列的下标集合,其中ai∈minf或ai∈maxf,1=a1<ai<ai 1<an5 n6=na,1<i<n5 n6,n5,n6分别表示集合maxf、minf中元素的个数,对集合a1中任意两个相邻的元素ai-1、ai,若
对书写速度时间序列
4)计算由极大值下标集合maxf定义的书写用力峰值点向量
5)计算由向量uf中所有分量构成集合的关于书写用力极大值的最大值、最小值、极大值均值,极大值标准差{maxmf,minmf,avgmf,stdmf},计算由向量vf中所有分量构成集合的关于书写用力极小值的最大值、最小值、极大值均值,极大值标准差{maxmf,minmf,avgmf,stdmf},计算由向量dxf中所有分量构成集合的关于书写用力序列在x轴方向上增量的最大值、最小值、极大值均值,极大值标准差
6)计算由向量ul中所有分量构成集合的关于书写速度极大值的最大值、最小值、极大值均值,极大值标准差{maxml,minml,avgml,stdml},计算由向量vl中所有分量构成集合的关于书写速度极小值的最大值、最小值、极大值均值,极大值标准差{maxml,minml,avgml,stdml},计算由向量dxl中所有分量构成集合的关于书写速度序列在x轴方向上增量的最大值、最小值、极大值均值,极大值标准差
7)取笔画序列a中采样点个数na作为书写耗时特征;
8)提取笔画a的频域特征:将书写用力时间序列
9)结束:返回关于笔画a的动态特征向量,包括书写用力和书写速度波型的类型,书写用力波形在波峰、波谷以及在x、y方向上增量的最大、最小值以及均值和方差,书写速度波形在波峰、波谷以及在x、y方向上增量的最大、最小值以及均值和方差,笔画书写耗时,以及书写用力和书写速度的截断频域特征,共五类特征值构成的特征向量。
技术总结