本发明涉及多媒体导航仪测试方法,具体涉及基于视觉稳定特征分类配准的多媒体导航仪测试方法,属于通讯技术领域。
背景技术:
计算机技术的发展使人类的生产生活不断朝着智能化、视觉化的方向发展,计算机视觉也越来越广泛的应用到工业生产各个领域,它能够使机器拥有像人一样的视觉系统,更智能、更灵活的处理复杂任务。数字图像处理技术是计算机视觉的实现方法之一,但对于传统图像处理算法,光线水平变化和噪声干扰对图像分析结果的影响很大,不具备很强的抗干扰能力;比如,在本专利的背景下,对于具有自发光能力的场景或物体,很难用一种算法对所有目标和任务保持很高的适应性,尤其是在线实时处理,更会由于种种不确定因素而效果欠佳。即使是光线的细微变化,也许人眼看起来并无太大差异,但从像素角度分析,每个像素值都提高了一个数量级,从全局来讲对图像的平均水平变化已经很明显。这种变化对最终处理结果将会是决定性的。基于此,从全局出发的图像处理算法稳定性将很差,对不同环境中的适应性将很难满足实际需要。但从局部特征考虑,这种随机干扰或是可控范围内的变化,局部稳定特征始终难以湮没,因此在本设计中主要采用局部特征信息提取和分析的设计方法。
图像配准是一种能够实现对未知场景的检索和识别的技术,它是实现视觉导航、图像信息检索等任务的重要技术手段。一般来说,配准的核心在于特征的检测与匹配,比如sift、surf等特征描述子,他能够在具有较大干扰情况下提取图像局部的关键特征信息,即使复杂环境下依然保持良好效果。特征检测是计算机视觉和图像处理中一个基础算法,它使用计算机算法处理图像信息,从数字图像角度决定每个图像的像素点是否属于图像的一个特征,或是把图像上的点分为不同的子集,并判断它是属于孤立的点、连续的曲线或是连续的区域。它的特点是从图像中的某些位置进行局部分析,而非面向整幅图像,只要某个局部特征足够稳定,便可以被判断为图像的一个关键点。它在目标识别、图像配准、视觉跟踪和三维重建等领域有着广泛应用。
如上所述,对于本专利涉及的这类发光目标的检测难点之一是其亮度的变化,不同于一般目标只能反射外部光线,其亮度决定于环境光线水平,短时间内不会发生大幅变化;但这种能自发光的目标可能较暗或较亮,更或是随时亮暗交替,这样采集到的图像质量会参差不齐,某个时刻拍到的可能亮度合适,但下一时刻采集到的的便是一张曝光过度的图像;解决方案之一是自动调整曝光时间,但短时间内频繁的调整对相机是一项巨大挑战,尤其应用在工业生产长期如此应用,对系统可靠性有着巨大影响,与此同时还会使控制流程更加复杂。基于以上因素,我们考虑将相机曝光调整到较低水平,保证目标最大亮度下的成像仍能保持较高质量,较低亮度下虽然全局质量有所损失,但仍能保证局部关键信息。在此基础上,还可以根据实时图像与样本图像中匹配关键点的相对位置关系计算单应性矩阵还原出暗光环境下发光物体的具体位置,这即使是对于没有判断经验的人通过图像定位目标都很困难。
特征点检测主要包括局部特征点的提取、特征点的描述和特征点的匹配等流程。目前应用较多的著名特征检测算法包括sift(scale-invariantfeaturetransform)特征,即尺度不变特征变换,和surf(speeded-uprobustfeatures)加速稳健特征。二者都很好地实现了从图像中提取特征的任务,前者通过dog对log近似,建立尺度空间寻找局部极值点并修正,每个特征用128维向量进行描述,对特征点细节的处理十分细致;后者通过优化,在算法速度上更有优势,执行速度比sift快了许多,但在图像的尺度和旋转不变性上的稳定程度处理的一般。相比sift特征,它大大提高了程序的执行效率,除了使用hession矩阵,还对关键点的描述做了降维处理,只采用了64维向量来描述特征。特征向量,也叫特征描述子,它用来保存关键点本身和周围邻近范围内的信息。一个特征点的描述不仅仅只孤立的包括它本身的信息,还应该体现对其局部某个范围内的完整描述,每个特征点将会形成一个多维的特征向量,这个特征向量就具体而又细节的描述了该特征及周围的所有信息。
为了提高控制算法效率进而提高检测识别速度,并通过实验比较不同算法的性能,本专利采用了surf算法,同时为提高系统检测精度和准确率对算法做了改进,没有采取传统对关键点进行暴力匹配或是快速最近邻近似搜索算法直接匹配识别方法。传统的特征点匹配要求每次采样后都将提取后的特征点分别于样本库中的n张图片进行一对一匹配,取最优匹配的某一样本作为识别结果,但这种方式下的时间开销会随着场景类别数目的增多而变得很大,可能很难满足在线实时检测的要求。另一种思路是通过对所有特征点按照不同标签场景进行分类学习,由样本数据特征训练一个针对该种分类任务有优秀性能的svm决策器,对采集到新场景或目标的特征点快速分类,判断当前场景是否存在于场景库中,如存在返回最佳匹配。这里提到的支持向量机(svm)是一种按监督机器学习对数据进行二元分类的广义线性分类器,其决策边界是对学习样本求解的最大边距分割超平面。它的核心思想是将待分类的样本线性分类,虽然大部分任务在原空间是线性不可分的,但使用非线性函数将输入数据映射到高维空间后应用线性svm选择的超平面可得到非线性分类效果。svm最初是针对二分类问题而提出的,也就是说只有当有两种可能出现的场景,传统的svm才能发挥作用。如何有效地将其推广到多类别分类是当前支持向量机研究的重要内容之一。目前提出的解决途径包括了一对一(one-against-one)、一对多(one-against-rest)方法,但是其分类器性能和不可分区域的存在都是有待解决的问题。一般的svm分类器还有一个明显的缺点就是没有考虑每个类别的分布情况,它在处理样本分布不平衡的数据是具有明显的倾向性,比如场景1中检测到的关键点远远多于场景2中,那么训练好的分类器在决策时将更偏向于场景1。
因此针对本专利设计的稳定特征分类配准问题,我们使用基于球结构的完全二叉树svm多分类算法对所有样本的特征点进行统一训练学习,根据特征描述子在超空间的分布特点进行分类,并以此学习到一个优秀的特征分类器。
技术实现要素:
本发明为解决多媒体导航显示界面测试过程中其背景过亮,无法捕捉图像细节信息的问题,进而提出基于视觉稳定特征分类配准的多媒体导航仪测试测试方法。
本发明为解决上述问题采取的技术方案是:本发明所述方法的具体步骤如下:
步骤一、预先准备临时样本库,对目标进行初次样本采集,将图片按相应顺序命名并保存;
步骤二、对采集的所有样本进行surf特征点检测;
步骤三、随机抽取部分特征点集,应用有监督的机器学习分类算法——基于球结构的完全二叉树svm进行训练,找到合适的决策函数,并用其余特征点调整学习策略和参数不断优化,直至系统能将这些特征点集准确的分类到与场景标签匹配的n类场景中去;
步骤四、训练阶段完成,相机可以开始采集图像,首先将图像进行预处理,然后交给特征提取器,同训练分类器检测参数保持一致,获得若干局部不变特征点信息;
步骤五、采取对多场景投票的方式,若特征点ki属于界面xi,则该类别票数加1,对所有特征点完成相同操作,得票数最多的场景类别认为是与当前界面的最佳配准结果;
步骤六、将当前采集到的图像中所有特征点与样本库中相匹配图像所有特征点进行快速最近邻近似搜索算法匹配,找到最佳匹配特征点对,由随机抽样一致算法计算单应性矩阵,它描述了在图像二维空间中目标两次位置的变换关系,检测出导航仪在未知场景图像中的位置;
步骤七、相机连续按照一定帧率取景,随着液晶屏幕内容的变化,系统实时检测并输出配准结果,后台将对检测结果进行累计记录,以日志形式保存到本地。
进一步的,步骤一中当对多媒体导航仪上所有按键对应的显示界面拍摄时,由于后续算法已经针对环境和平台安装等情况的变化设计了余量来保证系统的稳定性,如无特殊情况,此步骤只需进行一次即可。
进一步的,步骤二中对采集的所有样本进行surf特征点检测过程中应保证检测参数一致,要求每个样本至少能提取到n个特征点。
进一步的,假设存在n个场景类别,某场景下提取到ki,其中i=1,2,3......n,则共有n*ki个特征点集,其中ki>n,每个特征点用64维向量描述。
进一步的,步骤七中当出现屏幕配准结果与预计不相符的情况时,系统将自动记录当前时间并保存这一帧图像,便于人工的进一步分析。
本发明的有益效果是:本发明可以针对不同型号的多媒体导航仪,完成操作-检测这一套自动化测试流程。传统的导航仪测试环节需要依靠生产线上人工操作的方式,工作量大、效率低,且长时间条件下容易出现漏检、误检的现象。而采用计算机视觉的自动化方式可完全取代人工,依靠本设计中的多媒体智能测试平台,整个过程完全不需要人的参与,大幅提高测试效率,适用大批量的在线检测。
传统发光物体的检测与识别由于其复杂性大多采用基于神经网络的深度学习完成,不仅需要大量样本,训练周期长,对硬件有较高要求,成本高,而且扩展性差,再增加标签场景或更换不同型号的导航仪时需要重新训练和设计软件。本专利提出的特征分类配准技术,在保证完美实现多媒体测试的基本功能前提下,大大提高了此平台的稳定性和实用型。经过大量实验证明,在不同照明条件、不同位置、不同安装方式,甚至人为加入外界干扰条件(比如对目标的部分遮挡或强光)下,仍能保持系统的稳定与准确性。
为了增强本设计的适应性,不仅在机械臂末端准备了多种配合机械臂操作的治具,而且也考虑了软件的扩展性,当更换或增加新的界面内容时,只需将该新的界面取样添加到样本库中,并定义好标签,便可对不同型号不同场景的导航仪进行测试,无需重新设计,便于实际应用,适用性较广。同时本设计也为暗光条件下的目标的识别与定位提供了可行方案。综上,本检测平台发明的意义在于采用基于机器视觉的智能方式检测多媒体导航仪的按键功能,也可用于一切发光物体的识别和定位,提高企业的生产效率以及发展竞争力。
附图说明
图1是本发明的算法流程框图。
具体实施方式
具体实施方式一:结合图1说明本实施方式,本实施方式所述基于视觉稳定特征分类配准的多媒体导航仪测试方法的具体步骤如下:
步骤一、预先准备临时样本库,对目标进行初次样本采集,将图片按相应顺序命名并保存;
步骤二、对采集的所有样本进行surf特征点检测;
步骤三、随机抽取部分特征点集,应用有监督的机器学习分类算法——基于球结构的完全二叉树svm进行训练,找到合适的决策函数,并用其余特征点调整学习策略和参数不断优化,直至系统能将这些特征点集准确的分类到与场景标签匹配的n类场景中去;
步骤四、训练阶段完成,相机可以开始采集图像,首先将图像进行预处理,然后交给特征提取器,同训练分类器检测参数保持一致,获得若干局部不变特征点信息;
步骤五、采取对多场景投票的方式,若特征点ki属于界面xi,则该类别票数加1,对所有特征点完成相同操作,得票数最多的场景类别认为是与当前界面的最佳配准结果;
步骤六、将当前采集到的图像中所有特征点与样本库中相匹配图像所有特征点进行快速最近邻近似搜索算法匹配,找到最佳匹配特征点对,由随机抽样一致算法计算单应性矩阵,它描述了在图像二维空间中目标两次位置的变换关系,检测出导航仪在未知场景图像中的位置;
步骤七、相机连续按照一定帧率取景,随着液晶屏幕内容的变化,系统实时检测并输出配准结果,后台将对检测结果进行累计记录,以日志形式保存到本地。
具体实施方式二:结合图1说明本实施方式,本实施方式所述基于视觉稳定特征分类配准的多媒体导航仪测试方法的步骤一中当对多媒体导航仪上所有按键对应的显示界面拍摄时,由于后续算法已经针对环境和平台安装等情况的变化设计了余量来保证系统的稳定性,如无特殊情况,此步骤只需进行一次即可。
具体实施方式三:结合图1说明本实施方式,本实施方式所述基于视觉稳定特征分类配准的多媒体导航仪测试方法的步骤二中对采集的所有样本进行surf特征点检测过程中应保证检测参数一致,要求每个样本至少能提取到n个特征点。
具体实施方式四:结合图1说明本实施方式,本实施方式所述基于视觉稳定特征分类配准的多媒体导航仪测试方法的假设存在n个场景类别,某场景下提取到ki,其中i=1,2,3......n,则共有n*ki个特征点集,其中ki>n,每个特征点用64维向量描述。
具体实施方式五:结合图1说明本实施方式,本实施方式所述基于视觉稳定特征分类配准的多媒体导航仪测试方法的步骤七中当出现屏幕配准结果与预计不相符的情况时,系统将自动记录当前时间并保存这一帧图像,便于人工的进一步分析。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容做出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案内容,依据本发明的技术实质,在本发明的精神和原则之内,对以上实施例所作的任何简单的修改、等同替换与改进等,均仍属于本发明技术方案的保护范围之内。
1.基于视觉稳定特征分类配准的多媒体导航仪测试方法,其特征在于:所述基于视觉稳定特征分类配准的多媒体导航仪测试方法的具体步骤如下:
步骤一、预先准备临时样本库,对目标进行初次样本采集,将图片按相应顺序命名并保存;
步骤二、对采集的所有样本进行surf特征点检测;
步骤三、随机抽取部分特征点集,应用有监督的机器学习分类算法——基于球结构的完全二叉树svm进行训练,找到合适的决策函数,并用其余特征点调整学习策略和参数不断优化,直至系统能将这些特征点集准确的分类到与场景标签匹配的n类场景中去;
步骤四、训练阶段完成,相机可以开始采集图像,首先将图像进行预处理,然后交给特征提取器,同训练分类器检测参数保持一致,获得若干局部不变特征点信息;
步骤五、采取对多场景投票的方式,若特征点ki属于界面xi,则该类别票数加1,对所有特征点完成相同操作,得票数最多的场景类别认为是与当前界面的最佳配准结果;
步骤六、将当前采集到的图像中所有特征点与样本库中相匹配图像所有特征点进行快速最近邻近似搜索算法匹配,找到最佳匹配特征点对,由随机抽样一致算法计算单应性矩阵,它描述了在图像二维空间中目标两次位置的变换关系,检测出导航仪在未知场景图像中的位置;
步骤七、相机连续按照一定帧率取景,随着液晶屏幕内容的变化,系统实时检测并输出配准结果,后台将对检测结果进行累计记录,以日志形式保存到本地。
2.根据权利要求1所述基于视觉稳定特征分类配准的多媒体导航仪测试方法,其特征在于:步骤一中当对多媒体导航仪上所有按键对应的显示界面拍摄时,由于后续算法已经针对环境和平台安装等情况的变化设计了余量来保证系统的稳定性,如无特殊情况,此步骤只需进行一次即可。
3.根据权利要求1所述基于视觉稳定特征分类配准的多媒体导航仪测试方法,其特征在于:步骤二中对采集的所有样本进行surf特征点检测过程中应保证检测参数一致,要求每个样本至少能提取到n个特征点。
4.根据权利要求3所述基于视觉稳定特征分类配准的多媒体导航仪测试方法,其特征在于:假设存在n个场景类别,某场景下提取到ki,其中i=1,2,3......n,则共有n*ki个特征点集,其中ki>n,每个特征点用64维向量描述。
5.根据权利要求1所述基于视觉稳定特征分类配准的多媒体导航仪测试方法,其特征在于:步骤七中当出现屏幕配准结果与预计不相符的情况时,系统将自动记录当前时间并保存这一帧图像,便于人工的进一步分析。
技术总结