一种用于屏幕上智能取景显示的方法及移动终端与流程

专利2022-06-29 57

本发明属于人工智能领域，具体为一种用于屏幕上智能取景显示的方法及移动终端。

背景技术：

当前的人工智能产业的发展浪潮，主要是源于深度学习算法的提出，在数据量和计算能力的基础上实现大规模计算，属于技术性突破。属于超级人工智能的，关于意识起源、人脑机理等方面的基础理论研究仍有继续突破的余地。

现今中国人工智能行业的创业公司发展领域各色各异，计算机视觉领域拥有最多创业公司，其次就是服务机器人领域，而排名第三的是语音及自然语言处理领域，智能医疗、机器学习、智能驾驶等也是相比比较热门的领域之一。计算机视觉技术是人工智能的重要核心技术之一，可应用到安防、金融、硬件、营销、驾驶、医疗等领域，而目前我国计算机视觉技术水平已达到全球领先水平，广泛的商业化渠道和技术基础是其成为最热门领域的主要原因。

人工智能产业链可以分为基础设施层、应用技术层和行业应用层。基础设施层：主要有基础数据提供商、半导体芯片供应商、传感器供应商和云服务商；应用技术层：主要有语音识别、自然语言处理、计算机视觉、深度学习技术提供商；行业应用层：主要是把人工智能相关技术集成到自己的产品和服务中，然后切入特定场景。目前来看，自动驾驶、医疗、安防、金融、营销等领域是业内人士普遍比较看好方向。

智能取景技术，依托于各种移动终端偏向全屏化与人工智能发展的高潮而出现。移动终端的全屏化，如果将屏后的景色适当的取景显示，使得移动终端变得透明化成为了可能。而取景显示就需要将原有拍摄的景物进行调焦放大，如果手动调焦放大是不可取的，因为手动操作是不精准的，而且人一旦移动，眼睛便会跟着移动，放大的区域就会改变，人工操作是反应不过来，而人工智能依托于反应速度快、操作精准而可以胜任这个工作。

技术实现要素：

为了解决手动放大取景调焦等无法精准实现显示目标的问题，本发明提出一种用于屏幕上智能取景显示的方法及移动终端，通过前置深度传感器采集人眼的空间坐标，智能分析人眼观测屏幕时视线的角度范围，再通过已知的后置摄像头的摄像角度范围，通过手机自动对焦取景，智能截取人眼观测范围，无需手动操作，自动调整屏幕显示。时刻采集人眼空间坐标，人移动位置也无需调整屏幕，智能取景；当边框足够窄时，屏幕达到隐身、以假乱真的效果。

本发明的技术解决方案是提供一种用于屏幕上智能取景显示的方法，包括以下步骤：

步骤1、确定移动终端参数；

确定移动终端屏幕长宽，移动终端厚度，后置广角摄像头的广角摄像区域以及前置深度传感器与后置广角摄像头方位距离；

步骤2、人脸识别，并获得目标人眼的空间坐标；

2.1)、前置深度传感器采集位于其前方的人脸三维图像；

2.2)、分析前置深度传感器采集的人脸三维图像，识别目标人脸信息及眼睛信息；

2.3)、根据目标人脸信息及眼睛信息，提取目标人眼的三维空间坐标，即眼睛位于前置深度传感器的方位以及距离；以屏幕为xy基准面，右上为正，前置深度传感器为坐标原点，屏幕前方为z轴正方向建立空间坐标系；

步骤3、确定视野观测区域；

由目标人眼的三维空间坐标建模，按照确定的移动终端参数，向屏幕四周投射，其所围困的区域即是视野观测区域；

步骤4、在广角摄像区域内截取视野观测区域；

在视野观测区域与广角摄像区域相交的区域内，以与xy基准面平行的l平面截取位于屏幕后方的视野观测区域，l平面定义为焦点所处的平面；

视野观测区域从眼睛方位往外延伸，当视野观测区域最开始全部位于广角摄像区域时，将此时l′平面到xy基准面的距离定义为最短智能取景距离，在最短智能取景距离之外的l平面中计算此时视野观测区域占广角摄像区域中的大小和位置，然后在l平面所在位置处截取与此时视野观测区域相同大小的图像并投屏，所述l平面与l′平面平行，且l平面与xy基准面的距离大于等于最短智能取景距离。

进一步地，步骤2.3)中将双眼连线中点的坐标作为人眼的三维空间坐标。

进一步地，为了精确地获得目标人脸信息，步骤2.2)中采用基于特征脸pca的人脸识别方法识别目标人脸信息。

本发明还提供一种用于屏幕上智能取景显示的移动终端，其特殊之处在于：包括硬件部分和软件部分；

所述硬件部分包括：前置深度传感器、屏幕及后置广角摄像头；

所述前置深度传感器用于采集位于其前方的人脸三维图像；

所述软件部分包括：人脸识别分析模块、眼睛坐标分析模块、视野观测区域分析模块及最短智能取景距离分析模块；

所述人脸识别分析模块用于通过分析前置深度传感器采集的人脸三维图像识别目标人脸信息及眼睛信息；

所述眼睛坐标分析模块用于根据目标人脸信息及眼睛信息，提取眼睛的三维空间坐标，即眼睛位于前置深度传感器的方位以及距离；

所述视野观测区域分析模块用于通过眼睛的三维空间坐标以及移动终端参数，如屏幕的位置、长宽、移动终端厚度，后置广角摄像头的广角摄像区域以及前置深度传感器与后置广角摄像头方位距离，确定眼睛观测屏幕所形成的视野观测区域，其中观察区域是不固定的，随眼睛移动而改变；

所述最短智能取景距离分析模块用于根据后置广角摄像头的广角摄像区域与视野观测区域的相交区域判断最短智能取景距离，小于此距离将会产生取景失真效果。

进一步地，所述前置深度传感器为tof摄像头。

与现有的技术相比，本发明的有益效果是：

(1)最自然的观测效果。

在不断刷新截取图像的屏幕中，会感受到屏幕中的物体会随观察的位置改变而改变，似乎所见之物就是实物而非图像。智能化显示人眼看到最真实的景象，达到最自然的观测效果。

(2)无需手动调整。

本发明前置深度传感器一直在检测人眼位置，只要cpu处理速度足够快，搭配基于特征脸的人脸识别方式(计算速度快)，就能够人在移动的时候，及时将拍摄到的景物进行准确取景。

(3)更智能化。

通过人脸识别，屏幕将过滤屏幕前其它人脸，避免被其它人脸干扰，从而正确显示使用者应看到的景物于屏幕上。

附图说明

图1为本发明的整体框架图；

图2为普通拍照的效果图；

图3为本发明的效果图；

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步的详细说明。此处所描述的具体实施例仅用于解释本发明技术方案，并不限于本发明。

本发明提出一种用于屏幕上智能取景显示的方法，包括以下步骤：

(1)将屏幕长宽，手机厚度，后置摄像头拍摄角度，传感器与后置摄像头方位距离等参数均计算出来；

(2)以屏幕为xy基准面，右上为正，前置深度传感器为坐标原点，屏幕前方为z轴正方向建立空间坐标系；

(3)如图1所示，前置传感器(如tof摄像头)采集前方的三维图像，只要人脸处于采集区域内(区域a)，就可以实现采集，采集后进行人脸识别，找出目标人脸，并计算目标人眼的空间坐标，该坐标可以由双眼连线中点代替；

(4)由已知人眼空间坐标建模，向显示屏幕四周投射，其所围困的区域即是人的视野区域；即图中的区域c，此区域与广角摄像区域(区域b)会交汇在一起，且广角摄像区域远远大于视野观测区域，所以广角摄像区域很容易包含全部的视野观测区域。

(5)以与平行基准面平行的l平面去截取位于屏幕后方的人眼观测区域；当广角摄像区域包含全部的视野观测区域时，将此时l′平面到xy基准面的距离定义为最短智能取景距离，其中l′平面与l平面与平行，摄像物体距离不得小于这个长度，则可以采用此种方法进行智能取景，否则会出现失真，即可以在l平面所在位置取景，l平面与xy基准面的距离大于等于最短智能取景距离。最短取景距离会随人眼移动而改变，人眼离屏幕越远，最短智能取景距离就越近，人眼与后置摄像头的连线与屏幕的倾角越大，最短智能取景距离也越近。图1中，此时l平面处于最短智能取景距离，l′平面与l平面重合。

相应的移动终端包括硬件部分和算法分析部分。硬件部分包括：前置深度传感器、屏幕、后置广角摄像头；算法分析部分包括：人脸识别分析模块、眼睛坐标分析模块、视野观测区域分析模块及最短智能取景距离分析模块。

本实施例中前置深度传感器可以是tof摄像头，也可以是其他类别的深度传感器，用于采集位于其前方的人脸三维图像；屏幕采用普通用于显示图像的显示器；后置广角摄像头拍摄屏幕后方的状况。人脸识别分析模块用于通过分析前置深度传感器采集的人脸三维图像识别目标人脸信息及眼睛信息；具体可采用基于特征脸(pca)的人脸识别方法，它是通过生成特征脸，其特征脸是由一组特征向量来表示；一组特征脸可以通过在一大组描述不同人脸的图像上进行主成分分析(pca)获得。任意一张人脸图像都可以被认为是这些标准脸的组合，智能取景只有当被采集人脸数据的人站在屏幕前，才能生效，这是避免同一场景下出现多个人脸，出现多个数据无法做出正确判断而准备。另外，由于人脸是通过一系列向量(每个特征脸一个比例值)而不是数字图像进行保存，可以节省很多存储空间，且运算速度快。眼睛坐标分析模块根据目标人脸信息及眼睛信息，提取眼睛的三维空间坐标，即眼睛位于前置深度传感器的方位以及距离。视野观测区域分析模块通过眼睛的三维空间坐标以及移动终端参数，如屏幕的位置、长宽、移动终端厚度，后置广角摄像头的广角摄像区域以及前置深度传感器与后置广角摄像头方位距离，确定眼睛观测屏幕所形成的视野观测区域。最短智能取景距离分析模块根据后置广角摄像头的广角摄像区域与视野观测区域的相交区域判断最短智能取景距离。

如图2所示，为普通方式拍摄效果图，这种方式由于拍摄范围广且屏幕不够大，则将看到的物体进行了缩小显示，与人眼所观看应有的大小不一致，视觉观看效果不好。如图3所示，为采取了本发明智能取景显示效果图，它将所拍摄的景物大小结合人眼因观测到景物大小效果向结合，进行了取景放大，并且可以随着人的移动而改变取景的位置，智能化显示人眼应该看到最真实的景象，以达到最自然的观测效果。

技术特征：

1.一种用于屏幕上智能取景显示的方法，其特征在于，包括以下步骤：

步骤1、确定移动终端参数；

确定移动终端屏幕长宽，移动终端厚度，后置广角摄像头的广角摄像区域以及前置深度传感器与后置广角摄像头方位距离；

步骤2、人脸识别，并获得目标人眼的空间坐标；

2.1)、前置深度传感器采集位于其前方的人脸三维图像；

2.2)、分析前置深度传感器采集的人脸三维图像，识别目标人脸信息及眼睛信息；

步骤3、确定视野观测区域；

由目标人眼的三维空间坐标建模，按照确定的移动终端参数，向屏幕四周投射，其所围困的区域即是视野观测区域；

步骤4、在广角摄像区域内截取视野观测区域；

在视野观测区域与广角摄像区域相交的区域内，以与xy基准面平行的l平面截取位于屏幕后方的视野观测区域，l平面定义为焦点所处的平面；

视野观测区域从眼睛方位往外延伸，当视野观测区域最开始全部位于广角摄像区域时，将此时与l平面平行的l′平面到xy基准面的距离定义为最短智能取景距离，在最短智能取景距离之外的l平面中计算此时视野观测区域占广角摄像区域中的大小和位置，然后在l平面所在位置处截取与此时视野观测区域相同大小的图像并投屏，所述l平面与xy基准面的距离大于等于最短智能取景距离。

2.根据权利要求1所述的用于屏幕上智能取景显示的方法，其特征在于：步骤2.3)中将双眼连线中点的坐标作为人眼的三维空间坐标。

3.根据权利要求1所述的用于屏幕上智能取景显示的方法，其特征在于：步骤2.2)中采用基于特征脸pca的人脸识别方法识别目标人脸信息。

4.一种用于屏幕上智能取景显示的移动终端，其特征在于：包括硬件部分和软件部分；

所述硬件部分包括：前置深度传感器、屏幕及后置广角摄像头；

所述前置深度传感器用于采集位于其前方的人脸三维图像；

所述软件部分包括：人脸识别分析模块、眼睛坐标分析模块、视野观测区域分析模块及最短智能取景距离分析模块；

所述人脸识别分析模块用于通过分析前置深度传感器采集的人脸三维图像识别目标人脸信息及眼睛信息；

所述眼睛坐标分析模块用于根据目标人脸信息及眼睛信息，提取眼睛的三维空间坐标，即眼睛位于前置深度传感器的方位以及距离；

所述视野观测区域分析模块用于通过眼睛的三维空间坐标以及移动终端参数，确定眼睛观测屏幕所形成的视野观测区域；

所述最短智能取景距离分析模块用于根据后置广角摄像头的广角摄像区域与视野观测区域的相交区域判断最短智能取景距离。

5.根据权利要求4所述的用于屏幕上智能取景显示的移动终端，其特征在于：所述前置深度传感器为tof摄像头。

技术总结
本发明属于人工智能领域，涉及一种用于屏幕上智能取景显示的方法及移动终端，解决手动放大取景调焦等无法精准实现显示目标的问题，通过前置深度传感器采集人眼的空间坐标，智能分析人眼观测屏幕时视线的角度范围，再通过已知的后置摄像头的摄像角度范围，通过手机自动对焦取景，智能截取人眼观测范围，无需手动操作，自动调整屏幕显示。时刻采集人眼空间坐标，人移动位置也无需调整屏幕，智能取景；当边框足够窄时，屏幕达到隐身、以假乱真的效果。

技术研发人员：谌春亮;夏俊驰;陈志军;谌琴钰;周琪
受保护的技术使用者：谌春亮
技术研发日：2020.03.20
技术公布日：2020.06.05

转载请注明原文地址: https://bbs.8miu.com/read-54380.html

专利

最新回复(0)