一种金融设备语音交互方法以及系统与流程

专利2022-11-28  28


本发明涉及金融自助终端技术领域,特别是涉及一种金融设备语音交互方法以及系统。



背景技术:

随着金融自助设备和语音交互设备的广泛应用,在嘈杂环境中,设备会识别到错误或者无效的声音,并对无效声音进行回答,大大降低了客户体验度。



技术实现要素:

本发明的目的是针对现有技术中存在的技术缺陷,而提供一种金融设备语音交互方法以及系统。

为实现本发明的目的所采用的技术方案是:

一种金融设备语音交互系统的交互方法,包括步骤:

进行设备前面人与金融设备间的距离判断,若距离小于判定阈值,进行活体判断;若为活体,则启动人脸摄像头,判断声源方向;若为有效声源,则采集音频信号并转出音频文本;通过人脸识别判断人脸方向以及眼睛目光方向是否朝向设备;若朝向设备,开启唇语识别;唇语图像采集与唇语数据库比对,输出唇语文本;将音频文本与唇语文本对比,若对比通过,则对设备前面人对设备所发出的指令进行语义分析并回复。

优选的,通过超声波传感器和\或激光雷达来检测设备与设备前面人间的距离。

优选的,通过红外传感器进行活体判断。

优选的,通过麦克风阵列判断声源方向。

本发明的目的还在于提供一种金融设备语音交互系统,包括主控系统以及与所述主控系统连接的测距装置、红外传感器、人脸摄像头、麦克风阵列,喇叭,所述主控系统还通过无线模块连接到唇语数据库以及语义识别问答系统;

所述测距装置用于对设备前面人与金融设备间的距离进行判断,若距离小于判定阈值,通过红外传感器进行活体判断,若为活体,则开启人脸摄像头,通过麦克风阵列判断声源方向;若为有效声源,则采集音频信号并转出音频文本;通过人脸识别判断人脸方向以及眼睛目光方向是否朝向设备;若朝向设备,开启唇语识别;唇语图像采集与唇语数据库比对,输出唇语文本;将音频文本与唇语文本对比,若对比通过,则对设备前面人对设备所发出的指令进行语义分析并回复。

其中,所述测距离装置包括超声波传感器和\或激光雷达。

其中,所述语义识别问答系统包括语义识别模块以及问答数据库,所述语义识别模块与问答数据库。

其中,所述无线模块为wifi模块。

本发明解决了嘈杂环境下以及设备前两人或多人互相交流,不是与设备交流,设备乱说话问题,增强了客户体验度。

附图说明

图1是金融设备语音交互系统交互方法的流程图。

图2是金融设备语音交互系统结构原理图;

具体实施方式

以下结合附图和具体实施例对本发明作进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

如图1所示,本发明的一种金融设备语音交互系统的交互方法,包括步骤:

通过测距装置进行设备前面人与金融设备间的距离判断,若距离小于判定阈值,通过红外传感器进行活体判断,若为活体,则开启人脸摄像头,通过麦克风阵列判断声源方向;若为有效声源,则采集音频信号并转出音频文本;通过人脸识别判断人脸方向以及眼睛目光方向是否朝向设备;若朝向设备,开启唇语识别;唇语图像采集与唇语数据库比对,输出唇语文本;将音频文本与唇语文本对比,若对比通过,则对设备前面人对设备所发出的指令进行语义分析并回复。

本发明中,通过距离判断为有效的交流范围距离时,才进一步的开启红外传感器进行活体判断。通常情况下,语言交流通常距离是1.2米左右,阈值距离1.5。通过激光雷达测距和超声波测距,在阈值范围内,判定为语音交流距离,然后进一步的开启红外传感器进行活体判断,否则不开启下一步的交互。

本发明中,在判断为有效交流距离时,启动活体识别系统。具体是通过红外传感器来检测,判断设备前面人是否为活体,如是则打开人脸摄像头和音频识别功能,否则不打开人脸摄像头和音频识别功能。

本发明中,还进一步的通过麦克风阵列,判断声音来源方向。通过来声源角度判断是否是有效声音,若有效,将采集中音频转换成相应音频文本,否则不进行音频到文本的处理转换,不处理。

本发明中,还通过人脸识别中的人脸方向和人眼方向识别。通过人脸摄像头采集人脸后,通过人脸方向和人眼的目光方向识别,判断交流人是否面向设备,或者眼光是否关注设备。若人脸面向设备,眼睛目光朝向设备,判定为有效交流。则进行下一步的交互步骤,否则不再继续进行。

本发明通过以上的技术方案,能实现当嘈杂环境下以及设备前两人或多人互相交流,而非对设备进行交流,设备不会被接受的音频所干扰,设备能自主判断出有效音频信号,并对问题进行回答。

本发明中,在判断有效交流的基础上,还通过唇型判断说话内容。采集的的唇型通过与数据库进行分析对比,产生相应语言文本。将音频文本与唇语文本进行对比,判断音频文本是否设备前面的人的语音。

如图2所示,本发明还在于提供一种金融设备语音交互系统,包括主控系统以及与所述主控系统连接的测距装置、红外传感器、人脸摄像头、麦克风阵列,喇叭,所述主控系统还通过无线模块连接到唇语数据库以及语义识别问答系统。

其中,所述测距离装置包括超声波传感器和\或激光雷达。

其中,所述语义识别问答系统包括语义识别模块以及问答数据库,所述语义识别模块与问答数据库。

其中,所述无线模块为wifi模块。

本发明的上述的系统,通过激光雷达,超声波传感器进行距离判断;若距离小于判定阈值,红外传感器进行活体判断;若为活体,开启人脸摄像头和语音识别;语音识别通过麦克风阵列判断声源方向;对音频信号采集,转出文本;人脸识别判断人脸方向,眼睛目光方向,是否朝向设备;若人脸方向朝向设备,开启唇语识别;唇语图像采集与数据库进行比对,输出文本;音频文本与唇语文本对比。若对比通过,语音音频为设备前面人对设备发出的指令,进行语义分析,回复答案。

本发明通过以上的技术方案,能实现当嘈杂环境下以及设备前两人或多人互相交流,而非对设备进行交流,设备不会被接受的音频所干扰,设备能自主判断出有效音频信号,并对问题进行回答。

以上所述仅是本发明的优选实施方式,应当指出的是,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。


技术特征:

1.一种金融设备语音交互系统的交互方法,其特征在于,包括步骤:

进行设备前面人与金融设备间的距离判断,若距离小于判定阈值,进行活体判断;若为活体,则启动人脸摄像头,判断声源方向;若为有效声源,则采集音频信号并转出音频文本;通过人脸识别判断人脸方向以及眼睛目光方向是否朝向设备;若朝向设备,开启唇语识别;唇语图像采集与唇语数据库比对,输出唇语文本;将音频文本与唇语文本对比,若对比通过,则对设备前面人对设备所发出的指令进行语义分析并回复。

2.根据权利要求1所述金融设备语音交互方法,其特征在于,通过超声波传感器和\或激光雷达来检测设备与设备前面人间的距离。

3.根据权利要求1所述金融设备语音交互方法,其特征在于,通过红外传感器进行活体判断。

4.根据权利要求1所述金融设备语音交互方法,其特征在于,通过麦克风阵列判断声源方向。

5.一种所述金融设备语音交互系统,其特征在于,包括主控系统以及与所述主控系统连接的测距装置、红外传感器、人脸摄像头、麦克风阵列,喇叭,所述主控系统还通过无线模块连接到唇语数据库以及语义识别问答系统;

所述测距装置用于对设备前面人与金融设备间的距离进行判断,若距离小于判定阈值,通过红外传感器进行活体判断,若为活体,则开启人脸摄像头,通过麦克风阵列判断声源方向;若为有效声源,则采集音频信号并转出音频文本;通过人脸识别判断人脸方向以及眼睛目光方向是否朝向设备;若朝向设备,开启唇语识别;唇语图像采集与唇语数据库比对,输出唇语文本;将音频文本与唇语文本对比,若对比通过,则对设备前面人对设备所发出的指令进行语义分析并回复。

6.根据权利要求5所述金融设备语音交互系统,其特征在于,所述测距离装置包括超声波传感器和\或激光雷达。

7.根据权利要求5所述金融设备语音交互系统,其特征在于,所述语义识别问答系统包括语义识别模块以及问答数据库,所述语义识别模块与问答数据库。

8.根据权利要求5所述金融设备语音交互系统,其特征在于,所述无线模块为wifi模块。

技术总结
本发明公开一种金融设备语音交互方法以及系统。该方法包括:进行设备前面人与金融设备间的距离判断,若距离小于判定阈值,进行活体判断;若为活体,则启动人脸摄像头,判断声源方向;若为有效声源,则采集音频信号并转出音频文本;通过人脸识别判断人脸方向以及眼睛目光方向是否朝向设备;若朝向设备,开启唇语识别;唇语图像采集与唇语数据库比对,输出唇语文本;将音频文本与唇语文本对比,若对比通过,则对设备前面人对设备所发出的指令进行语义分析并回复。本发明解决了嘈杂环境下以及设备前两人或多人互相交流,不是与设备交流,设备乱说话问题,增强了客户体验度。

技术研发人员:田立刚
受保护的技术使用者:恒银金融科技股份有限公司
技术研发日:2019.12.20
技术公布日:2020.05.19

转载请注明原文地址: https://bbs.8miu.com/read-267707.html

最新回复(0)