本发明涉及大数据领域,尤其涉及一种基于人机交互的数据处理方法、装置、设备及存储介质。
背景技术:
目前,人工智能作为新兴行业,近年来发展迅猛。随着人工智能技术的发展,诞生了越来越多的智能机器人。有服务于闲聊的娱乐型机器人、有类似于导购的前台机器人,也有服务于特定行业的业务型机器人。然而,传统智能问答机器人的问答数据库都是以关系型数据库建立,随着问答数据的增多,问题与答案之间的关系越复杂,查询效率越来越低。
因此,如何提高智能问答系统查询回复内容的效率是亟待解决的问题。
技术实现要素:
本发明的主要目的在于提供一种基于人机交互的数据处理方法,旨在解决如何提高智能问答系统查询回复内容的效率的技术问题。
为实现上述目的,本发明提供的一种基于人机交互的数据处理方法,所述数据处理方法包括以下步骤:
接收用户针对当前问题答复的语音数据并进行意图解析,以确定当前用户意图;
在预置标准问答知识库中定位当前问题对应的节点;
从所述节点对应的连接关系中,匹配与当前用户意图对应的目标连接关系,其中,一条所述连接关系对应问题的一个标准答案;
定位与所述目标连接关系相连的目标节点,并输出所述目标节点在预置标准问答知识库中对应的问题。
可选地,所述当前用户意图包括主干意图和非主干意图,所述主干意图表示用户正面答复所述当前问题,所述非主干意图表示用户侧面答复所述当前问题。
可选地,接收用户针对当前问题答复的语音数据并进行意图解析,以确定当前用户意图之前,包括:
获取预设应用场景关联的问题以及所述问题对应的标准答案,其中,一个问题至少对应两个标准答案,所述标准答案为主干意图的标准文字表达;
分别以各问题为节点、以各问题对应的标准答案作为连接各节点的连接关系,根据每个问题在预设应用场景中的提问顺序,通过所述标准答案将各问题连接成有向图,将所述有向图作为所述预置标准问答知识库。
可选地,所述接收用户针对当前问题答复的语音数据并进行意图解析,以确定当前用户意图包括:
接收语音数据并将所述语音数据输入预置语言识别模型进行语音识别,输出所述语音数据对应的文本信息;
对所述文本信息进行切词处理,得到多个切词片段;
依次将每个切词片段与预置知识词表进行匹配,得到至少一个概念标签,其中,所述概念标签用于映射切词片段的抽象概念;
对所述概念标签按照其对应的切词片段在所述文本信息中的表达顺序,按序排列并组合得到概念标签序列;
基于预置意图知识网络,对所述概念标签序列进行意图匹配,确定当前用户意图,其中,所述预置意图知识网络由每个所述概念标签与每个所述概念标签所对应的意图标签的关联关系构成。
可选地,所述基于预置意图知识网络,对所述概念标签序列进行意图匹配,确定当前用户意图包括:
分别将所述概念标签序列中的单个概念标签,或相邻的至少两个概念标签构成的组合标签,与所述预置意图知识网络进行匹配;
若存在概念标签匹配到意图标签,则获取所述意图标签并将所述意图标签与尚未进行匹配的概念标签合并为新的概念标签序列,对该新的概念标签序列继续进行意图标签匹配,直到当前概念标签序列中的全部概念标签匹配完毕或匹配不到意图标签为止,输出最终匹配结果,其中,所述最终匹配结果为一个或多个意图标签组合而成的意图标签集;
以所述最终匹配结果确定当前用户意图。
可选地,所述数据处理方法还包括:
若匹配不出与当前用户意图对应的目标连接关系,则判定所述当前用户意图为非主干意图,查询预置通用问答知识库是否存在与当前用户意图对应的非标准答案,其中,所述预置通用问答知识库为存储预设应用场景关联的非主干意图对应的非标准答案以及所述非标准答案关联的答复内容的数据库,所述非标准答案表示用户非主干意图的标准文字表达;
若所述预置通用问答知识库存在与当前用户意图对应的非标准答案,则输出与所述非标准答案关联的答复内容;
若所述预置通用问答知识库不存在与当前用户意图对应的非标准答案,则输出预置应答内容。
进一步地,为实现上述目的,本发明还提供一种基于人机交互的数据处理装置,所述数据处理装置包括:
解析模块,用于接收用户针对当前问题答复的语音数据并进行意图解析,以确定当前用户意图;
定位模块,用于在预置标准问答知识库中定位当前问题对应的节点;
匹配模块,用于从所述节点对应的连接关系中,匹配与当前用户意图对应的目标连接关系,其中,一条所述连接关系对应问题的一个标准答案;
第一输出模块,用于定位与所述目标连接关系相连的目标节点,并输出所述目标节点在预置标准问答知识库中对应的问题。
可选地,所述数据处理装置包括:
获取模块,用于获取预设应用场景关联的问题以及所述问题对应的标准答案,其中,一个问题至少对应两个标准答案,所述标准答案为主干意图的标准文字表达;
建立模块,用于分别以各问题为节点、以各问题对应的标准答案作为连接各节点的连接关系,根据每个问题在预设应用场景中的提问顺序,通过所述标准答案将各问题连接成有向图,将所述有向图作为所述预置标准问答知识库。
可选地,所述解析模块包括:
识别单元,用于接收语音数据并将所述语音数据输入预置语言识别模型进行语音识别,输出所述语音数据对应的文本信息;
切词单元,用于对所述文本信息进行切词处理,得到多个切词片段;
标注单元,用于依次将每个切词片段与预置知识词表进行匹配,得到至少一个概念标签,其中,所述概念标签用于映射切词片段的抽象概念;
排列单元,用于对所述概念标签按照其对应的切词片段在所述文本信息中的表达顺序,按序排列并组合得到概念标签序列;
匹配单元,用于基于预置意图知识网络,对所述概念标签序列进行意图匹配,确定当前用户意图,其中,所述预置意图知识网络由每个所述概念标签与每个所述概念标签所对应的意图标签的关联关系构成。
可选地,所述匹配单元包括:
匹配子单元,用于分别将所述概念标签序列中的单个概念标签,或相邻的至少两个概念标签构成的组合标签,与所述意图知识网络进行匹配;
输出子单元,用于若存在概念标签匹配到意图标签,则获取所述意图标签并将所述意图标签与尚未进行匹配的概念标签合并为新的概念标签序列,对该新的概念标签序列继续进行意图标签匹配,直到当前概念标签序列中的全部概念标签匹配完毕或匹配不到意图标签为止,输出最终匹配结果,其中,所述最终匹配结果为一个或多个意图标签组合而成的意图标签集;
确定子单元,用于以所述最终匹配结果确定当前用户意图。。
可选地,所述数据处理装置包括:
查询模块,用于若匹配不出与当前用户意图对应的目标连接关系,则判定所述当前用户意图为非主干意图,查询预置通用问答知识库是否存在与当前用户意图对应的非标准答案,其中,所述预置通用问答知识库为存储预设应用场景关联的非主干意图对应的非标准答案以及所述非标准答案关联的答复内容的数据库,所述非标准答案表示用户非主干意图的标准文字表达;
第二输出模块,用于若所述预置通用问答知识库存在与当前用户意图对应的非标准答案,则输出与所述非标准答案关联的答复内容;
第三输出模块,用于若所述预置通用问答知识库不存在与当前用户意图对应的非标准答案,则输出预置应答内容。
进一步地,为实现上述目的,本发明还提供一种基于人机交互的数据处理设备,所述数据处理设备包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的数据处理程序,所述数据处理程序被所述处理器执行时实现如上述任一项所述的数据处理方法的步骤。
进一步地,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有数据处理程序,所述数据处理程序被处理器执行时实现如上述任一项所述的数据处理方法的步骤。
本发明基于预先以图库的构建方式建立问答知识库,接收用户针对当前问题答复的语音数据并进行意图解析,以确定当前用户意图,在预置标准问答知识库中定位当前问题的节点,从所述节点对应的连接关系中,匹配与当前用户意图对应的连接关系,定位与所述连接关系相连的下一节点,并输出该节点的文字描述信息作为回复用户的答复内容。本发明相比传统技术中以关系表的形式构建问答知识库来说,查询回复内容不需要繁杂的关系表,只需定位当前问题节点,匹配与用户意图对应连接关系的下一节点的文字描述信息,更快速的输出回复内容,提升用户体验。
附图说明
图1为本发明实施例方案涉及的基于人机交互的数据处理设备运行环境的结构示意图;
图2为本发明基于人机交互的数据处理方法第一实施例的流程示意图;
图3为本发明基于人机交互的数据处理方法第二实施例的流程示意图;
图4为图2中步骤s20一实施例的细化流程示意图;
图5为图4中步骤s205一实施例的细化流程示意图;
图6为本发明基于人机交互的数据处理方法第三实施例的流程示意图;
图7为本发明基于人机交互的数据处理装置一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本发明提供一种数据处理设备。
参照图1,图1为本发明实施例方案涉及的基于人机交互的数据处理设备运行环境的结构示意图。
如图1所示,该数据处理设备包括:处理器1001,例如cpu,通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard),网络接口1004可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。存储器1005可以是高速ram存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的数据处理设备的硬件结构并不构成对数据处理设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机可读存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及计算机程序。其中,操作系统是管理和控制数据处理设备和软件资源的程序,支持数据处理程序以及其它软件和/或程序的运行。
在图1所示的数据处理设备的硬件结构中,网络接口1004主要用于接入网络;用户接口1003主要用于侦测确认指令和编辑指令等。而处理器1001可以用于调用存储器1005中存储的数据处理程序,并执行以下数据处理方法的各实施例的操作。
基于上述数据处理设备硬件结构,提出本发明数据处理方法的各个实施例。
参照图2,图2为本发明基于人机交互的数据处理方法第一实施例的流程示意图。本实施例中,所述数据处理方法包括以下步骤:
步骤s10:接收用户针对当前问题答复的语音数据并进行意图解析,以确定当前用户意图;
人工智能作为新兴行业,进来发展迅猛。伴随着人工智能技术的发展与进步,各大科技企业相继推出智能机器人产品,其中,用于问答的智能机器人的核心技术是根据预置的问答知识库,输出对应的答复内容,而传统的问答知识库是基于问答数据中问题与答案的关系按关系型数据库建立问答知识库,这种方法建立的问答知识库随着问答数据的增加和问答关系的复杂,终会变得不堪重负,导致需要花费较长时间才能做出应答。
本实施例中,接收用户针对所述第一问题的答复语音,对所述答复语音进行意图解析,从意图解析数据中确定当前用户意图。进一步地,由于同一个意图的表述形式有很多,例如,用户回答的内容存在正面回答该问题的肯定意图“有”和否定意图“没有”等主干意图,也存在用户侧面答复该问题的非主干意图,如“没时间了解保险产品”、“不知道自己是否需要”等。所以需要预先根据具体业务场景,对用户针对每个问题可能出现的意图进行分类,分别建立主干意图库和非主干意图所对应的标准问答知识库和非标准问答知识库,然后根据用户意图,查询答复用户的应答内容。需要注意的是,意图是指系统为了明确用户意愿而抽象提炼出来的,是在一个对话任务中要理解的用户想法。
此外,在用户的话语中明确出现了表达意图的一类词汇,比如:“希望”、“想要”、“需要”等等,因而只需要识别出这些固定的意图特征词汇,再与句子中的其他成分作联系即可。比如用户输入“我想预定到北京的机票”,机器人可以识别出“我想”和“北京的机票”,然后在预置的知识数据库进行相关匹配处理。
例如,现在有些聊天机器人能够在用户的问题中识别出用户的意图,如订机票或酒店的场景中,机器人与用户聊天时,机器人接收用户输入的语音数据,将所述语音数据通过自然语言技术转化成文本信息,然后基于所述文本信息,在预设标准问答知识库中进行比对,查询是否存在用户所表达的意图对应的答案,然后输出查询结果。
步骤s20:在预置标准问答知识库中定位当前问题对应的节点;
本实施例中,在预置标准问答知识库中,首先确定当前所处流程环节,然后确定当前输出的问题,进而定位当前问题的节点。在所述标准问答知识库中,根据具体业务场景,由业务方长期的工作经验中统计并在得出初版后根据实际机器人工作场景的情形对意图库做优化和补充,得到不同流程环节的问答知识,其中,可能在不同流程环节中存在相同的问题题目,或存在相同用户意图的连接关系,因而在查询回复当前用户意图对应关系的下一节点内容时需先确定当前问题的节点。
步骤s30:从所述节点对应的连接关系中,匹配与当前用户意图对应的目标连接关系,其中,一条所述连接关系对应问题的一个标准答案;
本实施例中,针对每个问题,用户会有不同的意图,不同的意图对应该问题不同的答案。一个问题的答案在预置的问答知识库以连接上下问题的连接关系表示,所以在定位出当前问题所处节点后,在该节点的下属连接关系中,匹配出与当前用户意图对应的目标连接关系。
例如,在咨询用户是否有购买车险的意向的场景中,预设问题的标准答案有“有意愿”或“无意愿”两种意图,针对“有意愿”的意图,对应的标准答案有“需要购买”、“想购买”等表达;针对“无意愿”对应的标准答案有“不需要”、“不想”等表达,而具体的而两种常用答案也会引发不同的下一个问题,如用户回答“有意愿”的意图表达,则获取与“有意愿”意图对应的连接关系的下一节点的问题,如询问用户户“目前有时间吗,为您介绍我司的最新车险产品”等;若用户表达“无意愿”,则获取与“无意愿”意图对应的目标连接关系的下一节点的问题,如询问用户“有无其他保险需要”或“那不打扰您了”。
步骤s40:定位与所述目标连接关系相连的目标节点,并输出所述目标节点在预置标准问答知识库中对应的问题。
本实施例中,定位于所述连接关系相连的下一节点,该节点的文字描述信息与上一个问题和当前用户意图存在因果关系。根据用户意图的不同,在场景对话中会引发不同的问题,就像关于提问方提问“吃饭了吗”,对于标准答案中,回答方会有“正要去吃”和“已经吃了”,那么当提问方收到第一个意图“正要去吃”时,会引发提问方问回答方“打算或准备去吃什么”、“跟谁去吃”、“去哪吃呢”等问题,而如果提问方收到第二个意图“已经吃了”时,那么会引发提问方提问“吃什么了”、“跟谁吃的”、“在哪吃的”等问题,所以不同的意图,会引发不同的下一个问题,而引发的问题就会成为提问方在收到回答方所回答的内容之后,接下来提问的内容,基于这种关系,从预设的标准问答知识库中获取用户回答的所述第一答案关联的下一个节点设置的应答内容或操作。
例如,关于智能机器人提问“吃饭了没”,收到用户回答“吃过了”的意图表达,其中,“吃过了”的意图表达不限,则查询“吃饭了没”的问题所在节点,若在标准问答知识库中查询到所述节点,则识别所述节点中与意图“吃过了”相符的连接关系,获取所述连接关系对应的下一节点的文字描述内容并输出。
本实施例基于预先以图库的构建方式建立问答知识库,接收用户针对当前问题答复的语音数据并进行意图解析,以确定当前用户意图,在预置标准问答知识库中定位当前问题的节点,从所述节点对应的连接关系中,匹配与当前用户意图对应的连接关系,定位与所述连接关系相连的下一节点,并输出该节点的文字描述信息作为回复用户的答复内容。本发明相比传统技术中以关系表的形式构建问答知识库来说,查询回复内容不需要繁杂的关系表,只需定位当前问题节点,匹配与用户意图对应连接关系的下一节点的文字描述信息,更快速的输出回复内容,提升用户体验。
进一步地,在本发明基于人际交互的数据处理方法中,所述当前用户意图包括主干意图和非主干意图,所述主干意图表示用户正面答复所述当前问题,所述非主干意图表示用户侧面答复所述当前问题。
本实施例中,由于同一个意图的表述形式有很多,例如用户针对“有没购买保险的需要”的问题,用户回答的内容存在正面回答该问题的肯定意图“有”和否定意图“没有”等主干意图,也存在用户侧面答复该问题的非主干意图,如“没时间了解保险产品”、“不知道自己是否需要”等。所以需要预先根据具体业务场景,对用户针对每个问题可能出现的意图进行分类,分别建立主干意图库和非主干意图所对应的标准问答知识库和非标准问答知识库,然后根据用户意图,查询答复用户的应答内容。
参照图3,图3为本发明基于人机交互的数据处理方法第二实施例的流程示意图。本实施例中,在上述步骤s10之前,还包括:
步骤s001:获取预设应用场景关联的问题以及所述问题对应的标准答案,其中,一个问题至少对应两个标准答案,所述标准答案为主干意图的标准文字表达;
步骤s002:分别以各问题为节点、以各问题对应的标准答案作为连接各节点的连接关系,根据每个问题在预设应用场景中的提问顺序,通过所述标准答案将各问题连接成有向图,将所述有向图作为所述预置标准问答知识库。
本实施例中,不同的应用场景存在不同的问答数据。例如,在房产销售的应用场景中,销售人员与用户之间的问答内容会跟房产相关,如房子的类型、价格、位置等;在保险销售的应用场景中销售人员与用户之间的问答内容会跟保险相关,如保险的范围、理赔费率、保费保期等。随着智能问答机器人的推出,以智能机器人代替销售人员,为用户提供咨询服务,其中,常用问题及相关答复内容可从工作人员的日常工作中收集,然后由专家进行优化,进而得到标准的常用问答数据。
需要注意的是,工作人员在为用户提供咨询服务或销售服务的时候,根据用户答复内容所表达的意图,会引发销售人员回答或提出不一样的内容或问题,所以基于应用场景的问题与对应用户意图的答案之间存在一定的逻辑关系,整理每个常用问题与对应用户意图的答案之间的关系后,以各常用问题作为节点,各常用问题对应的答案作为连接各问题节点的关系,构建标准问答知识库。其中,所述标准问答知识库中,每个问题之间只有一个答案进行连接,以表示下一问题是由上一个问题其中一个答案所引发出的,而一个问题存在多个答案,每个答案只能引发一个问题,用户意图对应一个答案。
参照图4,图4为图2中步骤s20的细化流程示意图。本实施例中,上述步骤s30进一步包括:
步骤s201:接收语音数据并将所述语音数据输入预置语言识别模型进行语音识别,输出所述语音数据对应的文本信息;
本实施例中,为方便通过识别用户的语音答复,预先获取工作人员日常工作中与用户对话的语音训练数据,基于所述语音训练数据,训练一个语音识别模型。基于训练好的语音识别模型,接收用户针对当前问题作出答复的语音数据之后,将所语音数据输入语音识别模型进行语音识别,得到所述语音数据的文本信息。
步骤s202:对所述文本信息进行切词处理,得到多个切词片段;
本实施例中,对所述文本信息进行切词,可以利用现有技术中的任一种切词算法进行切词,得到多个切词片段。例如,通过n-gram切词算法对待自然语言文本“张先生需不需要车险”进行切词,得到切词片段分别为“张先生”、“需不需要”、“车险”。
步骤s203:依次将每个切词片段与预置知识词表进行匹配,得到至少一个概念标签,其中,所述概念标签用于映射切词片段的抽象概念;
本实施例中,基于切词片段,查询预置知识词库,匹配每个切词片段的概念,如果无法识别其中个别切词片段对应的概念,则跳过该切词片段,继续识别下一个切词片段,至少识别出一个切词片段对应的概念,并对匹配得到的概念对切词片段进行概念标注,得到分词片段的概念标签。需要注意的是,一个分词在一个问题中对应的概念至少一个,因此最终可得到至少一个概念标签,其中,所述概念标签用于映射切词片段的抽象概念。此外,由于不可能将所有可能出现的切词片段对应的概念标签都存入预置的知识词表,所以存在个别切词片段未能匹配到概念标签,因而会出现个别切词片段无法识别。例如,切词片段“张先生”对应抽象的概念是用户,因此切词片段“张先生”对应的概念标签即为“用户”,同理,“需不要要”对应的概念标签是“需要”、“不需要”,“车险”对应的概念标签为“保险”。
步骤s204:对所述概念标签按照其对应的切词片段在所述文本信息中的表达顺序,按序排列并组合得到概念标签序列;
本实施例中,对上述步骤得到的概念标签按照其对应的切词片段在所述文本信息中的表达顺序,按序进行排列组合,得到多个不冲突的概念标签序列,即为同一文本中,同一个序列中只能出现一个概念标签所覆盖的切词。例如,切词片段“需不需要”对应的概念标签为“需要”、“不需要”,因此需要将这两个概念标签分到不同的概念标签中。例如,切词片段“张先生”、“需不需要”、“车险”对应的概念标签序列分别为“用户、需要、保险”和“用户、不需要、保险”两种概念。
步骤s205:基于预置意图知识网络,对所述概念标签序列进行意图匹配,确定当前用户意图,其中,所述所述预置意图知识网络由每个所述概念标签与每个所述概念标签所对应的意图标签的关联关系构成。
本实施例中,所述预先建立的意图知识网络是将现实世界的意图通过人的日常描述语言,映射生成的意图知识网络。具体的,意图知识网络中包括当前应用场景不同问题对应的意图表达集合,每种意图表达以标签的形式存储在意图知识网络中,且不同问题对应的意图标签集合之间相互关联。其中,每个意图标签集合中会记载与问题相关的、可能存在的意图标签集合,以及那些概念标签会与这些意图标签有关联。例如,对于保险,有询问保险保期、险种、保费等意图。
因而,只需将每个概念标签序列中的概念标签分别与意图知识网络进行匹配即可确定用户的真实意图。
参照图5,图5为图4中步骤s205一实施例的细化流程示意图。本实施例中,上述步骤s205包括:
骤s2051:分别将所述概念标签序列中的单个概念标签,或相邻的至少两个概念标签构成的组合标签,与所述意图知识网络进行匹配;
本实施例中,分别将概念标签序列中的单个概念标签,与意图知识网络进行匹配,或将相邻多个概念标签与所述意图知识网络进行匹配。其中,考虑到可能存在部分意图标签需要多个概念标签组合才能匹配得到,因而将相邻多个概念标签组合,进而与所述意图知识网络进行匹配。例如,对于文本“张先生需不需要车险”经过切词和概念标签后对应的概念标签序列分别为“用户、需要、保险”和“用户、不需要、保险”。而“用户、不需要、保险”还可能是“用户、不、需要、保险”,那么其中的“不、需要”的相邻概念标签就需要组合,才能匹配出“不需要”的意图标签。将“用户、需要、保险”与意图知识网络进行匹配,以便推导该概念标签序列对应的用户意图;再将“用户、不需要、保险”与意图知识网络进行匹配,以便推导该概念标签序列对应的用户意图。
需要注意的是,按照与所述文本相同的表达顺序,目的是正确匹配用户意图,因为若将概念标签顺序打乱,则不符合人类自然语言的表达习惯,自然地,对乱序的概念标签进行匹配也不会匹配出正确的意图结果。
步骤s2052:若存在概念标签匹配到意图标签,则获取所述意图标签并将所述意图标签与尚未进行匹配的概念标签合并为新的概念标签序列,对该新的概念标签序列继续进行意图标签匹配,直到所述概念标签序列中的全部概念标签匹配完毕或匹配不到意图标签为止,输出最终匹配结果,其中,所述最终匹配结果为一个或多个意图标签组合而成的意图标签集;
步骤s2053:以所述最终匹配结果确定当前用户意图。
本实施例中,对于第一个概念标签序列“用户、需要、保险”,根据概念标签“用户”和“需要”与意图知识网络的匹配结果,确定有“需要”的意图标签,则获取该意图标签,即“需要”意图标签,并返回用户对应的概念标签“用户”;将概念标签“用户”、意图标签“需要”和未进行匹配的概念标签“保险”合并为新的概念标签序列,并与意图知识网络进行匹配,得出“用户需要保险”的意图标签。此时概念标签全部使用,无法继续匹配,则确定最终意图为“需要保险”意图。
参照图6,图6为本发明基于人机交互的数据处理方法第三实施例的流程示意图。
步骤s60:若匹配不出与当前用户意图对应的目标连接关系,则判定所述当前用户意图为非主干意图,查询预置通用问答知识库是否存在与当前用户意图对应的非标准答案,其中,所述预置通用问答知识库为存储预设应用场景关联的非主干意图对应的非标准答案以及所述非标准答案关联的答复内容的数据库,所述非标准答案表示用户非主干意图的标准文字表达;
本实施例中,由于现实应用场景中,用户的意图表达非常多,不可能将用户的所有意图都配置到标准问答知识库中,因此存在标准问答知识库中,没有当前用户意图对应的目标连接关系,即表示用户所答复的内容所表达的意图不是主干意图,则调用接口查询预置的通用问答知识库,所述通用问答知识库中存储有用户对于标准问答知识库中每个问题可能出现的非主干意图所对应的非标准答案,所述非标准答案即为非主干意图的标准文字表达。
进一步地,在现实应用场景中,用户针对一个问题除了主干意图之外,还存在非主干意图,此处的非主干意图指主干意图之外的意图,如在“有无意愿购买车险”的问题中,用户除了“有意愿”和“无意愿”两种主干意图对应的标准答案之外,还可能会回答“没钱”、“没空了解”、“已购买”等非主干意图对应的非标准答案,针对这种情况,将这类非主干意图的数据从常用问答数据中抽离,并基于各非主干意图与对应问题之间的关系,建立关系表作为通用问答知识库。
例如,在“有无意愿购买车险”的问题中,用户除了“有意愿”和“无意愿”两种标准答案之外,还可能会回答“没钱”、“没空了解”、“已购买”等非标准答案,筛选出“没钱”、“没空了解”、“已购买”等非标准答案,建立非标准答案“没钱”、“没空了解”、“已购买”与问题“有无意愿购买车险”的关联表,当用户答案在问答知识库中为匹配到相应答案时,则在所述通用问答知识库。
步骤s70:若所述预置通用问答知识库存在与当前用户意图对应的非标准答案,则输出与所述非标准答案关联的答复内容;
步骤s80:若所述预置通用问答知识库不存在与当前用户意图对应的非标准答案,则输出预置应答内容。
本实施例中,若在标准问答知识库中查询不到与当前用户意图对应的连接关系,表示用户当前答复内容所表达的意图为非主干意图,则查询所述通用问答知识库,确定所述通用问答知识库中是否存在与当前用户意图对应的非标准答案,若所述通用问答知识库存在与当前用户意图对应的非标准答案,则输出与所述非标准答案关联的答复内容。若所述通用问答知识库中不存在当前用户意图对应的非标准答案,则表明通用问答知识库中未配置与当前用户意图对应的非标准答案,也即未配置有关联的回复内容,则输出预先设置的统一应答内容。
例如,某一节点为询问用户“有无意愿购买车险”的问题,在标准问答知识库中该节点的预设标准答案对应意图为“有意愿”和“无意愿”,若当前接收到的用户意图为“没钱”,则所述标准问答知识库中当前问题节点不存在与当前用户意图对应的答案,则查询通用问答知识库中是否存在与“没钱”对应的非标准答案,而查询到通用问答知识库中询问用户“有无意愿购买车险”问题的节点预设有“没钱”、“没空了解”、“已购买”等意图对应的非标准答案,因而在通用问答知识库中匹配用户意图“没钱”的关联的应答内容,其中应答内容可能是“这份保险不需要多少钱,这边有个优惠...”等,此外,还可能是内容“那就不打扰您了”,结束本次服务。
本发明还提供一种数据处理装置。
参照图7,图7为本发明基于人机交互的数据处理装置一实施例的功能模块示意图。本实施例中,所述数据处理装置包括:
解析模块10,用于接收用户针对当前问题答复的语音数据并进行意图解析,以确定当前用户意图;
定位模块20,用于在预置标准问答知识库中定位当前问题对应的节点;
匹配模块30,用于从所述节点对应的连接关系中,匹配与当前用户意图对应的目标连接关系,其中,一条所述连接关系对应问题的一个标准答案;
第一输出模块40,用于定位与所述目标连接关系相连的目标节点,并输出所述目标节点在预置标准问答知识库中对应的问题。
本实施例中,解析模块10接收用户针对当前问题答复的语音数据并进行意图解析,以确定当前用户意图,定位模块20在预置标准问答知识库中定位当前问题对应的节点,第一匹配模块30从所述节点对应的连接关系中,匹配与当前用户意图对应的目标连接关系,第一输出模块40定位与所述目标连接关系相连的目标节点,并输出所述目标节点在预置标准问答知识库中对应的问题。
本发明还提供一种计算机可读存储介质。
本实施例中,所述计算机可读存储介质上存储有数据处理程序,所述数据处理程序被处理器执行时实现如上述任一项实施例中所述的数据处理方法的步骤。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,这些均属于本发明的保护之内。
1.一种基于人机交互的数据处理方法,其特征在于,所述数据处理方法包括:
接收用户针对当前问题答复的语音数据并进行意图解析,以确定当前用户意图;
在预置标准问答知识库中定位当前问题对应的节点;
从所述节点对应的连接关系中,匹配与当前用户意图对应的目标连接关系,其中,一条所述连接关系对应问题的一个标准答案;
定位与所述目标连接关系相连的目标节点,并输出所述目标节点在预置标准问答知识库中对应的问题。
2.如权利要求1所述的数据处理方法,其特征在于,所述当前用户意图包括主干意图和非主干意图,所述主干意图表示用户正面答复所述当前问题,所述非主干意图表示用户侧面答复所述当前问题。
3.如权利要求2所述的数据处理方法,其特征在于,在所述接收用户针对当前问题答复的语音数据并进行意图解析,以确定当前用户意图的步骤之前,还包括:
获取预设应用场景关联的问题以及所述问题对应的标准答案,其中,一个问题至少对应两个标准答案,所述标准答案为主干意图的标准文字表达;
分别以各问题为节点、以各问题对应的标准答案作为连接各节点的连接关系,根据每个问题在预设应用场景中的提问顺序,通过所述标准答案将各问题连接成有向图,将所述有向图作为所述预置标准问答知识库。
4.如权利要求1所述的数据处理方法,其特征在于,所述接收用户针对当前问题答复的语音数据并进行意图解析,以确定当前用户意图包括:
接收语音数据并将所述语音数据输入预置语言识别模型进行语音识别,输出所述语音数据对应的文本信息;
对所述文本信息进行切词处理,得到多个切词片段;
依次将每个切词片段与预置知识词表进行匹配,得到至少一个概念标签,其中,所述概念标签用于映射切词片段的抽象概念;
对所述概念标签按照其对应的切词片段在所述文本信息中的表达顺序,按序排列并组合得到概念标签序列;
基于预置意图知识网络,对所述概念标签序列进行意图匹配,确定当前用户意图,其中,所述预置意图知识网络由每个所述概念标签与每个所述概念标签所对应的意图标签的关联关系构成。
5.如权利要求4所述的数据处理方法,其特征在于,所述基于预置意图知识网络,对所述概念标签序列进行意图匹配,确定当前用户意图包括:
分别将所述概念标签序列中的单个概念标签,或相邻的至少两个概念标签构成的组合标签,与所述预置意图知识网络进行匹配;
若存在概念标签匹配到意图标签,则获取所述意图标签并将所述意图标签与尚未进行匹配的概念标签合并为新的概念标签序列,对该新的概念标签序列继续进行意图标签匹配,直到所述概念标签序列中的全部概念标签匹配完毕或匹配不到意图标签为止,输出最终匹配结果,其中,所述最终匹配结果为一个或多个意图标签组合而成的意图标签集;
以所述最终匹配结果确定当前用户意图。
6.如权利要求2所述的数据处理方法,其特征在于,所述数据处理方法还包括:
若匹配不出与当前用户意图对应的目标连接关系,则判定所述当前用户意图为非主干意图,查询预置通用问答知识库是否存在与当前用户意图对应的非标准答案,其中,所述预置通用问答知识库为存储预设应用场景关联的非主干意图对应的非标准答案以及所述非标准答案关联的答复内容的数据库,所述非标准答案为非主干意图的文字表达;
若所述预置通用问答知识库存在与当前用户意图对应的非标准答案,则输出与所述非标准答案关联的答复内容;
若所述预置通用问答知识库不存在与当前用户意图对应的非标准答案,则输出预置应答内容。
7.一种基于人机交互的数据处理装置,其特征在于,所述数据处理装置包括:
解析模块,用于接收用户针对当前问题答复的语音数据并进行意图解析,以确定当前用户意图,所述用户意图包括主干意图和非主干意图,所述主干意图包括肯定意图和否定意图;
定位模块,用于在预置标准问答知识库中定位当前问题对应的节点;
匹配模块,用于从所述节点对应的连接关系中,匹配出与当前用户意图对应的目标连接关系,其中,一条所述连接关系对应问题的一个标准答案;
第一输出模块,用于定位与所述目标连接关系相连的目标节点,并输出所述目标节点在预置标准问答知识库中对应的问题。
8.如权利要求7所述的数据处理装置,其特征在于,所述数据处理装置还包括:
获取模块,用于获取预设应用场景关联的问题以及所述问题对应的标准答案,其中,一个问题至少对应两个标准答案,所述标准答案为表示用户主干意图的标准文字表达;
建立模块,用于分别以各问题为节点、以各问题对应的标准答案作为连接各节点的连接关系,根据每个问题在预设应用场景中的提问顺序,通过所述标准答案将各问题连接成有向图,将所述有向图作为所述预置标准问答知识库。
9.一种基于人机对话的数据处理设备,其特征在于,所述数据处理设备包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的数据处理程序,所述数据处理程序被所述处理器执行时实现如权利要求1-6中任一项所述的基于人机交互的数据处理方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有数据处理程序,所述数据处理程序被处理器执行时实现如权利要求1-6中任一项所述的基于人机交互的数据处理方法的步骤。
技术总结