对话训练方法、装置、系统及存储介质与流程

专利2022-06-30  53


本发明涉及人工智能技术领域,尤其涉及一种对话教练方法、装置、系统及计算机可读存储介质。



背景技术:

各行各业都有销售人员,并且销售人员在服务于客户的活动中都扮演着重要的角色,尤其在零售业,销售人员作为与顾客面对面沟通的第一线人员,其话语及语调等会直接影响到顾客购物的结果。尤其是现在的电话销售,坐席通过电话与顾客联系推荐产品,这就更加考验销售坐席的交流方式了,而这些交流方式都是需要时间的积累和不断地实践总结才能获得,这就需要要求销售人员必须要通过岗前的技能培训才能上岗。

针对于岗前培训,目前的机器培训已经实现了机器人对话的方式进行培训,但是当前的机器人对话,智能基于简单的语言和单一的场景进行对话训练,对于逻辑复杂和多轮对话的情况下,则无法实现训练,还是需要回归到人工培训或者是实际销售中来实现。对此基于现有的训练方式,其场景过于单一,难以做到根据对话场景进行灵活应对,导致人员上岗成功率不高的现象。



技术实现要素:

本发明的主要目的在于提供一种对话训练方法、装置、系统及计算机可读存储介质,旨在解决现有坐席训练方式,成本过高,且训练场景单一的技术问题。

为实现上述目的,本发明提供一种对话训练方法,应用于对话教练系统,所述对话训练方法包括以下步骤:

实时获取坐席的说辞信息,其中,所述说辞信息包括所述坐席根据所述对话教练系统的应答请求回复的第一语音片段和/或所述坐席向所述对话教练系统推荐业务的第二语音片段;

采用语音识别技术提取所述说辞信息中的第一语音片段和/或第二语音片段的音频信息,并将所述音频信息转换成文字信息;

将所述文字信息输入至预设的对话分析模型中进行对话的匹配分析,以识别出与所述音频信息对应的对话回应策略;

将识别出的所述对话回应策略输入预先训练好的应对话术推荐模型中进行分析,以得到对应的回应语言;

将所述回应语言转换为语音流并进行广播,以回应所述坐席。

可选地,在所述实时获取坐席的说辞信息的步骤之后,还包括:

检测当前与所述坐席对话的对话教练系统是否存在上一轮对话的信息;

若存在,则判断所述上一轮对话的信息是否为提出异议的应答请求;

若不存在,则根据所述语音识别技术,将所述说辞信息转换成文字信息。

可选地,所述采用语音识别技术提取所述说辞信息中的第一语音片段和/或第二语音片段的音频信息,并将所述音频信息转换成文字信息的步骤包括:

提取所述说辞信息中的第一语音片段的波形信息;

若判断所述上一轮对话的信息为提出异议的应答请求时,根据所述波形信息,利用语音识别技术进行声学特征的提取;

将提取到的声学特征与预设的中文单词发声波形进行比较,得到对应的中文单词,以实现文字的转换;

将转换后的所有中文单词按照时序进行排序,得到所述第一语音片段对应的回复信息。

可选地,所述对话分析模型包括语言情绪分析子模型和策略分析模型,所述将所述文字信息输入至预设的对话分析模型中进行对话的匹配分析,以识别出与所述音频信息对应的对话回应策略的步骤包括:

对所述回复信息进行特征提取,提取所述第一语言片段对应的音频特征向量;

将所述音频特征向量和所述波形信息输入至所述语音情绪分析模型中进行分析,识别出所述第一语音片段对应的情绪分类;

将所述回复信息输入至所述策略分析模型,对所述回复信息中词语组合规律的分析,得到异议的回应策略;

将所述回应策略与预设的标准异议处理话术策略进行比较,得到比较的结果;

根据所述比较的结果和所述情绪分类选择对应的响应策略,其中,所述响应策略包括使用所述应对话术推荐模型输出回应言语和使用通用回应语言。

可选地,所述采用语音识别技术提取所述说辞信息中的第一语音片段和/或第二语音片段的音频信息,并将所述音频信息转换成文字信息的步骤,还包括:

若检测所述对话教练系统不存在上一轮对话的信息,或者判断所述上一轮对话的信息不是提出异议的应答请求时,根据语音识别技术,以及中文单词发音与声学特征之间的匹配关系,对所述说辞信息中的第二语音片段中的推荐音频信息进行文字转换,得对应的推荐信息。

可选地,所述将所述文字信息输入至预设的对话分析模型中进行对话的匹配分析,识别出与所述音频信息对应的对话回应策略的步骤,还包括:

将所述推荐信息输入至预设的对话分析模型中,基于所述对话分析模型中的意图识别分类算法,提取所述推荐信息中的销售关键词;

根据预先构建的销售关键与意图之间的对应关系,查询出与提取到的销售关键词对应的意图,其中所述意图包括置信度;

判断所述置信度是否大于置信度阈值,得到判断结果;

根据所述判断结果确定对应的对话回应策略。

可选地,所述应对话术推荐模型通过以下方式得到:

通过所述对话教练系统上的语音收集单元,收集不同岗位上的坐席与顾客之间对话的语音数据;

根据语音识别技术,提取所述语音数据中与所述坐席所销售的业务相关的销售关键词以及顾客基于所述业务的回答语料,其中,所述销售关键词为与所述坐席的销售业绩呈正相关的销售关键词,所述回答语料包括顾客提出异议;

利用人工智能深度学习算法,对提取的销售关键词和回答语料进行数据分析进而建立销售关键词与顾客的回答语料的应对话术推荐模型。

此外,为实现上述目的,本发明还提供一种对话训练装置,所述对话训练装置包括:

采集模块,用于实时获取坐席的说辞信息,其中,所述说辞信息包括所述坐席根据所述对话教练系统的应答请求回复的第一语音片段和/或所述坐席向所述对话教练系统推荐业务的第二语音片段;

转换模块,用于采用据语音识别技术提取所述说辞信息中的第一语音片段和/或第二语音片段的音频信息,并将所述音频信息转换成文字信息;

匹配模块,用于将所述文字信息输入至预设的对话分析模型中进行对话的匹配分析,以识别出与所述音频信息对应的对话回应策略;

分析模块,用于将识别出的所述对话回应策略输入预先训练好的应对话术推荐模型中进行分析,以得到对应的回应语言;

广播模块,用于将所述回应语言转换为语音流并进行广播,以回应所述坐席

可选地,所述对话训练装置还包括检测模块,用于检测当前与所述坐席对话的所述对话教练系统是否存在上一轮对话的信息;若存在,则判断所述上一轮对话的信息是否为提出异议的应答请求;若不存在,则根据所述语音识别技术,将所述说辞信息转换成文字信息。

可选地,所述转换模块包括提取单元和转换单元,其中:

所述提取单元,用于在所述检测模块判断所述上一轮对话的信息为提出异议的应答请求时,提取所述说辞信息中的第一语音片段的波形信息;根据所述波形信息,利用语音识别技术进行声学特征的提取;

所述转换单元,用于将提取到的声学特征与预设的中文单词发声波形进行比较,得到对应的中文单词,以实现文字的转换;将转换后的所有中文单词按照时序进行排序,得到所述第一语音片段对应的回复信息。

可选地,所述对话分析模型包括语言情绪分析子模型和策略分析模型,所述匹配模块包括情绪匹配单元、策略匹配单元、比较单元和选择单元,其中:

所述情绪匹配单元,用于对所述回复信息进行特征提取,提取所述第一语言片段对应的音频特征向量;将所述音频特征向量和所述波形信息输入至所述语音情绪分析模型中进行分析,识别出所述第一语音片段对应的情绪分类;

所述策略匹配单元,用于将所述回复信息输入至所述策略分析模型,对所述回复信息中词语组合规律的分析,得到异议的回应策略;

所述比较单元,用于将所述回应策略与预设的标准异议处理话术策略进行比较,得到比较的结果;

所述选择单元,用于根据所述比较的结果和所述情绪分类选择对应的响应策略,其中,所述响应策略包括使用所述应对话术推荐模型输出回应言语和使用通用回应语言。

可选地,所述转换单元,还用于在所述检测模块检测所述对话教练系统不存在上一轮对话的信息,或者判断所述上一轮对话的信息不是提出异议的应答请求时,根据语音识别技术,以及中文单词发音与声学特征之间的匹配关系,对所述说辞信息中的第二语音片段中的推荐音频信息进行文字转换,得对应的推荐信息。

可选地,所述匹配模块,还用于将所述推荐信息输入至预设的对话分析模型中,基于所述对话分析模型中的意图识别分类算法,提取所述推荐信息中的销售关键词;根据预先构建的销售关键与意图之间的对应关系,查询出与提取到的销售关键词对应的意图,其中所述意图包括置信度;判断所述置信度是否大于置信度阈值,得到判断结果;根据所述判断结果确定对应的对话回应策略。

可选地,所述对话训练装置还包括训练模块,用于通过所述对话教练系统上的语音收集单元,收集不同岗位上的坐席与顾客之间对话的语音数据;根据语音识别技术,提取所述语音数据中与所述坐席所销售的业务相关的销售关键词以及顾客基于所述业务的回答语料,其中,所述销售关键词为与所述坐席的销售业绩呈正相关的销售关键词,所述回答语料包括顾客提出异议;利用人工智能深度学习算法,对提取的销售关键词和回答语料进行数据分析进而建立销售关键词与顾客的回答语料的应对话术推荐模型。

此外,为实现上述目的,本发明还提供了一种对话教练系统,其特征在于,所述对话教练系统备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的对话训练程序,所述对话训练程序被所述处理器执行时实现如上任一项所述的对话训练方法的步骤。

此外,为实现上述目的,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有对话训练程序,所述对话训练程序被所述处理器执行时实现如上任一项所述的对话训练方法的步骤。

本发明通过提供一种人工智能人机的对话训练方法,将该方法应用到智能对话教练系统上,通过实时获取坐席的说辞信息,根据语音识别技术将说辞信息的语音转换为文字,然后提取其中的关键信息,输入至对话分析模型中匹配出对应的回应策略,根据回应策略集合预先训练好的应对话术推荐模型来确定回应语言,对话教练系统根据回应语言对坐席的说辞给出回答,从实现人机不同场景和不同对话逻辑的实战演练,这样也大大减少了人工经验传授过程,节省了人力资源,降低了成本,充分模拟实际场景,让新手坐席在上岗前感受真实的销售过程,有助于提升他们的销售技能,提高真实客户面对坐席新人的感受。

附图说明

图1为本发明实施例方案涉及的对话教练系统的运行环境的结构示意图;

图2为本发明提供的对话训练方法第一实施例的流程示意图;

图3为本发明提供的对话训练方法第二实施例的流程示意图;

图4为本发明提供的对话训练装置一实施例的功能模块示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。

本发明提供一种对话教练系统,参照图1,图1为本发明实施例方案涉及的对话教练系统的运行环境的结构示意图。

如图1所示,该对话教练系统包括:处理器101,例如cpu,通信总线102、用户接口103,网络接口104,存储器105。其中,通信总线102用于实现这些组件之间的连接通信。用户接口103可以包括显示屏(display)、输入单元比如键盘(keyboard),网络接口104可选地可以包括标准的有线接口、无线接口(如wi-fi接口)。存储器105可以是高速ram存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器105可选地还可以是独立于前述处理器101的存储装置。

本领域技术人员可以理解,图1中示出的对话教练系统的硬件结构并不构成对本发明中的对话训练装置和对话训练系统的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图1所示,作为一种计算机可读存储介质的存储器105中可以包括操作系统、网络通信程序模块、用户接口程序模块以及用于实现虚对话训练程序。其中,操作系统是调度对话教练系统中各模块之间的通信以及执行存储器中存储的对话训练程序,以实现对坐席或者话务职位的工作人员的对话训练。

在图1所示的对话教练系统的硬件结构中,网络接口104主要用于接入网络;用户接口103主要用于监控并获取待训练对象的语料,而处理器101可以用于调用存储器105中存储的对话训练程序,并执行以下对话训练方法的各实施例的操作。

基于上述对话教练系统的硬件结构,提出本发明对话训练方法的各个实施例。

参照图2,图2为本发明实施例提供的对话训练方法的流程图。在本实施例中,该方法是应用到智能对话教练系统上,通过实时获取坐席的说辞信息,根据语音识别技术将说辞信息的语音转换为文字,然后提取其中的关键信息,输入至对话分析模型中匹配出对应的回应策略,根据回应策略集合预先训练好的应对话术推荐模型来确定回应语言,对话教练系统根据回应语言对坐席的说辞给出回答,从实现人机不同场景的实战演练,这样也大大减少了人工经验传授过程,节省了人力资源,降低了成本,充分模拟实际场景,让新手坐席在上岗前感受真实的销售过程,有助于提升他们的销售技能,提高真实客户面对坐席新人的感受,该对话训练方法具体包括以下步骤:

步骤s210,实时获取坐席的说辞信息;

在该步骤中,这里的说辞信息包括所述坐席根据所述对话教练系统的应答请求回复的第一语音片段和所述坐席向所述对话教练系统推荐业务的第二语音片段中的至少一种。

在本实施例中,为了让对话教练系统能更好的识别坐席所说出来的说辞信息,可以通过固定一个说话格式来进行填充内容,例如,将说辞信息分成两段进行填充,但是这里的两段并不是说分开两段语音,而是通过一些标志信息来区分一段录音中两段不同内容语音,比如利用“回答”的词语指示下面的语音中是用来回答对话教练系统所提出的问题或者异议,而通过“推荐”词语来指示下面的语音是向顾客推荐业务的表述。

在实际应用中,所述说辞信息包括所述坐席根据所述对话教练系统的应答请求回复的第一语音片段和所述坐席向所述对话教练系统推荐业务的第二语音片段中的至少一种,即是说辞信息中可以是只有答异语音,也可以是只有推荐业务语音,但是也可以两者都有,只是先后说明而已。

步骤s220,根据语音识别技术,提取所述说辞信息中的第一语音片段和/或第二语音片段的音频信息,并将所述音频信息转换成文字信息;

在本实施例中,这里的语音识别技术只是可以通过识别语音中的标志词语的发音音波的波形比对技术,通过比对说辞信息语音中的音波来确定语音中对于标志第一语音片段和第二语音片段的区分位置,然后通过语音剪切技术将该说辞信息的语音剪切成两段语音,分别转换成文字信息。

在本实施例中,对于将语音片段转换为文字信息具体是通过中文单词的发音声波匹配的方式对语音片段进行逐一匹配来进行文字转换。在实际应用中,预先在对话教练系统中录音和存储有不同的文字和词语的发音,根据该发音生成一个声波的波形匹配表,然后根据语音片段生成一个语音片段对应的声波的波形图,基于波形图,按照声波图的时序先后顺序,逐一匹配波形匹配表,将匹配到的文字或者词语依次排序形成对应的文字段落,组成文字信息。

在实际应用中,还可以是通过根据不同的文字和词语的发音,预先生成一个声波的学习库,通过声纹学习模型,对所述声波的学习库进行声波的声纹学习,从而生成一个语音转换模型,基于该语音转换模型,对其输入到语音转换模型的所有语音片段转换文字,最后输出一段文字段落,得到语音片段对应的文字信息。

步骤s230,将所述文字信息输入至预设的对话分析模型中进行对话的匹配分析,识别出与所述音频信息对应的对话回应策略;

在本实施例中,对于所述对话分析模型具体是根据坐席教练与顾客的推销语料来训练得到的分析模型,即是通过预先获取一些销售业务成功的案例语料数据,通过人工智能深度学习算法对所述案例语料数据中的对话进行分析,分析其中每次交流的对话语境和对话措辞进行提取,从而分析出对话的规律,以生成对话分析模型。

在使用的过程中,当新手坐席向对话教练系统输入说辞信息后,该对话分析模型,根据学习到的对话规律提取出该说辞信息的对话规则,该对话规则可以是对措辞的组合方式,也可以是措辞的使用是否正确,甚至还可以是说辞信息中的一些关键词。

在实际应用中,当说辞信息为回答的语音时,则根据措辞的组合方式或者关键词,确定该说辞信息的回答规律,即是这时的对话回应策略是说辞信息本身的规律,若说辞信息是推荐语音时,则根据识别出来的关键词从回应策略库中选择合适的回答方式,即是这时的对话回应策略是对话教练系统回答坐席的回应策略。

步骤s240,将识别出的对话回应策略输入预先训练好的应对话术推荐模型中进行分析,以得到对应的回应语言;

在本实施例中,这里的分析包括对对话回应策略的评分和基于对话回应策略分析其应当使用的回复方式。

在实际应用中,当对话回应策略是说辞信息本身的规律,则该步骤所实现的是根据识别出来的对话回应策略和先训练好的应对话术推荐模型分析出标准的说辞信息的措辞,基于该措辞判断坐席给出来的说辞是否标准,进而给出评分,根据评分的结果给出对应的回复坐席的回复方式,这时的回复方式可能是用于指示对话结束的回复方式,例如“好的”。

当对话回应策略是对话教练系统回答坐席的回应策略时,则该步骤所实现的是根据识别出来的对话回应策略根和预先训练好的应对话术推荐模型分析出符合该说辞信息的客户的回答方式,这时回答方式指的是对话教练系统回应坐席的异议或者向坐席提出推荐业务的疑问。

步骤s250,将所述回应语言转换为语音流,并广播回应所述坐席。

在该步骤中,这里的回应语言是文字形式的数据,而对话教练系统与坐席之间的对话是语音的对话,所以在获取到回应语言后需要通过语音转换技术转换为语音流,然后通过系统中的喇叭播放出来,作为回答坐席的信息。

在实际应用中,坐席与对话教练系统之间的对话是一个持续尝长时间的过程,并不是只有一次来回的回复,而是多次回复的对话,当存在多次回复的情况时,则需要对上一轮的对话情况进行识别,根据上一轮的对话情况来选择对应的回应策略,具体的:

若判断所述上一轮对话的信息为提出异议的应答请求时,所述根据语音识别技术,提取所述说辞信息中的第一语音片段和/或第二语音片段的音频信息,并将所述音频信息转换成文字信息的步骤包括:

提取所述说辞信息中的第一语音片段的波形信息;

根据所述波形信息,利用语音识别技术进行声学特征的提取;

将提取到的声学特征与预设的中文单词发声波形进行比较,得到对应的中文单词,以实现文字的转换;

将转换后的所有中文单词按照时序进行排序,得到所述第一语音片段对应的回复信息。

在实际应用中,在对上一轮对话的识别中,主要是识别上一轮对话是提出异议的顾客回答还是提问的顾客回答,甚至还可以对话首轮结束以及推荐业务结束的回答。

若检测存在上一轮对话,且是提出异议或者是疑问的应答请求时,则选择对坐席的回答措辞的评分处理流程,并给出顾客的回复方式,若是没有异议或者疑问的回复,则执行直接对说辞信息进行文字转换的处理流程,即是步骤s230-240。

在本实施例中,若判断所述上一轮对话的信息为提出异议的应答请求时,所述步骤s220的具体实现包括:

提取所述说辞信息中的第一语音片段的波形信息;

根据所述波形信息,利用语音识别技术进行声学特征的提取;

将提取到的声学特征与预设的中文单词发声波形进行比较,得到对应的中文单词,以实现文字的转换;

将转换后的所有中文单词按照时序进行排序,得到所述第一语音片段对应的回复信息。

在实际应用中,在执行提取第一语音片段的步骤时,具体是通过识别标志信息的方式来提取,当然,在该过程之前,还可以是识别第一语音片段对应的位置上是否存在实质的内容,若存在,则提取并识别第一语音片段中的语音内容,转换为文字信息,具体的通过语音发音波形的方式来转换,具体实现是:

首先,把第一语音片段上的首尾端的静音切除,以降低对后续步骤造成的干扰;

然后,对语音的声音分帧,也就是把声音切开成一小段一小段,每小段称为一帧,分帧操作具体可以使用移动窗函数来实现。

进一步的,将切分后的语音小段进行波形变换。常见的一种变换方法是提取mfcc特征,根据人耳的生理特性,把每一帧波形变成一个多维向量,可以简单地理解为这个向量包含了这帧语音的内容信息。

最后,将转换后的波形进行组合,得到更能多的波形向量,将波形向量与先录取到的中文单词的声波波形进行匹配,从而得到对应的文字信息。

在本实施例中,所述对话分析模型包括语言情绪分析子模型和策略分析模型,这时,对于步骤s230的实现,是针对第一语音片段中的异议回复方式的分析,具体包括:

对所述回复信息进行特征提取,提取所述第一语言片段对应的音频特征向量;

将所述音频特征向量和所述波形信息输入至所述语音情绪分析模型中进行分析,识别出所述第一语音片段对应的情绪分类;

将所述回复信息输入至所述策略分析模型,对所述回复信息中词语组合规律的分析,得到异议的回应策略;

将所述回应策略与预设的标准异议处理话术策略进行比较,得到比较的结果;

根据所述比较的结果和所述情绪分类选择对应的响应策略,其中,所述响应策略包括使用所述应对话术推荐模型输出回应言语和使用通用回应语言。

在本实施例中,对于情绪分类的确定,其主要是对坐席的说辞所采用的情绪进行识别,识别出对应的情绪后,还包括:判断情绪是否正常,若不证长,则提醒坐席进行情绪的调整后再重复陈述说辞。

在实际应用中,在从当前获取的语音流中提取出音频特征向量后,对话训练系统将所述音频特征向量输入预设的语音情绪分析模型中进行分析识别,以识别出所述音频特征向量所对应的情绪分类(即坐席当前的情绪分类)。所述情绪分类包括:满意类、平静类、烦躁类以及生气类等,若是满意类、平静类时,则提示坐席使用情绪正确,若是烦躁类、生气类时,则向所述坐席的终端发送预设的提醒信息。

当发现坐席的情绪分类为异常情绪分类(例如,烦躁类、生气类,等情绪不积极的情绪分类)时,对话训练系统则会向坐席的终端发送预设的提醒信息,以提醒坐席注意情绪,及时调整好服务态度。进一步的,可以通过识别回复信息中的敏感词语来识别。

在本实施例中,对于这里的比较包括比较回应策略与标准的回应策略是否一致,以及对回应策略的评分,若不一致时,则根据识别出来的词语组合规律和词语的使用合适度进行评分,根据评分的结果来选择对应的响应策略。

在实际应用中,对于响应策略还可以包括向坐席给出标准的回应选择,以便于坐席在后续的训练中调整说辞,已达到做好的业务培训。

在本实施例中,对于说辞信息中,还可能包含有第二语音片段,而第二语音片段是用来向顾客推荐业务的语音,这时,在完成了对第一语音片段转换后,还需要执行对第二语音片段的文字转换,具体实现包括:

若检测所述对话教练系统不存在上一轮对话的信息,或者判断所述上一轮对话的信息不是提出异议的应答请求时,所述根据语音识别技术,提取所述说辞信息中的第一语音片段和/或第二语音片段的音频信息,并将所述音频信息转换成文字信息的步骤,还包括:

根据语音识别技术,以及中文单词发音与声学特征之间的匹配关系,对所述说辞信息中的第二语音片段中的推荐音频信息进行文字转换,得对应的推荐信息。

这时,对于步骤s230还包括:

将所述推荐信息输入至预设的对话分析模型中,基于所述对话分析模型中的意图识别分类算法,提取所述推荐信息中的销售关键词;

根据预先构建的销售关键与意图之间的对应关系,查询出与提取到的销售关键词对应的意图,其中所述意图包括置信度;

判断所述置信度是否大于置信度阈值;

根据判断的结果确定对应的对话回应策略。

在实际应用中,对于意图的识别具体可以是使用fasttext文本分类工具,对于每个意图,收集话术语料,然后训练出意图识别分类模型。

进一步的,对于所述应对话术推荐模型通过以下方式得到:

通过所述对话教练系统上的语音收集单元,收集不同岗位上的坐席与顾客之间对话的语音数据;

根据语音识别技术,提取所述语音数据中与所述坐席所销售的业务相关的销售关键词以及顾客基于所述业务的回答语料,其中,所述销售关键词为与所述坐席的销售业绩呈正相关的销售关键词,所述回答语料包括顾客提出异议;

利用人工智能深度学习算法,对提取的销售关键词和回答语料进行数据分析进而建立销售关键词与顾客的回答语料的应对话术推荐模型。

下面以具体的应用场景对上述的方案进行说明。

在本实施例中,所述对话教练系统主要包括三个部分,分别为语音识别模块、智能引擎模块、语音合成模块,坐席通过语音与对话教练系统进行自然地交互,坐席的声音经过语音识别模块转换成文字,传递给智能引擎模块;智能引擎模块接收到文字后会进行自然语言处理和理解,识别出坐席说的是什么意图,例如是在“表明身份”、“介绍产品”还是“索要身份信息”,然后给出响应,这个响应可以是正常的响应,例如提供自己的身份信息,也可以是通用的回复,例如直接回复“好的”,还可以是提出异议,例如“你们这个产品没有别家的实惠呀”。以上这些响应会经过语音合成模块合成为声音传达给坐席。基于该对话教练系统的结构实现对话训练流程,具体如图3所示:

步骤s310,获取待训练的坐席的说辞。

在该步骤中,对于待训练的坐席,具体的对话教练系统通过检测坐席的账号来实现坐席是否需要启动对话训练。在实际应用中,不同的坐席对于账号是有一定的区别的,比如通过账号来确定登录对话教练系统的坐席是否属于老用户,例如已经在对话教练系统中标注了已经毕业的学员,或者是新注册的学员。

在本实施例中,在获取说辞时,具体是通过对话教练系统中的语音识别模块来实现,坐席的声音经过语音识别模块转换成文字,传递给智能引擎模块;智能引擎模块接收到文字后会进行自然语言处理和理解。

步骤s320,检测对话教练系统上是否存在上一轮的对话,并且是否提出异议。

在该步骤中,若存在上一轮,且提出异议,则执行步骤s350,反之,则执行步骤s330。

步骤s330,识别坐席的说辞中的意图。

步骤s340,判断所述意图的识别结果是否大于阈值。

在该步骤中,若判断大于阈值,则执行步骤s380,反之,则执行步骤s370。

步骤s350,检测异议是否满足预先设定的处理话术方式。

在该步骤中,若满足处理话术方式,则执行步骤s360,反之则执行步骤s370。

步骤s360,根据异议选择对应的回复方式,并对异议进行回复。

步骤s370,根据意图选择通用的回复语言对坐席的说辞进行回复。

步骤s380,根据意图从意图回应库中选择语言组织方式回复坐席,或者是根据意图提出异议。

在本实施例中,具体是根据记录的上一轮对话系统是否提过异议分别处理,如果上一轮对话没有提过异议,则进行意图识别,判断坐席说的是什么意图,例如“表明身份”或“产品介绍”,意图识别的结果包含一个置信度,如果该置信度高于设定的阈值,则接受识别结果并给出响应,否则给出“好的”“嗯嗯”等通用回复。

如果系统上一轮对话给出过异议,则将坐席的说辞与异议处理标准话术进行比对,看坐席是否正确处理了异议,如果匹配了标准异议处理话术,则给出异议处理完后的回复,否则给出通用回复。

在本实施例中,对于进行意图识别时,具体可以通过以下方式实现:

根据预设的意图识别规则或者意图相似度算法,从所述说辞中识别出其表达的意图字段;

判断所述意图字段与所述意图树当前指示的节点的意图任务是否相同;

若相同,则根据所述训练规则判断所述对话语音中所陈述的具体内容是否达到预设标准。

在本实施例中,具体可以通过获取一些历史语料来训练一种识别模型来实现,在实际应用中,每个对话语料包含了多条语句,在本步骤中,可先将每个对话语料中的各语句提取,再基于预设意图识别模型对各个语句进行意图识别,即是通过一些识别规则训练出模型,基于该模型来识别每个语句,以确定各语句中所包含的意图信息。所谓意图信息是指语句中所包含的意图,例如,语句:“这个项目包含了哪些内容?”,其中所包含的意图信息为项目内容咨询。

为了更准确的识别出语句中所包含的意图信息,需要依赖于所使用的意图识别模型的准确度,较佳地,本实施例中,预设意图识别模型可基于以下方法进行构建,从而保证识别结果的准确性和适用性。

步骤401,将所述对话语料进行问、答语句的分类。

在构建预设意图识别模型的过程中,可使用意图分析中使用的对话语料,从而使得对意图识别模型的训练语料更加贴合实际的应用场景,从而提高识别的准确度和专业度。

在本步骤中,可先对各个对话语料中的问语句、答语句进行分类,确定出对话语料中的语句中所归属的类型。

步骤402,分别对各所述对话语料中的所述问语句和所述答语句进行合并,得到问语句集合、答语句集合。

在该步骤中,将所有对话语料中的问语句进行提取,合并并归为一类,答语句也进行相同处理,从而得到问语句集合、答语句集合。

步骤403,分别对所述问语句集合、所述答语句集合进行聚类,获得相应的分类。

具体而言,可基于k-means聚类算法,分别将问语句集合和答语句集合进行聚类,以将这两个语句集合再分别划分为多个小类别。

步骤404,从各所述分类语句中分别抽取预设数量的训练语句。

如上文所述,对话语料是基于大量的历史数据中提取出来的真实对话语料,不可避免的,会存在大量的重复情况,这种重复不仅包含整个对话语料的完全重复,也包含了不同对话语料中可包含相同的语句的重复,而对于这些重复的语句,其中所包含的意图信息也是重复的,在本步骤中,通过从各分类的语句中抽取出预设数据的训练语句,可在一定程度上降低重复语句的出现概率,更进一步的,由于这些语句是分别来自各个分类,那么可在一定程度上,保证了各个分类具有一定数量的训练语句,也就是说,各个分类中所包含的意图信息,可在一定程度上进行了保留,避免因盲目删减而导致的数据缺失的问题。

为了解决上述的问题,本发明实施例还提供了一种对话训练装置,如图4所示,所述虚拟机升级装置包括:采集模块41、转换模块42、匹配模块43、分析模块44和广播模块45,其中

采集模块41,用于实时获取坐席的说辞信息,其中,所述说辞信息包括所述坐席根据所述对话教练系统的应答请求回复的第一语音片段和所述坐席向所述对话教练系统推荐业务的第二语音片段中的至少一种;

转换模块42,用于根据语音识别技术,提取所述说辞信息中的第一语音片段和/或第二语音片段的音频信息,并将所述音频信息转换成文字信息;

匹配模块43,用于将所述文字信息输入至预设的对话分析模型中进行对话的匹配分析,识别出与所述音频信息对应的对话回应策略;

分析模块44,用于将识别出的对话回应策略输入预先训练好的应对话术推荐模型中进行分析,以得到对应的回应语言;

广播模块45,用于将所述回应语言转换为语音流,并广播回应所述坐席。

基于本装置的执行功能和功能对应的执行流程与上述本发明实施例的对话训练方法实施例说明内容相同的,因此本实施例对对话训练装置的实施例内容不做过多赘述。

此外,本发明实施例还提供了一种对话训练系统,所述对话训练系统包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的对话训练程序,所述对话训练程序被所述处理器执行时所实现的方法可参照本发明对话训练方法的各个实施例,因此不再过多赘述。

本发明还提供一种计算机可读存储介质。

本实施例中,所述计算机可读存储介质上存储有对话训练程序,所述对话训练程序被处理器执行时所实现的方法可参照本发明对话训练方法的各个实施例,因此不再过多赘述。

在本发明实施例提供的方法和装置,主要是用于提升保险电话销售坐席的销售技能,它能模拟客户同销售坐席进行人机对话,帮助坐席掌握销售话术并处理客户异议。通过结合语音识别技术和自然语音理解技术,使用教练系统的坐席能通过语音自然地和教练系统进行实战演练,这是培训方式的革新。坐席可以把教练系统当做自己的客户,向它介绍产品、销售保险,教练系统则可以向坐席提出异议,这种人机交互方式充分模拟实际场景,让新手坐席在上岗前感受真实的销售过程,有助于提升他们的销售技能,提高真实客户面对坐席新人的感受,同时释放人工教练人力。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器或者网络设备等)执行本发明各个实施例所述的方法。

上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,这些均属于本发明的保护之内。


技术特征:

1.一种对话训练方法,应用于对话教练系统,其特征在于,所述对话训练方法包括以下步骤:

实时获取坐席的说辞信息,其中,所述说辞信息包括所述坐席根据所述对话教练系统的应答请求回复的第一语音片段和/或所述坐席向所述对话教练系统推荐业务的第二语音片段;

采用语音识别技术提取所述说辞信息中的第一语音片段和/或第二语音片段的音频信息,并将所述音频信息转换成文字信息;

将所述文字信息输入至预设的对话分析模型中进行对话的匹配分析,以识别出与所述音频信息对应的对话回应策略;

将识别出的所述对话回应策略输入预先训练好的应对话术推荐模型中进行分析,以得到对应的回应语言;

将所述回应语言转换为语音流并进行广播,以回应所述坐席。

2.如权利要求1所述的对话训练方法,其特征在于,在所述实时获取坐席的说辞信息的步骤之后,还包括:

检测当前与所述坐席对话的所述对话教练系统是否存在上一轮对话的信息;

若存在,则判断所述上一轮对话的信息是否为提出异议的应答请求;

若不存在,则根据所述语音识别技术,将所述说辞信息转换成文字信息。

3.如权利要求2所述的对话训练方法,其特征在于,所述采用语音识别技术提取所述说辞信息中的第一语音片段和/或第二语音片段的音频信息,并将所述音频信息转换成文字信息的步骤包括:

当所述上一轮对话的信息为提出异议的应答请求时,提取所述说辞信息中的第一语音片段的波形信息;

根据所述波形信息,利用语音识别技术进行声学特征的提取;

将提取到的声学特征与预设的中文单词发声波形进行比较,得到对应的中文单词,以实现文字的转换;

将转换后的所有中文单词按照时序进行排序,得到所述第一语音片段对应的回复信息。

4.如权利要求3所述的对话训练方法,其特征在于,所述对话分析模型包括语言情绪分析子模型和策略分析模型,所述将所述文字信息输入至预设的对话分析模型中进行对话的匹配分析,以识别出与所述音频信息对应的对话回应策略的步骤包括:

对所述回复信息进行特征提取,提取所述第一语言片段对应的音频特征向量;

将所述音频特征向量和所述波形信息输入至所述语音情绪分析模型中进行分析,识别出所述第一语音片段对应的情绪分类;

将所述回复信息输入至所述策略分析模型,对所述回复信息中词语组合规律的分析,得到异议的回应策略;

将所述回应策略与预设的标准异议处理话术策略进行比较,得到比较的结果;

根据所述比较的结果和所述情绪分类选择对应的响应策略,其中,所述响应策略包括使用所述应对话术推荐模型输出回应言语和使用通用回应语言。

5.如权利要求4所述的对话训练方法,其特征在于,所述采用语音识别技术提取所述说辞信息中的第一语音片段和/或第二语音片段的音频信息,并将所述音频信息转换成文字信息的步骤,还包括:

当所述对话教练系统不存在上一轮对话的信息,或者所述上一轮对话的信息不是提出异议的应答请求时,根据语音识别技术,以及中文单词发音与声学特征之间的匹配关系,对所述说辞信息中的第二语音片段中的推荐音频信息进行文字转换,得对应的推荐信息。

6.如权利要求5所述的对话训练方法,其特征在于,所述将所述文字信息输入至预设的对话分析模型中进行对话的匹配分析,识别出与所述音频信息对应的对话回应策略的步骤,还包括:

将所述推荐信息输入至预设的对话分析模型中,基于所述对话分析模型中的意图识别分类算法,提取所述推荐信息中的销售关键词;

根据预先构建的销售关键与意图之间的对应关系,查询出与提取到的销售关键词对应的意图,其中所述意图包括置信度;

判断所述置信度是否大于置信度阈值,得到判断结果;

根据所述判断结果确定对应的对话回应策略。

7.如权利要求1-6任一项所述的对话训练方法,其特征在于,所述应对话术推荐模型通过以下方式得到:

通过所述对话教练系统上的语音收集单元,收集不同岗位上的坐席与顾客之间对话的语音数据;

根据语音识别技术,提取所述语音数据中与所述坐席所销售的业务相关的销售关键词以及顾客基于所述业务的回答语料,其中,所述销售关键词为与所述坐席的销售业绩呈正相关的销售关键词,所述回答语料包括顾客提出异议;

利用人工智能深度学习算法,对提取的销售关键词和回答语料进行数据分析进而建立销售关键词与顾客的回答语料的应对话术推荐模型。

8.一种对话训练装置,其特征在于,所述对话训练装置包括:

采集模块,用于实时获取坐席的说辞信息,其中,所述说辞信息包括所述坐席根据所述对话教练系统的应答请求回复的第一语音片段和/或所述坐席向所述对话教练系统推荐业务的第二语音片段;

转换模块,用于采用语音识别技术提取所述说辞信息中的第一语音片段和/或第二语音片段的音频信息,并将所述音频信息转换成文字信息;

匹配模块,用于将所述文字信息输入至预设的对话分析模型中进行对话的匹配分析,以识别出与所述音频信息对应的对话回应策略;

分析模块,用于将识别出的所述对话回应策略输入预先训练好的应对话术推荐模型中进行分析,以得到对应的回应语言;

广播模块,用于将所述回应语言转换为语音流并进行广播,以回应所述坐席。

9.一种对话教练系统,其特征在于,所述对话教练系统包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的对话训练程序,所述对话训练程序被所述处理器执行时实现如权利要求1-7中任一项所述的对话训练方法的步骤。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有对话训练程序,所述对话训练程序被所述处理器执行时实现如权利要求1-7中任一项所述的对话训练方法的步骤。

技术总结
本发明涉及人工智能技术领域,公开了一种对话训练方法,通过实时获取坐席的说辞信息,根据语音识别技术将说辞信息的语音转换为文字,然后提取其中的关键信息,输入至对话分析模型中匹配出对应的回应策略,根据回应策略集合预先训练好的应对话术推荐模型来确定回应语言,对话教练系统根据回应语言对坐席的说辞给出回答,从实现人机不同场景的实战演练,这样也大大减少了人工经验传授过程;本发明还提供了一种对话训练装置、系统及计算机可读存储介质,从而节省了人力资源,降低了成本,充分模拟实际场景,让新手坐席在上岗前感受真实的销售过程,有助于提升他们的销售技能,提高真实客户面对坐席新人的感受。

技术研发人员:谭维
受保护的技术使用者:中国平安人寿保险股份有限公司
技术研发日:2020.01.14
技术公布日:2020.06.05

转载请注明原文地址: https://bbs.8miu.com/read-57050.html

最新回复(0)