词槽填充方法、装置、设备及存储介质与流程

专利2022-06-29  155


本申请涉及计算机技术领域,特别是涉及一种词槽填充方法、装置、设备及存储介质。



背景技术:

任务型多轮对话是人机智能交互的一种常见的实现形式。所谓任务型多轮对话指的是:在执行某一任务流程(例如,充话费流程)时,用户与计算机设备进行多轮对话,以通过该多轮对话向计算机设备输入执行该任务流程所需的信息,从而使计算机设备根据输入的信息执行该任务流程。

通常情况下,计算机设备可以采用词槽填充的方式收集用户通过多轮对话向计算机输入的信息,具体地,技术人员可以为每一任务流程设置多个词槽,例如,对于充话费流程而言,可以设置手机号码以及充值金额这两个词槽,计算机设备可以从该多轮对话中提取出与词槽对应的词语填充至该词槽中,等到所有词槽填充完毕,计算机设备即可根据词槽中填充的词语执行任务流程。

相关技术中,计算机设备可以利用神经网络模型对多轮对话中用户向计算机设备输入的对话语句进行语义识别,并根据语义识别结果对词槽进行填充。

然而,神经网络的语义识别准确率并不高,这导致相关技术中词槽填充的准确率不高。



技术实现要素:

基于此,为了提高词槽填充的准确率,提供了一种词槽填充方法、装置、设备及存储介质。

第一方面,提供了一种词槽填充方法,所述方法包括:

在执行目标任务流程的过程中,从所述目标任务流程对应的多个目标词槽中,获取用户输入的对话语句中每一词语对应的候选词槽,得到候选词槽集合;对于所述候选词槽集合中的每一候选词槽,根据所述候选词槽的特征信息获取所述候选词槽的评价信息;从所述候选词槽集合中筛选出评价信息满足目标条件的目标候选词槽,并将所述目标候选词槽对应的词语填充至所述目标候选词槽中。

在其中一个实施例中,所述候选词槽的特征信息包括词语特征信息,所述词语特征信息用于指示所述候选词槽对应的词语的特征,所述根据所述候选词槽的特征信息获取所述候选词槽的评价信息,包括:

根据所述词语特征信息对所述候选词槽进行第一打分处理,并根据所述第一打分处理得到的分值获取所述候选词槽的评价信息。

在其中一个实施例中,所述词语特征信息用于指示所述候选词槽对应的词语的长度,所述根据所述词语特征信息对所述候选词槽进行第一打分处理,包括:

将第一分值作为对所述候选词槽进行所述第一打分处理得到的分值,其中,所述第一分值与所述候选词槽对应的词语的长度正相关。

在其中一个实施例中,所述词语特征信息用于指示所述候选词槽对应的词语与相邻字是否能组成新的词语,所述相邻字是所述对话语句中与所述候选词槽对应的词语所相邻的字,所述根据所述词语特征信息对所述候选词槽进行第一打分处理,包括:

当所述候选词槽对应的词语与所述相邻字能组成新的词语时,将第二分值作为所述第一打分处理得到的分值;当所述候选词槽对应的词语与所述相邻字不能组成新的词语时,将第三分值作为所述第一打分处理得到的分值,其中,所述第二分值小于所述第三分值。

在其中一个实施例中,所述候选词槽的特征信息包括词槽位置信息,所述词槽位置信息用于指示所述候选词槽在所述多个目标词槽中的位置,所述根据所述候选词槽的特征信息获取所述候选词槽的评价信息,包括:

根据所述词槽位置信息对所述候选词槽进行第二打分处理,并根据所述第二打分处理得到的分值获取所述候选词槽的评价信息。

在其中一个实施例中,所述根据所述词槽位置信息对所述候选词槽进行第二打分处理,包括:

当所述词槽位置信息指示所述候选词槽为所述多个目标词槽中当前所需填充的词槽时,将第四分值作为所述第二打分处理得到的分值;当所述词槽位置信息指示所述候选词槽不为所述多个目标词槽中当前所需填充的词槽时,将第五分值作为所述第二打分处理得到的分值,其中,所述第四分值大于所述第五分值。

在其中一个实施例中,所述根据所述词槽位置信息对所述候选词槽进行第二打分处理,包括:

当所述词槽位置信息指示所述候选词槽为所述多个目标词槽中已经进行过填充的词槽时,将第六分值作为所述第二打分处理得到的分值;当所述词槽位置信息指示所述候选词槽不为所述多个目标词槽中已经进行过填充的词槽时,将第七分值作为所述第二打分处理得到的分值,所述第六分值大于所述第七分值。

在其中一个实施例中,所述根据所述词槽位置信息对所述候选词槽进行第二打分处理,包括:

当所述词槽位置信息指示所述候选词槽为所述多个目标词槽中当前所需填充的词槽的后续词槽时,将第八分值作为所述第二打分处理得到的分值;当所述词槽位置信息指示所述候选词槽不为所述多个目标词槽中当前所需填充的词槽的后续词槽时,将第九分值作为所述第二打分处理得到的分值,其中,所述第八分值大于所述第九分值。

在其中一个实施例中,所述将所述目标候选词槽对应的词语填充至所述目标候选词槽中,包括:

当所述目标候选词槽为所述多个目标词槽中已经进行过填充的词槽时,利用所述目标候选词槽对应的词语替换所述目标候选词槽已经填充的词语。

在其中一个实施例中,所述评价信息为评价分值,所述目标条件为评价分值大于预设分值阈值的条件。

在其中一个实施例中,所述从所述目标任务流程对应的多个目标词槽中,获取用户输入的对话语句中每一词语对应的候选词槽,包括:

对所述对话语句进行分词处理,得到所述对话语句包括的多个词语,并对所述对话语句包括的每个词语进行语义识别;获取所述对话语句所属的对话在所述目标任务流程包括的多个对话中的次序;根据所述次序从所述多个目标词槽中得到多个待选词槽,根据所述对话语句包括的每个词语的语义识别结果,从所述多个待选词槽中确定所述对话语句包括的每个词语对应的候选词槽。

第二方面,提供了一种词槽填充装置,该装置包括:

第一获取模块,用于在执行目标任务流程的过程中,从该目标任务流程对应的多个目标词槽中,获取用户输入的对话语句中每一词语对应的候选词槽,得到候选词槽集合;

第二获取模块,用于对于该候选词槽集合中的每一候选词槽,根据该候选词槽的特征信息获取该候选词槽的评价信息;

填充模块,用于从该候选词槽集合中筛选出评价信息满足目标条件的目标候选词槽,并将该目标候选词槽对应的词语填充至该目标候选词槽中。

在其中一个实施例中,该候选词槽的特征信息包括词语特征信息,该词语特征信息用于指示该候选词槽对应的词语的特征,该第二获取模块,具体用于:根据该词语特征信息对该候选词槽进行第一打分处理,并根据该第一打分处理得到的分值获取该候选词槽的评价信息。

在其中一个实施例中,该词语特征信息用于指示该候选词槽对应的词语的长度,该第二获取模块,具体用于:将第一分值作为对该候选词槽进行该第一打分处理得到的分值,其中,该第一分值与该候选词槽对应的词语的长度正相关。

在其中一个实施例中,该词语特征信息用于指示该候选词槽对应的词语与相邻字是否能组成新的词语,该相邻字是该对话语句中与该候选词槽对应的词语所相邻的字,该第二获取模块,具体用于:

当该候选词槽对应的词语与该相邻字能组成新的词语时,将第二分值作为该第一打分处理得到的分值;当该候选词槽对应的词语与该相邻字不能组成新的词语时,将第三分值作为该第一打分处理得到的分值,其中,该第二分值小于该第三分值。

在其中一个实施例中,该候选词槽的特征信息包括词槽位置信息,该词槽位置信息用于指示该候选词槽在该多个目标词槽中的位置,该第二获取模块,具体用于:

根据该词槽位置信息对该候选词槽进行第二打分处理,并根据该第二打分处理得到的分值获取该候选词槽的评价信息。

在其中一个实施例中,该第二获取模块,具体用于:

当该词槽位置信息指示该候选词槽为该多个目标词槽中当前所需填充的词槽时,将第四分值作为该第二打分处理得到的分值;当该词槽位置信息指示该候选词槽不为该多个目标词槽中当前所需填充的词槽时,将第五分值作为该第二打分处理得到的分值,其中,该第四分值大于该第五分值。

在其中一个实施例中,该第二获取模块,具体用于:

当该词槽位置信息指示该候选词槽为该多个目标词槽中已经进行过填充的词槽时,将第六分值作为该第二打分处理得到的分值;当该词槽位置信息指示该候选词槽不为该多个目标词槽中已经进行过填充的词槽时,将第七分值作为该第二打分处理得到的分值,该第六分值大于该第七分值。

在其中一个实施例中,该第二获取模块,具体用于:

当该词槽位置信息指示该候选词槽为该多个目标词槽中当前所需填充的词槽的后续词槽时,将第八分值作为该第二打分处理得到的分值;当该词槽位置信息指示该候选词槽不为该多个目标词槽中当前所需填充的词槽的后续词槽时,将第九分值作为该第二打分处理得到的分值,其中,该第八分值大于该第九分值。

在其中一个实施例中,该填充模块,具体用于:

当该目标候选词槽为该多个目标词槽中已经进行过填充的词槽时,利用该目标候选词槽对应的词语替换该目标候选词槽已经填充的词语。

在其中一个实施例中,该评价信息为评价分值,该目标条件为评价分值大于预设分值阈值的条件。

在其中一个实施例中,该第一获取模块,具体用于:

对该对话语句进行分词处理,得到该对话语句包括的多个词语,并对该对话语句包括的每个词语进行语义识别;获取该对话语句所属的对话在该目标任务流程包括的多个对话中的次序;根据该次序从该多个目标词槽中得到多个待选词槽,根据该对话语句包括的每个词语的语义识别结果,从该多个待选词槽中确定该对话语句包括的每个词语对应的候选词槽。

第三方面,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该计算机程序被该处理器执行时实现上述第一方面任一所述的词槽填充方法。

第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述第一方面任一所述的词槽填充方法。

本申请实施例提供的技术方案带来的有益效果至少包括:

通过在执行目标任务流程的过程中,从该目标任务流程对应的多个目标词槽中,获取用户输入的对话语句中每一词语对应的候选词槽,得到候选词槽集合,对于候选词槽集合中的每一候选词槽,根据该候选词槽的特征信息获取该候选词槽的评价信息,而后,从该候选词槽集合中筛选出评价信息满足目标条件的目标候选词槽,并将目标候选词槽对应的词语填充至该目标候选词槽中,这样,就可以避免使用神经网络模型对多轮对话中用户向计算机设备输入的对话语句进行语义识别,并根据语义识别结果对词槽进行填充,因此,可以规避因神经网络的语义识别准确率不高而对词槽填充的准确率的影响,故而,可以提高词槽填充的准确率。

附图说明

图1为本申请实施例提供的一种词槽填充方法所涉及到的实施环境的示意图;

图2为本申请实施例提供的一种词槽填充方法的流程图;

图3为本申请实施例提供的一种词槽填充装置的框图;

图4为本申请实施例提供的一种计算机设备的框图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。

在执行某一任务流程的过程中,计算机设备可以与用户进行多轮对话,通过该多轮对话计算机设备可以收集用户输入的信息,而后,计算机设备可以根据收集到的信息执行该任务流程。其中,计算机设备与用户进行的多轮对话也可以被称为任务型多轮对话。

以计算机设备执行交话费这一任务流程为例,在执行该任务流程的过程中,计算机设备可以向用户输出“请问您的手机号是多少”的对话语句,用户可以根据该对话语句向计算机设备输入“我的号码是18629267xxx”的对话语句,而后,计算机设备可以向用户输出“请问您需要交多少钱的话费”的对话语句,用户可以根据该对话语句向计算机设备输入“交50元话费”的对话语句,根据上文叙述可知,通过两轮对话,计算机设备可以收集用户输入的“18629267xxx”以及“50元”的信息,而后,计算机设备可以根据收集到的信息执行交话费的作业。

在任务型多轮对话具体实现时,技术人员可以为每一个任务流程设置多个词槽,计算机设备可以从用户输入的语句中提取出与词槽对应的词语填充至该词槽中,等到所有词槽填充完毕,计算机设备即可根据词槽中填充的词语执行任务流程。

相关技术中,计算机设备可以利用神经网络模型对多轮对话中用户向计算机设备输入的对话语句进行语义识别,并根据语义识别结果对词槽进行填充,然而,由于神经网络的语义识别准确率并不高,因此导致相关技术中,词槽填充的准确率也不高。

有鉴于此,本申请实施例提供了一种词槽填充方法,可以提高词槽填充的准确率。

下面,将对本申请实施例提供的词槽填充方法所涉及到的实施环境进行简要说明:

如图1所示,该实施环境可以包括服务器101和终端102,其中,在任务型多轮对话中,服务器101可以将对话语句发送至终端102,终端102在接收到服务器101发送的对话语句之后,可以向用户输出该对话语句,而后,终端102可以接收用户输入的对话语句,并将用户输入的对话语句发送至服务器101中。服务器101在接收到终端102发送的对话语句之后,可以对该对话语句执行本申请实施例提供的词槽填充方法。

需要指出的是,在本申请实施例中,终端102可以为智能手机、平板电脑、台式电脑或者可穿戴设备等,服务器101可以为一台服务器,也可以为由多台服务器组成的服务器集群。

请参考图2,其示出了本申请实施例提供的一种词槽填充方法的流程图,该词槽填充方法可以应用于图1所示实施环境中的服务器101中,如图2所示,该词槽填充方法可以包括以下步骤:

步骤201、在执行目标任务流程的过程中,服务器从目标任务流程对应的多个目标词槽中,获取用户输入的对话语句中每一词语对应的候选词槽,得到候选词槽集合。

可选的,服务器可以对用户输入的对话语句进行分词处理,得到用户输入的对话语句包括的多个词语,并对该用户输入的话语句包括的每个词语进行语义识别,而后,服务器可以获取用户输入的对话语句所属的对话在目标任务流程包括的多个对话中的次序,而后,服务器可以根据获取到的次序从多个目标词槽中得到多个待选词槽,并根据用户输入的对话语句包括的每个词语的语义识别结果,从多个待选词槽中确定用户输入的对话语句包括的每个词语对应的候选词槽。

步骤202、对于候选词槽集合中的每一候选词槽,服务器根据候选词槽的特征信息获取该候选词槽的评价信息。

可选的,候选词槽的特征信息可以包括词语特征信息以及词槽位置信息中的至少一个,其中,词语特征信息用于指示候选词槽对应的词语的特征,词槽位置信息用于指示候选词槽在多个目标词槽中的位置。

可选的,在步骤202中,服务器可以根据词语特征信息对候选词槽进行第一打分处理,并根据第一打分处理得到的分值获取候选词槽的评价信息。

可选的,在步骤202中,服务器也可以根据词槽位置信息对候选词槽进行第二打分处理,并根据第二打分处理得到的分值获取候选词槽的评价信息。

在一种可能的实现方式中,服务器可以单独根据词语特征信息对候选词槽进行第一打分处理,此时,服务器可以将第一打分处理得到的分值作为候选词槽的评价信息。

在另一种可能的实现方式中,服务器可以单独根据词槽位置信息对候选词槽进行第二打分处理,此时,服务器可以将第二打分处理得到的分值作为候选词槽的评价信息。

在又一种可能的实现方式中,服务器即可以根据词语特征信息对候选词槽进行第一打分处理,又可以根据词槽位置信息对候选词槽进行第二打分处理,此时,服务器可以对第一打分处理得到的分值以及第二打分处理得到的分值进行加权相加,并将相加结果作为候选词槽的评价信息。

如上文所述可知,候选词槽的评价信息指的可以是候选词槽的评价分值。

步骤203、服务器从候选词槽集合中筛选出评价信息满足目标条件的目标候选词槽,并将目标候选词槽对应的词语填充至目标候选词槽中。

可选的,评价信息满足目标条件指的可以是:评价分值大于预设分值阈值的条件。

在本申请的一个可选的实施例中,当目标候选词槽为多个目标词槽中已经进行过填充的词槽时,服务器可以利用目标候选词槽对应的词语替换该目标候选词槽已经填充的词语。

其中,在本申请的一个实施例中,词语特征信息可以指示候选词槽对应的词语的长度,在这种情况下,服务器可以将第一分值作为对候选词槽进行第一打分处理得到的分值,其中,第一分值与候选词槽对应的词语的长度正相关。

也即是,服务器倾向于给对应的词语长度较长的候选词槽打更高的分值,例如,用户输入的对话语句中可以包括“李广州”,经过分词处理,服务器可以获取两个词语,其一为“李广州”,其二为“技术”,其中,“李广州”对应的候选词槽为“姓名”,“广州”对应的候选词槽为“地址”,由于“李广州”的长度更长,因此,服务器可以为“姓名”这一候选词槽打更高的分值,而由于“广州”的长度较短,因此,服务器可以为“地址”这一候选词槽打更低的分值。

在本申请的一个实施例中,词语特征信息可以指示候选词槽对应的词语与相邻字是否能组成新的词语,其中,该相邻字是对话语句中与候选词槽对应的词语所相邻的字。也即是,词语特征信息可以指示候选词槽对应的词语是否破坏分词边界。

例如,用户输入的对话语句中可以包括“一百元”,经过分词处理,服务器可以获取三个词语,其一为“一百”,其二为“元”,其三为“一百元”,“一百”对应的候选词槽可以为“数字”,“元”对应的候选词槽可以为“单位”,“一百元”对应的候选词槽可以为“金额”。这里的“一百”可以和对话语句中与其相邻的字“元”组成新的词语,因此,“一百”破坏了分词边界,同理,“元”也破坏了分词边界,只有“一百元”没有破坏分词边界。

在本申请实施例中,当候选词槽对应的词语与相邻字能组成新的词语时,服务器可以将第二分值作为第一打分处理得到的分值,当候选词槽对应的词语与相邻字不能组成新的词语时,服务器可以将第三分值作为第一打分处理得到的分值,其中,第二分值小于第三分值。

换句话说,服务器倾向于为没有破坏分词边界的词语所对应的候选词槽打更高的分值。如上述举例,由于“一百”和“元”均破坏了分词边界,因此,服务器可以为“数字”以及“单位”这两个候选词槽打更低的分值,而“一百元”没有破坏分词边界,因此,服务器可以为“金额”这一候选词槽打更高的分值。

在本申请的一个实施例中,当词槽位置信息指示候选词槽为多个目标词槽中当前所需填充的词槽时,服务器可以将第四分值作为第二打分处理得到的分值;当词槽位置信息指示候选词槽不为多个目标词槽中当前所需填充的词槽时,服务器可以将第五分值作为第二打分处理得到的分值,其中,第四分值大于第五分值。

换句话说,服务器倾向于为当前所需填充的候选词槽打更高的分值,例如,目标任务流程可以为查询话费账单的流程,该目标任务流程可以包括“身份证号”、“电话号码”、“账单类型”以及“账单月份”这4个目标词槽。

用户输入的对话语句可以包括“1874906xxxx”,根据语义识别,服务器可以确定“1874906xxxx”对应的候选词槽包括“身份证号”以及“电话号码”。然而,由于“电话号码”是该4个目标词槽中当前所需填充的词槽,因此,服务器可以为“电话号码”这一候选词槽打更高的分值,为“身份证号”这一候选词槽打更低的分值。

在本申请的一个实施例中,当词槽位置信息指示候选词槽为多个目标词槽中已经进行过填充的词槽时,服务器可以将第六分值作为第二打分处理得到的分值;当词槽位置信息指示候选词槽不为多个目标词槽中已经进行过填充的词槽时,服务器可以将第七分值作为第二打分处理得到的分值,该第六分值大于该第七分值。

在实际应用中,用户很可能会修正自己输入过的信息,例如,目标任务流程可以为查询话费账单的流程,该目标任务流程可以包括“身份证号”、“电话号码”、“账单类型”以及“账单月份”这4个目标词槽。

若在之前轮次的对话之中,用户已经输入了自己的电话号码,服务器已经根据用户的输入将“电话号码”这一词槽进行了填充,然而,用户发现自己的输入出现了错误,此时,用户可以修正自己输入的电话号码。

为了满足实际应用中用户的这种修正需求,在本申请实施例中,服务器可以倾向于给已经进行过填充的候选词槽打更高的分值。

在其本申请的一个实施例中,当词槽位置信息指示候选词槽为多个目标词槽中当前所需填充的词槽的后续词槽时,服务器可以将第八分值作为第二打分处理得到的分值;当词槽位置信息指示候选词槽不为多个目标词槽中当前所需填充的词槽的后续词槽时,服务器可以将第九分值作为第二打分处理得到的分值,其中,第八分值大于第九分值。

在实际应用中,用户输入的对话语句中可能会包含多个有用的信息,这些多个有用的信息对应的词槽很可能是当前所需填充的词槽的后续词槽,例如,“我的电话号码是1874906xxxx,查一下9月份的话费”,其中,当前并未到收集“月份”这一词槽的对话轮次,但用户输入的对话语句中已经包含了“9月份”这一信息,在这种情况下,服务器可以提前对词槽进行填充,而不是在后面的对话轮次中重复询问月份。

为了实现这种需求,在本申请实施例中,服务器可以倾向于给当前所需填充的词槽的后续词槽打更高的分值。

请参考图3,其示出了本申请实施例提供的一种词槽填充装置300的框图,该词槽填充装置300可以配置于上文所述的服务器101中。如图3所示,该词槽填充装置300可以包括:第一获取模块301、第二获取模块302以及填充模块303。

该第一获取模块301,用于在执行目标任务流程的过程中,从该目标任务流程对应的多个目标词槽中,获取用户输入的对话语句中每一词语对应的候选词槽,得到候选词槽集合。

该第二获取模块302,用于对于该候选词槽集合中的每一候选词槽,根据该候选词槽的特征信息获取该候选词槽的评价信息。

该填充模块303,用于从该候选词槽集合中筛选出评价信息满足目标条件的目标候选词槽,并将该目标候选词槽对应的词语填充至该目标候选词槽中。

在本申请的一个实施例中,该候选词槽的特征信息包括词语特征信息,该词语特征信息用于指示该候选词槽对应的词语的特征,该第二获取模块302,具体用于:根据该词语特征信息对该候选词槽进行第一打分处理,并根据该第一打分处理得到的分值获取该候选词槽的评价信息。

在本申请的一个实施例中,该词语特征信息用于指示该候选词槽对应的词语的长度,该第二获取模块302,具体用于:将第一分值作为对该候选词槽进行该第一打分处理得到的分值,其中,该第一分值与该候选词槽对应的词语的长度正相关。

在本申请的一个实施例中,该词语特征信息用于指示该候选词槽对应的词语与相邻字是否能组成新的词语,该相邻字是该对话语句中与该候选词槽对应的词语所相邻的字,该第二获取模块302,具体用于:当该候选词槽对应的词语与该相邻字能组成新的词语时,将第二分值作为该第一打分处理得到的分值;当该候选词槽对应的词语与该相邻字不能组成新的词语时,将第三分值作为该第一打分处理得到的分值,其中,该第二分值小于该第三分值。

在本申请的一个实施例中,该候选词槽的特征信息包括词槽位置信息,该词槽位置信息用于指示该候选词槽在该多个目标词槽中的位置,该第二获取模块302,具体用于:根据该词槽位置信息对该候选词槽进行第二打分处理,并根据该第二打分处理得到的分值获取该候选词槽的评价信息。

在本申请的一个实施例中,该第二获取模块302,具体用于:当该词槽位置信息指示该候选词槽为该多个目标词槽中当前所需填充的词槽时,将第四分值作为该第二打分处理得到的分值;当该词槽位置信息指示该候选词槽不为该多个目标词槽中当前所需填充的词槽时,将第五分值作为该第二打分处理得到的分值,其中,该第四分值大于该第五分值。

在本申请的一个实施例中,该第二获取模块302,具体用于:当该词槽位置信息指示该候选词槽为该多个目标词槽中已经进行过填充的词槽时,将第六分值作为该第二打分处理得到的分值;当该词槽位置信息指示该候选词槽不为该多个目标词槽中已经进行过填充的词槽时,将第七分值作为该第二打分处理得到的分值,该第六分值大于该第七分值。

在本申请的一个实施例中,该第二获取模块302,具体用于:当该词槽位置信息指示该候选词槽为该多个目标词槽中当前所需填充的词槽的后续词槽时,将第八分值作为该第二打分处理得到的分值;当该词槽位置信息指示该候选词槽不为该多个目标词槽中当前所需填充的词槽的后续词槽时,将第九分值作为该第二打分处理得到的分值,其中,该第八分值大于该第九分值。

在本申请的一个实施例中,该填充模块303,具体用于:当该目标候选词槽为该多个目标词槽中已经进行过填充的词槽时,利用该目标候选词槽对应的词语替换该目标候选词槽已经填充的词语。

在其中一个实施例中,该评价信息为评价分值,该目标条件为评价分值大于预设分值阈值的条件。

在本申请的一个实施例中,该第一获取模块301,具体用于:对该对话语句进行分词处理,得到该对话语句包括的多个词语,并对该对话语句包括的每个词语进行语义识别;获取该对话语句所属的对话在该目标任务流程包括的多个对话中的次序;根据该次序从该多个目标词槽中得到多个待选词槽,根据该对话语句包括的每个词语的语义识别结果,从该多个待选词槽中确定该对话语句包括的每个词语对应的候选词槽。

本申请实施例提供的词槽填充装置,可以实现上述方法实施例,其实现原理和技术效果类似,在此不再赘述。

关于词槽填充装置的具体限定可以参见上文中对于词槽填充方法的限定,在此不再赘述。上述词槽填充装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的设备通过网络连接通信。该计算机程序被处理器执行时以实现本申请实施例提供的一种词槽填充方法。

本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在本申请的一个实施例中,提供了一种计算机设备,该计算机设备包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:

在执行目标任务流程的过程中,从该目标任务流程对应的多个目标词槽中,获取用户输入的对话语句中每一词语对应的候选词槽,得到候选词槽集合;对于该候选词槽集合中的每一候选词槽,根据该候选词槽的特征信息获取该候选词槽的评价信息;从该候选词槽集合中筛选出评价信息满足目标条件的目标候选词槽,并将该目标候选词槽对应的词语填充至该目标候选词槽中。

该候选词槽的特征信息包括词语特征信息,该词语特征信息用于指示该候选词槽对应的词语的特征,在本申请的一个实施例中,处理器执行计算机程序时还实现以下步骤:根据该词语特征信息对该候选词槽进行第一打分处理,并根据该第一打分处理得到的分值获取该候选词槽的评价信息。

该词语特征信息用于指示该候选词槽对应的词语的长度,在本申请的一个实施例中,处理器执行计算机程序时还实现以下步骤:将第一分值作为对该候选词槽进行该第一打分处理得到的分值,其中,该第一分值与该候选词槽对应的词语的长度正相关。

该词语特征信息用于指示该候选词槽对应的词语与相邻字是否能组成新的词语,该相邻字是该对话语句中与该候选词槽对应的词语所相邻的字,在本申请的一个实施例中,处理器执行计算机程序时还实现以下步骤:当该候选词槽对应的词语与该相邻字能组成新的词语时,将第二分值作为该第一打分处理得到的分值;当该候选词槽对应的词语与该相邻字不能组成新的词语时,将第三分值作为该第一打分处理得到的分值,其中,该第二分值小于该第三分值。

候选词槽的特征信息包括词槽位置信息,该词槽位置信息用于指示该候选词槽在该多个目标词槽中的位置,在本申请的一个实施例中,处理器执行计算机程序时还实现以下步骤:根据该词槽位置信息对该候选词槽进行第二打分处理,并根据该第二打分处理得到的分值获取该候选词槽的评价信息。

在本申请的一个实施例中,处理器执行计算机程序时还实现以下步骤:当该词槽位置信息指示该候选词槽为该多个目标词槽中当前所需填充的词槽时,将第四分值作为该第二打分处理得到的分值;当该词槽位置信息指示该候选词槽不为该多个目标词槽中当前所需填充的词槽时,将第五分值作为该第二打分处理得到的分值,其中,该第四分值大于该第五分值。

在本申请的一个实施例中,处理器执行计算机程序时还实现以下步骤:当该词槽位置信息指示该候选词槽为该多个目标词槽中已经进行过填充的词槽时,将第六分值作为该第二打分处理得到的分值;当该词槽位置信息指示该候选词槽不为该多个目标词槽中已经进行过填充的词槽时,将第七分值作为该第二打分处理得到的分值,该第六分值大于该第七分值。

在本申请的一个实施例中,处理器执行计算机程序时还实现以下步骤:当该词槽位置信息指示该候选词槽为该多个目标词槽中当前所需填充的词槽的后续词槽时,将第八分值作为该第二打分处理得到的分值;当该词槽位置信息指示该候选词槽不为该多个目标词槽中当前所需填充的词槽的后续词槽时,将第九分值作为该第二打分处理得到的分值,其中,该第八分值大于该第九分值。

在本申请的一个实施例中,处理器执行计算机程序时还实现以下步骤:当该目标候选词槽为该多个目标词槽中已经进行过填充的词槽时,利用该目标候选词槽对应的词语替换该目标候选词槽已经填充的词语。

在本申请的一个实施例中,该评价信息为评价分值,该目标条件为评价分值大于预设分值阈值的条件。

在本申请的一个实施例中,处理器执行计算机程序时还实现以下步骤:对该对话语句进行分词处理,得到该对话语句包括的多个词语,并对该对话语句包括的每个词语进行语义识别;获取该对话语句所属的对话在该目标任务流程包括的多个对话中的次序;根据该次序从该多个目标词槽中得到多个待选词槽,根据该对话语句包括的每个词语的语义识别结果,从该多个待选词槽中确定该对话语句包括的每个词语对应的候选词槽。

本申请实施例提供的计算机设备,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。

在本申请的一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:

在执行目标任务流程的过程中,从该目标任务流程对应的多个目标词槽中,获取用户输入的对话语句中每一词语对应的候选词槽,得到候选词槽集合;对于该候选词槽集合中的每一候选词槽,根据该候选词槽的特征信息获取该候选词槽的评价信息;从该候选词槽集合中筛选出评价信息满足目标条件的目标候选词槽,并将该目标候选词槽对应的词语填充至该目标候选词槽中。

该候选词槽的特征信息包括词语特征信息,该词语特征信息用于指示该候选词槽对应的词语的特征,在本申请的一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据该词语特征信息对该候选词槽进行第一打分处理,并根据该第一打分处理得到的分值获取该候选词槽的评价信息。

该词语特征信息用于指示该候选词槽对应的词语的长度,在本申请的一个实施例中,计算机程序被处理器执行时还实现以下步骤:将第一分值作为对该候选词槽进行该第一打分处理得到的分值,其中,该第一分值与该候选词槽对应的词语的长度正相关。

该词语特征信息用于指示该候选词槽对应的词语与相邻字是否能组成新的词语,该相邻字是该对话语句中与该候选词槽对应的词语所相邻的字,在本申请的一个实施例中,计算机程序被处理器执行时还实现以下步骤:当该候选词槽对应的词语与该相邻字能组成新的词语时,将第二分值作为该第一打分处理得到的分值;当该候选词槽对应的词语与该相邻字不能组成新的词语时,将第三分值作为该第一打分处理得到的分值,其中,该第二分值小于该第三分值。

候选词槽的特征信息包括词槽位置信息,该词槽位置信息用于指示该候选词槽在该多个目标词槽中的位置,在本申请的一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据该词槽位置信息对该候选词槽进行第二打分处理,并根据该第二打分处理得到的分值获取该候选词槽的评价信息。

在本申请的一个实施例中,计算机程序被处理器执行时还实现以下步骤:当该词槽位置信息指示该候选词槽为该多个目标词槽中当前所需填充的词槽时,将第四分值作为该第二打分处理得到的分值;当该词槽位置信息指示该候选词槽不为该多个目标词槽中当前所需填充的词槽时,将第五分值作为该第二打分处理得到的分值,其中,该第四分值大于该第五分值。

在本申请的一个实施例中,计算机程序被处理器执行时还实现以下步骤:当该词槽位置信息指示该候选词槽为该多个目标词槽中已经进行过填充的词槽时,将第六分值作为该第二打分处理得到的分值;当该词槽位置信息指示该候选词槽不为该多个目标词槽中已经进行过填充的词槽时,将第七分值作为该第二打分处理得到的分值,该第六分值大于该第七分值。

在本申请的一个实施例中,计算机程序被处理器执行时还实现以下步骤:当该词槽位置信息指示该候选词槽为该多个目标词槽中当前所需填充的词槽的后续词槽时,将第八分值作为该第二打分处理得到的分值;当该词槽位置信息指示该候选词槽不为该多个目标词槽中当前所需填充的词槽的后续词槽时,将第九分值作为该第二打分处理得到的分值,其中,该第八分值大于该第九分值。

在本申请的一个实施例中,计算机程序被处理器执行时还实现以下步骤:当该目标候选词槽为该多个目标词槽中已经进行过填充的词槽时,利用该目标候选词槽对应的词语替换该目标候选词槽已经填充的词语。

在本申请的一个实施例中,该评价信息为评价分值,该目标条件为评价分值大于预设分值阈值的条件。

在本申请的一个实施例中,计算机程序被处理器执行时还实现以下步骤:对该对话语句进行分词处理,得到该对话语句包括的多个词语,并对该对话语句包括的每个词语进行语义识别;获取该对话语句所属的对话在该目标任务流程包括的多个对话中的次序;根据该次序从该多个目标词槽中得到多个待选词槽,根据该对话语句包括的每个词语的语义识别结果,从该多个待选词槽中确定该对话语句包括的每个词语对应的候选词槽。

本实施例提供的计算机可读存储介质,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。

以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。


技术特征:

1.一种词槽填充方法,其特征在于,所述方法包括:

在执行目标任务流程的过程中,从所述目标任务流程对应的多个目标词槽中,获取用户输入的对话语句中每一词语对应的候选词槽,得到候选词槽集合;

对于所述候选词槽集合中的每一候选词槽,根据所述候选词槽的特征信息获取所述候选词槽的评价信息;

从所述候选词槽集合中筛选出评价信息满足目标条件的目标候选词槽,并将所述目标候选词槽对应的词语填充至所述目标候选词槽中。

2.根据权利要求1所述的方法,其特征在于,所述候选词槽的特征信息包括词语特征信息,所述词语特征信息用于指示所述候选词槽对应的词语的特征,所述根据所述候选词槽的特征信息获取所述候选词槽的评价信息,包括:

根据所述词语特征信息对所述候选词槽进行第一打分处理,并根据所述第一打分处理得到的分值获取所述候选词槽的评价信息。

3.根据权利要求2所述的方法,其特征在于,所述词语特征信息用于指示所述候选词槽对应的词语的长度,所述根据所述词语特征信息对所述候选词槽进行第一打分处理,包括:

将第一分值作为对所述候选词槽进行所述第一打分处理得到的分值,其中,所述第一分值与所述候选词槽对应的词语的长度正相关。

4.根据权利要求2所述的方法,其特征在于,所述词语特征信息用于指示所述候选词槽对应的词语与相邻字是否能组成新的词语,所述相邻字是所述对话语句中与所述候选词槽对应的词语所相邻的字,所述根据所述词语特征信息对所述候选词槽进行第一打分处理,包括:

当所述候选词槽对应的词语与所述相邻字能组成新的词语时,将第二分值作为所述第一打分处理得到的分值;

当所述候选词槽对应的词语与所述相邻字不能组成新的词语时,将第三分值作为所述第一打分处理得到的分值,其中,所述第二分值小于所述第三分值。

5.根据权利要求1所述的方法,其特征在于,所述候选词槽的特征信息包括词槽位置信息,所述词槽位置信息用于指示所述候选词槽在所述多个目标词槽中的位置,所述根据所述候选词槽的特征信息获取所述候选词槽的评价信息,包括:

根据所述词槽位置信息对所述候选词槽进行第二打分处理,并根据所述第二打分处理得到的分值获取所述候选词槽的评价信息。

6.根据权利要求5所述的方法,其特征在于,所述根据所述词槽位置信息对所述候选词槽进行第二打分处理,包括:

当所述词槽位置信息指示所述候选词槽为所述多个目标词槽中当前所需填充的词槽时,将第四分值作为所述第二打分处理得到的分值;

当所述词槽位置信息指示所述候选词槽不为所述多个目标词槽中当前所需填充的词槽时,将第五分值作为所述第二打分处理得到的分值,其中,所述第四分值大于所述第五分值。

7.根据权利要求5所述的方法,其特征在于,所述根据所述词槽位置信息对所述候选词槽进行第二打分处理,包括:

当所述词槽位置信息指示所述候选词槽为所述多个目标词槽中已经进行过填充的词槽时,将第六分值作为所述第二打分处理得到的分值;

当所述词槽位置信息指示所述候选词槽不为所述多个目标词槽中已经进行过填充的词槽时,将第七分值作为所述第二打分处理得到的分值,所述第六分值大于所述第七分值。

8.根据权利要求5所述的方法,其特征在于,所述根据所述词槽位置信息对所述候选词槽进行第二打分处理,包括:

当所述词槽位置信息指示所述候选词槽为所述多个目标词槽中当前所需填充的词槽的后续词槽时,将第八分值作为所述第二打分处理得到的分值;

当所述词槽位置信息指示所述候选词槽不为所述多个目标词槽中当前所需填充的词槽的后续词槽时,将第九分值作为所述第二打分处理得到的分值,其中,所述第八分值大于所述第九分值。

9.根据权利要求1至8任一所述的方法,其特征在于,所述将所述目标候选词槽对应的词语填充至所述目标候选词槽中,包括:

当所述目标候选词槽为所述多个目标词槽中已经进行过填充的词槽时,利用所述目标候选词槽对应的词语替换所述目标候选词槽已经填充的词语。

10.根据权利要求1至8任一所述的方法,其特征在于,所述评价信息为评价分值,所述目标条件为评价分值大于预设分值阈值的条件。

11.根据权利要求1至8任一所述的方法,其特征在于,所述从所述目标任务流程对应的多个目标词槽中,获取用户输入的对话语句中每一词语对应的候选词槽,包括:

对所述对话语句进行分词处理,得到所述对话语句包括的多个词语,并对所述对话语句包括的每个词语进行语义识别;

获取所述对话语句所属的对话在所述目标任务流程包括的多个对话中的次序;

根据所述次序从所述多个目标词槽中得到多个待选词槽,根据所述对话语句包括的每个词语的语义识别结果,从所述多个待选词槽中确定所述对话语句包括的每个词语对应的候选词槽。

12.一种词槽填充装置,其特征在于,所述装置包括:

第一获取模块,用于在执行目标任务流程的过程中,从所述目标任务流程对应的多个目标词槽中,获取用户输入的对话语句中每一词语对应的候选词槽,得到候选词槽集合;

第二获取模块,用于对于所述候选词槽集合中的每一候选词槽,根据所述候选词槽的特征信息获取所述候选词槽的评价信息;

填充模块,用于从所述候选词槽集合中筛选出评价信息满足目标条件的目标候选词槽,并将所述目标候选词槽对应的词语填充至所述目标候选词槽中。

13.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至11任一所述的词槽填充方法。

14.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至11任一所述的词槽填充方法。

技术总结
本申请公开了一种词槽填充方法、装置、设备及存储介质,属于计算机技术领域。所述方法包括:在执行目标任务流程的过程中,从该目标任务流程对应的多个目标词槽中,获取用户输入的对话语句中每一词语对应的候选词槽,得到候选词槽集合;对于该候选词槽集合中的每一候选词槽,根据该候选词槽的特征信息获取该候选词槽的评价信息;从该候选词槽集合中筛选出评价信息满足目标条件的目标候选词槽,并将该目标候选词槽对应的词语填充至该目标候选词槽中。本申请实施例提供的技术方案能够在一定程度上提高词槽填充的准确率。

技术研发人员:李自法;刘思亮;武士雄
受保护的技术使用者:深圳追一科技有限公司
技术研发日:2019.12.31
技术公布日:2020.06.05

转载请注明原文地址: https://bbs.8miu.com/read-54835.html

最新回复(0)