一种改写模型的构建方法、显示设备及句子改写方法与流程

专利2026-05-12  3


本技术涉及自然语言处理领域,尤其涉及一种改写模型的构建方法、显示设备及句子改写方法。


背景技术:

1、显示设备是指能够输出具体显示画面的终端设备,可以是智能电视、移动终端、智能广告屏、投影仪等终端设备。以智能电视为例,智能电视是基于internet应用技术,具备开放式操作系统与芯片,拥有开放式应用平台,可实现双向人机交互功能,集影音、娱乐、数据等多种功能于一体的电视产品,用于满足用户多样化和个性化需求。

2、显示设备可以被配置有语音助手(voice assistant)功能,这样,用户可以以语音的方式通过语音助手与显示设备进行人机交互。用户向语音助手输入多次语音,并且由语音助手对每一次语音给出应答的过程可以称为多轮人机对话。在多轮人机对话的过程中,由于用户在当前轮发送的语音可能与前几轮发送的语音或者应答具有关联性,因此,用户在当前轮发送的语音可能会出现省略和/或指代,即用户在当前轮发送的语音所对应的句子不完整。

3、语音助手为了可以更加准确地的进行应答,需要对用户在当前轮发送的语音所对应的句子进行改写,也可以称为补全,即补全句子中的省略和指代。这样,语音助手可以针对改写后的句子进行更加准确地应答。如果语音助手基于预设的改写规则对句子进行改写,则需要人工预先根据对话的语境和逻辑关系设计改写规则和模板,这种改写方式会耗费大量的人力成本,以及要求人工具有专业知识。如果语音助手使用语言模型对句子进行改写,则需要人工进行大量、且高质量地数据和特征的标注过程,以得到语言模型的训练数据,并可以使用这些训练数据训练得到具有较强泛化能力的语言模型。这种补全方式也会耗费大量的人力成本。


技术实现思路

1、本技术提供了一种改写模型的构建方法、显示设备及句子改写方法,可以有效提高句子的改写能力。

2、第一方面,本技术提供了一种改写模型的构建方法,所述方法包括:

3、构造与指定场景相关的第一提示语,所述第一提示语用于提示生成与所述指定场景相关的人机对话数据、所述人机对话数据所要符合的结构要求和缺省要求、以及对所述人机对话数据中的第一指定句子进行改写,其中,所述结构要求包括所述人机对话数据以用户输入为结尾,所述缺省要求为所述结尾包括对之前的人机对话数据的省略和/或指代;

4、根据所述第一提示语使用预设模型生成第一对话数据,并以所述第一对话数据中的结尾作为所述第一指定句子,对所述第一指定句子进行改写,得到改写结果;

5、根据第一指令,以所述第一对话数据作为输入,以所述改写结果作为输出,构建训练数据,所述第一指令用于指示根据所述第一对话数据改写所述第一指定句子;

6、使用所述训练数据训练预设的语言模型,得到改写模型。

7、在本技术的一些实施例中,所述第一提示语还包括真实人机对话数据,所述第一提示语提示模仿所述真实人机对话数据生成所述人机对话数据,其中,所述真实人机对话数据符合所述结构要求和所述缺省要求、以及包括对用户输入的标注和对所述真实人机对话数据中的第二指定句子的改写结果,所述第二指定句子为所述真实人机对话数据中存在缺省的用户输入,所述标注用于指示相应的用户输入是否语义完整;

8、所述方法还包括:

9、根据所述第一提示语使用所述预设模型生成所述第一对话数据,并以所述第一对话数据中每个存在缺省的用户输入作为所述第一指定句子,对所述第一指定句子进行改写,得到所述改写结果;

10、根据所述第一指令,以所述第一对话数据作为输入,以所述改写结果作为输出,构建所述训练数据;

11、使用所述训练数据训练所述预设的语言模型,得到所述改写模型。

12、在本技术的一些实施例中,所述第一指令还包括第二提示语,所述第二提示语用于提示所述第一对话数据中实体对应的实体标签。

13、在本技术的一些实施例中,所述根据所述第一指令,以所述第一对话数据作为输入,以所述改写结果作为输出,构建所述训练数据,包括:

14、如果所述训练数据中的所述第一对话数据包括m轮交互,则将所述第一对话数据拆分为与每一轮交互对应的m组对话数据,其中,每一组对话数据包括本轮交互对应的对话数据和本轮交互以前各轮交互对应的对话数据;

15、使用所述m组对话数据训练所述预设的语言模型,得到所述改写模型。

16、在本技术的一些实施例中,所述根据所述第一指令,以所述第一对话数据作为输入,以所述改写结果作为输出,构建所述训练数据,包括:

17、将所述第一对话数据中每一轮交互对应的对话数据按照轮次顺序进行拼接,得到拼接后的对话数据;

18、计算所述每一轮交互对应的对话数据中机器应答的第一损失;

19、使用所述拼接后的对话数据和所述第一损失训练所述预设的语言模型,得到所述改写模型。

20、第二方面,本技术还提供一种显示设备,包括:

21、控制器,被配置为:

22、在获取到用户在当前轮输入的第一语音之后,获取用户与所述显示设备之间前n轮的第二对话数据,n≥0,所述第二对话数据包括用户在每一轮输入的第二语音对应的第二句子和所述显示设备对应于所述第二句子生成的应答数据;

23、在n>0时,根据所述第二对话数据,基于预设的改写规则对所述第一语音对应的第一句子进行改写,以及使用如第一方面中任一所述的改写模型对所述第一句子进行改写;

24、如果基于所述预设的改写规则对所述第一句子进行改写得到第一改写结果,则将所述第一改写结果作为所述第一句子的目标改写结果;

25、如果基于所述预设的改写规则对所述第一句子进行改写未得到所述第一改写结果,则将使用所述改写模型对所述第一句子进行改写得到的第二改写结果作为所述第一句子的目标改写结果。

26、在本技术的一些实施例中,所述控制器在获取到用户在当前轮输入的第一语音之后,获取用户与所述显示设备之间前n轮的第二对话数据,被配置为:

27、获取用户与所述显示设备之间的m轮历史对话数据,m≥n,每一轮历史对话数据包括用户历史输入语音对应的历史句子和所述显示设备对应于所述历史句子生成的历史应答数据;

28、将每一轮历史对话数据作为待识别历史对话数据,识别所述待识别历史对话数据中的历史句子与后一轮历史对话数据中的历史句子之间是否具有可搭配的意图对;

29、在不具有所述可搭配的意图对时,从所述m轮历史对话数据中剔除所述待识别历史对话数据以及所述待识别历史对话数据之前的历史对话数据,得到所述第二对话数据。

30、在本技术的一些实施例中,在n>0时,所述控制器根据所述第二对话数据,基于预设的改写规则对所述第一语音对应的第一句子进行改写,被配置为:

31、优先采用任务型多轮改写的方式,根据n组所述第二句子对所述第一句子进行改写,其中,以所述当前轮的前一轮对话数据为第1轮对话数据,将所述第二对话数据拆分为n组对话数据,每一组对话数据包括本轮对话数据,每一组所述第二句子包括相应组对话数据中的所述第二句子;

32、如果将所述第一句子改写为完整的第一目标句子,则确定将所述第一句子改写为所述第一目标句子所使用的第一目标组对应的轮次;

33、如果所述第一目标组对应的轮次为1,则将所述第一目标句子确定为所述第一改写结果;

34、如果所述第一目标组对应的轮次不为1,则采用规则配置的方式,根据所述n组所述第二句子对所述第一句子进行改写,其中,如果将所述第一句子改写为完整的第二目标句子,则确定将所述第一句子改写为所述第二目标句子所使用的第二目标组对应的轮次;

35、将所述第一目标组的轮次和所述第二目标组的轮次中较小轮次对应的目标句子确定为所述第一改写结果。

36、在本技术的一些实施例中,所述控制器使用如权利要求1-5中任一所述的改写模型对所述第一句子进行改写,被配置为:

37、结合第二指令,根据所述第二对话数据和所述第一句子,构建指令数据,所述第二指令用于指示根据所述第二对话数据改写所述第一句子;

38、将所述指令数据输入所述改写模型,以通过所述改写模型获得所述第二改写结果。

39、第三方面,本技术还提供一种句子改写方法,应用于如第二方面中任一所述的显示设备,所述方法包括:

40、在获取到用户在当前轮输入的第一语音之后,获取用户与所述显示设备之间前n轮的第二对话数据,n≥0,所述第二对话数据包括用户在每一轮输入的第二语音对应的第二句子和所述显示设备对应于所述第二句子生成的应答数据;

41、在n>0时,根据所述第二对话数据,基于预设的改写规则对所述第一语音对应的第一句子进行改写,以及使用如第一方面中任一所述的改写模型对所述第一句子进行改写;

42、如果基于所述预设的改写规则对所述第一句子进行改写得到第一改写结果,则将所述第一改写结果作为所述第一句子的目标改写结果;

43、如果基于所述预设的改写规则对所述第一句子进行改写未得到所述第一改写结果,则将使用所述改写模型对所述第一句子进行改写得到的第二改写结果作为所述第一句子的目标改写结果。

44、用户与显示设备进行多轮人机对话时,显示设备在获取到用户当前轮输入的第一句子之后,获取前n轮的对话数据。显示设备根据该对话数据,基于预设的改写规则对第一句子进行改写,以及使用改写模型对第一句子进行改写。如果基于预设的改写规则对第一句子进行改写可以得到第一改写结果,则将该第一改写结果作为第一句子的目标改写结果;否则,将使用改写模型对第一句子进行改写得到的第二改写结果作为第一句子的目标改写结果。这样,显示设备如果基于有限的改写规则可以补全第一句子,则可以保证改写第一句子的效率。显示设备如果基于有限的改写规则无法补全第一句子,则可以使用改写模型保证改写第一句子。而且,由于改写模型可以通过训练预设的语言模型获得,且所使用的训练数据可以通过预设模型自动构建,因此,改写模型的获得方式更加简单、迅速。


技术特征:

1.一种改写模型的构建方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述第一提示语还包括真实人机对话数据,所述第一提示语提示模仿所述真实人机对话数据生成所述人机对话数据,其中,所述真实人机对话数据符合所述结构要求和所述缺省要求、以及包括对用户输入的标注和对所述真实人机对话数据中的第二指定句子的改写结果,所述第二指定句子为所述真实人机对话数据中存在缺省的用户输入,所述标注用于指示相应的用户输入是否语义完整;

3.根据权利要求1或2所述的方法,其特征在于,所述第一指令还包括第二提示语,所述第二提示语用于提示所述第一对话数据中实体对应的实体标签。

4.根据权利要求1或2所述的方法,其特征在于,所述根据所述第一指令,以所述第一对话数据作为输入,以所述改写结果作为输出,构建所述训练数据,包括:

5.根据权利要求1或2所述的方法,其特征在于,所述根据所述第一指令,以所述第一对话数据作为输入,以所述改写结果作为输出,构建所述训练数据,包括:

6.一种显示设备,其特征在于,包括:

7.根据权利要求6所述的显示设备,其特征在于,所述控制器在获取到用户在当前轮输入的第一语音之后,获取用户与所述显示设备之间前n轮的第二对话数据,被配置为:

8.根据权利要求6所述的显示设备,其特征在于,在n>0时,所述控制器根据所述第二对话数据,基于预设的改写规则对所述第一语音对应的第一句子进行改写,被配置为:

9.根据权利要求6所述的显示设备,其特征在于,所述控制器使用如权利要求1-5中任一所述的改写模型对所述第一句子进行改写,被配置为:

10.一种句子改写方法,其特征在于,应用于如权利要求6-9中任一所述的显示设备,所述方法包括:


技术总结
本申请提供一种改写模型的构建方法、显示设备及句子改写方法。用户与显示设备进行多轮人机对话时,显示设备在获取到用户当前轮输入的第一句子之后,获取前n轮的对话数据。显示设备根据该对话数据,并行基于改写规则和使用改写模型改写第一句子。显示设备如果基于有限的改写规则可以补全第一句子,则可以保证改写第一句子的效率。显示设备如果基于有限的改写规则无法补全第一句子,则可以使用改写模型保证有效改写第一句子。而且,由于改写模型可以通过训练预设的语言模型获得,且所使用的训练数据可以通过预设模型自动构建,因此,改写模型的获得方式更加简单、迅速。

技术研发人员:王涵钰,陈冉
受保护的技术使用者:海信视像科技股份有限公司
技术研发日:
技术公布日:2024/7/25
转载请注明原文地址: https://bbs.8miu.com/read-440281.html

最新回复(0)