文本处理方法、装置、设备及存储介质与流程

专利2026-06-11  2


本技术涉及人工智能,尤其涉及一种文本处理方法、装置、设备及存储介质。


背景技术:

1、智能问答系统可以通过人工智能和自然语言处理领域相结合,为用户快速提供问题对应的应答。

2、在现有技术中,用户可以通过终端设备在智能问答系统中输入当前问题,处理设备可以接收当前问题,将当前问题与数据库中的多个历史文本进行匹配处理,得到每个历史文本对应的匹配度,将匹配度最大的历史文本确定为当前问题对应的当前应答。在上述过程中,将当前问题与历史文本进行匹配,并且将匹配度最大的历史文本确定为当前应答,使得应答结果的准确性较低。


技术实现思路

1、本技术提供一种文本处理方法、装置、设备及存储介质,用以解决现有技术中应答结果的准确性较低的技术问题。

2、第一方面,本技术提供一种文本处理方法,包括:

3、接收目标用户的当前问题;

4、根据所述当前问题在多个历史问题中,确定多个初始问题;

5、确定每个初始问题与所述当前问题的语义相似度;

6、根据所述每个初始问题对应的语义相似度和第一阈值,确定所述当前问题对应的目标文本,所述第一阈值用于在所述多个初始问题中确定第一目标问题或者第二目标问题,以确定目标文本;

7、对所述当前问题和所述目标文本进行文本处理,得到所述当前问题对应的当前应答。

8、有一些可能的实施例中,根据所述每个初始问题对应的语义相似度和所述第一阈值,确定所述当前问题对应的目标文本,包括:

9、判断是否存在所述语义相似度大于所述第一阈值的初始问题;

10、若是,则将所述语义相似度最大的初始问题确定为第一目标问题,并将第一目标问题对应的历史文本确定为所述当前问题对应的目标文本;

11、若否,则确定所述语义相似度大于第二阈值的至少一个第二目标问题,并根据所述至少一个第二目标问题对应的至少一个历史文本进行整合处理,得到所述目标文本。

12、有一些可能的实施例中,根据所述当前问题在多个历史问题中,确定多个初始问题,包括:

13、在预设数据库中获取每个历史文本对应的至少一个历史问题,以得到多个历史问题;

14、确定每个历史问题与所述当前问题的文本相似度;

15、将所述文本相似度大于第三阈值的历史问题确定为初始问题,以得到多个初始问题。

16、有一些可能的实施例中,在所述多个历史问题中确定所述当前问题对应的多个初始问题,包括:

17、在预设数据库中获取每个历史文本对应的至少一个历史问题,以得到多个历史问题;

18、确定每个历史问题与所述当前问题的文本相似度;

19、将所述文本相似度大于第三阈值的历史问题确定为初始问题,以得到多个初始问题。

20、有一些可能的实施例中,针对任意一个历史问题;确定所述历史问题与所述当前问题的文本相似度,包括:

21、对所述当前问题进行数据预处理,得到所述当前问题的多个有效字符;

22、确定每个有效字符与所述历史问题的字符匹配度;

23、将所述每个有效字符的字符匹配度之和确定为所述历史问题的文本相似度。

24、有一些可能的实施例中,确定所述每个初始问题与所述当前问题的语义相似度,包括:

25、对所述当前问题进行向量化处理,得到当前问题向量;

26、针对任意一个初始问题,对所述初始问题进行向量化处理,得到初始问题向量;

27、将多个初始问题向量与所述当前问题向量进行数据处理,得到所述每个初始向量的语义相似度。

28、有一些可能的实施例中,对所述当前问题和所述目标文本进行文本处理,得到所述当前问题对应的当前应答,包括:

29、获取输入模板,所述输入模板包括多个待替换字段;

30、根据所述当前问题和所述目标文本对所述输入模板进行文本处理,得到输入文本;

31、将所述输入文本输入第一预设模型,得到所述当前问题对应的当前应答。

32、有一些可能的实施例中,根据所述当前问题和所述目标文本对所述输入模板进行文本处理,得到输入文本,包括:

33、根据所述当前问题,确定当前前缀文本;

34、将所述当前问题、所述目标文本和所述当前前缀文本对所述输入模板进行替换处理,生成所述输入文本。

35、有一些可能的实施例中,在预设数据库中获取每个历史文本对应的至少一个历史问题,以得到多个历史问题之前,还包括:

36、获取多个历史文档;

37、针对任意一个历史文档,对所述历史文档进行切分处理,得到至少一个历史文本,以得到所述多个历史文本;

38、通过第二预设模型对所述多个历史文本进行文本提取处理,得到所述每个历史文本对应的至少一个历史问题;

39、将所述每个历史文本、以及所述每个历史文本对应的至少一个历史问题存储在至所述预设数据库。

40、第二方面,本技术实施例提供一种文本处理装置,包括接收模块、第一确定模块、第二确定模块、第三确定模块和文本处理模块:

41、所述接收模块用于,接收目标用户的当前问题;

42、所述第一确定模块用于,根据所述当前问题在多个历史问题中,确定多个初始问题;

43、所述第二确定模块用于,确定每个初始问题与所述当前问题的语义相似度;

44、所述第三确定模块用于,根据所述每个初始问题对应的语义相似度和第一阈值,确定所述当前问题对应的目标文本,所述第一阈值用于在所述多个初始问题中确定第一目标问题或者第二目标问题,以确定目标文本;

45、所述文本处理模块用于,对所述当前问题和所述目标文本进行文本处理,得到所述当前问题对应的当前应答。

46、有一些可能的实施例中,所述第三确定模块具体用于

47、判断是否存在所述语义相似度大于所述第一阈值的初始问题;

48、若是,则将所述语义相似度最大的初始问题确定为第一目标问题,并将第一目标问题对应的历史文本确定为所述当前问题对应的目标文本;

49、若否,则确定所述语义相似度大于第二阈值的至少一个第二目标问题,并根据所述至少一个第二目标问题对应的至少一个历史文本进行整合处理,得到所述目标文本。

50、有一些可能的实施例中,所述第一确定模块具体用于:

51、在预设数据库中获取每个历史文本对应的至少一个历史问题,以得到多个历史问题;

52、确定每个历史问题与所述当前问题的文本相似度;

53、将所述文本相似度大于第三阈值的历史问题确定为初始问题,以得到多个初始问题。

54、有一些可能的实施例中,针对任意一个历史问题;所述第一确定模块具体用于:

55、对所述当前问题进行数据预处理,得到所述当前问题的多个有效字符;

56、确定每个有效字符与所述历史问题的字符匹配度;

57、将所述每个有效字符的字符匹配度之和确定为所述历史问题的文本相似度。

58、有一些可能的实施例中,所述第二确定模块具体用于:

59、对所述当前问题进行向量化处理,得到当前问题向量;

60、针对任意一个初始问题,对所述初始问题进行向量化处理,得到初始问题向量;

61、将多个初始问题向量与所述当前问题向量进行数据处理,得到所述每个初始向量的语义相似度。

62、有一些可能的实施例中,所述文本处理模块具体用于:

63、获取输入模板,所述输入模板包括多个待替换字段;

64、根据所述当前问题和所述目标文本对所述输入模板进行文本处理,得到输入文本;

65、将所述输入文本输入第一预设模型,得到所述当前问题对应的当前应答。

66、有一些可能的实施例中,所述文本处理模块具体用于:

67、根据所述当前问题,确定当前前缀文本;

68、将所述当前问题、所述目标文本和所述当前前缀文本对所述输入模板进行替换处理,生成所述输入文本。

69、有一些可能的实施例中,在预设数据库中获取每个历史文本对应的至少一个历史问题,以得到多个历史问题之前,还包括第二获取模块、切分处理模块、文本提取处理模块和存储模块:

70、所述第二获取模块用于,获取多个历史文档;

71、所述切分处理模块用于,针对任意一个历史文档,对所述历史文档进行切分处理,得到至少一个历史文本,以得到所述多个历史文本;

72、所述文本提取处理模块用于,通过第二预设模型对所述多个历史文本进行文本提取处理,得到所述每个历史文本对应的至少一个历史问题;

73、所述存储模块用于,将所述每个历史文本、以及所述每个历史文本对应的至少一个历史问题存储在至所述预设数据库。

74、第三方面,本技术实施例提供一种电子设备,包括:至少一个处理器和存储器;所述存储器存储计算机执行指令;所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如上第一方面以及第一方面各种可能的设计所述的文本处理方法。

75、第四方面,本技术实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上第一方面以及第一方面各种可能的设计所述的文本处理方法。

76、第五方面,本技术实施例提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时,实现如上第一方面以及第一方面各种可能的设计所述的文本处理方法。

77、本技术提供的文本处理方法、装置、设备及存储介质,在接收目标用户的当前问题后,在多个历史问题中确定与当前问题相似的多个初始问题,通过多个初始问题对应的历史文本,确定目标文本,再根据当前问题对目标文本进行文本处理,可以提高应答结果的准确性。


技术特征:

1.一种文本处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,根据所述每个初始问题对应的语义相似度和所述第一阈值,确定所述当前问题对应的目标文本,包括:

3.根据权利要求1-2任一项所述的方法,其特征在于,根据所述当前问题在多个历史问题中,确定多个初始问题,包括:

4.根据权利要求3所述的方法,其特征在于,针对任意一个历史问题;确定所述历史问题与所述当前问题的文本相似度,包括:

5.根据权利要求1-4任一项所述的方法,其特征在于,确定每个初始问题与所述当前问题的语义相似度,包括:

6.根据权利要求1-5任一项所述的方法,其特征在于,对所述当前问题和所述目标文本进行文本处理,得到所述当前问题对应的当前应答,包括:

7.根据权利要求6所述的方法,其特征在于,根据所述当前问题和所述目标文本对所述输入模板进行文本处理,得到输入文本,包括:

8.根据权利要求1-7任一项所述的方法,其特征在于,在预设数据库中获取每个历史文本对应的至少一个历史问题,以得到多个历史问题之前,还包括:

9.一种文本处理装置,其特征在于,包括接收模块、第一获取模块、第一确定模块、第二确定模块和文本处理模块:

10.一种电子设备,其特征在于,包括:存储器和处理器,

11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当所述计算机执行指令被处理器执行时用于实现权利要求1至8任一项所述的文本处理方法。

12.一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现权利要求1至8任一项所述的文本处理方法。


技术总结
本申请提供一种文本处理方法、装置、设备及存储介质。涉及人工智能技术领域。该方法包括:接收目标用户的当前问题;根据当前问题在多个历史问题中,确定多个初始问题;确定每个初始问题与当前问题的语义相似度;根据每个初始问题对应的语义相似度和第一阈值,确定当前问题对应的目标文本,第一阈值用于在多个初始问题中确定第一目标问题或者第二目标问题,以确定目标文本;对当前问题和目标文本进行文本处理,得到当前问题对应的当前应答。本申请的方法,提高了应答结果的准确性。

技术研发人员:戴菀庭,罗奕康,聂砂,郑江,丁苏苏
受保护的技术使用者:中国建设银行股份有限公司
技术研发日:
技术公布日:2024/7/25
转载请注明原文地址: https://bbs.8miu.com/read-440889.html

最新回复(0)