本公开涉及互联网领域,特别涉及一种评论质量的确定方法、装置、电子设备及存储介质。
背景技术:
1、在互联网领域,评论区是作品的创作者与用户、用户与用户之间直接进行互动的区域,这种互动方式不但有温度又兼具亲和力,而且能够真实反映出用户的兴趣和实际需求。
2、由于任意注册用户均可在互联网平台的评论区发表评论,因此评论区中的评论质量参差不齐。基于这一前提,评估评论质量在很多场景下都非常重要,比如资源推荐景、评论搬运、评论排序或评论过滤等场景。
3、相关技术中在评估评论质量时,一般只考虑评论自身,且仅通过判断评论是否命中违禁词、垃圾词或情感褒贬词等来衡量评论的质量。不但评估时参考的信息单一,而且评估维度单一,缺乏对评论质量进行有效评估。
技术实现思路
1、本公开提供一种评论质量的确定方法、装置、电子设备及存储介质。本公开的技术方案如下:
2、根据本公开实施例的第一方面,提供一种评论质量的确定方法,包括:
3、对于多媒体作品,获取与作品内容相关的作品属性信息和待确定质量的目标评论;
4、基于所述目标评论和所述作品属性信息,获取第一得分和第二得分;其中,所述第一得分用于衡量所述多媒体作品与所述目标评论之间的内容相关性;所述第二得分用于衡量所述目标评论的情感极性;
5、获取所述目标评论的信息量;其中,所述信息量是对所述目标评论在给定所述作品属性信息的前提下所包含信息大小的度量;
6、基于所述第一得分、所述第二得分和所述信息量,确定所述目标评论的质量。
7、在一些实施例中,所述作品属性信息包括以下至少一项:
8、所述多媒体作品的标题;
9、所述多媒体作品的类别;
10、所述多媒体作品的光学识别文本;其中,所述光学识别文本是通过对所述多媒体作品中包括的图片进行光学字符识别得到的;
11、所述多媒体作品的语音识别文本;其中,所述语音识别文本是通过对所述多媒体作品中包括的语音进行语音识别得到的。
12、在一些实施例中,所述目标评论包括:针对所述多媒体作品的评论以及对所述评论进行回复的回复文本。
13、在一些实施例中,所述基于所述目标评论和所述作品属性信息,获取第一得分和第二得分,包括:
14、将所述目标评论和所述作品属性信息输入第一模型进行语义相似度分析,得到所述第一得分;其中,所述第一模型是基于第一训练样本集训练得到的,所述第一训练样本集中包括第一样本评论和所述第一样本评论对应的样本作品属性信息;
15、将所述目标评论输入第二模型进行情感极性分析,得到所述第二得分;其中,所述第二模型是基于第二训练样本集训练得到的,所述第二训练样本集中包括第二样本评论。
16、在一些实施例中,所述获取所述目标评论的信息量,包括:
17、分别对所述作品属性信息和所述目标评论进行信息抽取,得到信息抽取结果;其中,所述信息抽取结果包括实体和事件三元组;所述事件三元组中包括事件主体、事件触发词和事件客体;
18、基于所述信息抽取结果,获取所述目标评论的信息量。
19、在一些实施例中,所述分别对所述作品属性信息和所述目标评论进行信息抽取,得到信息抽取结果,包括:
20、从所述作品属性信息中抽取实体和事件三元组,得到第一实体列表和第一事件三元组列表;其中,所述事件三元组中包括事件主体、事件触发词和事件客体;
21、从所述目标评论中抽取实体和事件三元组,得到第二实体列表和第二事件三元组列表;
22、将所述第一实体列表、所述第一事件三元组列表、所述第二实体列表和所述第二事件三元组列表,作为所述信息抽取结果。
23、在一些实施例中,所述方法还包括:
24、在所述第一实体列表中查询核心实体,得到第一核心实体;以及,在所述第一事件三元组列表中查询核心事件三元组,得到第一核心事件三元组;
25、在所述第二实体列表中查询核心实体,得到第二核心实体;以及,在所述第二事件三元组列表中查询核心事件三元组,得到第二核心事件三元组;
26、其中,所述核心实体是指与所述多媒体作品的作品内容强相关的实体;所述核心事件三元组是指与所述多媒体作品的作品内容强相关的事件三元组。
27、在一些实施例中,所述基于所述第一得分、所述第二得分和所述信息量,确定所述目标评论的质量,包括:
28、基于所述信息抽取结果和知识图谱,生成至少一条虚拟评论;
29、基于所述信息量、所述目标评论和所述至少一条虚拟评论之间的相似度,获取第三得分;其中,所述第三得分用于衡量所述目标评论在信息量维度的质量;
30、基于所述第一得分、所述第二得分和所述第三得分,确定所述目标评论在所述信息量维度、内容相关性维度和情感极性维度的综合质量。
31、在一些实施例中,所述基于所述信息抽取结果和知识图谱,生成至少一条虚拟评论,包括以下至少一项:
32、将所述第一事件三元组列表中包括的事件三元组填充至预设的第一句式模板中,得到所述虚拟评论;
33、将所述第一核心事件三元组中包括的核心事件三元组填充至预设的第二句式模板中,得到所述虚拟评论;
34、基于所述知识图谱和所述第一实体列表,生成所述虚拟评论;
35、基于所述知识图谱和所述第一核心实体,生成所述虚拟评论。
36、在一些实施例中,所述基于所述知识图谱和所述第一实体列表,生成所述虚拟评论,包括:
37、在所述知识图谱中,查询与所述第一实体列表中包括的实体存在关联关系的相关实体;
38、基于所述相关实体和所述相关实体的简介,生成所述虚拟评论。
39、在一些实施例中,所述基于所述知识图谱和所述第一核心实体,生成所述虚拟评论,包括:
40、在所述知识图谱中,查询与所述第一核心实体存在关联关系的相关核心实体;
41、基于所述相关核心实体和所述相关核心实体的简介,生成所述虚拟评论。
42、在一些实施例中,所述基于所述信息抽取结果,获取所述目标评论的信息量,包括:
43、基于所述信息抽取结果和预设的多样性参数,确定所述目标评论的多样性得分;
44、基于所述信息抽取结果和预设的相关性参数,确定所述目标评论的相关性得分;
45、基于所述目标评论的多样性得分和相关性得分,获取所述目标评论的信息量。
46、在一些实施例中,所述基于所述信息抽取结果和预设的多样性参数,确定所述目标评论的多样性得分,包括:
47、获取实体多样性对应的第一权重参数和第一调节参数;
48、获取事件多样性对应的第二权重参数和第二调节参数;
49、确定所述第一实体列表和所述第二实体列表的交集中包括的第一实体数量;
50、确定所述第一事件三元组列表和所述第二事件三元组列表的交集中包括的事件三元组数量;
51、基于所述第一权重参数、所述第一调节参数、所述第二权重参数、所述第二调节参数、所述第一实体数量和所述事件三元组数量,确定所述目标评论的多样性得分;
52、其中,所述第一调节参数用于调节所述第一实体数量;所述第二调节参数用于调节所述事件三元组数量;所述第一权重参数用于对衡量所述实体多样性的数值进行加权;所述第二权重参数用于对衡量事件多样性的数值进行加权。
53、在一些实施例中,所述基于所述第一权重参数、所述第一调节参数、所述第二权重参数、所述第二调节参数、所述第一实体数量和所述事件三元组数量,确定所述目标评论的多样性得分,包括:
54、基于所述第一调节参数和所述第一实体数量,获取第一数值;其中,所述第一数值用于衡量实体多样性;
55、基于所述第二调节参数和所述事件三元组数量,获取第二数值;其中,所述第二数值用于衡量事件多样性;
56、通过所述第一权重参数和所述第二权重参数,对所述第一数值和所述第二数值进行加权求和,得到所述多样性得分。
57、在一些实施例中,所述基于所述信息抽取结果和预设的相关性参数,确定所述目标评论的相关性得分,包括:
58、获取实体相关性对应的第三权重参数和第三调节参数;
59、获取事件相关性对应的第四权重参数和第四调节参数;
60、将第一实体数量与第二实体数量之间的比值,作为第一比值;其中,所述第一实体数量是所述第一实体列表和所述第二实体列表的交集中包括的实体数量;所述第二实体数量是所述第一实体列表和所述第二实体列表的并集中包括的实体数量;
61、将第一事件三元组数量与第二事件三元组数量之间的比值,作为第二比值;其中,所述第一事件三元组数量是所述第一事件三元组列表和所述第二事件三元组列表的交集中包括的事件三元组数量;所述第二事件三元组数量是所述第一事件三元组列表和所述第二事件三元组列表的并集中包括的事件三元组数量;
62、基于所述第三权重参数、所述第三调节参数、所述四权重参数、所述第四调节参数、所述第一比值和所述第二比值,确定所述目标评论的相关性得分;
63、其中,所述第三调节参数用于调节所述第一比值;所述第四调节参数用于调节所述第二比值;所述第三权重参数用于对衡量所述实体相关性的数值进行加权;所述第四权重参数用于对衡量所述事件相关性的数值进行加权。
64、在一些实施例中,所述基于所述信息量、所述目标评论和所述至少一条虚拟评论之间的相似度,获取第三得分,包括:
65、在所述信息量的取值大于或等于第一阈值的情况下,将获取到的最大相似度作为所述第三得分;其中,获取到的相似度中包括:所述目标评论与所述至少一条虚拟评论中每条虚拟评论之间的相似度。
66、根据本公开实施例的第二方面,提供一种评论质量的确定装置,包括:
67、第一获取模块,被配置为对于多媒体作品,获取与作品内容相关的作品属性信息和待确定质量的目标评论;
68、第二获取模块,被配置为基于所述目标评论和所述作品属性信息,获取第一得分和第二得分;其中,所述第一得分用于衡量所述多媒体作品与所述目标评论之间的内容相关性;所述第二得分用于衡量所述目标评论的情感极性;
69、第三获取模块,被配置为获取所述目标评论的信息量;其中,所述信息量是对所述目标评论在给定所述作品属性信息的前提下所包含信息大小的度量;
70、确定模块,被配置为基于所述第一得分、所述第二得分和所述信息量,确定所述目标评论的质量。
71、在一些实施例中,所述作品属性信息包括以下至少一项:
72、所述多媒体作品的标题;
73、所述多媒体作品的类别;
74、所述多媒体作品的光学识别文本;其中,所述光学识别文本是通过对所述多媒体作品中包括的图片进行光学字符识别得到的;
75、所述多媒体作品的语音识别文本;其中,所述语音识别文本是通过对所述多媒体作品中包括的语音进行语音识别得到的。
76、在一些实施例中,所述目标评论包括:针对所述多媒体作品的评论以及对所述评论进行回复的回复文本。
77、在一些实施例中,所述第二获取模块,被配置为:
78、将所述目标评论和所述作品属性信息输入第一模型进行语义相似度分析,得到所述第一得分;其中,所述第一模型是基于第一训练样本集训练得到的,所述第一训练样本集中包括第一样本评论和所述第一样本评论对应的样本作品属性信息;
79、将所述目标评论输入第二模型进行情感极性分析,得到所述第二得分;其中,所述第二模型是基于第二训练样本集训练得到的,所述第二训练样本集中包括第二样本评论。
80、在一些实施例中,所述第三获取模块,被配置为:
81、分别对所述作品属性信息和所述目标评论进行信息抽取,得到信息抽取结果;其中,所述信息抽取结果包括实体和事件三元组;所述事件三元组中包括事件主体、事件触发词和事件客体;
82、基于所述信息抽取结果,获取所述目标评论的信息量。
83、在一些实施例中,所述第三获取模块,被配置为:
84、从所述作品属性信息中抽取实体和事件三元组,得到第一实体列表和第一事件三元组列表;其中,所述事件三元组中包括事件主体、事件触发词和事件客体;
85、从所述目标评论中抽取实体和事件三元组,得到第二实体列表和第二事件三元组列表;
86、将所述第一实体列表、所述第一事件三元组列表、所述第二实体列表和所述第二事件三元组列表,作为所述信息抽取结果。
87、在一些实施例中,所述第三获取模块,还被配置为:
88、在所述第一实体列表中查询核心实体,得到第一核心实体;以及,在所述第一事件三元组列表中查询核心事件三元组,得到第一核心事件三元组;
89、在所述第二实体列表中查询核心实体,得到第二核心实体;以及,在所述第二事件三元组列表中查询核心事件三元组,得到第二核心事件三元组;
90、其中,所述核心实体是指与所述多媒体作品的作品内容强相关的实体;所述核心事件三元组是指与所述多媒体作品的作品内容强相关的事件三元组。
91、在一些实施例中,所述确定模块,被配置为:
92、基于所述信息抽取结果和知识图谱,生成至少一条虚拟评论;
93、基于所述信息量、所述目标评论和所述至少一条虚拟评论之间的相似度,获取第三得分;其中,所述第三得分用于衡量所述目标评论在信息量维度的质量;
94、基于所述第一得分、所述第二得分和所述第三得分,确定所述目标评论在所述信息量维度、内容相关性维度和情感极性维度的综合质量。
95、在一些实施例中,所述确定模块,被配置为执行以下至少一项:
96、将所述第一事件三元组列表中包括的事件三元组填充至预设的第一句式模板中,得到所述虚拟评论;
97、将所述第一核心事件三元组中包括的核心事件三元组填充至预设的第二句式模板中,得到所述虚拟评论;
98、基于所述知识图谱和所述第一实体列表,生成所述虚拟评论;
99、基于所述知识图谱和所述第一核心实体,生成所述虚拟评论。
100、在一些实施例中,所述确定模块,被配置为:
101、在所述知识图谱中,查询与所述第一实体列表中包括的实体存在关联关系的相关实体;
102、基于所述相关实体和所述相关实体的简介,生成所述虚拟评论。
103、在一些实施例中,所述确定模块,被配置为:
104、在所述知识图谱中,查询与所述第一核心实体存在关联关系的相关核心实体;
105、基于所述相关核心实体和所述相关核心实体的简介,生成所述虚拟评论。
106、在一些实施例中,所述第三获取模块,被配置为:
107、基于所述信息抽取结果和预设的多样性参数,确定所述目标评论的多样性得分;
108、基于所述信息抽取结果和预设的相关性参数,确定所述目标评论的相关性得分;
109、基于所述目标评论的多样性得分和相关性得分,获取所述目标评论的信息量。
110、在一些实施例中,所述第三获取模块,被配置为:
111、获取实体多样性对应的第一权重参数和第一调节参数;
112、获取事件多样性对应的第二权重参数和第二调节参数;
113、确定所述第一实体列表和所述第二实体列表的交集中包括的第一实体数量;
114、确定所述第一事件三元组列表和所述第二事件三元组列表的交集中包括的事件三元组数量;
115、基于所述第一权重参数、所述第一调节参数、所述第二权重参数、所述第二调节参数、所述第一实体数量和所述事件三元组数量,确定所述目标评论的多样性得分;
116、其中,所述第一调节参数用于调节所述第一实体数量;所述第二调节参数用于调节所述事件三元组数量;所述第一权重参数用于对衡量所述实体多样性的数值进行加权;所述第二权重参数用于对衡量事件多样性的数值进行加权。
117、在一些实施例中,所述第三获取模块,被配置为:
118、基于所述第一调节参数和所述第一实体数量,获取第一数值;其中,所述第一数值用于衡量实体多样性;
119、基于所述第二调节参数和所述事件三元组数量,获取第二数值;其中,所述第二数值用于衡量事件多样性;
120、通过所述第一权重参数和所述第二权重参数,对所述第一数值和所述第二数值进行加权求和,得到所述多样性得分。
121、在一些实施例中,所述第三获取模块,被配置为:
122、获取实体相关性对应的第三权重参数和第三调节参数;
123、获取事件相关性对应的第四权重参数和第四调节参数;
124、将第一实体数量与第二实体数量之间的比值,作为第一比值;其中,所述第一实体数量是所述第一实体列表和所述第二实体列表的交集中包括的实体数量;所述第二实体数量是所述第一实体列表和所述第二实体列表的并集中包括的实体数量;
125、将第一事件三元组数量与第二事件三元组数量之间的比值,作为第二比值;其中,所述第一事件三元组数量是所述第一事件三元组列表和所述第二事件三元组列表的交集中包括的事件三元组数量;所述第二事件三元组数量是所述第一事件三元组列表和所述第二事件三元组列表的并集中包括的事件三元组数量;
126、基于所述第三权重参数、所述第三调节参数、所述四权重参数、所述第四调节参数、所述第一比值和所述第二比值,确定所述目标评论的相关性得分;
127、其中,所述第三调节参数用于调节所述第一比值;所述第四调节参数用于调节所述第二比值;所述第三权重参数用于对衡量所述实体相关性的数值进行加权;所述第四权重参数用于对衡量所述事件相关性的数值进行加权。
128、在一些实施例中,所述确定模块,被配置为:
129、在所述信息量的取值大于或等于第一阈值的情况下,将获取到的最大相似度作为所述第三得分;其中,获取到的相似度中包括:所述目标评论与所述至少一条虚拟评论中每条虚拟评论之间的相似度。
130、根据本公开实施例的第三方面,提供一种电子设备,该电子设备包括:
131、一个或多个处理器;
132、用于存储该处理器可执行程序代码的存储器;
133、其中,该处理器被配置为执行该程序代码,以实现上述第一方面或第一方面的任意一种可能实现方式所述的评论质量的确定方法。
134、根据本公开实施例的第四方面,提供一种计算机可读存储介质,在该计算机可读存储介质中的程序代码由电子设备的处理器执行的情况下,使得电子设备能够执行上述第一方面或第一方面的任意一种可能实现方式所述的评论质量的确定方法。
135、根据本公开实施例的第五方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序被电子设备的处理器执行时实现上述第一方面或第一方面的任意一种可能实现方式所述的评论质量的确定方法。
136、本公开实施例提供的评论质量的确定方案,能够对评论进行客观、准确的质量评估。详细来说,在评估评论质量时,该方案不但参考了多个维度的信息,比如考量了评论本身、作品属性信息和评论信息量等,而且还设置了多个评估维度,比如从评论与多媒体作品之间的内容相关性、评论的情感极性等维度进行综合评估,有效提升了评估质量。
137、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
1.一种评论质量的确定方法,其特征在于,所述方法包括:
2.根据权利要求1所述的评论质量的确定方法,其特征在于,所述作品属性信息包括以下至少一项:
3.根据权利要求1所述的评论质量的确定方法,其特征在于,所述目标评论包括:
4.根据权利要求1所述的评论质量的确定方法,其特征在于,所述基于所述目标评论和所述作品属性信息,获取第一得分和第二得分,包括:
5.根据权利要求1所述的评论质量的确定方法,其特征在于,所述获取所述目标评论的信息量,包括:
6.根据权利要求5所述的评论质量的确定方法,其特征在于,所述分别对所述作品属性信息和所述目标评论进行信息抽取,得到信息抽取结果,包括:
7.根据权利要求6所述的评论质量的确定方法,其特征在于,所述方法还包括:
8.根据权利要求5所述的评论质量的确定方法,其特征在于,所述基于所述第一得分、所述第二得分和所述信息量,确定所述目标评论的质量,包括:
9.根据权利要求8所述的评论质量的确定方法,其特征在于,所述基于所述信息抽取结果和知识图谱,生成至少一条虚拟评论,包括以下至少一项:
10.根据权利要求9所述的评论质量的确定方法,其特征在于,所述基于所述知识图谱和所述第一实体列表,生成所述虚拟评论,包括:
11.根据权利要求9所述的评论质量的确定方法,其特征在于,所述基于所述知识图谱和所述第一核心实体,生成所述虚拟评论,包括:
12.根据权利要求5所述的评论质量的确定方法,其特征在于,所述基于所述信息抽取结果,获取所述目标评论的信息量,包括:
13.根据权利要求12所述的评论质量的确定方法,其特征在于,所述基于所述信息抽取结果和预设的多样性参数,确定所述目标评论的多样性得分,包括:
14.根据权利要求13所述的评论质量的确定方法,其特征在于,所述基于所述第一权重参数、所述第一调节参数、所述第二权重参数、所述第二调节参数、所述第一实体数量和所述事件三元组数量,确定所述目标评论的多样性得分,包括:
15.根据权利要求12所述的评论质量的确定方法,其特征在于,所述基于所述信息抽取结果和预设的相关性参数,确定所述目标评论的相关性得分,包括:
16.根据权利要求8所述的评论质量的确定方法,其特征在于,所述基于所述信息量、所述目标评论和所述至少一条虚拟评论之间的相似度,获取第三得分,包括:
17.一种评论质量的确定装置,其特征在于,所述装置包括:
18.一种电子设备,其特征在于,所述电子设备包括:
19.一种计算机可读存储介质,其特征在于,在所述计算机可读存储介质中的指令由电子设备的处理器执行的情况下,使得电子设备能够执行如权利要求1至16中任一项所述的评论质量的确定方法。
20.一种计算机程序产品,其特征在于,包括计算机程序,所述计算机程序被电子设备的处理器执行时实现如权利要求1至16中任一项所述的评论质量的确定方法。
