本发明涉及计算机
技术领域:
,尤其涉及一种评论标签生成方法、装置和计算设备。
背景技术:
:随着信息工业的快速发展,越来越多的用户在各种互联网平台上购买产品和发表评论,且用户在购买产品前更希望能知道已使用过该产品的人群对于该产品的评价。不同于整体的情感分析,基于维度情感分析的分析粒度更为精细,其主要目的是根据评论信息给出一系列简明的表达,说明用户群体对某一产品各个维度的喜好程度。细粒度情感分析对于深刻理解商家和用户、挖掘用户情感等方面有至关重要的价值,能够广泛应用在个性化推荐、智能搜索、产品反馈、业务安全等领域。目前有基于长短期记忆网络的方法,将问题整体看作多维度的情感多分类问题,若有n种类别,每个类别的情感是二分类,则统一训练模型的类别为2n种。这种情况下要求各类别间必须具有明显区分的属性,比如汽车领域的动力、油耗等。但如果精确到更细维度,例如空间里的前排空间、后排空间、头部空间、腿部空间等,维度信息非常接近,且训练对象都是短句,上下文信息少,导致在整体分类过程中很难判断正确,正确率也非常低。另外一种方式是提取句子的中文情感词来表达整条评论的情感倾向,但评论文章的词语用法多种多样,很有可能导致抽取情感词对句子判定结果和实际结果的发生偏差,从而导致细粒度情感分析错误。技术实现要素:鉴于上述问题,本发明提出了一种评论标签生成方法、装置和计算设备,以力图解决或者至少解决上面存在的问题。根据本发明的一个方面,提供了一种评论标签生成方法,在计算设备中执行,该计算设备中存储有规则集,该规则集中的每个元素为评价维度与对应的标签生成规则的关联关系,该方法包括步骤:提取从目标评论中切分出的多个单维度子句,所述单维度子句是维度词和情感词均只有一个的子句;基于预先存储的标准词词典,将各单维度子句的维度词和情感词分别替换为对应的维度标准词和情感标准词;对于每个单维度子句,如果基于其替换后的标准词能够在所述规则集中匹配到对应的标签生成规则,则将该单维度子句判定为目标单维度子句;基于每个目标单维度子句所匹配上的标签生成规则生成该目标单维度子句的子句标签,从而得到所述目标评论的评论标签。可选地,在根据本发明的评论标签生成方法中,还包括步骤:采用情感分析模型对每个目标单维度子句进行情感分析,得到该目标单维度子句的情感极性,所述情感极性包括正向情感、负向情感和中性情感中的至少一种。可选地,在根据本发明的评论标签生成方法中,提取从目标评论中切分出的多个单维度子句的步骤包括:将该目标评论切分为多个短句,并对该多个短句进行分词处理,以识别其中同时具有维度词和情感词的目标短句;以及当目标短句超过预定字数或者存在两个以上情感词时,基于预先训练好的分句模型将该目标短句切分为多个单维度子句。可选地,在根据本发明的评论标签生成方法中,将该目标评论切分为多个短句的步骤包括:根据目标评论的标点符号将该目标评论切分为多个短句;其中,若目标评论没有标点符号,则基于所述分句模型将该目标评论切分为多个单维度子句。可选地,在根据本发明的评论标签生成方法中,将该目标评论切分为多个短句的步骤包括:剔除具有特殊句式的目标评论,再将剩下的目标评论切分为多个短句,该特殊句式包括反问句。可选地,在根据本发明的评论标签生成方法中,对多个短句进行分词处理的步骤包括:采用分词模型对每个短句进行分词处理,提取其中的维度词、情感词和过滤词中的至少一种,该些词分别代表评价维度、情感倾向和干扰信息。可选地,在根据本发明的评论标签生成方法中,标准词词典包括维度词词典、情感词词典、过滤词词典和宏文件中的至少一种;宏文件代表维度词与对应的可修饰情感词的关联关系,该分词模型中存储有所有标准词词典中的词。可选地,在根据本发明的评论标签生成方法中,还包括步骤:训练多义词分类器,并根据该分类器确定多义词属于情感词还是程度词,或者确定多义词属于名词还是情感词。可选地,在根据本发明的评论标签生成方法中,分句模型适于输出句子中切分符号加入位置的前字符和后字符,以在该前字符和后字符之间加入切分符号,从而将句子切分为多个单维度子句。可选地,在根据本发明的评论标签生成方法中,还包括分句模型的训练步骤:获取多个已经切分为单维度子句的文本内容,将其作为训练集对构建好的分句模型进行训练,得到训练好的分句模型。可选地,在根据本发明的评论标签生成方法中,标签生成规则包括多个占位符,每个占位符代表一种标准词x,且多个占位符之间通过逻辑运算符号连接;其中,标准词x包括维度标准词、与该维度相关的情感标准词、以及过滤标准词中的至少一种,情感标准词包括通用情感词、正向情感词和负向情感词中的至少一种。可选地,在根据本发明的评论标签生成方法中,逻辑运算符包括“%%”、“()”、“and”、“or”、和“not”中的至少一种,其中“%%”中填入标准词x,“()”代表优先运算,“and”代表同时出现,“or”代表两者取其一,“not”代表不能出现。可选地,在根据本发明的评论标签生成方法中,目标单维度子句的判定的步骤包括:对于每个单维度子句,若其替换后的维度标准词和情感标准词同时存在于规则集中的某标签生成规则中,且该子句中不含有该标签生成规则中的过滤标准词,则判定该单维度子句为目标单维度子句。可选地,在根据本发明的评论标签生成方法中,每种标准词词典均表示为标准词及其同义词的词簇,该标准词包括第一标准词和第二标准词,该标签生成规则中的标准词均为第一标准词,替换后的标准词均为替换后的第一标准词。可选地,在根据本发明的评论标签生成方法中,确定该标签生成规则中所匹配上的维度标准词;确定该标签生成规则中所匹配上的情感标准词,或者从该标签生成规则中任选一个与该目标单维度子句的情感极性相同的情感标准词;将所选取的维度标准词和情感标准词拼接为子句标签。可选地,在根据本发明的评论标签生成方法中,将所选取的维度标准词和情感标准词拼接为子句标签的步骤包括:分别确定该维度标准词和情感标准词所对应的第二标准词;该维度词的第一和第二标准词中任选一个维度标准词,从情感词的第一和第二标准词中任选一个情感标准词;以及将所选取的维度标准词和情感标准词拼接为子句标签。可选地,在根据本发明的评论标签生成方法中,在提取从目标评论中切分出的多个单维度子句之前,还包括步骤:对目标评论进行数据预处理操作,该数据预处理操作包括删除html代码、替换不可见字符、英文字符的大小写转换、标点符号的半角/全角转换和非标字符删除中的至少一种。根据本发明的另一个方面,提供了一种评论标签生成装置,适于驻留在计算设备中,计算设备中存储有规则集,所述规则集中的每个元素为评价维度与对应的标签生成规则的关联关系,该装置包括:子句切分模块,适于提取从目标评论中切分出的多个单维度子句,该单维度子句是维度词和情感词均只有一个的子句;归一化模块,适于基于预先存储的标准词词典,将各单维度子句的维度词和情感词分别替换为对应的维度标准词和情感标准词;规则匹配模块,适于对于每个单维度子句,如果基于其替换后的标准词能够在所述规则集中匹配到对应的标签生成规则,则将该单维度子句判定为目标单维度子句;标签生成模块,适于基于每个目标单维度子句所匹配上的标签生成规则生成该目标单维度子句的子句标签,从而得到目标评论的评论标签。根据本发明的又一方面,提供一种计算设备,包括:一个或多个处理器;存储器;以及一个或多个程序,其中一个或多个程序存储在存储器中并被配置为由一个或多个处理器执行,该一个或多个程序被处理器执行时实现如上所述的评论标签生成方法的步骤。根据本发明的又一方面,提供一种存储一个或多个程序的可读存储介质,该一个或多个程序包括指令,所述指令当由计算设备执行时实现如上所述的评论标签生成方法的步骤。根据本发明的技术方案,将评论内容切分为只含有一个维度词和情感词的单维度子句,保证每个子句之间相互独立,提高细粒度情感分析准确性。之后提取该单维度子句中的维度词和情感词,并利用复杂规则集命中所在类别和标签生成规则,同时还可以利用情感模型判断每个情感极性。这样不但有效解决维度区分度不大和类别少的问题,而且在情感模型判断的时候只对一种类别进行情感分析,大大降低了因为区分不开导致的错误,极大的提高了正确率。另外,本发明在匹配复杂规则时,采用归一化后的标准词进行匹配,方便统计。而在生成标签时,设定不同对象体系的情感词表述,例如动力标签在a品牌下的情感词表述为动力满意,在b品牌下的情感词表述为动力强劲等。每种体系下的标签可统计,且可从多个候选词中选出一个来生成标签,实现标签的多样化。上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。附图说明为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。图1示出了根据本发明一个实施例的计算设备100的结构框图;图2示出了根据本发明一个实施例的评论标签生成方法200的流程图;图3示出了根据本发明一个实施例的评论标签生成的过程分解示意图;图4示出了根据本发明一个实施例的部分汽车领域指标体系的示意图;图5示出了根据本发明一个实施例的标准词示意图;图6示出了根据本发明一个实施例的标签生成规则的示意图图7示出了根据本发明一个实施例的生成评论标签时的候选词示意图;图8示出了根据本发明一个实施例的生成的评论标签的示意图;以及图9示出了根据本发明一个实施例的评论标签生成装置900的结构图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。图1是根据本发明一个实施例的计算设备100的框图。在基本的配置102中,计算设备100典型地包括系统存储器106和一个或者多个处理器104。存储器总线108可以用于在处理器104和系统存储器106之间的通信。取决于期望的配置,处理器104可以是任何类型的处理,包括但不限于:微处理器(μp)、微控制器(μc)、数字信息处理器(dsp)或者它们的任何组合。处理器104可以包括诸如一级高速缓存110和二级高速缓存112之类的一个或者多个级别的高速缓存、处理器核心114和寄存器116。示例的处理器核心114可以包括运算逻辑单元(alu)、浮点数单元(fpu)、数字信号处理核心(dsp核心)或者它们的任何组合。示例的存储器控制器118可以与处理器104一起使用,或者在一些实现中,存储器控制器118可以是处理器104的一个内部部分。取决于期望的配置,系统存储器106可以是任意类型的存储器,包括但不限于:易失性存储器(诸如ram)、非易失性存储器(诸如rom、闪存等)或者它们的任何组合。系统存储器106可以包括操作系统120、一个或者多个应用122以及程序数据124。在一些实施方式中,应用122可以布置为在操作系统上利用程序数据124进行操作。程序数据124包括指令,在根据本发明的计算设备100中,程序数据124包含用于执行评论标签生成方法200的指令。计算设备100还可以包括有助于从各种接口设备(例如,输出设备142、外设接口144和通信设备146)到基本配置102经由总线/接口控制器130的通信的接口总线140。示例的输出设备142包括图形处理单元148和音频处理单元150。它们可以被配置为有助于经由一个或者多个a/v端口152与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外设接口144可以包括串行接口控制器154和并行接口控制器156,它们可以被配置为有助于经由一个或者多个i/o端口158和诸如输入设备(例如,键盘、鼠标、笔、语音输入设备、触摸输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备146可以包括网络控制器160,其可以被布置为便于经由一个或者多个通信端口164与一个或者多个其他计算设备162通过网络通信链路的通信。网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块,并且可以包括任何信息递送介质。“调制数据信号”可以这样的信号,它的数据集中的一个或者多个或者它的改变可以在信号中编码信息的方式进行。作为非限制性的示例,通信介质可以包括诸如有线网络或者专线网络之类的有线介质,以及诸如声音、射频(rf)、微波、红外(ir)或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。计算设备100可以实现为服务器,例如文件服务器、数据库服务器、应用程序服务器和web服务器等,也可以实现为小尺寸便携(或者移动)电子设备的一部分,这些电子设备可以是诸如蜂窝电话、个人数字助理(pda)、个人媒体播放器设备、无线网络浏览设备、个人头戴设备、应用专用设备、或者可以包括上面任何功能的混合设备。计算设备100还可以实现为包括桌面计算机和笔记本计算机配置的个人计算机。在一些实施例中,计算设备100被配置为执行评论标签生成方法200。图2示出了根据本发明一个实施例的评论标签生成方法200的流程示意图。方法200在计算设备中执行,如在计算设备100中执行。标签生成方法200的详细过程可参考图3中的分解过程进行理解。如图2所示,该方法始于步骤s210。在步骤s210中,提取从目标评论中切分出的多个单维度子句,该单维度子句是维度词和情感词均只有一个的子句。根据一个实施例,在对目标评论中进行多个单维度子句的切分之前,还包括步骤:对目标评论进行数据预处理操作,以去除文本中所存在的会影响到结果的文字信息。该数据预处理操作包括删除html代码、替换不可见字符、英文字符的大小写转换、标点符号的半角/全角转换和非标字符删除中的至少一种。具体而言,将空格或其他特殊符号转换为逗号,将小写英文转换为大写英文,将半角符号全部转换为全角符号,将稀有字符等非标字符删掉。根据另一个实施例,提取从目标评论中切分出的多个单维度子句的步骤包括:将该目标评论切分为多个短句,并对该多个短句进行分词处理,以识别其中同时具有维度词和情感词的目标短句。当目标短句超过预定字数(如20个字,当然不限于此)或者存在两个以上(包括两个)情感词时,基于预先训练好的分句模型将该目标短句切分为多个单维度子句。具体而言,第一步,根据目标评论的标点符号来将该目标评论切分为多个短句。例如,根据句号、感叹号、分号将目标评论先切分为长句,再根据每个长句中的逗号、顿号等,将长句切分为短句。当然,若目标评论没有标点符号,则直接基于分句模型将该目标评论切分为多个单维度子句。而且,在将目标评论切分为多个短句之前,还可以先剔除具有特殊句式的目标评论,再将剩下的目标评论切分为多个短句。特殊句式包括反问句、关联句等,这些特殊句式可以分别通过识别句子中的疑问符号、关联词来判定。其中,关联句包括转折关系、假设关系、条件关系、选择关系、承接关系、并列关系、因果关系中的至少一种,每种关联关系都有对应的关联词,如“虽然/但是”组合、“如果/就”组合、“只要/就”组合、“不是/就是”等组合。考虑到这些关联句可能会干扰情感极性的判断,甚至会导致生成错误的情感标签,因此本发明对含有这些常用关联词的关联句都进行了剔除处理,而基于剩下的语料来生成标签。这种做法虽然降低了一部分语料量,但能够保证不产生错误的情感标签。而且,当评论语料的数据量非常大的情况下,这种剔除做法对语料量的影响是可以忽略的。需要说明的是,对于递进关系的关联句,如“不但/而且”组合、“不仅/含”组合等,其前后两句话的情感倾向是一致的。因此,在一种实现方式中,本发明可以保留具有递进关系的关联句,而删除其他关联关系的关联句。第二步,在将目标评论切分为多个短句后,再采用分词模型对每个短句进行分词处理,提取其中的维度词、情感词和过滤词中的至少一种,该些词分别代表评价维度、情感倾向和干扰信息。举例而言,维度词例如包括动力、油耗、空间、前排头部空间、前排尾部空间等。评价维度代表一个评价aspect,可称为评价类别、评价方面或指标体系,这是一种细粒度的评价维度,该评价维度包括从顶级到最细层级的路径关系,也就是从大类到小类的路径关系,如“空间-前排空间-前排头部空间”。图4示出了根据本发明一个实施例的部分汽车领域指标体系的示例,这些评价维度可概括为空间、动力、内饰、油耗、电耗、性价比、操控、舒适性、外观、故障等10个大类,而这多个大类可细分出552个细粒度的小类,如前排头部空间、前排尾部空间、前备箱空间、后备箱空间等等。情感词例如包括形容空间的情感词,宽敞、大、满意、好、不好等。过滤词主要包括与维度无关的干扰词,如空间的无关词有书包、塑料、路边等等。这些干扰词可能会影响标签的生成,甚至会导致生成错误情感的标签。例如后备箱可以放一个小书包,这种语法可能提取出后备箱小这个标签,而用户想表达的是后备箱大。因此,本发明会提取句子中的过滤词来进行后续的识别处理。在一种实现方式中,如果一个句子(如一个短句)含有过滤词,则对该句子进行删除处理,这样该句子就不会再参与到后续的标签生成各过程。在另一种实现方式中,可以先识别出过滤词后,再在后续步骤中对其进行处理。此外,在进行分词时,还可以提取每个短句中的程度词和特殊提示词向,对应代表情感程度和辅助语气。程度词例如包括很、非常、极其、格外、十二分等,辅助语气一般包括听说、据说、传说、意味着等词语。上文中的分词方法采用分词模型进行,分词模型中存储有每种词的标准词词典,标准词词典包括维度词词典、情感词词典、过滤词词典和宏文件中的至少一种。宏文件代表维度词与对应的可修饰情感词的关联关系,例如空间维度可修饰的情感词包括宽敞、大、狭窄、够用、小等。每种标准词都可以表示为标准词和其多个同义词的词簇,标准词可以有第一和第二标准词,示例格式如图5所示,其中“####”左右两端的词分别代表第一标准词和第二标准词,“@@@@”之后的词代表该标准词的同义词。这些词都会存储于分词模型中,以便根据这些词来提取句子中的关键词。根据一个实施例,分词模型包括ltp语言技术平台、crf 条件随机场模型和ac自动机模型中的至少一种。以ac自动机为例,提前准备好一个词语列表,这个列表中包含所有的维度词、情感词、程度词、特殊提示词、过滤词等,以列表的形式输入到ac自动机中。为了提高分词结果的准确性,每一个短句都用多种分词模型进行分词处理,并对多个分词结果进行比较。当多种分词模型对某一句话的分词结果不一致时,以分词长度最长的分词结果为准。例如,某一短句的分词结果中,某两个模型的分词结果为“前排”和“头部”,第三个模型的分词结果为“前排头部”,则该短句以第三种模型的分词结果为准。此外,短句中可能还存在多义词,例如一般、可以等词,既能作为形容词(动力很一般、动力还可以),也能作为程度词(后排可以做四个人、后排一般能坐四个人)。空间感可以作为名词(前排空间感很足),也可以作为形容词(前排很有空间感)。因此,本发明还可以训练多义词分类器,并根据该分类器确定多义词属于情感词还是程度词,或者确定多义词属于名词还是情感词。对于某个词,可以采集多个含有该词的语料,并对其此属性进行二分类标注,之后对标注会的语料划分为训练集和测试集,基于训练集进行建模训练,基于测试集进行测试,并选择正确率最高的一个模型作为最终模型。以“一般”为例,二分类标注为情感词和程度词,从语料库抽取100条含有“一般”语料进行标注,随机抽取80条作为训练集,剩余的20条测试集。利用word2vec对80条训练集训练词向量作为输入特征,使用svm模型对输入特征和对应的标注进行建模训练,剩余的20条测试集进行测试。多次进行同样的方法,选择正确率最高的一个模型作为最终模型,通过多次测试后其正确率均在95%以上。基于分词结果,可识别出同时含有维度词和情感词的短句为目标短句,用于生成标签;而只有维度词或只有情感词、或维度词或情感词都没有的短句则会被剔除。需要说明的是,计算设备中还可以维护一个特殊词库,针对一些维度词的特殊表示,例如用户评论的“推背感强”实际指代的是动力强,因此当识别出这些特殊表示时,可以将这些词替换为对应的维度词,此时本来没有维度词的短句就有了维度词。第三步,当目标评论没有标点符号、或者切分后的短句过长、或者切分后的短句有两个以上情感词时,再用分句模型进行分句处理。对于两个以上情感词,以“后备箱又大又深”这一短句为例,在一种实现方式中,这句短句将被切分为“后备箱又大,又深”,切分后的第一句话同时含有维度词和情感词,可作为单维度子句;而第二句话只含有情感词,将被剔除。这种方式保证了最后所提炼出的所有子句的准确性。而当评论语料量非常大的情况下,这种删除部分评价词的做法对实际结果的影响可以忽略不计。当然,在另一种实现方式中,也可以基于第一句话的维度词为后一句中的情感词加上主语,即加上“后备箱”这一主语,这样具有两个以上情感词的句子就被切分为两个单维度子句。这种方式增加了评价素材的预料量,但在添加情感词的主语时可能会出现误添加,导致生成其他维度的评价。另外,在有些评论中会出现“前排很有空间感”、“车子很有动力感”这些词,“空间感”和“动力感”能同时代表维度词和情感词,此时可认为这些句子同时具有维度词和情感词,可以作为一个单维度子句。分句模型适于输出句子中切分符号加入位置的前字符和后字符,也就是下表中的pre标记和next标记,以在该前字符和后字符之间加入切分符号(如逗号),从而将句子切分为多个单维度子句。应当理解的是,句末最后一个字只有前字符标记而不会有后字符标记,此时在该符号后加逗号或句号都可进行句子切分。可选地,步骤s210中还可以包括分句模型的训练步骤:获取多个已经切分为单维度子句的文本内容,将其作为训练集对构建好的分句模型进行训练,得到训练好的分句模型。该训练集中标注有文本内容在切分成单维度子句时切分符号加入的前字符位置和后字符位置。张先生您好那你看一下到时候你可以直接过来ooprenextooprenextoooopre分句模型来源于序列标注问题,本发明使用crf条件随机场模型,标注关键词pre、next,表示要添加符号的前和后,采集语料库中的语料进行人工标注后,按照8:2的比例生成训练集和测试集,以分别进行模型训练和测试。这种方法对语料切分的正确率能够达到93%以上,而且切分效果很好,提高后续情感分析的准确,确保一个维度只被一个情感词修饰。例如对于不含标点符号的句子:内饰略显粗糙不过扶手箱够大超深能放进瓶装大可乐前排座椅没有扶手要是有扶手就好了。对其进行分句处理加逗号后变成:内饰略显粗糙,不过扶手箱够大,超深能放进瓶装大可乐,前排座椅没有扶手,要是有扶手就好了。经过步骤s210,就提取出了目标评论中的多个单维度子句。随后,在步骤s220中,基于预先存储的标准词词典,将各单维度子句的维度词和情感词分别替换为对应的维度标准词和情感标准词。也就是,基于维度标准词词典,将维度词替换为维度标准词,将情感标准词替换为情感标准词。如前文所述,维度标准词有第一维度标准词和第二维度标准词,情感标准词有第一情感标准词和第二情感标准词,这里进行替换时均将其替换为对应的第一标准词,也就是替换为第一维度标准词和第一情感标准词。例如,如图5所示,将维度词中的“主驾驶”替换为“前排”,将情感词中的“合我心意”替换为“满意”。另外,在步骤s220中,还可以将识别出的过滤词转换为过滤标准词。如将“水杯”、“谍照”、“杯子”、“玩具”等这些词都可转换为“东西”这个标准词。而且,步骤s220还可以将从每个目标单维度子句提取出的维度标准词、情感标准词和过滤标准词进行保存,如保存为词元组,或保存为列表中的一组词,方便后续的规则匹配。随后,在步骤s230中,对于每个单维度子句,如果基于其替换后的标准词能够在规则集中匹配到对应的标签生成规则,则将该单维度子句判定为目标单维度子句。这里,计算设备中预先存储有规则集,该规则集中的每个元素为评价维度与对应的标签生成规则的关联关系。评价维度可用维度标识表示,该维度标识可采用从大类到小类的逐层细分表示方法,如“空间-乘坐空间-前排空间-前排头部空间”。标签生成规则代表每种维度的规则匹配方法和标签生成方法,已知一个标签生成规则可以判断一个句子是否匹配该规则,以及基于该规则来生成对应的标签。评价维度标识和对应的标签生成规则之间可用特殊符号区分开,如“####”区分开。标签生成规则包括多个占位符,每个占位符代表一种标准词x,且多个占位符之间通过逻辑运算符号连接。其中,标准词x包括维度标准词、与该维度相关的情感标准词、以及过滤标准词中的至少一种。逻辑运算符包括“%%”、“()”、“and”、“or”、和“not”中的至少一种。“%%”中填入标准词x,“()”代表优先运算,“and”代表同时出现,“or”代表两者取其一,“not”代表不能出现其之后连接的过滤词。根据一个实施例,标签生成规则可以表示为:((%维度标准词%and%能形容维度的情感标准词%)not%与维度无关词%)。其中,%x%之间的x代表一个关键词x的标准词,如“%前排头部空间%”代表与“前排头部空间”相关的一个或多个标准词。进一步而言,这些标准词都是对应词簇中的第一标准词。基于此,目标单维度子句的判定的步骤包括:对于每个单维度子句,若其替换后的维度标准词和情感标准词同时存在于规则集中的某标签生成规则中,且该子句中不含有该标签生成规则中的过滤标准词,则判定该单维度子句为目标单维度子句。简言之,若一个句子含有一个标签生成规则中“not”之前的词,且不含有“not”之后的词,则代表该句子匹配该标签生成规则。对于维度词而言,在一种实现方式中,维度可以是一个大类表述,则此时的维度标准词只含有该大类词的标准词。例如“空间”这个维度,其维度标准词只包含为空间这个标准词。而在另一种实现方式中,维度也可以是细粒度的小类表示,该维度词若可拆分为多个子维度词,则该维度词标准词包括其多个子维度词的标准词。若单维度子句中替换后的维度词同时包含该多个子维度词的标准词,则代表该单维度子句的维度词匹配该维度词规则。例如,“前排头部空间”这个维度,其作为细粒度小类可拆分为“前排”、“头部”、“空间”这三个维度词,则“前排头部空间”的标准词需同时包含“前排”、“头部”、“空间”这三者的标准词。已知一个单维度子句中的词都已转换为了标准词,则该转换后的标准词中同时有“前排”、“头部”、“空间”这三个词,则代表该句子中的维度词匹配“%前排头部空间%”这个维度词规则。接下来进行情感词规则的匹配,“%能形容维度的情感标准词%”代表能形容维度的情感标准词。能形容维度的情感词包括通用情感词、正面情感词和负面情感词。其中,通用情感词即能用于任何事物评价的词,如“好”、“满意”、“正常”等标准词。正面情感词代表评价对象好,例如空间的正面情感词包括宽敞、大、够用等。负面情感词代表评价对象差,例如空间的负面情感词包括狭窄、拥挤、小等。这种对情感词的评价,能排除一些用户评论中维度词和情感词互不相干的情况,例如“空间强劲”等表述。如前文所述,这些情感词都是第一标准词,而单维度子句中的情感词转换为了对应的第一情感标准词。因此,在单维度子句替换后的维度词匹配了某个标签生成规则中的维度词规则后,只要替换后的情感标准词存在于该标签生成规则中的情感词规则中,则代表该单维度子句进一步匹配该情感词规则。而对于过滤词的匹配,过滤标准词一般位于“not”逻辑运算符之后,代表维度无关词,例如空间的维度无关词包括东西、减速带、路边、塑料等。如果某标签生成规则中有过滤标准词,且一个单维度子句替换后的过滤词标准词包括“东西”,则代表该子句匹配上了该过滤词规则。作为优选地,在进行标签生成规则的匹配时,首先进行过滤词的匹配,当某单维度子句命中某标签生成规则的过滤词规则,则可直接排除该标签生成规则,之后再进行维度词和情感词的匹配。在具体的实现方式中,本发明采用倒排索引判定多个候选规则,找到单维度子句的所有维度词和情感词所在的类别,之后利用堆栈快速匹配规则判定最终唯一的标签生成规则。例如:某个单维度子句的维度标准词提取到“空间”,则抽取出所有和“空间”相关的类别,之后再用“前排”和“头部”锁定“空间-乘坐空间-前排空间-前排头部空间”这个类别。如前文所述,一个单维度子句所替换的维度标准词、情感标准词、过滤标准词保存在列表里。那么在进行堆栈匹配时,可先提取所有候选规则压堆栈,然后从栈顶指针开始从堆栈里面逐个取候选规则里面的维度词、情感词和过滤词,与列表中的词一一对比,若某标签生成规则中的词和列表中的词相匹配,则判定该单维度子句为目标单维度子句,且命中该标签生成规则。进一步地,标签生成规则中还可以包括候选评价词,用“or”逻辑运算符连接,代表一种并选方案,等价于单个维度词和单个情感词的组合。例如,“前排头部有空间感”与“前排头部空间宽敞”是两种并选评价方案。如图6中所示,其标签生成规则为:空间-乘坐空间-前排空间-前排头部空间####(((%前排头部空间%and%能形容空间的词%)or%前排头部空间感%)not%与空间无关词%),其中“前排头部空间感”可拆分为“前排”、“头部”、“空间感”这三个标准词,当一个单维度子句命中该候选评价词,则可认为其维度词和情感词命中该标签生成规则。随后,在步骤s240中,基于每个目标单维度子句所匹配上的标签生成规则生成该目标单维度子句的子句标签,从而得到目标评论的评论标签。多个目标单维度子句的子句标签共同构成目标评论的评论标签。对于任一目标单维度子句,在生成子句标签时,可以确定该标签生成规则中所匹配上的维度标准词和情感标准词,并将所选取的维度标准词和情感标准词拼接为子句标签。例如,标签生成规则中匹配的维度标准词和情感标准词分别为“前排头部空间”和“大”,则可生成子句标签“前排头部空间大”。进一步地,在确定所匹配的情感标准词后,还可以从该标签生成规则中任选一个与该情感标准词具有相同情感极性的情感标准词,并与所确定的维度标准词拼接为子句标签。例如,“宽敞”、“够用”和“大”都是评价空间的正向评价词,当确定所匹配的情感词为“宽敞”时,则可以从这多个正向词中任选一个作情感标签,以提高生成标签的多样性。根据一个实施例,在步骤s240中,还可以采用情感分析模型对每个目标单维度子句进行情感分析,得到该目标单维度子句的情感极性。其中,情感极性包括正向情感、负向情感和中性情感中的至少一种。情感分析模型为bert模型和逻辑回归模型联用,其中bert模型用于生成词向量,有效的获取上下文信息,逻辑回归模型用于输出情感的二分类极性或三分类极性。二分类极性包括正向情感和负向情感,三分类极性包括正向情感、负向情感和中性情感。在情感分析模型的训练过程中,使用预训练模型在下游进行微调,使用中文维基百科作为训练语料进行预训练。首先获取多条具有情感分类标注的文本,在下游微调时,输入两列内容:第一列为情感类别,第二列为情感句子,最终根据调参生成分类模型。使用开源的bert-as-service开源工具将分类模型部署到远端服务中,根据服务调用方式获取文本的句向量,并单独训练一个二分类或三分类的lr模型来获取最后分类结果。经过真实测试,二分类正确率能达到94.6%,三分类正确率达到94%。可见,这种模型训练的方式比起整体训练的泛化能力要强很多。基于此,在生成子句标签时,可以先获取目标单维度子句的情感极性,并从该目标单维度子句所匹配的标签生成规则中任选一个与该情感极性相同的情感标准词。这样就可与标签生成规则中所匹配上的维度标准词一起拼接为子句标签。例如,图7中空间的正向情感词中有“够用”、“宽敞”、“大”等多个候选词,当目标单维度子句为正向情感极性时,则可从这多个候选词中任选取一个生成情感标签。通过这种方式,本发明首先利用复杂规则集提取句中的维度词和情感词,以命中所在维度类别,然后利用情感模型判断句子情感极性。这样不但能有效解决维度区分度不大和类别少的问题,而且在情感模型判断时只对一种类别进行情感分析,一个目标单维度子句对应一个情感极性,对应一个子句标签,大大降低了因为区分不开导致的错误,提高了正确率。进一步地,考虑到标签生成规则中用的是第一标准词。因此,为了进一步提升标签多样性,上文中在标签生成规则中选取好对应的第一维度标准词和第一情感标准词后,可以继续查找第一维度标准词对应的第二维度标准词,以及第一情感标准词对应的第二情感标准词。这样,就可从维度词的第一和第二标准词中任选一个维度标准词,从情感词的第一和第二标准词中任选一个情感标准词,并将所选出的维度标准词和情感标准词拼接为子句标签。例如,驾驶位的第二标准词是驾驶座,满意的第二标准词是称心、中意,这样可生成的标签有驾驶位满意、驾驶位称心、驾驶位中意、驾驶座满意、驾驶座称心、驾驶座中意,共有2*3=6种可选方案,满足了标签多样化。进一步地,在步骤s240中,还可以对每种对象体系设置对应的标签词方案,该方案中包括所应选取的维度标准词和情感标准词。例如a品牌的标签用“驾驶座满意”,b品牌的标签用“驾驶位中意”,提高品牌评价的多元化。可选地,在步骤s240中,还可以从该从该维度的宏文件中任选一个与该目标单维度子句的情感极性相同的情感词,与维度标准词拼接为子句标签。而且,子句标签中还包括目标单维度子句中的隐藏属性词和程度词。此时标签生成规则的表述形式可为:维度词(可隐/必有) 属性(必有/可隐) 程度(可选) 情感词(必有),或者维度词(必有) 属性(可隐) 程度(可选) 情感词(必有) 情感极性。其中,“必有”代表必须有,“可隐”代表可以隐藏含有,“可选”代表可有可无。若有以下评论文字:最满意的一点说到空间,在这里面就再详细的说说吧,其实polo车的前排头部很宽敞,车开起来推背感很强。其中,“前排头部宽敞”命中规则:空间-乘坐空间-前排空间-前排头部空间整体评价,命中的维度词有“前排头部”(必有),属性词有“空间”(隐藏),程度词有“很”(可选),情感词有“宽敞”(必有),情感极性为正面。匹配的标签生成规则为:空间-乘坐空间-前排空间-前排空间整体评价@@@@正面###(前排and头部and空间)and%空间正面词%),%空间正面词%####宽敞、大等情感词。对应生成的标签有:前排头部(空间)宽敞,其中“空间”为隐藏属性词。本发明对该评论标签生成方法进行了测试,测试过程是在口碑评论中随机选取40个热门车系,查看这些车系的标签和短句进行评测,每个标签下短句查看15条左右评论,人工核验标签和提取内容是否正确。图8示出了所生成的评论标签的示意图,其中包括每种标签和每种情感极性的详细分类。评测指标有标签准确率和提取内容正确率,实践证明,标签准确率达到94%,提取内容正确率达到96.5%。图9示出了根据本发明一个实施例的评论标签生成装置900的结构框图,,该装置可以驻留在计算设备中,如驻留在计算设备100中。如图9所示,装置900包括子句切分模块910、归一化模块920、规则匹配模块930和标签生成模块940。子句切分模块910提取从目标评论中切分出的多个单维度子句,该单维度子句是维度词和情感词均只有一个的子句。可选地,子句切分模块910还适于训练分句模型、以及训练多义词分类器,并根据该分类器确定多义词属于情感词还是程度词,或者确定多义词属于名词还是情感词。子句切分模块910可以进行与上面在步骤s210中描述的处理相对应的处理,这里不再展开赘述。归一化模块920基于预先存储的标准词词典,将各单维度子句的维度词和情感词分别替换为对应的维度标准词和情感标准词。归一化模块920可以进行与上面在步骤s220中描述的处理相对应的处理,这里不再展开赘述。规则匹配模块930对于每个单维度子句,如果基于其替换后的标准词能够在规则集中匹配到对应的标签生成规则,则将该单维度子句判定为目标单维度子句。规则匹配模块930可以进行与上面在步骤s230中描述的处理相对应的处理,这里不再展开赘述。标签生成模块940基于每个目标单维度子句所匹配上的标签生成规则生成该目标单维度子句的子句标签,从而得到目标评论的评论标签。标签生成模块940可以进行与上面在步骤s240中描述的处理相对应的处理,这里不再展开赘述。根据本发明的一个实施例,装置900还可以包括预处理模块和情感分析模块(图中均未示出)。其中,预处理模块适于对目标评论进行数据预处理操作。情感分析模块适于采用情感分析模型对每个目标单维度子句进行情感分析,得到该目标单维度子句的情感极性。根据本发明的技术方案,提出了基于用户评论的细粒度情感分析,使用复杂规则集来提取句中的维度词和情感词,并和情感分析模型相结合,来将细粒度情感分析分为两部分,第一部分抽取维度分类,第二部分情感分析,工程上极大降低分析的复杂度。而且,规则集在提取维度词和情感词的过程中易于理解、解析性能高,而且更加接近于程序语言设计。a8、如a6所述的方法,还包括步骤:训练多义词分类器,并根据该分类器确定多义词属于情感词还是程度词,或者确定多义词属于名词还是情感词。a9、如a3所述的方法,其中,所述分句模型适于输出句子中切分符号加入位置的前字符和后字符,以在该前字符和后字符之间加入切分符号,从而将句子切分为多个单维度子句。a10、如a3所述的方法,还包括所述分句模型的训练步骤:获取多个已经切分为单维度子句的文本内容,将其作为训练集对构建好的分句模型进行训练,得到训练好的分句模型。a11、如a1-a10中任一项所述的方法,所述标签生成规则包括多个占位符,每个占位符代表一种标准词x,且多个占位符之间通过逻辑运算符号连接;其中,所述标准词x包括维度标准词、与该维度相关的情感标准词、以及过滤标准词中的至少一种,所述情感标准词包括通用情感词、正向情感词和负向情感词中的至少一种。a12、如a11所述的方法,其中,所述逻辑运算符包括“%%”、“()”、“and”、“or”、和“not”中的至少一种,其中“%%”中填入标准词x,“()”代表优先运算,“and”代表同时出现,“or”代表两者取其一,“not”代表不能出现。a13、如a11所述的方法,其中,所述目标单维度子句的判定的步骤包括:对于每个单维度子句,若其替换后的维度标准词和情感标准词同时存在于规则集中的某标签生成规则中,且该子句中不含有该标签生成规则中的过滤标准词,则判定该单维度子句为目标单维度子句。a14、如a1-a13中任一项所述的方法,其中,每种标准词词典均表示为标准词及其同义词的词簇,所述标准词包括第一标准词和第二标准词,所述标签生成规则中的标准词均为第一标准词,所述替换后的标准词均为替换后的第一标准词。a15、如a14所述的方法,其中,所述基于每个目标单维度子句所匹配上的标签生成规则生成该目标单维度子句的子句标签的步骤包括:确定该标签生成规则中所匹配上的维度标准词;确定该标签生成规则中所匹配上的情感标准词,或者从该标签生成规则中任选一个与该目标单维度子句的情感极性相同的情感标准词;将所选取的维度标准词和情感标准词拼接为子句标签。a16、如a15所述的方法,其中,所述将所选取的维度标准词和情感标准词拼接为子句标签的步骤包括:分别确定该维度标准词和情感标准词所对应的第二标准词;该维度词的第一和第二标准词中任选一个维度标准词,从情感词的第一和第二标准词中任选一个情感标准词;以及将所选取的维度标准词和情感标准词拼接为子句标签。a17、如a1-a16中任一项所述的方法,其中,在提取从目标评论中切分出的多个单维度子句之前,还包括步骤:对目标评论进行数据预处理操作,所述数据预处理操作包括删除html代码、替换不可见字符、英文字符的大小写转换、标点符号的半角/全角转换和非标字符删除中的至少一种。这里描述的各种技术可结合硬件或软件,或者它们的组合一起实现。从而,本发明的方法和设备,或者本发明的方法和设备的某些方面或部分可采取嵌入有形媒介,例如可移动硬盘、u盘、软盘、cd-rom或者其它任意机器可读的存储介质中的程序代码(即指令)的形式,其中当程序被载入诸如计算机之类的机器,并被所述机器执行时,所述机器变成实践本发明的设备。在程序代码在可编程计算机上执行的情况下,计算设备一般包括处理器、处理器可读的存储介质(包括易失性和非易失性存储器和/或存储元件),至少一个输入装置,和至少一个输出装置。其中,存储器被配置用于存储程序代码;处理器被配置用于根据该存储器中存储的所述程序代码中的指令,执行本发明的评论标签生成方法。以示例而非限制的方式,可读介质包括可读存储介质和通信介质。可读存储介质存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息。通信介质一般以诸如载波或其它传输机制等已调制数据信号来体现计算机可读指令、数据结构、程序模块或其它数据,并且包括任何信息传递介质。以上的任一种的组合也包括在可读介质的范围之内。在此处所提供的说明书中,算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与本发明的示例一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。此外,所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本
技术领域:
内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本
技术领域:
的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的而非限制性的,本发明的范围由所附权利要求书限定。当前第1页1 2 3 
技术特征:1.一种评论标签生成方法,在计算设备中执行,所述计算设备中存储有规则集,所述规则集中的每个元素为评价维度与对应的标签生成规则的关联关系,所述方法包括步骤:
提取从目标评论中切分出的多个单维度子句,所述单维度子句是维度词和情感词均只有一个的子句;
基于预先存储的标准词词典,将各单维度子句的维度词和情感词分别替换为对应的维度标准词和情感标准词;
对于每个单维度子句,如果基于其替换后的标准词能够在所述规则集中匹配到对应的标签生成规则,则将该单维度子句判定为目标单维度子句;
基于每个目标单维度子句所匹配上的标签生成规则生成该目标单维度子句的子句标签,从而得到所述目标评论的评论标签。
2.如权利要求1所述的方法,还包括步骤:
采用情感分析模型对每个目标单维度子句进行情感分析,得到该目标单维度子句的情感极性,所述情感极性包括正向情感、负向情感和中性情感中的至少一种。
3.如权利要求1或2所述的方法,其中,所述提取从目标评论中切分出的多个单维度子句的步骤包括:
将该目标评论切分为多个短句,并对该多个短句进行分词处理,以识别其中同时具有维度词和情感词的目标短句;以及
当所述目标短句超过预定字数或者存在两个以上情感词时,基于预先训练好的分句模型将该目标短句切分为多个单维度子句。
4.如权利要求3所述的方法,其中,所述将该目标评论切分为多个短句的步骤包括:
根据目标评论的标点符号将该目标评论切分为多个短句;
其中,若所述目标评论没有标点符号,则基于所述分句模型将该目标评论切分为多个单维度子句。
5.如权利要求3所述的方法,其中,所述将该目标评论切分为多个短句的步骤包括:
剔除具有特殊句式的目标评论,再将剩下的目标评论切分为多个短句,所述特殊句式包括反问句。
6.如权利要求3-5中任一项所述的方法,其中,所述对多个短句进行分词处理的步骤包括:
采用分词模型对每个短句进行分词处理,提取其中的维度词、情感词和过滤词中的至少一种,该些词分别代表评价维度、情感倾向和干扰信息。
7.如权利要求6所述的方法,其中,
所述标准词词典包括维度词词典、情感词词典、过滤词词典和宏文件中的至少一种;
所述宏文件代表维度词与对应的可修饰情感词的关联关系,所述分词模型中存储有所有标准词词典中的词。
8.一种评论标签生成装置,适于驻留在计算设备中,所述计算设备中存储有规则集,所述规则集中的每个元素为评价维度与对应的标签生成规则的关联关系,所述装置包括:
子句切分模块,适于提取从目标评论中切分出的多个单维度子句,所述单维度子句是维度词和情感词均只有一个的子句;
归一化模块,适于基于预先存储的标准词词典,将各单维度子句的维度词和情感词分别替换为对应的维度标准词和情感标准词;
规则匹配模块,适于对于每个单维度子句,如果基于其替换后的标准词能够在所述规则集中匹配到对应的标签生成规则,则将该单维度子句判定为目标单维度子句;
标签生成模块,适于基于每个目标单维度子句所匹配上的标签生成规则生成该目标单维度子句的子句标签,从而得到所述目标评论的评论标签。
9.一种计算设备,包括:
存储器;
一个或多个处理器;
一个或多个程序,其中所述一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行根据权利要求1-7所述方法中的任一方法的指令。
10.一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当计算设备执行时,使得所述计算设备执行根据权利要求1-7所述的方法中的任一方法。
技术总结本发明公开了一种评论标签生成方法,在计算设备中执行,该计算设备中存储有规则集,该规则集中的每个元素为评价维度与对应的标签生成规则的关联关系,该方法包括步骤:提取从目标评论中切分出的多个单维度子句,该单维度子句是维度词和情感词均只有一个的子句;基于标准词词典将各单维度子句的维度词和情感词分别替换为对应的标准词;对于每个单维度子句,如果基于其替换后的标准词能够在所述规则集中匹配到对应的标签生成规则,则将该单维度子句判定为目标单维度子句;基于每个目标单维度子句所匹配上的标签生成规则生成该目标单维度子句的子句标签,构成目标评论的评论标签。本发明还一并公开了对应的评论标签生成装置和计算设备。
技术研发人员:寇凯;息振兴;史立华;王田利;付一韬;杨林凤;谢健聪
受保护的技术使用者:车智互联(北京)科技有限公司
技术研发日:2020.01.19
技术公布日:2020.06.05