目标内容的确定方法、装置、设备及计算机可读存储介质与流程

专利2022-06-30  59


本公开涉及数据处理技术,尤其涉及文字内容分析技术。



背景技术:

信息检索(informationretrieval)是用户进行信息查询和获取的主要方式,是查找信息的方法和手段。同时,信息检索也是搜索引擎的核心任务,搜索引擎需要根据用户输入的内容提供信息。

随着现代社会生活节奏的加快,人们面对信息的内容越来越多,阅读信息的时间越来越短。通常一篇文章中会有大量的内容;比如用户想知道某部电影的主演是谁;文章可能花大量篇幅介绍电影本身,然后介绍演出阵容,在演出阵容的段落中也可能存在大量演员本身的介绍,真正回答问题的是少数几句话;有些问题一句话能回答,而有些答案需要结合多句话的内容。

因此,如何在一篇文章中确定出有用信息,从而向用户反馈有用信息是本领域技术人员亟需解决的技术问题。



技术实现要素:

本公开提供一种目标内容的确定方法、装置、设备及计算机可读存储介质,从而根据从一篇文章中确定出有用的信息。

本公开的第一个方面是提供一种目标内容的确定方法,包括:

将根据检索信息确定的文章段落拆分为多个句子,并根据所述句子的属性确定句子间的关系;

根据所述句子间的关系确定每个所述句子对应的句子表示;

根据所述句子的句子表示、所述检索信息确定目标句子,并根据所述目标句子确定目标内容。

可选的,所述根据所述句子的属性确定句子间的关系,包括:

获取句子中包括的实体;

根据所述句子之间对应的实体重叠度,确定所述句子间的第一关系。

本实施例提供的方法,可以从句子包括的实体的维度,确定句子间关系。

可选的,所述根据所述句子的属性确定句子间的关系,包括:

确定所述句子在所述文章段落中的位置标号,并根据所述位置标号确定所述句子间的第二关系。

本实施例提供的方法,可以从句子在段落中的位置的维度,确定句子间的关系。

可选的,所述根据所述句子的属性确定句子间的关系,包括:

确定每个所述句子对应的句子向量,并根据所述句子向量确定句子间的第三关系。

本实施例提供的方法,可以从句子语义的维度,确定句子间的关系。

可选的,所述根据所述句子的属性确定句子间的关系,包括:

根据预设规则确定所述句子间的影响权重,并根据与所述句子对应的所述影响权重确定其他句子对所述句子的注意力。

本实施例提供的方法,可以从句子间的影响的维度,确定句子间的关系。

可选的,所述根据所述句子间的关系确定每个所述句子对应的句子表示,包括:

根据所述句子间的关系确定与所述关系对应的关系图;

通过预设神经网络确定所述关系图中每个所述句子的句子表示。

本实施例提供的方法,可以确定出包括句子间关系的句子表示。

可选的,若所述关系图的数量大于1;

所述通过预设神经网络确定所述关系图中每个所述句子的句子表示之后,还包括:

将所述句子对应的句子表示进行拼接,得到所述句子对应的完整表示。

本实施例提供的方法,可以得到包括从多个维度确定的句子关系的句子表示,使得句子表示中包含更丰富的句子间关系。

可选的,所述根据所述句子的句子表示、所述检索信息确定目标句子,包括:

根据所述句子表示、所述检索信息确定匹配度;

将匹配程度靠前的预设数量个句子确定为目标句子。

本实施例提供的方法,可以结合句子间的关系,在段落中确定与检索信息匹配的目标句子。

本公开的第二个方面是提供一种目标内容的确定装置,包括:

拆分模块,用于将根据检索信息确定的文章段落拆分为多个句子,并根据所述句子的属性确定句子间的关系;

表示确定模块,用于根据所述句子间的关系确定每个所述句子对应的句子表示;

目标确定模块,用于根据所述句子的句子表示、所述检索信息确定目标句子,并根据所述目标句子确定目标内容。

本公开的第三个方面是提供一种电子设备,包括:

至少一个处理器;以及

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的任一种目标内容的确定方法。

本公开的第四个方面是提供一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如上所述的任一种目标内容的确定方法。

本公开提供的目标内容的确定方法、装置、设备及计算机可读存储介质,包括:将根据检索信息确定的文章段落拆分为多个句子,并根据句子的属性确定句子间的关系;根据句子间的关系确定每个句子对应的句子表示;根据句子的句子表示、检索信息确定目标句子,并根据目标句子确定目标内容。本公开提供的方法、装置、设备及计算机可读存储介质中,可以确定句子的关系,并根据句子间的关系重新确定句子的句子表示,再根据句子表示在句子中确定目标句子,使得本公开提供的方法、装置、设备及计算机可读存储介质能够结合句子间关系对每句话进行分析,从而确定与检索信息更加匹配的目标内容。

附图说明

附图用于更好地理解本方案,不构成对本申请的限定。其中:

图1a为本申请一示例性实施例示出的系统结构图;

图1b为本申请一示例性实施例示出的界面图;

图2为本申请一示例性实施例示出的目标内容的确定方法的流程图;

图3为本申请另一示例性实施例示出的目标内容的确定方法的流程图;

图4为本申请一示例性实施例示出的目标内容的确定装置的结构图;

图5为本申请另一示例性实施例示出的目标内容的确定装置的结构图;

图6是用来实现本申请一示例性实施例示出的电子设备的框图。

具体实施方式

以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。

目前,用户可以在搜索引擎中输入检索信息,搜索引擎可以反馈与检索信息对应的检索内容。而一般在网络中检索到的内容较多,需要用户阅读大量的内容,才能够得到需要的内容。

例如用户输入的检索信息是“nba2018-2019赛季的mvp是谁”,则需要结合一个段落中下述三句话共同回答:

nba2018-2019赛季个人奖结果揭晓;

哈登本赛季表现突出,率领球队夺得联盟第一;

基于优异的表现,他获得了本赛季mvp。

上述三句话中的任何一句都不能独立回答该问题,因此,需要对段落内容中的语句进行分析,才能够得到有用信息。

本申请实施例提供的方案,根据段落中各个句子之间的关系对句子内容进行分析,即结合句子本身以及其他句子的内容,共同确定与检索信息匹配的内容。

图1a为本申请一示例性实施例示出的系统结构图。

如图1a所示,在该系统中可以包括用户端11,用户端11可以是计算机,还可以是智能手机等电子设备。该系统中还可以包括服务器12。服务器12与用户端11之间可以通过网络连接。

其中,用户可以在用户端11中输入检索信息,用户端11通过网络将检索信息发送到服务器12中,服务器12可以根据检索信息确定检索结果,并向用户端11反馈检索结果。

具体的,服务器12还可以根据检索结果确定与检索信息匹配的目标内容,并向用户端11反馈目标内容,从而无需用户阅读大量的内容,就能够得到有用信息。

图1b为本申请一示例性实施例示出的界面图。

如图1b所示,在用户端11的界面中可以显示一输入框,用户可以在输入框中输入检索信息,再点击搜索按键,能够触发用户端11向服务器12发送检索信息。

例如可以开启用户端11中设置的搜索引擎,使得用户端11显示如图1b所示出的输入框。

图2为本申请一示例性实施例示出的目标内容的确定方法的流程图。

如图2所示,本实施例提供的目标内容的确定方法包括:

步骤201,将根据检索信息确定的文章段落拆分为多个句子,并根据句子的属性确定句子间的关系。

其中,本实施例提供的方法可以由具备计算能力的电子设备执行,该设备例如可以是如图1a所示出的服务器。

具体的,电子设备可以根据检索信息确定对应的检索结果,例如一篇新闻报道,也可以是一篇文章等。电子设备可以基于本实施例提供的方法对检索结果进行分析,得到与检索信息对应的目标内容,也就是有用信息。

进一步的,可以将本实施例提供的方法封装在软件中,再将该软件安装在电子设备中,使得电子设备能够执行本实施例提供的方法。

实际应用时,针对检索结果中的段落,可以对段落进行拆分,得到多个句子。例如检索结果中的文章包括1个段落,则可以对该1个段落进行处理,若检索结果的文章包括的段落数量大于1个,则可以对每个段落都进行处理。

其中,可以根据段落中的标点符号对文章段落进行拆分,可以认为段落起始位置到第一个标点符号之间为你一句话,段落中每两个标点符号之间为一句话。

具体的,还可以根据句子属性确定句子之间的关系。本实施例提供的方法中,结合句子间的关系对文章段落进行分析,从而结合句子间关系更准确的识别每个句子中包含的信息。

进一步的,句子属性可以是句子中包括的内容、句子在段落中的位置等信息。可以根据这些信息确定句子间的关系。

实际应用时,例如可以根据句子中包括的实体词汇,确定句子间的关系。若两个句子包括的实体词汇重合度较高,则可以认为这两个句子的关联性较强,可以将关联性作为句子间的一个关系。再例如,若两个句子的位置较近,例如是连续的两句话,则可以认为这两个句子的相关性较强。对于文章段落来说,相近的句子相关性会更强,因此,可以根据句子位置确定句子之间的关系。

步骤202,根据句子间的关系确定每个句子对应的句子表示。

其中,本实施例提供的方法还可以重新确定每个句子的表示。在原始的文章中,一个句子的表示可以认为是句子内容。例如一个句子的内容是“基于优异的表现,他获得了本赛季mvp”,则该句话的内容是这个句子的句子表示,若仅根据这一句话无法得到针对检索信息的反馈内容。因此,本实施例提供的方法,结合句子之间的关系,重新确定句子表示,使得新的句子表示中包含句子间的关系。

具体的,可以根据句子间的关系构建关系图,针对每种句子关系都可以确定相应的关系图。例如,共确定了4种句子关系,则可以构建4个关系图,关系图中包括各个句子之间的关系。

在关系图中可以包括多个节点,每个节点可以代表一个句子。句子间的关系例如可以用边来表示,边还可以具有关系值,用于表示该边连接的两个节点间的关系。

进一步的,可以采用gcn(graphconvolutionalnetworks,图卷积神经网络)对关系图进行处理。例如可以将关系图输入gcn,由gcn输出图中每个节点的表示,即句子表示。

实际应用时,若根据句子间的关系确定了多个关系图,则可以根据每个关系图都输出各个句子的句子表示。这种情况下,还可以对同一个句子的句子表示进行拼接,从而得到该句子的完整表示。

其中,得到的句子表示中包括句子间的关系,从而可以根据带有句子间关系的句子表示在句子中确定目标内容。

步骤203,根据句子的句子表示、检索信息确定目标句子,并根据目标句子确定目标内容。

具体的,可以确定每个句子的句子表示与检索信息的匹配程度。若匹配程度较高,则可以认为对应的句子是目标句子。

进一步的,可以将句子表示转换为向量形式,将检索信息也表示为向量形式,从而可以计算两个向量的距离,并根据该距离确定二者匹配程度。

实际应用时,可以将匹配程度靠前的前n个句子确定为目标句子。还可以确定匹配程度阈值,将匹配程度大于该阈值的句子确定为目标句子。

其中,可以将目标句子包括的内容作为目标内容,还可以将目标内容反馈给用户端,使得用户在不阅读大量内容的情况下,就能够获得与检索信息对应的有用信息。

本实施例提供的方法用于确定目标内容,该方法由设置有本实施例提供的方法的设备执行,该设备通常以硬件和/或软件的方式来实现。

本实施例提供的目标内容的确定方法,包括:将根据检索信息确定的文章段落拆分为多个句子,并根据句子的属性确定句子间的关系;根据句子间的关系确定每个句子对应的句子表示;根据句子的句子表示、检索信息确定目标句子,并根据目标句子确定目标内容。本实施例提供的方法中,可以确定句子的关系,并根据句子间的关系重新确定句子的句子表示,再根据句子表示在句子中确定目标句子,使得本实施例提供的方法能够结合句子间关系对每句话进行分析,从而确定与检索信息更加匹配的目标内容。

图3为本申请另一示例性实施例示出的目标内容的确定方法的流程图。

如图3所示,本实施例提供的目标内容的确定方法包括:

步骤301,将根据检索信息确定的文章段落拆分为多个句子。

步骤301与步骤201中拆分段落的的具体原理和实现方式类似,此处不再赘述。

步骤302,获取句子中包括的实体;根据句子之间对应的实体重叠度,确定句子间的第一关系。

在一种情况下,句子的属性可以是句子包括的实体。可以对每个句子进行处理,获取各个句子中包括的实体。

其中,可以设置实体词汇库。可以对句子进行拆分,从而得到多个句子中包括的词汇。再根据实体词汇库中包括实体词汇对句子词汇进行识别,确定句子词汇中的实体。例如,可以在实体词汇库中查询句子词汇,若查询到对应的词,则说明该句子词汇是实体。

具体的,还可以设置识别算法,用于在句子中识别出包括的实体。

进一步的,可以根据句子之间对应的实体重叠度,确定句子间的第一关系。具体可以确定每两个句子之间的第一关系。

实际应用时,若两个句子中包括的实体重叠度较高,则可以认为两个句子的关联性较大。因此,可以将句子重叠度作为第一关系的指标。

其中,可以确定句子间重叠的实体数量d1,d1即是两个句子中重复的实体的数量。再用d1与句子中包括的实体数量d2的比值作为句子重叠度。例如,确定句子s1、s2之间的重叠度时,可以得到两个重叠度,第一个重叠度为重叠实体数量d1与句子s1包括的实体数量d2的比值,第二个重叠度为重叠实体数量d1与句子s2包括的实体数量d2的比值,可以将其中更大的重叠度作为两个句子间的重叠度。

步骤303,确定句子在文章段落中的位置标号,并根据位置标号确定句子间的第二关系。

在一种情况下,句子的属性可以是位置标号。可以根据句子在文章段落中的位置,确定句子的位置标号。例如,第一个句子的标号可以是1,第二个句子的标号可以是2等。

具体的,在段落中的句子具有承上启下的作用,因此,位置越近的句子之间的关联性就越强,例如,一般连续的两句话可能具有较强的关联性。本实施例提供的方法,可以通过位置标号表示句子的位置属性,进而可以根据各个句子的位置标号确定第二关系。

进一步的,可以确定每两个句子之间的第二关系。

实际应用时,可以用相应句子标号差值的绝对值的倒数来表示第二关系,例如第一个句子s1与第二个句子s2的第二关系为1/|1-2|=1,第二个句子s2与第四个句子s4的关系值为:1/|2-4|=0.5。

步骤304,确定每个句子对应的句子向量,并根据句子向量确定句子间的第三关系。

在一种情况下,句子属性可以是句子向量。

其中,可以根据句子中包括的词汇,确定句子向量。还可以预先设置模型,用于确定句子向量。

例如,可以通过doc2vec、bert确定句子向量。

具体的,句子向量能够体现句子中包括的内容,例如包括的词汇、词汇顺序等,因此,可以根据句子向量确定句子间在语义上的关联,即第三关系。

进一步的,可以确定两个句子之间的第三关系。具体可以计算两个句子对应的句子向量的余弦值,作为第三关系。例如,对于句子s1、s2,可以确定s1对应的向量h1和s1对应的向量h2,并计算这两个向量的余弦值来表示句子s1与s2在语义上的关系强弱。

步骤305,根据预设规则确定句子间的影响权重,并根据与句子对应的影响权重确定其他句子对句子的注意力。

实际应用时,句子属性还可以包括其他句子对该句子的影响。其中,可以预先设置规则,用于确定句子对句子的影响权重。例如,确定句子s1对句子s2的影响。

其中,可以确定句子与句子之间的相关性,来表示一个句子对另一个句子的影响。例如,可以确定出similarity(sm,sn),用于表示sn对sm的影响权重。

具体的,相关性可以用句子间的余弦值来表示,如similarity(sm,sn)=cos(sm,sn)。可以用相应的句子表示确定余弦值。

进一步的,可以通过这种方式确定每个句子对一个句子的影响权重,例如,分别确定出句子s2、s3、s4对s1的影响权重。还可以根据一个句子对应的影响权重确定其他句子对该句子的注意力。即根据其他句子对一个句子的影响,确定其他句子对该句子的注意力。

为了更清楚的说明,可以将被影响的句子确定为目标句子,将其他句子确定为影响句子。可以将确定目标句子的影响权重值与对应的影响句子的乘积之和,作为目标句子的注意力,即影响句子对目标句子产生影响的注意力值。

例如,共包括s1、s2、s3、s4这四个句子,则s1的注意力为:similarity(s1,s2)*s2 similarity(s1,s3)*s3 similarity(s1,s4)*s4

实际应用时,对句子进行计算时,可以根据句子表示进行计算。例如similarity(s1,s4)中,可以根据句子s1的句子表示、句子s4的句子表示进行计算。句子表示例如可以是句子向量。

其中,可以通过模型来确定句子的注意力。可以对该模型进行训练,每次迭代过程中,随着模型的更新,确定的注意力结果也会改变,使得最终输出的结果发生改变。

步骤302-305为四种确定句子间关系的方式,可以同时设置这四种方式,也可以设置其中的任意一种或几种,本实施例不对此进行限制。同时,也不对步骤302-305的执行时序做限制。

步骤306,根据句子间的关系确定与关系对应的关系图。

具体的,在确定出句子间的关系之后,可以根据句子间关系确定对应的关系图。

进一步的,若确定了多种句子间的关系,则可以确定出每种关系对应的关系图。在图中可以包括多个节点,每个节点代表一个句子。节点之间可以具有边,边的值即可以是节点之间的关系。例如,与第一关系对应的关系图中,各个节点的边可以是句子间的重叠度。

步骤307,通过预设神经网络确定关系图中每个句子的句子表示。

实际应用时,可以预先训练预设神经网络,用于提取关系图中各个节点的信息。例如,可以设置图卷积神经网络。

其中,图卷积神经网络(graphconvolutionalnetwork,gcn)是一种能对图数据进行深度学习的方法。将图数据输入gcn中,gcn能够根据图中各节点间的关系提取节点信息,也就是每个句子的句子表示。

具体的,通过gcn输出的句子表示中包括句子间关系的信息。

步骤308,将句子对应的句子表示进行拼接,得到句子对应的完整表示。

进一步的,若确定的关系图的数量大于1,则针对每个句子,都可以得到大于1个的句子表示。例如,可以根据第一关系、第二关系、第三关系、注意力分别确定第一关系图、第二关系图、第三关系图、注意力图,针对同一个句子,可以根据这些关系图分别确定第一表示、第二表示、第三表示、注意力表示。

实际应用时,不同的关系图是从不同的维度来描述句子间的关系,因此,可以将根据不同关系图得到的句子表示进行拼接,得到完整句子表示,从而可以得到包括更丰富句子间关系的句子表示。

其中,在对各个句子的句子表示进行拼接时,可以按照相同的顺序进行拼接。例如,针对每个句子,都按照第一表示、第二表示、第三表示、注意力表示的顺序进行拼接。

步骤309,根据句子表示、检索信息确定匹配度;将匹配程度靠前的预设数量个句子确定为目标句子。

具体的,若只确定了一个关系图,则可以直接根据该关系图对应的句子表示执行本步骤。若确定了多个关系图,则可以根据完整句子表示执行本步骤。

进一步的,可以计算一个句子的句子表示与检索信息的距离,将该距离确定为句子的匹配度。例如,可以计算一个句子表示h与检索信息q的余弦值,将该余弦值作为二者的距离。

实际应用时,在确定余弦值时,可以将句子表示转换为向量形式,还可以间检索信息转换为向量形式,从而确定两个向量的余弦值,即得到句子与检索信息之间的匹配度。

其中,可以将匹配程度较高的句子确定为目标句子。例如,可以预先设置数量值n,选取匹配程度靠前的n个句子作为目标句子。再例如,还可以设置一比例值m,可以将句子数量与比例值的乘积确定为数量值n。

具体的,若检索到的文章包括多个文章段落,则可以针对每个段落中句子的句子表示进行处理,确定匹配程度较高的目标句子。

步骤310,根据目标句子确定目标内容。

步骤310与步骤203中确定目标内容的具体原理和实现方式类似,此处不再赘述。

图4为本申请一示例性实施例示出的目标内容的确定装置的结构图。

如图4所示,本实施例提供的目标内容的确定装置包括:

拆分模块41,用于将根据检索信息确定的文章段落拆分为多个句子,并根据所述句子的属性确定句子间的关系;

表示确定模块42,用于根据所述句子间的关系确定每个所述句子对应的句子表示;

目标确定模块43,用于根据所述句子的句子表示、所述检索信息确定目标句子,并根据所述目标句子确定目标内容。

本实施例提供的目标内容的确定装置,包括拆分模块,用于将根据检索信息确定的文章段落拆分为多个句子,并根据句子的属性确定句子间的关系;表示确定模块,用于根据句子间的关系确定每个句子对应的句子表示;目标确定模块,用于根据句子的句子表示、检索信息确定目标句子,并根据目标句子确定目标内容。本实施例提供的装置中,可以确定句子的关系,并根据句子间的关系重新确定句子的句子表示,再根据句子表示在句子中确定目标句子,使得本实施例提供的装置能够结合句子间关系对每句话进行分析,从而确定与检索信息更加匹配的目标内容。

本实施例提供的目标内容的确定装置的具体原理和实现方式均与图2所示的实施例类似,此处不再赘述。

图5为本申请另一示例性实施例示出的目标内容的确定装置的结构图。

如图5所示,本实施例提供的目标内容的确定装置,在上述实施例的基础上,所述拆分模块41,包括第一关系确定单元411,用于:

获取句子中包括的实体;

根据所述句子之间对应的实体重叠度,确定所述句子间的第一关系。

所述拆分模块41,包括第二关系确定单元412,用于:

确定所述句子在所述文章段落中的位置标号,并根据所述位置标号确定所述句子间的第二关系。

所述拆分模块41,包括第三关系确定单元413,用于:

确定每个所述句子对应的句子向量,并根据所述句子向量确定句子间的第三关系。

所述拆分模块41,包括第四关系确定单元414,用于:

根据预设规则确定所述句子间的影响权重,并根据与所述句子对应的所述影响权重确定其他句子对所述句子的注意力。

所述表示确定模块42,包括:

图确定单元421,用于根据所述句子间的关系确定与所述关系对应的关系图;

表示确定单元422,用于通过预设神经网络确定所述关系图中每个所述句子的句子表示。

若所述关系图的数量大于1;

所述表示确定模块42,还包括拼接单元423,用于在表示确定单元422通过预设神经网络确定所述关系图中每个所述句子的句子表示之后:

将所述句子对应的句子表示进行拼接,得到所述句子对应的完整表示。

所述目标确定模块43具体用于:

根据所述句子表示、所述检索信息确定匹配度;

将匹配程度靠前的预设数量个句子确定为目标句子。

根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。

如图6所示,是根据本申请实施例的目标内容的确定方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图6所示,该电子设备包括:一个或多个处理器601、存储器602,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示gui的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图6中以一个处理器601为例。

存储器602即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的目标内容的确定方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的目标内容的确定方法。

存储器602作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的目标内容的确定方法对应的程序指令/模块(例如,附图4所示的拆分模块41、表示确定模块42和目标确定模块43)。处理器601通过运行存储在存储器602中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的目标内容的确定方法。

存储器602可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据目标内容的确定电子设备的使用所创建的数据等。此外,存储器602可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器602可选包括相对于处理器601远程设置的存储器,这些远程存储器可以通过网络连接目标内容的确定的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

目标内容的确定方法的电子设备还可以包括:输入装置603和输出装置604。处理器601、存储器602、输入装置603和输出装置604可以通过总线或者其他方式连接,图6中以通过总线连接为例。

输入装置603可接收输入的数字或字符信息,以及产生与目标内容的确定的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置604可以包括显示设备、辅助照明装置(例如,led)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(lcd)、发光二极管(led)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。

此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用asic(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(pld)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。

上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。


技术特征:

1.一种目标内容的确定方法,其特征在于,包括:

将根据检索信息确定的文章段落拆分为多个句子,并根据所述句子的属性确定句子间的关系;

根据所述句子间的关系确定每个所述句子对应的句子表示;

根据所述句子的句子表示、所述检索信息确定目标句子,并根据所述目标句子确定目标内容。

2.根据权利要求1所述的方法,其特征在于,所述根据所述句子的属性确定句子间的关系,包括:

获取句子中包括的实体;

根据所述句子之间对应的实体重叠度,确定所述句子间的第一关系。

3.根据权利要求1所述的方法,其特征在于,所述根据所述句子的属性确定句子间的关系,包括:

确定所述句子在所述文章段落中的位置标号,并根据所述位置标号确定所述句子间的第二关系。

4.根据权利要求1所述的方法,其特征在于,所述根据所述句子的属性确定句子间的关系,包括:

确定每个所述句子对应的句子向量,并根据所述句子向量确定句子间的第三关系。

5.根据权利要求1所述的方法,其特征在于,所述根据所述句子的属性确定句子间的关系,包括:

根据预设规则确定所述句子间的影响权重,并根据与所述句子对应的所述影响权重确定其他句子对所述句子的注意力。

6.根据权利要求1-5任一项所述的方法,其特征在于,所述根据所述句子间的关系确定每个所述句子对应的句子表示,包括:

根据所述句子间的关系确定与所述关系对应的关系图;

通过预设神经网络确定所述关系图中每个所述句子的句子表示。

7.根据权利要求6所述的方法,其特征在于,若所述关系图的数量大于1;

所述通过预设神经网络确定所述关系图中每个所述句子的句子表示之后,还包括:

将所述句子对应的句子表示进行拼接,得到所述句子对应的完整表示。

8.根据权利要求1所述的方法,其特征在于,所述根据所述句子的句子表示、所述检索信息确定目标句子,包括:

根据所述句子表示、所述检索信息确定匹配度;

将匹配程度靠前的预设数量个句子确定为目标句子。

9.一种目标内容的确定装置,其特征在于,包括:

拆分模块,用于将根据检索信息确定的文章段落拆分为多个句子,并根据所述句子的属性确定句子间的关系;

表示确定模块,用于根据所述句子间的关系确定每个所述句子对应的句子表示;

目标确定模块,用于根据所述句子的句子表示、所述检索信息确定目标句子,并根据所述目标句子确定目标内容。

10.根据权利要求9所述的装置,其特征在于,所述拆分模块,包括第一关系确定单元,用于:

获取句子中包括的实体;

根据所述句子之间对应的实体重叠度,确定所述句子间的第一关系。

11.根据权利要求9所述的装置,其特征在于,所述拆分模块,包括第二关系确定单元,用于:

确定所述句子在所述文章段落中的位置标号,并根据所述位置标号确定所述句子间的第二关系。

12.根据权利要求9所述的装置,其特征在于,所述拆分模块,包括第三关系确定单元,用于:

确定每个所述句子对应的句子向量,并根据所述句子向量确定句子间的第三关系。

13.根据权利要求9所述的装置,其特征在于,所述拆分模块,包括第四关系确定单元,用于:

根据预设规则确定所述句子间的影响权重,并根据与所述句子对应的所述影响权重确定其他句子对所述句子的注意力。

14.根据权利要求9-13任一项所述的装置,其特征在于,所述表示确定模块,包括:

图确定单元,用于根据所述句子间的关系确定与所述关系对应的关系图;

表示确定单元,用于通过预设神经网络确定所述关系图中每个所述句子的句子表示。

15.根据权利要求14所述的装置,其特征在于,若所述关系图的数量大于1;

所述表示确定模块,还包括拼接单元,用于在表示确定单元通过预设神经网络确定所述关系图中每个所述句子的句子表示之后:

将所述句子对应的句子表示进行拼接,得到所述句子对应的完整表示。

16.根据权利要求9所述的装置,其特征在于,所述目标确定模块具体用于:

根据所述句子表示、所述检索信息确定匹配度;

将匹配程度靠前的预设数量个句子确定为目标句子。

17.一种电子设备,其特征在于,包括:

至少一个处理器;以及

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-8中任一项所述的方法。

18.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-8中任一项所述的方法。

技术总结
本申请公开了一种目标内容的确定方法、装置、设备及计算机可读存储介质,包括:将根据检索信息确定的文章段落拆分为多个句子,并根据句子的属性确定句子间的关系;根据句子间的关系确定每个句子对应的句子表示;根据句子的句子表示、检索信息确定目标句子,并根据目标句子确定目标内容。本公开提供的方法、装置、设备及计算机可读存储介质中,可以确定句子的关系,并根据句子间的关系重新确定句子的句子表示,再根据句子表示在句子中确定目标句子,使得本公开提供的方法、装置、设备及计算机可读存储介质能够结合句子间关系对每句话进行分析,从而确定与检索信息更加匹配的目标内容。

技术研发人员:冯欣伟;田志兴;戴松泰;余淼;周环宇;田孟;吴学谦;宋勋超;袁鹏程
受保护的技术使用者:北京百度网讯科技有限公司
技术研发日:2020.01.09
技术公布日:2020.06.05

转载请注明原文地址: https://bbs.8miu.com/read-57618.html

最新回复(0)