本申请涉及数据技术领域,特别是涉及一种内容处理方法、装置、计算机可读存储介质和计算机设备。
背景技术:
随着计算机技术的发展,各种用于浏览内容的应用程序层出不穷,越来越多的用户选择通过应用程序来浏览内容,比如新闻、娱乐资讯等;在这个过程中,一些推送内容会基于用户请求推送至相应的应用程序。
然而,目前的推送内容的确定方式,一般是通过计算内容之间的相似度,将与用户阅读过的内容之间的相似度较高的内容确定为推送内容。但是,将每条内容单作一个个独立的数据,且只依赖内容,导致在确定推送内容的过程中会丢失很多信息,造成推送内容的确定准确率较低。
技术实现要素:
基于此,有必要针对推送内容的确定准确率较低的技术问题,提供一种内容处理方法、装置、计算机可读存储介质和计算机设备。
一种内容处理方法,包括:
获取待推送用户在行为评价维度下的数据,以及所述待推送用户的用户画像信息和待推送内容;所述用户画像信息匹配有对应的用户画像编码,所述待推送内容匹配有对应的待推送内容编码;
根据所述待推送用户在行为评价维度下的数据,确定所述待推送用户在所述行为评价维度下的用户行为编码;
将所述待推送内容编码与所述用户行为编码、所述用户画像编码进行融合处理,得到目标编码;
根据所述目标编码,确定所述待推送内容的推荐概率;
根据所述推荐概率,从所述待推送内容中确定出与所述待推送用户对应的推送内容。
一种内容处理装置,所述装置包括:
数据获取模块,用于获取待推送用户在行为评价维度下的数据,以及所述待推送用户的用户画像信息和待推送内容;所述用户画像信息匹配有对应的用户画像编码,所述待推送内容匹配有对应的待推送内容编码;
行为编码确定模块,用于根据所述待推送用户在行为评价维度下的数据,确定所述待推送用户在所述行为评价维度下的用户行为编码;
目标编码确定模块,用于将所述待推送内容编码与所述用户行为编码、所述用户画像编码进行融合处理,得到目标编码;
推荐概率确定模块,用于根据所述目标编码,确定所述待推送内容的推荐概率;
推送内容确定模块,用于根据所述推荐概率,从所述待推送内容中确定出与所述待推送用户对应的推送内容。
一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如下步骤:
获取待推送用户在行为评价维度下的数据,以及所述待推送用户的用户画像信息和待推送内容;所述用户画像信息匹配有对应的用户画像编码,所述待推送内容匹配有对应的待推送内容编码;
根据所述待推送用户在行为评价维度下的数据,确定所述待推送用户在所述行为评价维度下的用户行为编码;
将所述待推送内容编码与所述用户行为编码、所述用户画像编码进行融合处理,得到目标编码;
根据所述目标编码,确定所述待推送内容的推荐概率;
根据所述推荐概率,从所述待推送内容中确定出与所述待推送用户对应的推送内容。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:
获取待推送用户在行为评价维度下的数据,以及所述待推送用户的用户画像信息和待推送内容;所述用户画像信息匹配有对应的用户画像编码,所述待推送内容匹配有对应的待推送内容编码;
根据所述待推送用户在行为评价维度下的数据,确定所述待推送用户在所述行为评价维度下的用户行为编码;
将所述待推送内容编码与所述用户行为编码、所述用户画像编码进行融合处理,得到目标编码;
根据所述目标编码,确定所述待推送内容的推荐概率;
根据所述推荐概率,从所述待推送内容中确定出与所述待推送用户对应的推送内容。
上述内容处理方法、装置、计算机可读存储介质和计算机设备,根据待推送用户在行为评价维度下的数据,确定待推送用户在行为评价维度下的用户行为编码,并结合用户画像信息对应的用户画像编码以及待推送内容对应的待推送内容编码,得到目标编码;进而根据目标编码,确定待推送内容的推荐概率;最后根据推荐概率,从待推送内容中确定出与待推送用户对应的推送内容;综合考虑了待推送用户在行为评价维度下的数据、用户画像信息以及待推送内容,有利于全面准确地刻画待推送用户与内容之间的关系,从而使得确定出的推送内容更加准确,进一步提高了推送内容的确定准确率;同时,基于准确确定的推送内容,有利于实现内容的精准推荐,从而提高了内容推荐的准确率。
附图说明
图1为一个实施例中内容处理方法的应用环境图;
图2为一个实施例中计算机设备的结构框图;
图3为一个实施例中内容处理方法的流程示意图;
图4为一个实施例中获取待推送用户在行为评价维度下的数据的步骤的流程示意图;
图5为一个实施例中获取预设时间段内待推送用户在行为评价维度下的数据的步骤的流程示意图;
图6为一个实施例中待推送用户的行为图网络的结构示意图;
图7为另一个实施例中待推送用户的行为图网络的结构示意图;
图8为一个实施例中预先训练的信息嵌入网络模型以及预先训练的内容推荐模型的训练步骤的流程示意图;
图9为一个实施例中确定目标编码的步骤的流程示意图;
图10为一个实施例中确定待推送用户在行为评价维度下的用户行为编码的步骤的流程示意图;
图11为又一个实施例中待推送用户的行为图网络的流程示意图;
图12为另一个实施例中内容处理方法的流程示意图;
图13为一个实施例中内容推送方法的流程示意图;
图14为一个实施例中将推送内容推送至待推送用户的步骤的流程示意图;
图15为一个实施例中内容显示方法的流程示意图;
图16为一个实施例中内容推送界面的界面示意图;
图17为又一个实施例中内容处理方法的流程示意图;
图18为一个实施例中内容处理装置的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
图1为一个实施例中内容处理方法的应用环境图。参照图1,该应用环境图包括服务器110。服务器110预先获取待推送用户在行为评价维度下的数据,以及待推送用户的用户画像信息和待推送内容,比如用户a在行为评价维度下的数据以及用户a的用户画像信息和待推送内容;用户画像信息匹配有对应的用户画像编码,待推送内容匹配有对应的待推送内容编码;根据待推送用户在行为评价维度下的数据,确定待推送用户在行为评价维度下的用户行为编码;将待推送内容编码与用户行为编码、用户画像编码进行融合处理,得到目标编码;根据目标编码,确定待推送内容的推荐概率;根据推荐概率,从待推送内容中确定出与待推送用户对应的推送内容,比如推送内容1、推送内容2等。此外,服务器还可以基于待推送用户的用户终端的内容推送请求,将与待推送用户对应的推送内容推送至对应的用户终端,以供待推送用户查看。
图2示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中的服务器110。如图2所示,该计算机设备包括该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现内容处理方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行内容处理方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图2中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
如图3所示,在一个实施例中,提供了一种内容处理方法。本实施例主要以该方法应用于上述图1中的服务器110来举例说明。参照图3,该内容处理方法具体包括如下步骤:
s302,获取待推送用户在行为评价维度下的数据,以及待推送用户的用户画像信息和待推送内容;用户画像信息匹配有对应的用户画像编码,待推送内容匹配有对应的待推送内容编码。
其中,行为评价维度是指用于表征用户的操作行为的评价角度;比如,行为评价维度具体可以是用户-内容操作角度、用户-内容发布对象关联角度、内容发布对象-内容操作角度等;用户-内容操作角度用于描述用户与内容之间的关系,比如用户-内容点击关系、用户-内容点赞关系、用户-内容评论关系、用户-内容转发关系等;用户-内容发布对象关联角度用于描述用户与内容发布对象(比如文章作者、微信公众号等)之间的关系,比如用户-内容发布对象关注关系等;内容发布对象-内容操作角度用于描述内容发布对象与内容之间的关系,比如内容发布对象-内容发布关系。数据是指当前时段内,比如近几天,待推送用户在各个行为评价维度下的数据,比如待推送用户在用户-内容操作角度下的数据是指待推送用户与内容之间的关系,例如待推送用户点击过该内容、待推送用户点赞过该内容等。
需要说明的是,行为评价维度除了列举的用户-内容操作角度、用户-内容发布对象关联角度、内容发布对象-内容操作角度之外,还可以包括其他行为评价维度,具体本申请不做限定。
其中,用户画像信息是指根据待推送用户的基本信息如兴趣、爱好、职业、年龄等抽象出的用户偏好描述信息,可用于表征待推送用户对各内容类别的偏好程度。
其中,待推送内容是指推送给待推送用户的预选内容,具体是指最新的内容,比如近几天的内容;在实际场景中,待推送内容可以是指图文信息、视频信息、图片信息、文章信息等。应当理解的是,待推送内容只是初步确定的多个内容,并非最终推送给待推送用户的内容;最终推送给待推送用户的内容需要根据后续得到的推荐概率确定。
其中,用户画像信息编码是指经过压缩编码后的用于表示用户画像信息的低层语义的低维度特征向量,待推送内容编码是指经过压缩编码后的用于表示待推送内容的低层语义的低维度特征向量;两者均是通过预先训练的内容推荐模型中的特征提取网络提取得到。
具体地,服务器基于大数据技术,采集待推送用户的历史操作数据、用户画像信息以及网络上的内容,并将网络上的内容识别为待推送内容;获取行为评价维度,根据行为评价维度对待推送用户的历史操作数据进行统计分析,得到待推送用户在行为评价维度下的数据;根据用户画像信息查询用户画像信息与用户画像编码的匹配关系,得到该用户画像信息对应的用户画像编码;根据待推送内容查询待推送内容与待推送内容编码的对应关系,得到该待推送内容对应的待推送内容编码。
进一步地,服务器预先采集多个待推送用户的用户画像信息和待推送内容,分别将多个待推送用户的用户画像信息和待推送内容输入至预先训练的内容推荐模型的特征提取网络中,得到多个用户画像信息对应的用户画像编码、多个待推送内容对应的待推送内容编码;根据多个用户画像信息对应的用户画像编码,构建用户画像信息与用户画像编码的匹配关系;根据多个待推送内容对应的待推送内容编码,构建待推送内容与待推送内容编码的对应关系。
s304,根据待推送用户在行为评价维度下的数据,确定待推送用户在行为评价维度下的用户行为编码。
其中,用户行为编码是指用于表征待推送用户的用户时序特征以及用户行为特征的特征向量;用户时序特征是指待推送用户依次先后操作过的内容,比如待推送用户依次先后阅读了几篇文章;用户行为特征是指待推送用户对内容或者内容发布对象的操作行为,比如待推送用户点赞了那篇文章,关注了哪个微信公众号等。
具体地,服务器根据待推送用户在行为评价维度下的数据,构建待推送用户的行为图网络;将待推送用户的行为图网络中的数据输入预先训练的信息嵌入网络模型,得到待推送用户在行为评价维度下的用户行为编码;其中,预先训练的信息嵌入网络模型是一种能够基于待推送用户的行为图网络中的数据,得到待推送用户在行为评价维度下的用户行为编码的特征嵌入模型。
举例说明,服务器基于图网络构建技术,基于待推送用户在行为评价维度下的数据,构建待推送用户的行为图网络;通过deepwalk、graphsage、pinsage等图嵌入式算法,基于待推送用户的行为图网络中的数据,学习得到待推送用户在行为评价维度下的用户行为编码。
s306,将待推送内容编码与用户行为编码、用户画像编码进行融合处理,得到目标编码。
其中,目标编码是指由待推送内容编码、用户行为编码、用户画像编码融合处理而成的特征向量,具体是指由待推送内容编码、用户行为编码、用户画像编码拼接处理而成的特征向量,用于表征待推送内容的推荐概率。
具体地,服务器按照预设拼接顺序,分别将各个待推送内容编码与用户行为编码、用户画像编码进行按列拼接处理,得到目标编码;方便后续根据目标编码,确定待推送内容的推荐概率;同时综合考虑了待推送用户在行为评价维度下的数据、用户画像信息以及待推送内容,有利于全面准确地刻画待推送用户与内容之间的关系,有利于后续准确确定待推送用户的推送内容。
例如,服务器按照待推送内容编码、用户行为编码、用户画像编码的排列顺序,将待推送内容编码、用户行为编码、用户画像编码进行按列拼接处理,得到目标编码。
s308,根据目标编码,确定待推送内容的推荐概率。
其中,待推送内容的推荐概率用于衡量待推送内容被推荐可能性,具体是指待推送内容被待推送用户点击的概率。
具体地,服务器将目标编码输入预先训练的内容推荐模型中的内容预测网络,通过内容预测网络对目标编码进行一系列处理,得到待推送内容的推荐概率。其中,预先训练的内容推荐模型中的内容预测网络是一种能够根据输入的目标编码,确定待推送内容的推荐概率的神经网络。
s310,根据推荐概率,从待推送内容中确定出与待推送用户对应的推送内容。
具体地,服务器将推荐概率满足预设条件的待推送内容,比如推荐概率最大的待推送内容,推荐概率大于某个概率的待推送内容等等,作为与待推送用户对应的推送内容;这样,有利于提高推送内容的确定准确率,同时使得后续推送给待推送用户的内容更加精准,从而提高内容推送的准确度。
进一步地,在根据推荐概率,从待推送内容中确定出与待推送用户对应的推送内容之后,服务器还可以将与待推送用户对应的推送内容推送至待推送用户。
在一个实施例中,服务器可以按照预设推送频率,将与待推送用户对应的推送内容推送至待推送用户,通过待推送用户的用户终端界面显示推荐概率更高的推送内容,满足待推送用户的兴趣需求,从而实现了推送内容的精准推送。其中,预设推送频率是指待推送内容的推送频率,比如1分钟推送10条推送内容。
在另一个实施例中,服务器还可以将与待推送用户对应的推送内容,转化成与预设推送模式对应的推送内容,并将该推送内容推送至待推送用户。其中,预设推送模式是指推送内容的内容排版模式,比如图文视图模式、文字视图模式、视频视图模式等。
在又一个实施例中,服务器还可以接收用户终端的内容推送请求,内容推送请求中携带有待推送用户的用户标识;从待推送内容中,将与用户标识所标识的待推送用户的推送内容推送至用户终端。
上述内容处理方法,根据待推送用户在行为评价维度下的数据,确定待推送用户在行为评价维度下的用户行为编码,并结合用户画像信息对应的用户画像编码以及待推送内容对应的待推送内容编码,得到目标编码;进而根据目标编码,确定待推送内容的推荐概率;最后根据推荐概率,从待推送内容中确定出与待推送用户对应的推送内容;综合考虑了待推送用户在行为评价维度下的数据、用户画像信息以及待推送内容,有利于全面准确地刻画待推送用户与内容之间的关系,从而使得确定出的推送内容更加准确,进一步提高了推送内容的确定准确率;同时,基于准确确定的推送内容,有利于实现内容的精准推荐,从而提高了内容推荐的准确率。
如图4所示,在一个实施例中,步骤s302中获取待推送用户在行为评价维度下的数据,具体包括如下步骤:
s402,采集预设时间段内待推送用户对推送内容的操作数据、待推送用户与推送内容的发布对象的关联数据和发布对象对推送内容的操作数据。
其中,待推送用户对推送内容的操作数据可以是指待推送用户对推送内容的点赞、点击、转发等行为数据;待推送用户与推送内容的发布对象的关联数据可以是指待推送用户对推送内容的发布对象的关注行为数据;发布对象对推送内容的操作数据可以是指发布对象对推送内容的发布行为数据。
具体地,服务器基于大数据技术,采集预设时间段内与待推送用户有关的行为数据,将预设时间段内与待推送用户有关的行为数据进行分类,得到预设时间段内待推送用户对推送内容的操作数据、待推送用户与推送内容的发布对象的关联数据和发布对象对推送内容的操作数据。
s404,根据预设时间段内待推送用户对推送内容的操作数据、待推送用户与推送内容的发布对象的关联数据和发布对象对推送内容的操作数据,获取预设时间段内待推送用户在行为评价维度下的数据。
具体地,服务器根据数据与行为评价维度的对应关系,分别将预设时间段内待推送用户对推送内容的操作数据、待推送用户与推送内容的发布对象的关联数据和发布对象对推送内容的操作数据,归类到对应的行为评价维度下,从而得到预设时间段内待推送用户在各个行为评价维度下的数据。
本实施例中,通过对预设时间段内待推送用户对推送内容的操作数据、待推送用户与推送内容的发布对象的关联数据和发布对象对推送内容的操作数据进行统计分析,得到预设时间段内待推送用户在行为评价维度下的数据;实现了获取预设时间段内待推送用户在行为评价维度下的数据的目的,便于后续从多个行为评价维度确定待推送用户的用户行为编码,从而使得确定出的用户行为编码更能反映待推送用户的用户时序特征和用户行为特征,进一步提高了确定出的用户行为编码的准确率。
如图5所示,在一个实施例中,若行为评价维度包括第一行为评价维度、第二行为评价维度以及第三行为评价维度,那么,步骤s404中根据预设时间段内待推送用户对推送内容的操作数据、待推送用户与推送内容的发布对象的关联数据和发布对象对推送内容的操作数据,获取预设时间段内待推送用户在行为评价维度下的数据,具体包括:
s502,根据预设时间段内待推送用户对推送内容的操作数据,得到待推送用户与推送内容之间的关系,作为待推送用户在第一行为评价维度下的数据。
其中,第一行为评价维度是指用户-内容操作角度,用于描述待推送用户与推送内容之间的关系;待推送用户与推送内容之间的关系可以是指用户-内容点击关系、用户-内容点赞关系、用户-内容评论关系、用户-内容转发关系等。
举例说明,服务器对预设时间段内待推送用户对推送内容的操作数据进行统计分析,以判断待推送用户是否点击、点赞、评论、转发过推送内容,从而得到待推送用户与推送内容之间的关系,作为待推送用户在用户-内容操作角度下的数据。
s504,根据预设时间段内待推送用户与推送内容的发布对象的关联数据,得到待推送用户与发布对象之间的关系,作为待推送用户在第二行为评价维度下的数据。
其中,第二行为评价维度是指用户-内容发布对象关联角度,用于描述待推送用户与内容发布对象之间的关系;待推送用户与发布对象之间的关系可以是指用户-内容发布对象关注关系,比如待推送用户未关注内容发布对象、待推送用户已关注内容发布对象等。
举例说明,服务器对预设时间段内待推送用户对推送内容的操作数据进行统计分析,以判断待推送用户是否关注过内容发布对象,从而得到待推送用户与内容发布对象之间的关系,作为待推送用户在用户-内容发布对象关联角度下的数据。
s506,根据预设时间段内发布对象对推送内容的操作数据,得到发布对象与推送内容之间的关系,作为待推送用户在第三行为评价维度下的数据。
其中,第三行为评价维度是指内容发布对象-内容操作角度,用于描述内容发布对象与推送内容之间的关系;内容发布对象与推送内容之间的关系可以是指内容发布对象-内容发布关系,比如发布对象已发布过推送内容、发布对象未发布过推送内容等。
举例说明,服务器对预设时间段内发布对象对推送内容的操作数据进行统计分析,以判断发布对象是否发布过推送内容,从而得到发布对象与推送内容之间的关系,作为待推送用户在用户-内容发布对象关联角度下的数据。
在本实施例中,通过对预设时间段内待推送用户对推送内容的操作数据、待推送用户与推送内容的发布对象的关联数据,以及发布对象对推送内容的操作数据进行统计分析,有利于得到预设时间段内待推送用户在行为评价维度下的数据;有利于后续从多个行为评价维度确定待推送用户的用户行为编码,从而提高了用户行为编码的确定准确率。
在一个实施例中,待推送用户在行为评价维度下的数据包括数据对象以及数据对象之间的数据关系,那么,步骤s304中根据待推送用户在行为评价维度下的数据,确定待推送用户在行为评价维度下的用户行为编码,具体包括:以数据对象作为节点,以数据关系作为节点之间的边,构建待推送用户的行为图网络;根据待推送用户的行为图网络,确定待推送用户在行为评价维度下的用户行为编码。
其中,若行为评价维度为用户-内容操作角度,那么待推送用户在用户-内容操作角度下的数据对象是指待推送用户以及推送内容,数据关系是指推送用户与推送内容之间的关系,比如点击关系、点赞关系、转发关系等;若行为评价维度为用户-内容发布对象关联角度,那么待推送用户在用户-内容发布对象关联角度下的数据对象是指待推送用户以及发布对象,数据关系是待推送用户与发布对象之间的关系,比如关注关系;若行为评价维度为内容发布对象-内容操作角度,那么待推送用户在内容发布对象-内容操作角度下的的数据对象是指内容发布对象与推送内容,数据关系是指内容发布对象与推送内容之间的关系,比如发布关系。
其中,行为图网络是指由一系列的对象和对象之间的数据关系组成的图神经网络,对象是指行为图网络的节点,对象之间的数据关系是指行为图网络的边;比如用户a点击内容a,那么用户a和内容a是指对象,用于作为图网络的节点;用户a对内容a的点击关系是指对象之间的数据关系,用于作为行为图网络的边。需要说明的是,待推送用户的行为图网络以待推送用户对应的节点为中心。
具体地,服务器从待推送用户在行为评价维度下的数据中提取出数据对象以及数据对象之间的数据关系,分别将每个数据对象转化为行为图网络中的节点,将每个数据关系转化为行为图网络中节点之间的边,构建待推送用户的行为图网络;通过k阶聚合算法,对待推送用户的行为图网络中的节点的信息进行层层聚合,得到待推送用户在行为评价维度下的用户行为编码;这样,有利于通过行为图网络表征用户与内容之间的所有关系,便于通过行为图网络,得到更加准确的用户行为编码。
举例说明,待推送用户a在用户-内容操作角度、用户-内容发布对象关联角度、内容发布对象-内容操作角度的数据分别为:待推送用户a点击过内容b,待推送用户a关注过发布对象c,发布对象c发布过内容b;那么行为图网络中的节点为:待推送用户a对应的id、内容b对应的id、发布对象c对应的id,行为图网络中的边为:待推送用户a与内容b的点击关系,待推送用户a与发布对象c的关注关系,发布对象c与内容b的发布关系;基于此,构建成对应的行为图网络,参考图6。需要说明的是,图6所示的行为图网络只是待推送用户a的行为图网络中的一部分,并非一个完整的行为图网络。
在本实施例中,将待推送用户在行为评价维度下的数据转化成对应的行为图网络,有利于更好地描述用户与内容之间的共性关系,从而使得确定出的用户行为编码更加准确。
在一个实施例中,行为图网络中的节点匹配有对应的初始信息编码,那么,根据待推送用户的行为图网络,确定待推送用户在行为评价维度下的用户行为编码,包括:将待推送用户的行为图网络中的节点的初始信息编码输入预先训练的信息嵌入网络模型,得到待推送用户在行为评价维度下的用户行为编码;预先训练的嵌入网络模型用于对待推送用户所在节点的邻居节点的目标信息编码进行聚合处理,并将聚合处理后的目标信息编码与待推送用户所在节点的初始信息编码进行拼接处理,得到待推送用户在行为评价维度下的用户行为编码;其中,待推送用户所在节点的邻居节点的目标信息编码根据对邻居节点的邻居节点的目标信息编码进行聚合处理,并将聚合处理后的目标信息编码与待推送用户所在节点的邻居节点的初始信息编码进行拼接处理得到。
其中,预先训练的信息嵌入网络模型是一种能够基于待推送用户的行为图网络中的各个节点的信息,得到待推送用户的用户行为编码的特征嵌入模型,比如deepwalk网络模型、graphsage网络模型、pinsage网络模型等。
其中,行为图网络中的节点匹配的初始信息编码是指初始化的特征向量;邻居节点的目标信息编码是一种聚合处理后的特征向量。需要说明的是,行为图网络中的每个节点的目标信息编码都是通过其邻居节点聚合后的目标信息编码以及该节点对应的初始信息编码拼接得到。
举例说明,参考图6,待推送用户a所在节点为中心节点,内容b所在节点与发布对象c所在节点为待推送用户a所在节点的邻居节点;分别对内容b所在节点对应的目标信息编码b1以及发布对象c所在节点对应的目标信息编码c1进行线性变换、激活、池化处理,得到处理后的目标信息编码b1以及目标信息编码c1;将经过线性变换、激活、池化处理后的目标信息编码b1以及目标信息编码c1按列拼接在一起,得到聚合处理后的目标信息编码d1;将聚合处理后的目标信息编码d1与待推送用户a所在节点的初始信息编码a1按列拼接在一起,得到待推送用户a的目标信息编码a1,作为待推送用户a在行为评价维度下的用户行为编码。
需要说明的是,内容b所在节点对应的目标信息编码b1,也是通过对其邻居节点的目标信息编码进行线性变换、激活、池化、拼接处理,并将处理后的目标信息编码与内容b所在节点对应的初始信息编码b1按列拼接在一起得到。发布对象c所在节点对应的目标信息编码c1以及行为图网络中的其他节点对应的目标信息编码也是通过上述方法得到,在此不再赘述。
进一步地,参考图6,待推送用户a所在节点与内容b所在节点之间的边可以通过权重去强化该条边的重要程度,比如待推送用户a对内容b进行点击、点赞、评论、转发等操作,则说明该条边的重要程度较高,对应的权重也高;同理,待推送用户a所在节点与发布对象c所在节点之间的边也可以通过权重去强化该条边的重要程度,比如待推送用户a经常查看发布对象c发布的内容,则说明该条边的重要程度较高,对应的权重也高。
在一个实施例中,预先训练的嵌入网络模型还用于分别根据待推送用户所在节点与各个邻居节点之间的权重,对待推送用户所在节点的各个邻居节点的目标信息编码进行加权处理,得到各个邻居节点的加权处理后的目标信息编码;对各个邻居节点的加权处理后的目标信息编码进行聚合处理,并将聚合处理后的目标信息编码与待推送用户所在节点的初始信息编码进行拼接处理,得到待推送用户在行为评价维度下的用户行为编码。
举例说明,参考图6,假设经过线性变换、激活、池化处理后的目标信息编码b1以及目标信息编码c1对应的权重分别为m和n,则通过权重m和n分别对目标信息编码b1以及目标信息编码c1进行加权处理,得到加权处理后的目标信息编码mb1以及目标信息编码nc1;将加权处理后的目标信息编码mb1以及目标信息编码nc1按列拼接在一起,得到聚合处理后的目标信息编码d1;将聚合处理后的目标信息编码d1与待推送用户a所在节点的初始信息编码a1按列拼接在一起,得到待推送用户a的目标信息编码a1,作为待推送用户a在行为评价维度下的用户行为编码。
在实际场景中,参考图7,服务器将待推送用户所在节点作为中心节点v,将与待推送用户a所在节点相关的节点作为中心节点v的一阶邻居节点、二阶邻居节点等,通过k阶邻居聚合算法,对一阶邻居节点的二阶邻居节点的目标信息编码进行聚合处理,并将聚合处理后的目标信息编码与该一阶邻居节点的初始信息编码进行拼接处理,得到该一阶邻居节点的目标信息编码;参照同样的方法,可以得到各个一阶邻居节点的目标信息编码;对各个一阶邻居节点的目标信息编码进行聚合处理,并将聚合处理后的目标信息编码与待推送用户所在节点(即中心节点v)的初始信息编码进行拼接处理,得到待推送用户在行为评价维度下的用户行为编码。需要说明的是,二阶邻居节点的目标信息编码根据对二阶邻居节点的邻居节点(即三阶邻居节点)的目标信息编码进行聚合处理,并将聚合处理后的目标信息编码与该二阶邻居节点的初始信息编码进行拼接处理得到。
在本实施例中,通过待推送用户的行为图网络中各个节点的信息,确定待推送用户在行为评价维度下的用户行为编码,有利于更好地描述用户与内容之间的所有共性关系,从而使得确定出的用户行为编码更加准确。
在一个实施例中,步骤s308中根据目标编码,确定待推送内容的推荐概率,包括:将目标编码输入预先训练的内容推荐模型中,通过预先训练的内容推荐模型对目标编码进行卷积池化处理,得到待推送内容的推荐概率。
具体地,服务器将目标编码输入预先训练的内容推荐模型中,通过预先训练的内容推荐模型的内容预测网络对目标编码进行卷积池化等一系列神经网络处理,得到待推送内容的推荐概率;这样,有利于后续基于用户行为编码、用户画像编码、待推送信息编码确定的推荐概率,从待推送内容中确定出与待推送用户对应的推送内容,使得后续推送给待推送用户的内容更加精准,从而提高了推送内容的确定准确率。
如图8所示,在一个实施例中,预先训练的信息嵌入网络模型以及预先训练的内容推荐模型通过下述步骤训练得到:
s802,获取样本用户在行为评价维度下的数据、样本用户画像信息、样本推送内容和样本推送内容的实际推荐概率。
其中,样本推送内容的实际推荐概率用于衡量样本用户是否点击过样本推送内容,若样本用户点击过样本推送内容,则实际推荐概率为1;当然,样本推送内容的实际推荐概率也可以通过实际分析统计得到的具体概率值。
s804,分别将样本用户画像信息和样本推送内容输入至待训练的内容推荐模型中的特征提取网络,得到样本用户画像信息对应的样本用户画像编码和样本推送内容对应的样本推送内容编码。
s806,将样本用户在行为评价维度下的数据输入至待训练的信息嵌入网络模型,得到样本用户在行为评价维度下的样本用户行为编码。
具体地,服务器将样本用户在行为评价维度下的数据进行转化处理,得到样本用户在行为图网络中的信息;将样本用户在行为图网络中的信息输入至待训练的信息嵌入网络模型,通过待训练的信息嵌入网络模型对样本用户的行为图网络中的信息进行处理,得到样本用户在行为评价维度下的用户行为编码。
s808,将样本推送内容编码、样本用户行为编码以及样本用户画像编码进行融合处理,得到样本目标编码。
s810,将样本目标编码输入至待训练的内容推荐模型中的内容预测网络,得到样本推送内容的预测推荐概率。
s812,根据预测推荐概率以及实际推荐概率计算损失值。
具体地,服务器获取预设的损失值统计文件,根据预设的损失值统计文件对预测推荐概率以及实际推荐概率进行处理,得到损失值;预设的损失值统计文件是一种能够统计损失值的对数损失函数。
s814,根据损失值调整待训练的信息嵌入网络模型以及待训练的内容推荐模型的网络参数,直至达到训练结束条件。
具体地,若得到的损失值不满足条件,则在同一个反向传播过程中,同步调整待训练的信息嵌入网络模型以及待训练的内容推荐模型的网络参数,并重复执行步骤s804至s812,直到得到的损失值满足条件,则停止训练。这样,有利于使用参数共享的方式,并通过一个损失函数同步更新待训练的信息嵌入网络模型以及待训练的内容推荐模型的网络参数,使得后续训练出的信息嵌入网络模型得到的用户行为编码以及通过内容推荐模型得到的用户画像编码和待推送信息编码在同一个表达空间内。
s816,若达到训练结束条件,将当前的内容推荐模型,作为预先训练的内容推荐模型;并将当前的信息嵌入网络模型,作为预先训练的信息嵌入网络模型。
在本实施例中,通过在同一个反向传播中,同步训练信息嵌入网络模型以及内容推荐模型,使得通过信息嵌入网络模型得到的用户行为编码以及通过内容推荐模型得到的用户画像编码和待推送信息编码在同一个表达空间内,方便后续将用户行为编码、用户画像编码、待推送信息编码进行融合处理得到目标编码,并基于目标编码得到待推送内容的推荐概率,从而确定出更加准确的推送内容,进一步提高了推送内容的确定准确率。同时,通过对信息嵌入网络模型以及内容推荐模型进行多次训练,有利于提高得到的用户行为编码、用户画像编码、待推送信息编码的准确性。
在一个实施例中,步骤s310中,根据推荐概率,从待推送内容中确定出与待推送用户对应的推送内容,包括:将推荐概率大于预设阈值的待推送内容,确定为与待推送用户对应的推送内容。
举例说明,服务器从待推送内容中,筛选出推荐概率大于0.6的待推送内容,作为与待推送用户对应的推送内容;这样,只将推荐概率符合条件的待推送内容,确定为与待推送用户对应的推送内容,有利于实现了推送内容的精准确定,进一步提高了推送内容的确定准确率。
如图9所示,在一个实施例中,上述步骤s306,将待推送内容编码与用户行为编码、用户画像编码进行融合处理,得到目标编码,具体包括如下步骤:
s902,分别获取待推送内容编码、用户行为编码和用户画像编码对应的预设权重。
其中,待推送内容编码、用户行为编码和用户画像编码对应的预设权重是根据历史数据训练得到的,分别用于表征待推送内容编码、用户行为编码和用户画像编码对应的重要程度。
s904,分别根据预设权重,对待推送内容编码、用户行为编码和用户画像编码进行加权处理,得到处理后的待推送内容编码、处理后的用户行为编码和处理后的用户画像编码。
s906,将处理后的待推送内容编码与处理后的用户行为编码、处理后的用户画像编码进行融合处理,得到目标编码。
具体地,服务器根据待推送内容编码对应的预设权重,对待推送内容编码进行加权处理,得到处理后的待推送内容编码;根据用户行为编码对应的预设权重,对用户行为编码进行加权处理,得到处理后的用户行为编码;根据用户画像编码对应的预设权重,对用户画像编码进行加权处理,得到处理后的用户画像编码;将处理后的待推送内容编码与处理后的用户行为编码、处理后的用户画像编码进行拼接处理,得到拼接处理后的编码,作为目标编码。
举例说明,假设待推送内容编码、用户行为编码和用户画像编码分别为x、y和z,对应的预设权重分别为a、b和c,则处理后的待推送内容编码、用户行为编码和用户画像编码分别为ax、by和cz;将处理后的待推送内容编码ax与处理后的用户行为编码by、处理后的用户画像编码cz按列拼接在一起,得到目标编码。
在本实施例中,通过将待推送内容编码与用户行为编码、用户画像编码进行融合处理,得到目标编码,有利于后续根据目标编码,确定待推送内容的推荐概率,进而根据推荐概率从待推送内容中确定出与待推送用户对应的推送内容,从而提高了推送内容的确定准确率。
在一个实施例中,若待推送用户在行为评价维度下的数据为当前时间段内待推送用户在行为评价维度下的数据,那么本申请的内容处理方法还包括:获取下一时间段内待推送用户在行为评价维度下的数据。
具体地,服务器根据预设频率,获取各个时间段内待推送用户在行为评价维度下的数据,比如当前时间段的下一时间段内待推送用户在行为评价维度下的数据;这样,有利于后续根据下一时间段内待推送用户在行为评价维度下的数据,对当前时间段内待推送用户在行为评价维度下的数据进行更新,从而保证了待推送用户在行为评价维度下的数据的时效性和准确性。
如图10所示,在一个实施例中,步骤s304中根据待推送用户在行为评价维度下的数据,确定待推送用户在行为评价维度下的用户行为编码,具体包括以下步骤:
s1002,根据下一时间段内待推送用户在行为评价维度下的数据,对当前时间段内待推送用户在行为评价维度下的数据进行更新,得到更新后的数据。
具体地,服务器根据下一时间段内待推送用户在用户-内容操作角度、用户-内容发布对象关联角度、内容发布对象-内容操作角度下的数据,对当前时间段内待推送用户在用户-内容操作角度、用户-内容发布对象关联角度、内容发布对象-内容操作角度下的数据进行更新。
举例说明,比如待推送用户在下一时间段内(比如t 1,t为周期)点击了某篇文章、点赞了某篇文章、关注了某个微信公众号等,则将这些行为数据实时添加到当前时间段内(比如t)待推送用户在该行为评价维度下的数据。
s1004,根据更新后的数据,更新待推送用户在行为评价维度下的用户行为编码。
具体地,服务器参照上述构建待推送用户的行为图网络的方法,基于更新后的数据,对待推送用户的行为图网络进行更新,得到更新后的行为图网络;将更新后的行为图网络中的信息输入预先训练的信息嵌入网络模型,得到待推送用户在行为评价维度下的用户行为编码;这样,实现了对待推送用户在行为评价维度下的用户行为编码进行更新的目的,保证了得到的用户行为编码的时效性和准确性。
例如,假设图6为待推送用户a在当前时间段t的行为图网络,待推送用户a在下一时间段t 1点击了内容k,关注了公众号l等,则根据这些信息对图6所示的行为图网络进行更新,得到更新后的行为图网络,如图11所示;根据更新后的行为图网络,更新待推送用户在行为评价维度下的用户行为编码,保证了得到的用户行为编码的准确性。
在本实施例中,通过对当前时间段内待推送用户在行为评价维度下的数据进行更新,有利于提高得到的待推送用户的行为图网络的时效性和准确性,进一步提高了待推送用户在行为评价维度下的用户行为编码的时效性和准确性,便于后续基于更新后的用户行为编码,确定出更加准确的推送内容,从而提高了推送内容的确定准确率。
如图12所示,在一个实施例中,提供了另一种内容处理方法。本实施例主要以该方法应用于上述图1中的服务器110来举例说明。参照图12,该内容处理方法具体包括如下步骤:
s1202,获取待推送用户在行为评价维度下的数据,以及待推送用户的用户画像信息和待推送内容。
s1204,分别将用户画像信息以及待推送内容输入至预先训练的内容推荐模型中的特征提取网络,得到用户画像信息对应的用户画像编码以及待推送内容对应的待推送内容编码。
s1206,根据待推送用户在行为评价维度下的数据,构建待推送用户的行为图网络。
s1208,将待推送用户的行为图网络中的节点的初始信息编码输入预先训练的信息嵌入网络模型,得到待推送用户在行为评价维度下的用户行为编码。
s1210,将待推送内容编码与用户行为编码、用户画像编码进行按列拼接处理,得到目标编码。
s1212,将目标编码输入预先训练的内容推荐模型中的内容预测网络,得到待推送内容的推荐概率。
s1214,将推荐概率大于预设阈值的待推送内容,确定为与待推送用户对应的推送内容。
上述内容处理方法,综合考虑了待推送用户在行为评价维度下的数据、用户画像信息以及待推送内容,有利于全面准确地刻画待推送用户与内容之间的关系,从而使得确定出的推送内容更加准确,进一步提高了推送内容的确定准确率;同时,基于准确确定的推送内容,有利于实现内容的精准推荐,从而提高了内容推荐的准确率。
如图13所示,在一个实施例中,提供了一种内容推送方法。本实施例主要以该方法应用于上述图1中的服务器110来举例说明。参照图13,该内容推送方法具体包括如下步骤:
s1302,获取待推送用户在行为评价维度下的数据,以及待推送用户的用户画像信息和待推送内容;用户画像信息匹配有对应的用户画像编码,待推送内容匹配有对应的待推送内容编码。
s1304,根据待推送用户在行为评价维度下的数据,构建待推送用户的行为图网络。
s1306,根据待推送用户的行为图网络,确定待推送用户在行为评价维度下的用户行为编码。
s1308,将待推送内容编码与用户行为编码、用户画像编码进行融合处理,得到目标编码。
s1310,根据目标编码,确定待推送内容的推荐概率。
s1312,根据推荐概率,从待推送内容中确定出与待推送用户对应的推送内容。
s1314,将推送内容推送至待推送用户。
具体地,服务器将与待推送用户对应的推送内容,推送至待推送用户对应的用户终端,通过用户终端界面展示与待推送用户对应的推送内容。
进一步地,服务器还可以接收用户终端的推送请求,推送请求中携带有待推送用户的用户标识;对推送请求进行解析,得到待推送用户的用户标识;查询确定出的推送内容,获取与该用户标识对应的推送内容,作为与该待推送用户对应的推送内容,并将该推送内容推送至待推送用户。
需要说明的是,确定出的推送内容中,包括多个用户标识对应的推送内容。
上述内容推送方法,从确定出的内容中,将与待推送用户对应的推送内容推送至待推送用户,有利于实现了推送内容的精准推送,从而提高了推送内容的推送准确率,同时提高了推送内容的点击率。
如图14所示,在一个实施例中,上述步骤s1314中,将推送内容推送至待推送用户,具体包括以下步骤:
s1402,按照推荐概率,将与待推送用户对应的推送内容进行排序,得到排序后的推送内容。
其中,每个推送内容都匹配有对应的推荐概率。
具体地,服务器按照推荐概率从高到低的顺序,对与待推送用户对应的推送内容进行排序,得到排序后的推送内容。当然,还可以结合其他线上规则,对与待推送用户对应的推送内容进行综合排序。
s1404,按照预设推送频率,将排序后的推送内容推送至待推送用户。
举例说明,服务器按照预设推送频率,从排序后的推送内容中选取出推荐概率靠前的推送内容,推送至待推送用户;比如,按照每分钟推送10条推送内容的推送频率,从排序后的推送内容中选取出推荐概率靠前的10条推送内容,推送至待推送用户。
在本实施例中,按照推荐概率,将与待推送用户对应的推送内容进行排序后推送至待推送用户,实现了将推荐概率符合条件的推送内容推送至待推送用户的目的,满足待推送用户的兴趣需求,从而实现了推送内容的精准推送,进一步提高了推送内容的推送准确率。
如图15所示,在一个实施例中,提供了一种内容显示方法,具体包括如下步骤:
s1502,在内容推送界面上显示推送选项。
s1504,接收针对推送选项的触发指令。
s1506,响应触发指令,在内容推送界面上显示与待推送用户对应的推送内容;与待推送用户对应的推送内容根据上述所述的内容处理方法确定。
请参照图16,以“微信看一看”应用程序为例进行说明。用户终端安装有微信应用程序,用户打开微信应用程序,进入“微信看一看”对应的内容推送界面;用户点击推送选项,比如“精选”选项,即可触发生成触发指令,用户终端响应触发指令,生成推送请求,并将推送请求发送至对应的服务器;服务器根据推送请求,将与用户对应的推送内容推送至“微信看一看”应用程序,以通过“微信看一看”应用程序的内容推送界面展示与用户对应的推送内容,比如推送内容1、推送内容2、推送内容3、推送内容4、推送内容5、推送内容6等。
需要说明的是,本申请的内容推送方法除了应用于“微信看一看”的内容推送场景中,还可以应用于其他内容推送场景中,具体本申请不做限定。
上述内容显示方法,实现了在内容推送界面上显示与待推送用户对应的推送内容的目的;同时,实现了推送内容的精准推送,从而提高了推送内容的推送准确率。
如图17所示,在一个实施例中,提供了又一种内容推送方法。本实施例主要以该方法应用于上述图1中的服务器110来举例说明。参照图17,该内容推送方法具体包括如下内容:
首先,采集待推送用户在行为评价维度下的数据,根据待推送用户在行为评价维度下的数据,构建待推送用户的行为图网络;在待推送用户的行为图网络中,以待推送用户所在节点作为中心节点;通过信息嵌入网络模型基于邻居汇聚学习算法,学习行为图网络中各个节点的特征编码,并通过nceloss函数辅助学习行为图网络中各个节点之间的相关性,从而得到待推送用户所在节点的特征编码,作为待推送用户的用户行为编码。
接着,采集待推送用户的用户画像信息和待推送内容,分别将用户画像信息以及待推送内容输入至ctr预测模型中的特征提取网络,得到用户画像信息对应的用户画像编码以及待推送内容对应的待推送内容编码;将信息嵌入网络模型学习到的待推送用户的用户行为编码加入到ctr预测模型中的内容预测网络中,通过内容预测网络将待推送内容编码与用户行为编码、用户画像编码进行按列拼接处理,得到目标编码;将目标编码进行多次全连接处理(fc),得到待推送内容的推荐概率。
在得到待推送内容的推荐概率之后,可以分为两个步骤进行;第一,若在模型训练过程中,则在得到待推送内容的推荐概率之后,可以通过loss函数,基于待推送内容的推荐概率以及实际推荐概率计算损失值,并根据损失值,基于反向传播算法,同步调整信息嵌入网络模型以及ctr预测模型的网络参数,直至达到训练结束条件。若在内容推送过程中,则将推荐概率大于预设阈值的待推送内容,确定为与待推送用户对应的推送内容,并将推送内容推送至待推送用户。
进一步地,在得到t 0时间段的行为图网络之后,若待推送用户在t 1时间段内点击了某篇文章、点赞了某篇文章、关注了某个微信公众号等,则根据这些数据,更新待推送用户在t 0时间段的行为图网络,得到更新后的行为图网络,作为待推送用户的最新行为图网络;根据待推送用户的最新行为图网络,更新待推送用户在行为评价维度下的用户行为编码;将待推送内容编码与用户行为编码、用户画像编码进行融合处理,得到目标编码;根据目标编码,重新确定待推送内容的推荐概率;根据推荐概率,从待推送内容中重新确定出与待推送用户对应的推送内容,保证了确定出的推送内容的时效性和准确性。
进一步地,在实际应用中,上述确定出与待推送用户对应的推送内容的方案可以应用在微信看一看的列表页推荐场景中,如图16所示,将与待推送用户对应的新闻、视频等推送内容推送至待推送用户。
上述实施例可以达到以下效果:在离线阶段auc提升 0.52%,上线后线上指标提升显著,主要体现在微信看一看整体曝光点击率提升 1.25%,整体停留时长提升 0.67%,图文曝光点击率 2.00%,图文阅读时长 2.40%等核心指标。
应该理解的是,虽然图3-5、8-10、12-15的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图3-5、8-10、12-15中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
如图18所示,在一个实施例中,提供了一种内容处理装置1800,该装置1800包括:数据获取模块1802,行为编码确定模块1804,目标编码确定模块1806、推荐概率确定模块1808以及推送内容确定模块1810,其中:
数据获取模块1802,用于获取待推送用户在行为评价维度下的数据,以及待推送用户的用户画像信息和待推送内容;用户画像信息匹配有对应的用户画像编码,待推送内容匹配有对应的待推送内容编码。
行为编码确定模块1804,用于根据待推送用户在行为评价维度下的数据,确定待推送用户在行为评价维度下的用户行为编码。
目标编码确定模块1806,用于将待推送内容编码与用户行为编码、用户画像编码进行融合处理,得到目标编码。
推荐概率确定模块1808,用于根据目标编码,确定待推送内容的推荐概率。
推送内容确定模块1810,用于根据推荐概率,从待推送内容中确定出与待推送用户对应的推送内容。
在本实施例中,内容处理装置根据待推送用户在行为评价维度下的数据,确定待推送用户在行为评价维度下的用户行为编码,并结合用户画像信息对应的用户画像编码以及待推送内容对应的待推送内容编码,得到目标编码;进而根据目标编码,确定待推送内容的推荐概率;最后根据推荐概率,从待推送内容中确定出与待推送用户对应的推送内容;综合考虑了待推送用户在行为评价维度下的数据、用户画像信息以及待推送内容,有利于全面准确地刻画待推送用户与内容之间的关系,从而使得确定出的推送内容更加准确,进一步提高了推送内容的确定准确率;同时,基于准确确定的推送内容,有利于实现内容的精准推荐,从而提高了内容推荐的准确率。
在一个实施例中,数据获取模块1802还用于采集预设时间段内待推送用户对推送内容的操作数据、待推送用户与推送内容的发布对象的关联数据和发布对象对推送内容的操作数据;根据预设时间段内待推送用户对推送内容的操作数据、待推送用户与推送内容的发布对象的关联数据和发布对象对推送内容的操作数据,获取预设时间段内待推送用户在行为评价维度下的数据。
在一个实施例中,行为评价维度包括第一行为评价维度、第二行为评价维度以及第三行为评价维度,数据获取模块1802还用于根据预设时间段内待推送用户对推送内容的操作数据,得到待推送用户与推送内容之间的关系,作为待推送用户在第一行为评价维度下的数据;根据预设时间段内待推送用户与推送内容的发布对象的关联数据,得到待推送用户与发布对象之间的关系,作为待推送用户在第二行为评价维度下的数据;根据预设时间段内发布对象对推送内容的操作数据,得到发布对象与推送内容之间的关系,作为待推送用户在第三行为评价维度下的数据。
在一个实施例中,待推送用户在行为评价维度下的数据包括数据对象以及数据对象之间的数据关系;行为编码确定模块1804还用于以数据对象作为节点,以数据关系作为节点之间的边,构建待推送用户的行为图网络;根据待推送用户的行为图网络,确定待推送用户在行为评价维度下的用户行为编码。
在一个实施例中,行为图网络中的节点匹配有对应的初始信息编码;行为编码确定模块1804还用于将待推送用户的行为图网络中的节点的初始信息编码输入预先训练的信息嵌入网络模型,得到待推送用户在行为评价维度下的用户行为编码;预先训练的嵌入网络模型用于对待推送用户所在节点的邻居节点的目标信息编码进行聚合处理,并将聚合处理后的目标信息编码与待推送用户所在节点的初始信息编码进行拼接处理,得到待推送用户在行为评价维度下的用户行为编码;其中,待推送用户所在节点的邻居节点的目标信息编码根据对邻居节点的邻居节点的目标信息编码进行聚合处理,并将聚合处理后的目标信息编码与待推送用户所在节点的邻居节点的初始信息编码进行拼接处理得到。
在一个实施例中,推荐概率确定模块1808还用于将目标编码输入预先训练的内容推荐模型中,通过预先训练的内容推荐模型对目标编码进行卷积池化处理,得到待推送内容的推荐概率。
在一个实施例中,内容处理装置1800具体还包括:模型训练模块。
模型训练模块,用于获取样本用户在行为评价维度下的数据、样本用户画像信息、样本推送内容和样本推送内容的实际推荐概率;分别将样本用户画像信息和样本推送内容输入至待训练的内容推荐模型中的特征提取网络,得到样本用户画像信息对应的样本用户画像编码和样本推送内容对应的样本推送内容编码;将样本用户在行为评价维度下的数据输入至待训练的信息嵌入网络模型,得到样本用户在行为评价维度下的样本用户行为编码;将样本推送内容编码、样本用户行为编码以及样本用户画像编码进行融合处理,得到样本目标编码;将样本目标编码输入至待训练的内容推荐模型中的内容预测网络,得到样本推送内容的预测推荐概率;根据预测推荐概率以及实际推荐概率计算损失值;根据损失值调整待训练的信息嵌入网络模型以及待训练的内容推荐模型的网络参数,直至达到训练结束条件;若达到训练结束条件,将当前的内容推荐模型,作为预先训练的内容推荐模型;并将当前的信息嵌入网络模型,作为预先训练的信息嵌入网络模型。
在一个实施例中,推送内容确定模块1810还用于将推荐概率大于预设阈值的待推送内容,确定为与待推送用户对应的推送内容。
在一个实施例中,目标编码确定模块1806还用于分别获取待推送内容编码、用户行为编码和用户画像编码对应的预设权重;分别根据预设权重,对待推送内容编码、用户行为编码和用户画像编码进行加权处理,得到处理后的待推送内容编码、处理后的用户行为编码和处理后的用户画像编码;将处理后的待推送内容编码与处理后的用户行为编码、处理后的用户画像编码进行融合处理,得到目标编码。
在一个实施例中,待推送用户在行为评价维度下的数据为当前时间段内待推送用户在行为评价维度下的数据;内容处理装置1800具体还包括:第一数据获取模块;
第一数据获取模块,用于获取下一时间段内待推送用户在行为评价维度下的数据。
在一个实施例中,行为编码确定模块1804还用于根据下一时间段内待推送用户在行为评价维度下的数据,对当前时间段内待推送用户在行为评价维度下的数据进行更新,得到更新后的数据;根据更新后的数据,更新待推送用户在行为评价维度下的用户行为编码。
在一个实施例中,本申请提供的内容处理装置可以实现为一种计算机程序的形式,计算机程序可在如图2所示的计算机设备上运行。计算机设备的存储器中可存储组成该内容处理装置的各个程序模块,比如,图18所示的数据获取模块1802、行为编码确定模块1804、目标编码确定模块1806、推荐概率确定模块1808和推送内容确定模块1810。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的内容处理方法中的步骤。
例如,图2所示的计算机设备可以通过如图18所示的内容处理装置中的数据获取模块1802获取待推送用户在行为评价维度下的数据,以及待推送用户的用户画像信息和待推送内容;用户画像信息匹配有对应的用户画像编码,待推送内容匹配有对应的待推送内容编码。计算机设备可通过行为编码确定模块1804根据待推送用户在行为评价维度下的数据,确定待推送用户在行为评价维度下的用户行为编码。计算机设备可通过目标编码确定模块1806将待推送内容编码与用户行为编码、用户画像编码进行融合处理,得到目标编码。计算机设备可通过推荐概率确定模块1808根据目标编码,确定待推送内容的推荐概率,并通过推送内容确定模块1810根据推荐概率,从待推送内容中确定出与待推送用户对应的推送内容。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述内容处理方法的步骤。此处内容处理方法的步骤可以是上述各个实施例的内容处理方法中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述内容处理方法的步骤。此处内容处理方法的步骤可以是上述各个实施例的内容处理方法中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
1.一种内容处理方法,包括:
获取待推送用户在行为评价维度下的数据,以及所述待推送用户的用户画像信息和待推送内容;所述用户画像信息匹配有对应的用户画像编码,所述待推送内容匹配有对应的待推送内容编码;
根据所述待推送用户在行为评价维度下的数据,确定所述待推送用户在所述行为评价维度下的用户行为编码;
将所述待推送内容编码与所述用户行为编码、所述用户画像编码进行融合处理,得到目标编码;
根据所述目标编码,确定所述待推送内容的推荐概率;
根据所述推荐概率,从所述待推送内容中确定出与所述待推送用户对应的推送内容。
2.根据权利要求1所述的方法,其特征在于,所述获取待推送用户在行为评价维度下的数据,包括:
采集预设时间段内所述待推送用户对推送内容的操作数据、所述待推送用户与所述推送内容的发布对象的关联数据和所述发布对象对所述推送内容的操作数据;
根据所述预设时间段内所述待推送用户对推送内容的操作数据、所述待推送用户与所述推送内容的发布对象的关联数据和所述发布对象对所述推送内容的操作数据,获取所述预设时间段内所述待推送用户在行为评价维度下的数据。
3.根据权利要求2所述的方法,其特征在于,所述行为评价维度包括第一行为评价维度、第二行为评价维度以及第三行为评价维度;
所述根据所述预设时间段内所述待推送用户对推送内容的操作数据、所述待推送用户与所述推送内容的发布对象的关联数据和所述发布对象对所述推送内容的操作数据,获取所述预设时间段内所述待推送用户在行为评价维度下的数据,包括:
根据所述预设时间段内所述待推送用户对推送内容的操作数据,得到所述待推送用户与所述推送内容之间的关系,作为所述待推送用户在所述第一行为评价维度下的数据;
根据所述预设时间段内所述待推送用户与所述推送内容的发布对象的关联数据,得到所述待推送用户与所述发布对象之间的关系,作为所述待推送用户在所述第二行为评价维度下的数据;
根据所述预设时间段内所述发布对象对所述推送内容的操作数据,得到所述发布对象与所述推送内容之间的关系,作为所述待推送用户在所述第三行为评价维度下的数据。
4.根据权利要求1所述的方法,其特征在于,所述待推送用户在行为评价维度下的数据包括数据对象以及所述数据对象之间的数据关系;
所述根据所述待推送用户在行为评价维度下的数据,确定所述待推送用户在所述行为评价维度下的用户行为编码,包括:
以所述数据对象作为节点,以所述数据关系作为所述节点之间的边,构建所述待推送用户的行为图网络;
根据所述待推送用户的行为图网络,确定所述待推送用户在所述行为评价维度下的用户行为编码。
5.根据权利要求4所述的方法,其特征在于,所述行为图网络中的所述节点匹配有对应的初始信息编码;
所述根据所述待推送用户的行为图网络,确定所述待推送用户在所述行为评价维度下的用户行为编码,包括:
将所述待推送用户的行为图网络中的所述节点的初始信息编码输入预先训练的信息嵌入网络模型,得到所述待推送用户在所述行为评价维度下的用户行为编码;所述预先训练的嵌入网络模型用于对所述待推送用户所在节点的邻居节点的目标信息编码进行聚合处理,并将聚合处理后的目标信息编码与所述待推送用户所在节点的初始信息编码进行拼接处理,得到所述待推送用户在所述行为评价维度下的用户行为编码;
其中,所述待推送用户所在节点的邻居节点的目标信息编码根据对所述邻居节点的邻居节点的目标信息编码进行聚合处理,并将聚合处理后的目标信息编码与所述待推送用户所在节点的邻居节点的初始信息编码进行拼接处理得到。
6.根据权利要求5所述的方法,其特征在于,所述根据所述目标编码,确定所述待推送内容的推荐概率,包括:
将所述目标编码输入预先训练的内容推荐模型中,通过所述预先训练的内容推荐模型对所述目标编码进行卷积池化处理,得到所述待推送内容的推荐概率。
7.根据权利要求6所述的方法,其特征在于,所述预先训练的信息嵌入网络模型以及所述预先训练的内容推荐模型通过下述方式训练得到:
获取样本用户在所述行为评价维度下的数据、样本用户画像信息、样本推送内容和所述样本推送内容的实际推荐概率;
分别将所述样本用户画像信息和所述样本推送内容输入至待训练的内容推荐模型中的特征提取网络,得到所述样本用户画像信息对应的样本用户画像编码和所述样本推送内容对应的样本推送内容编码;
将所述样本用户在所述行为评价维度下的数据输入至待训练的信息嵌入网络模型,得到所述样本用户在所述行为评价维度下的样本用户行为编码;
将所述样本推送内容编码、所述样本用户行为编码以及所述样本用户画像编码进行融合处理,得到样本目标编码;
将所述样本目标编码输入至所述待训练的内容推荐模型中的内容预测网络,得到所述样本推送内容的预测推荐概率;
根据所述预测推荐概率以及所述实际推荐概率计算损失值;
根据所述损失值调整所述待训练的信息嵌入网络模型以及所述待训练的内容推荐模型的网络参数,直至达到训练结束条件;
若达到所述训练结束条件,将当前的内容推荐模型,作为所述预先训练的内容推荐模型;并将当前的信息嵌入网络模型,作为所述预先训练的信息嵌入网络模型。
8.根据权利要求1所述的方法,其特征在于,所述根据所述推荐概率,从所述待推送内容中确定出与所述待推送用户对应的推送内容,包括:
将所述推荐概率大于预设阈值的待推送内容,确定为与所述待推送用户对应的推送内容。
9.根据权利要求1所述的方法,其特征在于,所述将所述待推送内容编码与所述用户行为编码、所述用户画像编码进行融合处理,得到目标编码,包括:
分别获取所述待推送内容编码、所述用户行为编码和所述用户画像编码对应的预设权重;
分别根据所述预设权重,对所述待推送内容编码、所述用户行为编码和所述用户画像编码进行加权处理,得到处理后的待推送内容编码、处理后的用户行为编码和处理后的用户画像编码;
将所述处理后的待推送内容编码与所述处理后的用户行为编码、所述处理后的用户画像编码进行融合处理,得到目标编码。
10.根据所述权利要求1至9任一项所述的方法,其特征在于,所述待推送用户在所述行为评价维度下的数据为当前时间段内所述待推送用户在所述行为评价维度下的数据,所述方法还包括:
获取下一时间段内所述待推送用户在所述行为评价维度下的数据;
所述根据所述待推送用户在行为评价维度下的数据,确定所述待推送用户在所述行为评价维度下的用户行为编码,包括:
根据所述下一时间段内所述待推送用户在所述行为评价维度下的数据,对所述当前时间段内所述待推送用户在行为评价维度下的数据进行更新,得到更新后的数据;
根据所述更新后的数据,更新所述待推送用户在所述行为评价维度下的用户行为编码。
11.一种内容处理装置,其特征在于,所述装置包括:
数据获取模块,用于获取待推送用户在行为评价维度下的数据,以及所述待推送用户的用户画像信息和待推送内容;所述用户画像信息匹配有对应的用户画像编码,所述待推送内容匹配有对应的待推送内容编码;
行为编码确定模块,用于根据所述待推送用户在行为评价维度下的数据,确定所述待推送用户在所述行为评价维度下的用户行为编码;
目标编码确定模块,用于将所述待推送内容编码与所述用户行为编码、所述用户画像编码进行融合处理,得到目标编码;
推荐概率确定模块,用于根据所述目标编码,确定所述待推送内容的推荐概率;
推送内容确定模块,用于根据所述推荐概率,从所述待推送内容中确定出与所述待推送用户对应的推送内容。
12.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至10中任一项所述方法的步骤。
13.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至10中任一项所述方法的步骤。
技术总结