推荐模型的构建系统及方法与流程

专利2022-06-30  98


本发明涉及网络通信技术领域,尤其涉及一种推荐模型的构建系统及方法。



背景技术:

随着计算机技术和网络通信技术的发展,在线娱乐和消费等活动变得越来越普遍,减少用户花费在自己不感兴趣的事情上的时间,提高用户获取感兴趣的信息的概率成为越来越多的互联网行业着重的研究方向。在这一现实背景下,越来越多的互联网企业已经开始引入推荐模型向自己的用户精准推送信息。传统的协同过滤算法,由于数据稀疏、冷启动等问题,推荐精度也不够理想,已不能满足现阶段的用户需求。虽有部分技术人员提出了一些提高协同过滤算法的适用性的方法,但随着大数据时代的到来,用户数据和内容数据急剧增长,特征提取和相识度搜索越来越复杂,现有推荐系统已不能满足精准推荐用户所需内容的需求,在模型优化方面也存在需要手工调优的缺陷,因此如何提高推荐模型的精准度以精准推荐用户所需内容,成为一个亟待解决的问题。

上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。



技术实现要素:

本发明的主要目的在于提供了一种推荐模型的构建系统及方法,旨在解决现有推荐系统精准度不高导致的无法向用户精准推荐所需内容的技术问题。

为实现上述目的,本发明提供了一种推荐模型的构建系统,所述系统包括:

数据获取模块,用于获取用户内容数据和用户属性数据,根据所述用户内容数据和所述用户属性数据构建初始数据集;

模型构建模块,用于对所述初始数据集进行预处理,获得目标数据集,并将所述目标数据集输入至预设机器学习平台进行模型构建;

模型优化模块,用于获取所述预设机器学习平台输出的初始推荐模型,并通过预设优化算法对所述初始推荐模型进行参数优化,获得目标推荐模型。

所述模型构建模块,还用于对所述初始数据集进行数据清洗,以获得目标数据集;

所述模型构建模块,还用于将所述目标数据集输入至预设机器学习平台进行模型构建。

所述模型构建模块,还用于基于所述目标数据集构建初始矩阵,并通过预设变换算法将所述初始矩阵变换为特征矩阵;

所述模型构建模块,还用于将所述特征矩阵输入至预设机器学习平台进行模型构建。

所述模型构建模块,还用于从所述目标数据集中读取各用户内容数据对应的用户评分,以及对各用户内容数据进行评分的用户数量;

所述模型构建模块,还用于根据所述用户评分以及所述用户数量构建初始矩阵;

所述模型构建模块,还用于根据所述用户数量通过第一预设公式对所述初始矩阵中的所述用户评分进行转换,获得各用户内容数据对应的特征评分;

所述模型构建模块,还用于根据所述特征评分构建特征矩阵;

其中,所述第一预设公式为,

式中,ti为用户内容数据对应的用户评分,m为对用户内容数据进行评分的用户数量,n(i)为用户内容数据对应的特征评分。

所述模型优化模块,还用于获取所述预设机器学习平台输出的初始推荐模型,通过预设adam算法对所述初始推荐模型中的待优化参数进行优化,获得目标推荐模型,其中,所述待优化参数为各用户数据对应的用户评分预估值。

所述模型优化模块,还用于基于所述用户评分预估值构建模拟矩阵;

所述模型优化模块,还用于通过所述用户评分和所述用户数量计算平均评分;

所述模型优化模块,还用于根据所述模拟矩阵、所述模拟矩阵对应的转置矩阵及所述平均评分获得评分预估表。

所述模型优化模块,还用于从所述目标数据集中提取各用户内容数据对应的实际用户评分;

所述模型优化模块,还用于根据所述实际用户评分和所述用户评分预估值通过平均绝对误差算法计算所述用户评分预估值的误差值;

所述模型优化模块,还用于在所述误差值大于预设误差值时,将所述目标推荐模型通过所述预设优化算法进行参数优化,获得优化推荐模型。

此外,为实现上述目的,本发明还提出一种推荐模型的构建方法,其特征在于,所述方法包括以下步骤:

获取用户内容数据和用户属性数据,根据所述用户内容数据和所述用户属性数据构建初始数据集;

对所述初始数据集进行预处理,获得目标数据集,并将所述目标数据集输入至预设机器学习平台进行模型构建;

获取所述预设机器学习平台输出的初始推荐模型,并通过预设优化算法对所述初始推荐模型进行参数优化,获得目标推荐模型。

优选地,所述对所述初始数据集进行预处理,获得目标数据集,并将所述目标数据集输入至预设机器学习平台进行模型构建的步骤,具体包括:

对所述初始数据集进行数据清洗,以获得目标数据集;

从所述目标数据集中读取各用户内容数据对应的用户评分,以及对各用户内容数据进行评分的用户数量;

根据所述用户评分以及所述用户数量构建初始矩阵;

根据所述用户数量通过第一预设公式对所述初始矩阵中的所述用户评分进行转换,获得各用户内容数据对应的特征评分;

根据所述特征评分构建特征矩阵;

将所述特征矩阵输入至预设机器学习平台进行模型构建;

其中,所述第一预设公式为,

式中,ti为用户内容数据对应的用户评分,m为对用户内容数据进行评分的用户数量,n(i)为用户内容数据对应的特征评分。

优选地,所述获取所述预设机器学习平台输出的初始推荐模型,并通过预设优化算法对所述初始推荐模型进行参数优化,获得目标推荐模型的步骤,具体包括:

获取所述预设机器学习平台输出的初始推荐模型,通过预设adam算法对所述初始推荐模型中的待优化参数进行优化,获得目标推荐模型,其中,所述待优化参数为各用户数据对应的用户评分预估值。

本发明提出的推荐模型的构建系统,通过数据获取模块,用于获取用户内容数据和用户属性数据,根据所述用户内容数据和所述用户属性数据构建初始数据集;模型构建模块,用于对所述初始数据集进行预处理,获得目标数据集,并将所述目标数据集输入至预设机器学习平台进行模型构建;模型优化模块,用于获取所述预设机器学习平台输出的初始推荐模型,并通过预设优化算法对所述初始推荐模型进行参数优化,获得目标推荐模型。通过预设优化算法对获得的初始推荐模型进行参数优化,实现了精准推荐用户所需内容的目的,降低了程序编写的复杂度,减少了推荐构建过程中的资源消耗和模型调优过程中的工作量。

附图说明

图1为本发明实施例方案涉及的推荐模型的构建系统的结构示意图;

图2为本发明推荐模型的构建方法第一实施例的流程示意图。

图3为本发明推荐模型的构建方法第二实施例的流程示意图。

图4为本发明推荐模型的构建方法第三实施例的流程示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。

参照图1,图1为本发明实施例方案涉及的推荐模型的构建系统的结构示意图。

如图1所示,该推荐模型的构建系统可以包括:数据获取模块10,模型构建模块20,模型优化模块30。

本领域技术人员可以理解,图1中示出的结构并不构成对推荐模型的构建系统的结构限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

其中,所述数据获取模块10,用于获取用户内容数据和用户属性数据,根据所述用户内容数据和所述用户属性数据构建初始数据集;

易于理解的是,本发明实施例的执行主体为中央处理器,中央处理器控制所述数据获取模块10,所述模型构建模块20,所述模型优化模块30执行对应的模块内容,所述数据获取模块10用于获取用户内容数据和用户属性数据,根据所述用户内容数据和所述用户属性数据构建初始数据集,所述用户内容数据可为用户的浏览记录、用户的行为发生时间、用户的行为持续时间等,所述用户属性数据可为用户的年龄、性别、登录地点、登录设备等,再根据所述用户内容数据和所述用户属性数据构建初始数据集。

应当理解的是,以上仅为举例说明,对本发明的技术方案并不构成任何限定,在具体应用中,本领域的技术人员可以根据需要进行设置,本发明对此不做限制。

所述模型构建模块20,用于对所述初始数据集进行预处理,获得目标数据集,并将所述目标数据集输入至预设机器学习平台进行模型构建;

需要说明的是,所述预处理可以是数据清洗,所述数据清洗可以是对所述初始数据集进行一致性检查,剔除所述预设数据集中不符合预设格式要求(不同的用户数据对应的不同的格式,每种用户数据都会预先设置对应的格式要求)、超出预设阈值范围(每种用户数据都会有对应的阈值范围,可以是取值范围、长度范围等)及不符合程序逻辑关系(所述数据清洗基于预设程序,因此出现不符合程序逻辑关系的数据时,除了剔除所述不符合逻辑关系的数据外,还应发出相应的提示信息)的数据,也可以是检查所述初始数据集中是否存在无效数据或缺失数据,在存在所述无效数据或所述缺失数据时,剔除所述无效数据或所述缺失数据,以获得目标数据集,即所述模型构建模块20,可以用于对所述初始数据集进行数据清洗,以获得目标数据集。

具体实现中,所述模型构建模块20还可以基于所述目标数据集构建初始矩阵,并通过预设变换算法将所述初始矩阵变换为特征矩阵,再将所述特征矩阵输入至预设机器学习平台进行模型构建。具体地,所述模型构建模块20从所述目标数据集中读取各用户内容数据对应的用户评分(所述评分不仅限于用户对具体用户内容数据所给出的评分,还包括根据用户内容数据所计算出的隐式用户评分,所述计算方法可以为根据用户内容数据的种类设定不同的权重再综合计算具体内容数据的所得评分等),以及对各用户内容数据进行评分的用户数量,并根据所述用户评分以及所述用户数量构建初始矩阵,再根据所述用户数量通过第一预设公式对所述初始矩阵中的所述用户评分进行转换,获得各用户内容数据对应的特征评分,并根据所述特征评分构建特征矩阵。

其中,所述第一预设公式为,

式中,ti为用户内容数据对应的用户评分,m为对用户内容数据进行评分的用户数量,n(i)为用户内容数据对应的特征评分。

通过上述公式将初始矩阵中的所述用户评分进行转换,获得用户内容数据对应的特征评分,基于所述特征评分构建特征矩阵,再将所述特征矩阵输入至预设机器学习平台进行模型构建,根据所述特征矩阵可以得到获得用户对目标用户内容数据的评分与所述用户内容数据获得的平均评分之间的偏差,由此可以根据所述偏差对所述模型作进一步优化。

应当理解的是,以上仅为举例说明,对本发明的技术方案并不构成任何限定,在具体应用中,本领域的技术人员可以根据需要进行设置,本发明对此不做限制。

所述模型优化模块30,用于获取所述预设机器学习平台输出的初始推荐模型,并通过预设优化算法对所述初始推荐模型进行参数优化,获得目标推荐模型。

需要说明的是,所述预设优化算法可以是预设adam算法,所述算法基于adam算法,并融合了对现有协同过滤算法的改进,以实现对预设机器学习平台输出的初始推荐模型中的待优化参数的优化,获得目标推荐模型,所述待优化参数可以为各用户数据对应的用户评分预估值,所述预设机器学习平台可以为tensorflow(采用数据流图来进行数值计算的开源软件库)。

具体实现中,在获取所述初始推荐模型时,还需从所述目标数据集中获取用户对所述用户内容数据的评分、对所述用户内容数据给出评分的用户数量、用户的用户属性数据、目标用户对目标用户内容数据的评分、与所述目标用户内容数据相匹配的用户内容数据(初始推荐模型中会预设一个用户内容数据的映射关系表,在对不同的用户内容数据进行计算时,会调用其相匹配的用户内容数据)、所述目标用户内容数据对应的维度(所述维度可以是所述目标内容数据对应的参数的种类个数)、目标用户内容数据对应的系数(所述系数可以是根据所述目标内容数据的种类所设定的权重值,所诉权重值可以根据所述用户内容数据对应的特征评分作相应调整),并通过预设adam算法对初始推荐模型中的待优化参数的优化,以获得目标推荐模型。

其中,所述预设优化算法对应的公式为:

式中,j(θ)为用户对用户内容数据的评分预估值,r(i,j)为用户对所述用户内容数据的评分,u为对所述用户内容数据给出评分的用户数量,θ(j)是用户的用户属性数据,y(i,j)是目标用户对目标用户内容数据的评分,xi为与所述目标用户内容数据相匹配的用户内容数据,λ为所述目标用户内容数据对应的系数,n为所述目标用户内容数据对应的维度。

需要说明的是,所述模型优化模块30,还可在获取用户对用户内容数据的评分预估值时,基于所述评分预估值构建模拟矩阵,并根据用户对所述用户内容数据的评分和对所述用户内容数据给出评分的用户数量计算平均评分,再结合所述模拟矩阵、所述模拟矩阵对应的转置矩阵及所述平均评分获得评分预估表,所述评分预估表即为评分预估值的集合。

易于理解的是,所述模型优化模块30,还可在根据所述实际用户评分和所述用户评分预估值通过平均绝对误差算法计算所述用户评分预估值的误差值,并在所述误差值大于预设误差值时,将所述目标推荐模型通过所述预设优化算法进行参数优化,获得优化推荐模型,以实现对目标推荐的模型持续优化,并进一步地提高推荐精准度。

应当理解的是,以上仅为举例说明,对本发明的技术方案并不构成任何限定,在具体应用中,本领域的技术人员可以根据需要进行设置,本发明对此不做限制。

本发明实施例提出的推荐模型的构建系统,通过数据获取模块,用于获取用户内容数据和用户属性数据,根据所述用户内容数据和所述用户属性数据构建初始数据集;模型构建模块,用于对所述初始数据集进行预处理,获得目标数据集,并将所述目标数据集输入至预设机器学习平台进行模型构建;模型优化模块,用于获取所述预设机器学习平台输出的初始推荐模型,并通过预设优化算法对所述初始推荐模型进行参数优化,获得目标推荐模型。通过目标数据集中对用户的偏好数据提取,解决了冷启动的问题,通过预设优化算法对获得的初始推荐模型进行参数优化,实现了精准推荐用户所需内容的目的,降低了程序编写的复杂度,减少了推荐构建过程中的资源消耗和模型调优过程中的工作量。通过平均绝对误差法引入误差值的计算,不仅可以将推荐模型的效果数据可视化,还可将所述推荐模型持续优化至预设误差范围内,以达到精准推荐用户需求的目的。

基于上述推荐模型的构建系统,本发明实施例提供了一种推荐模型的构建方法,参照图2,图2为本发明推荐模型的构建方法第一实施例的流程示意图。

本实施例中,所述推荐模型的构建方法包括以下步骤:

步骤s10:获取用户内容数据和用户属性数据,根据所述用户内容数据和所述用户属性数据构建初始数据集;

步骤s20:对所述初始数据集进行预处理,获得目标数据集,并将所述目标数据集输入至预设机器学习平台进行模型构建;

步骤s30:获取所述预设机器学习平台输出的初始推荐模型,并通过预设优化算法对所述初始推荐模型进行参数优化,获得目标推荐模型。

本发明实施例提出的推荐模型的构建方法,通过获取用户内容数据和用户属性数据,根据所述用户内容数据和所述用户属性数据构建初始数据集;对所述初始数据集进行预处理,获得目标数据集,并将所述目标数据集输入至预设机器学习平台进行模型构建,获取所述预设机器学习平台输出的初始推荐模型,并通过预设优化算法对所述初始推荐模型进行参数优化,获得目标推荐模型。通过目标数据集中对用户的偏好数据提取,解决了冷启动的问题,通过预设优化算法对获得的初始推荐模型进行参数优化,实现了精准推荐用户所需内容的目的,降低了程序编写的复杂度,减少了推荐构建过程中的资源消耗和模型调优过程中的工作量。

参考图3,图3为本发明推荐模型的构建方法第二实施例的流程示意图。

基于上述第一实施例,在本实施例中,所述步骤s20包括:

s201:对所述初始数据集进行数据清洗,以获得目标数据集;

s202:从所述目标数据集中读取各用户内容数据对应的用户评分,以及对各用户内容数据进行评分的用户数量;

s203:根据所述用户评分以及所述用户数量构建初始矩阵;

s204:根据所述用户数量通过第一预设公式对所述初始矩阵中的所述用户评分进行转换,获得各用户内容数据对应的特征评分;

s205:根据所述特征评分构建特征矩阵;

其中,所述第一预设公式为,

式中,ti为用户内容数据对应的用户评分,m为对用户内容数据进行评分的用户数量,n(i)为用户内容数据对应的特征评分。

s206:将所述特征矩阵输入至预设机器学习平台进行模型构建。

参考图4,图4为本发明推荐模型的构建方法第三实施例的流程示意图。

基于上述各实施例,在本实施例中,所述步骤s30,具体包括:

s301:获取所述预设机器学习平台输出的初始推荐模型,通过预设adam算法对所述初始推荐模型中的待优化参数进行优化,获得目标推荐模型,其中,所述待优化参数为各用户数据对应的用户评分预估值。

所述步骤s30之后,所述方法还包括:

s401:基于所述用户评分预估值构建模拟矩阵;

s402:通过所述用户评分和所述用户数量计算平均评分;

s403:根据所述模拟矩阵、所述模拟矩阵对应的转置矩阵及所述平均评分获得评分预估表。

所述步骤s30之后,所述方法还包括:

s501:从所述目标数据集中提取各用户内容数据对应的实际用户评分;

s502:根据所述实际用户评分和所述用户评分预估值通过平均绝对误差算法计算所述用户评分预估值的误差值;

s503:在所述误差值大于预设误差值时,将所述目标推荐模型通过所述预设优化算法进行参数优化,获得优化推荐模型。

本发明推荐模型的构建方法的其他实施例或具体实现方式可参照上述各系统实施例,此处不再赘述。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器/随机存取存储器、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。


技术特征:

1.一种推荐模型的构建系统,其特征在于,所述系统包括:

数据获取模块,用于获取用户内容数据和用户属性数据,根据所述用户内容数据和所述用户属性数据构建初始数据集;

模型构建模块,用于对所述初始数据集进行预处理,获得目标数据集,并将所述目标数据集输入至预设机器学习平台进行模型构建;

模型优化模块,用于获取所述预设机器学习平台输出的初始推荐模型,并通过预设优化算法对所述初始推荐模型进行参数优化,获得目标推荐模型。

2.如权利要求1所述的系统,其特征在于,所述模型构建模块,还用于对所述初始数据集进行数据清洗,以获得目标数据集;

所述模型构建模块,还用于将所述目标数据集输入至预设机器学习平台进行模型构建。

3.如权利要求2所述的系统,其特征在于,所述模型构建模块,还用于基于所述目标数据集构建初始矩阵,并通过预设变换算法将所述初始矩阵变换为特征矩阵;

所述模型构建模块,还用于将所述特征矩阵输入至预设机器学习平台进行模型构建。

4.如权利要求3所述的系统,其特征在于,所述模型构建模块,还用于从所述目标数据集中读取各用户内容数据对应的用户评分,以及对各用户内容数据进行评分的用户数量;

所述模型构建模块,还用于根据所述用户评分以及所述用户数量构建初始矩阵;

所述模型构建模块,还用于根据所述用户数量通过第一预设公式对所述初始矩阵中的所述用户评分进行转换,获得各用户内容数据对应的特征评分;

所述模型构建模块,还用于根据所述特征评分构建特征矩阵;

其中,所述第一预设公式为,

式中,ti为用户内容数据对应的用户评分,m为对用户内容数据进行评分的用户数量,n(i)为用户内容数据对应的特征评分。

5.如权利要求4所述的系统,其特征在于,所述模型优化模块,还用于获取所述预设机器学习平台输出的初始推荐模型,通过预设adam算法对所述初始推荐模型中的待优化参数进行优化,获得目标推荐模型,其中,所述待优化参数为各用户数据对应的用户评分预估值。

6.如权利要求5所述的系统,其特征在于,所述模型优化模块,还用于基于所述用户评分预估值构建模拟矩阵;

所述模型优化模块,还用于通过所述用户评分和所述用户数量计算平均评分;

所述模型优化模块,还用于根据所述模拟矩阵、所述模拟矩阵对应的转置矩阵及所述平均评分获得评分预估表。

7.如权利要求5所述的系统,其特征在于,所述模型优化模块,还用于从所述目标数据集中提取各用户内容数据对应的实际用户评分;

所述模型优化模块,还用于根据所述实际用户评分和所述用户评分预估值通过平均绝对误差算法计算所述用户评分预估值的误差值;

所述模型优化模块,还用于在所述误差值大于预设误差值时,将所述目标推荐模型通过所述预设优化算法进行参数优化,获得优化推荐模型。

8.一种推荐模型的构建方法,其特征在于,所述方法包括以下步骤:

获取用户内容数据和用户属性数据,根据所述用户内容数据和所述用户属性数据构建初始数据集;

对所述初始数据集进行预处理,获得目标数据集,并将所述目标数据集输入至预设机器学习平台进行模型构建;

获取所述预设机器学习平台输出的初始推荐模型,并通过预设优化算法对所述初始推荐模型进行参数优化,获得目标推荐模型。

9.如权利要求8所述方法,其特征在于,所述对所述初始数据集进行预处理,获得目标数据集,并将所述目标数据集输入至预设机器学习平台进行模型构建的步骤,具体包括:

对所述初始数据集进行数据清洗,以获得目标数据集;

从所述目标数据集中读取各用户内容数据对应的用户评分,以及对各用户内容数据进行评分的用户数量;

根据所述用户评分以及所述用户数量构建初始矩阵;

根据所述用户数量通过第一预设公式对所述初始矩阵中的所述用户评分进行转换,获得各用户内容数据对应的特征评分;

根据所述特征评分构建特征矩阵;

将所述特征矩阵输入至预设机器学习平台进行模型构建;

其中,所述第一预设公式为,

式中,ti为用户内容数据对应的用户评分,m为对用户内容数据进行评分的用户数量,n(i)为用户内容数据对应的特征评分。

10.如权利要求9所述的方法,其特征在于,所述获取所述预设机器学习平台输出的初始推荐模型,并通过预设优化算法对所述初始推荐模型进行参数优化,获得目标推荐模型的步骤,具体包括:

获取所述预设机器学习平台输出的初始推荐模型,通过预设adam算法对所述初始推荐模型中的待优化参数进行优化,获得目标推荐模型,其中,所述待优化参数为各用户数据对应的用户评分预估值。

技术总结
本发明涉及网络通信技术领域,公开了一种推荐模型的构建系统及方法,所述系统包括:数据获取模块,用于获取用户内容数据和用户属性数据,根据所述用户内容数据和所述用户属性数据构建初始数据集;模型构建模块,用于对所述初始数据集进行预处理,获得目标数据集,并将所述目标数据集输入至预设机器学习平台进行模型构建;模型优化模块,用于获取所述预设机器学习平台输出的初始推荐模型,并通过预设优化算法对所述初始推荐模型进行参数优化,获得目标推荐模型。通过预设优化算法对获得的初始推荐模型进行参数优化,实现了精准推荐用户所需内容的目的,降低了程序编写的复杂度,减少了推荐构建过程中的资源消耗和模型调优过程中的工作量。

技术研发人员:张聪;樊翔宇;陈方;曹文琪;张俊杰;刘宇
受保护的技术使用者:武汉轻工大学
技术研发日:2020.01.21
技术公布日:2020.06.05

转载请注明原文地址: https://bbs.8miu.com/read-56766.html

最新回复(0)