本发明涉及推荐系统技术领域,具体涉及一种基于个性化召回的推荐系统优化方法。
背景技术:
随着互联网技术的不断发展,数据时代的到来,数据信息越积越累,“信息过载”的现象就会导致人们在大量的信息中寻找自己可能感兴趣的信息变得非常艰难。然而,推荐系统的出现就是为了解决这种“信息过载”的问题,它会主动帮助用户在大量的信息中发现他们感兴趣的信息,也会主动的将信息推送给对它们感兴趣的用户。
不论是在工业界还是在科研界,推荐系统的发展已越来越成熟。目前,工业界中绝大多数的推荐系统都是分为两阶段模式:召回阶段和排序阶段。在召回阶段,大多数都是采用多路召回策略,每一路召回topk的数量对每个用户都是相同的。一般来说,不同的用户对每一路召回策略感兴趣程度是不一样的,因此这会导致每个用户召回得到的物品完全相同,不能突出其个性化,尤其是在时效性特别强的新闻推荐领域更突显。
如图1所示,以往两阶段推荐系统召回阶段中每个用户在每一路召回都是召回固定数量的物品,导致每个用户在召回阶段召回的物品完全相同,从而很难体现出不同用户的兴趣偏好,影响推荐系统的准确性及用户感知。
本发明提出了一种基于个性化召回的推荐系统优化方法,能够更加精确的获取用户兴趣偏好,从而提高整个推荐系统的个性化以及准确性。
技术实现要素:
本发明所要解决的技术问题就是提供一种基于不断迭代的方式对推荐系统多路召回策略实现个性化的处理方法,通过一种优化迭代的思想,获取每个用户对不同召回策略的权重占比,然后按照每个用户的权重占比获取不同召回策略召回数,计算每个用户召回阶段的召回物品,接着进入排序阶段进行重排序预测。
本发明为解决上述技术问题采用以下技术方案
一种基于个性化召回的推荐系统优化方法,具体包括如下步骤:
步骤a:设定召回阶段召回物品的数量n,其中n>0,即推荐系统召回阶段候选集数量;
步骤b:设定召回阶段召回策略的数量n,其中n>0,即推荐系统召回阶段有多少路召回策略;
步骤c:设定相似度阈值δ,即物品与物品之间的相似度超过此阈值,表示物品较相似;
步骤d:设定召回阶段每个用户对每路召回的数量为k1,k2,...,kn,初始化值为ki=n/n,i=1,2...n;
步骤e:根据用户特征信息以及物品特征信息,通过词向量模型计算出每个物品的embedding向量,然后根据余弦相似度计算出所有物品与物品之间的相似度,形成物品相似度矩阵,其中,余弦相似度公式如下:
步骤f:根据召回阶段召回策略以及其召回数量ki,i=1,2,...,n,计算召回阶段每路召回策略召回的topki,i=1,2,...,n物品;
步骤g:根据用户行为数据、物品与物品相似度数据以及召回阶段每路策略召回的物品数据,计算出每个用户每路召回策略的权重占比β1,β2,...,βn,然后计算出每个用户对每路召回的数量k'i=n*βi,i=1,2,...,n;
步骤h:重复上述步骤e至步骤g,直到每个用户的每路召回策略召回数量不发生变化即止,得到每个用户每路召回策略最终召回数量
步骤i:针对每个用户在每路召回策略下的召回数量获取其
作为本发明一种基于个性化召回的推荐系统优化方法的进一步优选方案,所述步骤g,具体包含如下:
步骤g1:通过用户近一个月的行为数据获取每个用户点击的物品;
步骤g2:根据步骤g1获取的用户近一个月点击的物品,通过物品与物品相似度数据,匹配出用户近一个月点击的物品以及其相似度超过δ的相似物品,作为用户偏好的物品集;
步骤g3:根据步骤g2获取到的用户偏好物品与召回阶段每路召回策略召回的物品进行匹配,计算出每路召回策略中能够匹配到的物品数量为k1,k2,...,kn,占比情况
作为本发明一种基于个性化召回的推荐系统优化方法的进一步优选方案,在步骤c中,相似度阈值δ的取值范围为[0,1],参考经验值为0.8。
作为本发明一种基于个性化召回的推荐系统优化方法的进一步优选方案,在步骤e中,利用物品的词向量以及余弦相似度,计算物品与物品之间相似度。
作为本发明一种基于个性化召回的推荐系统优化方法的进一步优选方案,在步骤f中,通过不同召回策略以及召回数量获取每个用户每个召回策略的召回物品。
作为本发明一种基于个性化召回的推荐系统优化方法的进一步优选方案,在步骤h中,通过不断的重复迭代步骤e至步骤f,直到每个用户的每路召回策略召回数量不发生变化即止,得到每个用户每路召回策略最终召回数量
有益效果
本发明采用以上技术方案与现有技术相比,具有以下技术效果:
1、本发明所涉及一种基于个性化召回的推荐系统优化方法,采用的是针对推荐系统两阶段模式过程中召回阶段进行优化和改进,结合一种优化迭代的思想获取到不同用户在召回阶段多路召回策略下拥有不同的召回数量,以致于更加体现出不同用户的不同兴趣点。
2、为了更好的获取到用户在多路召回策略下拥有不同的召回数量以及用户感兴趣召回物品,通过对召回策略召回的物品与用户感兴趣的物品进行不断迭代计算用户偏好的召回策略权重,获取到针对不同用户的兴趣点分配不同的召回策略权重,从而达到不同用户在召回阶段多路召回策略下拥有不同的召回数量,实现召回阶段个性化。
附图说明
图1是传统的推荐系统多路召回策略示意图;
图2是本发明改进后的推荐系统多路召回策略示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提出了一种基于个性化召回的推荐系统优化方法。主要是针对传统的推荐系统两阶段模式中召回阶段进行优化和改进,从而实现召回阶段的个性化以及提高推荐系统的准确性。
如图2所示,具体步骤如下:
步骤a:设定召回阶段召回物品的数量n(n>0),即推荐系统召回阶段候选集数量;
步骤b:设定召回阶段召回策略的数量n(n>0),即推荐系统召回阶段有多少路召回策略;
步骤c:设定相似度阈值δ,即物品与物品之间的相似度超过此阈值,表示物品较相似;
步骤d:设定召回阶段每个用户对每路召回的数量为k1,k2,...,kn,初始化值为ki=n/n,i=1,2...n;
步骤e:根据用户特征信息以及物品特征信息,通过词向量模型计算出每个物品的embedding向量,然后根据余弦相似度计算出所有物品与物品之间的相似度,形成物品相似度矩阵,其中,余弦相似度公式如下:
步骤f:根据召回阶段召回策略以及其召回数量ki,i=1,2,...,n,计算召回阶段每路召回策略召回的topki,i=1,2,...,n物品;
步骤g:根据用户近一个月行为数据、物品与物品相似度数据以及召回阶段每路策略召回的物品数据,计算出每个用户每路召回策略的权重占比β1,β2,...,βn,然后计算出每个用户对每路召回的数量k'i=n*βi,i=1,2,...,n;
上述步骤g包括如下步骤g1至g3:
步骤g1:通过用户近一个月的行为数据(选取“近一个月”是为了获取用户最近的偏好作为指标)获取每个用户点击的物品;
步骤g2:根据步骤g1获取的用户近一个月点击的物品,通过物品与物品相似度数据,匹配出用户近一个月点击的物品以及其相似度超过δ的相似物品,作为用户偏好的物品集;
步骤g3:根据步骤g2获取到的用户偏好物品与召回阶段每路召回策略召回的物品进行匹配,计算出每路召回策略中能够匹配到的物品数量为k1,k2,...,kn,占比情况
步骤h:重复上述步骤e至步骤g,直到每个用户的每路召回策略召回数量不发生变化即止,得到每个用户每路召回策略最终召回数量
步骤i:针对每个用户在每路召回策略下的召回数量获取其
上述技术方案所涉及的一种基于个性化召回的推荐系统及实现方法,采用的是针对推荐系统两阶段模式过程中召回阶段进行优化和改进,结合一种优化迭代的思想获取到不同用户在召回阶段多路召回策略下拥有不同的召回数量,以致于更加体现出不同用户的不同兴趣点。其中,为了更好的获取到用户在多路召回策略下拥有不同的召回数量以及用户感兴趣召回物品,通过对召回策略召回的物品与用户感兴趣的物品进行不断迭代计算用户偏好的召回策略权重,获取到针对不同用户的兴趣点分配不同的召回策略权重,从而达到不同用户在召回阶段多路召回策略下拥有不同的召回数量,实现召回阶段个性化。
本发明并不限于上述实施方式,在本发明领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。
本技术领域技术人员可以理解的是,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
以上实施例仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明保护范围之内。上面对本发明的实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。
1.一种基于个性化召回的推荐系统优化方法,其特征在于,具体包括如下步骤:
步骤a:设定召回阶段召回物品的数量n,其中n>0,即推荐系统召回阶段候选集数量;
步骤b:设定召回阶段召回策略的数量n,其中n>0,即推荐系统召回阶段有多少路召回策略;
步骤c:设定相似度阈值δ,即物品与物品之间的相似度超过此阈值,表示物品较相似;
步骤d:设定召回阶段每个用户对每路召回的数量为k1,k2,...,kn,初始化值为ki=n/n,i=1,2...n;
步骤e:根据用户特征信息以及物品特征信息,通过词向量模型计算出每个物品的embedding向量,然后根据余弦相似度计算出所有物品与物品之间的相似度,形成物品相似度矩阵,其中,余弦相似度公式如下:
步骤f:根据召回阶段召回策略以及其召回数量ki,i=1,2,...,n,计算召回阶段每路召回策略召回的topki,i=1,2,...,n物品;
步骤g:根据用户行为数据、物品与物品相似度数据以及召回阶段每路策略召回的物品数据,计算出每个用户每路召回策略的权重占比β1,β2,...,βn,然后计算出每个用户对每路召回的数量k'i=n*βi,i=1,2,...,n;
步骤h:重复上述步骤e至步骤g,直到每个用户的每路召回策略召回数量不发生变化即止,得到每个用户每路召回策略最终召回数量
步骤i:针对每个用户在每路召回策略下的召回数量获取其
2.根据权利要求1所述一种基于个性化召回的推荐系统优化方法,其特征在于,在一个实施方式中,所述步骤g,具体包含如下:
步骤g1:通过用户近一个月的行为数据获取每个用户点击的物品;
步骤g2:根据步骤g1获取的用户近一个月点击的物品,通过物品与物品相似度数据,匹配出用户近一个月点击的物品以及其相似度超过δ的相似物品,作为用户偏好的物品集;
步骤g3:根据步骤g2获取到的用户偏好物品与召回阶段每路召回策略召回的物品进行匹配,计算出每路召回策略中能够匹配到的物品数量为k1,k2,...,kn,占比情况
3.根据权利要求1所述一种基于个性化召回的推荐系统优化方法,其特征在于,在一个实施方式中,在步骤c中,相似度阈值δ的取值范围为[0,1],参考经验值为0.8。
4.根据权利要求1所述一种基于个性化召回的推荐系统优化方法,其特征在于,在一个实施方式中,在步骤e中,利用物品的词向量以及余弦相似度,计算物品与物品之间相似度。
5.根据权利要求1所述一种基于个性化召回的推荐系统优化方法,其特征在于,在一个实施方式中,在步骤f中,通过不同召回策略以及召回数量获取每个用户每个召回策略的召回物品。
6.根据权利要求1所述一种基于个性化召回的推荐系统优化方法,其特征在于,在一个实施方式中,在步骤h中,通过不断的重复迭代步骤e至步骤f,直到每个用户的每路召回策略召回数量不发生变化即止,得到每个用户每路召回策略最终召回数量