一种基于双曲空间的无标度知识推荐方法及其系统与流程

专利2026-05-13  3


本发明涉及计算机系统领域,具体而言,涉及一种基于双曲空间的无标度知识推荐方法及其系统。


背景技术:

1、在真实世界的三元组图谱中,节点的度分布通常是无标度的,即度的分布符合幂律分布的特性。这种特性意味着在图谱中,只有少数节点具有非常高的度数(连接数量),而大多数节点的度数较低。这种幂律分布的现象在许多现实世界的网络中都可以观察到,如社交网络、互联网、蛋白质交互网络等。

2、在这种结构中,节点的度数与其重要性和影响力呈幂律关系。具体来说,具有更高度数的节点通常具有更大的影响力和重要性。这些节点可以视为图谱中的重要节点或核心节点,它们在图谱的结构和功能中发挥着关键作用。

3、尽管幂律分布的图谱在现实世界中很常见,但目前大多数研究对这一现象的重视程度不够。这导致现有的推荐方法在处理幂律分布的图谱时效果不佳,无法准确地捕捉到数据的真实分布,从而影响推荐性能。

4、如果能将图谱结点的度的分布考虑进推荐条件,最终的预测结果会更加精确。这可以通过对幂律分布的特性进行深入研究,并开发针对幂律分布的推荐算法来实现。通过对节点度数的分布进行分析,可以更好地理解节点的重要性,从而更准确地预测用户的需求和喜好。

5、另一方面,现阶段大多数知识图谱推荐方法都是基于欧氏空间中的考虑,默认假设数据分布满足正态分布。然而,当遇到满足幂律分布的图谱时,这些方法可能无法准确地捕捉到数据的真实分布,从而影响推荐效果。


技术实现思路

1、针对上述背景技术中提出的需求,本发明实施例提供一种基于双曲空间的无标度知识推荐方法及其系统,旨在解决了图谱中节点度的幂律分布的问题,将数据嵌入双曲空间,从根本的假设上解决了该问题。

2、一种基于双曲空间的无标度知识推荐方法,具体步骤包括:

3、步骤一、收集并准备要分析的三元组图谱数据,包括节点的嵌入向量和边的信息。这些数据可以通过爬虫技术、api接口或者开放数据库等方式获取,并经过预处理和清洗后,转换成适合模型输入的形式。

4、步骤二、构建一个由编码层、注意力洛伦兹卷积层和预测层组成的模型。该模型的设计和构建是该方法的核心部分。编码层负责将输入的嵌入向量映射到双曲空间,并保证它们落在洛伦兹流形面上。注意力洛伦兹卷积层则通过考虑洛伦兹流形上的本地结构的三元组知识,实现了节点之间的信息传播和聚集。预测层则使用双曲空间中的内积来估算节点的匹配分数,以完成推荐任务。

5、步骤三、使用准备好的数据对模型进行训练,通过反向传播算法优化模型的参数。训练过程中,模型会根据输入的数据进行预测,并计算预测结果与真实结果之间的误差,然后通过反向传播算法更新模型的参数,以减小误差。训练的目的是使模型能够准确地预测新的数据。

6、步骤四、使用训练好的模型对新的数据进行预测,输出推荐结果。当模型训练完成后,可以使用它来对新的数据进行预测。输入新的数据后,模型会自动将其转换为双曲空间中的表示形式,然后通过注意力机制和卷积操作进行信息传播和聚集,最后通过预测层输出推荐结果。

7、进一步的:编码层的主要作用是将输入数据从欧氏空间映射到双曲空间,并保证数据落在洛伦兹流形面上;这一步是为了让模型能够直接处理来自欧氏空间的输入;

8、具体来说,当输入数据分布在欧氏空间时,在输入数据进后续的层之前,需要先将其投影至洛伦兹流形面上。假设xe∈rd-1和xh∈hd分别表示欧氏空间的输入和迁移过后双曲空间中的嵌入。则

9、

10、其中(0,xe)是在欧氏切空间中的d维向量,向量表示空间原点。向量o用于在切空间中表示其他向量的一个参考。在该模型中,将曲率-1/c设置维一个可训练的变量,用于动态表示嵌入空间分层的程度。

11、进一步的:所述注意力洛伦兹卷积层包括洛伦兹知识注意力机制、洛伦兹信息传播机制、洛伦兹邻居聚集机制以及高阶信息提取机制;

12、洛伦兹知识注意力机制是该模型中提出的注意力机制考虑了在洛伦兹流形上的本地结构的三元组知识。

13、首先计算了实体h和实体t之间的关系r的注意力权重π(h,r,t):

14、

15、然后通过所有的边使用softmax函数来进行规范化:

16、

17、该模型的注意力机制由节点的嵌入h,t和权重矩阵wr决定,使得该模型可以自动衡量不同知识的邻居之间所做的贡献。基于此的学习权重,邻居之间的信息可以被传播和聚集。

18、洛伦兹信息传播机制是为了传播洛伦兹流形上邻居之间的信息,我们为不同的用户和商品分别计算了邻居之间的洛伦兹线性组合。

19、由于用户只会和商品有所联系,则用来表示用户u历史交互信息的嵌入可以用下列式子表示:

20、

21、类似的,商品对用户也有对应的联系,因此商品i也可以表示为:

22、

23、洛伦兹邻居聚集机制是当获得了传播而来的邻居信息,即sn(u)和sn(i),下一步是进行洛伦兹邻居聚集并更新用户和商品的嵌入。在该模型中,使用了三种类型的洛伦兹聚集算子来实现。

24、①加法聚集器:

25、

26、②拼接聚集器:

27、其中

28、

29、③邻居聚集器:

30、

31、高阶信息提取机制是为了更进一步提取图谱中的高阶信息,并将不同的知识传播给商品,模型采用不同子图并堆叠了更多的传播层。

32、其中第l层的传播可以表示为:

33、

34、所述预测层使用了来自上一层的可学习的双曲表征嵌入向量,并使用其在双曲空间中的内积来估算他们的匹配分数:

35、

36、进一步的:使用准备好的数据对模型进行训练,通过反向传播算法优化模型的参数的步骤包括:令表示物品和用户交互的正向样本,即表示对应的集合中的负样本,即为了更好地训练该模型,令在每一轮的模型训练中,和进行更新;最后的损失函数如下:

37、

38、进一步的:一种基于双曲空间的无标度知识推荐系统,包括:

39、数据预处理模块:该模块收集并准备要分析的三元组图谱数据,包括节点的嵌入向量和边的信息,并对数据进行清洗和格式转换,使其适合模型输入,将准备好的数据对模型进行训练;

40、模型构建模块,该模块用于构建一个由编码层、注意力洛伦兹卷积层和预测层组成的模型,来确定模型的架构和参数,以及层与层之间的连接方式;

41、训练模块,该模块使用准备好的数据对模型进行训练,通过反向传播算法优化模型的参数,使模型能够准确地进行预测,并根据训练结果调整模型参数,提高模型的准确性和泛化能力;

42、预测模块,该使用训练好的模型对新的数据进行预测,根据模型的输出结果,进行知识推荐,输出推荐结果,包括推荐的知识点和相关度得分。

43、进一步的:终端设备可以包括:处理器、存储介质和总线,存储介质存储有处理器可执行的机器可读指令,当终端设备运行时,处理器与存储介质之间通过总线通信,处理器执行机器可读指令,以执行时执行如前述实施例中所述的深度学习模型训练方法的步骤。

44、进一步的:一种存储介质,该存储有计算机程序,所述计算机程序被处理器运行时执行上述的方法的步骤。

45、进一步的:一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行上述所述的方法。

46、本发明的有益效果:有效利用了双曲空间的特性:双曲空间是一种非欧几里得空间,具有与欧几里得空间不同的几何特性,例如,双曲空间中的距离计算和角度测量方式与欧几里得空间不同。这种知识推荐方法有效利用了双曲空间的这些特性,可以更好地处理和分析知识图谱数据。

47、提高了推荐准确度:该方法使用双曲空间的内积来估算节点的匹配分数,相对于传统的基于欧几里得距离的推荐方法,能够更好地衡量节点之间的相似性,从而提高了推荐的准确度。

48、考虑了知识图谱的本地结构:该方法通过注意力洛伦兹卷积层考虑了洛伦兹流形上的本地结构的三元组知识,从而能够更好地捕捉知识图谱中的局部结构信息,提高了推荐的精度和可靠性。

49、实现了节点的信息传播和聚集:通过注意力洛伦兹卷积层,该方法实现了节点之间的信息传播和聚集,能够将分散的信息整合起来,从而更好地挖掘知识图谱中的隐藏信息。

50、可扩展性强:该方法采用了深度学习框架,可以利用现有的深度学习技术进行优化和扩展,从而能够更好地适应大规模的知识图谱数据。

51、提高了推荐的多样性:该方法通过构建由编码层、注意力洛伦兹卷积层和预测层组成的模型,能够根据用户的兴趣和历史行为进行个性化的推荐,提高了推荐的多样性和用户满意度。

52、减少了冷启动问题的影响:该方法通过构建由编码层、注意力洛伦兹卷积层和预测层组成的模型,可以利用用户的反馈和行为数据进行实时的在线学习和调整,从而减少了冷启动问题的影响。


技术特征:

1.一种基于双曲空间的无标度知识推荐方法,其特征在于,具体步骤包括:

2.根据权利要求1所述的方法,其特征在于,所述编码层用于将输入数据从欧氏空间映射到双曲空间,当输入数据分布在欧氏空间时,在输入数据进后续的层之前,先将其投影至洛伦兹流形面上,假设xe∈rd-1和xh∈hd分别表示欧氏空间的输入和迁移过后双曲空间中的嵌入,则

3.根据权利要求2所述的方法,其特征在于,所述注意力洛伦兹卷积层包括洛伦兹知识注意力机制、洛伦兹信息传播机制、洛伦兹邻居聚集机制以及高阶信息提取机制;

4.根据权利要求3所述的方法,其特征在于,洛伦兹信息传播机制是为了传播洛伦兹流形上邻居之间的信息,我们为不同的用户和商品分别计算了邻居之间的洛伦兹线性组合;由于用户只会和商品有所联系,则用来表示用户u历史交互信息的嵌入可以用下列式子表示:

5.根据权利要求4所述的方法,其特征在于,洛伦兹邻居聚集机制是当获得了传播而来的邻居信息,即sn(u)和sn(i),下一步是进行洛伦兹邻居聚集并更新用户和商品的嵌入,在该模型中,使用了三种类型的洛伦兹聚集算子来实现;

6.根据权利要求3所述的方法,其特征在于,高阶信息提取机制是为了更进一步提取图谱中的高阶信息,并将不同的知识传播给商品,模型采用不同子图并堆叠了更多的传播层;

7.根据权利要求1所述的方法,其特征在于,所述预测层使用了来自上一层的可学习的双曲表征嵌入向量,并使用其在双曲空间中的内积来估算他们的匹配分数:

8.根据权利要求1所述的方法,其特征在于,使用准备好的数据对模型进行训练,通过反向传播算法优化模型的参数的步骤包括:令表示物品和用户交互的正向样本,即表示对应的集合中的负样本,即为了更好地训练该模型,令在每一轮的模型训练中,和进行更新;最后的损失函数如下:

9.一种基于双曲空间的无标度知识推荐系统,其特征在于,包括:

10.一种终端设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当所述终端设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行时执行如权利要求1至8任一项所述的方法的步骤。

11.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至8任一项所述的方法的步骤。

12.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序在被处理器执行时实现如权利要求1-8中任一项所述的方法。


技术总结
本发明提供了一种基于双曲空间的无标度知识推荐方法及其系统,涉及计算机系统领域。本发明有效利用了双曲空间的特性:双曲空间是一种非欧几里得空间,具有与欧几里得空间不同的几何特性,例如,双曲空间中的距离计算和角度测量方式与欧几里得空间不同。这种知识推荐方法有效利用了双曲空间的这些特性,可以更好地处理和分析知识图谱数据。该方法使用双曲空间的内积来估算节点的匹配分数,相对于传统的基于欧几里得距离的推荐方法,能够更好地衡量节点之间的相似性,从而提高了推荐的准确度。

技术研发人员:刘成
受保护的技术使用者:中信银行股份有限公司
技术研发日:
技术公布日:2024/7/25
转载请注明原文地址: https://bbs.8miu.com/read-440334.html

最新回复(0)