一种基于LFM模型的智库数据推荐方法和系统与流程

专利2026-04-04  9


本发明涉及数据库推荐,特别涉及一种基于lfm模型的智库数据推荐方法和系统。


背景技术:

1、目前现有的智库数据通常是依靠人工输入相关检索词通过搜索引擎进行查询并推荐输出需要的智库数据,然而上述方式存在如下技术问题:1、现有的智库数据通常采用文本相似度算法进行匹配,而针对智库数据文本一般为规范文本,而文本相似度计算需要借助自然语言处理模型,计算成本较大且效率较低。2、现有的智库数据尚无对查询用户的历史数据做处理,因此推荐方式仅基于查询文本的文本相似度计算,从而导致推荐的模式比较单一,无法适应用户兴趣点的智库信息查询。3、使用者对智库实际下载的兴趣数据较少,现有模型无法准确推算出用户在非下载情况下的兴趣数据。


技术实现思路

1、本发明其中一个发明目的在于提供一种基于lfm模型的智库数据推荐方法和系统,所述方法和系统通过用户对智库数据操作的历史数据对lfm模型进行训练,lfm模型初始化后利用所述历史数据计算的用户兴趣矩阵,根据所述用户兴趣矩阵进行矩阵分解得到用户对智库数据隐类兴趣矩阵、智库数据和隐类兴趣关系矩阵,根据所述拆解的两个矩阵进行lfm模型训练得到用户兴趣预测模型,本发明基于隐类兴趣矩阵可以有效解决用户对智库数据兴趣矩阵稀疏的问题,增强了智库数据推荐的准确性。

2、本发明另一个发明目的在于提供一种基于lfm模型的智库数据推荐方法和系统,所述方法和系统利用kmp算法对智库数据进行搜索,在智库数据中预先构建知识图谱规范的三元组信息,根据所述kmp算法对所述三元组信息进行查询,根据查询结果选择最优的三元组的实体所关联的智库数据作为查询输出,相比于传统的相似度算法,本发明所述kmp算法具有低成本,高效率的查询优势。

3、本发明另一个发明目的在于提供一种基于lfm模型的智库数据推荐方法和系统,所述方法和系统利用所述kmp算法得到的智库数据具有关联度关系,本发明基于所述kmp算法搜索得到具有一定关联度的智库数据作为所述lfm模型的历史数据,并根据所述kmp算法得到的智库数据相关的信息作为隐类数据,从而实现高效查询基础上智库数据历史隐类数据的快速构建。

4、为了实现至少一个上述发明目的,本发明进一步提供一种基于lfm模型的智库数据推荐方法,所述方法包括:

5、预先构建智库数据的知识图谱,并根据知识图谱得到对应智库数据节点的三元组信息,获取用户输入数据,根据所述输入数据采用kmp算法查询所述三元组信息,得到第一查询数据;

6、将所述第一查询数据保存作为智库数据的历史数据,获取用户的对智库数据的操作数据构建用户对智库数据的兴趣矩阵;

7、将所述用户对智库数据的兴趣矩阵进行矩阵分解得到用户对智库数据隐类兴趣关系矩阵、智库数据和隐类关系矩阵,用于构建lfm模型;

8、根据所述智库数据的历史数据得到的隐类数据训练所述lfm模型,得到训练好的智库数据推荐模型。

9、根据本发明其中一个较佳实施例,所述kmp算法的查找方法包括:将所述知识图谱中的三元组信息转化为文本字符串,并将用户的输入数据转化为模式字符串,将所述模式字符串和所述文本字符串进行字符匹配,直到当前模式字符串中的所有字符均在所述文本字符串中匹配到,则获取所述被匹配到的三元组信息,并将所述被匹配到的三元组信息中的实体数据提取,保存后用于构建所述智库数据的历史数据。

10、根据本发明另一个较佳实施例,所述kmp算法的查找方法包括:获取用户是输入数据并转化为模式字符串,所述模式字符串包括k个顺序排列的字符,所述,文本字符串包括m个字符,其中m>k,将所述k个字符的模式字符串和所述三元组信息的文本字符串的起始位置开始匹配,计算模式字符串的字符在所述文本字符串中存在k1个字符和顺序相同的第一匹配字符串,其中k1<k,此时移动所述模式字符串x个字符和所述文本字符串匹配,使得所述模式串中存在至少上述k1个字符和顺序相同的第一匹配字符串和所述模式字符串匹配,继续移动所述模式字符串,直到k个模式字符串的字符均在所述文本字符串中匹配到。

11、根据本发明另一个较佳实施例,当所述k个字符的模式字符串在所述m个字符中查找到n个相同的模式字符串后,定位每个查找到n个模式字符串所在的三元组位置,并统计每个三元组信息中存在的所述模式字符串的个数,并按照模式字符串的数量从多到少依次排序,优先输出模式字符串匹配数量最多的三元组对应的智库数据。

12、根据本发明另一个较佳实施例,当所述k个模式字符串在所述文本字符串数据并未匹配到,则将所述k个字符模式字符串删除至少一个字符得到kn个字符的模式字符串再次和所述文本字符串进行匹配,其中所述kn个字符的模式字符串获取方法包括:采用分词和词嵌入技术从所述输入语句中抽取关键词,并将抽取至少一个关键词转化为所述kn个字符的模式字符串和对应的m个字符的文本字符串进行匹配,得到每个三元组信息的kn个字符的模式字符串的匹配数量。

13、根据本发明另一个较佳实施例,所述lfm模型的构建方法包括:获取用户对所述智库数据的历史数据,其中所述历史数据包括用户对智库数据的下载数据、点击数据、浏览数据和查找数据,其中将用户下载对应类型智库数据构建用户的兴趣矩阵rui,并将所述兴趣矩阵rui按照隐类型数据进行矩阵分解得到隐类兴趣矩阵和隐类兴趣关系矩阵,此时所述用户的兴趣矩阵可以采用如下公式表示:rui=,其中u为用户,t为转置矩阵标识,i为智库数据类型。

14、根据本发明另一个较佳实施例,所述lfm模型的构建方法包括:获取所述用户对对应类型智库的点击数据、浏览数据和查找数据后,根据上述点击数据、浏览数据和查找数据确定隐类数据,其中所述隐类数据包括上述用户输入数据在对应智库数据三元组信息中的模式串匹配数量,所述浏览数据包括用户在对应三元组智库数据中的浏览时长,点击数据包括用于对对应智库数据的点击次数,用于确定所述隐类数据,确定好隐类数据后得到按照如下公式进行计算兴趣矩阵:preference(u,i)=ru,i==,其中k为隐类维度,f=k,中的u和k表示为用户兴趣和隐类数据的关系,中的k和i表示为隐类数据和对应智库数据类型关系。

15、根据本发明另一个较佳实施例,当对所述用户的兴趣矩阵进行拆解得到用户对智库数据隐类兴趣关系矩阵、智库数据和隐类关系矩阵后,进一步按照获取的历史数据对所述lfm模型进行训练,并计所述用户的兴趣矩阵ru,i==的误差平方和:eu,i=,其中表示用户兴趣矩阵真实值,将误差平方和最小mineu,i的lfm模型作为训练好的lfm模型。

16、为了实现至少一个上述发明目的,本发明进一步提供一种基于lfm模型的智库数据推荐系统,所述系统执行上述一种基于lfm模型的智库数据推荐方法。

17、本发明提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程被处理器执行上述一种基于lfm模型的智库数据推荐方法。



技术特征:

1.一种基于lfm模型的智库数据推荐方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种基于lfm模型的智库数据推荐方法,其特征在于,所述kmp算法的查找方法包括:将所述知识图谱中的三元组信息转化为文本字符串,并将用户的输入数据转化为模式字符串,将所述模式字符串和所述文本字符串进行字符匹配,直到当前模式字符串中的所有字符均在所述文本字符串中匹配到,则获取所述被匹配到的三元组信息,并将所述被匹配到的三元组信息中的实体数据提取,保存后用于构建所述智库数据的历史数据。

3.根据权利要求2所述的一种基于lfm模型的智库数据推荐方法,其特征在于,所述kmp算法的查找方法包括:获取用户是输入数据并转化为模式字符串,所述模式字符串包括k个顺序排列的字符,所述文本字符串包括m个字符,其中m>k,将所述k个字符的模式字符串和所述三元组信息的文本字符串的起始位置开始匹配,计算模式字符串的字符在所述文本字符串中存在k1个字符和顺序相同的第一匹配字符串,其中k1<k,此时移动所述模式字符串x个字符和所述文本字符串匹配,使得所述模式串中存在至少上述k1个字符和顺序相同的第一匹配字符串和所述模式字符串匹配,继续移动所述模式字符串,直到k个模式字符串的字符均在所述文本字符串中匹配到。

4.根据权利要求3所述的一种基于lfm模型的智库数据推荐方法,其特征在于,当所述k个模式字符串在所述m个字符中查找到n个相同的模式字符串后,定位每个查找到n个模式字符串所在的三元组位置,并统计每个三元组信息中存在的所述模式字符串的个数,并按照模式字符串的数量从多到少依次排序,优先输出模式字符串匹配数量最多的三元组对应的智库数据。

5.根据权利要求3所述的一种基于lfm模型的智库数据推荐方法,其特征在于,当所述k个字符的模式字符串在所述文本字符串数据并未匹配到,则将所述k个字符模式字符串删除至少一个字符得到kn个字符的模式字符串再次和所述文本字符串进行匹配,其中所述kn个字符的模式字符串获取方法包括:采用分词和词嵌入技术从所述输入语句中抽取关键词,并将抽取至少一个关键词转化为所述kn个字符的模式字符串和对应的m个字符的文本字符串进行匹配,得到每个三元组信息的kn个字符的模式字符串的匹配数量。

6.根据权利要求1所述的一种基于lfm模型的智库数据推荐方法,其特征在于,所述lfm模型的构建方法包括:获取用户对所述智库数据的历史数据,其中所述历史数据包括用户对智库数据的下载数据、点击数据、浏览数据和查找数据,其中将用户下载对应类型智库数据构建用户的兴趣矩阵rui,并将所述兴趣矩阵rui按照隐类型数据进行矩阵分解得到隐类兴趣矩阵和隐类兴趣关系矩阵,此时所述用户的兴趣矩阵可以采用如下公式表示:rui=,其中u为用户,t为转置矩阵标识,i为智库数据类型。

7.根据权利要求6所述的一种基于lfm模型的智库数据推荐方法,其特征在于,所述lfm模型的构建方法包括:或者所述用户对对应类型智库的点击数据、浏览数据和查找数据后,根据上述点击数据、浏览数据和查找数据确定隐类数据,其中所述隐类数据包括上述用户输入数据在对应智库数据三元组信息中的模式串匹配数量,所述浏览数据包括用户在对应三元组智库数据中的浏览时长,点击数据包括用于对对应智库数据的点击次数,用于确定所述隐类数据,确定好隐类数据后得到按照如下公式进行计算兴趣矩阵:preference(u,i)=ru,i==,其中k为隐类维度,f=k,中的u和k表示为用户兴趣和隐类数据的关系,中的k和i表示为隐类数据和对应智库数据类型关系。

8.根据权利要求7所述的一种基于lfm模型的智库数据推荐方法,其特征在于,当对所述用户的兴趣矩阵进行拆解得到用户对智库数据隐类兴趣关系矩阵、智库数据和隐类关系矩阵后,进一步按照获取的历史数据对所述lfm模型进行训练,并计所述用户的兴趣矩阵ru,i==的误差平方和:eu,i=,其中表示用户兴趣矩阵真实值,将误差平方和最小的mineu,i的lfm模型作为训练好的lfm模型。

9.一种基于lfm模型的智库数据推荐系统,其特征在于,所述系统执行上述权利要求1-8中任意一项所述的一种基于lfm模型的智库数据推荐方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程被处理器执行上述权利要求1-8中任意一项所述的一种基于lfm模型的智库数据推荐方法。


技术总结
本发明提供了一种基于LFM模型的智库数据推荐方法和系统,所述方法包括:预先构建智库数据的知识图谱,并根据知识图谱得到对应智库数据节点的三元组信息,获取用户输入数据,根据所述输入数据采用KMP算法查询所述三元组信息,得到第一查询数据;将所述第一查询数据保存作为智库数据的历史数据,获取用户的对智库数据的操作数据构建用户对智库数据的兴趣矩阵;将所述用户对智库数据的兴趣矩阵进行矩阵分解得到用户对智库数据隐类兴趣关系矩阵、智库数据和隐类关系矩阵,用于构建LFM模型;根据所述智库数据的历史数据得到的隐类数据训练所述LFM模型,得到训练好的智库数据推荐模型。

技术研发人员:苗禾,毛亚萍
受保护的技术使用者:浙江淏瀚信息科技有限公司
技术研发日:
技术公布日:2024/7/25
转载请注明原文地址: https://bbs.8miu.com/read-439641.html

最新回复(0)