一种信息推荐方法、装置、设备及存储介质与流程

专利2022-06-30  53


本发明涉及互联网技术,尤其涉及一种信息推荐方法、装置、设备及存储介质。
背景技术
:信息推荐是指服务器根据用户的身份属性、兴趣属性等从数据库中匹配出对应的推荐内容,然后将推荐内容呈现在用户的终端上的过程。相关技术中,服务器会将具有相同或类似的身份属性、兴趣属性的用户划为一类,即为用户确定出用户类别,然后将某个用户类别中的一些用户所感兴趣内容作为推荐内容,推荐给该用户类别中的其他用户。常用的用户类别划分方式有直接根据用户的原始属性数据进行划分,以及根据从原始属性数据中提取出特征的进行划分等。然而,原始属性数据中往往可能包含对用户的类别划分的影响较低,甚至是对用户的类别划分具有负面影响的特征。此时,利用原始属性数据,以及利用从原始属性数据中所提取出的特征进行用户类别划分的准确度较低,从而导致信息推荐的准确度较低。技术实现要素:本发明实施例提供一种信息推荐方法、装置、设备及存储介质,能够提高信息推荐的准确度。本发明实施例的技术方案是这样实现的:本发明实施例提供一种信息推荐方法,应用于服务器,包括:获取预设好的至少一个用户类别对应的所至少一个类别中心、特征权重信息和目标对象对应的属性特征;所述特征权重信息表征所述属性特征对用户类别划分的重要程度;所述至少一个类别中心是由所述服务器对所述训练样本数据进行训练得到的;根据所述属性特征生成待聚类数据;基于所述待聚类数据和所述特征权重信息确定出带权重的待聚类数据,并根据所述带权重的待聚类数据和所述至少一个类别中心,分别确定出所述目标对象属于所述至少一个用户类别的至少一个类别概率;根据所述至少一个类别概率从推荐内容库中获取到推荐信息;将所述推荐信息发送给所述目标对象对应的终端。本发明实施例提供一种信息推荐方法,应用于终端,包括:接收服务器发送的推荐信息;所述推荐信息是所述服务器根据所述目标对象的属性特征确定出的;在功能界面接收到推荐信息浏览指令时,进入推荐信息呈现界面;将所述推荐信息呈现在所述推荐信息呈现界面上,完成针对所述目标对象的信息推荐。本发明实施例提供一种信息推荐装置,包括:获取模块,获取预设好的至少一个用户类别所对应的至少一个类别中心、特征权重信息和目标对象对应的属性特征;所述特征权重信息表征所述属性特征对用户类别划分的重要程度;所述至少一个类别中心是由所述服务器对所述训练样本数据进行训练得到的;数据生成模块,用于根据所述属性特征生成待聚类数据;类别确定模块,用于基于所述待聚类数据和所述特征权重信息确定出带权重的待聚类数据,并根据所述带权重的待聚类数据和所述至少一个类别中心,分别确定出所述目标对象属于所述至少一个用户类别的至少一个类别概率;结果生成模块,用于根据所述至少一个类别概率从推荐内容库中获取到推荐信息;发送模块,用于将所述推荐信息发送给所述目标对象对应的终端。本发明实施例提供一种呈现装置,包括:接收模块,用于接收服务器发送的推荐信息;所述推荐信息是所述服务器根据所述目标对象的属性特征确定出的;在功能界面接收到推荐信息浏览指令时,进入推荐信息呈现界面;结果呈现模块,用于将所述推荐信息呈现在所述推荐信息呈现界面上,完成针对所述目标对象的信息推荐。本发明实施例提供一种服务器,包括:第一存储器,用于存储可执行信息推荐指令;第一处理器,用于执行所述第一存储器中存储的可执行信息推荐指令时,实现本发明实施例服务器侧提供的信息推荐方法。本发明实施例提供一种终端,包括:第二存储器,用于存储可执行信息推荐指令;第二处理器,用于执行所述第二存储器中存储的可执行信息推荐指令时,实现本发明实施例终端侧提供的信息推荐方法。本发明实施例提供一种存储介质,存储有可执行信息推荐指令,用于引起第一处理器执行时,实现本发明实施例服务器侧提供的信息推荐方法,或者用于引起第二处理器执行时,实现本发明实施例终端侧提供的信息推荐方法。本发明实施例具有以下有益效果:本发明实施例中,服务器能够先获取由服务器对训练样本数据进行训练所得到的至少一个类别中心、特征权重信息和目标对象对应的特征属性,根据特征属性生成待聚类数据,然后基于待聚类数据和特征权重信息确定出带权重的待聚类数据,根据带权重的待聚类数据和至少一个类别中心,分别确定出目标对象属于至少一个用户类别的至少一个类别概率,再根据至少一个类别概率获取推荐信息得到推荐信息,并将推荐信息发送给目标对象对应的终端,以使终端呈现推荐信息。如此,服务器能够利用特征权重信息消除特征属性中的噪音特征对用户类别划分带来的影响,提高用户类别划分的准确度,从而提高信息推荐的准确度。附图说明图1是本发明实施例提供的信息推荐系统100的一个可选的结构示意图;图2是本发明实施例提供的服务器200的一个可选的结构示意图;图3是本发明实施例提供的终端400的一个可选的结构示意图;图4是本发明实施例提供的信息推荐方法的一个可选的流程示意图一;图5是本发明实施例提供的在功能界面上显示提示标识的示意图;图6是本发明实施例提供的推荐信息的示意图;图7是本发明实施例提供的信息推荐方法的一个可选的流程示意图二;图8是本发明实施例提供的服务器为待聚类数据中的各个子数据分配权重的示意图;图9是本发明实施例提供的信息推荐方法的一个可选的流程示意图三;图10是本发明实施例提供的看一看上的推荐结果示意图。具体实施方式为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,所描述的实施例不应视为对本发明的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。在以下的描述中,所涉及的术语“第一\第二”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本发明实施例能够以除了在这里图示或描述的以外的顺序实施。除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的
技术领域
的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本发明实施例的目的,不是旨在限制本发明。对本发明实施例进行进一步详细说明之前,对本发明实施例中涉及的名词和术语进行说明,本发明实施例中涉及的名词和术语适用于如下的解释。1)用户类别,是指根据不同用户的自然属性、兴趣属性等,所划分出来的类别。不同的用户可以归属到不同的用户类别之中,根据属于同一用户类别的一些用户对于某个媒体内容的操作,可以推测出属于该用户类别的其他用户针对该媒体内容的操作。例如,当某个用户类别中的一些用户选择了屏蔽某篇文章,则属于该用户类别的其他用户也有可能屏蔽该篇文章。2)类别中心,是指用户类别的中心所对应的向量。具体的,对于用户类别划分过程而言,实质上是将用户的属性特征映射到向量空间,然后判断根据用户的属性特征所生成的向量,距离用户类别的中心所对应向量的远近来划分用户类别。3)特征权重信息,用于为用户的各个属性特征赋予权重,根据权重的大小能够确定出哪些属性特征是对用户的类别划分具有较大影响的,哪些属性特征是对用户的类别划分不具有影响,甚至具有负面影响的。4)推荐内容,是指需要推荐给用户的媒体内容,可以是新闻、文章、音乐或者视频等内容。5)推荐信息,表征对推荐内容进行排序之后,需要在显示界面上呈现给用户的结果。例如,可以将所获取到的多个推荐内容按照发布时间的顺序,或是按照热度顺序进行排列所得到的结果。6)惩罚参数,是所引入的在训练聚类模型以得到类别中心和特征权重信息时,用来表征指示概率的分布的稀疏程度的参数。合适的惩罚参数意味着指示概率的分布具有合适的稀疏程度,使得训练数据样本与各个用户类别之间紧密程度能够合理量化,进而使得训练所得到的类别中心更为准确。信息推荐是指服务器根据用户的身份属性、兴趣属性等从数据库匹配出对应的推荐内容,然后将推荐内容呈现在用户的终端上的过程。在相关技术中,服务器会先将具有相同或类似的身份属性、兴趣属性的用户划归为一类,即为不同的用户确定出其所属的用户类别,然后根据某个用户类别中的一些用户所感兴趣的内容作为推荐内容,推荐给该用户类别中的其他用户。由此可见,用户类别划分的准确率,会直接影响信息推荐的准确率。常用的用户类别划分方式有直接根据用户的原始属性数据进行划分,即直接根据用户的对各类媒体内容的操作、用户的身份特性等进行划分;还有根据从原始属性数据中提取出的特征进行划分,例如根据人工挑选出或是机器自主挑选出的表征兴趣的特征等进行划分。然而,在实际的用户类别划分中,用户的原始属性数据往往是带有噪音特征的,即包含有对用户的类别划分的贡献较低,甚至于对用户的类别划分具有负面影响的特征。此时,无论是使用原始属性数据直接进行用户类别划分,还是使用从原始属性数据中所提取出的特征进行用户类别划分,都可能会使得用户类别划分受到噪音特征的影响,进而使得用户类别划分的准确度较低,最终导致信息推荐的准确度较低。本发明实施例提供一种信息推荐方法、装置、设备和存储介质,能够提高信息推荐的准确度。下面说明本发明实施例提供的信息推荐设备的示例性应用,本发明实施例提供的信息推荐设备可以实施为智能手机、平板电脑、笔记本电脑等各种类型的用户终端,也可以实施为服务器。下面,将说明信息推荐设备实施为终端以及服务器时的示例性应用。参见图1,图1是本发明实施例提供的信息推荐系统100的一个可选的架构示意图,为实现支撑一个信息推荐应用,终端400通过网络300连接服务器200,网络300可以是广域网或者局域网,又或者是二者的组合。服务器200先获取预设好的至少一个用户类别所对应的至少一个类别中心、特征权重信息,同时获取目标对象对应的属性特征,其中,至少一个类别中心是由服务器200对训练样本数据进行训练得到的。之后,服务器200根据属性特征生成待聚类数据,并基于待聚类数据,所获取到的至少一个类别中心和特征权重信息,分别确定出目标对象属于至少一个用户类别的至少一个类别概率。接着,服务器200根据所确定出的至少一个类别概率从推荐内容库中获取到推荐信息。接下来,服务器200将推荐信息发送给目标对象对应的终端400,以使终端400呈现推荐信息。终端400接收服务器200发送的推荐信息,并在功能界面接收到推荐信息浏览指令时,进入到推荐信息呈现界面410中。最后,终端400将推荐信息呈现在推荐信息呈现界面410中,如此,就完成了针对目标对象的信息推荐过程。参见图2,图2是本发明实施例提供的服务器200的一个可选的结构示意图,图2所示的服务器200包括:至少一个第一处理器210、第一存储器250、至少一个第一网络接口220和第一用户接口230。服务器200中的各个组件通过第一总线系统240耦合在一起。可理解,第一总线系统240用于实现这些组件之间的连接通信。第一总线系统240除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图2中将各种总线都标为第一总线系统240。第一处理器210可以是一种集成电路芯片,具有信号的处理能力,例如通用处理器、数字信号处理器(dsp,digitalsignalprocessor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其中,通用处理器可以是微处理器或者任何常规的处理器等。第一用户接口230包括使得能够呈现媒体内容的一个或多个第一输出装置231,包括一个或多个扬声器和/或一个或多个视觉显示屏。第一用户接口230还包括一个或多个第一输入装置232,包括有助于用户输入的用户接口部件,比如键盘、鼠标、麦克风、触屏显示屏、摄像头、其他输入按钮和控件。第一存储器250包括易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(rom,readonlymemory),易失性存储器可以是随机存取存储器(ram,randomaccessmemory)。本发明实施例描述的第一存储器250旨在包括任意适合类型的存储器。第一存储器250可选地包括在物理位置上远离第一处理器210的一个或多个存储设备。在一些实施例中,第一存储器250能够存储数据以支持各种操作,这些数据的示例包括程序、模块和数据结构或者其子集或超集,下面示例性说明。第一操作系统251,包括用于处理各种基本系统服务和执行硬件相关任务的系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务;第一网络通信模块252,用于经由一个或多个(有线或无线)第一网络接口220到达其他计算设备,示例性的第一网络接口220包括:蓝牙、无线相容性认证(wi-fi)、和通用串行总线(usb,universalserialbus)等;第一显示模块253,用于经由一个或多个与第一用户接口230相关联的第一输出装置231(例如,显示屏、扬声器等)使得能够呈现信息(例如,用于操作外围设备和显示内容和信息的用户接口);第一输入处理模块254,用于对一个或多个来自一个或多个第一输入装置232之一的一个或多个用户输入或互动进行检测以及翻译所检测的输入或互动。在一些实施例中,本发明实施例提供的信息推荐装置可以采用软件方式实现,图2示出了存储在第一存储器250中的信息推荐装置255,其可以是程序和插件等形式的软件,包括以下软件模块:获取模块2551、数据生成模块2552、类别确定模块2553、结果生成模块2554和发送模块2555,将在下文中说明各个模块的功能。在另一些实施例中,本发明实施例提供的信息推荐装置可以采用硬件方式实现,作为示例,本发明实施例提供的信息推荐装置可以是采用硬件译码处理器形式的处理器,其被编程以执行本发明实施例提供的信息推荐方法,例如,硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(asic,applicationspecificintegratedcircuit)、dsp、可编程逻辑器件(pld,programmablelogicdevice)、复杂可编程逻辑器件(cpld,complexprogrammablelogicdevice)、现场可编程门阵列(fpga,field-programmablegatearray)或其他电子元件。示例性的,本发明实施例提供一种服务器,包括:第一存储器,用于存储可执行信息推荐指令;第一处理器,用于执行所述第一存储器中存储的可执行信息推荐指令时,实现本发明实施例服务器侧提供的信息推荐方法。参见图3,图3是本发明实施例提供的终端400的一个可选的结构示意图,图3所示的终端400包括:至少一个第二处理器410、第二存储器450、至少一个第二网络接口420和第二用户接口430。终端400中的各个组件通过第二总线系统440耦合在一起。可理解,第二总线系统440用于实现这些组件之间的连接通信。第二总线系统440除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图3中将各种总线都标为第二总线系统440。第二处理器410可以是一种集成电路芯片,具有信号的处理能力,例如通用处理器、数字信号处理器(dsp,digitalsignalprocessor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其中,通用处理器可以是微处理器或者任何常规的处理器等。第二用户接口430包括使得能够呈现媒体内容的一个或多个第二输出装置431,包括一个或多个扬声器和/或一个或多个视觉显示屏。第二用户接口430还包括一个或多个第二输入装置432,包括有助于用户输入的用户接口部件,比如键盘、鼠标、麦克风、触屏显示屏、摄像头、其他输入按钮和控件。第二存储器450包括易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(rom,readonlymemory),易失性存储器可以是随机存取存储器(ram,randomaccessmemory)。本发明实施例描述的第二存储器450旨在包括任意适合类型的存储器。第二存储器450可选地包括在物理位置上远离第二处理器410的一个或多个存储设备。在一些实施例中,第二存储器450能够存储数据以支持各种操作,这些数据的示例包括程序、模块和数据结构或者其子集或超集,下面示例性说明。第二操作系统451,包括用于处理各种基本系统服务和执行硬件相关任务的系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务;第二网络通信模块452,用于经由一个或多个(有线或无线)第二网络接口420到达其他计算设备,示例性的第二网络接口420包括:蓝牙、无线相容性认证(wi-fi)、和通用串行总线(usb,universalserialbus)等;第二显示模块453,用于经由一个或多个与第二用户接口430相关联的第二输出装置431(例如,显示屏、扬声器等)使得能够呈现信息(例如,用于操作外围设备和显示内容和信息的用户接口);第二输入处理模块454,用于对一个或多个来自一个或多个第二输入装置432之一的一个或多个用户输入或互动进行检测以及翻译所检测的输入或互动。在一些实施例中,本发明实施例提供的呈现装置可以采用软件方式实现,图3示出了存储在第二存储器450中的呈现装置455,其可以是程序和插件等形式的软件,包括以下软件模块:接收模块4551和结果呈现模块4552,将在下文中说明各个模块的功能。在另一些实施例中,本发明实施例提供的呈现装置可以采用硬件方式实现,作为示例,本发明实施例提供的呈现装置可以是采用硬件译码处理器形式的处理器,其被编程以执行本发明实施例提供的信息推荐方法,例如,硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(asic,applicationspecificintegratedcircuit)、dsp、可编程逻辑器件(pld,programmablelogicdevice)、复杂可编程逻辑器件(cpld,complexprogrammablelogicdevice)、现场可编程门阵列(fpga,field-programmablegatearray)或其他电子元件。示例性的,本发明实施例提供一种终端,包括:第二存储器,用于存储可执行信息推荐指令;第二处理器,用于执行所述第二存储器中存储的可执行信息推荐指令时,实现本发明实施例终端侧提供的信息推荐方法。下面,将结合本发明实施例提供的服务器和终端的示例性应用和实施,说明本发明实施例提供的信息推荐方法。参见图4,图4是本发明实施例提供的信息推荐方法的一个可选的流程示意图一,将结合图4示出的步骤进行说明。s101、服务器获取预设好的至少一个用户类别所对应的至少一个类别中心、特征权重信息和目标对象对应的属性特征;特征权重信息表征属性特征对用户类别划分的重要程度;至少一个类别中心是由服务器对训练样本数据进行训练得到的。本发明实施例是在要对用户进行信息推荐的场景下实现的。服务器首先需要获取目标对象所对应的属性特征,以及预设好的至少一个用户类别中的每个用户类别所对应的类别中心,即至少一个类别中心,以及用来在信息推荐时指示哪些特征是重要特征的特征权重信息。需要说明的是,至少一个类别中心和特征权重信息,都是在信息推荐过程开始之前,由服务器利用训练样本数据进行学习所得到的,在信息推荐过程中直接使用即可。服务器在学习训练样本数据时,能够根据训练样本数据的分布,确定出用户类别的中心所对应的向量,即确定出类别中心,同时确定出哪些特征属性是对用户类别划分较为重要的,哪些特征属性是对用户类别划分不重要甚至具有负面影响的,即确定出特征属性对用户类别划分的重要程度。可以理解的是,特征属性中包括有用户的自然属性和兴趣属性。自然属性是指与用户对媒体内容的操作无关的属性,例如,用户的性别、年龄、所在地域以及职业等;兴趣属性是指与用户对媒体内容的操作有关的属性,例如,用户经常浏览的媒体内容的标签,用户对媒体内容的点赞、转发等操作等。当然,特征属性还可以包括有其他属性,本发明实施例在此不作限定。在本发明的一些实施例中,目标对象的属性特征可以是以用户画像的形式存在的,也可以是以属性标签的形式存在的,还可以是以其他形式存在的,本发明实施例在此不作具体限定。可以理解的是,本发明实施例中,目标对象指的是在服务器中注册过的任意用户。当目标对象是新注册的用户,还没有针对媒体内容的操作时,服务器可以仅根据目标对象在注册时所设置的自然属性,来对目标对象进行信息推荐。需要说明的是,本发明实施例中,至少一个用户类别的具体用户类别数,以及具体类别都是可以根据实际需求进行设定的,例如,可以将用户类别数设置为5,分别对应技术达人、居家生活、游戏大咖、音乐爱好者以及短视频爱好者这5个用户类别,还可以将用户类别数设置为20,分别对应实际应用中的各种用户类别,本发明在此不作具体限定。可以理解的是,服务器可以是在到达预设时间时,开始获取至少一个类别中心、特征权重信息和目标对象的属性特征,以开始信息推荐过程,例如,在每天的12:00获取上述内容,以开始信息推荐;服务器还可以是在目标对象完成对上一轮次信息推荐过程所推荐的信息的阅读之后,就开始获取上述内容,以开始新一轮次的信息推荐过程。具体触发服务器开始信息推荐的方式可以根据实际需求进行设定,本发明实施例在此不作限定。s102、服务器根据属性特征生成待聚类数据。服务器在得到目标对象对应的属性特征之后,就可以将属性特征数字化,得到一个向量,此时,服务器所得到的向量即是待聚类数据。如此,服务器就能够将用自然语言所表达的属性特征,映射到向量空间中去,以便于后续进行用户类别的划分。需要说明的是,服务器在对属性特征进行数字化时,需要尽可能多地保存目标对象的属性信息,以避免所生成的待聚类数据中缺少表征某个重要属性所对应的内容,给信息推荐的准确度带来影响。进一步的,目标对象的属性特征中,是具有很多子特征的,服务器可以逐个将这些子特征转换数字化,即用子数据来代表对应的子特征,并用这些子数据生成待聚类数据。s103、服务器基于待聚类数据和特征权重信息确定出带权重的待聚类数据,并根据带权重的待聚类数据和至少一个类别中心,分别确定出目标对象属于至少一个用户类别的至少一个类别概率。服务器得到所生成的待聚类数据,以及之前所获取到的至少一个类别中心和特征权重信息之后,会先利用特征权重信息为待聚类数据中的所有子数据赋予权重,使得待聚类数据中对用户类别划分具有较大影响的子特征所对应的子数据的权重变大,待聚类数据中对用户类别划分具有较小影响,以及具有负面影响的子特征所对应的子数据的权重变小,即得到带权重的待聚类数据。之后,服务器再计算至少一个类别中心中的每个类别中心,与分配了权重之后的带权重的待聚类数据之间的距离信息,从而根据这些距离信息得到目标对象属于每个用户类别的概率,记为类别概率。如此,服务器就可以得到至少一个类别概率。需要说明的是,特征权重信息是指不同的特征类别对用户类别划分的重要程度,与具体特征类别中的特征取值无关。例如,在判断用户类别时,用户对媒体内容的历史阅读记录是比较重要的,而用户所在的地域是不重要的,因而,特征权重信息中会为历史阅读记录这一特征类别分配较高的权重,为用户所在地域这一特征类别分配较低的权重,这些权重是与历史阅读记录、用户所在地域中具体的内容无关的。s104、服务器根据至少一个类别概率从推荐内容库中获取到推荐信息。服务器在得到目标对象属于每个用户类别的类别概率之后,就可以根据这些类别概率,从推荐内容库中的每个用户类别所对应的推荐内容集合中,获取到需要推荐给目标对象的推荐内容,然后对这些推荐内容排序,得到推荐信息。需要说明的是,由于类别概率说明了目标对象属于对应的用户类别的可能性,类别概率越大,说明目标对象越有可能是属于类别概率所对应的用户类别的,也就会对该用户类别所对应的推荐内容集合中的推荐内容感兴趣。因此,服务器在根据至少一个类别概率从推荐内容库中获取推荐信息时,会从较大的类别概率所对应的推荐内容集合中,多获取一些推荐内容,而从较小的类别概率所对应的推荐内容集合中,少获取乃至不获取推荐内容。相应的,服务器在根据至少一个类别概率对所获取到的推荐内容排序时,会将较大的类别概率对应的推荐内容排在前面,而将较小的类别概率所对应的推荐内容排在后面。如此,所得到的推荐信息就会较大程度地贴合目标对象的兴趣。在本发明的一些实施例中,服务器可以将类别概率直接作为推荐内容的获取比例,按照比例从不同的用户类别所对应的推荐内容集合中获取推荐内容。在本发明的另一些实施例中,服务器可以是只从超过预设阈值的类别概率所对应的推荐内容集合中获取推荐内容,不从未达到预设阈值的类别概率所对应的推荐内容集合中获取推荐内容。当然,服务器还可以按照其他的方式获得推荐内容,本发明实施例在此不作限定。s105、终端接收服务器发送的推荐信息;推荐信息是服务器根据目标对象的属性特征确定出的。服务器在根据目标对象的属性特征确定出推荐信息之后,就会将推荐信息发送给目标对象对应的终端,以使终端呈现推荐信息,完成针对目标对象的信息推荐。可以理解的是,目标对象对应的终端是指登录有目标对象的注册账号的终端。示例性的,服务器需要向目标对象推荐某个社交类应用的推荐信息时,会向登录有目标对象在该社交类应用的注册账号的终端发送推荐结果。s106、终端在功能界面接收到推荐信息浏览指令时,进入推荐信息呈现界面。终端在接收到服务器所发送的推荐信息之后,还需要在终端的功能界面上接收推荐信息浏览指令,在接收到目标对象所触发的推荐信息浏览指令之后,终端就会知晓目标对象具有浏览推荐信息的需求,这时,终端会跳转进入推荐信息呈现界面,以便于在后续呈现推荐信息。可以理解的是,推荐信息呈现界面可以是设置在功能界面上的悬浮显示窗口,也可以是占据终端整个显示界面的显示窗口,还可以是其他类型的显示窗口。具体的推荐信息呈现界面可以根据实际情况进行设置,本发明实施例在此不作限定。需要说明的是,在本发明的一些实施例中,终端在接收到推荐信息之后,还可以在功能界面上显示针对推荐信息的提示标识,以提示目标对象具有未浏览的推荐信息。当然,终端还可以利用其它方式来提示目标对象具有未浏览的推荐信息,本发明实施例在此不作具体限定。示例性的,本发明实施例提供了在功能界面上显示提示标识的示意图。如图5所示,功能界面5-1中呈现了社交圈5-11、扫一扫5-12、看一看5-13和搜一搜5-14这四个功能选项,目标对象可以通过点击这4个功能选项,进入到相应的功能页面中去。当终端收到看一看5-13的推荐信息之后,会在看一看5-13的功能选项处显示提示标识,即红点5-2,以此来提醒目标对象看一看5-13中具有未阅读的推荐信息。s107、终端将推荐信息呈现在推荐信息呈现界面上,完成针对目标对象的信息推荐。终端在进入推荐信息呈现界面之后,就会将推荐信息呈现在推荐信息呈现界面上,使得服务器所获取的推荐内容能够按照排列好的顺序呈现给目标对象。至此,通过终端与服务器的协同合作,就完成了针对目标对象的信息推荐过程。示例性的,本发明实施例提供了推荐信息的示意图,参见图6,推荐信息呈现界面6-1的推荐6-12栏目中,分别将推荐内容6-121:重大指示综述、推荐内容6-122:盘点包夹最多的球星,以及推荐内容6-123:“毫无动静”的新闻这三个推荐内容按照顺序呈现出来,如此,终端就完成了对推荐信息的呈现。本发明实施例中,服务器能够先获取由服务器对训练样本数据进行训练所得到的至少一个类别中心、特征权重信息和目标对象对应的特征属性,根据特征属性生成待聚类数据,然后基于待聚类数据和特征权重信息确定出带权重的待聚类数据,根据带权重的待聚类数据和至少一个类别中心,分别确定出目标对象属于至少一个用户类别的至少一个类别概率,再根据至少一个类别概率获取推荐信息得到推荐信息,并将推荐信息发送给目标对象对应的终端,以使终端呈现推荐信息。如此,服务器能够利用特征权重信息消除特征属性中的噪音特征对用户类别划分带来的影响,提高用户类别划分的准确度,从而提高信息推荐的准确度。参见图7,图7是本发明实施例提供的信息推荐方法的一个可选的流程示意图二,在本发明的一些实施例中,服务器基于待聚类数据和特征权重信息确定出带权重的待聚类数据,并根据带权重的待聚类数据和至少一个类别中心,分别确定出目标对象属于至少一个用户类别的至少一个类别概率,即s103的具体实现过程,可以包括:s1031、服务器利用特征权重信息,为待聚类数据中的各个子数据分配权重,得到带权重的待聚类数据。由于待聚类数据是以向量的形式存在,因而,特征权重信息可以为对角矩阵的形式存在,其中,对角矩阵对角线上的元素代表着属性特征中每个子特征的权重,而子特征又与待聚类数据中的子数据对应,如此,服务器只要将特征权重信息与待聚类数据相乘,就可以为待聚类数据中的每个子数据分配对应的权重,得到带权重的待聚类数据。示例性的,本发明实施例提供了服务器为待聚类数据中的各个子数据分配权重的示意图,如图8所示,显示区域8-1中呈现了待聚类数据中,与属性特征中的每个子特征所对应的子数据。其中,子数据8-11、子数据8-12和子数据8-13对应着属性特征中对用户类别划分具有较大影响的三个子特征,子数据8-14、子数据8-15对应着属性特征中对用户类别划分具有影响,但是影响程度不大的两个子特征,子数据8-16、子数据8-17和子数据8-18分别对应着属性特征中对用户类别划分无影响的两个子特征,以及对用户类别划分具有负面影响的一个子特征。在服务器为待聚类数据中的各个子数据分配权重之前,所有子数据的权重均为θ,即所有子数据的重要程度是相同的。之后,服务器将对角矩阵形式的特征权重信息与待聚类属性相乘,此时,会为每个子数据分配到对应的权重,即为子数据8-11、子数据8-12和子数据8-13分别分配权重值为θ1的权重,为子数据8-14、子数据8-15分别分配权重值为θ2的权重,为子数据8-16、子数据8-17和子数据8-18分别分配权重值为θ3的权重,其中θ1>θ2>θ>θ3,这样,所得到的带权重的待聚类数据中的所有子数据的就具有不同的重要程度。在图8中,结合显示区域8-3中所呈现的子数据重要程度的级别8-31、级别8-32、级别8-33和8-34,可以看出显示区域8-2中带权重的待聚类数据中的所有子数据按照重要程度分成了三级,即子数据8-21、子数据8-22和子数据8-23都拥有着级别为8-31的重要程度,子数据8-24和子数据8-25分别拥有着级别8-32的重要程度,子数据8-26、子数据8-27和子数据8-28分别拥有着级别为8-34的重要程度。s1032、服务器对带权重的待聚类数据,与至少一个类别中心中的每个类别中心分别进行距离计算,得到至少一个类别距离信息。服务器得到带权重的待聚类数据之后,就会将带权重的待聚类数据,分别与每个类别中心都计算出类别距离,这样,服务器可以得到与至少一个类别中心一一对应的至少一个类别距离信息。需要说明的是,本发明实施例中,服务器可以对带权重的待聚类数据和每个类别中心计算欧式距离、也可以计算闵式距离,还可以是欧式距离的平方等,本发明实施例在此不作具体限定。示例性的,本发明实施例提供了一种计算带权重的待聚类数据到类别中心的类别距离信息的方式,如式(1)所示:其中,θx为带权重的待聚类数据,x为待聚类数据,θ为特征权重信息,是一个对角矩阵,mc为第c个类别中心,lc为计算出的带权重的待聚类数据到第c个类别中的类别距离信息。当服务器在得到上述参数的具体数值之后,就可以将这些参数的具体数值代入至式(1)中,计算出类别距离信息。如此循环往复,就能够得到与每个类别中心所对应的类别距离信息,即得到至少一个类别距离信息。s1033、服务器对至少一个类别距离信息中的每个类别距离信息进行归一化,得到归一化结果,并利用归一化结果计算出至少一个类别概率。服务器先将至少一个类别距离信息中的所有类别距离信息累加起来,得到类别距离信息的累加结果,然后再用每个类别距离信息与类别距离信息的累加结果相比,得到每个类别距离信息所对应的归一化结果,并将1与归一化结果的差值作为类别概率。这样,服务器就可以得到与每个类别中心所对应的类别概率了,即得到了至少一个类别概率。可以理解的是,在实际应用中,带权重的待聚类数据和类别中心皆是以向量的形式存在,在向量空间中,两个向量之间的距离表征了这两个向量是否接近,因而,类别距离信息表征了带权重的待聚类数据距离类别中心的远近。当带权重的待聚类数据距离类别中心较近时,即类别距离信息较小时,说明带权重的待聚类数据有较大的可能属于该类别中心所对应的用户类别,反之,当类别距离信息较大时,说明带权重的待聚类数据有较小的可能属于该类别中心所对应的用户类别,因此,服务器可以将类别距离信息归一化,然后用1与归一化结果做差,得到类别概率。示例性的,表1示出了本发明实施例的用户类别划分与相关技术中用户类别划分的性能比较结果一。表1示出了相关技术中的四种用户类别划分方法,分别为基于嵌入式学习和稀疏回归的无监督特征选择方法(jointre-beddinglearningandsparseregression,jelsr)1-1进行用户类别划分,利用鲁棒的无监督特征选择(robustunsupervisedfeatureselection,rufs)1-2进行用户类别划分,利用线性判别分析(lineardisc-riminateanalysis,lda)1-3进行用户类别划分,和利用规则线性判别方法(regulationslineard-iscriminateanalysis,rlda)1-4进行用户类别划分。表1用户数据集1用户数据集2用户数据集3jelsr1-157.87±4.3463.17±2.5859.29±3.1rufs1-278.65±5.9063.93±2.5754.64±2.86lda1-385.80±2.0065.74±4.3761.21±8.45rlda1-486.16±1.7663.00±6.6949.38±7.15本发明实施例92.16±1.3066.50±2.4982.76±3.52当用户类别数为k时,从表1可以看出,在用户数据集1上时,jelsr1-1的准确率为57.87,误差为4.34,rufs1-2的准确率为78.65,误差为5.90,lda1-3的准确率为85.80,误差为2.00,rlda1-4的准确率为86.16,误差为1.76,本发明实施例的准确率为92.16,误差为1.30;在用户数据集2上时,jelsr1-1的准确率为63.17,误差为2.58,rufs1-2的准确率为63.93,误差为2.57,lda1-3的准确率为65.74,误差为4.37,rlda1-4的准确率为63.00,误差为6.69,本发明实施例的准确率为66.50,误差为2.49;在用户数据3上时,jelsr1-1的准确率为59.29,误差为3.1,rufs1-2的准确率为54.64,误差为2.86,lda1-3的准确率为61.21,误差为8.45,rlda1-4的准确率为49.38,误差为7.15,本发明实施例的准确率为82.76,误差为3.52。由此可见,不管是在用户数据集1,用户数据集2还是用户数据集3上,本发明实施例的用户类别划分的准确率都是最高的,同时,在用户数据集1和用户数据集2上,本发明实施例的用户类别划分的误差也是最小的,在用户数据集3上,本发明实施例的用户类别划分的误差虽然不是最小的,但也是较小的。综上,本发明实施例的用户类别划分的性能要总体优于相关技术中的四种用户类别划分方法,即利用特征权重信息为待聚类数据分配中的各个子数据分配权重,起到了提高用户类别划分的准确率的效果。可以理解的是,用户类别划分实质上是一个聚类问题,在聚类问题中,除了准确率之外,还可以使用归一化互信息(normalizedmutualinformation,nmi)来度量聚类的性能,nmi越高,聚类的性能越好,即用户类别划分的性能越好。示例性的,表2示出了本发明实施例的用户类别划分与相关技术中用户类别划分的性能比较结果二。与表1类似,表2中也示出了相关技术中的四种用户类别划分方法,即用jelsr1-1进行用户类别划分,利用rufs1-2进行用户类别划分,利用lda1-3进行用户类别划分,和rlda1-4进行用户类别划分。表2用户数据集1用户数据集2用户数据集3jelsr1-133.61±2.5251.47±2.1054.26±2.84rufs1-242.00±3.1557.35±2.3449.02±2.56lda1-386.32±6.8662.69±1.9864.64±7.39rlda1-485.92±5.6063.11±2.6048.71±11.78本发明实施例75.75±4.4066.89±1.9482.53±1.19当用户类别数为k时,从表2可知,在用户数据集1上时,jelsr1-1的nmi为33.61,误差为2.52,rufs1-2的nmi为42.00,误差为3.15,lda1-3的nmi为86.32,误差为6.86,rlda1-4的nmi为85.92,误差为5.60,本发明实施例的nmi为75.75,误差为4.40;在用户数据集2上时,jelsr1-1的nmi为51.47,误差为2.10,rufs1-2的nmi为57.35,误差为2.34,lda1-3的nmi为62.69,误差为1.98,rlda1-4的nmi为63.11,误差为2.60,本发明实施例的nmi为66.89,误差为1.94;在用户数据3上时,jelsr1-1的nmi为54.26,误差为2.84,rufs1-2的nmi为49.02,误差为2.56,lda1-3的nmi为67.64,误差为7.39,rlda1-4的nmi为48.71,误差为11.78,本发明实施例的nmi为82.53,误差为1.19。由此可见,在用户数据集2和用户数据集3上,本发明实施例的用户类别划分的nmi都是最高的,并且误差也是最小的;在用户数据集1上,本发明实施例的用户类别划分的nmi处于中上水平,且误差也没有很大。由此可见,本发明实施例的用户类别划分的性能要总体优于相关技术中的四种用户类别划分方法,也就是说,利用特征权重信息为待聚类数据分配中的各个子数据分配权重,还起到了提高用户类别划分的归一化互信息的效果。本发明实施例中,服务器先利用特征权重信息为待聚类数据中的每个子数据分配权重,得到带权重的待聚类数据,然后计算带权重的待聚类数据与每个类别中心的类别距离信息,最后根据类别距离信息计算出类别概率。如此,能够利用特征权重信息降低待聚类数据中与噪音特征对应的子数据,为用户类别划分所带来的影响,提供用户类别划分的准确度,从而提高信息推荐的准确度。在本发明的一些实施例中,服务器根据至少一个类别概率从推荐内容库中获取到推荐信息,即s104的具体实现过程,可以包括:s1041-s1042,如下:s1041、服务器将至少一个类别概率中的每个类别概率,作为每个用户类别对应的内容获取比例,并按照内容获取比例,从推荐内容库中分别获取到每个用户类别对应的推荐内容。服务器在根据至少一个类别概率从推荐内容库中获取推荐内容时,是先将每个类别概率分别作为每个用户类别所对应的内容获取比例,然后按照内容获取比例,从推荐内容库中与每个用户类别对应的推荐内容集合中,获取相应数量的推荐内容。可以理解的是,服务器在进行信息推荐时,可以规定每次信息推荐过程所需要推荐的内容总数,这时,服务器可以根据内容获取比例和内容总数,确定出需要从每个推荐内容集合中所获取的推荐内容的数量,并按照该数量获取推荐信息;服务器在进行信息推荐时,也可以不规定内容总数,而由根据用户的滑动操作触发获取推荐内容的过程,在每次滑动操作时根据页面所能显示的推荐内容的数量,和内容获取比例从推荐内容集合中获取推荐内容。s1042、服务器按照每个类别概率的大小,为每个用户类别对应的推荐内容进行排序,得到推荐信息。服务器在获取到推荐内容之后,就可以将类别概率较大的用户类别对应的推荐内容排在前面,即在终端中先显示类别概率较大的用户类别对应的推荐内容,将类别概率较小的用户类别对应的推荐内容排在后面,这样,服务器可以完成对不同用户类别所对应的推荐内容的排序,得到推荐信息。需要说明的是,在本发明的一些实施例中,服务器可能针对某个用户类别获取到了多个推荐内容,此时,服务器还需要处于同一用户类别内部的多个推荐内容进行排序。服务器在对处于同一用户类别内部的多个推荐内容进行排序时,可以是根据推荐内容的时间来排序,也可以是根据推荐内容的热度来排序,还可以是进一步确定目标对象对处于同一用户类别内的不同推荐内容的兴趣程度,然后根据该兴趣程度来对推荐内容排序。本发明实施例中,服务器可以将每个类别概率作为内容获取比例,按照内容获取比例获取每个用户类别所对应的推荐内容,以及按照每个类别概率大小为推荐信息进行排序,得到推荐结果。如此,服务器能够将与目标对象的特征属性相似程度更高的用户类别所对应的推荐内容排在前面,使得目标对象在终端中能够先浏览到其所感兴趣的推荐内容。在本发明的一些实施例中,属性特征包括:一个或多个子特征;服务器根据属性特征生成待聚类数据,即s102的具体实现过程,可以包括:s1021-s1022,如下:s1021、服务器根据预设好的子特征与子数据之间的对应关系,为一个或多个子特征中的每个子特征确定出对应的子数据,进而得到一个或多个子数据。服务器先在自身的存储空间中获取预设好的子特征与子数据之间的对应关系,其中,预设好的子特征与子数据之间的对应关系将子特征不同的取值用不同的数值表示出来。之后,服务器根据每个子特征的取值,确定出每个子特征所对应的子数据,如此,服务器就能够得到一个或多个子数据。示例性的,对于性别这一子特征,预设好的子特征与子数据之间的对应关系中,可以将男性用1表示出来,将女性用0表示出来,这样,服务器在得知目标对象的性别子特征的取值为女性时,服务器可以确定出该子特征所对应的子数据0;对于兴趣喜好这一子特征,预设好的子特征与子数据之间的对应关系中,可以将游戏视频用0表示出来,将明星娱乐用1表示出来,将科技趣闻用2表示出来,当服务器得知目标对象的兴趣喜好子特征的取值为科技趣闻时,就可以确定出该子特征对应的子数据2。s1022、服务器将一个或多个子数据进行整合,得到待聚类数据。服务器在得到一个或多个子数据之后,就可以将这些子数据按照属性特征中子特征的排列顺序组合成向量,这样,服务器经过组合所得到的向量即是待聚类数据。本发明实施例中,服务器能够根据预设好的子特征与子数据之间的对应关系,以及子特征的取值,为每个子特征确定出对应的子数据,得到一个或多个子数据,之后,服务器对这些子数据进行整合,得到待聚类数据。通过上述方式,服务器就能够得到待聚类数据,以便于后续利用待聚类数据得到带权重的待聚类数据,进而得到类别概率。参见图9,图9是本发明实施例提供的信息推荐方法的一个可选的流程示意图三。在本发明的一些实施例中,服务器在获取预设好的至少一个用户类别的对应的至少一个类别中心、特征权重信息和目标对象对应的属性特征之前,即在s101之前,该方法还可以包括:s108-s112,如下:s108、服务器获取初始指示概率、初始特征权重信息、惩罚参数以及多个训练样本数据;指示概率表征训练样本数据属于用户类别的概率。服务器在获取至少一个类别中心、特征权重信息之前,需要先训练出至少一个类别中心和特征权重信息。服务器在训练出至少一个类别中心和特征权重信息时,需要先获取到训练过程中所用到的训练样本数据、惩罚参数、初始指示概率和初始特征权重信息。其中,指示概率是表征训练样本属于用户类别的概率,是训练过程中才需要用的参数。需要说明的是,训练出至少一个类别中心和特征权重信息的过程,实质上指的是找到一组类别中心和一个特征权重信息,使得带有权重的训练样本数据到各自所对应的类别中心的距离的平方的累加结果最小。示例性的,本发明实施例中提供了一种训练至少一个类别中心和特征权重信息的公式示意,参见式(2):其中,mc是k个类别中心中的第c个用户类别的类别中心,m是由各个类别中心所组成的矩阵,xi是n个训练样本数据中的第i个训练样本数据,是指示概率信息,即是在用户类别的模糊度为m的情形下,第i个训练数据样本属于第c个用户类别的概率,y是指示概率信息所构成的矩阵,θ是对角矩阵形式的特征权重信息,θ是特征权重信息中的对角元素所组成的向量。y≥0,y1=1,θt1=1,θ≥0为约束条件,y≥0表示每个指示概率信息需要大于等于0,y1=1表示所有指示概率信息的和必须为1,θt1=1表示特征权重信息中所有对角元素的和必须为1,θ≥0表示特征权重信息中所有对角元素需要大于等于0。进一步的,在训练过程中,还需要让概率指示信息所构成的矩阵具有合适的稀疏程度,以使训练样本数据在类别边界不明显时,也可以达到较好的训练效果,即得到更准确的类别中心和特征权重信息。为此,本发明实施例将由指示概率信息所构成的矩阵的f-范数,即指示概率矩阵的f-范数作为正则项,引入到训练过程中,并将模糊度m设置为1。这时,训练出至少一个类别中心和特征权重信息的过程,就变为了找到一组类别中心、一个特征权重信息和一个指示概率矩阵,使得带有权重的训练样本数据到各自所对应的类别中心的距离的平方的累加结果最小,以及每个训练样本数据的指示概率矩阵的f-范数的平方最小。示例性的,本发明实施例提供了引入正则项之后的一种训练至少一个类别中心和特征权重信息的公式示意,如式(3)所示:其中,mc是k个类别中心中第c个用户类别的类别中心,m是由各个类别中心所组成的矩阵,xi是n个训练样本数据中的第i个训练样本数据,yic是指示概率信息,即是在用户类别的模糊度为1的情形下,第i个训练数据样本属于第c个用户类别的概率,y是指示概率矩阵,θ是对角矩阵形式的特征权重信息,θ是特征权重信息中的对角元素所组成的向量,||y||f是指示概率矩阵的f-范数,λ是惩罚参数,y≥0,y1=1,θt1=1,θ≥0为约束条件。值得注意的是,由于上述约束条件,当训练样本数据被对应一个用户类别时,当训练样本数据被分配到多个用户类别中时,是正的且远小于1。同时,惩罚参数λ是训练过程中的超参数,用于调节指示概率矩阵的稀疏程度,例如,当λ=0时,每个训练数据样本的指示概率信息所组成的指示概率向量中只与一个元素为1,其余均为0,即指示概率向量是非常稀疏的,当λ非常大时,指示概率向量的稀疏程度较低,也即可以通过设置惩罚参数的数值,来控制指示概率矩阵的稀疏程度。因而,引入正则项能够为指示概率矩阵找到合适的稀疏度。可以理解的是,初始指示概率、初始特征权重信息指的是在训练开始时经过随机初始化分别得到的指示概率和特征权重信息。值得注意的是,随机初始化所得到的初始指示概率和初始特征权重信息,都需要满足上述约束条件。惩罚参数是超参数,在训练过程中不进行更新。s109、服务器基于初始指示概率、初始特征权重信息和多个训练样本数据中的每个训练样本数据,计算出至少一个用户类别中的每个用户类别对应的临时类别中心。s110、服务器根据临时类别中心、初始特征权重信息、初始指示概率、惩罚参数和每个训练样本数据,确定出临时指示概率。服务器在得到初始指示概率、初始特征权重信息和多个训练样本数据之后,就可以利用初始指示概率和每个训练样本数据,来计算出在当前训练轮次中每个用户类别所对应的类别中心,记为临时类别中心。之后,服务器将临时类别中心和初始特征权重信息看作是固定值,然后结合惩罚参数、经过初始化所得到的初始指示概率以及训练样本数据,来更新当前训练轮次中的指示概率,得到临时指示概率。可以理解的是,在训练开始之前,服务器就已经知晓了预设好的至少一个用户类别的用户类别数目,因而,服务器在计算临时类别中心时,是能够计算出用户类别数目个临时类别中心的。s111、服务器利用临时指示概率、初始特征权重信息、临时类别中心和每个训练样本数据,计算出临时特征权重信息。同理的,服务器经过上述步骤得到临时类别中心和临时指示概率之后,会将临时类别中心和临时指示概率作为固定值,来计算出当前训练轮次中的特征权重信息,即得到临时特征权重信息。s112、服务器重复上述计算出临时类别中心,确定出临时指示概率以及计算出临时特征权重信息的过程,直至临时指示概率的变化幅度处于预设阈值之内时停止训练,得到至少一个类别中心和特征权重信息。服务器在得到临时类别中心、临时指示概率和临时特征权重信息之后,就会再利用这些数据进行下一训练轮次,重复上述步骤中计算出临时类别中心、确定出临时指示概率以及计算出临时特征权重信息的过程。如此循环往复,直到服务器判断出临时指示概率的变化幅度处于预设阈值之内,即临时指示概率基本不变化时,表明训练收敛,此时,服务器将计算出的临时类别中心和临时特征权重信息,分别作为最终的类别中心和特征权重信息。由于指示概率信息是为了使训练所得到的类别中心和特征权重信息更为准确,在实际的信息推荐过程中,指示概率并不参与运算,因而,在训练结束时只需要输出最终的类别中心和特征权重信息即可。需要说明的是,预设阈值可以是根据实际情况进行设定的,本发明实施例在此不作限定。例如,可以将预设阈值设置为0.01,还可以设置为0.005等。可以理解的是,本发明实施例中,服务器还可以设置其他训练停止条件来终止训练,例如设置为达到一定数目的训练轮次时停止训练等,本发明实施例在此不作具体限定。需要说明的是,在本发明的另一些实施例中,s110和s111之间的顺序并不固定,即也可以先根据临时类别中心、初始指示概率、初始特征权重信息和每个训练样本数据,计算出临时特征权重信息,然后再根据临时类别中心、临时特征权重信息、初始指示概率、惩罚参数和每个训练样本数据确定出临时指示概率。本发明实施例中,服务器能够先获取初始指示概率、初始特征权重信息、惩罚参数和多个训练样本数据,然后根据所获取到的初始指示概率、初始特征权重信息和多个训练样本数据计算出每个用户类别的临时类别中心,进而计算出临时指示概率和临时特征权重信息,最后,重复计算出临时类别中心、临时指示概率和临时特征权重信息的过程,直到达到预设训练停止条件,得到至少一个类别中心和特征权重信息。如此,服务器就能够得到类别中心和特征权重信息,以便于在后续根据类别中心和特征权重信息进行信息推荐过程。在本发明的一些实施例中,服务器基于初始指示概率、初始特征权重信息和多个训练样本数据中的每个训练样本数据,计算出至少一个用户类别中每个用户类别对应的临时类别中心,即s109的具体实现过程,可以包括:s1091-s1095,如下:s1091、服务器利用初始特征权重信息,为每个训练样本数据中的各个子数据分配权重,得到带权重的训练样本数据。与特征权重信息类似,初始特征权重信息也是对角矩阵,服务器将初始特征权重信息和每个训练样本数据相乘,以为每个训练样本数据中的各个子数据分配权重,并将乘积结果作为每个训练样本数据所对应的带权重的训练样本数据。示例性的,当训练样本数据用xi表示时,初始特征权重信息用θ表示时,带权重的训练样本数据即为θxi。s1092、服务器将初始指示概率按照用户类别进行划分,得到与每个用户类别对应的类别指示概率集合;类别指示概率向量表征用一个用户类别中每个训练样本数据所对应的初始指示概率的集合。服务器将初始指示概率中属于同一个用户类别的初始指示概率划分到一起,得到与每个用户类别一一对应的类别指示概率集合,值得注意的是,服务器在得到类别指示概率集合时,还可以将同一个用户类别的初始指示概率按照向量的形式拼接起来的,即类别指示概率集合可以以向量的形式存在。示例性的,服务器将初始指示概率中与第c个用户类别对应的每个训练样本数据的初始指示概率集合起来,例如,将第1个训练样本数据属于第c个用户类别的初始指示概率y1c,第2个训练样本数据属于第c个用户类别的初始指示概率y2c,……,第n个训练样本属于第c个用户类别的初始指示概率ync集合起来,得到第c个用户类别所对应的类别指示概率集合。s1093、服务器根据带权重的训练样本数据,和类别指示概率集合中的每个初始指示概率,计算出每个用户类别对应的第一临时中心参数。服务器将带权重的训练样本数据,和某一个用户类别对应的类别指示概率集合中的每个初始指示概率相乘,得到每个初始指示概率所对应的乘积结果,然后将每个乘积结果进行累加,将累加结果作为该用户类别对应的第一临时中心参数。服务器对每个用户类别对应的类别指示概率集合都进行该操作,得到每个用户类别所对应的第一临时中心参数。示例性的,针对第c个用户类别,服务器将第i个训练样本数据所对应的初始指示概率yic,与带权重的训练样本数据θxi相乘,得到第i个训练样本数据对应的乘积结果,再将所得到的所有训练样本数据对应的乘积结果进行累加,将累加结果作为第一临时中心参数。s1094、服务器对类别指示概率集合中的初始指示概率进行累加,得到每个用户类别对应的第二临时中心参数。服务器将某个用户类别对应的类别指示概率集合中的所有初始指示概率进行累加,并将所得到的累加结果作为该用户类别所对应的第二临时中心参数。服务器对每个用户类别对应的类别指示概率集合都进行该操作,得到每个用户类别所对应的第二临时中心参数。示例性的,针对第c个用户类别,服务器将每个训练样本数据所对应的初始指示概率进行累加,将累加所得到的作为第c个用户类别的第二临时中心参数。s1095、服务器根据第一临时中心参数和第二临时中心参数,计算出每个用户类别对应的临时类别中心。服务器在得到每个用户类别所对应的第一临时中心参数和第二临时中心参数之后,就可以将每个用户类别的第一临时中心参数和第二临时参数相比,将所得到的比值结果作为每个用户类别的临时类别中心。示例性的,本发明实施例提供了一种计算第c个用户类别的临时类别中心的方式,如式(4)所示:其中,为第c个用户类别的第一临时中心参数,为第c个用户类别的第二临时中心参数,yic为第i个训练样本数据属于第c个用户类别的初始指示概率,xi为第i个训练样本数据,θ为初始特征权重信息。当服务器在得到上述参数的具体数值之后,就可以将这些参数的数值代入到式(4)中,得到第c个用户类别的临时类别中心。下面,以第c个用户类别为例,来说明临时类别中心计算方式的推导过程。计算临时类别中心,即是在确定了初始指示概率和初始特征权重信息后,使得带有权重的训练样本数据到各自所对应的类别中心的距离的平方最小,以及每个训练样本数据的指示概率矩阵的f-范数的平方最小,也即找到一组类别中心,使其满足式(3)。需要说明的是,由于在确定临时类别中心时不需要对指示概率进行更新,可以不考虑式(3)中的正则项,初始指示概率是已经确定好的,使得由初始指示概率所组成的指示概率矩阵y是固定的,同理的,初始特征权重也是已经确定好的,即对角矩阵形式的特征权重信息θ是不变的,此时,只需要考虑类别中心的变化,即变量只有由临时类别中心所组成的矩阵。据此,可以将式(3)可以改写成式(5),如下:其中,mc是k个类别中心中第c个用户类别的临时类别中心,m是由各个临时类别中心所组成的矩阵,xi是n个训练样本数据中的第i个训练样本数据,yic是初始指示概率,y是由初始指示概率所组成的指示概率矩阵,θ是对角矩阵形式的初始特征权重信息。值得注意的是,在式(5)中,yic和θ都是确定好的固定值。进一步的,由于每个类别中心都是独立的,带权重的训练样本数据,到各自所对应的类别中心的距离的平方的累加结果最小,实质上是要求每个临时类别中心,到属于每个临时类别中心所对应的用户类别的带权重的训练样本数据的距离的平方最小。此时,针对第c个临时类别中心,可以得到式(6):其中,mc是第c个用户类别的临时类别中心,xi是n个训练样本数据中的第i个训练样本数据,yic是初始指示概率。显然,式(6)是一个凸函数,因此,可以对式(6)求导,得到式(6)的导函数,并让式(6)的导函数等于0,并进行变形,就可以得到用于计算第c个用户类别的临时类别中心的式(4)。本发明实施例中,服务器能够利用初始特征权重信息为每个训练样本数据中的各个子数据分配权重,得到带权重的训练样本数据,然后,将初始指示概率划分为与每个用户类别对应的类别指示概率集合,之后,根据带权重的训练样本数据和类别指示概率中的每个初始指示概率,计算出每个用户类别对应的第一临时中心参数,以及将类别指示概率集合中的初始指示概率累加,得到第二临时中心参数,最后用第一临时中心参数和第二临时中心参数计算出每个用户类别对应的临时类别中心。如此,服务器能够完成对类别中心的更新,进而在后续得到至少一个类别中心。本发明的一些实施例中,服务器根据临时类别中心、初始特征权重信息、初始指示概率、惩罚参数和每个训练样本数据,确定出临时指示概率,即s110的具体实现过程,可以包括:s1101-s1105,如下:s1101、服务器将初始指示概率按照训练样本数据进行划分,得到每个训练样本数据对应的样本数据指示概率集合;样本数据指示概率集合表征一个训练样本数据与每个用户类别所对应的指示概率的集合。服务器在确定临时指示概率时,需要将属于同一个训练样本数据所有的初始指示概率集合起来,得到每个用户类别的得到每个训练样本数据所对应的样本指示概率集合。由此可见,样本数据指示概率集合表征了一个训练样本数据对应到每个用户类别的初始指示概率的集合。示例性的,服务器将第i个训练样本数据对应到第1个用户类别的初始指示概率yi1,将第i个训练样本数据对应到第2个用户类别的初始指示概率yi2,……,将第i个训练样本数据对应到第k个用户类别的初始指示概率yik集合到一起,得到样本数据指示概率集合[yi1,yi2,…,yik]t,记为yi*。s1102、服务器利用每个用户类别对应的临时类别中心、初始特征权重信息、惩罚参数和每个训练样本数据,构造出类别参数向量。服务器利用每个用户类别所对应的临时类别中心,初始特征权重、每个训练样本数据一一计算出每个用户类别的临时类别中心,到每个训练样本数据的距离,然后利用所计算出的距离和惩罚参数,构造出训练样本数据的数目个类别参数向量,以便于后续利用这些类别参数向量计算出确定临时指示概率所需要的参数。s1103、服务器计算类别参数向量和样本数据指示概率集合之间的距离,得到第一指示概率参数。服务器在构造出训练样本数据的数目个类别参数向量之后,就会先将类别参数向量和向量形式的样本数据指示概率集合之间进行一一对应,然后计算类别参数向量和其所对应的样本数据指示概率集合之间的距离,将计算出的距离的平方作为第一概率指示参数。可以理解的是,类别参数向量和训练样本数据是一一对应的,而训练样本数据和样本数据指示概率集合之间是一一对应的,因而,类别参数向量和样本数据指示概率集合之间也可以一一对应。需要说明的是,由于类别参数向量和样本数据指示概率集合之间一一对应,因而,服务器功能计算出训练样本数据的数目个第一概率指示参数,即第一概率指示参数和训练样本数据是对应的。示例性的,对于第i个训练样本数据,可以将类别参数向量表示为当样本数据指示概率集合表示为yi*时,类别参数向量和样本数据指示概率集合之间的距离,即第i个训练样本数据对应的第一指示概率参数则为s1104、服务器对样本数据指示概率集合中的每个初始指示概率进行一次或多次调整,得到一个或多个调整后的样本数据指示概率集合,并对类别参数向量和一个或多个调整后的样本数据指示概率集合分别进行距离计算,得到一个或多个第二指示概率参数。服务器在计算出每个训练样本数据对应的第一指示概率参数之后,就会对样本数据指示概率集合中的每个初始指示概率进行调整,每调整一次都会得到一个调整后的样本数据指示概率集合。服务器可以对样本数据指示概率集合中的每个初始指示概率进行一次或多个调整,能够得到一个或多个调整后的样本数据指示概率集合。之后,服务器用每个调整后的样本数据指示概率集合,分别与类别参数向量进行距离计算,将计算结果作为第二指示概率参数,如此,能够得到一个或多个第二概率指示参数。需要说明的是,服务器是对每个训练样本数据所对应的样本数据指示概率集合进行调整,因而,能够针对每个训练样本数据,得到一个或多个调整后的样本数据指示概率集合,即一个训练样本数据,对应一个或多个调整后的样本数据指示概率集合。进而,能够针对每个训练样本数据,得到一个或多个第二概率指示参数。可以理解的是,服务器在对样本数据指示概率集合中的每个初始指示概率进行一次或多次调整时,可以是一次性完成一次或多次调整,还可以是调整一次,计算出第二概率指示参数之后,再继续调整,本发明实施例在此不作限定。在本发明的一些实施例中,服务器对样本数据指示概率集合调整的总次数,可以按照实际情况进行设定,例如,服务器可以对样本数据指示概率集合调整100次,也可以调整500次,本发明实施例在此不作限定。s1105、服务器将第一指示概率参数,以及一个或多个第二指示概率参数中最小的指示概率参数作为临时目标比较结果,并根据临时目标比较结果对应的样本数据指示概率集合,得到临时指示概率。服务器对每个训练样本数据的第一指示概率参数,以及一个或多个第二指示概率参数进行比较,为每个训练样本参数选择出指示概率参数最小的作为临时目标比较结果。之后,找到与每个训练样本参数的目标比较结果所对应的样本数据指示概率集合,该样本数据指示概率集合中的指示概率是最适合训练样本数据的,因而,服务器将该样本数据指示概率集合中的指示概率提取出来,作为训练样本数据对应的临时指示概率。示例性的,本发明实施例提供了第i个训练样本数据的临时指示概率确定公式,如式(7)所示:其中,将第i个训练样本数据的样本数据指示概率集合,和调整后的样本数据指示概率集合都表示为yi*,为第i个训练样本数据的类别参数向量,yi*1=1,yi*≥0是约束条件,表征第i个训练样本数据的样本数据指示概率集合中的初始指示概率之和,以及调整后的样本数据指示概率集合中的初始指示概率之和均需要为1;第i个训练样本数据的样本数据指示概率集合中的初始指示概率,以及调整后的样本数据指示概率集合中的初始指示概率均需要大于等于0。下面,以第i个训练样本数据为例,来说明临时指示概率的计算方式的推导过程。在确定临时指示概率时,初始特征权重信息和临时类别中心都不会发生变化,即初始特征权重信息θ和由临时类别中心所组成的矩阵m都是固定的。在这种情况下,更新临时指示概率,使带有权重的训练样本数据到各自所对应的类别中心的距离的平方最小,以及每个训练样本数据的指示概率矩阵的f-范数的平方最小,即找到由临时指示概率组成的指示概率矩阵y,使其满足式(3)。进一步的,将指示概率矩阵的f-范数展开,得到式(8):其中,mc是k个类别中心中第c个用户类别的临时类别中心,xi是n个训练样本数据中的第i个训练样本数据,yic是临时指示概率,λ是惩罚参数,y是由初始指示概率所组成的指示概率矩阵,θ是对角矩阵形式的初始特征权重信息,y≥0,y1=1是约束条件。值得注意的是,在式(8)中,mc和θ都是固定的。由于每个训练样本数据都是独立的,可以将式(8)分解成n个子问题,其中,第i个训练样本数据对应的子问题可以用式(9)描述:其中,mc是k个用户类别中第c个用户类别的临时类别中心,xi是第i个训练样本数据,yic是初始指示概率,λ是惩罚参数,yi*是第i个训练样本数据对应到每个用户类别的初始指示概率的集合,即第i个训练样本数据的样本数据指示概率集合,θ是对角矩阵形式的初始特征权重信息。对于k个用户类别,利用类似于的公式,可以分别计算出第i个训练样本数据到这k个用户类别的每个临时类别中心的距离的平方,即得到hi1,hi2,……,hik,记为hi*=[hi1,hi2,…,hik]t。依据hi*,将式(9)改写如下:由于是hi*固定值,则可以按照构造平方和的方式,利用式(10)构造出式(11),如下:进一步按照l-2范数变形,可得式(12):此时,若令就可以得到式(7)了。本发明实施例中,服务器能够将初始指示概率划分成与每个训练样本数据对应的样本数据指示概率集合,然后利用构造出类别参数向量,进而根据类别参数向量和样本数据指示概率计算出每个第一指示概率参数,之后,调整样本数据指示概率集合中的初始指示概率,得到一个或多个调整后的样本数据指示概率集合,进而得到一个或多个第二指示概率参数,最后,从第一指示概率参数,以及一个或多个第二指示概率参数中选择出最小的一个指示概率参数作为临时目标比较结果,并用该临时目标比较结果所对应的样本数据指示概率集合中的指示概率,作为临时指示概率。在本发明的一些实施例中,服务器利用每个用户类别对应的临时类别中心、初始特征权重信息、惩罚参数和每个训练样本数据,构造出类别参数向量,即s1102的具体实现过程,可以包括:s1102a-s1102d,如下:s1102a、服务器利用初始特征权重信息,为每个训练样本数据中的各个子数据分配权重,得到带权重的训练样本数据。需要说明的是,本发明实施例中服务器得到带权重的训练样本数据的过程,与s1091中的实现过程类似,在此不再赘述。s1102b、服务器计算带权重的训练样本数据和临时类别中心的距离,得到每个用户类别对应的样本中心距离。由于临时类别中心是与用户类别相对应的,服务器计算带权重的训练样本数据和临时类别中心的距离,是先计算一个带权重的训练样本数据分别到每个用户类别都对应的临时类别中心的距离,得到针对一个带权重的训练样本数据而言,每个用户类别对应的样本中心距离。当服务器对所有的带权重的训练样本数据都进行该运算,就能得到针对每个带权重的训练样本数据而言,每个用户类别所对应的样本中心距离。示例性的,第i个带权重的训练样本数据到第c个临时类别中心的距离,可以表示为hic=||θxi-mc||2,此时,每个用户类别对应的样本中心距离,指的是hi1,hi2,……,hin。其中,mc是第c个用户类别的临时类别中心,xi是第i个训练样本数据,θ是对角矩阵形式的初始特征权重信息。s1102c、服务器根据样本中心距离和惩罚参数,计算出每个用户类别对应的类别参数元素。服务器在得到每个用户类别对应的样本中心距离之后,就会将样本中心距离的平方,与惩罚参数相比,得到比值结果,并求出比较结果的相反数,此时,求相反数所得到的结果即是针对一个带权重的训练样本数据而言,每个用户类别所对应的类别参数元素。服务器对所有的带权重的训练样本数据进行该操作,就可以得到针对每个带权重的训练样本数据,每个用户类别所对应类别参数元素。示例性的,对于第i个带权重的训练样本数据而言,其第c个用户类别所对应的类别参数元素为其每个用户类别所对应的类别参数元素,指的是s1102d、服务器利用每个用户类别对应的类别参数元素,组成类别参数向量。服务器将针对一个带权重的训练样本数据所对应的每个用户类别的类别参数元素,按照向量的形式拼接起来,得到该带权重的训练样本数据对应的类别参数向量。服务器对每个带权重的训练样本数据都进行该操作,就可以得到每个带权重的训练样本数据对应的类别参数向量,即得到训练样本数据的数目个类别参数向量。示例性的,服务器将第i个带权重的训练样本数据的每个用户类别所对应的类别参数元素按照向量的形式拼接起来,得到一个行向量该行向量即是第i个带权重的训练样本数据对应的类别参数向量。本发明实施例中,服务器能够先利用初始特征权重信息为每个训练样本数据中的各个子数据分配权重,得到带权重的训练样本数据,然后计算带权重的训练样本数据和临时类别中心的聚类,得到每个用户类别对应的样本中心距离,接着根据每个用户类别对应的样本中心距离和惩罚参数计算出每个用户类别对应的类别参数元素,进而用这些类别参数元素组成每个训练样本数据对应的类别参数向量,如此,服务器就能够得到类别参数向量,以便于在后续能够利用类别参数向量计算第一指示概率参数和第二指示概率参数。在本发明的一些实施例中,服务器利用临时指示概率、初始特征权重信息、临时类别中心和每个训练样本数据,计算出临时特征权重信息,即s111的具体实现过程,可以包括:s1111-s1116,如下:s1111、服务器利用初始特征权重信息组成初始特征权重向量。服务器在将对角矩阵形式的初始特征权重信息中,处于对角线的元素提取出来,并将这些元素在按照其对角线上的顺序,组成初始特征权重向量,以便于后续利用初始特征权重计算第一特征权重参数和第二特征权重参数。示例性的,当θ是对角矩阵形式的初始特征权重信息时,服务器将θ中的所有对角元素提取出来,组成初始特征权重向量θ。s1112、服务器利用每个训练样本数据和初始特征权重向量,计算出第一特征权重参数。服务器在得到初始特征权重向量之后,就会先将每个训练样本数据,和每个训练样本数据的转置相乘,得到每个训练样本数据所对应的乘积结果。然后利用每个训练样本数所对应的乘积结果组成对角矩阵,得到权重参数矩阵,之后,将初始特征权重向量的转置、所得到的对角矩阵和初始特征权重向量相乘,得到的结果即是第一特征权重参数。示例性的,服务器将权重参数矩阵记为dx,此时,第一特征权重参数就可以表示为θtdxθ。其中,θ是初始特征权重向量。s1113、服务器根据每个训练数据样本、临时类别中心、临时指示概率和初始特征权重向量,计算出第二特征权重参数。服务器继续利用每个训练数据样本、临时类别中心和临时指示概率,构造出一个构造矩阵,然后将该构造矩阵中的对角元素提取出来,组成权重参数向量。接着,服务器将初始特征权重向量的转置与权重参数向量相乘,将所得到的乘积作为第二特征权重参数。示例性的,当服务器利用每个训练数据样本、临时类别中心和临时指示概率,构造出的构造矩阵为a时,权重参数向量可以表示为a,此时,第二特征权重参数则为θta。s1114、服务器对第一特征权重参数和第二特征权重参数做差,得到初始特征向量对应的初始差值结果。s1115、服务器对初始特征权重向量中的初始特征权重信息进行一次或多次调整,得到一个或多个调整后的特征权重向量,进而得到一个或多个调整后的特征权重向量所对应的一个或多个调整差值结果。服务器将利用第一特征权重参数减去第二特征权重参数,将差值结果作为初始差值结果。之后,服务器调整初始特征权重向量中的初始特征权重信息,每调整一次都会得到一个调整后的特征权重向量,在经过一次或多次调整之后,可以得到一个或多个调整后的特征权重向量。之后,服务器再利用一个或多个调整后的特征权重向量按照s1112-s1114的过程,计算得到一个或多个调整差值结果。s1116、服务器将初始差值结果和一个或多个调整差值结果中最小的差值结果作为临时目标差值结果,并根据临时目标差值结果所对应的特征权重向量,得到临时特征权重信息。服务器从计算出的初始差值结果,以及一个或多个调整差值结果中选择出最小的差值结果,将最小的差值结果作为临时目标差值结果。之后,再寻找临时目标差值结果所对应的特征权重向量,最后将该特征权重向量中的各个特征权重信息提取出来,作为最终的临时特征权重信息。示例性的,本发明实施例提供了计算临时特征权重信息的公式,如式(13)所示:其中,第一特征权重参数就可以表示为θtdxθ,θ是初始特征权重向量,dx为权重参数矩阵,第二特征权重参数则为θta,a为权重参数向量可以表示。θt=1,θ≥0为约束条件,表征θ中所有元素之和为1,θ中所有元素均为非负数。在本发明的一些实施例中,对计算临时特征权重信息的公式,即对式(3)还可以进一步优化,此时,为式(3)构造拉格朗日函数,则有:其中,θ是初始特征权重向量,a为权重参数向量,dx为权重参数矩阵,η和α为拉格朗日乘子。针对θ求导,且将求导所得到的导函数等于0,可得:2dxθ-a-η1-αt=0(15)进一步的,对于θ中的每个元素,则有:diiθi-ai-η-αi=0(16)其中,dii是权重参数矩阵dx中的第i个对角元素,θi是θ中的第i个元素。若使θiαi=0,则式(16)可以变形为:此时,在通过牛顿迭代方法确定出拉格朗日乘子η的值之后,就可以直接得到临时特征权重信息。下面,以第i个训练样本数据为例,来说明临时特征权重信息的计算方式的推导过程。在计算临时特征权重信息时,临时类别中心和临时指示概率都是固定值,即由临时类别中心所组成的矩阵m,和由临时指示概率所组成的指示概率矩阵y都是固定的,仅更新初始特征权重信息θ,使得带有权重的训练样本数据到各自所对应的类别中心的距离的平方最小,以及每个训练样本数据的指示概率矩阵的f-范数的平方最小。需要说明的是,由于在计算临时特征权重矩阵时不需要对指示概率进行更新,可以不考虑式(3)中的正则项,此时,针对第i个训练样本数据,可以得到式(18),如下:其中,mc是k个类别中心中第c个用户类别的类别中心,xi是n个训练样本数据中的第i个训练样本数据,yic是临时指示概率,θ是临时特征权重信息,θ是临时特征权重信息中的对角元素所组成的向量,θt1=1,θ≥0为约束条件,表征θ中所有元素的和为1,θ中的所有元素均为非负数。对式(18)进行变形,可得使(19):此时,由于θ是对角矩阵,因而,根据矩阵迹的性质xty=tr(xyt)=tr(yxt),可以对式(19)继续进行转化,得到式(20),如下:再进一步的,用作为对角元素,组成特征参数矩阵dx,用作为矩阵元素,组成n×k的矩阵,然后用该矩阵的对角元素作为特征参数向量,再结合迹的性质,可以得到式(13)。本发明实施例中,服务器能够先用初始特征权重信息组成初始特征权重向量,然后结合每个训练样本数据和初始特征权重向量,计算出第一特征权重参数,并结合每个训练样本数据、临时类别中心、临时指示概率和初始特征权重向量,计算出第二特征权重参数,再结合第一特征权重参数和第二特征权参数计算得到初始差值结果,之后,服务器对初始特征权重向量中的初始特征权重信息进行调整,得到一个或多个调整后的特征权重向量,进而得到一个或多个调整差值结果,然后将初始差值结果和一个或多个调整差值结果中,选择出最小的一个差值结果作为临时目标差值结果,然后将临时目标差值结果对应的特征权重向量中的特征权重信息,作为临时特征权重信息。如此,服务器就能够对初始特征权重信息进行调整,得到临时特征权重信息,以便于在后续得到特征权重信息。在本发明的一些实施例中,服务器利用每个训练样本数据和初始特征权重向量,计算出第一特征权重参数,即s1112的具体实现过程,可以包括:s1112a-s1112c,如下:s1112a、服务器将每个训练样本数据,和每个训练样本数据的转置对应相乘,得到每个训练样本数据对应的训练数据元素。s1112b、服务器利用训练数据元素组成权重参数矩阵。服务器先求出每个训练样本数据的转置,然后将每个训练样本数据,和其所对应的训练样本数据的转置相乘,将所得到乘积结果,作为该训练样本数据对应的训练数据元素。服务器在得到每个训练样本数据对应的训练数据元素之后,就将训练数据元素按照训练样本数据的顺序作为对角元素,得到权重参数矩阵。示例性的,服务器求第i个训练样本数据xi的转置然后将xi与相乘,将所得到的乘积作为第i个训练样本数据对应的训练数据元素,之后,服务器将作为矩阵的第i个对角元素,依次类推,服务器就可以得到权重参数矩阵。s1112c、服务器采用初始特征权重向量、权重参数矩阵和初始特征权重向量的转置向量,计算出第一特征权重参数。服务器将初始特征权重向量的转置向量、权重参数矩阵和初始特征权重向量按照顺序相乘,所得到的乘积结果即为第一特征权重参数。本发明实施例中,服务器能够利用每个训练数据,计算出每个训练数据对应的训练数据元素,进而得到权重参数矩阵,最后利用初始特征权重向量、权重参数矩阵和初始特征权重向量的转置向量计算出第一特征权重参数。如此,服务器在后续就可以利用第一特征权重参数得到临时特征权重信息了。在本发明的一些实施例中,服务器根据每个训练样本数据、临时类别中心、临时指示概率和初始特征权重向量,计算出第二特征权重参数,即s1113的具体实现过程,可以包括:s1113a-s1113b,如下:s1113a、服务器利用每个训练数据样本、临时类别中心和临时指示概率,构造出权重参数向量。服务器用某个训练样本数据的2倍,和每个临时类别中心的转置相乘,然后再用乘积结果与该训练样本数据对应的属于每个用户类别的临时指示概率相乘,得到该训练样本数据的对应的用户类别的数目个矩阵元素。服务器对每个训练样本数据都按照该过程求出用户类别数目个矩阵元素,并用每个训练样本数据对应的用户类别数目个矩阵元素组成矩阵,之后,将该矩阵中的对角元素提取出来,组成权重参数向量。示例性的,若第c个临时类别中心为mc,对于第i个训练样本数据xi,其对于的第c个用户类别的临时指示概率为yic,此时,第i个训练样本数据的第c个矩阵元素可以写为s1113b、服务器将初始特征权重向量的转置向量,与权重参数向量相乘,得到第二特征权重参数。服务器在得到权重参数向量之后,就可以求初始特征权重向量的转置,将所得到的初始特征权重向量的转置向量与权重参数向量相乘,所得到的乘积即为第二特征权重参数。本发明实施例中,服务器能够先利用每个训练数据样本、临时类别中心和临时指示概率构造出权重参数向量,然后再利用权重参数向量、初始特征权重向量的转置向量计算出第二特征权重参数。如此,服务器在后续就能够利用第二特征权重参数得到临时特征权重信息了。在本发明的一些实施例中,服务器在重复上述计算出临时类别中心信息、确定出临时指示概率以及计算出临时特征权重信息的过程,直至临时指示概率的变化处于预设阈值之内时停止条件,得到至少一个类别中心和特征权重信息之后,即在s112之后,该方法还可以包括:s201-s205,如下:s201、服务器对每个训练样本数据,和至少一个类别中心的每个类别中心分别进行距离计算,得到每个训练样本数据对应的至少一个距离信息。s202、服务器将至少一个距离信息的前预设数目个距离信息累加,得到每个训练样本数据的第一惩罚参数因子。服务器先分别计算每个训练样本数据到每个类别中心的距离,得到每个训练样本数据所对应的至少一个距离信息,然后将这些距离信息中的前预设数目个距离信息累加起来,将累加结果的一半作为每个训练样本数据的第一惩罚参数因子。可以理解的是,预设数目可以是根据实际情况进行设定的,预设数目可以为5,也可以为10,本发明实施例在此不做限定。示例性的,当预设数目为s时,第i个训练样本数据到所对应的第一惩罚参数因子可以写为s203、服务器根据第预设数目个距离信息的下一个距离信息,以及预设数目计算出每个训练样本数据的第二惩罚参数因子。服务器找到每个训练样本数据的第预设数目个距离信息的下一个距离信息,然后将预设数目的一半与下一个距离信息相乘,将乘积结果作为第二惩罚参数因子。示例性的,当预设数目为s时,第i个训练样本数据到所对应的第二惩罚参数因子可以写为s204、服务器对第二惩罚参数因子和第一惩罚参数因子做差,得到每个训练样本数据的惩罚子参数。s205、服务器对每个训练样本数据的惩罚子参数求平均,得到更新后的惩罚参数。服务器利用第二惩罚参数因子减去第一惩罚参数因子,将所得到的差值作为惩罚子参数,如此,服务器可以得到每个训练样本数据的惩罚子参数。之后,服务器将这些惩罚子参数累加起来,再用累加所得到的结果与训练样本数据的数目相比,将比值结果作为更新后的惩罚参数,以便于利用更新后的惩罚参数再次进行训练。示例性的,本发明实施例提供了一种计算惩罚参数的公式,参见式(21):其中,n为训练样本数据的数目,s为预设数目,his 1为第i个训练样本数据对应的第预设数目个距离信息的下一个距离信息,hic为第i个训练样本数据到第c个类别中心的距离。服务器在得到上述参数的具体数值之后,就可以将这些参数的具体数值代入到式(21)中,计算出惩罚参数。下面,将说明惩罚参数的计算公式,即式(21)的推导过程。由于惩罚参数是用在更新临时指示概率时的,因而,可以构造式(7)的拉格朗日函数,得到式(22),如下:其中,yi*表示第i个训练样本数据的样本数据指示概率集合,为第i个训练样本数据的类别参数向量,γ和βi是拉格朗日乘子,且取值均大于等于0。之后,由于kkt条件,式(7)的最优解可以写为:其中,(x) =max(0,x),λi表示第i个训练样本数据的惩罚子参数。实际上,对于训练样本数据xi,只希望最近的s个类别中心与其相关。假设hi1,hi2,…,hik已经按照从小到大的顺序排列好,当第i个训练样本数据xi的样本数据指示概率集合为yi*中只有s个非0元素时,根据式(23),可以得到yis>0且yis 1=0,进而可以得到:再结合约束条件yi*1=1,则有:联合式(24)和式(25),可以得到针对λi的不等式:为了使yi*严格有s个非零元素,可以使λi满足式(27):因此,利用式(27)计算出每个训练样本数据的惩罚子参数后,对这些惩罚子参数求平均,就可以得到式(21)。本发明实施例中,服务器还能够根据至少一个类别中心和特征权重信息,重新计算出更新后的惩罚参数,以便于在训练过程结束之后,利用更新后的惩罚参数再次开始训练,得到更准确的类别中心和特征权重信息,进一步提高用户类别划分的准确度,最终提升信息推荐的准确度。下面,将说明本发明实施例在一个实际的应用场景中的示例性应用。本发明实施例是基于社交类应用程序的看一看功能实现的。服务器获取训练过程中所确定出的k个用户类别的聚类中心(至少一个类别中心),权重矩阵(特征权重信息),以及用户a(目标对象)的用户画像(属性特征)之后,就可以先利用用户画像中的自然属性、兴趣画像(子特征)的具体取值(子数据),生成用户a的输入数据(待聚类数据)。之后,服务器用特征矩阵和输入数据相乘,并计算所得到的乘积(带权重的待聚类数据),和k个类别中心的每个类别中心的欧式距离(类别距离信息),最后根据类别距离信息得到输入数据分别属于k个类别中心所确定出的用户类别的概率(类别概率)。当服务器确定出用户a属于用户类别“技术达人”的概率为0.6,属于“家居爱好者”的概率为0.4时,就会按照该概率,从数据库(推荐内容库)中获取推荐文章(推荐内容),其中,从“技术达人”类别获取3篇文章,从“家居爱好者”类别选取2篇文章,之后,将“技术达人”类别下的文章排在前面,将“家居爱好者”类别下的文章排在后面,得到排序结果(推荐信息),并将排序结果发送给用户a的终端。用户a的终端接收到服务器发送的排序结果之后,就会接收用户a在社交类应用程序的界面上(功能界面)所触发的点击操作(推荐信息浏览指令),然后进入到看一看的主界面(推荐信息呈现界面)。之后,终端将排序结果显示在看一看的主界面上,完成针对用户a的信息推荐过程。参见图10,图10是本发明实施例提供的看一看上的推荐结果示意图。在图10的显示区域10-1中,显示了文章的标题:“12306”的架构有多厉害10-11,以及该文章的所属的类别技术达人10-12;在显示区域10-2中,显示了文章的标题:46平米的房间,也可以舒适精彩10-21,以及该文章所属的类别家居爱好者10-22等(推荐信息中的其他文章未示出)。如此,用户a就可以在看一看的主界面上,选择自己感兴趣的文章进行阅读。通过上述方式,服务器将特征矩阵和输入数据相乘,然后计算乘积结果到聚类中心的距离,减少了输入数据中噪音特征对用户聚类的影响,提高了聚类的准确度,从而提高了信息推荐的准确率。下面继续说明本发明实施例提供的信息推荐装置255的实施为软件模块的示例性结构,在一些实施例中,如图2所示,存储在第一存储器250的信息推荐装置255中的软件模块可以包括:获取模块2551,用于获取预设好的至少一个用户类别所对应的至少一个类别中心、特征权重信息和目标对象对应的属性特征;所述特征权重信息表征所述属性特征对用户类别划分的重要程度;所述至少一个类别中心是由所述服务器对所述训练样本数据进行训练得到的;数据生成模块2552,用于根据所述属性特征生成待聚类数据;类别确定模块2553,用于基于所述待聚类数据和所述特征权重信息确定出带权重的待聚类数据,并根据所述带权重的待聚类数据和所述至少一个类别中心,分别确定出所述目标对象属于所述至少一个用户类别的至少一个类别概率;结果生成模块2554,用于根据所述至少一个类别概率从推荐内容库中获取到推荐信息;发送模块2555,用于将所述推荐信息发送给所述目标对象对应的终端。在本发明的一些实施例中,所述类别确定模块2553,具体用于利用所述特征权重信息,为所述待聚类数据中的各个子数据分配权重,得到所述带权重的待聚类数据;对所述带权重的待聚类数据,与所述至少一个类别中心中的每个类别中心分别进行距离运算,得到至少一个类别距离信息;对所述至少一个类别距离信息中的每个类别距离信息进行归一化,得到归一化结果,并利用所述归一化结果计算出所述至少一个类别概率。在本发明的一些实施例中,所述结果生成模块2554,具体用于将所述至少一个类别概率中的每个类别概率,作为所述每个用户类别对应的内容获取比例,并按照所述内容获取比例,从所述推荐内容库中分别获取到所述每个用户类别对应的推荐内容;按照所述每个类别概率的大小,为所述每个用户类别对应的推荐内容进行排序,得到所述推荐结果。在本发明的一些实施例中,所述数据生成模块2552,具体用于根据预设好的子特征与子数据之间的对应关系,为所述一个或多个子特征中的每个子特征确定出对应的子数据,进而得到一个或多个子数据;将所述一个或多个子数据进行整合,得到所述待聚类数据。在本发明的一些实施例中,所述推荐装置255还包括:训练模块2556;所述获取模块2551,还用于获取初始指示概率、初始特征权重信息、惩罚参数以及多个训练样本数据;指示概率表征训练样本数据属于用户类别的概率;所述训练模块2556,用于基于所述初始指示概率、所述初始特征权重信息和所述多个训练样本数据中的每个训练样本数据,计算出所述至少一个用户类别中的每个用户类别对应的临时类别中心;根据所述临时类别中心、所述初始特征权重信息、所述初始指示概率、所述惩罚参数和所述每个训练样本数据,确定出临时指示概率;利用所述临时指示概率、所述初始特征权重信息、所述临时类别中心和所述每个训练样本数据,计算出临时特征权重信息;重复上述计算出所述临时类别中心,确定出临时指示概率以及计算出临时特征权重信息的过程,直至所述临时指示概率的变化幅度处于预设阈值之内时停止训练,得到所述至少一个类别中心和所述特征权重信息。在本发明的一些实施例中,所述训练模块2556,具体用于利用所述初始特征权重信息,为所述每个训练样本数据中的各个子数据分配权重,得到带权重的训练样本数据;将所述初始指示概率按照所述用户类别进行划分,得到与所述每个用户类别对应的类别指示概率集合;所述类别指示概率集合表征一个用户类别中每个训练样本数据所对应的初始指示概率的集合;根据所述带权重的训练样本数据,和所述类别指示概率集合中的每个初始指示概率,计算出所述每个用户类别对应的第一临时中心参数;对所述类别指示概率集合中的初始指示概率进行累加,得到所述每个用户类别对应的第二临时中心参数;根据所述第一临时中心参数和所述第二临时中心参数,计算出所述每个用户类别对应的所述临时类别中心。在本发明的一些实施例中,所述训练模块2556,具体用于将所述初始指示概率按照训练样本数据进行划分,得到所述每个训练样本数据对应的样本数据指示概率集合;所述样本数据指示概率集合表征一个训练样本数据对应到所述每个用户类别的初始指示概率的集合;利用所述每个用户类别对应的所述临时类别中心、所述初始特征权重信息、所述惩罚参数和所述每个训练样本数据,构造出类别参数向量;计算所述类别参数向量和所述样本数据指示概率集合之间的距离,得到第一指示概率参数;对所述样本数据指示概率集合中的每个初始指示概率进行一次或多次调整,得到一个或多个调整后的样本数据指示概率集合,并对所述类别参数向量和所述一个或多个调整后的样本数据指示概率集合分别进行距离计算,得到一个或多个第二指示概率参数;将所述第一指示概率参数,以及所述一个或多个第二指示概率参数中最小的指示概率参数作为临时目标比较结果,并根据所述临时目标比较结果对应的样本数据指示概率集合,得到所述临时指示概率。在本发明的一些实施例中,所述训练模块2556,具体用于利用所述初始特征权重信息,为所述每个训练样本数据中的各个子数据分配权重,得到带权重的训练样本数据;计算所述带权重的训练样本数据和所述临时类别中心的距离,得到所述每个用户类别对应的样本中心距离;根据所述样本中心距离和所述惩罚参数,计算出所述每个用户类别对应的类别参数元素;利用所述每个用户类别对应的所述类别参数元素,组成所述类别参数向量。在本发明的一些实施例中,所述训练模块2556,具体用于利用所述初始特征权重信息组成所述初始特征权重向量;利用所述每个训练样本数据和所述初始特征权重向量,计算出第一特征权重参数;根据所述每个训练数据样本、所述临时类别中心、所述临时指示概率和所述初始特征权重向量,计算出第二特征权重参数;对所述第一特征权重参数与所述第二特征权重参数做差,得到所述初始特征权重向量对应的初始差值结果;对所述初始特征权重向量中的初始特征权重信息进行一次或多次调整,得到一个或多个调整后的特征权重向量,进而得到所述一个或多个调整后的特征权重向量所对应的一个或多个调整差值结果;将所述初始差值结果和所述一个或多个调整差值结果中最小的差值结果作为临时目标差值结果,并根据所述临时目标差值结果所对应的特征权重向量,得到所述临时特征权重信息。在本发明的一些实施例中,所述训练模块2556,具体用于将所述每个训练样本数据,和所述每个训练样本数据的转置对应相乘,得到所述每个训练样本数据对应的训练数据元素;利用所述训练数据元素组成权重参数矩阵;采用所述初始特征权重向量、所述权重参数矩阵和所述初始特征权重向量的转置向量,计算出所述第一特征权重参数。在本发明的一些实施例中,所述训练模块2556,具体用于利用所述每个训练数据样本、所述临时类别中心和所述临时指示概率,构造出权重参数向量;将所述初始特征权重向量的转置向量,与所述权重参数向量相乘,得到所述第二特征权重参数。在本发明的一些实施例中,所述推荐装置255还包括:惩罚参数确定模块2557;所述惩罚参数确定模块2557,用于对所述每个训练样本数据,和所述至少一个类别中心的每个类别中心分别进行距离计算,得到所述每个训练样本数据对应的至少一个距离信息;将所述至少一个距离信息的前预设数目个距离信息累加,得到所述每个训练样本数据的第一惩罚参数因子;根据第预设数目个距离信息的下一个距离信息,以及所述预设数目计算出所述每个训练样本数据的第二惩罚参数因子;对所述第二惩罚参数因子和所述第一惩罚参数因子做差,得到所述每个训练样本数据的惩罚子参数;对所述每个训练样本数据的惩罚子参数求平均,得到更新后的惩罚参数。下面继续说明本发明实施例提供的呈现装置455的实施为软件模块的示例性结构,在一些实施例中,如图3所示,存储在第二存储器450的呈现装置455中的软件模块可以包括:接收模块4551,用于接收服务器发送的推荐结果;所述推荐结果是所述服务器根据所述目标对象的属性特征确定出的;在功能界面接收到推荐信息浏览指令时,进入推荐信息呈现界面;结果呈现模块4552,用于将所述推荐结果呈现在所述推荐信息呈现界面上,完成针对所述目标对象的信息推荐。本发明实施例提供一种存储有可执行指令的存储介质,其中存储有可执行信息推荐指令,当可执行信息推荐指令被第一处理器或第二处理器执行时,将引起第一处理器或第二处理器执行本发明实施例提供的信息推荐方法,例如,如图4、图7和图9示出的方法。在一些实施例中,存储介质可以是fram、rom、prom、eprom、eeprom、闪存、磁表面存储器、光盘、或cd-rom等存储器;也可以是包括上述存储器之一或任意组合的各种设备。在一些实施例中,可执行指令可以采用程序、软件、软件模块、脚本或代码的形式,按任意形式的编程语言(包括编译或解释语言,或者声明性或过程性语言)来编写,并且其可按任意形式部署,包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。作为示例,可执行指令可以但不一定对应于文件系统中的文件,可以可被存储在保存其它程序或数据的文件的一部分,例如,存储在超文本标记语言(html,hypertextmarkuplanguage)文档中的一个或多个脚本中,存储在专用于所讨论的程序的单个文件中,或者,存储在多个协同文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。作为示例,可执行指令可被部署为在一个计算设备上执行,或者在位于一个地点的多个计算设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算设备上执行。以上所述,仅为本发明的实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和范围之内所作的任何修改、等同替换和改进等,均包含在本发明的保护范围之内。当前第1页1 2 3 
技术特征:

1.一种信息推荐方法,其特征在于,应用于服务器,包括:

获取预设好的至少一个用户类别所对应的至少一个类别中心、特征权重信息和目标对象对应的属性特征;所述特征权重信息表征所述属性特征对用户类别划分的重要程度;所述至少一个类别中心是由所述服务器对所述训练样本数据进行训练得到的;

根据所述属性特征生成待聚类数据;

基于所述待聚类数据和所述特征权重信息确定出带权重的待聚类数据,并根据所述带权重的待聚类数据和所述至少一个类别中心,分别确定出所述目标对象属于所述至少一个用户类别的至少一个类别概率;

根据所述至少一个类别概率从推荐内容库中获取到推荐信息;

将所述推荐信息发送给所述目标对象对应的终端。

2.根据权利要求1所述的方法,其特征在于,所述基于所述待聚类数据、和所述特征权重信息确定出带权重的待聚类数据,并根据所述带权重的待聚类数据和所述至少一个类别中心,分别确定出所述目标对象属于所述至少一个用户类别的至少一个类别概率,包括:

利用所述特征权重信息,为所述待聚类数据中的各个子数据分配权重,得到所述带权重的待聚类数据;

对所述带权重的待聚类数据,与所述至少一个类别中心中的每个类别中心分别进行距离运算,得到至少一个类别距离信息;

对所述至少一个类别距离信息中的每个类别距离信息进行归一化,得到归一化结果,并利用所述归一化结果计算出所述至少一个类别概率。

3.根据权利要求1或2所述的方法,其特征在于,所述根据所述至少一个类别概率从推荐内容库中获取到推荐信息,包括:

将所述至少一个类别概率中的每个类别概率,作为所述每个用户类别对应的内容获取比例,并按照所述内容获取比例,从所述推荐内容库中分别获取到所述每个用户类别对应的推荐内容;

按照所述每个类别概率的大小,为所述每个用户类别对应的推荐内容进行排序,得到所述推荐信息。

4.根据权利要求1至3任一项所述的方法,其特征在于,所述属性特征包括:一个或多个子特性;所述根据所述属性特征生成待聚类数据,包括:

根据预设好的子特征与子数据之间的对应关系,为所述一个或多个子特征中的每个子特征确定出对应的子数据,进而得到一个或多个子数据;

将所述一个或多个子数据进行整合,得到所述待聚类数据。

5.根据权利要求1至4任一项所述的方法,其特征在于,在所述获取预设好的至少一个用户类别对应的至少一个类别中心、特征权重信息和目标对象对应的属性特征之前,所述方法还包括:

获取初始指示概率、初始特征权重信息、惩罚参数以及多个训练样本数据;指示概率表征训练样本数据属于用户类别的概率;

基于所述初始指示概率、所述初始特征权重信息和所述多个训练样本数据中的每个训练样本数据,计算出所述至少一个用户类别中的每个用户类别对应的临时类别中心;

根据所述临时类别中心、所述初始特征权重信息、所述初始指示概率、所述惩罚参数和所述每个训练样本数据,确定出临时指示概率;

利用所述临时指示概率、所述初始特征权重信息、所述临时类别中心和所述每个训练样本数据,计算出临时特征权重信息;

重复上述计算出所述临时类别中心,确定出临时指示概率以及计算出临时特征权重信息的过程,直至所述临时指示概率的变化幅度处于预设阈值之内时停止训练,得到所述至少一个类别中心和所述特征权重信息。

6.根据权利要求5所述的方法,其特征在于,所述基于所述初始指示概率、所述初始特征权重信息和所述多个训练样本数据中的每个训练样本数据,计算出所述至少一个用户类别中的每个用户类别对应的临时类别中心,包括:

利用所述初始特征权重信息,为所述每个训练样本数据中的各个子数据分配权重,得到带权重的训练样本数据;

将所述初始指示概率按照所述用户类别进行划分,得到与所述每个用户类别对应的类别指示概率集合;所述类别指示概率集合表征一个用户类别中每个训练样本数据所对应的初始指示概率的集合;

根据所述带权重的训练样本数据,和所述类别指示概率集合中的每个初始指示概率,计算出所述每个用户类别对应的第一临时中心参数;

对所述类别指示概率集合中的初始指示概率进行累加,得到所述每个用户类别对应的第二临时中心参数;

根据所述第一临时中心参数和所述第二临时中心参数,计算出所述每个用户类别对应的所述临时类别中心。

7.根据权利要求5所述的方法,其特征在于,所述根据所述临时类别中心、所述初始特征权重信息、所述初始指示概率、所述惩罚参数和所述每个训练样本数据,确定出临时指示概率,包括:

将所述初始指示概率按照训练样本数据进行划分,得到所述每个训练样本数据对应的样本数据指示概率集合;所述样本数据指示概率集合表征一个训练样本数据对应到所述每个用户类别的初始指示概率的集合;

利用所述每个用户类别对应的所述临时类别中心、所述初始特征权重信息、所述惩罚参数和所述每个训练样本数据,构造出类别参数向量;

计算所述类别参数向量和所述样本数据指示概率集合之间的距离,得到第一指示概率参数;

对所述样本数据指示概率集合中的每个初始指示概率进行一次或多次调整,得到一个或多个调整后的样本数据指示概率集合,并对所述类别参数向量和所述一个或多个调整后的样本数据指示概率集合分别进行距离计算,得到一个或多个第二指示概率参数;

将所述第一指示概率参数,以及所述一个或多个第二指示概率参数中最小的指示概率参数作为临时目标比较结果,并根据所述临时目标比较结果对应的样本数据指示概率集合,得到所述临时指示概率。

8.根据权利要求7所述的方法,其特征在于,所述利用所述每个用户类别对应的所述临时类别中心、所述初始特征权重信息、所述惩罚参数和所述每个训练样本数据,构造出类别参数向量,包括:

利用所述初始特征权重信息,为所述每个训练样本数据中的各个子数据分配权重,得到带权重的训练样本数据;

计算所述带权重的训练样本数据和所述临时类别中心的距离,得到所述每个用户类别对应的样本中心距离;

根据所述样本中心距离和所述惩罚参数,计算出所述每个用户类别对应的类别参数元素;

利用所述每个用户类别对应的所述类别参数元素,组成所述类别参数向量。

9.根据权利要求5所述的方法,其特征在于,所述利用所述临时指示概率、所述初始特征权重信息、所述临时类别中心和所述每个训练样本数据,计算出临时特征权重信息,包括:

利用所述初始特征权重信息组成所述初始特征权重向量;

利用所述每个训练样本数据和所述初始特征权重向量,计算出第一特征权重参数;

根据所述每个训练数据样本、所述临时类别中心、所述临时指示概率和所述初始特征权重向量,计算出第二特征权重参数;

对所述第一特征权重参数与所述第二特征权重参数做差,得到所述初始特征权重向量对应的初始差值结果;

对所述初始特征权重向量中的初始特征权重信息进行一次或多次调整,得到一个或多个调整后的特征权重向量,进而得到所述一个或多个调整后的特征权重向量所对应的一个或多个调整差值结果;

将所述初始差值结果和所述一个或多个调整差值结果中最小的差值结果作为临时目标差值结果,并根据所述临时目标差值结果所对应的特征权重向量,得到所述临时特征权重信息。

10.根据权利要求9所述的方法,其特征在于,所述利用所述每个训练样本数据和所述初始特征权重向量,计算出第一特征权重参数,包括:

将所述每个训练样本数据,和所述每个训练样本数据的转置对应相乘,得到所述每个训练样本数据对应的训练数据元素;

利用所述训练数据元素组成权重参数矩阵;

采用所述初始特征权重向量、所述权重参数矩阵和所述初始特征权重向量的转置向量,计算出所述第一特征权重参数。

11.根据权利要求9所述的方法,其特征在于,所述根据所述每个训练样本数据、所述临时类别中心、所述临时指示概率和所述初始特征权重向量,计算出第二特征权重参数,包括:

利用所述每个训练数据样本、所述临时类别中心和所述临时指示概率,构造出权重参数向量;

将所述初始特征权重向量的转置向量,与所述权重参数向量相乘,得到所述第二特征权重参数。

12.根据权利要求5所述的方法,其特征在于,在所述重复上述计算出所述临时类别中心信息,确定出临时指示概率以及计算出临时特征权重信息的过程,直至所述临时指示概率的变化幅度处于预设阈值之内时停止训练,得到所述至少一个类别中心和所述特征权重信息之后,所述方法还包括:

对所述每个训练样本数据,和所述至少一个类别中心的每个类别中心分别进行距离计算,得到所述每个训练样本数据对应的至少一个距离信息;

将所述至少一个距离信息的前预设数目个距离信息累加,得到所述每个训练样本数据的第一惩罚参数因子;

根据第预设数目个距离信息的下一个距离信息,以及所述预设数目计算出所述每个训练样本数据的第二惩罚参数因子;

对所述第二惩罚参数因子和所述第一惩罚参数因子做差,得到所述每个训练样本数据的惩罚子参数;

对所述每个训练样本数据的惩罚子参数求平均,得到更新后的惩罚参数。

13.一种信息推荐装置,其特征在于,包括:

获取模块,获取预设好的至少一个用户类别所对应的至少一个类别中心、特征权重信息和目标对象对应的属性特征;所述特征权重信息表征所述属性特征对用户类别划分的重要程度;所述至少一个类别中心是由所述服务器对所述训练样本数据进行训练得到的;

数据生成模块,用于根据所述属性特征生成待聚类数据;

类别确定模块,用于基于所述待聚类数据和所述特征权重信息确定出带权重的待聚类数据,并根据所述带权重的待聚类数据和所述至少一个类别中心,分别确定出所述目标对象属于所述至少一个用户类别的至少一个类别概率;

结果生成模块,用于根据所述至少一个类别概率从推荐内容库中获取到推荐信息;

发送模块,用于将所述推荐信息发送给所述目标对象对应的终端。

14.一种服务器,其特征在于,包括:

第一存储器,用于存储可执行信息推荐指令;

第一处理器,用于执行所述第一存储器中存储的可执行信息推荐指令时,实现权利要求1至12任一项所述的方法。

15.一种存储介质,其特征在于,存储有可执行信息推荐指令,用于引起第一处理器执行时,实现权利要求1至12任一项所述的方法。

技术总结
本发明提供了一种信息推荐方法、装置、设备及存储介质;该方法包括:获取预设好的至少一个用户类别所对应的至少一个类别中心、特征权重信息和目标对象对应的属性特征;特征权重信息表征属性特征对用户类别划分的重要程度;根据属性特征生成待聚类数据;基于待聚类数据和特征权重信息确定出带权重的待聚类数据,并根据带权重的待聚类数据和至少一个类别中心,分别确定出目标对象属于至少一个用户类别的至少一个类别概率;根据至少一个类别概率从推荐内容库中获取推荐信息并排序,得到推荐结果;将推荐结果发送给目标对象对应的终端。通过本发明,能够提高信息推荐的准确度。

技术研发人员:黎功福
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:2020.01.09
技术公布日:2020.06.05

转载请注明原文地址: https://bbs.8miu.com/read-57037.html

最新回复(0)