本申请涉及互联网
技术领域:
,尤其涉及一种数据处理方法、装置、存储介质及设备。
背景技术:
:随着互联网技术的发展,越来越多的商家选择通过内容展示平台来推广商品或服务,内容展示平台是指用于展示业务内容的平台,业务内容可以包括商家需要推广的商品对应的商品信息(如名称、类型),或者需要推广的服务对应的服务信息(如服务内容)。实践中发现,存在内容展示平台通过制造大量异常用户(如虚假用户),来访问内容展示平台所展示的业务内容,以达到增加内容展示平台的访问量的目的。目前,主要通过对每个访问用户的访问行为进行分析,以识别出异常访问用户,但是存在异常访问用户模仿正常访问用户的访问行为的情况,导致将异常访问用户误识别为正常访问用户,降低对异常访问用户的识别准确度。技术实现要素:本申请实施例所要解决的技术问题在于,提供一种数据处理方法、装置、存储介质及设备,能够提高对异常访问用户的识别准确度。本申请实施例一方面提供一种数据处理方法,包括:获取与至少两个内容展示平台相关联的访问用户,该至少两个内容展示平台用于向该访问用户提供业务内容;根据该访问用户生成该至少两个内容展示平台之间的访问用户重叠度;根据该访问用户重叠度在该至少两个内容展示平台中筛选被异常访问的内容展示平台,作为目标内容展示平台;从属于该目标内容展示平台的访问用户中确定异常访问用户。本申请实施例一方面提供一种数据处理装置,包括:获取模块,用于获取与至少两个内容展示平台相关联的访问用户,该至少两个内容展示平台用于向该访问用户提供业务内容;生成模块,用于根据该访问用户生成该至少两个内容展示平台之间的访问用户重叠度;筛选模块,用于根据该访问用户重叠度在该至少两个内容展示平台中筛选被异常访问的内容展示平台,作为目标内容展示平台;确定模块,用于从属于该目标内容展示平台的访问用户中确定异常访问用户。上述筛选模块,包括:连接单元,用于将该至少两个内容展示平台确定为至少两个节点,将该至少两个节点中访问用户重叠度大于第一重叠阈值的两个节点进行连接,得到包含该至少两个节点的平台网络图;第一确定单元,用于若该平台网络图中包括完全子图,且该完全子图中的节点的数量大于第一数量阈值,则将该完全子图中访问用户重叠度大于第二重叠阈值的两个节点,作为该目标内容展示平台。上述筛选模块,包括:第二确定单元,用于从该至少两个内容展示平台中确定与第一内容展示平台的访问用户重叠度大于第三重叠阈值的内容展示平台,作为第二内容展示平台,该第一内容展示平台属于该至少两个内容展示平台;第一获取单元,用于获取该第二内容展示平台的数量;第二确定单元,还用于若该第二内容展示平台的数量大于第二数量阈值,则将该第一内容展示平台作为该目标内容展示平台。可选的,该至少两个内容展示平台包括内容展示平台ki和内容展示平台kj,i和j均为小于或等于n的正整数,n为该至少两个内容展示平台中的内容展示平台数量;上述生成模块,包括:第三确定单元,用于将属于该内容展示平台ki的访问用户,作为第一访问用户集合,将属于该内容展示平台kj的访问用户,作为第二访问用户集合;第二获取单元,用于获取该第一访问用户集合和该第二访问用户集合之间的相似度,作为第一相似度;上述第三确定单元,还用于根据该第一相似度确定该内容展示平台ki和该内容展示平台kj的访问用户重叠度。上述第二获取单元,包括:第一获取子单元,用于获取该第一访问用户集合和该第二访问用户集合具有相同用户标识的访问用户,作为重叠访问用户集合;合并子单元,用于对该第一访问用户集合和该第二访问用户集合进行合并,得到合并后的访问用户集合;第一确定子单元,用于将该重叠访问用户集合与该合并后的访问用户集合之间的比值,作为该第一相似度。可选的,上述第三确定单元,包括:第二确定子单元,用于将属于该内容展示平台ki的访问用户,作为第一待选访问用户集合;将属于该内容展示平台kj的访问用户,作为第二待选访问用户集合;第二获取子单元,用于获取属于该内容展示平台ki的访问用户对该内容展示平台ki的访问次数,作为第一访问次数,获取属于该内容展示平台kj的访问用户对该内容展示平台kj的访问次数,作为第二访问次数;生成子单元,用于根据该第一访问次数生成属于该内容展示平台ki的访问用户对应的虚拟访问用户,作为第一虚拟访问用户,该第一虚拟访问用户的数量与该第一访问次数具有正相关关系;根据该第二访问次数生成属于该内容展示平台kj的访问用户对应的虚拟访问用户,作为第二虚拟访问用户,该第二虚拟访问用户的数量与该第二访问次数具有正相关关系;添加子单元,用于将该第一虚拟访问用户添加至该第一待选访问用户集合,得到该第一访问用户集合,将该第二虚拟访问用户添加至该第二待选访问用户集合,得到该第二访问用户集合。上述确定模块,包括:第三获取单元,用于获取属于该目标内容展示平台的访问用户的访问行为数据;第四确定单元,用于根据该访问行为数据从属于该目标内容展示平台的访问用户中确定异常访问用户。可选的,访问用户pm和访问用户pn属于该目标内容展示平台,m和n均为小于或等于t的正整数,t为属于该目标内容展示平台的访问用户的数量,该访问行为数据包括所访问过的内容展示平台;可选的,第三获取单元,包括:第三确定子单元,用于将该访问用户pm所访问过的内容展示平台,作为第一内容展示平台集合,将该访问用户pn所访问过的内容展示平台,作为第二内容展示平台集合;第三获取子单元,用于获取该第一内容展示平台集合和该第二内容展示平台集合之间的相似度,作为第二相似度;上述第三确定子单元,用于若该第二相似度大于相似度阈值,则将该访问用户pm和该访问用户pn作为异常访问用户。第三获取子单元,用于获取该第一内容展示平台集合和该第二内容展示平台集合具有相同平台标识的内容展示平台,作为重叠内容展示平台集合;对该第一内容展示平台集合和该第二内容展示平台集合进行合并,得到合并后的内容展示平台集合;将该重叠内容展示平台集合和该合并后的内容展示平台集合之间的比值,作为该第二相似度。第三确定子单元,用于将该访问用户pm所访问过的内容展示平台,作为第一待选内容展示平台集合,将该访问用户pn所访问过的内容展示平台,作为第二待选内容展示平台集合;获取该访问用户pm对该第一待选内容展示平台集合中的内容展示平台的访问次数,作为第三访问次数;获取该访问用户pn对该第二待选内容展示平台集合中的内容展示平台的访问次数,作为第四访问次数;根据该第三访问次数生成该第一待选内容展示平台集合中的内容展示平台对应的虚拟内容展示平台,作为第一虚拟内容展示平台,该第一虚拟内容展示平台的数量与该第三访问次数具有正相关关系;根据该第四访问次数生成该第二待选内容展示平台集合中的内容展示平台对应的虚拟内容展示平台,作为第二虚拟内容展示平台,该第二虚拟内容展示平台的数量与该第四访问次数具有正相关关系;将该第一虚拟内容展示平台添加至该第一待选内容展示平台集合中,得到该第一内容展示平台集合;将该第二虚拟内容展示平台添加至该第二待选内容展示平台集合中,得到该第二内容展示平台集合。可选的,该访问行为数据包括访问用户所属的机构;确定模块,用于根据该访问行为数据从属于该目标内容展示平台的访问用户中确定属于目标机构的访问用户;获取属于该目标机构的访问用户的数量;若属于该目标机构的访问用户的数量大于第三数量阈值,则将属于该目标机构的访问用户确定为异常访问用户。可选的,该访问行为数据包括对该目标内容展示平台提供的业务内容的访问时长;确定模块,用于获取属于该目标内容展示平台的访问用户在该目标内容展示平台上的登录时长;将属于该目标内容展示平台且该访问时长与该登录时长的差值小于时长阈值的访问用户,作为异常访问用户。本申请一方面提供了一种计算机设备,包括:处理器、存储器、网络接口;上述处理器与存储器、网络接口相连,其中,网络接口用于提供数据通信功能,上述存储器用于存储计算机程序,上述处理器用于调用上述计算机程序,以执行本申请实施例中上述一方面中的方法。本申请实施例一方面提供了一种计算机可读存储介质,上述计算机可读存储介质存储有计算机程序,上述计算机程序包括程序指令,上述程序指令当被处理器执行时,以执行如本申请实施例中的方法。本申请实施例中,计算机设备可以获取与至少两个内容展示平台关联的访问用户,根据访问用户生成至少两个内容展示平台之间的访问用户重叠度,由于该访问用户重叠度能够反映同一访问用户访问多个内容展示平台的情况;因此,通过访问用户重叠度可从至少两个内容展示平台筛选被异常访问的内容展示平台,作为目标内容展示平台,即可通过访问用户重叠度可识别出聚集异常访问用户的目标内容展示平台。另外,通过从属于目标内容展示平台的访问用户确定出异常访问用户,即通过对内容展示平台的访问数据以及访问用户进行分析,来识别异常访问用户,可提高对异常访问用户的识别准确度;且不需要对属于至少两个内容展示平台的所有访问用户进行分析,可提高对异常访问用户的识别效率,降低识别出异常访问用户的复杂度。另外,通过内容展示平台之间的访问用户重叠度可快速的识别出内容展示平台中的异常访问用户,可避免异常访问用户导致网络拥塞的问题,提高对商品或服务的推广效果;可降低商家对产品或服务的推广费用,提高评估推广效果的准确度。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本申请实施例提供的一种数据处理系统的架构图;图2a是本申请实施例提供的一种数据处理方法的应用场景图;图2b是本申请实施例提供的一种数据处理方法的应用场景图;图2c是本申请实施例提供的一种数据处理方法的应用场景图;图3是本申请实施例提供的一种数据处理方法的流程示意图;图4a是本申请实施例提供的一种获取第一相似度的应用场景图;图4b是本申请实施例提供的一种获取第一相似度的应用场景图;图5a是本申请实施例提供的一种获取平台网络图的应用场景图;图5b是本申请实施例提供的一种平台网络图;图5c是本申请实施例提供的一种平台网络图;图6是本申请实施例提供的一种访问量的示意图;图7是本申请实施例提供的一种获取第二相似度的应用场景图;图8是本申请实施例提供的一种获取第二相似度的应用场景图;图9是本申请实施例提供的一种可视化的内容展示平台的示意图;图10是本申请实施例提供的一种访问量的示意图;图11是本申请实施例提供的一种数据处理装置的结构示意图;图12是本申请实施例提供的一种计算机设备的结构示意图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。请参见图1,图1为本发明实施例提供的一种数据处理系统,数据处理系统包括服务器10及至少一个终端,图1中以三个终端为例,分别为终端11、终端12以及终端13。其中,终端11、终端12以及终端13均是指面向用户的终端,终端11、终端12以及终端13均是指面向访问业务内容的用户(即访问用户)的终端;终端11、终端12以及终端13均可以是智能手机、平板电脑、便携式个人计算机、智能手表、手环及智能电视等智能设备。其中,服务器10可以是指面向发布业务内容的用户(即发布者)的设备,发布者可以是指商家或流量主,流量主可以是指为商家发布业务内容的用户或机构,即流量主是指为商家提供内容展示平台的用户;服务器10可以是一台独立的服务器、或由若干台服务器组成的服务器集群、或云计算中心。此处该业务内容可以称为广告内容,具体是指为推销商品或提供服务,以付费方式通过广告媒体向消费者或用户传播的商品信息或服务信息;业务内容可以是指由文本、视频、图像、语音等中的至少一种构成。内容展示平台可包括后台服务器以及前端展示页面,后台服务器用于为前端展示页面提供服务,如提供前端展示页面的渲染服务,以及响应访问用户对前端展示页面的访问请求等。内容展示平台的前端展示页面可以包括应用程序的服务页面,例如社交软件的会话窗口界面或公众号的网页;或者网页界面,例如论坛空间等;或者,小程序的服务页面。公众号可以是指应用账号,可实现和特定群体的文字、图片、语音、视频的全方位沟通、互动;小程序可以是指一种不需要下载安装包即可使用的应用。内容展示平台包括的后台服务器可以是指上述服务器10,也可以是指独立的服务器。在一个实施例中,当商家需要推广商品或服务时,服务器10可以根据商品对应的商品信息或服务对应的服务信息生成业务内容,商品信息包括商品的价格、名称、购买地址以及产地等信息,服务信息可以包括价格、服务内容以及服务时长等信息。服务器10生成业务内容后,可将业务内容发布至少两个内容展示平台。如图2a中,以商家推广女包为例,内容展示平台包括内容展示平台1和内容展示平台2,内容展示平台1为小程序,内容展示平台2为网页页面。内容展示平台1的前端展示界面14中包括女包的图片、介绍信息(如颜色)以及价格等信息,内容展示平台2的前端展示界面15中包括女包的视频、介绍信息以及价格等信息。当服务器10发布业务内容后,各个终端对应的终端用户可以访问内容展示平台上展示的业务内容,此处访问业务内容可以包括点击业务内容、下载业务内容、查看业务内容等等。如图2b所示,服务器10可从各个终端获取用户针对业务内容的访问行为数据,访问行为数据可以包括业务内容的内容展示平台的平台标识、访问用户的用户标识、访问时间以及访问次数等等。服务器10可以根据访问行为数据获取属于内容展示平台1的访问用户,根据访问行为数据获取属于内容展示平台2的访问用户。属于内容展示平台1的访问用户是指:访问过内容展示平台1上的业务内容的用户,属于内容展示平台2的访问用户是指:访问过内容展示平台2上的业务内容的用户,属于内容展示平台1的访问用户和属于内容展示平台2的访问用户均可包括多个访问用户。以属于内容展示平台1的访问用户包括用户2和用户3,属于内容展示平台2的访问用户包括用户1、用户2以及用户3为例。服务器10可以根据属于内容展示平台1的访问用户和属于内容展示平台2的访问用户计算内容展示平台1和内容展示平台2的访问用户重叠度;该访问用户重叠度可以用于反映内容展示平台1和内容展示平台2中访问用户访问多个内容展示平台的行为。如图2c所示,如果内容展示平台1和内容展示平台2的访问用户重叠度小于或等于第四重叠阈值,表明内容展示平台1和内容展示平台2中存在较少的访问用户访问多个内容展示平台,或不存在访问用户访问多个内容展示平台,因此,可确定内容展示平台1和内容展示平台2未被异常访问。如果内容展示平台1和内容展示平台2的访问用户重叠度大于第四重叠阈值,表明内容展示平台1和内容展示平台2中存在较多访问用户访问多个内容展示平台,即存在访问用户以刷访问量为目的,而访问多个内容展示平台,因此,可确定内容展示平台1和内容展示平台2被异常访问,将内容展示平台1和内容展示平台2作为目标内容展示平台。进一步,服务器10可以将内容展示平台1和内容展示平台2之间的相同访问用户作为异常访问用户,内容展示平台1和内容展示平台2之间的相同访问用户是指:均访问过内容展示平台1和内容展示平台2的访问用户,即此处相同访问用户包括访问用户1和访问用户2。因此,服务器10可以将访问用户1和访问2作为异常访问用户。或者,服务器10可以获取属于内容展示平台1的访问用户的访问行为数据,根据访问行为数据从属于内容展示平台1的访问用户中确定出异常访问用户;同理,获取属于内容展示平台2的访问用户的访问行为数据,根据访问行为数据从属于内容展示平台2的访问用户中确定出异常访问用户。可见,通过内容展示平台之间的访问用户重叠度可快速的识别出内容展示平台中的异常访问用户,可避免异常访问用户导致网络拥塞的问题,提高对商品或服务的推广效果;可降低商家对产品或服务的推广费用,提高评估推广效果的准确度。基于上述的描述,请参见图3,是本申请实施例提供的一种数据处理方法的流程示意图。该方法可由计算机设备来执行,该计算机设备可以是指终端或图1中的服务器,如图3所示,上述方法可以包括:s101、获取与至少两个内容展示平台相关联的访问用户,该至少两个内容展示平台用于向该访问用户提供业务内容。为了准确地识别出异常访问用户,计算机设备可以从至少两个内容展示平台的后台服务器中获取关于访问用户的访问行为数据,或者,从终端中获取关于访问用户的访问行为数据,或可从第三方获取关于访问用户的访问行为数据。第三方可以是指流量主所管理的设备中,流量主是指为商家发布业务内容的机构或个人。该访问行为数据可以包括与至少两个内容展示平台相关联的访问用户的用户标识、访问次数、访问时间、内容展示平台的平台标识以及业务内容的类型等等;用户标识可以是指访问用户在内容展示平台中的注册用户账号或访问用户所使用的设备标识(如手机号码、手机的序列码等);平台标识可以是指内容展示平台的名称、版本号或网页地址等等。与内容展示平台关联的访问用户可以是指访问该内容展示平台提供的业务内容的用户,内容展示平台之间具有相同的访问用户。例如,用户1访问了内容展示平台1提供的业务内容,也访问了内容展示平台2提供的业务内容;那么可以称用户1属于内容展示平台1和内容展示平台2的访问用户。业务内容的类型可以包括推广应用程序的业务内容、推广商品的业务内容、推广文章的业务内容,应用程序可包括但不限于:游戏应用程序、社交应用程序以及购物应用程序等;商品可以包括衣物、书籍或食品等。内容展示平台之间提供的业务内容可以相同,也可以不相同。s102、根据该访问用户生成该至少两个内容展示平台之间的访问用户重叠度。计算机设备可以获取该至少两个内容展示平台之间的相同访问用户,根据相同访问用户生成该至少两个内容展示平台之间的访问用户重叠度。访问用户重叠度用于反映同一访问用户访问多个内容展示平台的情况,也可称访问用户重叠度用于反映该至少两个内容展示平台之间的相同访问用户的数量,即内容展示平台之间的相同访问用户的数量与内容展示平台之间的访问用户重叠度具有正相关关系。即内容展示平台之间的相同访问用户的数量越多,则内容展示平台之间的访问用户重叠度也越大;反之,内容展示平台之间的相同访问用户的数量越少,则内容展示平台之间的访问用户重叠度也越小。或者,该访问用户重叠度还用于反映该至少两个内容展示平台之间的相同访问用户的访问行为,访问行为可以包括访问时长或访问次数等。s103、根据该访问用户重叠度在该至少两个内容展示平台中筛选被异常访问的内容展示平台,作为目标内容展示平台。对内容展示平台的异常访问行为包括但不限于:①通过运行脚本来访问多个内容展示平台提供的业务内容;②通过给访问用户支付电子资源的方式,来诱导访问用户访问多个内容展示平台提供的业务内容;③伪造访问用户针对多个内容展示平台的访问行为数据。④访问用户被机构控制,来访问多个内容展示平台;即存在内容展示平台按照机构的需求,来控制属于机构的访问用户访问内容展示平台。也就是说,异常访问可是指访问用户通过访问多个内容展示平台来刷访问量(或访问流量),以赚取推广费用的行为。如果至少两个内容展示平台之间的访问用户重叠度较大,表明至少两个内容展示平台之间的相同访问用户的数量越多,即存在同一访问用户访问多个内容展示平台的情况,则内容展示平台被异常访问的概率比较高。即如果至少两个内容展示平台之间的访问用户重叠度较小,表明至少两个内容展示平台之间的相同访问用户的数量越少,内容展示平台被异常访问的概率比较低。因此,计算机设备可以根据该访问用户重叠度在该至少两个内容展示平台中筛选被异常访问的内容展示平台,作为目标内容展示平台。目标内容展示平台是指被异常访问的内容展示平台,即目标内容展示平台中聚集大量异常访问用户,异常访问用户可以是指以刷访问量(或访问流量)为目的,而访问内容展示平台的用户。即目标内容展示平台可以是指至少两个内容展示平台中访问用户重叠度最大的两个内容展示平台,或者,是指与多个内容展示平台之间的访问用户重叠度均较大的内容展示平台。s104、从属于该目标内容展示平台的访问用户中确定异常访问用户。商家通常是根据访问用户对业务内容的访问量来评估产品或服务的推广效果,根据访问用户对业务内容的访问量来向内容展示平台来支付推广费用。如果这些访问量中包含异常访问用户所产生的访问量,会降低推广效果的评估准确性,增加商家对产品或服务的推广费用。因此,在确定目标内容展示平台后,计算机设备可以从属于该目标内容展示平台的访问用户中确定异常访问用户,属于目标内容访问平台的访问用户是指访问过目标内容展示平台的用户。具体的,计算机设备可以访问用户的访问行为数据从属于该目标内容展示平台的访问用户中确定异常访问用户;或者,可以将目标内容展示平台之间的相同访问用户作为异常访问用户。通过从属于目标内容展示平台的访问用户中识别出异常访问用户,可降低商家对产品或服务的推广费用,提高评估推广效果的准确度。本申请实施例中,计算机设备可以获取与至少两个内容展示平台关联的访问用户,根据访问用户生成至少两个内容展示平台之间的访问用户重叠度,由于该访问用户重叠度能够反映同一访问用户访问多个内容展示平台的情况;因此,通过访问用户重叠度可从至少两个内容展示平台筛选被异常访问的内容展示平台,作为目标内容展示平台,即可通过访问用户重叠度可识别出聚集异常访问用户的目标内容展示平台。另外,通过从属于目标内容展示平台的访问用户确定出异常访问用户,即通过对内容展示平台的访问数据以及访问用户进行分析,来识别异常访问用户,可提高对异常访问用户的识别准确度;且不需要对属于至少两个内容展示平台的所有访问用户进行分析,可提高对异常访问用户的识别效率,降低识别出异常访问用户的复杂度。另外,通过内容展示平台之间的访问用户重叠度可快速的识别出内容展示平台中的异常访问用户,可避免异常访问用户导致网络拥塞的问题,提高对商品或服务的推广效果;可降低商家对产品或服务的推广费用,提高评估推广效果的准确度。在一个实施例中,该至少两个内容展示平台包括内容展示平台ki和内容展示平台kj,i和j均为小于或等于n的正整数,n为该至少两个内容展示平台中的内容展示平台数量;步骤s102可包括如下步骤s11~s13。s11、将属于该内容展示平台ki的访问用户,作为第一访问用户集合,将属于该内容展示平台kj的访问用户,作为第二访问用户集合。s12、获取该第一访问用户集合和该第二访问用户集合之间的相似度,作为第一相似度。s13、根据该第一相似度确定该内容展示平台ki和该内容展示平台kj的访问用户重叠度。在步骤s11~s13中,计算机设备可以从访问行为数据中筛选出属于该内容展示平台ki的访问用户,作为第一访问用户集合,从访问行为数据中筛选出属于该内容展示平台kj的访问用户,作为第二访问用户集合。具体的,此处获取第一访问用户集合和第一访问用户集合的方式可包括直接获取方式或扩展获取方式,直接获取方式是指:将访问该内容展示平台ki的访问用户,作为第一访问用户集合;将访问该内容展示平台kj的访问用户,作为第二访问用户集合。扩展获取方式是指:根据属于该内容展示平台ki的访问用户,以及对应的访问行为数据确定第一访问用户集合,根据属于该内容展示平台kj的访问用户,以及对应的访问行为数据确定第二访问用户集合。扩展获取方式通过考虑访问用户的访问行为数据来获取第一访问用户集合和第二访问用户集合,有利于准确地识别出异常内容展示平台。其中,该内容展示平台ki可以是指上述至少两个内容展示平台中的任一内容展示平台,该内容展示平台kj为上述至少两个内容展示平台中除该内容展示平台ki以外的内容展示平台。计算机设备获取到第一访问用户集合和第二访问用户集合后,可以获取该第一访问用户集合与第二访问集合之间的相似度,作为第一相似度,该第一相似度可以用于反映第一访问用户集合和第二访问用户集合中相同访问用户的数量,即相同访问用户的数量越多,则第一相似度越大;相同访问用户的数量越少,则第一相似度越小。计算机设备获取到第一相似度后,可以根据该第一相似度确定该内容展示平台ki和该内容展示平台kj的访问用户重叠度;第一相似度与该内容展示平台ki和该内容展示平台kj的访问用户重叠度具有正相关关系,即第一相似度越大,该内容展示平台ki和该内容展示平台kj的访问用户重叠度越大;第一相似度越小,该内容展示平台ki和该内容展示平台kj的访问用户重叠度越小。可选的,计算机设备可将第一相似度作为该内容展示平台ki和该内容展示平台kj的访问用户重叠度。在此实施例中,步骤s11可包括如下步骤s21~s26。s21、将属于该内容展示平台ki的访问用户,作为第一待选访问用户集合。s22、将属于该内容展示平台kj的访问用户,作为第二待选访问用户集合。s23、获取属于该内容展示平台ki的访问用户对该内容展示平台ki的访问次数,作为第一访问次数,获取属于该内容展示平台kj的访问用户对该内容展示平台kj的访问次数,作为第二访问次数。s24、根据该第一访问次数生成属于该内容展示平台ki的访问用户对应的虚拟访问用户,作为第一虚拟访问用户,该第一虚拟访问用户的数量与该第一访问次数具有正相关关系。s25、根据该第二访问次数生成属于该内容展示平台kj的访问用户对应的虚拟访问用户,作为第二虚拟访问用户,该第二虚拟访问用户的数量与该第二访问次数具有正相关关系。s26、将该第一虚拟访问用户添加至该第一待选访问用户集合,得到该第一访问用户集合,将该第二虚拟访问用户添加至该第二待选访问用户集合,得到该第二访问用户集合。步骤s21~s26中,由于异常访问用户存在访问多个内容展示平台,或多次访问同一内容展示平台的情况,因此,为了提高识别异常被访问的内容展示平台的准确度,计算机设备可以根据访问用户的访问次数获取访问用户集合。具体的,计算机设备可以将属于该内容展示平台ki的访问用户,作为第一待选访问用户集合,将属于该内容展示平台kj的访问用户,作为第二待选访问用户集合。然后,可从访问行为数据中获取属于该内容展示平台ki的访问用户对该内容展示平台ki的访问次数,作为第一访问次数,从访问行为数据中获取属于该内容展示平台kj的访问用户对该内容展示平台kj的访问次数,作为第二访问次数。其中,第一访问次数可以是指属于该内容展示平台ki的各个访问用户时间段内分别对该内容展示平台ki的访问次数,第二访问次数可以是指属于该内容展示平台kj的各个访问用户时间段内分别对该内容展示平台kj的访问次数。该时间段可以是指近一周之内或近一个月之内等等。计算机设备获取到第一访问次数和第二访问次数后,可根据该第一访问次数生成属于该内容展示平台ki的访问用户对应的虚拟访问用户,作为第一虚拟访问用户;该第一虚拟访问用户的数量与该第一访问次数具有正相关关系。即第一访问次数越多,则生成的属于该内容展示平台ki的访问用户对应的该第一虚拟访问用户的数量越多;第一访问次数越少,则生成的属于该内容展示平台ki的访问用户对应的该第一虚拟访问用户的数量越少。其中,第一虚拟访问用户的用户标识与属于该内容展示平台ki的对应访问用户的用户标识不相同。同理,可根据该第二访问次数生成属于该内容展示平台kj的访问用户对应的虚拟访问用户,作为第二虚拟访问用户;该第二虚拟访问用户的数量与该第二访问次数具有正相关关系。即第二访问次数越多,则生成的属于该内容展示平台kj的访问用户对应的该第二虚拟访问用户的数量越多;第二访问次数越少,则生成的属于该内容展示平台kj的访问用户对应的该第二虚拟访问用户的数量越少。其中,第二虚拟访问用户的用户标识与属于该内容展示平台kj、的对应访问用户的用户标识不相同。在获取到第一虚拟访问用户和第二虚拟访问用户后,可以将该第一虚拟访问用户添加至该第一待选访问用户集合,得到该第一访问用户集合,将该第二虚拟访问用户添加至该第二待选访问用户集合,得到该第二访问用户集合。可选的,计算机设备可以访问时长以及访问用户获取访问用户集合,计算机设备可以将属于该内容展示平台ki的访问用户,作为第一待选访问用户集合,将属于该内容展示平台kj的访问用户,作为第二待选访问用户集合。然后,可从访问行为数据中获取属于该内容展示平台ki的访问用户对该内容展示平台ki的访问时长,作为第一访问时长,从访问行为数据中获取属于该内容展示平台kj的访问用户对该内容展示平台kj的访问时长,作为第二访问时长。其中,第一访问时长可以是指属于该内容展示平台ki的各个访问用户时间段内分别对该内容展示平台ki的累计访问时长,第二访问时长可以是指属于该内容展示平台kj的各个访问用户时间段内分别对该内容展示平台kj的累计访问时长。该时间段可以是指近一周之内或近一个月之内等等。计算机设备获取到第一访问时长和第二访问时长后,可根据该第一访问时长生成属于该内容展示平台ki的访问用户对应的虚拟访问用户,作为第一虚拟访问用户;该第一虚拟访问用户的数量与该第一访问时长具有正相关关系。即第一访问时长越大,则生成的属于该内容展示平台ki的访问用户对应的该第一虚拟访问用户的数量越多;第一访问时长越小,则生成的属于该内容展示平台ki的访问用户对应的该第一虚拟访问用户的数量越少。其中,第一虚拟访问用户的用户标识与属于该内容展示平台ki的对应访问用户的用户标识不相同。同理,可根据该第二访问时长生成属于该内容展示平台kj的访问用户对应的虚拟访问用户,作为第二虚拟访问用户;该第二虚拟访问用户的数量与该第二访问时长具有正相关关系。即第二访问时长越大,则生成的属于该内容展示平台kj的访问用户对应的该第二虚拟访问用户的数量越多;第二访问时长越小,则生成的属于该内容展示平台kj的访问用户对应的该第二虚拟访问用户的数量越少。其中,第二虚拟访问用户的用户标识与属于该内容展示平台kj、的对应访问用户的用户标识不相同。在获取到第一虚拟访问用户和第二虚拟访问用户后,可以将该第一虚拟访问用户添加至该第一待选访问用户集合,得到该第一访问用户集合,将该第二虚拟访问用户添加至该第二待选访问用户集合,得到该第二访问用户集合。在此实施例中,步骤s12可包括如下步骤s31~s33。s31、获取该第一访问用户集合和该第二访问用户集合具有相同用户标识的访问用户,作为重叠访问用户集合。s32、对该第一访问用户集合和该第二访问用户集合进行合并,得到合并后的访问用户集合。s33、将该重叠访问用户集合与该合并后的访问用户集合之间的比值,作为该第一相似度。在步骤s31~s33中,计算机设备可以获取该第一访问用户集合和该第二访问用户集合具有相同用户标识的访问用户,作为重叠访问用户集合,即具有相同用户标识的访问用户可以是指第一访问用户集合和第二访问用户集合中的相同访问用户。具体的,可获取第一访问用户集合与第二访问用户集合的交集,得到重叠访问用户集合。然后,可对该第一访问用户集合和该第二访问用户集合进行合并,得到合并后的访问用户集合,即获取该第一访问用户集合和该第二访问用户集合的并集,得到合并后的访问用户集合。计算机设备获取到该重叠访问用户集合与该合并后的访问用户集合后,可将该重叠访问用户集合与该合并后的访问用户集合之间的比值,作为该第一相似度。通过该第一访问用户集合和该第二访问用户集合计算该内容展示平台ki和该内容展示平台kj的访问用户重叠度,不需要分别对该内容展示平台ki和该内容展示平台kj的访问用户进行遍历,降低了计算该内容展示平台ki和该内容展示平台kj的访问用户重叠度的复杂度,可缩短计算访问用户重叠度的时长。可选的,第一相似度可以采用如下公式(1)表示。在公式(1)中,p、q分别表示第一访问用户集合和该第二访问用户集合,p∩q表示第一访问用户集合和该第二访问用户集合的交集,p∪q表示第一访问用户集合和该第二访问用户集合的并集,f1表示第一相似度。例如,假设该至少两个内容展示平台包括内容展示平台k1、内容展示平台k2、内容展示平台k3。如表1所示,属于该内容展示平台k1的访问用户包括用户1和用户2,属于该内容展示平台k2的访问用户包括用户1、用户2、用户3,属于内容展示平台k3,访问用户包括用户2、用户3。假设内容展示平台k1、内容展示平台k2、内容展示平台k3对应的访问用户集合分别为a、b、c,内容展示平台k1、内容展示平台k2、内容展示平台k3对应的待选访问用户集合分别为a*、b*、c*。假设内容展示平台k1、k2、k3所提供的业务内容不相同,内容展示平台k1提供的是关于推荐智能手机的业务内容,内容展示平台k2提供的是关于推荐汽车的业务内容,内容展示平台k3提供的是关于推荐智能音箱的业务内容。如图4a所示,如果采用直接获取方式获取访问用户集合,则展示平台k1的访问用户集合a为(用户1、用户2),内容展示平台k2的访问用户集合b为(用户1、用户2、用户3),内容展示平台k3的访问用户集合c为(用户2、用户3)。a∪b为(用户1、用户2、用户3),a∩b为(用户1、用户2),采用公式(1)计算得到a与b的第一相似度为2/3。同理,c∪b为(用户1、用户2、用户3),c∩b为(用户2、用户3),采用公式(1)计算得到c与b的第一相似度为2/3。表1:如图4b所示,如果采用扩展获取方式获取访问用户集合,则可将属于该内容展示平台k1的访问用户,作为待选访问用户集合a*,待选访问用户集合a*为(用户1、用户2);将属于该内容展示平台k2的访问用户,作为待选访问用户集合b*,待选访问用户集合b*为(用户1、用户2、用户3);将属于该内容展示平台k3的访问用户,作为待选访问用户集合c*,待选访问用户集合c*为(用户2、用户3)。如表1所示,用户1、用户2访问该内容展示平台k1的访问次数分别为200次、100次,用户1、用户2、用户3访问该内容展示平台k2的第二访问次数分别为200次、100次、10次;用户2、用户3访问该内容展示平台k3的第二访问次数分别为10次、10次。计算机设备可以根据用户1访问该内容展示平台k1的访问次数生成用户1对应的第一虚拟访问用户,包括用户11和用户12,根据用户2的访问该内容展示平台k1的访问次数生成用户2对应的第一虚拟访问用户,包括用户21、用户22。同理,计算机设备可以根据用户1访问该内容展示平台k2的访问次数生成用户1对应的第二虚拟访问用户,包括用户11和用户12,根据用户2访问该内容展示平台k2的访问次数生成用户2对应的第二虚拟访问用户,包括用户21,由于用户3访问该内容展示平台k2的访问次数相对比较少,因此可以不生成用户3的第二虚拟访问用户。同时,用户2和用户3访问该内容展示平台k3的访问次数均比较少,因此,可以不生成属于该内容展示平台k3访问用户对应的虚拟访问用户,即可将待选访问用户集合c*作为访问用户集合c,c为(用户2、用户3)。计算机设备获取到第一虚拟访问用户和第二虚拟访问用户后,可以将该第一虚拟访问用户添加至该待选访问用户集合a*,得到该访问用户集合a,即访问用户集合a为(用户1、用户11、用户12、用户2、用户21、用户22);将该第二虚拟访问用户添加至该待选访问用户集合b*,得到该访问用户集合b,即访问用户集合b为(用户1、用户11、用户12、用户2、用户21、用户3)。其中,用户1、用户11、用户12分别对应的用户标识不相同,用户2、用户21分别对应的用户标识也不相同。这时a∪b为(用户1、用户11、用户12、用户2、用户21、用户22、用户3),a∩b为(用户1、用户11、用户12、用户2、用户21),采用公式(1)计算得到第一相似度为5/7。同理,c∪b为(用户1、用户11、用户12、用户2、用户21、用户3),c∩b为(用户2、用户3),采用公式(1)计算得到c与b的第一相似度为1/3。通过表1可知,内容展示平台k1和内容展示平台k2中存在访问用户多次访问同一内容展示平台,和存在访问用户多次访问不同内容展示平台的情况,即内容展示平台k1和内容展示平台k2为异常内容展示平台的概率更大,即理论上内容展示平台k1和内容展示平台k2的相似度应该更大。通过对比上述访问用户集合的直接获取方式和扩展获取方式可知,采用扩展获取方式扩大访问次数较多的内容展示平台之间的相似度,这样更加有利于准确地识别被异常访问的内容展示平台。在一个实施例中,步骤s103可包括如下步骤s41~s42。s41、将该至少两个内容展示平台确定为至少两个节点,将该至少两个节点中访问用户重叠度大于第一重叠阈值的两个节点进行连接,得到包含该至少两个节点的平台网络图。s42、若该平台网络图包括完全子图,且该完全子图中的节点的数量大于第一数量阈值,则将该完全子图中访问用户重叠度大于第二重叠阈值的两个节点,作为该目标内容展示平台。在步骤s41~s42中,计算机设备可以将该至少两个内容展示平台确定为至少两个节点,将该至少两个节点中访问用户重叠度大于第一重叠度的两个节点进行连接,得到包含至少两个节点的平台网络图,通过访问用户重叠度大于第一重叠度的两个节点进行连接,可避免将访问用户重叠度为零的节点相连接,还可避免将访问用户重叠度较小的节点相连接,可提高获取异常内容展示平台的准确度。节点之间的访问用户重叠度为零可以是指对应的内容展示平台之间不具有相同访问用户,节点之间的访问用户重叠度较小可以是指对应的内容展示平台之间具有的相同访问用户的数量较少,或者,由于计算误差导致节点之间的访问用户重叠度较小。平台网络图可用于指示内容展示平台之间的访问用户重叠度,即平台网络图包括多个节点以及多条边,每个节点对应一个内容展示平台,每条边的权重为内容展示平台之间的访问用户重叠度。计算机设备在获取到平台网络图后,判断该平台网络图中是否包括完全子图,完全子图是指平台网络图中存在三个节点或三个以上的节点之间相互连接构成的图,若平台网络图中不包括完全子图,则可以结束本次流程。若平台网络图中包括完全子图,可以获取该完全子图中的节点的数量。如果该完全子图的节点的数量大于第一数量阈值,则表明每两个内容展示平台之间均存在相同访问用户,且每两个节点之间均存在较大访问用户重叠度,则将该完全子图中访问用户重叠度大于第二重叠阈值的两个节点,作为该目标内容展示平台。目标内容展示平台中存在访问用户存在访问多个内容展示平台的行为,即目标内容展示平台中为被异常访问的内容展示平台。例如,如图5a所示,上述至少两个内容展示平台包括内容展示平台k1、k2、k3、k4、k5、k6、k7,各个内容展示平台之间访问用户重叠度如表18所示,k1与k2、k3、k4、k5、k6、k7的访问用户重叠度分别为0.65、0.33、0.45、0.62、0.1、0.1;k2与k3、k4、k5、k6、k7的访问用户重叠度分别为0.35、0.33、0.45、0.25、0.05;k3与k4、k5、k6、k7的访问用户重叠度分别为0.45、0.62、0.23、0.03;k4与k5、k6、k7的访问用户重叠度分别为0.31、0.13、0.15;k5与k6、k7的访问用户重叠度分别为0.35、0.12;k6与k7的访问用户重叠度分别为0.1。假设第一重叠度阈值、第二重叠度阈值分别为0.3、0.63,第一数量阈值为3。计算机设备可以将k1、k2、k3、k4、k5、k6、k7作为至少两个节点,由于k1、k2、k3、k4、k5之间的访问用户重叠度均大于0.3,因此,将k1、k2、k3、k4、k5进行连接,得到平台网络图(图5a中将平台网络图标记为19)。该平台网络图中每两个节点之间均相连接,可确定该平台网络图为完全图,即该平台网络图为完全子图。该完全子图中k1与k2的访问用户重叠大于0.63,因此可以将k1与k2被异常访问,将k1与k2作为该目标内容展示平台。可选的,平台网络图中包括完全子图可以是指:平台网络图中部分节点相连接构成的图为完全图。如图5b所示,平台网络图(图5b中将平台网络图标记为20)包括内容展示平台k1、k2、k3、k4、k5以及k6,平台网络图中k1、k2、k3之间是相互连接的,即k1、k2、k3之间相连接所构成的图为完全子图;k2、k5、k6之间是相互连接的,即k2、k5、k6之间相连接所构成的图为完全子图;k1、k3、k4之间是相互连接的,k1、k3、k4之间相连接所构成的图为完全子图。因此,可确定图5b中的平台网络图包括完全子图。同理,如图5c所示,平台网络图(图5c中将平台网络图标记为21)包括内容展示平台k1、k2、k3、k4、k5、k6、k7、k8、k9、k10、k11,平台网络图中k1、k2、k3、k4、k5、k6之间是相互连接的,即k1、k2、k3、k4、k5、k6之间相连接所构成的图为完全子图,因此,可确定图5c的平台网络图包括完全子图。可选的,平台网络图中包括完全子图可以是指:平台网络图中的节点相连接构成的图为完全图,即平台网络图为完全子图,图5a所示,即平台网络图中各个内容展示平台之间相互连接,即图5a的平台网络图为完全子图。在一个实施例中,步骤s103可包括如下步骤s51~s53。s51、从该至少两个内容展示平台中确定与第一内容展示平台的访问用户重叠度大于第三重叠阈值的内容展示平台,作为第二内容展示平台,该第一内容展示平台属于该至少两个内容展示平台。s52、获取该第二内容展示平台的数量。s53、若该第二内容展示平台的数量大于第二数量阈值,则将该第一内容展示平台作为该目标内容展示平台。在步骤s51~s53中,计算机设备可以从该至少两个内容展示平台中确定与第一内容展示平台的访问用户重叠度大于第三重叠阈值的内容展示平台,作为第二内容展示平台,获取该第二内容展示平台的数量。若该第二内容展示平台的数量小于或等于第二数量阈值,表明第一内容展示平台中不存在访问用户访问多个内容展示平台到的行为,或者,表明第一内容展示平台中较少的访问用户具备访问多个内容展示平台到的行为,则不将第一内容展示平台作为目标内容展示平台。若该第二内容展示平台的数量大于第二数量阈值,表明第一内容展示平台中较多的访问用户具备访问多个内容展示平台到的行为,则将该第一内容展示平台作为该目标内容展示平台。可选的,计算机设备可以获取内容展示平台的访问次数(即访问量),根据访问量确定出被异常访问的内容展示平台。假设上述至少两个内容展示平台中包括内容展示平台k1、k2、k3、k4,如图6所示,图6中是内容展示平台k1、k2、k3、k4分别平均每天的访问量,内容展示平台k1、k2、k3、k4平均每天的访问量分别为1062926次、224233次、232436次、356584次。可见,内容展示平台k1、k2、k3、k4的平均每天的访问量均为十万次以上,因此,可以确定内容展示平台k1、k2、k3、k4为被异常访问的内容展示平台。在一个实施例中,步骤s104可包括如下步骤s61~s62。s61、获取属于该目标内容展示平台的访问用户的访问行为数据。s62、根据该访问行为数据从属于该目标内容展示平台的访问用户中确定异常访问用户。在步骤s61~s62中,计算机设备可以从目标内容展示平台的后台服务器,或从展示目标内容展示平台的终端中获取属于该目标内容展示平台的访问用户的访问行为数据,该访问行为数据包括访问过的内容展示平台、访问次数、访问时长、访问用户所属的机构等中的一种或多种;访问用户所属的机构可以是指向访问用户支付电子资源的机构,即访问用户被运营的机构。计算机设备获取到访问行为数据后,可根据该访问行为数据从属于该目标内容展示平台的访问用户中确定异常访问用户。异常访问用户可以是指以获取访问量为目的,而访问内容展示平台的用户,即存在作弊行为的用户,如异常访问用户可以是指属于该目标内容展示平台的访问用户中存在访问多个内容展示平台的访问用户,或者,是指访问时长大于时长阈值的访问用户等等。在此实施例中,访问用户pm和访问用户pn属于该目标内容展示平台,m和n均为小于或等于t的正整数,t为属于该目标内容展示平台的访问用户的数量,该访问行为数据包括所访问过的内容展示平台;步骤s62可包括如下步骤s71~s73。s71、将该访问用户pm所访问过的内容展示平台,作为第一内容展示平台集合,将该访问用户pn所访问过的内容展示平台,作为第二内容展示平台集合。s72、获取该第一内容展示平台集合和该第二内容展示平台集合之间的相似度,作为第二相似度。s73、若该第二相似度大于相似度阈值,则将该访问用户pm和该访问用户pn作为异常访问用户。在步骤s71~s73中,计算机设备可以从访问行为数据中筛选出该访问用户pm所访问过的内容展示平台,作为第一内容展示平台集合,从访问行为数据中筛选出该访问用户pn所访问过的内容展示平台,作为第二内容展示平台集合。具体的,此处获取内容展示平台集合的方式包括:直接获取方式或扩展获取方式,直接获取方式是指:将该访问用户pm所访问过的内容展示平台,作为第一内容展示平台集合,将该访问用户pn所访问过的内容展示平台,作为第二内容展示平台集合。扩展获取方式是指根据该访问用户pm所访问过的内容展示平台,以及对应的访问次数或访问时长确定第一内容展示平台集合;根据该访问用户pn所访问过的内容展示平台,以及对应的访问次数或访问时长确定第二内容展示平台集合。扩展获取方式通过考虑访问用户的访问行为数据(即访问次数或访问时长)来获取第二内容展示平台集合和第一内容展示平台集合,有利于准确地识别出异常访问用户。计算机设备获取到第二内容展示平台集合和第一内容展示平台集合后,可以获取该第一内容展示平台集合和该第二内容展示平台集合之间的相似度,作为第二相似度,该第二相似度可以用于反映访问用户pm和访问用户pn的均访问的内容展示平台的数量,即均访问的内容展示平台的数量越多,则第二相似度越大;均访问的内容展示平台的数量越少,则第二相似度越小。若该第二相似度小于或等于相似度阈值,则访问用户pm和该访问用户pn均访问的内容展示平台的数量较少,确定该访问用户pm和该访问用户pn不是异常访问用户。若该第二相似度大于相似度阈值,则访问用户pm和该访问用户pn均访问的内容展示平台的数量较多,即访问用户pm和该访问用户pn存在访问多个内容展示平台的异常情况,因此,将该访问用户pm和该访问用户pn作为异常访问用户。通过该第一内容展示平台集合和该第二内容展示平台集合之间的相似度可快速地识别出异常访问用户,可降低商家对产品或服务的推广费用,提高评估推广效果的准确度。步骤s71可包括如下步骤s81~s85。s81、将该访问用户pm访问过的内容展示平台,作为第一待选内容展示平台集合,将该访问用户pn访问过的内容展示平台,作为第二待选内容展示平台集合。s82、获取该访问用户pm对该第一待选内容展示平台集合中的内容展示平台的访问次数,作为第三访问次数;获取该访问用户pn对该第二待选内容展示平台集合中的内容展示平台的访问次数,作为第四访问次数。s83、根据该第三访问次数生成该第一待选内容展示平台集合中的内容展示平台对应的虚拟内容展示平台,作为第一虚拟内容展示平台,该第一虚拟内容展示平台的数量与该第三访问次数具有正相关关系。s84、根据该第四访问次数生成该第二待选内容展示平台集合中的内容展示平台对应的虚拟内容展示平台,作为第二虚拟内容展示平台,该第二虚拟内容展示平台的数量与该第四访问次数具有正相关关系。s85、将该第一虚拟内容展示平台添加至该第一待选内容展示平台集合中,得到该第一内容展示平台集合;将该第二虚拟内容展示平台添加至该第二待选内容展示平台集合中,得到该第二内容展示平台集合。在步骤s81~s85中,由于异常访问用户存在访问多个内容展示平台,或多次访问同一内容展示平台的情况,因此,为了提高识别异常用户的准确度,计算机设备可以根据访问用户的访问次数获取内容展示平台集合。具体的,计算机设备可以将该访问用户pm访问的内容展示平台,作为第一待选内容展示平台集合,将该访问用户pn访问的内容展示平台,作为第二待选内容展示平台集合。然后,可从访问行为数据中获取该访问用户pm对该第一待选内容展示平台集合中的内容展示平台的访问次数,作为第三访问次数;从访问行为数据中获取该访问用户pn对该第二待选内容展示平台集合中的内容展示平台的访问次数,作为第四访问次数。其中,第三访问次数为该访问用户pm时间段内分别对该第一待选内容展示平台集合中的各个内容展示平台的访问次数,第四访问次数该访问用户pn时间段内分别对该第二待选内容展示平台集合中的各个内容展示平台的访问次数。计算机设备获取到第三访问次数和第四访问次数后,可根据该第三访问次数生成该第一待选内容展示平台集合中的内容展示平台对应的虚拟内容展示平台,作为第一虚拟内容展示平台,该第一虚拟内容展示平台的数量与该第三访问次数具有正相关关系。即第三访问次数越多,则生成的第一虚拟内容展示平台越多,相反,第三访问次数越少,则生成的第一虚拟内容展示平台越少。同理,可根据该第四访问次数生成该第二待选内容展示平台集合中的内容展示平台对应的虚拟内容展示平台,作为第二虚拟内容展示平台,该第二虚拟内容展示平台的数量与该第四访问次数具有正相关关系。即第四访问次数越多,则生成的第二虚拟内容展示平台越多,相反,第四访问次数越少,则生成的第二虚拟内容展示平台越少。在计算机设备获取到第一虚拟内容展示平台和第二虚拟内容展示平台后,将该第一虚拟内容展示平台添加至该第一待选内容展示平台集合中,得到该第一内容展示平台集合;将该第二虚拟内容展示平台添加至该第二待选内容展示平台集合中,得到该第二内容展示平台集合。在此实施例中,步骤s72可包括如下步骤s91~s93。s91、获取该第一内容展示平台集合和该第二内容展示平台集合具有相同平台标识的内容展示平台,作为重叠内容展示平台集合。s92、对该第一内容展示平台集合和该第二内容展示平台集合进行合并,得到合并后的内容展示平台集合。s93、将该重叠内容展示平台集合和该合并后的内容展示平台集合之间的比值,作为该第二相似度。在步骤s91~s93中,计算机设备可以获取该第一内容展示平台集合和该第二内容展示平台集合具有相同平台标识的内容展示平台,作为重叠内容展示平台集合,即具有相同平台标识的内容展示平台为该第一内容展示平台集合和该第二内容展示平台集合的相同内容展示平台。具体的,可获取该第一内容展示平台集合和该第二内容展示平台集合的交集,得到重叠内容展示平台集合。然后,对该第一内容展示平台集合和该第二内容展示平台集合进行合并,得到合并后的内容展示平台集合,即获取该第一内容展示平台集合和该第二内容展示平台集合的并集,得到合并后的内容展示平台集合。计算机设备可以将该重叠内容展示平台集合和该合并后的内容展示平台集合之间的比值,作为该第二相似度。通过根据该第一内容展示平台集合和该第二内容展示平台集合,计算该访问用户pm和该访问用户pn的相似度,不需要对该访问用户pm和该访问用户pn访问的内容展示平台进行遍历,降低计算访问用户之间的相似度的复杂度,可缩短计算访问用户重叠度的时长。可选的,第二相似度可以采用如下公式(2)表示。在公式(1)中,r、s分别表示第一内容展示平台集合和该第二内容展示平台集合,r∩s表示第一内容展示平台集合和该第二内容展示平台集合的交集,r∪s表示第一内容展示平台集合和该第二内容展示平台集合的并集,f2表示第二相似度。例如,该目标内容展示平台为图1中的内容展示平台k1,属于内容展示平台k1的访问用户包括用户1和用户2,用户1访问过的内容展示平台包括内容展示平台k1和内容展示平台k2,用户2访问过的内容展示平台包括内容展示平台k1、内容展示平台k2以及内容展示平台k3。假设用户1与第一内容展示平台集合、第一待选内容展示平台集合对应,第一内容展示平台集合为r,第一待选内容展示平台集合为r*;用户2与该第二内容展示平台集合、该第二待选内容展示平台集合对应,第二内容展示平台集合为s,该第二待选内容展示平台集合为s*。如图7所示,如果采用直接获取方式获取内容展示平台,计算设备可将该用户1所访问过的内容展示平台,作为第一内容展示平台集合,将该用户2所访问过的内容展示平台,作为第二内容展示平台集合;第一内容展示平台集合r为(k1,k2),第二内容展示平台集合s为(k1,k2,k3)。图7中三角形表示内容展示平台k1,五角星表示内容展示平台k2,圆形表示内容展示平台k3。r∩s为(k1,k2),r∪s为(k1,k2,k3),因此,采用上述公式(2)可计算得到第二相似度为2/3。如图8所示,如果采用直接获取方式获取内容展示平台,计算机设备可将用户1所访问过的内容展示平台,作为第一待选内容展示平台集合,第一待选内容展示平台集合r*(k1,k2);将该用户2所访问过的内容展示平台,作为第二待选内容展示平台集合;该第二待选内容展示平台集合s*为(k1,k2,k3)。可从访问行为数据中获取用户1对该第一待选内容展示平台集合中的内容展示平台的访问次数,从访问行为数据中获取用户2对该第二待选内容展示平台集合中的内容展示平台的访问次数;如表2所示,用户1对k1、k2的访问次数分别为200次、100次,用户2对k1、k2、k3的访问次数分别为200次、100次、10次。如图8所示,计算机设备获取到各个访问用户对内容展示平台的访问次数后,可根据用户1对内容展示平台1的访问次数生成内容展示平台1对应的第一虚拟内容展示平台,即内容展示平台1对应的第一虚拟内容展示平台包括:k11、k12。可根据用户1对内容展示平台2的访问次数生成内容展示平台2对应的第一虚拟内容展示平台,即内容展示平台2对应的第一虚拟内容展示平台包括:k21。同理,可根据用户2对内容展示平台1的访问次数生成内容展示平台1对应的第二虚拟内容展示平台,即内容展示平台1对应的第二虚拟内容展示平台包括:k11、k12。可根据用户2对内容展示平台2的访问次数生成内容展示平台2对应的第二虚拟内容展示平台,即内容展示平台2对应的第二虚拟内容展示平台包括:k21。可根据用户2对内容展示平台3的访问次数比较小,因此可以不生成内容展示平台3对应的第二虚拟内容展示平台。计算机设备获取到第一虚拟内容展示平台和第二虚拟内容展示平台后,可将该第一虚拟内容展示平台添加至该第一待选内容展示平台集合中,得到该第一内容展示平台集合,该第一内容展示平台集合r为(k1,k11,k12,k2,k21);可将该第二虚拟内容展示平台添加至该第二待选内容展示平台集合中,得到该第二内容展示平台集合,该第二内容展示平台集合s为(k1,k11,k12,k2,k21,k3)。r∩s为(k1,k11,k12,k2,k21),r∪s为(k1,k11,k12,k2,k21,k3),因此,采用上述公式(2)可计算得到第二相似度为5/6。表2:可选的,如图9所示,计算机设备将异常用户所访问内容展示平台进行可视化,得到可视化后的内容展示平台16和可视化后的内容展示平台17。其中,可视化后的内容展示平台16和可视化后的内容展示平台17中的圆点表示内容展示平台。视化后的内容展示平台16包括异常访问用户访问过的内容展示平台,以及根据访问次数生成的虚拟内容展示平台;视化后的内容展示平台17是对内容展示平台与对应虚拟内容展示平台合并得到的,即视化后的内容展示平台17中包括异常访问用户访问过的内容展示平台。根据如图9可知,异常访问用户通常会访问大量内容展示平台。可选的,该访问行为数据包括访问用户所属的机构;步骤s104可包括如下步骤s111~s113。s111、根据该访问行为数据从属于该目标内容展示平台的访问用户中确定属于目标机构的访问用户。s112、获取属于该目标机构的访问用户的数量。s113、若属于该目标机构的访问用户的数量大于第三数量阈值,则将属于该目标机构的访问用户确定为异常访问用户。在步骤s111~s113中,计算机设备可以根据该访问行为数据从属于该目标内容展示平台的访问用户中确定属于目标机构的访问用户,目标机构可以是指被标记为异常的机构,或者,目标机构可以是指属于该目标内容展示平台的访问用户对应的机构中的任一机构。获取属于该目标机构的访问用户的数量,若属于该目标机构的访问用户的数量小于或等于第三数量阈值,则属于目标机构的访问用户数量比较少,因此,目标机构存在异常行为的概率比较低,则不需要将属于目标机构的访问用户作为异常用户。若属于该目标机构的访问用户的数量大于第三数量阈值,表明该目标机构存在以获取访问量为目的行为,即该目标机构存在刷访问量的作弊行为,则将属于该目标机构的访问用户确定为异常访问用户。可选的,计算机设备可以获取属于目标访问用户的访问量(即访问次数),根据访问量确定该访问用户的访问量变化率,根据访问量变化率确定异常访问用户。假设用户1属于目标内容展示平台,用户1从7月25日至9月23日每天的访问量如图10所示。从图10可知,从7月25日至9月23日的访问量具有增长的趋势,即访问量变化率不断增大,9月23日的访问量相比7月25日的访问量增加了近10000的访问量,因此可确定用户1为异常访问用户。例如,如下表3所示,目标内容展示平台包括用户1、用户2、用户3、用户4、用户4等等,用户1、用户3、用户4、用户4属于机构1,用户2属于机构2。假设第三数量阈值为80000,属于机构1的用户数量为100000,属于机构2的用户数量为10000。由于机构1的用户数量大于机构2,因此,可以将机构1作为目标机构,且目标机构的用户数量大于第三数量阈值,确定属于目标机构的方用户为异常用户。表3:用户1机构1用户2机构2用户3机构1用户4机构1用户5机构1…………在一个实施例中,该访问行为数据包括对该目标内容展示平台提供的业务内容的访问时长;步骤s104可包括如下步骤s211~s212。s211、获取属于该目标内容展示平台的访问用户在该目标内容展示平台上的登录时长。s212、将属于该目标内容展示平台且该访问时长与该登录时长的差值小于时长阈值的访问用户,作为异常访问用户。在步骤s211~s212中,计算机设备可以获取属于该目标内容展示平台的访问用户在该目标内容展示平台上的登录时长,访问用户的该访问时长与该登录时长的差值小于时长阈值,表明访问用户登录至目标内容展示平台的目的就是为了访问目标内容展示平台上提供的业务内容,即该访问用户为刷目标内容展示平台的业务内容的访问量而存在。可以将属于该目标内容展示平台且该访问时长与该登录时长的差值小于时长阈值的访问用户,作为异常访问用户。例如,目标内容展示平台为社交应用程序,某一用户登录至该社交应用程序的登录时长为5天。该用户在这5天中每天均访问了该社交应用程序上推荐游戏应用程序的业务内容,即该用户对社交应用程序的业务内容的访问时长为5天,可确定该用户登录社交应用程序的目的就是为了访问社交应用程序上的业务内容,即确定该用户为异常用户。请参见图11,是本申请实施例提供的一种数据处理装置的结构示意图。该数据处理装置可以是运行于计算机设备中的一个计算机程序(包括程序代码),例如该数据处理装置为一个应用软件;该装置可以用于执行本申请实施例提供的方法中的相应步骤。如图11所示,该数据处理装置可包括:获取模块11,用于获取与至少两个内容展示平台相关联的访问用户,该至少两个内容展示平台用于向该访问用户提供业务内容;生成模块12,用于根据该访问用户生成该至少两个内容展示平台之间的访问用户重叠度;筛选模块13,用于根据该访问用户重叠度在该至少两个内容展示平台中筛选被异常访问的内容展示平台,作为目标内容展示平台;确定模块14,用于从属于该目标内容展示平台的访问用户中确定异常访问用户。上述筛选模块13,包括:连接单元131,用于将该至少两个内容展示平台确定为至少两个节点,将该至少两个节点中访问用户重叠度大于第一重叠阈值的两个节点进行连接,得到包含该至少两个节点的平台网络图;第一确定单元132,用于若该平台网络图中包括完全子图,且该完全子图中的节点的数量大于第一数量阈值,则将该完全子图中访问用户重叠度大于第二重叠阈值的两个节点,作为该目标内容展示平台。上述筛选模块13,包括:第二确定单元133,用于从该至少两个内容展示平台中确定与第一内容展示平台的访问用户重叠度大于第三重叠阈值的内容展示平台,作为第二内容展示平台,该第一内容展示平台属于该至少两个内容展示平台;第一获取单元134,用于获取该第二内容展示平台的数量;第二确定单元133,还用于若该第二内容展示平台的数量大于第二数量阈值,则将该第一内容展示平台作为该目标内容展示平台。可选的,该至少两个内容展示平台包括内容展示平台ki和内容展示平台kj,i和j均为小于或等于n的正整数,n为该至少两个内容展示平台中的内容展示平台数量;上述生成模块12,包括:第三确定单元121,用于将属于该内容展示平台ki的访问用户,作为第一访问用户集合,将属于该内容展示平台kj的访问用户,作为第二访问用户集合;第二获取单元122,用于获取该第一访问用户集合和该第二访问用户集合之间的相似度,作为第一相似度;上述第三确定单元121,还用于根据该第一相似度确定该内容展示平台ki和该内容展示平台kj的访问用户重叠度。上述第二获取单元122,包括:第一获取子单元1221,用于获取该第一访问用户集合和该第二访问用户集合具有相同用户标识的访问用户,作为重叠访问用户集合;合并子单元1222,用于对该第一访问用户集合和该第二访问用户集合进行合并,得到合并后的访问用户集合;第一确定子单元1223,用于将该重叠访问用户集合与该合并后的访问用户集合之间的比值,作为该第一相似度。可选的,上述第三确定单元121,包括:第二确定子单元1211,用于将属于该内容展示平台ki的访问用户,作为第一待选访问用户集合;将属于该内容展示平台kj的访问用户,作为第二待选访问用户集合;第二获取子单元1212,用于获取属于该内容展示平台ki的访问用户对该内容展示平台ki的访问次数,作为第一访问次数,获取属于该内容展示平台kj的访问用户对该内容展示平台kj的访问次数,作为第二访问次数;生成子单元1213,用于根据该第一访问次数生成属于该内容展示平台ki的访问用户对应的虚拟访问用户,作为第一虚拟访问用户,该第一虚拟访问用户的数量与该第一访问次数具有正相关关系;根据该第二访问次数生成属于该内容展示平台kj的访问用户对应的虚拟访问用户,作为第二虚拟访问用户,该第二虚拟访问用户的数量与该第二访问次数具有正相关关系;添加子单元1214,用于将该第一虚拟访问用户添加至该第一待选访问用户集合,得到该第一访问用户集合,将该第二虚拟访问用户添加至该第二待选访问用户集合,得到该第二访问用户集合。上述确定模块14,包括:第三获取单元141,用于获取属于该目标内容展示平台的访问用户的访问行为数据;第四确定单元142,用于根据该访问行为数据从属于该目标内容展示平台的访问用户中确定异常访问用户。可选的,访问用户pm和访问用户pn属于该目标内容展示平台,m和n均为小于或等于t的正整数,t为属于该目标内容展示平台的访问用户的数量,该访问行为数据包括所访问过的内容展示平台;可选的,第三获取单元141,包括:第三确定子单元1411,用于将该访问用户pm所访问过的内容展示平台,作为第一内容展示平台集合,将该访问用户pn所访问过的内容展示平台,作为第二内容展示平台集合;第三获取子单元1412,用于获取该第一内容展示平台集合和该第二内容展示平台集合之间的相似度,作为第二相似度;上述第三确定子单元1411,用于若该第二相似度大于相似度阈值,则将该访问用户pm和该访问用户pn作为异常访问用户。第三获取子单元1412,用于获取该第一内容展示平台集合和该第二内容展示平台集合具有相同平台标识的内容展示平台,作为重叠内容展示平台集合;对该第一内容展示平台集合和该第二内容展示平台集合进行合并,得到合并后的内容展示平台集合;将该重叠内容展示平台集合和该合并后的内容展示平台集合之间的比值,作为该第二相似度。第三确定子单元1411,用于将该访问用户pm所访问过的内容展示平台,作为第一待选内容展示平台集合,将该访问用户pn所访问过的内容展示平台,作为第二待选内容展示平台集合;获取该访问用户pm对该第一待选内容展示平台集合中的内容展示平台的访问次数,作为第三访问次数;获取该访问用户pn对该第二待选内容展示平台集合中的内容展示平台的访问次数,作为第四访问次数;根据该第三访问次数生成该第一待选内容展示平台集合中的内容展示平台对应的虚拟内容展示平台,作为第一虚拟内容展示平台,该第一虚拟内容展示平台的数量与该第三访问次数具有正相关关系;根据该第四访问次数生成该第二待选内容展示平台集合中的内容展示平台对应的虚拟内容展示平台,作为第二虚拟内容展示平台,该第二虚拟内容展示平台的数量与该第四访问次数具有正相关关系;将该第一虚拟内容展示平台添加至该第一待选内容展示平台集合中,得到该第一内容展示平台集合;将该第二虚拟内容展示平台添加至该第二待选内容展示平台集合中,得到该第二内容展示平台集合。可选的,该访问行为数据包括访问用户所属的机构;确定模块14,用于根据该访问行为数据从属于该目标内容展示平台的访问用户中确定属于目标机构的访问用户;获取属于该目标机构的访问用户的数量;若属于该目标机构的访问用户的数量大于第三数量阈值,则将属于该目标机构的访问用户确定为异常访问用户。可选的,该访问行为数据包括对该目标内容展示平台提供的业务内容的访问时长;确定模块14,用于获取属于该目标内容展示平台的访问用户在该目标内容展示平台上的登录时长;将属于该目标内容展示平台且该访问时长与该登录时长的差值小于时长阈值的访问用户,作为异常访问用户。应当理解,本申请实施例中所描述数据处理装置可执行前文图3所对应实施例中对上述数据处理方法的描述,对采用相同方法的有益效果描述,也不再进行赘述。本申请实施例中,计算机设备可以获取与至少两个内容展示平台关联的访问用户,根据访问用户生成至少两个内容展示平台之间的访问用户重叠度,由于该访问用户重叠度能够反映同一访问用户访问多个内容展示平台的情况;因此,通过访问用户重叠度可从至少两个内容展示平台筛选被异常访问的内容展示平台,作为目标内容展示平台,即可通过访问用户重叠度可识别出聚集异常访问用户的目标内容展示平台。另外,通过从属于目标内容展示平台的访问用户确定出异常访问用户,即通过对内容展示平台的访问数据以及访问用户进行分析,来识别异常访问用户,可提高对异常访问用户的识别准确度;且不需要对属于至少两个内容展示平台的所有访问用户进行分析,可提高对异常访问用户的识别效率,降低识别出异常访问用户的复杂度。另外,通过内容展示平台之间的访问用户重叠度可快速的识别出内容展示平台中的异常访问用户,可避免异常访问用户导致网络拥塞的问题,提高对商品或服务的推广效果;可降低商家对产品或服务的推广费用,提高评估推广效果的准确度。请参见图12,是本申请实施例提供的另一种计算机设备的结构示意图。如图12所示,上述计算机设备2000可以包括:处理器2001,网络接口2004和存储器2005,此外,上述计算机设备2000还可以包括:用户接口2003,和至少一个通信总线2002。其中,通信总线2002用于实现这些组件之间的连接通信。其中,用户接口2003可以包括显示屏(display)、键盘(keyboard),可选用户接口2003还可以包括标准的有线接口、无线接口。网络接口2004可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。存储器2005可以是高速ram存储器,也可以是非易失性的存储器(non-volatilememory),例如至少一个磁盘存储器。存储器2005可选的还可以是至少一个位于远离前述处理器2001的存储装置。如图12所示,作为一种计算机可读存储介质的存储器2005中可以包括操作系统、网络通信模块、用户接口模块以及设备控制应用程序。在图12所示的计算机设备2000中,网络接口2004可提供网络通讯功能;而用户接口2003主要用于为用户提供输入的接口;而处理器2001可以用于调用存储器2005中存储的设备控制应用程序,以实现:获取与至少两个内容展示平台相关联的访问用户,该至少两个内容展示平台用于向该访问用户提供业务内容;根据该访问用户生成该至少两个内容展示平台之间的访问用户重叠度;根据该访问用户重叠度在该至少两个内容展示平台中筛选被异常访问的内容展示平台,作为目标内容展示平台;从属于该目标内容展示平台的访问用户中确定异常访问用户。可选的,处理器2001可以用于调用存储器2005中存储的设备控制应用程序,以实现:将该至少两个内容展示平台确定为至少两个节点,将该至少两个节点中访问用户重叠度大于第一重叠阈值的两个节点进行连接,得到包含该至少两个节点的平台网络图;若该平台网络图中包括完全子图,且该完全子图中的节点的数量大于第一数量阈值,则将该完全子图中访问用户重叠度大于第二重叠阈值的两个节点,作为该目标内容展示平台。可选的,处理器2001可以用于调用存储器2005中存储的设备控制应用程序,以实现:从该至少两个内容展示平台中确定与第一内容展示平台的访问用户重叠度大于第三重叠阈值的内容展示平台,作为第二内容展示平台,该第一内容展示平台属于该至少两个内容展示平台;获取该第二内容展示平台的数量;若该第二内容展示平台的数量大于第二数量阈值,则将该第一内容展示平台作为该目标内容展示平台。可选的,该至少两个内容展示平台包括内容展示平台ki和内容展示平台kj,i和j均为小于或等于n的正整数,n为该至少两个内容展示平台中的内容展示平台数量;可选的,处理器2001可以用于调用存储器2005中存储的设备控制应用程序,以实现:将属于该内容展示平台ki的访问用户,作为第一访问用户集合,将属于该内容展示平台kj的访问用户,作为第二访问用户集合;获取该第一访问用户集合和该第二访问用户集合之间的相似度,作为第一相似度;根据该第一相似度确定该内容展示平台ki和该内容展示平台kj的访问用户重叠度。可选的,处理器2001可以用于调用存储器2005中存储的设备控制应用程序,以实现:获取该第一访问用户集合和该第二访问用户集合具有相同用户标识的访问用户,作为重叠访问用户集合;对该第一访问用户集合和该第二访问用户集合进行合并,得到合并后的访问用户集合;将该重叠访问用户集合与该合并后的访问用户集合之间的比值,作为该第一相似度。可选的,处理器2001可以用于调用存储器2005中存储的设备控制应用程序,以实现:将属于该内容展示平台ki的访问用户,作为第一待选访问用户集合;将属于该内容展示平台kj的访问用户,作为第二待选访问用户集合;获取属于该内容展示平台ki的访问用户对该内容展示平台ki的访问次数,作为第一访问次数,获取属于该内容展示平台kj的访问用户对该内容展示平台kj的访问次数,作为第二访问次数;根据该第一访问次数生成属于该内容展示平台ki的访问用户对应的虚拟访问用户,作为第一虚拟访问用户,该第一虚拟访问用户的数量与该第一访问次数具有正相关关系;根据该第二访问次数生成属于该内容展示平台kj的访问用户对应的虚拟访问用户,作为第二虚拟访问用户,该第二虚拟访问用户的数量与该第二访问次数具有正相关关系;将该第一虚拟访问用户添加至该第一待选访问用户集合,得到该第一访问用户集合,将该第二虚拟访问用户添加至该第二待选访问用户集合,得到该第二访问用户集合。可选的,处理器2001可以用于调用存储器2005中存储的设备控制应用程序,以实现:获取属于该目标内容展示平台的访问用户的访问行为数据;根据该访问行为数据从属于该目标内容展示平台的访问用户中确定异常访问用户。可选的,访问用户pm和访问用户pn属于该目标内容展示平台,m和n均为小于或等于t的正整数,t为属于该目标内容展示平台的访问用户的数量,该访问行为数据包括所访问过的内容展示平台;可选的,处理器2001可以用于调用存储器2005中存储的设备控制应用程序,以实现:将该访问用户pm所访问过的内容展示平台,作为第一内容展示平台集合,将该访问用户pn所访问过的内容展示平台,作为第二内容展示平台集合;获取该第一内容展示平台集合和该第二内容展示平台集合之间的相似度,作为第二相似度;若该第二相似度大于相似度阈值,则将该访问用户pm和该访问用户pn作为异常访问用户。可选的,处理器2001可以用于调用存储器2005中存储的设备控制应用程序,以实现:获取该第一内容展示平台集合和该第二内容展示平台集合具有相同平台标识的内容展示平台,作为重叠内容展示平台集合;对该第一内容展示平台集合和该第二内容展示平台集合进行合并,得到合并后的内容展示平台集合;将该重叠内容展示平台集合和该合并后的内容展示平台集合之间的比值,作为该第二相似度。可选的,处理器2001可以用于调用存储器2005中存储的设备控制应用程序,以实现:将该访问用户pm所访问过的内容展示平台,作为第一待选内容展示平台集合,将该访问用户pn所访问过的内容展示平台,作为第二待选内容展示平台集合;获取该访问用户pm对该第一待选内容展示平台集合中的内容展示平台的访问次数,作为第三访问次数;获取该访问用户pn对该第二待选内容展示平台集合中的内容展示平台的访问次数,作为第四访问次数;根据该第三访问次数生成该第一待选内容展示平台集合中的内容展示平台对应的虚拟内容展示平台,作为第一虚拟内容展示平台,该第一虚拟内容展示平台的数量与该第三访问次数具有正相关关系;根据该第四访问次数生成该第二待选内容展示平台集合中的内容展示平台对应的虚拟内容展示平台,作为第二虚拟内容展示平台,该第二虚拟内容展示平台的数量与该第四访问次数具有正相关关系;将该第一虚拟内容展示平台添加至该第一待选内容展示平台集合中,得到该第一内容展示平台集合;将该第二虚拟内容展示平台添加至该第二待选内容展示平台集合中,得到该第二内容展示平台集合。可选的,处理器2001可以用于调用存储器2005中存储的设备控制应用程序,以实现:根据该访问行为数据从属于该目标内容展示平台的访问用户中确定属于目标机构的访问用户;获取属于该目标机构的访问用户的数量;若属于该目标机构的访问用户的数量大于第三数量阈值,则将属于该目标机构的访问用户确定为异常访问用户。可选的,处理器2001可以用于调用存储器2005中存储的设备控制应用程序,以实现:获取属于该目标内容展示平台的访问用户在该目标内容展示平台上的登录时长;将属于该目标内容展示平台且该访问时长与该登录时长的差值小于时长阈值的访问用户,作为异常访问用户。应当理解,本申请实施例中所描述的计算机设备2000可执行前文图3所对应实施例中对上述数据处理方法的描述,也可执行前文图11所对应实施例中对上述数据处理装置的描述,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。本申请实施例中,计算机设备可以获取与至少两个内容展示平台关联的访问用户,根据访问用户生成至少两个内容展示平台之间的访问用户重叠度,由于该访问用户重叠度能够反映同一访问用户访问多个内容展示平台的情况;因此,通过访问用户重叠度可从至少两个内容展示平台筛选被异常访问的内容展示平台,作为目标内容展示平台,即可通过访问用户重叠度可识别出聚集异常访问用户的目标内容展示平台。另外,通过从属于目标内容展示平台的访问用户确定出异常访问用户,即通过对内容展示平台的访问数据以及访问用户进行分析,来识别异常访问用户,可提高对异常访问用户的识别准确度;且不需要对属于至少两个内容展示平台的所有访问用户进行分析,可提高对异常访问用户的识别效率,降低识别出异常访问用户的复杂度。另外,通过内容展示平台之间的访问用户重叠度可快速的识别出内容展示平台中的异常访问用户,可避免异常访问用户导致网络拥塞的问题,提高对商品或服务的推广效果;可降低商家对产品或服务的推广费用,提高评估推广效果的准确度。此外,这里需要指出的是:本申请实施例还提供了一种计算机可读存储介质,且上述计算机可读存储介质中存储有前文提及的数据处理装置1所执行的计算机程序,且上述计算机程序包括程序指令,当上述处理器执行上述程序指令时,能够执行前文图3对应实施例中对上述数据处理方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机可读存储介质实施例中未披露的技术细节,请参照本申请方法实施例的描述。作为示例,程序指令可被部署为在一个计算设备上执行,或者在位于一个地点的多个计算设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算设备上执行,分布在多个地点且通过通信网络互连的多个计算设备可以组成区块链系统。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,上述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,上述的存储介质可为磁盘、光盘、只读存储器(read-onlymemory,rom)或随机存储器(randomaccessmemory,ram)等。以上所揭露的仅为本申请较佳实施例而已,当然不能以此来限定本申请之权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖的范围。当前第1页1 2 3 
技术特征:1.一种数据处理方法,其特征在于,包括:
获取与至少两个内容展示平台相关联的访问用户,所述至少两个内容展示平台用于向所述访问用户提供业务内容;
根据所述访问用户生成所述至少两个内容展示平台之间的访问用户重叠度;
根据所述访问用户重叠度在所述至少两个内容展示平台中筛选被异常访问的内容展示平台,作为目标内容展示平台;
从属于所述目标内容展示平台的访问用户中确定异常访问用户。
2.如权利要求1所述的方法,其特征在于,所述根据所述访问用户重叠度在所述至少两个内容展示平台中筛选被异常访问的内容展示平台,作为目标内容展示平台,包括:
将所述至少两个内容展示平台确定为至少两个节点,将所述至少两个节点中访问用户重叠度大于第一重叠阈值的两个节点进行连接,得到包含所述至少两个节点的平台网络图;
若所述平台网络图中包括完全子图,且所述完全子图中的节点的数量大于第一数量阈值,则将所述完全子图中访问用户重叠度大于第二重叠阈值的两个节点,作为所述目标内容展示平台。
3.如权利要求1所述的方法,其特征在于,所述根据所述访问用户重叠度在所述至少两个内容展示平台中筛选被异常访问的内容展示平台,作为目标内容展示平台,包括:
从所述至少两个内容展示平台中确定与第一内容展示平台的访问用户重叠度大于第三重叠阈值的内容展示平台,作为第二内容展示平台,所述第一内容展示平台属于所述至少两个内容展示平台;
获取所述第二内容展示平台的数量;
若所述第二内容展示平台的数量大于第二数量阈值,则将所述第一内容展示平台作为所述目标内容展示平台。
4.如权利要求1所述的方法,其特征在于,所述至少两个内容展示平台包括内容展示平台ki和内容展示平台kj,i和j均为小于或等于n的正整数,n为所述至少两个内容展示平台中的内容展示平台数量;所述根据所述访问用户生成所述至少两个内容展示平台之间的访问用户重叠度,包括:
将属于所述内容展示平台ki的访问用户,作为第一访问用户集合,将属于所述内容展示平台kj的访问用户,作为第二访问用户集合;
获取所述第一访问用户集合和所述第二访问用户集合之间的相似度,作为第一相似度;
根据所述第一相似度确定所述内容展示平台ki和所述内容展示平台kj的访问用户重叠度。
5.如权利要求4所述的方法,其特征在于,所述获取所述第一访问用户集合和所述第二访问用户集合之间的相似度,作为第一相似度,包括:
获取所述第一访问用户集合和所述第二访问用户集合具有相同用户标识的访问用户,作为重叠访问用户集合;
对所述第一访问用户集合和所述第二访问用户集合进行合并,得到合并后的访问用户集合;
将所述重叠访问用户集合与所述合并后的访问用户集合之间的比值,作为所述第一相似度。
6.如权利要求4或5所述的方法,其特征在于,所述将属于所述内容展示平台ki的访问用户,作为第一访问用户集合,将属于所述内容展示平台kj的访问用户,作为第二访问用户集合,包括:
将属于所述内容展示平台ki的访问用户,作为第一待选访问用户集合;
将属于所述内容展示平台kj的访问用户,作为第二待选访问用户集合;
获取属于所述内容展示平台ki的访问用户对所述内容展示平台ki的访问次数,作为第一访问次数,获取属于所述内容展示平台kj的访问用户对所述内容展示平台kj的访问次数,作为第二访问次数;
根据所述第一访问次数生成属于所述内容展示平台ki的访问用户对应的虚拟访问用户,作为第一虚拟访问用户,所述第一虚拟访问用户的数量与所述第一访问次数具有正相关关系;
根据所述第二访问次数生成属于所述内容展示平台kj的访问用户对应的虚拟访问用户,作为第二虚拟访问用户,所述第二虚拟访问用户的数量与所述第二访问次数具有正相关关系;
将所述第一虚拟访问用户添加至所述第一待选访问用户集合,得到所述第一访问用户集合,将所述第二虚拟访问用户添加至所述第二待选访问用户集合,得到所述第二访问用户集合。
7.如权利要求1所述的方法,其特征在于,所述从属于所述目标内容展示平台的访问用户中确定异常访问用户,包括:
获取属于所述目标内容展示平台的访问用户的访问行为数据;
根据所述访问行为数据从属于所述目标内容展示平台的访问用户中确定异常访问用户。
8.如权利要求7所述的方法,其特征在于,访问用户pm和访问用户pn属于所述目标内容展示平台,m和n均为小于或等于t的正整数,t为属于所述目标内容展示平台的访问用户的数量,所述访问行为数据包括所访问过的内容展示平台;
所述根据所述访问行为数据从属于所述目标内容展示平台的访问用户中确定异常访问用户,包括:
将所述访问用户pm所访问过的内容展示平台,作为第一内容展示平台集合,将所述访问用户pn所访问过的内容展示平台,作为第二内容展示平台集合;
获取所述第一内容展示平台集合和所述第二内容展示平台集合之间的相似度,作为第二相似度;
若所述第二相似度大于相似度阈值,则将所述访问用户pm和所述访问用户pn作为异常访问用户。
9.如权利要求8所述的方法,其特征在于,所述获取所述第一内容展示平台集合和所述第二内容展示平台集合之间的相似度,作为第二相似度,包括:
获取所述第一内容展示平台集合和所述第二内容展示平台集合具有相同平台标识的内容展示平台,作为重叠内容展示平台集合;
对所述第一内容展示平台集合和所述第二内容展示平台集合进行合并,得到合并后的内容展示平台集合;
将所述重叠内容展示平台集合和所述合并后的内容展示平台集合之间的比值,作为所述第二相似度。
10.如权利要求8或9所述的方法,其特征在于,所述将所述访问用户pm所访问过的内容展示平台,作为第一内容展示平台集合,将所述访问用户pn所访问过的内容展示平台,作为第二内容展示平台集合,包括:
将所述访问用户pm所访问过的内容展示平台,作为第一待选内容展示平台集合,将所述访问用户pn所访问过的内容展示平台,作为第二待选内容展示平台集合;
获取所述访问用户pm对所述第一待选内容展示平台集合中的内容展示平台的访问次数,作为第三访问次数;获取所述访问用户pn对所述第二待选内容展示平台集合中的内容展示平台的访问次数,作为第四访问次数;
根据所述第三访问次数生成所述第一待选内容展示平台集合中的内容展示平台对应的虚拟内容展示平台,作为第一虚拟内容展示平台,所述第一虚拟内容展示平台的数量与所述第三访问次数具有正相关关系;
根据所述第四访问次数生成所述第二待选内容展示平台集合中的内容展示平台对应的虚拟内容展示平台,作为第二虚拟内容展示平台,所述第二虚拟内容展示平台的数量与所述第四访问次数具有正相关关系;
将所述第一虚拟内容展示平台添加至所述第一待选内容展示平台集合中,得到所述第一内容展示平台集合;将所述第二虚拟内容展示平台添加至所述第二待选内容展示平台集合中,得到所述第二内容展示平台集合。
11.如权利要求7所述的方法,其特征在于,所述访问行为数据包括访问用户所属的机构;
所述根据所述访问行为数据从属于所述目标内容展示平台的访问用户中确定异常访问用户,包括:
根据所述访问行为数据从属于所述目标内容展示平台的访问用户中确定属于目标机构的访问用户;
获取属于所述目标机构的访问用户的数量;
若属于所述目标机构的访问用户的数量大于第三数量阈值,则将属于所述目标机构的访问用户确定为异常访问用户。
12.如权利要求7所述的方法,其特征在于,所述访问行为数据包括对所述目标内容展示平台提供的业务内容的访问时长;
所述根据所述访问行为数据从属于所述目标内容展示平台的访问用户中确定异常访问用户,包括:
获取属于所述目标内容展示平台的访问用户在所述目标内容展示平台上的登录时长;
将属于所述目标内容展示平台且所述访问时长与所述登录时长的差值小于时长阈值的访问用户,作为异常访问用户。
13.一种数据处理装置,其特征在于,包括:
获取模块,用于获取与至少两个内容展示平台相关联的访问用户,所述至少两个内容展示平台用于向所述访问用户提供业务内容;
生成模块,用于根据所述访问用户生成所述至少两个内容展示平台之间的访问用户重叠度;
筛选模块,用于根据所述访问用户重叠度在所述至少两个内容展示平台中筛选被异常访问的内容展示平台,作为目标内容展示平台;
确定模块,用于从属于所述目标内容展示平台的访问用户中确定异常访问用户。
14.一种计算机设备,其特征在于,包括:处理器、存储器以及网络接口;
所述处理器与存储器、网络接口相连,其中,网络接口用于提供数据通信功能,所述存储器用于存储程序代码,所述处理器用于调用所述程序代码,以执行如权利要求1至12任一项所述的方法。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时,执行如权利要求1至12中任一项所述方法的步骤。
技术总结本申请实施例公开了一种数据处理方法、装置、存储介质及设备,其中,该方法包括:获取与至少两个内容展示平台相关联的访问用户,该至少两个内容展示平台用于向该访问用户提供业务内容,根据该访问用户生成该至少两个内容展示平台之间的访问用户重叠度,根据该访问用户重叠度在该至少两个内容展示平台中筛选被异常访问的内容展示平台,作为目标内容展示平台,从属于该目标内容展示平台的访问用户中确定异常访问用户。通过本发明实施例能够提高对异常访问用户的识别准确度。
技术研发人员:张李均焕
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:2020.01.14
技术公布日:2020.06.09