1.本发明涉及广告管理技术领域,尤其涉及一种广告异常设备处理方法、装置、电子设备和存储介质。
背景技术:2.随着互联网广告的发展,广告作弊行为破坏了广告系统的生态平衡,现有的广告反作弊系统,能针对各种广告作弊行为进行有效处理。一旦被判定为“作弊”的设备,会被视为异常设备,该设备会被拉入广告黑名单中,黑名单中设备的流量会被广告系统拦截,不会再进入到广告竞价系统。
3.但目前,广告黑名单的设备中,存在由于网络波动、程序异常等原因造成的“非作弊”设备,当这些设备的网络或者程序等恢复正常时,也无法参与到正常的广告竞价中,造成了这些设备流量的浪费。
技术实现要素:4.为解决由于网络波动、程序异常等原因造成的设备流量浪费的技术问题,本发明实施例提供一种广告异常设备处理方法、装置、电子设备和存储介质。
5.本发明实施例的技术方案是这样实现的:
6.本发明实施例提供了一种广告异常设备处理方法,方法包括:
7.获取广告黑名单中的设备流量数据;
8.对所述设备流量数据进行分析,确定广告黑名单中的正常设备;
9.将所述正常设备从所述广告黑名单中移出。
10.上述方案中,所述对所述设备流量数据进行分析,确定广告黑名单中的正常设备,包括:
11.对所述设备流量数据进行清洗,获得清洗后的数据;
12.利用随机森林算法对所述清洗后的数据进行归类,划分出所述广告黑名单中的正常设备。
13.上述方案中,所述利用随机森林算法对所述清洗后的数据进行归类,划分出所述广告黑名单中的正常设备,包括:
14.利用随机森林算法训练样本数据,获得训练模型;
15.将所述清洗后的数据输入所述训练模型中进行分类,获得分类结果;
16.根据所述分类结果,划分出所述广告黑名单中的正常设备。
17.上述方案中,所述获取广告黑名单中的设备流量数据,包括:
18.接收设备请求;
19.根据所述设备请求获取所述设备请求携带的设备标识;
20.根据所述设备标识判断所述设备是否为广告黑名单中的异常设备;
21.当所述设备为广告黑名单中的异常设备时,获取所述设备的设备流量数据。
22.上述方案中,根据所述设备标识判断所述设备是否为广告黑名单中的异常设备之后,所述方法还包括:
23.当所述设备不为广告黑名单中的异常设备时,将所述设备的设备流量数据输入广告竞价系统,并向所述设备返回广告。
24.上述方案中,所述将所述正常设备从所述广告黑名单中移出,包括:
25.将所述正常设备的设备标识从所述广告黑名单中移出。
26.上述方案中,所述方法还包括:
27.将设备操作日志写入数据库中。
28.本发明实施例还提供了一种广告异常设备处理装置,该装置包括:
29.获取模块,用于获取广告黑名单中的设备流量数据;
30.分析模块,用于对所述设备流量数据进行分析,确定广告黑名单中的正常设备;
31.移出模块,用于将所述正常设备从所述广告黑名单中移出。
32.本发明实施例还提供了一种电子设备,包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器;其中,
33.处理器用于运行计算机程序时,执行上述任一方法的步骤。
34.本发明实施例还提供了一种存储介质,存储介质中存储有计算机程序,计算机程序被处理器执行时,实现上述任一方法的步骤。
35.本发明实施例提供的广告异常设备处理方法、装置、电子设备和存储介质,获取广告黑名单中的设备流量数据;对所述设备流量数据进行分析,确定广告黑名单中的正常设备;将所述正常设备从所述广告黑名单中移出。采用本发明提供的方案能实现广告黑名单中异常设备的自愈,将异常设备中恢复正常设备的数据流量依旧纳入广告竞价中,避免了广告流量的浪费。
附图说明
36.图1为本发明实施例广告异常设备处理方法的流程示意图;
37.图2为本发明实施例现有技术中广告流程示意图;
38.图3为本发明实施例改进后的广告流程示意图;
39.图4为本发明实施例广告异常设备处理装置的结构示意图;
40.图5为本发明实施例计算机设备的内部结构图。
具体实施方式
41.下面将结合附图及实施例对本发明作进一步详细的描述。
42.本发明实施例提供了一种广告异常设备处理方法,如图1所示,该方法包括:
43.步骤101:获取广告黑名单中的设备流量数据;
44.步骤102:对所述设备流量数据进行分析,确定广告黑名单中的正常设备;
45.步骤103:将所述正常设备从所述广告黑名单中移出。
46.本实施例中,广告黑名单为存储有通过广告反作弊系统判定为“作弊”的设备的名单。广告黑名单中的设备的流量为本实施例广告黑名单中的设备流量数据。
47.本实施例通过对异常设备的流量数据进行分析研究,从黑名单中划分出正常的设
备,再将恢复正常的设备从黑名单中移除,从而实现异常设备的自愈,避免了广告流量的浪费。
48.在一实施例中,所述对所述设备流量数据进行分析,确定广告黑名单中的正常设备,包括:
49.对所述设备流量数据进行清洗,获得清洗后的数据;
50.利用随机森林算法对所述清洗后的数据进行归类,划分出所述广告黑名单中的正常设备。
51.本实施例中,可先对设备流量数据进行清洗,排除异常数据。这里,可采用常规的数据清洗方法,这里不在一一赘述。
52.另外,本实施例中,可通过随机森林算法对清洗后的数据进行处理。这里,随机森林算法为一种数据训练并预测的分类器,可对输入的数据进行分类预测,从而实现数据判别。
53.本实施例先通过对黑名单中的设备请求数据进行清洗,然后通过随机森林算法对数据进行归类,划分出正常的设备,再将恢复正常的设备从黑名单中移除,从而实现异常设备的自愈,避免了广告流量的浪费。
54.在一实施例中,所述利用随机森林算法对所述清洗后的数据进行归类,划分出所述广告黑名单中的正常设备,包括:
55.利用随机森林算法训练样本数据,获得训练模型;
56.将所述清洗后的数据输入所述训练模型中进行分类,获得分类结果;
57.根据所述分类结果,划分出所述广告黑名单中的正常设备。
58.这里,可采用人工标注数据的方式,获取样本数据。根据随机森林算法利用样本数据进行训练,获得随机森林算法的训练模块。将清洗后的数据输入训练模块,可实现对清洗后的数据的分类预测,获得分类结果。若分类结果表明该设备为正常设备,可将该设备从广告黑名单中移出,从而将该设备的流量重新纳入广告竞价系统进行计算,进而避免了广告浪费。
59.在一实施例中,所述获取广告黑名单中的设备流量数据,包括:
60.接收设备请求;
61.根据所述设备请求获取所述设备请求携带的设备标识;
62.根据所述设备标识判断所述设备是否为广告黑名单中的异常设备;
63.当所述设备为广告黑名单中的异常设备时,获取所述设备的设备流量数据。
64.本实施例中,可根据接收的设备发起的设备请求确定该设备是否为广告黑名单中的设备。具体地,设备在发起设备请求时,设备请求中会携带设备标识,例如设备id,根据设备标识和广告黑名单中的设备标识进行比对,可判定该设备是否为广告黑名单中的异常设备。若广告黑名单中存在该设备标识,则该设备为广告黑名单中的异常设备;若广告黑名单中不存在该设备标识,则该设备为正常设备。
65.当所述设备为广告黑名单中的异常设备,获取该设备的流量,对该设备的流量进行分类识别,确定该设备是否已恢复正常,当该设备恢复正常后,可将该设备从广告黑名单中移出,从而将将该设备的流量重新纳入广告竞价系统进行计算,进而避免了广告浪费。
66.相应地,在一实施例中,根据所述设备标识判断所述设备是否为广告黑名单中的
异常设备之后,所述方法还包括:
67.当所述设备不为广告黑名单中的异常设备时,将所述设备的设备流量数据输入广告竞价系统,并向所述设备返回广告。
68.这里,当所述设备为正常设备时,可执行针对正常设备的操作:将所述设备的设备流量数据输入广告竞价系统,并向所述设备返回广告。
69.在一实施例中,所述将所述正常设备从所述广告黑名单中移出,包括:
70.将所述正常设备的设备标识从所述广告黑名单中移出。
71.本实施例中,当广告黑名单中存储的是异常设备的设备标识时,可通过将恢复正常的设备的设备标识从广告黑名单中移出,来实现将正常设备从广告黑名单中移出。
72.在一实施例中,所述方法还包括:
73.将设备操作日志写入数据库中。
74.本实施例中,通过设备设备判定设备为广告黑名单中的异常设备时,可将该设备的操作日志写入黑名单数据库中进行存储;当通过设备设备判定设备为正常设备时,可将该设备的操作日志写入正常设备数据库中进行存储。本实施例中,通过将操作日志分开存储的方式,可简化数据处理量。
75.具体地,参见图2和图3,图2为现有技术中广告流程示意图;图3为本发明实施例改进后的广告流程示意图。
76.图2中,电视发起电视请求,请求中携带设备id,系统判断设备id是否在广告黑名单中,当判定设备id不在广告黑名单中时,将该设备的流量纳入广告竞价系统,并返回广告,同时,将操作日志写入kafka数据库中,广告反作弊系统读取数据库中的日志,进行异常设备id识别,当识别为异常设备时,将该设备id存入广告黑名单中。
77.图3中,电视发起电视请求,请求中携带设备id,系统判断设备id是否在广告黑名单中,当判定设备id不在广告黑名单中时,将该设备的流量纳入广告竞价系统,并返回广告,同时,将操作日志写入kafka数据库中,广告反作弊系统读取数据库中的日志,进行异常设备id识别,当识别为异常设备时,将该设备id存入广告黑名单中。当判定设备id在广告黑名单中时,将操作日志写入黑名单kafka数据库中,基于随机森林的数据分析系统从黑名单kafka数据库中读取日志,判定该设备是否已恢复正常,当判定该设备恢复正常后,从广告黑名单中移除该设备的id。
78.利用图3所示的处理流程,将1000万的电视设备作为样本数据,经过反作弊系统,判定其中的28.6万的设备为异常设备。通过基于随机森林的数据分析系统对这28.6万的设备进行分析后,判定32.5%的设备恢复了正常,即避免了约9万台设备的流量浪费。
79.和现有技术中的流程比,本实施例中改进后的流程加入了对黑名单中设备的流量数据分析。通过对异常流量的识别,利用随机森林算法(一种监督学习算法,可以将数据进行训练并预测的一种分类器)将黑名单kafka中的流量日志数据进行清洗,将清洗后的数据使用随机森林算法进行归类,筛选出恢复正常的设备,再将该设备从黑名单redis中移除,实现异常设备的自愈。
80.本发明实施例提供的广告异常设备处理方法,获取广告黑名单中的设备流量数据;对所述设备流量数据进行分析,确定广告黑名单中的正常设备;将所述正常设备从所述广告黑名单中移出。采用本发明提供的方案能实现广告黑名单中异常设备的自愈,将异常
设备中恢复正常设备的数据流量依旧纳入广告竞价中,避免了广告流量的浪费。
81.为了实现本发明实施例的方法,本发明实施例还提供了一种广告异常设备处理装置,如图4所示,广告异常设备处理装置400包括:获取模块401、分析模块402和移出模块403;其中,
82.获取模块401,用于获取广告黑名单中的设备流量数据;
83.分析模块402,用于对所述设备流量数据进行分析,确定广告黑名单中的正常设备;
84.移出模块403,用于将所述正常设备从所述广告黑名单中移出。
85.实际应用时,获取模块401、分析模块402和移出模块403可由广告异常设备处理装置中的处理器实现。
86.需要说明的是:上述实施例提供的上述装置在执行时,仅以上述各程序模块的划分进行举例说明,实际应用时,可以根据需要而将上述处理分配由不同的程序模块完成,即将终端的内部结构划分成不同的程序模块,以完成以上描述的全部或者部分处理。另外,上述实施例提供的上述装置与上述方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
87.为了实现本发明实施例的方法,本发明实施例还提供了一种计算机程序产品,计算机程序产品包括计算机指令,计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取计算机指令,处理器执行计算机指令,使得计算机设备执行上述方法的步骤。
88.基于上述程序模块的硬件实现,且为了实现本发明实施例的方法,本发明实施例还提供了一种电子设备(计算机设备)。具体地,在一个实施例中,该计算机设备可以是终端,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器a01、网络接口a02、显示屏a04、输入装置a05和存储器(图中未示出)。其中,该计算机设备的处理器a01用于提供计算和控制能力。该计算机设备的存储器包括内存储器a03和非易失性存储介质a06。该非易失性存储介质a06存储有操作系统b01和计算机程序b02。该内存储器a03为非易失性存储介质a06中的操作系统b01和计算机程序b02的运行提供环境。该计算机设备的网络接口a02用于与外部的终端通过网络连接通信。该计算机程序被处理器a01执行时以实现上述任意一项实施例的方法。该计算机设备的显示屏a04可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置a05可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
89.本领域技术人员可以理解,图5中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
90.本发明实施例提供的设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现上述任意一项实施例的方法。
91.本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产
品的形式。
92.本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
93.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
94.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
95.在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
96.存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram)。存储器是计算机可读介质的示例。
97.计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。
98.可以理解,本发明实施例的存储器可以是易失性存储器或者非易失性存储器,也可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(rom,read only memory)、可编程只读存储器(prom,programmable read-only memory)、可擦除可编程只读存储器(eprom,erasable programmable read-only memory)、电可擦除可编程只读存储器(eeprom,electrically erasable programmable read-only memory)、磁性随机存取存储器(fram,ferromagnetic random access memory)、快闪存储器(flash memory)、磁表面存储器、光盘、或只读光盘(cd-rom,compact disc read-only memory);磁表面存储器可以是磁盘存储器或磁带存储器。易失性存储器可以是随机存取存储器(ram,random access memory),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的ram可用,例如静态随机存取存储器(sram,static random access memory)、同步静态随机存取存储器(ssram,synchronous static random access memory)、动态随机存取存储器
(dram,dynamic random access memory)、同步动态随机存取存储器(sdram,synchronous dynamic random access memory)、双倍数据速率同步动态随机存取存储器(ddrsdram,double data rate synchronous dynamic random access memory)、增强型同步动态随机存取存储器(esdram,enhanced synchronous dynamic random access memory)、同步连接动态随机存取存储器(sldram,synclink dynamic random access memory)、直接内存总线随机存取存储器(drram,direct rambus random access memory)。本发明实施例描述的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
99.还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
100.以上仅为本技术的实施例而已,并不用于限制本技术。对于本领域技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本技术的权利要求范围之内。
技术特征:1.一种广告异常设备处理方法,其特征在于,所述方法包括:获取广告黑名单中的设备流量数据;对所述设备流量数据进行分析,确定广告黑名单中的正常设备;将所述正常设备从所述广告黑名单中移出。2.根据权利要求1所述的方法,其特征在于,所述对所述设备流量数据进行分析,确定广告黑名单中的正常设备,包括:对所述设备流量数据进行清洗,获得清洗后的数据;利用随机森林算法对所述清洗后的数据进行归类,划分出所述广告黑名单中的正常设备。3.根据权利要求2所述的方法,其特征在于,所述利用随机森林算法对所述清洗后的数据进行归类,划分出所述广告黑名单中的正常设备,包括:利用随机森林算法训练样本数据,获得训练模型;将所述清洗后的数据输入所述训练模型中进行分类,获得分类结果;根据所述分类结果,划分出所述广告黑名单中的正常设备。4.根据权利要求1所述的方法,其特征在于,所述获取广告黑名单中的设备流量数据,包括:接收设备请求;根据所述设备请求获取所述设备请求携带的设备标识;根据所述设备标识判断所述设备是否为广告黑名单中的异常设备;当所述设备为广告黑名单中的异常设备时,获取所述设备的设备流量数据。5.根据权利要求4所述的方法,其特征在于,根据所述设备标识判断所述设备是否为广告黑名单中的异常设备之后,所述方法还包括:当所述设备不为广告黑名单中的异常设备时,将所述设备的设备流量数据输入广告竞价系统,并向所述设备返回广告。6.根据权利要求1所述的方法,其特征在于,所述将所述正常设备从所述广告黑名单中移出,包括:将所述正常设备的设备标识从所述广告黑名单中移出。7.根据权利要求1所述的方法,其特征在于,所述方法还包括:将设备操作日志写入数据库中。8.一种广告异常设备处理装置,其特征在于,所述装置包括:获取模块,用于获取广告黑名单中的设备流量数据;分析模块,用于对所述设备流量数据进行分析,确定广告黑名单中的正常设备;移出模块,用于将所述正常设备从所述广告黑名单中移出。9.一种电子设备,其特征在于,包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器;其中,所述处理器用于运行所述计算机程序时,执行权利要求1至7任一项所述方法的步骤。10.一种存储介质,所述存储介质中存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现权利要求1至7任一项所述方法的步骤。
技术总结本发明公开了一种广告异常设备处理方法、装置、电子设备和存储介质。其中,方法包括获取广告黑名单中的设备流量数据;对所述设备流量数据进行分析,确定广告黑名单中的正常设备;将所述正常设备从所述广告黑名单中移出。采用本发明提供的方案能实现广告黑名单中异常设备的自愈,将异常设备中恢复正常设备的数据流量依旧纳入广告竞价中,避免了广告流量的浪费。费。费。
技术研发人员:王慧雪
受保护的技术使用者:深圳市酷开软件技术有限公司
技术研发日:2022.08.09
技术公布日:2022/12/2