本发明涉及互联网领域,尤其是涉及一种互联网反作弊行为方法、装置、设备和可读存储介质。
背景技术:
随着移动互联网及电商平台的快速发展,以及电子渠道的推广和普及,越来越多的营销活动转移到互联网渠道开展,线上营销模式已经深度渗透到移动互联网用户的日常生活当中,比如各种类型的团购、秒杀、抽奖等营销活动。
与此同时,出现一些通过各种技术手段恶意抢夺那些原计划发放给目标用户的线上有价资源的作弊现象。现有的防作弊手段多为基于设备指纹、访问的ip地址等,已经无法防范类似p2p网络的分布式群刷方式,因此,如何准确识别作弊订单成为了亟待解决的问题。
技术实现要素:
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提出一种互联网反作弊行为方法,能够有效识别存在的作弊现象。
本发明还提出一种互联网反作弊行为装置。
本发明还提出一种互联网反作弊行为设备。
本发明还提出了一种计算机可读存储介质。
第一方面,本发明的一个实施例提供了一种互联网反作弊行为方法:包括:获取用户访问的行为序列,所述行为序列为完成所述目标行为的点击顺序和操作间隔时间;
将所述行为序列输入训练好的预设模型,判断是否存在作弊行为;
若存在涉嫌作弊行为,则对所述访问进行抑制操作。
本发明实施例的互联网反作弊行为方法至少具有如下有益效果:通过将用户的访问行为序列带入预设模型,有效的识别出作弊用户,准确度高。
根据本发明的另一些实施例的一种互联网反作弊行为方法,包括预设模型训练步骤,具体包括:
定义预设种类目标行为;
针对所述目标行为建立正常用户的行为序列样本库,根据正常用户历史行为中行为序列出现的概率作为能否进入所述行为序列样本库的标准;
定义相似度函数,所述相似度函数用以描述与正常用户行为模式之间的相似程度。
进一步地,所述抑制操作包括阻断访问和/或增加验证步骤。
进一步地,还包括将作弊行为记录在日志中。
进一步地,还包括步骤验证访问的设备数据是否存在异常。
进一步地,所述设备数据包括:设备指纹和/或ip地址和/或访问时间。
第二方面,本发明的一个实施例提供了一种互联网反作弊行为装置:包括:
获取单元,用于获取用户访问的行为序列,所述行为序列为完成所述目标行为的点击顺序和操作间隔时间
判定单元,用于将所述行为序列输入训练好的预设模型,判断是否存在作弊行为;
访问抑制单元,用于对涉嫌作弊行为的用户进行访问抑制。
第三方面,本发明的一个实施例提供了一种互联网反作弊行为设备,包括:
至少一个处理器,以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行所述的互联网反作弊行为方法。
第四方面,本发明的一个实施例提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行所述的互联网反作弊行为方法。
附图说明
图1是本发明实施例中互联网反作弊行为方法的一具体实施例流程示意图;
图2是本发明实施例中互联网反作弊行为方法的预设模型训练步骤一具体实施例流程示意图。
具体实施方式
以下将结合实施例对本发明的构思及产生的技术效果进行清楚、完整地描述,以充分地理解本发明的目的、特征和效果。显然,所描述的实施例只是本发明的一部分实施例,而不是全部实施例,基于本发明的实施例,本领域的技术人员在不付出创造性劳动的前提下所获得的其他实施例,均属于本发明保护的范围。
在本发明的描述中,如果涉及到方位描述,例如“上”、“下”、“前”、“后”、“左”、“右”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。如果某一特征被称为“设置”、“固定”、“连接”、“安装”在另一个特征,它可以直接设置、固定、连接在另一个特征上,也可以间接地设置、固定、连接、安装在另一个特征上。
在本发明实施例的描述中,如果涉及到“若干”,其含义是一个以上,如果涉及到“多个”,其含义是两个以上,如果涉及到“大于”、“小于”、“超过”,均应理解为不包括本数,如果涉及到“以上”、“以下”、“以内”,均应理解为包括本数。如果涉及到“第一”、“第二”,应当理解为用于区分技术特征,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。
参照图1,示出了本发明实施例中一种互联网反作弊行为方法的流程示意图。其具体包括步骤:
s1,获取用户访问的行为序列,所述行为序列为完成所述目标行为的点击顺序和操作间隔时间;
s2,将所述行为序列输入训练好的预设模型,判断是否存在作弊行为;
s3,若存在涉嫌作弊行为,则对所述访问进行抑制操作。
通过行为序列判断是否存在作弊现象,避免了从简单设备物理层面进行判断,用行为序列表征用户的操作方式、操作间隔的等用户使用习惯,能够更加逼近真实用户的行为特征的拟合,更加准确地甄别出恶意用户。
参照图2,图2示出了预设模型训练步骤,包括:
s01,定义预设种类目标行为;
具体的,目标行为包括:购买、浏览、加入收藏、加入购物车等。
s02,针对所述目标行为建立正常用户的行为序列样本库,根据正常用户历史行为中行为序列出现的概率作为能否进入所述行为序列样本库的标准;
具体的,例如以目标行为购买为例,对应的行为序列包括但不限于:
序列1:浏览商品详情、选择商品数量、加入购物车;
序列2:浏览商品详情、点击立即购买;
序列3:点击购物车、点击立即购买;
按照正常用户历史行为中各序列的出现概率,来提取候入选正常用户行为序列样本库的序列。
s03,定义相似度函数,所述相似度函数用以描述与正常用户行为模式之间的相似程度。
如果相似度值在某个区间范围内,判定为正常用户行为;如果超出范围,则判定为欺诈行为。由此,建立用户行为模型,用于识别是否为作弊行为。
完成模型训练后,还需要对模型进行测试。先随机抽取若干数据进行人工审核,得到对该批次测试数据的抽样预测结果。然后,使用模型进行自动测试,得到测试结果。
根据预测结果和测试结果,计算该模型的准确率和召回率等指标,并对模型进行优化处理,最终得到满足使用需要的模型。
其中,准确率计算,指对给定数据集,分类正确样本个数和总样本数的比值。使用一组测试数据作为输入,将每一条测试数据都通过预设模型得到行为类型(作弊/正常)判断,如果与人工审核结果一致,判定为正确,否则判定错误。计算整组数据中判定为正确的比率,就得到模型的准确率。
召回率计算,用来说明模型中判定为真的正例占总正例的比率。使用一组测试数据作为输入,将每一条测试数据都通过预设模型得到行为类型的判断,如果与人工审核结果一致,且是正常用户行为,判定为正确,否则判定错误。计算整组数据中判定为正常用户行为的数量占所有正常用户行为的数量占比,就得到模型的召回率。
预设模型训练完成后,将模型的输入端封装成webapi服务调用接口,供后续使用。
在另一个实施例中,还包括对训练数据预处理,包括:编码统一、不合理数据的剔除、数据归一化处理。由于原始采集的用户访问数据,存在一定比例的不完整数据和错误数据,为了提高数据分析的质量。
具体地,编码统一,指对于不用的用户行为,采用统一的编码格式和编码集合,保证后续训练模型输入统一的数据编码方式。
不合理数据剔除,指对于因系统缺陷等原因产生明显不合理、不完整的数据进行剔除,避免错误数据干扰正常模型训练。
数据归一化处理,不同指标数据往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标数据之间的量纲影响,需要进行数据标准化处理,以解决指标数据之间的可比性。原始数据经过数据标准化处理后,各指标处于同一数量级,有利于提高模型训练的收敛速度,提升模型的精度。
在另一个实施例中,抑制操作包括阻断访问和/或增加验证步骤,如提示输入验证码或滑动进度条匹配图片等。
当检测到疑似作弊行为时,将作弊行为记录到日志中。
在另一个实施例中,还包括基于设备特征、网络访问行为识别作弊用户的步骤,具体地验证访问的设备数据是否存在异常,其中设备数据包括但不限于设备指纹和/或ip地址和/或访问时间。
具体地,包括识别是否存在单设备多pv(访问量,pageview),或者少量设备多pv;关联设备指纹和ip地址,建立时域映射关系,识别基于设备池和ip池的恶意刷量;识别代理ip,防止通过代理ip操作的批量作弊行为;甄别ip黑名单,阻断来自恶意ip的访问;甄别设备黑名单,阻断来自恶意设备的访问等。
本发明的一个实施例提供了一种互联网反作弊行为装置:包括:
获取单元,用于获取用户访问的行为序列,所述行为序列为完成所述目标行为的点击顺序和操作间隔时间
判定单元,用于将所述行为序列输入训练好的预设模型,判断是否存在作弊行为;
访问抑制单元,用于对涉嫌作弊行为的用户进行访问抑制。
本发明的一个实施例提供了一种互联网反作弊行为设备,包括:
至少一个处理器,以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行所述的互联网反作弊行为方法。
本发明的一个实施例提供了还一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行所述的互联网反作弊行为方法。
上面结合附图对本发明实施例作了详细说明,但是本发明不限于上述实施例,在所属技术领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。此外,在不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。
1.一种互联网反作弊行为方法,其特征在于,包括:
获取用户访问的行为序列,所述行为序列为完成目标行为的点击顺序和操作间隔时间;
将所述行为序列输入训练好的预设模型,判断是否存在作弊行为;
若存在涉嫌作弊行为,则对所述访问进行抑制操作。
2.根据权利要求1所述的一种互联网反作弊行为方法,其特征在于,包括预设模型训练步骤,具体包括:
定义预设种类目标行为;
针对所述目标行为建立正常用户的行为序列样本库,根据正常用户历史行为中行为序列出现的概率作为能否进入所述行为序列样本库的标准;
定义相似度函数,所述相似度函数用以描述与正常用户行为模式之间的相似程度。
3.根据权利要求1所述的一种互联网反作弊行为方法,其特征在于,所述抑制操作包括阻断访问和/或增加验证步骤。
4.根据权利要求1所述的一种互联网反作弊行为方法,其特征在于,还包括将作弊行为记录在日志中。
5.根据权利要求1至4任一项所述的互联网反作弊行为方法,其特征在于,还包括步骤:验证访问的设备数据是否存在异常。
6.根据权利要求5所述的一种互联网反作弊行为方法,其特征在于,所述设备数据包括:设备指纹和/或ip地址和/或访问时间。
7.一种互联网反作弊行为装置,其特征在于,包括:
获取单元,用于获取用户访问的行为序列,所述行为序列为完成所述目标行为的点击顺序和操作间隔时间
判定单元,用于将所述行为序列输入训练好的预设模型,判断是否存在作弊行为;
访问抑制单元,用于对涉嫌作弊行为的用户进行访问抑制。
8.一种互联网反作弊行为设备,其特征在于,包括:
至少一个处理器,以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至6任一项所述的互联网反作弊行为方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1至6任一项所述的互联网反作弊行为方法。
技术总结