业务处理方法、业务处理装置、电子设备及存储介质与流程

专利2022-06-29  121


本说明书涉及移动互联网技术领域,尤其涉及一种业务处理方法、业务处理装置、电子设备以及计算机可读存储介质。



背景技术:

互联网技术在其发展的过程中,也滋生出一些以互联网为媒介,以网络技术为主要手段,为计算机信息系统安全和网络空间管理秩序带来潜在威胁的非法或不当行为。由于这些异常或者不当的网络行为会给计算机信息系统安全和网络空间管理秩序带来重大安全隐患,因此,如何从较大的用户群体中识别出从事异常或不当行为的非正常用户从而对其进行监督和管理从而保障业务和系统的安全性是当前移动互联网技术需要解决的问题之一。



技术实现要素:

有鉴于此,本说明书的实施例提出了一种业务处理方法,该方法可以包括:

从用户数据中提取移动终端号码,得到移动终端号码集合;

通过二次放号判别模型,基于上述移动终端号码集合以及与上述移动终端号码集合中各移动终端号码对应的用户行为数据,确定上述移动终端号码集合中各移动终端号码是否为二次放号的移动终端号码,并对确定为二次放号的移动终端号码进行标注;

从上述移动终端号码集合中删除标注为二次放号的移动终端号码;

提取上述移动终端号码集合中各移动终端号码的区域标识以及在上述用户数据中首次出现的时间信息;

根据各个移动终端号码的区域标识及在上述用户数据中首次出现的时间信息确定各移动终端号码对应的属性值;以及

响应于一业务请求,获取上述业务请求中的移动终端号码,并根据获取的移动终端号码对应的属性值或者是否标注为二次放号对上述业务请求进行处理。

其中,上述根据各移动终端号码的区域标识及在上述用户数据中首次出现时间信息确定各移动终端号码对应的属性值可以包括:

根据上述区域标识将上述移动终端号码集合划分为至少一个移动终端号码子集,其中,每个移动终端号码子集对应一个区域标识;

针对每个移动终端号码子集,根据上述移动终端号码子集中每个移动终端号码在上述用户数据中首次出现的时间信息,确定上述移动终端号码子集的时间标签;以及

根据上述移动终端号码子集的时间标签确定上述移动终端号码子集中每个移动终端号码对应的属性值。

其中,上述根据上述移动终端号码子集中每个移动终端号码在上述用户数据中首次出现的时间信息,确定上述移动终端号码子集的时间标签可以包括:确定上述移动终端号码子集中每个移动终端号码在上述用户数据中首次出现的时间信息的时间分位数,将上述时间分位数作为上述移动终端号码子集的时间标签。

其中,上述时间分位数可以为上述时间信息的中位数、四分位数或者百分位数中的一个。

其中,上述根据上述移动终端号码子集的时间标签确定上述移动终端号码子集中每个移动终端号码对应的属性值包括:

根据上述时间标签对上述各个移动终端号码子集进行排序;

根据上述排序结果确定上述移动终端号码子集对应的属性值;以及

将上述移动终端号码子集对应的属性值作为上述移动终端号码子集中每个移动终端号码对应的属性值。

其中,上述根据上述排序结果确定上述移动终端号码子集对应的属性值可以包括:根据对上述各个移动终端号码子集进行排序后上述移动终端号码子集的序号以及上述移动终端号码子集的个数确定上述移动终端号码子集对应的属性值。

其中,上述二次放号判别模型可以包括二分类模型,其中,上述二分类模型根据由多个标注为二次放号的移动终端号码及其对应的用户行为数据组成的样本数据构建。

其中,上述用户行为数据可以包括:用户进行身份核验操作的相关数据以及用户账户使用数据中的至少一项。

上述方法可以进一步包括:在从用户数据中提取移动终端号码后,对上述移动终端号码进行数据清洗,删除其中无效的移动终端号码数据,并将数据清洗后剩余的移动终端号码组成的集合作为上述移动终端号码集合。

对应上述业务处理方法,本说明书的实施例还提供了一种业务处理装置,该装置可以包括:

移动终端号码获取模块,用于从用户数据中提取移动终端号码,得到移动终端号码集合;

二次放号判别模型,用于基于上述移动终端号码集合以及与上述移动终端号码集合中各移动终端号码对应的用户行为数据,确定上述移动终端号码集合中各移动终端号码是否为二次放号的移动终端号码,并对确定为二次放号的移动终端号码进行标注;

去除模块,用于从上述移动终端号码集合中删除标注为二次放号的移动终端号码;

信息提取模块,用于提取上述移动终端号码集合中各移动终端号码的区域标识以及在上述用户数据中首次出现的时间信息;

属性值确定模块,用于根据各个移动终端号码的区域标识及在上述用户数据中首次出现的时间信息确定各移动终端号码对应的属性值;以及

业务处理模块,用于响应于一业务请求,获取上述业务请求中的移动终端号码,并根据获取的移动终端号码对应的属性值或者是否标注为二次放号对上述业务请求进行处理。

其中,上述属性值确定模块可以包括:

子集划分单元,用于根据上述区域标识将上述移动终端号码集合划分为至少一个移动终端号码子集,其中,每个移动终端号码子集对应一个区域标识;

时间标签确定单元,用于针对每个移动终端号码子集,根据上述移动终端号码子集中每个移动终端号码在上述用户数据中首次出现的时间信息,确定上述移动终端号码子集的时间标签;以及

属性值确定单元,用于根据上述移动终端号码子集的时间标签确定上述移动终端号码子集中每个移动终端号码对应的属性值。

其中,上述时间标签确定单元确定上述移动终端号码子集中每个移动终端号码在上述用户数据中首次出现的时间信息的时间分位数,并将上述时间分位数作为上述移动终端号码子集的时间标签。

其中,上述属性值确定单元可以包括:

排序子模块,用于根据上述时间标签对上述各个移动终端号码子集进行排序;

属性值确定子模块,用于根据上述排序结果确定上述移动终端号码子集对应的属性值;以及

赋值子模块,用于将上述移动终端号码子集对应的属性值作为上述移动终端号码子集中每个移动终端号码对应的属性值。

其中,上述二次放号判别模型包括二分类模型,其中,上述二分类模型根据由多个标注为二次放号的移动终端号码及其对应的用户行为数据组成的样本数据构建。

上述业务处理装置可以进一步包括:数据清洗模块,用于在移动终端号码获取模块从用户数据中提取移动终端号码后,对上述移动终端号码进行数据清洗,删除其中无效的移动终端号码数据,并将数据清洗后剩余的移动终端号码组成的集合作为上述移动终端号码集合。

本说明书的实施例还提供了一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器执行上述程序时实现上述业务处理方法。

本说明书的实施例还提供了一种非暂态计算机可读存储介质,上述非暂态计算机可读存储介质存储计算机指令,上述计算机指令用于使上述计算机执行上述业务处理方法。

由此可以看出,通过上述业务处理方法、业务处理装置、电子设备以及计算机可读存储介质,可以在不依赖运营商数据的情况下,仅基于系统内存储的用户数据识别系统中与各账户相关联的二次放号的移动终端号码,并推测移动终端号码的大致入网时间,确定一个可以用于表征移动终端号码价值的参数,从而辅助业务侧识别非正常用户或低质量用户,对其进行监督和管控,进而保障业务和系统的安全性,有效避免风险。

附图说明

为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本说明书实施例所述业务处理方法的应用环境示意图;

图2为本说明书实施例所述业务处理方法的流程示意图;

图3为本说明书一些实施例所述的确定移动终端号码对应的属性值的方法流程示意图;以及

图4为本说明书实施例所述业务处理装置的内部结构示意图。

具体实施方式

为使本说明书的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本说明书进一步详细说明。

需要说明的是,除非另外定义,本说明书实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本公开中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。

如前所述,用户的异常或不当行为会给计算机信息系统安全和网络空间管理秩序带来重大安全隐患,因此,如何从较大的用户群体中识别出非正常用户或低质量用户从而对其进行监督和管理是当前移动互联网技术需要解决的问题之一。

通过观察和研究发现,从风险的角度出发,入网时间长的移动终端号码,也就是手机号,通常对于用户的价值较大,也就是说,这类移动终端号码所标识账户成为非正常用户或低质量用户的可能性就相对较小。而相对地,新入网的移动终端号码或者是二次放号的移动终端号码所标识的账户成为非正常用户或低质量用户的可能性就相对大一些,因此,可以将移动终端号码的入网时间或者是否为二次放号等与移动终端号码相关的信息作为判断其标识账户是否为非正常用户或低质量用户的一个参量。其中,在本说明书的实施例中,入网时间通常是指移动终端号码开卡使用的时间。二次放号的移动终端号码通常是指前任机主已办理正式销户手续,并经过了号码冻结时限,再重新启用的移动终端号码。

通常,移动终端号码的入网时间以及是否为二次放号等信息是可以从运营商处购买并调用的,但是从运营商购买数据的费用相对很高,不便于利用。因此,需要一种业务处理方法,该方法可以由进行业务处理的计算设备执行。图1显示了本说明书实施例所述业务处理方法的应用环境。如图1所示,计算设备10可以从自身系统数据库20获取大量的用户数据,并根据获取的用户数据判断标识系统内各个账号的移动终端号码是否为二次放号的移动终端号码,且可以进一步根据这些用户数据确定其中非二次放号的移动终端号码的大致入网时间,从而确定可以表征移动终端号码价值的一个参数——属性值。这样,在计算设备10从业务方30接收到与移动终端号码相关联的业务请求后,可以对业务请求中的移动终端号码进行二次放号或其相对应属性值的判断,并根据判断结果对业务进行相应的处理,并将业务处理结果返回业务方30。也即,在本说明书的实施例中,进行业务处理的计算设备10可以在业务处理过程中加入对其关联的移动终端号码的一个价值评估的结果,辅助业务侧辅助业务进行非正常用户或低质量用户识别,从而保障业务和系统的安全性。

图2显示了本说明书实施例所述业务处理方法的流程。如图2所示,该业务处理方法可以包括如下步骤。

在步骤202,从用户数据中提取移动终端号码,得到移动终端号码集合。

在本说明书的实施例中,可以从系统内存储的用户数据的多个数据字段提取数据,从而得到大量的移动终端号码信息。例如,上述多个数据字段可以包括:用户账户绑定的移动终端号码字段、用户账户注册时填写的移动终端号码字段、用户账户上传的通讯录中的移动终端号码字段、用户账户收货信息中的移动终端号码字段、用户账户话费充值信息中的移动终端号码字段、用户转账信息中记录的移动终端号码字段等等可能记录有移动终端号码的数据字段。通常,从这些数据字段可以提取系统中存储的全部移动终端号码。然后,再将这些提取的移动终端号码组成上述移动终端号码集合。

在本说明书的另一些实施例中,由于用户在注册、绑定移动终端号码或者在其他应用场景中填写的移动终端号码可能不符合规范要求,属于无效的移动终端号码,则在从用户数据中提取移动终端号码之后,还可以进一步对上述提取的移动终端号码进行数据清洗,以删除其中无效的移动终端号码数据。具体地,在本说明书的一些实施例中,上述数据清洗可以包括以下步骤:

首先,对提取的移动终端号码进行特殊字符处理,去除国家码或非数字的字符。例如,通过特殊字符处理步骤,可以从提取的移动终端号码中去除“ 86”等国家码或者去除“-”等非数字的垃圾字符等等。

然后,从提取的移动终端号码中去除不满足移动终端号码编码规则的号码。由于移动终端号码通常具有特定的编码规则,例如,在中国,移动终端号码具有特定的长度以及固定的首几位数字等等,而其他国家对于移动终端号码也有类似的规范要求,则在本说明书的实施例中,可以利用移动终端号码编码规则从提取的移动终端号码中去除非不满足上述移动终端号码编码规则的号码,也即去除其中的无效移动终端号码或者非本国的移动终端号码。

可以看出,经过上述数据清洗过程,上述移动终端号码集合中所包括的移动终端号码基本上都是符合移动终端号码编码规则的有效的移动终端号码,也即是真实的手机号。

在步骤204,通过二次放号判别模型,基于上述移动终端号码集合以及与上述移动终端号码集合中各移动终端号码对应的用户行为数据,确定上述移动终端号码集合中各移动终端号码是否为二次放号的移动终端号码,并对确定为二次放号的移动终端号码进行标注。

可以理解,在系统存储的用户数据中包含大量的用户行为数据,这些行为数据可以包括用户进行身份核验操作的相关数据以及用户账户使用数据。其中,用户进行身份核验操作的相关数据通常是指用户在进行身份核验操作时上传和产生的数据。例如,用户通过某个移动终端号码进行短信认证时输入和产生的数据;用户上传身份信息时上传和产生的数据(例如,用户的身份证号码、人脸图像、指纹图像信息等等)。用户账户使用数据通常是指用户对账户进行操作时上传或者产生的数据。例如,用户进行销户或开户操作时输入和产生的数据;用户上传的通信录信息时上传和产生的数据等等。通过这些信息通常可以判定这个移动终端号码所对应用户是否进行过更换,从而可以识别出该移动终端号码是否为二次放号的移动终端号码。例如,如果用户的行为数据中记录一个移动终端号码对应的账户进行过销户,随后又进行了开户,且两次开户填写的信息差异较大,则可以确定该移动终端号码为二次放号的移动终端号码。又例如,如果用户的行为数据中显示一个移动终端号码对应的账户上传过至少两次身份信息,且上传的身份信息不一致,则可以确定该移动终端号码为二次放号的移动终端号码。再例如,如果用户的行为数据中显示一个移动终端号码对应的账户上传过至少两次通讯录信息,且上传的通讯录信息差异较大,则可以确定该移动终端号码为二次放号的移动终端号码等等。

在本发明的实施例中,预先构建了一个用于判别移动终端号码是否为二次放号的二次放号判别模型。通过该二次放号判别模型,基于上述移动终端号码集合以及与上述移动终端号码集合中各移动终端号码对应的用户行为数据可以确定上述移动终端号码集合中各移动终端号码是否为二次放号的移动终端号码。

在本发明的一些实施例中,上述二次放号判别模型可以通过二分类模型实现,该二分类模型可以根据由多个标注为二次放号的移动终端号码以及这些移动终端号码对应的用户行为数据组成的样本数据构建。具体地,上述二分类模型可以通过决策树、随机森林、梯度提升决策树(gbdt)、深度学习网络等等多种二分类模型中的至少一个实现。此外,上述标注为二次放号的移动终端号码可以是通过调用运营商数据接口从运营商获得的真实的二次放号的移动终端号码。在通过决策树、随机森林、或gbdt的方式实现上述二分类模型时可以通过信息增益率来选择树上各个节点的具体属性,而在使用深度学习网络来实现上述二分类模型时可以使用上述标注为二次放号的移动终端号码对应的用户行为数据通过梯度下降算法来训练上述深度学习网络,确定该深度学习网络中的各个权值。

在步骤206,从上述移动终端号码集合中删除标注为二次放号的移动终端号码。

在从上述移动终端号码集合中删除标注为二次放号的移动终端号码后,上述移动终端号码集合中将保留上述二次放号判别模型识别为非二次放号的移动终端号码。在本说明书的实施例中,从上述移动终端号码集合中删除标注为二次放号的移动终端号码的目的是为了保障后续操作中对于移动终端号码入网时间推断的准确性。

在步骤208,提取上述移动终端号码集合中各移动终端号码的区域标识以及在用户数据中首次出现的时间信息。

在本说明书的实施例中,上述移动终端号码的区域标识可以包括:表征移动终端号码所属运营商的逻辑区域标识以及表征移动终端号码所属地理区域的地理区域标识。例如,中国的移动终端号码通常包括11位数字,其中,前3位数字是分配给运营商的号段,可以视为一种逻辑区域标识;中间4位数字是表征地区的,可以视为一种地理区域标识;而最后四位是随机号码。因此,对于中国的移动终端号码而言,上述区域标识可以包括前7位数字,也即包括前3位数字的逻辑区域标识以及中间4位数字的地理区域标识。也即在本步骤中,可以直接提取上述移动终端号码集合中各移动终端号码的前7位数字,作为其区域标识。

在本说明书的实施例中,用户数据中通常还会记录与所存储数据相关联的时间信息,因此,针对某一个移动终端号码,可以先在用户数据中搜索包括该移动终端号码的至少一条记录,并将搜索到的这至少一条记录中最早的记录所对应的时间信息作为该移动终端号码在用户数据中首次出现的时间信息。

在步骤210,根据各个移动终端号码的区域标识及在用户数据中首次出现的时间信息确定各移动终端号码对应的属性值。

在本说明书的实施例中,上述移动终端号码的属性值为可以表征移动终端号码价值的一个参数,该参数可以根据移动终端号码的大致入网时间确定。

图3显示了本说明书一些实施例所述的确定上述移动终端号码对应的属性值的方法流程。如图3所示,移动终端号码对应的属性值可以通过如下步骤确定:

在步骤302,根据移动终端号码的区域标识将移动终端号码集合划分为至少一个移动终端号码子集,其中,每个移动终端号码子集对应一个区域标识。

例如,在本说明书的实施例中,有多个移动终端号码均包括1377755这个区域标识,则可以将这些移动终端号码作为一个移动终端号码子集,且该移动终端号码子集对应1377755这个区域标识。

在步骤304,针对每个移动终端号码子集,根据上述移动终端号码子集中每个移动终端号码在上述用户数据中首次出现的时间信息,确定上述移动终端号码子集的时间标签。

在本说明书的实施例中,可以根据上述移动终端号码子集中每个移动终端号码在上述用户数据中首次出现的时间信息,确定移动终端号码子集中每个移动终端号码在上述用户数据中首次出现的时间信息的时间分位数;然后,将上述时间分位数作为该移动终端号码子集的时间标签。

例如,针对一个移动终端号码子集,例如,1377755,可以获得下述包含移动终端号码及其在上述用户数据中首次出现的时间信息的一系列数据:

(移动终端号码1,2010.5.14)

(移动终端号码2,2010.5.15)

(移动终端号码3,2010.5.14)

(移动终端号码4,2010.5.18)

(移动终端号码5,2010.5.13)

在上述步骤304中,可以先计算上述各个移动终端号码在用户数据中首次出现的多个时间的时间分位数,然后将该时间分位数作为该移动终端号码子集1377755的时间标签。

在本说明书的实施例中,上述时间分位数具体可以包括上述多个时间的中位数、四分位数或者百分位数中的一个。例如,上述多个时间的中位数也就是50分位数为2010.5.14,因此,可以将2010.5.14作为该移动终端号码子集1377755的时间标签。可以理解,在同一个地理区域内同一个运营商发放的移动终端号码的入网时间相对会比较接近,使用这些移动终端号码在用户数据中首次出现的时间的中位数或50分位数作为该移动终端号码子集的时间标签可以相对比较准确地刻画包括这个区域标识的移动终端号码的入网时间,并且具有较强的稳健性。

在步骤306,根据上述移动终端号码子集的时间标签确定上述移动终端号码子集中每个移动终端号码对应的属性值。

在本说明书的实施例中,上述步骤306可以通过如下方法实现。

首先,根据各个移动终端号码子集的时间标签对上述各个移动终端号码子集进行排序。也即,按照时间标签的先后对各个移动终端号码子集进行排序。具体地,在本说明书的实施例中,上述排序可以是从先到后的排序也可以是从后到先的排序。

其次,根据上述排序结果确定上述移动终端号码子集对应的属性值。

具体地,在本说明书的一些实施例中,可以根据对上述各个移动终端号码子集进行排序后各个移动终端号码子集的序号以及移动终端号码子集的个数确定各个移动终端号码子集对应的属性值。

例如,在采用从先到后的排序方法时,可以根据如下的表达式(1)或(2)确定上述移动终端号码子集对应的属性值:

其中,sa为移动终端号码子集a对应的属性值;rt为根据上述各个移动终端号码子集的时间标签对各个移动终端号码子集进行从先到后排序后移动终端号码子集a的序号;以及n为移动终端号码子集的个数。

又例如,在采用从后到先的排序方法时,可以根据如下的表达式(3)确定上述移动终端号码子集对应的属性值:

其中,sa为移动终端号码子集a对应的属性值;rtr为根据上述各个移动终端号码子集的时间标签对各个移动终端号码子集进行从后到先排序后移动终端号码子集a的序号;以及n为移动终端号码子集的个数。

需要说明的是,上述表达式(1)、(2)或(3)仅是确定移动终端号码子集a对应的属性值的一种方法,还可以对上述表达式(1)、(2)或(3)进行各种变形,得到确定移动终端号码子集a对应的属性值的各种不同方法。且可以看出,通过上述方法确定的属性值,排序越靠前的移动终端号码子集,也即时间标签越早的移动终端号码子集,将具有越大的属性值。也就是说,在本说明书的实施例中,越大的属性值将对应越大的移动终端号码价值。

最后,将上述移动终端号码子集对应的属性值作为移动终端号码子集中每个移动终端号码对应的属性值。

在本说明书的实施例中,同一个移动终端号码子集中的移动终端号码可以具有相同的属性值。

在步骤212,响应于一业务请求,获取该业务请求中的移动终端号码,并根据获取的移动终端号码对应的属性值或者是否标注为二次放号对该业务请求进行处理。

在本说明书的实施例中,在确定了移动终端号码是否为二次放号的移动终端号码或者移动终端号码的属性值之后,即可利用上述属性值信息辅助业务侧识别可能的非正常或低质量用户。具体地,在接收到与移动终端号码相关联的业务请求后,可以对业务请求中携带的移动终端号码进行二次放号或属性值的判断,然后根据判断结果对业务进行相应的处理。

上述业务请求可以包含多种,例如,可以针对是移动终端号码的价值评估请求,可以是针对某个账户的风险评估请求,还可以是某个用户的具体业务请求,例如,用户请求发放某种权益时发送的业务请求等等。

本说明书的实施例针对不同的业务请求有不同的具体处理方式。

具体地,如果是针对移动终端号码的价值评估或者账户的风险评估,则通常可以通过预先构建的价值评估模型或风险评估模型实现。在本说明书的实施例中,在接收到针对移动终端号码的价值评估或者账户的风险评估请求时,可以将上述请求关联的移动终端号码的二次放号的标注或者属性值作为输入特征之一输入预先构建的价值评估模型或风险评估模型,与其他输入特征一起用于对移动终端号码或者账户进行评估,并反馈价值评估模型或风险评估模型的输出结果。

如果是某个用户的具体业务请求,则在获取业务请求中的移动终端号码后,确定该移动终端号码是否属于二次放号的移动终端号码或者确定其属性值,然后根据预先确定的业务处理逻辑对业务请求进行处理。例如,针对用户发放某种权益的请求,如果判断出该移动终端号码属于二次放号的移动终端号码或者其属性值不满足预设要求(例如低于某一设定的阈值)时,则可以根据预先确定的业务处理逻辑拒绝发放这种权益或者降低权益的发放额度等等。

通过上述技术方案可以看出,上述业务处理方法可以在不依赖运营商数据的情况下,基于系统内存储的用户数据识别二次放号的移动终端号码,并推测移动终端号码的大致入网时间,确定一个可以用于表征移动终端号码价值的参数,从而辅助业务侧识别非正常用户或低质量用户,对其进行监督和管控,进而保障业务和系统的安全性,有效避免风险。

对应上述业务处理方法,本说明书的实施例还给出了实现上述业务处理方法的业务处理装置,图4显示了本说明书实施例所述的业务处理装置的内部结构。如图4所示,该业务处理装置可以包括:

移动终端号码获取模块402,用于从用户数据中提取移动终端号码,得到移动终端号码集合;

二次放号判别模型404,用于基于上述移动终端号码集合以及与上述移动终端号码集合中各移动终端号码对应的用户行为数据,确定上述移动终端号码集合中各移动终端号码是否为二次放号的移动终端号码,并对确定为二次放号的移动终端号码进行标注;

去除模块406,用于从上述移动终端号码集合中删除标注为二次放号的移动终端号码;

信息提取模块408,用于提取上述移动终端号码集合中各移动终端号码的区域标识以及在上述用户数据中首次出现的时间信息;

属性值确定模块410,用于根据各个移动终端号码的区域标识及在上述用户数据中首次出现的时间信息确定各移动终端号码对应的属性值;以及

业务处理模块412,用于响应于一业务请求,获取上述业务请求中的移动终端号码,并根据获取的移动终端号码对应的属性值或者是否标注为二次放号对上述业务请求进行处理。

在本说明书的实施例中,上述属性值确定模块410可以包括:

子集划分单元,用于根据上述区域标识将上述移动终端号码集合划分为至少一个移动终端号码子集,其中,每个移动终端号码子集对应一个区域标识;

时间标签确定单元,用于针对每个移动终端号码子集,根据上述移动终端号码子集中每个移动终端号码在上述用户数据中首次出现的时间信息,确定上述移动终端号码子集的时间标签;以及

属性值确定单元,用于根据上述移动终端号码子集的时间标签确定上述移动终端号码子集中每个移动终端号码对应的属性值。

在本说明书的实施例中,上述时间标签确定单元确定上述移动终端号码子集中每个移动终端号码在上述用户数据中首次出现的时间信息的时间分位数,并将上述时间分位数作为上述移动终端号码子集的时间标签。

在本说明书的实施例中,上述属性值确定单元可以包括:

排序子模块,用于根据上述时间标签对上述各个移动终端号码子集进行排序;

属性值确定子模块,用于根据上述排序结果确定上述移动终端号码子集对应的属性值;以及

赋值子模块,用于将上述移动终端号码子集对应的属性值作为上述移动终端号码子集中每个移动终端号码对应的属性值。

在本说明书的实施例中,上述二次放号判别模型404包括二分类模型,其中,上述二分类模型根据由多个标注为二次放号的移动终端号码及其对应的用户行为数据组成的样本数据构建。具体地,上述二分类模型可以通过决策树、随机森林、gbdt、深度学习网络等等多种二分类模型中的至少一个实现。

在本说明书的实施例中,上述业务处理装置可以进一步包括:数据清洗模块,用于在移动终端号码获取模块从用户数据中提取移动终端号码后,对上述移动终端号码进行数据清洗,删除其中无效的移动终端号码数据,并将数据清洗后剩余的移动终端号码组成的集合作为上述移动终端号码集合。

通过上述技术方案可以看出,上述业务处理装置可以在不依赖运营商数据的情况下,基于系统内存储的用户数据识别二次放号的移动终端号码,并推测移动终端号码的大致入网时间,确定一个可以用于表征移动终端号码价值的参数,从而辅助业务侧识别非正常用户或低质量用户,对其进行监督和管控,进而保障业务和系统的安全性,有效避免风险。

此外,在本说明书的实施例中,上述业务处理装置可以被视为一个电子设备,因此,该业务处理装置可以包括:存储器500、处理器600、输入/输出接口700、通信接口800和总线900。其中处理器600、存储器500、输入/输出接口700和通信接口800通过总线900实现彼此之间在设备内部的通信连接。

存储器500可以采用rom(readonlymemory,只读存储器)、ram(randomaccessmemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器500可以存储操作系统和其他应用程序,还可以存储本说明书实施例提供的服务器的各个模块,例如上述移动终端号码获取模块402、二次放号判别模型404、去除模块406、信息提取模块408、属性值确定模块410以及业务处理模块412,通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器500中,并由处理器600来调用执行。

处理器600可以采用通用的cpu(centralprocessingunit,中央处理器)、微处理器、应用专用集成电路(applicationspecificintegratedcircuit,asic)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。

输入/输出接口700用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。

通信接口800用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中,通信模块可以通过有线方式(例如usb、网线等)实现通信,也可以通过无线方式(例如移动网络、wifi、蓝牙等)实现通信。

总线900包括一通路,在设备的各个组件(例如处理器600、存储器500、输入/输出接口700和通信接口800)之间传输信息。

需要说明的是,尽管上述设备仅示出了处理器600、存储器500、输入/输出接口700、通信接口800以及总线900,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。

本实施例的计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于电子设备实施例以及计算机存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本说明书的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本说明书的不同方面的许多其它变化,为了简明它们没有在细节中提供。

另外,为简化说明和讨论,并且为了不会使本说明书难以理解,在所提供的附图中可以示出或可以不示出与集成电路(ic)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本说明书难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本说明书的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本说明书的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本说明书。因此,这些描述应被认为是说明性的而不是限制性的。

尽管已经结合了本说明书的具体实施例对本说明书进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态ram(dram))可以使用所讨论的实施例。

上述对本说明书特定实施例进行了描述。其他实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。

本说明书的实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本说明书的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本说明书的保护范围之内。


技术特征:

1.一种业务处理方法,包括:

从用户数据中提取移动终端号码,得到移动终端号码集合;

通过二次放号判别模型,基于所述移动终端号码集合以及与所述移动终端号码集合中各移动终端号码对应的用户行为数据,确定所述移动终端号码集合中各移动终端号码是否为二次放号的移动终端号码,并对确定为二次放号的移动终端号码进行标注;

从所述移动终端号码集合中删除标注为二次放号的移动终端号码;

提取所述移动终端号码集合中各移动终端号码的区域标识以及在所述用户数据中首次出现的时间信息;

根据各个移动终端号码的区域标识及在所述用户数据中首次出现的时间信息确定各移动终端号码对应的属性值;以及

响应于一业务请求,获取所述业务请求中的移动终端号码,并根据获取的移动终端号码对应的属性值或者是否标注为二次放号对所述业务请求进行处理。

2.根据权利要求1所述的方法,其中,所述根据各移动终端号码的区域标识及在所述用户数据中首次出现时间信息确定各移动终端号码对应的属性值包括:

根据所述区域标识将所述移动终端号码集合划分为至少一个移动终端号码子集,其中,每个移动终端号码子集对应一个区域标识;

针对每个移动终端号码子集,根据所述移动终端号码子集中每个移动终端号码在所述用户数据中首次出现的时间信息,确定所述移动终端号码子集的时间标签;以及

根据所述移动终端号码子集的时间标签确定所述移动终端号码子集中每个移动终端号码对应的属性值。

3.根据权利要求2所述的方法,其中,所述根据所述移动终端号码子集中每个移动终端号码在所述用户数据中首次出现的时间信息,确定所述移动终端号码子集的时间标签包括:确定所述移动终端号码子集中每个移动终端号码在所述用户数据中首次出现的时间信息的时间分位数,将所述时间分位数作为所述移动终端号码子集的时间标签。

4.根据权利要求3所述的方法,其中,所述时间分位数包括所述时间信息的中位数、四分位数或者百分位数中的一个。

5.根据权利要求2所述的方法,其中,所述根据所述移动终端号码子集的时间标签确定所述移动终端号码子集中每个移动终端号码对应的属性值包括:

根据所述时间标签对所述各个移动终端号码子集进行排序;

根据所述排序结果确定所述移动终端号码子集对应的属性值;以及

将所述移动终端号码子集对应的属性值作为所述移动终端号码子集中每个移动终端号码对应的属性值。

6.根据权利要求5所述的方法,其中,所述根据所述排序结果确定所述移动终端号码子集对应的属性值包括:根据对所述各个移动终端号码子集进行排序后所述移动终端号码子集的序号以及所述移动终端号码子集的个数确定所述移动终端号码子集对应的属性值。

7.根据权利要求1所述的方法,其中,所述二次放号判别模型包括二分类模型,其中,所述二分类模型根据由多个标注为二次放号的移动终端号码及其对应的用户行为数据组成的样本数据构建。

8.根据权利要求1或7所述的方法,其中,所述用户行为数据包括:用户进行身份核验操作的相关数据以及用户账户使用数据中的至少一项。

9.根据权利要求1所述的方法,进一步包括:在从用户数据中提取移动终端号码后,对所述移动终端号码进行数据清洗,删除其中无效的移动终端号码数据,并将数据清洗后剩余的移动终端号码组成的集合作为所述移动终端号码集合。

10.一种业务处理装置,包括:

移动终端号码获取模块,用于从用户数据中提取移动终端号码,得到移动终端号码集合;

二次放号判别模型,用于基于所述移动终端号码集合以及与所述移动终端号码集合中各移动终端号码对应的用户行为数据,确定所述移动终端号码集合中各移动终端号码是否为二次放号的移动终端号码,并对确定为二次放号的移动终端号码进行标注;

去除模块,用于从所述移动终端号码集合中删除标注为二次放号的移动终端号码;

信息提取模块,用于提取所述移动终端号码集合中各移动终端号码的区域标识以及在所述用户数据中首次出现的时间信息;

属性值确定模块,用于根据各个移动终端号码的区域标识及在所述用户数据中首次出现的时间信息确定各移动终端号码对应的属性值;以及

业务处理模块,用于响应于一业务请求,获取所述业务请求中的移动终端号码,并根据获取的移动终端号码对应的属性值或者是否标注为二次放号对所述业务请求进行处理。

11.根据权利要求10所述的装置,其中,所述属性值确定模块包括:

子集划分单元,用于根据所述区域标识将所述移动终端号码集合划分为至少一个移动终端号码子集,其中,每个移动终端号码子集对应一个区域标识;

时间标签确定单元,用于针对每个移动终端号码子集,根据所述移动终端号码子集中每个移动终端号码在所述用户数据中首次出现的时间信息,确定所述移动终端号码子集的时间标签;以及

属性值确定单元,用于根据所述移动终端号码子集的时间标签确定所述移动终端号码子集中每个移动终端号码对应的属性值。

12.根据权利要求11所述的装置,其中,所述时间标签确定单元确定所述移动终端号码子集中每个移动终端号码在所述用户数据中首次出现的时间信息的时间分位数,并将所述时间分位数作为所述移动终端号码子集的时间标签。

13.根据权利要求11所述的装置,其中,所述属性值确定单元包括:

排序子模块,用于根据所述时间标签对所述各个移动终端号码子集进行排序;

属性值确定子模块,用于根据所述排序结果确定所述移动终端号码子集对应的属性值;以及

赋值子模块,用于将所述移动终端号码子集对应的属性值作为所述移动终端号码子集中每个移动终端号码对应的属性值。

14.根据权利要求10所述的装置,其中,所述二次放号判别模型包括二分类模型,其中,所述二分类模型根据由多个标注为二次放号的移动终端号码及其对应的用户行为数据组成的样本数据构建。

15.根据权利要求10所述的装置,进一步包括:

数据清洗模块,用于在移动终端号码获取模块从用户数据中提取移动终端号码后,对所述移动终端号码进行数据清洗,删除其中无效的移动终端号码数据,并将数据清洗后剩余的移动终端号码组成的集合作为所述移动终端号码集合。

16.一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现如权利要求1至9任意一项所述的方法。

17.一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行权利要求1至9任意一项所述方法。

技术总结
本说明书涉及一种业务处理方法。该方法从用户数据中提取移动终端号码,得到移动终端号码集合;通过二次放号判别模型,基于移动终端号码集合以及与各移动终端号码对应的用户行为数据,确定各移动终端号码是否为二次放号的移动终端号码;从移动终端号码集合中删除二次放号的移动终端号码;提取各移动终端号码的区域标识以及在用户数据中首次出现的时间信息;根据各个移动终端号码的区域标识及时间信息确定各移动终端号码对应的属性值;以及响应于一业务请求,获取业务请求中的移动终端号码,并根据获取的移动终端号码对应的属性值或者是否标注为二次放号对业务请求进行处理。本说明书还提供了业务处理装置、电子设备以及存储介质。

技术研发人员:金宏;陈露佳;孙传亮;王维强;张震;王立
受保护的技术使用者:支付宝(杭州)信息技术有限公司
技术研发日:2020.01.09
技术公布日:2020.06.09

转载请注明原文地址: https://bbs.8miu.com/read-14645.html

最新回复(0)