本申请涉及大数据处理技术领域,尤其涉及一种目标用户群的确定方法及装置。
背景技术:
为了逃避监管和税收,一些用户通过交易、转移和转换等洗钱方式,将资金进行合法化转移,这些行为严重影响了正常的金融顺序,给金融、经济带来重大风险,所以,及时发现不正当交易的目标用户群可以有效地及时阻止洗钱行为的发生。
现有技术中,为了识别出目标用户群,从一些用户的账户特征入手,再逐一找出目标用户群中其他用户,这样通过人工的识别,筛选出交易集中程度高的可疑用户的消耗时间长,识别出进行非法交易目标用户群的效率低,识别出的进行非法交易目标用户群准确率较低。
技术实现要素:
有鉴于此,本申请实施例的目的在于提供一种目标用户群的确定方法及装置,通过获取的多个用户的历史交易信息,可以从多个用户中确定出至少一个可疑用户,进而,根据每个可疑用户,以及可疑用户产生交易的关联用户,可以将多个用户划分到至少一个可疑用户群,并根据每个可疑用户群中各个可疑用户的可疑分数以及包含用户的总人数,确定出每个可疑用户群的可疑分数,进而根据可疑用户群的可疑分数,从各个可疑用户群中确定出进行非法交易的目标用户群,可以准确且高效地识别出非法交易组织。
主要包括以下几个方面:
第一方面,本申请实施例提供一种目标用户群的确定方法,所述确定方法包括:
获取多个用户的历史交易信息;
根据所述多个用户的历史交易信息,从所述多个用户中确定出至少一个可疑用户;
根据所述至少一个可疑用户,以及每个可疑用户产生交易的关联用户,将所述多个用户划分为至少一个可疑用户群;
确定出每个可疑用户群中各个可疑用户的可疑分数;根据每个可疑用户群中各个可疑用户的可疑分数,以及该可疑用户群包含的用户的总人数,确定出该可疑用户群的可疑分数;所述可疑分数用于表征可疑用户和/或可疑用户群进行非法交易的可疑程度;
根据各个可疑用户群的可疑分数,从所述至少一个可疑用户群中选取出目标用户群。
在一种可能的实施方式中,所述根据所述多个用户的历史交易信息,从所述多个用户中确定出至少一个可疑用户,包括:
根据所述多个用户的历史交易信息,统计每个用户的转入信息和转出信息;
根据统计出的每个用户的转入信息和转出信息,计算用于表征每个用户的交易集中程度的集中程度指标;
将所述多个用户中集中程度指标大于或等于预设阈值对应的用户,确定为可疑用户。
在一种可能的实施方式中,所述表征每个用户的交易集中程度的集中程度指标包括:
向该用户转入资金的用户与接受该用户转出资金的用户的数量的和值、向该用户转入资金的用户与接受该用户转出资金的用户的数量的比值、向该用户转入次数与该用户转出次数的均值,以及向该用户转入金额与该用户转出金额的均值。
在一种可能的实施方式中,所述根据所述至少一个可疑用户,以及每个可疑用户产生交易的关联用户,将所述多个用户划分为至少一个可疑用户群,包括:
针对所述至少一个可疑用户中的每个可疑用户,确定出与该可疑用户产生交易的第一关联用户,以及与所述第一关联用户产生交易的第二关联用户,并判断所述第二关联用户是否为所述至少一个可疑用户中除该可疑用户之外的其他可疑用户;
若是,则将该可疑用户、该可疑用户对应的第一关联用户,以及该第二关联用户划分至一个可疑用户群。
在一种可能的实施方式中,所述确定出每个可疑用户群中各个可疑用户的可疑分数,包括:
根据所述各个可疑用户中每个可疑用户的历史交易信息,提取出表征每个用户交易特征向量;
将所述各个可疑用户对应的交易特征向量输入至训练好的交易评分模型,输出所述各个可疑用户对应的可疑分数。
在一种可能的实施方式中,所述根据每个可疑用户群中各个可疑用户的可疑分数,以及该可疑用户群包含的用户的总人数,确定出该可疑用户群的可疑分数,包括:
确定该可疑用户群中每个可疑用户的可疑分数进行加和的和值,并将所述和值与该可疑用户群中所有用户的数量之间的比值,确定为该可疑用户群的可疑分数。
第二方面,本申请实施例还提供一种目标用户群的确定装置,所述确定装置包括:
获取模块,用于获取多个用户的历史交易信息;
第一确定模块,用于根据所述多个用户的历史交易信息,从所述多个用户中确定出至少一个可疑用户;
划分模块,用于根据所述至少一个可疑用户,以及每个可疑用户产生交易的关联用户,将所述多个用户划分为至少一个可疑用户群;
第二确定模块,用于确定出每个可疑用户群中各个可疑用户的可疑分数;
第三确定模块,用于根据每个可疑用户群中各个可疑用户的可疑分数,以及该可疑用户群包含的用户的总人数,确定出该可疑用户群的可疑分数;所述可疑分数用于表征可疑用户和/或可疑用户群进行非法交易的可疑程度;
选取模块,用于根据各个可疑用户群的可疑分数,从所述至少一个可疑用户群中选取出目标用户群。
在一种可能的实施方式中,所述第一确定模块,用于根据以下步骤从所述多个用户中确定出至少一个可疑用户:
根据所述多个用户的历史交易信息,统计每个用户的转入信息和转出信息;
根据统计出的每个用户的转入信息和转出信息,计算用于表征每个用户的交易集中程度的集中程度指标;
将所述多个用户中集中程度指标大于或等于预设阈值对应的用户,确定为可疑用户。
在一种可能的实施方式中,所述表征每个用户的交易集中程度的集中程度指标包括:
向该用户转入资金的用户与接受该用户转出资金的用户的数量的和值、向该用户转入资金的用户与接受该用户转出资金的用户的数量的比值、向该用户转入次数与该用户转出次数的均值,以及向该用户转入金额与该用户转出金额的均值。
在一种可能的实施方式中,所述划分模块,用于根据以下步骤将所述多个用户划分为至少一个可疑用户群:
针对所述至少一个可疑用户中的每个可疑用户,确定出与该可疑用户产生交易的第一关联用户,以及与所述第一关联用户产生交易的第二关联用户,并判断所述第二关联用户是否为所述至少一个可疑用户中除该可疑用户之外的其他可疑用户;
若是,则将该可疑用户、该可疑用户对应的第一关联用户,以及该第二关联用户划分至一个可疑用户群。
在一种可能的实施方式中,所述第二确定模块,用于根据以下步骤确定出每个可疑用户群中各个可疑用户中每个可疑用户的可疑分数:
根据所述各个可疑用户中每个可疑用户的历史交易信息,提取出表征每个用户交易特征向量;
将所述各个可疑用户对应的交易特征向量输入至训练好的交易评分模型,输出所述各个可疑用户对应的可疑分数。
在一种可能的实施方式中,所述第三确定模块,具体用于:
确定该可疑用户群中每个可疑用户的可疑分数进行加和的和值,并将所述和值与该可疑用户群中所有用户的数量之间的比值,确定为该可疑用户群的可疑分数。
第三方面,本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过所述总线进行通信,所述机器可读指令被所述处理器运行时执行上述第一方面或第一方面中任一种可能的实施方式中所述的目标用户群的确定方法的步骤。
第四方面,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述第一方面或第一方面中任一种可能的实施方式中所述的目标用户群的确定的步骤。
本申请实施例中,通过获取多个用户的历史交易信息,从所述多个用户中确定出至少一个可疑用户,再根据每个可疑用户产生交易的关联用户,将多个用户划分为至少一个可疑用户群,根据每个可疑用户群中各个可疑用户的可疑分数以及包含用户的总人数,确定出该可疑用户群的可疑分数,再根据可疑用户群的可疑分数,从各个可疑用户群中选取出目标用户群,本申请根据多个用户的历史交易信息,可以从多个用户中确定出可疑用户,进而根据可疑用户确定出用于非法交易的目标用户群,实现了可以准确地识别出目标用户群,且可以提高识别效率的效果。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的一种目标用户群的确定方法的流程图;
图2示出了本申请实施例所提供的可疑用户群的结构示意图之一;
图3示出了本申请实施例所提供的可疑用户群的结构示意图之二;
图4示出了本申请实施例所提供的可疑用户群的结构示意图之三;
图5示出了本申请实施例所提供的一种目标用户群的确定装置的结构示意图;
图6示出了本申请实施例所提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解,本申请中的附图仅起到说明和描述的目的,并不用于限定本申请的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应当理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。
另外,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的全部其他实施例,都属于本申请保护的范围。
值得注意的是,在本申请提出之前,现有技术中,为了识别出目标用户群,从一些用户的账户特征入手,再逐一找出目标用户群中其他用户,这样通过人工的识别,筛选出交易集中程度高的可疑用户的消耗时间长,识别出进行非法交易目标用户群的效率低,识别出的进行非法交易目标用户群准确率较低。
针对上述问题,本申请实施例通过获取的多个用户的历史交易信息,可以从多个用户中确定出至少一个可疑用户,进而,根据每个可疑用户,以及可疑用户产生交易的关联用户,可以将多个用户划分到至少一个可疑用户群,并根据每个可疑用户群中各个可疑用户的可疑分数以及包含用户的总人数,确定出每个可疑用户群的可疑分数,进而根据可疑用户群的可疑分数,从各个可疑用户群中确定出进行非法交易的目标用户群,可以准确且高效地识别出非法交易组织。
为便于对本申请进行理解,下面结合具体实施例对本申请提供的技术方案进行详细说明。
参照图1,图1为本申请实施例所提供的一种目标用户群的确定方法的流程图。其中,所述确定方法,包括以下步骤:
s101:获取多个用户的历史交易信息。
该步骤中,获取多个用户中每个用户的历史交易信息,这里历史交易信息包括其他用户向该用户的转入信息、该用户向其他用户的转出信息以及历史交易特征信息,每个用户的转入信息包括其他用户向该用户转入的次数以及金额,每个用户的转出信息包括该用户向其他用户的转出次数以及金额,每个用户的历史交易特征信息包括但不限于历史交易方式、历史交易分散程度、历史交易金额范围以及历史交易用户的特征信息等。
s102:根据所述多个用户的历史交易信息,从所述多个用户中确定出至少一个可疑用户。
该步骤中,根据每个用户的历史交易信息,包括每个用户的转入信息和转出信息,从多个用户中,筛选出交易程度集中的用户,确定为可疑用户。
s103:根据所述至少一个可疑用户,以及每个可疑用户产生交易的关联用户,将所述多个用户划分为至少一个可疑用户群。
该步骤中,根据确定出的至少一个可疑用户,从其中一个可疑用户开始,通过确定该可疑用户与其产生历史交易的至少一个关联用户,从每个关联用户中再继续确定关联用户的方式,从多个用户中,可以划分出至少一个可疑用户群。
需要说明的是,这里可疑用户群中包括至少一个可疑用户,以及每个可疑用户的关联用户,关联用户包括可疑用户的转入用户以及转出用户,通过关联用户,使可疑用户群中的可疑用户发生间接关系,也就是说,可疑用户群中包括三层用户,中间层是可疑用户群中的至少一个可疑用户,第一层是给可疑用户转入金额的关联用户,第三层是可疑用户转出金额的关联用户,通过第一层和第三层的各个关联用户,将可疑用户群中的至少一个可疑用户相互联系起来。
一示例中,参照图2,图2示出了本申请实施例所提供的可疑用户群的结构示意图之一,图中第二层标有数字标号的为三个可疑用户,第一层为转入金额给可疑用户的关联用户,第三层为可疑用户转出金额的关联用户,从图2可以看出,通过第一层用户与第三层用户,使几个可疑用户之间产生了间接关联,再与每个可疑用户的关联用户形成了一个可疑用户群。
s104:确定出每个可疑用户群中各个可疑用户的可疑分数。
该步骤中,针对每个可疑用户群中包括的各个可疑用户中的每个可疑用户,通过该可疑用户的历史交易信息进行计算,确定出每个可疑用户的可疑分数,这里可疑分数是表征可疑用户进行非法交易的可疑程度。
s105:根据每个可疑用户群中各个可疑用户的可疑分数,以及该可疑用户群包含的用户的总人数,确定出该可疑用户群的可疑分数;所述可疑分数用于表征可疑用户和/或可疑用户群进行非法交易的可疑程度。
该步骤中,针对每个可疑用户群中包括的各个可疑用户中的每个可疑用户的可疑分数,再根据该可疑用户群中包括所有用户的总人数,从而确定出该可疑用户群的可疑分数。这里,可疑分数是表征可疑用户群的非法交易的可疑程度。
s106:根据各个可疑用户群的可疑分数,从所述至少一个可疑用户群中选取出目标用户群。
根据每个可疑用户群对应的可疑分数,将划分出的至少一个可疑用户群中的每个可疑用户群,按照每个可疑用户群的可疑分数从大到小的顺序,进行排序,并且从中选出可疑分数最高的可疑用户群,确定为目标用户群。
还需说明的是,本申请除了根据每个可疑用户群对应的可疑分数,确定出目标用户群之外,还包括将每个可疑用户群按照可疑用户群对应的可疑分数从大到小的顺序进行排序,并且提取出每个可疑用户群中各个用户,将各个可疑用户群以及每个可疑用户群中的各个用户进行标记与存储,以便用于展示和记录。
在本申请实施例中,通过获取的多个用户的历史交易信息,可以从多个用户中确定出至少一个可疑用户,进而,根据每个可疑用户,以及可疑用户产生交易的关联用户,可以将多个用户划分到至少一个可疑用户群,并根据每个可疑用户群中各个可疑用户的可疑分数以及包含用户的总人数,确定出每个可疑用户群的可疑分数,进而根据可疑用户群的可疑分数,从各个可疑用户群中确定出进行非法交易的目标用户群,可以准确且高效地识别出非法交易组织。
在一种可能的实施方式中,在s102中所述根据所述多个用户的历史交易信息,从所述多个用户中确定出至少一个可疑用户,包括以下步骤:
步骤(1):根据所述多个用户的历史交易信息,统计每个用户的转入信息和转出信息。
该步骤中,通过多个用户中每个用户的历史交易信息,统计出对于每个用户,在多个用户中,向该用户转入金额的用户,转入的次数,转入的金额,以及该用户转出金额的用户,转出的次数,转出的金额。
需要说明的是,本申请使用有向图的方法,有向图中每个节点代表每个用户,用户之间的交易关系作为有向图中节点之间的有向关系,统计每个用户的转入信息和转出信息,也就是在有向图中统计每个节点的入度与出度信息,若两个用户之间交易次数超过一次,则在有向图中,对应的两个节点之间的连线是有属性的,属性的数值代表了两个节点之间的交易次数,在有向图中,两个节点之间的权重,代表了两个节点之间的交易金额的总数值。
步骤(2):根据统计出的每个用户的转入信息和转出信息,计算用于表征每个用户的交易集中程度的集中程度指标。
该步骤中,根据建立的有向图,计算表征每个用户交易集中程度的集中程度指标,集中程度指标包括该用户在有向图中,对应的用户节点的入度与出度的和值、比值以及交易金额均值等。
步骤(3):将所述多个用户中集中程度指标大于或等于预设阈值对应的用户,确定为可疑用户。
该步骤中,集中程度指标包括的指标不止一个,所以集中程度指标中每个指标都有一个固定的预设阈值,假设集中程度指标是节点的出度与入度的和值,该预设阈值为10,那么假设该节点的出度与入度的和值为12,则该节点对应的用户的集中程度指标中,出度与入度和值的指标就为不合格,再判定其它指标,若所有指标都超过了每个指标规定的预设阈值,则该节点对应的用户就为可疑用户。
需要说明的是,集中程度指标中包括多个指标,每个指标都对应一个固定的预设阈值,若该节点计算出的每个指标都大于该指标对应的预设阈值,则该节点对应的用户才确定为可疑用户,若其中有一项指标没有大于该指标对应的预设阈值,则该节点对应的用户就不是可疑用户。
在一种可能的实施方式中,步骤(2)中所述表征每个用户的交易集中程度的集中程度指标包括:
向该用户转入资金的用户与接受该用户转出资金的用户的数量的和值、向该用户转入资金的用户与接受该用户转出资金的用户的数量的比值、向该用户转入次数与该用户转出次数的均值,以及向该用户转入金额与该用户转出金额的均值。
该步骤中,集中程度指标在有向图中包括节点的出度与入度的和值、出度与入度的比值、出度与入度的属性均值以及出度与入度的交易金额均值。
其中节点的出度属性均值为出度属性之和与出度的比值;节点的入度属性均值为入度属性之和与入度的比值;节点的出度交易金额均值为出度交易金额之和与出度的比值;节点的入度交易金额均值为入度交易金额之和与入度的比值。
一示例中,参照图3所示,图3示出了本申请实施例所提供的可疑用户群的结构示意图之二,其中,图中每个节点分别对应每个用户,图中箭头指的有向方向为转出关系,图中节点之间的属性代表节点对应的用户之间交易次数,图中节点之间的权重代表节点对应的用户之间的交易总金额,以图3中节点1为例,对于节点1,入度为4,出度为5,所以节点1的入度与出度的和值为9,入度与出度的比值为4:5,入度属性均值为:(3 2 1 5)/4=2.75,出度属性均值为:(2 7 1 6 4)/5=4,入度交易金额均值为:(10 20 50 100)/4=45,出度交易金额均值为:(30 80 30 40 70)/5=50。
在一种可能的实施方式中,在s103中所述根据所述至少一个可疑用户,以及每个可疑用户产生交易的关联用户,将所述多个用户划分为至少一个可疑用户群,包括以下步骤:
步骤(a):针对所述至少一个可疑用户中的每个可疑用户,确定出与该可疑用户产生交易的第一关联用户,以及与所述第一关联用户产生交易的第二关联用户,并判断所述第二关联用户是否为所述至少一个可疑用户中除该可疑用户之外的其他可疑用户。
该步骤中,在确定出的至少一个可疑用户中,对于每个可疑用户,确定该可疑用户与其发生历史交易的第一关联用户,也就是在有向图中,该可疑用户对应的节点的入度节点以及出度节点对应的用户,再针对确定出的至少一个第一关联用户中的每个第一关联用户,确定每个第一关联用户与其发生历史交易的至少一个第二关联用户,并从中确认是否为除了初次确定的可疑用户之外,在至少一个可疑用户中的其他可疑用户。
这里,第一关联用户指的是从可疑用户开始,确认出的该可疑用户的关联用户,第二关联用户指的是从可疑用户开始确定出的第一关联用户,第一关联用户的关联用户。
一示例中,参照图4,图4示出了本申请实施例所提供的可疑用户群的结构示意图之三,在图4中,假设节点1、节点8和节点11为可疑用户对应的节点,对于节点1,先确定对于节点1的第一关联节点,也就是入度节点和出度节点,分别是节点2、节点3、节点4、节点5以及节点6,再分别确定每个节点的关联节点是否为除节点1以外的至少一个可疑用户中,以节点3为例,确认节点3的至少一个第二关联节点,并确认每个第二关联节点对应的用户是否为除了节点1之外的至少一个可疑用户中。
步骤(b):若是,则将该可疑用户、该可疑用户对应的第一关联用户,以及该第二关联用户划分至一个可疑用户群。
该步骤中,若第二关联用户中为除了初次确定的可疑用户之外,在至少一个可疑用户中的其他可疑用户,如果是其中一个可疑用户,则对该可疑用户继续确认该可疑用户的关联用户,重复这个过程,直到第一关联用户中的第二关联用户不再为其他可疑用户,得到包含各个可疑用户以及每个可疑用户的关联用户的可疑用户群。
一示例中,如图4,确认节点3的关联节点中,确认出节点8对应的用户是可疑用户,所以再继续确认节点8的关联节点,重复这个过程,直至再确认的关联节点中不再有属于其他可疑用户对应的节点,最后确认出包含各个可疑用户以及每个可疑用户的关联用户的可疑用户群。
需要说明的是,在多个用户中,不是每个用户都会被划分至一个可疑用户群的,在多个用户中,不与确认出的可疑用户发生历史交易的用户,是不会划分到可疑用户群中。
在一种可能的实施方式中,在s104中所述确定出每个可疑用户群中各个可疑用户的可疑分数,包括以下步骤:
步骤(一):根据所述各个可疑用户中每个可疑用户的历史交易信息,提取出表征每个用户交易特征向量。
该步骤中,根据每个可疑用户的历史交易信息,提取出表征每个用户交易特征的向量,交易特征包括但不限于:交易地点是分散还是集中、交易方式、交易的网际互连协议地址、交易金额的范围、交易时间集中度以及用户及交易用户的个人信息。
步骤(二):将所述各个可疑用户对应的交易特征向量输入至训练好的交易评分模型,输出所述各个可疑用户对应的可疑分数。
该步骤中,可疑用户交易特征的向量的维度是固定好了的,如果该可疑用户缺少某一项交易特征,该特征就为零值,保证维度与训练好的模型一致,训练好的交易评分模型是将每个可疑用户可能出现的交易特征赋予不一样的分值,如果可疑用户的交易特征满足了训练好的交易评分模型中对应的特征,则赋予该可疑用户对应的分值,如果没有满足,就直接零值,再将每个特征对应的分值可以直接相加,或者赋予不同的权重,再加和,得到该可疑用户对应的可疑分数,所以,每个可疑用户在提取出表征交易特征的向量之后,输入至训练好的交易评分模型,就可以输出该可疑用户对应的可疑分数。
在一种可能的实施方式中,在s105中所述根据每个可疑用户群中各个可疑用户的可疑分数,以及该可疑用户群包含的用户的总人数,确定出该可疑用户群的可疑分数,包括:
确定该可疑用户群中每个可疑用户的可疑分数进行加和的和值,并将所述和值与该可疑用户群中所有用户的数量之间的比值,确定为该可疑用户群的可疑分数。
该步骤中,针对每个可疑用户群,计算每个可疑用户群的可疑分数,首先计算每个可疑用户的可疑分数的和值,再统计出该可疑用户群总共的用户数量的数值,两个值的比值为该可疑用户群的可疑分数。
一示例中,如图4所示,每个节点对应每个用户,节点1、节点8和节点11对应的用户为可疑用户,假设节点1对应的可疑用户的可疑分数为80分,节点8对应的可疑用户的可疑分数为50分,节点11对应的可疑用户的可疑分数为60分,则该可疑用户群中各个可疑用户的可疑分数的和值为80 50 60=190分,之后统计该可疑用户群中所有用户的数量为15个,所以该可疑用户群的可疑分数为190/15=12.67分。
基于同一申请构思,本申请实施例中还提供了与上述实施例提供的目标用户群的确定方法对应的目标用户群的确定装置,由于本申请实施例中的装置解决问题的原理与本申请上述实施例的目标用户群的确定方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
参见图5所示,为本申请实施例提供的一种目标用户群的确定装置500的结构示意图,本申请实施例提供的目标用户群的确定装置500,包括:
获取模块510,用于获取多个用户的历史交易信息;
第一确定模块520,用于根据所述多个用户的历史交易信息,从所述多个用户中确定出至少一个可疑用户;
划分模块530,用于根据所述至少一个可疑用户,以及每个可疑用户产生交易的关联用户,将所述多个用户划分为至少一个可疑用户群;
第二确定模块540,用于确定出每个可疑用户群中各个可疑用户的可疑分数;
第三确定模块550,用于根据每个可疑用户群中各个可疑用户的可疑分数,以及该可疑用户群包含的用户的总人数,确定出该可疑用户群的可疑分数;所述可疑分数用于表征可疑用户和/或可疑用户群进行非法交易的可疑程度;
选取模块560,用于根据各个可疑用户群的可疑分数,从所述至少一个可疑用户群中选取出目标用户群。
本申请通过获取模块510获取的多个用户的历史交易信息,可以从多个用户中经过第一确定模块520确定出至少一个可疑用户,进而,根据每个可疑用户,以及可疑用户产生交易的关联用户,可以将多个用户经过划分模块530划分到至少一个可疑用户群,通过第二确定模块540确定出每个可疑用户群中各个可疑用户的可疑分数之后,并根据每个可疑用户群中各个可疑用户的可疑分数以及包含用户的总人数,根据第三确定模块550确定出每个可疑用户群的可疑分数,进而根据可疑用户群的可疑分数,从各个可疑用户群中通过选取模块560选取出进行非法交易的目标用户群,可以准确且高效地识别出非法交易组织。
在一种可能的实施方式中,所述第一确定模块520,用于根据以下步骤从所述多个用户中确定出至少一个可疑用户:
根据所述多个用户的历史交易信息,统计每个用户的转入信息和转出信息;
根据统计出的每个用户的转入信息和转出信息,计算用于表征每个用户的交易集中程度的集中程度指标;
将所述多个用户中集中程度指标大于或等于预设阈值对应的用户,确定为可疑用户。
在一种可能的实施方式中,所述表征每个用户的交易集中程度的集中程度指标包括:
向该用户转入资金的用户与接受该用户转出资金的用户的数量的和值、向该用户转入资金的用户与接受该用户转出资金的用户的数量的比值、向该用户转入次数与该用户转出次数的均值,以及向该用户转入金额与该用户转出金额的均值。
在一种可能的实施方式中,所述划分模块530,用于根据以下步骤将所述多个用户划分为至少一个可疑用户群:
针对所述至少一个可疑用户中的每个可疑用户,确定出与该可疑用户产生交易的第一关联用户,以及与所述第一关联用户产生交易的第二关联用户,并判断所述第二关联用户是否为所述至少一个可疑用户中除该可疑用户之外的其他可疑用户;
若是,则将该可疑用户、该可疑用户对应的第一关联用户,以及该第二关联用户划分至一个可疑用户群。
在一种可能的实施方式中,所述第二确定模块540,用于根据以下步骤确定出每个可疑用户群中各个可疑用户中每个可疑用户的可疑分数:
根据所述各个可疑用户中每个可疑用户的历史交易信息,提取出表征每个用户交易特征向量;
将所述各个可疑用户对应的交易特征向量输入至训练好的交易评分模型,输出所述各个可疑用户对应的可疑分数。
在一种可能的实施方式中,所述第三确定模块550,具体用于:
确定该可疑用户群中每个可疑用户的可疑分数进行加和的和值,并将所述和值与该可疑用户群中所有用户的数量之间的比值,确定为该可疑用户群的可疑分数。
基于同一申请构思,参见图6所示,为本申请实施例提供的一种电子设备600的结构示意图,包括:处理器610、存储器620和总线630,所述存储器620存储有所述处理器610可执行的机器可读指令,当电子设备600运行时,所述处理器610与所述存储器620之间通过所述总线630进行通信,所述机器可读指令被所述处理器610运行时执行如上述实施例所述的目标用户群的确定的步骤。
具体地,所述机器可读指令被所述处理器610执行时可以执行如下处理:
获取多个用户的历史交易信息;
根据所述多个用户的历史交易信息,从所述多个用户中确定出至少一个可疑用户;
根据所述至少一个可疑用户,以及每个可疑用户产生交易的关联用户,将所述多个用户划分为至少一个可疑用户群;
确定出每个可疑用户群中各个可疑用户的可疑分数;
根据每个可疑用户群中各个可疑用户的可疑分数,以及该可疑用户群包含的用户的总人数,确定出该可疑用户群的可疑分数;所述可疑分数用于表征可疑用户和/或可疑用户群进行非法交易的可疑程度;
根据各个可疑用户群的可疑分数,从所述至少一个可疑用户群中选取出目标用户群。
本申请实施例中,本申请通过获取的多个用户的历史交易信息,可以从多个用户中确定出至少一个可疑用户,进而,根据每个可疑用户,以及可疑用户产生交易的关联用户,可以将多个用户划分到至少一个可疑用户群,并根据每个可疑用户群中各个可疑用户的可疑分数以及包含用户的总人数,确定出每个可疑用户群的可疑分数,进而根据可疑用户群的可疑分数,从各个可疑用户群中确定出进行非法交易的目标用户群,可以准确且高效地识别出非法交易组织。
基于同一申请构思,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述实施例提供的目标用户群的确定方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应所述理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者所述技术方案的部分可以以软件产品的形式体现出来,所述计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
1.一种目标用户群的确定方法,其特征在于,所述确定方法包括:
获取多个用户的历史交易信息;
根据所述多个用户的历史交易信息,从所述多个用户中确定出至少一个可疑用户;
根据所述至少一个可疑用户,以及每个可疑用户产生交易的关联用户,将所述多个用户划分为至少一个可疑用户群;
确定出每个可疑用户群中各个可疑用户的可疑分数;
根据每个可疑用户群中各个可疑用户的可疑分数,以及该可疑用户群包含的用户的总人数,确定出该可疑用户群的可疑分数;所述可疑分数用于表征可疑用户和/或可疑用户群进行非法交易的可疑程度;
根据各个可疑用户群的可疑分数,从所述至少一个可疑用户群中选取出目标用户群。
2.根据权利要求1所述的确定方法,其特征在于,所述根据所述多个用户的历史交易信息,从所述多个用户中确定出至少一个可疑用户,包括:
根据所述多个用户的历史交易信息,统计每个用户的转入信息和转出信息;
根据统计出的每个用户的转入信息和转出信息,计算用于表征每个用户的交易集中程度的集中程度指标;
将所述多个用户中集中程度指标大于或等于预设阈值对应的用户,确定为可疑用户。
3.根据权利要求2所述的确定方法,其特征在于,所述表征每个用户的交易集中程度的集中程度指标包括:
向该用户转入资金的用户与接受该用户转出资金的用户的数量的和值、向该用户转入资金的用户与接受该用户转出资金的用户的数量的比值、向该用户转入次数与该用户转出次数的均值,以及向该用户转入金额与该用户转出金额的均值。
4.根据权利要求1所述的确定方法,其特征在于,所述根据所述至少一个可疑用户,以及每个可疑用户产生交易的关联用户,将所述多个用户划分为至少一个可疑用户群,包括:
针对所述至少一个可疑用户中的每个可疑用户,确定出与该可疑用户产生交易的第一关联用户,以及与所述第一关联用户产生交易的第二关联用户,并判断所述第二关联用户是否为所述至少一个可疑用户中除该可疑用户之外的其他可疑用户;
若是,则将该可疑用户、该可疑用户对应的第一关联用户,以及该第二关联用户划分至一个可疑用户群。
5.根据权利要求1所述的确定方法,其特征在于,所述确定出每个可疑用户群中各个可疑用户的可疑分数,包括:
根据所述各个可疑用户中每个可疑用户的历史交易信息,提取出表征每个用户交易特征向量;
将所述各个可疑用户对应的交易特征向量输入至训练好的交易评分模型,输出所述各个可疑用户对应的可疑分数。
6.根据权利要求1所述的确定方法,其特征在于,所述根据每个可疑用户群中各个可疑用户的可疑分数,以及该可疑用户群包含的用户的总人数,确定出该可疑用户群的可疑分数,包括:
确定该可疑用户群中每个可疑用户的可疑分数进行加和的和值,并将所述和值与该可疑用户群中所有用户的数量之间的比值,确定为该可疑用户群的可疑分数。
7.一种目标用户群的确定装置,其特征在于,所述确定装置包括:
获取模块,用于获取多个用户的历史交易信息;
第一确定模块,用于根据所述多个用户的历史交易信息,从所述多个用户中确定出至少一个可疑用户;
划分模块,用于根据所述至少一个可疑用户,以及每个可疑用户产生交易的关联用户,将所述多个用户划分为至少一个可疑用户群;
第二确定模块,用于确定出每个可疑用户群中各个可疑用户的可疑分数;
第三确定模块,用于根据每个可疑用户群中各个可疑用户的可疑分数,以及该可疑用户群包含的用户的总人数,确定出该可疑用户群的可疑分数;所述可疑分数用于表征可疑用户和/或可疑用户群进行非法交易的可疑程度;
选取模块,用于根据各个可疑用户群的可疑分数,从所述至少一个可疑用户群中选取出目标用户群。
8.根据权利要求7所述的确定装置,其特征在于,所述第一确定模块,用于根据以下步骤从所述多个用户中确定出至少一个可疑用户:
根据所述多个用户的历史交易信息,统计每个用户的转入信息和转出信息;
根据统计出的每个用户的转入信息和转出信息,计算用于表征每个用户的交易集中程度的集中程度指标;
将所述多个用户中集中程度指标大于或等于预设阈值对应的用户,确定为可疑用户。
9.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至6任一所述的目标用户群的确定方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至6任一所述的目标用户群的确定方法。
技术总结