一种目标人群的定位方法、系统及相关设备与流程

专利2022-06-29  55


本申请涉及数字定位领域,特别涉及一种目标人群的定位方法、系统及相关设备。



背景技术:

当前存在不法分子扰乱社会治安,因此,如何对这一类目标人群实现有效的定位是本领域技术人员亟需解决的技术问题。



技术实现要素:

本申请的目的是提供一种目标人群的定位方法、系统、计算机可读存储介质和定位终端,能够对于目标人群进行有效的定位监控。

为解决上述技术问题,本申请提供一种目标人群的定位方法,具体技术方案如下:

获取所述目标人群中已公开的身份信息和通讯数据;

根据所述通讯数据的通讯网络确定目标人群号码集合;

根据所述目标人群号码集合确定所述目标人群的集会地;

根据所述通讯数据中超过预设频率通话的所在基站确定各所述身份信息对应的居住地;

根据所述集会地和所述居住地的并集确定所述目标人群的位置。

其中,还包括:

根据所述通讯数据中的通话记录的拨出方为头节点建立头结点链表;

利用所述头结点链表确定目标人群中的任意两人之间的通话次数、平均通话时长和短信次数;

根据所述通话次数得到通话次数影响因子,根据所述平均通话时长得到平均通话时长影响因子,根据所述短信次数得到短信次数影响因子;

根据所述通话次数影响因子、所述平均通话时长影响因子、所述短信次数影响因子得到所述目标人群中任意两人之间的亲密度。

其中,还包括:

以所述通讯数据中的电话号码为节点,通联记录为边,亲密度为边的权值建立所述目标人群的人际关系图。

其中,还包括:

利用gn算法对所述人际关系图划分社区,将包含预设数量以上的社区确认为目标社区。

其中,还包括:

将所述通讯数据输入svm分类模型,得到所述目标人群的电话号码集合。

其中,还包括:

根据所述头结点链表建立数据集;

利用所述数据集建立所述svm分类模型。

本申请还提供一种目标人群的定位系统,包括:

获取模块,用于获取所述目标人群中已公开的身份信息和通讯数据;

号码确定模块,用于根据所述通讯数据的通讯网络确定目标人群号码集合;

集会地确认模块,用于根据所述目标人群号码集合确定所述目标人群的集会地;

居住地确认模块,用于根据所述通讯数据中超过预设频率通话的所在基站确定各所述身份信息对应的居住地;

定位模块,用于根据所述集会地和所述居住地的并集确定所述目标人群的位置。

其中,还包括:

人际关系分析模块,用于以所述通讯数据中的电话号码为节点,通联记录为边,亲密度为边的权值建立所述目标人群的人际关系图。

本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的方法的步骤。

本申请还提供一种定位终端,包括存储器和处理器,所述存储器中存有计算机程序,所述处理器调用所述存储器中的计算机程序时实现如上所述的方法的步骤。

本申请提供一种目标人群的定位方法,具体技术方案如下:获取所述目标人群中已公开的身份信息和通讯数据;根据所述通讯数据的通讯网络确定目标人群号码集合;根据所述目标人群号码集合确定所述目标人群的集会地;根据所述通讯数据中超过预设频率通话的所在基站确定各所述身份信息对应的居住地;根据所述集会地和所述居住地的并集确定所述目标人群的位置。

本申请通过根据身份信息和对应的通讯数据,先锁定目标人群的通讯范围,有利于根据目标人群的通讯范围确定目标。进而根据再确定集会地和居住地,锁定目标人群的活动范围,容易发现具有定期集会、定期联系的目标人群,以便对目标人群进行布控。本申请还提供一种目标人群的定位方法、系统、计算机可读存储介质和定位终端,具有上述有益效果,此处不再赘述。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本申请实施例所提供的一种目标人群的定位方法的流程图;

图2为本申请实施例所提供的一种目标人群的定位系统结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

请参考图1,图1为本申请实施例所提供的一种目标人群的定位方法的流程图,该定位方法包括:

s101:获取目标人群中已公开的身份信息和通讯数据;

本步骤主要指获取目标人群的已公开信息。例如针对于某宗教成员时,当发现该宗教中某一成员或某些成员时,确定其身份信息以及相应的通讯数据。通讯数据主要指手机等移动终端的手机号及相应的通讯记录。具体的,获取身份信息和通讯数据时可以借助于公安通联数据。

s102:根据通讯数据的通讯网络确定目标人群号码集合;

本步骤旨在确定目标人群号码集合。根据已经获取到的身份信息和其通讯数据,可以确定其通讯范围中的目标人群号码集合。而容易理解的是,在已公开的通讯数据中,包含无效号码以及商业电话或者运营商服务电话或者其他广告等,以及可能存在误拨等情况。因此,在根据通讯数据的通讯网络确定目标人群号码集合时可以先进行数据预处理,删除通讯数据中的无效号码并去除通话时长不满足预设时长的通话记录,该预设时长不作具体限定,可以为3秒、5秒等。

在进行数据预处理后,即可确定通讯数据中的目标人群之间的通联记录和对应的有效通讯号码,根据有效通讯号码对应的身份信息确定目标人群号码集合。

s103:根据目标人群号码集合确定目标人群的集会地;

本步骤旨在确定集会地。根据s102中得到的目标人群号码集合,可以得到目标人群中每个人的移动终端号码集合,则进一步可以根据这些移动终端号码的所述基站相对应,一旦当这些移动终端号码所连接的基站较为集中,或者均与同一基站相连,或者连接的几个基站位置较为接近,那么可以直接根据基站位置确定集会地。每个基站均存在对应的唯一识别编码,则根据移动终端对应的基站的唯一识别编码确定基站位置后,则集会地为该基站周围信号的有效接收范围内。

s104:根据通讯数据中超过预设频率通话的所在基站确定各身份信息对应的居住地;

进一步的,针对目标人群号码集合中,根据每个号码访问频率最高的基站确定该号码的位置,进一步得到该身份信息对应的居住地。由于每个目标人物大部分时间应在其居住地,因此根据其移动终端号码打电话频率最高时对应的基站即可确定目标人物的居住地。

需要注意的是,由于目标人群的流散性较强,该居住地可能仅仅为目标人物的落脚点或者暂居地,或者同一目标人物可能存在若干落脚点等等。

s105:根据集会地和居住地的并集确定目标人群的位置。

根据居住地和集会地的并集,即可确定目标人物的主要位置。

本申请通过根据身份信息和对应的通讯数据,先锁定目标人群的通讯范围,有利于根据目标人群的通讯范围确定目标。进而根据再确定集会地和居住地,锁定目标人群的活动范围,容易发现具有定期集会、定期联系的目标人群,以便对目标人群进行布控。

在上述实施例的基础上,作为优选的实施例,对目标人物进行布控通常不仅需要获知其位置,还需要确定目标人群之间的人物关系。为此,可以采取如下步骤:

s201:根据通讯数据中的通话记录的拨出方为头节点建立头结点链表;

s202:利用头结点链表确定目标人群中的任意两人之间的通话次数、平均通话时长和短信次数;

s203:根据通话次数得到通话次数影响因子,根据平均通话时长得到平均通话时长影响因子,根据短信次数得到短信次数影响因子;

s204:根据通话次数影响因子、平均通话时长影响因子、短信次数影响因子得到目标人群中任意两人之间的亲密度。

对于通讯数据中的任一条通讯记录号码a→号码b,首先判断是否存在值为a的头结点,若是,再判断是否存在值为b的头结点,若不存在值为b的头结点,则在号码a结点后添加值为b的节点。若不存在值为a的头结点,则添加一个值为a的头结点。

依次类推,根据通讯数据中的所有通讯记录建立头结点链表。容易理解的是,每个头结点对应一个子链表。

此后可以计算亲密度,主要根据两人之间的通话次数、平均通话时长和短信次数确定。

而通话次数影响因子、平均通话时长影响因子、短信次数影响因子均由本领域技术人员进行相应设定,在此不作限定。当然通话越多,对应的通话次数影响因子越大,平均通话时长越大,对应的平均通话时长影响因子也越大。短信次数影响因子同理。

则最后的亲密度可以根据通话次数影响因子、平均通话时长影响因子、短信次数影响因子和预设系数进行确定。

在得到亲密度后,还可以以通讯数据中的电话号码为节点,通联记录为边,亲密度为边的权值建立目标人群的人际关系图,有利于判断目标人群之间的人物关系。

在上述实施例的基础上,作为优选的实施例,在得到人际关系图后,还可以包括:

利用gn算法对人际关系图划分社区,将包含预设数量以上的社区确认为目标社区。

gn算法是社区发现的一种方法。社区发现基于图结构。图最基本结构以两个点,一条边构成,即:起始点——终点。社区发现类似于聚类问题,都是将具有一定特性的点归入同一个簇中。不同的是聚类基于点自身的特征,而社区划分则基于点与点之间的关系。

在一个网络之中,通过社区内部的边的最短路径相对较少,而通过社区之间的边的最短路径的数目则相对较多。下面展示了边的强度以及边介数在现实网络中的分布情况。gn算法是一个基于删除边的算法,本质是基于聚类中的分裂思想,在原理上是使用边介数作为相似度的度量方法。在gn算法中,每次都会选择边介数高的边删除,进而网络分裂速度远快于随机删除边时的网络分裂。

gn算法的步骤如下:

a.计算每一条边的边介数;

b.删除边界数最大的边;

c.重新计算网络中剩下的边的边阶数;

d.重复步骤b、c,直到网络中的任一顶点作为一个社区为止。

利用gn算法,可以进一步得到目标社区,目标社区实际上为目标人群的重点活动区域,因此可以对该目标社区进行重点布控,以期发现其他目标人物。

在上述实施例的基础上,作为优选的实施例,还包括:

将通讯数据输入svm分类模型,得到目标人群的电话号码集合。

具体的,可以根据头结点链表建立数据集,再利用数据集建立svm分类模型。具体的,需要对数据集进行特征提取。

特征提取过程主要对目标人物进行特征分类,例如判断是否处于目标社区,是否去过可疑地点,可疑地点访问是否具有周期性,是否存在特殊时段通话等等,根据一定特征进行分类判断,以确定目标人物的身份。这些均为数据集的数据内容。此后根据数据集中的特征经过svm算法训练后即可得到svm分类模型。

本申请实施例旨在根据头结点链表建立svm分类模型,通过该模型,只需要输入已知的目标人群的移动终端号码和一段时间内的通讯数据,可以自动输出其他目标人物的移动终端号码集合。因此,svm分类模型实质也是判断任意人物是否属于目标人物的判断模型。

下面对本申请实施例提供的一种目标人群的定位系统进行介绍,下文描述的定位系统与上文描述的一种目标人群的定位方法可相互对应参照。

参见图2,图2为本申请实施例所提供的一种目标人群的定位系统结构示意图,本申请还提供一种目标人群的定位系统,包括:

获取模块100,用于获取所述目标人群中已公开的身份信息和通讯数据;

号码确定模块200,用于根据所述通讯数据的通讯网络确定目标人群号码集合;

集会地确认模块300,用于根据所述目标人群号码集合确定所述目标人群的集会地;

居住地确认模块400,用于根据所述通讯数据中超过预设频率通话的所在基站确定各所述身份信息对应的居住地;

定位模块500,用于根据所述集会地和所述居住地的并集确定所述目标人群的位置。

在上述实施例的基础上,作为优选的实施例,还可以包括:

人际关系分析模块,用于以所述通讯数据中的电话号码为节点,通联记录为边,亲密度为边的权值建立所述目标人群的人际关系图。

本申请还提供了一种计算机可读存储介质,其上存有计算机程序,该计算机程序被执行时可以实现上述实施例所提供的步骤。该存储介质可以包括:u盘、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。

本申请还提供了一种定位终端,可以包括存储器和处理器,所述存储器中存有计算机程序,所述处理器调用所述存储器中的计算机程序时,可以实现上述实施例所提供的步骤。当然所述定位终端还可以包括各种网络接口,电源等组件。

说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例提供的系统而言,由于其与实施例提供的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。

还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。


技术特征:

1.一种目标人群的定位方法,其特征在于,包括:

获取所述目标人群中已公开的身份信息和通讯数据;

根据所述通讯数据的通讯网络确定目标人群号码集合;

根据所述目标人群号码集合确定所述目标人群的集会地;

根据所述通讯数据中超过预设频率通话的所在基站确定各所述身份信息对应的居住地;

根据所述集会地和所述居住地的并集确定所述目标人群的位置。

2.根据权利要求1所述的定位方法,其特征在于,还包括:

根据所述通讯数据中的通话记录的拨出方为头节点建立头结点链表;

利用所述头结点链表确定目标人群中的任意两人之间的通话次数、平均通话时长和短信次数;

根据所述通话次数得到通话次数影响因子,根据所述平均通话时长得到平均通话时长影响因子,根据所述短信次数得到短信次数影响因子;

根据所述通话次数影响因子、所述平均通话时长影响因子、所述短信次数影响因子得到所述目标人群中任意两人之间的亲密度。

3.根据权利要求1所述的定位方法,其特征在于,还包括:

以所述通讯数据中的电话号码为节点,通联记录为边,亲密度为边的权值建立所述目标人群的人际关系图。

4.根据权利要求3所述的定位方法,其特征在于,还包括:

利用gn算法对所述人际关系图划分社区,将包含预设数量以上的社区确认为目标社区。

5.根据权利要求2所述的定位方法,其特征在于,还包括:

将所述通讯数据输入svm分类模型,得到所述目标人群的电话号码集合。

6.根据权利要求5所述的定位方法,其特征在于,还包括:

根据所述头结点链表建立数据集;

利用所述数据集建立所述svm分类模型。

7.一种目标人群的定位系统,其特征在于,包括:

获取模块,用于获取所述目标人群中已公开的身份信息和通讯数据;

号码确定模块,用于根据所述通讯数据的通讯网络确定目标人群号码集合;

集会地确认模块,用于根据所述目标人群号码集合确定所述目标人群的集会地;

居住地确认模块,用于根据所述通讯数据中超过预设频率通话的所在基站确定各所述身份信息对应的居住地;

定位模块,用于根据所述集会地和所述居住地的并集确定所述目标人群的位置。

8.根据权利要求7所述的定位系统,其特征在于,还包括:

人际关系分析模块,用于以所述通讯数据中的电话号码为节点,通联记录为边,亲密度为边的权值建立所述目标人群的人际关系图。

9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-6任一项所述的定位方法的步骤。

10.一种定位终端,其特征在于,包括存储器和处理器,所述存储器中存有计算机程序,所述处理器调用所述存储器中的计算机程序时实现如权利要求1-6任一项所述的定位方法的步骤。

技术总结
本申请提供一种目标人群的定位方法,包括:获取目标人群中已公开的身份信息和通讯数据;根据通讯数据的通讯网络确定目标人群号码集合;根据目标人群号码集合确定目标人群的集会地;根据通讯数据中超过预设频率通话的所在基站确定各身份信息对应的居住地;根据集会地和居住地的并集确定目标人群的位置。本申请有利于根据目标人群的通讯范围确定目标。进而根据再确定集会地和居住地,锁定目标人群的活动范围,容易发现具有定期集会、定期联系的目标人群,以便对目标人群进行布控。本申请还提供一种目标人群的定位方法、系统、计算机可读存储介质和定位终端,具有上述有益效果。

技术研发人员:郎朗;范渊
受保护的技术使用者:杭州安恒信息技术股份有限公司
技术研发日:2019.11.28
技术公布日:2020.06.05

转载请注明原文地址: https://bbs.8miu.com/read-53061.html

最新回复(0)