本发明涉及轨迹检测技术领域,特别是指一种轨迹异常检测方法和系统。
背景技术:
飓风破坏力极强,每年造成严重人员伤亡和财产损失。从大量的轨迹数据中挖掘出异常轨迹模式来预防突发事件的发生具有十分重要的意义。
traod(trajectoryoutlierdetectionalgorithm)算法是一种经典的异常轨迹检测算法,该算法首先采用两种分段粒度将每条轨迹分为若干轨迹线段,然后,在基于距离的异常检测方法的基础上,引入调整系数的概念,采用密度与距离相结合的方法进行异常轨迹检测。
然而,在实际应用中,通过上述traod算法检测出的飓风异常轨迹与实际情况的符合效果不佳;因此,有必要提供一种飓风异常轨迹方法,可以相比于经典的traod算法更加符合实际情况。
技术实现要素:
有鉴于此,本发明的一个或多个实施例提供了一种轨迹异常检测方法和系统,能够检测出更符合实际情况的异常轨迹。
上述轨迹异常检测方法包括:
采样得到待检测轨迹的轨迹点后,根据每个轨迹点的空间和时间状态,从采样的轨迹点中提取特征点;若所述轨迹
根据提取的特征点对所述待检测轨迹进行分段;
将分段得到的轨迹段与预先得到的正常、异常模式轨迹段进行比较,根据比较结果识别出异常的轨迹段;
其中,所述2个条件为:
条件1:
条件2:
其中,所述正常、异常模式轨迹段是通过对训练集中的轨迹段进行聚类后得到的;所述训练集中的轨迹段是根据历史轨迹的轨迹点的空间和时间状态提取特征点并对所述历史轨迹分段后得到的。
较佳地,所述
其中,各轨迹点的时间状态参数指标
较佳地,所述轨迹具体为飓风的轨迹,所述轨迹点的时间状态参数指标
其中,
较佳地,所述正常、异常模式轨迹段是通过对训练集中的轨迹段进行聚类后得到的,具体包括:
对所述训练集中的任意两个轨迹段,根据这两个轨迹段的时间、空间状态,计算这两个轨迹段之间的时空状态距离;
根据计算出的轨迹段之间的时空状态距离,对轨迹段进行聚类。
较佳地,所述根据这两个轨迹段的时间、空间状态,计算这两个轨迹段之间的时空状态距离,具体包括:
根据如下公式八计算两个轨迹段之间的时空状态距离:
其中,
其中,
其中,
较佳地,所述根据计算出的轨迹段之间的时空状态距离,对轨迹段进行聚类,具体包括:
根据所述训练集中的轨迹段之间的时空状态距离,确定所述训练集中每个轨迹段的ε-近邻;其中,ε为设定的近邻阈值;
对于所述训练集中每个轨迹段,统计该轨迹段的ε-近邻总数,作为该轨迹段的密度值;并判断该轨迹段的密度值是否小于密度阈值
对于所述训练集中的每个高密度轨迹段,判断该轨迹段是否为其它高密度轨迹段的ε-近邻;若是,则将两者聚类为同一簇的轨迹段,并将两者确认为聚类得到的正常模式轨迹段;
对于所述训练集中的每个低密度轨迹段,判断该该轨迹段是否为任一高密度轨迹段的ε-近邻;若否,则确认该低密度轨迹段为异常模式轨迹段。
较佳地,所述将分段得到的轨迹段与预先得到的正常、异常模式轨迹段进行比较,根据比较结果识别出异常的轨迹段,具体包括:
对于分段得到的每个轨迹段,根据该轨迹段的空间和时间状态,计算该轨迹段与各正常、异常模式轨迹段之间的时空状态距离,并根据计算出的时空状态距离,确定该轨迹段的ε-近邻;根据该轨迹段的ε-近邻中的正常、异常模式轨迹段数量,判断该轨迹段是否为异常的轨迹段;
其中,ε为设定的近邻阈值。
较佳地,在所述识别出异常的轨迹段后,还包括:在所述异常的轨迹段中进行细粒度异常检测:
对于识别出的异常的轨迹段,依次连接该轨迹段的起始点之间的轨迹点,得到该轨迹段的各子轨迹段;
针对每个子轨迹段,将该子轨迹段的起点与所述异常的轨迹段的起点相连得到该子轨迹段的前分段,将该子轨迹段的终点与所述异常的轨迹段的起点相连得到该子轨迹段的后分段;将该子轨迹段的前、后分段与预先得到的正常、异常模式轨迹段进行比较,根据比较结果若确认该子轨迹段的前、后分段均为正常,则判断该子轨迹段为正常;否则,判断该子轨迹段为异常。
本发明的一个或多个实施例还提供一种轨迹异常检测系统,包括:
特征点提取模块,用于采样得到待检测轨迹的轨迹点后,根据每个轨迹点的空间和时间状态,从采样的轨迹点中提取特征点:若所述轨迹
轨迹分段模块,用于根据提取的特征点对所述待检测轨迹进行分段,得到所述待检测轨迹的轨迹段;
异常轨迹段识别模块,用于将所述待检测轨迹的轨迹段与预先得到的正常、异常模式轨迹段进行比较,根据比较结果识别出异常的轨迹段;
其中,所述2个条件为:
条件1:
条件2:
其中,所述正常、异常模式轨迹段是通过对训练集中的轨迹段进行聚类后得到的;所述训练集中的轨迹段是根据历史轨迹的轨迹点的空间和时间状态提取特征点并对所述历史轨迹分段后得到的。
本发明的一个或多个实施例还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现如上所述的轨迹异常检测方法。
本发明的技术方案中,在采样得到待检测轨迹的轨迹点后,根据每个轨迹点的空间和时间状态,从采样的轨迹点中提取特征点;根据提取的特征点对所述待检测轨迹进行分段;将分段得到的轨迹段与预先得到的正常、异常模式轨迹段进行比较,根据比较结果识别出异常的轨迹段;其中,所述正常、异常模式轨迹段是通过对训练集中的轨迹段进行聚类后得到的;所述训练集中的轨迹段是根据历史轨迹的轨迹点的空间和时间状态提取特征点并对所述历史轨迹分段后得到的。
这样,在分段阶段考虑了时间因素的影响,通过轨迹状态的约束来分段,从而发现轨迹行为变化特别大的特征点,并通过这些点将轨迹划分为若干轨迹段,既能够减少运算数据又能有效地保持轨迹局部特征,同时又不会丢失轨迹的全局特征;使得分段的轨迹更符合轨迹状态的变化,在分段结果上更具有实际意义;
而且,在训练正常、异常模式轨迹段的聚类阶段也考虑了时间因素的影响,并据此重新定义轨迹段间测距离计算对分段后的轨迹聚类,最后根据聚类结果的正常、异常模式轨迹段进行异常检测,使得检测的异常轨迹更符合轨迹状态的变化,更加符合实际情况。
进一步,在异常检测阶段采用两级异常轨迹检测方法,首先通过第一级粗粒度的异常检测找到异常的轨迹分段,其次通过第二级细粒度的异常检测检测异常的子轨迹。通过针对1999-2012年大西洋飓风数据进行仿真实验,实验结果表明上述两级异常轨迹检测方法检测的异常轨迹更加符合飓风状态的变化,更加符合实际情况。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的一个或多个实施例提供的轨迹异常检测方法流程图;
图2a为本发明的一个或多个实施例提供的一种飓风轨迹示意图;
图2b、2c分别为通过本发明的一个或多个实施例提供的轨迹异常检测方法、现有mdl方法进行的轨迹分段得到的分段轨迹示意图;
图2d为通过本发明的一个或多个实施例提供的轨迹异常检测方法、现有mdl方法得到的分段轨迹对比图;
图2e为本发明的一个或多个实施例提供的一种飓风的原始轨迹图;
图2f为通过本发明的一个或多个实施例提供的轨迹异常检测方法得到的分段轨迹的示意图;
图3a为本发明的一个或多个实施例提供的一种识别出异常的轨迹段的方法流程图;
图3b为本发明的一个或多个实施例提供的一种轨迹段之间的空间距离示意图;
图4为本发明的一个或多个实施例提供的一种从异常的轨迹段中检测出异常的子轨迹段的方法流程图;
图5a为本发明的一个或多个实施例提供的一种该子轨迹段的前、后分段示意图;
图5b为本发明的一个或多个实施例提供的两级异常轨迹检测方法的异常轨迹检测结果示意图;
图5c为traod异常检测方法的异常轨迹检测结果示意图;
图6为本发明的一个或多个实施例提供的一种训练出正常、异常模式轨迹的方法流程图;
图7为本发明的一个或多个实施例提供的一种对轨迹段进行聚类的方法流程图;
图8为本发明的一个或多个实施例提供的一种根据计算出的轨迹段之间的时空状态距离,对轨迹段进行聚类的方法流程图;
图9为本发明的一个或多个实施例提供的一种轨迹异常检测系统的内部结构框图;
图10为本发明的一个或多个实施例提供的一种电子设备硬件结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明的一个或多个实施例进一步详细说明。
需要说明的是,除非另外定义,本发明的实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本公开中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
通过对现有的traod算法进行分析,发现该方法注重空间上轨迹的变化,在计算轨迹距离时只考虑了轨迹垂直距离、平行距离和角度距离,而忽略了轨迹在时间上的变化;但在实际应用中,轨迹在时间上的变化也是衡量轨迹是否异常的标准。
因此,本发明的一个或多个实施例的技术方案,在分段和聚类阶段考虑了时间因素的影响,通过轨迹状态的约束来分段,然后重新定义轨迹段间测距离计算对分段后的轨迹聚类,最后根据聚类的结果进行异常检测。
进一步,本发明的一个或多个实施例的技术方案,在异常检测阶段采用两级异常轨迹检测方法,首先通过第一级粗粒度的异常检测找到异常的轨迹分段,其次通过第二级细粒度的异常检测检测异常的子轨迹。通过针对1999-2012年大西洋飓风数据进行仿真实验,实验结果表明本发明实施例提出的基于状态约束的轨迹分段的技术方案检测的异常轨迹更加符合飓风状态的变化,本发明提出的异常检测方法检测出的异常轨迹同经典的traod相比更加符合实际情况。
下面结合附图详细说明本发明一个或多个实施例的技术方案。
本发明一个或多个提供的轨迹异常检测方法,具体流程如图1所示,包括如下步骤:
步骤s101:采样得到待检测轨迹的轨迹点后,根据每个轨迹点的空间和时间状态,从采样的轨迹点中提取特征点。
具体地,轨迹(trajectory)是多维度空间下有序的点的集合,可记为
现有技术通常采用mdl(minimumdescriptionlength,最小描述长度)准则来判断轨迹点是否为特征点;mdl包括两个部分:
对于一个待检测轨迹
其中,
然而,通过研究发现,mdl准则只是考虑到轨迹的空间距离和方向上的变化而忽略了轨迹时间上的变化,轨迹时间上的变化可以通过采样的轨迹点的时间状态参数来体现。由于轨迹在某些位置上的状态会发生变化,如飓风登陆时最大持续风速,中心最低气压等状态,这些状态发生重大变化的点也具有重要的研究价值。因此本发明的一个或多个实施例在提取特征点时除了考虑轨迹在空间位置上的变化,同时也考虑了轨迹在时间状态上的变化。
本发明的实施例提出轨迹点的时间状态参数指标
在本发明的一个或多个实施例中,定义:子轨迹段
子轨迹段
状态离散指标
其中,
其中,
本步骤中,对于采样得到的轨迹点形成的待检测轨迹
采样得到的第
条件1:
其中,
条件2:
其中,
若轨迹点的时间状态参数指标
步骤s102:根据提取的特征点对所述待检测轨迹进行分段,得到所述待检测轨迹的各轨迹段。
具体地,由于一般轨迹的数据非常庞大,因此通过发现轨迹行为变化特别大的特征点,并通过这些点将轨迹划分为若干轨迹段,既能够减少运算数据又能有效地保持轨迹局部特征,同时又不会丢失轨迹的全局特征。由此,本步骤中,在待检测轨迹
例如,对如图2a所示的飓风轨迹,采用本发明一个或多个实施例所述的方法提取特征点并分段得到如图2b所示的轨迹段,其中提取的特征点为:0,7,12,18,22,23,24,25,26,27,30,33,34,35,39,42,43,44,45,49,51;采用现有的mdl分方法提取特征点并分段得到如图2c所示的轨迹段,其中提取的特征点为:0,7,12,18,22,34,39,43,46,50,51。
图2d表示的是轨迹点22到轨迹点34,本发明实施例提出的轨迹异常检测方法和mdl方法选取的特征点的对比。本发明实施例所提出的方法选取的特征点是22,23,24,25,26,27,30,33,34,得到的分段轨迹如图2d中实线所示;mdl方法提取的特征点为22,34,得到的分段轨迹如图2d中虚线所示。根据萨菲尔-辛普森飓风量级(saffir-simpsonhurricanewindscale,sshs),如表1所示,本发明的实施例把每一个子轨迹段对应的飓风等级进行划分,结果如下表2所示。(注(26,27)和(32,33)的轨迹最大持续风速均超过136节,飓风强度属于5级,但是其中心最低气压过高属于4级,因此把这两段的飓风强度定义为4-5级)。
表2
本发明实施例提出的分段方法将轨迹点22到轨迹点34之间的轨迹分成了如下8段,其中
图2e所示为1990-2009年飓风的原始轨迹图,图2f为采用本发明实施例提出的上述提取特征点并分段的方法得到的飓风轨迹图。从图2f中可以看出分段后的飓风轨迹和原始轨迹几乎一致,但是分段后的轨迹的在数量级上和原始轨迹是不一样的。原始轨迹有8469个子轨迹,通过分段后得到2896条轨迹段,轨迹段压缩到原始轨迹的34.2%,这就提高了轨迹聚类的速率,同时分段也保存了轨迹在时间和空间上的局部特性。
步骤s103:将分段得到的所述待检测轨迹的各轨迹段与预先得到的正常、异常模式轨迹段进行比较,根据比较结果识别出异常的轨迹段。
具体地,所述正常、异常模式轨迹段是通过对训练集中的轨迹段进行聚类后得到的;所述训练集中的轨迹段是根据历史轨迹的轨迹点的空间和时间状态提取特征点并对所述历史轨迹分段后得到的;所述正常、异常模式轨迹段的生成方法将在后续详细介绍。
对于所述待检测轨迹的每个轨迹段,可以根据如图3a所示的方法流程,识别出异常的轨迹段,具体包括如下子步骤:
子步骤s301:对于当前处理的一个待检测轨迹的轨迹段,根据该轨迹段的空间和时间状态,计算该轨迹段与各正常、异常模式轨迹段之间的时空状态距离。
具体地,轨迹段之间的匹配程度可以通过两者之间的距离来确定,首先给出如下定义:
对于如图3b所示轨迹段
其中
其中
其中
其中,
其中,
例如,对于飓风轨迹,轨迹点的
其中
本子步骤中,对于每个正常模式轨迹段,可以根据该正常模式轨迹段的空间和时间状态,与当前处理的轨迹段的空间和时间状态,依据上述公式八计算该正常模式轨迹段与当前处理的轨迹段之间的时空状态距离;
对于每个异常模式轨迹段,可以根据该异常模式轨迹段的空间和时间状态,与当前处理的轨迹段的空间和时间状态,依据上述公式八计算该异常模式轨迹段与当前处理的轨迹段之间的时空状态距离。
子步骤s302:根据计算出的当前处理的轨迹段与各正常、异常模式轨迹段之间的时空状态距离,确定该轨迹段的ε-近邻。
具体地,首先给出如下定义:
定义轨迹段的ε-近邻集(ε-neighbor):对于轨迹段
定义轨迹段的密度值:对于轨迹段
定义核心轨迹段:对于轨迹段
由此,本子步骤中,对于每个正常模式轨迹段,若当前处理的轨迹段
对于每个异常模式轨迹段,若当前处理的轨迹段
子步骤s303:根据当前处理的轨迹段的ε-近邻中的正常、异常模式轨迹段数量,判断该轨迹段是否为异常的轨迹段。
具体地,可以根据如下公式九计算当前处理的轨迹段
其中
若
步骤s104:在识别出的异常的轨迹段中进行细粒度异常检测。
更优地,在识别出的异常的轨迹段后,还可进一步在异常的轨迹段中进行细粒度异常检测;也就是说,作为一种更优的实施方式,本发明的实施例采用两级异常检测,其中,上述步骤s103是第一级粗粒度异常检测,实现对分段后的轨迹段进行异常检测,而本步骤是第二级细粒度异常检测,是对识别出的异常的轨迹段对应的原始轨迹中的每一个子轨迹段进行异常检测;从而实现两级异常轨迹检测。
本步骤中,从识别出的异常的轨迹段
子步骤s401:对于识别出的异常的轨迹段,依次连接该轨迹段的起始点之间的轨迹点,得到该轨迹段的各子轨迹段;
具体地,当检测到轨迹段
子步骤s402:针对每个子轨迹段,根据该子轨迹段的前、后分段与预先得到的正常、异常模式轨迹段的比较结果,判断该子轨迹段是否异常。
具体地,本子步骤中,针对每个子轨迹段,将该子轨迹段的起点与所述异常的轨迹段的起点相连得到该子轨迹段的前分段,将该子轨迹段的终点与所述异常的轨迹段的起点相连得到该子轨迹段的后分段;例如,如图5a所示,通过子轨迹段
将该子轨迹段的前分段与预先得到的正常、异常模式轨迹段进行比较,根据比较结果,确认该子轨迹段的前分段是否异常;其中,将子轨迹段的前分段与预先得到的正常、异常模式轨迹段进行比较、识别是否异常的方法与上述步骤s103中详述的方法一样,此处不再赘述。
将该子轨迹段的后分段与预先得到的正常、异常模式轨迹段进行比较,根据比较结果,确认该子轨迹段的后分段是否异常;其中,将子轨迹段的后分段与预先得到的正常、异常模式轨迹段进行比较、识别是否异常的方法与上述步骤s103中详述的方法一样,此处不再赘述。
若确认该子轨迹段的前、后分段均为正常,则判断该子轨迹段为正常;否则,判断该子轨迹段为异常。
图5b、5c示出了本发明实施例提出的两级异常轨迹检测方法与traod异常检测方法的异常轨迹检测结果对比,其中,深色轨迹表示判定的异常轨迹,浅色轨迹表示正常轨迹;traod(trajectoryoutlierdetectionalgorithm)算法是一种经典的异常轨迹检测算法,首先采用两种分段粒度将每条轨迹分为若干轨迹线段,然后,在基于距离的异常检测方法的基础上,引入调整系数的概念,采用密度与距离相结合的方法进行异常轨迹检测。该方法注重空间上轨迹的变化,在计算轨迹距离时只考虑了轨迹垂直距离、平行距离和角度距离。而traod算法却忽略了轨迹在时间上的变化,轨迹在时间上的变化也是衡量轨迹是否异常的标准。
在将参数设置为
其中,两级异常轨迹检测方法检测出来的异常的子轨迹有356条,traod方法测出的异常子轨迹数量为142条。从图5b、5c中可以看出,本发明实施例提出的两级异常轨迹检测方法和traod检测出来的异常轨迹存在相同的检测结果,不过也存在差异,如图5b中黑框圈出来的区域。本发明实施例提出的两级异常轨迹检测方法在黑框圈出来的区域检测出来的轨迹是异常的,而图5ctraod方法则显示该部分区域的轨迹仅部分是异常的,部分轨迹被认为是正常轨迹。而通过分析1990-2009年20年间飓风原始轨迹图可以看出,在这20年间出现在图5b黑框区域的飓风轨迹数量是非常少的,因此出现在该区域的飓风轨迹会被检测为异常轨迹。本发明实施例提出的两级异常轨迹检测方法是通过对历史轨迹进行聚类进而进行异常轨迹检测,因而在历史数据上飓风出现较少区域的轨迹会被视为异常。traod算法仅仅只是通过空间形状是否同近邻的轨迹相似来判断异常。同时图5b中箭头所指向的飓风轨迹明显不同于它邻近区域的轨迹,本发明实施例提出的方法检测出它为异常轨迹,而traod算法对于该轨迹则没有检测出其异常,因此本发明实施例提出的方法检测出来的异常轨迹相对于traod方法更具有合理性。同时在图5b中发现很多不连续的轨迹段也被标记为异常,这是因为轨迹在时间上状态发生了很大的变化因此轨迹段检测为异常。因此可以看出本节提出的异常轨迹检测方法在检测结果上更为合理和精确,并且检测出来的以异常轨迹更加符合实际上的异常轨迹。
上述的正常、异常模式轨迹是预先训练得到的,具体流程如图6所示,包括如下步骤:
步骤s601:生成训练集。
对预先采集的历史轨迹的轨迹点,根据这些轨迹点的空间和时间状态提取特征点,并根据提取的特征点对历史轨迹分段后,得到训练集中的轨迹段。
例如,采用美国国家飓风中心发布的大西洋飓风数据,该数据集包括飓风经纬度、最大持续风速、中心最低气压、采样时间等信息,可以从中抽取1900~2009年这20年的数据集作为训练集,该数据集有280条飓风轨迹作为历史轨迹,8774个采样的轨迹点。首先对数据集进行了预处理,数据中存在数据缺失的情况,针对这种情况对数据缺失值采用临近数据近似值进行填补。对采样的轨迹点中重复的数据也给予清洗。对于一些噪声数据例如在数据中存在尚未命名的飓风,即数据name字段显示的是“unnamed”,这些轨迹一般采样的点很少并且数据缺失严重,针对这种情况对这样的轨迹给予删除。选取经度、纬度、最大持续风速、中心最低气压四个属性作为轨迹点的时间状态参数;之后,根据这些轨迹点的空间和时间状态提取特征点并根据提取的特征点对历史轨迹分段后,得到训练集中的轨迹段。
步骤s602:对训练集中的轨迹段进行聚类,得到正常、异常模式轨迹段。
具体地,轨迹的匹配程度主要通过相似度来确定,基于密度的聚类方法可以很好的适应轨迹段聚类。该方法可以发现任意形状的聚类,更重要的是,可以通过调整密度相关的参数来控制聚类的覆盖面。对轨迹段进行聚类的具体方法,流程如图7所示,可以包括如下步骤:
步骤s701:对训练集中的任意两个轨迹段,根据这两个轨迹段的时间、空间状态,计算这两个轨迹段之间的时空状态距离。
具体地,可以根据上述公式八计算两个轨迹段之间的时空状态距离。
步骤s702:根据计算出的轨迹段之间的时空状态距离,对轨迹段进行聚类。
本步骤中,根据计算出的轨迹段之间的时空状态距离,对轨迹段进行聚类的具体方法流程,可如图8所示,包括如下子步骤:
子步骤s801:根据训练集中的轨迹段之间的时空状态距离,确定所述训练集中每个轨迹段的ε-近邻;
子步骤s802:对于所述训练集中每个轨迹段,统计该轨迹段的ε-近邻总数,作为该轨迹段的密度值;并判断该轨迹段的密度值是否小于密度阈值
子步骤s803:对于所述训练集中的每个高密度轨迹段,判断该轨迹段是否为其它高密度轨迹段的ε-近邻;若是,则将两者聚类为同一簇的轨迹段,并将两者确认为聚类得到的正常模式轨迹段;
子步骤s804:对于所述训练集中的每个低密度轨迹段,判断该该轨迹段是否为任一高密度轨迹段的ε-近邻;若否,则确认该低密度轨迹段为异常模式轨迹段。
基于上述的轨迹异常检测方法,本发明的一个或多个实施例还提供了一种轨迹异常检测系统,结构如图9所示,包括:特征点提取模块901、轨迹分段模块902、异常轨迹段识别模块903。
其中,特征点提取模块901用于采样得到待检测轨迹的轨迹点后,根据每个轨迹点的空间和时间状态,从采样的轨迹点中提取特征点;具体地,特征点提取模块901对于轨迹
轨迹分段模块902用于根据提取的特征点对所述待检测轨迹进行分段,得到所述待检测轨迹的轨迹段;
异常轨迹段识别模块903用于将所述待检测轨迹的轨迹段与预先得到的正常、异常模式轨迹段进行比较,根据比较结果识别出异常的轨迹段;具体地,异常轨迹段识别模块903对于分段得到的每个轨迹段,根据该轨迹段的空间和时间状态,计算该轨迹段与各正常、异常模式轨迹段之间的时空状态距离,并根据计算出的时空状态距离,确定该轨迹段的ε-近邻;根据该轨迹段的ε-近邻中的正常、异常模式轨迹段数量,判断该轨迹段是否为异常的轨迹段。
其中,所述正常、异常模式轨迹段是通过对训练集中的轨迹段进行聚类后得到的;所述训练集中的轨迹段是根据历史轨迹的轨迹点的空间和时间状态提取特征点并根据提取的特征点对所述历史轨迹分段后得到的。
进一步,本发明一个或多个实施例提供的轨迹异常检测系统还可包括:训练模块904。
训练模块904用于根据预先采集的历史轨迹的轨迹点,根据这些轨迹点的空间和时间状态提取特征点并对历史轨迹分段后得到训练集中的轨迹段;根据训练集中的轨迹段进行聚类,得到训练出的正常、异常模式轨迹段。
进一步,异常轨迹段识别模块903还可在所述异常的轨迹段中进行细粒度异常检测:对于识别出的异常的轨迹段,依次连接该轨迹段的起始点之间的轨迹点,得到该轨迹段的各子轨迹段;针对每个子轨迹段,将该子轨迹段的起点与所述异常的轨迹段的起点相连得到该子轨迹段的前分段,将该子轨迹段的终点与所述异常的轨迹段的起点相连得到该子轨迹段的后分段;将该子轨迹段的前、后分段与预先得到的正常、异常模式轨迹段进行比较,根据比较结果若确认该子轨迹段的前、后分段均为正常,则判断该子轨迹段为正常;否则,判断该子轨迹段为异常。
上述轨迹异常检测系统的各模块的功能具体实现方法可参考如图1所示流程中的各步骤中详述的方法,此处不再赘述。
上述实施例的系统用于实现前述实施例中相应的方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
图10示出了本实施例所提供的一种更为具体的电子设备硬件结构示意图,该设备可以包括:处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
处理器1010可以采用通用的cpu(centralprocessingunit,中央处理器)、微处理器、应用专用集成电路(applicationspecificintegratedcircuit,asic)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本发明实施例所提供的轨迹异常检测方法。
存储器1020可以采用rom(readonlymemory,只读存储器)、ram(randomaccessmemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序,在通过软件或者固件来实现本发明实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。
输入/输出接口1030用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如usb、网线等)实现通信,也可以通过无线方式(例如移动网络、wifi、蓝牙等)实现通信。
总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。
需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本发明实施例方案所必需的组件,而不必包含图中所示的全部组件。
本发明一个或多个实施例提出的技术方案中,在采样得到待检测轨迹的轨迹点后,根据每个轨迹点的空间和时间状态,从采样的轨迹点中提取特征点;根据提取的特征点对所述待检测轨迹进行分段;将分段得到的轨迹段与预先得到的正常、异常模式轨迹段进行比较,根据比较结果识别出异常的轨迹段;其中,所述正常、异常模式轨迹段是通过对训练集中的轨迹段进行聚类后得到的;所述训练集中的轨迹段是根据历史轨迹的轨迹点的空间和时间状态提取特征点并对所述历史轨迹分段后得到的。
这样,在分段阶段考虑了时间因素的影响,通过轨迹状态的约束来分段,从而发现轨迹行为变化特别大的特征点,并通过这些点将轨迹划分为若干轨迹段,既能够减少运算数据又能有效地保持轨迹局部特征,同时又不会丢失轨迹的全局特征;使得分段的轨迹更符合轨迹状态的变化,在分段结果上更具有实际意义;
而且,在训练正常、异常模式轨迹段的聚类阶段也考虑了时间因素的影响,并据此重新定义轨迹段间测距离计算对分段后的轨迹聚类,最后根据聚类结果的正常、异常模式轨迹段进行异常检测,使得检测的异常轨迹更符合轨迹状态的变化,更加符合实际情况。
进一步,在异常检测阶段采用两级异常轨迹检测方法,首先通过第一级粗粒度的异常检测找到异常的轨迹分段,其次通过第二级细粒度的异常检测检测异常的子轨迹。通过针对1999-2012年大西洋飓风数据进行仿真实验,实验结果表明本发明一个或多个实施例提出的两级异常轨迹检测方法检测的异常轨迹更加符合飓风状态的变化,更加符合实际情况。
本发明的一个或多个实施例还提供了一种非暂态计算机可读存储介质,上述非暂态计算机可读存储介质存储计算机指令,其中,所存储的计算机指令用于使计算机执行上述实施例所述的轨迹异常检测方法。
本实施例的计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的不同方面的许多其它变化,为了简明它们没有在细节中提供。
另外,为简化说明和讨论,并且为了不会使本发明的实施例难以理解,在所提供的附图中可以示出或可以不示出与集成电路(ic)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本发明的实施例难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本发明实施例的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本发明的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本发明的实施例。因此,这些描述应被认为是说明性的而不是限制性的。
尽管已经结合了具体实施例对本发明所提供的技术方案进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态ram(dram))可以使用所讨论的实施例。
本发明的实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明的保护范围之内。
1.一种轨迹异常检测方法,其特征在于,包括:
采样得到待检测轨迹的轨迹点后,根据每个轨迹点的空间和时间状态,从采样的轨迹点中提取特征点:若所述轨迹
根据提取的特征点对所述待检测轨迹进行分段;
将分段得到的轨迹段与预先得到的正常、异常模式轨迹段进行比较,根据比较结果识别出异常的轨迹段;
其中,所述2个条件为:
条件1:
条件2:
其中,所述正常、异常模式轨迹段是通过对训练集中的轨迹段进行聚类后得到的;所述训练集中的轨迹段是根据历史轨迹的轨迹点的空间和时间状态提取特征点并对所述历史轨迹分段后得到的。
2.根据权利要求1所述的方法,其特征在于,所述
其中,各轨迹点的时间状态参数指标
3.根据权利要求2所述的方法,其特征在于,所述轨迹包括飓风的轨迹,所述轨迹点的时间状态参数指标
其中,
4.根据权利要求2所述的方法,其特征在于,所述正常、异常模式轨迹段是通过对训练集中的轨迹段进行聚类后得到的,包括:
对所述训练集中的任意两个轨迹段,根据这两个轨迹段的时间、空间状态,计算这两个轨迹段之间的时空状态距离;
根据计算出的轨迹段之间的时空状态距离,对轨迹段进行聚类。
5.根据权利要求4所述的方法,其特征在于,所述根据这两个轨迹段的时间、空间状态,计算这两个轨迹段之间的时空状态距离包括:
根据如下公式八计算两个轨迹段之间的时空状态距离:
其中,
其中,
其中,
6.根据权利要求4所述的方法,其特征在于,所述根据计算出的轨迹段之间的时空状态距离,对轨迹段进行聚类包括:
根据所述训练集中的轨迹段之间的时空状态距离,确定所述训练集中每个轨迹段的ε-近邻;其中,ε为设定的近邻阈值;
对于所述训练集中每个轨迹段,统计该轨迹段的ε-近邻总数,作为该轨迹段的密度值;并判断该轨迹段的密度值是否小于密度阈值
对于所述训练集中的每个高密度轨迹段,判断该轨迹段是否为其它高密度轨迹段的ε-近邻;若是,则将两者聚类为同一簇的轨迹段,并将两者确认为聚类得到的正常模式轨迹段;
对于所述训练集中的每个低密度轨迹段,判断该该轨迹段是否为任一高密度轨迹段的ε-近邻;若否,则确认该低密度轨迹段为异常模式轨迹段。
7.根据权利要求4所述的方法,其特征在于,所述将分段得到的轨迹段与预先得到的正常、异常模式轨迹段进行比较,根据比较结果识别出异常的轨迹段包括:
对于分段得到的每个轨迹段,根据该轨迹段的空间和时间状态,计算该轨迹段与各正常、异常模式轨迹段之间的时空状态距离,并根据计算出的时空状态距离,确定该轨迹段的ε-近邻;根据该轨迹段的ε-近邻中的正常、异常模式轨迹段数量,判断该轨迹段是否为异常的轨迹段;
其中,ε为设定的近邻阈值。
8.根据权利要求1-7任一所述的方法,其特征在于,在所述识别出异常的轨迹段后,还包括:在所述异常的轨迹段中进行细粒度异常检测:
对于识别出的异常的轨迹段,依次连接该轨迹段的起始点之间的轨迹点,得到该轨迹段的各子轨迹段;
针对每个子轨迹段,将该子轨迹段的起点与所述异常的轨迹段的起点相连得到该子轨迹段的前分段,将该子轨迹段的终点与所述异常的轨迹段的起点相连得到该子轨迹段的后分段;将该子轨迹段的前、后分段与预先得到的正常、异常模式轨迹段进行比较,根据比较结果若确认该子轨迹段的前、后分段均为正常,则判断该子轨迹段为正常;否则,判断该子轨迹段为异常。
9.一种轨迹异常检测系统,其特征在于,包括:
特征点提取模块,用于采样得到待检测轨迹的轨迹点后,根据每个轨迹点的空间和时间状态,从采样的轨迹点中提取特征点:若所述轨迹
轨迹分段模块,用于根据提取的特征点对所述待检测轨迹进行分段,得到所述待检测轨迹的轨迹段;
异常轨迹段识别模块,用于将所述待检测轨迹的轨迹段与预先得到的正常、异常模式轨迹段进行比较,根据比较结果识别出异常的轨迹段;
其中,所述2个条件为:
条件1:
条件2:
其中,所述正常、异常模式轨迹段是通过对训练集中的轨迹段进行聚类后得到的;所述训练集中的轨迹段是根据历史轨迹的轨迹点的空间和时间状态提取特征点并对所述历史轨迹分段后得到的。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-8任一所述的方法。
技术总结