基于车辆轨迹的停等聚集效应预测方法与流程

专利2022-06-29  47


本发明涉及车辆时空轨迹信息挖掘领域,尤其涉及一种基于车辆轨迹的停等聚集效应预测方法。



背景技术:

交通已经逐渐成为衡量一个城市进步和文明的重要标志,是城市赖以生存的命脉。交通的发展和进步在不仅方便的人们的出行,还促进了物质和文化的交流,给人类创造了巨大的财富。随着交通的飞速发展及人们生活水平的大幅提高,科学技术的不断进步,使得汽车数量的不断激增,对整个城市的交通管理和城市建设带来了巨大的挑战。公安部交管局发布数据显示,截至2018年底,小型载客汽车达2.01亿辆,其中,以个人名义登记的小型载客汽车(私家车)达到1.89亿辆,占小型载客汽车的94.03%。与2017年相比,私家车增加1952万辆,增长了10.33%。据统计,全国平均每百户家庭拥有36辆私家车,成都、深圳、苏州等城市每百户家庭拥有私家车超过70辆。因此,私家车是我国城市交通系统中占比较大的组成部分。

在无线通信、gps定位等移动感知技术广泛普及的情况下,载有智能终端车辆产生了越来越多的具有时空特征的轨迹数据。作为用户历史运动模式的载体,这些数据在各种应用领域发挥着重要作用,帮助人们来理解个人行为和群体活动规律,进而辅助城市交通以及城市建设。然而这些大轨迹数据会产生以下几个问题,一是数据存储:轨迹数据大多数是原始形式存在的并且数据量呈爆炸式増长。因此,大数据在存储、管理等方面面临着严峻的挑战。二是数据挖掘:轨迹大数据呈现出规模大、种类巧多、价值密度低等特性,导致在数据挖掘过程中,数据噪声大。三是数据建模:利用大量的原始轨迹数据在建模时,容易出现建模时间过长,以及模型的泛化能力弱的问题。

近些年来,如何分析挖掘这些海量的时空轨迹数据,从中提取信息与知识,已逐渐受到国内外学者的重视,成为时间轨迹信息领域的一大研究热点。轨迹stop/move模型是现有的研究中比较新颖的分析方法,主要是将轨迹点序列在语义的基础上划分为stop/move序列,之后再开展研究工作。然而,其中现有的研究比较多集中在移动段上,而在停留的部分比较少,并且在少有的停等部分的研究中,采用的都是一些比较传统的聚类方法(k-中值算法、dbscan算法),然而,这些方法都需要繁琐的数据处理和复杂的参数选择过程,并且没有考虑到空间中地理的关联性以及丢失了轨迹数据中比较重要的时间维度的信息。因此,如何利用轨迹中相对少量的停等数据来挖掘出城市交通信息是十分必要的。



技术实现要素:

针对上述技术问题,本发明实施例提供了一种基于车辆轨迹的停等聚集效应预测方法,基于地理第一定律、顾及时空邻近性的时空核密度估计(3d-kde),并且结合变权重的粒子种群优化算法(miw-pso),在轨迹停等数据的上来挖掘出城市交通中的热区,推导交通停等聚集效应的演变过程,为交通管理以及城市建设提供指导意义。

本发明实施例提供一种基于车辆轨迹的停等聚集效应预测方法,所述方法包括:

获取车辆停原始的停等轨迹数据;

根据所述原始的停等轨迹数据,提取待预测区域在预定时间周期内的停等轨迹数据;

基于三维空间的核密度估计,将提取出的停等轨迹数据中预设时间段内的停等轨迹数据转化为具有时空语义的停等时空密度分布数据;

根据预设的季节模型,使用历史时间段的停等时空密度分布数据结合随机变量域的线性特征参数来预测目标时间段的停等时空密度分布数据,其中,参数优化由结合变权重的粒子种群优化算法完成,所述目标时间段的时刻晚于所述历史时间段的时刻。

可选地,所述原始的停等轨迹数据为基于车辆的定位装置和车载诊断阅读器所获取的车辆行驶数据得到。

可选地,所述停等轨迹数据包括车辆标号id、熄火点的经纬度信息以及熄火时间。

可选地,所述预设时间段以天为单位,所述预设时间段内的停等轨迹数据为:

其中表示第u周中第d天的停等轨迹数据,(xi,yi,ti)表示停等时空中第i个停等点,x为熄火点经度,y为熄火点纬度,t为熄火时间,n是整个一天中所有待预测区域的车辆的总的停等点数量。

可选地,所述基于三维空间的核密度估计,将提取出的停等轨迹数据中预设时间段内的停等轨迹数据转化为具有时空语义的停等时空密度分布数据,包括:

将每天的车辆停等轨迹数据表示为停等时间序列数据:

通过三维空间的核密度估计,将所述停等时间序列数据转化为停等时空密度分布数据,其中三维空间的核密度估计表示为:

其中f(x,y,t)是待求解的停等时空密度分布数据的未知点(x,y,t)的密度值,(xi,yi,ti)是处于未知点预设距离内的临近点坐标,hs是空间维度的带宽,ht是时间维度的带宽,ks和kt分别表示空间和时间维度上的核函数,dj和ti是临近点到未知点的空间距离和时间距离;

以p来拟合整个一天的时空密度分布,转化得到停等时空核密度分布序列为:

可选地,所述方法还包括:

在三维空间的核密度估计中,核函数采用gaussian核,空间维度的带宽hs和时间维度的带宽ht分别表示为:

其中分别表示停等时空密度分布数据在空间和时间上的方差,n是该天停等时空密度分布数据的数量。

可选地,所述方法还包括:

将整个待预测区域对应的时空域分成na×nb×nc个小立方体,对于位置为(a,b,c)的立方体,中心点(xma,ymb,tmc)的密度值计算如下:

可选地,所述根据预设的季节模型,使用历史时间段的停等时空密度分布数据结合随机变量域的线性特征参数来预测目标时间段的停等时空密度分布数据,包括:

根据所述季节模型,第i天的停等时空密度分布数据由前t-1天的密度分布和上周同期一天的停等时空密度分布数据结合随机变量域的线性特征预测,记权重系数e={e0,...,et-1}∈[0,1]为历史天停等时空密度分布数据与预测天停等时空密度分布数据的相关因子,其中e0表示上周中同一天的停等时空密度分布数据即的权重系数,其余的e1,e2,...,et-1即为相对于该周的历史天停等时空密度分布数据其中k表示该周的第k天,则预测得到的停等时空密度分布数据为:

可选地,所述参数优化用于获取权重系数e的最优值,最优的e为基于所述上周的停等时空密度分布数据结合变权重的粒子群优化算法得到,其中粒子的搜索空间由t维向量的所有可能值组成,第m个粒子的位置变化记作为其相对应的最优的位置表示为

在每次迭代过程中,所有粒子中最优的位置为同时每个粒子被赋予一个速度,对于第m个粒子,速度表示为对于该粒子在第k次迭代时,表示为:

其中m=1,...,nsize,nsize为粒子总数,c1、c2表示学习系数,r1~u(0,1)、r2~u(0,1)为两个独立的随机函数,所述权重参数在每次粒子运动后,基于迭代公式进行更新计算,针对于密度分布数据特征,采用kl散度来衡量预测的停等时空密度分布数据和真实的停等时空密度分布数据之间的差异,并将它作为粒子种群优化算法的适应函数:

其中,(a,b,c)为待预测区域对应的时空区域之内任意一个坐标点的坐标,当且仅当时,即预测停等时空密度分布数据等于真实的停等时空密度分布数据,适应值f为0;

或者是时,添加一个极其小的数ò=1×e-12

可选地,第m个粒子在第k次迭代的权重变化的表达式表示为:

w的范围为[0,1],δf是适应值的变化值,当δf相对较大时,w变得相对较大;当δf相对较小时,w变得相对较小。

本发明实施例提供的技术方案中,充分的考虑了车辆停等聚集效应的时空特性,而同一个区域中的车辆通常有着很相似很规律的时间周期性,同时附近区域的停等聚集效应也会对周围的聚集效应产生影响,本发明设计的三维空间的核密度估计方法能够有效地考虑停等聚集效应的时间和空间特征,比传统方法能够更加准确的预测车辆的停等密度。

附图说明

图1为本发明一实施例中基于车辆轨迹的停等聚集效应预测方法的方法流程示意图;

图2为本发明另一实施例中基于车辆轨迹的停等聚集效应预测方法的方法流程示意图;

图3为本发明一实施例中时空核密度估计中样本点跟临近点的关系图;

图4为本发明一实施例中深圳罗湖区训练预测方案;

图5为本发明一实施例中上海浦东区训练预测方案;

图6为本发明一实施例中2016年1月27号8:00深圳罗湖区私家车停等点图;

图7为本发明一实施例中2016年1月27号8:00深圳罗湖区私家车密度分布图;

图8为本发明一实施例中2016年1月27号8:00,12:00和19:00深圳罗湖区停等分布演变图;

图9为本发明一实施例中2016年1月27号8:00深圳罗湖区私家车密度分布预测图;

图10为本发明一实施例中基于车辆轨迹的停等聚集效应预测方法与传统方法对比结果图;

图11为本发明另一实施例中基于车辆轨迹的停等聚集效应预测装置的结构框。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

需要说明的是,在不冲突的情况下,下述实施例可以进行组合。

本发明实施例提供一种基于车辆轨迹的停等聚集效应预测方法,该方法可以通过服务器或终端设备执行。该终端设备可以为任意具有显示装置、处理器和控制器的电子设备,例如,可以是手机、个人电脑等。

本发明实施例的车辆可以是私家车,也可以是其它类型的车辆。

本发明实施例的基于车辆轨迹的停等聚集效应预测方法,利用3d-kde(即三维空间的核密度估计)将车辆停等点转化为具有时空语义的停等分布模型,来以直观展示轨迹在其生命周期内停等时空聚集程度的变化,然后利用miw-pso(即结合变权重的粒子种群优化算法)对随机变量域的线性特征参数进行优化,并且通过线性特征组合获得具有长期依赖性的停等时空模型,进一步推导出其未来的停等时空聚集程度变化。

图1为本发明一实施例中基于车辆轨迹的停等聚集效应预测方法的方法流程示意图;主要分为三大块:一是数据采集模块,主要是运用了基于gps和车载诊断(obd)阅读器的数据融合新模式,获取到车辆的停等轨迹数据。二是停等时空密度分布转化模块,将采集到的私家车停等点按照天依次输入到3d-kde模块中,得到相应天数的停等时空密度。三是预测模块,通过利用历史的停等时空密度分布数据来优化权重系数参数e而后,使用最优的参数来预测得到未来某天的停等时空密度分布。

图2为本发明一实施例中基于车辆轨迹的停等聚集效应预测方法的方法流程示意图;请参见图2,本发明实施例的基于车辆轨迹的停等聚集效应预测方法可以包括如下步骤:

s201:获取车辆停原始的停等轨迹数据;

在一些实施例中,原始的停等轨迹数据为基于车辆的定位装置和车载诊断(obd)阅读器所获取的车辆行驶数据得到。该定位装置可以为gps,以可以为其它定位装置。

进一步地,在获取到原始的停等轨迹数据后,将原始的停等轨迹数据存储于数据库中。

其中,停等轨迹数据可以包括车辆标号id、熄火点的经纬度信息以及熄火时间,也可以包括其他。

s202:根据原始的停等轨迹数据,提取待预测区域在预定时间周期内的停等轨迹数据;

其中,待预测区域、预定时间周期可以根据具体的情况进行设置,比如待预测区域可以是国家、某个省或某个城市,预定时间周期可以是一天、一周或半个月等。

可选地,预设时间段以天为单位,预设时间段内的停等轨迹数据为:

其中表示第u周中第d天的停等轨迹数据,(xi,yi,ti)表示停等时空中第i个停等点,x为熄火点经度,y为熄火点纬度,t为熄火时间,n是整个一天中所有待预测区域的车辆的总的停等点数量。

可选地,利用数据库操作提取出待预测区域在预定时间周期内的停等轨迹数据。例如,在一些实施例中,利用数据库操作提取出待预测区域在预定时间周期(剔除节假日)内的停等轨迹数据,并以“天”为时间单位整理停等轨迹数据。

s203:基于三维空间的核密度估计,将提取出的停等轨迹数据中预设时间段内的停等轨迹数据转化为具有时空语义的停等时空密度分布数据;

一种基于三维空间的核密度估计,将提取出的停等轨迹数据中预设时间段内的停等轨迹数据转化为具有时空语义的停等时空密度分布数据的实现过程可以包括:

(1)、将每天的车辆停等轨迹数据表示为停等时间序列数据:

(2)、通过三维空间的核密度估计,将停等时间序列数据转化为停等时空密度分布数据,其中三维空间的核密度估计表示为:

其中f(x,y,t)是待求解的停等时空密度分布数据的未知点(x,y,t)(图3中的点1为未知点)的密度值,(xi,yi,ti)是处于未知点预设距离内的临近点(图3中除点1外的点)坐标,hs是空间维度的带宽,ht是时间维度的带宽,ks和kt分别表示空间和时间维度上的核函数,dj和ti是临近点到未知点的空间距离和时间距离;如图3所示,简而言之,只要到未知点的空间距离dj和时间距离ti都在空间带宽hs和时间带宽ht之内,都会影响位未知点的密度计算,以此来顾及地理空间相关性和时间相关性。

在一些实施例中,基于车辆轨迹的停等聚集效应预测方法还可以包括:

在三维空间的核密度估计中,核函数采用gaussian核,根据西尔弗曼带宽法,空间维度的带宽hs和时间维度的带宽ht分别表示为:

其中分别表示停等时空密度分布数据在空间和时间上的方差,n是该天停等时空密度分布数据的数量。

(2)、以p来拟合整个一天的时空密度分布,转化得到停等时空核密度分布序列为:

通过上述时空核密度模型(即公式(3))推导,用p来拟合整个一天的时空密度分布,同时,为了预测和误差计算,在一些实施例中,基于车辆轨迹的停等聚集效应预测方法还包括:将整个待预测区域对应的时空域分成na×nb×nc个小立方体,对于位置为(a,b,c)的立方体,中心点(xma,ymb,tmc)的密度值计算如下:

s204:根据预设的季节模型,使用历史时间段的停等时空密度分布数据结合随机变量域的线性特征参数来预测目标时间段的停等时空密度分布数据,其中,参数优化由结合变权重的粒子种群优化算法完成,目标时间段的时刻晚于历史时间段的时刻。

一种根据预设的季节模型,使用历史时间段的停等时空密度分布数据结合随机变量域的线性特征参数来预测目标时间段的停等时空密度分布数据的实现过程可以包括:

根据季节模型,第i天的停等时空密度分布数据由前t-1天的密度分布和上周同期一天的停等时空密度分布数据结合随机变量域的线性特征预测,记权重系数e={e0,...,et-1}∈[0,1]为历史天停等时空密度分布数据与预测天停等时空密度分布数据的相关因子,其中e0表示上周中同一天的停等时空密度分布数据即的权重系数,其余的e1,e2,...,et-1即为相对于该周的历史天停等时空密度分布数据其中k表示该周的第k天,则预测得到的停等时空密度分布数据为:

可选地,参数优化用于获取权重系数e的最优值,最优的e为基于上周的停等时空密度分布数据结合变权重的粒子群优化算法(即miw-pso)得到,该改进的方法具有精度高和收敛快的优点,在一定程度上避免了搜索陷入局部最优。其中粒子的搜索空间由t维向量的所有可能值组成,第m个粒子的位置变化记作为其相对应的最优的位置表示为

在每次迭代过程中,所有粒子中最优的位置为同时每个粒子被赋予一个速度,对于第m个粒子,速度表示为对于该粒子在第k次迭代时,表示为:

其中m=1,...,nsize,nsize为粒子总数,c1、c2表示学习系数,r1~u(0,1)、r2~u(0,1)为两个独立的随机函数。权重参数并不是固定不变的,本实施例中,权重参数在每次粒子运动后,基于迭代公式进行更新计算,用来平衡局部搜索和全局搜索能力,从而达到加快收敛速度,避免陷入局部最优的目的。针对于密度分布数据特征,采用kl散度(kullback–leiblerdivergence)来衡量预测的停等时空密度分布数据和真实的停等时空密度分布数据之间的差异,并将它作为粒子种群优化算法的适应函数:

其中,(a,b,c)为待预测区域对应的时空区域之内任意一个坐标点的坐标,当且仅当时,即预测停等时空密度分布数据等于真实的停等时空密度分布数据,适应值f为0;同时,当或者是时,添加一个极其小的数ò=1×e-12,从而不影响整个的计算结果。

基于前述定义和公式,第m个粒子在第k次迭代的权重变化的表达式表示为:

w的范围为[0,1],δf是适应值的变化值,当δf相对较大时,w变得相对较大;当δf相对较小时,w变得相对较小。

如图4和图5所示,本发明实施的研究周期为5周(除休息日以及节假日外),分别为深圳罗湖区2016年1月4号到2月5号和上海浦东区2018年6月25号到7月27号。以图4中深圳罗湖区的一次训练预测为例,在预测2016年1月27号(即周三)的停等密度分布时,需要利用它之前的停等密度分布(2016年1月26号,1月25号以及上周周三1月20号,再结合对随机变量域的线性特征参数组合得到,为了获取参数,以上一周的数据(1月18号,1月19号以及1月13号)赋予相应的线性参数来预测得到1月20号的停等密度分布,在参数获取过程中,以得到最优参数,采用miw-pso优化算法,通过训练多次,得到最优参数解。

图6和图7展示出了本发明提出的3d-kde方法的效果,图6表示设备采集到的2016年1月27号深圳私家车停等的原始点,在2016年1月27号时空停等密度分布中,为了更好地显示效果,截取该3d图中早上8:00时刻(即上班早高峰)的停等密度分布图展示在图7中,从图中,可以观察到3d-kde刻画的停等密度分布图不但具有了原始停等点的特征,而且还蕴含着语义信息。比如,在图7中,很容易地就可以观测到停等比较密集的区域,进而结合分布数据能够挖掘中城市的停等热区。

如图8所示,该图提取了2016年1月27号的三个具有代表性意义的时刻,早8:00为上班早高峰期,中午12:00为午餐时间,晚上7:00是休闲娱乐时间,通过三个时刻的停等时空密度分布演变图,可以看出,在上班高峰期会产生大量的停等,并且可以找出三个较大的停等热区,与地图匹配,发现这些区域大都集中在办公区,写字楼等办公场所。在中午12:00时,停等密集区数减少,停等区域相对变小,在地图匹配之后,这些区域还是聚集在办公区以及餐饮区。相比上班早高峰以及中午用餐时段,晚上7:00停等热区急剧减少,停等区域大幅度缩小,在地图上显示,该区域主要是休闲娱乐场所。从上述的停等时空密度分布演变过程,从而反映出了人们出行行为规律,可以为城市交通以及城市建设提出指导建议。

图9是使用本发明提出的预测方法得到的2016年1月27号8:00的停等时空密度分布图,将真实的停等时空密度分布图7与图9对比,预测得到的停等时空分布图比较贴近于真实的。

图10中的1、2、3分别表示kl散度、平均绝对误差和均方误差。如图10所示,与其他传统的两个方法(em,voronoi)作对比,利用kl散度,平均绝对误差(mae)和均方根误差(rmse)三个模型评价指标对本发明提出的模型方法进行评估,本发明提出的方法都优于其他传统方法。其中,平均绝对误差(mae)和均方根误差(rmse)的计算公式如下:

其中,表示的是真实的停等时空密度分布数据,是预测得到的停等时空密度分布数据,na、nb、nc分别是经度、纬度和时间立方格数(如图3所示)。

上面对本发明实施例中的基于车辆轨迹的停等聚集效应预测方法进行了描述,下面对本发明实施例中的基于车辆轨迹的停等聚集效应预测装置进行描述。

请参见图11,本发明实施例的基于车辆轨迹的停等聚集效应预测装置可以包括数据获取模块110、数据提取模块120、转化模块130和预测模块140。

其中,数据获取模块110,用于获取车辆停原始的停等轨迹数据;

数据提取模块120,用于根据原始的停等轨迹数据,提取待预测区域在预定时间周期内的停等轨迹数据;

转化模块130,用于基于三维空间的核密度估计,将提取出的停等轨迹数据中预设时间段内的停等轨迹数据转化为具有时空语义的停等时空密度分布数据;

预测模块140,用于根据预设的季节模型,使用历史时间段的停等时空密度分布数据结合随机变量域的线性特征参数来预测目标时间段的停等时空密度分布数据,其中,参数优化由结合变权重的粒子种群优化算法完成,目标时间段的时刻晚于历史时间段的时刻。

可选地,原始的停等轨迹数据为基于车辆的定位装置和车载诊断阅读器所获取的车辆行驶数据得到。

可选地,停等轨迹数据包括车辆标号id、熄火点的经纬度信息以及熄火时间。

可选地,预设时间段以天为单位,预设时间段内的停等轨迹数据为:

其中表示第u周中第d天的停等轨迹数据,(xi,yi,ti)表示停等时空中第i个停等点,x为熄火点经度,y为熄火点纬度,t为熄火时间,n是整个一天中所有待预测区域的车辆的总的停等点数量。

可选地,基于三维空间的核密度估计,将提取出的停等轨迹数据中预设时间段内的停等轨迹数据转化为具有时空语义的停等时空密度分布数据,包括:

将每天的车辆停等轨迹数据表示为停等时间序列数据:

通过三维空间的核密度估计,将停等时间序列数据转化为停等时空密度分布数据,其中三维空间的核密度估计表示为:

其中f(x,y,t)是待求解的停等时空密度分布数据的未知点(x,y,t)的密度值,(xi,yi,ti)是处于未知点预设距离内的临近点坐标,hs是空间维度的带宽,ht是时间维度的带宽,ks和kt分别表示空间和时间维度上的核函数,dj和ti是临近点到未知点的空间距离和时间距离;

以p来拟合整个一天的时空密度分布,转化得到停等时空核密度分布序列为:

可选地,所述转化模块130,还用于在三维空间的核密度估计中,核函数采用gaussian核,空间维度的带宽hs和时间维度的带宽ht分别表示为:

其中分别表示停等时空密度分布数据在空间和时间上的方差,n是该天停等时空密度分布数据的数量。

可选地,所述转化模块130,还用于将整个待预测区域对应的时空域分成na×nb×nc个小立方体,对于位置为(a,b,c)的立方体,中心点(xma,ymb,tmc)的密度值计算如下:

可选地,预测模块140在根据预设的季节模型,使用历史时间段的停等时空密度分布数据结合随机变量域的线性特征参数来预测目标时间段的停等时空密度分布数据时,具体用于:

根据季节模型,第i天的停等时空密度分布数据由前t-1天的密度分布和上周同期一天的停等时空密度分布数据结合随机变量域的线性特征预测,记权重系数e={e0,...,et-1}∈[0,1]为历史天停等时空密度分布数据与预测天停等时空密度分布数据的相关因子,其中e0表示上周中同一天的停等时空密度分布数据即的权重系数,其余的e1,e2,...,et-1即为相对于该周的历史天停等时空密度分布数据其中k表示该周的第k天,则预测得到的停等时空密度分布数据为:

可选地,参数优化用于获取权重系数e的最优值,最优的e为基于上周的停等时空密度分布数据结合变权重的粒子群优化算法得到,其中粒子的搜索空间由t维向量的所有可能值组成,第m个粒子的位置变化记作为其相对应的最优的位置表示为

在每次迭代过程中,所有粒子中最优的位置为同时每个粒子被赋予一个速度,对于第m个粒子,速度表示为对于该粒子在第k次迭代时,表示为:

其中m=1,...,nsize,nsize为粒子总数,c1、c2表示学习系数,r1~u(0,1)、r2~u(0,1)为两个独立的随机函数,权重参数在每次粒子运动后,基于迭代公式进行更新计算,针对于密度分布数据特征,采用kl散度来衡量预测的停等时空密度分布数据和真实的停等时空密度分布数据之间的差异,并将它作为粒子种群优化算法的适应函数:

其中,(a,b,c)为待预测区域对应的时空区域之内任意一个坐标点的坐标,当且仅当时,即预测停等时空密度分布数据等于真实的停等时空密度分布数据,适应值f为0;

或者是时,添加一个极其小的数ò=1×e-12

可选地,第m个粒子在第k次迭代的权重变化的表达式表示为:

w的范围为[0,1],δf是适应值的变化值,当δf相对较大时,w变得相对较大;当δf相对较小时,w变得相对较小。

在本发明实施例中,还提供一种存储介质,存储介质包括存储的程序,其中,程序执行任意一种上述的基于车辆轨迹的停等聚集效应预测方法。

在本发明实施例中,还提供一种处理器,上述处理器用于运行程序,其中,程序运行时执行任意一种上述的基于车辆轨迹的停等聚集效应预测方法。

在本发明实施例中,还提供一种电子设备,包括:一个或多个处理器,存储器,显示装置以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置为由上述一个或多个处理器执行,上述一个或多个程序包括用于执行任意一种上述的基于车辆轨迹的停等聚集效应预测方法。

以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。


技术特征:

1.一种基于车辆轨迹的停等聚集效应预测方法,其特征在于,所述方法包括:

获取车辆停原始的停等轨迹数据;

根据所述原始的停等轨迹数据,提取待预测区域在预定时间周期内的停等轨迹数据;

基于三维空间的核密度估计,将提取出的停等轨迹数据中预设时间段内的停等轨迹数据转化为具有时空语义的停等时空密度分布数据;

根据预设的季节模型,使用历史时间段的停等时空密度分布数据结合随机变量域的线性特征参数来预测目标时间段的停等时空密度分布数据,其中,参数优化由结合变权重的粒子种群优化算法完成,所述目标时间段的时刻晚于所述历史时间段的时刻。

2.根据权利要求1所述的方法,其特征在于,所述原始的停等轨迹数据为基于车辆的定位装置和车载诊断阅读器所获取的车辆行驶数据得到。

3.根据权利要求1所述的方法,其特征在于,所述停等轨迹数据包括车辆标号id、熄火点的经纬度信息以及熄火时间。

4.根据权利要求1所述的方法,其特征在于,所述预设时间段以天为单位,所述预设时间段内的停等轨迹数据为:

其中表示第u周中第d天的停等轨迹数据,(xi,yi,ti)表示停等时空中第i个停等点,x为熄火点经度,y为熄火点纬度,t为熄火时间,n是整个一天中所有待预测区域的车辆的总的停等点数量。

5.根据权利要求4所述的方法,其特征在于,所述基于三维空间的核密度估计,将提取出的停等轨迹数据中预设时间段内的停等轨迹数据转化为具有时空语义的停等时空密度分布数据,包括:

将每天的车辆停等轨迹数据表示为停等时间序列数据:

通过三维空间的核密度估计,将所述停等时间序列数据转化为停等时空密度分布数据,其中三维空间的核密度估计表示为:

其中f(x,y,t)是待求解的停等时空密度分布数据的未知点(x,y,t)的密度值,(xi,yi,ti)是处于未知点预设距离内的临近点坐标,hs是空间维度的带宽,ht是时间维度的带宽,ks和kt分别表示空间和时间维度上的核函数,dj和ti是临近点到未知点的空间距离和时间距离;

以p来拟合整个一天的时空密度分布,转化得到停等时空核密度分布序列为:

6.根据权利要求5所述的方法,其特征在于,所述方法还包括:

在三维空间的核密度估计中,核函数采用gaussian核,空间维度的带宽hs和时间维度的带宽ht分别表示为:

其中分别表示停等时空密度分布数据在空间和时间上的方差,n是该天停等时空密度分布数据的数量。

7.根据权利要求6所述的方法,其特征在于,所述方法还包括:

将整个待预测区域对应的时空域分成na×nb×nc个小立方体,对于位置为(a,b,c)的立方体,中心点(xma,ymb,tmc)的密度值计算如下:

8.根据权利要求6所述的方法,其特征在于,所述根据预设的季节模型,使用历史时间段的停等时空密度分布数据结合随机变量域的线性特征参数来预测目标时间段的停等时空密度分布数据,包括:

根据所述季节模型,第i天的停等时空密度分布数据由前t-1天的密度分布和上周同期一天的停等时空密度分布数据结合随机变量域的线性特征预测,记权重系数e={e0,...,et-1}∈[0,1]为历史天停等时空密度分布数据与预测天停等时空密度分布数据的相关因子,其中e0表示上周中同一天的停等时空密度分布数据即的权重系数,其余的e1,e2,...,et-1即为相对于该周的历史天停等时空密度分布数据其中k表示该周的第k天,则预测得到的停等时空密度分布数据为:

9.根据权利要求8所述的方法,其特征在于,所述参数优化用于获取权重系数e的最优值,最优的e为基于所述上周的停等时空密度分布数据结合变权重的粒子群优化算法得到,其中粒子的搜索空间由t维向量的所有可能值组成,第m个粒子的位置变化记作为其相对应的最优的位置表示为

在每次迭代过程中,所有粒子中最优的位置为同时每个粒子被赋予一个速度,对于第m个粒子,速度表示为对于该粒子在第k次迭代时,表示为:

其中m=1,...,nsize,nsize为粒子总数,c1、c2表示学习系数,r1~u(0,1)、r2~u(0,1)为两个独立的随机函数,所述权重参数在每次粒子运动后,基于迭代公式进行更新计算,针对于密度分布数据特征,采用kl散度来衡量预测的停等时空密度分布数据和真实的停等时空密度分布数据之间的差异,并将它作为粒子种群优化算法的适应函数:

其中,(a,b,c)为待预测区域对应的时空区域之内任意一个坐标点的坐标,当且仅当时,即预测停等时空密度分布数据等于真实的停等时空密度分布数据,适应值f为0;

或者是时,添加一个极其小的数

10.根据权利要求9所述的方法,其特征在于,第m个粒子在第k次迭代的权重变化的表达式表示为:

w的范围为[0,1],δf是适应值的变化值,当δf相对较大时,w变得相对较大;当δf相对较小时,w变得相对较小。

技术总结
本发明公开了一种基于车辆轨迹的停等聚集效应预测方法,包括:获取车辆停原始的停等轨迹数据;根据原始的停等轨迹数据,提取待预测区域在预定时间周期内的停等轨迹数据;基于三维空间的核密度估计,将提取出的停等轨迹数据中预设时间段内的停等轨迹数据转化为具有时空语义的停等时空密度分布数据;根据预设的季节模型,使用历史时间段的停等时空密度分布数据结合随机变量域的线性特征参数来预测目标时间段的停等时空密度分布数据,参数优化由结合变权重的粒子种群优化算法完成,目标时间段晚于历史时间段。本发明的三维空间的核密度估计方法能够有效地考虑停等聚集效应的时间和空间特征,比传统方法能够更加准确的预测车辆的停等密度。

技术研发人员:周志文;肖竹;王东;范娇娇
受保护的技术使用者:深圳市麦谷科技有限公司
技术研发日:2020.01.02
技术公布日:2020.06.05

转载请注明原文地址: https://bbs.8miu.com/read-52224.html

最新回复(0)