一种基于多数据融合的全量人口合成及出行要素构建方法与流程

专利2026-03-09 38

本发明涉交通规划和城市规划，涉及一种基于多数据融合的全量人口合成及出行要素构建方法。

背景技术：

1、在城市规划和交通管理领域中，人口的整体规模与出行决定了交通系统的需求及运行状态，是交通需求分析的基础。人口的规模及出行要素在交通模型中既可以作为传统四阶段模型的基本输入，也可以作为出行链模型及基于活动模型和混合模型的必备数据条件。

2、人口合成模型是获取家庭和个体人员属性的基本方法。人口合成模型通过整合不同数据源，获取详细的有限人口样本数据及全量特征数据，将有限样本数据在全量特征约束下拟合生成全量人口数据，使拟合生成的全量人口数据特征与总体特征相符。

3、但人口合成模型结果缺少职住关系、家庭关系、生活状态、就学地、就学距离、职住等主要出行要素属性，进而影响稳态出行活动起终点的判断。

4、当前海量的交通运行监测数据和互联网位置数据为人口合成及出行要素构建提供了新的数据源，为更加全面的城市观察提供了新契机，为人口合成及出行要素构建结果的可靠性检验提供了新的视角，使得获取基于交通分区的职住od关系成为可能。

5、针对人口合成模型，本文提出了一种基于多数据融合的全量人口合成及出行要素构建方法。采用多数据融合技术整合人口普查数据、经济普查数据、居民出行调查数据、互联网位置数据等多种数据源，使用迭代比例更新ipu算法以数据驱动的方式生成具有相似特征的人口集合。同时通过长周期时空位置数据，学区划分等数据资源从群体中挖掘个体出行要素属性，对人口合成结果出行要素属性进行更新，利用真实总体数据、大样本的个人出行信息进行人口合成为稳态出行活动目的地选择提供了因果推断的可能。

技术实现思路

1、本发明的目的在于克服现有技术中的问题，提供一种基于多数据融合的全量人口合成及出行要素构建方法，以人口普查数据、经济普查数据、居民出行调查数据及互联网位置数据作为数据来源，采用迭代比例更新模型ipu生成全量家庭信息及人口信息，并根据多源数据统计结果更新人口出行要素属性。具体包括以下步骤：(1)建立城市家庭、人口基础信息库，存储获取人口普查数据、经济普查数据、居民出行调查数据、互联网位置数据、交通大区、交通中区、交通小区、行政区空间范围及对应关系。(2)根据原始数据获取包括不同空间范围内个人、家庭详细样本数据、统计数据、非工作人口大学就学比例、职住od矩阵、不同就学群体不同居住小区就学交通小区分布矩阵，平均就学距离及不同就学距离的住校概率列表。(3)采用迭代比例更新模型ipu，使用家庭信息及人口信息样本数据拟合生成全量家庭信息及人口信息。(4)根据家庭成员的年龄、性别更新全量个人信息中的家庭关系出行要素。(5)根据个人年龄、性别、职业更新全量个人信息生活状态出行要素。(6)根据统计结果职住od矩阵，构建不放回随机抽样模型的总样本库。对全量个人信息中的工作人口利用不放回随机抽样模型获取并更新就业地交通小区。(7)根据居住交通小区就学交通小区概率分布矩阵、距离分布矩阵、及不同就学距离的住校概率列表结合个体属性更新就学人口就学所在交通小区、就学距离、住校信息出行要素属性。本方法对人员稳态出行活动目的地选择提供了因果推断。

2、本发明的技术方案如下：

3、一种基于多数据融合的全量人口合成及出行要素构建方法，所述方法包括如下步骤：

4、s1、建立城市家庭、人口基础信息库，获取原始数据；

5、s2、根据原始数据获取统计数据；将原始数据及统计数据存入家庭人口基础信息库；

6、s3、对样本数据扩样；获取输入样本数据、约束数据，采用迭代比例更新模型ipu用样本数据拟合总体，生成全量家庭信息及人口信息，存储至城市家庭、人口基础信息库；

7、s4、更新城市家庭、人口基础信息库中全量个人信息中家庭关系出行要素，从城市家庭、人口基础信息库获取步骤s2生成的全量个人信息，以家庭为单位进行分组，以家庭成员的年龄为依据判断家庭成员之间夫妻关系、代际关系、父辈与子辈关系并初始化；

8、s5、更新城市家庭、人口基础信息库中全量个人信息生活状态出行要素，根据全量个人信息表中的个人年龄、性别、职业判断个体生活状态；

9、s6、更新城市家庭、人口基础信息库全量个人信息就业人口的就业地交通小区出行要素，根据城市家庭、人口基础信息库中职住od矩阵a，构建不放回随机抽样模型的总样本库；在全量个人信息表中增加就业交通小区字段，对全量个人信息进行迭代更新，利用不放回随机抽样模型给全量个人信息中就业人口就业地交通小区赋值并更新；具体方法如下：

10、s61、根据职住od矩阵a居住在m交通小区就业在n交通小区的人口数据量amn构建对应职住交通小区岗位分布列表tmn：

11、tmn＝{n,n,n,…,n},tmn包含amn个n

12、s62、将居住交通小区m所有对应的岗位分布列表合并为tm：

13、tm＝{1,1,1…1,2,2,…,2,…n,n,n,…,n}

14、s63、筛选出所有就业人口，对就业人口进行遍历，获取就业人口的居住地交通小区信息m，获取对应的岗位分布列表tm，对tm进行无放回抽样，获取就业地交通小区编号，并更新就业交通小区字段；

15、s7、更新城市家庭、人口基础信息库全量个人信息就学人口的就学地交通小区出行要素，在全量个人信息表中增加就学交通小区字段、就学距离字段、住校情况字段；获取全量个人信息表中所有就学人口，对就学人口进行迭代，更新就学人口就学交通小区字段、就学距离字段、住校情况字段。

16、优选地，步骤s1中：原始数据包括：研究范围内人口普查数据，经济普查数据，居民出行调查数据及互联网位置数据，交通大区、交通中区、交通小区、行政区空间范围及对应关系原始数据。

17、优选地，步骤s2所述数据统计步骤如下：

18、s21、根据人口普查数据及互联网位置数据获取交通小区、交通中区、交通大区、行政区不同区域内个人、家庭统计数据；

19、s22、根据居民出行调查数据获取详细的家庭信息，个人信息样本数据；

20、s23、根据人口普查数据获取18岁至30岁不同年龄非工作人口大学就学比例列表insh；

21、s24、根据经济普查数据及互联网位置数据确定基于交通小区的职住od矩阵a；

22、s25、根据居民出行调查数据获取不同小学、初中、高中、大学不同就学人群居住交通小区就学交通小区分布概率矩阵ptype、平均出行距离矩阵dtype、不同就学距离下学生的住校概率分布字典lshtype。

23、优选地，所述步骤s21中，个人、家庭统计数据包括不同交通大区、交通中区、交通小区、行政区空间范围内家庭总规模、不同人数家庭规模、总人口规模、不同年龄人口规模、不同性别人口规模、不同职业人口规模，不同车辆拥有数量人口规模数据；

24、所述步骤s22中，家庭信息包括：家庭编号、所在交通大区、所在交通中区、所在交通小区、所在行政区、家庭人数、车辆拥有数量，家庭从业人口数量；

25、个人信息包括：id序号，居住交通大区、居住交通中区、居住交通小区、居住行政区、家庭编号、成员编号、年龄、性别、职业、收入；

26、所述步骤s23中：

27、insh＝[insh18,nsh19,nsh20,…,nshage,…,nsh30]

28、insh18为年龄18岁非就业人口中上大学人口的比例，inshage为年龄为age非就业人口中上大学比例；

29、所述步骤s24中，所述职住od矩阵a如下：amn为居住在m交通小区工作在n交通小区的人数，m为居住交通小区编号，n为工作小区编号；

30、

31、所述步骤s25中，交通小区分布概率矩阵ptype、平均出行距离矩阵dtype、不同就学距离下学生的住校概率分布字典lshtype如下：type为就学人口类型；

32、

33、ptype,,为就学类型为type居住在m交通小区就学在n交通小区的概率；

34、

35、dtype,,为就学类型为type居住在m通小区就学在n交通小区的最小出行距离；

36、lshtype＝lshtype,,shtype,4,shtype,6,…,shtype,20,shtype,]

37、lshtype为不同就学类型不同上学距离住校的概率值；lshtype,2为就学类型为type上学距离小于等于2公里学生住校的概率值；lshtype,为就学类型为type，上学距离大于20公里学生住校的概率值。

38、优选地，步骤s3具体为：对家庭信息、个人信息样本数据扩样生成全量家庭信息、个人信息数据；获取城市人口基础信息库中家庭信息，个人信息样本数据作为算法输入样本数据，人口、家庭统计数据作为约束数据，采用迭代比例更新模型ipu用样本数据拟合总体，生成全量家庭信息及人口信息，存储至城市家庭、人口基础信息库。

39、优选地，步骤s4中所述以家庭为单位对个人信息数据分组并迭代更新的具体方法如下：

40、s41、在个人信息中增加人员代际编码并更新，将家庭成员按年龄从大到小排序，根据年龄差构建家庭成员之间的代际关系，代际关系最小年龄差为20岁，年龄最大的代际编码为1，代际编号根据年龄减小顺序增加；

41、s42、在个人信息中增加配偶id字段并更新，根据家庭成员层级、家庭成员性别构建家庭成员间的夫妻关系，如果家庭代际层级仅有1级或者家代际层级大于1级且个人代际层级不为最后一级，对同层级家庭成员按年龄大小排序，则对代际编码相同、年龄相邻的两个家庭成员如果性别不同且男性年龄大于22岁，女性年龄大于20岁则构建两个家庭成员的夫妻关系；

42、s43、在个人信息中增加孩子id列表字段并更新，根据家庭成员的相邻代际关系构建家庭成员间的父辈与子辈的关系，个人家庭代际编码为i且存在及家庭代际编码为i+1的家庭成员，则在个人信息中孩子id列表添加所有代际编码为i+1的家庭成员id。

43、优选地，步骤s5中，生活状态出行要素包括婴儿、幼儿、小学、中学、大学、工作、退休、待业；在全量个人信息表中增加生活状态字段，对全量个人信息进行迭代更新，具体方法如下：

44、s51、如果个人信息中职业信息不为无业，则更新生活状态字段为工作，更新结束,否则进入下步骤；

45、s52、根据年龄、性别判断个人信息的生活状态,判定信息如下.

46、a.3岁以下生活状态为婴儿

47、b.3岁至6岁生活状态为幼儿，生活状态为幼儿园

48、c.6岁至12岁生活状态为小学，生活状态为小学

49、d.12岁至18岁生活状态为中学，生活状态为中学

50、e.18岁至30岁从城市家庭、人口基础信息库获取18岁至30岁不同年龄非工作人口大学就学比例列表insh，根据年龄age获取上大学比例inshage，待业比例为1-inshage，采用概率抽样的方法获取非工作人口为大学就学状态或待业状态，更新生活状态；

51、f.根据性别及法定退休年龄判别个人信息的生活状态为退休，男性年龄大于60则更新生活状态为退休，女性年龄大于55则判定生活状态为退休。

52、优选地，所述步骤s7具体步骤如下：

53、s71)根据个体就学类型type，从城市家庭、人口基础信息库中获取居住交通小区就学交通小区分布概率矩阵ptype、平均出行距离矩阵dtype及不同就学距离下学生住校概率分布字典lshtype；

54、s72)根据就学人口居住交通小区m,获取对应就学交通小区概率分布列表ptype,m＝[ptype,m,0,ptype,m,1,,type,m,n]，通过概率抽样模型获取就学学校所在交通小区n，更新就学学校所在交通小区编号；

55、s73)根据居住地m及就学地交通小区n从dtype中获取上学出行距离dtype,m,n，更近就学距离字段；

56、s74)根据dtype,m,n及不同就学距离下学生住校概率分布字典lshtype，获取学生住校概率值lshtype，非住校概率为1-lshtype，采用概率抽样方法获取个体就学状态，更新就学人口的住校信息。

57、本发明提供了一种基于多数据融合的全量人口合成及出行要素构建方法，采用迭代比例更新模型ipu生成全量家庭信息及人口信息，根据多元数据统计结果更新人口出行要素属性。与现有技术相比，本发明具有以下优势：

58、(1)多元数据融合进行人口合成及出行要素构建，可整合不同数据源信息，获得更加丰富和全面的数据，综合利用多种数据源，获取不同维度和层次的人口特征，提高人口生成结果的准确性和可信度。

59、(2)采用迭代更新算法ipu进行人口合成，能够根据实际情况对样本数据进行迭代更新，使得人口合成果更加贴近实际情况，计算效率高，能够更好地适应不同人口特征的变化。

60、(3)采用交通大区、交通中区、交通小区、行政区空间位置数据及关联关系作为人口合成及出行要素构建的约束条件能够保证数据在空间的一致性，保证合成人口数据在空间上的准确性。

61、(4)使用长周期位置数据、学区划分等数据资源，采用概率抽样的方法，从群体挖掘个体的出行要素，节约调查成本和时间，确保样本代表总体，减少出行要素构建过程的选择偏差，使结果更加具有普适性及可靠性，较好支持了人口出行要素的研究和分析。

技术特征：

1.一种基于多数据融合的全量人口合成及出行要素构建方法，其特征在于，所述方法包括如下步骤：

2.根据权利要求1所述的一种基于多数据融合的全量人口合成及出行要素构建方法，其特征在于，步骤s1中：原始数据包括：研究范围内人口普查数据，经济普查数据，居民出行调查数据及互联网位置数据，交通大区、交通中区、交通小区、行政区空间范围及对应关系原始数据。

3.根据权利要求1或2任一项所述的一种基于多数据融合的全量人口合成及出行要素构建方法，其特征在于，步骤s2所述数据统计步骤如下：

4.根据权利要求3所述的一种基于多数据融合的全量人口合成及出行要素构建方法，其特征在于，

5.根据权利要求1所述的一种基于多数据融合的全量人口合成及出行要素构建方法，其特征在于，步骤s3具体为：对家庭信息、个人信息样本数据扩样生成全量家庭信息、个人信息数据；获取城市人口基础信息库中家庭信息，个人信息样本数据作为算法输入样本数据，人口、家庭统计数据作为约束数据，采用迭代比例更新模型ipu用样本数据拟合总体，生成全量家庭信息及人口信息，存储至城市家庭、人口基础信息库。

6.根据权利要求1所述的一种基于多数据融合的全量人口合成及出行要素构建方法，其特征在于，步骤s4中所述以家庭为单位对个人信息数据分组并迭代更新的具体方法如下：

7.根据权利要求1所述的一种基于多数据融合的全量人口合成及出行要素构建方法，其特征在于，步骤s5中，生活状态出行要素包括婴儿、幼儿、小学、中学、大学、工作、退休、待业；在全量个人信息表中增加生活状态字段，对全量个人信息进行迭代更新，具体方法如下：

8.根据权利要求1所述的一种基于多数据融合的全量人口合成及出行要素构建方法，其特征在于，所述步骤s7具体步骤如下：

技术总结
本发明提供了一种基于多数据融合的全量人口合成及出行要素构建方法，以人口普查数据、经济普查数据、居民出行调查数据及互联网位置数据作为数据来源，采用迭代比例更新模型IPU生成全量家庭信息及人口信息，并根据多源数据统计结果更新人口出行要素属性。本发明综合利用多种数据源，获取不同维度和层次的人口特征，提高人口生成结果的准确性和可信度；且采用迭代更新算法IPU进行人口合成，能够根据实际情况对样本数据进行迭代更新，使得人口合成果更加贴近实际情况，计算效率高，能够更好地适应不同人口特征的变化。

技术研发人员：陈先龙,景国胜,马小毅,何健,张薇,沈文韬,宋程,顾宇忻,林晓生,欧阳剑,郑贵兵,陈丹洁
受保护的技术使用者：广州市交通规划研究院有限公司
技术研发日：
技术公布日：2024/7/25

转载请注明原文地址: https://bbs.8miu.com/read-439597.html

专利

最新回复(0)