CN113962437A - 人流预测模型的构建方法及轨道交通站人流情况预测方法 - Google Patents
人流预测模型的构建方法及轨道交通站人流情况预测方法 Download PDFInfo
- Publication number
- CN113962437A CN113962437A CN202111098118.9A CN202111098118A CN113962437A CN 113962437 A CN113962437 A CN 113962437A CN 202111098118 A CN202111098118 A CN 202111098118A CN 113962437 A CN113962437 A CN 113962437A
- Authority
- CN
- China
- Prior art keywords
- people
- model
- pedestrian
- prediction model
- people flow
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000010276 construction Methods 0.000 title claims abstract description 21
- 238000004088 simulation Methods 0.000 claims abstract description 59
- 238000007637 random forest analysis Methods 0.000 claims abstract description 49
- 238000003066 decision tree Methods 0.000 claims description 31
- 238000012360 testing method Methods 0.000 claims description 18
- 238000012549 training Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 8
- 238000005070 sampling Methods 0.000 claims description 8
- 230000008520 organization Effects 0.000 claims description 5
- 230000009286 beneficial effect Effects 0.000 abstract description 5
- 238000005457 optimization Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 238000012546 transfer Methods 0.000 description 8
- 230000006399 behavior Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000007781 pre-processing Methods 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000005206 flow analysis Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Software Systems (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Game Theory and Decision Science (AREA)
- Medical Informatics (AREA)
- Evolutionary Computation (AREA)
- Entrepreneurship & Innovation (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了人流预测模型的构建方法及轨道交通站人流情况预测方法,该方法包括:根据行人仿真模型得到空间内的多个历史人流数据集,其中,所述历史人流数据集包括时间数据和人数,所述时间数据用于表示所述人数的记录时间;将所述历史人流数据集输入随机森林模型,对所述随机森林模型进行优化,得到用于预测所述空间内人流情况的人流预测模型。本发明的有益效果:能够进行准确的人流预测,例如对空间人流密度进行准确预测,进而能够迅速应对大客流及突发事件。
Description
技术领域
本发明涉及大数据技术领域,具体而言,涉及一种人流预测模型的构建方法及轨道交通站人流情况预测方法。
背景技术
伴随着城市轨道交通网络化运营,轨道客流规模逐年增长。尤其在工作日早晚高峰,车站内人流量达到峰值,拥挤现象明显,一旦发生突发意外事件,所造成的影响将难以估量。如何有效监管车站人流是安全管控重要的一环,也是公共安全的重要保障,当前实践中主要依靠人员巡视和车站经验,对未来的人流情况进行预测较为困难,且准确度不高,进而难以迅速应对大客流及突发事件。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题,为达上述目的,本发明提供了一种人流预测模型的构建方法,包括步骤:
根据行人仿真模型得到空间内的多个历史人流数据集,其中,所述历史人流数据集包括时间数据和人数,所述时间数据用于表示所述人数的记录时间;
将所述历史人流数据集输入随机森林模型,对所述随机森林模型进行优化,得到用于预测所述空间内人流情况的人流预测模型。
进一步地,所述根据行人仿真模型得到空间内的多个历史人流数据集包括:
将所述空间划分为多个网格;
根据行人仿真输入数据和所述行人仿真模型为每个所述网格分别生成对应的所述历史人流数据集,其中,所述行人仿真输入数据包括空间布局情况、行人流线和行人路径选择情况,每个所述网格均具有对应的所述人流预测模型。
进一步地,所述空间包括轨道交通站,所述行人仿真模型的输入数据包括轨道交通站布局和行人步行路径,所述轨道交通站布局包括轨道交通站环境布局、设施设备布局和组织方案,其中,所述行人步行路径的确定方法包括:
根据轨道交通刷卡数据和车站调查数据确定行人起终点需求;
根据所述行人起终点需求和轨道交通站布局确定行人步行路径。
进一步地,所述行人仿真模型包括行人模型和轨道交通站布局模型;所述行人仿真模型的构建方法包括:
将行人选择偏好和行人特征参数作为模型参数构建所述行人模型,其中,所述行人选择偏好用于表示所述行人对轨道交通站布局中设施设备的选择比例;
将设施设备参数和所述轨道交通站中建筑结构的空间布局作为模型参数构建所述轨道交通站布局模型,其中,所述设施设备参数用于表示所述行人通过设施设备时的通行情况。
进一步地,所述历史人流数据集还包括日期标识参数和/或事故标识参数,其中,所述日期标识参数用于表示所述时间数据对应的时间是否为工作日;所述事故标识参数用于表示所述时间数据对应的时间是否存在突发事故。
进一步地,所述历史人流数据集包括训练数据集;所述将所述历史人流数据集输入随机森林模型,对所述随机森林模型进行优化,得到用于预测所述空间内人流情况的人流预测模型包括:
在多个所述训练数据集中进行第一预设数量次的抽样,得到所述第一预设数量个学习样本子集,其中,每次抽样抽取第二预设数量个所述训练数据集;
根据所述学习样本子集,分别对所述第一预设数量个所述随机森林模型的决策树进行优化,其中,所述人流预测模型包括优化后的所述决策树,所述人流预测模型的预测结果为第一预设数量个所述决策树的回归结果的平均值。
进一步地,每个所述决策树具有的多个特征属性;所述将所述历史人流数据集输入随机森林模型,对所述随机森林模型进行优化,得到用于预测所述空间内人流情况的人流预测模型包括:
针对每个所述决策树,通过信息增益率选取所述决策树的一个最优的所述特征属性作为所述决策树的根节点,其中,所述决策树基于所述根节点进行分裂。
进一步地,所述历史人流数据集还包括测试数据集;所述将所述历史人流数据集输入随机森林模型,对所述随机森林模型进行优化,得到用于预测所述空间内人流情况的人流预测模型还包括:
根据所述测试数据集和所述人流预测模型得到用于表示所述人流预测模型的性能的性能指标,其中,所述性能指标包括绝对平均误差、均方误差和可靠性判定参数中的至少一项;
根据所述性能指标对所述决策树进行优化,直至达到预期。
本发明中的人流预测模型的构建方法,能够用于构建空间的人流预测模型,进而用于对空间内的人流情况进行预测,其中,人流预测模型基于随机森林的随机森林模型优化得到,随机森林模型的训练数据基于行人仿真模型模拟得到,通过对行人仿真,如地铁等轨道交通站的行人仿真,仿真得到的数据能够为车站人流情况的推演提供较好的原始数据积累,基于随机森林模型对数据进行学习优化,随机森林具有抗过拟合能力,并且能够处理高维度数据,进而优化后的模型能够进行准确的人流预测。
本发明还提出了一种轨道交通站人流情况预测方法,包括:
获取需要预测的预测时间;
根据所述预测时间和上述的人流预测模型的构建方法构建的人流预测模型,对人流情况进行预测。
进一步地,所述人流情况包括轨道交通站的人流密度;所述对人流情况进行预测包括:
获取各个网格的面积;
将所述预测时间输入各个所述网格的所述人流预测模型,得到各个所述网格的预测人数;
根据所述预测人数和所述面积生成所述人流密度。
本发明所述的轨道交通站人流情况预测方法与上述人流预测模型的构建方法的有益效果相近似,在此不再进行赘述。
本发明还提出了一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,当所述处理器执行所述计算机程序时,实现如上所述的人流预测模型的构建方法,和/或实现如上所述的轨道交通站人流情况预测方法。
本发明所述的计算设备与上述人流预测模型的构建方法和轨道交通站人流情况预测方法的有益效果相近似,在此不再进行赘述。
本发明还提出了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序被处理器执行时,实现如上所述的人流预测模型的构建方法,和/或实现如上所述的轨道交通站人流情况预测方法。
本发明所述的计算机可读存储介质与上述人流预测模型的构建方法和轨道交通站人流情况预测方法的有益效果相近似,在此不再进行赘述。
附图说明
图1为本发明实施例中的人流预测模型的构建方法的流程图;
图2为本发明实施例中的对空间进行网格分割示意图;
图3为本发明实施例中网格人流密度变化示意图;
图4为本发明实施例中对随机森林模型进行优化的示意图;
图5为本发明实施例中的平均误差(MAE)的分布,其中,横坐标为MAE的值,纵坐标为模型个数;
图6为本发明实施例中的均方误差(MSE)的分布图,其中,横坐标为MSE的值,纵坐标为模型个数;
图8为本发明实施例中的车站工作日24h预测值和真实值对比示意图,其中,横坐标为小时,纵坐标为车站人数;
图9为本发明实施例中的车站休息日24h预测值和真实值对比示意图,其中,横坐标为小时,纵坐标为车站人数;
图10为本发明实施例中的车站各个时间段的预测准确率示意图,其中,横坐标为小时,纵坐标为预测准确率;
图11为本发明实施例中进行行人仿真模拟的流程示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
在本说明书的描述中,参考术语“实施例”、“一个实施例”和“一个实施方式”等的描述意指结合该实施例或实施方式描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示实施方式中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或实施方式。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或实施方式以合适的方式结合。
参照图1所示,本发明实施例提出了一种人流预测模型的构建方法,包括步骤:
S1、根据行人仿真模型得到空间内的多个历史人流数据集,其中,所述历史人流数据集包括时间数据和人数,所述时间数据用于表示所述人数的记录时间;
S2、将所述历史人流数据集输入随机森林模型,对所述随机森林模型进行优化,得到用于预测所述空间内人流情况的人流预测模型。
本发明提出的人流预测模型的构建方法,能够用于构建空间的人流预测模型,进而用于对空间内的人流情况进行预测,例如对地铁空间的人流密度进行预测等。其中,人流预测模型基于随机森林的随机森林模型优化得到,随机森林模型的训练数据基于行人仿真模型模拟得到,通过对行人仿真,如地铁等轨道交通站的行人仿真,仿真得到的数据能够为车站人流情况的推演提供较好的原始数据积累,基于随机森林模型对数据进行学习优化,随机森林具有抗过拟合能力,并且能够处理高维度数据,进而优化后的模型能够进行准确的人流预测。
在对地铁等轨道交通站的人流预测中,行人仿真模型可将车站布局、行人流线、行人路径选择情况(如行人起终点需求)作为输入数据进行模拟仿真,以此输出仿真范围内行人人流数据(如输出人数和密度等),进而对数据进行一定的预处理,即可得到本实施例中用于优化随机森林模型的历史人流数据。对于轨道交通站等空间,行人仿真模型即可以反映全空间无死角全时段的车站客流特征,且根据实际情况对行人的实际流线、路径选择情况等进行了标定,使得仿真的准确度较高。
相关实施例中,本发明的人流预测模型的构建方法还可以应用于存在人流监管的其它区域,例如,体育馆、高铁车站、机场等。以此基于该区域对应的空间布局、行人流线、行人路径选择情况等构建行人仿真模型,根据对应的行人仿真模型得到历史人流数据集,进而对随机森林模型进行优化,从而能够得到此类区域的人流预测模型,以用于人流预测。
在本发明的一个可选的实施例中,所述根据行人仿真模型得到空间内的多个历史人流数据集包括:
将所述空间划分为多个网格;
根据所述行人仿真模型为每个所述网格分别生成对应的所述历史人流数据集,其中,每个所述网格均具有对应的所述人流预测模型。
本实施例中,参照图2所示,在建立空间的人流预测模型时,可将空间,例如地铁车站等轨道交通站,依据车站布局将车站空间划分为多个网格单元,本实施例中,划分的网格尺寸为3×3米,由此,基于行人仿真模型将划分的每个网格均对应生成所述历史人流数据集,进而,针对于各个网格,基于所述历史人流数据集为每个网格均构建随机森林模型,以及进行随机森林模型的优化,由此每个网格均具有对应的人流预测模型。
本实施例中,基于对空间进行网格细分,以及对应具有单独的人流预测模型,在进行人流情况预测时,能够使得预测更加精准,可以便于进行人流密度等人流情况预测,如预测空间以及网格中在时间上的人流密度变化。
参照图3所示,其为轨道交通站网格人流密度变化示意图,在利用人流预测模型进行预测时,可基于模型输出的结果,如输出人数,进而基于网格面积生成网格对应的人流密度,进而生成相对应地人流密度示意图,以使得预测更加直观。
在一可选的实施例中,行人仿真模型仿真得到的数据可如下表1所示的数据形式,对应于将空间划分为多个网格,仿真得到的数据包括网格内人数和记录日期及具体时间等时间信息,其中每间隔1分钟进行采样。基于仿真得到的数据,将数据进行预处理,如进行数据格式上的转化,以此生成用于进行随机森林模型优化的历史人流数据,每组历史人流数据也即包括对应上述记录时间的时间数据以及对应记录时间人数。
记录日期及具体时间 | 网格内人数(人) |
2021/2/10 07:52:00 | 1 |
2021/2/10 07:53:00 | 2 |
2021/2/10 07:54:00 | 1 |
2021/2/10 07:55:00 | 4 |
2021/2/10 07:56:00 | 7 |
可以理解,对于多个网格,每个网格具有独特的标识,如编号等,以表示网格的位置,进而便于进行模型的优化,以及最终的预测结果与实际位置的对应。
仿真得到的数据的时间格式为日期格式,在进行预处理时,可将日期格式以转换公式进行转换,而得到数字格式,即所述历史人流数据集中的时间数据,转换公式具体可为:
hour指的是获取时间的小时,min指的是获取时间的分钟,sec指的是获取时间的秒钟,Rt表示历史人流数据集中的时间数据。
在本发明的一个可选的实施例中,所述空间包括轨道交通站,所述行人仿真模型的输入数据包括轨道交通站布局和行人步行路径,所述轨道交通站布局包括轨道交通站环境布局、设施设备布局和组织方案,其中,所述行人步行路径的确定方法包括:
根据轨道交通刷卡数据和车站调查数据确定行人起终点需求;
根据所述行人起终点需求和轨道交通站布局确定行人步行路径。
参照图11所示,本实施例中,人流预测模型的构建方法可具体应用于构建轨道交通站中,具体如地铁车站中,通过构建关于轨道交通站的人流预测模型,对轨道交通站的人流进行预测。基于此,行人仿真模型的输入数据可以包括轨道交通站布局,如楼梯、扶梯、安检和闸机等设施设备布局,以及如车站建筑结构等轨道交通站环境布局,以及如车站的实际栏杆摆放、车站限流等实际调整的空间布局。同时,行人仿真模型的输入还包括行人步行路径,如行人流线以及行人的起终点等。
其中,可根据轨道交通刷卡数据和车站调查数据确定行人起终点需求,如结合轨道IC卡刷卡数据及车站调查数据获取车站内部的出行需求,包括起点、终点等,具体地,还可包括出行规模,主要分析以出行为目的的旅客出行,细化地块建筑物内的行人出行,包括进站、出站、换乘等流程的出行需求,基于此,可结合轨道交通站布局以及该行人起终点需求进行行人步行路径的确定,具体地,包括上下车客流、换乘客流、集散客流,对各出入口进行客流分析,根据出行目的和出行选择规划行人的室内出行路径,细化楼扶梯、电梯乘坐方式,购票、安检、检票、候车、排队、上车等全流程。由此,通过该行人仿真模型能够反映全空间无死角全时段的轨道交通站客流特征,且根据实际情况对行人的实际流线、路径选择情况等进行了标定,其准确度高,便于输出仿真范围内行人的数量和密度,参照图11所示,对于将空间划分为多个网格,行人仿真模型的输出具体包括网格的位置人数,对应的仿真时间,并且不同的网格具有不同的位置编号进而便于进行人流预测模型的构建,相关实施例中,还可得到具有行人轨迹数据的行人轨迹文件,以用于对行人轨迹进行分析。
在本发明的一个可选的实施例中,所述行人仿真模型包括行人模型和轨道交通站布局模型;所述行人仿真模型的构建方法包括:
将行人选择偏好和行人特征参数作为模型参数构建所述行人模型,其中,所述行人选择偏好用于表示所述行人对轨道交通站布局中设施设备的选择比例;
将设施设备参数和所述轨道交通站中建筑结构的空间布局作为模型参数构建所述轨道交通站布局模型,其中,所述设施设备参数用于表示所述行人通过设施设备时的通行情况。
参照图11所示,本实施例中,轨道交通站布局模型可细分为环境模型和设备设施模型,其中,环境模型可根据轨道交通站的建筑结构和内部布局图纸确定模型参数来建立,包括高铁进出站、地铁城际进出站、高铁站台、地铁城际站台、候车厅、换乘通道、接驳通道等。环境模型可以支持空间结构的修改,在此基础上在相应位置配置各车站设施设备和按照车站组织方案设置乘客流向等。设施设备模型根据轨道交通站中的设施设备参数作为模型参数建立,设施设备参数用于表示所述行人通过设施设备时的通行情况,具体地,设施设备参数可以是行人通过各类设施设备所花费的时间参数,该类参数的标定关系到仿真系统内各类设施的服务能力的准确描述和评估结果的可靠性。可包括对楼梯、扶梯、闸机、安检机、步行通道等进行标定,标定结果以经验分布的形式作为模型的参数输入,构建设施设备模型,由此,各类设备设施均实现参数化控制,可在仿真过程中实现动态的控制和状态改变以体现轨道交通站客运组织或场景的变化,车站设施设备包括但不限于疏导围栏、出入口、安检机、自动售票机、人工售票厅、闸机、紧急出口、楼扶梯、水平步梯、站台等。
行人模型基于将行人选择偏好和行人特征参数作为模型参数构建,实现个体行为特性和个体间的相互作用的模拟,具体地,所述行人选择偏好用于表示所述行人对轨道交通站布局中设施设备的选择比例,如电梯和扶梯的使用比、换乘通道选择方式等,该类参数反映了乘客对于设施的使用偏好,可通过对轨道交通站等进行现场观测调研或其它形式的采集对相关参数进行标定。行人特征参数可以理解为表示行人行为,如包括行人行走速率、行人体态特征、行李携带行为和社会力模型参数,该类参数体现了仿真模型中行人的行为特征,可通过现场观测调研并参考已有研究成果设置此类参数。
由此,通过综合考虑行人和轨道交通布局,能够更加合理准确地进行仿真,进而使得人流预测模型的构建更加精确。
在一可选的实施例中,行人仿真模型可还包括列车模型,以体现列车在车站内的基本行为,包括但不限于列车到达离开车站时间、列车停站或通过、开关门响应时间、列车乘客上下车、列车清人等,以进一步提高仿真准确性。
本实施例中的仿真主要采用的是基于智能体的建模与仿真,对轨道交通站仿真结果进行评估,从而输出任意时刻模型空间范围内的行人运动数据。由此,根据仿真输出的结果,进而得到更加精确的历史人流数据集以便于进行人流预测模型的构建。
在一个可选的实施例中,所述历史人流数据集还包括日期标识参数和/或事故标识参数,其中,所述日期标识参数用于表示所述时间数据对应的时间是否为工作日;所述事故标识参数用于表示所述时间数据对应的时间是否存在突发事故。
本实施例中,考虑到突发事故,如停运、暴雨等天气会对人流造成影响,历史人流数据集还包括日期标识参数和事故标识参数,由此在通过历史人流数据集进行随机森林模型的优化而得到人流预测模型,能够综合考虑是否工作日,以及是否具有突发事故,进而在进行人流情况预测时,能够对各类情况进行综合考虑,以使得预测结果更准确,便于进行安全管控。
突发事故包括列车停运、暴雨、台风等,事故标识参数为Acc,具体地:
通过具体日期时间以及相应的事故历史纪录表等进行确定。
基于此,历史人流数据集的具体形式为:{Rt,iswork,Acc,Pop},其中Pop表示人数,以此用于随机森林模型的优化。
在一个可选的实施例中,所述历史人流数据集包括训练数据集;所述将所述历史人流数据集输入随机森林模型,对所述随机森林模型进行优化,得到用于预测所述空间内人流情况的人流预测模型包括:
在多个所述训练数据集中进行第一预设数量次的抽样,得到所述第一预设数量个学习样本子集,其中,每次抽样抽取第二预设数量个所述训练数据集;
根据所述学习样本子集,分别对所述第一预设数量个所述随机森林模型的决策树进行优化,其中,所述人流预测模型包括优化后的所述决策树,所述人流预测模型的预测结果为第一预设数量个所述决策树的回归结果的平均值;
针对每个所述决策树,通过信息增益率选取所述决策树的一个最优的所述特征属性作为所述决策树的根节点,其中,所述决策树基于所述根节点进行分裂。
本实施例中,历史人流数据集包括训练数据集,具体地,可选择历史人流数据集中的20%作为训练数据集,另外的可作为测试数据集,以用于在模型优化过程中对模型进行测试,进而根据测试结果进行调整以继续进行优化。
参照图4所示,本实施例中,通过迭代测试对随机森林模型的参数进行优化时,可采用Bootstrap随机有放回地从训练数据集抽取第一预设数量个样本,一共进行第二预设数量次抽样,形成第二预设数量个学习样本子集,被抽中的样本称为袋内数据,未被抽中的数据则称为袋外数据。
对于第二预设数量个学习样本子集,从而能够发展第二预设数量个所述随机森林模型的决策树,以此进行优化,由于学习样本子集是随机选取的,各个决策树之间相互独立,以此确保随机森林模型中被优化的决策树数量,其中,由于对于优化完成得到的人流预测模型,其预测结果为所有优化完成的决策树的回归结果的平均值,由此即能够使得预测结果更加精确。
另外,本实施例中,对于每个所述决策树,其均具有多个特征属性,利用信息增益率选取一个最优属性作为该决策树的根节点,然后依次进行分裂,由于每个决策树都按照最优特征进行分裂,在这个过程中不需要进行剪枝,形成随机森林,以此对于各个决策树,在优化时,确保最大深度,进而使得预测结果更加精确。
在本发明的一个可选的实施例中,所述历史人流数据集还包括测试数据集;所述将所述历史人流数据集输入随机森林模型,对所述随机森林模型进行优化,得到用于预测所述空间内人流情况的人流预测模型还包括:
根据所述测试数据集和所述人流预测模型得到用于表示所述人流预测模型的性能的性能指标,其中,所述性能指标包括绝对平均误差、均方误差和可靠性判定参数中的至少一项;
根据所述性能指标对所述决策树进行优化,直至达到预期。
如上述实施例中,历史人流数据集中的80%作为训练数据集,另外20%可作为测试数据集进行模型优化过程中的测试,通过将测试数据集输入人流预测模型,得到的结果即为预测值,结合测试数据集的真实值,如实际人数,进行计算,即能够确定模型的优化情况,也即得到用于表现人流预测模型的性能的性能指标,其中,本实施例中,性能指标包括绝对平均误差、均方误差和可靠性判定参数,通过性能指标判断模型性能不达标时,基于该性能指标对决策树进行进一步地优化,直至达到预期,以此完成模型的优化。
本发明另一实施例中的一种轨道交通站人流情况预测方法,包括步骤:
获取需要预测的预测时间;
根据所述预测时间和所述的人流预测模型的构建方法构建的人流预测模型,对人流情况进行预测。
本发明所述的轨道交通站人流情况预测方法用于对地铁车站等轨道交通站的人流情况进行预测,其有益效果与上述人流预测模型的构建方法的有益效果相近似,在此不再进行赘述。
在本发明的一个可选的实施例中,所述人流情况包括轨道交通站的人流密度;所述对人流情况进行预测包括:
获取各个网格的面积;
将所述预测时间输入各个所述网格的所述人流预测模型,得到各个所述网格的预测人数;
根据所述预测人数和所述面积生成所述人流密度。
本实施例中,将地铁车站等轨道交通站的空间划分为多个网格,即与上述为每个网格构建的人流预测模型的网格对应,以便于进行人流密度等人流情况预测,可基于模型输出的各个网格的预测人数,预测空间以及网格中在时间上的人流密度变化,进而基于网格面积生成网格对应的人流密度,以使得预测更加直观,便于迅速应对大客流及突发事件。
在一实例中,基于本发明中人流预测模型的构建方法和轨道交通站人流情况预测方法对深圳市某地铁站点的人流情况进行分析,该站点为一个十字交叉型的双线换乘车站,车站负一层为站厅层,负二层为5号线站台,负三层为10号线站台。5号线同10号线的换乘方式为十字型换乘楼梯换乘,当客流量较大时,换乘楼梯处上行和下行流线交织容易造成客流拥堵。参照图2,将其划分为多个网格,本实例中对于其多层结果,共划分有为220个网格,并基于行人仿真模型得到仿真人流数据,进而对数据预处理后,进行随机森林模型的优化,而最终构建基于随机森林的220个人流预测模型,并对2021年5月的某一周的人流密度进行了预测。
在预测中,汇总所有网格预测结果的平均误差分布,如图5所示,可以看出平均误差的范围在0-1.1之间,平均值为0.47,以此即表示模型拟合精度较好,预测较准确。
汇总所有的均方误差,如图6所示,可以看出,均方误差平均值为0.63,并且67%的网格对应的人流预测模型均方误差都小于1,即表示模型性能较好。
汇总所有的可靠性判定参数,如图7所示,可以看出,其平均值为0.8,即表示模型可靠性高。
另外对于该车站多层的结果,汇总了车站站厅、站台层的各个性能指标,如下表2中所示:
表2车站内分区域性能指标
可以看出,站台层相对站厅层模型拟合精度更高。
另外,对站点每天6:00-24:00区间进行测试,将时间和事件参数输入人流预测模型,同时安排车站工作人员在车站内统计真实人流情况,对预测结果及真实统计人数进行对比。取每小时网格人数的最大值,绘制时间分布图,如图8和图9所示,可以看出,工作日预测人数同真实人数走势变化基本一致,在8:00-9:00和18:00-19:00之间呈现早晚高峰的峰值特征,休息日预测人数同真实人数走势基本一致,在19:00-20:00为车站人流的高峰,下午和晚上的人流相较上午更高。
参照图10所示,从车站的预测准确率来看,无论是工作日还是休息日,准确率都在80%以上。
本发明另一实施例的一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,当所述处理器执行所述计算机程序时,实现如上所述的人流预测模型的构建方法,和/或实现如上所述的轨道交通站人流情况预测方法。
本发明所述的计算设备与上述人流预测模型的构建方法和轨道交通站人流情况预测方法的有益效果相近似,在此不再进行赘述。
本发明另一实施例的一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序被处理器执行时,实现如上所述的人流预测模型的构建方法,和/或实现如上所述的轨道交通站人流情况预测方法。
本发明所述的计算机可读存储介质与上述人流预测模型的构建方法和轨道交通站人流情况预测方法的有益效果相近似,在此不再进行赘述。
一般来说,用于实现本发明方法的计算机指令的可以采用一个或多个计算机可读的存储介质的任意组合来承载。非临时性计算机可读存储介质可以包括任何计算机可读介质,除了临时性地传播中的信号本身。
计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言,特别是可以使用适于神经网络计算的Python语言和基于TensorFlow、PyTorch等平台框架。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。
Claims (10)
1.一种人流预测模型的构建方法,其特征在于,包括:
根据行人仿真模型得到空间内的多个历史人流数据集,其中,所述历史人流数据集包括时间数据和人数,所述时间数据用于表示所述人数的记录时间;
将所述历史人流数据集输入随机森林模型,对所述随机森林模型进行优化,得到用于预测所述空间内人流情况的人流预测模型。
2.根据权利要求1所述的人流预测模型的构建方法,其特征在于,所述根据行人仿真模型得到空间内的多个历史人流数据集包括:
将所述空间划分为多个网格;
根据所述行人仿真模型为每个所述网格分别生成对应的所述历史人流数据集,其中,每个所述网格均具有对应的所述人流预测模型。
3.根据权利要求1所述的人流预测模型的构建方法,其特征在于,所述空间包括轨道交通站,所述行人仿真模型的输入数据包括轨道交通站布局和行人步行路径,所述轨道交通站布局包括轨道交通站环境布局、设施设备布局和组织方案,其中,所述行人步行路径的确定方法包括:
根据轨道交通刷卡数据和车站调查数据确定行人起终点需求;
根据所述行人起终点需求和轨道交通站布局确定行人步行路径。
4.根据权利要求1所述的人流预测模型的构建方法,其特征在于,所述行人仿真模型包括行人模型和轨道交通站布局模型;所述行人仿真模型的构建方法包括:
将行人选择偏好和行人特征参数作为模型参数构建所述行人模型,其中,所述行人选择偏好用于表示所述行人对轨道交通站布局中设施设备的选择比例;
将设施设备参数和所述轨道交通站中建筑结构的空间布局作为模型参数构建所述轨道交通站布局模型,其中,所述设施设备参数用于表示所述行人通过设施设备时的通行情况。
5.根据权利要求1所述的人流预测模型的构建方法,其特征在于,所述历史人流数据集还包括日期标识参数和/或事故标识参数,其中,所述日期标识参数用于表示所述时间数据对应的时间是否为工作日;所述事故标识参数用于表示所述时间数据对应的时间是否存在突发事故。
6.根据权利要求1-5任一项所述的人流预测模型的构建方法,其特征在于,所述历史人流数据集包括训练数据集;所述将所述历史人流数据集输入随机森林模型,对所述随机森林模型进行优化,得到用于预测所述空间内人流情况的人流预测模型包括:
在多个所述训练数据集中进行第一预设数量次的抽样,得到所述第一预设数量个学习样本子集,其中,每次抽样抽取第二预设数量个所述训练数据集;
根据所述学习样本子集,分别对所述第一预设数量个所述随机森林模型的决策树进行优化,其中,所述人流预测模型包括优化后的所述决策树,所述人流预测模型的预测结果为所述第一预设数量个所述决策树的回归结果的平均值;
针对每个所述决策树,通过信息增益率选取所述决策树的一个最优的特征属性作为所述决策树的根节点,其中,所述决策树基于所述根节点进行分裂。
7.根据权利要求6所述的人流预测模型的构建方法,其特征在于,所述历史人流数据集还包括测试数据集;所述将所述历史人流数据集输入随机森林模型,对所述随机森林模型进行优化,得到用于预测所述空间内人流情况的人流预测模型还包括:
根据所述测试数据集和所述人流预测模型得到用于表示所述人流预测模型的性能的性能指标,其中,所述性能指标包括绝对平均误差、均方误差和可靠性判定参数中的至少一项;
根据所述性能指标对所述决策树进行优化,直至达到预期。
8.一种轨道交通站人流情况预测方法,其特征在于,包括:
获取需要预测的预测时间;
根据所述预测时间和基于权利要求1-7中任一项所述的人流预测模型的构建方法构建的人流预测模型,对人流情况进行预测。
9.根据权利要求8所述的轨道交通站人流情况预测方法,其特征在于,所述人流情况包括轨道交通站的人流密度;所述对人流情况进行预测包括:
获取各个网格的面积;
将所述预测时间输入各个所述网格的所述人流预测模型,得到各个所述网格的预测人数;
根据所述预测人数和所述面积生成所述人流密度。
10.一种计算设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,当所述处理器执行所述计算机程序时,实现如权利要求1-7中任一项所述的人流预测模型的构建方法,和/或实现如权利要求中8或9所述的轨道交通站人流情况预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111098118.9A CN113962437A (zh) | 2021-09-18 | 2021-09-18 | 人流预测模型的构建方法及轨道交通站人流情况预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111098118.9A CN113962437A (zh) | 2021-09-18 | 2021-09-18 | 人流预测模型的构建方法及轨道交通站人流情况预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113962437A true CN113962437A (zh) | 2022-01-21 |
Family
ID=79461758
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111098118.9A Pending CN113962437A (zh) | 2021-09-18 | 2021-09-18 | 人流预测模型的构建方法及轨道交通站人流情况预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113962437A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114141020A (zh) * | 2022-02-08 | 2022-03-04 | 北京城建设计发展集团股份有限公司 | 一种基于轨道交通的行人仿真方法、系统及电子设备 |
CN116663748A (zh) * | 2023-07-26 | 2023-08-29 | 常熟理工学院 | 基于循环神经网络的电梯调度决策方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190295007A1 (en) * | 2018-03-26 | 2019-09-26 | Hitachi Solutions, Ltd. | People flow prediction device |
CN111178633A (zh) * | 2019-12-31 | 2020-05-19 | 上饶市中科院云计算中心大数据研究院 | 基于随机森林算法预测景区客流量的方法和装置 |
CN113095539A (zh) * | 2020-07-06 | 2021-07-09 | 广州大学 | 一种识别特定人群最优衡量指标的方法及装置 |
-
2021
- 2021-09-18 CN CN202111098118.9A patent/CN113962437A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190295007A1 (en) * | 2018-03-26 | 2019-09-26 | Hitachi Solutions, Ltd. | People flow prediction device |
CN111178633A (zh) * | 2019-12-31 | 2020-05-19 | 上饶市中科院云计算中心大数据研究院 | 基于随机森林算法预测景区客流量的方法和装置 |
CN113095539A (zh) * | 2020-07-06 | 2021-07-09 | 广州大学 | 一种识别特定人群最优衡量指标的方法及装置 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114141020A (zh) * | 2022-02-08 | 2022-03-04 | 北京城建设计发展集团股份有限公司 | 一种基于轨道交通的行人仿真方法、系统及电子设备 |
CN114141020B (zh) * | 2022-02-08 | 2022-09-16 | 北京城建设计发展集团股份有限公司 | 一种基于轨道交通的行人仿真方法、系统及电子设备 |
CN116663748A (zh) * | 2023-07-26 | 2023-08-29 | 常熟理工学院 | 基于循环神经网络的电梯调度决策方法及系统 |
CN116663748B (zh) * | 2023-07-26 | 2023-11-03 | 常熟理工学院 | 基于循环神经网络的电梯调度决策方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP4030365A1 (en) | Multi-mode multi-service rail transit analog simulation method and system | |
CN105279572B (zh) | 城市轨道交通客流密集度指数计算与发布系统 | |
CN108446470B (zh) | 基于车辆轨迹数据和人口分布的医疗设施可达性分析方法 | |
CN113962437A (zh) | 人流预测模型的构建方法及轨道交通站人流情况预测方法 | |
Schultz et al. | Analysis of distribution and calibration of car-following sensitivity parameters in microscopic traffic simulation models | |
CN111091225B (zh) | 一种基于深度学习的城市轨道交通短期客流预测方法 | |
Cuesta et al. | School egress data: comparing the configuration and validation of five egress modelling tools | |
Hassannayebi et al. | A hybrid simulation model of passenger emergency evacuation under disruption scenarios: A case study of a large transfer railway station | |
Tang et al. | BIM-based safety design for emergency evacuation of metro stations | |
Salling et al. | Modelling of transport projects uncertainties: Risk assessment and scenario analysis | |
CN108805347B (zh) | 基于客流池的地铁站外关联区域客流估计方法 | |
CN113919605B (zh) | 一种基于大数据的应急指挥调度管理系统及方法 | |
Zhou et al. | Field observation and analysis of waiting passengers at subway platform—A case study of Beijing subway stations | |
Cuesta et al. | Future challenges in evacuation modelling | |
Lu et al. | Analysis of subway station distribution capacity based on automatic fare collection data of Nanjing metro | |
CN106779222A (zh) | 机场地面等待时间预测方法及装置 | |
Zhang et al. | Evaluation of emergency evacuation capacity of urban metro stations based on combined weights and TOPSIS-GRA method in intuitive fuzzy environment | |
Liu et al. | Understanding urban bus travel time: Statistical analysis and a deep learning prediction | |
CN116415756B (zh) | 一种基于vr技术的城市虚拟场景体验管理系统 | |
Fontes et al. | A deep learning approach for predicting bus passenger demand based on weather conditions | |
Liu et al. | Microscopic Simulation-Based Pedestrian Distribution Service Network in Urban Rail Station | |
CN117035198A (zh) | 城市轨道交通车站客流状态识别与管控方法 | |
Ivanusa et al. | Construction of a visual model of people’s movement to manage safety when evacuating from a sports infrastructure facility | |
Zhang et al. | Study on evaluation indicators system of crowd management for transfer stations based on pedestrian simulation | |
Belezamo | Data-driven Methods for Characterizing Transportation System Performances Under Congested Conditions: A Phoenix Study |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20220121 |
|
RJ01 | Rejection of invention patent application after publication |