CN112785071A - 一种企业用车客流模拟与预测系统 - Google Patents
一种企业用车客流模拟与预测系统 Download PDFInfo
- Publication number
- CN112785071A CN112785071A CN202110128721.0A CN202110128721A CN112785071A CN 112785071 A CN112785071 A CN 112785071A CN 202110128721 A CN202110128721 A CN 202110128721A CN 112785071 A CN112785071 A CN 112785071A
- Authority
- CN
- China
- Prior art keywords
- time
- station
- stations
- site
- mode
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004088 simulation Methods 0.000 title claims abstract description 19
- 238000012549 training Methods 0.000 claims abstract description 50
- 238000000034 method Methods 0.000 claims abstract description 26
- 230000004927 fusion Effects 0.000 claims abstract description 12
- 238000012360 testing method Methods 0.000 claims description 9
- 230000001186 cumulative effect Effects 0.000 claims description 6
- 238000005096 rolling process Methods 0.000 claims description 6
- 230000000737 periodic effect Effects 0.000 claims description 4
- 238000012795 verification Methods 0.000 claims description 4
- 238000000342 Monte Carlo simulation Methods 0.000 claims description 3
- 239000011229 interlayer Substances 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 2
- 230000003203 everyday effect Effects 0.000 claims description 2
- 239000000284 extract Substances 0.000 claims description 2
- 238000007689 inspection Methods 0.000 claims 1
- 238000004458 analytical method Methods 0.000 abstract description 2
- 238000002790 cross-validation Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 239000010410 layer Substances 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 2
- 238000004445 quantitative analysis Methods 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/08—Probabilistic or stochastic CAD
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- General Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Tourism & Hospitality (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- Quality & Reliability (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Operations Research (AREA)
- Development Economics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Game Theory and Decision Science (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明公开了一种企业用车客流模拟与预测系统,包括时间流生成模块:生成单次需要用车单个乘客需要坐车的时间;行驶模式选择模块:输入正向、逆向、站间运行比例,根据这个比例确定时间流生成模块的每一时间点的每一乘客确定行驶方向;出发站选择模块:根据运行模式选择不同出发站点和目的站点;目的站选择模块:根据运行模式选择不同目的站点;特征选取模块:从客流数据中提取有用的特征,用于模型训练;模型训练模块:规定输出格式,将提取的特征送入,训练预测模型,得到输出结果;模型融合模块:将使用不同方法训练得到的预测模型进行融合,得到未来某时间段客流预测输出结果。根据这个预测结果分析,更新调度方案。
Description
技术领域
本发明属于车辆调度和机器学习技术领域,具体涉及一种企业用车客流模拟与预测系统。
背景技术
企业用车是指企业工作人员上下班和执行外务需要所配备的车辆。以前大部分企业人员上下班均使用固定大型客车和固定路线接送,但是现在的情况随着各种企业逐渐壮大,企业中部门增多且上下班时间不一致,因此开始使用更灵活方便的非固定路线中小型汽车。一开始应用于企业内的汽车使用制度大多数以纸件或网上申请(孙晨,孔娇丽,郭雷,刘正国,黄笑笑.一种公务用车的智能调度系统及其调度方法[P].浙江省:CN110147924A,2019-08-20.),存在审批效率慢,且容易丢失;不便于二次修改;难以统计数据且难以查看车辆使用情况,因此开始使用企业用车调度管理系统。企业用车调度管理系统一般是收到了用车呼叫然后就开始派车(叶唯,董振环,张华,白晓轩.企业用车管理系统及其方法[P].北京:CN108108904A,2018-06-01.),这种情况下有可能会造成一次派车只搭乘一名乘客的公车浪费的情况,所以开始研究在平均等待时间尽量小的情况下,对公车资源进行合理的配置。一般智能用车调度系统,根据实时用车申请计算出调度方案,但这样对算法和计算机的速度较高要求(张文,谢学泽,熊文博,姜杰,陈聪权,肖朝华.一种基于大数据的公务用车调度监管系统[P].浙江省:CN111652779A,2020-09-11.)。因此本方法提出收集历史数据,在离线情况训练好模型然后对未来某一天的客流做出预测,再设计调度方案可以节约等待时间。此外,在企业用车投入使用之前,需要定量分析客流,以免事先投入过多的企业用车造成浪费从而节约成本。本客流模拟方法通过较少的统计数据得到可以反映实际用车客流。
发明内容
本发明要解决的技术问题是:企业用车投入使用之前模拟真实客流客流,做定量分析,根据模拟客流决定投入车辆以及初期调度方案。本发明在公务用车投入使用后产生的客流数据,预测站点未来的客流量变化,帮助实现更合理的出行路线选择,规避交通堵塞,方便作出科学的资源调配。
本发明至少通过如下技术方案之一实现。
一种企业用车客流模拟与预测系统,包括:
时间流生成模块:生成单次需要用车单个乘客需要坐车的时间,分成两个模式,上下班高峰时间使用泊松分布客流生成,非上下班高峰时间使用均匀分布客流生成,用于客流模拟;
行驶模式选择模块:输入正向、逆向、站间运行比例,根据比例确定时间流生成模块的每一时间点的每一乘客确定行驶方向;设置从其他站点到单位部门站点为正向,从单位部门站点到其他站点为逆向,出发点和到达点都没有单位部门站点为站间运行模式;
出发站选择模块:根据运行模式选择不同出发站点和目的站点,如果是正向模式或者站间模式则出发站点为其他普通站点,如果是逆向模式出发站点固定为单位部门站点;
目的站选择模块:根据运行模式选择不同目的站点,如果是正向模式目的站点固定为单位部门站点,如果是逆向模式和站间模式目的站点为其他普通站点;
各站点当前人数存储模块:记录每个时间段后,每个站点的容纳人数,提现站点人数的变化,初始值为每个普通站点附近的居住人数;
特征选取模块:从客流数据中提取特征,用于预测模型训练;
模型训练模块:规定输出格式,将提取的特征送入,训练预测模型,得到输出结果;
模型融合模块:将使用不同方法训练得到的预测模型进行融合,得到未来某时间段客流预测输出结果,根据这个预测结果分析,更新调度方案。
优选的,所述时间流生成模块需要提供数据包括:规定作为上班高峰期间的时间段,这段时间内到达机关部门的人数设置为N1;规定作为非高峰期间的时间段,这段时间内到达机关部门的人数设置为N2,上下班高峰期间的用车需求发出过程看成泊松分布:
f为时间段T内有用车需求的概率,n为乘客数,λ为每秒用车需求数的平均数即到达速率;
非上下班高峰期间的用车需求发出过程看成均匀分布,
f为时间段T内有用车需求的概率,T2为结束时间点,T1为开始时间点,λ为每秒用车需求数的平均数即到达速率。
优选的,所述出发站选择模块和目的站选择模块需要提供数据包括:将所有企业用车涵盖路线划分为N个站点,统计单位部门中在各个站点附近居住的人数Pi,得到P1,P2...Pi...PN,分为正行模式、逆行模式和层间模式三种运行模式;在逆行模式固定单位部门站点作为出发站点;在正行模式情况下,根据蒙特卡洛法构造轮盘,总共有N个站点,将圆盘分成N个区间分别和N个站点对应,每个区间的宽度和该站点的起始密度成正比,对于每个乘客,随机转动一次轮盘,当轮盘停止时,指针指向的区间所对应的站点即为该乘客的起始站点,操作步骤如下:
④对于每个乘客,在[0,1]区间产生1个随机数r,如果该随机数小于第1个站点的累积概率,则第一个楼层作为起始站点,如果qi≥r≥qi-1,则第i站点作为所选站点;
在站间模式情况下,步骤①的Pi为各站点当前人数存储模块中每个站点当前容纳人数Pi′。
优选的,所述特征选取模块对客流数据进行特征提取包括强相关性信息特征、趋势性特征、周期性特征;
所述强相关性信息特征主要发生在每天对应时刻,分别构造小时粒度和a分钟粒度的出入站流量特征,考虑到前后时间段流量的波动因素,添加上个时段和下个时段,或者上两个和下两个时段的流量特征,同时还构造前M天对应时段的流量,考虑到相邻站点的强相关性,添加相邻两站对应时段的流量。
优选的,所述强相关性信息特征包括:d分钟固定特征、小时统计特征的平滑特征、滑窗统计特征、相邻站点统计特征。
优选的,所述趋势性特征构造特征定义如下:
A_diff(n+1)=A(n+1)-A(n),A=in|out
即表示前后时段的差值,A(n)是入站流量或出站流量,同样,考虑每天对应当前时段,每天对应上个时段;流量差比为:
A_ratio(n+1)=A(n+1)/A(n),A=in|out。
优选的,所述周期性特征选择对应日期对应时间段的信息进行特征的构建,具体包括每周对应时刻d分钟的历史统计值特征和每周对应时刻h小时的历史统计值。
优选的,所述模型训练模块采用滑窗滚动的方式进行构建,将所有滚动滑窗的标签以及特征进行拼接形成最终的训练集,输出规定为h天内以s分钟为间隔,每个站点的进出人数;利用特征选取模块的特征向量,叶子的数量为g,学习率为b,最大深度为w的Xgboost(eXtreme Gradient Boosting,最大梯度提升树)和LightGBM(Light GradientBoosting Machine,轻量梯度提升树)回归模型进行训练。
优选的,所述预测模型Xgboost和LightGBM分别作为基础模型,命名为第一模型和第二模型。
优选的,所述模型融合模块使用时序Stacking方法进行模型融合,将所有数据集生成80%训练集和20%测试集,训练集部分执行p折交叉检验,使用训练集中的80%作为子训练集,剩余20%作为验证集。
与现有技术相比,本发明一种企业用车客流模拟与预测系统收集历史数据,在离线情况训练好模型然后对未来某一天的客流做出预测,再设计调度方案可以节约等待时间。Xgboost和LightGBM的融合模型可以得到比较准确的预测模型。并且企业用车投入使用之前模拟真实客流客流,做定量分析,根据模拟客流决定投入车辆以及初期调度方案,节约成本,避免资源浪费。
附图说明
图1为本实施例企业用车客流模拟流程图;
图2为本实施例企业用车客流预测滑窗模型图;
图3为本实施例训练集融合示意图;
图4为本实施例测试集融合示意图。
具体实施方式
本发明提出一种企业用车客流模拟与预测系统,结合附图和实施例子说明如下。
本实施例的一种企业用车客流模拟与预测系统,包括时间流生成模块:生成单次需要用车单个乘客需要坐车的时间,分成两个模式,上下班高峰时间使用泊松分布客流生成,非上下班高峰时间使用均匀分布客流生成,用于客流模拟;
行驶模式选择模块:输入正向、逆向、站间运行比例,根据这个比例确定时间流生成模块的每一时间点的每一乘客确定行驶方向;设置从其他站点到单位部门站点为正向,从单位部门站点到其他站点为逆向,出发点和到达点都没有单位部门站点为站间运行模式;
出发站选择模块:根据运行模式选择不同出发站点和目的站点,如果是正向模式或者站间模式则出发站点为其他普通站点,如果是逆向模式出发站点固定为单位部门站点;
目的站选择模块:根据运行模式选择不同目的站点,如果是正向模式目的站点固定为单位部门站点,如果是逆向模式和站间模式目的站点为其他普通站点;
各站点当前人数存储模块:记录每个时间段后,每个站点的容纳人数,提现站点人数的变化,初始值为每个普通站点附近的居住人数;
特征选取模块:从客流数据中提取有用的特征,用于模型训练;
模型训练模块:规定输出格式,将提取的特征送入,训练预测模型,得到输出结果;
模型融合模块:将使用不同方法训练得到的预测模型进行融合,得到未来某时间段客流预测输出结果。根据这个预测结果分析,更新调度方案。
如图1所示,所述一种企业用车客流模拟与预测系统的方法,包括以下步骤:
S1、首先生成时间流,假设属于上下班高峰期间,呼叫用车发生次数满足泊松分布,由原来的概率公式推导出:
式子表示初始为0,下式表示在仿真时间内第i个人任到达的时间。r属于[0,1]区间均匀分布的随机数。设置模拟结束的时间为ti,通过调整达速率λ,得到i的最大值等于这段时间内到达机关部门的人数N1结束。
假设属于非上下高峰期间,呼叫用车发生次数满足均匀分布,已知这段时间内到达机关部门的人数N2,计算出分配到模拟结束时间的人数为N2/n,n表示倍数。假设仿真时间为[T1,T2],则在这个区间中生成N2/n个随机数,表示每个人任到达的时间。以上时间单位都表示区间中的第几秒,都要转化为正常的时间格式。
S2、使用行驶模式选择模块,输入正向、逆向、站间运行比例,根据这个比例确定时间流生成模块的每一时间点的每一乘客确定行驶方向。假设这个比例为[0.8,0.1,0.1],说明该时间段的乘客正向、逆向、站间运行的概率为0.8,0.1,0.1。
S3、根据运行模式选择不同出发站点和目的站点。假设所有企业用车涵盖路线划分为8个站点,统计单位部门中在各个站点附近居住的人数Pi,得到[17,18,21,22,32,31,27,32](P1表示单位部门站点附近居住人数)。分为三种模式,在正行模式情况下,出发站点决定根据蒙特卡洛法构造轮盘,总共有8个站点,所以将圆盘分成8个区间分别和8个站点对应,每个区间的宽度和该站点的起始密度成正比,对于每个乘客,随机转动一次轮盘,当轮盘停止时,指针指向的区间所对应的站点即为该乘客的起始站点,操作步骤如下:
①计算站点起始密度之和:F=17+18+21+22+32+31+27+32=200
②计算每个站点的选择概率:
q1=0.085,q2=0.175,q3=0.28,q4=0.39,q5=0.55,q6=0.705,q7=0.84,q8=0.16
④对于每个乘客,在[0,1]区间产生1个随机数,如果该随机数小于第1个站点的累积概率,则第一个楼层作为起始站点,如果qi≥r≥qi-1,则第i站点作为所选站点。假如生成的r为0.776,则第6个站点为出发站点。目的站点为单位部门站点。
在层间模式情况下,出发站点类似上述计算方式,但将上述操作步骤的第①步的Pi更改为各站点当前人数存储模块中每个站点当前容纳人数Pi′。目的站点和上述计算出发站点方法类似。
在逆行模式固定单位部门站点作为出发站点。目的站点和上述计算出发站点方法类似。
根据以上客流模拟方法可以生成以下表1客流数据:
表1客流数据
呼叫用车时间 | 出发站点 | 目的站点 |
2020-12-28 08:12:01 | 2 | 1 |
2020-12-28 08:12:07 | 3 | 1 |
... | ... | ... |
2020-12-28 18:32:01 | 1 | 6 |
S4、企业用车投入使用一段时间后积累使用数据。然后使用特征选取模块,从客流数据进行特征提取,如图2所示,为企业用车客流预测滑窗模型图,包括以下步骤:
假设有30天的历史客流数据积累,并且是如上表1类型,然后以10分钟为单位,统计得到每个10分钟内每个站点的进出人数。假设有4个站点,在8:00-8:10的进出数据分别为1:[21,1],2:[0,3],3:[0,4],4:[1,5],提取特征如下:
1)强相关性信息
2)趋势性
3)周期性
每条训练样本是针对每一个站点的,对于站点1,则是上述一共25个特征的inNums&outNums对应一个输出[21,1];对于站点2,则是上述一共25个特征的inNums&outNums对应一个输出[0,3]等,整个训练集就是由这4个站点的数据进行拼接。如果选取作为特征的天数大于1,则inNums&outNums表示的都是平均值。采用滑窗滚动(天)的方式进行训练,可以防止因为某一天存在奇异值而导致模型训练走偏。最后将所有滚动滑窗的标签以及特征进行拼接形成最终的训练集,输出规定为1天内以10分钟为间隔,每个站点的进出人数;
S5、得到样本以及打上标签后,将其使用Xgboost和LightGBM模型分开训练,保存两个模型。叶子的数量为16,学习率为0.01,最大深度为4,评价标准为MAE。
S6、如图3、图4所示,使用时序stacking方法进行模型融合。用XGBoost作为基础模型Model1,5折交叉验证就是先拿出四折作为训练集,另外一折作为测试集。再在训练集中划分,拿出四折作为训练集,另外一折作为验证集。假设整个训练集包含10000行数据,测试集包含2500行数据,那么每一次交叉验证其实就是对训练集进行划分,在每一次的交叉验证中训练集将会是8000行,验证集是2000行。
每一次的交叉验证包含两个过程,1.基于训练集训练模型;2.基于训练集训练生成的模型对验证集进行预测。在整个第一次的交叉验证完成之后将会得到关于当前验证集的预测值,这将会是一个一维2000行的数据,记为a1。在这部分操作完成后,还要对数据集原来的整个测试集进行预测,这个过程会生成2500个预测值,这部分预测值将会作为下一层模型测试集的一部分,记为b1。因为进行的是5折交叉验证,所以以上提及的过程将会进行五次,最终会生成针对验证集数据预测的5列2000行的数据a1、a2、a3、a4、a5,对测试集的预测会是5列2500行数据b1、b2、b3、b4、b5。
在完成对Model1的整个步骤之后,可以发现a1、a2、a3、a4、a5其实就是对原来整个训练集的预测值,将其拼凑起来,会形成一个10000行一列的矩阵,记为A1。而对于b1、b2、b3、b4、b5这部分数据,将各部分相加取平均值,得到一个2500行一列的矩阵,记为B1。
以上就是stacking中一个模型的完整流程,stacking中同一层通常包含多个模型,还有Model2:LightGBM。重复以上的步骤,在整个流程结束之后,可以得到新的A2、A3、A4、A5、B2、B3、B4、B5矩阵。
在此之后,把A1、A2、A3、A4、A5并列合并得到一个10000行五列的矩阵作为训练集,B1、B2、B3、B4、B5并列合并得到一个2500行五列的矩阵作为测试集。让下一层的模型,基于他们进一步训练。
再训练是基于每个基础模型的预测结果作为特征(2个特征),次学习器会学习训练如果往这样的基学习的预测结果上赋予权重w,来使得最后的预测最为准确。
最后预测数据结果形式为:
以上所述仅为本发明的优选实施例,并不用于限制本发明,显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种企业用车客流模拟与预测系统,其特征在于:包括
时间流生成模块:生成单次需要用车单个乘客需要坐车的时间,分成两个模式,上下班高峰时间使用泊松分布客流生成,非上下班高峰时间使用均匀分布客流生成,用于客流模拟;
行驶模式选择模块:输入正向、逆向、站间运行比例,根据比例确定时间流生成模块的每一时间点的每一乘客确定行驶方向;设置从其他站点到单位部门站点为正向,从单位部门站点到其他站点为逆向,出发点和到达点都没有单位部门站点为站间运行模式;
出发站选择模块:根据运行模式选择不同出发站点和目的站点,如果是正向模式或者站间模式则出发站点为其他普通站点,如果是逆向模式出发站点固定为单位部门站点;
目的站选择模块:根据运行模式选择不同目的站点,如果是正向模式目的站点固定为单位部门站点,如果是逆向模式和站间模式目的站点为其他普通站点;
各站点当前人数存储模块:记录每个时间段后,每个站点的容纳人数,提现站点人数的变化,初始值为每个普通站点附近的居住人数;
特征选取模块:从客流数据中提取特征,用于预测模型训练;
模型训练模块:规定输出格式,将提取的特征送入,训练预测模型,得到输出结果;
模型融合模块:将使用不同方法训练得到的预测模型进行融合,得到未来某时间段客流预测输出结果,根据这个预测结果分析,更新调度方案。
3.根据权利要求2所述的一种企业用车客流模拟与预测系统,其特征在于:所述出发站选择模块和目的站选择模块需要提供数据包括:将所有企业用车涵盖路线划分为N个站点,统计单位部门中在各个站点附近居住的人数Pi,得到P1,P2...Pi...PN,分为正行模式、逆行模式和层间模式三种运行模式;在逆行模式固定单位部门站点作为出发站点;在正行模式情况下,根据蒙特卡洛法构造轮盘,总共有N个站点,将圆盘分成N个区间分别和N个站点对应,每个区间的宽度和该站点的起始密度成正比,对于每个乘客,随机转动一次轮盘,当轮盘停止时,指针指向的区间所对应的站点即为该乘客的起始站点,操作步骤如下:
④对于每个乘客,在[0,1]区间产生1个随机数r,如果该随机数小于第1个站点的累积概率,则第一个楼层作为起始站点,如果qi≥r≥qi-1,则第i站点作为所选站点;
在站间模式情况下,步骤①的Pi为各站点当前人数存储模块中每个站点当前容纳人数Pi′。
4.根据权利要求3所述的一种企业用车客流模拟与预测系统,其特征在于:所述特征选取模块对客流数据进行特征提取包括强相关性信息特征、趋势性特征、周期性特征;
所述强相关性信息特征主要发生在每天对应时刻,分别构造小时粒度和a分钟粒度的出入站流量特征,考虑到前后时间段流量的波动因素,添加上个时段和下个时段,或者上两个和下两个时段的流量特征,同时还构造前M天对应时段的流量,考虑到相邻站点的强相关性,添加相邻两站对应时段的流量。
5.根据权利要求4所述的一种企业用车客流模拟与预测系统,其特征在于:所述强相关性信息特征包括:d分钟固定特征、小时统计特征的平滑特征、滑窗统计特征、相邻站点统计特征。
6.根据权利要求5所述的一种企业用车客流模拟与预测系统,其特征在于:所述趋势性特征构造特征定义如下:
A_diff(n+1)=A(n+1)-A(n),A=in|out
即表示前后时段的差值,A(n)是入站流量或出站流量,同样,考虑每天对应当前时段,每天对应上个时段;流量差比为:
A_ratio(n+1)=A(n+1)/A(n),A=in|out。
7.根据权利要求6所述的一种企业用车客流模拟与预测系统,其特征在于:所述周期性特征选择对应日期对应时间段的信息进行特征的构建,具体包括每周对应时刻d分钟的历史统计值特征和每周对应时刻h小时的历史统计值。
8.根据权利要求7所述的一种企业用车客流模拟与预测系统,其特征在于:所述模型训练模块采用滑窗滚动的方式进行构建,将所有滚动滑窗的标签以及特征进行拼接形成最终的训练集,输出规定为h天内以s分钟为间隔,每个站点的进出人数;利用特征选取模块的特征向量,叶子的数量为g,学习率为b,最大深度为w的最大梯度提升树(Xgboos)和轻量梯度提升树(LightGBM)回归模型进行训练。
9.根据权利要求8所述的一种企业用车客流模拟与预测系统,其特征在于:所述预测模型Xgboost和LightGBM分别作为基础模型,命名为第一模型和第二模型。
10.根据权利要求9所述的一种企业用车客流模拟与预测系统,其特征在于:所述模型融合模块使用时序Stacking方法进行模型融合,将所有数据集生成80%训练集和20%测试集,训练集部分执行p折交叉检验,使用训练集中的80%作为子训练集,剩余20%作为验证集。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110128721.0A CN112785071B (zh) | 2021-01-29 | 2021-01-29 | 一种企业用车客流模拟与预测系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110128721.0A CN112785071B (zh) | 2021-01-29 | 2021-01-29 | 一种企业用车客流模拟与预测系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112785071A true CN112785071A (zh) | 2021-05-11 |
CN112785071B CN112785071B (zh) | 2023-02-28 |
Family
ID=75759910
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110128721.0A Active CN112785071B (zh) | 2021-01-29 | 2021-01-29 | 一种企业用车客流模拟与预测系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112785071B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106355276A (zh) * | 2016-08-30 | 2017-01-25 | 郑州天迈科技股份有限公司 | 基于客流仿真分析的发车时刻表生成系统 |
US20170169373A1 (en) * | 2015-12-14 | 2017-06-15 | Xerox Corporation | System and method for measuring perceived impact of schedule deviation in public transport |
CN108009568A (zh) * | 2017-11-14 | 2018-05-08 | 华南理工大学 | 一种基于wgan模型的行人检测方法 |
CN109034449A (zh) * | 2018-06-14 | 2018-12-18 | 华南理工大学 | 基于深度学习和乘客行为模式的短期公交客流预测方法 |
CN109308543A (zh) * | 2018-08-20 | 2019-02-05 | 华南理工大学 | 基于ls-svm和实时大数据的地铁短期客流预测方法 |
CN110459050A (zh) * | 2019-05-27 | 2019-11-15 | 华南理工大学 | 一种基于混合决策树的短期公交客流预测方法 |
CN112214873A (zh) * | 2020-09-10 | 2021-01-12 | 卡斯柯信号有限公司 | 一种轨道交通故障下的客流分布仿真评估方法及系统 |
-
2021
- 2021-01-29 CN CN202110128721.0A patent/CN112785071B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170169373A1 (en) * | 2015-12-14 | 2017-06-15 | Xerox Corporation | System and method for measuring perceived impact of schedule deviation in public transport |
CN106355276A (zh) * | 2016-08-30 | 2017-01-25 | 郑州天迈科技股份有限公司 | 基于客流仿真分析的发车时刻表生成系统 |
CN108009568A (zh) * | 2017-11-14 | 2018-05-08 | 华南理工大学 | 一种基于wgan模型的行人检测方法 |
CN109034449A (zh) * | 2018-06-14 | 2018-12-18 | 华南理工大学 | 基于深度学习和乘客行为模式的短期公交客流预测方法 |
CN109308543A (zh) * | 2018-08-20 | 2019-02-05 | 华南理工大学 | 基于ls-svm和实时大数据的地铁短期客流预测方法 |
CN110459050A (zh) * | 2019-05-27 | 2019-11-15 | 华南理工大学 | 一种基于混合决策树的短期公交客流预测方法 |
CN112214873A (zh) * | 2020-09-10 | 2021-01-12 | 卡斯柯信号有限公司 | 一种轨道交通故障下的客流分布仿真评估方法及系统 |
Non-Patent Citations (5)
Title |
---|
JIANG LI-JUN ET AL.: ""A crowd evacuation simulation model based on 2.5-dimension cellular automaton"", 《2009 IEEE INTERNATIONAL CONFERENCE ON VIRTUAL ENVIRONMENTS, HUMAN-COMPUTER INTERFACES AND MEASUREMENTS SYSTEMS》 * |
丁小兵等: "基于时段分布的市郊轨道交通车站滞留客流分布算法", 《交通运输系统工程与信息》 * |
左乾坤: ""基于数据挖掘的公交客流分析与短时预测研究"", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》 * |
杨瑞霞等: ""安检互认条件下的市郊铁路与地铁换乘站客流模拟仿真研究"", 《城市轨道交通研究》 * |
章若晨: ""基于社会力模型的公交乘客上下行为仿真建模及应用"", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》 * |
Also Published As
Publication number | Publication date |
---|---|
CN112785071B (zh) | 2023-02-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP4030365A1 (en) | Multi-mode multi-service rail transit analog simulation method and system | |
Toqué et al. | Short & long term forecasting of multimodal transport passenger flows with machine learning methods | |
CN103632212B (zh) | 一种时变用户均衡动态网络演化客流预测系统和方法 | |
Gkiotsalitis et al. | At-stop control measures in public transport: Literature review and research agenda | |
Liu et al. | Bus stop-skipping scheme with random travel time | |
CN106503869A (zh) | 一种基于站点短时需求预测的公共自行车动态调度方法 | |
CN102044149A (zh) | 一种基于时变客流的城市公交运营协调方法与装置 | |
CN107341553A (zh) | 一种车辆调度方法及装置,电子设备 | |
CN112598177B (zh) | 一种城市轨道交通突发事件在线客流预测与仿真系统 | |
Wilson et al. | The potential impact of automated data collection systems on urban public transport planning. | |
CN114529032A (zh) | 一种基于lstm网络的地铁断面客流预测方法 | |
CN112183815B (zh) | 基于规则推荐算法的精准短时客流预测模型 | |
CN114037158A (zh) | 一种基于od路径的客流预测方法及应用方法 | |
CN110570656B (zh) | 定制公共交通线路方法及装置 | |
CN112562377A (zh) | 一种基于随机机会约束的客运车辆实时调度方法 | |
CN115472011B (zh) | 基于预约数据的公交智能线路规划算法 | |
CN114707709A (zh) | 铁路综合客运枢纽安全预警方法及系统 | |
CN115860594A (zh) | 一种应用于智能公交排班调度的仿真系统及方法 | |
CN113033928B (zh) | 一种基于深度强化学习的公交排班模型的设计方法、装置及系统 | |
Leffler et al. | Simulation of fixed versus on-demand station-based feeder operations | |
CN113536692A (zh) | 一种不确定环境下的高铁列车智能调度方法及系统 | |
CN113821547A (zh) | 快速高效的停车场占有率短时预测方法、系统及存储介质 | |
CN112785071B (zh) | 一种企业用车客流模拟与预测系统 | |
CN117371596A (zh) | 一种基于多源数据的智慧城市用公共交通综合调控系统 | |
Nuzzolo et al. | Stop: a short term transit occupancy prediction tool for aptis and real time transit management systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 510640 No. five, 381 mountain road, Guangzhou, Guangdong, Tianhe District Applicant after: SOUTH CHINA University OF TECHNOLOGY Applicant after: GUANGZHOU VIDEO-STAR ELECTRONICS Co.,Ltd. Address before: 510640 No. five, 381 mountain road, Guangzhou, Guangdong, Tianhe District Applicant before: SOUTH CHINA University OF TECHNOLOGY Applicant before: Guangzhou visual sound intelligent technology Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |