CN103793761A - 一种枢纽异常客流量产生因素的识别方法 - Google Patents
一种枢纽异常客流量产生因素的识别方法 Download PDFInfo
- Publication number
- CN103793761A CN103793761A CN201410035508.5A CN201410035508A CN103793761A CN 103793761 A CN103793761 A CN 103793761A CN 201410035508 A CN201410035508 A CN 201410035508A CN 103793761 A CN103793761 A CN 103793761A
- Authority
- CN
- China
- Prior art keywords
- data
- abnormal
- passenger flow
- flow
- passengers
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Traffic Control Systems (AREA)
Abstract
本发明涉及一种枢纽异常客流量产生因素的识别方法,该方法包括以下步骤:1)采集历史数据,包括枢纽历史客流数据及相关影响因素信息;2)根据步骤1)采集的数据构建枢纽客流量估测模型;3)根据步骤2)的枢纽客流量估测模型提取异常客流量数据;4)对提取的异常客流量数据进行聚类分析;5)根据分析结果识别异常客流量产生因素。与现有技术相比,本发明提升客流数据收集的可靠性,加强客流数据分析的有效性,实现客流分析的量化,提升客流预测的准确性。
Description
技术领域
本发明涉及交通运输及数据分析领域,尤其是涉及一种枢纽异常客流量产生因素的识别方法。
背基技术
目前,枢纽客流分析的现状呈现以下几个问题:
1.目前为止,还没有一个完善的枢纽客流数据收集系统,实现对枢纽运营效率及客流量及客流分布的数据收集。
2.目前为止,由于缺乏枢纽运营效率、客流量及客流分布的历史数据,我国各大枢纽仍未建立有较为完善的枢纽客流分析方法,分析造成枢纽客流量及客流分布变异的影响因素,预测枢纽客流到达量及到达分布,为综合交通枢纽的客运调度提供数据指导及为设计枢纽特殊运营状态应急处理预案提供支持。
3.枢纽客流预测及影响因素分析多凭借主观经验进行人为判定,未能建立信息化及量化的分析技术。导致我国综合客运枢纽运营效率低下,服务水平低,用户出行满意度不高。
运用统计学的分析方法进行客流统计及异常客流数据的提取不仅可以为大型枢纽管理部门提供分析造成客流异常的依据,提前预知异常客流产生的可能性,做好运预案和应急监控的准备,最大限度的满足旅客出行的需求,提高枢纽的运营效率和服务水平,实现客运和收益的最大化。
多元线性回归模型,在数理统计中,是描述一个因变量变量受到多个自变量的影响的方法。以y作为因变量,以x1,x2…xn为n个自变量,则模型可以写成:
其中β0为常数项,βi(i=1,2,...n)是y对x的回归系数,ε为随机误差项。
聚类分析是一组将研究对象分为相对同质的群组的统计分析技术,聚类分析过程主要包括了数据变换处理、计算聚类统计量、选择聚类方法、根据聚类方法进行数据分析和预测四个步骤。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种枢纽异常客流量产生因素的识别方法,提升客流数据收集的可靠性,加强客流数据分析的有效性,实现客流分析的量化,提升客流预测的准确性。
本发明的目的可以通过以下技术方案来实现:
一种枢纽异常客流量产生因素的识别方法,该方法包括以下步骤:
1)采集历史数据,包括枢纽历史客流数据及相关影响因素信息;
2)根据步骤1)采集的数据构建枢纽客流量估测模型;
3)根据步骤2)的枢纽客流量估测模型提取异常客流量数据;
4)对提取的异常客流量数据进行聚类分析;
5)根据分析结果识别异常客流量产生因素。
所述的步骤1)具体为:
101)设置历史客流量收集颗粒度;
102)采集枢纽历史客流数据,包括枢纽各运输方式的运力、客流量和客流分布比例;
103)采集相关影响因素信息,所述的相关影响因素信息包括天气数据、温度数据、枢纽建设数据和交通数据。
所述的步骤2)具体为:采用多元线性回归方法对步骤1)采集的历史数据进行回归训练,计算回归函数中的回归系数,构建如下回归函数:
其中,y为某种运输方式客流承担比例或客流量,x1,x2...xn为n个自变量,β0为常数项,βi(i=1,2,...n)是y对x的回归系数,ε为随机误差项。
所述的自变量的选取满足F检测95%置信区间的要求。
所述的步骤3)中的提取异常客流量数据具体为:
301)采用步骤2)的枢纽客流量估测模型对历史数据进行重新计算,计算历史数据的估计值与实际数据的残差和相对误差;
302)设定相对误差控制值,提取相对误差超过相对误差控制值的数据,并将提取的数据作为异常客流量数据。
所述的步骤4)中,对异常客流数据进行聚类分析时,聚类过程采用明考夫斯基距离和夹角余弦值作为测量异常客流数据的相似程度,所述的明考夫斯基距离计算公式为:
式中,diα(q)为异常客流数据i与异常数据聚类组α的明考夫斯基距离,q为自然数,为控制距离计算程度的指标,p为异常客流数据的相关影响因素数量,Xik为第i个异常客流数据的第k个相关影响因素的取值,Xαk为第α个异常客流数据聚类组的第k个相关影响因素的平均值;
所述的夹角余弦值的计算公式为:
式中CoSθiα为第i个异常客流数据和第α个聚类组向量夹角余弦值。
所述的聚类过程具体为:
401)取第i个异常客流数据及其相关影响因素向量;
402)取第α个聚类组及其相关影响因素向量;
403)根据步骤401)和402)计算相应的明考夫斯基距离和夹角余弦值;
404)判断是否满足diα(q)≤α⌒CoSθiα≤β,α、β分别为明考夫斯基距离、夹角余弦值的临界值,若是,则将该第i个异常客流数据加入第α个聚类组,执行步骤406),若否,则执行步骤405);
405)判断是否满足α=m,m为当前聚类组数,若是,则将第i个异常客流数据加入新建聚类组m+1,并执行步骤406),若否,则α=α+1,返回步骤402);
406)判断是否满足i=n,n为异常客流数据总个数,若是,则结束,若否,则i=i+1,返回步骤401)。
与现有技术相比,本发明通过构建枢纽客流量估测模型,并根据历史数据与预测数据的比较结果,为交通枢纽的等客运部门提供一种客流数据收集及分析的新型方法,提升客流数据收集的可靠性,加强客流数据分析的有效性,实现客流分析的量化,提升客流预测的准确性。
附图说明
图1为本发明的流程示意图;
图2为本发明聚类过程的示意图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。
如图1所示,一种枢纽异常客流量产生因素的识别方法,该方法包括以下步骤:
1)采集历史数据,包括枢纽历史客流数据及相关影响因素信息;
2)根据步骤1)采集的数据构建枢纽客流量估测模型;
3)根据步骤2)的枢纽客流量估测模型提取异常客流量数据;
4)对提取的异常客流量数据进行聚类分析;
5)根据分析结果识别异常客流量产生因素。
步骤1):历史数据采集
a.设置历史客流量收集颗粒度
根据实际大型交通枢纽的数据收集手段和枢纽预测精度要求,选取合适的历史客流量数据颗粒度。数据收集的颗粒度从大到小可为:年,季度,月,周,日,早晚高峰,小时,30分钟和15分钟。优选天、小时、30分钟及15分钟作为历史客流量收集的颗粒度。
b.枢纽历史客流数据和可能相关影响因素信息的收集
历史数据的收集主要对时间数据、客流数据、运力数据、天气数据、温度数据、建设数据、交通数据、其他数据等数据进行收集。具体数据的收集不限于下属数据,不同枢纽可以根据其实际数据收集技术和数据收集需求,选取其中需要的数据类型。具体的数据类型和对应的数据收集内容如表1所示。表1所示仅为本发明的部分优选数据收集内容,并非因此限制本发明的专利范围,凡是利用本发明提出的数据收集方法,或直接或简介运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
表1
c.数据结构设计。
数据结构设计过程中,取各交通方式的客运量、客运承担比率和运力为连续变量,天气数据、温度数据、建设数据、交通数据、其他数据取为哑元变量(0,1变量)。具体的变量格式参见附件表
以天为例具体数据的结构形式可以用如表2所示。
表2
步骤2):构建枢纽客流量估测模型
将枢纽客流数据处理成上述数据格式后,按照OLS作为控制目标采用多元线性回归方法对历史数据进行回归训练,计算回归函数的相关参数,构建回归函数,作为估算客流数据的估测模型。
优选回归方程形式如下:
其中y作为因变量为某种交通方式客流承担比例或客流量,以x1,x2….xn为n个自变量。β0为常数项,βi(i=1,2,...n)是y对x的回归系数,ε为随机误差项。其中自变量的选取需满足F检测95%置信区间的要求,否则去除该自变量。
在此,以轨道交通客流比例作为因变量为例,采用上述多元线性回归方程进行历史数据训练,训练结果表3所示。
表3
步骤3):根据枢纽客流量估测模型提取异常客流量数据;
采用根据历史数据训练的回归模型对历史数据进行重新计算,计算历史数据的估计值和相对误差对相对误差超过10%的数据进行提取。提取的数据即为异常数据。以某枢纽2012年6月的历史数据为事例,对应的计算结果如表4所示。
表4
根据计算结果,对相对误差超过10%的数据进行提取,提取结果如表5。
表5
步骤4):异常客流数据分析
对异常客流数据进行聚类分析,聚类过程采用明考夫斯基距离和夹角余弦作为测量异常客流数据的相似程度。明考夫斯基距离计算公式如下:
夹角余弦值的计算方法如下:
取q为2,明考夫斯基距离、夹角余弦值的临界值α、β分别为α=0.2,β=0.5,未满足此两项条件则单独作为聚类分组。如图2所示,聚类过程具体为:
401)取第i个异常客流数据及其相关影响因素向量;
402)取第α个聚类组及其相关影响因素向量;
403)根据步骤401)和402)计算相应的明考夫斯基距离和夹角余弦值;
404)判断是否满足diα(q)≤α⌒CoSθiα≤β,若是,则将该第i个异常客流数据加入第α个聚类组,执行步骤406),若否,则执行步骤405);
405)判断是否满足α=m,m为当前聚类组数,若是,则将第i个异常客流数据加入新建聚类组m+1,并执行步骤406),若否,则α=α+1,返回步骤402):
406)判断是否满足i=n,n为异常客流数据总个数,若是,则结束,若否,则i=i+1,返回步骤401)。
取上述3组异常数据计算明考夫斯基距离和夹角余弦值,计算结果可以分成两组聚类,如表6所示。
表6
聚类1组 | 假期 | 节前3天 | 节后3天 | 周一 | 周二 | 周三 | 周四 | 周五 | 周六 | 周日 |
6/23 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 |
6/24 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 |
聚类2组 | 假期 | 节前3天 | 节后3天 | 周一 | 周二 | 周三 | 周四 | 周五 | 周六 | 周日 |
6/26 | 0 | 0 | 1 | 0 | 1 | 0 | 0 | 0 | 0 | 0 |
步骤5):异常客流数据成因判定及估测模型适用性判定
对各个聚类组的异常数据对应各的影响因素进行统计分析,如果各组中对应某些向量关系存在率超过80%则认为该影响因素为造成异常客流数据的影响因素之一。
对上述2组聚类数据进行分析,分析结果显示第1组数据中均出现在节假日,且节假日均为周末,存在率为100%,故造成异常客流比例的原因可能是假期客流与周末客流的相互影响所引起的。第2组聚类中由于数据量不足,不对聚类结果进行分析。
根据上述分析结果所示,当节假日出现在周末时,由于周末及节假日客流的相互影响,轨道交通所承担的客流比例会下降,在面对这类特殊情况时,需考虑该因素对实际客流分布的影响。
以上所属仅为本发明的部分优选实施事例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所做的等效结构或等效流程变换,或直接或简介运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (7)
1.一种枢纽异常客流量产生因素的识别方法,其特征在于,该方法包括以下步骤:
1)采集历史数据,包括枢纽历史客流数据及相关影响因素信息;
2)根据步骤1)采集的数据构建枢纽客流量估测模型;
3)根据步骤2)的枢纽客流量估测模型提取异常客流量数据;
4)对提取的异常客流量数据进行聚类分析;
5)根据分析结果识别异常客流量产生因素。
2.根据权利要求1所述的一种枢纽异常客流量产生因素的识别方法,其特征在于,所述的步骤1)具体为:
101)设置历史客流量收集颗粒度;
102)采集枢纽历史客流数据,包括枢纽各运输方式的运力、客流量和客流分布比例;
103)采集相关影响因素信息,所述的相关影响因素信息包括天气数据、温度数据、枢纽建设数据和交通数据。
3.根据权利要求1所述的一种枢纽异常客流量产生因素的识别方法,其特征在于,所述的步骤2)具体为:采用多元线性回归方法对步骤1)采集的历史数据进行回归训练,计算回归函数中的回归系数,构建如下回归函数:
其中,y为某种运输方式客流承担比例或客流量,x1,x2…xn为n个自变量,β0为常数项,βi(i=1,2,...n)是y对x的回归系数,ε为随机误差项。
4.根据权利要求3所述的一种枢纽异常客流量产生因素的识别方法,其特征在于,所述的自变量的选取满足F检测95%置信区间的要求。
5.根据权利要求3所述的一种枢纽异常客流量产生因素的识别方法,其特征在于,所述的步骤3)中的提取异常客流量数据具体为:
301)采用步骤2)的枢纽客流量估测模型对历史数据进行重新计算,计算历史数据的估计值与实际数据的残差和相对误差;
302)设定相对误差控制值,提取相对误差超过相对误差控制值的数据,并将提取的数据作为异常客流量数据。
6.根据权利要求1所述的一种枢纽异常客流量产生因素的识别方法,其特征在于,所述的步骤4)中,对异常客流数据进行聚类分析时,聚类过程采用明考夫斯基距离和夹角余弦值作为测量异常客流数据的相似程度,所述的明考夫斯基距离计算公式为:
式中,diα(q)为异常客流数据i与异常数据聚类组α的明考夫斯基距离,q为自然数,为控制距离计算程度的指标,p为异常客流数据的相关影响因素数量,Xik为第i个异常客流数据的第k个相关影响因素的取值,Xαk为第α个异常客流数据聚类组的第k个相关影响因素的平均值:
所述的夹角余弦值的计算公式为:
式中CoSθiα为第i个异常客流数据和第α个聚类组向量夹角余弦值。
7.根据权利要求6所述的一种枢纽异常客流量产生因素的识别方法,其特征在于,所述的聚类过程具体为:
401)取第i个异常客流数据及其相关影响因素向量;
402)取第α个聚类组及其相关影响因素向量;
403)根据步骤401)和402)计算相应的明考夫斯基距离和夹角余弦值;
404)判断是否满足diα(q)≤α⌒CoSθiα≤β,α、β分别为明考夫斯基距离、夹角余弦值的临界值,若是,则将该第i个异常客流数据加入第α个聚类组,执行步骤406),若否,则执行步骤405);
405)判断是否满足α=m,m为当前聚类组数,若是,则将第i个异常客流数据加入新建聚类组m+1,并执行步骤406),若否,则α=α+1,返回步骤402);
406)判断是否满足i=n,n为异常客流数据总个数,若是,则结束,若否,则i=i+1,返回步骤401)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410035508.5A CN103793761B (zh) | 2014-01-24 | 2014-01-24 | 一种枢纽异常客流量产生因素的识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410035508.5A CN103793761B (zh) | 2014-01-24 | 2014-01-24 | 一种枢纽异常客流量产生因素的识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103793761A true CN103793761A (zh) | 2014-05-14 |
CN103793761B CN103793761B (zh) | 2017-11-07 |
Family
ID=50669400
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410035508.5A Active CN103793761B (zh) | 2014-01-24 | 2014-01-24 | 一种枢纽异常客流量产生因素的识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103793761B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107169555A (zh) * | 2017-06-30 | 2017-09-15 | 广东欧珀移动通信有限公司 | 一种闸机提示方法、装置、存储介质和终端 |
CN112070324A (zh) * | 2020-11-11 | 2020-12-11 | 江西鹭鹭行科技有限公司 | 站点客流量预测方法、装置、可读存储介质及计算机设备 |
CN112235152A (zh) * | 2020-09-04 | 2021-01-15 | 北京邮电大学 | 流量大小估算方法和装置 |
CN113723858A (zh) * | 2021-09-10 | 2021-11-30 | 首约科技(北京)有限公司 | 一种依据供需的网约车排队场景的分析方法 |
CN114548836A (zh) * | 2022-04-25 | 2022-05-27 | 杭州玳数科技有限公司 | 一种基于疫情的多因素交通枢纽运营方法和系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101771758A (zh) * | 2008-12-31 | 2010-07-07 | 北京亿阳信通软件研究院有限公司 | 一种性能指标值正常波动范围的动态确定方法及其装置 |
US20110227697A1 (en) * | 2010-01-22 | 2011-09-22 | ICTS Europe Systems Ltd | Passenger flow monitoring method and system |
CN102819768A (zh) * | 2011-11-07 | 2012-12-12 | 金蝶软件(中国)有限公司 | 客流数据分析的方法及系统 |
CN103473620A (zh) * | 2013-09-26 | 2013-12-25 | 青岛海信网络科技股份有限公司 | 综合客运枢纽多交通方式预测方法及系统 |
JP2014002596A (ja) * | 2012-06-19 | 2014-01-09 | Honda Motor Co Ltd | 道路交通情報サーバ及び道路交通情報システム |
-
2014
- 2014-01-24 CN CN201410035508.5A patent/CN103793761B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101771758A (zh) * | 2008-12-31 | 2010-07-07 | 北京亿阳信通软件研究院有限公司 | 一种性能指标值正常波动范围的动态确定方法及其装置 |
US20110227697A1 (en) * | 2010-01-22 | 2011-09-22 | ICTS Europe Systems Ltd | Passenger flow monitoring method and system |
CN102819768A (zh) * | 2011-11-07 | 2012-12-12 | 金蝶软件(中国)有限公司 | 客流数据分析的方法及系统 |
JP2014002596A (ja) * | 2012-06-19 | 2014-01-09 | Honda Motor Co Ltd | 道路交通情報サーバ及び道路交通情報システム |
CN103473620A (zh) * | 2013-09-26 | 2013-12-25 | 青岛海信网络科技股份有限公司 | 综合客运枢纽多交通方式预测方法及系统 |
Non-Patent Citations (3)
Title |
---|
何九冉: "《城市轨道交通客流统计特征分析及组合预测方法实证研究》", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑 》 * |
夏青: "《节假日铁路客流波动规律分析及其在客流预测中的应用研究》", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑 》 * |
张红坡 张海峰: "《SPSS统计分析实用宝典》", 30 June 2012, 清华大学出版社 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107169555A (zh) * | 2017-06-30 | 2017-09-15 | 广东欧珀移动通信有限公司 | 一种闸机提示方法、装置、存储介质和终端 |
CN112235152A (zh) * | 2020-09-04 | 2021-01-15 | 北京邮电大学 | 流量大小估算方法和装置 |
CN112070324A (zh) * | 2020-11-11 | 2020-12-11 | 江西鹭鹭行科技有限公司 | 站点客流量预测方法、装置、可读存储介质及计算机设备 |
CN113723858A (zh) * | 2021-09-10 | 2021-11-30 | 首约科技(北京)有限公司 | 一种依据供需的网约车排队场景的分析方法 |
CN114548836A (zh) * | 2022-04-25 | 2022-05-27 | 杭州玳数科技有限公司 | 一种基于疫情的多因素交通枢纽运营方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN103793761B (zh) | 2017-11-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111653088B (zh) | 一种车辆出行量预测模型构建方法及预测方法和系统 | |
CN103090831B (zh) | 覆冰区域输电线路覆冰厚度的判断方法 | |
CN103793761A (zh) | 一种枢纽异常客流量产生因素的识别方法 | |
CN107086935B (zh) | 基于wifi ap的人流量分布预测方法 | |
CN105023468B (zh) | 一种基于碰撞风险模型的终端区航线安全容限监测方法和系统 | |
CN109299438B (zh) | 一种基于网约车数据的公共交通设施供给水平评价方法 | |
CN110276977B (zh) | 一种公交站点匹配方法、装置、设备及可读存储介质 | |
CN110060513A (zh) | 基于历史轨迹数据的空中交通管制员工作负荷评估方法 | |
CN101814112A (zh) | 处理数据的方法和装置 | |
CN102243816B (zh) | 一种机场空域最大纵向飞行冲突风险计算方法 | |
CN111415039B (zh) | 一种基于非负张量分解的航班延误模式分析方法 | |
Nam et al. | Analysis of grid cell–based taxi ridership with large-scale GPS data | |
CN111598333B (zh) | 客流数据的预测方法及装置 | |
CN110889092A (zh) | 一种基于轨道交易数据的短时大型活动周边轨道站点客流量预测方法 | |
CN103903437A (zh) | 基于视频交通检测数据的机动车出行od矩阵获取方法 | |
Cui et al. | A framework for investigating the air quality variation characteristics based on the monitoring data: Case study for Beijing during 2013–2016 | |
CN105528647A (zh) | 基于大数据分析的机场概率交通需求预测方法 | |
CN112232535A (zh) | 一种基于监督学习的航班离场平均延误预测方法 | |
Ji et al. | Identifying homogeneous periods in bus route origin-destination passenger flow patterns from automatic passenger counter data | |
CN113221472B (zh) | 一种基于lstm的客流预测方法 | |
Wu et al. | A novel dynamically adjusted regressor chain for taxi demand prediction | |
CN103106329B (zh) | 一种用于svr短期负荷预测的训练样本分组构造方法 | |
CN103218516A (zh) | 一种聚类再回归的机场噪声单步预测方法 | |
CN102508997B (zh) | 一种地下水模型输出不确定性分析方法 | |
Hansen et al. | Going south? econometric analysis of US airline flight delays from 2000 to 2004 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |