CN103793761B - 一种枢纽异常客流量产生因素的识别方法 - Google Patents

一种枢纽异常客流量产生因素的识别方法 Download PDF

Info

Publication number
CN103793761B
CN103793761B CN201410035508.5A CN201410035508A CN103793761B CN 103793761 B CN103793761 B CN 103793761B CN 201410035508 A CN201410035508 A CN 201410035508A CN 103793761 B CN103793761 B CN 103793761B
Authority
CN
China
Prior art keywords
data
mrow
flow
passengers
abnormal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410035508.5A
Other languages
English (en)
Other versions
CN103793761A (zh
Inventor
孙立军
成诚
杜豫川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tongji University
Original Assignee
Tongji University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tongji University filed Critical Tongji University
Priority to CN201410035508.5A priority Critical patent/CN103793761B/zh
Publication of CN103793761A publication Critical patent/CN103793761A/zh
Application granted granted Critical
Publication of CN103793761B publication Critical patent/CN103793761B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Traffic Control Systems (AREA)

Abstract

本发明涉及一种枢纽异常客流量产生因素的识别方法,该方法包括以下步骤:1)采集历史数据,包括枢纽历史客流数据及相关影响因素信息;2)根据步骤1)采集的数据构建枢纽客流量估测模型;3)根据步骤2)的枢纽客流量估测模型提取异常客流量数据;4)对提取的异常客流量数据进行聚类分析;5)根据分析结果识别异常客流量产生因素。与现有技术相比,本发明提升客流数据收集的可靠性,加强客流数据分析的有效性,实现客流分析的量化,提升客流预测的准确性。

Description

一种枢纽异常客流量产生因素的识别方法
技术领域
本发明涉及交通运输及数据分析领域,尤其是涉及一种枢纽异常客流量产生因素的识别方法。
背景技术
目前,枢纽客流分析的现状呈现以下几个问题:
1.目前为止,还没有一个完善的枢纽客流数据收集系统,实现对枢纽运营效率及客流量及客流分布的数据收集。
2.目前为止,由于缺乏枢纽运营效率、客流量及客流分布的历史数据,我国各大枢纽仍未建立有较为完善的枢纽客流分析方法,分析造成枢纽客流量及客流分布变异的影响因素,预测枢纽客流到达量及到达分布,为综合交通枢纽的客运调度提供数据指导及为设计枢纽特殊运营状态应急处理预案提供支持。
3.枢纽客流预测及影响因素分析多凭借主观经验进行人为判定,未能建立信息化及量化的分析技术。导致我国综合客运枢纽运营效率低下,服务水平低,用户出行满意度不高。
运用统计学的分析方法进行客流统计及异常客流数据的提取不仅可以为大型枢纽管理部门提供分析造成客流异常的依据,提前预知异常客流产生的可能性,做好运预案和应急监控的准备,最大限度的满足旅客出行的需求,提高枢纽的运营效率和服务水平,实现客运和收益的最大化。
多元线性回归模型,在数理统计中,是描述一个因变量变量受到多个自变量的影响的方法。以y作为因变量,以x1,x2…xn为n个自变量,则模型可以写成:
其中β0为常数项,βi(i=1,2,...n)是y对x的回归系数,ε为随机误差项。
聚类分析是一组将研究对象分为相对同质的群组的统计分析技术,聚类分析过程主要包括了数据变换处理、计算聚类统计量、选择聚类方法、根据聚类方法进行数据分析和预测四个步骤。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种枢纽异常客流量产生因素的识别方法,提升客流数据收集的可靠性,加强客流数据分析的有效性,实现客流分析的量化,提升客流预测的准确性。
本发明的目的可以通过以下技术方案来实现:
一种枢纽异常客流量产生因素的识别方法,该方法包括以下步骤:
1)采集历史数据,包括枢纽历史客流数据及相关影响因素信息;
2)根据步骤1)采集的数据构建枢纽客流量估测模型;
3)根据步骤2)的枢纽客流量估测模型提取异常客流量数据;
4)对提取的异常客流量数据进行聚类分析;
5)根据分析结果识别异常客流量产生因素。
所述的步骤1)具体为:
101)设置历史客流量收集颗粒度;
102)采集枢纽历史客流数据,包括枢纽各运输方式的运力、客流量和客流分布比例;
103)采集相关影响因素信息,所述的相关影响因素信息包括天气数据、温度数据、枢纽建设数据和交通数据。
所述的步骤2)具体为:采用多元线性回归方法对步骤1)采集的历史数据进行回归训练,计算回归函数中的回归系数,构建如下回归函数:
其中,y为某种运输方式客流承担比例或客流量,x1,x2...xn为n个自变量,β0为常数项,βi(i=1,2,...n)是y对x的回归系数,ε为随机误差项。
所述的自变量的选取满足F检测95%置信区间的要求。
所述的步骤3)中的提取异常客流量数据具体为:
301)采用步骤2)的枢纽客流量估测模型对历史数据进行重新计算,计算历史数据的估计值与实际数据的残差和相对误差;
302)设定相对误差控制值,提取相对误差超过相对误差控制值的数据,并将提取的数据作为异常客流量数据。
所述的步骤4)中,对异常客流数据进行聚类分析时,聚类过程采用明考夫斯基距离和夹角余弦值作为测量异常客流数据的相似程度,所述的明考夫斯基距离计算公式为:
式中,d(q)为异常客流数据i与异常数据聚类组α的明考夫斯基距离,q为自然数,为控制距离计算程度的指标,p为异常客流数据的相关影响因素数量,Xik为第i个异常客流数据的第k个相关影响因素的取值,Xαk为第α个异常客流数据聚类组的第k个相关影响因素的平均值;
所述的夹角余弦值的计算公式为:
式中CoSθ为第i个异常客流数据和第α个聚类组向量夹角余弦值。
所述的聚类过程具体为:
401)取第i个异常客流数据及其相关影响因素向量;
402)取第α个聚类组及其相关影响因素向量;
403)根据步骤401)和402)计算相应的明考夫斯基距离和夹角余弦值;
404)判断是否满足d(q)≤α⌒CoSθ≤β,α、β分别为明考夫斯基距离、夹角余弦值的临界值,若是,则将该第i个异常客流数据加入第α个聚类组,执行步骤406),若否,则执行步骤405);
405)判断是否满足α=m,m为当前聚类组数,若是,则将第i个异常客流数据加入新建聚类组m+1,并执行步骤406),若否,则α=α+1,返回步骤402);
406)判断是否满足i=n,n为异常客流数据总个数,若是,则结束,若否,则i=i+1,返回步骤401)。
与现有技术相比,本发明通过构建枢纽客流量估测模型,并根据历史数据与预测数据的比较结果,为交通枢纽的等客运部门提供一种客流数据收集及分析的新型方法,提升客流数据收集的可靠性,加强客流数据分析的有效性,实现客流分析的量化,提升客流预测的准确性。
附图说明
图1为本发明的流程示意图;
图2为本发明聚类过程的示意图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。
如图1所示,一种枢纽异常客流量产生因素的识别方法,该方法包括以下步骤:
1)采集历史数据,包括枢纽历史客流数据及相关影响因素信息;
2)根据步骤1)采集的数据构建枢纽客流量估测模型;
3)根据步骤2)的枢纽客流量估测模型提取异常客流量数据;
4)对提取的异常客流量数据进行聚类分析;
5)根据分析结果识别异常客流量产生因素。
步骤1):历史数据采集
a.设置历史客流量收集颗粒度
根据实际大型交通枢纽的数据收集手段和枢纽预测精度要求,选取合适的历史客流量数据颗粒度。数据收集的颗粒度从大到小可为:年,季度,月,周,日,早晚高峰,小时,30分钟和15分钟。优选天、小时、30分钟及15分钟作为历史客流量收集的颗粒度。
b.枢纽历史客流数据和可能相关影响因素信息的收集
历史数据的收集主要对时间数据、客流数据、运力数据、天气数据、温度数据、建设数据、交通数据、其他数据等数据进行收集。具体数据的收集不限于下属数据,不同枢纽可以根据其实际数据收集技术和数据收集需求,选取其中需要的数据类型。具体的数据类型和对应的数据收集内容如表1所示。表1所示仅为本发明的部分优选数据收集内容,并非因此限制本发明的专利范围,凡是利用本发明提出的数据收集方法,或直接或简介运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
表1
c.数据结构设计。
数据结构设计过程中,取各交通方式的客运量、客运承担比率和运力为连续变量,天气数据、温度数据、建设数据、交通数据、其他数据取为哑元变量(0,1变量)。具体的变量格式参见附件表
以天为例具体数据的结构形式可以用如表2所示。
表2
步骤2):构建枢纽客流量估测模型
将枢纽客流数据处理成上述数据格式后,按照OLS作为控制目标采用多元线性回归方法对历史数据进行回归训练,计算回归函数的相关参数,构建回归函数,作为估算客流数据的估测模型。
优选回归方程形式如下:
其中y作为因变量为某种交通方式客流承担比例或客流量,以x1,x2….xn为n个自变量。β0为常数项,βi(i=1,2,...n)是y对x的回归系数,ε为随机误差项。其中自变量的选取需满足F检测95%置信区间的要求,否则去除该自变量。
在此,以轨道交通客流比例作为因变量为例,采用上述多元线性回归方程进行历史数据训练,训练结果表3所示。
表3
步骤3):根据枢纽客流量估测模型提取异常客流量数据;
采用根据历史数据训练的回归模型对历史数据进行重新计算,计算历史数据的估计值和相对误差对相对误差超过10%的数据进行提取。提取的数据即为异常数据。以某枢纽2012年6月的历史数据为事例,对应的计算结果如表4所示。
表4
根据计算结果,对相对误差超过10%的数据进行提取,提取结果如表5。
表5
步骤4):异常客流数据分析
对异常客流数据进行聚类分析,聚类过程采用明考夫斯基距离和夹角余弦作为测量异常客流数据的相似程度。明考夫斯基距离计算公式如下:
夹角余弦值的计算方法如下:
取q为2,明考夫斯基距离、夹角余弦值的临界值α、β分别为α=0.2,β=0.5,未满足此两项条件则单独作为聚类分组。如图2所示,聚类过程具体为:
401)取第i个异常客流数据及其相关影响因素向量;
402)取第α个聚类组及其相关影响因素向量;
403)根据步骤401)和402)计算相应的明考夫斯基距离和夹角余弦值;
404)判断是否满足d(q)≤α⌒CoSθ≤β,若是,则将该第i个异常客流数据加入第α个聚类组,执行步骤406),若否,则执行步骤405);
405)判断是否满足α=m,m为当前聚类组数,若是,则将第i个异常客流数据加入新建聚类组m+1,并执行步骤406),若否,则α=α+1,返回步骤402):
406)判断是否满足i=n,n为异常客流数据总个数,若是,则结束,若否,则i=i+1,返回步骤401)。
取上述3组异常数据计算明考夫斯基距离和夹角余弦值,计算结果可以分成两组聚类,如表6所示。
表6
聚类1组 假期 节前3天 节后3天 周一 周二 周三 周四 周五 周六 周日
6/23 1 0 0 0 0 0 0 0 1 0
6/24 1 0 0 0 0 0 0 0 0 1
聚类2组 假期 节前3天 节后3天 周一 周二 周三 周四 周五 周六 周日
6/26 0 0 1 0 1 0 0 0 0 0
步骤5):异常客流数据成因判定及估测模型适用性判定
对各个聚类组的异常数据对应各的影响因素进行统计分析,如果各组中对应某些向量关系存在率超过80%则认为该影响因素为造成异常客流数据的影响因素之一。
对上述2组聚类数据进行分析,分析结果显示第1组数据中均出现在节假日,且节假日均为周末,存在率为100%,故造成异常客流比例的原因可能是假期客流与周末客流的相互影响所引起的。第2组聚类中由于数据量不足,不对聚类结果进行分析。
根据上述分析结果所示,当节假日出现在周末时,由于周末及节假日客流的相互影响,轨道交通所承担的客流比例会下降,在面对这类特殊情况时,需考虑该因素对实际客流分布的影响。
以上所属仅为本发明的部分优选实施事例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所做的等效结构或等效流程变换,或直接或简介运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (4)

1.一种枢纽异常客流量产生因素的识别方法,其特征在于,该方法包括以下步骤:
1)采集历史数据,包括枢纽历史客流数据及相关影响因素信息,具体为:
101)设置历史客流量收集颗粒度,根据实际大型交通枢纽的数据收集手段和枢纽预测精度要求,选取合适的历史客流量数据颗粒度,数据收集的颗粒度从大到小包括:年,季度,月,周,日,早晚高峰,小时,30分钟和15分钟;
102)采集枢纽历史客流数据,包括枢纽各运输方式的运力、客流量和客流分布比例;
103)采集相关影响因素信息,所述的相关影响因素信息包括天气数据、温度数据、枢纽建设数据和交通数据;
104)数据结构设计,数据结构设计过程中,取各交通方式的客运量、客运承担比率和运力为连续变量,天气数据、温度数据、建设数据、交通数据取为哑元变量;
2)根据步骤1)采集的数据构建枢纽客流量估测模型,具体为:
将枢纽客流数据处理成数据格式后,按照OLS作为控制目标,采用多元线性回归方法对步骤1)采集的历史数据进行回归训练,计算回归函数中的回归系数,构建如下回归函数:
<mrow> <mi>y</mi> <mo>=</mo> <msub> <mi>&amp;beta;</mi> <mn>0</mn> </msub> <mo>+</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <mrow> <msub> <mi>&amp;beta;</mi> <mi>i</mi> </msub> <msub> <mi>x</mi> <mi>i</mi> </msub> </mrow> <mo>+</mo> <mi>&amp;epsiv;</mi> </mrow>
其中,y为某种运输方式客流承担比例或客流量,x1,x2.....xn为n个自变量,β0为常数项,βi(i=1,2,...n)是y对x的回归系数,ε为随机误差项;
3)根据步骤2)的枢纽客流量估测模型提取异常客流量数据;
4)对提取的异常客流量数据进行聚类分析,聚类过程具体为:
401)取第i个异常客流数据及其相关影响因素向量;
402)取第a个聚类组及其相关影响因素向量;
403)根据步骤401)和402)计算相应的明考夫斯基距离和夹角余弦值;
404)判断是否满足dia(q)≤α∩cosθia≤β,α、β分别为明考夫斯基距离、夹角余弦值的临界值,q为自然数,为控制距离计算程度的指标,若是,则将该第i个异常客流数据加入第a个聚类组,执行步骤406),若否,则执行步骤405);
405)判断是否满足a=m,m为当前聚类组数,若是,则将第i个异常客流数据加入新建聚类组m+1,并执行步骤406),若否,则a=a+1,返回步骤402);
406)判断是否满足i=n,n为异常客流数据总个数,若是,则结束,若否,则i=i+1,返回步骤401);
5)根据分析结果识别异常客流量产生因素,对各个聚类组的异常数据对应的各影响因素进行统计分析,如果各组中对应某些向量关系存在率超过80%则认为该影响因素为造成异常客流数据的影响因素之一。
2.根据权利要求1所述的一种枢纽异常客流量产生因素的识别方法,其特征在于,所述的自变量的选取满足F检测95%置信区间的要求。
3.根据权利要求1所述的一种枢纽异常客流量产生因素的识别方法,其特征在于,步骤3)中的提取异常客流量数据具体为:
301)采用步骤2)的枢纽客流量估测模型对历史数据进行重新计算,计算历史数据的估计值与实际数据的残差和相对误差;
302)设定相对误差控制值,提取相对误差超过相对误差控制值的数据,并将提取的数据作为异常客流量数据。
4.根据权利要求1所述的一种枢纽异常客流量产生因素的识别方法,其特征在于,所述的步骤4)中,对异常客流数据进行聚类分析时,聚类过程采用明考夫斯基距离和夹角余弦值作为测量异常客流数据的相似程度,所述的明考夫斯基距离计算公式为:
<mrow> <msub> <mi>d</mi> <mrow> <mi>i</mi> <mi>a</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>q</mi> <mo>)</mo> </mrow> <mo>=</mo> <msup> <mrow> <mo>(</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>p</mi> </munderover> <mo>|</mo> <msub> <mi>X</mi> <mrow> <mi>i</mi> <mi>k</mi> </mrow> </msub> <mo>-</mo> <msub> <mi>X</mi> <mrow> <mi>a</mi> <mi>k</mi> </mrow> </msub> <msup> <mo>|</mo> <mi>q</mi> </msup> <mo>)</mo> </mrow> <mrow> <mn>1</mn> <mo>/</mo> <mi>q</mi> </mrow> </msup> </mrow>
式中,dia(q)为异常客流数据i与异常数据聚类组a的明考夫斯基距离,q为自然数,为控制距离计算程度的指标,p为异常客流数据的相关影响因素数量,Xik为第i个异常客流数据的第k个相关影响因素的取值,Xak为第a个异常客流数据聚类组的第k个相关影响因素的平均值;
所述的夹角余弦值的计算公式为:
<mrow> <msub> <mi>cos&amp;theta;</mi> <mrow> <mi>i</mi> <mi>a</mi> </mrow> </msub> <mo>=</mo> <mfrac> <mrow> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>p</mi> </munderover> <msub> <mi>X</mi> <mrow> <mi>i</mi> <mi>k</mi> </mrow> </msub> <msub> <mi>X</mi> <mrow> <mi>a</mi> <mi>k</mi> </mrow> </msub> </mrow> <msqrt> <mrow> <mo>(</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>p</mi> </munderover> <msubsup> <mi>X</mi> <mrow> <mi>i</mi> <mi>k</mi> </mrow> <mn>2</mn> </msubsup> <mo>)</mo> <mo>(</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>p</mi> </munderover> <msubsup> <mi>X</mi> <mrow> <mi>a</mi> <mi>k</mi> </mrow> <mn>2</mn> </msubsup> <mo>)</mo> </mrow> </msqrt> </mfrac> </mrow>
式中cosθia为第i个异常客流数据和第a个聚类组向量夹角余弦值。
CN201410035508.5A 2014-01-24 2014-01-24 一种枢纽异常客流量产生因素的识别方法 Active CN103793761B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410035508.5A CN103793761B (zh) 2014-01-24 2014-01-24 一种枢纽异常客流量产生因素的识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410035508.5A CN103793761B (zh) 2014-01-24 2014-01-24 一种枢纽异常客流量产生因素的识别方法

Publications (2)

Publication Number Publication Date
CN103793761A CN103793761A (zh) 2014-05-14
CN103793761B true CN103793761B (zh) 2017-11-07

Family

ID=50669400

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410035508.5A Active CN103793761B (zh) 2014-01-24 2014-01-24 一种枢纽异常客流量产生因素的识别方法

Country Status (1)

Country Link
CN (1) CN103793761B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107169555B (zh) * 2017-06-30 2020-11-13 Oppo广东移动通信有限公司 一种闸机提示方法、装置、存储介质和终端
CN112235152B (zh) * 2020-09-04 2022-05-10 北京邮电大学 流量大小估算方法和装置
CN112070324A (zh) * 2020-11-11 2020-12-11 江西鹭鹭行科技有限公司 站点客流量预测方法、装置、可读存储介质及计算机设备
CN113723858A (zh) * 2021-09-10 2021-11-30 首约科技(北京)有限公司 一种依据供需的网约车排队场景的分析方法
CN114548836A (zh) * 2022-04-25 2022-05-27 杭州玳数科技有限公司 一种基于疫情的多因素交通枢纽运营方法和系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101771758B (zh) * 2008-12-31 2012-11-07 北京亿阳信通科技有限公司 一种性能指标值正常波动范围的动态确定方法及其装置
US8581693B2 (en) * 2010-01-22 2013-11-12 Icts Europe Systems Ltd. Passenger flow monitoring method and system
CN102819768B (zh) * 2011-11-07 2015-08-19 金蝶软件(中国)有限公司 客流数据分析的方法及系统
JP5506866B2 (ja) * 2012-06-19 2014-05-28 本田技研工業株式会社 道路交通情報サーバ及び道路交通情報システム
CN103473620B (zh) * 2013-09-26 2016-09-21 青岛海信网络科技股份有限公司 综合客运枢纽多交通方式预测方法及系统

Also Published As

Publication number Publication date
CN103793761A (zh) 2014-05-14

Similar Documents

Publication Publication Date Title
CN103793761B (zh) 一种枢纽异常客流量产生因素的识别方法
CN103632212B (zh) 一种时变用户均衡动态网络演化客流预测系统和方法
WO2021212866A1 (zh) 一种车辆出行量预测模型构建方法及预测方法和系统
CN106875314B (zh) 一种城市轨道交通线网客流od动态估计方法
CN109657844B (zh) 电力短期负荷预测方法和装置
CN104200286B (zh) 一种城市轨道交通时刻表优化技术应用框架
CN104156594B (zh) 一种基于贝叶斯网的航班过站时间动态估计方法
CN102169630A (zh) 一种道路连续交通流数据质量控制方法
CN107978153B (zh) 一种基于空间向量自回归模型的多模式交通需求影响分析方法
CN108805347B (zh) 基于客流池的地铁站外关联区域客流估计方法
CN110348601A (zh) 一种基于双向长短期记忆网络的地铁短期客流量预测方法
CN111932429B (zh) 基于od的轨道交通站点客流结构相似性分析方法及装置
CN103530527A (zh) 基于数值天气预报集合预报结果的风电功率概率预测方法
CN111695722A (zh) 一种城市轨道交通车站节假日短时客流预测方法
CN113159374B (zh) 一种数据驱动的城市交通流速模式识别与实时预测预警方法
CN110889092A (zh) 一种基于轨道交易数据的短时大型活动周边轨道站点客流量预测方法
CN103870890B (zh) 高速公路网交通流量分布的预测方法
CN111739292B (zh) 一种考虑路网od流量贡献时变性的收费站流量预测方法
CN114399099A (zh) 一种城市轨道交通断面客流的预测方法及装置
CN111598333A (zh) 客流数据的预测方法及装置
CN108876064B (zh) 基于客流量的城市轨道交通网络关键车站识别方法
CN108665178A (zh) 一种基于afc的地铁站内楼扶梯客流量预测方法
CN112232535A (zh) 一种基于监督学习的航班离场平均延误预测方法
CN111191817B (zh) 一种基于换乘客流量的公交线网拓扑划分方法
CN117314504B (zh) 一种公共交通客流预测方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant