CN112232607B - 一种地铁客流量预测方法及装置 - Google Patents

一种地铁客流量预测方法及装置 Download PDF

Info

Publication number
CN112232607B
CN112232607B CN202011485564.0A CN202011485564A CN112232607B CN 112232607 B CN112232607 B CN 112232607B CN 202011485564 A CN202011485564 A CN 202011485564A CN 112232607 B CN112232607 B CN 112232607B
Authority
CN
China
Prior art keywords
passenger flow
data
prediction
prediction result
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011485564.0A
Other languages
English (en)
Other versions
CN112232607A (zh
Inventor
王纯斌
吕宗明
蓝科
王琳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Sefon Software Co Ltd
Original Assignee
Chengdu Sefon Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Sefon Software Co Ltd filed Critical Chengdu Sefon Software Co Ltd
Priority to CN202011485564.0A priority Critical patent/CN112232607B/zh
Publication of CN112232607A publication Critical patent/CN112232607A/zh
Application granted granted Critical
Publication of CN112232607B publication Critical patent/CN112232607B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种地铁客流量预测方法及装置,主要解决现有技术中存在的现有客流量预测方法均为单一模型预测,预测精度不高,得出的预测结果不具有说服力的问题。该种地铁客流量预测方法先对对原始客流量数据进行预处理;然后分别将预处理后的数据输入LSTM模型和SVR模型中输出预测结果;然后将两个模型输出的预测结果通过熵值法求权得到最终的预测结果。通过上述方案,本发明达到了提升客流量预测精度,输出更具说服力预测结果的目的。

Description

一种地铁客流量预测方法及装置
技术领域
本发明涉及交通流量预测领域,具体地说,是涉及一种地铁客流量预测方法及装置。
背景技术
随着我国城市化进程的不断加快,城市人口不断增多,以公共交通为导向的城市交通模式使得大城市公共交通主要承担者——地铁及地铁车站成为人员密集场所;客流量过大、人员过度密集不仅易造成车站拥挤,降低乘客出行效率和乘车舒适度,进一步易诱发拥挤踩踏等人身安全事故;因此,对地铁站内客流进行合理控制,对于提高车站大客流应急处置效率、保障车站运营安全具有重要意义。
随着数据挖掘和云计算的发展,数据分析方法变的多种多样,在众多方法中以机器学习为基础的人工智能方法在多个领域都获得了比较好的成果,也成为现阶段研究问题的热点;智慧交通使城市轨道交通的数据得到爆发性的发展,有效的客流量预测可以为地铁交通网提供准确的决策支持,提高地铁交通的服务质量;现有的客流量预测方法均为单一模型预测,预测精度不高,得出的预测结果不具有说服力。
发明内容
本发明的目的在于提供一种地铁客流量预测方法及装置,以解决现有客流量预测方法均为单一模型预测,预测精度不高,得出的预测结果不具有说服力的问题。
为了解决上述问题,本发明提供如下技术方案:
一种地铁客流量预测方法包括以下步骤:
S1、对原始客流量数据进行预处理;
S2、经步骤S1预处理后的数据输入LSTM模型中输出预测结果;
S3、经步骤S1预处理后的数据输入SVR模型中输出最终的预测结果;
S4、将步骤S2和S3输出的预测结果通过熵值法求权得到预测结果。
本发明对其中三类日均客流量(大,中,小)的站点客流量进行预测分析,算法包括数据预处理、数据集检验、模型训练、熵值法求权四大过程;采用LSTM+SVR组合模型,利用熵值法分别对LSTM和SVR模型的预测结果进行指标归一化,将两种或多种预测模型进行组合,通过各模型之间的优势互补,来降低单个模型在特定问题中的弊端,且预测效果良好,收敛速度不受影响,客流量预测精度提升,且时间复杂度并没有因此上升。
进一步的,步骤S1的具体过程为:采集各个站点的客流量数据,过滤出客流量数据中的异常数据后,对各站点的客流量进行大小排序;数据预处理过程包括异常值筛除,站点客流量大、中、小统计,筛选代表站点,尽可能的让意义更大的数据投入到模型训练中。
进一步的,步骤S1中对数据进行预处理后对数据进行检验,检测检验结果是否大于设定阈值,是则进行步骤S2,否则再次对数据进行预处理;数据检验的具体过程为:将预处理后各站点的客流量样本数据,各站点分别取n个样本数据由大到小排序,输入下式中判断这n个数据是否符合正态分布;
Figure 977572DEST_PATH_IMAGE001
其中
Figure 649862DEST_PATH_IMAGE002
表示样本观测均值,通过均值法求得为已知,
Figure 616681DEST_PATH_IMAGE003
表示整数部分,
Figure 981803DEST_PATH_IMAGE004
的值由 统计指标
Figure 401283DEST_PATH_IMAGE004
的界值表查出,即可得出检验标准,若
Figure 698589DEST_PATH_IMAGE007
,则认为样本数据所来自 的总体不服从正态分布,反之则服从正态分布;数据集检验包括代表站点数据集抽样分布 及W假设检验,以达到验证数据集可行性的目的。
进一步的,步骤S2的详细过程如下:
S201、经步骤S1处理后的数据,分成训练集和测试集;
S202、将步骤S201的训练集输入LSTM模型中训练模型;
S203、将步骤S201的测试集输入步骤S202训练后的LSTM模型中,计算神经元输出值,计算输出值与实际值的偏差,检测两者误差是否小于预期值,是则输出预测结果,否则执行步骤S204;
S204、更新权值重复执行步骤S203。
LSTM(long short-term memory)是长短时记忆网络,适用于处理和预测时间序列中间隔和延迟非常长的事件。
进一步的,步骤S3的具体过程如下:
S301、经步骤S1处理后的数据,分成训练集和测试集;
S302、将步骤S301的训练集输入SVR模型中训练模型;
S303、将步骤S301的测试集输入步骤S302训练后的SVR模型中,输出预测结果,检测预测结果是否小于预期值,是则输出预测结果,否则执行步骤S304;
S304、重新执行步骤S303。
SVR(support vector machine)是支持向量机在回归预测领域的一种应用,能较好地解决小样本、非线性、高维数和局部极小点等实际问题。
进一步的,步骤S4的具体过程如下:
S401、分别将步骤S203和S303S输出的预测结果进行指标归一化得到
Figure 234613DEST_PATH_IMAGE008
S402、根据步骤S401指标归一化后的预测结果,计算其概率分布
Figure 141389DEST_PATH_IMAGE009
;i,j为矩阵索引值,
Figure 155481DEST_PATH_IMAGE008
分别表示第i个时刻 的第j个模型的预测结果;
S403、根据步骤S402得到的概率分布计算熵值
Figure 96892DEST_PATH_IMAGE010
,然后根 据熵值计算熵值冗余度
Figure 803817DEST_PATH_IMAGE011
S404、根据步骤S403的熵值冗余度,计算各项指标权重
Figure 197889DEST_PATH_IMAGE012
S405、根据步骤S404的指标权重计算最终预测结果
Figure 15673DEST_PATH_IMAGE013
;wij为对应坐标的指标权重,
Figure 546011DEST_PATH_IMAGE014
Figure 423837DEST_PATH_IMAGE015
分别表示来自SVR模型的预测结果,以及来自LSTM模型的预测结果。
LSTM、SVR两者都比较适合本文的数据集训练和预测,但又各有优势之处,故采用LSTM+SVR组合模型。
进一步的,步骤S401中指标归一化的方法如下:
Figure 305206DEST_PATH_IMAGE016
Figure 926680DEST_PATH_IMAGE008
为第 i 个时刻预测结果的第 j 个模型方法指标的数值(i=1,2…,n;j=1, 2,…,m);xij为未归一化的原始预测结果。
一种地铁客流量预测装置包括存储器:用于存储可执行指令;处理器:用于执行所述存储器中存储的可执行指令,实现一种地铁客流量预测方法。
与现有技术相比,本发明具有以下有益效果:
(1)本发明针对单一模型预测精确度不高的问题,提出了LSTM+SVR组合模型,有助于客流量预测精度的提升,且时间复杂度并没有因此而上升。
(2)本发明采用熵值法权重组合计算,使得模型更准确且高效收敛,以及有效权衡并结合不同方法模型的能力,最终得出更具说服力的预测结果。
(3)本发明采用LSTM+SVR组合模型,利用熵值法分别对LSTM和SVR模型的预测结果进行指标归一化,将两种或多种预测模型进行组合,通过各模型之间的优势互补,来降低单个模型在特定问题中的弊端,且预测效果良好,收敛速度不受影响。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,其中:
图1为本发明的预测流程图。
图2为LSTM结构图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合图1和图2对本发明作进一步地详细描述,所描述的实施例不应视为对本发明的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
对本发明实施例进行进一步详细说明之前,对本发明实施例中涉及的名词和术语进行说明,本发明实施例中涉及的名词和术语适用于如下的解释。
如图1所示,一种地铁客流量预测方法包括以下步骤:
S1数据预处理:
S1.1原始数据异常值筛除:
选取原始数据中存在明显异常的数值,例如负值,零等情况,避免原始数据的异常影响,使预测模型更具备鲁棒性。
S1.2站点客流量分类统计:
对地铁各站点的客流量进行大、中、小分类,分析出各地铁线路客流量承载情况,以及各站点的客流量大小排序情况。进而根据数据情况,结合地铁实际承载空间,闭线及开线情况,筛选出大、中、小类中的代表站点,并应用到模型训练中。
S2数据集检验:
S2.1代表站点数据抽样:
对代表站点的客流量数据进行抽样,并用以后续验证是否符合正态分布,以确定数据合理性及可用性。
S2.2对抽样数据进行W假设检验:
验证抽样数据是否符合正态分布,将n个样本数据由大到小排序,计算W正态性检验统计指标,最后与检验标准比较,推断出检验结果。
正态性检验统计指标如下:
Figure 577104DEST_PATH_IMAGE001
(1)
其中
Figure 360252DEST_PATH_IMAGE002
表示样本观测均值,
Figure 728917DEST_PATH_IMAGE003
表示整数部分,
Figure 888503DEST_PATH_IMAGE004
的值由统计指标
Figure 659012DEST_PATH_IMAGE004
的界值表 查出,即可得出检验标准,若
Figure 469023DEST_PATH_IMAGE007
,则认为样本数据所来自的总体不服从正态分 布,反则服从正态分布。
S3模型训练:
S3.1 LSTM模型训练:
LSTM 的循环结构由3个控制门组成,由遗忘门
Figure 432299DEST_PATH_IMAGE018
( forget gate )、输入门
Figure 791737DEST_PATH_IMAGE019
( external input gate)和输出门
Figure 182267DEST_PATH_IMAGE020
( output gate )组成,它的结构如图2所示。
LSTM模型对输入信息
Figure 259944DEST_PATH_IMAGE021
的计算下式所示,其中
Figure 26912DEST_PATH_IMAGE022
分别表示遗忘门、输入门、输 出门函数中t时刻输入数据
Figure 506435DEST_PATH_IMAGE023
的权值矩阵和t-1时刻隐藏层的输出数据
Figure 67866DEST_PATH_IMAGE024
的权值矩阵 以及偏置项,
Figure 632840DEST_PATH_IMAGE025
表示Hadamard积,tanh表示双曲正切函数,
Figure 937919DEST_PATH_IMAGE026
表示激活函数。
(1)t时刻的遗忘门
Figure 271948DEST_PATH_IMAGE027
、输出门
Figure 4281DEST_PATH_IMAGE028
、输入门
Figure 56551DEST_PATH_IMAGE029
的输出分别如式 (2)所示:
Figure 899742DEST_PATH_IMAGE030
(2)
(2)t时刻的更新的记忆信息
Figure 353857DEST_PATH_IMAGE031
公式如式(3)所示:
Figure 257091DEST_PATH_IMAGE032
(3)
(3)t时刻的更新的记忆状态
Figure 796656DEST_PATH_IMAGE033
的输出公式如式(4)所示:
Figure 443538DEST_PATH_IMAGE034
(4)
(4)t时刻的隐藏层
Figure 752160DEST_PATH_IMAGE035
的输出公式如式(5)所示:
Figure 826295DEST_PATH_IMAGE036
(5)
S3.2 SVR模型训练:
支持向量机回归(SVR)是建立在 SVM 基础上的回归算法,是从解决分类问题的SVM分类方法发展而来的,把变量选择和建立回归模型相结合,以期得到最佳分析效果。其目标是寻求回归函数如式(6)所示:
Figure 587578DEST_PATH_IMAGE037
(6)
对于样本集
Figure 38151DEST_PATH_IMAGE038
Figure 201279DEST_PATH_IMAGE039
为输入变量的值,
Figure 446315DEST_PATH_IMAGE040
为输出变量的值,回归问 题就是寻找一个从输入空间到输出空间的映射
Figure 960473DEST_PATH_IMAGE041
,使得
Figure 949158DEST_PATH_IMAGE042
。对于线性问题,回 归函数为:
Figure 966793DEST_PATH_IMAGE043
(7)
对于非线性问题,可以通过非线性变换转化为某个高维特征空间的线性问题,并 在高维空间中进行线性求解。在高维特征空间中,线性问题中的内积运算可用核
Figure 648310DEST_PATH_IMAGE044
来代替,回归函数为为:
Figure 384184DEST_PATH_IMAGE045
(8)
根据SVR函数性质,只有少数
Figure 48701DEST_PATH_IMAGE047
不为 0,这些参数对应的向量称为支持向 量机,回归函数
Figure 901119DEST_PATH_IMAGE048
完全由其决定。常用的 SVR 算法包括ε‒SVR 和ν‒SVR 两种类型,与 ε‒SVR 相比ν‒SVR的优点是引入的参数ν能够控制支持向量的个数和训练误差,并能够自动 调节不敏感损失函数的参数ε。
S4熵值法求权:
熵值法是指用来判断某个指标的离散程度的数学方法。离散程度越大,该指标对综合评价的影响越大,可以用熵值判断某个指标的离散程度。在本发明中,利用熵值法求得LSTM和SVR预测结果的权值,进行组合得到最终预测结果;具体步骤如下:
指标归一化:
异质指标同质化,由于各项指标的计量单位并不统一,因此在用它们计算综合指标前,先要对它们进行标准化处理,即把指标的绝对值转化为相对值,并令 xij=|xij|,从而解决各项不同质指标值的同质化问题。而且,由于正向指标和负向指标数值代表的含义不同(正向指标数值越高越好,负向指标数值越低越好),因此,对于高低指标我们用不同的算法进行数据标准化处理。其具体方法如下:
Figure 124290DEST_PATH_IMAGE016
(9)
Figure 454777DEST_PATH_IMAGE008
为第 i 个时刻预测结果的第 j 个模型方法指标的数值(i=1,2…,n;j=1, 2,…,m)。
2)计算概率分布:
计算第j项指标下第i个时刻预测值占该指标的比重
Figure 447004DEST_PATH_IMAGE009
(10)
3)计算熵值:
计算第j项指标的熵值
Figure 876849DEST_PATH_IMAGE010
(11)
4)计算熵值冗余度:
计算信息熵冗余度
Figure 446370DEST_PATH_IMAGE011
(12)
计算各项指标权重:
Figure 455914DEST_PATH_IMAGE012
(13)
6)得出最终预测结果:
计算各个时刻预测值的综合结果值
Figure 692861DEST_PATH_IMAGE049
(14)
本发明首先分别采用LSTM,SVR模型对代表站点地铁客流量进行预测分析,接着对这预测结果进行熵值法权重组合计算,得出最后的预测结果。这种组合模型能更准确且高效的收敛,使各个模型发挥自己的优势,从而得出更有说服力的预测结果;本发明能应用于地铁运输领域,尤其是对短期客流量的预测及地铁运管方案决策尤为重要,本发明提出的组合模型方法不仅可以在地铁客流量方面进行预测,还可以应用在多个方面的数据分析预测。
本发明可为轨道交通网络系统高效有序运营提供重要的保障;成网条件下,不同线路直接或间接地通过车站相互联系,不同线路的列车运行计划相互影响、限制。因此,必须准确把握网络系统中每条线路的客流量,才能对每条线路进行协调安排,进而更有效地完成乘客运输要求,减少乘客乘坐时间,提高轨道交通网络服务水平。同时,本发明可为实现社会效益最大化提供可能。短期客流预测的主要目的是满足运输市场需要,并对客流短期波动做出快速响应,有效组织运输力量。针对短期客流序列的特征趋势及影响因素,构建适合我国城市轨道交通短期客流预测的模型方法,科学有效地获得轨道交通系统中各线路客流量,对满足居民的出行需求、降低企业运营成本等具有重要的意义,从而实现经济效益和社会效益最大化。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (7)

1.一种地铁客流量预测方法,其特征在于,包括以下步骤:
S1、对原始客流量数据进行预处理;
S2、经步骤S1预处理后的数据输入LSTM模型中输出预测结果;
S3、经步骤S1预处理后的数据输入SVR模型中输出预测结果;
S4、将步骤S2和S3输出的预测结果通过熵值法求权得到最终的预测结果;
步骤S4的具体过程如下:
S401、分别将步骤S2和S3输出的预测结果进行指标归一化得到x′ij
S402、根据步骤S401指标归一化后的预测结果,计算其概率分布
Figure FDA0002911845380000011
i,j为矩阵索引值,x′ij分别表示第i个时刻的第j个模型的预测结果;
S403、根据步骤S402得到的概率分布计算熵值
Figure FDA0002911845380000012
然后根据熵值计算熵值冗余度hj=1-sj
S404、根据步骤S403的熵值冗余度,计算各项指标权重
Figure FDA0002911845380000013
S405、根据步骤S404的指标权重计算最终预测结果
Figure FDA0002911845380000014
wij为对应坐标的指标权重,
Figure FDA0002911845380000015
Figure FDA0002911845380000016
分别表示来自SVR模型的预测结果,以及来自LSTM模型的预测结果。
2.根据权利要求1所述的一种地铁客流量预测方法,其特征在于,步骤S1的具体过程为:采集各个站点的客流量数据,过滤出客流量数据中的异常数据后,对各站点的客流量进行大小排序。
3.根据权利要求2所述的一种地铁客流量预测方法,其特征在于,步骤S1中对数据进行预处理后进行数据检验,检测检验结果w是否大于检验标准wα,若w<wα则认为样本数据所来自的总体不服从正态分布,再次对数据进行预处理;若w>wα则认为样本数据所来自的总体服从正态分布,进行步骤S2和S3;数据检验的具体过程为:将预处理后各站点的客流量样本数据,各站点分别取n个样本数据由大到小排序,输入下式中判断这n个数据是否符合正态分布;
Figure FDA0002911845380000021
其中
Figure FDA0002911845380000022
表示样本观测均值,
Figure FDA0002911845380000023
表示整数部分,ai(w)的值由统计指标ai(w)的界值表查出,即可得出检验标准wα,若w<wα,则认为样本数据所来自的总体不服从正态分布,反之则服从正态分布。
4.根据权利要求1所述的一种地铁客流量预测方法,其特征在于,步骤S2的详细过程如下:
S201、经步骤S1处理后的数据,分成训练集和测试集;
S202、将步骤S201的训练集输入LSTM模型中训练模型;
S203、将步骤S201的测试集输入步骤S202训练后的LSTM模型中,计算神经元输出值,计算输出值与实际值的偏差,检测两者误差是否小于预期值,是则输出预测结果,否则执行步骤S204;
S204、更新权值重复执行步骤S203。
5.根据权利要求4所述的一种地铁客流量预测方法,其特征在于,步骤S3的具体过程如下:
S301、经步骤S1处理后的数据,分成训练集和测试集;
S302、将步骤S301的训练集输入SVR模型中训练模型;
S303、将步骤S301的测试集输入步骤S302训练后的SVR模型中,输出预测结果,检测预测结果是否小于预期值,是则输出预测结果,否则执行步骤S304;
S304、重新执行步骤S303。
6.根据权利要求1所述的一种地铁客流量预测方法,其特征在于,步骤S401中指标归一化的方法如下:
Figure FDA0002911845380000031
x′ij为第i个时刻预测结果的第j个模型方法指标的数值(i=1,2…,n;j=1,2,…,m);xij为未归一化的原始预测结果。
7.一种地铁客流量预测装置,其特征在于,包括
存储器:用于存储可执行指令;
处理器:用于执行所述存储器中存储的可执行指令,实现如权利要求1-6任一项所述的一种地铁客流量预测方法。
CN202011485564.0A 2020-12-16 2020-12-16 一种地铁客流量预测方法及装置 Active CN112232607B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011485564.0A CN112232607B (zh) 2020-12-16 2020-12-16 一种地铁客流量预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011485564.0A CN112232607B (zh) 2020-12-16 2020-12-16 一种地铁客流量预测方法及装置

Publications (2)

Publication Number Publication Date
CN112232607A CN112232607A (zh) 2021-01-15
CN112232607B true CN112232607B (zh) 2021-03-09

Family

ID=74124187

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011485564.0A Active CN112232607B (zh) 2020-12-16 2020-12-16 一种地铁客流量预测方法及装置

Country Status (1)

Country Link
CN (1) CN112232607B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115792333B (zh) * 2022-11-16 2023-09-22 国网湖北省电力有限公司营销服务中心(计量中心) 一种充电设备充电电流检测方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108197739A (zh) * 2017-12-29 2018-06-22 中车工业研究院有限公司 一种城市轨道交通乘客流量预测方法
CN111597971A (zh) * 2020-05-14 2020-08-28 北京交通大学 一种城市轨道交通短期进站客流量预测方法
CN111985706A (zh) * 2020-08-15 2020-11-24 西北工业大学 一种基于特征选择和lstm的景区日客流量预测方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107590569A (zh) * 2017-09-25 2018-01-16 山东浪潮云服务信息科技有限公司 一种数据预测方法及装置
CN109034449A (zh) * 2018-06-14 2018-12-18 华南理工大学 基于深度学习和乘客行为模式的短期公交客流预测方法
CN110991734A (zh) * 2019-11-29 2020-04-10 西安理工大学 一种基于多目标优化和svr的地铁客流预测方法
CN111860951B (zh) * 2020-06-12 2023-09-26 北京工业大学 一种基于动态超图卷积网络的轨道交通客流预测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108197739A (zh) * 2017-12-29 2018-06-22 中车工业研究院有限公司 一种城市轨道交通乘客流量预测方法
CN111597971A (zh) * 2020-05-14 2020-08-28 北京交通大学 一种城市轨道交通短期进站客流量预测方法
CN111985706A (zh) * 2020-08-15 2020-11-24 西北工业大学 一种基于特征选择和lstm的景区日客流量预测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
"Short-Term Abnormal Passenger Flow Prediction Based on the Fusion of SVR and LSTM";Jianyuan Guo etc.;《IEEE Access ( Volume: 7)》;20190327;42946-42955 *
T-LSTM: A Long Short-Term Memory Neural;Luntian Mou etc.;《IEEE Access ( Volume: 7)》;20190722;全文 *
基于PCA-LSTM模型的城市轨道交通短时客流预测;石敏莲 等;《智能计算机与应用》;20200301;全文 *

Also Published As

Publication number Publication date
CN112232607A (zh) 2021-01-15

Similar Documents

Publication Publication Date Title
CN107633265B (zh) 用于优化信用评估模型的数据处理方法及装置
Wahono et al. Metaheuristic optimization based feature selection for software defect prediction.
CN110796859A (zh) 基于交通流的实时交通状态辨识及事故风险预警方法
CN111832225A (zh) 一种构建汽车行驶工况的方法
Zhang et al. Traffic Accident Prediction Based on LSTM‐GBRT Model
Jia et al. Anomaly detection using supervised learning and multiple statistical methods
CN104298881A (zh) 一种基于贝叶斯网络模型的公交环境动态变化预报方法
JP6783002B2 (ja) 企業の債務不履行予測システム及びその動作方法
CN104636449A (zh) 基于lsa-gcc的分布式大数据系统风险识别方法
CN111126868B (zh) 一种道路交通事故发生风险确定方法及系统
CN112232607B (zh) 一种地铁客流量预测方法及装置
CN113704389A (zh) 一种数据评估方法、装置、计算机设备及存储介质
CN115112372A (zh) 轴承故障诊断方法、装置、电子设备及存储介质
Gopalakrishnan et al. IIoT Framework Based ML Model to Improve Automobile Industry Product.
Zhang et al. Long‐term bridge performance assessment using clustering and Bayesian linear regression for vehicle load and strain mapping model
CN111341096B (zh) 一种基于gps数据的公交运行状态评估方法
Rodríguez-Rueda et al. Origin–Destination matrix estimation and prediction from socioeconomic variables using automatic feature selection procedure-based machine learning model
CN109447306B (zh) 基于最大似然回归树的地铁事故延误时间预测方法
CN116380438A (zh) 一种故障诊断方法、装置、电子设备及存储介质
CN110610016A (zh) 一种基于大数据机器学习进行轨道交通停准问题预测方法
CN111654853B (zh) 一种基于用户信息的数据分析方法
CN114880954A (zh) 一种基于机器学习的滑坡敏感性的评估方法
CN114492967A (zh) 基于ceemdan和blstm组合模型的城轨车站客流预测方法和介质
CN114331019A (zh) 一种基于致险因素的城市交通安全风险实时评估方法及装置
Zhao et al. Software Defect Prediction Method Based on Cost-Sensitive Random Forest

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant