CN110782060A - 基于大数据技术的轨道交通断面客流短时预测方法及系统 - Google Patents
基于大数据技术的轨道交通断面客流短时预测方法及系统 Download PDFInfo
- Publication number
- CN110782060A CN110782060A CN201810858596.7A CN201810858596A CN110782060A CN 110782060 A CN110782060 A CN 110782060A CN 201810858596 A CN201810858596 A CN 201810858596A CN 110782060 A CN110782060 A CN 110782060A
- Authority
- CN
- China
- Prior art keywords
- passenger flow
- data
- time
- real
- historical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000005516 engineering process Methods 0.000 title claims abstract description 49
- 238000012545 processing Methods 0.000 claims abstract description 30
- 238000003860 storage Methods 0.000 claims abstract description 7
- 238000013500 data storage Methods 0.000 claims description 30
- 238000004590 computer program Methods 0.000 claims description 6
- 238000013075 data extraction Methods 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 abstract description 15
- 238000004422 calculation algorithm Methods 0.000 description 21
- 238000010801 machine learning Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 230000007246 mechanism Effects 0.000 description 5
- 238000012549 training Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000002354 daily effect Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Tourism & Hospitality (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Train Traffic Observation, Control, And Security (AREA)
Abstract
本发明提供了一种基于大数据技术的轨道交通断面客流短时预测方法及系统、计算机可读存储介质,包括:历史数据处理步骤:存储及查询历史客流数据;实时数据处理步骤:获取乘客进出站数据,转换为实时客流数据,储存实时客流数据;客流预测及展示步骤:根据所述历史客流数据及实时客流数据进行客流预测,得到并展示客流预测结果。本发明兼顾了断面客流预测的实时性与准确性,能够应用于城市轨道今天断面客流的短时预测与实时计算场景。
Description
技术领域
本发明涉及交通技术领域,具体地,涉及基于大数据技术的轨道交通断面客流短时预测方法及系统。尤其是,涉及一种基于大数据技术的轨道交通断面客流短时预测方法。
背景技术
断面客流数据在城市轨道交通系统服务评价体系占据重要作用,其中实时断面客流因其时效性特点,主要应用在两个方面:一是断面客流的实时计算,用于信息发布,实现乘客引导等作用,是实现动态交通管理的基础条件;二是断面客流的短时预测,用于表征未来的客流状态,主要用于客流预警、应急疏散等方面。这两种应用场景各有不同主流方法,但互相之间也用应用场景交叉的情况。实时计算方面,目前主流的是基于机理模型的计算方法,需要获取当前时段完整的客流OD信息,即乘客的进站与出站时间与相应的数量信息,再向各断面进行客流分配获取断面客流数据。由于OD数据的统计具有一定的滞后性,目前的实时客流计算方法虽然具备可用的准确度,但时效性不足,用于短时客流预测时,预测结果的可用性则进一步受到了时效性的限制。短时断面客流预测方面,常见的是基于各种时间序列预测算法的系统,通过对历史数据库中的断面客流进行分析,总结其在时间上的分布规律并用于对未来的预测;由于短时断面客流受到多方面因素的影响,单一维度的时间序列预测很难获取到较高的准确度,更不可能用于替代实时计算的结果;同时,基于历史客流数据的预测系统,算法的计算效率也受到了数据库系统的制约,面对海量的客流数据,传统的数据库系统查询效率也不能够满足实时预测的需求。
目前有一些使用数据仓库系统与神经网络算法结合进行轨道交通短时客流预测的方法,模型经过修改后可以用于断面客流的预测,但由于传统储存技术的本身的局限,预测模型在计算效率和后续应用潜力方面有所不足。
例如,专利文献CN106485359A(申请号:201610893608.0)公开了一种基于列车运行时刻表的城市轨道交通断面客流推测方法,首先从轨道交通历史数据库选择足够样本量的历史出站交易数据进行数据清洗,然后考虑换乘客流情况从经过清洗的数据中提取线网中涉及目标线路的交易数据,接着采用历史目标线路数据建立基于列车运行时刻表的历史客流单向OD(起讫点)矩阵,从原始数据中筛选出预测时段之前的交易日当天实时数据,参照历史客流单向OD矩阵的统计步骤获得实时客流单向OD矩阵,再结合站点进站客流数据,构建基于BP神经网络的断面客流预测模型,并对模型进行检验和调整。
专利文献CN107688873A(申请号:201710757135.6)公开了一种基于大数据分析的地铁客流预测方法,应用于轨道交通的客流预测,包括如下步骤:从客流数据库中提取客流数据,并将其导入大数据存储系统;从上述的大数据存储系统中读取每天分时客流数据和/或每天累计的客流数据;根据上述的每天分时客流数据和/或每天累计的客流数据利用RNN模型进行客流预测建模,并进行优化,得到客流预测数据;根据上述的每天分时客流数据和/或每天累计的客流数据与客流预测数据,持续优化预测模型参数,提高下一次预测的准确度。该专利文献应用大数据技术,所进行的客流预测主要是基于历史数据,并未突出其实时性。
专利文献CN107291668A(申请号:201710573357.2)公开了一种基于机器学习的地铁短时客流预测方法,通过基于地铁拍卡数据,假设所有乘客均按照最短路径出行,统计所有区间,所有站点在单位时间窗内的流量。以单位时间窗内的地铁站点客流为节点,以单位时间窗内的地铁区间客流为边的权重,建立地铁客流网络。针对单一目标区间,挑选出对其影响最重要的特征纳入后续的回归预测模型。该专利文献采用递归特征消除算法完成特征选择,挑选出目标区间在目标时间窗内的重要特征。采用梯度提升回归树方法建立回归预测模型,实现地铁短时客流预测。该专利文献虽然定位为一种实时客流预测系统,却并没有介绍预测算法所使用数据存储处理系统的实时性能。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种基于大数据技术的轨道交通断面客流短时预测方法及系统、计算机可读存储介质。
根据本发明提供的一种基于大数据技术的轨道交通断面客流短时预测方法,其特征在于,包括:
历史数据处理步骤:存储及查询历史客流数据;
实时数据处理步骤:获取乘客进出站数据,转换为实时客流数据,储存实时客流数据;
客流预测及展示步骤:根据所述历史客流数据及实时客流数据进行客流预测,得到并展示客流预测结果。
优选地,所述历史数据处理步骤包括:
从数据库系统中抽取历史客流数据;
将历史客流数据存储至基于Hadoop架构的大数据存储平台中;
从所述大数据存储平台通过搜索引擎检索历史客流数据。
优选地,历史客流数据包括:历史断面客流数据、历史进站客流数据;
历史断面客流数据为全网全日各断面不同时间间隔的历史客流量数据;
历史进站客流数据为全网全日各车站不同时间间隔的历史进站客流数据;
所述历史断面客流数据包括:断面信息、客流量信息及时间信息;
所述历史进站客流数据包括:进站车站信息、客流量信息及时间信息
优选地,所述实时数据处理步骤包括:
通过Kafka分布式消息订阅系统接收自动售检票系统采集的实时客流数据,所述实时客流数据为自动售检票系统发送的全网实时乘客进站信息,包括:进站车站信息、时间信息,所述实时客流数据的延迟不超过预设时长;
通过基于spark技术的流处理程序统计实时客流数据;
实时客流数据被统计后,以一预设时间间隔的分车站进站客流数据的形式,存储至Hadoop架构的实时客流数据库系统,记为:存档的实时进站客流数据。所述存档的实时进站客流数据包括:进站车站信息、客流量信息及时间信息。
优选地,客流预测及展示步骤包括:
根据从所述大数据存储平台通过搜索引擎检索的历史客流数据,以历史进站客流数据为输入,以相应的历史断面客流数据为输出,建立客流预测模型;
根据所述客流预测模型,输入存档的实时进站客流数据,预测客流并输出相应的断面客流预测结果;
通过浏览器展示断面客流预测结果。
根据本发明提供的一种基于大数据技术的轨道交通断面客流短时预测系统,包括:
历史数据处理模块:存储及查询历史客流数据;
实时数据处理模块:获取乘客进出站数据,转换为实时客流数据,储存实时客流数据;
客流预测及展示模块:根据所述历史客流数据及实时客流数据进行客流预测,得到并展示客流预测结果。
优选地,历史数据处理模块包括:
历史数据抽取模块:从数据库系统中抽取历史客流数据;
历史数据储存模块:将历史客流数据存储至基于Hadoop架构的大数据存储平台中;
历史数据检索模块:从所述大数据存储平台通过搜索引擎检索历史客流数据;
历史客流数据包括:历史断面客流数据、历史进站客流数据;
历史断面客流数据为全网全日各断面不同时间间隔的历史客流量数据;
历史进站客流数据为全网全日各车站不同时间间隔的历史进站客流数据;
所述历史断面客流数据包括:断面信息、客流量信息及时间信息;
所述历史进站客流数据包括:进站车站信息、客流量信息及时间信息。
优选地,实时数据处理模块包括:
实时数据采集模块:通过Kafka分布式消息订阅系统接收自动售检票系统采集的实时客流数据,所述实时客流数据为自动售检票系统发送的全网实时乘客进站信息,包括:进站车站信息、时间信息,所述实时客流数据的延迟不超过预设时长;
实时数据统计模块:通过基于spark技术的流处理程序统计实时客流数据;
实时数据存储模块:实时客流数据被统计后,以一预设时间间隔的分车站进站客流数据的形式,存储至Hadoop架构的实时客流数据库系统,记为:存档的实时进站客流数据。所述存档的实时进站客流数据包括:进站车站信息、客流量信息及时间信息。
优选地,客流预测及展示模块包括:
预测模型构建模块:根据从所述大数据存储平台通过搜索引擎检索的历史客流数据,以历史进站客流数据为输入,以相应的历史断面客流数据为输出,建立客流预测模型;
客流预测模块:根据所述客流预测模型,输入存档的实时进站客流数据,预测客流并输出相应的断面客流预测结果;
结果展示模块:通过浏览器展示断面客流预测结果。
根据本发明提供的一种存储有计算机程序的计算机可读存储介质,所述计算机程序被处理器执行时实现上述任一项所述的基于大数据技术的轨道交通断面客流短时预测方法的步骤。
与现有技术相比,本发明具有如下的有益效果:
本发明提出了一种基于机器学习算法与大数据技术的城市轨道交通断面客流短时预测方法。算法层面,该方法参考基于机理模型的实时计算方法,以准确度较高的多维清分数据为样本作为训练样本,包括进站客流数据与断面客流数据,应用机器学习算法进行预测,相比时间序列预测算法,大幅提高了预测结果的准确性;同时相比基于机理模型的计算方法,仅需要OD出行链中的部分数据,就可以计算出断面客流结果,避免了因为获取出行链而造成的计算结果延迟。数据库系统层面,采用了Hadoop架构的大数据存储系统和相应的数据处理技术,应用大数据技术架构的存储平台取代传统的数据仓库系统,以适应机器学习算法高频读写的特点,从而进一步提高了预测算法的计算速度,提高了算法效率,保证了结果的时效性。
本发明采用数据驱动的机器学习预测算法,实现了不依赖于机理模型的预测计算,保证了预测结果的可靠性与失效性。围绕该预测算法,使用基于Hadoop架构的大数据技术,搭建了数据处理系统,实现了通过实时获取的城市轨道交通全网AFC进站数据,预测各个断面客流量的功能,提升了客流预测系统的运行效率。同时使用前端展示工具,将预测结果通过web端进行发布,用户使用浏览器即可访问获取预测信息。
本发明还能够实时准确的根据实时客流数据预测城市轨道交通断面客流量,兼顾预测结果的实时性与准确性。可以用与城市轨道交通断面客流的短时预测,取代时间序列分析方法,结果能够进行客流预警、应急疏散等方面。也可以用于断面客流的实时计算,使用高精度的预测取代实时计算结果,提高数据的时效性,从而用于信息发布、客流引导等场景。本发明采用机器学习算法,使得模型具备了自学习能力,能够在运行过程中对预测模型进行调整,提高其准确度。大数据技术的应用,则更好的满足了机器学习算法的读写需求,增加了算法的效率。此外,由于大数据平台拥有了大量开源技术,相比基于数据仓库平台的预测方法,可以减少相关产品的采购费用,对于成本降低有着显著的效果,前景非常广阔。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为根据本发明的基于大数据技术的轨道交通断面客流短时预测方法的流程示意图。
图2为根据本发明的基于大数据技术的轨道交通断面客流短时预测方法的步骤S101流程示意图。
图3为根据本发明的基于大数据技术的轨道交通断面客流短时预测方法的步骤S102流程示意图。
图4为根据本发明的基于大数据技术的轨道交通断面客流短时预测方法的步骤S103流程示意图。
图5为根据本发明的优选例中的基于大数据技术的轨道交通断面客流短时预测方法的流程示意图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
如图1所示,根据本发明提供的一种基于大数据技术的轨道交通断面客流短时预测方法,包括:
步骤S101:存储及查询历史客流数据;
步骤S102:获取乘客进出站数据,转换为实时客流数据,储存实时客流数据;
步骤S103:根据所述历史客流数据及实时客流数据进行客流预测,得到并展示客流预测结果。
具体地,如图2所示,步骤S101包括:
步骤S201:从数据库系统中抽取历史客流数据;进一步地,应用数据抽取方法,从其他数据库系统中抽取历史客流数据。
步骤S202:将历史客流数据存储至基于Hadoop架构的大数据存储平台中;
步骤S203:从所述大数据存储平台通过搜索引擎检索历史客流数据。
具体地,历史客流数据包括:历史断面客流数据、历史进站客流数据;
历史断面客流数据为全网全日各断面不同时间间隔的历史客流量数据;
历史进站客流数据为全网全日各车站不同时间间隔的历史进站客流数据;
所述历史断面客流数据包括:断面信息、客流量信息及时间信息;
所述历史进站客流数据包括:进站车站信息、客流量信息及时间信息
具体地,如图3所示,步骤S102包括:
步骤S301:通过Kafka分布式消息订阅系统接收自动售检票系统采集的实时客流数据,所述实时客流数据为自动售检票系统发送的全网实时乘客进站信息,包括:进站车站信息、时间信息,所述实时客流数据的延迟不超过预设时长;
步骤S302:通过基于spark技术的流处理程序统计实时客流数据;
步骤S303:实时客流数据被统计后,以一预设时间间隔的分车站进站客流数据的形式,存储至Hadoop架构的实时客流数据库系统,记为:存档的实时进站客流数据。所述存档的实时进站客流数据包括:进站车站信息、客流量信息及时间信息。
进一步地,实时数据通过流计算技术进行获取,通过专用的计算程序进行统计。基于分布式消息订阅机制与流处理技术,能够实现数据的分布式流式处理。
更进一步地,实时数据经过专用程序统计后,以5分钟间隔分车站进站客流数据的形式存储至Hadoop架构的实时客流数据库系统中。在实时客流数据库系统中,仅存储算法需求时间以内的进站客流数据。
具体地,如图4所示,步骤S103包括:
步骤S401:根据从所述大数据存储平台通过搜索引擎检索的历史客流数据,以历史进站客流数据为输入,以相应的历史断面客流数据为输出,建立客流预测模型;
步骤S402:根据所述客流预测模型,输入存档的实时进站客流数据,预测客流并输出相应的断面客流预测结果;
步骤S403:通过浏览器展示断面客流预测结果。
进一步地,客流预测的模型使用机器学习算法进行训练。算法输入为一段时间内的,固定时间间隔的轨道交通全网各车站进站客流量数据;输出为当前时间段的轨道交通全网各断面客流量数据。模型在训练完成后进行预测,输入为相应时段内的实时进站客流数据。
本发明提供的基于大数据技术的轨道交通断面客流短时预测系统,可以通过本发明给的基于大数据技术的轨道交通断面客流短时预测方法的步骤流程实现。本领域技术人员可以将所述基于大数据技术的轨道交通断面客流短时预测方法,理解为所述基于大数据技术的轨道交通断面客流短时预测系统的一个优选例。
根据本发明一种基于大数据技术的轨道交通断面客流短时预测系统,包括:
历史数据处理模块:存储及查询历史客流数据;
实时数据处理模块:获取乘客进出站数据,转换为实时客流数据,储存实时客流数据;
客流预测及展示模块:根据所述历史客流数据及实时客流数据进行客流预测,得到并展示客流预测结果。
具体地,历史数据处理模块包括:
历史数据抽取模块:从其他数据库系统中抽取历史客流数据;
历史数据储存模块:将历史客流数据存储至基于Hadoop架构的大数据存储平台中;
历史数据检索模块:从所述大数据存储平台通过搜索引擎检索历史客流数据;
历史客流数据包括:历史断面客流数据、历史进站客流数据;
历史断面客流数据为全网全日各断面不同时间间隔的历史客流量数据;
历史进站客流数据为全网全日各车站不同时间间隔的历史进站客流数据;
所述历史断面客流数据包括:断面信息、客流量信息及时间信息;
所述历史进站客流数据包括:进站车站信息、客流量信息及时间信息。
具体地,实时数据处理模块包括:
实时数据采集模块:通过Kafka分布式消息订阅系统接收自动售检票系统采集的实时客流数据,所述实时客流数据为自动售检票系统发送的全网实时乘客进站信息,包括:进站车站信息、时间信息,所述实时客流数据的延迟不超过预设时长;
实时数据统计模块:通过基于spark技术的流处理程序统计实时客流数据;
实时数据存储模块:实时客流数据被统计后,以一预设时间间隔的分车站进站客流数据的形式,存储至Hadoop架构的实时客流数据库系统,记为:存档的实时进站客流数据。所述存档的实时进站客流数据包括:进站车站信息、客流量信息及时间信息。
具体地,客流预测及展示模块包括:
预测模型构建模块:根据从所述大数据存储平台通过搜索引擎检索的历史客流数据,以历史进站客流数据为输入,以相应的历史断面客流数据为输出,建立客流预测模型;
客流预测模块:根据所述客流预测模型,输入存档的实时进站客流数据,预测客流并输出相应的断面客流预测结果;
结果展示模块:通过浏览器展示断面客流预测结果。
根据本发明提供的一种存储有计算机程序的计算机可读存储介质,所述计算机程序被处理器执行时实现上述任一项所述的基于大数据技术的轨道交通断面客流短时预测方法的步骤。
下面通过优选例,对本发明进行更为具体的说明。
实施例1:
如图5所示,在服务器集群上部署基于Hadoop架构的数据存储系统,并安装客流数据采集、处理、预测等相关服务,该系统具备以下功能:
1、实时数据处理功能。通过专用协议向服务器发送自动售检票系统(AFC)采集的进站信息,接收到的数据进入Kafka分布式消息订阅系统,通过基于spark技术的流处理程序统计后,转换为一定时间间隔的各车站进站客流数据,并存储至实时数据库,待预测模型需要时再予以调用。
2、历史数据处理功能。服务器内置数据抽取系统,以天为单位抽取离线计算的全网各断面5min客流量数据与统计完成的全网各车站5min进站客流量数据。将数据存储至基于Hadoop技术的大数据存储平台。并搜素引擎技术实现海量历史数据的快速检索。
3、断面客流预测功能。使用机器学习算法训练客流预测模型。训练过程中,以一定时间长度的清分数据为样本,其中进站客流数据作为输入样本,相应的断面客流数据作为输出样本。在进行预测前会工艺区历史数据中存储的历史断面客流量数据与进站客流数据进行训练
4、数据发布功能。预测结果在web端进行实时展示,使用者可以通过浏览器访问相关页面,获取实时断面客流信息。
本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统、装置及其各个模块以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统、装置及其各个模块以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同程序。所以,本发明提供的系统、装置及其各个模块可以被认为是一种硬件部件,而对其内包括的用于实现各种程序的模块也可以视为硬件部件内的结构;也可以将用于实现各种功能的模块视为既可以是实现方法的软件程序又可以是硬件部件内的结构。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。
Claims (10)
1.一种基于大数据技术的轨道交通断面客流短时预测方法,其特征在于,包括:
历史数据处理步骤:存储及查询历史客流数据;
实时数据处理步骤:获取乘客进出站数据,转换为实时客流数据,储存实时客流数据;
客流预测及展示步骤:根据所述历史客流数据及实时客流数据进行客流预测,得到并展示客流预测结果。
2.根据权利要求1所述的基于大数据技术的轨道交通断面客流短时预测方法,其特征在于,所述历史数据处理步骤包括:
从数据库系统中抽取历史客流数据;
将历史客流数据存储至基于Hadoop架构的大数据存储平台中;
从所述大数据存储平台通过搜索引擎检索历史客流数据。
3.根据权利要求2所述的基于大数据技术的轨道交通断面客流短时预测方法,其特征在于,历史客流数据包括:历史断面客流数据、历史进站客流数据;
历史断面客流数据为全网全日各断面不同时间间隔的历史客流量数据;
历史进站客流数据为全网全日各车站不同时间间隔的历史进站客流数据;
所述历史断面客流数据包括:断面信息、客流量信息及时间信息;
所述历史进站客流数据包括:进站车站信息、客流量信息及时间信息。
4.根据权利要求3所述的基于大数据技术的轨道交通断面客流短时预测方法,其特征在于,所述实时数据处理步骤包括:
通过Kafka分布式消息订阅系统接收自动售检票系统采集的实时客流数据,所述实时客流数据为自动售检票系统发送的全网实时乘客进站信息,包括:进站车站信息、时间信息,所述实时客流数据的延迟不超过预设时长;
通过基于spark技术的流处理程序统计实时客流数据;
实时客流数据被统计后,以一预设时间间隔的分车站进站客流数据的形式,存储至Hadoop架构的实时客流数据库系统,记为:存档的实时进站客流数据。所述存档的实时进站客流数据包括:进站车站信息、客流量信息及时间信息。
5.根据权利要求4所述的基于大数据技术的轨道交通断面客流短时预测方法,其特征在于,客流预测及展示步骤包括:
根据从所述大数据存储平台通过搜索引擎检索的历史客流数据,以历史进站客流数据为输入,以相应的历史断面客流数据为输出,建立客流预测模型;
根据所述客流预测模型,输入存档的实时进站客流数据,预测客流并输出相应的断面客流预测结果;
通过浏览器展示断面客流预测结果。
6.一种基于大数据技术的轨道交通断面客流短时预测系统,包括:
历史数据处理模块:存储及查询历史客流数据;
实时数据处理模块:获取乘客进出站数据,转换为实时客流数据,储存实时客流数据;
客流预测及展示模块:根据所述历史客流数据及实时客流数据进行客流预测,得到并展示客流预测结果。
7.根据权利要求6所述的基于大数据技术的轨道交通断面客流短时预测系统,其特征在于,历史数据处理模块包括:
历史数据抽取模块:从数据库系统中抽取历史客流数据;
历史数据储存模块:将历史客流数据存储至基于Hadoop架构的大数据存储平台中;
历史数据检索模块:从所述大数据存储平台通过搜索引擎检索历史客流数据;
历史客流数据包括:历史断面客流数据、历史进站客流数据;
历史断面客流数据为全网全日各断面不同时间间隔的历史客流量数据;
历史进站客流数据为全网全日各车站不同时间间隔的历史进站客流数据;
所述历史断面客流数据包括:断面信息、客流量信息及时间信息;
所述历史进站客流数据包括:进站车站信息、客流量信息及时间信息。
8.根据权利要求7所述的基于大数据技术的轨道交通断面客流短时预测系统,其特征在于,实时数据处理模块包括:
实时数据采集模块:通过Kafka分布式消息订阅系统接收自动售检票系统采集的实时客流数据,所述实时客流数据为自动售检票系统发送的全网实时乘客进站信息,包括:进站车站信息、时间信息,所述实时客流数据的延迟不超过预设时长;
实时数据统计模块:通过基于spark技术的流处理程序统计实时客流数据;
实时数据存储模块:实时客流数据被统计后,以一预设时间间隔的分车站进站客流数据的形式,存储至Hadoop架构的实时客流数据库系统,记为:存档的实时进站客流数据。所述存档的实时进站客流数据包括:进站车站信息、客流量信息及时间信息。
9.根据权利要求8所述的基于大数据技术的轨道交通断面客流短时预测系统,其特征在于,客流预测及展示模块包括:
预测模型构建模块:根据从所述大数据存储平台通过搜索引擎检索的历史客流数据,以历史进站客流数据为输入,以相应的历史断面客流数据为输出,建立客流预测模型;
客流预测模块:根据所述客流预测模型,输入存档的实时进站客流数据,预测客流并输出相应的断面客流预测结果;
结果展示模块:通过浏览器展示断面客流预测结果。
10.一种存储有计算机程序的计算机可读存储介质,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的基于大数据技术的轨道交通断面客流短时预测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810858596.7A CN110782060A (zh) | 2018-07-31 | 2018-07-31 | 基于大数据技术的轨道交通断面客流短时预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810858596.7A CN110782060A (zh) | 2018-07-31 | 2018-07-31 | 基于大数据技术的轨道交通断面客流短时预测方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110782060A true CN110782060A (zh) | 2020-02-11 |
Family
ID=69383094
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810858596.7A Pending CN110782060A (zh) | 2018-07-31 | 2018-07-31 | 基于大数据技术的轨道交通断面客流短时预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110782060A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115578233A (zh) * | 2022-11-18 | 2023-01-06 | 深圳市城市交通规划设计研究中心股份有限公司 | 一种交通应急疏散方法、系统及计算机设备 |
CN115952173A (zh) * | 2023-03-13 | 2023-04-11 | 北京全路通信信号研究设计院集团有限公司 | 一种客流数据处理方法、装置、大数据平台及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105224999A (zh) * | 2015-09-10 | 2016-01-06 | 北京市交通信息中心 | 基于afc数据的城市轨道交通实时客流预测方法及系统 |
CN106485359A (zh) * | 2016-10-13 | 2017-03-08 | 东南大学 | 一种基于列车运行时刻表的城市轨道交通断面客流推测方法 |
CN106844546A (zh) * | 2016-12-30 | 2017-06-13 | 江苏号百信息服务有限公司 | 基于Spark集群的多数据源位置信息融合方法及系统 |
CN107688873A (zh) * | 2017-08-29 | 2018-02-13 | 南京轨道交通系统工程有限公司 | 基于大数据分析的地铁客流预测方法 |
CN107808235A (zh) * | 2017-10-10 | 2018-03-16 | 东南大学 | 基于afc大数据的城市轨道大客流模型构建方法 |
-
2018
- 2018-07-31 CN CN201810858596.7A patent/CN110782060A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105224999A (zh) * | 2015-09-10 | 2016-01-06 | 北京市交通信息中心 | 基于afc数据的城市轨道交通实时客流预测方法及系统 |
CN106485359A (zh) * | 2016-10-13 | 2017-03-08 | 东南大学 | 一种基于列车运行时刻表的城市轨道交通断面客流推测方法 |
CN106844546A (zh) * | 2016-12-30 | 2017-06-13 | 江苏号百信息服务有限公司 | 基于Spark集群的多数据源位置信息融合方法及系统 |
CN107688873A (zh) * | 2017-08-29 | 2018-02-13 | 南京轨道交通系统工程有限公司 | 基于大数据分析的地铁客流预测方法 |
CN107808235A (zh) * | 2017-10-10 | 2018-03-16 | 东南大学 | 基于afc大数据的城市轨道大客流模型构建方法 |
Non-Patent Citations (3)
Title |
---|
吕利民等: "城市轨道交通短期客流预测方法", 《都市快轨交通》 * |
石庄彬 等: "数据挖掘技术在轨道交通AFC系统中的应用", 《都市快轨交通》 * |
程涛等: "西安地铁2号线南段运营初期客流预测", 《都市快轨交通》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115578233A (zh) * | 2022-11-18 | 2023-01-06 | 深圳市城市交通规划设计研究中心股份有限公司 | 一种交通应急疏散方法、系统及计算机设备 |
CN115578233B (zh) * | 2022-11-18 | 2023-08-01 | 深圳市城市交通规划设计研究中心股份有限公司 | 一种交通应急疏散方法、系统及计算机设备 |
CN115952173A (zh) * | 2023-03-13 | 2023-04-11 | 北京全路通信信号研究设计院集团有限公司 | 一种客流数据处理方法、装置、大数据平台及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109754594B (zh) | 一种路况信息获取方法及其设备、存储介质、终端 | |
CN108082224B (zh) | 基于afc时变客流的城市轨道交通列车运行图编制方法 | |
Wen et al. | Statistical investigation on train primary delay based on real records: evidence from Wuhan–Guangzhou HSR | |
CN102436603B (zh) | 基于概率树d预测的轨道交通全路网客流预测方法 | |
CN110866649A (zh) | 一种短期地铁客流预测方法、系统及电子设备 | |
CN108846514B (zh) | 一种突发事件下轨道交通客流疏散需求预测方法 | |
CN104424812B (zh) | 一种公交到站时间预测系统和方法 | |
US20140035921A1 (en) | Analysis and visualization of passenger movement in a transportation system | |
CN113538898A (zh) | 一种基于多源数据的高速公路拥堵管控系统 | |
CN103745229A (zh) | 一种基于svm的轨道交通故障诊断方法及系统 | |
CN108398934B (zh) | 一种用于轨道交通的设备故障监控的系统 | |
CN104464344B (zh) | 一种车辆行驶路径预测方法及系统 | |
CN103838868B (zh) | 一种基于多公交线路运行数据融合的城市公交到站时间预测方法 | |
CN115018148A (zh) | 一种基于数字孪生模型的城市轨道交通线网客流分布预测方法及系统 | |
CN112016735B (zh) | 一种基于交通违法热点预测的巡逻路线规划方法、系统和可读存储介质 | |
CN110400462B (zh) | 基于模糊理论的轨道交通客流监测预警方法及其系统 | |
CN109993964A (zh) | 基于Hadoop技术的智能交通管理系统 | |
CN105447592A (zh) | 一种乘客路径选择的分析方法及装置 | |
CN106447137A (zh) | 一种基于信息融合和马尔可夫模型的交通客流预测方法 | |
CN106327867B (zh) | 一种基于gps数据的公交准点预测方法 | |
CN114328675A (zh) | 基于双注意力机制和双向双层lstm的公交行程时间预测方法 | |
CN110782060A (zh) | 基于大数据技术的轨道交通断面客流短时预测方法及系统 | |
CN113570867A (zh) | 一种城市交通状态预测方法、装置、设备及可读存储介质 | |
CN115953186A (zh) | 一种网约车需求模式识别与短时需求预测方法 | |
Barabino et al. | Regularity analysis on bus networks and route directions by automatic vehicle location raw data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200211 |