CN113850411A - 一种列车晚点预测方法、装置、设备和介质 - Google Patents

一种列车晚点预测方法、装置、设备和介质 Download PDF

Info

Publication number
CN113850411A
CN113850411A CN202110943759.3A CN202110943759A CN113850411A CN 113850411 A CN113850411 A CN 113850411A CN 202110943759 A CN202110943759 A CN 202110943759A CN 113850411 A CN113850411 A CN 113850411A
Authority
CN
China
Prior art keywords
station
time
late
characteristic information
delay
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110943759.3A
Other languages
English (en)
Other versions
CN113850411B (zh
Inventor
张红斌
赵义阳
王斌
赵飞
冯小芳
宣利
琚兵兵
韩宇
杜何伟
金福才
田苗苗
李欣
孔庆玮
卢晓杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Academy of Railway Sciences Corp Ltd CARS
Beijing Jingwei Information Technology Co Ltd
Original Assignee
China Academy of Railway Sciences Corp Ltd CARS
Beijing Jingwei Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Academy of Railway Sciences Corp Ltd CARS, Beijing Jingwei Information Technology Co Ltd filed Critical China Academy of Railway Sciences Corp Ltd CARS
Priority to CN202110943759.3A priority Critical patent/CN113850411B/zh
Publication of CN113850411A publication Critical patent/CN113850411A/zh
Application granted granted Critical
Publication of CN113850411B publication Critical patent/CN113850411B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Biomedical Technology (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Primary Health Care (AREA)
  • Train Traffic Observation, Control, And Security (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种列车晚点预测方法、装置、设备和介质,获取目标列车的初始晚点时长和目标列车的图定计划特征信息;获取初始晚点发生后目标列车将经过的目标车站的运力特征信息、目标车站的历史相关特征、目标车站和目标列车的时间特征信息;将上述特征信息输入晚点预测模型,输出目标列车经过目标车站的晚点时长预测值;对于相邻两个车站,将前一个车站的出发晚点时长或者出发晚点时长预测值作为到达晚点模型的输入,输出后一个车站的到达晚点时长预测值;对于同一个车站,将该车站的到达晚点时长或者到达晚点时长预测值作为出发晚点模型的输入,输出该车站的出发晚点时长预测值。该方法可以有效提升列车晚点预测模型的准确性和稳定性。

Description

一种列车晚点预测方法、装置、设备和介质
技术领域
本发明涉及预测技术领域,尤其涉及一种列车晚点预测方法、装置、设备和介质。
背景技术
中国高铁经过十多年的高速发展,铁路以安全、正点、运距长和价格低等优势成为人们中长距离出行选择的主要交通运输方式。
在列车运行过程中,当发生较小扰动致使列车偏离运行图时,调度员利用运行图的缓冲时间来弥补列车的晚点时间,尽量使列车回到原来的运行图轨迹上,保证基本的行车秩序。但如果发生突发事件,例如恶劣天气和设备故障等,使得列车晚点的时间远大于运行图留有的缓冲时间,在这种情况下调度员需要与涉及到的列车司机进行电话沟通,询问现场情况,还需要与相邻调度台的调度员进行协调,凭借经验与调度原则制定运行图调整方案,大量的联络工作对调度员来说是一项巨大的挑战。人工决策容易出现失误,不仅影响当前线路上列车运行的正点率,还可能会影响路网上其他线路的行车秩序。因此,研究高速铁路列车晚点时间的预测模型意义深远,可以为高速铁路的行车指挥自动化的实现提供有利支撑。
目前高速铁路列车晚点时间的预测模型包括传统的数学模型和随机森林模型。传统的数学模型泛用性低、不能实现自动预测;随机森林模型采取平均的方法容易忽略每个基模型的精度差别,算法的精度很大程度取决于参数的调节,而随机森林模型的参数较少,导致随机森林模型的预测精度不稳定。
发明内容
本发明提供一种列车晚点预测方法、装置、设备和介质,用以解决现有技术中预测模型的泛用性低、不能实现自动预测以及预测精度不稳定的缺陷,可以实现对晚点车站晚点时间的自动精准预测。
第一方面,本发明提供了一种列车晚点预测方法,包括:根据目标列车初始发生晚点,获取所述目标列车的初始晚点时长和所述目标列车的图定计划特征信息;其中,所述初始晚点时长包括到达晚点时长或者出发晚点时长;获取所述初始晚点发生后所述目标列车将经过的目标车站的运力特征信息、所述目标列车的历史统计特征信息、所述目标车站和所述目标列车的时间特征信息;将所述初始晚点时长、所述图定计划特征信息、所述历史统计特征信息、所述运力特征信息和所述时间特征信息输入晚点预测模型,输出所述目标列车经过所述目标车站的晚点时长预测值;其中,所述晚点预测模型包括出发晚点模型和到达晚点模型;所述晚点时长预测值包括出发晚点时长预测值和/或到达晚点时长预测值;对于相邻两个车站,将前一个车站的所述出发晚点时长或者所述出发晚点时长预测值作为所述到达晚点模型的输入,输出后一个车站的所述到达晚点时长预测值;对于同一个车站,将该车站的所述到达晚点时长或者所述到达晚点时长预测值作为所述出发晚点模型的输入,输出该车站的所述出发晚点时长预测值。
根据本发明提供的列车晚点预测方法,所述将所述初始晚点时长、所述图定计划特征信息、所述历史统计特征信息、所述运力特征信息和所述时间特征信息输入晚点预测模型,输出所述目标列车经过所述目标车站的晚点时长预测值,包括:将发生所述初始晚点的车站作为当前车站,将所述当前车站的所述到站晚点时长、所述当前车站的所述图定计划特征信息、所述当前车站的历史统计特征信息、所述当前车站的所述运力特征信息、所述当前车站和所述目标列车的时间特征信息输入所述出发晚点模型,输出所述当前车站的所述出发晚点时长预测值,将所述当前车站的下一个车站作为当前车站;将所述当前车站的上一个车站的所述出发晚点时长预测值、所述当前车站的所述运力特征信息、所述当前车站的图定计划特征信息、所述当前车站的所述历史统计特征信息、所述当前车站和所述目标列车的时间特征信息输入所述到达晚点模型,输出所述当前车站的所述到达晚点时长预测值;判断所述当前车站是否为所述目标列车的终点车站;若所述当前车站不为所述目标列车的终点车站,将所述当前车站的所述到达晚点时长预测值、所述当前车站的所述图定计划特征信息、所述当前车站的所述历史统计特征信息、所述当前车站的所述运力特征信息、所述当前车站和所述目标列车的时间特征信息输入所述出发晚点模型,输出所述当前车站的所述出发晚点时长预测值,将所述当前车站的下一个车站作为当前车站。
根据本发明提供的列车晚点预测方法,所述将所述初始晚点时长、所述图定计划特征信息、所述历史统计特征信息、所述运力特征信息和所述时间特征信息输入晚点预测模型,输出所述目标列车经过所述目标车站的晚点时长预测值,包括:将发生所述初始晚点的车站的下一个车站作为当前车站,将所述当前车站的上一个车站的所述出发晚点时长、所述当前车站的所述图定计划特征信息、所述当前车站的所述历史统计特征信息、所述当前车站的所述运力特征信息、所述当前车站和所述目标列车的时间特征信息输入所述到达晚点模型,输出所述当前车站的所述到达晚点时长预测值;判断所述当前车站是否为所述目标列车的终点车站;若所述当前车站不为所述目标列车的终点车站,将所述当前车站的所述到达晚点时长预测值、所述当前车站的所述图定计划特征信息、所述当前车站的所述历史统计特征信息、所述当前车站的所述运力特征信息、所述当前车站和所述目标列车的时间特征信息输入所述出发晚点模型,输出所述当前车站的所述出发晚点时长预测值,将所述当前车站的下一个车站作为当前车站;将所述当前车站的上一个车站的所述出发晚点时长预测值、所述当前车站的所述图定计划特征信息、所述当前车站的所述历史统计特征信息、所述当前车站的所述运力特征信息、所述当前车站和所述目标列车的时间特征信息输入所述到达晚点模型,输出所述当前车站的所述到达晚点时长预测值。
根据本发明提供的列车晚点预测方法,所述将前一个车站的所述出发晚点时长或者所述出发晚点时长预测值作为所述到达晚点模型的输入,输出后一个车站的所述到达晚点时长预测值之后,还包括:根据所述到达晚点时长预测值、所述出发晚点时长或者所述出发晚点时长预测值、所述目标列车在所述相邻两个车站之间的图定运行时间,得到所述目标列车在所述相邻两个车站之间的预测概率值;根据预设时间段内所有列车在所述相邻两个车站之间的历史吸收时长和图定运行时间,得到所述相邻两个车站之间的历史概率值;判断所述目标列车在所述相邻两个车站之间的预测概率值是否大于所述相邻两个车站之间的历史概率值;若所述目标列车在所述相邻两个车站之间的预测概率值大于所述相邻两个车站之间的历史概率值,根据所述相邻两个车站之间的历史概率值修正所述到达晚点时长预测值;
根据本发明提供的列车晚点预测方法,所述将该车站的所述到达晚点时长或者所述到达晚点时长预测值作为所述出发晚点模型的输入,输出该车站的所述出发晚点时长预测值之后,还包括:根据所述到达晚点时长或者所述到达晚点时长预测值、所述出发晚点时长预测值、所述目标列车在该车站的图定停留时间,得到所述目标列车在该车站的预测概率值;根据预设时间段内所有列车在该车站的历史吸收时长和图定停留时间,得到该车站的历史概率值;判断所述目标列车在该车站的预测概率值是否大于该车站的历史概率值;若所述目标列车在该车站的预测概率值大于该车站的历史概率值,根据该车站的历史概率值修正所述出发晚点时长预测值。
根据本发明提供的列车晚点预测方法,所述将所述初始晚点时长、所述图定计划特征信息、所述历史统计特征信息、所述运力特征信息和所述时间特征信息输入晚点预测模型,输出所述目标列车经过所述目标车站的晚点时长预测值之前,还包括:根据所述初始晚点时长,确定与所述初始晚点时长相匹配的晚点预测模型;其中,所述晚点预测模型包括四个分别对应不同的初始晚点长的晚点预测模型,每一个所述晚点预测模型均包括出发晚点模型和到达晚点模型;和/或,根据所述目标列车的等级,确定与所述目标列车等级相匹配的晚点预测模型;其中,所述晚点预测模型包括二个分别对应不同的等级类型的晚点预测模型,每一个所述晚点预测模型均包括出发晚点模型和到达晚点模型;所述将所述初始晚点时长、所述图定计划特征信息、所述历史统计特征信息、所述运力特征信息和所述时间特征信息输入晚点预测模型,输出所述目标列车经过所述目标车站的晚点时长预测值,包括:将所述初始晚点时长、所述图定计划特征信息、所述历史统计特征信息、所述运力特征信息和所述时间特征信息输入与所述初始晚点时长和/或所述目标列车等级相匹配的晚点预测模型,输出所述目标列车经过所述目标车站的晚点时长预测值。
根据本发明提供的列车晚点预测方法,还包括:根据目标铁路线路的列车运行信息,构建样本集;根据列车的运力信息、图定计划信息、历史统计信息和时间信息,确定所述样本集中列车样本的初始特征信息组成;根据初始晚点时长,对所述样本集中列车样本的运行信息进行时间序列的提取,并获取所述样本集中列车样本的所述初始特征信息;选取晚点预测模型,并对所述初始特征信息进行特征选择,得到目标特征信息;所述目标特征信息包括所述样本集中列车样本在所述初始晚点发生后将经过的车站的运力特征信息、图定计划特征信息、历史统计特征信息和时间特征信息,以及所述列车样本的时间特征信息;将所述样本集中列车样本的所述初始晚点时长和所述目标特征信息输入所述晚点预测模型,根据所述时间序列对所述晚点预测模型的参数进行调整。
第二方面,本发明还提供了一种列车晚点预测装置,包括:第一获取模块,用于根据目标列车初始发生晚点,获取所述目标列车的初始晚点时长和所述目标列车的图定计划特征信息;其中,所述初始晚点时长包括到达晚点时长或者出发晚点时长;第二获取模块,用于获取所述初始晚点发生后所述目标列车将经过的目标车站的运力特征信息、所述目标列车的历史统计特征信息、所述目标车站和所述目标列车的时间特征信息;第一预测模块,用于将所述初始晚点时长、所述图定计划特征信息、所述历史统计特征信息、所述运力特征信息和所述时间特征信息输入晚点预测模型,输出所述目标列车经过所述目标车站的晚点时长预测值;其中,所述晚点预测模型包括出发晚点模型和到达晚点模型;所述晚点时长预测值包括出发晚点时长预测值和/或到达晚点时长预测值;第二预测模块,用于对于相邻两个车站,将前一个车站的所述出发晚点时长或者所述出发晚点时长预测值作为所述到达晚点模型的输入,输出后一个车站的所述到达晚点时长预测值;第三预测模块,用于对于同一个车站,将该车站的所述到达晚点时长或者所述到达晚点时长预测值作为所述出发晚点模型的输入,输出该车站的所述出发晚点时长预测值。
第三方面,本发明还提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现所述列车晚点预测方法的步骤。
第四方面,本发明还提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现所述列车晚点预测方法的步骤。
本发明提供了一种列车晚点预测方法、装置、设备和介质,通过根据目标列车初始发生晚点,获取目标列车的初始晚点时长和目标列车的图定计划特征信息;其中,初始晚点时长包括到达晚点时长或者出发晚点时长;获取初始晚点发生后目标列车将经过的目标车站的运力特征信息、目标列车的历史统计特征信息、目标车站和目标列车的时间特征信息;将初始晚点时长、历史统计特征信息、运力特征信息和时间特征信息输入晚点预测模型,输出目标列车经过目标车站的晚点时长预测值;其中,晚点预测模型包括出发晚点模型和到达晚点模型;晚点时长预测值包括出发晚点时长预测值和/或到达晚点时长预测值;对于相邻两个车站,将前一个车站的出发晚点时间或者出发晚点时长预测值作为到达晚点模型的输入,输出后一个车站的到达晚点时长预测值;对于同一个车站,将该车站的到达晚点时长或者到达晚点时长预测值作为出发晚点模型的输入,输出该车站的出发晚点时长预测值。通过获取目标车站的运力特征信息长、图定计划特征信息、历史统计特征信息、目标车站和目标列车的时间特征信息作为模型的输入,保证了输入参数的数量和维度,可以有效提升列车晚点预测模型的准确性和稳定性。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的列车晚点预测方法实施例的流程示意图;
图2是本发明提供的调整模型参数方法实施例的流程示意图;
图3是本发明提供的箱线图的示意图;
图4是本发明提供的初始特征信息的示例图;
图5是本发明提供的对离散型特征进行独热编码示意图;
图6是本发明实施例提供的LGBM模型对迭代次数进行参数调整的迭代过程示意图;
图7本发明实施例提供的LGBM模型对树的最大深度和叶子节点个数进行参数调整的迭代过程示意图;
图8是本发明实施例提供的LGBM模型对数据比例和特征比例进行参数调整的迭代过程示意图;
图9是本发明实施例提供的LGBM模型对alpha正则参数和lambda正则参数进行参数调整的迭代过程示意图;
图10是本发明实施例提供的LGBM模型对迭代次数参数进行重新调整的迭代过程示意图;
图11是本发明实施例提供的LGBM模型在各个初始晚点段的性能表现示意图;
图12是本发明提供的一种列车晚点预测装置实施例的组成结构示意图;
图13是是本发明提供的一种电子设备结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本发明提供的列车晚点预测方法实施例的流程示意图。如图1所示,该列车晚点预测方法包括以下步骤:
S101,根据目标列车初始发生晚点,获取目标列车的初始晚点时长和目标列车的图定计划特征信息;其中,初始晚点时长包括到达晚点时长或者出发晚点时长。
在步骤S101中,目标列车初始发生晚点是指目标列车第一次发生晚点。比如,目标列车一共运行27站,该目标列车在第15站第一次发生晚点,那么第15站就是该列车发生初始晚点的车站,也称初始晚点车站,将对该目标列车在第15站之后的运行情况进行预测。如果该目标列车到达第15站时发生晚点,那么初始晚点时长为到达晚点时长;如果该目标列车从第15站出发时发生晚点,那么初始晚点时长为出发晚点时长。
S102,获取初始晚点发生后目标列车将经过的目标车站的运力特征信息、目标列车的历史统计特征信息、目标车站和目标列车的时间特征信息。
在步骤S102中,目标车站可以是初始晚点车站之后列车未到达的任意车站。仍以在步骤S101中的例子作为示例进行说明,第15站是该目标列车的初始晚点车站,那么初始晚点车站之后列车未到达的第16站至第27站中的任意一个或者多个车站可以作为目标车站。
目标车站的运力特征信息可以包括:历史站点运力、区间运行状态、历史区间站距和历史区间运行速度或者历史站点运力。
目标列车的时间特征信息可以包括:上一站出发晚点时长、区间图定运行时长、历史区间吸收最大值、前车图定发车时间间隔、历史区间吸收概率、历史区间扩散概率、列车运行处于某时间段或者历史站点到达晚点平均值、历史站点到达早点概率、历史站点吸收最大值、站点图定停留时长、历史站点列车到达晚点概率、历史站点到达晚点概率、历史站点到达早点平均值和历史列车到达晚点平均值。
S103,将初始晚点时间长、图定计划特征信息、历史统计特征信息、运力特征信息和时间特征信息输入晚点预测模型,输出目标列车经过目标车站的晚点时长预测值;其中,晚点预测模型包括出发晚点模型和到达晚点模型;晚点时长预测值包括出发晚点时长预测值和/或到达晚点时长预测值。
在步骤S103中,可以将发生初始晚点的车站作为当前车站,将当前车站的到站晚点时长、当前车站的图定计划特征信息、当前车站的历史统计特征信息、、当前车站的运力特征信息、当前车站和目标列车的时间特征信息输入出发晚点模型,输出当前车站的出发晚点时长预测值,将当前车站的下一个车站作为当前车站;将当前车站的上一个车站的出发晚点时长预测值、当前车站的图定计划特征信息、前车站的历史统计特征信息、当前车站的运力特征信息、当前车站和目标列车的时间特征信息输入到达晚点模型,输出当前车站的到达晚点时长预测值;判断当前车站是否为目标列车的终点车站;若当前车站不为目标列车的终点车站,将当前车站的到达晚点时长预测值、当前车站的图定计划特征信息、前车站的历史统计特征信息、当前车站的运力特征信息、当前车站和目标列车的时间特征信息输入出发晚点模型,输出当前车站的出发晚点时长预测值,将当前车站的下一个车站作为当前车站。
仍以步骤S101中的例子作为示例进行说明,第15站是目标列车的发生初始晚点的车站,也就是当前站,那么将第15站的到站晚点时长、当前车站的图定计划特征信息、当前车站的历史统计特征信息运力特征信息和时间特征信息输入晚点预测模型,可以得到第15站的出发晚点时长预测值,并将第16站作为的当前站。将第15站的出发晚点时长预测值、当前车站的图定计划特征信息、当前车站的历史统计特征信息、当前车站的运力特征信息、当前车站和目标列车的时间特征信息输入到达晚点模型,可以得到第16站的到达晚点时长预测值;由于第16站不是终点站,将第16站的到达晚点时长预测值、、第16站的图定计划特征信息、第16站的历史统计特征信息、第16站的运力特征信息、第16站和目标列车的时间特征信息输入出发晚点模型,输出第16站的出发晚点时长预测值,并将第17站作为当前站,以此类推,直至终点站。
可选地,可以将发生初始晚点的车站的下一个车站作为当前车站,将当前车站的上一个车站的出发晚点时长、当前车站的运力特征信息、当前车站的图定计划特征信息、当前车站的历史统计特征信息、当前车站和目标列车的时间特征信息输入到达晚点模型,输出当前车站的到达晚点时长预测值;判断当前车站是否为目标列车的终点车站;若当前车站不为目标列车的终点车站,将当前车站的到达晚点时长预测值、当前车站的运力特征信息、当前车站的图定计划特征信息、当前车站的历史统计特征信息、当前车站和目标列车的时间特征信息输入出发晚点模型,输出当前车站的出发晚点时长预测值,将当前车站的下一个车站作为当前车站;将当前车站的上一个车站的出发晚点时长预测值、当前车站的图定计划特征信息、当前车站的历史统计特征信息、当前车站的运力特征信息、当前车站和目标列车的时间特征信息输入到达晚点模型,输出当前车站的到达晚点时长预测值。
S104,对于相邻两个车站,将前一个车站的出发晚点时长或者出发晚点时长预测值作为到达晚点模型的输入,输出后一个车站的到达晚点时长预测值。
在步骤S104中,相邻的两个车站中,如果前一个车站为初始晚点车站,那么将初始晚点车站的出发晚点时长输入到达晚点模型,得到后一个车站的到达晚点时长预测值;如果前一个车站不是初始晚点车站,那么将前一站的出发晚点时长预测值输入到达晚点模型,得到后一个车站的达到晚点时长预测值。获取后一个车站的到达晚点时长预测值,需要通过与之相邻的前一个车站的出发晚点时长或出发晚点时长预测值和到达晚点预测模型获得。也就是说,预测车站的到达晚点时长,需要在两个相邻车站进行。
S105,对于同一个车站,将该车站的到达晚点时长或者到达晚点时长预测值作为出发晚点模型的输入,输出该车站的出发晚点时长预测值。
在步骤S105中,如果该车站为初始晚点车站,将初始晚点车站的到达晚点时长输入出发晚点模型,得到该车站的出发晚点时长预测值;如果该车站不是初始晚点车站,将该车站的到达晚点时长预测值输入出发晚点模型,得到该车站的出发晚点时长预测值。获取车站的出发晚点时长预测值,可以通过该车站的到达晚点时长或到达晚点时长预测值得到该车站的出发晚点时长预测值。也就是说,预测车站的出发晚点时长,在同一车站进行即可。
本发明实施例提供的一种列车晚点预测方法、装置、设备和介质,
根据目标列车初始发生晚点,获取目标列车的初始晚点时长和目标列车的图定计划特征信息;其中,初始晚点时长包括到达晚点时长或者出发晚点时长;获取初始晚点发生后目标列车将经过的目标车站的运力特征信息、目标列车的历史统计特征信息、目标车站和目标列车的时间特征信息;将初始晚点时长、历史统计特征信息、运力特征信息和时间特征信息输入晚点预测模型,输出目标列车经过目标车站的晚点时长预测值;其中,晚点预测模型包括出发晚点模型和到达晚点模型;晚点时长预测值包括出发晚点时长预测值和/或到达晚点时长预测值;对于相邻两个车站,将前一个车站的出发晚点时间或者出发晚点时长预测值作为到达晚点模型的输入,输出后一个车站的到达晚点时长预测值;对于同一个车站,将该车站的到达晚点时长或者到达晚点时长预测值作为出发晚点模型的输入,输出该车站的出发晚点时长预测值。通过获取目标车站的运力特征信息长、目标车站的图定计划特征信息、目标车站的历史统计特征信息、目标车站和目标列车的时间特征信息作为模型的输入,保证了输入参数的数量和维度,可以有效提升列车晚点预测模型的准确性和稳定性;
通过前一个车站的前一个车站的出发晚点时长或者出发晚点时长预测值作为到达晚点模型的输入,输出后一个车站的到达晚点时长预测值以及对于同一个车站,将该车站的到达晚点时长或者到达晚点时长预测值作为出发晚点模型的输入,输出该车站的出发晚点时长预测值能够将前后车站或同一个车站的晚点信息紧密关联,能够提升预测值的准确性。
可选地,将前一个车站的出发晚点时长或者出发晚点时长预测值作为到达晚点模型的输入,输出后一个车站的到达晚点时长预测值之后,还包括:根据到达晚点时长预测值、出发晚点时长或者出发晚点时长预测值、目标列车在相邻两个车站之间的图定运行时间,得到目标列车在相邻两个车站之间的预测概率值;根据预设时间段内所有列车在相邻两个车站之间的历史吸收时长和图定运行时间,得到相邻两个车站之间的历史概率值;判断目标列车在相邻两个车站之间的预测概率值是否大于相邻两个车站之间的历史概率值;若目标列车在相邻两个车站之间的预测概率值大于相邻两个车站之间的历史概率值,根据相邻两个车站之间的历史概率值修正到达晚点时长预测值。
可选地,将该车站的到达晚点时长或者到达晚点时长预测值作为出发晚点模型的输入,输出该车站的出发晚点时长预测值之后,还包括:根据到达晚点时长或者到达晚点时长预测值、出发晚点时长预测值、目标列车在该车站的图定停留时间,得到目标列车在该车站的预测概率值;根据预设时间段内所有列车在该车站的历史吸收时长和图定停留时间,得到该车站的历史概率值;判断目标列车在该车站的预测概率值是否大于该车站的历史概率值;若目标列车在该车站的预测概率值大于该车站的历史概率值,根据该车站的历史概率值修正出发晚点时间预测值。
其中,预设时间段可以为一年,或者可以为半年,或者还可以为一个季度,本发明实施实施例对此不作限定。相邻两个车站之间的吸收时长预测值可以为前一个车站的出发晚点时长或前一个车站的出发晚点时长的预测值与后一个车站的达到晚点时长预测值的差值。相邻两个车站之间的预测概率值可以定义为相邻两个车站之间的吸收时长预测值与相邻两个车站之间的图定运行时间的比值。类似的,相邻两个车站之间的历史概率值为相邻两个车站之间的历史吸收时长与相邻两个车站之间的图定运行时间的比值。若目标列车在相邻两个车站之间的预测概率值大于相邻两个车站之间的历史概率值,将历史概率值作为预测概率值,根据预测概率值的计算公式可以得到修正的相邻两个车站之间的吸收时长预测值,进而得到修正的到达晚点时长预测值。
车站的历史概率值同相邻两个车站之间的历史概率值定义类似,车站的预测概率值的定义同相邻两个车站之间的预测概率值的定义类似,到达晚点时长预测值进行修正的过程与出发晚点时长预测值修正过程类似,在此不作赘述。
可选地,将初始晚点时长、图定计划特征信息、历史统计特征信息、运力特征信息和时间特征信息输入晚点预测模型,输出目标列车经过目标车站的晚点时长预测值之前,还包括:根据初始晚点时长,确定与初始晚点时长相匹配的晚点预测模型;其中,晚点预测模型包括四个分别对应不同的初始晚点时长的晚点预测模型,每一个晚点预测模型均包括出发晚点模型和到达晚点模型;和/或,根据目标列车的等级,确定与目标列车等级相匹配的晚点预测模型;其中,晚点预测模型包括二个分别对应不同的等级类型的晚点预测模型,每一个晚点预测模型均包括出发晚点模型和到达晚点模型。
将初始晚点时间长、图定计划特征信息、历史统计特征信息、运力特征信息和时间特征信息输入晚点预测模型,输出目标列车经过目标车站的晚点时长预测值,包括:将初始晚点时长、图定计划特征信息、历史统计特征信息、运力特征信息和时间特征信息输入与初始晚点时长和/或目标列车等级相匹配的晚点预测模型,输出目标列车经过目标车站的晚点时长预测值。
其中,四个分别对应不同的初始晚点时长的晚点预测模型依次为初始晚点时长为0-5分钟的晚点预测模型,初始晚点时长为5-10分钟的晚点预测模型,初始晚点时长为10-30分钟的晚点预测模型和初始晚点时长为30钟以上的晚点预测模型。
二个分别对应不同的等级类型的晚点预测模型依次为列车等级为G、D和C的晚点预测模型以及列车等级为K、T和Z的晚点预测模型。
图2是本发明提供的调整模型参数方法实施例的流程示意图。如图2所示,该方法包括:
S201,根据目标铁路线路的列车运行信息,构建样本集。
在步骤S201中,目标铁路线路可以任意时间内的任意线路,比如,可以是2018年全国所有铁路线路的所有列车的运行信息,或者可以是2019年全国铁路线路的所有列车的运行信息,或者还可以是2018、2019和2020三年全国部分铁路线路的运行信息,本发明实施例对此不作限定。
在构建样本集之前还包括,对获取目标铁路线路的列车运行信息进行清洗。将缺失运行信息数据和重复运行信息数据以列车行程为单位删除。图3是本发明提供的箱线图的示意图,如图3所示,在上下三倍四分位以外的数据以行程为单位进行剔除。
S202,根据列车的运力信息、图定计划信息、历史统计信息和时间信息,确定样本集中列车样本的初始特征信息组成。
在步骤S202中,图4是本发明提供的初始特征信息的示例图,如图4所示,原始特征从左至右的每一列依次为车站编码、车站名称、实际到达时间、实际出发时间、到达列车名、图定到达时间、图定出发时间、到达晚点时长、出发晚点时长、股道和路局码。
对初始特征信息中的离散型特征进行独热编码,如图5所示。图5是本发明提供的对离散型特征进行独热编码示意图。
S203,根据初始晚点时长,对样本集中列车样本的运行信息进行时间序列的提取,并获取样本集中列车样本的初始特征信息。
在步骤S203中,若行程中发生一次初始晚点,则时间序列序列从初始晚点车站提取至终点站;若行程中发生多次初始晚点,则序列从第一次初始晚点车站提取至第二次初始晚点车站之前,再从至第二次初始晚点车站提取至第三次初始晚点站之前,提取直至终点站。比如,列车一共运行27站,第15站是第一次初始晚点车站,第21站是第二次初始晚点车站。那么需要提取第15站至第20站的时间序列和第21站至第27站的时间序列。
S204,选取晚点预测模型,并对初始特征信息进行特征选择,得到目标特征信息;目标特征信息包括样本集中列车样本在初始晚点发生后将经过的车站的运力特征信息、图定计划特征信息、历史统计特征信息和时间特征信息,以及列车样本的时间特征信息。
在步骤S204中,选取2020年初始晚点段为5-10分钟的时间序列数据作为LinearRegression到达晚点模型和LGBM到达晚点模型的输入,数据条数为97964,总序列数为8649个。对比结果如表1所示。
表1测试结果对比表
Figure BDA0003216099770000121
其中,MAE被称为平均绝对误差,是绝对误差的平均值。可以更好地反映预测值误差的实际情况。可以通过公式1进行计算。
Figure BDA0003216099770000122
其中,X代表输入值,h代表预测值,y代表实际值。
R2一共有三种取值:R2=1,意味着样本中的预测值和真实值完全相等没有误差;R2=0,此时分子等于分母,样本每项的预测值都等于均值。R2<0,分子大于分母,意味着训练模型产生的误差比均值产生的误差还要大。因此,R2越接近于1越好。
R2可以通过公式2进行计算。
Figure BDA0003216099770000123
其中,
Figure BDA0003216099770000124
是回归值,y(i)是预测值,
Figure BDA0003216099770000125
是平均实际值。
1min acc代表实际值与预测值的差值在1分钟内的时间序列数据占时间序列数据总数的百分比。
根据上述结果可以得知,LGBM模型要比Linear模型表现得优秀,模型确定为LGBM。
使用LGBM模型的重要特征排名,选出贡献较高的特征,作为目标特征信息。目标特征信息包括到达晚点模型16维特征和出发晚点模型10维特征。到达晚点模型16维特征和出发晚点模型10维特征分别如表2和表3所示。
表2到达晚点模型特征表
Figure BDA0003216099770000131
其中,序号6特征有三个类别,编码后为三列,序号11特征有4个类别,编码后是四列。
表3出发晚点模型特征表
Figure BDA0003216099770000132
Figure BDA0003216099770000141
S205,将样本集中列车样本的初始晚点时长和目标特征信息输入晚点预测模型,根据时间序列对晚点预测模型的参数进行调整。
在步骤S205中,晚点预测模型为到达晚点时长为5至10分钟的到达晚点模型。LightGBM的学习默认是使用GBDT的,所以损失函数也是GBDT的损失函数,所以LightGBM的损失函数为均方差损失,如公式3所示:
L(y,f(x))=(y-f(x))2 (公式3)
其中,y代表实际值,f(x)代表预测值。
接下来进行模型迭代,模型迭代步骤如下:
输入训练集样本T={(x1,y1),(x2,y2),...(xm,ym)},最大迭代次数T,损失函数为L,其中x代表特征信息,y代表预测值。
首先进行初始化弱学习器,弱学习器的表达式如公式4所示。
Figure BDA0003216099770000142
然后,计算样本i=1,2,...m的负梯度,计算公式如公式5所示。
Figure BDA0003216099770000143
令(xi,rti)(i=1,2,...,m)拟合一棵CART回归树,得到第t棵回归树,其相应的叶子节点区域为Rtj(j=1,2,...j)。其中j为回归树的叶子节点的个数。对叶子节点区域j=1,2,...j,计算最佳拟合值,计算公式如公式6所示。
Figure BDA0003216099770000151
更新强学习器,更新后的强学习器的公式如公式7所示。
Figure BDA0003216099770000152
最后,根据上述公式得到强学习器的表达式,强学习器的表达式如公式8所示。
Figure BDA0003216099770000153
模型参数设置包括以下步骤:
步骤1,由于参数数量较多,采取分部调参,首先将学习率设置为默认值0.1,调整迭代次数。参数设置如表4所示。使用lightgbm.cv(lightgbm封装好的交叉验证方法)设置5折交叉验证,评价指标为MAE。如果MAE连续50次不降低测停止,观察图6中的迭代次数,得到的结果为如表5所示。
表4参数表
序号 参数名称 参数值
1 boosting_type(基学习器类型) gbdt
2 objective(目标:回归/分类) regression
3 learning_rate(学习率) 0.1
4 num_leaves(叶子节点个数) 31
5 max_depth(最大深度) -1(无限制)
6 Subsample(数据条数) 1.0
7 colsample_bytree(特征维数) 1.0
表5测试结果表
参数名称 参数值
best n_estimators(最优迭代次数) 781
best cv score:(评价分数) 92.7965
从图6可以看出,从第90棵树开始,MAE一直有缓慢收敛直至781棵树停止收敛。
步骤2,固定learning_rate为:0.1,n_estimators为:781。最大深度分别设置为max_depth:[4,5,6,7,8],与之对应的叶子节点个数分别为num_leaves:[24,32,64,128,152,256],通过网格搜索sklearn封装好的网格搜索(GridSearchCV)函数对这30组参数进行5折交叉验证(150次)测试结果如表6所示。
表6测试结果表
参数名称 参数值
max_depth 7
num_leaves 32
best cv score:(评价分数) -91.6293
由图7可以看出,观察不同叶子个数对应的数的深度的曲线可知,当max_depth=7,num_leaves=32时MAE效果最好,-91.62较于上次92.79降低1.17。由于sklearn模型评估里的scoring参数都是采用的higher return values are better than lower returnvalues,也就是说,较高的返回值优于较低的返回值,但是lightgbm.cv中采用的mae是越低越好,所以sklearn就提供了'neg_mean_absolute_error'方法,也就是说返回metric的负值,所以就变成负数越大越好,即两指标越趋近于0越好。
步骤3,固定learning_rate为0.1,n_estimators为781,max_depth为7,num_leaves为32,bagging_fraction为[0.5,0.6,0.7,0.8,0.9],feature_fraction为[0.6,0.7,0.8,0.9,1.0],使用网格搜索分别组合对25组参数进行5折交叉验证进行预测(125),预测结果如表7所示。
表7测试结果表
参数名称 参数值
bagging_fraction 1.0
feature_fraction 0.8
best cv score:(评价分数) -92.5532
根据图8可以获取预测结果,由图8中best cv score可知,此次分数-92.55较于上次分数-91.62更小更偏离0值,所以此次调参使得模型效果更差,此次调参结果不使用。
步骤4,固定learning_rate为0.1,n_estimators为781,max_depth7,num_leaves32。分别设置'reg_alpha'为[0.03,0.08,0.3,0.5,0.65,0.75,0.85],'reg_lambda'为[0,0.01,0.08,0.5,0.75],共35组参数,分别进行5折交叉验证(175次训练)。
表8测试结果表
参数名称 参数值
reg_alpha 0.5
reg_lambda 0.5
best cv score:(评价分数) -91.4889
由图9可以获得测试结果。如图9所示,best cv score-91.48较于上次分数-91.62更大,此次调参{'reg_alpha'为0.5,'reg_lambda'为0.5}采用。
步骤5,根据确定好的参数重新降低准确率确定迭代次数LGBMRegressor(max_depth=7,n_estimators=781,num_leaves=32,reg_alpha=0.5,reg_lambda=0.5)调用lightgbm.cv方法,设置5折交叉验证,不断调整学习率观评价指标,最终确定学习率为0.04时模型效果最好。
表9测试结果表
参数名称 参数值
best n_estimators 1807
best cv score:(评价分数) 91.3169
如图10所示,模型在增加到200课棵树以上时MAE仍有微小降低,直至1807次完全停止。
基于MAE的调参结果以及到达晚点模型调参后的准确率和相应指标如表10和表11所示。
表10基于MAE的调参结果表
Figure BDA0003216099770000171
Figure BDA0003216099770000181
表11到达晚点模型调参后的测试结果
Figure BDA0003216099770000182
将表11同表1的测试结果对比可知,参数调整后模型准确率上升,因此使用参数调整后的参数训练模型,并将模型持久化用于预测。
在每个高铁、普铁的不同时间段序列数据中分别随机抽取3000个序列数据做实例测试,部分不足3000序列的数据用总序列数据1/10,其评价指标情况如图11所示。由图11可以看出,晚点时长为0-5分钟的晚点模型和晚点时长为5-10分钟的晚点模型的准确率高于晚点时长为10-30分钟晚点模模型和晚点时长为30分钟以上的晚点模型的准确率。
图12是本发明提供的一种列车晚点预测装置实施例的结构示意图,如图12所示,该装置包括:
第一获取模块1201,用于根据目标列车初始发生晚点,获取目标列车的初始晚点时长和所述目标列车的图定计划特征信息;其中,初始晚点时长包括到达晚点时长或者出发晚点时长;
第二获取模块1202,用于获取初始晚点发生后目标列车将经过的目标车站的运力特征信息、目标列车的历史统计特征信息、目标车站和目标列车的时间特征信息;
第一预测模块1203,用于将初始晚点时长、图定计划特征信息、历史统计特征信息、运力特征信息和时间特征信息输入晚点预测模型,输出目标列车经过目标车站的晚点时长预测值;其中,晚点预测模型包括出发晚点模型和到达晚点模型;晚点时长预测值包括出发晚点时长预测值和/或到达晚点时长预测值;
第二预测模块1204,用于对于相邻两个车站,将前一个车站的出发晚点时长或者出发晚点时长预测值作为到达晚点模型的输入,输出后一个车站的到达晚点时长预测值;
第三预测模块1205,用于对于同一个车站,将该车站的到达晚点时长或者到达晚点时长预测值作为出发晚点模型的输入,输出该车站的出发晚点时长预测值。
可选地,第一预测模块1203,包括:
第一预测单元,用于将发生初始晚点的车站作为当前车站,将当前车站的到站晚点时长、图定计划特征信息、当前车站的图定计划特征信息、历史统计特征信息、当前车站的运力特征信息、当前车站和目标列车的时间特征信息输入出发晚点模型,输出当前车站的出发晚点时长预测值,将当前车站的下一个车站作为当前车站;
第二预测单元,用于将当前车站的上一个车站的出发晚点时长预测值、当前车站的图定计划特征信息、当前车站的历史统计特征信息、当前车站的运力特征信息、当前车站和目标列车的时间特征信息输入到达晚点模型,输出当前车站的到达晚点时长预测值;
第一判断单元,用于判断当前车站是否为目标列车的终点车站;
第三预测单元,用于若当前车站不为目标列车的终点车站,将当前车站的到达晚点时长预测值、当前车站的图定计划特征信息、当前车站的历史统计特征信息、当前车站的运力特征信息、当前车站和目标列车的时间特征信息输入出发晚点模型,输出当前车站的出发晚点时长预测值,将当前车站的下一个车站作为当前车站。
可选地,第一预测模块1203,还包括:
第四预测单元,用于将发生初始晚点的车站的下一个车站作为当前车站,将当前车站的上一个车站的出发晚点时长、当前车站的图定计划特征信息、当前车站的的历史统计特征信息当前车站的运力特征信息、当前车站和目标列车的时间特征信息输入到达晚点模型,输出当前车站的到达晚点时长预测值;
第二判断单元,用于判断当前车站是否为目标列车的终点车站;
第五预测单元,用于若当前车站不为目标列车的终点车站,将当前车站的到达晚点时长预测值、当前车站的图定计划特征信息、当前车站的历史统计特征信息、当前车站的运力特征信息、当前车站和目标列车的时间特征信息输入出发晚点模型,输出当前车站的出发晚点时长预测值,将当前车站的下一个车站作为当前车站;
第六预测单元,用于将当前车站的上一个车站的出发晚点时长预测值、当前车站的图定计划特征信息、当前车站的历史统计特征信息、当前车站的运力特征信息、当前车站和目标列车的时间特征信息输入到达晚点模型,输出当前车站的到达晚点时长预测值。
可选地,该装置还包括:
第一确定模块,用于根据到达晚点时长预测值、出发晚点时长或者出发晚点时长预测值、目标列车在相邻两个车站之间的图定运行时间,得到目标列车在相邻两个车站之间的预测概率值;
第二确定模块,用于根据预设时间段内所有列车在相邻两个车站之间的历史吸收时长和图定运行时间,得到相邻两个车站之间的历史概率值;
第一判断模块,用于判断目标列车在相邻两个车站之间的预测概率值是否大于相邻两个车站之间的历史概率值;
第一修正模块,用于若目标列车在相邻两个车站之间的预测概率值大于相邻两个车站之间的历史概率值,根据相邻两个车站之间的历史概率值修正到达晚点时间预测值。
可选地,该装置还包括:第三确定模块,用于根据到达晚点时长或者到达晚点时长预测值、出发晚点时长预测值、目标列车在该车站的图定停留时间,得到目标列车在该车站的预测概率值;
第四确定模块,用于根据预设时间段内所有列车在该车站的历史吸收时长和图定停留时间,得到该车站的历史概率值;
第二判断模块,用于判断目标列车在该车站的预测概率值是否大于该车站的历史概率值;
第二修正模块,用于若目标列车在该车站的预测概率值大于该车站的历史概率值,根据该车站的历史概率值修正出发晚点时长预测值。
可选地,该装置还包括:
第一匹配模块,用于根据初始晚点时长,确定与初始晚点时长相匹配的晚点预测模型;其中,晚点预测模型包括四个分别对应不同的初始晚点长的晚点预测模型,每一个晚点预测模型均包括出发晚点模型和到达晚点模型;和/或,
第二匹配模块,用于根据目标列车的等级,确定与目标列车等级相匹配的晚点预测模型;其中,晚点预测模型包括二个分别对应不同的等级类型的晚点预测模型,每一个晚点预测模型均包括出发晚点模型和到达晚点模型;
第一预测模块1203,用于将初始晚点长、图定计划特征信息、历史统计特征信息、运力特征信息和时间特征信息输入与初始晚点时长和/或目标列车等级相匹配的晚点预测模型,输出目标列车经过目标车站的晚点时长预测值。
可选地,该装置还包括:
构建模块,用于根据目标铁路线路的列车运行信息,构建样本集;
第五确定模块,用于根据列车的运力信息、图定计划信息、历史统计信息和时间信息,确定样本集中列车样本的初始特征信息组成;
提取模块,用于根据初始晚点时长,对样本集中列车样本的运行信息进行时间序列的提取,并获取样本集中列车样本的初始特征信息;
第六确定模块,用于选取晚点预测模型,并对初始特征信息进行特征选择,得到目标特征信息;目标特征信息包括样本集中列车样本在初始晚点发生后将经过的车站的运力特征信息、图定计划特征信息、历史统计特征信息和时间特征信息,以及列车样本的时间特征信息;
调参模块,用于将样本集中列车样本的初始晚点时长和目标特征信息输入晚点预测模型,根据时间序列对晚点预测模型的参数进行调整。
图13是本发明提供的一种电子设备的实体结构示意图,如图13所示,该电子设备可以包括:处理器(processor)1301、通信接口(Communications Interface)1302、存储器(memory)1303和通信总线1304,其中,处理器1301,通信接口1302,存储器1303通过通信总线1304完成相互间的通信。处理器1301可以调用存储器1303中的逻辑指令,以执行列车晚点预测方法,该方法包括:
根据目标列车初始发生晚点,根据目标列车初始发生晚点,获取目标列车的初始晚点时长和目标列车的图定计划特征信息;其中,初始晚点时长包括到达晚点时长或者出发晚点时长;获取初始晚点发生后目标列车将经过的目标车站的运力特征信息、目标列车的历史统计特征信息、目标车站和目标列车的时间特征信息;将初始晚点时长、历史统计特征信息、运力特征信息和时间特征信息输入晚点预测模型,输出目标列车经过目标车站的晚点时长预测值;其中,晚点预测模型包括出发晚点模型和到达晚点模型;晚点时长预测值包括出发晚点时长预测值和/或到达晚点时长预测值;对于相邻两个车站,将前一个车站的出发晚点时间或者出发晚点时长预测值作为到达晚点模型的输入,输出后一个车站的到达晚点时长预测值;对于同一个车站,将该车站的到达晚点时长或者到达晚点时长预测值作为出发晚点模型的输入,输出该车站的出发晚点时长预测值。。
此外,上述的存储器1303中的逻辑指令可以通过软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的列车晚点预测方法,该方法包括:
根据目标列车初始发生晚点,获取目标列车的初始晚点时长和目标列车的图定计划特征信息;其中,初始晚点时长包括到达晚点时长或者出发晚点时长;获取初始晚点发生后目标列车将经过的目标车站的运力特征信息、目标列车的历史统计特征信息、目标车站和目标列车的时间特征信息;将初始晚点时长、历史统计特征信息、运力特征信息和时间特征信息输入晚点预测模型,输出目标列车经过目标车站的晚点时长预测值;其中,晚点预测模型包括出发晚点模型和到达晚点模型;晚点时长预测值包括出发晚点时长预测值和/或到达晚点时长预测值;对于相邻两个车站,将前一个车站的出发晚点时间或者出发晚点时长预测值作为到达晚点模型的输入,输出后一个车站的到达晚点时长预测值;对于同一个车站,将该车站的到达晚点时长或者到达晚点时长预测值作为出发晚点模型的输入,输出该车站的出发晚点时长预测值。又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法所提供的列车晚点预测方法,该方法包括:
根据目标列车初始发生晚点,获取目标列车的初始晚点时长和目标列车的图定计划特征信息;其中,初始晚点时长包括到达晚点时长或者出发晚点时长;获取初始晚点发生后目标列车将经过的目标车站的运力特征信息、目标列车的历史统计特征信息、目标车站和目标列车的时间特征信息;将初始晚点时长、历史统计特征信息、运力特征信息和时间特征信息输入晚点预测模型,输出目标列车经过目标车站的晚点时长预测值;其中,晚点预测模型包括出发晚点模型和到达晚点模型;晚点时长预测值包括出发晚点时长预测值和/或到达晚点时长预测值;对于相邻两个车站,将前一个车站的出发晚点时间或者出发晚点时长预测值作为到达晚点模型的输入,输出后一个车站的到达晚点时长预测值;对于同一个车站,将该车站的到达晚点时长或者到达晚点时长预测值作为出发晚点模型的输入,输出该车站的出发晚点时长预测值。以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种列车晚点预测方法,其特征在于,包括:
根据目标列车初始发生晚点,获取所述目标列车的初始晚点时长和所述目标列车的图定计划特征信息;其中,所述初始晚点时长包括到达晚点时长或者出发晚点时长;
获取所述初始晚点发生后所述目标列车将经过的目标车站的运力特征信息、所述目标列车的历史统计特征信息、所述目标车站和所述目标列车的时间特征信息;
将所述初始晚点时长、所述图定计划特征信息、所述历史统计特征信息、所述运力特征信息和所述时间特征信息输入晚点预测模型,输出所述目标列车经过所述目标车站的晚点时长预测值;
其中,所述晚点预测模型包括出发晚点模型和到达晚点模型;所述晚点时长预测值包括出发晚点时长预测值和/或到达晚点时长预测值;
对于相邻两个车站,将前一个车站的所述出发晚点时长或者所述出发晚点时长预测值作为所述到达晚点模型的输入,输出后一个车站的所述到达晚点时长预测值;
对于同一个车站,将该车站的所述到达晚点时长或者所述到达晚点时长预测值作为所述出发晚点模型的输入,输出该车站的所述出发晚点时长预测值。
2.根据权利要求1所述的列车晚点预测方法,其特征在于,所述将所述初始晚点时长、所述图定计划特征信息、所述历史统计特征信息、所述运力特征信息和所述时间特征信息输入晚点预测模型,输出所述目标列车经过所述目标车站的晚点时长预测值,包括:
将发生所述初始晚点的车站作为当前车站,将所述当前车站的所述到站晚点时长、所述当前车站的图定计划特征信息、所述当前车站的历史统计特征信息、所述当前车站的所述运力特征信息、所述当前车站和所述目标列车的时间特征信息输入所述出发晚点模型,输出所述当前车站的所述出发晚点时长预测值,将所述当前车站的下一个车站作为当前车站;
将所述当前车站的上一个车站的所述出发晚点时长预测值、所述当前车站的所述图定计划特征信息、所述当前车站的所述历史统计特征信息、所述当前车站的所述运力特征信息、所述当前车站和所述目标列车的时间特征信息输入所述到达晚点模型,输出所述当前车站的所述到达晚点时长预测值;
判断所述当前车站是否为所述目标列车的终点车站;
若所述当前车站不为所述目标列车的终点车站,将所述当前车站的所述到达晚点时长预测值、所述当前车站的所述图定计划特征信息、所述当前车站的所述历史统计特征信息、所述当前车站的所述运力特征信息、所述当前车站和所述目标列车的时间特征信息输入所述出发晚点模型,输出所述当前车站的所述出发晚点时长预测值,将所述当前车站的下一个车站作为当前车站。
3.根据权利要求1所述的列车晚点预测方法,其特征在于,所述将所述初始晚点时间、所述图定计划特征信息、所述历史统计特征信息、所述运力特征信息和所述时间特征信息输入晚点预测模型,输出所述目标列车经过所述目标车站的晚点时长预测值,包括:
将发生所述初始晚点的车站的下一个车站作为当前车站,将所述当前车站的上一个车站的所述出发晚点时长、所述当前车站的所述图定计划特征信息、所述当前车站的的所述历史统计特征信息、所述当前车站的所述运力特征信息、所述当前车站和所述目标列车的时间特征信息输入所述到达晚点模型,输出所述当前车站的所述到达晚点时长预测值;
判断所述当前车站是否为所述目标列车的终点车站;
若所述当前车站不为所述目标列车的终点车站,将所述当前车站的所述到达晚点时长预测值、所述当前车站的所述图定计划特征信息、所述当前车站的所述历史统计特征信息、所述当前车站的所述运力特征信息、所述当前车站和所述目标列车的时间特征信息输入所述出发晚点模型,输出所述当前车站的所述出发晚点时长预测值,将所述当前车站的下一个车站作为当前车站;
将所述当前车站的上一个车站的所述出发晚点时长预测值、所述当前车站的所述图定计划特征信息、所述当前车站的所述历史统计特征信息、所述当前车站的所述运力特征信息、所述当前车站和所述目标列车的时间特征信息输入所述到达晚点模型,输出所述当前车站的所述到达晚点时长预测值。
4.根据权利要求1至3中任一项所述的列车晚点预测方法,其特征在于,所述将前一个车站的所述出发晚点时长或者所述出发晚点时长预测值作为所述到达晚点模型的输入,输出后一个车站的所述到达晚点时间预测值之后,还包括:
根据所述到达晚点时长预测值、所述出发晚点时长或者所述出发晚点时长预测值、所述目标列车在所述相邻两个车站之间的图定运行时间,得到所述目标列车在所述相邻两个车站之间的预测概率值;
根据预设时间段内所有列车在所述相邻两个车站之间的历史吸收时长和图定运行时间,得到所述相邻两个车站之间的历史概率值;
判断所述目标列车在所述相邻两个车站之间的预测概率值是否大于所述相邻两个车站之间的历史概率值;
若所述目标列车在所述相邻两个车站之间的预测概率值大于所述相邻两个车站之间的历史概率值,根据所述相邻两个车站之间的历史概率值修正所述到达晚点时长预测值。
5.根据权利要求1至3中任一项所述的列车晚点预测方法,其特征在于,所述将该车站的所述到达晚点时长或者所述到达晚点时长预测值作为所述出发晚点模型的输入,输出该车站的所述出发晚点时长预测值之后,还包括:
根据所述到达晚点时长或者所述到达晚点时长预测值、所述出发晚点时长预测值、所述目标列车在该车站的图定停留时间,得到所述目标列车在该车站的预测概率值;
根据预设时间段内所有列车在该车站的历史吸收时长和图定停留时间,得到该车站的历史概率值;
判断所述目标列车在该车站的预测概率值是否大于该车站的历史概率值;
若所述目标列车在该车站的预测概率值大于该车站的历史概率值,根据该车站的历史概率值修正所述出发晚点时长预测值。
6.根据权利要求5所述的列车晚点预测方法,其特征在于,所述将所述初始晚点时长、所述图定计划特征信息、所述历史统计特征信息、所述运力特征信息和所述时间特征信息输入晚点预测模型,输出所述目标列车经过所述目标车站的晚点时长预测值之前,还包括:
根据所述初始晚点时长,确定与所述初始晚点时长相匹配的晚点预测模型;其中,所述晚点预测模型包括四个分别对应不同的初始晚点时长的晚点预测模型,每一个所述晚点预测模型均包括出发晚点模型和到达晚点模型;和/或,
根据所述目标列车的等级,确定与所述目标列车等级相匹配的晚点预测模型;其中,所述晚点预测模型包括二个分别对应不同的等级类型的晚点预测模型,每一个所述晚点预测模型均包括出发晚点模型和到达晚点模型;
所述将所述初始晚点时长、所述图定计划特征信息、所述历史统计特征信息、所述运力特征信息和所述时间特征信息输入晚点预测模型,输出所述目标列车经过所述目标车站的晚点时长预测值,包括:
将所述初始晚点时长、所述图定计划特征信息、所述历史统计特征信息、所述运力特征信息和所述时间特征信息输入与所述初始晚点时长和/或所述目标列车等级相匹配的晚点预测模型,输出所述目标列车经过所述目标车站的晚点时长预测值。
7.根据权利要求6所述的列车晚点预测方法,其特征在于,还包括:
根据目标铁路线路的列车运行信息,构建样本集;
根据列车的运力信息、图定计划信息、历史统计信息和时间信息,确定所述样本集中列车样本的初始特征信息组成;
根据初始晚点时长,对所述样本集中列车样本的运行信息进行时间序列的提取,并获取所述样本集中列车样本的所述初始特征信息;
选取晚点预测模型,并对所述初始特征信息进行特征选择,得到目标特征信息;所述目标特征信息包括所述样本集中列车样本在所述初始晚点发生后将经过的车站的运力特征信息、图定计划特征信息、历史统计特征信息和时间特征信息,以及所述列车样本的时间特征信息;
将所述样本集中列车样本的所述初始晚点时长和所述目标特征信息输入所述晚点预测模型,根据所述时间序列对所述晚点预测模型的参数进行调整。
8.一种列车晚点预测装置,其特征在于,包括:
第一获取模块,用于根据目标列车初始发生晚点,获取所述目标列车的初始晚点时长和所述目标列车的图定计划特征信息;其中,所述初始晚点时长包括到达晚点时间或者出发晚点时长;
第二获取模块,用于获取所述初始晚点发生后所述目标列车将经过的目标车站的运力特征信息、所述目标列车的历史统计特征信息、所述目标车站和所述目标列车的时间特征信息;
第一预测模块,用于将所述初始晚点时长、所述图定计划特征信息、所述历史统计特征信息、所述运力特征信息和所述时间特征信息输入晚点预测模型,输出所述目标列车经过所述目标车站的晚点时长预测值;其中,所述晚点预测模型包括出发晚点模型和到达晚点模型;所述晚点时长预测值包括出发晚点时长预测值和/或到达晚点时长预测值;
第二预测模块,用于对于相邻两个车站,将前一个车站的所述出发晚点时长或者所述出发晚点时长预测值作为所述到达晚点模型的输入,输出后一个车站的所述到达晚点时长预测值;
第三预测模块,用于对于同一个车站,将该车站的所述到达晚点时长或者所述到达晚点时长预测值作为所述出发晚点模型的输入,输出该车站的所述出发晚点时长预测值。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1~7任一项所述的列车晚点预测方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1~7任一项所述的列车晚点预测方法的步骤。
CN202110943759.3A 2021-08-17 2021-08-17 一种列车晚点预测方法、装置、设备和介质 Active CN113850411B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110943759.3A CN113850411B (zh) 2021-08-17 2021-08-17 一种列车晚点预测方法、装置、设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110943759.3A CN113850411B (zh) 2021-08-17 2021-08-17 一种列车晚点预测方法、装置、设备和介质

Publications (2)

Publication Number Publication Date
CN113850411A true CN113850411A (zh) 2021-12-28
CN113850411B CN113850411B (zh) 2023-04-07

Family

ID=78975826

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110943759.3A Active CN113850411B (zh) 2021-08-17 2021-08-17 一种列车晚点预测方法、装置、设备和介质

Country Status (1)

Country Link
CN (1) CN113850411B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013114543A (ja) * 2011-11-30 2013-06-10 Dainippon Printing Co Ltd 遅延情報取得システム及び遅延情報取得サーバ
CN110969295A (zh) * 2019-11-25 2020-04-07 北京交通大学 列车区段延误预测误差控制方法
CN112070325A (zh) * 2020-11-12 2020-12-11 北京交通大学 非正常事件下路网列车优化方法、装置、设备及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013114543A (ja) * 2011-11-30 2013-06-10 Dainippon Printing Co Ltd 遅延情報取得システム及び遅延情報取得サーバ
CN110969295A (zh) * 2019-11-25 2020-04-07 北京交通大学 列车区段延误预测误差控制方法
CN112070325A (zh) * 2020-11-12 2020-12-11 北京交通大学 非正常事件下路网列车优化方法、装置、设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
胡雨欣等: "基于初始晚点和冗余时间的列车晚点恢复时间预测模型", 《交通运输工程与信息学报》 *
黄平等: "武广高速铁路列车晚点恢复时间预测的随机森林模型", 《铁道学报》 *

Also Published As

Publication number Publication date
CN113850411B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN109840639B (zh) 一种高速铁路列车运行晚点时间预测方法
CN108596396B (zh) 一种基于养护历史修正的路面性能预测和养护方法及装置
CN112286924A (zh) 一种数据异常动态识别与多模式自匹配的数据清洗技术
CN110427360A (zh) 轨迹数据的处理方法、处理装置、处理系统及计算机程序产品
Kosijer et al. Multicriteria decision-making in railway route planning and design
CN110795868B (zh) 基于城市轨道交通的列车运行仿真的数据处理方法和装置
CN105091889A (zh) 一种热点路径的确定方法及设备
CN112036490B (zh) 一种铁路纵断面线形的识别重构方法
CN107730893B (zh) 一种基于乘客出行多维特征的共享巴士站点客流预测方法
CN110309962A (zh) 基于时间扩展模型的铁路行程路线规划方法及装置
CN110909953A (zh) 一种基于ann-lstm的泊位预测方法
CN113850411B (zh) 一种列车晚点预测方法、装置、设备和介质
CN112258029A (zh) 地铁站周边共享单车的需求预测方法
CN104978859A (zh) 一种计算城市任意区域公交线网密度的方法
CN110675074A (zh) 出行目标点识别方法及装置、模型开发、评价方法及装置
CN107272407B (zh) 一种ato系统行程方案的评价方法及系统
CN113645280A (zh) 车辆位置数据上传方法、装置、电子设备及存储介质
CN111160594B (zh) 一种到达时间的预估方法、装置及存储介质
CN113807560A (zh) 一种物流成本预测方法、装置、电子设备以及存储介质
CN115195829B (zh) 基于时序的行车仿真方法及装置
CN113689081B (zh) 基于正态云模型的自动驾驶道路测试数据质量确定方法
CN113465613B (zh) 一种城市轨道交通中隧道网络定位的地图匹配优化方法
CN113847923A (zh) 预估到达时间的计算方法、装置、电子设备和可读存储介质
CN111874045B (zh) 城市轨道交通正线通过能力确定方法及装置
CN112906915A (zh) 一种基于深度学习的轨交系统故障诊断方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant