CN113673818B

CN113673818B - 一种调整行车折返能力的方法及装置

Info

Publication number: CN113673818B
Application number: CN202110790356.XA
Authority: CN
Inventors: 张诣元
Original assignee: Traffic Control Technology TCT Co Ltd
Current assignee: Traffic Control Technology TCT Co Ltd
Priority date: 2021-07-13
Filing date: 2021-07-13
Publication date: 2024-04-19
Anticipated expiration: 2041-07-13
Also published as: CN113673818A

Abstract

本发明提供一种调整行车折返能力的方法及装置，所述方法包括：获取应用层数据，所述应用层数据包括轨道交通线路的行车折返数据；对所述应用层数据进行关联性分析，获取影响行车折返能力的所有频繁项集，构建频繁项集集合；根据所述频繁项集集合，确定影响行车折返能力的影响因子；调整所述影响因子所对应的行车设置，以调整行车折返能力。本发明提供的调整行车折返能力的方法及装置，通过对行车折返数据进行大数据分析，获取影响行车折返能力稳定与效率的影响因子，并进行综合调整，能够提高分析列车折返影响因素的准确性，可以有针对性的提高列车的折返运行效率，进而为整个轨道交通运营能力的提升提供有力的保障。

Description

一种调整行车折返能力的方法及装置

技术领域

本发明涉及轨道交通技术领域，尤其涉及一种调整行车折返能力的方法及装置。

背景技术

随着城轨网络化与智能化的迅速发展，现有线路的运能与日益增长的运能需求之间的差距越来越大，因此如何提高城轨运能，缩短城轨运能与运能需求之间的差距，成为了亟需解决的技术问题。提高城轨运能的重要方法之一就是提高城轨的发车频率，而列车的当日折返能力(简称折返能力)是阻碍城轨发车频率变高的一个关键限制条件。因此，优化列车折返能力对提高城轨运能，缩短运能与日益提高的运能需求之间的差距有重要的意义。

现有技术在进行城轨交通线路折返能力计算时，一般是采用图解计算或者仿真计算的方法，如：先根据已有的城轨线路设计图，勾画出折返站存在的折返渡线图；再根据折返渡线图绘制出每一种折返方式下列车的折返作业进程图；然后，根据折返作业进程图计算每一种折返方式下单列车在折返站的折返时间，进而确定出不同折返方式下的列车折返能力。

采用上述图解计算的方法进行行车折返能力的调整，往往需要进行大批量的城轨行车折返数据的业务流程分析以构建折返渡线图，分析的精度低、效率不高，致使运营单位无法最大限度的提升城轨单线折返站折返能力及线路运营能力。

发明内容

本发明提供一种调整行车折返能力的方法及装置，用以解决现有技术中分析行车折返能力精度差、效率低的缺陷。

第一方面，本发明提供一种调整行车折返能力的方法，包括：获取应用层数据，所述应用层数据包括轨道交通线路的行车折返数据；对所述应用层数据进行关联性分析，获取影响行车折返能力的所有频繁项集，构建频繁项集集合；根据所述频繁项集集合，确定影响行车折返能力的影响因子；调整所述影响因子所对应的行车设置，以调整行车折返能力。

根据本发明提供的一种调整行车折返能力的方法，所述获取应用层数据，具体包括：获取所述轨道交通线路的运营日志数据；

将所述运营日志数据以二进制数据的形式，发送至分布式消息系统；基于分布式流处理读取所述分布式消息系统中存储的二进制数据，并对所述二进制数据进行数据解析以及数据结构化后，存储至分布式文件系统；根据影响行车折返能力的指标，在所述分布式文件系统中生成应用层数据宽表；获取所述应用层数据宽表中的行车折返数据。

根据本发明提供的一种调整行车折返能力的方法，所述对所述应用层数据进行关联性分析，获取影响行车折返能力的所有频繁项集，构建频繁项集集合，具体包括：遍历所述应用层数据，构建头指针表；所述头指针表中记载有至少一个元素项以及每个元素项出现的总次数；每个所述元素项出现的总次数大于预设最小值尺度；初始化空频繁模式树，并利用所述头指针表更新所述空频繁模式树，以获取目标频繁模式树；将行车折返能力作为频繁项，从所述目标频繁模式树中获取每个所述频繁项的条件模式基；初始化空频繁模式树，并分别利用每个所述条件模式基，对所述空频繁模式树进行更新，以获取与每个所述条件模式基所对应的条件频繁模式树；在每个所述条件频繁模式树中抽取频繁项集，以构建所述频繁项集集合。

根据本发明提供的一种调整行车折返能力的方法，所述在每个所述条件频繁模式树中抽取频繁项集，以构建所述频繁项集集合，具体包括：以所述头指针表上的任一所述元素项作为开始节点，获取从所述开始节点到根节点之间的条件模式基，构建一个频繁项集；所述条件模式基包括从所述开始节点到所述根节点之间的前缀路径，以及所述前缀路径的数量；所述根节点为所述频繁项在所述条件频繁模式树中所对应的节点；遍历所述头指针表上的所有所述元素项，构建所述频繁项集集合。

根据本发明提供的一种调整行车折返能力的方法，所述根据所述频繁项集集合，确定影响行车折返能力的影响因子具体包括：根据所述频繁项集集合中每个所述频繁项集的置信度和支持度，对所述频繁项集集合进行筛选过滤，获取目标频繁项集集合；根据所述目标频繁项集集合，确定所述影响因子。

根据本发明提供的一种调整行车折返能力的方法，根据所述频繁项集集合中每个所述频繁项集的置信度和支持度，对所述频繁项集集合进行筛选过滤，获取目标频繁项集集合，具体包括：计算每个所述频繁项集的支持度和置信度；根据每个所述频繁项集的支持度和置信度，对所述频繁项集集合进行筛选过滤，获取所述目标频繁项集集合；所述目标频繁项集集合中的每个频繁项集的支持度大于或等于最小支持度阈值，且每个频繁项集的置信度大于或等于最小置信度阈值。

根据本发明提供的一种调整行车折返能力的方法，所述计算每个所述频繁项集的支持度和置信度，具体包括：针对任一目标频繁项集，获取所述目标频繁项集中，所有元素项综合对折返能力的第一影响概率，并将所述第一影响概率作为所述频繁项集的支持度；获取所述目标频繁项集的开始节点所对应的元素项对折返能力的第二影响概率；根据所述第一影响概率与所述第二影响概率的比值，确定所述目标频繁项集的置信度。

根据本发明提供的一种调整行车折返能力的方法，在调整所述影响因子所对应的行车设置之后，还包括：基于深度时空网络模型，获取所述轨道交通线路的当日城轨交通客流量；根据所述当日城轨交通客流量，确定当日列车折返标准值；从所述应用层数据中，确定当日列车折返次数；根据所述当日列车折返次数与所述当日列车折返标准值的比值，确定当日列车折返能力值；利用所述当日列车折返能力值，以检验在调整所述行车设置之后对行车折返能力的调整结果。

第二方面，本发明还提供一种调整行车折返能力的装置，包括：数据采集单元，用于获取应用层数据，所述应用层数据包括轨道交通线路的行车折返数据；关联性分析单元，用于对所述应用层数据进行关联性分析，获取影响行车折返能力的所有频繁项集，构建频繁项集集合；影响因子筛选单元，用于根据所述频繁项集集合，确定影响行车折返能力的影响因子；行车设置调整单元，用于调整所述影响因子所对应的行车设置，以调整行车折返能力。

第三方面，本发明提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述调整行车折返能力的方法步骤。

第四方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述调整行车折返能力的方法步骤。

本发明提供的调整行车折返能力的方法及装置，通过对行车折返数据进行大数据分析，获取影响行车折返能力稳定与效率的影响因子，并进行综合调整，能够提高分析列车折返影响因素的准确性，可以有针对性的提高列车的折返运行效率，进而为整个轨道交通运营能力的提升提供有力的保障。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明提供的调整行车折返能力的方法的流程示意图；

图2是本发明提供的一种FP树的结构示意图；

图3是本发明提供的一种构建创建FP树的数据结构代码的示意图；

图4是本发明提供的一种头指针表的示意图；

图5是本发明提供的一种剔除非频繁项集的超集的示意图；

图6是本发明提供一种调整行车折返能力的装置；

图7是本发明提供的电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，在本发明实施例的描述中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。术语“上”、“下”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本发明中的具体含义。

本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象，而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施，且“第一”、“第二”等所区分的对象通常为一类，并不限定对象的个数，例如第一对象可以是一个，也可以是多个。此外，说明书以及权利要求中“和/或”表示所连接对象的至少其中之一，字符“/”，一般表示前后关联对象是一种“或”的关系。

在城轨运营的过程中，会产生大量的行车数据，这些数据多而杂，从而导致在利用这些行车数据，分析行车调度相关的业务流程以及构建维度模型时均会十分复杂。并且，当前对于行车数据的治理处于初步的阶段，也导致根据数据治理系统所生成的应用层数据进行数据挖掘具有一定的局限性。

本发明提供了一种基于轨道交通线路的行车折返数据，以调整行车折返能力的方法及装置，能够实现对应用层数据的大数据分析，精准分析出影响列车折返能力的相关影响因子，以实现通过对相关影响因子的调整，为有效地提高列车折返能力提供了一种新方式。

下面结合图1-图7描述本发明实施例所提供的调整行车折返能力的方法和装置。

图1是本发明提供的调整行车折返能力的方法的流程示意图，如图1所示，包括但不限于以下步骤：

步骤101：获取应用层数据，所述应用层数据包括轨道交通线路的行车折返数据。

首先，通过获取大量待调整的轨道交通线路上的运营日志数据，并将所有的运营日志数据进行数据转换、类型划分，以根据数据指标生成对应的应用层数据。

其中，数据指标可以是数据的类型指标、相关性指标、格式指标等。

在本发明中，可以根据相关性指标，从所有的运营日志数据中筛选出与行车折返相关的行车折返数据(如：列车运行时间、折返进站时间、折返出站时间等)，并利用所获取的行车折返数据构建出数据应用层宽表，则所述数据应用层宽表中所记载的数据则为应用层数据。

可选地，在获取运营日志数据之后，还可以对所有数据进行预处理，如：过滤不合规的数据、清洗无意义的数据、去除明显错误的数据或波动大的数据、合并相同或相似的数据，对于预处理的实际执行方式，本发明不作具体地限定。

步骤102：对所述应用层数据进行关联性分析，获取影响行车折返能力的所有频繁项集，构建频繁项集集合。

可选地，本发明通过对采集的应用层数据进行关联性分析，如采用关联规则算法(Apriori算法)或者频繁模式增长算法(FP-growth算法)，对应用层数据中影响行车折返能力的因素进行关联性分析，以获取所有影响行车折返能力的频繁项集。

其中，Apriori算法主要是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集，包括：利用逐层搜索的迭代方法找出应用层数据中各元素项的关系，以形成规则，其过程由连接(包括类矩阵运算)与剪枝(包括去掉那些没必要的中间结果)组成。Apriori算法中项集的概念即为项的集合，包含k个元素项的集合为k项集。每个项集出现的频率是包含项集的次数，称为项集的频率。如果某项集满足最小支持度，则称其为频繁项集。

FP-growth算法则是通过将应用层数据存储在一个特定的称作频繁模式树(Frequent Pattern Tree，FP-Tree)的结构之后，发现频繁项集或频繁项对，即常在一块出现的元素项的集合。

由于，在轨道交通线路的应用层数据中与行车折返相关的行车折返数据的来源众多，所以在对应用层数据进行关联性分析的过程中，可以生成多个频繁项集，构建成频繁项集集合。

步骤103：根据所述频繁项集集合，确定影响行车折返能力的影响因子。

可选地，在获取到所有的与折返能力相关的所有频繁项集之后，由于其中可能存在许多实际不相关(或关联性极小)的频繁项集。有鉴于此，在本发明提供的调整行车折返能力的方法中，可以针对频繁项集集合中任意一个频繁项集，分别计算其支持度和置信度，然后利用相关阈值，将上述实际不相关的频繁项集进行剔除，并将剩下的所有的频繁项集中的元素项作为影响行车折返能力的影响因子。

其中，支持度可以是指项集在所有数据中出现的频率，置信度表示某个关联规则的概率。

步骤104：调整所述影响因子所对应的行车设置，以调整行车折返能力。

最后，在充分满足行车折返实际要求的前提下，对步骤103中所筛选出的影响因子进行适当的调整，则能够最大程度的提升行车折返能力。

例如，通过关联性分析获取到的影响行车折返能力的影响因子包括：后车折返进站间隔；当前的后车折返进站间隔为2分钟，但是在适当的将后车折返进站间隔设置为1分半钟的时候，不但能够节省行车折返时间，且不会对行车进站安全造成影响。

需要说明的是，若单纯的对某一个影响因子相关的行车设置进行调整可能收效甚微，但本发明所提供的调整行车折返能力的方法，能够通过对应用层数据进行大数据分析，能够最大程度的获取到所有影响行车折返能力的影响因子，在对所有影响因子均进行一定程度的调整的情况下，则能够最大程度地提高行车折返能力。

本发明提供的调整行车折返能力的方法，通过对行车折返数据进行大数据分析，获取影响行车折返能力稳定与效率的影响因子，并进行综合调整，能够提高分析列车折返影响因素的准确性，可以有针对性的提高列车的折返运行效率，进而为整个轨道交通运营能力的提升提供有力的保障。

基于上述实施例的内容，作为一种可选实施例，所述获取应用层数据，具体包括：

获取所述轨道交通线路的运营日志数据；

将所述运营日志数据发送至分布式消息系统，以生成二进制数据；

基于分布式流处理读取所述二进制数据，并对所述二进制数据进行数据解析以及数据结构化后，存储至分布式文件系统；

根据影响行车折返能力的指标，在所述分布式文件系统中生成应用层数据宽表；

获取所述应用层数据宽表中的行车折返数据。

具体来说，本发明提供了一种获取应用层数据的获取方法，主要包括：

首先，实时采集待处理的轨道交通线路相关的运营日志数据，并实时将获取的运营日志数据与二进制数据的方式发送到分布式消息系统中。

由于分布式发布订阅消息系统Kafka，是一个分布式、支持分区的(partition)、多副本的(replica)、基于zookeeper协调的分布式消息系统，其最大的特性就是可以实时的处理大量数据以满足各种需求场景：比如基于hadoop的批处理系统、低延迟的实时系统、storm/Spark流式处理引擎，web/nginx日志、访问日志，消息服务等。故本发明提供的调整行车折返能力的方法中，选择采用高吞吐量的分布式发布订阅消息系统Kafka作为存储运营日志数据的分布式消息系统

然后，再通过分布式流处理来读取Kafka中的二进制数据。其中分布式流处理的工具可以选用分布式流处理开源框架Flink，以能够实时读取Kafka中的二进制数据。

进一步地，在对读取出的二进制数据进行数据治理，如：数据解析以及数据结构化之后，将所有数据均注入至分布式文件系统，如：基于Hadoop的数据仓库工具HIVE，或者分布式文件系统(Hadoop Distributed File System，HDFS)中。

其中，数据仓库工具HIVE是基于Hadoop构建的一套数据仓库分析系统，它提供了丰富的SQL查询方式来分析

其中，HIVE是基于Hadoop构建的一套数据仓库分析系统，其提供了丰富的结构化查询方式(Structured Query Language，SQL)来分析存储在Hadoop分布式文件系统中的数据：可以将结构化的数据文件映射为一张数据库表，并提供完整的SQL查询功能；可以将SQL语句转换为MapReduce任务运行，通过自己的SQL查询分析需要的内容。

HDFS是指被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统(Distributed File System)，其与现有的分布式文件系统有很多共同点，但同时与其他的分布式文件系统的区别也是很明显的。HDFS是一个高度容错性的系统，适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问，非常适合大规模数据集上的应用，最适合本发明中存在大量行车折返数据的应用程序。

对经过数据治理的所有数据进行预处理，包括数据转换，数据细分等，然后根据影响行车折返能力的指标，由所有数据生成对应的数据应用层宽表，即实现了将所有行车折返数据均以表格的形式存储分布式文件系统以供调用分析。

本发明提供的调整行车折返能力的方法，通过对大量的运营日志数据进行数据整理以及数据存储处理，构建出应用层数据宽表，以供调用，有效地提高的数据的利用效率，简化了数据的分析流程，为后期进行行车折返能力的检测及调整，提供了数据基础。

基于上述实施例的内容，作为一种可选实施例，所述对所述应用层数据进行关联性分析，获取影响行车折返能力的所有频繁项集，构建频繁项集集合，具体包括：

遍历所述应用层数据，构建头指针表；所述头指针表中记载有至少一个元素项以及每个元素项出现的总次数；每个所述元素项出现的总次数大于预设最小值尺度；

初始化空频繁模式树，并利用所述头指针表更新所述空频繁模式树，以获取目标频繁模式树；

将行车折返能力作为频繁项，从所述目标频繁模式树中获取每个所述频繁项的条件模式基；

初始化空频繁模式树，并分别利用每个所述条件模式基，对所述空频繁模式树进行更新，以获取与每个所述条件模式基所对应的条件频繁模式树；

在每个所述条件频繁模式树中抽取频繁项集，以构建所述频繁项集集合。

可选地，本发明提供的调整行车折返能力的方法，基于Apriori算法、FP-growth算法等关联性分析方法，对获取到的应用层数据进行折返能力关联性分析，以得到影响折返能力的频繁项集。

首先，可以预先将本发明中所提到的以下特征，注释如下：

FP-Tree是指将应用层数据宽表中的各应用层数据，按照支持度排序后，并把每个事务中的数据项按降序依次插入到一棵以NULL为根结点的树中，同时在每个结点处记录该结点出现的次数。

条件模式基：条件模式基是以所查找元素项(本发明可以设置为折返能力)为结尾的路径集合，即包含FP-Tree中与后缀次数一起出现的前缀路径的集合。

条件FP-Tree：将条件模式基按照FP-Tree的构造原则形成的一个新的FP-Tree。

作为一种可选实施例，可以采用FP-growth算法进行关联性分析为例，对本发明提供的频繁项集的确定方法进行说明。

在获取到所有应用层数据之后，可以先扫描一遍整个应用层数据，将与行车折返能力相关的每个数据，作为频繁项为1的元素项。

还可以，定义最小值尺度(即元素项出现的最小次数，例如设置为2)，以删除那些出现次数小于最小支持度的元素项。

然后，将所有元素项按照出现次数进行降序排列，获取一次扫描后的应用层数据。

对一次扫描后的应用层数据进行二次扫描，即开始遍历所述一次扫描后的应用层数据，创建头指针表(Header Table)。其中，头指针表记载有所有元素项以及每个元素项出现的总次数。

初始化一个空FP树，并利用头指针表对其进行更新，获取到更新后的FP树作为目标FP树。

图2是本发明提供的一种FP树的结构示意图，由图2所示，可以获知：

路径1：{t，s，y，x，z}出现过两次、路径2：{t，r，y，x，z}出现了一次、而路径3{z}独自出现过1次(此时路径3中仅包括1个元素项)，并按此方式，可以获取由针表上的每个元素项作为开始节点的所有路径。

作为另一实施例，图3是本发明提供的一种构建创建FP树的数据结构代码的示意图，在构建FP树之前，还可以采用如图3所示的方式创建FP树的数据结构代码。

图4是本发明提供的一种头指针表的示意图，构建如图4所示的头指针表，头指针表即为用来记录各个元素项的总出现次数的数组，再附带一个指针指向FP树中该元素项的第一个节点。

例如：头指针表中的第一行数据z:5，表示元素项z的出现总次数为5；第二行r:3，表示元素项r的出现总次数为3；并以此类推，在头指针表中依次记载有所有元素项以及每个元素项出现的总次数。

进一步地，以图4中的第5行s:3为例，其指针指向FP树中的s：2，设根节点为x:1，则由头指针表上的元素项s作为开始节点至根节点x:1的路径作为一条单链表，该单链表中包括元素项{s，y，x}，出现的次数为1。

需要说明的是，FP树会存储项集和每个项集的出现频率(也就是每个可能影响折返能力且发生变化的元素项以及元素项出现的频率)，例如：牵引制动性能，道岔限速等项集，以及每个项集出现的次数，而每个项集会以路径的方式存储在FP树中。

存在相同元素项的集合会共享FP树的一部分，只有当元素项之间完全不同时，FP树才会出现分叉。在FP树的节点上给出每个元素项及其每个元素项在当前链接中的出现次数，路径会给出该链接的出现次数。相似的元素项之间的链接称为节点链接(Node Link)，用于快速发现相似元素项的位置。

本发明提供的调整行车折返能力的方法，提供了一种对应用层数据进行关联性分析的方法，通过构建FP树以筛选出频繁项集，能够有效地分析各应用层数据与行车折返能力的相关性，获取真实影响行车折返能力的频繁项集，决行车折返相关的应用层数据的业务流程分析以及维度模型建立的难点，从而能够准确、快速地获取到影响列车折返的影响因子，准确性高，能为后续优化行车折返能力提供了有力的保障。

基于上述实施例的内容，作为一种可选实施例，所述在每个所述条件频繁模式树中抽取频繁项集，以构建所述频繁项集集合，具体包括：

以所述头指针表上的任一所述元素项作为开始节点，获取从所述开始节点到根节点之间的条件模式基，构建一个频繁项集；

所述条件模式基包括从所述开始节点到所述根节点之间的前缀路径，以及所述前缀路径的数量；所述根节点为所述频繁项在所述条件频繁模式树中所对应的节点；

遍历所述头指针表上的所有所述元素项，构建所述频繁项集集合。

本发明提供了一种对FP树进行挖掘，获取频繁项集的方式，主要包括以下三个步骤：

步骤1，从FP树中获得条件模式基。以头指针表上的任一元素项作为开始节点，获取从开始节点到根节点之间的路径，作为条件模式基。即条件模式基是以所查找元素项为根节点的路径集合，每一条路径其实都是一条前缀路径(prefix path)。

简而言之，一条前缀路径是介于所查找元素项与树根节点之间的所有元素项，本发明选取折返能力为根节点，获取其相应的所有前缀路径，作为条件模式基。

步骤2，利用每个条件模式基，分别重新构建一个条件FP树。其构建方法类似于FP树的构建方式，在此不作一一赘述。

步骤3，迭代执行上述步骤1-步骤2，直至遍历所述头指针表中的所有元素项为止。

在构建了FP树和条件FP树之后，就可以在此基础上递归的查找频繁项集，以获取最终的频繁项集集合。

图5是本发明提供的一种剔除非频繁项集的超集的示意图，作为一种可选实施例，如图5所示，本发明在使用FP树进行频繁项集的挖掘过程中，可以结合Apriori算法进行频繁项集的查找，以优化大部分无用递归的查找，主要包括两点：

其一，在进行频繁项集的挖掘过程中，如果一个项集是频繁项集，则确定其所有子集都是频繁项集；

其二，在进行频繁项集的挖掘过程中，如果一个项集不是频繁项集，则确定其所有超集都不是频繁项集。

如图5所示，若项集AB是频繁项集，则可以确定其子集A和子集B均为频繁项集；若项集AB不是频繁项集，则可以确定其超集ABCD、超集ABCE以及超集ABDE均不是频繁项集，可以直接剔除。

本发明提供了一种快速从FP树中挖掘出所有频繁项集的方法，尤其是将FP-growth算法与Apriori算法相结合，在FP-growth算法的基础上结合Apriori算法在频繁项集挖掘过程中对于相关项集的子集或超集的快速筛选，在保证挖掘精度的前提下，挖掘效率得到了极大的提升。

基于上述实施例的内容，作为一种可选实施例，所述根据所述频繁项集集合，确定影响行车折返能力的影响因子具体包括：

根据所述频繁项集集合中每个所述频繁项集的置信度和支持度，对所述频繁项集集合进行筛选过滤，获取目标频繁项集集合；

根据所述目标频繁项集集合，确定所述影响因子。

在最终获取到所有的与折返能力相关的频繁项集之后，由于其中可能有许多的不相干的频繁项集，故需要继续将这些不相干的频繁项集从频繁项集集合中剔除掉，以留下需要进行分析调整的关联性强的频繁项集作为影响因子。

在本发明提供的调整行车折返能力的方法中，主要是通过计算每个频繁项集的支持度和置信度，并利用预设的最小支持度阈值和预设的最小置信度阈值，对每个频繁项集进行筛选。

本发明提供的调整行车折返能力的方法，在获取到由所有频繁项集所组成的频繁项集集合之后，利用每个频繁项集的置信度和支持度，对其进行筛选，以从中剔除对行车转折的影响较小的一些频繁项集之后，将剩余的频繁项集作为实际对行车转折造成影响的影响因子，则能够有针对性的对这些影响因子所对应的行车设置进行调整，有效地减少了实际调整的难度，也一定程度上提高了实际调整的精度。

作为一种可选实施例，根据所述频繁项集集合中每个所述频繁项集的置信度和支持度，对所述频繁项集集合进行筛选过滤，获取目标频繁项集集合，具体包括：

计算每个所述频繁项集的支持度和置信度；

根据每个所述频繁项集的支持度和置信度，对所述频繁项集集合进行筛选过滤，获取所述目标频繁项集集合；

所述目标频繁项集集合中的每个频繁项集的支持度大于或等于最小支持度阈值，且每个频繁项集的置信度大于或等于最小置信度阈值。

可选地，在本发明所提供的调整行车折返能力的方法中，在获取每个频繁项集的支持度和置信度之后，将支持度小于最小支持度阈值或者置信度小于最小置信度阈值的频繁项集进行剔除，以获取最终的目标频繁项集集合。

作为另一可选实施例，还可以采用两次遍历的方式来实现频繁项集的挖掘：

在第一次遍历应用层数据的时候，获取造成折返能力发生变化的所有元素项的出现频率，作为每个元素项的支持度；然后，剔除支持度小于最小支持度阈值的元素项，生成头指针表。

接下来，对头指针表中的所有元素项进行排序，并合并相同的频繁项集。其中，排序的方法可以按照元素项出现的总次数进行降序排列。

在进行第二次遍历的时候，剔除置信度小于最小置信度阈值的所有元素项，然后对剩余的所有元素项进行再次排序。

通过上述两次遍历筛选，获取到最终的目标频繁项集集合，集中的每个频繁项集均可以作为影响行车折返能力的影响因子。

本发明提供具体提供了一种利用预设的最小置信度阈值和最小支持度阈值，根据每个频繁项集所对应的置信度和支持度，对整个频繁项集集合中的所有频繁项集进行判断方法，即将支持度小于最小支持度阈值的频繁项集以及将置信度小于最小置信度阈值的频繁项集均进行删除，能够有效地排除行车折返能力影响小的相关因子的干扰，更加有针对性的实现对影响行车折返能力的行车设置进行调整，效率更高。

基于上述实施例的内容，作为一种可选实施例，所述计算每个所述频繁项集的支持度和置信度，具体包括：

针对任一目标频繁项集，获取所述目标频繁项集中，所有元素项综合对折返能力的第一影响概率，并将所述第一影响概率作为所述频繁项集的支持度；

获取所述目标频繁项集的开始节点所对应的元素项对折返能力的第二影响概率；

根据所述第一影响概率与所述第二影响概率的比值，确定所述目标频繁项集的置信度。

作为一种可选地实施例，假设频繁项集包括元素项A和元素项B，其支持度的计算公式可以为：

support(A＝＞B)＝P(A∪B)；

其中，support(A＝＞B)则为该频繁项集的支持度；P(A∪B)为元素项A和元素项B综合对折返能力的影响概率。

对应地，若假设频繁项集包括元素项A、元素项B和元素项C，其支持度的计算公式可以为：

support(A＝＞B＝＞C)＝P(A∪B∪C)；

其中,support(A＝＞B＝＞C)则为该频繁项集的支持度；P(A∪B∪C)为元素项A、元素项B和元素项C综合对折返能力的影响概率。

依次类推，可以计算每一个频繁项集的支持度，在此不作一一赘述。

另外，本发明还提供了一种计算频繁项集的置信度的方法，假设频繁项集包括元素项A和元素项B，其置信度的计算公式可以为：

其中，confidence(A＝＞B)为频繁项集的置信度，support(A＝＞B)为该频繁项集的支持度；support(A)为目标频繁项集的开始节点A所对应的元素项对折返能力的影响概率。

同理，在频繁项集包括元素项A、元素项B和元素项C的情况下，其置信度的计算公式可以为：

其中，confidence(A＝＞B＝＞C)为频繁项集的置信度；support(A＝＞B＝＞C)为该频繁项集的支持度。

本发明提供了一种具体计算每个频繁项集的支持度和置信度的方法，通过上述公式所计算出的每个频繁项集的支持度和置信度能真实的反映每个频繁项集对行车折返能力的影响。

基于上述实施例的内容，作为一种可选实施例，在调整所述影响因子所对应的行车设置之后，还包括：

基于深度时空网络模型，获取所述轨道交通线路的当日城轨交通客流量；

根据所述当日城轨交通客流量，确定当日列车折返标准值；

从所述应用层数据中，确定当日列车折返次数；

根据所述当日列车折返次数与所述当日列车折返标准值的比值，确定当日列车折返能力值；

利用所述当日列车折返能力值，以检验在调整所述行车设置之后对行车折返能力的调整结果。

其中，利用深度学习模型进行当日城轨交通客流量的预测，可以采用以下方法：

对轨道交通线路的历史交通起止点出行(Origin Destination，OD)数据进行预处理，并根据预处理后的历史OD数据构建训练数据集；根据所述训练数据集对深度时空网络模型进行训练将待预测数据集输入到训练后的深度时空网络模型，以获取目标OD数据，并根据所述目标OD数据确定待预测的轨道交通客流量。

然后，根据获取到的当日城轨交通客流量，确定出当日列车折返标准值α。

在计算到当日列车折返标准值α之后，即可计算出当日列车折返能力如何。即当日列车折返次数为δ，单日列车的折返能力为γ，则单日列车的折返能力γ的计算公式为：

本发明提供的调整行车折返能力的方法，可以在每次完成所获取到的影响因子之后，采用模拟的方式进行相应的行车设置调整，并获取每次调整后的当日列车折返能力值，这样可以根据当日列车折返能力值的变化或者变化趋势，判断评价实际的调整效果。

例如：若在调整某一部分行车设置之后，若当日列车折返能力值有一定程度的提升，或者在一段时间内存在一定的提升趋势，则认为对这些影响因子的调整是可行的。

相反地，在调整某一部分行车设置之后，若当日列车折返能力值出现了一定程度的下降或者保持不变，则认为对这些影响因子的调整是不可行的。

本发明提供的调整行车折返能力的方法，根据当日列车折返能力值，对对每次调整后的行车往返能力的变化进行评价，以判断每次调整的方式是否正确，以及时的对不可行的调整方式进行纠正，同时保持对行车往返能力有良性帮助的调整，能够有针对性的提高列车的折返运行效率，进而为整个轨道交通运营能力的提升提供有力的保障。

图6是本发明提供一种调整行车折返能力的装置，如图6所示，主要包括：数据采集单元601、关联性分析单元602、影响因子筛选单元603和行车设置调整单元604，其中：

数据采集单元601主要用于获取应用层数据，所述应用层数据包括轨道交通线路的行车折返数据；关联性分析单元602主要用于对所述应用层数据进行关联性分析，获取影响行车折返能力的所有频繁项集，构建频繁项集集合；影响因子筛选单元603主要用于根据所述频繁项集集合，确定影响行车折返能力的影响因子；行车设置调整单元604主要用于调整所述影响因子所对应的行车设置，以调整行车折返能力。

需要说明的是，本发明实施例提供的调整行车折返能力的装置，在具体运行时，可以执行上述任一实施例所述的调整行车折返能力的方法，对此本实施例不作赘述。

本发明提供的调整行车折返能力的装置，通过对行车折返数据进行大数据分析，获取影响行车折返能力稳定与效率的影响因子，并进行综合调整，能够提高分析列车折返影响因素的准确性，可以有针对性的提高列车的折返运行效率，进而为整个轨道交通运营能力的提升提供有力的保障。

图7是本发明提供的电子设备的结构示意图，如图7所示，该电子设备可以包括：处理器(processor)710、通信接口(Communications Interface)720、存储器(memory)730和通信总线740，其中，处理器710，通信接口720，存储器730通过通信总线740完成相互间的通信。处理器710可以调用存储器730中的逻辑指令，以执行调整行车折返能力的方法，该方法包括：获取应用层数据，所述应用层数据包括轨道交通线路的行车折返数据；对所述应用层数据进行关联性分析，获取影响行车折返能力的所有频繁项集，构建频繁项集集合；根据所述频繁项集集合，确定影响行车折返能力的影响因子；调整所述影响因子所对应的行车设置，以调整行车折返能力。

此外，上述的存储器730中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面，本发明还提供一种计算机程序产品，所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，计算机能够执行上述各方法所提供的调整行车折返能力的方法，该方法包括：获取应用层数据，所述应用层数据包括轨道交通线路的行车折返数据；对所述应用层数据进行关联性分析，获取影响行车折返能力的所有频繁项集，构建频繁项集集合；根据所述频繁项集集合，确定影响行车折返能力的影响因子；调整所述影响因子所对应的行车设置，以调整行车折返能力。

又一方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各实施例提供的调整行车折返能力的方法，该方法包括：获取应用层数据，所述应用层数据包括轨道交通线路的行车折返数据；对所述应用层数据进行关联性分析，获取影响行车折返能力的所有频繁项集，构建频繁项集集合；根据所述频繁项集集合，确定影响行车折返能力的影响因子；调整所述影响因子所对应的行车设置，以调整行车折返能力。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种调整行车折返能力的方法，其特征在于，包括：

获取应用层数据，所述应用层数据包括轨道交通线路的行车折返数据；

对所述应用层数据进行关联性分析，获取影响行车折返能力的所有频繁项集，构建频繁项集集合；

根据所述频繁项集集合，确定影响行车折返能力的影响因子；

调整所述影响因子所对应的行车设置，以调整行车折返能力；

所述对所述应用层数据进行关联性分析，获取影响行车折返能力的所有频繁项集，构建频繁项集集合，具体包括：

在每个所述条件频繁模式树中抽取频繁项集，以构建所述频繁项集集合；

所述在每个所述条件频繁模式树中抽取频繁项集，以构建所述频繁项集集合，具体包括：

遍历所述头指针表上的所有所述元素项，构建所述频繁项集集合；

所述根据所述频繁项集集合，确定影响行车折返能力的影响因子具体包括：

根据所述目标频繁项集集合，确定所述影响因子；

根据所述频繁项集集合中每个所述频繁项集的置信度和支持度，对所述频繁项集集合进行筛选过滤，获取目标频繁项集集合，具体包括：

计算每个所述频繁项集的支持度和置信度；

所述目标频繁项集集合中的每个频繁项集的支持度大于或等于最小支持度阈值，且每个频繁项集的置信度大于或等于最小置信度阈值；

所述计算每个所述频繁项集的支持度和置信度，具体包括：

2.根据权利要求1所述的调整行车折返能力的方法，其特征在于，所述获取应用层数据，具体包括：

获取所述轨道交通线路的运营日志数据；

将所述运营日志数据以二进制数据的形式，发送至分布式消息系统；

基于分布式流处理读取所述分布式消息系统中存储的二进制数据，并对所述二进制数据进行数据解析以及数据结构化后，存储至分布式文件系统；

获取所述应用层数据宽表中的行车折返数据。

3.根据权利要求1所述的调整行车折返能力的方法，其特征在于，在调整所述影响因子所对应的行车设置之后，还包括：

根据所述当日城轨交通客流量，确定当日列车折返标准值；

从所述应用层数据中，确定当日列车折返次数；

4.一种调整行车折返能力的装置，其特征在于，包括：

数据采集单元，用于获取应用层数据，所述应用层数据包括轨道交通线路的行车折返数据；

关联性分析单元，用于对所述应用层数据进行关联性分析，获取影响行车折返能力的所有频繁项集，构建频繁项集集合；

影响因子筛选单元，用于根据所述频繁项集集合，确定影响行车折返能力的影响因子；

行车设置调整单元，用于调整所述影响因子所对应的行车设置，以调整行车折返能力；

所述关联性分析单元具体执行以下操作：

其中，根据所述频繁项集集合，确定影响行车折返能力的影响因子具体包括：

根据所述目标频繁项集集合，确定所述影响因子；

其中，根据所述频繁项集集合中每个所述频繁项集的置信度和支持度，对所述频繁项集集合进行筛选过滤，获取目标频繁项集集合，具体包括：

计算每个所述频繁项集的支持度和置信度；

其中，计算每个所述频繁项集的支持度和置信度，具体包括：

5.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至3任一项所述调整行车折返能力的方法步骤。