CN109063313A

CN109063313A - 基于机器学习的列车牵引能耗计算方法

Info

Publication number: CN109063313A
Application number: CN201810834730.XA
Authority: CN
Inventors: 杨欣; 黄康; 吴建军; 高自友; 尹浩东; 屈云超
Original assignee: Beijing Jiaotong University
Current assignee: Beijing Jiaotong University
Priority date: 2018-07-26
Filing date: 2018-07-26
Publication date: 2018-12-21
Anticipated expiration: 2038-07-26
Also published as: CN109063313B

Abstract

本发明实施例提供了一种基于机器学习的列车牵引能耗计算方法。该方法包括：建立离散化的列车牵引能耗计算模型；对既有数据进行选择，处理，形成离散化的数据集；将数据集划分为训练集与测试集，利用训练集训练标定随机森林回归与支持向量机回归机器学习算法的最优参数，并用测试集验证其用于计算牵引能耗的效果。利用机器学习算法随机森林回归与支持向量机回归的新方法计算列车牵引速度曲线的能耗，其中随机森林回归同时可以得到曲线某位移处的速度的重要度排序。机器学习方法计算列车牵引能耗，计算过程简单，计算精度高，计算成本低。

Description

基于机器学习的列车牵引能耗计算方法

技术领域

本发明涉及列车牵引能源计算技术领域，尤其涉及一种基于机器学习的列车牵引能耗计算方法。

背景技术

现阶段，世界大城市解决交通拥堵问题的主要措施是导向发展公共交通，作为城市公共交通的主干的城市轨道交通得以大力发展。城市轨道交通运营里程的不断增加，随之而来的是运营能源消耗的不断攀升，相对应的碳排放量也急剧上升，国家以及环保部门对此也极为重视；能源消耗的成本亦愈来愈大，能源消耗的基数的变大，也对节约能源提出了更高的要求。

城市轨道交通系统节能涉及很多方面，其中能源消耗占比过半是列车的牵引过程，因此对列车牵引的优化节能也成为了节能的基础性工作。牵引过程主要表现是速度曲线，传统研究中对于列车牵引能源计算是通过车辆生产厂家对列车的牵引特性进行大量的实验得出的经验公式，用于后续计算列车运行的能源消耗。然而，在现场的应用过程，列车的实际能耗往往与理论计算存在着一定的误差。

目前，现有技术中还没有一种有效的计算列车牵引能耗的方法。

发明内容

本发明的实施例提供了一种基于机器学习的列车牵引能耗计算方法，以克服现有技术的缺点。

为了实现上述目的，本发明采取了如下技术方案。

一种基于机器学习的列车牵引能耗计算方法，包括：

建立机器学习计算列车牵引能耗的数据驱动模型；

收集列车运行状态数据，对所述列车运行状态数据进行降维、标准化处理，得到处理后的数据；

利用处理后的数据训练随机森林回归机器学习算法，并对训练好的随机森林回归机器学习算法进行验证；

利用处理后的数据训练支持向量机回归机器学习算法，并对训练好的支持向量机回归机器学习算法进行验证；

基于任意区间的列车运行曲线数据，利用所述训练好的随机森林回归机器学习算法与支持向量机回归机器学习算法分别求解所述列车牵引能耗的数据驱动模型，获取列车牵引能耗数据。

进一步地，所述的建立机器学习计算列车牵引能耗的数据驱动模型，包括：

在原始的列车运行速度曲线中获取小时间单位间隔▽t内每个速度点之间列车的运行状态为匀加速的过程；

将所述原始的列车运行速度曲线离散为一系列不同位移处的速度数据点{v₁-s₁},{v₂-s₂}.......,{v_i-s_i},.....{v_n-s_n}，{v_i-s_i}为速度-位移点；

从数据驱动的角度出发，固定运行时间t下的牵引能耗E_t与{v_i-s_i}(i＝0,1...n)之间构成对应关系E_t({v₁-s₁},{v₂-s₂}.......,{v_i-s_i},.....{v_n-s_n})，将所述对应关系E_t({v₁-s₁},{v₂-s₂}.......,{v_i-s_i},.....{v_n-s_n})作为计算列车牵引能耗的数据驱动模型，将所述速度-位移点{v_i-s_i}作为所述计算列车牵引能耗的数据驱动模型的决策变量。

进一步地，所述的收集列车运行状态数据，对所述列车运行状态数据进行降维、标准化处理，得到处理后的数据，包括：

收集列车运行状态数据，该列车运行状态数据包括的列车速度、位移、时间以及对应的能耗数据；

获取地铁区间的长度S₀，将S₀切割为n个小区间，则所述地铁区间的(n+1)个端点序列为：{s₀...s_i...s_n}(i＝0,1...n)，则有s₀＝0,s_n＝S₀；

搜索原始的列车运行速度曲线中对应s₀...s_i...s_n相隔邻域内的位移点：{s⁺ ₀...s⁺ _i...s⁺ _n}，{s^- ₀...s^- _i...s^- _n}，其中{s⁺ ₀...s⁺ _i...s⁺ _n}为{s₀...s_i...s_n}(i＝0,1...n)在时间之前位移点，{s^- ₀...s^- _i...s^- _n}为{s₀...s_i...s_n}(i＝0,1...n)在时间之后的位移点；

搜索原始的列车运行速度曲线中{s⁺ ₀...s⁺ _i...s⁺ _n}，{s^- ₀...s^- _i...s^- _n}对应的速度点组成的序列：{v⁺ ₀...v⁺ _i...v⁺ _n}，{v^- ₀...v^- _i...v^- _n}，搜索{s⁺ ₀...s⁺ _i...s⁺ _n}，{s^- ₀...s^- _i...s^- _n}对应的时间点组成的序列{t^- ₀...t^- _i...t^- _n}，{t⁺ ₀...t⁺ _i...t⁺ _n}；

在s^- _i→s_i→s⁺ _i运行过程中，列车运行处于均加速状态，则列车的位移与速度呈二次函数关系，a_i为s^- _i→s_i→s⁺ _i运行的时间内列车的加速度：

由(1)(2)(3)可得：

或者：

则得到列车的速度序列值{v₀...v_i...v_n}(i＝0,1...n)。

依据实际的数据，处理得到速度曲线-能耗格式的数据集，对所述速度曲线-能耗格式的数据集进行归一化处理，将归一化处理后的速度曲线-能耗格式的数据集的一部分作为训练集，另一部分作为测试集。

进一步地，所述的利用处理后的数据训练随机森林回归机器学习算法，并对训练好的随机森林回归机器学习算法进行验证，包括：

利用所述训练集训练随机森林回归机器学习算法，该随机森林回归机器学习算法的参数包括决策树数目和分裂属性个数，调整决策树数目参数和分裂属性个数参数的精度，分析决策树数目参数和分裂属性个数参数的情况，确定随机森林回归机器学习算法的最佳的应用范围；

利用所述测试集对训练好的随机森林回归机器学习算法进行测试和验证。

进一步地，所述的利用处理后的数据训练支持向量机回归机器学习算法，并对训练好的支持向量机回归机器学习算法进行验证，包括：

利用所述训练集训练支持向量机机器学习算法，确定所述向量机机器学习算法的核函数以及不同核函数下的参数，分别验证不同核函数的计算精度以及核函数在不同参数范围内的表现；

从精度、稳定性和计算时间方面分析各种核函数的计算效果表现，并确定各种核函数的最佳的应用范围；

利用所述测试集对训练好的支持向量机机器学习算法进行测试和验证。

进一步地，所述的基于任意区间的列车运行曲线数据，利用所示训练好的随机森林回归机器学习算法与支持向量机回归机器学习算法分别求解所述列车牵引能耗的数据驱动模型，获取列车牵引能耗数据，包括：

将任意区间的列车运行曲线数据输入到训练好的随机森林回归机器学习算法与支持向量机回归机器学习算法中，利用随机森林回归机器学习算法与支持向量机回归机器学习算法分别求解所述列车牵引能耗的数据驱动模型，得到输入的列车运行曲线数据对应的列车牵引能耗数据，所述随机森林回归机器学习算法还得到列车运行曲线某位移处的速度的重要度排序。

由上述本发明的实施例提供的技术方案可以看出，

本发明实施例的方法建立了离散化的列车牵引能耗计算模型，模型具有简单，易于理解，并且便于数据驱动的优化方法的实施。本发明实施例能根据记录的列车运行状态的速度，时间，位移数据以及对应的列车牵引消耗的净能耗(除去其他设备的能耗)，作为机器学习算法的训练集，更加便捷地计算列车运行能耗，计算精度高，计算成本低。

本发明附加的方面和优点将在下面的描述中部分给出，这些将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种基于机器学习的列车牵引能耗计算方法的处理流程图。

图2为本发明实施例提供的一种十三陵至昌平西山口区段的一条运行曲线示意。

图3为本发明实施例提供的一种数据降维处理的示意图。

图4为本发明实施例提供的一种随机森林回归平均误差收敛。

图5为本发明实施例提供的一种随机森林回归得出的不同位移处的速度重要度。

图6为本发明实施例提供的一种支持向量机回归平均误差收敛。

具体实施方式

下面详细描述本发明的实施方式，所述实施方式的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的，仅用于解释本发明，而不能解释为对本发明的限制。

本技术领域技术人员可以理解，除非特意声明，这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是，本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件，但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解，当我们称元件被“连接”或“耦接”到另一元件时，它可以直接连接或耦接到其他元件，或者也可以存在中间元件。此外，这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。

本技术领域技术人员可以理解，除非另外定义，这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是，诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义，并且除非像这里一样定义，不会用理想化或过于正式的含义来解释。

为便于对本发明实施例的理解，下面将结合附图以几个具体实施例为例做进一步的解释说明，且各个实施例并不构成对本发明实施例的限定。

实施例一

大数据、机器学习、人工智能和深度学习等理论的快速发展，挖掘数据的潜在信息，利用数据建模优化，并且在各方面的应用表现了良好的效果。与此同时，列车运行状态的高质量数据也完全可获取，本发明正是基于此，希望将数据驱动应用到列车牵引节能中。运用列车在站间运行的状态数据(运行曲线)，建立数据驱动的列车运行能耗计算的新方法。

本发明提供了一种基于机器学习的列车牵引能耗计算方法，能根据记录的列车运行状态的速度，时间，位移数据以及对应的列车牵引消耗的净能耗(除去其他设备的能耗)，作为机器学习算法的训练集，训练机器学习模型，更加便捷地得到列车牵引能耗。

本发明实施例提供的一种基于机器学习的列车牵引能耗计算方法的处理流程图如图1所示，包括如下的处理步骤：

步骤1:建立机器学习计算列车牵引能耗的数据驱动模型。

步骤2:收集列车运行状态数据，并对列车运行状态数据进行降维、标准化处理，得到处理后的数据。

步骤3:利用处理后的数据训练随机森林回归机器学习算法，并利用既有数据验证训练好的随机森林回归机器学习算法的有效性。

步骤4:利用处理后的数据训练支持向量机回归机器学习算法，并利用既有数据验证训练好的支持向量机回归机器学习算法的有效性。

步骤5：将任意区间的列车运行曲线数据输入到训练好的随机森林回归机器学习算法与支持向量机回归机器学习算法中，利用随机森林回归机器学习算法与支持向量机回归机器学习算法分别求解上述步骤1建立的列车牵引能耗的数据驱动模型，两种算法都可以直接得到输入的列车运行曲线数据对应的列车牵引能耗数据。其中，随机森林回归机器学习算法可以得到列车运行曲线某位移处的速度的重要度排序。

优先地，步骤1进一步包括：

步骤1-1:模型的假设，在原始的列车运行速度曲线中获取小时间单位间隔▽t内(0.1s级别)每个速度点之间列车的运行状态为匀加速的过程。

步骤1-2:将列车运行速度曲线(位移速度曲线)离散为一系列不同位移处的速度数据点{v₁-s₁},{v₂-s₂}.......,{v_i-s_i},.....{v_n-s_n}，{v_i-s_i}为速度-位移点。简化后的速度点序列及是代表一条速度曲线，每个速度点也即是模型的决策变量。

步骤1-3:从数据驱动的角度出发，固定运行时间t下的牵引能耗E_t与{v_i-s_i}(i＝0,1...n)是某种复杂的对应关系，及是E_t({v₁-s₁},{v₂-s₂}.......,{v_i-s_i},.....{v_n-s_n})。

将上述牵引能耗E_t与{v_i-s_i}(i＝0,1...n)之间的对应关系E_t({v₁-s₁},{v₂-s₂}.......,{v_i-s_i},.....{v_n-s_n})作为计算列车牵引能耗的数据驱动模型。

优先地，步骤2进一步包括：

步骤2-1:收集列车运行状态数据，该列车运行状态数据包括高精度的列车速度、位移、时间以及对应的能耗数据。

步骤2-2:获取地铁区间的长度S₀，将S₀切割为n个小区间,则其(n+1)个端点序列为：{s₀...s_i...s_n}(i＝0,1...n)，则有s₀＝0,s_n＝S₀。

步骤2-3:搜索原始的列车运行速度曲线中对应s₀...s_i...s_n相隔邻域内的位移点：{s⁺ ₀...s⁺ _i...s⁺ _n}，{s^- ₀...s^- _i...s^- _n}。其中{s⁺ ₀...s⁺ _i...s⁺ _n}为{s₀...s_i...s_n}(i＝0,1...n)在时间之前位移点，{s^- ₀...s^- _i...s^- _n}为{s₀...s_i...s_n}(i＝0,1...n)在时间之后的位移点。

步骤2-4:搜索原始的列车运行速度曲线中{s⁺ ₀...s⁺ _i...s⁺ _n}，{s^- ₀...s^- _i...s^- _n}对应的速度点组成的序列：{v⁺ ₀...v⁺ _i...v⁺ _n}，{v^- ₀...v^- _i...v^- _n}，搜索{s⁺ ₀...s⁺ _i...s⁺ _n}，{s^- ₀...s^- _i...s^- _n}对应的时间点组成的序列{t^- ₀...t^- _i...t^- _n}，{t⁺ ₀...t⁺ _i...t⁺ _n}。

步骤2-5:在s^- _i→s_i→s⁺ _i运行过程中，因为时间间隔极小，假设列车运行处于均加速状态，依据物理学“位移-速度”定理，则位移与速度呈二次函数关系(a_i为s^- _i→s_i→s⁺ _i运行的时间内列车的加速度)：

由(1)(2)(3)可得：

或者：

则可以得到速度序列值{v₀...v_i...v_n}(i＝0,1...n)。

步骤2-6:依据实际的数据，处理得到速度曲线-能耗格式的数据集，

简化的速度曲线(处理后的速度曲线)是通过上述2-1至2-5步骤处理得到，每条原始速度曲线在实际列车运行记录收集的数据中，都存在其对应的能耗记录数据值。数据集的内容为简化的速度曲线以及与其对应的能耗值。

训练集与测试集的数据内容：

并对速度曲线-能耗格式的数据集进行归一化处理。将归一化处理后的速度曲线-能耗格式的数据集的一部分作为训练集，另一部分作为测试集。

优先地，步骤3进一步包括：

步骤3-1:利用上述训练集训练随机森林回归机器学习算法，该算法的主要参数包括决策树数目(ntree)和分裂属性个数(mtry)，同时调整决策树数目(ntree)和分裂属性个数(mtry)这两个参数，使这两个参数达到计算精度。

步骤3-2:分析上述两个参数的情况，确定随机森林回归机器学习算法的最佳的应用范围。利用上述测试集对训练好的随机森林回归机器学习算法进行测试和验证。

优先地，步骤4进一步包括：

步骤4-1:利用上述训练集训练支持向量机机器学习算法，算法需要确定核函数以及不同核函数下的参数。分别验证不同核函数的计算精度以及其在不同参数范围内的表现。

步骤4-2:从精度，稳定性，计算时间分析各种核函数的计算效果表现，并确定最佳的应用范围。利用上述测试集对训练好的支持向量机机器学习算法进行测试和验证。

实施例二

该实施例提供的一种基于机器学习的列车牵引能耗计算方法的处理步骤包括：

Step1:建立机器学习计算列车牵引能耗的数据驱动模型。

Step1-1:模型的假设，在原始的列车运行速度曲线中获取的小时间单位间隔▽t内(0.1s级别)，每个速度点之间列车的运行状态为匀加速的过程。

Step1-2:将列车运行速度曲线(位移速度曲线)离散为一系列不同位移处的速度数据点{v₁-s₁},{v₂-s₂}.......,{v_i-s_i},.....{v_n-s_n}，{v_i-s_i}为速度-位移点。简化后的速度点序列及是代表一条速度曲线，每个速度点也即是模型的决策变量。

Step1-3:从数据驱动的角度出发，固定运行时间t下的牵引能耗E_t与{v_i-s_i}(i＝0,1...n)是某种复杂的对应关系，及是E_t({v₁-s₁},{v₂-s₂}.......,{v_i-s_i},.....{v_n-s_n})。

Step2:收集列车运行状态数据，并对列车运行状态数据进行降维、标准化处理，得到处理后的数据。

Step2-1:收集列车运行状态数据，高精度的速度，位移，时间以及对应的能耗数据。获取列车运行状态的实际数据(北京地铁昌平线，以下行十三陵至昌平西山口区段为例)，其区间总长1230m。图2为十三陵至昌平西山口区段的一条运行曲线。原始的记录数据的格式如表1所示，包含时间间隔为的瞬时速度(Velocity(km/h))，与累积距离Distance(m)。

Step2-2:获取地铁区间的长度S₀，将S₀切割为25个小区间,则其26个端点序列为：{s₀...s_i...s₂₆}(i＝0,1...26)，则有s₀＝0,s₂₆＝1230m。

Step2-3:搜索原始的列车运行速度曲线中对应s₀...s_i...s_n相隔邻域内的位移点：{s⁺ ₀...s⁺ _i...s⁺ _n}，{s^- ₀...s^- _i...s^- _n}。其中{s⁺ ₀...s⁺ _i...s⁺ _n}为{s₀...s_i...s_n}(i＝0,1...n)在时间之前位移点，{s^- ₀...s^- _i...s^- _n}为{s₀...s_i...s_n}(i＝0,1...n)在时间之后的位移点。

Step2-4:如图3所示，搜索原始的列车运行速度曲线中{s⁺ ₀...s⁺ _i...s⁺ _n}，{s^- ₀...s^- _i...s^- _n}对应的速度点组成的序列：{v⁺ ₀...v⁺ _i...v⁺ _n}，{v^- ₀...v^- _i...v^- _n}，搜索{s⁺ ₀...s⁺ _i...s⁺ _n}，{s^- ₀...s^- _i...s^- _n}对应的时间点组成的序列{t^- ₀...t^- _i...t^- _n}，{t⁺ ₀...t⁺ _i...t⁺ _n}。以5m为间隔，可以计算得到表2。

Step2-5:在s^- _i→s_i→s⁺ _i的运行过程中，因为时间间隔极小，假设列车运行处于均加速状态，依据物理学“位移-速度”定理，则位移与速度呈二次函数关系(a_i为s^- _i→s_i→s⁺ _i运行的时间内列车的加速度)：

由(1)(2)(3)可得：

或者：

则可以得到速度序列值{v₀...v_i...v_n}(i＝0,1...n)。

Step2-6:依据实际的数据，处理得到速度曲线-能耗格式的数据集。处理后的部分训练数据如表3所示；归一化后的部分训练数据如表4所示。

表1原始的列车运行速度曲线的数据格式

表2 v_i的计算结果

表3训练数据格式

表4进行归一化的处理后的训练数据格式

Step3:利用处理后的数据训练随机森林回归机器学习算法，并利用既有数据验证训练好的随机森林回归机器学习算法的有效性。

Step3-1:训练随机森林回归机器学习算法，算法主要参数包括决策树数目(ntree),分裂属性个数(mtry)，调整参数，如图4所示，最终的平均误差收敛，并选取最佳组合参数Mtry＝3，Ntree>50，如图5所示，并得到不同位移处的速度的重要度。

Step3-2:分析参数的情况可知，Mtry＝3，Ntree>50，随机森林算法的计算精度可以发挥较好。

Step4：利用处理后的数据训练支持向量机回归机器学习算法，并利用既有数据验证训练好的支持向量机回归机器学习算法的有效性。

Step4-1:训练支持向量机机器学习算法，核函数：共验证了三种重要的核函数，RBF核函数，线性(linear)核函数，多项式(poly)核函数。

Step4-2:RBF径向基核函数主要需要标定的参数包括：C惩罚因子与gamma值，如图6所示，RBF收敛速度较快，C>＝30以及gamma＝3是最佳的参数组合。且最终的误差收敛在0.1kwh。

LINEAR线性核函数的需要标定的参数为：C惩罚因子。Linear收敛速度较慢，但最终误差收敛在0.11kwh附近。PlOY多项式核函数标定的参数为：C惩罚因子。多项式核函数的误差在0.1kwh附近波动，未达到较好的收敛效果。

对比三种核函数的表现，RBF核函数作为牵引能耗评估效果最佳，可以使用其在最优参数条件下对牵引能耗作评估。

综上所述，本发明实施例的方法建立了离散化的列车牵引能耗计算模型，模型具有简单，易于理解，并且便于数据驱动的优化方法的实施。本发明实施例能根据记录的列车运行状态的速度，时间，位移数据以及对应的列车牵引消耗的净能耗(除去其他设备的能耗)，作为机器学习算法的训练集，更加便捷地计算列车运行能耗，计算精度高，计算成本低。

本发明实施例的方法通过建立离散化的列车速度曲线的优化模型，将列车速度曲线离散化为一系列的速度点集合；利用机器学习算法随机森林回归与支持向量机回归的新方法计算列车牵引速度曲线的能耗，计算精度高，计算的成本更低。其中随机森林回归同时可以得到曲线某位移处的速度的重要度排序；计算的数据来源于实际记录，计算效果得以检验。

本领域普通技术人员可以理解：附图只是一个实施例的示意图，附图中的模块或流程并不一定是实施本发明所必须的。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置或系统实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求的保护范围为准。

Claims

1.一种基于机器学习的列车牵引能耗计算方法，其特征在于，包括：

建立机器学习计算列车牵引能耗的数据驱动模型；

2.根据权利要求1所述的方法，其特征在于，所述的建立机器学习计算列车牵引能耗的数据驱动模型，包括：

3.根据权利要求2所述的方法，其特征在于，所述的收集列车运行状态数据，对所述列车运行状态数据进行降维、标准化处理，得到处理后的数据，包括：

搜索原始的列车运行速度曲线中对应s₀...s_i...s_n相隔▽t邻域内的位移点：{s⁺ ₀...s⁺ _i...s⁺ _n}，{s^- ₀...s^- _i...s^- _n}，其中{s⁺ ₀...s⁺ _i...s⁺ _n}为{s₀...s_i...s_n}(i＝0,1...n)在▽t时间之前位移点，{s^- ₀...s^- _i...s^- _n}为{s₀...s_i...s_n}(i＝0,1...n)在▽t时间之后的位移点；

在s^- _i→s_i→s⁺ _i运行过程中，列车运行处于均加速状态，则列车的位移与速度呈二次函数关系，a_i为s^- _i→s_i→s⁺ _i运行的▽t时间内列车的加速度：

由(1)(2)(3)可得：

或者：

则得到列车的速度序列值{v₀...v_i...v_n}(i＝0,1...n)。

4.根据权利要求3所述的方法，其特征在于，所述的利用处理后的数据训练随机森林回归机器学习算法，并对训练好的随机森林回归机器学习算法进行验证，包括：

5.根据权利要求3所述的方法，其特征在于，所述的利用处理后的数据训练支持向量机回归机器学习算法，并对训练好的支持向量机回归机器学习算法进行验证，包括：

6.根据权利要求4或5所述的方法，其特征在于，所述的基于任意区间的列车运行曲线数据，利用所示训练好的随机森林回归机器学习算法与支持向量机回归机器学习算法分别求解所述列车牵引能耗的数据驱动模型，获取列车牵引能耗数据，包括：