CN117689163B

CN117689163B - 基于图论的铁路专用线作业调控方法

Info

Publication number: CN117689163B
Application number: CN202311702219.1A
Authority: CN
Inventors: 马锡忠; 乔灿立; 张波; 李拉; 李天宇; 窦东东; 黄帆; 梅因昂; 李明; 刘天增; 张辉; 李思颖; 袁鹬; 于智勇; 陈亮; 王惠
Original assignee: Institute of Science and Technology of China Railway Zhengzhou Group Co Ltd
Current assignee: Institute of Science and Technology of China Railway Zhengzhou Group Co Ltd
Filing date: 2023-12-12
Publication date: 2024-06-04
Anticipated expiration: 2043-12-12

Abstract

本发明涉及铁路运输车辆控制技术领域，具体涉及基于图论的铁路专用线作业调控方法，该方法包括：构建对应的哈密尔顿图；获取各节点的空车数对及装载数对；计算每个需求的动态饥饿值，构建各节点的空车节点需求函数以得到空车节点需求预测值；构建蒙特卡洛搜索树中各搜索节点状态并获取绝对需求路径值及饥饿修正需求路径值；计算每个需求的饥饿值评分；构建各搜索节点的预期收益函数并设定蒙特卡洛搜索树的搜索停止条件；搜索各最佳节点及调控策略，实现铁路专用线的调控。本发明使铁路专线调控策略更加贴合实际工程场景，提高调控效率，节省运力资源。

Description

基于图论的铁路专用线作业调控方法

技术领域

本申请涉及铁路运输车辆控制技术领域，具体涉及基于图论的铁路专用线作业调控方法。

背景技术

铁路专用线是在工业区之间常见的运输方式，通过在工厂园区与园区之间搭设专用铁路线路，进行大宗商品运输，是一种降低运输成本的有效手段。

铁路专用线的结构通常为放射形专用线、树状形专线，以及两种结构混合的混合形专用线。在上述专用线结构中，后两种专用线的取送车作业调控问题较为复杂，本领域技术人员通常会针对该问题使用调控优化算法获取最好的优化调控效果，以减少取送车的等待时间，提升工作效率。

在现有的铁路专用线作业调控研究中，通常只是研究在固定的调控需求下，如何调控取送车使调控时间最短。在实际场景中，调控作业的需求是不断更新的，即调控方案实时更行的。这样可能会导致某些调控需求排在不断加入的新调控需求后面，造成调控需求长时间搁置的“饥饿”现象；其次，大多数研究得到的调控算法并未考虑不断加入的新调控需求，导致调控策略得到的最优调控策略并非符合实际工程场景的调控策略，造成了运力资源浪费。

发明内容

为了解决上述技术问题，本发明提供基于图论的铁路专用线作业调控方法，以解决现有的问题。

本发明的基于图论的铁路专用线作业调控方法采用如下技术方案：

本发明一个实施例提供了基于图论的铁路专用线作业调控方法，该方法包括以下步骤：

根据铁路专线各站点及站点间的路径长度结合哈密尔顿图算法构建对应的哈密尔顿图；

获取哈密尔顿图中各节点；获取各节点的空车数对及装载数对；根据各时刻系统中每个需求的提出时间、需求总量以及需求提出时被满足的需求量得到各时刻系统中每个需求的动态饥饿值；根据各节点的空车数对构建各节点的空车节点需求函数，根据各节点的空车节点需求函数和上一次产生空车厢需求的时刻、空车厢需求量及需求路径得到各节点在各个时刻的空车节点需求预测值；对于装载数对采用空车节点需求预测值的计算方法获取装载节点需求预测值；

构建蒙特卡洛搜索树中各搜索节点状态并获取绝对需求路径值；根据各节点未完成的需求的动态饥饿值获取饥饿修正需求路径值；根据绝对需求路径值及饥饿修正需求路径值获取每个需求的饥饿值评分；根据饥饿值评分及蒙特卡洛搜索树中各搜索节点的绝对需求路径值构建各搜索节点的预期收益函数；根据各搜索节点的绝对需求路径值、空车节点需求预测值及装载节点需求预测值构建蒙特卡洛搜索树的搜索停止条件；

结合搜索停止条件、预设最大搜索次数以及预期收益函数采用蒙特卡洛搜索树模拟搜索各最佳节点及调控策略，将最佳节点对应的调控策略作为铁路专用线的下一个调控指令，完成铁路专用线的调控。

优选的，所述获取各节点的空车数对及装载数对，包括：

一个节点每产生一次需求，就产生一个数对；将产生的需求所要求的空车厢数量、需求提出时刻以及完成需求所消耗的时间长度组成一个空车数对，其中，空车数对中完成需求所消耗的时间长度为：节点在预设天数内的所有空车厢需求完成时，在哈密尔顿图中走过的哈密尔顿路径长度的均值；

将产生的需求所需要被拉走的车厢数量、需求提出时刻以及完成需求所消耗的时间长度组成一个装载数对，其中，装载数对中完成需求所消耗的时间长度为：以运送需要被拉走的车厢的起始节点到终止终点在哈密尔顿图中的哈密尔顿路径长度。

优选的，所述动态饥饿值，包括：

获取T时刻与各需求提出时间的差值，计算所有需求的所述差值的均值，获取所述差值与所述均值的比值记为第一比值；

统计T时刻各需求在提出时的需求总量与已经被满足的需求量的差值，记为第一差值，计算第一差值与所述需求总量的比值记为第二比值；

将第一比值与第二比值的和值作为T时刻各需求的动态饥饿值。

优选的，所述根据各节点的空车数对构建各节点的空车节点需求函数，包括：

对于节点的各空车数对，统计需求提出时间相同的空车数对的空车厢数量之和，将所述空车厢数量之和、对应的需求提出时间、完成需求所消耗的时间长度组成对应需求提出时间的新的空车数对；

将各新的空车数对中的需求提出时间作为横坐标点，将各新的空车数对中的空车厢数量与预设天数的比值作为纵坐标点，通过拟合获取平滑曲线；对所述平滑曲线进行求导得到空车节点需求函数。

优选的，所述空车节点需求预测值，包括：

对于各节点，统计节点在预设预测时刻的上一次产生空车厢需求的时刻，计算节点的空车节点需求函数在所述上一次产生空车厢需求时刻到预设预测时刻区间内的积分；计算节点在上一次产生空车厢需求时的空车厢需求数量与完成对应的需求所消耗的时间长度的乘积；计算节点在所述上一次产生空车厢需求时刻的空车节点需求预测值与所述乘积的差值，获取所述差值与预设衰减系数相乘的结果；将所述积分与所述结果的和值作为节点的空车节点需求预测值；

其中，所述上一次产生空车厢需求时刻的空车节点需求预测值的计算方法与节点的空车节点需求预测值相同，当所述上一次产生空车厢需求时刻不存在时，将所述上一次产生空车厢需求时刻的空车节点需求预测值设定为预设数值。

优选的，所述构建蒙特卡洛搜索树中各搜索节点状态并获取绝对需求路径值，包括：

蒙特卡洛搜索树中每个搜索节点代表一条铁路专用线的需求分布状态，所述需求分布状态包括：该条铁路专用线中取送车完成当前任务后的位置、各节点的空车节点需求预测值、装载节点需求预测值；

将各节点未完成的需求记为历史需求，将所有历史需求的完成需求所消耗的时间长度的和值与哈密尔顿图中所有节点的需求预测值的和值进行求和，求和结果作为绝对需求路径值。

优选的，所述饥饿修正需求路径值，包括：

计算各历史需求的完成需求所消耗的时间长度与动态饥饿值的乘积，获取所有历史需求的所述乘积的和值与哈密尔顿图中所有节点的需求预测值的和值进行求和的结果，将所述结果作为饥饿修正需求路径值。

优选的，所述根据绝对需求路径值及饥饿修正需求路径值获取每个需求的饥饿值评分，包括：将饥饿修正需求路径值与绝对需求路径值的差值作为饥饿值评分。

优选的，所述根据饥饿值评分及蒙特卡洛搜索树中各搜索节点的绝对需求路径值构建各搜索节点的预期收益函数，包括：

对于蒙特卡洛搜索树的各搜索节点，每个搜索节点下方连接各搜索叶节点，其中，搜索叶节点表示调控中心对取送车进行各操作策略后蒙特卡洛搜索树模拟出的铁路专用线的需求分布状态；各搜索节点的预期收益函数为：

式中，ca_st、ca_l分别是第st个搜索节点、第st个搜索节点的第l个搜索叶节点的绝对需求路径值，Shg_st、Shg_l分别是第st个搜索节点、第st个搜索节点的第l个搜索叶节点的饥饿值评分。Tc_st,l是从第st个搜索节点模拟第st个搜索节点的第l个搜索叶节点的取送车所行驶的路径长度之和，L是第st个搜索节点的搜索叶节点个数。

优选的，所述蒙特卡洛搜索树的搜索停止条件，包括：

计算搜索节点的搜索叶节点对应的各节点的空车节点需求预测值和装载节点需求预测值的和值，获取搜索节点的搜索叶节点的所有所述和值之和的结果，将所述之和的结果与搜索叶节点的绝对需求路径值的比值大于0.5作为蒙特卡洛搜索树的搜索停止条件。

本发明至少具有如下有益效果：

本发明将铁路的作业调控视作动态的优化调控模型，通过对铁路专用线中各节点提出的需求的时间和需求被完成的程度，构建动态饥饿需求值，并将其加入优化算法的参数设置中，避免了在铁路专用线作业中，某些调控需求排在不断加入的新调控需求后面，造成调控需求长时间搁置的“饥饿”现象；进一步通过对铁路专用线中各节点提出的需求的规律进行统计计算，得到节点需求预测值，模拟铁路专用线中各节点不断提出的新需求，结合蒙特卡洛搜索树，构建了动态铁路的作业调控策略优化模型，考虑到了不断加入的新调控需求，使调控策略优化模型更加贴合实际工程场景，进一步节省了运力资源。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案和优点，下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它附图。

图1为本发明提供的基于图论的铁路专用线作业调控方法的流程图；

图2为铁路专线及哈密尔顿示意图；

图3为节点状态中各项参数示意图。

具体实施方式

为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效，以下结合附图及较佳实施例，对依据本发明提出的基于图论的铁路专用线作业调控方法，其具体实施方式、结构、特征及其功效，详细说明如下。在下述说明中，不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外，一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。

下面结合附图具体的说明本发明所提供的基于图论的铁路专用线作业调控方法的具体方案。

本发明一个实施例提供的基于图论的铁路专用线作业调控方法，具体的，提供了如下的基于图论的铁路专用线作业调控方法，请参阅图1，该方法包括以下步骤：

步骤S001，收集铁路专线调控数据，根据图论获取哈密尔顿图。

首先进行数据采集，对于铁路专线，获取其每个站点，以及站点间每条路径的长度；为方便计算，此处的每条路径的长度使用取送车经过每条路径的消耗时间表示。

实时获取铁路调控系统中，每个运输需求的提出时间tm，每个运输需求提出时，要求的运输量记为A，其中A为需求的空车厢数量或需要被拉走的车厢数量；当每个需求被部分满足，如取送车拉来了空车厢或拉走了装货的车厢，记录需求被满足的车厢数量记为F。

根据站点以及站点间每条路径的长度，得到铁路专用线示意图，混合专用线示意图如图2中的(a)所示，其中所述混合专用线示意图即为铁路专用线示意图。并根据哈密尔顿图算法获得其哈密尔顿图，示意图如图2中的(b)所示。黑色节点是车站节点、灰色节点是作业点，V0、V1、V2、V3、V4、V5、V6是不同节点的编号，a、b、c、d、e、f、g、h是不同路径的长度；图2中(a)是混合型的铁路专用线的示意图，其中的每条直线代表一段铁路；图2中(b)是通过铁路专用线示意图根据哈密尔顿图算法获得的对应哈密尔顿图。哈密尔顿图算法在应用过程中，将一个节点视作哈密尔顿图的出发顶点，另一个节点视作一个需要经过一次的哈密尔顿图顶点，最后获得行走路径最短的哈密尔顿路。图2中(b)是哈密尔顿图的示意图，其中每条直线代表一个哈密尔顿路，其旁的[V0,V1]、[V0,V2]、[V1,V2]代表了每条哈密尔顿路的长度。

对每个节点，在预设天数Dy内记录其提出的需求的时刻和提出需求的数量，所述预设天数实施者自行设定，本实施例中预设天数Dy为60，所述需求的时刻以秒为单位，提出的需求数量以所需空车厢数量或需要被拉走的车厢数量。因此，一个节点每产生一次需求，就产生一个数对，其中产生空车厢需求的数对记为空车数对Eq＝{eq,tm,cte}，其中产生需要被拉走的车厢需求的数对为装载数对Lq＝{lq,tm,ctl}，其中tm为时刻，也即产生需求的时刻；其中eq、lq分别为产生的需求所要求的空车厢数量、需要被拉走的车厢数量。

其中cte、ctl为完成对应的需求所消耗的时间长度，称为需求路径，具体为：对于装载数对，由于需要被拉走的车厢的运送目的地明确，则以运送货物的起始节点到终止终点在哈密尔顿图中的哈密尔顿路径长度作为需求路径ctl；对于空车数对，将该节点在所述预设天数Dy内的所有空车厢需求完成时，在哈密尔顿图中走过的哈密尔顿路径长度的均值，作为每个空车数对的需求路径cte；对于每个节点的空车需求，其需求路径都等于cte。

步骤S002：针对铁路专线的调控场景构建蒙特卡洛搜索树的预期收益函数及搜索停止条件。

概括步骤：

a.构建动态饥饿值，防止节点需求饥饿。

b.构建节点需求预测值，模拟不断由各节点添加的新需求。

c.针对场景构建蒙特卡洛搜索树的预期收益函数和搜索停止条件。

具体展开如下：

a.构建动态饥饿值，防止节点需求饥饿。

在铁路专用线的作业调控中，是每个作业节点提出作业需求后，由调控中心对取送车进行调控。因此在使用哈密尔顿图对调控进行指导时，需要将哈密尔顿图和作业需求相结合，才能进一步的计算调控策略。

计算需求动态饥饿值：

当一个节点提出需求时，就需要调控中信为其安排取送车满足需求。在优化调控算法中，为防止出现某个需求持续排在新进入需求之后的问题，因此计算需求动态饥饿值hg如下：

式中T是当前时刻，tb_T,a是T时刻系统中第a个需求的提出时间，μ(T-tb_T)是T时刻与所有需求提出时间的差值的均值；A_a是T时刻系统中第a个需求在提出需求时的需求总量；F_a是T时刻系统中第a个需求已经被满足的需求量。hg_a,T是T时刻系统中第a个需求的动态饥饿值。

式中项是第a个需求距离其提出时间的已过去时间除以所有需求距离其提出时间的已过去时间的均值，第a个需求距离其提出时间的已过去时间相对于整体的越长，该项的值越大，动态饥饿值hg越大，代表了该需求被搁置的时间越长，应该优先解决该需求防止饥饿现象。

式中项是由于每个取送车所能承载的车厢数量有限，有时会导致某个需求被部分满足，如一部分原料已经从其中一个园区拉向另一个园区，或者某个园区已有部分的空车厢，可以进行部分货物的装载，这是需要降低该需求的优先级，去执行其它需求。该项的值越大，代表了该需求被部分满足的比例越少，对应的动态饥饿值hg越大，应该优先解决该需求防止饥饿现象。

b.构建节点需求预测值，模拟不断由各节点添加的新需求。

传统的铁路专用线作业调控算法，在获得调控策略时，是根据已有的运输需求安排调控策略，没有考虑到调控运输的需求是不断添加的，因此得到的调控策略是基于现有需求状况的最佳策略，当现有的需求状况比较极端时，得到的调控策略也就比较极端，当新的需求加入时，取送车的仍在执行过去的调控策略，而过去的调控策略与当前的需求状况适应性很差，造成运力资源浪费。因此在通过算法模拟不同调控策略并得到最优调控策略时，应考虑到各作业节点产生新的送取需求的可能，才可以得到最优的调控策略。

由于取送车运输的目标通常是工厂产品，由于工厂产品生产稳定，送取需求对应的也具有很强的以天为单位的周期性，因此可以通过节点需求函数表征送取需求产生的规律，本实施例通过统计数据构建节点需求函数，具体如下：

对第v个节点的空车数对，遍历所有空车数对，如果其时刻tm相同，则将tm相同的空车数对的空车厢数量eq相加，也即统计需求提出时间相同时所有空车数对的空车厢数量之和，将所述空车厢数量之和、对应的需求提出时间tm、完成需求所消耗的时间长度组成对应需求提出时间tm的新的空车数对；将各新的空车数对作为坐标点在笛尔卡二维坐标系上标出，其中时刻tm为横坐标，将新的空车数对中的eq除以预设天数Dy的值作为纵坐标；最后以得到的坐标系以及坐标系中的坐标点作为输入，对其进行插值，插值的间隔为1秒，插值的范围为24小时，插值顺序为从横轴从左到右，插值大小为被插值点左右两个点的均值，被插值的点左、右侧的点中没有值时，则在计算插值时将左、右侧的点的值视为0；对第一个点或最后一个点进行插值时，插值大小为其左侧或右侧的点的值。最终输出为一条在笛尔卡二维坐标系上的平滑曲线。

所得平滑曲线是对第v个节点Dy天内的空车厢需求进行叠加求和来进行分析获取的，其上任意一点代表了第v个节点在一天内的对应时刻，可能产生的空车厢需求数量；因此对所得平滑曲线求导数，得到的函数为空车节点需求函数fe(t)，其随着时间的定积分表征了定积分时间段内第v个节点产生空车厢需求的累积结果，累积结果越大，第v个节点越容易提出空车厢需求。

需要说明的是，对装载数对进行同样操作得到装载节点需求函数fl(t)，其随着时间的定积分表征了定积分时间段内第v个节点产生需要被拉走的车厢需求的累积大小，累积大小越大，第v个节点越容易提出需要被拉走的车厢需求。

计算空车节点需求预测值pre：

式中，Te是被预测的时刻，Tb_v是第v个节点在被预测时刻的上一次产生空车厢需求的时刻；pre_v,Te和分别是Te、Tb_v时刻第v个节点的空车节点需求预测值，/>是第v个节点在Tb_v时刻产生空车厢需求的空车厢需求数量，fe_v(t)是第v个节点的空车节点需求函数，/>是Tb_v时刻第v个节点完成对应的需求所消耗的时间长度。β是衰减系数，经验值取0.8。需要说明的是，当被预测时刻之前不存在上一次产生空车厢需求的时刻时，的取值实施者可根据实际情况自行设定，本实施例设置为1。

上式完成了对第v个节点的空车厢需求数量的预测。其中是距离上一次第v个节点提出需求以来，第v个节点产生空车厢需求的累积，累积越大，第v个节点越容易提出空车厢需求。

是上一次第v个节点提出需求时，其空车节点需求预测值与空车厢需求的空车厢需求所消耗时间的差值，如果差值为正，代表了过去积累的空车厢需求尚未得到满足，应该把多余的空车节点需求预测值累积到接下来的空车节点需求预测值中；如果差值为0，代表了过去积累的空车厢需求完全满足，空车节点需求预测值没有剩余；如果差值为负，代表了过去积累的空车厢需求过度满足，接下来的空车节点需求预测值中应该减去过度满足的部分。

衰减系数β是在将上一次的空车节点需求预测值的剩余累积到下一次空车节点需求预测值时的衰减系数，使较为久远的空车节点需求预测值的剩余累积对最新的空车节点需求预测值影响变小，是预测值主要和最近的时间段内的数据相关，使预测数据更加准确。

最终空车节点需求预测值pre_v,Te，能够表征在Te时刻，第v个节点提出新的空车厢需求的可能性大小，值越大可能性越大，该参量可以用于优化策略中，对可能新加入的节点需求的补充。

对于装载节点需求函数同理可得装载节点需求预测值prl_v,Te，具体过程同理易得，本实施例在此不再赘述。

综上本实施例获得了每个需求的需求动态饥饿值hg，空车节点需求预测值pre，装载节点需求预测值prl，由于本实施例所述场景的节点属性复杂，采用传统的优化调度算法构建模型复杂，计算量也随之增加，因此本实施例采用蒙特卡洛搜索树对调度策略进行选取。以当前的各节点需求的综合状态作为蒙特卡洛搜索树的一个搜索节点，调控中心每对取送车发送一次调度指令后，以预计的各节点需求的综合状态为搜索叶节点。

本实施例的蒙特卡洛搜索树采用上置信界函数作为搜索树进行搜索时的指导函数，具体过程为：

首先，设置蒙特卡洛搜索树中各搜索节点的状态。

通过专线铁路的调控中心可以获得取送车完成当前任务后各节点的状态，获得该状态下的各项参数，具体如图3所示，蒙特卡洛搜索树中每个搜索节点代表了一种铁路专用线的需求分布状态，需求分布状态为：该条铁路专用线中取送车完成当前任务后的位置，各节点的空车节点需求预测值pre、装载节点需求预测值prl。将各节点未完成的需求记为历史需求，可以获得每个历史需求的需求类型，分为：空车厢需求、需要被拉走的车厢需求；可以获得每个历史需求当前时刻的饥饿值大小。

然后，设定每一次蒙特卡洛模拟搜索的规则：

在当前搜索节点对应的各条铁路专用线状态中，指派闲置的取送车随机挑选一个历史需求进行处理，模拟决策的执行过程，直到下一次取送车完成任务后，重新计算各节点的参数，将该节点的参数作为当前搜索节点的搜索叶节点。记录从第k1个搜索节点的状态模拟到第k2个搜索节点的状态时，取送车所行驶的路径长度之和，能够对取送车执行一系列策略后的实际使用时间进行表征。

最后，设定蒙特卡洛树每次搜索后，各节点的评分更新方式：

由于本实施例采用上置信界算法作为评分更新方式，因此只需要说明上置信界函数中的节点估计的预期收益Si即可，具体评分更新方式为本领域公知技术不再赘述。具体如下：

对当前状态下的铁路专用线当中的所有历史需求，将所有历史需求的完成需求所消耗的时间长度的和值与哈密尔顿图中所有节点的需求预测值的和值进行求和，求和得到的值作为绝对需求路径值ca，表征了取送车完成当前状态下所有的需求消耗时间减去空车运行的时间，可以代表在当前状态下取送车需要处理的工作量大小。

对当前状态下的铁路专用线当中的所有历史需求，计算各历史需求的完成需求所消耗的时间长度与动态饥饿值的乘积，将所有历史需求的所述乘积的和值与哈密尔顿图中所有节点的需求预测值的和值进行求和，将求和结果作为饥饿修正需求路径值ch，是用饥饿值对绝对需求路径值ca进行修正后得到的值。

获得饥饿值评分如下：

Shg＝ch-ca

式中，ch是饥饿修正需求路径值，ca是绝对需求路径值。相减得到的值Shg代表了当前的各节点的状态中各需求的饥饿分布情况，差值越大代表当前各节点的状态中的饥饿值整体越大，各需求的饥饿分布整体上越偏向于饥饿。

最终每个搜索节点都有一个绝对需求路径值ca和饥饿值评分。

在蒙特卡洛搜索树中，每个搜索节点代表了一种铁路专用线的需求分布状态，每个搜索节点下方连接的搜索叶节点代表了调控中心对取送车进行某一步操作策略后，模拟出的铁路专用线的需求分布状态。因此每个搜索节点与其搜索叶节点之间，是算法模拟的调控中心对取送车进行一系列调控操作策略后的模拟状态。比较搜索节点和其搜索叶节点之间的绝对需求路径值ca和饥饿值评分，可以获得一系列调控操作策略的评分，选取评分高的策略方向，就可以得到最优的调控操作策略。

对于蒙特卡洛搜索树中的第st个搜索节点，其预期收益函数Si_st的计算如下式：

式中，ca_st、ca_l分别是第st个搜索节点和第st个搜索节点的第l个搜索叶节点的绝对需求路径值，Shg_st、Shg_l分别是第st个搜索节点和第st个搜索节点的第l个搜索叶节点的饥饿值评分。Tc_st,l是从第st个搜索节点模拟第st个搜索节点的第l个搜索叶节点的取送车所行驶的路径长度之和，能够代表取送车执行一系列策略后的实际使用时间。L是第st个搜索节点的搜索叶节点个数。

式中是搜索根节点和其搜索叶节点的绝对需求路径值之差除以时间。减式的差值越大，代表第st个搜索节点经过一系列策略到达第l个搜索叶节点时，各节点的状态中的绝对需求路径值下降越多，代表两个搜索节点代表的状态之间，取送车已处理的需求工作量越多；除以Tc_st,l后就是取送车单位时间内处理工作量的大小，代表策略下取送车的效率；所得值越大，取送车效率越高，也即该系列策略越好。

式中是搜索根节点和其搜索叶节点的饥饿值评分之差除以时间，分子越大，代表第st个搜索节点经过一系列策略到达第l个搜索叶节点时，各节点的状态中的饥饿值下降越多，代表两个搜索节点代表的状态之间，取送车经过一系列策略处理掉的高饥饿需求越多；除以Tc_st,l就是取送车单位时间内处理饥饿需求的多少，代表该一系列策略下取送车处理饥饿需求的效率；所得值越大，取送车处理饥饿需求的效率越高，该一系列策略越好。

最终通过上式计算得到第st个搜索节点的节点估计的预期收益Si_st，值越大代表该搜索树分支代表的一系列调度策略越好。

进一步，本实施例将设置搜索停止条件：

式中，ca_l是第st个搜索节点的第l个搜索叶节点的绝对需求路径值，pre_l,v、prl_l,v分别是第st个搜索节点的第l个搜索叶节点的第v个节点的空车节点需求预测值和装载节点需求预测值。V为第l个搜索叶节点的节点总数。

式中，是需求预测值的和，因此上式含义逻辑为：当需求预测值的和占绝对需求路径值的一半即以上时，认为继续往该方向进行策略模拟时，得到的结果与当下的铁路专用线各节点需求分布的关联性越小，也即继续往该方向搜索的价值越小，越需要停止搜索。

另外设置最大搜索次数为10000，需要说明的是，实施者可自行设定最大搜索次数。当所有的策略模拟方向都满足搜索停止条件或达到最大搜索次数，此时停止蒙特卡洛搜索树的模拟。

步骤S003，根据蒙特卡洛搜索树获得调控方案指挥取送车。

在步骤S002中设定了蒙特卡洛搜索树的具体规则，包括：

1.每个搜索节点代表的状态：当前取送车所在位置、铁路专用线中每个节点的各项参数所构成的数据集合，作为每个搜索节点的状态。

2.设定每一次蒙特卡洛模拟搜索的规则：系统在搜索母节点中，选取一项历史需求进行模拟，得到模拟后的状态作为搜索叶节点。

3.设定蒙特卡洛每次搜索后，对各节点的评分更新方式：采用上置信界算法计算更新搜索节点的评分，具体参数设置于步骤S2中已描述，具体计算步骤为本领域公知技术不再赘述。

4.设置搜索停止条件：具体参数设置于步骤S002中，在此不再重复阐述。

需要说明的是，蒙特卡洛搜索树搜索过程及节点更新、最佳节点选取过程为本领域公知技术，本实施例对此不做限制，在此不再赘述。最终，将各最佳节点对应的调控策略作为铁路专用线的下一个调控指令，完成铁路专用线的调控。

需要说明的是：上述本发明实施例先后顺序仅仅为了描述，不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同或相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。

以上所述实施例仅用以说明本申请的技术方案，而非对其限制；对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的范围，均应包含在本申请的保护范围之内。

Claims

1.基于图论的铁路专用线作业调控方法，其特征在于，该方法包括以下步骤：

结合搜索停止条件、预设最大搜索次数以及预期收益函数采用蒙特卡洛搜索树模拟搜索各最佳节点及调控策略，将最佳节点对应的调控策略作为铁路专用线的下一个调控指令，完成铁路专用线的调控；

所述获取各节点的空车数对及装载数对，包括：

将产生的需求所需要被拉走的车厢数量、需求提出时刻以及完成需求所消耗的时间长度组成一个装载数对，其中，装载数对中完成需求所消耗的时间长度为：以运送需要被拉走的车厢的起始节点到终止终点在哈密尔顿图中的哈密尔顿路径长度；

所述动态饥饿值，包括：

将第一比值与第二比值的和值作为T时刻各需求的动态饥饿值；

所述构建蒙特卡洛搜索树中各搜索节点状态并获取绝对需求路径值，包括：

将各节点未完成的需求记为历史需求，将所有历史需求的完成需求所消耗的时间长度的和值与哈密尔顿图中所有节点的需求预测值的和值进行求和，求和结果作为绝对需求路径值；

所述饥饿修正需求路径值，包括：

2.如权利要求1所述的基于图论的铁路专用线作业调控方法，其特征在于，所述根据各节点的空车数对构建各节点的空车节点需求函数，包括：

3.如权利要求2所述的基于图论的铁路专用线作业调控方法，其特征在于，所述空车节点需求预测值，包括：

4.如权利要求1所述的基于图论的铁路专用线作业调控方法，其特征在于，所述根据绝对需求路径值及饥饿修正需求路径值获取每个需求的饥饿值评分，包括：将饥饿修正需求路径值与绝对需求路径值的差值作为饥饿值评分。

5.如权利要求4所述的基于图论的铁路专用线作业调控方法，其特征在于，所述根据饥饿值评分及蒙特卡洛搜索树中各搜索节点的绝对需求路径值构建各搜索节点的预期收益函数，包括：

式中，、/>分别是第/>个搜索节点、第/>个搜索节点的第/>个搜索叶节点的绝对需求路径值，/>、/>分别是第/>个搜索节点、第/>个搜索节点的第/>个搜索叶节点的饥饿值评分，/>是从第/>个搜索节点模拟第/>个搜索节点的第/>个搜索叶节点的取送车所行驶的路径长度之和，/>是第/>个搜索节点的搜索叶节点个数。

6.如权利要求5所述的基于图论的铁路专用线作业调控方法，其特征在于，所述蒙特卡洛搜索树的搜索停止条件，包括：