CN117864218A - 一种基于混合专家模型的轨旁辅助决策中心设备 - Google Patents
一种基于混合专家模型的轨旁辅助决策中心设备 Download PDFInfo
- Publication number
- CN117864218A CN117864218A CN202410181083.2A CN202410181083A CN117864218A CN 117864218 A CN117864218 A CN 117864218A CN 202410181083 A CN202410181083 A CN 202410181083A CN 117864218 A CN117864218 A CN 117864218A
- Authority
- CN
- China
- Prior art keywords
- model
- expert
- data
- trackside
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims abstract description 23
- 230000008569 process Effects 0.000 claims abstract description 15
- 238000012545 processing Methods 0.000 claims abstract description 4
- 238000012423 maintenance Methods 0.000 claims description 40
- 238000007726 management method Methods 0.000 claims description 39
- 230000001276 controlling effect Effects 0.000 claims description 22
- 238000012549 training Methods 0.000 claims description 17
- 238000013461 design Methods 0.000 claims description 16
- 238000005516 engineering process Methods 0.000 claims description 15
- 238000010276 construction Methods 0.000 claims description 6
- 230000002452 interceptive effect Effects 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 238000012544 monitoring process Methods 0.000 claims description 5
- 238000013500 data storage Methods 0.000 claims description 4
- 238000004891 communication Methods 0.000 claims description 3
- 238000012805 post-processing Methods 0.000 claims description 3
- 230000001105 regulatory effect Effects 0.000 claims description 3
- 238000011084 recovery Methods 0.000 abstract description 10
- 230000008901 benefit Effects 0.000 abstract description 6
- 238000013475 authorization Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 230000003993 interaction Effects 0.000 description 6
- 238000013499 data model Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical group [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000009545 invasion Effects 0.000 description 2
- 230000003137 locomotive effect Effects 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 230000002195 synergetic effect Effects 0.000 description 2
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000011217 control strategy Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000003340 mental effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- APTZNLHMIGJTEW-UHFFFAOYSA-N pyraflufen-ethyl Chemical compound C1=C(Cl)C(OCC(=O)OCC)=CC(C=2C(=C(OC(F)F)N(C)N=2)Cl)=C1F APTZNLHMIGJTEW-UHFFFAOYSA-N 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012384 transportation and delivery Methods 0.000 description 1
- 238000013024 troubleshooting Methods 0.000 description 1
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B61—RAILWAYS
- B61L—GUIDING RAILWAY TRAFFIC; ENSURING THE SAFETY OF RAILWAY TRAFFIC
- B61L27/00—Central railway traffic control systems; Trackside control; Communication systems specially adapted therefor
- B61L27/60—Testing or simulation
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B61—RAILWAYS
- B61L—GUIDING RAILWAY TRAFFIC; ENSURING THE SAFETY OF RAILWAY TRAFFIC
- B61L27/00—Central railway traffic control systems; Trackside control; Communication systems specially adapted therefor
- B61L27/50—Trackside diagnosis or maintenance, e.g. software upgrades
- B61L27/53—Trackside diagnosis or maintenance, e.g. software upgrades for trackside elements or systems, e.g. trackside supervision of trackside control system conditions
Landscapes
- Engineering & Computer Science (AREA)
- Mechanical Engineering (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Train Traffic Observation, Control, And Security (AREA)
Abstract
本发明公开了一种基于混合专家模型的轨旁辅助决策中心设备,该设备包含:外部输入接口模块,其用于接收外部设备发来的信息;外部输出接口模块,其用于向外部设备发送信息;AI模型管理模块,其分别与所述外部输入接口模块和所述外部输出接口模块连接,所述AI模型管理模块包含由铁路运营数据、设备数据、气象数据、灾害数据及相应处理信息训练的MMOE混合专家模型和至少一个LLM模型,MMOE混合专家模型和LLM模型中的至少一个形成轨交车辆控制多专家大模型,所述AI模型管理模块接收所述外部输入接口模块接收的信息,并通过所述轨交车辆控制多专家大模型进行处理,得到相应的辅助决策意见,并通过外部输出接口模块将相应的辅助决策意见输出到相应设备。其优点是:该设备可实现多专业跨领域专家经验协同,发挥协同优势,可有效提高现场决策效率,帮助轨道交通提高运输效率和安全系数,以及突发事件的恢复速度和应急水平。
Description
技术领域
本发明涉及列车控制的辅助决策领域,具体涉及一种基于混合专家模型的轨旁辅助决策中心设备。
背景技术
现有轨道交通的控制手段和调度方法在快速、有效解决列车运行过程中出现的突发事件(比如电力故障、突发地震、山体滑坡、异物侵限等)方面尚有一定差距。目前列车运行控制与调度采用分层架构,突发情况下主要依赖调度员和司机的人工经验进行应急处置,然而这一领域场景复杂、决策复杂,一旦决策错误,引起的后果非常严重,可能造成列车严重晚点、旅客人身伤害、重大财产损失等,导致旅客满意度不高。
除此之外,(1)货运领域的行车指挥,操作复杂,需要调度、列控设备联动以辅助调度员进行操作。(2)在自动驾驶领域,需要综合调度、控制等信息,统筹把握,做出有利于提高运输能力的控车策略的最优判断。比如,轻车行车需要会让重车。(3)现场设备故障后,需要信号、调度、运维多专业配合调查故障。
由上述可知,现有的列车控制领域经常会出现多专业协同问题,仅依靠人力基于庞杂数据做出精准决策的难度较高,因此,需要借助智能设备辅助提高现场决策的准确性。然而现有系统中的智能设备较多侧重于系统间的信息交互量和内容的增加,或很笼统简单的提到了提升智能化水平,这些都无法对决策起到较好的辅助效果,因此,需要对现有技术进行改进。
可以理解的是,上述陈述仅提供与本发明有关的背景技术,而并不必然地构成现有技术。
发明内容
基于前述技术问题,本发明的目的在于提供一种基于混合专家模型的轨旁辅助决策中心设备,该轨旁辅助决策中心设备的AI模型管理模块基于铁路运营数据、设备数据等信息进行模型训练,以基于实际应用场景获取应用性较高的数据模型,同时其可基于MMOE混合专家模型和各个LLM模型中的至少一个模型形成轨交车辆控制多专家大模型,实现多专业跨领域专家经验协同,发挥协同优势。该轨旁辅助决策中心设备率先提出“群组”专家智能大模型在轨交的应用,可有效提高现场决策效率,帮助轨道交通提高运输效率和安全系数,以及突发事件的恢复速度和应急水平。
为了达到上述目的,本发明通过以下技术方案实现:
一种基于混合专家模型的轨旁辅助决策中心设备,包含:
外部输入接口模块,其用于接收外部设备发来的信息;
外部输出接口模块,其用于向外部设备发送信息;
AI模型管理模块,其分别与所述外部输入接口模块和所述外部输出接口模块连接,所述AI模型管理模块包含由铁路运营数据、设备数据、气象数据、灾害数据及相应处理信息训练的MMOE混合专家模型和至少一个LLM模型,MMOE混合专家模型和LLM模型中的至少一个形成轨交车辆控制多专家大模型,所述AI模型管理模块接收所述外部输入接口模块接收的信息,并通过所述轨交车辆控制多专家大模型进行处理,得到相应的辅助决策意见,并通过外部输出接口模块将相应的辅助决策意见输出到相应设备。
可选的,基于不同的应用场景,选取多个不同的轨交车辆控制多专家大模型进行训练,根据各个轨交车辆控制多专家大模型训练的准确性、精确度、召回率和F1分数指标,选择结果最优的模型,作为此应用场景下对应的轨交车辆控制多专家大模型在线运用。
可选的,所述AI模型管理模块通过指令角色以提示词设计和对话的形式对所述轨交车辆控制多专家大模型进行微调。
可选的,所述AI模型管理模块利用思维链Cot技术进行提示词设计和录入。
可选的,所述MMOE混合专家模型包含多个门控模型和其对应的多个子大模型,每个子大模型包含至少一个子专家模型,所述门控模型对接收的数据进行处理,判定输入的数据应分配给哪个子专家模型处理并分配各个子专家模型的权重,进而输出对应的操作提示。
可选的,各个子大模型分别为行车调度大模型、轨旁列控大模型和司机驾驶大模型。
可选的,所述行车调度大模型的子专家模型包含:列车调度专家模型、货运调度专家模型、车站调度专家模型、移动闭塞控制专家模型、固定闭塞控制专家模型、联锁控制专家模型、临时限速专家模型、线路限速专家模型、调车控制专家模型、监测专家模型、现场设备维修专家模型、物流专家模型和旅服专家模型中的至少一种。
可选的,所述外部输入接口模块接收的外部设备发来的信息包含:
调度数据、控车数据、监视视频、调度电话语音数据、应急处置说明、操作说明、事后处理说明、关键操作说明、旅客服务、物流数据、气象数据、灾害数据和施工数据中的至少一种。
可选的,所述外部输出接口模块向外部设备发送的信息包含:
对各方人员的建议、输出给列控维护台的用于故障修复和应急处置的信息、输出给车载DMI的用于辅助控车的提示信息、输出给调度设备的操作提示信息、发送至自动驾驶ATO设备的控车辅助指令信息和发送至ATP、TCC、RBC的安全防护信息数据中的至少一种。
可选的,还包含:
外部接口数据转换模块,其分别与所述外部输入接口模块、所述外部输出接口模块和所述AI模型管理模块连接,所述外部接口数据转换模块用于将数据转换为预定格式。
可选的,还包含:
控显终端,其用于对各个模块进行调控。
可选的,所述轨旁辅助决策中心设备与外部设备连接后自动运行;
和/或,所述轨旁辅助决策中心设备中的各个模块通过控显终端控制运行。
可选的,还包含:
数据存储模块,其用于存储所述轨旁辅助决策中心设备的各类数据。
可选的,所述轨旁辅助决策中心设备的各类数据包含:
输入输出交互数据日志、基于多角色指令的轨交车辆控制多专家大模型数据、通信和线路配置数据和在线运行状态数据中的至少一种。
可选的,所述辅助决策意见采用预定形式进行输出;
所述外部设备包含TCC设备的维护台、RBC设备的维护台、CBI设备的维护台和车载DMI显示终端中的至少一种。
本发明与现有技术相比具有以下优点:
本发明的一种基于混合专家模型的轨旁辅助决策中心设备中,AI模型管理模块利用最新的大模型技术(MMOE混合专家模型和LLM模型),将不同专业分别对应一个子专家大模型,通过MMOE混合专家模型技术构建更高层的大模型,可以多专业跨领域专家经验协同,发挥协同优势,以提高现场决策水平,帮助提高运行效率、运行安全以及恢复效率。与既有AI在列控领域的应用相比,该轨旁辅助决策中心设备率先提出“群组”专家智能大模型在轨交的应用,且其根据本领域实际场景,对大模型进行了适应性设计,结合通用技术,给出了具体的可落地的大模型方案以及设备设计方案,可有效提高现场决策效率,帮助轨道交通提高运输效率和安全系数,以及突发事件的恢复速度和应急水平。
进一步的,该轨旁辅助决策中心设备利用大模型技术中的多智能体提示词设计技术,设计不同的提示词模板,以应对不同的问题场景,快速形成最优解决方案,提供给调度、司机、信号运维人员,给相关人员和系统提出决策参考,便于快速、准确的做出决策。同时该轨旁辅助决策中心设备支持语音、视频、文字等多模态输入、输出,相比于目前AI在列控领域的应用,可接收、处理、输出的信息更加多元化,提高了系统的易用性和智能化水平。
进一步的,目前还尚未见到将混合专家模型和多角色指令设计技术应用于轨交车辆控制的辅助决策领域,本发明的轨旁辅助决策中心设备将大模型的最新技术,包括混合专家模型和角色指令技术引入调度、列控领域,相比于既有的跨领域多专业协同中多着眼于信息的交互,没有体现出“跨领域”的智能交互协同演进的特点,本发明针对性的提出了跨领域协同“智能”的特点,实现了辅助决策信息的智能化,有助于提高运行效率、运行安全以及恢复效率。
附图说明
图1为本发明的一种基于混合专家模型的轨旁辅助决策中心设备的示意图;
图2为本发明的一种MMOE混合专家模型示意图;
图3为本发明的一种多个独立LLM模型通过角色指令协同工作的示意图。
具体实施方式
以下结合附图,通过详细说明一个较佳的具体实施例,对本发明做进一步阐述。
基于前述问题,本发明提供了一种基于混合专家模型的轨旁辅助决策中心设备(Train Control Auxiliary Decision Center,简称TCADC),该轨旁辅助决策中心设备基于本领域实际应用场景,对AI模型管理模块的大模型进行了适应性设计,结合通用技术,给出了具体的可落地的大模型方案,以及设备设计方案。基于此,该轨旁辅助决策中心设备可“吸收”调度(行车调度、综合调度等)、列车控(中心控制、车站控制、车载控制)和调车控制、运维、物流、旅客服务等多专业的专家经验,进而为轨道交通车辆运行控制提出最优的决策方案,以提高现场决策水平,帮助提高运行效率、运行安全以及恢复效率。
具体地,如图1所示,为本发明的一种基于混合专家模型的轨旁辅助决策中心设备,该设备包含:外部输入接口模块、外部输出接口模块和AI模型管理模块,所述外部输入接口模块用于接收外部设备发来的信息,所述外部输出接口模块用于向外部设备发送信息,所述AI模型管理模块分别与所述外部输入接口模块和所述外部输出接口模块连接,所述AI模型管理模块包含由铁路运营数据、设备数据、气象数据、灾害数据及相应处理信息训练的MMOE(Multi-gate Mixture-of-Experts)混合专家模型和至少一个LLM模型,MMOE混合专家模型和各个LLM模型中的至少一个形成轨交车辆控制多专家大模型,所述AI模型管理模块接收所述外部输入接口模块接收的信息,并通过所述轨交车辆控制多专家大模型进行处理,得到相应的辅助决策意见,并通过外部输出接口模块将相应的辅助决策意见输出到相应设备。
由上述可知,该轨旁辅助决策中心设备的AI模型管理模块基于铁路运营数据、设备数据等信息进行模型训练,以基于实际应用场景获取应用性较高的数据模型,同时其可基于MMOE混合专家模型和各个LLM模型中的至少一个模型形成轨交车辆控制多专家大模型,实现多专业跨领域专家经验协同,发挥协同优势。该轨旁辅助决策中心设备率先提出“群组”专家智能大模型在轨交的应用,可有效提高现场决策效率,帮助轨道交通提高运输效率和安全系数,以及突发事件的恢复速度和应急水平。
在实际应用中,基于不同的应用场景,可选取多个不同的轨交车辆控制多专家大模型进行训练,根据各个轨交车辆控制多专家大模型训练的准确性、精确度、召回率和F1分数指标,选择结果最优的模型,作为此应用场景下对应的轨交车辆控制多专家大模型在线运用。
随着AI技术飞速发展,特别是大模型技术的出现,使得AI出现了智慧的涌现。在本发明中,通过MMOE混合专家模型训练多个子网络即子专家模型,不同子专家模型对应不同的“领域专家”,再通过“组合”的方式,组合混合专家的大模型,达到了更小网络规模下的更高的智能化水平。具体地,所述MMOE混合专家模型包含多个门控模型和其对应的多个子大模型(可参见图2),每个子大模型包含至少一个子专家模型,所述门控模型对接收的数据进行处理,判定输入的数据应分配给哪个子专家模型处理并分配各个子专家模型的权重,进而输出对应的操作提示。
在实际应用中,所述AI模型管理模块中的MMOE混合专家模型可在线部署于中心的服务器部分。构建MMOE混合专家模型时,可使每个领域对应一个子大模型,例如可以为调度领域、列控领域等,每个领域可以进一步划分为多个具体的细分领域,例如可以按车载、地面区分领域专家,也可以按照运营方、设备方区分专家。每个细分领域可对应若干个“专家”,基于各个“专家”的数据对模型进行训练,进而形成该细分领域对应的子专家模型。其中,所述“专家”的数据可包含“专家”的操作视频、语音视频、操作和处置文档说明、交互接口数据等。进一步的,各个领域对应的子大模型通过GATE网关即门控模型协调多个子专家模型的输出,根据公式(1)的结果输出至下一层输出。GATE网关对应目前人与人交流时,需要多专业协同的场景,比如,列车、调车一体化融合场景,调度、列控、运维联合排查问题的场景等。各个子大模型的输出的综合为MMOE混合专家模型的输出。
其中,y为输出的结果,w为权重,各个Expert分别对应各个领域的子专家模型的输出,n为子专家模型的数量。
示例地,如图2所示,为一实施例的MMOE混合专家模型,该MMOE混合专家模型的各个子大模型包含行车调度大模型、轨旁列控大模型和司机驾驶大模型,各个子大模型分别对应有门控模型以分配各个子专家模型的权重,可使不同子专家模型的权重值不同。在该实施例中,行车调度大模型对应列车调度协调解决门控(GATE1),司机驾驶大模型对应车地列控协调解决门控(GATE2),轨旁列控大模型对应调车控制、物流协同解决门控(GATE3)。各个子大模型基于其对应的门控模型生成对应的操作提示,进而进行输出。进一步的,其行车调度大模型的子专家模型包含:列车调度专家模型、货运调度专家模型、车站调度专家模型、移动闭塞控制专家模型、固定闭塞控制专家模型、联锁控制专家模型、临时限速专家模型、线路限速专家模型、调车控制专家模型、监测专家模型、现场设备维修专家模型、物流专家模型和旅服专家模型中的至少一种。
需要说明的是,MMOE混合专家模型的子大模型不仅限于上述,在其他实施例中,还可采用其他领域类别的数据进行模型训练。进一步的,所述行车调度大模型中的子专家模型不仅限于上述,在其他实施例中,其还可包含其他子专家模型,例如机车调度专家模型和编组调度专家模型,本发明对此不做限制。
在实际应用中,训练专家网络模型所需的数据可从以下几个方面获取:(1)国铁集团、地方铁路等运营公司中的专家数据:11)调度领域。可进一步细分为行车调度、机车调度、车站调度、车辆调度、编组调度、货运调度、助理调度等。12)信号专业人员。设备管理处/科专业领导专家,道岔等现场设备维修人员、信号室值班员。13)客运和货运方面的专业人员。(2)设备供应商“专家”数据:21)列控中心TCC、无线闭塞中心RBC、临时限速服务器TSRS、车载ATP/ATO信号设备的交互日志信息、维护诊断日志、操作记录信息记录。22)TCC、RBC、TSRS信号设备厂家的使用手册、故障处置说明。23)调度中心CTC、监测CSM调度和运维设备的日志信息,操作记录信息。24)CTC、CSM厂家的使用手册、故障处置说明。25)旅客服务、货运服务的操作信息和内部关键事件信息。(3)轨道交通外部“专家”数据:31)灾害、气象部门的关键数据,包括地震、暴风雪、异物入侵等关键信息。32)关键社会性事件数据信息。
训练模型时,选取应用场景涉及到的数据以及对应的通用轨交车辆控制多专家大模型,在通用轨交车辆控制多专家大模型的基础上,将上述数据(包含输入信息和输出信息)作为训练数据录入通用轨交车辆控制多专家大模型,将输出信息作为训练目标,最小化模型输出的输出数据与目标输出数据之间的差距,以实现对通用轨交车辆控制多专家大模型的训练。训练过程可概括为反向传播算法,根据反向传播算法训练神经网络。将轨旁辅助决策中心设备在线运用时,将输入信息接入该设备,该设备将其录入到AI模型管理模块中,通过多专家模型进行智能运算,根据运算结果,将其提供的输出信息输出给相关用户。
另一方面,在本发明中,所述AI模型管理模块还包含相互独立的LLM模型,所述LLM模型相当于将上述MMOE混合专家模型中的各个子大模型独立出来,分别为独立输入、输出的子专家模型,分别基于角色指令进行设计,比如,调度对应的大模型,就用调度的角色进行设计;列控的大模型就用列控的角色进行设计。各个子大模型即各个LLM模型可相互自动进行输入、输出的对话,实现训练升级以及在线运用,从而形成铁路调度、信号跨领域“专家”群,以集群的形式,协同工作,形成各个决策,输出给对应的用户。示例地,如图3所示,为一实施例中相互独立的多个LLM模型独立工作相互协同的示意图,在该实施例中,所述AI模型管理模块包含行车调度大模型、轨旁列控大模型和司机驾驶大模型,调度角色提示词作为行车调度大模型的输入数据,进而得到调整指令或调整计划;轨旁列控角色提示词和从行车调度大模型得到的调度指令作为轨旁列控大模型的输入数据,进而得到维修建议或授权指令;司机角色提示词和从轨旁列控大模型得到的授权指令作为司机驾驶大模型的输入数据,进而得到驾驶操作建议。采用上述模式使各个LLM模型之间对话,可进一步实现相应的模型升级,提高其生成的建议的可靠性。
由前述可知,所述AI模型管理模块中包含MMOE混合专家模型和至少一个LLM模型,因此,所述AI模型管理模块实际应用的轨交车辆控制多专家大模型可以有三种方向的设计,具体为只采用MMOE混合专家模型、只采用LLM模型以及结合MMOE混合专家模型和LLM模型,在实际应用中,可基于实际应用场景选取训练结果较好的模型作为该应用场景对应的轨交车辆控制多专家大模型,可根据实际应用需求和实际效果进行调整。
进一步的,在本发明中,在MMOE混合专家模型和LLM模型的基础上,所述AI模型管理模块通过指令角色以提示词设计和对话的形式对所述轨交车辆控制多专家大模型进行微调(可参见图3)。
具体地,在本实施例中,所述AI模型管理模块利用思维链Cot技术进行提示词设计和录入。例如分别设计调度设备、列控设备、运维设备、调度人员角色、司机、轨旁信号人员、物流人员、旅服人员几种角色;可根据需要,进一步细分某个业务领域。将这些角色在某些场景里,利用思维链Cot技术进行提示词设计和录入,以对大模型进行微调。例如在调度作业场景、列控作业场景、运维作业场景、现场故障处置和恢复的场景或突发事件应急处置和恢复的场景里进行微调,当然也可为其他场景,本发明对此不做限制。基于上述场景中的不同角色的任务信息和交互信息,进行提示词设计,对大模型进行微调,获取基于多角色指令的轨交车辆控制多专家大模型。
进一步的,所述AI模型管理模块具有多个轨交车辆控制多专家大模型时,各个轨交车辆控制多专家大模型的组成可不同,各个轨交车辆控制多专家大模型之间可联合起来进行多角色设计。例如可部分采用混合专家模型,部分采用独立模型,联合起来进行多角色设计,例如,调度+轨旁列控+司机为一个调度列控一体化系统混合模型作为轨交车辆控制多专家大模型,运维、旅服、物流专家为一个混合专家模型作为轨交车辆控制多专家大模型,两个轨交车辆控制多专家大模型之间进行对话,达到群体最优的效果。
另一方面,如图1所示,所述轨旁辅助决策中心设备的外部输入接口模块接收的外部设备发来的信息包含:调度数据、控车数据、监视视频、调度电话语音数据、应急处置说明、操作说明、事后处理说明、关键操作说明、旅客服务、物流数据、气象数据、灾害数据和施工数据中的至少一种。可选的,所述外部设备包含TCC设备的维护台、RBC设备的维护台、CBI设备的维护台和车载DMI显示终端中的至少一种。进一步的,所述外部输入接口模块的信息输入具有以下两类方式:第一类,通过设备间接口输入,设备间接口尽可能复用既有系统中的接口进行数据交互,避免重复开发成本,这些接口可获取下列信息:(1)既有调度和控制设备的接口数据。接入调度与列控、调控、联锁设备等交互的接口数据,此类数据由国家铁路局、国铁集团等严格定义,每个字段有明确的长度、含义等。该数据包括限速命令、进路命令、道岔操作命令、区段操作命令、方向操作命令、进路预告信息、调车作业单、UEM命令等命令,以及命令的执行情况;该数据还包括运行计划信息、折返计划信息等,以及计划的回执;该数据还包括道岔、轨道电路等设备状态信息、车辆运行状态信息。(2)既有控制设备间接口数据。该接口数据包括联锁CBI设备、列控中心TCC设备、无线闭塞中心RBC间、车载ATP、车载ATO设备、调车STP设备等交互信息。这些交互信息数据也有相关规范的严格定义,该数据包括进路状态、限速命令和状态、区段和道岔状态数据等。(3)通过既有监测运维设备(CSM)与其他设备的接口,获得CSM的相关数据。(4)维护台记录的内部日志、关键事件、报警日志等信息。(5)旅客服务信息、物流信息,具体地包括突发高客流的信息、旅客滞留信息、旅客疏解信息、货物滞留信息。第二类,人员语音和作业文字总结信息:(1)对现场调度电话进行记录,记录有时间信息、语音信息、人员信息。(2)带有时机信息、人员信息、场所信息等的现场作业说明和总结信息。该说明和信息可包括:21)操作说明(对应到上述设备间接口数据的操作说明)和维修手册。22)关键事件的处置措施(包括上述接口数据的维护操作、应急处置操作)。需进路有应急处置的时间信息、应急处置的类型信息,用于与相关时刻的大数据进行比对学习。23)关键操作命令,包括排进路的时机、控车加减速时机、倒机操作信息等。(3)人员关键操作日志数据。关键操作包括:31)轨旁倒机、重启、维修操作。32)司机在制动、牵引、惰行等关键时刻时的关键操作;在进入、运行、退出时的关键操作;执行调度命令时的关键操作。33)调度关键调度命令拟制、下达、管理;34)旅服系统、物流系统关键操作;35)现场信号设备关键运维操作,具体包括道岔、信号机、轨道电路保养等。(4)关键时刻的视频、语音信息。关键时刻包括:进路办理时刻、调度命令下达的时刻、司机加减速的时刻、故障维修的时刻。视频可为调度操作视频、信号工在机械室操作视频和司机在驾驶室操作视频中的至少一种。(5)灾害/气象/旅客服务部门的信息。该信息包括事发时刻的温度、湿度、风力信息;地震、台风、雷电等灾害信息;异物入侵报警信息等。
进一步的,所述轨旁辅助决策中心设备的外部输出接口模块向外部设备发送的信息包含:对各方人员的建议、输出给列控维护台的用于故障修复和应急处置的信息、输出给车载DMI的用于辅助控车的提示信息、输出给调度设备的操作提示信息、发送至自动驾驶ATO设备的控车辅助指令信息和发送至ATP、TCC、RBC的安全防护信息数据中的至少一种。进一步的,所述轨旁辅助决策中心设备通过外部输出接口模块输出的辅助决策意见可采用预定形式进行输出,示例地,采用文字、关键语音或预定义表格化数据(比如把枚举类型对应到某个手册文件或者指示灯)输出(可参见图2)。
进一步的,如图1所示,所述轨旁辅助决策中心设备还包含外部接口数据转换模块,所述外部接口数据转换模块分别与所述外部输入接口模块、所述外部输出接口模块和所述AI模型管理模块连接,所述外部接口数据转换模块用于将数据转换为预定格式,以便数据的输入、输出和处理。
进一步的,如图1所示,所述轨旁辅助决策中心设备还包含控显终端,所述控显终端可为一个或多个,所述控显终端用于对各个模块进行调控。示例地,所述控显终端可进行开关机操作、故障修复操作、模型更新升级操作、软件升级操作、权限管理操作、控车辅助指令操作以及显示AI模型管理模块的输出结果。
可以理解的是,本发明对所述轨旁辅助决策中心设备的驱动运行方式不做限制。可选的,所述轨旁辅助决策中心设备与外部设备连接后自动运行;或,所述轨旁辅助决策中心设备中的各个模块通过控显终端控制运行,当然,在实际应用中,也可两种控制方式并用,在自动运行的基础上,通过所述控显终端对所述AI模型管理模块的输出结果进行显示,同时其也可对各个模块进行调控。
进一步的,所述轨旁辅助决策中心设备还包含数据存储模块,所述数据存储模块用于存储所述轨旁辅助决策中心设备的各类数据。可选的,所述轨旁辅助决策中心设备的各类数据包含:输入输出交互数据日志、基于多角色指令的轨交车辆控制多专家大模型数据、通信和线路配置数据和在线运行状态数据中的至少一种。
在本发明中,轨旁辅助决策中心设备可基于历史数据进行学习,得到AI模型管理模块中的轨交交通车辆运行控制大模型。学习的输入信息包括列控等数据。该轨旁辅助决策中心设备根据轨道交通领域的特点,基于MMOE混合专家模型、LLM模型和角色指令技术,对大模型进行了设计,获取适合本领域的大模型,并给出了训练和运用策略。
轨旁辅助决策中心设备在线运行时,从外部系统接收列控数据、调度数据、运维数据等,可令相关设备的维护接口转发接口数据至本设备。同时,该轨旁辅助决策中心设备支持异步学习关键事件后的应急处置措施、调度处置措施、维修措施等,进而升级内部的大模型,形成持续升级改进。
轨旁辅助决策中心设备对输入的数据进行处理后,形成辅助决策意见,提供给调度、信号维护人员、司机、旅服和物流等相关人员,用以指导进行调度命令操作、司机控车、设备维护、应急处置、指挥客流和货流作业等操作。辅助决策信息可以“文字”、语音的形式,根据紧急程度、重要程度、信息量,通过电子邮件、短信、社交软件的形式发送至相关工作人员,形成决策辅助;还可以约定的格式(表格化数据),推送至TCC、RBC、CBI信号设备的维护台,用以提供维修决策;或推送至车载DMI显示终端,给司机控车操作提示。相关人员还可通过轨旁辅助决策中心设备本身的控显终端,获取辅助决策信息。
基于上述,下面通过两个示例进一步说明轨旁辅助决策中心设备的运行:
示例1,某货运线路提出了如下需求:单线线路,空车(没有拉货)、重车(满载货物)对向行驶,因为一场施工延误,两车可能在区间有行车冲突,对运输效率造成较大影响,应迅速调整策略,令空车在会让站会让重车,保证重车不停车高速通过会让站。基于该应用需求,向轨旁辅助决策中心设备录入如下信息以基于轨交车辆控制多专家大模型获取辅助决策意见:(1)空车、重车车辆参数(轴重、车长、制动性能等)、线路数据(坡度、变速点、站场拓扑等)。(2)司机操作记录。(3)调度操作记录,如调度命令和运行图信息。(4)、轨旁列控授权信息,包括授权长度等。(5)物流信息,如载重、正晚点信息以及货物装卸货停留时间信息。(6)故障情况下的上述各种信息。比如,列车定位不准后,轨旁授权变化,调度运行图的调整,以及调整后的调度命令,进而导致的进路情况的变化,针对进路的变化,司机操作策略。又比如,出现临时施工情况时的施工的地点和时间,运行图调整信息,调度命令拟制下达信息,结构化的事后处置说明文档。
将上述应用场景对应的轨交车辆控制多专家大模型部署于在线运行的轨旁辅助决策中心设备。轨旁辅助决策中心设备得到输入信息,将输入信息录入AI模型管理模块的轨交车辆控制多专家大模型,经该轨交车辆控制多专家大模型“专家会诊”后,输出辅助决策信息,调度可得到运行图调整建议,调度命令建议;轨旁信号人员可得到设备维护、应急处置等建议;司机可得到控车建议。根据这些建议,空重可顺利实现会让,重车可实现尽量少停车情况下的,快速通行。
示例2(基于历史数据进行训练):因为突降暴雪,导致某线列车无法及时制动,与前车追尾,造成多名旅客受伤,且恢复运营时间长,滞留旅客较多。基于上述,向轨旁辅助决策中心设备录入如下信息:(1)车辆参数(轴重、车长、制动性能等)、线路数据(坡度、变速点、站场拓扑等)。(2)气象信息,包括现状和预测。(3)司机操作信息。(4)旅服系统信息,包括客流量、拥堵程度、热点事件等。(5)调度信息,如调度命令交互信息、运行图调整信息。(6)列控系统信息,如授权长度、临时限速、列车曲线计算、列车定位等信息。(7)极端天气后的处置措施,包括运行图调整信息、司机(正确的)控车调整信息、列控系统控制授权和控车曲线变化信息、结构化的旅客疏解方案。
轨旁辅助决策中心设备基于上述数据对AI模型管理模块的轨交车辆控制多专家大模型进行训练,以实现对模型的微调升级。轨旁辅助决策中心设备在线运行时,当其探测到极端天气后,根据AI模型管理模块的多专家大模型,实时跟踪列车位置、授权、运行计划等信息,当可能发生危险前,分别给调度、列控、运维、旅服等设备和人员,发出建议和警报。调度、司机等相关人员可根据建议、报警及时调整策略,避免故障的发生。经过规避,可能仍然存在一定的小概率,危害较小的事故发生了,轨旁辅助决策中心设备继续给出应急处置建议和旅客疏解建议,用以辅助现场尽快恢复运营秩序。
综上所述,本发明的一种基于混合专家模型的轨旁辅助决策中心设备中,其AI模型管理模块基于铁路运营数据、设备数据等信息进行模型训练,以基于实际应用场景获取应用性较高的数据模型,同时其可基于MMOE混合专家模型和各个LLM模型中的至少一个模型形成轨交车辆控制多专家大模型,实现多专业跨领域专家经验协同,发挥协同优势。该轨旁辅助决策中心设备率先提出“群组”专家智能大模型在轨交的应用,可有效提高现场决策效率,帮助轨道交通提高运输效率和安全系数,以及突发事件的恢复速度和应急水平。
尽管本发明的内容已经通过上述优选实施例作了详细介绍,但应当认识到上述的描述不应被认为是对本发明的限制。在本领域技术人员阅读了上述内容后,对于本发明的多种修改和替代都将是显而易见的。因此,本发明的保护范围应由所附的权利要求来限定。
Claims (15)
1.一种基于混合专家模型的轨旁辅助决策中心设备,其特征在于,包含:
外部输入接口模块,其用于接收外部设备发来的信息;
外部输出接口模块,其用于向外部设备发送信息;
AI模型管理模块,其分别与所述外部输入接口模块和所述外部输出接口模块连接,所述AI模型管理模块包含由铁路运营数据、设备数据、气象数据、灾害数据及相应处理信息训练的MMOE混合专家模型和至少一个LLM模型,MMOE混合专家模型和LLM模型中的至少一个形成轨交车辆控制多专家大模型,所述AI模型管理模块接收所述外部输入接口模块接收的信息,并通过所述轨交车辆控制多专家大模型进行处理,得到相应的辅助决策意见,并通过外部输出接口模块将相应的辅助决策意见输出到相应设备。
2.如权利要求1所述的基于混合专家模型的轨旁辅助决策中心设备,其特征在于,
基于不同的应用场景,选取多个不同的轨交车辆控制多专家大模型进行训练,根据各个轨交车辆控制多专家大模型训练的准确性、精确度、召回率和F1分数指标,选择结果最优的模型,作为此应用场景下对应的轨交车辆控制多专家大模型在线运用。
3.如权利要求1所述的基于混合专家模型的轨旁辅助决策中心设备,其特征在于,
所述AI模型管理模块通过指令角色以提示词设计和对话的形式对所述轨交车辆控制多专家大模型进行微调。
4.如权利要求3所述的基于混合专家模型的轨旁辅助决策中心设备,其特征在于,
所述AI模型管理模块利用思维链Cot技术进行提示词设计和录入。
5.如权利要求1所述的基于混合专家模型的轨旁辅助决策中心设备,其特征在于,
所述MMOE混合专家模型包含多个门控模型和其对应的多个子大模型,每个子大模型包含至少一个子专家模型,所述门控模型对接收的数据进行处理,判定输入的数据应分配给哪个子专家模型处理并分配各个子专家模型的权重,进而输出对应的操作提示。
6.如权利要求5所述的基于混合专家模型的轨旁辅助决策中心设备,其特征在于,
各个子大模型分别为行车调度大模型、轨旁列控大模型和司机驾驶大模型。
7.如权利要求6所述的基于混合专家模型的轨旁辅助决策中心设备,其特征在于,
所述行车调度大模型的子专家模型包含:列车调度专家模型、货运调度专家模型、车站调度专家模型、移动闭塞控制专家模型、固定闭塞控制专家模型、联锁控制专家模型、临时限速专家模型、线路限速专家模型、调车控制专家模型、监测专家模型、现场设备维修专家模型、物流专家模型和旅服专家模型中的至少一种。
8.如权利要求1所述的基于混合专家模型的轨旁辅助决策中心设备,其特征在于,所述外部输入接口模块接收的外部设备发来的信息包含:
调度数据、控车数据、监视视频、调度电话语音数据、应急处置说明、操作说明、事后处理说明、关键操作说明、旅客服务、物流数据、气象数据、灾害数据和施工数据中的至少一种。
9.如权利要求1所述的基于混合专家模型的轨旁辅助决策中心设备,其特征在于,所述外部输出接口模块向外部设备发送的信息包含:
对各方人员的建议、输出给列控维护台的用于故障修复和应急处置的信息、输出给车载DMI的用于辅助控车的提示信息、输出给调度设备的操作提示信息、发送至自动驾驶ATO设备的控车辅助指令信息和发送至ATP、TCC、RBC的安全防护信息数据中的至少一种。
10.如权利要求1所述的基于混合专家模型的轨旁辅助决策中心设备,其特征在于,还包含:
外部接口数据转换模块,其分别与所述外部输入接口模块、所述外部输出接口模块和所述AI模型管理模块连接,所述外部接口数据转换模块用于将数据转换为预定格式。
11.如权利要求1所述的基于混合专家模型的轨旁辅助决策中心设备,其特征在于,还包含:
控显终端,其用于对各个模块进行调控。
12.如权利要求11所述的基于混合专家模型的轨旁辅助决策中心设备,其特征在于,
所述轨旁辅助决策中心设备与外部设备连接后自动运行;
和/或,所述轨旁辅助决策中心设备中的各个模块通过控显终端控制运行。
13.如权利要求1所述的基于混合专家模型的轨旁辅助决策中心设备,其特征在于,还包含:
数据存储模块,其用于存储所述轨旁辅助决策中心设备的各类数据。
14.如权利要求13所述的基于混合专家模型的轨旁辅助决策中心设备,其特征在于,所述轨旁辅助决策中心设备的各类数据包含:
输入输出交互数据日志、基于多角色指令的轨交车辆控制多专家大模型数据、通信和线路配置数据和在线运行状态数据中的至少一种。
15.如权利要求1所述的基于混合专家模型的轨旁辅助决策中心设备,其特征在于,
所述辅助决策意见采用预定形式进行输出;
所述外部设备包含TCC设备的维护台、RBC设备的维护台、CBI设备的维护台和车载DMI显示终端中的至少一种。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410181083.2A CN117864218A (zh) | 2024-02-18 | 2024-02-18 | 一种基于混合专家模型的轨旁辅助决策中心设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410181083.2A CN117864218A (zh) | 2024-02-18 | 2024-02-18 | 一种基于混合专家模型的轨旁辅助决策中心设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117864218A true CN117864218A (zh) | 2024-04-12 |
Family
ID=90581360
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410181083.2A Pending CN117864218A (zh) | 2024-02-18 | 2024-02-18 | 一种基于混合专家模型的轨旁辅助决策中心设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117864218A (zh) |
-
2024
- 2024-02-18 CN CN202410181083.2A patent/CN117864218A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8473127B2 (en) | System, method and computer software code for optimizing train operations considering rail car parameters | |
AU2007294587B2 (en) | System and method for optimizing parameters of multiple rail vehicles operating over multiple intersecting railroad networks | |
US8676410B2 (en) | System and method for pacing a plurality of powered systems traveling along a route | |
RU2501695C2 (ru) | Система и способ оптимизации движения поезда | |
US8645047B2 (en) | System and method for optimizing vehicle performance in presence of changing optimization parameters | |
US8725326B2 (en) | System and method for predicting a vehicle route using a route network database | |
CN101254791B (zh) | 基于通信的轨道交通列车自动监控系统 | |
CN107284471A (zh) | 一种基于车车通信的cbtc系统 | |
US20070233335A1 (en) | Method and apparatus for optimizing railroad train operation for a train including multiple distributed-power locomotives | |
US20070219683A1 (en) | System and Method for Optimized Fuel Efficiency and Emission Output of a Diesel Powered System | |
US20080183490A1 (en) | Method and computer software code for implementing a revised mission plan for a powered system | |
Lüthi | Improving the efficiency of heavily used railway networks through integrated real-time rescheduling | |
CN101941451A (zh) | 点式列车控制系统 | |
CN111016979A (zh) | 基于实时客流的城市轨道交通列车自动调整方法 | |
WO2008073546A2 (en) | Method and apparatus for optimizing railroad train operation for a train including multiple distributed-power locomotives | |
EP0719224B1 (de) | Verkehrsleitsystem zur steuerung des fahrbetriebes und des verkehrsablaufes für den schienengebundenen verkehr | |
Ding et al. | Key technologies and applications of intelligent dispatching command for high-speed railway in China | |
AU2013206474A1 (en) | Method and apparatus for optimizing railroad train operation for a train including multiple distributed-power locomotives | |
CN117864218A (zh) | 一种基于混合专家模型的轨旁辅助决策中心设备 | |
Kaderavek | Concept for an energy-optimized Railway Operation | |
AU2016202936B2 (en) | Method and apparatus for optimizing railroad train operation for a train including multiple distributed-power locomotives | |
Fiala et al. | Comparison of Two Railway Signalling Systems in Denmark–Traditional Signalling and ERTMS | |
CN117382704A (zh) | 一种客货共线下乘务接续与列车运行图协同调整的方法 | |
RU2466049C2 (ru) | Система и способ для оптимизации параметров множества железнодорожных транспортных средств, действующих в железнодорожных сетях с множеством пересечений | |
Barwell et al. | Paper 8: Application of Automatic Control Theory to Railways |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |