CN107453913B - 具备处理器间高速通信的网关冗余方法 - Google Patents

具备处理器间高速通信的网关冗余方法 Download PDF

Info

Publication number
CN107453913B
CN107453913B CN201710690295.3A CN201710690295A CN107453913B CN 107453913 B CN107453913 B CN 107453913B CN 201710690295 A CN201710690295 A CN 201710690295A CN 107453913 B CN107453913 B CN 107453913B
Authority
CN
China
Prior art keywords
bus
communication
gateway
fault
redundant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710690295.3A
Other languages
English (en)
Other versions
CN107453913A (zh
Inventor
李恒瑞
乐建锐
王莉
邝福銮
胡玉昕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Tongye Technology Co ltd
Original Assignee
Shenzhen Tongye Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Tongye Technology Co ltd filed Critical Shenzhen Tongye Technology Co ltd
Priority to CN201710690295.3A priority Critical patent/CN107453913B/zh
Publication of CN107453913A publication Critical patent/CN107453913A/zh
Application granted granted Critical
Publication of CN107453913B publication Critical patent/CN107453913B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0663Performing the actions predefined by failover planning, e.g. switching to standby network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/66Arrangements for connecting between networks having differing types of switching systems, e.g. gateways

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Hardware Redundancy (AREA)
  • Small-Scale Networks (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供具备处理器间高速通信的网关冗余方法包括热备冗余工作模式的两套网关。所述两套网关包括两颗独立的CPU、两组冗余的通信接口、连接两颗CPU的高速通信总线、以及每个通信接口处的故障隔离开关;两组冗余的通信接口分别与第一总线和第二总线相连;两个CPU均接收第一总线和第二总线发送过来的网络数据;两个CPU分别将各自接收到的网络数据和自身故障状态数据,通过高速通信总线发送给对方;两个CPU各自将第一总线和第二总线发送过来的网络数据进行协议转换后进行转发。本发明能够对冗余网关之间的数据同步进行通信诊断,实现互相诊断,提高网关安全性和可用性。

Description

具备处理器间高速通信的网关冗余方法
技术领域
本发明涉及列车车载网络控制技术领域,具体说的是具备处理器间高速通信的网关冗余方法。
背景技术
当前列车控制领域正朝着智能网络化高速发展,对车载网络提出了更多更高的要求。多元化的发展导致各子系统之间、设备内网与外网之间、不同通信协议的网络之间的数据转换都需要用到网关。网关作为重要的网络通信节点,其自身的可靠性与安全性将直接影响列车的正常运行。既有网关大部分是非冗余模式或冷备冗余模式。当非冗余网关一旦出现故障,会导致整个网络异常或崩溃,严重时即便是重启网关也无法恢复工作。冷备模式下虽然有备份组可以接替工作,但是出现异常时也只能进行人工手动倒组转换,操作存在风险及在倒组过程中也会出现网络的短暂中断,势必会影响列车的正常运行。更严重的是,冷备模式下备份组设备长期得不到运行,故障隐患不能及时发现,当其主用工作组故障时,将直接导致网络的故障,影响列车运行。
发明内容
本发明所要解决的技术问题是:提供一种能够解决上述问题的具备处理器间高速通信的网关冗余方法,避免在部分网络故障情况下,对列车控制网络通信造成的灾难性后果,提高车载网络的安全性与可用性。
为了解决上述技术问题,本发明采用的技术方案为:
一种具备处理器间高速通信的网关冗余方法,其特征在于,包括处于热备冗余工作模式的两套网关,所述两套网关包括两个独立的CPU、两组冗余的通信接口、连接两个独立的CPU的高速通信总线,以及设置在每个通信接口处的故障隔离开关;
两组冗余的通信接口分别与第一总线和第二总线连接;
两个CPU均接收第一总线和第二总线发送过来的网络数据;
两个CPU分别将各自接收到的网络数据和自身故障状态数据通过高速通信总线发送给对方;
两个CPU各自将第一总线和第二总线发送过来的网络数据进行协议转换后进行转发。
进一步的,还包括:
当诊断出单点故障时,由第一总线正常的部分或第二总线正常的部分通过高速通信总线,再到第二总线正常的部分或第一总线正常的部分构建新的通信路径。
进一步的,还包括:
当出现交叉线的两点故障时,由第一总线正常的部分、高速通信总线以及第二总线正常的部分构建新的通信路径。
进一步的,还包括:
正常通信过程中,两个冗余的网关实时进行自身网络通信状态诊断,以及通过高速通信总线获取冗余方网络通信状态诊断数据,当诊断出自身通信模块异常或总线严重故障时,断开相应通信端口的隔离开关。
进一步的,还包括:
当网关出现芯片宕机故障时,通过看门狗强制复位;
复位成功后,通过高速通信总线同步冗余方的网络数据以及故障状态数据。
本发明的目的是这样实现的:一种具备处理器间高速通信的网关冗余方法,其特征在于,在硬件上设置热备冗余的A、B两套网关,具备两颗独立的CPU,网关所连接的网络均提供冗余通信接口,实现不同冗余通信总线间的数据转换。两颗CPU之间具备高速通信总线,工作过程中,CPU之间通过高速通信总线进行数据交互。
所述的两套网关,在软硬件上完全一致,正常工作中,两套同时工作处于热备份状态。它们同时接收总线上的数据,同时进行接收数据的完整性校验,同时通过各自CPU间高速通信总线,交互双方接收的网络数据及故障诊断状态。
所述的两套网关的安全性体现在,正常工作过程中,当网关诊断出自身通信模块异常或总线严重故障时,利用硬件上每路通信接口处设置的隔离开关,断开相应通信总线的物理连接,隔离故障,杜绝自身故障导致的外部网络瘫痪。
所述的两套网关的可用性是指,当网关诊断出某个通信控制器模块故障、单个总线故障、单个通信接口松脱等单点故障时,或当两套网关出现不同方向的通信故障时(两点故障),通过通信路径的重新组合,进行故障自愈,最大程度上保障通信的可用性。
所述的通信路径的重新组合是指,当某路通信出现异常时,通过处理器间的高速通信总线获取冗余方的相同侧网络通信数据,经过内部协议转换后,将故障侧总线上的数据发送至没有故障发生的那一侧总线上。
所述的两套网关的安全性及故障自愈,同时体现在,每套网关均具备硬件独立看门狗功能。当出现芯片宕机故障时,由看门狗强制复位进行自恢复,复位成功后,先通过处理器间高速通信总线进行必要数据的恢复,再进入正常工作状态。
所述的冗余网关的两颗CPU,通过处理器间高速通信总线,周期进行任务同步,保证步调的一致性。
本发明的有益效果在于:本发明部署有处于热备冗余状态的两套网关,能够对冗余网关之间的数据同步进行通信诊断,实现互相诊断,及时发现异常,提高网关的安全性。进一步的,该方法能够使得冗余通信网关具备自愈能力的同时提升安全性。可以确保部分网络故障情况下,通过不同通信路径的组合,最大化保障网络的可用性。同时能够对故障点进行隔离,有效降低网络整体瘫痪的风险。
附图说明
图1为本发明车载冗余通信网关的安全及自愈方法硬件拓扑架构;
图2为本发明车载冗余通信网关的通信路径;
图3为本发明单点故障通信路径示例;
图4为本发明交叉的两点故障通信路径示例。
具体实施方式
为详细说明本发明的技术内容、所实现目的及效果,以下结合实施方式并配合附图予以说明。
本发明涉及的技术术语解释:
Figure GDA0002424329940000041
本发明是一种具备处理器间高速通信的网关冗余方法,该方法的最关键的构思在于,通过冗余网关两颗CPU间高速通信总线进行数据交互,实时通信故障诊断,以及使用隔离开关进行故障隔离。对故障的通信端口,通过高速通信总线重新进行通信路径的组合,实现通信故障的自愈。
本发明提供该方法需要软硬件结合的方式实现。在硬件上,冗余网关由两套独立的网关组成(网关A与网关B),每个网关具备各自独立的CPU。冗余网关对外提供2组冗余的总线通信接口,分别连接两条冗余的第一通信总线和两条冗余的第二通信总线。
第一通信总线和第二通信总线,通过通信接口与CPU连接,所述两个独立的CPU还通过高速通信总线相连接;正常情况下,网关A的CPU转发第一通信总线和第二通信总线与网关A相连的通信总线数据。网关B的CPU转发第一通信总线和第二通信总线与网关B相连的通信总线数据。
同时,网关A和网关B的CPU通过高速通信总线,将各自的通信数据和故障状态数据发送给对方。
当出现单点故障时,发生故障的网关,通过高速通信总线从另一网关接收故障点一侧的总线数据,然后转发至自身无故障一侧的通信总线上。
进一步的,当出现交叉线的两点故障时,由第一通信总线正常的部分,通过高速通信总线,再到第二通信总线正常的部分,由此构建出新的通信路径,完成数据的转发。
由上述描述可知,该方法不仅能通过冗余网关间数据同步,对各节点通信质量进行判断,从而实现冗余网关更加精准的自诊断能力;而且能够在出现任意单点故障甚至交叉线两点故障的情况下,构建出新的通信路径,依旧能保证将故障方向总线上的数据经过协议转换发送给正常方向的另一总线,从而实现故障自愈,确保网关的无障碍工作,大大提升网关的可用性。
进一步的,每个通信接口处设有故障隔离开关;
在网关诊断为自身通信模块异常或总线严重故障时,断开故障点对应的隔离开关,实现电气信号的物理隔离。
由上述描述可知,能在诊断确定接口发生异常时,如自身通信模块异常或总线严重故障时,在保证总线线缆连接完整性的同时,通过故障隔离开关及时断开网关内部故障模块与总线的电气连接,实现物理隔离,从而提高网关的安全性。
进一步的,还包括:当一套网关出现处理器芯片宕机故障时,通过看门狗强制复位;
复位成功后,所述一套网关通过高速通信总线与另一网关同步数据。
由上述描述可知,每套网关均具备独立看门狗功能,当出现芯片宕机故障时,可有看门狗强制复位进行自恢复,复位成功后通过高速通信总线同步冗余方的数据,完成相关参数配置后,进入正常工作态。
实施例一
请参照图1、2以及图3,本实施例提供一种具备处理器间高速通信的网关冗余方法,可用于列车车载网络控制技术领域,有效提高网关的安全性与可用性。
所述方法是基于一套冗余网关硬件实现的,包括A/B两套网关,分别包含两个独立的CPU(A)和CPU(B),并提供两组冗余的通信接口、两条冗余的第一总线以及两条冗余的第二总线;CPU(A)和CPU(B)之间通过高速通信总线连接,实现两个CPU的同步数据交互;通过冗余通信接口,实现不同冗余通信总线的数据转换。每个通信接口均设置有硬件隔离开关(图1、图3和图4中的隔离开关1、隔离开关2、隔离开关3和隔离开关4),可断开与总线物理连接。
具体的,如图1所示,网关A包括依次连接的:第一总线(A)、通信模块、CPU(A)、通信模块以及第二总线(A);网关B包括依次连接的:第一总线(B)、通信模块、CPU(B)、通信模块以及第二总线(B);所述第一总线(A)和第一总线(B)互为冗余总线;所述第二总线(A)与第二总线(B)互为冗余总线。
所述冗余,是指在软硬件上完全一致的A/B两套网关,在正常通信过程中,同时接收第一总线上的数据转发至第二总线,同时接收第二总线上的数据转发至第一总线,并通过高速通信总线进行数据同步处理。
如图2所示,基于上述具备处理器间高速通信的网关冗余方法的故障自愈处理过程可以包括:
CPU(A)接收第一总线(A)及第二总线(A)的数据,CPU(B)接收第一总线(B)及第二总线(B)的数据;CPU(A)以及CPU(B)分别对接收到的数据进行完整性及合法性校验后,通过高速通信总线将自身接收的数据及故障状态发送给对方,即CPU(A)发送给CPU(B),CPU(B)发送给CPU(A)。其中,图2中的①-②-③-④-⑤为网关A和网关B接收第一总线的数据进行协议转发的路径;I-II-III-IV-V为网关A和网关B接收第二总线的数据进行协议转发的路径。
当诊断发现单一总线故障时,如图3所示的第一总线(B)或与之相连的通信模块故障。此时,CPU(B)通过高速通信总线,将CPU(A)转发过来的第一总线(A)的网络数据经过协议转换后,发送至第二总线(B)。
本实施例针对单点故障(单一总线通信故障),提供新的通信路径进行故障自愈。所述通信路径是指,当单一总线通信出现异常时,通过高速通信总线获取冗余方的数据,利用正常网关弥补故障网关缺失的通信部分,保障通信的可用性。
实施例二
本实施例在实施例一的基础上进一步拓展,能实现网关通信交叉的两点故障的自愈。
当出现交叉线的两点故障时,所述交叉线的两点故障指的是两套网关的不同方向通信故障的两点故障,如第一总线(A)及第二总线(B)的通信模块同时故障、或第一总线(B)及第二总线(A)的通信模块同时故障;当出现这两种情况的两点故障时,由正常的通信模块,通过高速通信总线进行数据中转,构建出新的通信路径,实现网关的功能。
如图4所示,当第一总线(B)所连接通信模块及第二总线(A)所连接通信模块同时故障时,CPU(A)接收第一总线(A)的数据,通过高速通信总线,将第一总线通信数据发送至CPU(B),CPU(B)将数据经过协议转换后,发送至第二总线(B);反方向,CPU(B)接收第二总线(B)的数据,通过高速通信总线,将第二总线通信数据发送至CPU(A),CPU(A)将数据经过协议转换后,发送至第一总线(A);这样由第一总线(B)、高速通信总线、第二总线(A)组合成新的通信路径,完成网关功能。
本实施例针对两点故障(交叉的两总线通信故障),提供新的通信路径进行故障自愈。所述通信路径是指,当两总线通信出现交叉的异常时,通过高速通信总线传递双方的网关通信数据,将两套网关各自正常的部分拼接起来,实现冗余网关的自愈,保障了网关更高的可用性,大大降低停机重新恢复通信的发生概率。
实施例三
本实施例在实施例二的基础上进一步拓展,实现安全功能。
如图2所示,CPU(A)接收总线1(A)及2(A)的数据,CPU(B)接收总线1(B)及2(B)的数据,将数据进行完整性及合法性校验后,通过高速通信总线将双方接收到的数据进行交互。整个过程中,网关实时进行通信状态诊断,当诊断出自身通信模块异常或总线严重故障时,断开对应总线通信的隔离开关。
结合图3来说明,总线1(B)发生故障,网关自身可能的原因为:总线1(B)相连的通信模块故障。这种故障也许是模块短路或逻辑混乱导致,通过断开通信模块与总线1(B)的物理连接来隔离故障。
本实施例在诊断出由于网关自身通信模块异常或总线严重故障等难以修复的故障时,通过使用故障隔离开关进行物理隔离,能够彻底抑制故障影响范围,确保不会由于网关自身的原因,导致所连接通信总线的崩溃。
实施例四
本实施例在实施例三的基础上进一步拓展,还包括:
当网关CPU宕机时,所设置的独立看门狗电路,将强行复位处理器的运行,复位成功后通过高速通信总线同步冗余方的网络数据以及故障状态数据,再进入正常工作状态,避免失控状态下故障的扩大化,进一步增强网关的安全性。
综上所述,具备处理器间高速通信的网关冗余方法,通过软硬件结合的方式,在保证安全性的同时,大幅提高可用性。通过冗余间数据同步比对,实现故障诊断,并在接口异常时能够对其进行物理隔离。实现在任意单点故障甚至部分两点故障的情况下,通过通信路径的重组,确保网关的无障碍工作,最大化保障网关的可用性。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等同变换,或直接或间接运用在相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (3)

1.一种具备处理器间高速通信的网关冗余方法,其特征在于,包括处于热备冗余工作模式的两套网关,所述两套网关包括两个独立的CPU、两组冗余的通信接口、连接两个独立的CPU的高速通信总线,以及设置在每个通信接口处的故障隔离开关;
两组冗余的通信接口分别与第一总线和第二总线连接;
两个CPU均接收第一总线和第二总线发送过来的网络数据;
两个CPU分别将各自接收到的网络数据和自身故障状态数据通过高速通信总线发送给对方;
两个CPU各自将第一总线和第二总线发送过来的网络数据进行协议转换后进行转发;
还包括:
当诊断出单点故障时,由第一总线正常的部分或第二总线正常的部分通过高速通信总线,再到第二总线正常的部分或第一总线正常的部分构建新的通信路径;
还包括:
当出现交叉线的两点故障时,由第一总线正常的部分、高速通信总线以及第二总线正常的部分构建新的通信路径。
2.如权利要求1所述的具备处理器间高速通信的网关冗余方法,其特征在于,还包括:
正常通信过程中,两个冗余的网关实时进行自身网络通信状态诊断,以及通过高速通信总线获取冗余方网络通信状态诊断数据,当诊断出自身通信模块异常或总线严重故障时,断开相应通信端口的隔离开关。
3.如权利要求1所述的具备处理器间高速通信的网关冗余方法,其特征在于,还包括:
当网关出现芯片宕机故障时,通过看门狗强制复位;
复位成功后,通过高速通信总线同步冗余方的网络数据以及故障状态数据。
CN201710690295.3A 2017-08-14 2017-08-14 具备处理器间高速通信的网关冗余方法 Active CN107453913B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710690295.3A CN107453913B (zh) 2017-08-14 2017-08-14 具备处理器间高速通信的网关冗余方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710690295.3A CN107453913B (zh) 2017-08-14 2017-08-14 具备处理器间高速通信的网关冗余方法

Publications (2)

Publication Number Publication Date
CN107453913A CN107453913A (zh) 2017-12-08
CN107453913B true CN107453913B (zh) 2020-08-07

Family

ID=60492408

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710690295.3A Active CN107453913B (zh) 2017-08-14 2017-08-14 具备处理器间高速通信的网关冗余方法

Country Status (1)

Country Link
CN (1) CN107453913B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11374786B2 (en) * 2018-06-14 2022-06-28 Hitachi Astemo, Ltd. Gateway device
DE102019108504A1 (de) * 2019-04-02 2020-10-08 Knorr-Bremse Systeme für Nutzfahrzeuge GmbH System zur Datenübertragung für ein Nutzfahrzeug sowie Verfahren hierzu
CN112650048B (zh) * 2021-01-21 2021-09-17 杭州康吉森自动化科技有限公司 一种工业网关冗余系统和控制方法
CN112887152B (zh) * 2021-02-01 2022-08-19 中车青岛四方车辆研究所有限公司 一种基于以太网的列车通信网络架构、方法及轨道列车
CN113568301B (zh) * 2021-09-26 2022-01-14 浙江中控技术股份有限公司 热备冗余方法及控制系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6714549B1 (en) * 1998-12-23 2004-03-30 Worldcom, Inc. High resiliency network infrastructure
CN103139060A (zh) * 2013-03-01 2013-06-05 哈尔滨工业大学 基于双dsp的高容错性can总线数字网关
CN103973476A (zh) * 2013-02-06 2014-08-06 上海杰之能信息科技有限公司 网关、网关热备份系统及方法
CN105553706A (zh) * 2015-12-10 2016-05-04 中国航空工业集团公司西安航空计算技术研究所 一种基于数据流的机电管理余度系统
CN106878081A (zh) * 2017-02-27 2017-06-20 中车青岛四方车辆研究所有限公司 列车网关冗余控制系统及其控制方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6714549B1 (en) * 1998-12-23 2004-03-30 Worldcom, Inc. High resiliency network infrastructure
CN103973476A (zh) * 2013-02-06 2014-08-06 上海杰之能信息科技有限公司 网关、网关热备份系统及方法
CN103139060A (zh) * 2013-03-01 2013-06-05 哈尔滨工业大学 基于双dsp的高容错性can总线数字网关
CN105553706A (zh) * 2015-12-10 2016-05-04 中国航空工业集团公司西安航空计算技术研究所 一种基于数据流的机电管理余度系统
CN106878081A (zh) * 2017-02-27 2017-06-20 中车青岛四方车辆研究所有限公司 列车网关冗余控制系统及其控制方法

Also Published As

Publication number Publication date
CN107453913A (zh) 2017-12-08

Similar Documents

Publication Publication Date Title
CN107453913B (zh) 具备处理器间高速通信的网关冗余方法
EP2798782B1 (en) Technique for handling a status change in an interconnect node
WO2017107665A1 (zh) 一种用于列车控制的安全计算机系统
JPH0666783B2 (ja) ネツトワーク・モジュールの相互接続方法
US5379278A (en) Method of automatic communications recovery
CN104516306B (zh) 冗余的自动化系统
EP3599521B1 (en) System and method of communicating data over high availability industrial control systems
CN108551397A (zh) 网桥装置及应用以及多plc主站与多plc从站的通信控制方法
CN106888142B (zh) 一种具有环自愈功能的e1双环网
US9282015B2 (en) Network relay device
CN115913906A (zh) 一种船用冗余控制系统及方法
CN112615728B (zh) 一种基于铁路安全通信协议的仿真系统主备切换方法
CN104536853B (zh) 一种保障双控制器存储设备资源连续可用性的装置
CN109306875A (zh) 一种汽轮机deh双控制器同步热备冗余切换装置及方法
CN110247809B (zh) 双环网控制系统的通信控制方法
JP2682251B2 (ja) 多重化制御装置
CN100449983C (zh) 实现至少一个不出故障的通信关系的方法和通信装置
CN113835337A (zh) 一种列车网络冗余控制的方法与系统
RU2430400C1 (ru) Комплекс резервируемых программно-аппаратных средств автоматизации контроля и управления
JPH06343074A (ja) 耐故障性システム
US11914338B2 (en) Redundant automation system and method for operating the redundant automation system
CN107276812B (zh) 一种核电站Level2层冗余设备的故障诊断装置、系统和方法
CN115412424B (zh) 一种mlag环境下双主设备检测方法及设备
JP7306983B2 (ja) コントローラ及び施設監視システム
CN116319156A (zh) 工业网络系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant