CN112887133B - 一种用于工业网关的冗余切换方法、工业网关和存储介质 - Google Patents

一种用于工业网关的冗余切换方法、工业网关和存储介质 Download PDF

Info

Publication number
CN112887133B
CN112887133B CN202110079797.9A CN202110079797A CN112887133B CN 112887133 B CN112887133 B CN 112887133B CN 202110079797 A CN202110079797 A CN 202110079797A CN 112887133 B CN112887133 B CN 112887133B
Authority
CN
China
Prior art keywords
gateway
working state
fault
slave
slave station
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110079797.9A
Other languages
English (en)
Other versions
CN112887133A (zh
Inventor
李华军
温宜明
周渊敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Kangjisen Automation Technology Co ltd
Original Assignee
Hangzhou Kangjisen Automation Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Kangjisen Automation Technology Co ltd filed Critical Hangzhou Kangjisen Automation Technology Co ltd
Priority to CN202110079797.9A priority Critical patent/CN112887133B/zh
Publication of CN112887133A publication Critical patent/CN112887133A/zh
Application granted granted Critical
Publication of CN112887133B publication Critical patent/CN112887133B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0663Performing the actions predefined by failover planning, e.g. switching to standby network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/22Arrangements for detecting or preventing errors in the information received using redundant apparatus to increase reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/66Arrangements for connecting between networks having differing types of switching systems, e.g. gateways
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Small-Scale Networks (AREA)

Abstract

本发明公开了一种用于工业网关的冗余切换方法,包括采集从站数据,并根据获取的各从站数据分析自身故障等级,向备用网关发送时间同步信息,根据各网关的通信故障从站的数量和/或分布来判断是否需要从第一工作状态切换至第二工作状态,如果不切换至第二工作状态,则将采集成功的从站数据上报至控制器,并向处于第二工作状态的备用网关发送具有数据采集故障的从站地址的补充采集通知,实现多个网关的最大限度的冗余,在备用网关可进行辅助采集也可视故障情况切换为主工作状态,增加了工业网关冗余系统的切换灵活性,提高了系统的可靠性与可工作性。

Description

一种用于工业网关的冗余切换方法、工业网关和存储介质
技术领域
本发明涉及工业数据采集领域,尤其涉及一种用于工业网关的冗余切换方法、工业网关和存储介质。
背景技术
在工业自动化控制领域,为了避免工厂停机状况的发生,要求工业自动化控制系统具有较高的可靠性和高可用性,在现有技术中,一般通过冗余方式提高系统的高可用性,具体方法为对控制系统的关键部件或者关键控制应用进行复制或者备份,从而保证现场数据的实时采集,实现工厂生产的连续运营。
网关的作用是连接两个或多个异构的网络,使之能够相互通信。工业网关将异构传感网络融入工业互联网,在工业现场的多种总线协议与要求的通信协议之间进行协议转换,实现不同协议之间的数据交互。但工业网关与普通互联网网关设备的工作环境不同,工业网关还须针对苛刻的工业应用环境。因此,网关冗余是控制系统中不可或缺的一部分,现有技术中多采用1:1热备份冗余技术,采用两个相同的网关同时处于运行状态,其中一个网关为正常工作状态,实时采集数据上报至控制器,另一个则处于备用状态,不参与数据采集,当工作网关故障后,则备用网关进入工作状态,完成无扰切换,但在某些情况下此种方法在工作网关故障后就直接切换至备用网关,冗余性能较差,不能满足现场高可用性的要求。
发明内容
本发明针对现有技术中的不足,提供了一种用于工业网关的冗余切换方法,包括:
步骤S1,采集从站数据,并根据获取的各从站数据分析自身故障等级;
步骤S2,向备用网关发送时间同步信息,并接收备用网关的应答消息,所述应答消息包括该备用网关的故障等级信息和无法正常通信的从站数量;
步骤S3,根据各网关的通信故障从站的数量和/或分布来判断是否需要从第一工作状态切换至第二工作状态;
步骤S4,如果不切换至第二工作状态,则将采集成功的从站数据上报至控制器,并向处于第二工作状态的备用网关发送具有数据采集故障的从站地址的补充采集通知;
步骤S5,如需切换至第二工作状态,则向一备用网关发送冗余切换信号,并等待响应切换至第一工作状态的网关所发出的时间同步信息或补充采集通知。
优选的,所述步骤S3还包括:S31,如果无法采集位于同一总线下所有从站数据且自身故障等级高于备用网关故障等级,则从第一工作状态切换至第二工作状态。
优选的,所述步骤S3还包括:S32,如果无法采集连接于第一总线的所有从站数据,且备用网关无法采集连接于第二总线的所有从站数据但可采集连接第一总线的至少一从站数据时,判断与主网关正常通信的从站数量是否小于与备用网关正常通信的从站数量,如是则从第一工作状态切换至第二工作状态。
优选的,所述步骤S3还包括:S33,如果采集失败的从站数量大于预设值,且正常通信的从站数量少于与备用网关正常通信的从站数量时,则从第一工作状态切换至第二工作状态。
优选的,所述步骤S3还包括:步骤S34,如果本网关的故障分布率大于预设故障阈值,且大于备用网关的故障分布率时,则从第一工作状态切换至第二工作状态,其中故障分布率
Figure BDA0002908756030000021
其中
Figure BDA0002908756030000022
为网关各总线的平均故障率,
Figure BDA0002908756030000023
N为该网关所连接的总线数,W1、W2…Wn为该网关所连接的N条总线上各自连接的从站数量,M1、M2…Mn为该网关连接的N条总线上的故障从站数量。
本发明还公开了一种工业网关,包括:采集模块,用于采集从站数据,并根据获取的各从站数据分析自身故障等级;发送模块,用于向备用网关发送时间同步信息并接收备用网关的应答消息,所述应答消息包括所在网关的故障等级信息和与所在网关无法正常通信的从站数量;切换控制模块,用于根据各网关的通信故障从站的数量和/或分布来判断是否需要从第一工作状态切换至第二工作状态;如果不切换至第二工作状态,则将采集成功的从站数据上报至控制器,并向处于第二工作状态的备用网关发送具有数据采集故障的从站地址的补充采集通知;如需切换至第二工作状态,则向一备用网关发送冗余切换信号,并等待响应切换至第一工作状态的网关所发出的时间同步信息或补充采集通知。
优选的,所述切换控制模块还被配置为如果无法采集位于同一总线下所有从站数据且自身故障等级高于备用网关故障等级,则从第一工作状态切换至第二工作状态。
优选的,所述切换控制模块还被配置为如果无法采集连接于第一总线的所有从站数据,且备用网关无法采集连接于第二总线的所有从站数据但可采集连接第一总线的至少一从站数据时,则从第一工作状态切换至第二工作状态。
本发明还公开了一种工业网关,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一用于工业网关的冗余切换方法的步骤。
本发明还公开了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如前述工业网关的数据处理方法的步骤。
本发明公开的用于工业网关的冗余切换方法,通过判断主网关和备用网关的故障情况,实现多个网关的最大限度的冗余,在主网关处于轻度故障的情况下,不能独立完成数据采集的情况下,备用网关可进行辅助采集,不需要直接维修或者更换主网关,而当主网关处于特定的较重故障时则可视故障情况切换为备用状态,另将其中原备用网关切换为主网关,增加了工业网关冗余系统的切换灵活性,提高了系统的可靠性与可工作性,降低了停机的风险。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明一实施例公开的工业网关冗余系统的结构示意图。
图2为本发明另一实施例公开的工业网关冗余系统的结构示意图。
图3为本发明一实施例公开的用于工业网关的冗余切换方法的流程示意图。
图4为本发明一实施例公开的步骤S3的具体流程示意图。
图5为本发明另一实施例公开的工业网关冗余系统的结构示意图。
图6为本发明另一实施例公开的工业网关的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例的附图,对本发明实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于所描述的本发明的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本发明中,除非另有明确的规定和限定,第一特征在第二特征之“上”或之“下”可以包括第一和第二特征直接接触,也可以包括第一和第二特征不是直接接触而是通过它们之间的另外的特征接触。而且,第一特征在第二特征“之上”、“上方”和“上面”包括第一特征在第二特征正上方和斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”包括第一特征在第二特征正下方和斜下方,或仅仅表示第一特征水平高度小于第二特征。
除非另作定义,此处使用的技术术语或者科学术语应当为本发明所属领域内具有一般技能的人士所理解的通常意义。本发明专利申请说明书以及权利要求书中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。同样,“一个”或者“一”等类似词语也不表示数量限制,而是表示存在至少一个。
实施例1
附图1为本实施例公开的一种工业网关冗余系统,包括主网关、备用网关和多个从站,主网关和备用网关互相连接;多个从站即从设备通过至少一总线分别与主网关和备用网关连接;主网关被配置为采集各从站数据,并根据各网关的通信故障从站的数量和/或分布来判断是否需要从第一工作状态切换至第二工作状态。备用网关被配置为在收到状态切换通知或与主网关通信中断后从第二工作状态切换至第一工作状态。其中,第一工作状态被配置为将采集成功的从站数据上报至控制器,并向处于第二工作状态的网关发送具有采集失败的从站地址的补充采集通知;所述第二工作状态被配置为响应补充采集通知,对采集失败的从站进行补充采集并将数据上报至控制器。
具体的,在该实施例中将网关A作为主网关,网关B作为备用网关,网关A先行作为主网关,网关B为备用网关进行详细说明。网关A在作为主网关时,处于第一工作状态,按预定周期采集各从站数据,将采集成功的从站数据上报至控制器,并向作为备用网关的网关B发送具有采集失败的从站地址的补充采集通知。而作为备用网关的网关B,则处于第二工作状态,只监听总线状态,对总线故障进行诊断,不接收总线数据。并在接到主网关发送的补充采集通知后,对采集失败的从站进行补充采集并将数据上报至控制器。
在本实施例中,网关A与网关B之间相互连接进行通信,该连接可以采用有线连接也可以是无线连接,只需网关间可实现相互通信即可,在本实施例中具体可以采用串口通信的方式。网关A与网关B也分别与外部控制器通信连接,用于向控制器发送自己采集的从站数据,以及转发控制器下发给从站的数据。多个从站通过总线分别连接网关A和网关B,总线可以选用RS485总线或其他总线协议,且总线可以为一条或者多条总线,即各从站可以全部或者各自分组通过不同的总线与网关A或网关B连接。各从站也可通过同一条总线与网关A连接,并通过另一条总线与网关B连接。或者各从站可通过同一条总线分别与网关A或网关B连接。网关A或网关B将采集的从站数据打包为数据包上传至控制器,其中数据包包括所采集的从站数据和时间戳,控制器对每个从站均只分配一片内存,网关A和网关B采集的数据均存放在同一片内存中。
在本实施例中,备用网关被配置为在收到主网关发送的时间同步信息后回复应答消息,所述应答消息包括故障等级和与备用网关无法正常通信的从站数量及从站地址,从站地址包含了所连接的总线信息。具体的,从设备通过总线分别与网关A和网关B连接,网关A作为主网关采集从设备数据,并上传至控制器,并且网关A周期性向网关B发送本机时间信息,网关B应答。其中网关B的应答内容包括自身故障等级信息,同时网关B通过接收到网关A的时间信息,对自身的时间进行校正,校正方式具体为网关B将接收到的网关A发送数据包中的时间信息、理论通信时间消耗及中断响应延时的时间和作为网关B的时间。其中作为备用网关的网关B只监听总线状态,对总线故障进行诊断,不接收总线数据。
当网关A在完成一周期数据采集后,根据数据采集情况分析自身故障等级,并可向网关B发送时间同步信息,以等待网关B向网关A发送的应答消息,具体的应答消息包括网关B的故障等级和网关B所连接的从设备故障的数量及从站地址,从站地址包含了所连接的总线信息,其中故障等级中包括同一总线的从站数据采集情况。网关A根据位于同一总线的从站数据采集情况或各网关的通信失败从站的数量来判断是否需要从第一工作状态切换至第二工作状态,或者根据位于同一总线的从站数据采集情况和各网关的通信失败从站的数量来判断是否需要从第一工作状态切换至第二工作状态,即将网关A从主网关切换至备用网关,将网关B切换至主网关。
在本实施例中,作为主网关的网关A出现故障后,对自身故障等级进行分析。其中将故障等级按具体情况分成第一级~第五级故障,其中第一级故障为轻故障,具体为不影响当前运行的局部轻微故障,例如冗余控制网单网故障。第二级故障为一般故障,具体为影响局部控制输出的故障,例如RS485总线上部分从设备通信故障。第三级故障为较重故障,具体为影响整条总线的故障,例如整条RS485总线故障。第四级故障为严重故障,具体为影响全部控制输出的故障,例如冗余控制网双网故障。第五级故障为致命故障,具体为不可恢复的硬件故障,例如Flash、DDR RAM、SRAM不可恢复硬件故障,上述一至五级故障程度依次加重。
如果是第一级故障,则网关A继续工作,如果为第二级故障,则网关A采集从设备数据,对于采集失败的从设备,网关A再次轮询采集,若仍为失败状态,则将自身采集失败的从设备信息同步给网关B,从设备信息包括从设备的虚拟地址;网关B解析网关A发送的从设备信息,并根据从设备地址采集网关A采集失败的从设备数据,并将所采集的从设备数据和状态上传至控制器,相应的,控制器通过网关A下发给从设备的数据,则通过网关B下发。
因此当主网关所连接的从设备产生故障的数量增多时,数据采集的时间会延长,不利于数据采集的实效性,所以当采集时间过长时,适当的需进行网关切换。具体的,主网关被配置为根据数据采集情况分析自身故障等级并接收备用网关发送的故障等级信息,在无法采集位于同一总线下所有从站数据且自身故障等级高于备用网关故障等级时,切换至第二工作状态。
其中,在无法采集位于同一总线下所有从站数据时,可判断发生第三级故障,即至少一根RS485总线整体通信发生故障,当网关A处于该第三级故障的同时,如果其故障等级大于收到的网关B的故障等级,则进行主网关切换,将网关B切换为主网关,将网关A切换为备用网关。通过上述切换方式,当整根RS485总线故障后,此总线的轮询时间延长,相应的数据采集周期延长,因此为了避免此种状况的发生,在网关A为较重故障的情况下,且网关B为正常、轻故障或者一般故障则触发冗余切换,从而避免总线轮询时间过长,影响整个系统通信。
在本实施例中,主网关还被配置为在当主网关和备用网关故障等级均小于第三级故障的情况下,采集失败的从站数量大于预设值,且正常通信的从站数量少于与备用网关正常通信的从站数量时切换至第二工作状态。具体的,其中的预设值可以按具体要求进行设置,在本实施例中我们将预设值设定为从站数量的一半来进行说明,即在网关A所连接的从站已经超过一半发生故障且网关A所连接的正常工作的从站数量小于网关B,且网关A和网关B所连接的从设备不存在相同的从设备通信故障时,进行主网关切换,将网关B切换为主网关,将网关A切换为备用网关。
在本实施例中,主网关被配置为在无法采集连接于第一总线的所有从站数据,且备用网关无法采集连接于第二总线的所有从站数据但可采集连接第一总线的至少一从站数据时,判断与主网关正常通信的从站数量是否小于与备用网关正常通信的从站数量,如是则切换至第二工作状态。即主网关被配置为在与从站连接的一总线发生故障且备用网关与从站连接的另一总线也发生故障时,判断与主网关正常通信的从站数量是否小于与备用网关正常通信的从站数量,如是则切换至第二工作状态。
具体的,网关A和网关B故障等级均为第三级故障,且故障总线非同一总线,则此类情况下根据各网关所能正常通信的从站数量来确定是否切换,如果网关A正常通信的从站数量少于网关B正常通信从站数量,则进行主网关切换,将网关B切换为主网关并将网关A切换为备用网关,如果网关A正常通信从站数量多于或等于网关B正常通信从站数量,则不进行切换,网关A仍然作为主网关进行工作。
在另一些具体实施例中,用网关各总线故障率的方差表示网关的故障分布率,第一网关故障分布率为
Figure BDA0002908756030000071
第二网关故障分布率为
Figure BDA0002908756030000072
其中
Figure BDA0002908756030000073
Figure BDA0002908756030000074
分别表示网关A和网关B各总线的平均故障率,且分别为
Figure BDA0002908756030000075
Figure BDA0002908756030000076
NA、NB分别为第一网关A和第二网关B所连接的总线数,WA1、WA2…WAn为连接在第一网关上的总线A1、A2…An各自的连接的从站数量,WB1、WB2…WBn为连接在第二网关上的总线B1、B2…Bn各自的连接的从站数量,MA1、MA2…MAn、MB1、MB2…MBn为对应每条总线上从站的故障数量。当满足以下任一条件时,进行主网关的切换:
(1)当网关A故障等级为第三级故障,且高于网关B故障等级,即至少一根RS485总线整体通信发生故障,或者网关A总线中至少一条总线的故障率等于1。
(2)如果网关A和网关B故障等级均小于第三级故障,当第一网关的故障分布率大于预设故障阈值,且大于第二网关的故障分布率时,则触发冗余切换,将第一网关切换至第二工作状态。
(3)所述第一网关被配置为在无法采集连接于第一总线的所有从站数据,且第二网关无法采集连接于第二总线的所有从站数据但可采集连接第一总线的至少一从站数据时,判断第一网关故障分布率是否大于第二网关故障分布率,若是则进行切换,将第一网关切换至第二工作状态。其中第一总线和第二总线可以为任一不相同的总线。
具体如附图2所示,在另一具体实施例中,网关A连接三条总线,分别为总线A1、总线A2、总线A3,网关B连接三条总线分别为总线B1、总线B2、总线B3,若干从站分别连接网关A和网关B的若干总线,总线A1、A2、A3分别连接WA1、WA2、WA3个从站,总线B1、B2、B3上分别连接WB1、WB2、WB3个从站,且每条总线上从站的故障数量为MA1、MA2、MA3、MB1、MB2、MB3,则每条总线的故障率为
Figure BDA0002908756030000081
网关A的平均故障率
Figure BDA0002908756030000082
网关B的平均故障率
Figure BDA0002908756030000083
用网关A各总线故障率的方差表示网关A的故障分布率
Figure BDA0002908756030000084
用网关B各总线故障率的方差表示网关B的故障分布率
Figure BDA0002908756030000085
Figure BDA0002908756030000086
其中、分别为网关A和网关B所连接的总线数,本实施例中均等于3,当满足以下任一条件时,进行主网关的切换:
(1)当网关A故障等级为第三级故障,即至少一根RS485总线整体通信发生故障,或者网关A三条总线中至少一条总线的故障率等于1,即
Figure BDA0002908756030000087
Figure BDA0002908756030000088
Figure BDA0002908756030000089
相应的数据采集周期延长,因此为了避免此种状况的发生,当网关A在无法采集位于同一总线下所有从站数据且自身故障等级高于网关B故障等级时,则触发冗余切换,切换至第二工作状态。
(2)如果网关A和网关B故障等级均小于第三级故障,当主网关的故障分布率大于预设故障阈值,且大于备用网关的故障分布率时,则触发冗余切换,将主网关切换至第二工作状态。在一具体实施例中,预设故障阈值可以设置为0.1,当网关A的故障分布率>0.1,且ρAB,网关A的故障分布率越大,说明网关A所连接的总线从站通信故障分布不均,存在较为集中的情况,例如总线A1、A2、A3分别连接3、3、4个从站,总线B1、B2、B3也分别连接3、3、4个从站,网关A连接总线故障从站数分别为0、2、3,则网关A的故障分布率ρA=0.113,若故障从站数分别为1、2、2,则故障分布率ρB=0.0185,则ρA>0.1,且ρAB,进行网关切换,故障分布率代表从站故障的密集程度,故障分布率越大,故障从站越集中,当网关A的故障分布率ρA>0.1,且ρAB的情况下,则进行网关的切换。
(3)所述主网关被配置为在无法采集连接于第一总线的所有从站数据,且备用网关无法采集连接于第二总线的所有从站数据但可采集连接第一总线的至少一从站数据时,判断主网关故障分布率是否大于备用网关故障分布率,若是则进行切换,将主网关切换至第二工作状态。其中第一总线和第二总线可以为任一不相同的总线。即在网关A和网关B故障等级均为较重故障,且故障总线非同一总线,根据网关故障分布率的大小,若网关A的故障分布率ρA大于网关B的故障分布率,则进行切换,若网关A的故障分布率ρA大于网关B的故障分布率ρB,则不进行切换。
在判断需要进行主网关切换后,主网关将第一工作状态切换至第二工作状态并向备用网关发送网关切换指令,所述备用网关确认网关切换指令后将第二工作状态切换至第一工作状态。具体的,在进行主网关切换后,切换后网关B作为主网关,网关A则进行维修或者作为备用网关,网关A停止各总线输出,并通过串口通知网关B冗余切换为主网关,切换后依旧按照上述处于第一工作状态的主网关和处于第二工作状态的备用网关工作方式进行工作。
在一些具体实施例中,处于第二工作状态的备用网关在收到冗余切换信号后,延迟预定时间对切换信号进行多次确认后,将第二工作状态转换为第一工作状态。具体的,作为备用网关的网关B在接收到冗余切换信号后,须延迟一段时间对切换信号进行确认,网关B一旦接收到切换信号,则每0.2ms读取一次切换状态,如果连续5次均为切换信号,则确认为有效切换信号,网关B切换为主网关,同时为了避免总线冲突,网关B延时一定时间后进入工作状态,优选为1s。网关B作为主网关后,网关A作为备用网关,网关B的工作方式与之前网关A工作方式相同。在备用网关切换到第一工作状态后,在预定时间内不再进行冗余切换。例如在发生冗余切换后60秒内,不因故障等级比对、通信故障从站数量或通信故障从站分布情况而产生冗余切换,避免接线过程中时断时续造成频繁切换。
在一些具体实施例中,当主网关或备用网关分析其故障等级为第四级或第五级故障时,则中止其运行。即当网关A或网关B分析自身故障等级为严重故障或者致命故障,则需要更换或者维修网关的硬件设备。进一步的,对于相同的从站,网关A或网关B均不能采集到数据时,则需要更换或者维修网关的硬件设备。
处于第二工作状态的备用网关还被配置为在无法接收到处于第一工作状态的主网关发送时间信息、采集失败信息或同步采集信息时,切换为第一工作状态。具体的,如网关A、网关B的冗余通信中断,则网关B无法接收到网关A的时间信息、采集失败信息、同步采集信息等,则网关B进入主网关模式,采集所有从设备数据,并上报控制器,由控制器根据上报的从设备数据包中的时间戳,保留最新数据存放入该从站所分配的内存中。
本实施例公开的工业网关冗余系统通过判断主网关和备用网关的故障情况,实现多个网关的最大限度的冗余,在主网关处于轻度故障的情况下,不能独立完成数据采集的情况下,备用网关可进行辅助采集,不需要直接维修或者更换主网关,而当主网关处于特定的较重故障时则可视故障情况切换为备用状态,将原备用网关中的一个切换为主网关,增加了工业网关冗余系统的切换灵活性,提高了系统的可靠性与可工作性,降低了停机的风险。
实施例2
附图3为本实施例公开的一种用于工业网关的冗余切换方法,可用于各工业网关,例如用于如前面实施例中描述的工业网关冗余系统中的工业网关,该方法主要用于工业网关冗余系统中的主网关即主网关,为描述清楚下面实施例将以实施例1工业网关冗余系统为例进行描述,当然该数据处理方法可应用与其它实施例和各类工业冗余系统的工业网关中,该冗余切换方法主要包括如下步骤:
步骤S1,采集从站数据,并根据获取的各从站数据分析自身故障等级。
主网关采集从站的数据并上报至控制器,在完成一周期数据采集后,根据数据采集情况分析自身故障等级。其中将故障等级按具体情况分成第一级~第五级故障,其中第一级故障为轻故障,具体为不影响当前运行的局部轻微故障,例如冗余控制网单网故障。第二级故障为一般故障,具体为影响局部控制输出的故障,例如RS485总线上部分从设备通信故障。第三级故障为较重故障,具体为影响整条总线的故障,例如整条RS485总线故障。第四级故障为严重故障,具体为影响全部控制输出的故障,例如冗余控制网双网故障。第五级故障为致命故障,具体为不可恢复的硬件故障,例如Flash、DDR RAM、SRAM不可恢复硬件故障,上述一至五级故障程度依次加重。
步骤S2,向备用网关发送时间同步信息,并接收备用网关的应答消息,所述应答消息包括该备用网关的故障等级信息和无法正常通信的从站数量及从站地址。
向网关B发送时间同步信息,以等待网关B向网关A发送的应答消息,具体的应答消息包括网关B的故障等级和网关B所连接的从站故障的数量及从站地址。其中,网关B接收到网关A的时间信息后,计算网关B的时间为网关A时间同步信息中的时间与理论通信传输时间和中断响应延时三者时间的总和。
步骤S3,根据各网关的通信故障从站的数量和/或分布来判断是否需要从第一工作状态切换至第二工作状态。
具体的,如果网关A处于第二级故障且不满足工作状态切换条件,则网关A采集从设备数据,对于采集失败的从设备,网关A再次轮询采集,若仍为失败状态,则将自身采集失败的从设备信息同步给网关B,从设备信息包括从设备的虚拟地址;网关B解析网关A发送的从设备信息,并根据从设备地址采集网关A采集失败的从设备数据,并将所采集的从设备数据和状态上传至控制器,相应的,控制器通过网关A下发给从设备的数据,则通过网关B下发。
具体的,如附图4所示,步骤S3还包括:步骤S31,如果无法采集位于同一总线下所有从站数据且自身故障等级高于备用网关故障等级,则从第一工作状态切换至第二工作状态。
当主网关所连接的从设备产生故障的数量增多时,数据采集的时间会延长,不利于数据采集的实效性,所以当采集时间过长时,适当的需进行网关切换。具体的,主网关被配置为根据数据采集情况分析自身故障等级并接收备用网关发送的故障等级信息,在无法采集位于同一总线下所有从站数据且自身故障等级高于备用网关故障等级时,切换至第二工作状态。
其中,在无法采集位于同一总线下所有从站数据时,可判断发生第三级故障,即至少一根RS485总线整体通信发生故障,当网关A处于该第三级故障的同时,如果其故障等级大于收到的网关B的故障等级,则进行主网关切换,将网关B切换为主网关,将网关A切换为备用网关。通过上述切换方式,当整根RS485总线故障后,此总线的轮询时间延长,相应的数据采集周期延长,因此为了避免此种状况的发生,在网关A为较重故障的情况下,且网关B为正常、轻故障或者一般故障则触发冗余切换,从而避免总线轮询时间过长,影响整个系统通信。
步骤S32,如果无法采集连接于第一总线的所有从站数据,且备用网关无法采集连接于第二总线的所有从站数据但可采集连接第一总线的至少一从站数据时,判断与主网关正常通信的从站数量是否小于与备用网关正常通信的从站数量,如是则从第一工作状态切换至第二工作状态。
在本实施例中,在与从站连接的一总线发生故障且备用网关与从站连接的另一总线也发生故障时,判断与主网关正常通信的从站数量是否小于与备用网关正常通信的从站数量,如是则切换至第二工作状态。具体的,网关A和网关B故障等级均为第三级故障,且故障总线非同一总线,即连接不同的从站,则此类情况下根据各网关所能正常通信的从站数量来确定是否切换,如果网关A正常通信的从站数量少于网关B正常通信从站数量,则进行主网关切换,将网关B切换为主网关并将网关A切换为备用网关,如果网关A正常通信从站数量多于或等于网关B正常通信从站数量,则不进行切换,网关A仍然作为主网关进行工作。
步骤S33,当主网关和备用网关的故障等级均低于第三级故障,在采集失败的从站数量大于预设值,且正常通信的从站数量少于与其它网关正常通信的从站数量时,切换至第二工作状态。
其中的预设值可以按具体要求进行设置,在本实施例中我们将预设值设定为从站数量的一半来进行说明,即在网关A和网关B故障等级均小于第三级故障,可以为正常、轻故障或一般故障,网关A所连接的从站已经超过一半发生故障且网关A所连接的正常工作的从站数量小于网关B,且网关A和网关B所连接的从设备不存在相同的从设备通信故障时,进行主网关切换,将网关B切换为主网关,将网关A切换为备用网关。
步骤S34,当主网关和备用网关的故障等级均低于第三级故障,如果主网关的故障分布率大于预设故障阈值,且大于备用网关的故障分布率时,则从第一工作状态切换至第二工作状态,其中故障分布率
Figure BDA0002908756030000111
其中
Figure BDA0002908756030000112
表示总线故障率的方差,
Figure BDA0002908756030000121
为各网关所连接总线的平均故障率,具体为网关各总线故障率的方差,
Figure BDA0002908756030000122
N为该网关所连接的总线数,W1、W2…Wn为该网关所连接的N条总线上各自连接的从站数量,M1、M2…Mn为该网关连接的N条总线上的故障从站数量。
具体的,在本实施例中,主网关A连接三条总线,分别为总线A1、总线A2、总线A3,备用网关B连接三条总线分别为总线B1、总线B2、总线B3,若干从站分别连接网关A和网关B的若干总线,总线A1、A2、A3分别连接WA1、WA2、WA3个从站,总线B1、B2、B3上分别连接WB1、WB2、WB3个从站,且每条总线上从站的故障数量为MA1、MA2、MA3、MB1、MB2、MB3,则每条总线的故障率为
Figure BDA0002908756030000123
定义网关A的故障分布率
Figure BDA0002908756030000124
Figure BDA0002908756030000125
网关B的故障分布率
Figure BDA0002908756030000126
Figure BDA0002908756030000127
其中
Figure BDA0002908756030000128
为各网关所连接总线的平均故障率,
Figure BDA0002908756030000129
NA、NB分别为网关A和网关B所连接的总线数。其中主网关故障分布率为
Figure BDA00029087560300001210
Figure BDA00029087560300001211
备用网关故障分布率为
Figure BDA00029087560300001212
Figure BDA00029087560300001213
其中
Figure BDA00029087560300001214
为各网关所连接总线的平均故障率,
Figure BDA00029087560300001215
Figure BDA00029087560300001216
NA、NB分别为主网关A和备用网关B所连接的总线数,WA1、WA2、WAn为连接在主网关上的总线A1、A2、An各自的连接的从站数量,WB1、WB2、WBn为连接在备用网关上的总线B1、B2、Bn各自的连接的从站数量,MA1、MA2、MAn、MB1、MB2、MBn为对应每条总线上从站的故障数量。在一具体实施例中,预设故障阈值可以设置为0.1,当网关A的故障分布率ρA>0.1,且ρAB,网关A的故障分布率越大,说明网关A所连接的总线从站通信故障分布不均,存在较为集中的情况,例如总线A1、A2、A3分别连接3、3、4个从站,与网关A连接的故障从站数分别为0、2、3,则网关A的故障分布率ρA=0.113,与网关B连接的故障从站数分别为1、2、2,则故障分布率ρB=0.0185,网关A的故障分布率大于0.1,且大于网关B的故障分布率,应进行网关切换。故障分布率代表从站故障的密集程度,故障分布率越大,故障从站越集中,当网关A的故障分布率ρA>0.1,且ρAB的情况下,则进行网关的切换。
步骤S35,如果无法采集连接于第一总线的所有从站数据,且备用网关无法采集连接于第二总线的所有从站数据但可采集连接第一总线的至少一从站数据时,判断本网关故障分布率是否大于备用网关故障分布率,若是则进行切换,向该备用网关发送冗余切换信号。本网关也将主网关切换至第二工作状态。其中第一总线和第二总线可以为任一不相同的总线。即在网关A和网关B故障等级均为较重故障,且故障总线非同一总线,根据网关故障分布率的大小,若网关A的故障分布率ρA大于网关B的故障分布率,则进行切换,若网关A正常通信设备数量多于等于网关B,则不进行切换。
上述步骤S31至步骤S35的各主网关的工作状态切换条件采用顺序可按步骤S31-S35的切换优先级从高至低依次进行判断,也可按步骤S31-S33或步骤S31、步骤S34-S35进行,或者按其它预设的切换条件优先级排列顺序进行执行。
在判断需要进行主网关切换后,将第一工作状态切换至第二工作状态并向备用网关发送网关切换指令,原备用网关在确认网关切换指令后将第二工作状态切换至第一工作状态。具体的,在进行主网关切换后,切换后网关B作为工作网关,网关A则进行维修或者作为备用网关,网关A停止各总线输出,并通过串口通知网关B冗余切换为主网关,切换后依旧按照上述处于第一工作状态的主网关和处于第二工作状态的备用网关工作方式进行工作。
在一些具体实施例中,在分析其故障等级为第四级或第五级故障时,中止运行。即当网关A或网关B分析自身故障等级为严重故障或者致命故障,则需要更换或者维修网关的硬件设备。进一步的,对于相同的从站,网关A或网关B均不能采集到数据时,则需要更换或者维修网关的硬件设备。
步骤S4,如果不切换至第二工作状态,则将采集成功的从站数据上报至控制器,并向处于第二工作状态的一网关发送具有数据采集失败的从站地址的补充采集通知。
将采集成功的从站数据上报至控制器,并向处于第二工作状态的备用网关发送具有采集失败的从站地址的补充采集通知。而作为备用网关则处于第二工作状态,只监听总线状态,对总线故障进行诊断,不接收总线数据。并在接到主网关发送的补充采集通知后,对采集失败的从站进行补充采集并将数据上报至控制器,以及转发控制器下发给该从站的数据。
具体的,例如如果网关A处于第二级故障,且网关A不需要进行网关切换,在采集从设备数据后,对于采集失败的从设备,网关A再次轮询采集,若仍为失败状态,则将自身采集失败的从设备信息同步给网关B,从设备信息包括从设备的虚拟地址;网关B解析网关A发送的从设备信息,并根据从设备地址采集网关A采集失败的从设备数据,并将所采集的从设备数据和状态上传至控制器,相应的,控制器通过网关A下发给从设备的数据,则通过网关B下发。
步骤S5,如需切换至第二工作状态,则向一备用网关发送冗余切换信号,并等待响应切换至第一工作状态的网关所发出的时间同步信息或补充采集通知。
在判断需要进行主网关切换后,将第一工作状态切换至第二工作状态并向备用网关发送网关切换指令,原备用网关在确认网关切换指令后将第二工作状态切换至第一工作状态。具体的,在进行主网关切换后,切换后网关B作为工作网关,网关A则进行维修或者作为备用网关,网关A停止各总线输出,并通过串口通知网关B冗余切换为主网关,切换后依旧按照上述处于第一工作状态的主网关和处于第二工作状态的备用网关工作方式进行工作。
具体的,在处于第二工作状态时,如果收到冗余切换信号后,延迟预定时间对切换信号进行多次确认后,将第二工作状态转换为第一工作状态。具体的,作为备用网关的网关B在接收到冗余切换信号后,须延迟一段时间对切换信号进行确认,网关B一旦接收到切换信号,则每0.2ms读取一次切换状态,如果连续5次均为切换信号,则确认为有效切换信号,网关B切换为主网关,同时为了避免总线冲突,网关B延时一定时间后进入工作状态,优选为1s。网关B作为主网关后,网关A作为备用网关,网关B的工作方式与之前网关A工作方式相同。在备用网关切换到第一工作状态后,在预定时间内不再进行冗余切换。例如在发生冗余切换后60秒内,不因故障等级比对、通信故障从站数量或通信故障从站分布情况而产生冗余切换,避免接线过程中时断时续造成频繁切换。
如果无法接收到处于第一工作状态的主网关发送时间信息、采集失败信息或同步采集信息时,切换为第一工作状态。具体的,如网关A、网关B的冗余通信中断,则网关B无法接收到网关A的时间信息、采集失败信息、同步采集信息等,则网关B进入主网关模式,采集所有从设备数据,并上报控制器,由控制器根据上报的从设备数据包中的时间戳,保留最新数据存放入内存中。
本实施例公开的用于工业网关的冗余切换方法通过判断主网关和从网关的故障情况,实现多个网关的最大限度的冗余,在主网关处于轻度故障的情况下,不能独立完成数据采集的情况下,备用网关可进行辅助采集,不需要直接维修或者更换主网关,而当主网关处于特定的较重故障时则可视故障情况切换为备用状态,增加了工业网关冗余系统的切换灵活性,提高了系统的可靠性与可工作性,降低了停机的风险。
实施例3
附图5为本实施例公开的一种工业网关冗余系统,包括第一网关、第二网关、第三网关和多个从站,第一网关、第二网关和第三网关互相连接;多个从站即从设备通过至少一总线分别与第一网关、第二网关和第三网关连接;第一网关被配置为采集各从站数据,并根据位于同一总线的从站数据采集情况和/或各网关的通信失败从站的数量来判断是否需要从第一工作状态切换至第二工作状态,或者根据各网关的通信故障从站的数量和/或分布来判断是否需要从第一工作状态切换至第二工作状态。第二网关或第三网关被配置为在收到状态切换通知或与第一网关通信中断后从第二工作状态切换至第一工作状态。其中,第一工作状态被配置为将采集成功的从站数据上报至控制器,并向处于第二工作状态的网关发送具有采集失败的从站地址的补充采集通知;所述第二工作状态被配置为响应补充采集通知,对采集失败的从站进行补充采集并将数据上报至控制器。
具体的,在该实施例中将网关C作为第一网关,网关D作为第二网关,网关E作为第三网关,网关C先行作为主网关,网关D和E为备用网关进行详细说明。网关C在作为主网关时,处于第一工作状态,按预定周期采集各从站数据,将采集成功的从站数据上报至控制器,并向作为备用网关的网关D或E发送具有采集失败的从站地址的补充采集通知。而作为备用网关的D或E,则处于第二工作状态,只监听总线状态,对总线故障进行诊断,不接收总线数据。并在接到第一网关发送的补充采集通知后,对采集失败的从站进行补充采集并将数据上报至控制器。
在本实施例中,网关C、D和E之间相互连接进行通信,该连接可以采用有线连接也可以是无线连接,只需网关间可实现相互通信即可,在本实施例中具体可以采用串口通信的方式。网关C、D和E也分别与外部控制器通信连接,用于向控制器发送自己采集的从站数据,以及转发控制器下发给从站的数据。多个从站通过总线分别连接网关C、D和E,总线可以选用RS485总线或其他总线协议,且总线可以为一条或者多条总线,即各从站可以全部或者各自分组通过不同的总线与网关C、D或E连接。各从站也可通过同一条总线与网关C连接,通过另一条总线与网关D连接,通过另一条总线与网关E连接。或者各从站可通过同一条总线分别与网关C、D或E连接。网关C、D或E将采集的从站数据打包为数据包上传至控制器,其中数据包包括所采集的从站数据和时间戳,控制器对每个从站均只分配一片内存,网关C、D和E采集的数据均存放在同一片内存中。
在本实施例中,第二网关和第三网关被配置为在收到第一网关发送的时间同步信息后回复应答消息,所述应答消息包括故障等级和与本网关无法正常通信的从站数量及从站地址,从站地址包含了总线信息。具体的,从设备通过总线分别与网关C、D和E连接,网关C作为主网关采集从设备数据,并上传至控制器,并且网关C周期性向网关D和E发送本机时间信息,网关D和E应答。其中网关D和E的应答内容包括自身故障等级信息,同时网关D和E通过接收到网关C的时间信息,对自身的时间进行校正,校正方式具体为网关D和E将接收到的网关C发送数据包中的时间信息、理论通信时间消耗及中断响应延时的时间和作为网关D和E的时间。其中作为第二网关的网关D和E只监听总线状态,对总线故障进行诊断,不接收总线数据。
当网关C在完成一周期数据采集后,根据数据采集情况分析自身故障等级,并可向网关D和E发送时间同步信息,以等待网关D和E向网关C发送的应答消息,具体的应答消息包括网关D、E的故障等级以及网关D、E所连接的无法正常通信的从站数量及从站地址,其中故障等级中包括同一总线的从站数据采集情况,从站地址包含总线信息。网关C根据位于同一总线的从站数据采集情况或各网关的通信失败从站的数量来判断是否需要从第一工作状态切换至第二工作状态,或者根据位于同一总线的从站数据采集情况和各网关的通信失败从站的数量来判断是否需要从第一工作状态切换至第二工作状态,即将网关C从主网关切换至备用网关,将网关D或E切换至主网关。
在本实施例中,作为第一网关的网关C出现故障后,对自身故障等级进行分析。其中将故障等级按如实施例1中的等级进行分类,如果是第一级故障,则网关C继续工作,如果为第二级故障,则网关C采集从设备数据,对于采集失败的从设备,网关C再次轮询采集,若仍为失败状态,则将自身采集失败的从设备信息同步给网关D或E,从设备信息包括从设备的虚拟地址;网关D或E解析网关C发送的从设备信息,并根据从设备地址采集网关C采集失败的从设备数据,并将所采集的从设备数据和状态上传至控制器,相应的,控制器通过网关C下发给从设备的数据则通过网关D或E下发。
因此当主网关所连接的从设备产生故障的数量增多时,数据采集的时间会延长,不利于数据采集的实效性,所以当采集时间过长时,适当的需进行网关切换。具体的,第一网关被配置为根据数据采集情况分析自身故障等级并接收第二网关和第三网关发送的故障等级信息,在无法采集位于同一总线下所有从站数据且自身故障等级高于第二网关或第三网关故障等级时,切换至第二工作状态。
其中,在无法采集位于同一总线下所有从站数据时,可判断发生第三级故障,即至少一根RS485总线整体通信发生故障,当网关C处于该第三级故障的同时,如果其故障等级大于收到的网关D或者网关E的故障等级,则进行主网关切换,将网关D与E中故障等级较低的网关切换为主网关,若故障等级相同,则通信故障从站数量较少的网关切换为主网关,将网关C切换为备用网关。通过上述切换方式,当整根RS485总线故障后,此总线的轮询时间延长,相应的数据采集周期延长,因此为了避免此种状况的发生,在主网关为较重故障的情况下,且备用网关中存在正常、轻故障或者一般故障则触发冗余切换,将备用网关中故障等级较低的网关切换为主网关,从而避免总线轮询时间过长,影响整个系统通信。
在本实施例中,第一网关还被配置为在第二网关和第三网关故障等级均低于第三级故障的情况下,采集失败的从站数量大于预设值,且正常通信的从站数量少于与第二网关或第三网关正常通信的从站数量时切换至第二工作状态。具体的,其中的预设值可以按具体要求进行设置,在本实施例中我们将预设值设定为从站数量的一半来进行说明,即在网关C所连接的从站已经超过一半发生故障且网关C所连接的正常工作的从站数量小于网关D或E,且网关C与网关D或E所连接的从设备不存在相同的从设备通信故障时,进行第一网关切换,将网关D或E切换为主网关,将网关C切换为备用网关,优选的,可将网关D和E中的连接正常从站数量较多的网站切换为主网关。
在本实施例中,第一网关被配置为在与从站连接的一总线发生故障且第二、三网关与从站连接的另一总线也发生故障时,判断与第一网关正常通信的从站数量是否小于与第二或第三网关正常通信的从站数量,如是则切换至第二工作状态,并将第二网关和第三网关中各自连接的正常通信从站数量较多的一网关切换为主网关。具体的,网关C、D、E故障等级均为第三级故障,且故障总线非同一总线,即所连接的从设备不同,则此类情况下根据各网关所能正常通信的从站数量来确定是否切换,如果网关C正常通信的从站数量少于网关D或E正常通信从站数量,则进行主网关切换,将正常通信从站数量最多的网关切换为主网关并将网关C切换为备用网关,如果网关C正常通信从站数量多于或等于网关D和E正常通信从站数量,则不进行切换,网关C仍然作为主网关进行工作。
在判断需要进行主网关切换后,第一网关将第一工作状态切换至第二工作状态并向第二网关或第三网关发送网关切换指令,所述第二网关或第三网关确认网关切换指令后将第二工作状态切换至第一工作状态。
在另一些具体实施例中,当第一网关的故障分布率大于预设故障阈值,且大于第二网关或第三网关的故障分布率时,则触发冗余切换,将第一网关切换至第二工作状态,将第二网关和第三网关中的故障分布率较小的网关设置为第一工作状态。其中用网关所连接总线的故障率的方差表示故障分布率,则第一网关故障分布率为
Figure BDA0002908756030000171
Figure BDA0002908756030000172
第二网关故障分布率为
Figure BDA0002908756030000173
Figure BDA0002908756030000174
其中
Figure BDA0002908756030000175
为各网关所连接总线的平均故障率,
Figure BDA0002908756030000176
N1、N2分别为第一网关和第二网关所连接的总线数,W11、W12…W1n为连接在第一网关上的各总线连接的从站数量,W21、W22…W2n为连接在第二网关上的各线各自的连接的从站数量,M11、M12…M1n、M21、M22…M2n为对应每条总线上从站的故障数量,第三网关的故障分布率也是如此,再此不再重复描述。
第一网关在无法采集连接于第一总线的所有从站数据,且第二网关无法采集连接于第二总线的所有从站数据但可采集连接第一总线的至少一从站数据时,判断第一网关故障分布率是否大于第二网关故障分布率,若是则进行切换,将第一网关切换至第二工作状态。其中第一总线和第二总线可以为任一不相同的总线。
在一些具体实施例中,处于第二工作状态的第二网关在收到冗余切换信号后,延迟预定时间对切换信号进行多次确认后,将第二工作状态转换为第一工作状态。具体的,作为备用网关的网关D在接收到冗余切换信号后,须延迟一段时间对切换信号进行确认,网关D一旦接收到切换信号,则每0.2ms读取一次切换状态,如果连续5次均为切换信号,则确认为有效切换信号,网关D切换为主网关,同时为了避免总线冲突,网关D延时一定时间后进入工作状态,优选为1s。网关D作为主网关后,网关C作为第二网关,网关D的工作方式与之前网关C工作方式相同。在备用网关切换到第一工作状态后,在预定时间内不再进行冗余切换。例如在发生冗余切换后60秒内,不因故障等级比对、通信故障从站数量或通信故障从站分布情况而产生冗余切换,避免接线过程中时断时续造成频繁切换。
在一些具体实施例中,当第一、二或三网关分析其故障等级为第四级或第五级故障时,则中止其运行。即当网关C、D、E分析自身故障等级为严重故障或者致命故障,则需要更换或者维修网关的硬件设备。进一步的,对于相同的从站,网关C、D、E均不能采集到数据时,则需要更换或者维修网关的硬件设备。处于第二工作状态的第二网关和第三网关还被配置为在无法接收到处于第一工作状态的第一网关发送时间信息、采集失败信息或同步采集信息时,将第二网关或第三网关切换为第一工作状态。
本实施例公开的工业网关冗余系统通过判断故障等级,实现多个网关的最大限度的冗余,在作为第一网关的主网关不能独立完成数据采集的情况下,作为备用网关的第二网关和第三网关进行辅助采集,不需要直接维修或者更换主网关,提高了系统的可靠性与可工作性,降低了停机的风险;在实际使用中可以设置三个以上的网关,具体方案与上面类似就不再重复论述。
实施例4
附图6为一实施例公开的工业网关的结构示意图,具体包括采集模块1、发送模块2和切换控制模块3,其中采集模块1用于采集从站数据,并根据获取的各从站数据分析自身故障等级,发送模块2用于向备用网关发送时间同步信息并接收备用网关的应答消息,所述应答消息包括所在网关的故障等级信息和与所在网关无法正常通信的从站数量及从站地址,所述从站地址包含总线信息;切换控制模块3用于根据各网关的通信故障从站的数量和/或分布来判断是否需要从第一工作状态切换至第二工作状态;如果不切换至第二工作状态,则将采集成功的从站数据上报至控制器,并向处于第二工作状态的备用网关发送具有数据采集故障的从站地址的补充采集通知;如需切换至第二工作状态,则向一备用网关发送冗余切换信号,并等待响应切换至第一工作状态的网关所发出的时间同步信息或补充采集通知。
该工业网关通过判断主网关和从网关的故障情况,实现多个网关的最大限度的冗余,在主网关处于轻度故障的情况下,不能独立完成数据采集的情况下,备用网关可进行辅助采集,不需要直接维修或者更换主网关,而当主网关处于特定的较重故障时则可视故障情况切换为备用状态,增加了工业网关冗余系统的切换灵活性,提高了系统的可靠性与可工作性,降低了停机的风险。
在本实施例中,切换控制模块3还被配置为如果无法采集位于同一总线下所有从站数据且自身故障等级高于备用网关故障等级,则从第一工作状态切换至第二工作状态。
其中,切换控制模块还被配置在所连接的从设备产生故障的数量增多时,数据采集的时间会延长,不利于数据采集的实效性,所以当采集时间过长时,适当的需进行网关切换。通过上述切换方式,当整根RS485总线故障后,此总线的轮询时间延长,相应的数据采集周期延长,因此为了避免此种状况的发生,在网关A为较重故障的情况下,且网关B为正常、轻故障或者一般故障则触发冗余切换,从而避免总线轮询时间过长,影响整个系统通信。
在本实施例中,切换控制模块3还被配置为如果无法采集连接于第一总线的所有从站数据,且备用网关无法采集连接于第二总线的所有从站数据但可采集连接第一总线的至少一从站数据时,判断与主网关正常通信的从站数量是否小于与备用网关正常通信的从站数量,如是则从第一工作状态切换至第二工作状态。在与从站连接的一总线发生故障且备用网关与从站连接的另一总线也发生故障时,判断与主网关正常通信的从站数量是否小于与备用网关正常通信的从站数量,如是则切换至第二工作状态。
在本实施例中,切换控制模块还被配置为在主网关和备用网关均没有总线故障的情况下,在采集失败的从站数量大于预设值,且正常通信的从站数量少于与其它网关正常通信的从站数量时,切换至第二工作状态。其中的预设值可以按具体要求进行设置。
在本实施例中,切换控制模块还被配置为在主网关和备用网关均没有总线故障的情况下,在故障分布率大于预设故障阈值,且大于备用网关的故障分布率时,则从第一工作状态切换至第二工作状态,其中故障分布率
Figure BDA0002908756030000201
其中
Figure BDA0002908756030000202
为网关的平均故障率
Figure BDA0002908756030000203
N为该网关所连接的总线数,W1、W2…Wn为该网关所连接的N条总线上各自连接的从站数量,M1、M2…Mn为该网关连接的N条总线上的故障从站数量。
在本实施例中,切换控制模块还被配置为如果无法采集连接于第一总线的所有从站数据,且备用网关无法采集连接于第二总线的所有从站数据但可采集连接第一总线的至少一从站数据时,判断本网关故障分布率是否大于备用网关故障分布率,若是则进行切换,向该备用网关发送冗余切换信号。其中第一总线和第二总线可以为任一不相同的总线。
切换控制模块在判断需要进行主网关切换后,将第一工作状态切换至第二工作状态并向备用网关发送网关切换指令,在确认网关切换指令后将第二工作状态切换至第一工作状态。
所述工业网关还包括上报模块,所述上报模块用于在不切换至第二工作状态时,将采集成功的从站数据上报至控制器,并向处于第二工作状态的一网关发送具有数据采集失败的从站地址的补充采集通知。将采集成功的从站数据上报至控制器,并向处于第二工作状态的备用网关发送具有采集失败的从站地址的补充采集通知。而作为备用网关则处于第二工作状态,只监听总线状态,对总线故障进行诊断,不接收总线数据。并在接到主网关发送的补充采集通知后,对采集失败的从站进行补充采集并将数据上报至控制器,以及转发控制器下发给该从站的数据。
需要说明的是,本说明书中前述各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的上述工业网关而言,由于其与前面实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本发明一实施例还提供的另一种工业网关,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述各实施例中描述的工业网关的数据处理方法的各个步骤。
所述工业网关可包括但不仅限于,处理器、存储器。本领域技术人员可以理解,所述示意图仅仅是工业网关的示例,并不构成对工业网关的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述工业网关还可以包括输入输出设备、网络接入设备、总线等。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述工业网关的控制中心,利用各种接口和线路连接整个工业网关设备的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述工业网关的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart MediaCard,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
所述工业网关的数据处理装置数据管理方法如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个工业网关的数据处理方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
总之,以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所作的均等变化与修饰,皆应属本发明专利的涵盖范围。

Claims (9)

1.一种用于工业网关的冗余切换方法,其特征在于,包括:
S1,采集从站数据,并根据获取的各从站数据分析自身故障等级;
S2,向备用网关发送时间同步信息,并接收备用网关的应答消息,所述应答消息包括该备用网关的故障等级信息和无法正常通信的从站数量;
S3,根据各网关的通信故障从站的数量和分布来判断是否需要从第一工作状态切换至第二工作状态;所述步骤S3包括:
如果本网关的故障分布率大于预设故障阈值,且大于备用网关的故障分布率时,则从第一工作状态切换至第二工作状态,其中故障分布率
Figure FDA0003714786220000011
Figure FDA0003714786220000012
其中
Figure FDA0003714786220000013
为网关各总线的平均故障率,
Figure FDA0003714786220000014
N为该网关所连接的总线数,W1、W2...Wn为该网关所连接的N条总线上各自连接的从站数量,M1、M2...Mn为该网关连接的N条总线上的故障从站数量;
S4,如果不切换至第二工作状态,则将采集成功的从站数据上报至控制器,并向处于第二工作状态的备用网关发送具有数据采集故障的从站地址的补充采集通知;
S5,如需切换至第二工作状态,则向一备用网关发送冗余切换信号,并等待响应切换至第一工作状态的网关所发出的时间同步信息或补充采集通知。
2.根据权利要求1所述用于工业网关的冗余切换方法,其特征在于,所述步骤S3还包括:
S31,如果无法采集位于同一总线下所有从站数据且自身故障等级高于备用网关故障等级,则从第一工作状态切换至第二工作状态。
3.根据权利要求2所述用于工业网关的冗余切换方法,其特征在于,所述步骤S3还包括:
S32,如果无法采集连接于第一总线的所有从站数据,且备用网关无法采集连接于第二总线的所有从站数据但可采集连接第一总线的至少一从站数据时,判断与主网关正常通信的从站数量是否小于与备用网关正常通信的从站数量,如是则从第一工作状态切换至第二工作状态。
4.根据权利要求3所述用于工业网关的冗余切换方法,其特征在于,所述步骤S3还包括:
S33,如果采集失败的从站数量大于预设值,且正常通信的从站数量少于与备用网关正常通信的从站数量时,则从第一工作状态切换至第二工作状态。
5.一种工业网关,其特征在于,包括:
采集模块,用于采集从站数据,并根据获取的各从站数据分析自身故障等级;
发送模块,用于向备用网关发送时间同步信息并接收备用网关的应答消息,所述应答消息包括所在网关的故障等级信息和与所在网关无法正常通信的从站数量;
切换控制模块,用于根据各网关的通信故障从站的数量和分布来判断是否需要从第一工作状态切换至第二工作状态;如果本网关的故障分布率大于预设故障阈值,且大于备用网关的故障分布率时,则从第一工作状态切换至第二工作状态,其中故障分布率
Figure FDA0003714786220000021
Figure FDA0003714786220000022
其中
Figure FDA0003714786220000023
为网关各总线的平均故障率,
Figure FDA0003714786220000024
N为该网关所连接的总线数,W1、W2...Wn为该网关所连接的N条总线上各自连接的从站数量,M1、M2...Mn为该网关连接的N条总线上的故障从站数量;如果不切换至第二工作状态,则将采集成功的从站数据上报至控制器,并向处于第二工作状态的备用网关发送具有数据采集故障的从站地址的补充采集通知;如需切换至第二工作状态,则向一备用网关发送冗余切换信号,并等待响应切换至第一工作状态的网关所发出的时间同步信息或补充采集通知。
6.根据权利要求5所述的工业网关,其特征在于:所述切换控制模块还被配置为如果无法采集位于同一总线下所有从站数据且自身故障等级高于备用网关故障等级,则从第一工作状态切换至第二工作状态。
7.根据权利要求6所述的工业网关,其特征在于:所述切换控制模块还被配置为如果无法采集连接于第一总线的所有从站数据,且备用网关无法采集连接于第二总线的所有从站数据但可采集连接第一总线的至少一从站数据时,判断与主网关正常通信的从站数量是否小于与备用网关正常通信的从站数量,如是则从第一工作状态切换至第二工作状态。
8.一种工业网关,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于:所述处理器执行所述计算机程序时实现如权利要求1-4任一所述方法的步骤。
9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现如权利要求1-4任一所述方法的步骤。
CN202110079797.9A 2021-01-21 2021-01-21 一种用于工业网关的冗余切换方法、工业网关和存储介质 Active CN112887133B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110079797.9A CN112887133B (zh) 2021-01-21 2021-01-21 一种用于工业网关的冗余切换方法、工业网关和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110079797.9A CN112887133B (zh) 2021-01-21 2021-01-21 一种用于工业网关的冗余切换方法、工业网关和存储介质

Publications (2)

Publication Number Publication Date
CN112887133A CN112887133A (zh) 2021-06-01
CN112887133B true CN112887133B (zh) 2022-08-16

Family

ID=76051184

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110079797.9A Active CN112887133B (zh) 2021-01-21 2021-01-21 一种用于工业网关的冗余切换方法、工业网关和存储介质

Country Status (1)

Country Link
CN (1) CN112887133B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113867126B (zh) * 2021-09-30 2023-10-03 南京国电南自维美德自动化有限公司 一种带冗余机制的实时控制系统同步性能测试方法和系统
CN113949605B (zh) * 2021-11-03 2024-03-08 珠海格力电器股份有限公司 一种网关、自动控制系统及网关控制方法
CN114070546B (zh) * 2021-11-09 2024-03-01 许昌许继软件技术有限公司 一种iec61850规约装置与双网关机通信状态同步上送方法及系统
CN114531703B (zh) * 2021-12-30 2024-01-23 浙江中控技术股份有限公司 一种基于tdma的无线网关冗余方法
CN115933565B (zh) * 2022-12-23 2023-10-20 广东职业技术学院 一种agv任务交换方法、装置、系统和介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101296065A (zh) * 2008-06-19 2008-10-29 浙江中控技术股份有限公司 一种提高冗余主站可靠性的方法及系统
CN101424550A (zh) * 2008-09-03 2009-05-06 中国海洋石油总公司 仪表冻表故障快速检测方法
CN206819105U (zh) * 2017-04-12 2017-12-29 辽宁瑞丰专用车制造有限公司 一种基于现场dp总线的混砂车自动控制系统
CN108153214A (zh) * 2017-12-27 2018-06-12 海南立昇净水科技实业有限公司 设备监控方法、设备监控装置及计算机设备
CN108289050A (zh) * 2018-01-25 2018-07-17 北京海智元科技有限公司 一种变送器环网控制系统及控制方法
CN108416069A (zh) * 2018-05-10 2018-08-17 湖南利能新能源有限公司 一种数据采集装置和方法
CN108572551A (zh) * 2018-04-23 2018-09-25 广东水利电力职业技术学院(广东省水利电力技工学校) 一种基于EtherCAT总线的工业嵌入式控制系统
CN109245980A (zh) * 2018-11-20 2019-01-18 厦门科灿信息技术有限公司 Modbus通信协议解析方法、系统及设备和存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998049620A1 (en) * 1997-04-25 1998-11-05 Symbios, Inc. Redundant server failover in networked environment
CN104047879B (zh) * 2013-03-13 2017-09-05 北京康吉森自动化设备技术有限责任公司 透平压缩机组诊断控制系统及方法
US9806911B2 (en) * 2015-11-02 2017-10-31 International Business Machines Corporation Distributed virtual gateway appliance
US10800363B2 (en) * 2017-09-18 2020-10-13 GM Global Technology Operations LLC Analog-to-digital fault detection, isolation, and mitigation for a low-voltage communications network

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101296065A (zh) * 2008-06-19 2008-10-29 浙江中控技术股份有限公司 一种提高冗余主站可靠性的方法及系统
CN101424550A (zh) * 2008-09-03 2009-05-06 中国海洋石油总公司 仪表冻表故障快速检测方法
CN206819105U (zh) * 2017-04-12 2017-12-29 辽宁瑞丰专用车制造有限公司 一种基于现场dp总线的混砂车自动控制系统
CN108153214A (zh) * 2017-12-27 2018-06-12 海南立昇净水科技实业有限公司 设备监控方法、设备监控装置及计算机设备
CN108289050A (zh) * 2018-01-25 2018-07-17 北京海智元科技有限公司 一种变送器环网控制系统及控制方法
CN108572551A (zh) * 2018-04-23 2018-09-25 广东水利电力职业技术学院(广东省水利电力技工学校) 一种基于EtherCAT总线的工业嵌入式控制系统
CN108416069A (zh) * 2018-05-10 2018-08-17 湖南利能新能源有限公司 一种数据采集装置和方法
CN109245980A (zh) * 2018-11-20 2019-01-18 厦门科灿信息技术有限公司 Modbus通信协议解析方法、系统及设备和存储介质

Also Published As

Publication number Publication date
CN112887133A (zh) 2021-06-01

Similar Documents

Publication Publication Date Title
CN112887133B (zh) 一种用于工业网关的冗余切换方法、工业网关和存储介质
CN112650048B (zh) 一种工业网关冗余系统和控制方法
EP2798782B1 (en) Technique for handling a status change in an interconnect node
CN110750480B (zh) 一种双机热备系统
CN109344014B (zh) 一种主备切换方法、装置及通信设备
CN104320311A (zh) 一种scada分布式平台下的心跳检测方法
CN107248933A (zh) 一种轨道交通信号系统双主防护的方法
CN109104325B (zh) 基于CANopen协议的列车网络数据传输方法、系统及其装置
CN104485738A (zh) 一种智能变电站监控系统双机切换告警无扰动处理方法
CN105095008A (zh) 一种适用于集群系统的分布式任务故障冗余方法
CN112346925A (zh) 一种进程级双机热备冗余系统及方法
CN110601945A (zh) 一种双冗余can总线通信系统和通信方法
CN115913906A (zh) 一种船用冗余控制系统及方法
CN112821980B (zh) 一种用于工业自动化系统的时钟同步系统、方法和装置
CN111698136B (zh) 一种高可靠plc的数据传输方法及数据传输系统
JP4879823B2 (ja) 監視制御システム
GB2237907A (en) Information handling system
CN105553735A (zh) 一种堆叠系统故障处理方法、设备及堆叠系统
JP3867047B2 (ja) フォールト・トレラント計算機配列およびその作動方法
CN115396752A (zh) 一种基于Redis的双平面采集数据方法及系统
JPH07152697A (ja) 疎結合計算機システム
JPH05225161A (ja) ネットワーク監視方式
JP2633351B2 (ja) 制御装置の故障検出機構
JPH05304528A (ja) 多重化通信ノード
JP7431034B2 (ja) コントローラ及び施設監視システム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant