CN104781792A - 判断在工业控制系统中的故障的冗余设备单元和方法,工业控制系统和包括冗余设备单元的工业系统 - Google Patents

判断在工业控制系统中的故障的冗余设备单元和方法,工业控制系统和包括冗余设备单元的工业系统 Download PDF

Info

Publication number
CN104781792A
CN104781792A CN201280076893.7A CN201280076893A CN104781792A CN 104781792 A CN104781792 A CN 104781792A CN 201280076893 A CN201280076893 A CN 201280076893A CN 104781792 A CN104781792 A CN 104781792A
Authority
CN
China
Prior art keywords
equipment
link
fault
control system
diagnostic message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201280076893.7A
Other languages
English (en)
Other versions
CN104781792B (zh
Inventor
许烨
阿克塞尔·洛贝克
迪特·汉高
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ABB Technology AG
Original Assignee
ABB T&D Technology AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ABB T&D Technology AG filed Critical ABB T&D Technology AG
Publication of CN104781792A publication Critical patent/CN104781792A/zh
Application granted granted Critical
Publication of CN104781792B publication Critical patent/CN104781792B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/28Routing or path finding of packets in data switching networks using route fault recovery
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/04Programme control other than numerical control, i.e. in sequence controllers or logic controllers
    • G05B19/042Programme control other than numerical control, i.e. in sequence controllers or logic controllers using digital processors
    • G05B19/0423Input/output
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/418Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
    • G05B19/4184Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM] characterised by fault tolerance, reliability of production system
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0224Process history based detection method, e.g. whereby history implies the availability of large amounts of data
    • G05B23/0227Qualitative history assessment, whereby the type of data acted upon, e.g. waveforms, images or patterns, is not relevant, e.g. rule based assessment; if-then decisions
    • G05B23/0237Qualitative history assessment, whereby the type of data acted upon, e.g. waveforms, images or patterns, is not relevant, e.g. rule based assessment; if-then decisions based on parallel systems, e.g. comparing signals produced at the same time by same type systems and detect faulty ones by noticing differences among their responses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0736Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in functional embedded systems, i.e. in a data processing system designed as a combination of hardware and software dedicated to performing a certain function
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2002Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant
    • G06F11/2007Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant using redundant communication media
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2205Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
    • G06F11/221Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested to test buses, lines or interfaces, e.g. stuck-at or open line faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/64Hybrid switching systems
    • H04L12/6418Hybrid transport
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/33Director till display
    • G05B2219/33315Failure detection and reconfiguration
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/34Director, elements to supervisory
    • G05B2219/34449Fault tolerant control, task from one microprocessor can be done by other
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/34Director, elements to supervisory
    • G05B2219/34477Fault prediction, analyzing signal trends
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2017Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where memory access, memory control or I/O control functionality is redundant

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Automation & Control Theory (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computer Hardware Design (AREA)
  • Manufacturing & Machinery (AREA)
  • Hardware Redundancy (AREA)
  • Safety Devices In Control Systems (AREA)

Abstract

本公开提供了一种用于判断在其中的故障的冗余设备单元、方法、工业控制系统和工业系统。冗余设备单元包括:第一设备,配置为通过串联的第一链路和第二链路与现场设备连接,第一设备配置为在使用中最初是主动的并发送第一诊断信息,第一诊断信息指示当第一设备为主动时,在第一链路和/或第二链路中是否有故障;以及第二设备,配置为通过串联的第二链路和第三链路与现场设备连接,第二设备配置为在使用中最初是被动的并接收来自第一设备的第一诊断信息;其中,当第一诊断信息指示在第一链路和/或第二链路有故障时,第一设备被切换进入被动且第二设备被切换进入主动并生成第二诊断信息,第二诊断信息指示当第二设备是主动的时在第二链路和/或第三链路中是否有故障,以及基于第一和第二诊断信息对关于工业控制系统的故障做出判断。

Description

判断在工业控制系统中的故障的冗余设备单元和方法,工业控制系统和包括冗余设备单元的工业系统
技术领域
本公开涉及自动控制领域,并且具体地涉及一种判断在工业控制系统中的故障的冗余设备单元和方法,以及工业控制系统和包括这样的冗余设备单元的工业系统。
背景技术
工业控制系统现在几乎应用在各个工业领域,如石油&天然气、化学、制药、造纸、矿业和金属。为了改进工业控制系统的可靠性,冗余设备用作工业控制系统的设备,如输入/输出模块(I/O模块),以使工业控制系统中的一个或多个设备的故障将不会影响到整个工业控制系统的运行。通常地,当存在故障时,工业控制系统中的主动设备(即与它相应的现场设备进行数据传输的设备)可以检测是否是关于连接在工业控制系统的主动设备和其现场设备之间的链路的故障或者是发生在主动设备本身的故障。一般地,若是检测到链路中的故障,如链路断开和短路,则检测到的故障通常被认为是与现场设备连接的即时链路中的故障,该即时链路通常由主动设备和它的冗余设备共享,因此,在这样的情况下,当前的工业控制系统在主动设备和它的冗余设备之间不执行切换,因为主动设备和它的冗余设备共享的链路的故障将导致无休止的切换。
但是,在连接在工业控制系统的主动设备和现场设备之间的链路中检测到的故障不仅包括在主动设备和它的冗余设备共享的链路中的故障,还包括主动设备和它的冗余设备非共享链路中的故障。现有技术对此没有给出想法,因此降低了故障修复的效率。
因此,需要提供一种技术以克服上述缺点。
发明内容
为了解决前述技术问题,根据本发明的一个方面,提供了一种用于判断工业控制系统的故障的冗余设备单元,包括:第一设备,配置为通过串联的第一链路和第二链路与现场设备连接,第一设备配置为在使用中最初是主动的并发送第一诊断信息,第一诊断信息指示当所述第一设备为主动时,在第一链路和/或第二链路中是否有故障;以及第二设备,配置为通过串联的第二链路和第三链路与现场设备连接,第二设备配置为在使用中最初是被动的并接收来自第一设备的第一诊断信息;其中,当第一诊断信息指示在第一链路和/或所述第二链路有故障时,第一设备被切换进入被动且所述第二设备被切换进入主动并生成第二诊断信息,第二诊断信息指示当第二设备是主动的时在第二链路和/或第三链路中是否有故障,以及基于第一和第二诊断信息对关于工业控制系统的故障做出判断。
根据本发明的另一个方面,提供了一种用于判断工业控制系统的故障的方法,其中工业控制系统包括第一设备和第二设备,第一设备通过串联的第一链路和第二链路与现场设备连接,第二设备通过串联的第二链路和第三链路与现场设备连接,第一设备配置为在使用中最初是主动的,以及第二设备配置为在使用中最初是被动的,该方法包括以下步骤:从第一设备获取第一诊断信息,第一诊断信息指示当所述第一设备为主动时,在第一链路和/或第二链路中是否有故障;在第一诊断信息指示在第一链路和/或第二链路中有故障时,切换第一设备进入被动并且切换第二设备进入主动;从第二设备获取第二诊断信息,第二诊断信息指示当第二设备为主动时,在第二链路和/或第三链路中是否有故障;当第二诊断信息指示在第二链路和/或第三链路中没有故障时,判断在第一链路中有故障;以及当第二诊断信息指示在第二链路和/或第三链路中有故障时,认作是在第二链路中有故障。
根据本发明的另一个方面,提供了一种用于判断在其中的故障的工业控制系统,其中所述控制系统包括至少一个上述冗余设备单元。
根据本发明的另一个方面,提供了一种用于判断在其中的故障的工业系统,该系统包括上述工业控制系统。
与现有技术相比,根据本公开的冗余设备单元、工业控制系统和工业系统可以判断故障是来自冗余设备单元的两个设备共享的链路还是来自主动设备的非共享链路,并由此提高故障修复的效率,若检测到故障来自主动设备的非共享链路,则消除了失去现场控制的风险,以及阻止了冗余设备单元的两个设备之间无休止的切换。
根据以下的说明书和附图,本发明的这些以及其它方面及特征将变得更明显。在说明书和附图中,本发明的具体实施例已经详细公开,并且本发明的原理可以利用的许多方式已经被指出。应当理解本发明的范围不限于此,本发明旨在包含不偏离所附权利要求的范围和精神的各种修改、变化和等效替换。
应该强调的是,如在文中使用的措辞“包括”,以及该词的变形,指的是存在的特征、整体、步骤或部件但不排除存在或添加一个或多个其它特征、整体、步骤或部件。
参考附图将会更好地理解本发明许多方面。在附图中的部件不是按比例描绘的而只是旨在阐明本发明的原理。为了便于本发明某些部分的阐述和说明,在附图中的相应特征可以被放大,也就是,根据本发明这些部件可以被制成比在实际制造的示例的装置中的其它部件要大。在附图中描述的元件和特征或本发明的实施例可以结合在一个或多个其它附图或实施例中说明的元件和特征。另外,在附图中的相似的参考标记表示在几个附图中的相应部件并且可以表示用在一个以上的实施例中的相应部件。
附图说明
本发明相关实施例已在附图中说明,这些附图组成了具体实施例的一部分并用来连同说明书一起进一步详细地阐明了本发明的原理,其中:
图1示出根据本公开实施例的冗余设备单元的示意图。
图2示出如图1所示的冗余设备单元1的具体实施的结构图。
图3是根据本公开实施例的判断工业控制系统的故障的方法的过程的流程图。
具体实施方式
下面将参考附图描述本发明,并且应注意的是,以下描述的实施例仅仅是为了便于本发明的理解而不是以任何方式限制本发明。
图1示出根据本发明实施例的冗余设备单元的示意图。
如图1所示,用于判断工业控制系统中的故障的冗余设备单元1包括第一设备10和第二设备20,第一设备10配置为通过串联的第一链路11和第二链路12与现场设备30连接,第二设备20配置为通过串联的第二链路12和第三链路13与现场设备30连接。第一设备10配置为在使用中最初是主动的并发送第一诊断信息,第一诊断信息指示当第一设备10为主动时在第一链路11和/或第二链路12中是否有故障。第二设备20配置为在使用时最初是被动的并接收来自第一设备10的第一诊断信息。当第一诊断信息指示在第一链路11和/或第二链路12有故障时,第一设备11被切换成被动,以及第二设备12被切换成主动并生成第二诊断信息,指示当第二设备11是主动的时在第二链路12和/或第三链路13是否有故障,并基于第一和第二诊断信息对关于工业控制系统的故障做出判断。
如图1所示,第二链路12由冗余设备单元1的第一设备10和第二设备20共享,用于与现场设备30进行数据传输。
通常,初始主动设备是最初用于与现场设备进行数据传输的设备,并且初始被动设备是最初用作初始主动设备的冗余设备的设备,当连接在主动设备和现场设备之间的链路中有故障时,冗余设备可以接管主动设备的操作。根据一实施例,第一设备10配置为在使用中最初是主动的,并且第二设备20配置为在使用中最初是被动的。
根据本公开的实施例,第一设备10配置为发送第一诊断信息,以及第二设备20配置为从第一设备10接收第一诊断信息。因为只限定主动设备与现场设备通信,所以连接在该设备和现场设备之间的链路中的故障只能在主动设备中检测到。也就是说,只有在第一设备10是主动的时才可以获得第一诊断信息。
参考图1,根据本公开的实施例,当第一诊断信息指示在第一链路11和/或第二链路12中有故障时,在第一设备10和第二设备20之间执行切换,也就是,第一设备10被切换到被动,而第二设备12被切换到主动。根据本公开的一个实施例,当检测到故障时,切换可以由第一设备10发起。但是,本公开不限于此,本领域技术人员可以理解,其它设备(如连接到第一设备10的计算机)也可以发起第一设备10和第二设备20的切换,只要它可以从第一设备10获得第一诊断信息。
因为第二设备12变成主动的,它能够判断连接在第二设备20和现场设备30之间的链路中是否有故障,即,在第二链路12和/或第三链路13中是否有故障,以及第二诊断信息可以由第二设备20基于此判断来生成,第二诊断信息指示当第二设备20是主动的时在第二链路12和/或第三链路13中是否有故障。具体地,若在被切换到被动后第二设备20正常工作,则生成指示在第二链路12和第三链路13中没有故障的第二诊断信息;否则生成指示在第二链路12和/或第三链路13中有故障的第二诊断信息。根据本公开的一个实施例,接收到的第一诊断信息和生成的第二诊断信息都可以存储在第二设备20的存储器中。
当第二设备20从第一设备10获得第一诊断信息并且第二诊断信息由第二设备20自身生成时,可以基于第一诊断信息和第二诊断信息对关于在工业控制系统中的故障做出判断。
具体地,若第二诊断信息指示在第二链路12和第三链路13中没有故障,则基于第一诊断信息和第二诊断信息,第二设备20可以做出在第一链路11有故障的判断,其中第一诊断信息指示在第一链路11和/或第二链路12中有故障并且第二诊断信息指示在第二链路12和/或第三链路13中没有故障。
若第二诊断信息指示在第二链路12和/或第三链路13中有故障,则基于第一诊断信息和第二诊断信息,第二设备20可以判断第二链路12中有故障,其中第一诊断信息指示在第一链路11和/或第二链路12中有故障并且第二诊断信息指示在第二链路12和/或第三链路13中有故障。需要说明的是,尽管理论上关于故障是否在第一链路11和/或第二链路12和/或第三链路13中存在几种可能性,基于第一链路和第二链路两者有故障的可能性相当低的事实,可以认为在第二链路12中有故障。
尽管第二设备20被描述为做出关于检测到的故障的判断的设备,但是本公开不限于此。本领域的技术人员应理解,所述判断可以由如与第一设备10和第二设备20连接的计算机做出,只要它可以分别或共同地从第一设备10和第二设备20获得第一诊断信息和第二诊断信息。
根据本公开的优选实施例,为了便于基于第一诊断信息和第二诊断信息的故障判断,由第一设备10发送的第一诊断信息进一步包括指示第一设备是否是主动设备或者是被动设备的信息。类似地,由第二设备生成的第二诊断信息进一步包括指示第二设备20是否是主动设备或者是被动设备的信息。
下面的表1示出根据本公开优选实施例的第一和第二诊断信息的数据格式。如表1所示,诊断信息存储在4比特寄存器中,其中D1-D0的比特位是用于指示设备的操作状态,也就是,连接在设备和现场设备之间的链路中的是否有故障和/或在设备自身中是否有故障,D2的比特位用于指示设备是否是主动设备或者被动设备,以及D3的比特位是保留位。
表1
根据本公开的实施例,在比特位D2中“0”可以指示设备是主动设备,在比特位D2中的“1”可以指示设备是被动设备,在比特位D1-D0中的“00”可以指示在设备中没有故障或者在连接在设备与它的现场设备之间的链路中没有故障,在比特位D1-D0中的“01”可以指示设备自身有故障;在比特位D1-D0中的“10”可以指示在连接在设备与现场设备之间的链路中有故障并且该故障是短路故障;在比特位D1-D0中的“11”可以指示在设备与现场设备之间连接的链路中有故障并且该故障是链路断开故障。因此,若表示第一诊断信息的比特位D2-D0示出“010”,则它指示第一设备是主动设备并且在第一链路和/或第二链路中存在短路的故障。上述诊断信息的配置仅仅是示例性的,本领域技术人员应理解其它配置也可以用作诊断信息。
根据上述实施例,基于采用上述配置的第一和第二诊断信息,可以更容易对关于工业控制系统的故障做出判断。
根据本发明优选实施例,第一设备10进一步配置为判断在第一设备10被切换到被动且第二设备20被切换到主动之前,第二设备20是否准备接管第一设备10的操作。根据本公开的实施例,若第二设备20检测到在自身、第二链路和/或第三链路上有故障,则判断第二设备20还不准备接管第一设备10的操作;否则,判断第二设备20准备接管第一设备10的操作。根据本公开另一个实施例,还可以基于在之前第二设备20是主动的时获得的第二设备20的第二诊断信息判断第二设备20是否准备接管第一设备10的操作。第二设备20的第二诊断信息可以被更新,与将在下文描述的更新后的第一诊断信息类似。
例如,当D2-D0比特位表示的诊断信息如上面例子所述时,若第二设备20的诊断信息是“100”,则它指的是在第二设备20自身中或者在连接第二设备20和现场设备30之间的链路中没有故障并且第二设备20准备接管第一设备10的操作;若第二设备20的诊断信息是“101”,则它指的是在第二设备20自身中有故障并且第二设备20不准备接管第一设备10的操作;以及若第二设备20的诊断信息是“110”或“111”,则它指的是在第二链路12和/或第三链路13中有故障并且第二设备20还不准备接管第一设备10的操作。此处尽管第二设备20处于被动状态,其操作状态是从其之前紧邻的主动状态获得的,当第二设备20被切换到被动状态时仅更新冗余状态。
若判断第二设备20还不准备接管第一设备10的操作,则将不执行第一设备10和20的切换。
若判断第二设备20准备接管第一设备10的操作,则将执行第一设备10和第二设备20的切换并且基于第一诊断信息和由第二设备20生成的新的第二诊断信息对工业控制系统的故障做出判断。
尽管第一设备10被描述为判断第二设备20是否准备接管第一设备10的操作的装置,本公开不限于此。本领域技术人员应理解,还可以由例如与第二设备20连接的计算机来做出判断,只要计算机能够获得第二设备20的诊断信息。
因为对第二设备20是否准备接管第一设备10的操作做出判断,所以当判断第二设备20不准备接管第一设备10的操作时避免了第一设备10和第二设备20不必要的切换。
在实际操作中,考虑到第一链路和第二链路同时具有故障是不可能的(尽管具有理论上的可能性),因此,若第一诊断信息指示第一链路和/或第二链路有故障,则在第二链路有故障的情况下第一链路将被认为没有故障。
因此,根据本公开优选的实施例,第二设备20进一步配置为在第二链路12中的故障被修复时发送第二诊断信息,并且第一设备10进一步配置为接收第二诊断信息并根据接收到的第二诊断信息更新第一诊断信息。
通过使用具有上述配置的冗余设备单元1,在当第二链路中的故障被修复时生成指示第二链路12和/或第三链路13中没有故障的新的诊断信息的情况下,第二设备20发送指示第二链路12和/或第三链路13中没有故障的新的诊断信息,以及第一设备10从第二设备20接收新的诊断信息并且基于从第二设备20接收到的新的诊断信息更新自身的诊断信息为包括指示在第一链路和/或第二链路中没有故障的信息。因此,如果在第二设备20和/或在第二设备20与现场设备30之间连接的链路中存在任何故障,则第一设备10准备接管第二设备20的操作。
根据上述实施例,第一设备10可以基于从第二设备20接收到的新的诊断信息更新第一诊断信息,该新的诊断信息指示第二链路12和/或第三链路13中没有故障,从而当检测到第二设备20中有新故障时促成下一次切换(如上文所述)。
图2示出了如图1所示的冗余设备单元1的具体实施例的结构图。
如图2所示,根据本公开的实施例,冗余设备单元1中的第一设备10和第二设备20中的每一个提供有串联通信接口(SCI),并且第一设备10通过第一设备10的串联通信接口发送第一诊断信息,并且第二设备20通过第二设备20的串联通信接口接收第一诊断信息。
通过提供串联通信接口来配置冗余设备单元1中的第一设备10和第二设备20仅仅是一个例子,本公开不限于此。第一设备10和第二设备20还可以通过CAN总线等发送和接收诊断信息,只要第二设备20可以接收来自第一设备10的第一诊断信息。
根据本公开的实施例,第一诊断信息还有第二诊断信息可以被不仅循环发送而且事件驱动的方式发送。例如,冗余设备单元1的第一设备10不仅可以以预定的周期发送诊断信息而且可以在检测到任何故障时发送诊断信息。
根据本公开的优选实施例,第一和第二设备可以是输入/输出模块。
根据本公开的优选实施例,第一链路11和第二链路13可以是电缆,如数据总线电缆(DB电缆),并且第二链路12可以是电缆,如现场电缆。但是,本公开不限于此,第一链路11、第二链路12和第三链路13中的任一个或任意两个或全部可以是如无线路径。相应地,在第一链路11中的故障可以是DB电缆的故障,第二链路12中的故障可以是现场电缆的故障。根据本公开的另一个实施例,在第一链路11中的故障可以是DB电缆的故障和/或现场电路的故障。
另外,本公开的另一个实施例还提供了判断工业控制系统的故障的方法,工业控制系统包括第一设备和第二设备,第一设备通过串联的第一链路和第二链路与现场设备连接,第二设备通过串联的第二链路和第三链路与现场设备连接,第一设备10配置为在使用中最初是主动的,以及第二设备配置为在使用中最初是被动的。参考图3描述判断工业控制系统的故障的方法的示例性过程。
如图3所示,根据本公开判断工业控制系统的故障的方法的过程以步骤S310开始,然后执行步骤S320。
在步骤S320中,从第一设备获取第一诊断信息,第一诊断信息指示当第一设备为主动时在第一链路和/或第二链路中是否有故障。参考图1和图2所描述的,可以由第二设备20执行这个步骤S320。但是,本公开不限于此,本领域技术人员会理解该步骤也可以由其它设备(如与第一设备10和第二设备20连接的计算机)来执行。然后,该过程进入步骤S330。
在步骤S330,对关于第一诊断信息是否指示第一链路和/或第二链路中有故障做出判断。例如,这个步骤S330可以由如参考图1和图2所描述的第一设备10来执行。若判断第一诊断信息指示第一链路和/或第二链路中有故障,则过程进入步骤S340,否则过程返回步骤S320。
在步骤S340中,当判断第一诊断信息指示第一链路和/或第二链路中有故障(在步骤S330中为“是”)时,第一设备从主动被切换到被动而第二设备从被动被切换到主动。这个步骤S340可以由如参考图1和图2所描述的第一设备10来执行。但是,本公开不限于此,本领域技术人员会理解该步骤也可以由其它设备(如与第一设备和该设备连接的计算机)来执行。然后,过程进入步骤S350。
因为在步骤S340中,第二设备被切换到主动,所以能够获得第二信息,第二信息指示在第二链路和/或第三链路中是否有故障。因此,在步骤S350中,第二诊断信息是从第二设备获取的。这个步骤S350可以由如参考图1和图2所描述的第二设备20来执行。但是,本公开不限于此,本领域技术人员会理解该步骤也可以由其它设备(如与第一设备和该设备连接的计算机)来执行。然后,过程进入步骤S360。
在步骤S360中,对关于第二诊断信息是否指示第二链路和/或第三链路中有故障做出判断。若第二诊断信息指示第二链路和/或第三链路中有故障,则过程进入步骤S370。否则,过程进入步骤S380。
在步骤S370中,当判断第二诊断信息为指示第二链路和/或第三链路中有故障,可以认为第二链路中有故障。这个步骤S370可以由如参考图1和图2所描述的第二设备20来执行。但是,本公开不限于此,本领域技术人员会理解该步骤也可以由其它设备(如与第一设备10和设备20连接的计算机)来执行。然后,过程进入步骤S390。
在步骤S380,当判断第二诊断信息为指示第二链路和/或第三链路中没有故障,可以确定第一链路中有故障。这个步骤S370可以由如参考图1和图2所描述的第二设备20来执行。但是,本公开不限于此,本领域技术人员会理解该步骤也可以由其它设备(如与第一设备10和设备20连接的计算机)来执行。然后,该过程进入步骤S390。
根据本公开实施例的方法的过程以步骤390结束。
根据本公开的优选实施例,该方法进一步包括:在切换第一设备进入被动并切换第二设备进入主动之前判断第二设备是否准备接管第一设备的操作;以及若判断第二设备为准备接管第一设备的操作,则切换第一设备进入被动并切换第二设备进入主动。
另外,本公开实施例进一步提供了判断在其中的故障的工业控制系统,该工业控制系统包括至少一个如参考图1和图2所述的冗余设备单元。
本公开实施例进一步提供用于判断在其中的故障的工业系统,该工业系统包括如上所述的工业控制系统和如参考图1所述的现场设备。
与现有技术相比,根据本公开实施例的冗余设备单元和包括冗余设备单元的工业控制系统具有下列优势中的至少一项或多项:
第一,当检测到故障时,第一设备从主动被切换到被动并且第二设备从被动被切换到主动,因此与不执行切换的现有技术相比,如果故障来自第一设备的第一链路,将不会失去现场控制。
第二,因为第二设备可以接收来自第一设备的第一诊断信息,所以能够判断故障是否来自冗余的两个设备共享的链路还是来自非共享链路,由此根据故障的出处容易修复故障。而且,在本公开中,若故障来自两个设备的共享链路,则将不会继续执行切换,以便避免无休止的切换。
已经参考附图详细描述了本公开的优选实施例。但是,本公开的技术范围不限于上述实施例。在不偏离所附权利要求限定的技术范围和精神情况下可以做出各种修改和变化,对本领域的技术人员来说是显然的。因此,应当理解这些修改和变化应包含在本公开的技术范围之内。
在本公开中,在流程图和时序图中描绘的步骤包括根据本公开描述的顺序按时间序列执行的进程以及不按时间序列执行而是并行或单独执行的进程。在这些按时间序列执行的步骤中,可以适当地根据需要改变顺序。

Claims (15)

1.一种用于判断工业控制系统的故障的冗余设备单元,包括:
第一设备,配置为通过串联的第一链路和第二链路与现场设备连接,所述第一设备配置为最初在使用中是主动的并发送第一诊断信息,所述第一诊断信息指示当所述第一设备为主动时在所述第一链路和/或所述第二链路中是否有故障;以及
第二设备,配置为通过串联的所述第二链路和第三链路与所述现场设备连接,所述第二设备配置为最初在使用中是被动的并接收来自所述第一设备的所述第一诊断信息;
其中,当所述第一诊断信息指示在所述第一链路和/或所述第二链路中有故障时,所述第一设备被切换进入被动且所述第二设备被切换进入主动并生成第二诊断信息,所述第二诊断信息指示当所述第二设备是主动的时在所述第二链路和/或所述第三链路中是否有故障,以及基于所述第一和第二诊断信息对关于所述工业控制系统的故障做出判断。
2.根据权利要求1的所述冗余设备单元,其中当所述第二诊断信息指示在所述第二链路和/或第三链路中有故障时,认作是在所述第二链路中有故障。
3.根据权利要求1或2的所述冗余设备单元,其中当所述第二诊断信息指示在所述第二链路和第三链路中没有故障时,判断所述第一链路中有故障。
4.根据权利要求1或2的所述冗余设备单元,其中所述第二设备进一步配置为当所述第二链路中的故障被修复时发送所述第二诊断信息,以及所述第一设备进一步配置为接收所述第二诊断信息并根据接收到的第二诊断信息更新所述第一诊断信息。
5.根据权利要求3或4的所述冗余设备单元,其中所述第一诊断信息进一步包括指示所述第一设备是否是主动或是被动的信息,以及所述第二诊断信息进一步包括指示所述第二设备是否是主动或是被动的信息。
6.根据权利要求5的所述冗余设备单元,其中所述第一设备进一步配置为判断在所述第一设备被切换进入被动和所述第二设备被切换进入被动之前所述第二设备是否准备接管所述第一设备的操作,以及若所述第二设备被判断为准备接管所述第一设备的操作,则所述第一设备被切换进入被动和所述第二设备被切换进入被动。
7.根据权利要求1-6中任一项的所述冗余设备单元,其中所述第一设备和所述第二设备中的各个设备设有串联通信接口,并且所述第一设备通过所述第一设备的所述串联通信接口发送所述第一诊断信息,以及所述第二设备通过所述第二设备的串联通信接口接收所述第一诊断信息。
8.根据权利要求7的所述冗余设备单元,其中所述第一链路中的故障包括现场电路中的故障和/或数据总线电缆中的故障,以及所述第二链路中的故障包括现场电缆的故障。
9.根据权利要求8的所述冗余设备单元,其中所述第一链路、所述第二链路和所述第三链路中的一条或多条链路为电缆。
10.根据权利要求9的所述冗余设备单元,其中所述第一设备和所述第二设备是输入/输出模块。
11.一种用于判断工业控制系统的故障的方法,其中所述工业控制系统包括第一设备和第二设备,所述第一设备通过串联的第一链路和第二链路与现场设备连接,所述第二设备通过串联的第二链路和第三链路与现场设备连接,所述第一设备配置为最初在使用中是主动的,以及所述第二设备配置为最初在使用中是被动的,所述方法包括以下步骤:
从所述第一设备获取第一诊断信息,所述第一诊断信息指示当所述第一设备为主动时,在所述第一链路和/或所述第二链路中是否有故障;
在所述第一诊断信息指示在所述第一链路和/或所述第二链路中有故障时,切换所述第一设备进入被动并且切换所述第二设备进入主动;
从所述第二设备获取第二诊断信息,所述第二诊断信息指示当所述第二设备为主动时,在所述第二链路和/或所述第三链路中是否有故障;
当所述第二诊断信息指示在所述第二链路和/或所述第三链路中没有故障时,判断在所述第一链路中有故障;以及
当所述第二诊断信息指示在所述第二链路和/或所述第三链路中有故障时,认作是在所述第二链路中有故障。
12.根据权利要求11的所述方法,所述方法进一步包括:
在切换所述第一设备进入被动并切换所述第二设备进入主动之前,判断所述第二设备是否准备接管所述第一设备的操作;以及
若所述第二设备被判断为准备接管所述第一设备的操作,则切换所述第一设备进入被动并切换所述第二设备进入主动。
13.一种用于判断在其中的故障的工业控制系统,其中所述工业控制系统包括至少一个根据权利要求1-10中任一项所述的冗余设备单元。
14.根据权利要求13的所述工业控制系统,其中所述工业控制系统为过程控制系统,所述第一设备和所述第二设备用于收集来自现场设备的数据或者控制所述现场设备。
15.一种用于判断在其中的故障的工业系统,包括根据权利要求13或14的工业控制系统和现场设备。
CN201280076893.7A 2012-11-07 2012-11-07 判断在工业控制系统中的故障的冗余设备单元和方法,工业控制系统和包括冗余设备单元的工业系统 Active CN104781792B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2012/084232 WO2014071575A1 (en) 2012-11-07 2012-11-07 Redundancy device unit and method for determining fault in industrial control system, industrial control system and industrial system comprising redundancy device unit

Publications (2)

Publication Number Publication Date
CN104781792A true CN104781792A (zh) 2015-07-15
CN104781792B CN104781792B (zh) 2016-06-29

Family

ID=50683918

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280076893.7A Active CN104781792B (zh) 2012-11-07 2012-11-07 判断在工业控制系统中的故障的冗余设备单元和方法,工业控制系统和包括冗余设备单元的工业系统

Country Status (4)

Country Link
US (1) US9929944B2 (zh)
EP (1) EP2917836B1 (zh)
CN (1) CN104781792B (zh)
WO (1) WO2014071575A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112995726A (zh) * 2019-12-12 2021-06-18 杭州海康威视数字技术股份有限公司 显示系统和热备切换方法以及视频控制装置

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6333056B2 (ja) * 2014-05-14 2018-05-30 APRESIA Systems株式会社 中継システムおよびスイッチ装置
CN107171820B (zh) * 2016-03-08 2019-12-31 北京京东尚科信息技术有限公司 信息传输、发送、获取方法和装置
CN106094742A (zh) * 2016-05-31 2016-11-09 苏州时代华理电气有限公司 一种安全仪表控制系统
CN106647351A (zh) * 2016-10-19 2017-05-10 浙江中控技术股份有限公司 一种冗余切换电路
US10958567B1 (en) * 2019-03-29 2021-03-23 Juniper Networks, Inc. Controlling paths in a network via a centralized controller or network devices
CN112526979B (zh) * 2020-12-16 2023-06-09 中国兵器装备集团自动化研究所 一种多重冗余架构的串行通信接口诊断系统及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040260481A1 (en) * 2003-02-01 2004-12-23 Peter Heiligensetzer Method for monitoring a machine and such a machine, particularly a robot
CN101241359A (zh) * 2007-02-06 2008-08-13 Abb研究有限公司 用来监视工业机器人的状况的方法和控制系统
CN101286954A (zh) * 2007-02-13 2008-10-15 Abb研究有限公司 用于机器人的远程诊断系统
CN101840233A (zh) * 2010-04-29 2010-09-22 深圳市共济科技有限公司 一种设备故障检测装置及设备故障检测方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07253896A (ja) * 1994-03-15 1995-10-03 Fujitsu Ltd 警報処理方式
US6178327B1 (en) * 1998-05-08 2001-01-23 Motorola, Inc. Method and apparatus for providing fault tolerance in frequency reuse wireless communication systems
DE19815097C2 (de) 1998-04-03 2002-03-14 Siemens Ag Busmasterumschalteinheit
DE19842593C2 (de) 1998-09-17 2001-05-03 Abb Patent Gmbh Verfahren zum Betrieb eines Busmasters an einem Feldbus
US6742136B2 (en) * 2000-12-05 2004-05-25 Fisher-Rosemount Systems Inc. Redundant devices in a process control system
US7085225B2 (en) * 2001-09-27 2006-08-01 Alcatel Canada Inc. System and method for providing detection of faults and switching of fabrics in a redundant-architecture communication system
US20080123522A1 (en) 2006-07-28 2008-05-29 David Charles Elliott Redundancy coupler for industrial communications networks
ITTO20090182A1 (it) * 2009-03-11 2010-09-12 Fond Istituto Italiano Di Tecnologia Procedimento per la generazione di relazioni di ridondanza analitica per la diagnosi di sistemi
US20100325719A1 (en) * 2009-06-19 2010-12-23 Craig Stephen Etchegoyen System and Method for Redundancy in a Communication Network
US20140244192A1 (en) * 2013-02-25 2014-08-28 Inscope Energy, Llc System and method for providing monitoring of industrial equipment

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040260481A1 (en) * 2003-02-01 2004-12-23 Peter Heiligensetzer Method for monitoring a machine and such a machine, particularly a robot
CN101241359A (zh) * 2007-02-06 2008-08-13 Abb研究有限公司 用来监视工业机器人的状况的方法和控制系统
CN101286954A (zh) * 2007-02-13 2008-10-15 Abb研究有限公司 用于机器人的远程诊断系统
CN101840233A (zh) * 2010-04-29 2010-09-22 深圳市共济科技有限公司 一种设备故障检测装置及设备故障检测方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112995726A (zh) * 2019-12-12 2021-06-18 杭州海康威视数字技术股份有限公司 显示系统和热备切换方法以及视频控制装置
CN112995726B (zh) * 2019-12-12 2022-09-30 杭州海康威视数字技术股份有限公司 显示系统和热备切换方法以及视频控制装置

Also Published As

Publication number Publication date
US9929944B2 (en) 2018-03-27
EP2917836A1 (en) 2015-09-16
US20150295817A1 (en) 2015-10-15
CN104781792B (zh) 2016-06-29
EP2917836B1 (en) 2017-09-20
WO2014071575A1 (en) 2014-05-15
EP2917836A4 (en) 2016-07-06

Similar Documents

Publication Publication Date Title
CN104781792A (zh) 判断在工业控制系统中的故障的冗余设备单元和方法,工业控制系统和包括冗余设备单元的工业系统
CN107070731B (zh) 一种主从仲裁方法及系统
CN102882704B (zh) 一种issu的软重启升级过程中的链路保护方法和设备
CN107957692B (zh) 控制器冗余方法、装置及系统
CN103139033B (zh) 单主通信控制总线主设备冗余切换方法
CN103440188A (zh) 一种pcie硬件故障的检测方法及装置
CN104461765A (zh) 基于版本校验的联锁系统数据准确性检测方法
CN103678031A (zh) 二乘二取二冗余系统及方法
JP2006245956A (ja) 通信機器用の接続装置
CN111399879A (zh) 一种cpld的固件升级系统和方法
JP5706347B2 (ja) 二重化制御システム
CN111273577A (zh) 设施监视系统及设施监视系统的通信方法
CN103885921A (zh) Flash存储器、fpga芯片以及fpga芯片的配置方法
CN106446311B (zh) Cpu告警电路及告警方法
US20160156501A1 (en) Network apparatus with inserted management mechanism, system, and method for management and supervision
CN109219105B (zh) 路由切换方法以及路由切换系统
CN110497941A (zh) 热备冗余系统工作装置
CN102656528A (zh) 双重系统控制装置
CN106814643A (zh) 一种双机热备的控制方法及系统
CN102790814B (zh) 一种媒体接入控制地址确定方法、相关装置及系统
CN105306256B (zh) 一种基于VxWorks设备的双机热备实现方法
JP2009187284A (ja) ボード間接続監視装置
JP5989193B1 (ja) ソフトウェア更新システム
JP2008217188A (ja) 障害復旧作業支援システム及び障害復旧作業支援方法
CN202995449U (zh) 一种测试装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20180507

Address after: Baden, Switzerland

Patentee after: ABB TECHNOLOGY LTD.

Address before: Zurich

Patentee before: ABB T & D Technology Ltd.