CN111752139A - 不具有专用硬件的冗余控制器或输入-输出网关 - Google Patents

不具有专用硬件的冗余控制器或输入-输出网关 Download PDF

Info

Publication number
CN111752139A
CN111752139A CN202010221366.7A CN202010221366A CN111752139A CN 111752139 A CN111752139 A CN 111752139A CN 202010221366 A CN202010221366 A CN 202010221366A CN 111752139 A CN111752139 A CN 111752139A
Authority
CN
China
Prior art keywords
controller
network
computing platforms
gateway
hardware
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010221366.7A
Other languages
English (en)
Inventor
保罗·弗朗西斯·麦克劳克林
杰森·托马斯·乌尔索
詹姆斯·迈克尔·施莱德
约翰·罗萨-比安
诺尔曼·斯旺森
杰思罗·F·斯坦曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honeywell International Inc
Original Assignee
Honeywell International Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honeywell International Inc filed Critical Honeywell International Inc
Publication of CN111752139A publication Critical patent/CN111752139A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1456Hardware arrangements for backup
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2028Failover techniques eliminating a faulty processor or activating a spare
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B9/00Safety arrangements
    • G05B9/02Safety arrangements electric
    • G05B9/03Safety arrangements electric with multiple-channel loop, i.e. redundant control systems
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/04Programme control other than numerical control, i.e. in sequence controllers or logic controllers
    • G05B19/042Programme control other than numerical control, i.e. in sequence controllers or logic controllers using digital processors
    • G05B19/0428Safety, monitoring
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/418Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS], computer integrated manufacturing [CIM]
    • G05B19/4184Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS], computer integrated manufacturing [CIM] characterised by fault tolerance, reliability of production system
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/418Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS], computer integrated manufacturing [CIM]
    • G05B19/4185Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS], computer integrated manufacturing [CIM] characterised by the network communication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/142Reconfiguring to eliminate the error
    • G06F11/1423Reconfiguring to eliminate the error by reconfiguration of paths
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2002Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant
    • G06F11/2007Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant using redundant communication media
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2038Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with a single idle spare processing component
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2048Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share neither address space nor persistent storage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/42Bus transfer protocol, e.g. handshake; Synchronisation
    • G06F13/4204Bus transfer protocol, e.g. handshake; Synchronisation on a parallel bus
    • G06F13/4221Bus transfer protocol, e.g. handshake; Synchronisation on a parallel bus being an input/output bus, e.g. ISA bus, EISA bus, PCI bus, SCSI bus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5011Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/66Arrangements for connecting between networks having differing types of switching systems, e.g. gateways
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/04Programme control other than numerical control, i.e. in sequence controllers or logic controllers
    • G05B19/042Programme control other than numerical control, i.e. in sequence controllers or logic controllers using digital processors
    • G05B19/0421Multiprocessor system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1658Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2097Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements maintaining the standby controller/processing unit updated
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/5011Pool

Abstract

本发明题为“不具有专用硬件的冗余控制器或输入‑输出网关”。本公开提供了一种容错过程控制的方法,该方法包括在工业处理设施(IPF)中提供包括工厂级网络(170)的网络过程控制系统(600),工厂级网络将服务器(180)耦接到计算平台(621‑624),每个计算平台包括计算硬件(171)和存储器(172)用以托管用于同时支持至少一个过程控制器和另一过程控制器或输入/输出(I/O)网关的至少一个软件应用程序。计算平台通过专用路径冗余网络(260)彼此耦接以提供硬件资源池。至少一些计算平台通过I/O网状网络(240)直接耦接到多个I/O设备(145),多个I/O设备耦接到现场设备(150),现场设备耦接到处理装置(160)。在检测到硬件资源池中的至少一个故障设备时,通过专用路径冗余网络将来自硬件资源池中的计算平台中的另一计算平台处的另一设备的针对故障设备的备份投入服务。

Description

不具有专用硬件的冗余控制器或输入-输出网关
技术领域
本发明所公开的实施方案涉及网络控制系统,更具体地涉及网络控制系统中的冗余控制器或冗余输入/输出(I/O)网关设备。
背景技术
工业控制系统的故障可能导致昂贵的停机时间。在重新启动过程以及因此类故障而造成的实际生产损失方面会涉及到费用。如果该过程被设计为在没有监督人员或服务人员的情况下运行,则过程控制系统中的所有部件通常都需要容错。
容错工业过程控制系统可采用1:1冗余系统来同步存储器中的中央处理单元(CPU)数据,其中在与主过程控制器相关联的主存储器和与专用辅过程控制器相关联的辅存储器两者中以相同方式使用初始存储器传输然后更新对主存储器映像的跟踪更改来维护存储器。如本领域中所已知的,存储器高速缓存(高速缓存)是与低速随机存取存储器(RAM)一起使用的高速缓冲器。不具有高速缓存的CPU将所有更改(数据和地址)表达给它们被捕获处的RAM总线。具有透写式高速缓存的CPU以类似的方式工作。相比之下,具有常用于对过程更改快速作出响应的过程控制系统的高速缓存的CPU可能不支持透写式高速缓存。
传统的高可用性控制系统冗余使用具有1:1备份控制器的主控制器。图1示出了常规的工业控制系统100,其包括被示出为冗余控制器平台1 120和冗余控制器平台2 130的冗余过程控制器布置,每个冗余控制器平台具有一对过程控制器,其中每个过程控制器包括含有至少一个处理器的计算硬件171和相关联的存储器172。在冗余控制器平台1 120中,存在主控制器122和专用备份(冗余)辅控制器127,并且类似地,在冗余控制器平台130中,存在主控制器132和辅控制器137。冗余过程控制器1 120和2 130均被示出为通过输入/输出(I/O)网状网络140耦接以控制处理装置160,该处理装置被示出为通过现场I/O设备145和现场设备150耦接。示出了专用于数据传输以对每个冗余控制器对中的控制器进行同步的专用路径网络125和135。还示出了控制器120、130与一个或多个服务器180、至少一个人机界面(HMI)185之间的工厂级网络170(诸如基于以太网电缆)。
如图1中的常规工业控制系统100中所示的传统嵌入式控制器冗余通过以任何所需的配置部署控制器来増加控制器的可用性,其中一个控制器作为主控制器,另一控制器作为准备在主控制器发生故障时承担过程控制的备份控制器。因此,图1所示的两个冗余控制器对120和130总共需要四个控制器,每个控制器包括专用计算硬件171。
诸如远程终端单元(RTU)或边缘网关之类的I/O网关设备也可被配置具有设备冗余。RTU是一种微处理器控制的电子设备,它将物理世界中的设备或装置连接到分布式控制系统或数据采集与监视控制(SCADA)系统。边缘网关是一种用于组织虚拟设备上下文(VDC)网络的虚拟路由器,其可配置为提供网络服务,例如动态主机配置协议(DHCP)、防火墙、网络地址转换(NAT)、静态路由、虚拟专用网络(VPN)和负载均衡。尽管从技术上讲,I/O设备与RTU是不同的,但RTU可包括I/O设备作为组件的一部分,并因此可用作I/O设备。与RTU相比,I/O设备通常更简单,并且不具有用于远程独立数据采集传输的遥测功能。
发明内容
提供本发明内容以介绍简化形式的公开概念的简要选择,其在下文包括附图的具体实施方式中被进一步描述。该发明内容不旨在限制所要求保护的主题的范围。
本发明所公开的实施方案认识到,包括冗余过程控制器布置的工业控制系统(诸如图1中所示的常规工业控制系统100)的一个重大问题是传统冗余控制器均需要专用备份控制器,其中在冗余过程控制器的情况下,仅在主控制器发生故障时才使用备份控制器。此外,如果主过程控制器和备份过程控制器都发生故障,则过程控制任务就不再可能,这通常被称为“丢失”。
公开的计算平台的M:N冗余方案允许更大的灵活性,这是因为就控制器而言,控制系统中的任何活动的过程控制器在继续其自身的过程控制任务以接管故障主控制器的过程控制任务的同时,还可用作另一控制器的备份控制器,使得不需要包括计算硬件的显式专用备份控制器硬件来实现所公开的计算平台冗余方案。因此,就控制器而言,即使存在多个控制器故障,仍可通过将工作量转交到可用的控制器硬件来维护主控制任务。如本文所用,同样就控制器而言,M是主控制器实例/环境的数量,并且N是为M提供冗余所必需的附加控制器平台的数量。
虽然本文大致针对过程控制器进行描述,但所公开的硬件冗余方案也可适用于I/O网关,诸如下文图6如示。过程控制器或I/O网关可以是嵌入式设备或虚拟设备,它们可托管执行包括模拟、数字或顺序控制功能、I/O网关、监管控制等功能的应用程序、高级控制应用程序和用户编写的程序。
本发明所公开的一个实施方案包括一种容错过程控制的方法,该方法包括在工业处理设施(IPF)中配置包括多个计算平台的网络过程控制系统,该多个计算平台通过多个I/O设备耦接到现场级的现场设备,这些现场设备耦接到处理装置。多个I/O被配置为使I/O中的任一者能够耦接至过程控制器中的任一者,从而不像往常以常规的分级方式被配置那样而从属束缚。
检测到多个过程控制器中的第一过程控制器或I/O网关中的第一I/O网关的故障,其可使用已知的方法来检测设备故障。这些已知的设备故障检测技术包括通过检测网络故障、诊断故障、I/O路径的丢失或看门狗超时。另一计算平台处的过程控制器或I/O网关中的一者在处于其自身任务中的服务中并且还作为另一设备的冗余备份设备服务时,在恢复步骤中投入服务以便也用作第一过程控制器或第一I/O网关的冗余控制器或冗余I/O网关来控制或接收来自与第一过程控制器或第一I/O网关相关联的现场设备的数据。冗余控制器或冗余I/O网关继续作为其关联的现场设备的主控制器或其关联的现场设备的主I/O网关工作。恢复步骤可通过用户交互来实现,也可通过使用组织/编排主备关系并根据需要调整该关系的软件来完全自动实现。
所公开的实施方案的一个有利方面是I/O网状网络。I/O网状网络是一种I/O配置,其中I/O不是经由物理的专用链路连接到一个特定过程控制器,而是按通道级别与一组控制器和I/O网关中的所有控制器和I/O网关网状连接,使得该组控制器和I/O网关中的任一过程控制器或一组I/O网关可拥有灵活的工作量分配以便能够对I/O网状网络中的输入和输出执行操作。I/O网状网络支持灵活的冗余方案。简而言之,I/O网状网络是一种共享I/O网络,其中多个控制器和任选的I/O网关以及多个I/O模块和设备驻留于同一网络上,使得I/O资源可在过程控制器和I/O网关之间共享。
附图说明
图1示出了包括冗余过程控制器布置的常规工业控制系统,该冗余过程控制器布置各自包括主控制器和专用冗余控制器,它们均耦接到现场I/O和现场设备以控制处理装置。
图2示出了实现本发明所公开的冗余控制器的本发明所公开的示例性网络控制系统,该冗余控制器不具有耦接至现场I/O和现场设备以控制处理装置的任何专用辅助(冗余)硬件。
图3参考了图2中的先前状态,其中一个控制器已发生故障。突出显示的文本描述了控制操作如何变化,其指示失去控制器冗余,但未失去过程控制。
图4参考了图3中的先前状态,并且假设所描绘的由右边第5个控制器表示的池中现有的或新添加的备用硬件的可用性,其中针对(当前非冗余)控制器1和4的备份可在备用硬件上自动创建。
图5示出了通过将控制器1的主要角色切换到新硬件,已利用4个控制器恢复了完全且正常的冗余操作,所有控制器运行一个主过程控制任务,并且所有控制器均由另一平台进行备份。假设备用平台在池上的预先安装可用性,并且假设一个控制器发生故障,该场景展示了如何可通过总数为N的平台来恢复M个主控制器的完全冗余,其中N=M+1并且没有硬件部署。
图6示出了本发明所公开的示例性网络控制系统,其实现被示出为4个计算平台的本发明所公开的I/O网关硬件和冗余控制器,它们共同实现一个冗余I/O网关设备和三个冗余控制器1、2和3。
具体实施方式
参考附图描述了公开的实施方案,其中在所有附图中使用相同的附图标号来表示类似或等同元件。附图未按比例绘制,并且其仅提供用于说明某些公开的方面。下面参考用于说明的示例性应用来描述若干公开的方面。应当理解,阐述了许多具体细节、关系和方法以提供对所公开实施方案的完全理解。
如本文所用,IPF运行涉及所公开的实施方案适用的有形材料的工业过程。例如,油和天然气、化学、饮料、制药、纸浆和造纸、石油工艺、电气和水。IPF不同于仅执行数据操纵的数据处理系统。
本公开消除了对用于备份控制器或专用备份I/O网关的专用辅助硬件(例如,RTU或边缘网关硬件)的需要。本公开还允许更大的备份覆盖范围。本发明所公开的概念是创建至少一组主过程控制器或一组I/O网关设备,它们除了运行其主过程控制或I/O网关设备任务(例如,控制器控制现场设备诸如致动器和I/O网关设备从感测设备读取数据)之外,还被配置为同时用作其他主控制器或其他I/O网关设备的备份。因此,如果一个或多个其他主控制器或I/O网关硬件节点发生故障,那么有能力运行2个或更多个同时的主控制器或主I/O网关设备任务。
图2示出了实现本发明所公开的不具有任何辅助硬件的冗余控制器的示例性网络控制系统200。仅存在被示出为控制器1 221、控制器2 222、控制器3 223和控制器4 224的主控制器,这是因为每个主控制器221、222、223、224可在需要时用作另一主控制器的备份控制器,因此不需要任何辅控制器。仅以举例的方式示出,控制器1 221用作控制器4 224的备份控制器,控制器2 222用作控制器1 221的备份控制器,控制器3 223用作控制器2 22的备份控制器,并且控制器4 224用作控制器3 223的备份控制器。在图2中,因此,具有主控制器221-224的每个主节点也用作另一控制器的备份控制器。
每个控制器221、222、223和224包括计算硬件171和相关联的存储器172。存储器用于托管至少一个软件应用程序,此处为控制器的控制软件。在I/O网关的情况下,软件应用程序将用于I/O网关的通信。
存在被示出通过将所有控制器连接在一起来提供硬件资源池的专用路径冗余网络260,使得多个过程控制器中的任一者在处于其自身任务的服务中时能够在恢复步骤中投入对故障控制器的服务,以便也用作冗余控制器来控制相关联的现场设备。专用路径冗余网络260是用于使计算平台能够彼此保持同步的高速网络。如上所述,用作冗余控制器的控制器继续作为其相关联的现场设备的主控制器进行操作,并且恢复步骤可通过用户交互来实现或可通过使用组织/编排主备关系并根据需要调整该关系的软件部件来自动实现。
在另一种布置中,通过专用路径冗余网络260连接成一组的过程控制器中的任一者可支持2个或更多个控制器。图2所示的这种布置或相关公开的布置还允许在控制器组中分配热备用硬件设备,其中除非/直到主控制器发生故障,否则备用控制器当前不运行主控制任务,在主控制器发生故障的情况下,其控制工作量被转移(或转交)到备用控制器。备用装置不是必需的,但如果客户需要额外的可用性,则可以客户为基础进行添加。如果控制器或I/O网关节点发生故障,正在备份故障控制器或I/O网关设备节点的控制器或I/O网关设备则同时运行其自身和其他节点过程控制或I/O网关任务。然后,另一节点将为它刚刚执行的控制或I/O网关任务备份此设备,使得它的主控制或主I/O网关任务均由其他节点上的控制器或I/O网关设备进行备份。
在具体实施方面,有多种可能的设计方法,其中提供了就冗余过程控制器的具体实施方面的一些示例。例如,下面列出四个选项:
1.创建封装控制器功能的基于软件的抽象层(或软件容器),其中系统的其余部分(包括配置工具和HMI 185)将每个控制器视为由包括计算硬件171或地址的控制器硬件平台托管但不连接到该平台的“应用模块”(或AM)。
2.结合选项#1的设计,在控制器平台中创建低级别软件/固件层,这允许其同时托管多个AM(或软件容器),并考虑每个AM的物理资源配置文件(包括存储器、中央处理单元(CPU)等)。
3.使用将所有控制器平台连接成一组的专用路径网络(用于冗余和同步数据业务)。
4.一种设计,它确保每个AM的冗余状态信息被视为AM的属性,而不是主机平台。
图2中所示的布置提供了与传统控制器冗余类似的可用性配置文件,但消除了对用于如上述图1所示的任何专用备份控制器的专用硬件的需求。在正常操作中,图2中的每个控制器同时用作主动控制器和另一个控制器的备份控制器。在检测到任何控制器发生故障时,其伙伴(备份)控制器将承担双主控制器的角色。在一个部署中,部署的控制器总数是上述图1中所示的基线情况的一半。在图2中,部署了四个控制器(与图1相同),但具有本发明所公开的増强功能,使得每个控制器能够同时充当主控制器和备份控制器,或在另一个控制器发生故障的情况下充当双主控制器。因此,对于相同数量的控制器硬件,用户可配置四个冗余控制器,而不是上述图1所示的常规布置的两个控制器。
本发明所公开的概念大致依赖于具有IO网状网络140,使得IO不常规地以分级方式从属于任何一个特定节点。如上所述,I/O网状网络是相对较新的概念,在该概念中,I/O不是经由物理的专用链路连接到一个特定过程控制器,而是按通道级别与I/O组中的所有控制器网状连接,使得任何一个过程控制器可对I/O网状网络中的输入和输出执行操作。I/O网状网络支持灵活的冗余方案。
本发明所公开的这种形式的控制器/节点冗余表示成本节约(没有未使用的硬件),更简单的部署选项和更高的可用性(多个备份能力可用,而不仅仅是一个特定节点)。本发明所公开的这种设计利用当今的1:1冗余方法来实现初始同步、同步维护和故障切换处理的核心冗余行为。一旦从主节点池中确定了可行的备份,即可进行初始同步,并且可使用在标题为“Systems and Methods for Synchronizing Redundant Controllers withMinimal Control Disruption”的美国专利6,170,044中所公开的涓流同步来在运行控制任务的同时以原子的方式传输完整数据库,因此对主控件没有中断或延迟。同步维护以标准1:1冗余的方式进行,并且故障切换方法以类似于1:1的方式进行,其中备份主控制器的节点持续检查其伙伴的运行状况,并从最后一个清晰点同步数据启动故障切换/I/O处理/控制执行。
本文所公开的新特征为主控制的同时执行,备份一个或多个其他主控制器的能力,以及运行两个彼此独立且具有适当控制性能的同时控制任务的能力。本发明所公开的实施方案通常可适用于任何过程控制器。例如,EXPERION过程控制器(例如,C300)、ControlEdge PLC和I/O网关设备(诸如RTU2020)均来自Honeywell International Inc.。本发明所公开的实施方案也可适用于Honeywell的増强型高性能过程管理器(EHPM)的演进,一旦其采用I/O网状架构即可。EHPM是増强型通用控制网络(EUCN)上的用于提供监管控制和顺序操作的过程连接设备。
图3、图4和图5示出了示例性控制器故障场景,其展示了所公开的M:N冗余方案的自恢复潜能。这些附图是对图2的逻辑修改,其中控制器再次被示出为221、222、223和224,描述了控制器故障场景和恢复。图3参考了图2中的先前状态,其中示出为控制器221的一个过程控制器已发生故障。文本指示控制操作如何变化,这表示失去冗余,但并未失去控制。图4参考了图3中的先前状态,并且假设所描绘的由右边被示出为控制器229的第5个控制器表示的现有的或新添加的备用控制器硬件在由专用路径冗余网络260连接的控制器组上的控制器可用性,针对(当前非冗余)控制器1 221和4 224的备份可在备用控制器硬件上自动创建。图5示出了在出现故障时通过将控制器1 221的主要角色切换到被示出为控制器229的新硬件,已利用4个控制器平台恢复了完全且正常的冗余操作,每个控制器平台运行一个主控制任务,并且所有控制器平台均由另一控制器平台进行备份。假设备用平台在由专用路径冗余网络260连接的控制器组上的预先安装可用性,并且假设一个控制器发生故障,该场景展示了如何可通过总数为N的控制器平台来恢复M个主控制器的完全冗余,其中N=M+1并且没有硬件部署。
图6示出了本发明所公开的示例性网络控制系统600,其实现被示出为4个计算平台621、622、623和624的本发明所公开的冗余I/O网关和冗余控制器,它们共同实现一冗余I/O网关设备和三个冗余控制器1、2和3。每个计算平台包括用于同时支持至少一个过程控制器和另一过程控制器或I/O网关的计算硬件171和存储器172,其中计算平台再次通过专用路径冗余网络260彼此耦接以提供硬件资源池。如本领域中所已知的,I/O网关是一种数据采集设备,其在两个不同的网络(通常为I/O网络和厂内网络)上的实体之间提供通信,从而为工厂级网络170上的控制器提供通信路径以与I/O网络上的I/O设备通信。
I/O网关可潜在地执行其他功能,包括类似于由控制器提供的控制能力,从而执行I/O网络网关和控制器的两个角色。所有冗余实体都表示为存在于不同物理计算平台上的两个实体:主实体和备份实体。计算平台621托管主I/O网关和备份控制器3。计算平台622托管主控制器1和备份I/O网关。计算平台623包括主控制器2和备份控制器1。计算平台624包括主控制器3和备份控制器2。虽然未示出计算平台623和624直接耦接到I/O网状网络240,但它们可通过计算平台621和622耦接到现场I/O 145、现场设备150和处理装置160,或通过单独的I/O网状网络(未示出)耦接。
虽然上面已经描述了各种所公开的实施方案,但是应当理解,它们仅以示例而非限制的方式呈现。在不脱离本公开的实质或范围的情况下,可根据本公开对本文公开的主题进行许多改变。例如,扩展到其他自动化设置,包括建筑物控制器。此外,虽然可使用仅关于若干实施方式中的一者来公开特定特征,但是此类特征可与其他实施方式的一个或多个其他特征组合,如对于任何给定或特定应用可能期望或有利的那样。

Claims (10)

1.一种容错过程控制的方法,包括:
在工业处理设施(IPF)中提供包括工厂级网络(170)的网络过程控制系统(600),所述工厂级网络将至少一个服务器(180)耦接到多个计算平台(621-624),所述多个计算平台各自包括计算硬件(171)和存储器(172)用以托管用于同时支持至少一个过程控制器和另一过程控制器或输入/输出(I/O)网关的至少一个软件应用程序,所述计算平台通过专用路径冗余网络(260)彼此耦接以提供硬件资源池;
其中所述多个计算平台中的至少一些计算平台通过输入/输出(I/O)网状网络(240)直接耦接到多个I/O设备(145),所述多个I/O设备耦接到现场设备(150),所述现场设备耦接到处理装置(160);
检测所述硬件资源池中的至少一个故障设备,以及
利用所述专用路径冗余网络,将所述多个计算平台中的另一计算平台处的另一设备作为所述故障设备的备份投入服务。
2.根据权利要求1所述的方法,其中所述投入服务是自动执行的。
3.根据权利要求1所述的方法,其中所述另一设备在所述投入服务之前和之后均作为过程控制器或作为I/O网关提供另一任务。
4.根据权利要求1所述的方法,其中所述多个计算平台专门支持所述过程控制器。
5.根据权利要求1所述的方法,其中所述多个计算平台共同支持所述过程控制器和所述I/O网关两者。
6.根据权利要求1所述的方法,其中所述专用路径冗余网络的速度大于所述工厂级网络的速度。
7.根据权利要求1所述的方法,还包括在所述投入服务之后执行初始同步,然后执行相比于所述初始同步更慢的同步以在作为所述备份运行时以原子的方式传输完整数据库。
8.一种用于工业处理设施(IPF)中的网络过程控制系统(600)的计算机平台布置,包括:
多个计算平台(621-624),所述多个计算平台各自包括计算硬件(171)和存储器(172)用以托管用于同时支持至少一个过程控制器和另一过程控制器或输入/输出(I/O)网关的至少一个软件应用程序;
专用路径冗余网络(260),所述专用路径冗余网络将所述多个计算平台耦接在一起以提供硬件资源池;
其中在检测到所述多个过程控制器中的第一过程控制器或所述I/O网关设备中的第一I/O网关设备的所述硬件资源池中的至少一个故障设备时,通过所述专用路径冗余网络将所述多个计算平台中的另一计算平台处的另一设备作为所述故障设备的备份投入服务。
9.一种工业处理设施(IPF)中的容错网络过程控制系统(600),包括:
工厂级网络(170),所述工厂级网络将至少一个服务器(180)耦接到包括多个计算平台(621-624)的计算机平台布置,所述多个计算平台各自包括计算硬件(171)和存储器(172)用以托管用于同时支持至少一个过程控制器和另一过程控制器或输入/输出(I/O)网关的至少一个软件应用程序,所述计算平台通过专用路径冗余网络(260)彼此耦接以提供硬件资源池;
其中所述多个计算平台中的至少一些计算平台通过输入/输出(I/O)网状网络(240)直接耦接到多个I/O设备(145),所述多个I/O设备耦接到现场设备(150),所述现场设备耦接到处理装置(160),
其中所述计算机平台布置被配置用于:
检测所述硬件资源池中的至少一个故障设备,以及
利用所述专用路径冗余网络将所述多个计算平台中的另一计算平台处的另一设备作为所述故障设备的备份投入服务。
10.根据权利要求9所述的控制系统,其中所述投入服务是自动执行的。
CN202010221366.7A 2019-03-29 2020-03-26 不具有专用硬件的冗余控制器或输入-输出网关 Pending CN111752139A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201962825884P 2019-03-29 2019-03-29
US62/825,884 2019-03-29
US16/502,692 2019-07-03
US16/502,692 US11481282B2 (en) 2019-03-29 2019-07-03 Redundant controllers or input-output gateways without dedicated hardware

Publications (1)

Publication Number Publication Date
CN111752139A true CN111752139A (zh) 2020-10-09

Family

ID=69960511

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010221366.7A Pending CN111752139A (zh) 2019-03-29 2020-03-26 不具有专用硬件的冗余控制器或输入-输出网关

Country Status (3)

Country Link
US (1) US11481282B2 (zh)
EP (1) EP3715970B1 (zh)
CN (1) CN111752139A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114697406A (zh) * 2020-12-31 2022-07-01 霍尼韦尔国际公司 用于使用同一物理接口的数据流的多个网络冗余协议
CN116566654A (zh) * 2023-04-12 2023-08-08 南京玖时科技有限公司 一种区块链管理服务器用的防护系统

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3028993A1 (en) * 2016-06-24 2017-12-28 Schneider Electric Systems Usa, Inc. Methods, systems and apparatus to dynamically facilitate boundaryless, high availability system management
US11563673B1 (en) * 2019-09-10 2023-01-24 Cable Television Laboratories, Inc. Network gateways with redundant communication capability, and associated methods
CN112241352B (zh) * 2020-11-03 2023-10-20 中国航空工业集团公司西安航空计算技术研究所 一种网格化容错计算机平台的监控系统
CN114594700B (zh) * 2020-12-04 2023-07-14 昆达电脑科技(昆山)有限公司 整合控制管理系统
US11609809B1 (en) * 2021-08-25 2023-03-21 Honeywell International Inc. Method and apparatus for the enhanced diagnostic coverage of a secondary device of a redundant controller pair
JP2023090264A (ja) * 2021-12-17 2023-06-29 横河電機株式会社 制御システムおよび制御方法
CN114563946B (zh) * 2022-04-28 2022-07-15 深圳斯凯达控制技术有限公司 一种网关与plc配合的工业监控冗余系统的控制方法及系统
CN115356980B (zh) * 2022-08-25 2023-06-27 合肥吉斯凯达控制技术有限公司 一种利用边缘计算网关对既有自控系统的改造方法
CN117647925B (zh) * 2024-01-30 2024-04-09 成都正扬博创电子技术有限公司 一种多余度飞控计算方法、装置、设备及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0416891A2 (en) * 1989-09-05 1991-03-13 Honeywell Inc. Apparatus for providing a universal interface to a process control system
WO1994023367A1 (en) * 1993-04-06 1994-10-13 Honeywell, Inc. A method for maintaining a sequence of events function during failover in a redundant multiple layer system
US6170044B1 (en) * 1997-12-19 2001-01-02 Honeywell Inc. Systems and methods for synchronizing redundant controllers with minimal control disruption
CN101576837A (zh) * 2009-06-12 2009-11-11 成都市华为赛门铁克科技有限公司 一种存储控制系统及方法
US20120117416A1 (en) * 2010-11-09 2012-05-10 Honeywell International Inc. Method and system for process control network migration
CN202421873U (zh) * 2012-01-11 2012-09-05 江苏瑞奇自动化有限公司 支持功能安全与信息安全的分散控制系统
WO2015169352A1 (en) * 2014-05-07 2015-11-12 Abb Technology Ltd Flexible controller utilization in a process control system
CN106569751A (zh) * 2016-11-10 2017-04-19 郑州云海信息技术有限公司 一种多控制器缓存镜像方法及系统
CN107621996A (zh) * 2017-09-26 2018-01-23 郑州云海信息技术有限公司 缓存备份方法、故障处理方法、系统、装置及存储介质
CN109408299A (zh) * 2018-11-02 2019-03-01 郑州云海信息技术有限公司 三控制器集群的数据处理方法、装置、设备及存储介质

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4958270A (en) 1989-01-23 1990-09-18 Honeywell Inc. Method for control data base updating of a redundant processor in a process control system
US5088021A (en) 1989-09-07 1992-02-11 Honeywell, Inc. Apparatus and method for guaranteed data store in redundant controllers of a process control system
US6272386B1 (en) 1998-03-27 2001-08-07 Honeywell International Inc Systems and methods for minimizing peer-to-peer control disruption during fail-over in a system of redundant controllers
US8756412B2 (en) * 2010-04-16 2014-06-17 Honeywell International Inc. Gateway supporting transparent redundancy in process control systems and other systems and related method
US10503155B2 (en) * 2014-06-26 2019-12-10 Abb Schweiz Ag Method for controlling a process plant using a redundant local supervisory controller
US9990286B1 (en) 2017-05-05 2018-06-05 Honeywell International, Inc. Memory tracking using copy-back cache for 1:1 device redundancy
US20180364673A1 (en) * 2017-06-16 2018-12-20 Honeywell International Inc. Process data synchronization between redundant process controllers
US20190050342A1 (en) * 2017-08-08 2019-02-14 Honeywell International Inc. Selective page tracking for process controller redundancy
US11022962B2 (en) * 2018-09-28 2021-06-01 Rockwell Automation Technologies, Inc. High availability industrial automation system having primary and secondary industrial automation controllers and method of communicating information over the same
US11343206B2 (en) * 2019-11-15 2022-05-24 Rockwell Automation Technologies, Inc. Redundant infrastructure for industrial automation distributed control systems

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0416891A2 (en) * 1989-09-05 1991-03-13 Honeywell Inc. Apparatus for providing a universal interface to a process control system
WO1994023367A1 (en) * 1993-04-06 1994-10-13 Honeywell, Inc. A method for maintaining a sequence of events function during failover in a redundant multiple layer system
US6170044B1 (en) * 1997-12-19 2001-01-02 Honeywell Inc. Systems and methods for synchronizing redundant controllers with minimal control disruption
CN101576837A (zh) * 2009-06-12 2009-11-11 成都市华为赛门铁克科技有限公司 一种存储控制系统及方法
US20120117416A1 (en) * 2010-11-09 2012-05-10 Honeywell International Inc. Method and system for process control network migration
CN202421873U (zh) * 2012-01-11 2012-09-05 江苏瑞奇自动化有限公司 支持功能安全与信息安全的分散控制系统
WO2015169352A1 (en) * 2014-05-07 2015-11-12 Abb Technology Ltd Flexible controller utilization in a process control system
CN106569751A (zh) * 2016-11-10 2017-04-19 郑州云海信息技术有限公司 一种多控制器缓存镜像方法及系统
CN107621996A (zh) * 2017-09-26 2018-01-23 郑州云海信息技术有限公司 缓存备份方法、故障处理方法、系统、装置及存储介质
CN109408299A (zh) * 2018-11-02 2019-03-01 郑州云海信息技术有限公司 三控制器集群的数据处理方法、装置、设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114697406A (zh) * 2020-12-31 2022-07-01 霍尼韦尔国际公司 用于使用同一物理接口的数据流的多个网络冗余协议
CN116566654A (zh) * 2023-04-12 2023-08-08 南京玖时科技有限公司 一种区块链管理服务器用的防护系统

Also Published As

Publication number Publication date
US11481282B2 (en) 2022-10-25
EP3715970A1 (en) 2020-09-30
EP3715970B1 (en) 2024-05-01
US20200310920A1 (en) 2020-10-01

Similar Documents

Publication Publication Date Title
EP3715970B1 (en) Redundant controllers or input-output gateways without dedicated hardware
US8924498B2 (en) Method and system for process control network migration
CN107707393B (zh) 基于Openstack O版特性的多活系统
EP1800194B1 (en) Maintaining transparency of a redundant host for control data acquisition systems in process supervision
WO2017067484A1 (zh) 一种虚拟化数据中心调度系统和方法
CN103346903A (zh) 一种双机备份的方法和装置
EP3599521B1 (en) System and method of communicating data over high availability industrial control systems
EP2930623B1 (en) Controller system with peer-to-peer redundancy, and method to operate the system
CN105141456A (zh) 一种高可用集群资源监控方法
CN103312809A (zh) 云平台中服务的分布式管理方法
WO2015169352A1 (en) Flexible controller utilization in a process control system
CN109656753B (zh) 一种应用于轨道交通综合监控系统的冗余热备系统
EP2866422A1 (en) Method of operating a server system with high availability
CN103856357B (zh) 一种堆叠系统故障处理方法及堆叠系统
CN106874142B (zh) 一种实时数据容错处理方法及系统
US9231779B2 (en) Redundant automation system
CN111752140A (zh) 控制器应用程序模块协调器
CN113127270A (zh) 一种基于云计算的3取2安全计算机平台
CN111949444A (zh) 一种基于分布式服务集群的数据备份与恢复系统及方法
CN106850269A (zh) 一种云平台的管理系统
CN111654384A (zh) 一种主备切换方法、bras设备及存储介质
US20040153704A1 (en) Automatic startup of a cluster system after occurrence of a recoverable error
CN105959145B (zh) 一种适用高可用性集群的并行管理服务器的方法及系统
Gundall et al. Introduction of an architecture for flexible future process control systems as enabler for industry 4.0
CN105119754A (zh) 虚拟化主备倒换保持tcp连接的系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination