CN114815745A - 工业监控设备的灾备方法、装置及工业监控系统 - Google Patents

工业监控设备的灾备方法、装置及工业监控系统 Download PDF

Info

Publication number
CN114815745A
CN114815745A CN202110119668.8A CN202110119668A CN114815745A CN 114815745 A CN114815745 A CN 114815745A CN 202110119668 A CN202110119668 A CN 202110119668A CN 114815745 A CN114815745 A CN 114815745A
Authority
CN
China
Prior art keywords
monitoring
state
equipment
monitoring device
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110119668.8A
Other languages
English (en)
Inventor
李聪超
罗章维
汤琦
王刚华
刘晓南
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Priority to CN202110119668.8A priority Critical patent/CN114815745A/zh
Publication of CN114815745A publication Critical patent/CN114815745A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/418Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
    • G05B19/41875Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM] characterised by quality surveillance of production
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/32Operator till task planning
    • G05B2219/32252Scheduling production, machining, job shop

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Manufacturing & Machinery (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提出了一种监控设备的灾备方法,所述监控设备用于对工业节点设备进行监控,多个监控设备组成监控网络,所述方法包括:所述监控网络中的监控设备随机向所述监控网络中的其它监控设备发送状态测试消息;根据所述状态测试消息确定所述监控网络中处于故障状态的监控设备;在所述监控网络中选择所述处于故障状态的监控设备的替代监控设备,并将所述处于故障状态的监控设备切换至所述替代监控设备。与现有技术相比,在新的监控设备加入时,监控网络中的现有监控设备可以快速获取新的监控设备的状态,新的监控设备也可以快速获取现有监控设备的状态,实现了灾备模型的快速部署和验证。

Description

工业监控设备的灾备方法、装置及工业监控系统
技术领域
本发明主要涉及工业数字化领域,尤其涉及一种工业监控设备的灾备方法、装置及工业监控系统。
背景技术
在工业领域,工业节点设备(例如切割机、分装机、清洗机等)正常工作对整个工业产线至关重要。然而在实际运营中,工业节点设备出现故障是不可避免的,因此会引入监控设备对工业节点设备进行监控,以避免计划之外的故障。
现有技术中,多个监控设备连接至控制器,以将监控设备监控的工业节点设备的状态数据传输至控制器,控制器根据接收到的工业节点设备的状态数据进行相应的灾备处理。在开发完成灾备模型之后,需要在现场对灾备模型进行针对性的部署和验证,然而,不同的应用场景通常具有不同数量和拓扑结构的监控设备以及工业节点设备,这将会增加灾备模型的复杂度和安全风险。
发明内容
为了解决上述技术问题,本发明提供一种工业监控设备的灾备方法、装置及工业监控系统,以实现灾备模型的快速部署和验证,降低灾备模型的复杂度和安全风险。
为实现上述目的,本发明提出了一种监控设备的灾备方法,所述监控设备用于对工业节点设备进行监控,多个监控设备组成监控网络,所述方法包括:所述监控网络中的监控设备随机向所述监控网络中的其它监控设备发送状态测试消息;根据所述状态测试消息确定所述监控网络中处于故障状态的监控设备;在所述监控网络中选择所述处于故障状态的监控设备的替代监控设备,并将所述处于故障状态的监控设备切换至所述替代监控设备。为此,通过监控网络中的监控设备随机向监控网络中的其它监控设备发送状态测试消息,在新的监控设备加入时,监控网络中的现有监控设备可以快速获取新的监控设备的状态,新的监控设备也可以快速获取现有监控设备的状态,实现了灾备模型的快速部署和验证;通过在监控网络中选择处于故障状态的监控设备的替代监控设备,并将处于故障状态的监控设备切换至替代监控设备,提高了灾备的灵活性和监控网络的稳定性。
在本发明的一实施例中,根据所述状态测试消息确定所述监控网络中处于故障状态的监控设备包括:在发送状态测试消息的监控设备于第一预定时间内没有收到回复时,将该状态测试消息的发送目标的监控设备标记为可疑状态;在监控设备的可疑状态持续超过第二预定时间时,确定该标记为可疑状态的监控设备处于故障状态。为此,可以迅速确定监控状态是否处于故障状态。
在本发明的一实施例中,所述方法还包括:在监控网络中的监控设备接收到标记为可疑状态的监控设备发送的复活消息时,将发送复活消息的监控设备由可疑状态恢复至正常状态。为此,可以避免对监控设备状态的错误判断,提高确定监控设备状态的准确性。
在本发明的一实施例中,在所述监控网络中选择所述处于故障状态的监控设备的替代监控设备包括:在所述监控网络中选择处于正常状态的监控设备;在所述处于正常状态监控设备中,选择以下一个监控设备作为替代监控设备:与处于故障状态的监控设备物理距离最近的监控设备、与处于故障状态的监控设备网络距离最近的监控设备或与处于故障状态的监控设备相关值最大的监控设备。为此,可以快速替换故障监控设备,提高监控网络的可靠性。
在本发明的一实施例中,所述监控设备包括上游监控设备和下游监控设备,所述上游监控设备用于监控上游工业节点设备,所述下游监控设备用于监控下游工业节点设备,所述上游工业节点设备位于所述下游工业节点设备的上游,所述方法还包括:所述上游监控设备将检测到的上游工业节点设备的异常数据发送至下游监控设备;所述下游监控设备使用监控模型对所述异常数据进行验证,在监控模型运行正常时增加所述上游监控设备和所述下游监控设备的相关值,以及在监控模型运行异常时降低所述上游监控设备和所述下游监控设备的相关值。为此,可以增加监控设备之间关系的维度,进一步提高监控网络的稳定性。
在本发明的一实施例中,所述监控网络中每个所述监控设备均连接至数据网关,所述数据网关还连接至其它监控网络。为此,可以将多个网络连接起来,实现多个监控网络之间的数据通信。
本发明还提出了一种监控设备的灾备装置,所述监控设备用于对工业节点设备进行监控,多个监控设备组成监控网络,其特征在于,所述装置包括:随机发送模块,使所述监控网络中的监控设备随机向所述监控网络中的其它监控设备发送状态测试消息;故障确定模块,根据所述状态测试消息确定所述监控网络中处于故障状态的监控设备;切换模块,在所述监控网络中选择所述处于故障状态的监控设备的替代监控设备,并将所述处于故障状态的监控设备切换至所述替代监控设备。
在本发明的一实施例中,所述故障确定模块根据所述状态测试消息确定所述监控网络中处于故障状态的监控设备包括:在发送状态测试消息的监控设备于第一预定时间内没有收到回复时,将该状态测试消息的发送目标的监控设备标记为可疑状态;在监控设备的可疑状态持续超过第二预定时间时,确定该标记为可疑状态的监控设备处于故障状态。
在本发明的一实施例中,所述装置还包括:在监控网络中的监控设备接收到标记为可疑状态的监控设备发送的复活消息时,将发送复活消息的监控设备由可疑状态恢复至正常状态。
在本发明的一实施例中,所述切换模块在所述监控网络中选择所述处于故障状态的监控设备的替代监控设备包括:在所述监控网络中选择处于正常状态的监控设备;在所述处于正常状态监控设备中,选择以下一个监控设备作为替代监控设备:与处于故障状态的监控设备物理距离最近的监控设备、与处于故障状态的监控设备网络距离最近的监控设备或与处于故障状态的监控设备相关值最大的监控设备。
在本发明的一实施例中,所述监控设备包括上游监控设备和下游监控设备,所述上游监控设备用于监控上游工业节点设备,所述下游监控设备用于监控下游工业节点设备,所述上游工业节点设备位于所述下游工业节点设备的上游,所述装置还包括:所述上游监控设备将检测到的异常数据发送至下游监控设备;所述下游监控设备使用监控模型对所述异常数据进行验证,在监控模型运行正常时提高所述上游监控设备和所述下游监控设备的相关值,以及在监控模型运行异常时降所述上游监控设备和所述下游监控设备的相关值。
在本发明的一实施例中,所述监控网络中每个所述监控设备均连接至所述数据网关,所述数据网关还连接至其它监控网络。
本发明还提出了一种工业监控系统,所述工业监控系统包括多个监控设备,所述监控设备用于对工业节点设备进行监控,多个监控设备组成监控网络,所述工业监控系统还包括如上所述的装置。
本发明还提出了一种电子设备,包括处理器、存储器和存储在所述存储器中的指令,其中所述指令被所述处理器执行时实现如上所述的方法。
本发明还提出了一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令在被运行时执行如上所述的方法。
附图说明
以下附图仅旨在于对本发明做示意性说明和解释,并不限定本发明的范围。其中,
图1是根据本发明的一实施例的一种监控系统的示意图;
图2是根据本发明的一实施例的一种监控设备的灾备方法的流程图;
图3是根据本发明的一实施例的一种选择替代监控设备的示意图;
图4是根据本发明的一实施例的一种更新上游监控设备和下游监控设备的相关值的示意图;
图5是根据本发明的一实施例的一种监控设备的灾备装置的示意图;
图6是根据本发明的一实施例的一种电子设备的示意图。
附图标记说明
100 监控系统
10 第一监控网络
11-16 监控设备
20 数据网关
30 第二监控网络
31-32 监控设备
200 监控设备的灾备方法
210-230 步骤
ME1-ME3 工业节点设备
500 监控设备的灾备装置
510 随机发送模块
520 故障确定模块
530 切换模块
600 电子设备
610 处理器
620 存储器
具体实施方式
为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图说明本发明的具体实施方式。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其它不同于在此描述的其它方式来实施,因此本发明不受下面公开的具体实施例的限制。
如本申请和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其他的步骤或元素。
图1是根据本发明的一实施例的一种监控系统100的示意图。如图1所示,监控系统100包括第一监控网络10和第二监控网络30。在本发明的实施例中,第一监控网络10可以对应于一条产线,第二监控网络30可以对应于另一条产线。
第一监控网络10包括监控设备11-16,第二监控网络30包括监控设备31-32。优选地,第一监控网络10中的监控设备11-16之间以无线方式连接,第二监控网络30中的监控设备31-32之间以无线方式连接。以第一监控网络10为例,第一监控网络10中的监控设备11-16分别连接至工业节点设备(图1未示出),用于对工业节点设备进行监控。具体地,监控设备11-16工业节点设备的状态进行监控,以确定工业节点设备的状态是正常还是故障。工业节点设备为产线上执行独立功能的设备,例如切割机、分装机、清洗机等,多个工业节点设备相互连接形成完整的产线,可以生产出相应的产品,例如金属胚料经过切割机床切割,轧辊机床成形,清洗机床清洗之后,可以生产出金属板件。
监控系统100还包括数据网关20,数据网关20分别连接至第一监控网络10和第二监控网络30,以使第一监控网络10和第二监控网络30之间实现数据通信。
图2是根据本发明的一实施例的一种监控设备的灾备方法200的流程图。该实施例中的监控设备的灾备方法200可以在图1所示的监控系统100中实现,下文将结合图1和图2对该监控设备的灾备方法200进行说明。如图2所示,该监控设备的灾备方法200包括:
步骤210,监控网络中的监控设备随机向监控网络中的其它监控设备发送状态测试消息。
监控设备随机向其它监控设备发送状态测试消息,此过程可以采用流言协议(gossip protocol)。在一个周期内,每个或部分监控设备随机向其它监控设备发送状态测试消息(例如ping消息),接收到状态测试消息的监控设备再向其它监控设备发送状态测试消息,经过若干周期之后,包含所有监控设备的状态信息的状态测试消息传遍了整个网络。通过此种消息传递方式,在新的监控设备加入时,监控网络中的现有监控设备可以快速获取新的监控设备的状态,新的监控设备也可以快速获取现有监控设备的状态。
如图1所示,在某个周期内,监控设备11向监控设备12和监控设备13发送状态测试消息,监控设备12将接收到的状态测试消息发送至监控设备13和监控设备15,监控设备15将接收到的状态测试消息发送至监控设备14和监控设备16,监控设备16又将接收到的状态测试消息发送至监控设备14和监控设备11,经过若干个周期之后,监控网络10中的监控设备11-16获取到监控网络中其它监控设备的状态信息。
步骤220,根据状态测试消息确定监控网络中处于故障状态的监控设备。
状态测试消息包括发送目标的监控设备的ID标识,以确定状态测试消息的发送目标,从而可以确定监控网络中处于故障状态的监控设备。可以将监控网络中的监控设备分为正常(alive)、可疑(suspicious)和故障(dead)三种状态,通过状态测试消息,可以确定监控网络中的各监控设备当前周期内处于何种状态。
在一些实施例中,根据状态测试消息确定监控网络中处于故障状态的监控设备可以包括:在发送状态测试消息的监控设备于第一预定时间内没有收到回复时,将该状态测试消息的发送目标的监控设备标记为可疑状态;在监控设备的可疑状态持续超过第二预定时间时,确定该标记为可疑状态的监控设备处于故障状态。如图1所示,监控设备12向监控设备13发送状态测试消息,若在第一预定时间(例如30s)内监控设备12没有收到确收消息,则监控设备13将会被标记为可疑状态,如果监控设备13的可疑状态持续超过第二预定时间(例如5min),则监控设备13会被确定为故障状态,并且监控设备13处于故障状态的消息将会向第一监控网络10全网广播。
在一些实施例中,灾备方法还包括:在监控网络中的监控设备接收到标记为可疑状态的监控设备发送的复活消息时,将发送复活消息的监控设备由可疑状态恢复至正常状态。继续参考图1,在监控设备13被标记为可疑状态之后,若监控设备14接收到监控设备13发送的消息,此消息称之为复活消息,则监控设备13将由可疑状态被调整为正常状态,并且监控设备13恢复为正常状态的消息将会向第一监控网络10全网广播。
步骤230,在监控网络中选择处于故障状态的监控设备的替代监控设备,并将处于故障状态的监控设备切换至替代监控设备。
若监控设备处于故障状态,则该监控设备将无法执行对工业节点设备的监控功能,此步骤选择替代监控设备执行监控功能,此过程称之为灾备,通过由替代监控设备替代处于故障状态的监控设备,可以提高监控网络的稳定性。
图3是根据本发明的一实施例的一种选择替代监控设备的示意图。如图3所示,监控设备11用于对工业节点设备ME1进行监控,监控设备11被确认为处于故障状态之后,由监控网络10中的监控设备16作为监控设备11的替代监控设备,以替代监控设备11执行对工业节点设备ME1的监控功能,从而避免监控设备11处于故障时工业节点设备ME1无法被监控到,可以提高整个监控网络的稳定性。
在一些实施例中,在监控网络中选择处于故障状态的监控设备的替代监控设备包括:在监控网络中选择处于正常状态的监控设备。在处于正常状态监控设备中,选择以下一个监控设备作为替代监控设备:与处于故障状态的监控设备物理距离最近的监控设备、与处于故障状态的监控设备网络距离最近的监控设备或与处于故障状态的监控设备相关值最大的监控设备。在另一些实施例中,还可以根据物理距离、网络距离以及相关值的加权值选择替代监控设备。
继续参考图3,在监控网络10中选择处于正常状态的监控设备,例如监控设备12-16都处于正常状态,然后分别计算监控设备12-16与监控设备11之间的物理距离,对计算出来的物理距离进行排序,选择物理距离最近的监控设备(例如监控设备16)作为替代监控设备,然后由监控设备16执行对工业节点设备ME1的监控功能。监控网络中传递的报文除了状态测试信息外还可以包括位置信息,通过位置信息计算监控设备之间的物理距离。网络距离最近和相关值最大的替代监控设备亦然,此处不再赘述。监控网络中传递的报文除了状态测试信息外还可以包括IP地址信息,通过IP地址信息计算监控设备之间的网络距离。在本发明的实施例中,相关值用于表示两个监控设备之间的相关性,若相关值越高,表示两个监控设备之间的相关性越大,反之则两个监控设备之间的相关性越小。相关值可以用监控设备监控的工业节点设备的关联度表征,例如两个工业节点设备的关联度越大,则对应的两个监控设备的相关值的数值就越高,反之则越低。
在一些实施例中,监控设备包括上游监控设备和下游监控设备,上游监控设备用于监控上游工业节点设备,下游监控设备用于监控下游工业节点设备,上游工业节点设备位于下游工业节点设备的上游,方法还包括:上游监控设备将检测到的上游工业节点设备的异常数据发送至下游监控设备;下游监控设备使用监控模型对异常数据进行验证,在监控模型运行正常时增加上游监控设备和下游监控设备的相关值,以及在监控模型运行异常时降低上游监控设备和下游监控设备的相关值。
图4是根据本发明的一实施例的一种更新上游监控设备和下游监控设备的相关值的示意图。如图4所示,从上游到下游依次设置有工业节点设备ME1、工业节点设备ME2和工业节点设备ME3,监控设备11、监控设备12和监控设备13分别用于对工业节点设备ME1、工业节点设备ME2和工业节点设备ME3进行监控。在图4中,监控设备11作为监控设备12的上游监控设备,监控设备12作为监控设备13的上游监控设备。上游监控设备11将检测到的上游工业节点设备ME1的异常数据发送至下游监控设备12,下游监控设备12使用监控模型对异常数据进行验证,在监控模型运行正常时增加上游监控设备11和下游监控设备12的相关值,以及在监控模型运行异常时降低上游监控设备11和下游监控设备12的相关值。
在一些实施例中,监控网络中每个监控设备均连接至数据网关,数据网关还连接至其它监控网络。如图1所示,第一监控网络10的每个监控网络均连接至数据网关20,数据网关20还连接至第二监控网络30,从而可以实现第一监控网络10和第二监控网络30之间的数据通信。为此,可以实现多个多个监控网络之间的数据通信。优选地,数据网关可以采用虚拟路由器冗余协议(Virtual Router Redundancy Protocol,VRRP)。
本发明的实施例提供一种监控设备的灾备方法,监控网络中的监控设备随机向监控网络中的其它监控设备发送状态测试消息,在新的监控设备加入时,监控网络中的现有监控设备可以快速获取新的监控设备的状态,新的监控设备也可以快速获取现有监控设备的状态,实现了灾备模型的快速部署和验证;通过在监控网络中选择处于故障状态的监控设备的替代监控设备,并将处于故障状态的监控设备切换至替代监控设备,提高了灾备的灵活性和监控网络的稳定性。
图5是根据本发明的一实施例的一种监控设备的灾备装置500的示意图。如图5所示,灾备装置500包括:
随机发送模块510,使监控网络中的监控设备随机向监控网络中的其它监控设备发送状态测试消息。
故障确定模块520,根据状态测试消息确定监控网络中处于故障状态的监控设备。
切换模块530,在监控网络中选择处于故障状态的监控设备的替代监控设备,并将处于故障状态的监控设备切换至替代监控设备。
在一些实施例中,故障确定模块520根据状态测试消息确定监控网络中处于故障状态的监控设备包括:在发送状态测试消息的监控设备于第一预定时间内没有收到回复时,将该状态测试消息的发送目标的监控设备标记为可疑状态;在监控设备的可疑状态持续超过第二预定时间时,确定该标记为可疑状态的监控设备处于故障状态。
在一些实施例中,装置500还包括:在监控网络中的监控设备接收到标记为可疑状态的监控设备发送的复活消息时,将发送复活消息的监控设备由可疑状态恢复至正常状态。
在一些实施例中,切换模块530在监控网络中选择处于故障状态的监控设备的替代监控设备包括:在监控网络中选择处于正常状态的监控设备;
在处于正常状态监控设备中,选择以下一个监控设备作为替代监控设备:与处于故障状态的监控设备物理距离最近的监控设备、与处于故障状态的监控设备网络距离最近的监控设备或与处于故障状态的监控设备相关值最大的监控设备。
在一些实施例中,监控设备包括上游监控设备和下游监控设备,上游监控设备用于监控上游工业节点设备,下游监控设备用于监控下游工业节点设备,上游工业节点设备位于下游工业节点设备的上游,装置500还包括:上游监控设备将检测到的异常数据发送至下游监控设备;下游监控设备使用监控模型对异常数据进行验证,在监控模型运行正常时提高上游监控设备和下游监控设备的相关值,以及在监控模型运行异常时降上游监控设备和下游监控设备的相关值。
在一些实施例中,监控网络中每个监控设备均连接至数据网关,数据网关还连接至其它监控网络。
本发明还提出一种工业监控系统,工业监控系统包括多个监控设备,监控设备用于对工业节点设备进行监控,多个监控设备组成监控网络,工业监控系统还包括如上文所述的装置500。
本发明还提出一种电子设备600。图6是根据本发明的一实施例的一种电子设备600的示意图。如图6所示,电子设备600包括处理器610和存储器620,存储器620存储中存储有指令,其中指令被处理器610执行时实现如上文所述的方法200。
本发明还提出一种计算机可读存储介质,其上存储有计算机指令,计算机指令在被运行时执行如上文所述的方法200。
本发明的方法和装置的一些方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。处理器可以是一个或多个专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理器件(DAPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、处理器、控制器、微控制器、微处理器或者其组合。此外,本发明的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。例如,计算机可读介质可包括,但不限于,磁性存储设备(例如,硬盘、软盘、磁带……)、光盘(例如,压缩盘(CD)、数字多功能盘(DVD)……)、智能卡以及闪存设备(例如,卡、棒、键驱动器……)。
在此使用了流程图用来说明根据本申请的实施例的方法所执行的操作。应当理解的是,前面的操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各种步骤。同时,或将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
应当理解,虽然本说明书是按照各个实施例描述的,但并非每个实施例仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
以上所述仅为本发明示意性的具体实施方式,并非用以限定本发明的范围。任何本领域的技术人员,在不脱离本发明的构思和原则的前提下所作的等同变化、修改与结合,均应属于本发明保护的范围。

Claims (15)

1.一种监控设备的灾备方法(200),所述监控设备用于对工业节点设备进行监控,多个监控设备组成监控网络,其特征在于,所述方法包括:
所述监控网络中的监控设备随机向所述监控网络中的其它监控设备发送状态测试消息(210);
根据所述状态测试消息确定所述监控网络中处于故障状态的监控设备(220);
在所述监控网络中选择所述处于故障状态的监控设备的替代监控设备,并将所述处于故障状态的监控设备切换至所述替代监控设备(230)。
2.根据权利要求1所述的灾备方法(200),其特征在于,根据所述状态测试消息确定所述监控网络中处于故障状态的监控设备(220)包括:
在发送状态测试消息的监控设备于第一预定时间内没有收到回复时,将该状态测试消息的发送目标的监控设备标记为可疑状态;
在监控设备的可疑状态持续超过第二预定时间时,确定该标记为可疑状态的监控设备处于故障状态。
3.根据权利要求2所述的灾备方法(200),其特征在于,所述方法(200)还包括:在监控网络中的监控设备接收到标记为可疑状态的监控设备发送的复活消息时,将发送复活消息的监控设备由可疑状态恢复至正常状态。
4.根据权利要求1所述的灾备方法(200),其特征在于,在所述监控网络中选择所述处于故障状态的监控设备的替代监控设备(230)包括:
在所述监控网络中选择处于正常状态的监控设备;
在所述处于正常状态监控设备中,选择以下一个监控设备作为替代监控设备:与处于故障状态的监控设备物理距离最近的监控设备、与处于故障状态的监控设备网络距离最近的监控设备或与处于故障状态的监控设备相关值最大的监控设备。
5.根据权利要求4所述的灾备方法(200),其特征在于,所述监控设备包括上游监控设备和下游监控设备,所述上游监控设备用于监控上游工业节点设备,所述下游监控设备用于监控下游工业节点设备,所述上游工业节点设备位于所述下游工业节点设备的上游,所述方法(200)还包括:
所述上游监控设备将检测到的上游工业节点设备的异常数据发送至下游监控设备;
所述下游监控设备使用监控模型对所述异常数据进行验证,在监控模型运行正常时增加所述上游监控设备和所述下游监控设备的相关值,以及在监控模型运行异常时降低所述上游监控设备和所述下游监控设备的相关值。
6.根据权利要求1所述的灾备方法(200),其特征在于,所述监控网络中每个所述监控设备均连接至数据网关,所述数据网关还连接至其它监控网络。
7.一种监控设备的灾备装置(500),所述监控设备用于对工业节点设备进行监控,多个监控设备组成监控网络,其特征在于,所述装置包括:
随机发送模块(510),使所述监控网络中的监控设备随机向所述监控网络中的其它监控设备发送状态测试消息;
故障确定模块(520),根据所述状态测试消息确定所述监控网络中处于故障状态的监控设备;
切换模块(530),在所述监控网络中选择所述处于故障状态的监控设备的替代监控设备,并将所述处于故障状态的监控设备切换至所述替代监控设备。
8.根据权利要求7所述的灾备装置(500),其特征在于,所述故障确定模块(520)根据所述状态测试消息确定所述监控网络中处于故障状态的监控设备包括:
在发送状态测试消息的监控设备于第一预定时间内没有收到回复时,将该状态测试消息的发送目标的监控设备标记为可疑状态;
在监控设备的可疑状态持续超过第二预定时间时,确定该标记为可疑状态的监控设备处于故障状态。
9.根据权利要求8所述的灾备装置(500),其特征在于,所述装置(500)还包括:在监控网络中的监控设备接收到标记为可疑状态的监控设备发送的复活消息时,将发送复活消息的监控设备由可疑状态恢复至正常状态。
10.根据权利要求7所述的灾备装置(500),其特征在于,所述切换模块(530)在所述监控网络中选择所述处于故障状态的监控设备的替代监控设备包括:
在所述监控网络中选择处于正常状态的监控设备;
在所述处于正常状态监控设备中,选择以下一个监控设备作为替代监控设备:与处于故障状态的监控设备物理距离最近的监控设备、与处于故障状态的监控设备网络距离最近的监控设备或与处于故障状态的监控设备相关值最大的监控设备。
11.根据权利要求10所述的灾备装置(500),其特征在于,所述监控设备包括上游监控设备和下游监控设备,所述上游监控设备用于监控上游工业节点设备,所述下游监控设备用于监控下游工业节点设备,所述上游工业节点设备位于所述下游工业节点设备的上游,所述装置(500)还包括:
所述上游监控设备将检测到的异常数据发送至下游监控设备;
所述下游监控设备使用监控模型对所述异常数据进行验证,在监控模型运行正常时提高所述上游监控设备和所述下游监控设备的相关值,以及在监控模型运行异常时降所述上游监控设备和所述下游监控设备的相关值。
12.根据权利要求7所述的灾备装置(500),其特征在于,所述监控网络中每个所述监控设备均连接至所述数据网关,所述数据网关还连接至其它监控网络。
13.一种工业监控系统,其特征在于,所述工业监控系统包括多个监控设备,所述监控设备用于对工业节点设备进行监控,多个监控设备组成监控网络,所述工业监控系统还包括如权利要求7-13所述的装置。
14.一种电子设备(600),包括处理器(610)、存储器(620)和存储在所述存储器(620)中的指令,其中所述指令被所述处理器(610)执行时实现如权利要求1-6任一项所述的方法。
15.一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令在被运行时执行如权利要求1-6中任一项所述的方法。
CN202110119668.8A 2021-01-28 2021-01-28 工业监控设备的灾备方法、装置及工业监控系统 Pending CN114815745A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110119668.8A CN114815745A (zh) 2021-01-28 2021-01-28 工业监控设备的灾备方法、装置及工业监控系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110119668.8A CN114815745A (zh) 2021-01-28 2021-01-28 工业监控设备的灾备方法、装置及工业监控系统

Publications (1)

Publication Number Publication Date
CN114815745A true CN114815745A (zh) 2022-07-29

Family

ID=82525914

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110119668.8A Pending CN114815745A (zh) 2021-01-28 2021-01-28 工业监控设备的灾备方法、装置及工业监控系统

Country Status (1)

Country Link
CN (1) CN114815745A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115776438A (zh) * 2023-01-29 2023-03-10 北京珞安科技有限责任公司 一种工控数据传输方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115776438A (zh) * 2023-01-29 2023-03-10 北京珞安科技有限责任公司 一种工控数据传输方法及系统
CN115776438B (zh) * 2023-01-29 2023-05-23 北京珞安科技有限责任公司 一种工控数据传输方法及系统

Similar Documents

Publication Publication Date Title
CN108989135B (zh) 网络设备故障检测方法及装置
CN104283738A (zh) 一种链路检测方法及设备
CN111142801B (zh) 分布式存储系统网络亚健康检测方法及装置
CN107566036B (zh) 自动检测通信中的错误并且自动确定该错误的源
CN111030877A (zh) 主备设备切换方法和装置
KR101705504B1 (ko) 프로그래머블 컨트롤러 및 프로그래머블 컨트롤러 시스템
CN105634848B (zh) 一种虚拟路由器监控方法及装置
CN105379201A (zh) 路径切换的方法和设备
CN101237314A (zh) 一种保障复制业务传输的方法及接入设备
CN104378186A (zh) 一种网络冗余数据处理的方法、装置和系统
CN111338858B (zh) 一种双机房的容灾方法及装置
CN114815745A (zh) 工业监控设备的灾备方法、装置及工业监控系统
CN107948000B (zh) 一种主备通道的切换方法、装置及系统
US11516073B2 (en) Malfunction point estimation method and malfunction point estimation apparatus
CN110224872B (zh) 一种通信方法、装置及存储介质
CN111130917B (zh) 线路测试的方法、装置及系统
CN104394033B (zh) 跨数据中心的监控系统、方法及装置
CN105812160B (zh) 一种无缝冗余网络模式自适应方法及装置
JP6351076B2 (ja) 保守装置、ネットワークシステム及びその保守方法
JP6278868B2 (ja) 通信制御装置および計算装置
JP2017034403A (ja) サービス影響原因推定装置、サービス影響原因推定プログラム、及びサービス影響原因推定方法
CN108880882B (zh) 一种基于健康检查改进机制的gslb处理方法
JP6310405B2 (ja) サービス影響原因推定装置、サービス影響原因推定プログラム、及びサービス影響原因推定方法
CN104869016A (zh) 一种数据报文的传输方法和设备
CN110912837A (zh) 基于vsm系统的主备切换方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination