CN114356625A - 分布式系统冗余诊断方法、装置、电子装置和存储介质 - Google Patents

分布式系统冗余诊断方法、装置、电子装置和存储介质 Download PDF

Info

Publication number
CN114356625A
CN114356625A CN202111590818.XA CN202111590818A CN114356625A CN 114356625 A CN114356625 A CN 114356625A CN 202111590818 A CN202111590818 A CN 202111590818A CN 114356625 A CN114356625 A CN 114356625A
Authority
CN
China
Prior art keywords
diagnosis
information
operation information
service
diagnostic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111590818.XA
Other languages
English (en)
Inventor
柏立悦
夏学存
陈善镇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Supcon Technology Co Ltd
Original Assignee
Zhejiang Supcon Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Supcon Technology Co Ltd filed Critical Zhejiang Supcon Technology Co Ltd
Priority to CN202111590818.XA priority Critical patent/CN114356625A/zh
Publication of CN114356625A publication Critical patent/CN114356625A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Hardware Redundancy (AREA)

Abstract

本申请涉及一种分布式系统冗余诊断方法、装置、电子装置和存储介质,其中,该分布式系统冗余诊断方法包括:获取组态服务的诊断位号信息,其中,所述诊断位号信息包括多个诊断位号,每个诊断位号对应一个节点服务;根据诊断位号信息,通过多个诊断服务分别获取所述诊断位号信息对应节点服务的运行信息;将多个运行信息和诊断服务的状态参数发送至实时数据库,以使所述实时数据库根据所述状态参数将所述运行信息进行存储;诊断所述运行信息,生成诊断操作。通过本申请,降低了分布式系统信息收集的失效风险,提高了分布式系统各节点服务的信息监测与诊断的安全性。

Description

分布式系统冗余诊断方法、装置、电子装置和存储介质
技术领域
本申请涉及工业自动化监控技术领域,特别是涉及分布式系统冗余诊断方法、装置、系统、电子装置和存储介质。
背景技术
随着我国经济的不断成长,国家越来越重视工业自动化监控系统项目相关行业的发展。现有企业规模的迅猛扩张,数据规模的爆发式增长,为满足用户日益庞大的数据流量需求,集群架构的实时数据库应运而生。
实时数据库(Real Time DataBase,RTDB)是数据库系统发展的一个分支,是数据库技术结合实时处理技术产生的,可直接实时采集、获取企业运行过程中的各种数据,并将其转化为对各类业务有效的公共信息。出于容灾考虑,往往采用多副本技术,即针对某份数据复制为多个副本,按照分布式存储算法保存在集群中不同的存储服务器节点。当前的诊断信息,不能很好的保证数据完整性与切换的实时性,如果发生网络中断,很容易丢失数据,甚至服务不可用。
针对相关技术中存在难以保证分布式系统各节点服务的信息监测与诊断安全性,目前还没有提出有效的解决方案。
发明内容
在本实施例中提供了一种分布式系统冗余诊断方法、装置、系统、电子装置和存储介质,以解决相关技术中分布式系统各节点服务的信息监测与诊断安全性的问题。
第一个方面,在本实施例中提供了一种分布式系统冗余诊断方法,包括:
获取组态服务的诊断位号信息,其中,所述诊断位号信息包括多个诊断位号,每个诊断位号对应一个节点服务;
根据诊断位号信息,通过多个诊断服务分别获取所述诊断位号信息对应节点服务的运行信息;
将多个运行信息和诊断服务的状态参数发送至实时数据库,以使所述实时数据库根据所述状态参数将所述运行信息进行存储;
诊断所述运行信息,生成诊断操作。
在其中的一些实施例中,所述将多个运行信息和诊断服务的状态参数发送至实时数据库,以使所述实时数据库根据所述状态参数将所述运行信息进行存储包括:
检测多个所述诊断服务的状态参数;
筛选出状态参数最优诊断服务获取的运行信息,将该运行信息存储于实时数据库。
在其中的一些实施例中,所述根据诊断位号信息,通过多个诊断服务分别获取所述诊断位号信息对应节点服务的运行信息包括:
检测多个诊断服务与实时数据库的连接时间;
将连接时间最长的诊断服务获取的运行信息为状态参数最优的运行信息。
在其中的一些实施例中,所述将连接时间最长的诊断服务获取的运行信息为状态参数最优的运行信息包括:
若多个诊断服务与实时数据库的连接时间相同,则检测多个诊断服务的系统负载;
将系统负载最小的诊断服务获取的运行信息为状态参数最优的运行信息。
在其中的一些实施例中,所述将系统负载最小的诊断服务获取的运行信息为状态参数最优的运行信息包括:
若多个诊断服务与实时数据库的连接时间相同,则检测多个诊断服务的IP地址;
将IP地址最小的诊断服务获取的运行信息为状态参数最优的运行信息。
在其中的一些实施例中,所述诊断所述运行信息,生成诊断操作包括:
诊断所述运行信息中各节点服务的工况参数;
若节点服务的工况参数超出工况阈值,则记录当前的工况参数生成诊断操作,并发出警报提示。
在其中的一些实施例中,所述诊断所述运行信息,生成诊断操作还包括:
诊断所述运行信息中各节点服务的存储空间;
若节点服务的存储空间低于存储阈值,则将该节点服务的存储数据进行转移到外部存储设备或其余节点服务的存储空间。
第二个方面,在本实施例中提供了一种分布式系统冗余诊断装置,包括:
组态模块,用于获取组态服务的诊断位号信息,其中,所述诊断位号信息包括多个诊断位号,每个诊断位号对应一个节点服务;
收集模块,用于根据诊断位号信息,通过多个诊断服务分别获取所述诊断位号信息对应节点服务的运行信息;
传输模块,用于将多个运行信息和诊断服务的状态参数发送至实时数据库,以使所述实时数据库根据所述状态参数将所述运行信息进行存储;
诊断模块,用于诊断所述运行信息,生成诊断操作。
第三个方面,在本实施例中提供了一种电子装置,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一个方面所述的分布式系统冗余诊断方法。
第四个方面,在本实施例中提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述第一个方面所述的分布式系统冗余诊断方法。
与相关技术相比,在本实施例中提供的分布式系统冗余诊断方法,通过多个诊断服务分别获取所述诊断位号信息对应节点服务的运行信息,降低了分布式系统信息收集的失效风险,提高了分布式系统各节点服务的信息监测与诊断的安全性。
本申请的一个或多个实施例的细节在以下附图和描述中提出,以使本申请的其他特征、目的和优点更加简明易懂。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是本实施例的分布式系统冗余诊断方法的终端的硬件结构框图;
图2是本实施例的分布式系统冗余诊断方法的系统结构框图;
图3是本实施例的分布式系统冗余诊断方法的流程图;
图4是本实施例的分布式系统冗余诊断装置的结构框图。
具体实施方式
为更清楚地理解本申请的目的、技术方案和优点,下面结合附图和实施例,对本申请进行了描述和说明。
除另作定义外,本申请所涉及的技术术语或者科学术语应具有本申请所属技术领域具备一般技能的人所理解的一般含义。在本申请中的“一”、“一个”、“一种”、“该”、“这些”等类似的词并不表示数量上的限制,它们可以是单数或者复数。在本申请中所涉及的术语“包括”、“包含”、“具有”及其任何变体,其目的是涵盖不排他的包含;例如,包含一系列步骤或模块(单元)的过程、方法和系统、产品或设备并未限定于列出的步骤或模块(单元),而可包括未列出的步骤或模块(单元),或者可包括这些过程、方法、产品或设备固有的其他步骤或模块(单元)。在本申请中所涉及的“连接”、“相连”、“耦接”等类似的词语并不限定于物理的或机械连接,而可以包括电气连接,无论是直接连接还是间接连接。在本申请中所涉及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。通常情况下,字符“/”表示前后关联的对象是一种“或”的关系。在本申请中所涉及的术语“第一”、“第二”、“第三”等,只是对相似对象进行区分,并不代表针对对象的特定排序。
在本实施例中提供的方法实施例可以在终端、计算机或者类似的运算装置中执行。比如在终端上运行,图1是本实施例的分布式系统冗余诊断方法的终端的硬件结构框图。如图1所示,终端可以包括一个或多个(图1中仅示出一个)处理器102和用于存储数据的存储器104,其中,处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置。上述终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述终端的结构造成限制。例如,终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示出的不同配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如在本实施例中的分布式系统冗余诊断方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输设备106用于经由一个网络接收或者发送数据。上述的网络包括终端的通信供应商提供的无线网络。在一个实例中,传输设备106包括一个网络适配器(NetworkInterface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
图2是本实施例的分布式系统冗余诊断方法的系统结构框图。如图2所示,所述分布式系统冗余诊断系统包括:组态服务、诊断服务、实时服务以及存储服务。
组态服务用于获取分布式系统中各个节点服务的诊断位号信息。
诊断服务设置有一主一从或一主多从的方式,多个诊断服务之间互为热备,可以同时订阅组态服务进行组态更新,获取诊断位号信息,根据诊断位号信息获取对应节点服务的运行信息。诊断服务将运行信息和状态参数发送至实时服务。
实时服务识别诊断服务状态的状态参数,确认主诊断服务,保留主诊断服务发送的运行信息,将该运行信息发送至存储服务。
存储服务为实时数据库,将运行信息进行存储。
在本实施例中提供了一种分布式系统冗余诊断方法,图3是本实施例的分布式系统冗余诊断方法的流程图,如图3所示,该流程包括如下步骤:
步骤S301,获取组态服务的诊断位号信息,其中,所述诊断位号信息包括多个诊断位号,每个诊断位号对应一个节点服务。
具体地,多个诊断服务向组态服务进行订阅,获取组态服务的诊断位号信息。
步骤S302,根据诊断位号信息,通过多个诊断服务分别获取所述诊断位号信息对应节点服务的运行信息。
具体地,多个诊断服务根据诊断位号信息,分别获取所述诊断位号信息对应节点服务节点服务的运行信息。
在一个实施例中,所述诊断服务获取各节点服务实时的节点资源、服务资源和设备资源。其中,节点资源包括CPU状况、内存状况、磁盘状况、网络状况等;服务资源:运行时间、运行状态、系统属性、系统事件等;设备资源:属性数据、状态数据、事件数据、资源数据等。
步骤S303,将多个运行信息和诊断服务的状态参数发送至实时数据库,以使所述实时数据库根据所述状态参数将所述运行信息进行存储。
具体地,将多个诊断服务获取的运行信息和诊断服务的状态参数,实时服务检测带有诊断服务的状态参数,根据状态参数的具体状况,将对应的运行信息存储于实时数据库。
所述将多个运行信息和诊断服务的状态参数发送至实时数据库,以使所述实时数据库根据所述状态参数将所述运行信息进行存储包括:检测多个所述诊断服务的状态参数;筛选出状态参数最优诊断服务获取的运行信息,将该运行信息存储于实时数据库。
具体地,实时服务检测多个所述运行信息的状态参数,将状态参数最优的诊断服务作为主诊断服务,将该主诊断服务获取的运行信息存储于实时数据库,其余诊断服务的运行信息不进行存储。通过设置多个诊断服务获取同一诊断位号信息对应的节点服务的运行信息,实现诊断服务的冗余,防止数据丢失。
在一个实施例中,所述状态参数包括连接时间、系统负载和IP地址。连接时间、系统负载和IP地址的优先级从高到低排序。检测多个诊断服务与实时数据库的连接时间;将连接时间最长的诊断服务获取的运行信息为状态参数最优的运行信息。若多个诊断服务与实时数据库的连接时间相同,则检测多个诊断服务的系统负载;将系统负载最小的诊断服务获取的运行信息为状态参数最优的运行信息。若多个诊断服务与实时数据库的连接时间相同,则检测多个诊断服务的IP地址;将IP地址最小的诊断服务获取的运行信息为状态参数最优的运行信息。可以理解,所述状态参数也可以为系统诊断位号、标号等其他参数,通过判断状态参数的不同,标记对应的诊断服务为主诊断服务。
所述将多个运行信息和诊断服务的状态参数发送至实时数据库,以使所述实时数据库根据所述状态参数将所述运行信息进行存储包括:检测诊断位号信息是否改变;若诊断位号信息发生改变,则根据改变的诊断位号信息,更新节点服务的运行信息;若诊断位号信息未发生改变,则按预设的时间周期更新节点服务的运行信息。
步骤S304,诊断所述运行信息,生成诊断操作。
具体地,诊断所述运行信息,生成诊断操作,诊断服务通过gRPC接口与外部web服务连接,将诊断操作发送至外部应用,供用户查看。
所述诊断所述运行信息,生成诊断操作包括:诊断所述运行信息中各节点服务的工况参数;若节点服务的工况参数超出工况阈值,则记录当前的工况参数生成诊断操作,并发出警报提示。
具体地,诊断所述运行信息中各节点服务的工况参数,通过CPU利用率、内存利用率、网络流量、磁盘空间等参数,计算出该节点服务运行的工况参数。当该工况参数超出工况阈值时,自动将所有进程与线程等计算机资源占用情况记录下来,并通过web服务通知给上层业务。
所述诊断所述运行信息,生成诊断操作还包括:诊断所述运行信息中各节点服务的存储空间;若节点服务的存储空间低于存储阈值,则将该节点服务的存储数据进行转移到外部存储设备或其余节点服务的存储空间。
具体地,诊断所述运行信息中各节点服务的存储空间,当该节点服务磁盘的存储空间小于16G时,自动将该节点服务的存储数据迁移到外部磁带或机械硬盘上,并通过web服务通知给上层业务。可以理解,存储空间的数值也可以为其他数值。
所述诊断所述运行信息,生成诊断操作包括:诊断所述运行信息中各节点服务在预设时间间隔内的连接请求次数是否超出次数阈值;若所述运行信息中各节点服务在预设时间间隔内的连接请求次数超出次数阈值,则将该节点服务进行降级,降低响应请求次数,防止系统遭到破坏。
通过上述步骤,采用多个诊断服务分别获取所述诊断位号信息对应节点服务的运行信息,检测多个所述诊断服务的状态参数,筛选出状态参数最优诊断服务的运行信息,将该运行信息存储于实时数据库。降低了分布式系统信息收集的失效风险,提高了分布式系统各节点服务的信息监测与诊断的安全性。
需要说明的是,在上述流程中或者附图的流程图中示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
在本实施例中还提供了一种分布式系统冗余诊断装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。以下所使用的术语“模块”、“单元”、“子单元”等可以实现预定功能的软件和/或硬件的组合。尽管在以下实施例中所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图4是本实施例的分布式系统冗余诊断装置的结构框图,如图4所示,该装置包括:组态模块410、收集模块420、传输模块430和诊断模块440。
组态模块410,用于获取组态服务的诊断位号信息,其中,所述诊断位号信息包括多个诊断位号,每个诊断位号对应一个节点服务。
收集模块420,用于根据诊断位号信息,通过多个诊断服务分别获取所述诊断位号信息对应节点服务的运行信息。
传输模块430,用于将多个运行信息和诊断服务的状态参数发送至实时数据库,以使所述实时数据库根据所述状态参数将所述运行信息进行存储。
诊断模块440,用于诊断所述运行信息,生成诊断操作。
传输模块430还用于检测多个所述诊断服务的状态参数;筛选出状态参数最优诊断服务获取的运行信息,将该运行信息存储于实时数据库。
传输模块430还用于检测多个诊断服务与实时数据库的连接时间;
将连接时间最长的诊断服务获取的运行信息为状态参数最优的运行信息。
传输模块430还用于若多个诊断服务与实时数据库的连接时间相同,则检测多个诊断服务的系统负载;将系统负载最小的诊断服务获取的运行信息为状态参数最优的运行信息。
传输模块430还用于若多个诊断服务与实时数据库的连接时间相同,则检测多个诊断服务的IP地址;将IP地址最小的诊断服务获取的运行信息为状态参数最优的运行信息。
诊断模块440还用于诊断所述运行信息中各节点服务的工况参数;若节点服务的工况参数超出工况阈值,则记录当前的工况参数生成诊断操作,并发出警报提示。
诊断模块440还用于诊断所述运行信息中各节点服务的存储空间;若节点服务的存储空间低于存储阈值,则将该节点服务的存储数据进行转移到外部存储设备或其余节点服务的存储空间。
需要说明的是,上述各个模块可以是功能模块也可以是程序模块,既可以通过软件来实现,也可以通过硬件来实现。对于通过硬件来实现的模块而言,上述各个模块可以位于同一处理器中;或者上述各个模块还可以按照任意组合的形式分别位于不同的处理器中。
在本实施例中还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
获取组态服务的诊断位号信息,其中,所述诊断位号信息包括多个诊断位号,每个诊断位号对应一个节点服务;
根据诊断位号信息,通过多个诊断服务分别获取所述诊断位号信息对应节点服务的运行信息;
将多个运行信息和诊断服务的状态参数发送至实时数据库,以使所述实时数据库根据所述状态参数将所述运行信息进行存储;
诊断所述运行信息,生成诊断操作。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:检测多个所述诊断服务的状态参数;筛选出状态参数最优诊断服务的运行信息,将该运行信息存储于实时数据库。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:检测多个诊断服务与实时数据库的连接时间;将连接时间最长的诊断服务获取的运行信息为状态参数最优的运行信息。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:若多个诊断服务与实时数据库的连接时间相同,则检测多个诊断服务的系统负载;将系统负载最小的诊断服务获取的运行信息为状态参数最优的运行信息。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:若多个诊断服务与实时数据库的连接时间相同,则检测多个诊断服务的IP地址;将IP地址最小的诊断服务获取的运行信息为状态参数最优的运行信息。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:诊断所述运行信息中各节点服务的工况参数;若节点服务的工况参数超出工况阈值,则记录当前的工况参数生成诊断操作,并发出警报提示。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:诊断所述运行信息中各节点服务的存储空间;若节点服务的存储空间低于存储阈值,则将该节点服务的存储数据进行转移到外部存储设备或其余节点服务的存储空间。
需要说明的是,在本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,在本实施例中不再赘述。
此外,结合上述实施例中提供的分布式系统冗余诊断方法,在本实施例中还可以提供一种存储介质来实现。该存储介质上存储有计算机程序;该计算机程序被处理器执行时实现上述实施例中的任意一种分布式系统冗余诊断方法。
应该明白的是,这里描述的具体实施例只是用来解释这个应用,而不是用来对它进行限定。根据本申请提供的实施例,本领域普通技术人员在不进行创造性劳动的情况下得到的所有其它实施例,均属本申请保护范围。
显然,附图只是本申请的一些例子或实施例,对本领域的普通技术人员来说,也可以根据这些附图将本申请适用于其他类似情况,但无需付出创造性劳动。另外,可以理解的是,尽管在此开发过程中所做的工作可能是复杂和漫长的,但是,对于本领域的普通技术人员来说,根据本申请披露的技术内容进行的某些设计、制造或生产等更改仅是常规的技术手段,不应被视为本申请公开的内容不足。
“实施例”一词在本申请中指的是结合实施例描述的具体特征、结构或特性可以包括在本申请的至少一个实施例中。该短语出现在说明书中的各个位置并不一定意味着相同的实施例,也不意味着与其它实施例相互排斥而具有独立性或可供选择。本领域的普通技术人员能够清楚或隐含地理解的是,本申请中描述的实施例在没有冲突的情况下,可以与其它实施例结合。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对专利保护范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (10)

1.一种分布式系统冗余诊断方法,其特征在于,包括:
获取组态服务的诊断位号信息,其中,所述诊断位号信息包括多个诊断位号,每个诊断位号对应一个节点服务;
根据诊断位号信息,通过多个诊断服务分别获取所述诊断位号信息对应节点服务的运行信息;
将多个运行信息和诊断服务的状态参数发送至实时数据库,以使所述实时数据库根据所述状态参数将所述运行信息进行存储;
诊断所述运行信息,生成诊断操作。
2.根据权利要求1所述的分布式系统冗余诊断方法,其特征在于,所述将多个运行信息和诊断服务的状态参数发送至实时数据库,以使所述实时数据库根据所述状态参数将所述运行信息进行存储包括:
检测多个所述诊断服务的状态参数;
筛选出状态参数最优诊断服务获取的运行信息,将该运行信息存储于实时数据库。
3.根据权利要求2所述的分布式系统冗余诊断方法,其特征在于,所述根据诊断位号信息,通过多个诊断服务分别获取所述诊断位号信息对应节点服务的运行信息包括:
检测多个诊断服务与实时数据库的连接时间;
将连接时间最长的诊断服务获取的运行信息为状态参数最优的运行信息。
4.根据权利要求3所述的分布式系统冗余诊断方法,其特征在于,所述将连接时间最长的诊断服务获取的运行信息为状态参数最优的运行信息包括:
若多个诊断服务与实时数据库的连接时间相同,则检测多个诊断服务的系统负载;
将系统负载最小的诊断服务获取的运行信息为状态参数最优的运行信息。
5.根据权利要求4所述的分布式系统冗余诊断方法,其特征在于,所述将系统负载最小的诊断服务获取的运行信息为状态参数最优的运行信息包括:
若多个诊断服务与实时数据库的连接时间相同,则检测多个诊断服务的IP地址;
将IP地址最小的诊断服务获取的运行信息为状态参数最优的运行信息。
6.根据权利要求1所述的分布式系统冗余诊断方法,其特征在于,所述诊断所述运行信息,生成诊断操作包括:
诊断所述运行信息中各节点服务的工况参数;
若节点服务的工况参数超出工况阈值,则记录当前的工况参数生成诊断操作,并发出警报提示。
7.根据权利要求1所述的分布式系统冗余诊断方法,其特征在于,所述诊断所述运行信息,生成诊断操作还包括:
诊断所述运行信息中各节点服务的存储空间;
若节点服务的存储空间低于存储阈值,则将该节点服务的存储数据进行转移到外部存储设备或其余节点服务的存储空间。
8.一种分布式系统冗余诊断装置,其特征在于,包括:
组态模块,用于获取组态服务的诊断位号信息,其中,所述诊断位号信息包括多个诊断位号,每个诊断位号对应一个节点服务;
收集模块,用于根据诊断位号信息,通过多个诊断服务分别获取所述诊断位号信息对应节点服务的运行信息;
传输模块,用于将多个运行信息和诊断服务的状态参数发送至实时数据库,以使所述实时数据库根据所述状态参数将所述运行信息进行存储;
诊断模块,用于诊断所述运行信息,生成诊断操作。
9.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行权利要求1至7中任一项所述的分布式系统冗余诊断方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的分布式系统冗余诊断方法的步骤。
CN202111590818.XA 2021-12-23 2021-12-23 分布式系统冗余诊断方法、装置、电子装置和存储介质 Pending CN114356625A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111590818.XA CN114356625A (zh) 2021-12-23 2021-12-23 分布式系统冗余诊断方法、装置、电子装置和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111590818.XA CN114356625A (zh) 2021-12-23 2021-12-23 分布式系统冗余诊断方法、装置、电子装置和存储介质

Publications (1)

Publication Number Publication Date
CN114356625A true CN114356625A (zh) 2022-04-15

Family

ID=81101074

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111590818.XA Pending CN114356625A (zh) 2021-12-23 2021-12-23 分布式系统冗余诊断方法、装置、电子装置和存储介质

Country Status (1)

Country Link
CN (1) CN114356625A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116248548A (zh) * 2023-02-28 2023-06-09 重庆川仪自动化股份有限公司 一种设备诊断方法、系统、电子设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116248548A (zh) * 2023-02-28 2023-06-09 重庆川仪自动化股份有限公司 一种设备诊断方法、系统、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN109768875B (zh) 网络切片的策略管理方法、装置、设备及系统
CA2808239C (en) Determining equivalent subsets of agents to gather information for a fabric
CN104753994A (zh) 基于集群服务器系统的数据同步方法及其装置
CN113364852B (zh) 文件的传输方法、装置和服务器
CN114116172A (zh) 一种流量数据采集方法、装置、设备及存储介质
CN112003721B (zh) 一种大数据平台管理节点高可用的实现方法及装置
CN109656783A (zh) 系统平台监控方法及装置
CN114363144A (zh) 一种面向分布式系统的故障信息关联上报方法及相关设备
CN108512753B (zh) 一种集群文件系统中消息传输的方法及装置
CN114356625A (zh) 分布式系统冗余诊断方法、装置、电子装置和存储介质
CN111342986B (zh) 分布式节点管理方法及装置、分布式系统、存储介质
CN113765690A (zh) 集群切换方法、系统、装置、终端、服务器及存储介质
CN112417050A (zh) 数据同步方法和装置、系统、存储介质及电子装置
CN104657240B (zh) 多内核操作系统的失效控制方法及装置
CN111309515B (zh) 一种容灾控制方法、装置及系统
JP4673532B2 (ja) マルチマネージャ環境における包括アライメントプロセス
CN116886286A (zh) 大数据认证服务自适应方法、装置和设备
CN111935296B (zh) 一种高可用无限mqtt消息服务扩容的系统
CN115705259A (zh) 故障处理方法、相关设备及存储介质
EP3756310B1 (en) Method and first node for managing transmission of probe messages
JP6364203B2 (ja) システムの稼働状態を監視する監視サーバ及び監視サーバの制御方法
CN112328375B (zh) 一种用于跟踪分布式系统的数据片段的关联方法和装置
CN114237510B (zh) 数据处理方法、装置、电子设备及存储介质
CN115150031B (zh) 基于分布式消息的分布式系统消息响应方法及装置
CN116614412A (zh) 终端异常修复方法、装置、系统、存储介质和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination