CN114285722B - 一种分布式存储集群节点通信告警方法、装置、设备及介质 - Google Patents
一种分布式存储集群节点通信告警方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN114285722B CN114285722B CN202111508964.3A CN202111508964A CN114285722B CN 114285722 B CN114285722 B CN 114285722B CN 202111508964 A CN202111508964 A CN 202111508964A CN 114285722 B CN114285722 B CN 114285722B
- Authority
- CN
- China
- Prior art keywords
- node set
- node
- cluster
- abnormal
- communication
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004891 communication Methods 0.000 title claims abstract description 113
- 238000000034 method Methods 0.000 title claims abstract description 32
- 230000002159 abnormal effect Effects 0.000 claims abstract description 182
- 230000005856 abnormality Effects 0.000 claims abstract description 10
- 230000004044 response Effects 0.000 claims description 24
- 238000004590 computer program Methods 0.000 claims description 11
- 238000012217 deletion Methods 0.000 claims description 10
- 230000037430 deletion Effects 0.000 claims description 10
- 230000006870 function Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Abstract
本发明涉及分布式存储领域,尤其涉及一种分布式存储集群节点通信告警方法、装置、设备及介质,所述方法包括:获取分布式存储集群管理节点维护的集群异常节点集合;接收客户端消息,其中,所述客户端消息中包括表征与所述客户端通信正常的第一节点集合和表征与所述客户端通信异常的第二节点集合;基于所述第一节点集合和所述第二节点集合对所述集群异常节点集合进行更新;根据更新后的异常节点集合进行通信异常告警。本发明的方案避免同一个节点上的不同客户端,通信正常的客户端将通信异常的客户端上报的节点通信告警误消除的问题,使得节点通信告警功能的覆盖场景更全面,提高了告警的可靠性。
Description
技术领域
本发明涉及分布式存储领域,尤其涉及一种分布式存储集群节点通信告警方法、装置、设备及介质。
背景技术
客户端网络通信功能主要是通过客户端与存储集群的监控节点建立心跳连接,可以实现对客户端的状态进行监控,并根据客户端的状态进行告警,我们称之为客户端通信告警;同时通过客户端上报的存储集群节点的连接情况,可以实现对客户端与集群之间的网络进行监控和告警,我们称之为节点通信告警。
现有技术背景下,节点通信告警的原理是每个客户端(通常是虚拟机)在给集群发送消息时,会携带该客户端的异常信息,如果本次客户端上报的异常节点和上次上报的异常节点相比,存在新增的通信异常节点,则会上报节点通信告警;如果本次上报的异常节点和上次相比减少了,说明存在之前通信异常的集群节点现在通信已经恢复,则会上报节点通信恢复告警。但在大规模分布式存储集群的应用场景下,通常每个客户端计算节点上会创建多个客户端。如果相同计算节点上的不同客户端向不同的存储池中读写数据,其中某个存储池中的某个集群节点异常导致落在该节点上的读写操作无法正常完成,则该计算节点会将该集群节点放入异常中,进而上报节点通信告警。但此时该计算节点上的其他客户端是可以正常进行业务读写的,因此其他客户端上报的异常值就会为空值,新上报的消息中所包含的异常信息会将之前的异常内容覆盖掉,导致该计算节点又会将自己刚刚上报的节点通信告警消除掉,周而复始,从而产生节点通信告警震荡的问题。
发明内容
有鉴于此,有必要针对以上技术问题,提供一种分布式存储集群节点通信告警。
根据本发明的第一方面,提供了一种分布式存储集群节点通信告警方法,所述方法包括:
获取分布式存储集群管理节点维护的集群异常节点集合;
接收客户端消息,其中,所述客户端消息中包括表征与所述客户端通信正常的第一节点集合和表征与所述客户端通信异常的第二节点集合;
基于所述第一节点集合和所述第二节点集合对所述集群异常节点集合进行更新;
根据更新后的异常节点集合进行通信异常告警。
在一些实施例中,所述基于所述第一节点集合和所述第二节点集合对所述集群异常节点集合进行更新的步骤包括:
根据所述第一节点集合对所述集群异常节点集合进行节点删除;
根据所述第二节点集合对所述集群异常节点集合进行节点添加。
在一些实施例中,所述根据所述第一节点集合对所述集群异常节点集合进行节点删除的步骤包括:
判断所述第一节点集合与所述集群异常节点集合是否存在交集;
响应于所述第一节点集与合所述集群异常节点集合存在交集,则将所述交集对应的节点从所述集群异常节点集合中的剔除。
在一些实施例中,所述根据所述第二节点集合对所述集群异常节点集合进行节点添加的步骤包括:
响应于所述第一节点集与合所述集群异常节点集合不存在交集,则判断所述第二节点集合与所述集群异常节点集合是否存在差集;
响应于所述第二节点集合与所述集群异常节点集合存在差集,则将所述差集对应节点插入到所述集群异常节点集合中。
根据本发明的第二方面,提供了一种分布式存储集群节点通信告警装置,所述装置包括:
获取模块,配置用于获取分布式存储集群管理节点维护的集群异常节点集合;
消息接收模块,配置用于接收客户端消息,其中,所述客户端消息中包括表征与所述客户端通信正常的第一节点集合和表征与所述客户端通信异常的第二节点集合;
更新模块,配置用于基于所述第一节点集合和所述第二节点集合对所述集群异常节点集合进行更新;
告警模块,配置用于根据更新后的异常节点集合进行通信异常告警。
在一些实施例中,所述更新模块进一步包括:
删除模块,配置用于根据所述第一节点集合对所述集群异常节点集合进行节点删除;
添加模块,配置用于根据所述第二节点集合对所述集群异常节点集合进行节点添加。
在一些实施例中,所述删除模块进一步包括:
第一判断模块,配置用于判断所述第一节点集合与所述集群异常节点集合是否存在交集;
剔除模块,配置用于响应于所述第一节点集与合所述集群异常节点集合存在交集,则将所述交集对应的节点从所述集群异常节点集合中的剔除。
在一些实施例中,所述添加模块进一步包括:
第二判断模块,配置用于响应于所述第一节点集与合所述集群异常节点集合不存在交集,则判断所述第二节点集合与所述集群异常节点集合是否存在差集;
插入模块,配置用于响应于所述第二节点集合与所述集群异常节点集合存在差集,则将所述差集对应节点插入到所述集群异常节点集合中。
根据本发明的第三方面,还提供了一种计算机设备,该计算机设备包括:
至少一个处理器;以及
存储器,存储器存储有可在处理器上运行的计算机程序,处理器执行程序时执行前述的分布式存储集群节点通信告警方法,所述方法包括:
获取分布式存储集群管理节点维护的集群异常节点集合;
接收客户端消息,其中,所述客户端消息中包括表征与所述客户端通信正常的第一节点集合和表征与所述客户端通信异常的第二节点集合;
基于所述第一节点集合和所述第二节点集合对所述集群异常节点集合进行更新;
根据更新后的异常节点集合进行通信异常告警。
根据本发明的第四方面,还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时执行前述的分布式存储集群节点通信告警方法,所述方法包括:
获取分布式存储集群管理节点维护的集群异常节点集合;
接收客户端消息,其中,所述客户端消息中包括表征与所述客户端通信正常的第一节点集合和表征与所述客户端通信异常的第二节点集合;
基于所述第一节点集合和所述第二节点集合对所述集群异常节点集合进行更新;
根据更新后的异常节点集合进行通信异常告警。
上述一种分布式存储集群节点通信告警方法,通过获取分布式存储集群管理节点维护的集群异常节点集合,进而接收客户端消息,该客户端消息中包括表征与客户端通信正常的第一节点集合和表征与客户端通信异常的第二节点集合,基于该第一节点集合和第二节点集合对集群异常节点集合进行更新,最后根据更新后的集群异常节点集合进行通信异常告警,通过在客户端消息中增加表征正常通信的第一节点集合,取代了传统方案中仅采用表征异常通信的节点集合的方式,避免同一个节点上的不同客户端,通信正常的客户端将通信异常的客户端上报的节点通信告警误消除的问题,使得节点通信告警功能的覆盖场景更全面,提高了告警的可靠性。
此外,本发明提供的一种分布式存储集群节点通信告警装置、一种计算机设备和一种计算机可读存储介质,同样能实现上述技术效果,这里不再赘述。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
图1为本发明一个实施例提供的一种分布式存储集群节点通信告警方法100的流程示意图;
图2为本发明另一个实施例提供的又一种分布式存储集群节点通信告警方法200的流程示意图;
图3为本发明另一个实施例提供的一种分布式存储集群节点通信告警装置300的结构示意图;
图4为本发明另一个实施例中计算机设备的内部结构图;以及
图5为本发明提供的计算机可读存储介质的一实施例的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。
需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。
在一个实施例中,请参照图1所示,本发明提供了一种分布式存储集群节点通信告警方法,具体来说该分布式存储集群节点通信告警方法包括以下步骤:
步骤101,获取分布式存储集群管理节点维护的集群异常节点集合;
在本实施例中,集群异常节点集合是管理节点用于维护集群内各个异常状态的集合,该集合可以采用存储异常节点的IP地址的方式区分不同节点,举例来说假设分布式存储集群中有十个节点,其中有三个节点异常,此时管理节点可以将以上三个异常节点的IP地址存放在集群异常节点集合中。
步骤102,接收客户端消息,其中,所述客户端消息中包括表征与所述客户端通信正常的第一节点集合和表征与所述客户端通信异常的第二节点集合;
在本实施例中,客户端消息是指客户端与集群之间进行交互的消息,通常记作Message;客户端消息中包括第一节点集合和第二节点集合,第一节点集合记作normal,normal是指存放客户端认为处于通信正常状态的集群节点的数据结构,第二节点集合记作abnormal,abnormal是指存放客户端认为处于通信异常状态的集群节点的数据结构。
步骤103,基于所述第一节点集合和所述第二节点集合对所述集群异常节点集合进行更新;
步骤104,根据更新后的异常节点集合进行通信异常告警。
上述一种分布式存储集群节点通信告警方法,通过获取分布式存储集群管理节点维护的集群异常节点集合,进而接收客户端消息,该客户端消息中包括表征与客户端通信正常的第一节点集合和表征与客户端通信异常的第二节点集合,基于该第一节点集合和第二节点集合对集群异常节点集合进行更新,最后根据更新后的集群异常节点集合进行通信异常告警,通过在客户端消息中增加表征正常通信的第一节点集合,取代了传统方案中仅采用表征异常通信的节点集合的方式,避免同一个节点上的不同客户端,通信正常的客户端将通信异常的客户端上报的节点通信告警误消除的问题,使得节点通信告警功能的覆盖场景更全面,提高了告警的可靠性。
在一些实施例中,前述步骤103包括:
步骤1031,根据所述第一节点集合对所述集群异常节点集合进行节点删除;
步骤1032,根据所述第二节点集合对所述集群异常节点集合进行节点添加。
在一些实施例中,前述步骤1031具体包括:
判断所述第一节点集合与所述集群异常节点集合是否存在交集;
响应于所述第一节点集与合所述集群异常节点集合存在交集,则将所述交集对应的节点从所述集群异常节点集合中的剔除。
在一些实施例中,前述步骤1032具体包括:
响应于所述第一节点集与合所述集群异常节点集合不存在交集,则判断所述第二节点集合与所述集群异常节点集合是否存在差集;
响应于所述第二节点集合与所述集群异常节点集合存在差集,则将所述差集对应节点插入到所述集群异常节点集合中。
在又一个实施例中,请参照图2所示,图2示出了本发明另一个实施例提供的又一种分布式存储集群节点通信告警方法,在每个客户端给集群管理节点发送客户端消息时,在客户端消息中增加数据结构normal,用来保存对于当前客户端通信正常的集群节点。集群侧管理节点在收到客户端消息后,将管理节点保存的上次的集群异常节点与客户端新发送的消息中携带的normal进行对比,如果两者存在交集,说明存在之前通信异常的集群节点现在已经恢复,则将集群保存的集群异常节点进行更新:把已经恢复的节点IP从集群异常节点中去掉,把客户端消息中新增通信异常节点插入进去,具体来说该方法包括以下步骤:
步骤201:管理节点接收客户端发送的客户端消息;
步骤202,遍历客户端消息中数据结构normal包含的节点IP地址,并在管理节点上保存的集群异常节点集合中寻找该IP地址;
步骤203,判断管理节点保存的集群异常节点集合与消息中normal是否存在交集,如果存在则前进到步骤204,如果不存在则前进到步骤205;
步骤204,管理节点保存的集群异常节点集合与消息中normal存在交集则确认存在通信异常节点恢复,将该IP地址从管理节点维护的集群异常节点集合中删除,并前执行步骤205;
步骤205,将消息中数据结构abnormal包含的节点IP地址插入到管理节点维护的集群异常节点集合中;
步骤206,根据管理节点保存的更新后的集群异常节点集合进行节点通信告警的上报和消除;
步骤207,节点通信告警完成。
上述一种分布式存储集群节点通信告警方法,避免同一个计算节点上的不同客户端,通信正常的客户端将通信异常的客户端上报的节点通信告警误消除的问题,由于在客户端给管理节点发送的消息中增加了normal,使用通过客户端消息中包含的normal信息和abnormal信息共同更新管理节点保存的集群异常节点集合的策略取代了现有的单纯根据消息中的异常节节点来覆盖管理节点保存的集群异常节点集合的方法,使得节点通信告警功能的覆盖场景更全面,提高了告警的可靠性。
在一些实施例中,请参照图3所示,本发明还提供了一种分布式存储集群节点通信告警装置300,具体来说所述分布式存储集群节点通信告警装置300包括:
获取模块301,所述获取模块301配置用于获取分布式存储集群管理节点维护的集群异常节点集合;
消息接收模块302,所述消息接收模块302配置用于接收客户端消息,其中,所述客户端消息中包括表征与所述客户端通信正常的第一节点集合和表征与所述客户端通信异常的第二节点集合;
更新模块303,所述更新模块303配置用于基于所述第一节点集合和所述第二节点集合对所述集群异常节点集合进行更新;
告警模块304,所述告警模块304配置用于根据更新后的异常节点集合进行通信异常告警。
上述一种分布式存储集群节点通信告警装置,通过获取分布式存储集群管理节点维护的集群异常节点集合,进而接收客户端消息,该客户端消息中包括表征与客户端通信正常的第一节点集合和表征与客户端通信异常的第二节点集合,基于该第一节点集合和第二节点集合对集群异常节点集合进行更新,最后根据更新后的集群异常节点集合进行通信异常告警,通过在客户端消息中增加表征正常通信的第一节点集合,取代了传统方案中仅采用表征异常通信的节点集合的方式,避免同一个节点上的不同客户端,通信正常的客户端将通信异常的客户端上报的节点通信告警误消除的问题,使得节点通信告警功能的覆盖场景更全面,提高了告警的可靠性。
在一些实施例中,所述更新模块进一步包括:
删除模块,所述删除模块配置用于根据所述第一节点集合对所述集群异常节点集合进行节点删除;
添加模块,所述添加模块配置用于根据所述第二节点集合对所述集群异常节点集合进行节点添加。
在一些实施例中,所述删除模块进一步包括:
第一判断模块,所述第一判断模块配置用于判断所述第一节点集合与所述集群异常节点集合是否存在交集;
剔除模块,所述剔除模块配置用于响应于所述第一节点集与合所述集群异常节点集合存在交集,则将所述交集对应的节点从所述集群异常节点集合中的剔除。
在一些实施例中:所述添加模块进一步包括:
第二判断模块,所述第二判断模块配置用于响应于所述第一节点集与合所述集群异常节点集合不存在交集,则判断所述第二节点集合与所述集群异常节点集合是否存在差集;
插入模块,所述插入模块配置用于响应于所述第二节点集合与所述集群异常节点集合存在差集,则将所述差集对应节点插入到所述集群异常节点集合中。
需要说明的是,关于分布式存储集群节点通信告警装置的具体限定可以参见上文中对分布式存储集群节点通信告警方法的限定,在此不再赘述。上述分布式存储集群节点通信告警装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
根据本发明的另一方面,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图请参照图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时实现以上所述的分布式存储集群节点通信告警方法,具体来说,所述方法包括以下步骤:
获取分布式存储集群管理节点维护的集群异常节点集合;
接收客户端消息,其中,所述客户端消息中包括表征与所述客户端通信正常的第一节点集合和表征与所述客户端通信异常的第二节点集合;
基于所述第一节点集合和所述第二节点集合对所述集群异常节点集合进行更新;
根据更新后的异常节点集合进行通信异常告警。
在一些实施例中,所述基于所述第一节点集合和所述第二节点集合对所述集群异常节点集合进行更新的步骤包括:
根据所述第一节点集合对所述集群异常节点集合进行节点删除;
根据所述第二节点集合对所述集群异常节点集合进行节点添加。
在一些实施例中,所述根据所述第一节点集合对所述集群异常节点集合进行节点删除的步骤包括:
判断所述第一节点集合与所述集群异常节点集合是否存在交集;
响应于所述第一节点集与合所述集群异常节点集合存在交集,则将所述交集对应的节点从所述集群异常节点集合中的剔除。
在一些实施例中,所述根据所述第二节点集合对所述集群异常节点集合进行节点添加的步骤包括:
响应于所述第一节点集与合所述集群异常节点集合不存在交集,则判断所述第二节点集合与所述集群异常节点集合是否存在差集;
响应于所述第二节点集合与所述集群异常节点集合存在差集,则将所述差集对应节点插入到所述集群异常节点集合中。
根据本发明的又一方面,如图5所示,提供了一种计算机可读存储介质40,其上存储有计算机程序410,该计算机程序410被处理器执行时实现以上所述的分布式存储集群节点通信告警方法,具体来说,包括执行以下步骤:
获取分布式存储集群管理节点维护的集群异常节点集合;
接收客户端消息,其中,所述客户端消息中包括表征与所述客户端通信正常的第一节点集合和表征与所述客户端通信异常的第二节点集合;
基于所述第一节点集合和所述第二节点集合对所述集群异常节点集合进行更新;
根据更新后的异常节点集合进行通信异常告警。
在一些实施例中,所述基于所述第一节点集合和所述第二节点集合对所述集群异常节点集合进行更新的步骤包括:
根据所述第一节点集合对所述集群异常节点集合进行节点删除;
根据所述第二节点集合对所述集群异常节点集合进行节点添加。
在一些实施例中,所述根据所述第一节点集合对所述集群异常节点集合进行节点删除的步骤包括:
判断所述第一节点集合与所述集群异常节点集合是否存在交集;
响应于所述第一节点集与合所述集群异常节点集合存在交集,则将所述交集对应的节点从所述集群异常节点集合中的剔除。
在一些实施例中,所述根据所述第二节点集合对所述集群异常节点集合进行节点添加的步骤包括:
响应于所述第一节点集与合所述集群异常节点集合不存在交集,则判断所述第二节点集合与所述集群异常节点集合是否存在差集;
响应于所述第二节点集合与所述集群异常节点集合存在差集,则将所述差集对应节点插入到所述集群异常节点集合中。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (4)
1.一种分布式存储集群节点通信告警方法,其特征在于,所述方法包括:
获取分布式存储集群管理节点维护的集群异常节点集合;
接收客户端消息,其中,所述客户端消息中包括表征与所述客户端通信正常的第一节点集合和表征与所述客户端通信异常的第二节点集合;
基于所述第一节点集合和所述第二节点集合对所述集群异常节点集合进行更新;
根据更新后的异常节点集合进行通信异常告警;
所述基于所述第一节点集合和所述第二节点集合对所述集群异常节点集合进行更新的步骤包括:
根据所述第一节点集合对所述集群异常节点集合进行节点删除;
根据所述第二节点集合对所述集群异常节点集合进行节点添加;
所述根据所述第一节点集合对所述集群异常节点集合进行节点删除的步骤包括:
判断所述第一节点集合与所述集群异常节点集合是否存在交集;
响应于所述第一节点集与合所述集群异常节点集合存在交集,则将所述交集对应的节点从所述集群异常节点集合中的剔除;
所述根据所述第二节点集合对所述集群异常节点集合进行节点添加的步骤包括:
响应于所述第一节点集合与所述集群异常节点集合不存在交集,则判断所述第二节点集合与所述集群异常节点集合是否存在差集;
响应于所述第二节点集合与所述集群异常节点集合存在差集,则将所述差集对应节点插入到所述集群异常节点集合中。
2.一种分布式存储集群节点通信告警装置,其特征在于,所述装置包括:
获取模块,所述获取模块配置用于获取分布式存储集群管理节点维护的集群异常节点集合;
消息接收模块,所述消息接收模块配置用于接收客户端消息,其中,所述客户端消息中包括表征与所述客户端通信正常的第一节点集合和表征与所述客户端通信异常的第二节点集合;
更新模块,所述更新模块配置用于基于所述第一节点集合和所述第二节点集合对所述集群异常节点集合进行更新;
告警模块,所述告警模块配置用于根据更新后的异常节点集合进行通信异常告警;
所述更新模块进一步包括:
删除模块,所述删除模块配置用于根据所述第一节点集合对所述集群异常节点集合进行节点删除;
添加模块,所述添加模块配置用于根据所述第二节点集合对所述集群异常节点集合进行节点添加;
所述删除模块进一步包括:
第一判断模块,所述第一判断模块配置用于判断所述第一节点集合与所述集群异常节点集合是否存在交集;
剔除模块,所述剔除模块配置用于响应于所述第一节点集与合所述集群异常节点集合存在交集,则将所述交集对应的节点从所述集群异常节点集合中的剔除;
所述添加模块进一步包括:
第二判断模块,所述第二判断模块配置用于响应于所述第一节点集合与所述集群异常节点集合不存在交集,则判断所述第二节点集合与所述集群异常节点集合是否存在差集;
插入模块,所述插入模块配置用于响应于所述第二节点集合与所述集群异常节点集合存在差集,则将所述差集对应节点插入到所述集群异常节点集合中。
3.一种计算机设备,其特征在于,包括:
至少一个处理器;以及
存储器,所述存储器存储有可在所述处理器中运行的计算机程序,所述处理器执行所述程序时执行权利要求1所述的分布式存储集群节点通信告警方法。
4.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时执行权利要求1所述的分布式存储集群节点通信告警方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111508964.3A CN114285722B (zh) | 2021-12-10 | 2021-12-10 | 一种分布式存储集群节点通信告警方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111508964.3A CN114285722B (zh) | 2021-12-10 | 2021-12-10 | 一种分布式存储集群节点通信告警方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114285722A CN114285722A (zh) | 2022-04-05 |
CN114285722B true CN114285722B (zh) | 2023-08-25 |
Family
ID=80871671
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111508964.3A Active CN114285722B (zh) | 2021-12-10 | 2021-12-10 | 一种分布式存储集群节点通信告警方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114285722B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109257195A (zh) * | 2017-07-12 | 2019-01-22 | 华为技术有限公司 | 集群中节点的故障处理方法及设备 |
CN112686717A (zh) * | 2021-03-11 | 2021-04-20 | 腾讯科技(深圳)有限公司 | 一种广告召回的数据处理方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014165538A2 (en) * | 2013-04-01 | 2014-10-09 | Nebula, Inc. | Update management for a distributed computing system |
-
2021
- 2021-12-10 CN CN202111508964.3A patent/CN114285722B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109257195A (zh) * | 2017-07-12 | 2019-01-22 | 华为技术有限公司 | 集群中节点的故障处理方法及设备 |
CN112686717A (zh) * | 2021-03-11 | 2021-04-20 | 腾讯科技(深圳)有限公司 | 一种广告召回的数据处理方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN114285722A (zh) | 2022-04-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110750267B (zh) | 业务信息更新方法、装置、计算机设备和存储介质 | |
CN112463448B (zh) | 分布式集群数据库同步方法、装置、设备及存储介质 | |
CN108897658B (zh) | 主数据库监控方法、装置、计算机设备和存储介质 | |
CN114124655A (zh) | 网络监控方法、系统、装置、计算机设备和存储介质 | |
US11281446B2 (en) | Updating method, terminal and electronic device | |
CN110727698A (zh) | 数据库访问方法、装置、计算机设备和存储介质 | |
CN112613993A (zh) | 交易数据处理方法、装置、计算机设备和存储介质 | |
CN111198921A (zh) | 数据库的切换方法、装置、计算机设备和存储介质 | |
CN114285722B (zh) | 一种分布式存储集群节点通信告警方法、装置、设备及介质 | |
CN114172785A (zh) | 告警信息处理方法、装置、设备和存储介质 | |
CN109857344B (zh) | 基于共享内存的心跳状态判断方法、装置和计算机设备 | |
CN112070585A (zh) | 订单状态统一管理方法、装置、计算机设备和存储介质 | |
CN113778763B (zh) | 一种三方接口服务故障智能切换方法及系统 | |
CN107959595B (zh) | 一种异常检测的方法、装置及系统 | |
CN114064674A (zh) | 数据同步方法、装置、计算机设备、存储介质和产品 | |
CN111258860B (zh) | 数据告警方法、装置、计算机设备和存储介质 | |
CN114528350A (zh) | 集群脑裂的处理方法、装置、设备及可读存储介质 | |
CN113157493A (zh) | 基于检票系统的备份方法、装置、系统和计算机设备 | |
CN113808725A (zh) | 设备预警系统和方法 | |
CN111681397A (zh) | 一种配网自动化短信发送方法、发送系统和存储介质 | |
CN113485865B (zh) | 基于正向代理服务器访问第三方应用的数据处理系统 | |
CN114281578B (zh) | 分布式文件存储系统交互方法、装置、计算机设备及介质 | |
CN115334000B (zh) | 基于多控存储系统的数据传输方法、装置、设备及介质 | |
CN114666401B (zh) | 设备信息处理方法、装置、计算机设备和存储介质 | |
CN115473793B (zh) | 一种集群ei主机环境自动恢复方法、装置、终端及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |