CN117319276A - 设备监控方法、装置、设备及存储介质 - Google Patents
设备监控方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN117319276A CN117319276A CN202311271514.6A CN202311271514A CN117319276A CN 117319276 A CN117319276 A CN 117319276A CN 202311271514 A CN202311271514 A CN 202311271514A CN 117319276 A CN117319276 A CN 117319276A
- Authority
- CN
- China
- Prior art keywords
- data
- equipment
- monitoring
- server
- service cluster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 210
- 238000000034 method Methods 0.000 title claims abstract description 52
- 230000002159 abnormal effect Effects 0.000 claims description 25
- 238000013500 data storage Methods 0.000 claims description 19
- 230000009471 action Effects 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 13
- 230000000007 visual effect Effects 0.000 claims description 4
- 230000006870 function Effects 0.000 claims description 3
- 238000012545 processing Methods 0.000 description 16
- 230000008569 process Effects 0.000 description 9
- 230000007246 mechanism Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000001360 synchronised effect Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 239000010979 ruby Substances 0.000 description 1
- 229910001750 ruby Inorganic materials 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/50—Testing arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/04—Network management architectures or arrangements
- H04L41/045—Network management architectures or arrangements comprising client-server management architectures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1095—Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1097—Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Debugging And Monitoring (AREA)
Abstract
本申请公开了一种设备监控方法、装置、设备及存储介质,涉及计算机技术领域。应用于基于远程字典服务集群的设备监控系统,该方法包括:获取服务端配置的需要采集设备数据的目标客户端,并定期采集所述目标客户端所在设备的设备数据;控制所述设备监控系统中数据接收组件集群的数据接收节点将所述设备数据存储至远程字典服务集群的主服务器,以便所述主服务器将所述设备数据发布至所述远程字典服务集群中订阅了所述主服务器的不同从服务器;实时监控所述远程字典服务集群并生成与所述目标客户端所在设备对应的监控数据,以将所述监控数据发送至所述服务端进行设备监控。通过本申请的技术方案,可以实现对服务器、终端等设备的全面监控。
Description
技术领域
本发明涉及计算机技术领域,特别涉及一种设备监控方法、装置、设备及存储介质。
背景技术
随着互联网的快速发展,服务器与终端设备的数量和规模不断扩大,给设备的监控和管理带来了巨大的挑战。传统的设备监控系统通常使用关系数据库来存储设备状态和性能数据,但在大规模服务器集群中,关系数据库的性能和扩展性存在局限性。因此,开发一种能够实现对服务器、终端等设备的全面监控的设备监控系统显得尤为重要。
发明内容
有鉴于此,本发明的目的在于提供一种设备监控方法、装置、设备及存储介质,能够提供高性能、高可用性的数据存储和实时数据处理能力,实现对服务器、终端等设备的全面监控。其具体方案如下:
第一方面,本申请公开了一种设备监控方法,应用于基于远程字典服务集群的设备监控系统,包括:
获取服务端配置的需要采集设备数据的目标客户端,并定期采集所述目标客户端所在设备的设备数据;
控制所述设备监控系统中数据接收组件集群的数据接收节点将所述设备数据存储至远程字典服务集群的主服务器,以便所述主服务器将所述设备数据发布至所述远程字典服务集群中订阅了所述主服务器的不同从服务器;
实时监控所述远程字典服务集群并生成与所述目标客户端所在设备对应的监控数据,以将所述监控数据发送至所述服务端进行设备监控。
可选的,所述定期采集所述目标客户端所在设备的设备数据,包括:
定期采集所述目标客户端所在设备的用于表征设备运行状态的状态数据、用于表征设备运行基本条件的基础数据以及用于表征设备特性功能的性能数据。
可选的,所述定期采集所述目标客户端所在设备的设备数据之后,还包括:
通过用户数据报协议将所述设备数据进行发送处理,并将生成的用户数据报协议包发送至所述设备监控系统中数据接收组件集群的数据接收节点;
相应的,所述控制所述设备监控系统中数据接收组件集群的数据接收节点将所述设备数据存储至远程字典服务集群的主服务器,包括:
控制所述设备监控系统中数据接收组件集群的数据接收节点将所述用户数据报协议包存储至远程字典服务集群的主服务器。
可选的,所述控制所述设备监控系统中数据接收组件集群的数据接收节点将所述设备数据存储至远程字典服务集群的主服务器,包括:
当通过所述设备监控系统中数据接收组件集群的数据接收节点获取到所述设备数据后,触发第一数据存储动作以控制所述数据接收节点将所述设备数据存储至远程字典服务集群的主服务器;
基于预设时间周期,通过所述数据接收节点定期读取所述主服务器中对应设备的当前设备数据并对所述当前设备数据进行优化,然后触发第二数据存储动作以控制所述数据接收节点将优化后的所述当前设备数据存储至所述主服务器。
可选的,所述控制所述设备监控系统中数据接收组件集群的数据接收节点将所述设备数据存储至远程字典服务集群的主服务器,以便所述主服务器将所述设备数据发布至所述远程字典服务集群中订阅了所述主服务器的不同从服务器之后,还包括:
当所述主服务器故障时,在所述从服务器中确定目标从服务器以将所述目标从服务器作为当前新的主服务器。
可选的,所述实时监控所述远程字典服务集群并生成与所述目标客户端所在设备对应的监控数据,以将所述监控数据发送至所述服务端进行设备监控,包括:
实时监控所述远程字典服务集群并生成与所述目标客户端所在设备对应的监控数据;
将所述监控数据发送至所述服务端,以便所述服务端将所述监控数据存储至预设数据库并对所述监控数据进行可视化展示。
可选的,所述实时监控所述远程字典服务集群并生成与所述目标客户端所在设备对应的监控数据,以将所述监控数据发送至所述服务端进行设备监控,包括:
实时监控所述远程字典服务集群,并根据预先设置的告警规则判断所述远程字典服务集群的所述主服务器中的所述设备数据是否存在异常;
如果所述设备数据存在异常,则确定异常客户端并生成与所述异常客户端所在设备对应的告警信息,以将所述告警信息发送至所述服务端;
如果所述设备数据不存在异常,则将当前生成的所述设备数据发送至所述服务端,以利用当前生成的所述设备数据对所述服务端中的历史设备数据进行实时更新。
第二方面,本申请公开了一种设备监控装置,应用于基于远程字典服务集群的设备监控系统,包括:
数据采集模块,用于获取服务端配置的需要采集设备数据的目标客户端,并定期采集所述目标客户端所在设备的设备数据;
数据同步模块,用于控制所述设备监控系统中数据接收组件集群的数据接收节点将所述设备数据存储至远程字典服务集群的主服务器,以便所述主服务器将所述设备数据发布至所述远程字典服务集群中订阅了所述主服务器的不同从服务器;
设备监控模块,用于实时监控所述远程字典服务集群并生成与所述目标客户端所在设备对应的监控数据,以将所述监控数据发送至所述服务端进行设备监控。
第三方面,本申请公开了一种电子设备,所述电子设备包括处理器和存储器;其中,所述存储器用于存储计算机程序,所述计算机程序由所述处理器加载并执行以实现如前所述的设备监控方法。
第四方面,本申请公开了一种计算机可读存储介质,用于存储计算机程序;其中所述计算机程序被处理器执行时实现如前所述的设备监控方法。
本申请提供了一种设备监控方法,应用于基于远程字典服务集群的设备监控系统,该方法包括:获取服务端配置的需要采集设备数据的目标客户端,并定期采集所述目标客户端所在设备的设备数据;控制所述设备监控系统中数据接收组件集群的数据接收节点将所述设备数据存储至远程字典服务集群的主服务器,以便所述主服务器将所述设备数据发布至所述远程字典服务集群中订阅了所述主服务器的不同从服务器;实时监控所述远程字典服务集群并生成与所述目标客户端所在设备对应的监控数据,以将所述监控数据发送至所述服务端进行设备监控。本发明的有益技术效果为:本发明通过采用基于远程字典服务集群的设备监控系统实现对设备的监控,一方面,采用远程字典服务集群作为数据存储和处理引擎,能够实现了高性能的数据读写和实时处理能力,能够处理大规模服务器设备的监控数据;另一方面,远程字典服务集群采用分布式架构,保证了数据的高可用性和冗余备份,提供了更高的系统可靠性和容错能力。由于远程字典服务集群具备良好的水平扩展性,因此该监控系统可以方便地扩展和适应不断增长的服务器设备规模。远程字典服务集群支持主从同步,数据可以从主服务器向任意数量的从服务器上同步,从服务器可以是关联其他从服务器的主服务器。由于完全实现了发布/订阅机制,使得从服务器可针对订阅的频道接收主服务器完整的消息发布记录,同步对读取操作的可扩展性和数据冗余很有帮助。另外,监控系统能够将生成的监控数据发送到服务端,实现设备的实时全面监控,及时发现设备故障和异常情况。
此外,本申请提供的一种设备监控装置、设备及存储介质,与上述设备监控方法对应,效果同上。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请公开的一种设备监控方法流程图;
图2为本申请公开的一种具体的设备监控方法流程图;
图3为本申请公开的一种设备监控系统模块流转示意图;
图4为本申请公开的一种设备监控装置结构示意图;
图5为本申请公开的一种电子设备结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
当前,设备监控系统通常使用关系型数据库来存储维护服务器与终端等设备的基础设备信息。然而,随着设备数量的增加,数据库的性能可能会受到限制,往往需要进行适当的索引、分区和优化以提高性能,但扩展性仍然存在限制;并且,关系型数据库需要设计和维护复杂的数据模型,包括表和关系。数据结构的改变和调整通常需要对数据库模式进行修改和迁移操作;关系型数据库通常需要较大的存储空间来存储索引、约束和其他元数据,尤其在处理大规模数据时,这可能导致存储成本的增加。
为此,本申请提供了一种设备监控方案,能够提供高性能、高可用性的数据存储和实时数据处理能力,实现对服务器、终端等设备的全面监控。
本发明实施例公开了一种设备监控方法,应用于基于远程字典服务集群的设备监控系统,参见图1所示,该方法包括:
步骤S11:获取服务端配置的需要采集设备数据的目标客户端,并定期采集所述目标客户端所在设备的设备数据。
本申请实施例中,设备监控系统通过在服务器集群中部署远程字典服务(RemoteDictionary Server,Redis)集群,提供高性能、高可用性的数据存储和实时数据处理能力,实现对服务器、终端等设备的全面监控。Redis是一个高性能的key-value(键-值)数据库。Redis的出现很大程度补偿了Memcached(分布式的高速缓存系统)这类key/value存储的不足,在部分场合可以对关系数据库起到很好的补充作用。它提供了Java、C/C++、C#、PHP、JavaScript、Perl、Object-C、Python、Ruby、Erlang等客户端,使用很方便。
本申请实施例中,服务端为用于配置所辖设备,即需要监控的客户端对应设备的主服务端。通过服务端可以确定需要采集设备数据的目标客户端,然后定期采集目标客户端所在设备的设备数据。具体的,目标客户端的设备数据是用于表征设备运行状态的状态数据、用于表征设备运行基本条件的基础数据以及用于表征设备特性功能的性能数据。例如,定期采集设备的状态数据来判断设备处于在线状态还是离线状态;定期采集设备的操作系统内核、版本等基础数据;定期采集设备的CPU(Central Processing Unit,中央处理器)、内存、磁盘速率等性能数据。
步骤S12:控制所述设备监控系统中数据接收组件集群的数据接收节点将所述设备数据存储至远程字典服务集群的主服务器,以便所述主服务器将所述设备数据发布至所述远程字典服务集群中订阅了所述主服务器的不同从服务器。
本申请实施例中,当采集了目标客户端所在设备的设备数据之后,设备监控系统中的数据接收组件集群则用来接收这些设备数据并对其进行处理。需要指出的是,采集到的设备数据通过用户数据报协议(User Datagram Protocol,UDP)进行发送处理发送到数据接收组件集群,因此,数据接收组件集群旨在处理大量的UDP数据流。数据接收组件集群由多个数据接收节点组成,每个数据接收节点都可以独立的接收用户数据报协议包,因此,生成的用户数据报协议包将发送到数据接收组件集群中的各个数据接收节点。
本申请实施例中,数据接收组件集群中的各个数据接收节点会将接收到的用户数据报协议包存储到远程字典服务集群的主服务器中。远程字典服务集群是一个由多个主从节点群组成的分布式服务集群,节点群分为主节点和从节点,只有主节点的主服务器负责集群信息的维护信息,因此所有数据接收节点的数据仅发送给主服务器。
本申请实施例中,远程字典服务集群中的主服务器与从服务器之间基于发布与订阅的机制。也即,当从节点订阅了主节点的一个消息主题后,在主节点发布消息时从节点将同步接收到主节点发布的消息。因此,由于完全实现了发布/订阅机制,使得从服务器在任何地方同步树时可订阅一个频道并接收主服务器完整的消息发布记录。同步对读取操作的可扩展性和数据冗余很有帮助。
可以理解的是,由于远程字典服务集群支持主从同步,数据可以从主服务器向任意数量的从服务器上同步,从服务器可以是关联其他从服务器的主服务器,因此,从节点只进行主节点数据和状态信息的复制。如此一来,远程字典服务集群将数据分散到多个节点,突破了单机内存的限制。另外,远程字典服务集群可执行单层树复制,存盘可以有意无意的对数据进行写操作。因此,远程字典服务集群中每一个主节点都能够对外提供读写服务,大大提高了集群的响应能力。
另外,远程字典服务集群支持主节点的自动故障转移,当任意节点发生故障时,集群仍然可以对外提供服务。在一种具体的实施方式中,当所述主服务器故障时,在所述从服务器中确定目标从服务器以将所述目标从服务器作为当前新的主服务器,继续对外提供服务。
步骤S13:实时监控所述远程字典服务集群并生成与所述目标客户端所在设备对应的监控数据,以将所述监控数据发送至所述服务端进行设备监控。
本申请实施例中,实时对远程字典服务集群进行监控,这样设备监控系统就能够及时采集和处理客户端对应设备的状态和性能信息。需要指出的是,针对每个客户端对应的设备都有相应的设备监控参数标识,根据设备监控参数标识可以获取客户端对应设备的设备数据。例如,可以从远程字典服务集群中获取设备的在线状态数据、基本数据、性能数据等。
进一步的,设备监控系统中预先设置了告警规则。根据该告警规则可以判断所述远程字典服务集群的所述主服务器中的所述设备数据是否存在异常。例如,根据告警规则可对客户端对应设备的CPU、内存、磁盘、网络流量等数据进行实时分析和比较。
在一种具体的实施方式中,如果所述设备数据存在异常,则确定异常客户端并生成与所述异常客户端所在设备对应的告警信息,以将所述告警信息发送至所述服务端;此时的监控数据包括发现异常情况的客户端对应的设备以及告警信息。将此监控数据发送至服务端,能够及时的通知给相关人员针对故障设备进行处理。
在另一种具体的实施方式中,如果所述设备数据不存在异常,则将当前生成的所述设备数据发送至所述服务端,以利用当前生成的所述设备数据对所述服务端中的历史设备数据进行实时更新。可以理解的是,如果当前设备不存在异常情况,将会进行数据实时更新,设备数据也会可视化的展示在服务端,使得相关工作人员能够对设备各方面的数据进行实时监控,及时发现设备故障和异常情况。
本申请提供了一种设备监控方法,应用于基于远程字典服务集群的设备监控系统,该方法包括:获取服务端配置的需要采集设备数据的目标客户端,并定期采集所述目标客户端所在设备的设备数据;控制所述设备监控系统中数据接收组件集群的数据接收节点将所述设备数据存储至远程字典服务集群的主服务器,以便所述主服务器将所述设备数据发布至所述远程字典服务集群中订阅了所述主服务器的不同从服务器;实时监控所述远程字典服务集群并生成与所述目标客户端所在设备对应的监控数据,以将所述监控数据发送至所述服务端进行设备监控。本发明的有益技术效果为:本发明通过采用基于远程字典服务集群的设备监控系统实现对设备的监控,一方面,采用远程字典服务集群作为数据存储和处理引擎,能够实现了高性能的数据读写和实时处理能力,能够处理大规模服务器设备的监控数据;另一方面,远程字典服务集群采用分布式架构,保证了数据的高可用性和冗余备份,提供了更高的系统可靠性和容错能力。由于远程字典服务集群具备良好的水平扩展性,因此该监控系统可以方便地扩展和适应不断增长的服务器设备规模。远程字典服务集群支持主从同步,数据可以从主服务器向任意数量的从服务器上同步,从服务器可以是关联其他从服务器的主服务器。由于完全实现了发布/订阅机制,使得从服务器可针对订阅的频道接收主服务器完整的消息发布记录,同步对读取操作的可扩展性和数据冗余很有帮助。另外,监控系统能够将生成的监控数据发送到服务端,实现设备的实时全面监控,及时发现设备故障和异常情况。
本申请实施例公开了一种具体的设备监控方法,应用于基于远程字典服务集群的设备监控系统,参见图2所示,该方法包括:
步骤S21:获取服务端配置的需要采集设备数据的目标客户端,并定期采集所述目标客户端所在设备的设备数据。
其中,关于上述步骤S21更加具体的处理过程可以参考前述实施例中公开的相应内容,在此不再进行赘述。
步骤S22:当通过所述设备监控系统中数据接收组件集群的数据接收节点获取到所述设备数据后,触发第一数据存储动作以控制所述数据接收节点将所述设备数据存储至远程字典服务集群的主服务器。
本申请实施例中,数据接收组件集群的数据接收节点一共有两次往远程字典服务集群的主服务器中存储的动作。第一次的数据存储动作在数据接收组件集群的各数据接收节点接收了用户数据报协议包后第一次将其存储到远程字典服务集群的主服务器。
步骤S23:基于预设时间周期,通过所述数据接收节点定期读取所述主服务器中对应设备的当前设备数据并对所述当前设备数据进行优化,然后触发第二数据存储动作以控制所述数据接收节点将优化后的所述当前设备数据存储至所述主服务器。
本申请实施例中,在服务端可以配置接收节点的所辖设备情况,因此每个接收节点根据配置的设备信息从远程字典服务集群的主服务器中获取对应的设备的UDP数据。需要指出的是,基于预设时间周期定期读取所述主服务器中对应设备的当前设备数据,例如可以设置一个定时线程,1min/次读取当前设备数据。进一步的,对当前设备数据进行优化,主要判断设备的在线状态,对设备的基本数据与性能数据进行组装处理,然后执行第二次的数据存储动作。具体的,触发第二数据存储动作以控制所述数据接收节点将优化后的所述当前设备数据存储至所述主服务器。
本申请实施例中,当客户端对应的设备数据存储至远程服务集群的主服务器后,主服务器会将当前设备数据发布至所述远程字典服务集群中订阅了所述主服务器的不同从服务器。
步骤S24:实时监控所述远程字典服务集群并生成与所述目标客户端所在设备对应的监控数据;将所述监控数据发送至所述服务端,以便所述服务端将所述监控数据存储至预设数据库并对所述监控数据进行可视化展示。
本申请实施例中,将目标客户端所在设备对应的监控数据发送到服务端。服务端将其存储至本地的预设数据库中,同时,目标客户端所在设备对应的监控数据也会在服务端进行可视化展示。如此一来,实现实时更新监控数据,并能够及时发现设备故障和异常情况。
本申请提供了一种设备监控方法,应用于基于远程字典服务集群的设备监控系统,该方法包括:获取服务端配置的需要采集设备数据的目标客户端,并定期采集所述目标客户端所在设备的设备数据;当通过所述设备监控系统中数据接收组件集群的数据接收节点获取到所述设备数据后,触发第一数据存储动作以控制所述数据接收节点将所述设备数据存储至远程字典服务集群的主服务器;基于预设时间周期,通过所述数据接收节点定期读取所述主服务器中对应设备的当前设备数据并对所述当前设备数据进行优化,然后触发第二数据存储动作以控制所述数据接收节点将优化后的所述当前设备数据存储至所述主服务器;实时监控所述远程字典服务集群并生成与所述目标客户端所在设备对应的监控数据;将所述监控数据发送至所述服务端,以便所述服务端将所述监控数据存储至预设数据库并对所述监控数据进行可视化展示。本发明的有益技术效果为:本发明通过采用基于远程字典服务集群的设备监控系统实现对设备的监控,一方面,采用远程字典服务集群作为数据存储和处理引擎,能够实现了高性能的数据读写和实时处理能力,能够处理大规模服务器设备的监控数据;另一方面,远程字典服务集群采用分布式架构,保证了数据的高可用性和冗余备份,提供了更高的系统可靠性和容错能力。由于远程字典服务集群具备良好的水平扩展性,因此该监控系统可以方便地扩展和适应不断增长的服务器设备规模。远程字典服务集群支持主从同步,数据可以从主服务器向任意数量的从服务器上同步,从服务器可以是关联其他从服务器的主服务器。由于完全实现了发布/订阅机制,使得从服务器可针对订阅的频道接收主服务器完整的消息发布记录,同步对读取操作的可扩展性和数据冗余很有帮助。另外,监控系统能够将生成的监控数据发送到服务端,实现设备的实时全面监控,及时发现设备故障和异常情况。
进一步的,如图3所示为本申请实施例提供的一种基于远程字典服务集群的设备监控系统的各模块之间流转工作的示意图。主要包含以下模块:数据采集组件、数据接收组件集群、远程字典服务集群、设备监控展示与告警规则模块。
数据采集组件负责定期采集设备的状态数据;操作系统内核、版本等基础数据;CPU、内存、磁盘速率等性能数据并通过UDP协议发送到数据接收组件集群。具体通过代理端采集,例如通过客户端上安装的能够采集设备信息的软件进行信息采集。
数据接收组件集群用于接收数据采集组件发送的设备数据旨在处理大量的UDP数据流。其中包括数据接收主节点以及其余的数据接收节点。其主要区别在于,假设存在10个资源需要进行处理,如果有一个数据接收主节点、两个数据接收节点,那么每个数据接收节点都将分配一个资源进行处理。剩余的7个资源将直接分配给数据接收主节点。每个数据接收节点将设备数据存储至远程字典服务集群的主服务器中,防止数据丢失;然后再定期从中读取数据进行数据优化,然后再存储回远程字典服务集群的主服务器。
远程字典服务集群用于存储和处理采集到的服务器与终端设备数据,采用开源方式实现。它是一个由多个主从节点群组成的分布式服务集群,为三主三从的部署方式;节点群分为主节点和从节点,只有主节点负责读写请求和集群信息的维护信息,从节点只进行主节点数据和状态信息的复制。数据在存储时通过计算得到的键值存到相应的节点内。需要指出的是,当主节点负责读写请求时,由服务端通过数据接收组件集群对主节点执行读写请求。远程字典服务集群可以将数据分散到多个节点,一方面突破了单机内存的限制,另一个方面每一个主节点对外提供读写服务,大大提高了集群的响应能力;同时支持主节点的自动故障转移,当任意节点发生故障时,集群仍然可以对外提供服务。
设备监控展示模块用于根据设备监控参数标识,从远程字典服务群中获取设备的在线状态、基本数据以及性能数据,在页面进行数据实时更新。
告警规则模块用于根据预设的告警规则,可对服务器设备的CPU、内存、磁盘、网络流量等数据进行实时分析和比较,一旦发现异常情况生产告警信息,并及时发送告警通知给相关人员。
需要指出的是,图中的数据库为服务端的数据库。数据库中的数据可以从告警规则模块与设备监控展示模块中获取设备的监控数据,也可以从数据接收组件集群中读取节点配置信息。
可见,通过采用基于远程字典服务集群的设备监控系统实现对设备的监控,一方面,采用远程字典服务集群作为数据存储和处理引擎,能够实现了高性能的数据读写和实时处理能力,能够处理大规模服务器设备的监控数据;另一方面,远程字典服务集群采用分布式架构,保证了数据的高可用性和冗余备份,提供了更高的系统可靠性和容错能力。由于远程字典服务集群具备良好的水平扩展性,因此该监控系统可以方便地扩展和适应不断增长的服务器设备规模。远程字典服务集群支持主从同步,数据可以从主服务器向任意数量的从服务器上同步,从服务器可以是关联其他从服务器的主服务器。由于完全实现了发布/订阅机制,使得从服务器可针对订阅的频道接收主服务器完整的消息发布记录,同步对读取操作的可扩展性和数据冗余很有帮助。另外,监控系统能够将生成的监控数据发送到服务端,实现设备的实时全面监控,及时发现设备故障和异常情况。
相应的,本申请实施例还公开了一种设备监控装置,应用于基于远程字典服务集群的设备监控系统,参见图4所示,该装置包括:
数据采集模块11,用于获取服务端配置的需要采集设备数据的目标客户端,并定期采集所述目标客户端所在设备的设备数据;
数据同步模块12,用于控制所述设备监控系统中数据接收组件集群的数据接收节点将所述设备数据存储至远程字典服务集群的主服务器,以便所述主服务器将所述设备数据发布至所述远程字典服务集群中订阅了所述主服务器的不同从服务器;
设备监控模块13,用于实时监控所述远程字典服务集群并生成与所述目标客户端所在设备对应的监控数据,以将所述监控数据发送至所述服务端进行设备监控。
其中,关于上述各个模块更加具体的工作过程可以参考前述实施例中公开的相应内容,在此不再进行赘述。
由此可见,通过本实施例的上述方案,应用于基于远程字典服务集群的设备监控系统,该方法包括:获取服务端配置的需要采集设备数据的目标客户端,并定期采集所述目标客户端所在设备的设备数据;控制所述设备监控系统中数据接收组件集群的数据接收节点将所述设备数据存储至远程字典服务集群的主服务器,以便所述主服务器将所述设备数据发布至所述远程字典服务集群中订阅了所述主服务器的不同从服务器;实时监控所述远程字典服务集群并生成与所述目标客户端所在设备对应的监控数据,以将所述监控数据发送至所述服务端进行设备监控。本发明的有益技术效果为:本发明通过采用基于远程字典服务集群的设备监控系统实现对设备的监控,一方面,采用远程字典服务集群作为数据存储和处理引擎,能够实现了高性能的数据读写和实时处理能力,能够处理大规模服务器设备的监控数据;另一方面,远程字典服务集群采用分布式架构,保证了数据的高可用性和冗余备份,提供了更高的系统可靠性和容错能力。由于远程字典服务集群具备良好的水平扩展性,因此该监控系统可以方便地扩展和适应不断增长的服务器设备规模。远程字典服务集群支持主从同步,数据可以从主服务器向任意数量的从服务器上同步,从服务器可以是关联其他从服务器的主服务器。由于完全实现了发布/订阅机制,使得从服务器可针对订阅的频道接收主服务器完整的消息发布记录,同步对读取操作的可扩展性和数据冗余很有帮助。另外,监控系统能够将生成的监控数据发送到服务端,实现设备的实时全面监控,及时发现设备故障和异常情况。
进一步的,本申请实施例还公开了一种电子设备,图5是根据一示例性实施例示出的电子设备20结构图,图中内容不能认为是对本申请的使用范围的任何限制。
图5为本申请实施例提供的一种电子设备20的结构示意图。该电子设备20,具体可以包括:至少一个处理器21、至少一个存储器22、电源23、通信接口24、输入输出接口25和通信总线26。其中,所述存储器22用于存储计算机程序,所述计算机程序由所述处理器21加载并执行,以实现前述任一实施例公开的设备监控方法中的相关步骤。另外,本实施例中的电子设备20具体可以为计算机。
本实施例中,电源23用于为电子设备20上的各硬件设备提供工作电压;通信接口24能够为电子设备20创建与外界设备之间的数据传输通道,其所遵循的通信协议是能够适用于本申请技术方案的任意通信协议,在此不对其进行具体限定;输入输出接口25,用于获取外界输入数据或向外界输出数据,其具体的接口类型可以根据具体应用需要进行选取,在此不进行具体限定。
另外,存储器22作为资源存储的载体,可以是只读存储器、随机存储器、磁盘或者光盘等,其上所存储的资源可以包括操作系统221、计算机程序222及数据223等,数据223可以包括各种各样的数据。存储方式可以是短暂存储或者永久存储。
其中,操作系统221用于管理与控制电子设备20上的各硬件设备以及计算机程序222,其可以是Windows Server、Netware、Unix、Linux等。计算机程序222除了包括能够用于完成前述任一实施例公开的由电子设备20执行的设备监控方法的计算机程序之外,还可以进一步包括能够用于完成其他特定工作的计算机程序。
进一步的,本申请实施例还公开了一种计算机可读存储介质,这里所说的计算机可读存储介质包括随机存取存储器(Random Access Memory,RAM)、内存、只读存储器(Read-Only Memory,ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、磁碟或者光盘或技术领域内所公知的任意其他形式的存储介质。其中,所述计算机程序被处理器执行时实现前述设备监控方法。关于该方法的具体步骤可以参考前述实施例中公开的相应内容,在此不再进行赘述。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
结合本文中所公开的实施例描述的设备监控方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本发明所提供的设备监控方法、装置、设备及存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种设备监控方法,其特征在于,应用于基于远程字典服务集群的设备监控系统,包括:
获取服务端配置的需要采集设备数据的目标客户端,并定期采集所述目标客户端所在设备的设备数据;
控制所述设备监控系统中数据接收组件集群的数据接收节点将所述设备数据存储至远程字典服务集群的主服务器,以便所述主服务器将所述设备数据发布至所述远程字典服务集群中订阅了所述主服务器的不同从服务器;
实时监控所述远程字典服务集群并生成与所述目标客户端所在设备对应的监控数据,以将所述监控数据发送至所述服务端进行设备监控。
2.根据权利要求1所述的设备监控方法,其特征在于,所述定期采集所述目标客户端所在设备的设备数据,包括:
定期采集所述目标客户端所在设备的用于表征设备运行状态的状态数据、用于表征设备运行基本条件的基础数据以及用于表征设备特性功能的性能数据。
3.根据权利要求1所述的设备监控方法,其特征在于,所述定期采集所述目标客户端所在设备的设备数据之后,还包括:
通过用户数据报协议将所述设备数据进行发送处理,并将生成的用户数据报协议包发送至所述设备监控系统中数据接收组件集群的数据接收节点;
相应的,所述控制所述设备监控系统中数据接收组件集群的数据接收节点将所述设备数据存储至远程字典服务集群的主服务器,包括:
控制所述设备监控系统中数据接收组件集群的数据接收节点将所述用户数据报协议包存储至远程字典服务集群的主服务器。
4.根据权利要求1所述的设备监控方法,其特征在于,所述控制所述设备监控系统中数据接收组件集群的数据接收节点将所述设备数据存储至远程字典服务集群的主服务器,包括:
当通过所述设备监控系统中数据接收组件集群的数据接收节点获取到所述设备数据后,触发第一数据存储动作以控制所述数据接收节点将所述设备数据存储至远程字典服务集群的主服务器;
基于预设时间周期,通过所述数据接收节点定期读取所述主服务器中对应设备的当前设备数据并对所述当前设备数据进行优化,然后触发第二数据存储动作以控制所述数据接收节点将优化后的所述当前设备数据存储至所述主服务器。
5.根据权利要求1所述的设备监控方法,其特征在于,所述控制所述设备监控系统中数据接收组件集群的数据接收节点将所述设备数据存储至远程字典服务集群的主服务器,以便所述主服务器将所述设备数据发布至所述远程字典服务集群中订阅了所述主服务器的不同从服务器之后,还包括:
当所述主服务器故障时,在所述从服务器中确定目标从服务器以将所述目标从服务器作为当前新的主服务器。
6.根据权利要求1所述的设备监控方法,其特征在于,所述实时监控所述远程字典服务集群并生成与所述目标客户端所在设备对应的监控数据,以将所述监控数据发送至所述服务端进行设备监控,包括:
实时监控所述远程字典服务集群并生成与所述目标客户端所在设备对应的监控数据;
将所述监控数据发送至所述服务端,以便所述服务端将所述监控数据存储至预设数据库并对所述监控数据进行可视化展示。
7.根据权利要求1至6任一项所述的设备监控方法,其特征在于,所述实时监控所述远程字典服务集群并生成与所述目标客户端所在设备对应的监控数据,以将所述监控数据发送至所述服务端进行设备监控,包括:
实时监控所述远程字典服务集群,并根据预先设置的告警规则判断所述远程字典服务集群的所述主服务器中的所述设备数据是否存在异常;
如果所述设备数据存在异常,则确定异常客户端并生成与所述异常客户端所在设备对应的告警信息,以将所述告警信息发送至所述服务端;
如果所述设备数据不存在异常,则将当前生成的所述设备数据发送至所述服务端,以利用当前生成的所述设备数据对所述服务端中的历史设备数据进行实时更新。
8.一种设备监控装置,其特征在于,应用于基于远程字典服务集群的设备监控系统,包括:
数据采集模块,用于获取服务端配置的需要采集设备数据的目标客户端,并定期采集所述目标客户端所在设备的设备数据;
数据同步模块,用于控制所述设备监控系统中数据接收组件集群的数据接收节点将所述设备数据存储至远程字典服务集群的主服务器,以便所述主服务器将所述设备数据发布至所述远程字典服务集群中订阅了所述主服务器的不同从服务器;
设备监控模块,用于实时监控所述远程字典服务集群并生成与所述目标客户端所在设备对应的监控数据,以将所述监控数据发送至所述服务端进行设备监控。
9.一种电子设备,其特征在于,所述电子设备包括处理器和存储器;其中,所述存储器用于存储计算机程序,所述计算机程序由所述处理器加载并执行以实现如权利要求1至7任一项所述的设备监控方法。
10.一种计算机可读存储介质,其特征在于,用于存储计算机程序;其中所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的设备监控方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311271514.6A CN117319276A (zh) | 2023-09-28 | 2023-09-28 | 设备监控方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311271514.6A CN117319276A (zh) | 2023-09-28 | 2023-09-28 | 设备监控方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117319276A true CN117319276A (zh) | 2023-12-29 |
Family
ID=89245795
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311271514.6A Pending CN117319276A (zh) | 2023-09-28 | 2023-09-28 | 设备监控方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117319276A (zh) |
-
2023
- 2023-09-28 CN CN202311271514.6A patent/CN117319276A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Eisele et al. | Riaps: Resilient information architecture platform for decentralized smart systems | |
US11082288B2 (en) | System and method for resolving master node failures within node clusters | |
CN112600891B (zh) | 一种基于信息物理融合的边云协同系统及工作方法 | |
US8108623B2 (en) | Poll based cache event notifications in a distributed cache | |
US20090144220A1 (en) | System for storing distributed hashtables | |
US20100235409A1 (en) | System and method for managing data stored in a data network | |
CN111143382B (zh) | 数据处理方法、系统和计算机可读存储介质 | |
CN110795503A (zh) | 分布式存储系统的多集群数据同步方法及相关装置 | |
WO2004004283A1 (en) | Opc server redirection manager | |
CN112994935B (zh) | prometheus管控方法、装置、设备及存储介质 | |
EP1518174A2 (en) | System event filtering and notification for opc clients | |
US20180136848A1 (en) | Distributed backup system | |
CN112015744A (zh) | 配置数据访问方法、装置、设备、配置中心及存储介质 | |
CN110837423A (zh) | 一种自动导引运输车数据采集的方法和装置 | |
Sherman et al. | ACMS: The Akamai configuration management system | |
JP2016005275A (ja) | 相互接続ネットワークを管理する方法およびシステム | |
CN114518970A (zh) | 动态资产模型信息视图的高可用性 | |
CN111104250A (zh) | 用于数据处理的方法、设备和计算机程序产品 | |
Liu et al. | Replication in distributed storage systems: State of the art, possible directions, and open issues | |
CN117319276A (zh) | 设备监控方法、装置、设备及存储介质 | |
CN112685486B (zh) | 数据库集群的数据管理方法、装置、电子设备及存储介质 | |
CN111064643B (zh) | 一种节点服务器及其数据交互方法和相关装置 | |
CN116633724A (zh) | 多维度限流和动态路由的系统和部署方法 | |
CN108701035B (zh) | 应用属性的管理 | |
CN113032477B (zh) | 基于gtid的长距离数据同步方法、装置及计算设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |