CN117743115A - 运维方法、系统、装置及非易失性存储介质 - Google Patents
运维方法、系统、装置及非易失性存储介质 Download PDFInfo
- Publication number
- CN117743115A CN117743115A CN202311613030.5A CN202311613030A CN117743115A CN 117743115 A CN117743115 A CN 117743115A CN 202311613030 A CN202311613030 A CN 202311613030A CN 117743115 A CN117743115 A CN 117743115A
- Authority
- CN
- China
- Prior art keywords
- target application
- data
- target
- maintenance
- server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012423 maintenance Methods 0.000 title claims abstract description 83
- 238000000034 method Methods 0.000 title claims abstract description 66
- 230000008569 process Effects 0.000 claims abstract description 30
- 230000002159 abnormal effect Effects 0.000 claims abstract description 19
- 238000004364 calculation method Methods 0.000 claims abstract description 17
- 238000012545 processing Methods 0.000 claims description 25
- 238000011156 evaluation Methods 0.000 claims description 21
- 238000013480 data collection Methods 0.000 claims description 10
- 238000005516 engineering process Methods 0.000 abstract description 5
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 5
- 230000002688 persistence Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Debugging And Monitoring (AREA)
Abstract
本申请公开了一种运维方法、系统、装置及非易失性存储介质。其中,该方法包括:依据与各个目标应用对应的数据采集规则,确定设置在各个目标应用中的运维线程;获取各个目标应用中的运维线程在目标应用的运行过程中采集的与目标应用对应的运行数据,其中,运行数据包括目标应用运行时占用的计算资源信息和运行日志;依据运行数据和预设预警规则,确定目标应用是否运行异常,并在确定目标应用运行异常的情况下生成与目标应用对应的预警信息。本申请解决了由于相关技术中在对服务器进行运维时直接获取服务器的运行数据导致的在应用出现异常时无法及时发现的技术问题。
Description
技术领域
本申请涉及运维领域,具体而言,涉及一种运维方法、系统、装置及非易失性存储介质。
背景技术
相关技术中在对服务器等设备进行维护时,通常是将服务器作为一个整体来获取服务器所提供的各项计算资源的运行数据,这种方式的问题在于获取的数据不够精确,导致在服务器中运行的应用出现异常时无法及时发现。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种运维方法、系统、装置及非易失性存储介质,以至少解决由于相关技术中在对服务器进行运维时直接获取服务器的运行数据导致的在应用出现异常时无法及时发现的技术问题。
根据本申请实施例的一个方面,提供了一种运维方法,包括:依据与各个目标应用对应的数据采集规则,确定设置在各个目标应用中的运维线程;获取各个目标应用中的运维线程在目标应用的运行过程中采集的与目标应用对应的运行数据,其中,运行数据包括目标应用运行时占用的计算资源信息和运行日志;依据运行数据和预设预警规则,确定目标应用是否运行异常,并在确定目标应用运行异常的情况下生成与目标应用对应的预警信息。
可选地,依据与各个目标应用对应的数据采集规则,确定设置在各个目标应用中的运维线程的步骤包括:在各个目标应用中建立初始线程;获取为目标应用配置的数据采集规则,其中,数据采集规则包括运维线程在目标应用运行过程中需要采集的数据类型;依据数据采集规则配置初始线程,得到运维线程。
可选地,获取为目标应用配置的数据采集规则的步骤包括:确定各个目标应用的应用标识,其中,应用标识用于确定目标应用在运行时所需的计算资源类型;向目标对象展示应用标识,并获取目标对象依据应用标识为目标应用配置的数据采集规则。
可选地,计算资源类型包括以下至少之一:CPU资源,内存资源,磁盘资源。
可选地,预设预警规则包括运行数据中的各类计算资源对应的评价方式;依据运行数据和预设预警规则,确定目标应用是否运行异常的步骤包括:依据运行数据和预设预警规则,确定运行数据中的各类计算资源对应的评价结果,其中,评价结果包括运行正常和运行异常;在运行数据中存在评价结果为运行异常的计算资源的情况下,确定目标应用运行异常。
可选地,预设预警规则包括与目标服务器对应的服务器运行数据预警规则,其中,各个目标应用运行在目标服务器中;依据运行数据和预设预警规则,确定目标应用是否运行异常的步骤包括:汇总各个目标应用对应的运行数据,得到目标服务器的服务器运行数据;依据服务器运行数据和预设预警规则,确定目标服务器是否运行异常。
可选地,预设预警规则包括以下至少之一:依据与预设阈值的比较结果确定目标服务器是否运行异常,依据预设评价公式处理确定目标服务器是否运行异常。
根据本申请实施例的另一方面,还提供了一种运维系统,包括信息采集装置,服务器,其中,服务器,用于运行多个目标应用;信息采集装置,与服务器相连,用于依据与各个目标应用对应的数据采集规则,确定设置在各个目标应用中的运维线程;获取各个目标应用中的运维线程在目标应用的运行过程中采集的与目标应用对应的运行数据,其中,运行数据包括目标应用运行时占用的计算资源信息和运行日志;依据运行数据和预设预警规则,确定目标应用是否运行异常,并在确定目标应用运行异常的情况下生成与目标应用对应的预警信息。
根据本申请实施例的另一方面,还提供了一种运维装置,包括:第一处理模块,用于依据与各个目标应用对应的数据采集规则,确定设置在各个目标应用中的运维线程;第二处理模块,用于获取各个目标应用中的运维线程在目标应用的运行过程中采集的与目标应用对应的运行数据,其中,运行数据包括目标应用运行时占用的计算资源信息和运行日志;第三处理模块,用于依据运行数据和预设预警规则,确定目标应用是否运行异常,并在确定目标应用运行异常的情况下生成与目标应用对应的预警信息。
根据本申请实施例的另一方面,还提供了一种非易失性存储介质,非易失性存储介质中存储有程序,其中,在程序运行时控制非易失性存储介质所在设备执行运维方法。
根据本申请实施例的另一方面,还提供了一种电子设备,包括:存储器和处理器,处理器用于运行存储在存储器中的程序,其中,程序运行时执行运维方法。
在本申请实施例中,采用依据与各个目标应用对应的数据采集规则,确定设置在各个目标应用中的运维线程;获取各个目标应用中的运维线程在目标应用的运行过程中采集的与目标应用对应的运行数据,其中,运行数据包括目标应用运行时占用的计算资源信息和运行日志;依据运行数据和预设预警规则,确定目标应用是否运行异常,并在确定目标应用运行异常的情况下生成与目标应用对应的预警信息的方式,通过在应用中设置运维线程,达到了直接获取应用在运行过程中产生的运行数据的目的,从而实现了在应用运行异常时及时发现并处理的技术效果,进而解决了由于相关技术中在对服务器进行运维时直接获取服务器的运行数据导致的在应用出现异常时无法及时发现技术问题。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的一种计算机终端(移动终端)的结构示意图;
图2是根据本申请实施例的一种运维方法的流程示意图;
图3是根据本申请实施例的一种运维系统的结构示意图;
图4是根据本申请实施例的一种信息采集装置的结构示意图;
图5是根据本申请实施例的一种运维系统的信息采集流程示意图;
图6是根据本申请实施例的一种运维系统的预警流程示意图;
图7是根据本申请实施例的一种运维装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为了更好地理解本申请实施例,以下将本申请实施例中涉及的技术术语解释如下:
Redis:是一个开源的内存数据结构存储系统,可以用作数据库、缓存和消息队列等多种用途。它支持多种数据结构,包括字符串、哈希表、列表、集合和有序集合,并提供了丰富的操作命令和功能,如数据持久化、数据备份、事务等。Redis的特点是速度快、内存占用低、支持丰富的数据类型和操作命令,适用于高并发、高性能的场景。
FullGC日志:FullGC日志是指Java虚拟机进行Full GC(Full GarbageCollection,全局垃圾回收)操作时生成的日志。Full GC是指对整个Java堆进行垃圾回收,包括新生代和老年代的对象。Full GC一般会导致应用程序停顿,因为在Full GC期间,Java虚拟机会暂停应用程序的执行,以便进行全局的垃圾回收操作。FullGC日志通常包含了Full GC的详细信息,如垃圾回收的时间、回收前后堆的使用情况、回收的对象数量等。通过分析FullGC日志,可以了解垃圾回收的性能瓶颈、内存使用情况以及调优的方向。FullGC日志可以通过在Java虚拟机启动参数中添加"-XX:+PrintGCDetails"来开启。开启后,Java虚拟机会在进行Full GC时将详细的垃圾回收信息打印到日志文件中,供开发人员进行分析和优化。
JVM堆内存:JVM堆内存是Java虚拟机(JVM)在运行Java程序时所使用的内存空间,用于存储对象实例和数组。堆内存是一个运行时数据区域,被所有线程共享。在Java程序中,所有通过new关键字创建的对象都会被分配在堆内存中。堆内存被划分为两个区域:新生代和老年代。新生代主要用于存放新创建的对象,而老年代主要用于存放长时间存活的对象。堆内存的大小可以通过JVM的启动参数进行调整,一般建议根据应用的需求和服务器的硬件条件进行合理的配置。如果堆内存不足,可能会导致内存溢出的错误,而堆内存过大可能会导致垃圾回收时间过长,影响程序的性能。
目前随着互联网业务的不断发展,各种系统越来越多,为了给客户提供更好的体验,提升服务性能,系统服务器、资源使用的越来越多。为了满足客户需求,系统迭代的越来越快。由于系统的快速迭代,服务器的数量不断增多,为了确保各类业务的稳定运行,需要针对运行业务的服务器设立运维系统,实时自动的收集系统运行情况、及时预警和解决问题,保障系统平稳运行。相关技术中建立的运维系统通常是定时采集服务器信息,由少量运维人员统一进行监控维护。
这种方式的问题在于直接从服务器中采集得到的数据有时候并不能体现应用的运行状态,并且运维人员对业务应用不够熟悉,有时无法从运维数据中及时确定运行的应用是否发生异常。
为了解决上述问题,本申请实施例中提供了相关的解决方案,以下详细说明。
根据本申请实施例,提供了一种运维方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图1示出了一种用于实现运维方法的计算机终端(或移动设备)的硬件结构框图。如图1所示,计算机终端10(或移动设备10)可以包括一个或多个(图中采用102a、102b,……,102n来示出)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输模块106。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为BUS总线的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
应当注意到的是上述一个或多个处理器102和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算机终端10(或移动设备)中的其他元件中的任意一个内。如本申请实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
存储器104可用于存储应用软件的软件程序以及模块,如本申请实施例中的运维方法对应的程序指令/数据存储装置,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的应用程序的运维方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与计算机终端10(或移动设备)的用户界面进行交互。
在上述运行环境下,本申请实施例提供了一种运维方法,如图2所示,该方法包括如下步骤:
步骤S202,依据与各个目标应用对应的数据采集规则,确定设置在各个目标应用中的运维线程;
在步骤S202所提供的技术方案中,依据与各个目标应用对应的数据采集规则,确定设置在各个目标应用中的运维线程的步骤包括:在各个目标应用中建立初始线程;获取为目标应用配置的数据采集规则,其中,数据采集规则包括运维线程在目标应用运行过程中需要采集的数据类型;依据数据采集规则配置初始线程,得到运维线程。
具体地,上述数据采集规则可以是由目标应用的开发人员或其他熟悉目标应用的运行过程及作用的目标对象来设定。与相关技术中的由运维人员统一针对服务器设定运维数据采集规则的方法相比,本申请所采用的由目标应用的开发人员针对目标应用在实际运行过程中所需要占用的各项计算资源类型,以及各类计算资源对应的异常判断标准,可以在目标应用运行失常时及时发现并处理。
作为一种可选地实施方式,获取为目标应用配置的数据采集规则的步骤包括:确定各个目标应用的应用标识,其中,应用标识用于确定目标应用在运行时所需的计算资源类型;向目标对象展示应用标识,并获取目标对象依据应用标识为目标应用配置的数据采集规则。
具体地,每个目标应用唯一对应一个应用标识。应用标识可以是目标对象在开发目标应用的过程中为目标应用设置的应用名称或应用编号等。
作为一种可选地实施方式,上述目标对象也可以是存储有开发人员预先存储的各个目标应用的标识与应用所述的各项计算资源及目标应用正常运行条件的电子设备,该电子设备在接收到应用标识后,可以根据应用标识检索该目标应用正常运行时所需的各项计算资源以及各项计算资源需要满足的条件,并根据检索结果生成与目标应用对应的数据采集规则和预警规则。
步骤S204,获取各个目标应用中的运维线程在目标应用的运行过程中采集的与目标应用对应的运行数据,其中,运行数据包括目标应用运行时占用的计算资源信息和运行日志;
在步骤S204所提供的技术方案中,计算资源类型包括以下至少之一:CPU资源,内存资源,磁盘资源。运行日志的类型包括应用启动日志等。
作为一种可选地实施方式,从目标应用中获取的信息还包括运行目标应用的服务器的服务器IP地址。
当目标应用程序为java程序时,采集的信息还包括java程序运行时JVM堆内存的使用率。
需要说明的是,本申请中也可以直接过去服务器层面的计算资源信息和日志文件,如FullGC日志文件和Redis集群的基本信息。Redis集群的基本信息包括Redis集群的各种运行时信息,如Redis集群节点的统计信息、配置信息、内存使用情况、持久化信息、客户端连接信息等。Redis集群的基本信息可以通过向服务器发送info命令获取,通过info命令可以获取的信息包括:
cluster:提供了有关Redis集群的信息,如集群节点数量、槽位分配情况、集群状态等。
keyspace:提供了有关Redis数据库的信息,如数据库数量、键的数量等。
memory:提供了有关Redis内存使用情况的信息,如占用的物理内存、内存碎片等。
persistence:提供了有关Redis持久化的信息,如持久化方式、RDB和AOF文件的相关信息等。
clients:提供了有关Redis客户端连接的信息,如连接数量、连接状态等。
stats:提供了有关Redis服务器的统计信息,如服务器运行时间、命令执行次数等。
作为一种可选地实施方式,在目标应用运行过程中采集的各类数据和日志文件可以存放到对应的数据库中。
需要说明的是,作为一种可选地实施方式,对于采集到的数据还可以设置对应的过滤规则来过滤数据中的噪声。
步骤S206,依据运行数据和预设预警规则,确定目标应用是否运行异常,并在确定目标应用运行异常的情况下生成与目标应用对应的预警信息。
在步骤S206所提供的技术方案中,预设预警规则包括运行数据中的各类计算资源对应的评价方式;依据运行数据和预设预警规则,确定目标应用是否运行异常的步骤包括:依据运行数据和预设预警规则,确定运行数据中的各类计算资源对应的评价结果,其中,评价结果包括运行正常和运行异常;在运行数据中存在评价结果为运行异常的计算资源的情况下,确定目标应用运行异常。
作为一种可选地实施方式,预设预警规则包括与目标服务器对应的服务器运行数据预警规则,其中,各个目标应用运行在目标服务器中;依据运行数据和预设预警规则,确定目标应用是否运行异常的步骤包括:汇总各个目标应用对应的运行数据,得到目标服务器的服务器运行数据;依据服务器运行数据和预设预警规则,确定目标服务器是否运行异常。
在本申请的一些实施例中,预设预警规则包括以下至少之一:依据与预设阈值的比较结果确定目标服务器是否运行异常,依据预设评价公式处理确定目标服务器是否运行异常。
具体地,上述依据预设评价公式处理确定目标服务器是否运行异常包括对获取的一项或多项数据按照预设评价公式进行计算,并根据计算结果确定目标服务器是否运行异常。例如预设公式及对应的标准为sql2-sql1>0,则可以分别获取sql1和sql2的执行结果套入上述预设公式中运算,其中sql1和sql2分别为一种用于获取特定类型的数据的获取指令,例如,sql1为select count(*)as counts from a,sql2为select count(*)as countsfrom b。
通过采用依据与各个目标应用对应的数据采集规则,确定设置在各个目标应用中的运维线程;获取各个目标应用中的运维线程在目标应用的运行过程中采集的与目标应用对应的运行数据,其中,运行数据包括目标应用运行时占用的计算资源信息和运行日志;依据运行数据和预设预警规则,确定目标应用是否运行异常,并在确定目标应用运行异常的情况下生成与目标应用对应的预警信息的方式,通过在应用中设置运维线程,达到了直接获取应用在运行过程中产生的运行数据的目的,从而实现了在应用运行异常时及时发现并处理的技术效果,进而解决了由于相关技术中在对服务器进行运维时直接获取服务器的运行数据导致的在应用出现异常时无法及时发现的技术问题。
本申请实施例提供了一种运维系统,图3是该运维系统的结构示意图。如图3所示,该系统包括信息采集装置30,服务器32,其中,服务器32,用于运行多个目标应用;信息采集装置30,与服务器32相连,用于依据与各个目标应用对应的数据采集规则,确定设置在各个目标应用中的运维线程;获取各个目标应用中的运维线程在目标应用的运行过程中采集的与目标应用对应的运行数据,其中,运行数据包括目标应用运行时占用的计算资源信息和运行日志;依据运行数据和预设预警规则,确定目标应用是否运行异常,并在确定目标应用运行异常的情况下生成与目标应用对应的预警信息。
在本申请的一些实施例中,如图4所示,信息采集装置30中可以包括采集配置模块302和预警配置模块304,其中采集配置模块302中存储有信息采集装置30需要采集的数据类型,预警配置模块304存储有各类数据对应的噪声过滤规则和预警规则,预警规则包括依据阈值比较结果进行判断和根据预设公式的计算结果进行判断等。
作为一种可选地实施方式,信息采集装置30中还设置有开关程序,用于控制是否采集某类数据以及是否对采集到的数据进行预警等。
在本申请的一些实施例中,信息采集装置30可以向服务器32或服务器32所运行的应用中的数据采集线程发送数据采集指令来获取特定类型的数据。例如,如图5所示,信息采集装置可以向服务器32或数据采集线程发送采集CPU、内存、磁盘信息的命令,并获取服务器返回的CPU、内存、磁盘信息;向服务器32或数据采集线程发送info命令,并获取服务器返回的Redis信息;向服务器32或数据采集线程发送日志读取命令,并获取服务器返回的FullGC日志文件。
作为一种可选地实施方式,运维系统可以选择对采集到的数据进行持续预警或周期性预警。当选择进行周期性预警时,运维系统中的信息采集装置30的预警流程如图6所示,包括如下步骤:
步骤S602,周期性通过开关程序确定需要进行预警的各类数据;
步骤S604,确定需要预警的数据对应的预警规则;
步骤S606,根据预警规则对需要预警的数据进行评价,并在确定数据异常时向目标设备发送预警信息。
在步骤S606所提供的技术方案中,上述目标设备可以是目标应用的开发人员所使用的设备,或运维人员所使用的设备。
本申请实施例提供了一种运维装置,图7是该装置的结构示意图,如图7所示,该装置包括:第一处理模块70,用于依据与各个目标应用对应的数据采集规则,确定设置在各个目标应用中的运维线程;第二处理模块72,用于获取各个目标应用中的运维线程在目标应用的运行过程中采集的与目标应用对应的运行数据,其中,运行数据包括目标应用运行时占用的计算资源信息和运行日志;第三处理模块74,用于依据运行数据和预设预警规则,确定目标应用是否运行异常,并在确定目标应用运行异常的情况下生成与目标应用对应的预警信息。
在本申请的一些实施例中,第一处理模块70依据与各个目标应用对应的数据采集规则,确定设置在各个目标应用中的运维线程的步骤包括:在各个目标应用中建立初始线程;获取为目标应用配置的数据采集规则,其中,数据采集规则包括运维线程在目标应用运行过程中需要采集的数据类型;依据数据采集规则配置初始线程,得到运维线程。
在本申请的一些实施例中,第一处理模块70获取目标对象为目标应用配置的数据采集规则的步骤包括:确定各个目标应用的应用标识,其中,应用标识用于确定目标应用在运行时所需的计算资源类型;向目标对象展示应用标识,并获取目标对象依据应用标识为目标应用配置的数据采集规则。
在本申请的一些实施例中,计算资源类型包括以下至少之一:CPU资源,内存资源,磁盘资源。
在本申请的一些实施例中,预设预警规则包括运行数据中的各类计算资源对应的评价方式;第三处理模块74依据运行数据和预设预警规则,确定目标应用是否运行异常的步骤包括:依据运行数据和预设预警规则,确定运行数据中的各类计算资源对应的评价结果,其中,评价结果包括运行正常和运行异常;在运行数据中存在评价结果为运行异常的计算资源的情况下,确定目标应用运行异常。
在本申请的一些实施例中,预设预警规则包括与目标服务器对应的服务器运行数据预警规则,其中,各个目标应用运行在目标服务器中;第三处理模块74依据运行数据和预设预警规则,确定目标应用是否运行异常的步骤包括:汇总各个目标应用对应的运行数据,得到目标服务器的服务器运行数据;依据服务器运行数据和预设预警规则,确定目标服务器是否运行异常。
在本申请的一些实施例中,预设预警规则包括以下至少之一:依据与预设阈值的比较结果确定目标服务器是否运行异常,依据预设评价公式处理确定目标服务器是否运行异常。
需要说明的是,上述运维装置中的各个模块可以是程序模块(例如是实现某种特定功能的程序指令集合),也可以是硬件模块,对于后者,其可以表现为以下形式,但不限于此:上述各个模块的表现形式均为一个处理器,或者,上述各个模块的功能通过一个处理器实现。
根据本申请实施例的另一方面,还提供了一种非易失性存储介质,非易失性存储介质中存储有程序,其中,在程序运行时控制非易失性存储介质所在设备执行如下运维方法:依据与各个目标应用对应的数据采集规则,确定设置在各个目标应用中的运维线程;获取各个目标应用中的运维线程在目标应用的运行过程中采集的与目标应用对应的运行数据,其中,运行数据包括目标应用运行时占用的计算资源信息和运行日志;依据运行数据和预设预警规则,确定目标应用是否运行异常,并在确定目标应用运行异常的情况下生成与目标应用对应的预警信息。
根据本申请实施例的另一方面,还提供了一种电子设备,电子设备包括处理器和存储器,处理器用于运行存储在存储器中的程序,其中,程序运行时执行如下运维方法:依据与各个目标应用对应的数据采集规则,确定设置在各个目标应用中的运维线程;获取各个目标应用中的运维线程在目标应用的运行过程中采集的与目标应用对应的运行数据,其中,运行数据包括目标应用运行时占用的计算资源信息和运行日志;依据运行数据和预设预警规则,确定目标应用是否运行异常,并在确定目标应用运行异常的情况下生成与目标应用对应的预警信息。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对相关技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (11)
1.一种运维方法,其特征在于,包括:
依据与各个目标应用对应的数据采集规则,确定设置在各个所述目标应用中的运维线程;
获取各个所述目标应用中的所述运维线程在所述目标应用的运行过程中采集的与所述目标应用对应的运行数据,其中,所述运行数据包括所述目标应用运行时占用的计算资源信息和运行日志;
依据所述运行数据和预设预警规则,确定所述目标应用是否运行异常,并在确定所述目标应用运行异常的情况下生成与所述目标应用对应的预警信息。
2.根据权利要求1所述的运维方法,其特征在于,所述依据与各个目标应用对应的数据采集规则,确定设置在各个所述目标应用中的运维线程的步骤包括:
在各个所述目标应用中建立初始线程;
获取为所述目标应用配置的数据采集规则,其中,所述数据采集规则包括所述运维线程在所述目标应用运行过程中需要采集的数据类型;
依据所述数据采集规则配置所述初始线程,得到所述运维线程。
3.根据权利要求2所述的运维方法,其特征在于,所述获取为所述目标应用配置的数据采集规则的步骤包括:
确定各个所述目标应用的应用标识,其中,所述应用标识用于确定所述目标应用在运行时所需的计算资源类型;
向目标对象展示所述应用标识,并获取所述目标对象依据所述应用标识为所述目标应用配置的所述数据采集规则。
4.根据权利要求3所述的运维方法,其特征在于,所述计算资源类型包括以下至少之一:CPU资源,内存资源,磁盘资源。
5.根据权利要求1所述的运维方法,其特征在于,所述预设预警规则包括所述运行数据中的各类计算资源对应的评价方式;所述依据所述运行数据和预设预警规则,确定所述目标应用是否运行异常的步骤包括:
依据所述运行数据和所述预设预警规则,确定所述运行数据中的各类计算资源对应的评价结果,其中,所述评价结果包括运行正常和运行异常;
在所述运行数据中存在所述评价结果为运行异常的计算资源的情况下,确定所述目标应用运行异常。
6.根据权利要求1所述的运维方法,其特征在于,所述预设预警规则包括与目标服务器对应的服务器运行数据预警规则,其中,各个所述目标应用运行在所述目标服务器中;所述依据所述运行数据和预设预警规则,确定所述目标应用是否运行异常的步骤包括:
汇总各个所述目标应用对应的所述运行数据,得到所述目标服务器的服务器运行数据;
依据所述服务器运行数据和预设预警规则,确定所述目标服务器是否运行异常。
7.根据权利要求5或权利要求6所述的运维方法,其特征在于,所述预设预警规则包括以下至少之一:依据与预设阈值的比较结果确定所述目标服务器是否运行异常,依据预设评价公式处理确定所述目标服务器是否运行异常。
8.一种运维系统,其特征在于,包括信息采集装置,服务器,其中,
所述服务器,用于运行多个目标应用;
所述信息采集装置,与所述服务器相连,用于依据与各个所述目标应用对应的数据采集规则,确定设置在各个所述目标应用中的运维线程;获取各个所述目标应用中的所述运维线程在所述目标应用的运行过程中采集的与所述目标应用对应的运行数据,其中,所述运行数据包括所述目标应用运行时占用的计算资源信息和运行日志;依据所述运行数据和预设预警规则,确定所述目标应用是否运行异常,并在确定所述目标应用运行异常的情况下生成与所述目标应用对应的预警信息。
9.一种运维装置,其特征在于,包括:
第一处理模块,用于依据与各个目标应用对应的数据采集规则,确定设置在各个所述目标应用中的运维线程;
第二处理模块,用于获取各个所述目标应用中的所述运维线程在所述目标应用的运行过程中采集的与所述目标应用对应的运行数据,其中,所述运行数据包括所述目标应用运行时占用的计算资源信息和运行日志;
第三处理模块,用于依据所述运行数据和预设预警规则,确定所述目标应用是否运行异常,并在确定所述目标应用运行异常的情况下生成与所述目标应用对应的预警信息。
10.一种非易失性存储介质,其特征在于,所述非易失性存储介质中存储有程序,其中,在所述程序运行时控制所述非易失性存储介质所在设备执行权利要求1至7中任意一项所述的运维方法。
11.一种电子设备,其特征在于,包括:存储器和处理器,所述处理器用于运行存储在所述存储器中的程序,其中,所述程序运行时执行权利要求1至7中任意一项所述的运维方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311613030.5A CN117743115A (zh) | 2023-11-28 | 2023-11-28 | 运维方法、系统、装置及非易失性存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311613030.5A CN117743115A (zh) | 2023-11-28 | 2023-11-28 | 运维方法、系统、装置及非易失性存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117743115A true CN117743115A (zh) | 2024-03-22 |
Family
ID=90282291
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311613030.5A Pending CN117743115A (zh) | 2023-11-28 | 2023-11-28 | 运维方法、系统、装置及非易失性存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117743115A (zh) |
-
2023
- 2023-11-28 CN CN202311613030.5A patent/CN117743115A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10248404B2 (en) | Managing update deployment | |
US8595364B2 (en) | System and method for automatic storage load balancing in virtual server environments | |
US9116897B2 (en) | Techniques for power analysis | |
US9712410B1 (en) | Local metrics in a service provider environment | |
US9128899B1 (en) | Predictive failover planning | |
US7251588B2 (en) | System for metric introspection in monitoring sources | |
JP2009543233A (ja) | アプリケーションシステムの負荷管理 | |
CN111611207B (zh) | 状态数据处理方法、装置及计算机设备 | |
JP2006260056A (ja) | 統合運用管理サーバ、統合的な運用管理のためのメッセージの抽出方法、及び、プログラム | |
CN115469813A (zh) | 数据处理方法及装置、存储介质、电子装置 | |
CN110515938B (zh) | 基于kafka消息总线的数据汇聚存储方法、设备和存储介质 | |
US10282245B1 (en) | Root cause detection and monitoring for storage systems | |
CN111901405B (zh) | 一种多节点监控方法、装置、电子设备及存储介质 | |
CN109033188A (zh) | 一种元数据采集方法、装置、服务器和计算机可读介质 | |
CN117369941A (zh) | Pod调度方法和系统 | |
CN112463549A (zh) | 云平台的审计方法、装置、设备及计算机可读存储介质 | |
CN109510730A (zh) | 分布式系统及其监控方法、装置、电子设备及存储介质 | |
CN112817687A (zh) | 一种数据同步方法和装置 | |
CN110909023B (zh) | 一种查询计划的获取方法、数据查询方法及装置 | |
CN109995571B (zh) | 服务器配置与vnf应用匹配的方法及装置 | |
CN117743115A (zh) | 运维方法、系统、装置及非易失性存储介质 | |
CN107894942B (zh) | 数据表访问量的监控方法和装置 | |
CN111885159B (zh) | 数据采集方法、装置、电子设备及存储介质 | |
JP2004164610A (ja) | 管理装置 | |
CN115269519A (zh) | 一种日志检测方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |