CN112115026B - 服务器集群监控方法、装置、电子设备及可读存储介质 - Google Patents
服务器集群监控方法、装置、电子设备及可读存储介质 Download PDFInfo
- Publication number
- CN112115026B CN112115026B CN202010970557.3A CN202010970557A CN112115026B CN 112115026 B CN112115026 B CN 112115026B CN 202010970557 A CN202010970557 A CN 202010970557A CN 112115026 B CN112115026 B CN 112115026B
- Authority
- CN
- China
- Prior art keywords
- server
- abnormal
- exception
- information
- event
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 126
- 238000012544 monitoring process Methods 0.000 title claims abstract description 58
- 230000002159 abnormal effect Effects 0.000 claims abstract description 284
- 230000008569 process Effects 0.000 claims abstract description 89
- 238000012545 processing Methods 0.000 claims abstract description 27
- 238000013507 mapping Methods 0.000 claims description 16
- 230000004083 survival effect Effects 0.000 claims description 4
- 230000005856 abnormality Effects 0.000 abstract description 10
- 238000012806 monitoring device Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 4
- 238000012423 maintenance Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3006—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3055—Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3089—Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Quality & Reliability (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明涉及数据处理,揭露一种服务器集群监控方法,包括:实时监控待监控服务器集群中各个服务器的预设指标,当判断发生服务器异常事件时生成第一异常信息;实时读取各个服务器上部署的每个应用程序的核心进程对应的日志信息及页面跳转信息,当判断发生应用程序异常事件时生成第二异常信息;确定服务器异常事件和/或应用程序异常事件对应的异常等级,基于第一、第二异常信息及异常等级对服务器异常事件和/或应用程序异常事件进行处理。本发明还提供一种服务器集群监控装置、电子设备及可读存储介质。本发明实现了全面监控服务器集群中的服务器及部署在服务器上的应用程序是否异常,并及时处理异常。
Description
技术领域
本发明涉及数据处理领域,尤其涉及一种服务器集群监控方法、装置、电子设备及可读存储介质。
背景技术
随着数字化时代的到来,服务器集群的应用越来越广泛,为了保证服务器集群的正常运行,通常需要对其进行监控,然而,当前的监控方案只能监控服务器集群中的服务器是否异常,而无法同时监控部署在服务器上的应用程序是否异常。因此,亟需一种服务器集群监控方法,以全面监控服务器集群中的服务器及部署在服务器上的应用程序是否异常,并及时处理异常。
发明内容
鉴于以上内容,有必要提供一种服务器集群监控方法,旨在全面监控服务器集群中的服务器及部署在服务器上的应用程序是否异常,并及时处理异常。
本发明提供的服务器集群监控方法,包括:
实时监控待监控服务器集群中各个服务器的预设指标,基于所述预设指标判断所述待监控服务器集群是否发生服务器异常事件,当判断发生服务器异常事件时生成第一异常信息;
确定所述待监控服务器集群中各个服务器上部署的每个应用程序的核心进程,实时读取所述核心进程对应的日志信息及页面跳转信息,基于所述日志信息及页面跳转信息判断所述待监控服务器集群是否发生应用程序异常事件,当判断发生应用程序异常事件时生成第二异常信息;
基于所述第一、第二异常信息确定所述服务器异常事件和/或应用程序异常事件对应的异常等级,基于所述第一、第二异常信息及异常等级对所述服务器异常事件和/或应用程序异常事件进行处理。
可选的,所述预设指标包括license利用率,基于license利用率判断所述待监控服务器集群是否发生服务器异常事件包括:
从所述待监控服务器集群中选择一个服务器,计算所述选择的服务器的license的第一利用率;
当所述第一利用率小于第一阈值时,计算所述待监控服务器集群剔除所述选择的服务器后的license的第二利用率;
当所述第一利用率与第二利用率的差值绝对值大于第二阈值时,判断所述选择的服务器发生了服务器异常事件。
可选的,在计算所述选择的服务器的license的第一利用率之后,所述方法还包括:
若所述第一利用率大于第一阈值,则判断所述选择的服务器发生了服务器异常事件。
可选的,所述基于所述日志信息及页面跳转信息判断所述待监控服务器集群是否发生应用程序异常事件包括:
根据所述日志信息的写入时间判断所述核心进程是否存活;
根据所述日志信息中是否存在预设关键字判断所述核心进程是否异常;
基于所述页面跳转信息确定所述核心进程对应的各个模块的跳转成功率,基于所述跳转成功率判断所述核心进程对应的各个模块是否异常;
当出现核心进程未存活、核心进程异常及核心进程对应的模块异常中任意一种情况时,判断所述待监控服务器集群发生了应用程序异常事件。
可选的,所述第一异常信息包括:异常服务器ID、异常时间、异常指标名称及异常指标值,所述第二异常信息包括:异常应用程序名称、异常时间、异常应用程序所在的服务器ID、异常核心进程名称及其异常状态、异常模块名称及其异常状态。
可选的,所述基于所述第一、第二异常信息确定所述服务器异常事件和/或应用程序异常事件对应的异常等级包括:
根据所述第一异常信息中的异常指标值及第一映射关系表确定所述服务器异常事件对应的异常等级;
根据所述第二异常信息中的异常核心进程名称及其异常状态、异常模块名称及其异常状态和第二映射关系表确定所述应用程序异常事件对应的异常等级。
可选的,所述基于所述第一、第二异常信息及异常等级对所述服务器异常事件和/或应用程序异常事件进行处理包括:
基于所述第一、第二异常信息从数据库中查找所述服务器异常事件和/或应用程序异常事件对应的解决方案;
根据所述异常等级确定所述服务器异常事件和/或应用程序异常事件对应的目标告警方式;
执行所述服务器异常事件和/或应用程序异常事件对应的解决方案,并将所述服务器异常事件和/或应用程序异常事件对应的第一、第二异常信息及解决方案通过目标告警方式进行告警。
为了解决上述问题,本发明还提供一种服务器集群监控装置,所述装置包括:
第一监控模块,用于实时监控待监控服务器集群中各个服务器的预设指标,基于所述预设指标判断所述待监控服务器集群是否发生服务器异常事件,当判断发生服务器异常事件时生成第一异常信息;
第二监控模块,用于确定所述待监控服务器集群中各个服务器上部署的每个应用程序的核心进程,实时读取所述核心进程对应的日志信息及页面跳转信息,基于所述日志信息及页面跳转信息判断所述待监控服务器集群是否发生应用程序异常事件,当判断发生应用程序异常事件时生成第二异常信息;
处理模块,用于基于所述第一、第二异常信息确定所述服务器异常事件和/或应用程序异常事件对应的异常等级,基于所述第一、第二异常信息及异常等级对所述服务器异常事件和/或应用程序异常事件进行处理。
为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的服务器集群监控程序,所述服务器集群监控程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述服务器集群监控方法。
为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有服务器集群监控程序,所述服务器集群监控程序可被一个或者多个处理器执行,以实现上述服务器集群监控方法。
相较现有技术,本发明首先实时监控待监控服务器集群中各个服务器的预设指标,基于预设指标判断待监控服务器集群是否发生服务器异常事件,当判断发生服务器异常事件时生成第一异常信息,本步骤可及时识别待监控服务器集群中各个服务器是否异常;接着,确定待监控服务器集群中各个服务器上部署的每个应用程序的核心进程,实时读取核心进程对应的日志信息及页面跳转信息,基于日志信息及页面跳转信息判断待监控服务器集群是否发生应用程序异常事件,当判断发生应用程序异常事件时生成第二异常信息,本步骤可及时识别部署在待监控服务器集群中各个服务器上的应用程序是否异常;最后,基于第一、第二异常信息确定服务器异常事件和/或应用程序异常事件对应的异常等级,基于第一、第二异常信息及异常等级对服务器异常事件和/或应用程序异常事件进行处理,本步骤保证了及时处理各异常事件。因此,本发明实现了全面监控服务器集群中的服务器及部署在服务器上的应用程序是否异常,并及时处理了异常。
附图说明
图1为本发明一实施例提供的服务器集群监控方法的流程示意图;
图2为本发明一实施例提供的服务器集群监控装置的模块示意图;
图3为本发明一实施例提供的实现服务器集群监控方法的电子设备的结构示意图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
本发明提供一种服务器集群监控方法。参照图1所示,为本发明一实施例提供的服务器集群监控方法的流程示意图。该方法可以由一个电子设备执行,该电子设备可以由软件和/或硬件实现。
本实施例中,服务器集群监控方法包括:
S1、实时监控待监控服务器集群中各个服务器的预设指标,基于所述预设指标判断所述待监控服务器集群是否发生服务器异常事件,当判断发生服务器异常事件时生成第一异常信息。
本实施例中,所述预设指标包括CPU、内存、磁盘及license(许可证)利用率,所述服务器异常事件包括服务器宕机及服务器运行缓慢。
基于license利用率判断所述待监控服务器集群是否发生服务器异常事件包括:
A1、从所述待监控服务器集群中选择一个服务器,计算所述选择的服务器的license的第一利用率;
A2、当所述第一利用率小于第一阈值(例如,80%)时,计算所述待监控服务器集群剔除所述选择的服务器后的license的第二利用率;
A3、当所述第一利用率与第二利用率的差值绝对值大于第二阈值(例如,10%)时,判断所述选择的服务器发生了服务器异常事件。
本实施例中,在计算所述选择的服务器的license的第一利用率之后,所述方法还包括:
若所述第一利用率大于第一阈值,则判断所述选择的服务器发生了服务器异常事件。
例如,服务器集群中有3台服务器,license数量分别是100,100,80,某瞬间实时license使用量分别为65,64,63,则第一台服务器单台使用率为65%,第二台服务器单台使用率为64%,第三台服务器单台使用率为78.8%,从单台来看,不会出现告警。剔除第一台后其余2台的总使用率为70.6%;剔除第二台后其余2台的总使用率为71.1%,剔除第三台后其余2台的总使用率为64.5%。三台机器单台使用率与其余机器总使用率的差的绝对值分别为:5.6%,7.1%,14.3%,若第二阈值为10%,则判定license分发机制异常或第三台机器license应用异常,说明此时发生了服务器异常事件。
基于license利用率判断服务器集群是否发生服务器异常事件的目的是为了确认当前的license访问请求分配是否合理,在峰值到来前发现异常,防止峰值到来时单台服务器需要处理的license访问请求过多而导致服务器运行异常,本方案可保证license分配均衡。
对于CPU利用率、内存利用率、磁盘利用率三个指标,当指标值高于对应的阈值时认为发生了服务器异常事件。
所述第一异常信息包括:异常服务器ID、异常时间、异常指标名称及异常指标值。
S2、确定所述待监控服务器集群中各个服务器上部署的每个应用程序的核心进程,实时读取所述核心进程对应的日志信息及页面跳转信息,基于所述日志信息及页面跳转信息判断所述待监控服务器集群是否发生应用程序异常事件,当判断发生应用程序异常事件时生成第二异常信息。
应用程序的核心进程是否正常运行是应用程序能否提供服务的关键,核心进程为一直运行的进程,例如,各应用程序的登录模块、即时通讯平台的聊天模块、购物平台的支付模块等。
本实施例中确定出各个应用程序的核心进程后,根据核心进程打印日志的地址路径获取其日志信息,同时核心进程对应的页面跳转信息被记录在预设数据库中。
所述基于所述日志信息及页面跳转信息判断所述待监控服务器集群是否发生应用程序异常事件包括:
B1、根据所述日志信息的写入时间判断所述核心进程是否存活;
本实施例中,当核心进程的日志在预设时间段(例如,6秒)内未写入数据时,则说明该核心进程异常。
B2、根据所述日志信息中是否存在预设关键字判断所述核心进程是否异常;
本实施例中预设关键字段为核心程序异常或报错时日志输出的字段,例如,“Error”、“Abnormal”、“Bug”,或者异常编码(例如,某核心进程正常运行时输出编码001,异常时输出编码002)。
日志在输出异常或报错字段时,也会同时输出异常或报错的原因及涉及到的模块名称。
B3、基于所述页面跳转信息确定所述核心进程对应的各个模块的跳转成功率,基于所述跳转成功率判断所述核心进程对应的各个模块是否异常;
页面跳转成功率在一定程度上反映了应用程序是否正常运行,例如,对于某购物平台,在购物界面点击“立即付款”后会跳转到支付界面,跳转成功率为0时认为购物平台应用程序未存活或其支付模块异常,若购物平台应用程序有存活(通过日志信息的写入时间来判断),则说明支付模块异常。
所述基于所述跳转成功率判断各个模块是否异常包括:
C1、将各个模块的当前跳转成功率与前一周每天同一时间区间的跳转成功率进行比对(同比),若差值绝对值大于第三阈值,则认为该模块出现异常;
C2、将各个模块的当前跳转成功率与前10分钟、前20分钟、前30分钟的跳转成功率进行比对(环比),若差值绝对值大于第四阈值,则认为该模块出现异常。
通过对跳转成功率进行同比、环比,可全面侦测到各个应用程序的每个异常模块。
本实施例中,所述第二异常信息包括:异常应用程序名称、异常时间、异常应用程序所在的服务器ID、异常核心进程名称及其异常状态、异常模块名称及其异常状态,所述异常状态包括:未存活及运行缓慢。
B4、当出现核心进程未存活、核心进程异常及核心进程对应的模块异常中任意一种情况时,判断所述待监控服务器集群发生了应用程序异常事件。
S3、基于所述第一、第二异常信息确定所述服务器异常事件和/或应用程序异常事件对应的异常等级,基于所述第一、第二异常信息及异常等级对所述服务器异常事件和/或应用程序异常事件进行处理。
所述基于所述第一、第二异常信息确定所述服务器异常事件和/或应用程序异常事件对应的异常等级包括:
D1、根据所述第一异常信息中的异常指标值及第一映射关系表确定所述服务器异常事件对应的异常等级;
所述第一映射关系表为预先设置的指标值与异常等级的映射关系表,本实施例中以预设指标为CPU利用率为例进行说明,CPU利用率与异常等级的映射关系如下表1所示:
CPU利用率 | 异常等级 |
>95% | 第一等级 |
90%~95% | 第二等级 |
80%~90% | 第三等级 |
表1
若第一异常信息中的CPU利用率为96%,则认为该服务器异常事件的异常等级为第一等级。
D2、根据所述第二异常信息中的异常核心进程名称及其异常状态、异常模块名称及其异常状态和第二映射关系表确定所述应用程序异常事件对应的异常等级。
本实施例中,第二映射关系表可以如下表2所示:
表2
所述基于所述第一、第二异常信息及异常等级对所述服务器异常事件和/或应用程序异常事件进行处理包括:
E1、基于所述第一、第二异常信息从数据库中查找所述服务器异常事件和/或应用程序异常事件对应的解决方案;
本实施例中,数据库中预先设置了各异常事件对应的解决方案。例如,某核心进程未存活,则重启该核心进程,重启三次后该核心进程仍未正常运行,则重启该核心进程对应的应用程序。
E2、根据所述异常等级确定所述服务器异常事件和/或应用程序异常事件对应的目标告警方式;
本实施例中,异常等级与告警方式之间的关系如下表3所示:
表3
E3、执行所述服务器异常事件和/或应用程序异常事件对应的解决方案,并将所述服务器异常事件和/或应用程序异常事件对应的第一、第二异常信息及解决方案通过目标告警方式进行告警。
所述将所述服务器异常事件和/或应用程序异常事件对应的第一、第二异常信息及解决方案以目标告警方式进行告警,包括:
F1、将所述服务器异常事件和/或应用程序异常事件对应的第一、第二异常信息及解决方案拼接后生成文本信息;
F2、若目标告警方式为电话、短信及邮件告警,则将所述文本信息转换为语音信息,通过语音模块外呼第一联系人播报所述语音信息,并将所述文本信息通过短信和邮件发送给第一联系人。
本实施例确定异常事件对应的异常等级后,将异常消息、联系人信息通过参数传递至该异常等级对应的处理平台。
若异常等级为第一等级,则目标告警方式为电话+短信+邮件。以电话告警为例,告警平台传输给电话自动外呼平台的参数包含“第一联系人姓名”、“第一联系人电话”、“第二联系人姓名”、“第二联系人电话”、“异常信息描述”,
电话平台自动读取“第一联系人电话”并自动外呼该号码,同时将收到的参数信息拼接为播报文本,拼接格式为:“第一联系人姓名”您好,“异常信息描述”,现已按照预设方案进行“异常对应解决方案”。请您及时查看,确认收到信息请按1,重听请按2,需联系运维值班人员请按3。
若联系人已接听,则外呼平台将拼接好的文本传至TTS,将语音文件播报给联系人听,并记录5种反馈结果,各种反馈结果对应的处理方式如下表4所示:
表4
若外呼次数超过预设次数阈值(例如,3次)时电话仍未接通,则外呼第二联系人,如果第二联系人仍未接听,则外呼第三联系人,若预设的所有联系人均未接听,则外呼运维值班人员,记录信息并回调告警平台。
由上述实施例可知,本发明提出的服务器集群监控方法,首先,实时监控待监控服务器集群中各个服务器的预设指标,基于预设指标判断待监控服务器集群是否发生服务器异常事件,当判断发生服务器异常事件时生成第一异常信息,本步骤可及时识别待监控服务器集群中各个服务器是否异常;接着,确定待监控服务器集群中各个服务器上部署的每个应用程序的核心进程,实时读取核心进程对应的日志信息及页面跳转信息,基于日志信息及页面跳转信息判断待监控服务器集群是否发生应用程序异常事件,当判断发生应用程序异常事件时生成第二异常信息,本步骤可及时识别部署在待监控服务器集群中各个服务器上的应用程序是否异常;最后,基于第一、第二异常信息确定服务器异常事件和/或应用程序异常事件对应的异常等级,基于第一、第二异常信息及异常等级对服务器异常事件和/或应用程序异常事件进行处理,本步骤保证了及时处理各异常事件。因此,本发明实现了全面监控服务器集群中的服务器及部署在服务器上的应用程序是否异常,并及时处理了异常。
如图2所示,为本发明一实施例提供的服务器集群监控装置的模块示意图。
本发明所述服务器集群监控装置100可以安装于电子设备中。根据实现的功能,所述服务器集群监控装置100可以包括第一监控模块110、第二监控模块120及处理模块130。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块/单元的功能如下:
第一监控模块110,用于实时监控待监控服务器集群中各个服务器的预设指标,基于所述预设指标判断所述待监控服务器集群是否发生服务器异常事件,当判断发生服务器异常事件时生成第一异常信息。
本实施例中,所述预设指标包括CPU、内存、磁盘及license(许可证)利用率,所述服务器异常事件包括服务器宕机及服务器运行缓慢。
基于license利用率判断所述待监控服务器集群是否发生服务器异常事件包括:
A1、从所述待监控服务器集群中选择一个服务器,计算所述选择的服务器的license的第一利用率;
A2、当所述第一利用率小于第一阈值(例如,80%)时,计算所述待监控服务器集群剔除所述选择的服务器后的license的第二利用率;
A3、当所述第一利用率与第二利用率的差值绝对值大于第二阈值(例如,10%)时,判断所述选择的服务器发生了服务器异常事件。
本实施例中,在计算所述选择的服务器的license的第一利用率之后,所述第一监控模块110还用于:
若所述第一利用率大于第一阈值,则判断所述选择的服务器发生了服务器异常事件。
例如,服务器集群中有3台服务器,license数量分别是100,100,80,某瞬间实时license使用量分别为65,64,63,则第一台服务器单台使用率为65%,第二台服务器单台使用率为64%,第三台服务器单台使用率为78.8%,从单台来看,不会出现告警。剔除第一台后其余2台的总使用率为70.6%;剔除第二台后其余2台的总使用率为71.1%,剔除第三台后其余2台的总使用率为64.5%。三台机器单台使用率与其余机器总使用率的差的绝对值分别为:5.6%,7.1%,14.3%,若第二阈值为10%,则判定license分发机制异常或第三台机器license应用异常,说明此时发生了服务器异常事件。
基于license利用率判断服务器集群是否发生服务器异常事件的目的是为了确认当前的license访问请求分配是否合理,在峰值到来前发现异常,防止峰值到来时单台服务器需要处理的license访问请求过多而导致服务器运行异常,本方案可保证license分配均衡。
对于CPU利用率、内存利用率、磁盘利用率三个指标,当指标值高于对应的阈值时认为发生了服务器异常事件。
所述第一异常信息包括:异常服务器ID、异常时间、异常指标名称及异常指标值。
第二监控模块120,用于确定所述待监控服务器集群中各个服务器上部署的每个应用程序的核心进程,实时读取所述核心进程对应的日志信息及页面跳转信息,基于所述日志信息及页面跳转信息判断所述待监控服务器集群是否发生应用程序异常事件,当判断发生应用程序异常事件时生成第二异常信息。
应用程序的核心进程是否正常运行是应用程序能否提供服务的关键,核心进程为一直运行的进程,例如,各应用程序的登录模块、即时通讯平台的聊天模块、购物平台的支付模块等。
本实施例中确定出各个应用程序的核心进程后,根据核心进程打印日志的地址路径获取其日志信息,同时核心进程对应的页面跳转信息被记录在预设数据库中。
所述基于所述日志信息及页面跳转信息判断所述待监控服务器集群是否发生应用程序异常事件包括:
B1、根据所述日志信息的写入时间判断所述核心进程是否存活;
本实施例中,当核心进程的日志在预设时间段(例如,6秒)内未写入数据时,则说明该核心进程异常。
B2、根据所述日志信息中是否存在预设关键字判断所述核心进程是否异常;
本实施例中预设关键字段为核心程序异常或报错时日志输出的字段,例如,“Error”、“Abnormal”、“Bug”,或者异常编码(例如,某核心进程正常运行时输出编码001,异常时输出编码002)。
日志在输出异常或报错字段时,也会同时输出异常或报错的原因及涉及到的模块名称。
B3、基于所述页面跳转信息确定所述核心进程对应的各个模块的跳转成功率,基于所述跳转成功率判断所述核心进程对应的各个模块是否异常;
页面跳转成功率在一定程度上反映了应用程序是否正常运行,例如,对于某购物平台,在购物界面点击“立即付款”后会跳转到支付界面,跳转成功率为0时认为购物平台应用程序未存活或其支付模块异常,若购物平台应用程序有存活(通过日志信息的写入时间来判断),则说明支付模块异常。
所述基于所述跳转成功率判断各个模块是否异常包括:
C1、将各个模块的当前跳转成功率与前一周每天同一时间区间的跳转成功率进行比对(同比),若差值绝对值大于第三阈值,则认为该模块出现异常;
C2、将各个模块的当前跳转成功率与前10分钟、前20分钟、前30分钟的跳转成功率进行比对(环比),若差值绝对值大于第四阈值,则认为该模块出现异常。
通过对跳转成功率进行同比、环比,可全面侦测到各个应用程序的每个异常模块。
本实施例中,所述第二异常信息包括:异常应用程序名称、异常时间、异常应用程序所在的服务器ID、异常核心进程名称及其异常状态、异常模块名称及其异常状态,所述异常状态包括:未存活及运行缓慢。
B4、当出现核心进程未存活、核心进程异常及核心进程对应的模块异常中任意一种情况时,判断所述待监控服务器集群发生了应用程序异常事件。
处理模块130,用于基于所述第一、第二异常信息确定所述服务器异常事件和/或应用程序异常事件对应的异常等级,基于所述第一、第二异常信息及异常等级对所述服务器异常事件和/或应用程序异常事件进行处理。
所述基于所述第一、第二异常信息确定所述服务器异常事件和/或应用程序异常事件对应的异常等级包括:
D1、根据所述第一异常信息中的异常指标值及第一映射关系表确定所述服务器异常事件对应的异常等级;
所述第一映射关系表为预先设置的指标值与异常等级的映射关系表,本实施例中以预设指标为CPU利用率为例进行说明,CPU利用率与异常等级的映射关系如下表1所示:
CPU利用率 | 异常等级 |
>95% | 第一等级 |
90%~95% | 第二等级 |
80%~90% | 第三等级 |
表1
若第一异常信息中的CPU利用率为96%,则认为该服务器异常事件的异常等级为第一等级。
D2、根据所述第二异常信息中的异常核心进程名称及其异常状态、异常模块名称及其异常状态和第二映射关系表确定所述应用程序异常事件对应的异常等级。
本实施例中,第二映射关系表可以如下表2所示:
第二异常信息 | 异常等级 |
核心进程未存活 | 第一等级 |
核心进程运行缓慢 | 第二等级 |
非核心模块未存活或运行缓慢 | 第三等级 |
表2
所述基于所述第一、第二异常信息及异常等级对所述服务器异常事件和/或应用程序异常事件进行处理包括:
E1、基于所述第一、第二异常信息从数据库中查找所述服务器异常事件和/或应用程序异常事件对应的解决方案;
本实施例中,数据库中预先设置了各异常事件对应的解决方案。例如,某核心进程未存活,则重启该核心进程,重启三次后该核心进程仍未正常运行,则重启该核心进程对应的应用程序。
E2、根据所述异常等级确定所述服务器异常事件和/或应用程序异常事件对应的目标告警方式;
本实施例中,异常等级与告警方式之间的关系如下表3所示:
表3
E3、执行所述服务器异常事件和/或应用程序异常事件对应的解决方案,并将所述服务器异常事件和/或应用程序异常事件对应的第一、第二异常信息及解决方案通过目标告警方式进行告警。
所述将所述服务器异常事件和/或应用程序异常事件对应的第一、第二异常信息及解决方案以目标告警方式进行告警,包括:
F1、将所述服务器异常事件和/或应用程序异常事件对应的第一、第二异常信息及解决方案拼接后生成文本信息;
F2、若目标告警方式为电话、短信及邮件告警,则将所述文本信息转换为语音信息,通过语音模块外呼第一联系人播报所述语音信息,并将所述文本信息通过短信和邮件发送给第一联系人。
本实施例确定异常事件对应的异常等级后,将异常消息、联系人信息通过参数传递至该异常等级对应的处理平台。
若异常等级为第一等级,则目标告警方式为电话+短信+邮件。以电话告警为例,告警平台传输给电话自动外呼平台的参数包含“第一联系人姓名”、“第一联系人电话”、“第二联系人姓名”、“第二联系人电话”、“异常信息描述”,
电话平台自动读取“第一联系人电话”并自动外呼该号码,同时将收到的参数信息拼接为播报文本,拼接格式为:“第一联系人姓名”您好,“异常信息描述”,现已按照预设方案进行“异常对应解决方案”。请您及时查看,确认收到信息请按1,重听请按2,需联系运维值班人员请按3。
若联系人已接听,则外呼平台将拼接好的文本传至TTS,将语音文件播报给联系人听,并记录5种反馈结果,各种反馈结果对应的处理方式如下表4所示:
表4
若外呼次数超过预设次数阈值(例如,3次)时电话仍未接通,则外呼第二联系人,如果第二联系人仍未接听,则外呼第三联系人,若预设的所有联系人均未接听,则外呼运维值班人员,记录信息并回调告警平台。
如图3所示,为本发明一实施例提供的实现服务器集群监控方法的电子设备的结构示意图。
所述电子设备1是一种能够按照事先设定或者存储的指令,自动进行数值计算和/或信息处理的设备。所述电子设备1可以是计算机、也可以是单个网络服务器、多个网络服务器组成的服务器组或者基于云计算的由大量主机或者网络服务器构成的云,其中云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。
在本实施例中,电子设备1包括,但不仅限于,可通过系统总线相互通信连接的存储器11、处理器12、网络接口13,该存储器11中存储有服务器集群监控程序10,所述服务器集群监控程序10可被所述处理器12执行。图3仅示出了具有组件11-13以及服务器集群监控程序10的电子设备1,本领域技术人员可以理解的是,图3示出的结构并不构成对电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
其中,存储器11包括内存及至少一种类型的可读存储介质。内存为电子设备1的运行提供缓存;可读存储介质可为如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等的非易失性存储介质。在一些实施例中,可读存储介质可以是电子设备1的内部存储单元,例如该电子设备1的硬盘;在另一些实施例中,该非易失性存储介质也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。本实施例中,存储器11的可读存储介质通常用于存储安装于电子设备1的操作系统和各类应用软件,例如存储本发明一实施例中的服务器集群监控程序10的代码等。此外,存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器12在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器12通常用于控制所述电子设备1的总体操作,例如执行与其他设备进行数据交互或者通信相关的控制和处理等。本实施例中,所述处理器12用于运行所述存储器11中存储的程序代码或者处理数据,例如运行服务器集群监控程序10等。
网络接口13可包括无线网络接口或有线网络接口,该网络接口13用于在所述电子设备1与客户端(图中未画出)之间建立通信连接。
可选的,所述电子设备1还可以包括用户接口,用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。可选的,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
所述电子设备1中的所述存储器11存储的服务器集群监控程序10是多个指令的组合,在所述处理器12中运行时,可以实现:
实时监控待监控服务器集群中各个服务器的预设指标,基于所述预设指标判断所述待监控服务器集群是否发生服务器异常事件,当判断发生服务器异常事件时生成第一异常信息;
确定所述待监控服务器集群中各个服务器上部署的每个应用程序的核心进程,实时读取所述核心进程对应的日志信息及页面跳转信息,基于所述日志信息及页面跳转信息判断所述待监控服务器集群是否发生应用程序异常事件,当判断发生应用程序异常事件时生成第二异常信息;
基于所述第一、第二异常信息确定所述服务器异常事件和/或应用程序异常事件对应的异常等级,基于所述第一、第二异常信息及异常等级对所述服务器异常事件和/或应用程序异常事件进行处理。
具体地,所述处理器12对上述服务器集群监控程序10的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。需要强调的是,为进一步保证上述第一、第二异常信息的私密和安全性,上述第一、第二异常信息还可以存储于一区块链的节点中。
进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。所述计算机可读介质可以是非易失性的,也可以是非易失性的。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
所述计算机可读存储介质上存储有服务器集群监控程序10,所述服务器集群监控程序10可被一个或者多个处理器执行,本发明计算机可读存储介质具体实施方式与上述服务器集群监控方法各实施例基本相同,在此不作赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (9)
1.一种服务器集群监控方法,其特征在于,所述方法包括:
实时监控待监控服务器集群中各个服务器的预设指标,所述预设指标包括license利用率,基于license利用率判断所述待监控服务器集群是否发生服务器异常事件,当判断发生服务器异常事件时生成第一异常信息,其中,所述基于license利用率判断所述待监控服务器集群是否发生服务器异常事件,包括:从所述待监控服务器集群中选择一个服务器,计算所述选择的服务器的license的第一利用率;当所述第一利用率小于第一阈值时,计算所述待监控服务器集群剔除所述选择的服务器后的license的第二利用率;当所述第一利用率与第二利用率的差值绝对值大于第二阈值时,判断所述选择的服务器发生了服务器异常事件;
确定所述待监控服务器集群中各个服务器上部署的每个应用程序的核心进程,实时读取所述核心进程对应的日志信息及页面跳转信息,基于所述日志信息及页面跳转信息判断所述待监控服务器集群是否发生应用程序异常事件,当判断发生应用程序异常事件时生成第二异常信息;
基于所述第一异常信息确定所述服务器异常事件对应的异常等级,和/或,基于所述第二异常信息确定所述应用程序异常事件对应的异常等级,基于所述第一、第二异常信息及异常等级对所述服务器异常事件和/或应用程序异常事件进行处理。
2.如权利要求1所述的服务器集群监控方法,其特征在于,在计算所述选择的服务器的license的第一利用率之后,所述方法还包括:
若所述第一利用率大于第一阈值,则判断所述选择的服务器发生了服务器异常事件。
3.如权利要求1所述的服务器集群监控方法,其特征在于,所述基于所述日志信息及页面跳转信息判断所述待监控服务器集群是否发生应用程序异常事件包括:
根据所述日志信息的写入时间判断所述核心进程是否存活;
根据所述日志信息中是否存在预设关键字判断所述核心进程是否异常;
基于所述页面跳转信息确定所述核心进程对应的各个模块的跳转成功率,基于所述跳转成功率判断所述核心进程对应的各个模块是否异常;
当出现核心进程未存活、核心进程异常及核心进程对应的模块异常中任意一种情况时,判断所述待监控服务器集群发生了应用程序异常事件。
4.如权利要求3所述的服务器集群监控方法,其特征在于,所述第一异常信息包括:异常服务器ID、异常时间、异常指标名称及异常指标值,所述第二异常信息包括:异常应用程序名称、异常时间、异常应用程序所在的服务器ID、异常核心进程名称及其异常状态、异常模块名称及其异常状态。
5.如权利要求4所述的服务器集群监控方法,其特征在于:
所述基于所述第一异常信息确定所述服务器异常事件对应的异常等级,包括:根据所述第一异常信息中的异常指标值及第一映射关系表确定所述服务器异常事件对应的异常等级;
所述基于所述第二异常信息确定所述应用程序异常事件对应的异常等级,包括:根据所述第二异常信息中的异常核心进程名称及其异常状态、异常模块名称及其异常状态和第二映射关系表确定所述应用程序异常事件对应的异常等级。
6.如权利要求5所述的服务器集群监控方法,其特征在于,所述基于所述第一、第二异常信息及异常等级对所述服务器异常事件和/或应用程序异常事件进行处理包括:
基于所述第一、第二异常信息从数据库中查找所述服务器异常事件和/或应用程序异常事件对应的解决方案;
根据所述异常等级确定所述服务器异常事件和/或应用程序异常事件对应的目标告警方式;
执行所述服务器异常事件和/或应用程序异常事件对应的解决方案,并将所述服务器异常事件和/或应用程序异常事件对应的第一、第二异常信息及解决方案通过目标告警方式进行告警。
7.一种服务器集群监控装置,其特征在于,所述装置包括:
第一监控模块,用于实时监控待监控服务器集群中各个服务器的预设指标,所述预设指标包括license利用率,基于license利用率判断所述待监控服务器集群是否发生服务器异常事件,当判断发生服务器异常事件时生成第一异常信息,其中,所述基于license利用率判断所述待监控服务器集群是否发生服务器异常事件,包括:从所述待监控服务器集群中选择一个服务器,计算所述选择的服务器的license的第一利用率;当所述第一利用率小于第一阈值时,计算所述待监控服务器集群剔除所述选择的服务器后的license的第二利用率;当所述第一利用率与第二利用率的差值绝对值大于第二阈值时,判断所述选择的服务器发生了服务器异常事件;
第二监控模块,用于确定所述待监控服务器集群中各个服务器上部署的每个应用程序的核心进程,实时读取所述核心进程对应的日志信息及页面跳转信息,基于所述日志信息及页面跳转信息判断所述待监控服务器集群是否发生应用程序异常事件,当判断发生应用程序异常事件时生成第二异常信息;
处理模块,用于基于所述第一异常信息确定所述服务器异常事件对应的异常等级,和/或,基于所述第二异常信息确定所述应用程序异常事件对应的异常等级,基于所述第一、第二异常信息及异常等级对所述服务器异常事件和/或应用程序异常事件进行处理。
8.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的服务器集群监控程序,所述服务器集群监控程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至6中任一项所述的服务器集群监控方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有服务器集群监控程序,所述服务器集群监控程序可被一个或者多个处理器执行,以实现如权利要求1至6任一项所述的服务器集群监控方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010970557.3A CN112115026B (zh) | 2020-09-15 | 2020-09-15 | 服务器集群监控方法、装置、电子设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010970557.3A CN112115026B (zh) | 2020-09-15 | 2020-09-15 | 服务器集群监控方法、装置、电子设备及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112115026A CN112115026A (zh) | 2020-12-22 |
CN112115026B true CN112115026B (zh) | 2022-09-16 |
Family
ID=73802672
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010970557.3A Active CN112115026B (zh) | 2020-09-15 | 2020-09-15 | 服务器集群监控方法、装置、电子设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112115026B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112612676A (zh) * | 2020-12-25 | 2021-04-06 | 深圳市裕展精密科技有限公司 | 设备的监控方法及监控装置 |
CN112769605B (zh) * | 2020-12-30 | 2022-08-09 | 杭州东方通信软件技术有限公司 | 一种异构多云的运维管理方法及混合云平台 |
CN113886122B (zh) * | 2021-09-30 | 2024-03-01 | 济南浪潮数据技术有限公司 | 一种系统运行异常处理方法、装置、设备及存储介质 |
CN113965497B (zh) * | 2021-10-20 | 2022-12-06 | 深圳平安医疗健康科技服务有限公司 | 服务器异常识别方法、装置、计算机设备及可读存储介质 |
CN114448831B (zh) * | 2022-03-18 | 2023-09-01 | 以萨技术股份有限公司 | 一种集群所属服务器状态监控方法及系统 |
CN117411732B (zh) * | 2023-12-15 | 2024-03-22 | 国网四川省电力公司技能培训中心 | 网络安全事件的监测方法及其系统 |
CN118519815B (zh) * | 2024-07-18 | 2024-09-27 | 四川华鲲振宇智能科技有限责任公司 | 一种服务器集群异常检测方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106100902A (zh) * | 2016-08-04 | 2016-11-09 | 腾讯科技(深圳)有限公司 | 云端指标监控方法和装置 |
WO2017045079A1 (en) * | 2015-09-18 | 2017-03-23 | Avigilon Corporation | Physical security system having multiple server nodes configured to implement a conditionally triggered rule |
CN107943668A (zh) * | 2017-12-15 | 2018-04-20 | 江苏神威云数据科技有限公司 | 计算机服务器集群日志监控方法及监控平台 |
CN108537347A (zh) * | 2018-04-17 | 2018-09-14 | 成都致云科技有限公司 | It设备监控系统及方法 |
CN109062760A (zh) * | 2018-07-23 | 2018-12-21 | 深圳安泰创新科技股份有限公司 | 服务器监控方法、装置及计算机可读存储介质 |
CN109522287A (zh) * | 2018-09-18 | 2019-03-26 | 平安科技(深圳)有限公司 | 分布式文件存储集群的监控方法、系统、设备及介质 |
CN111447329A (zh) * | 2020-03-31 | 2020-07-24 | 携程旅游信息技术(上海)有限公司 | 呼叫中心中状态服务器的监控方法、系统、设备及介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111343262B (zh) * | 2020-02-20 | 2022-04-29 | 中国建设银行股份有限公司 | 分布式集群登录方法、装置、设备和存储介质 |
-
2020
- 2020-09-15 CN CN202010970557.3A patent/CN112115026B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017045079A1 (en) * | 2015-09-18 | 2017-03-23 | Avigilon Corporation | Physical security system having multiple server nodes configured to implement a conditionally triggered rule |
CN106100902A (zh) * | 2016-08-04 | 2016-11-09 | 腾讯科技(深圳)有限公司 | 云端指标监控方法和装置 |
CN107943668A (zh) * | 2017-12-15 | 2018-04-20 | 江苏神威云数据科技有限公司 | 计算机服务器集群日志监控方法及监控平台 |
CN108537347A (zh) * | 2018-04-17 | 2018-09-14 | 成都致云科技有限公司 | It设备监控系统及方法 |
CN109062760A (zh) * | 2018-07-23 | 2018-12-21 | 深圳安泰创新科技股份有限公司 | 服务器监控方法、装置及计算机可读存储介质 |
CN109522287A (zh) * | 2018-09-18 | 2019-03-26 | 平安科技(深圳)有限公司 | 分布式文件存储集群的监控方法、系统、设备及介质 |
CN111447329A (zh) * | 2020-03-31 | 2020-07-24 | 携程旅游信息技术(上海)有限公司 | 呼叫中心中状态服务器的监控方法、系统、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112115026A (zh) | 2020-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112115026B (zh) | 服务器集群监控方法、装置、电子设备及可读存储介质 | |
CN110618890B (zh) | 故障处理方法、装置、电子设备及计算机可读存储介质 | |
CN110851298B (zh) | 异常分析及处理方法、电子装置及存储介质 | |
CN113220540B (zh) | 业务管理方法、装置、计算机设备和存储介质 | |
CN111782456A (zh) | 异常检测方法、装置、计算机设备和存储介质 | |
CN108650123B (zh) | 故障信息记录方法、装置、设备和存储介质 | |
CN114547696A (zh) | 文件脱敏方法、装置、电子设备及存储介质 | |
CN114399397A (zh) | 续保跟踪方法、装置、设备及介质 | |
CN117640203A (zh) | 电网信息安全防护方法及系统 | |
CN112085611A (zh) | 数据异步核验方法、装置、电子设备及存储介质 | |
CN109040491B (zh) | 挂机行为处理方法、装置、计算机设备及存储介质 | |
CN116302652A (zh) | 系统报警信息的处理方法、装置及电子设备 | |
CN114416560A (zh) | 程序崩溃分析聚合方法和系统 | |
CN112685377B (zh) | 基于历史对象数据的检测处理方法、装置、服务器及介质 | |
CN112668998B (zh) | 流程实现方法、装置、系统、电子设备和可读存储介质 | |
CN114826725A (zh) | 数据交互方法、装置、设备及存储介质 | |
CN111131393B (zh) | 用户活跃度数据统计方法、电子装置及存储介质 | |
CN113724074A (zh) | 信用贷风险预警方法及装置 | |
CN111835566A (zh) | 一种系统故障管理方法、装置及系统 | |
CN111488236A (zh) | 一种订单异常处理方法、服务器、存储介质及处理装置 | |
CN116383544B (zh) | 一种网页报表的生成方法、装置、设备和介质 | |
CN111045723B (zh) | 关联系统间的代码变更通知方法、装置 | |
CN115840677A (zh) | 一种数据验证方法、装置、设备和存储介质 | |
CN113468024A (zh) | 一种可视化值班应急处置交互方法及装置 | |
CN109325667B (zh) | 基于转发信息的业务人员业绩考核方法及终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |