CN117971527A - 应用系统降级方法、装置、计算机设备和存储介质 - Google Patents
应用系统降级方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN117971527A CN117971527A CN202211300702.2A CN202211300702A CN117971527A CN 117971527 A CN117971527 A CN 117971527A CN 202211300702 A CN202211300702 A CN 202211300702A CN 117971527 A CN117971527 A CN 117971527A
- Authority
- CN
- China
- Prior art keywords
- degradation
- application system
- application
- log
- screening condition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000006731 degradation reaction Methods 0.000 title claims abstract description 410
- 230000015556 catabolic process Effects 0.000 title claims abstract description 404
- 238000000034 method Methods 0.000 title claims abstract description 90
- 238000012216 screening Methods 0.000 claims abstract description 182
- 230000002159 abnormal effect Effects 0.000 claims abstract description 120
- 230000009471 action Effects 0.000 claims abstract description 111
- 238000012545 processing Methods 0.000 claims abstract description 108
- 238000004590 computer program Methods 0.000 claims abstract description 26
- 230000005856 abnormality Effects 0.000 claims abstract description 23
- 238000011084 recovery Methods 0.000 claims description 60
- 238000004458 analytical method Methods 0.000 claims description 38
- 230000009467 reduction Effects 0.000 claims description 25
- 230000002776 aggregation Effects 0.000 claims description 8
- 238000004220 aggregation Methods 0.000 claims description 8
- 230000000593 degrading effect Effects 0.000 claims description 7
- 238000005516 engineering process Methods 0.000 abstract description 4
- 238000001514 detection method Methods 0.000 abstract description 3
- 230000000875 corresponding effect Effects 0.000 description 72
- 230000008569 process Effects 0.000 description 34
- 238000007726 management method Methods 0.000 description 32
- 238000010586 diagram Methods 0.000 description 14
- 238000011161 development Methods 0.000 description 9
- 238000001914 filtration Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 3
- 230000001276 controlling effect Effects 0.000 description 3
- 238000007639 printing Methods 0.000 description 3
- 230000001960 triggered effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000004141 dimensional analysis Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012827 research and development Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000007474 system interaction Effects 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000000586 desensitisation Methods 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Debugging And Monitoring (AREA)
Abstract
本申请涉及一种应用系统降级方法、装置、计算机设备、存储介质和计算机程序产品。可应用于云技术,方法包括:当接收到应用系统的异常告警消息时,确定异常告警消息中的系统异常时间节点,得到对应的时间窗口内应用系统的应用日志数据;查找应用系统对应的降级筛选条件以及降级筛选条件的降级阈值;当基于降级筛选条件筛选的应用日志数据符合降级阈值时,生成降级动作指令;基于降级动作指令对应用系统进行降级处理。本申请的方案通过结合应用系统的异常告警以及应用日志,可以在应用系统出现异常时提高应用系统异常的排查效率,再结合降级筛选条件以及降级阈值可以针对一些明确的场景进行自动降级处理,从而提高了应用系统的降级处理效率。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种应用系统降级方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
随着计算机技术的发展,出现了应用系统降级技术,比如由于代码发布,网络抖动,硬件损坏等原因,造成了应用的系统异常。开发者收到异常的告警消息后,往往需要根据告警消息来分析产生的原因,同时进行应用系统降级的相关处理,以保证应用系统的稳定性。
而在进行应用系统降级时,一般需要开发端与运营端同时协调处理,由开发端对问题进行定位,再由开发端联系运营端进行降级操作,在解决问题后联系运维进行恢复操作。处理过程链路较长,降级处理的效率较低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够在应用系统出现问题时提高降级处理效率的应用系统降级方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种应用系统降级方法。所述方法包括:
当接收到应用系统的异常告警消息时,确定所述异常告警消息中的系统异常时间节点,得到所述系统异常时间节点对应的时间窗口内所述应用系统的应用日志数据;
查找所述应用系统对应的降级筛选条件以及所述降级筛选条件的降级阈值;
当基于所述降级筛选条件筛选的应用日志数据符合所述降级阈值时,生成降级动作指令;
基于所述降级动作指令对所述应用系统进行降级处理。
第二方面,本申请还提供了一种应用系统降级装置。所述装置包括:
溯源模块,用于当接收到应用系统的异常告警消息时,确定所述异常告警消息中的系统异常时间节点,得到所述系统异常时间节点对应的时间窗口内所述应用系统的应用日志数据;
阈值筛选模块,用于查找所述应用系统对应的降级筛选条件以及所述降级筛选条件的降级阈值;
降级决策模块,用于当基于所述降级筛选条件筛选的应用日志数据符合所述降级阈值时,生成降级动作指令;
降级处理模块,用于基于所述降级动作指令对所述应用系统进行降级处理。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
当接收到应用系统的异常告警消息时,确定所述异常告警消息中的系统异常时间节点,得到所述系统异常时间节点对应的时间窗口内所述应用系统的应用日志数据;
查找所述应用系统对应的降级筛选条件以及所述降级筛选条件的降级阈值;
当基于所述降级筛选条件筛选的应用日志数据符合所述降级阈值时,生成降级动作指令;
基于所述降级动作指令对所述应用系统进行降级处理。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
当接收到应用系统的异常告警消息时,确定所述异常告警消息中的系统异常时间节点,得到所述系统异常时间节点对应的时间窗口内所述应用系统的应用日志数据;
查找所述应用系统对应的降级筛选条件以及所述降级筛选条件的降级阈值;
当基于所述降级筛选条件筛选的应用日志数据符合所述降级阈值时,生成降级动作指令;
基于所述降级动作指令对所述应用系统进行降级处理。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
当接收到应用系统的异常告警消息时,确定所述异常告警消息中的系统异常时间节点,得到所述系统异常时间节点对应的时间窗口内所述应用系统的应用日志数据;
查找所述应用系统对应的降级筛选条件以及所述降级筛选条件的降级阈值;
当基于所述降级筛选条件筛选的应用日志数据符合所述降级阈值时,生成降级动作指令;
基于所述降级动作指令对所述应用系统进行降级处理。
上述应用系统降级方法、装置、计算机设备、存储介质和计算机程序产品,在接收到应用系统的异常告警消息时,确定异常告警消息中的系统异常时间节点,得到系统异常时间节点对应的时间窗口内应用系统的应用日志数据。即在应用系统出现异常时,及时通过应用日志数据来对系统的异常进行定位以及识别,而后查找应用系统对应的降级筛选条件以及降级筛选条件的降级阈值;从而通过降级筛选条件以及降级阈值,判断应用日志所表征的应用系统状态是否达到了应用系统降级的要求,而在当基于降级筛选条件筛选的应用日志数据符合降级阈值时,生成降级动作指令;再基于降级动作指令对应用系统进行降级处理。即在通过应用日志数据判断系统可以实施降级处理后,通过降级动作指令来实现对应用系统进行降级处理。本申请的方案通过结合应用系统的异常告警以及应用日志,可以在应用系统出现异常时提高应用系统异常的排查效率,再结合降级筛选条件以及降级阈值可以针对一些明确的场景进行自动降级处理,从而有效地提高了应用系统的降级处理效率。
附图说明
图1为一个实施例中应用系统降级方法的应用环境图;
图2为一个实施例中应用系统降级方法的流程示意图;
图3为一个实施例中日志溯源处理过程的示意图;
图4为一个实施例中日志格式化处理过程的示意图;
图5为一个实施例中数据多维度分析过程中责任链处理的示意图;
图6为一个实施例中通过降级模块实现应用系统降级处理的示意图;
图7为一个实施例中应用系统降级处理过程的时序示意图;
图8为一个实施例中应用系统降级的整体系统交互流程图;
图9为一个实施例中应用系统降级方法的系统架构与实现过程示意图;
图10为一个实施例中基于筛选条件进行决策的流程示意图;
图11为一个实施例中应用系统降级装置的结构框图;
图12为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的应用系统降级方法,可以应用于如图1所示的应用环境中。其中,应用系统服务器102通过网络与降级管理服务器104进行通信。数据存储系统可以存储降级管理服务器104需要处理的数据。数据存储系统可以集成在降级管理服务器104上,也可以放在云上或其他服务器上。应用系统服务器102用于实现应用的后台管理服务,而由于代码发布、网络抖动、硬件损坏等原因,可能会造成应用系统服务器102上的系统异常,因此需要通过降级管理服务器104来对应用系统服务器102的状态进行监测,并在必要时对应用系统服务器102上的应用系统进行降级处理,降级管理服务器104可以接收到应用系统服务器102的异常告警消息。当接收到应用系统的异常告警消息时,确定异常告警消息中的系统异常时间节点,得到系统异常时间节点对应的时间窗口内应用系统的应用日志数据;查找应用系统对应的降级筛选条件以及降级筛选条件的降级阈值;当基于降级筛选条件筛选的应用日志数据符合降级阈值时,生成降级动作指令;基于降级动作指令对应用系统进行降级处理。应用系统服务器102与降级管理服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种应用系统降级方法,该方法可以应用于服务器或终端,其中,终端可以但不限于是各种台式计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。以该方法应用于图1中的降级管理服务器104为例进行说明,包括以下步骤:
步骤201,当接收到应用系统的异常告警消息时,确定异常告警消息中的系统异常时间节点,得到系统异常时间节点对应的时间窗口内应用系统的应用日志数据。
其中,应用系统具体是指应用系统服务器102上所搭载的应用后台系统,由于代码发布、网络抖动、硬件损坏等原因,可能会造成应用系统异常,此时需要对其进行降级处理,从而维持系统的正常运行。异常告警消息是指由于应用后台系统出现了代码发布、网络抖动、硬件损坏等异常,导致系统无法正常运转,而向降级管理服务器104发送的一个告警消息,用于提示降级管理服务器104当前的应用系统服务器102上所搭载的应用系统出现了故障,需要及时进行维护,异常告警消息中携带有出现异常的应用系统的身份信息,可以帮助降级管理服务器104对异常的应用系统服务器进行定位。异常时间节点是指应用系统异常发生的时间。而系统异常时间节点对应的时间窗口是指预先指定的一个时间段,比如对于一个异常时间节点,可以指定异常时间节点前的一段固定长度的时间作为该系统异常时间节点对应的时间窗口,再基于时间窗口进行降级的判断,若在时间窗口内异常触发设置的降级阈值,则说明应用系统需要降级。应用日志数据则是指应用系统服务器102上所搭载的应用后台系统在运行过程中所记录下的日志数据。对于日志,网络设备、系统及服务程序等计算机相关,在运作时都会产生一个叫日志(log)的事件记录;每一行日志都记载着日期、时间、使用者及动作等相关操作的描述。
具体地,降级管理服务器104可以与多个不同的应用系统服务器进行网络连接,并对这些应用系统服务器进行监测,而后依据应用系统的情况来对正在运行中的应用系统进行降级处理。当应用系统服务器102在运行过程中遭遇代码发布、网络抖动、硬件损坏等异常时,会向降级管理服务器104发出异常告警消息,以通知降级管理服务器104来确定当前应用系统服务器102上出现异常的应用系统是否满足降级条件,以及是否需要对该应用系统进行降级处理。而降级管理服务器104在接收到应用系统的异常告警消息时,为了了解到应用系统的具体情况,可以从异常告警消息中提取出异常的应用系统的身份信息,而后基于身份信息,从日志系统中得到应用系统的应用日志数据。在一个实施例中,可以根据应用系统的实际运行情况,将日志按照时间区间进行划分,比如记录每一分钟下应用系统服务器102的日志数据,而降级管理服务器104在得到应用系统的应用日志数据时,可以提取出异常告警消息中异常发生的异常时间节点,再筛选出该时间节点前的若干分钟(比如5分钟)内的应用日志数据来进行处理,从而保证可以准确地筛选出应用系统异常状态下的异常日志,并减少日志数据处理量,保证应用系统降级处理过程中的处理效率。
步骤203,查找应用系统对应的降级筛选条件以及降级筛选条件的降级阈值。
其中,降级筛选条件可以视为降级筛选的规则,再具体实施例中,降级筛选条件可以确定为时间窗口内应用系统的错误个数。而阈值则是降级筛选规则所规定的具体数值,只有通过降级筛选条件筛选出的日志数据符合降级阈值时,降级管理服务器104才会判定需要对当前的应用系统进行降级。
具体地,由于应用系统的异常告警消息也存在异常程度的区分,只有在系统异常达到一定限度时,才需要对应用系统进行降级。因此,在得到应用日志数据后,降级管理服务器104还需要对应用系统是否应该降级进行识别判断。在判断时,针对不同的应用系统,可以预设一些明确的降级场景,并设置这些降级场景所对应的降级筛选条件以及降级筛选条件的降级阈值。而后,系统出现异常时,降级管理服务器104可以直接查找出应用系统对应的降级筛选条件以及降级筛选条件的降级阈值,而后即可基于降级筛选条件以及降级筛选条件的降级阈值,判断应用日志数据所表征的应用系统状态是否达到了降级要求,如果达到了降级要求,则对应用系统实施降级,否则维持对应用系统的监测。在其中一个实施例中,本申请的方案通过固定长度时间窗口内的错误数作为降级筛选条件,此时可以设置降级筛选条件为连续5分钟错误数超过5个且错误占比超过15%。其中的5个错误以及15%的错误占比即为设置的降级阈值。
步骤205,当基于降级筛选条件筛选的应用日志数据符合降级阈值时,生成降级动作指令。
其中,基于降级筛选条件筛选的应用日志数据具体是指从应用日志数据中筛选出降级筛选条件对应日志数据的过程,应用日志数据完整的记录了应用系统在运行过程中的各类数据,包括应用名、租户、异常码、发生时间、总访问次数、错误数、错误占比等各类数据,而其中只有部分数据符合降级筛选条件的要求,因此可以基于降级筛选条件先对应用日志数据进行筛选,确定降级筛选条件所对应的应用日志数据。应用日志数据符合降级阈值则是指应用日志数据中所记载的降级筛选条件的字段数值与满足降级阈值的要求,如错误数超过错误数的降级阈值以及错误占比超过了错误占比的降级阈值等,都可以视为应用日志数据符合降级阈值。而降级动作指令则是用于控制应用系统进行降级的指令,通过降级动作指令可以调用相应的插件,从而控制应用系统进行降级处理。
具体地,在确定应用系统对应的降级筛选条件以及降级筛选条件的降级阈值后,即可基于降级筛选条件对得到的应用日志数据进行相应的处理,筛选出符合降级筛选条件的日志字段以及字段具体数值。而后再通过对比字段具体数值与降级筛选条件的降级阈值,确定当前的日志字段是否符合降级阈值。通过依次对日志字段的筛选,来确定应用系统是否达成了降级筛选条件所规定的降级要求,如果应用日志数据全部都符合降级阈值时,即可判定应用系统需要降级,此时可以降级管理服务器104可以通过生成降级动作指令,藉由降级动作指令实现对应用系统的降级处理。在一个实施例中,本申请的方案适用于对运行中的多个应用系统进行降级管理,在接收到某个应用系统的异常告警消息。可以基于应用系统的应用系统日志、降级筛选条件以及降级筛选条件的降级阈值来对是否对应用进行降级,当判定降级条件达成时,即可通过降级动作指令来对应用系统进行降级,而降级条件未达成时,即可通过系统重启或者系统扩容等方式来对应用系统进行维护,保证应用系统的有效运行。
步骤207,基于降级动作指令对应用系统进行降级处理。
其中,降级处理具体是指将新版本下的应用系统回退到稳定的旧版本的过程。由于最新版本应用系统在运行过程中可能由于代码发布、网络抖动、硬件损坏等原因导致系统异常,因此可以通过降级处理将最新版本的应用系统回退到稳定的旧版本,保证应用系统的有效运行。
具体地,当降级管理服务器104生成降级动作指令后,即可基于降级动作指令来对应用系统进行降级处理,通过执行降级动作指令,对应用系统中对应的对象进行操作,即可实现降级处理。在一个具体实施例中,降级处理的过程可以通过降级管理服务器104中的降级模块来实现,降级模块通过解析降级动作指令,确定指令所需要操纵的对象以及需要执行的动作,而后即可基于对应插件来操纵对象执行动作,完成对应用系统的降级处理。
上述应用系统降级方法,在接收到应用系统的异常告警消息时,确定异常告警消息中的系统异常时间节点,得到系统异常时间节点对应的时间窗口内所述应用系统的应用日志数据。即在应用系统出现异常时,及时通过应用日志数据来对系统的异常进行定位以及识别,而后查找应用系统对应的降级筛选条件以及降级筛选条件的降级阈值;从而通过降级筛选条件以及降级阈值,判断应用日志所表征的应用系统状态是否达到了应用系统降级的要求,而在当基于降级筛选条件筛选的应用日志数据符合降级阈值时,生成降级动作指令;再基于降级动作指令对应用系统进行降级处理。即在通过应用日志数据判断系统可以实施降级处理后,通过降级动作指令来实现对应用系统进行降级处理。本申请的方案通过结合应用系统的异常告警以及应用日志,可以在应用系统出现异常时提高应用系统异常的排查效率,再结合降级筛选条件以及降级阈值可以针对一些明确的场景进行自动降级处理,从而有效地提高了应用系统的降级处理效率。
在一个实施例中,步骤201包括:基于应用系统异常告警消息确定系统异常时间节点;查找系统异常时间节点对应的时间窗口,得到时间窗口内应用系统的原始日志;对原始日志进行聚合分析处理,得到应用日志数据。
其中,原始日志是指未经处理的原始日志数据,原始日志为各个应用系统所记录下的日志。这些日志与各自的应用系统对应,不同应用系统所对应的日志各不相同。因此,为了有效地从日志中提取出数据,可以对原始日志进行聚合分析处理,从而从原始日志中提取出可用的应用日志数据。聚合分析处理具体包括日志格式化、日志落库以及日志解析等处理过程,可以有效地将日志格式统一化同时将日志解析为可用的应用日志数据。
具体地,系统异常告警消息会在系统出现异常时对应生成,同时系统异常告警消息中还会包含有应用系统的标识以及出现异常的时间。而实现本申请应用系统降级方法的服务器即可基于应用系统异常告警消息确定系统异常时间节点。查找系统异常时间节点对应的时间窗口,得到时间窗口内应用系统的原始日志,在具体实施例中,原始日志可以按照分钟级别进行拆分,而服务器则可以系统异常时间节点对应的若干分钟内原始日志的数据,而后基于这些获得的原始日志来进行分析。在得到原始日志后,如何将不同应用不同打印格式的日志进行格式化统一管理。这便是本申请首先需要解决的问题,本申请的方案中通过对原始日志进行聚合分析处理,来得到应用日志数据。在具体地实施例中,可以通过映射规则或者格式化工具来对原始日志进行格式化处理,从而得到相应的应用日志数据。在一个实施例中,如图3所示,在对原始日志进行聚合分析处理后,还可以针对当前的应用系统异常告警消息,基于获取到的应用日志数据来生成应用系统的应用异常分析报告,具体包括访问总次数、异常分组以及异常占比等数据,帮助服务器进行了解应用系统的异常情况,保证应用系统降级的准确性以及效率。本实施例中,通过系统异常时间节点以及日志的聚合分析,可以有效地得到原始日志,并从原始日志中提取出相应的统一格式化应用日志数据,保证应用日志数据的准确性以及应用日志的提取效率,从而保证应用系统降级的准确性以及效率。
在其中一个实施例中,对原始日志进行聚合分析处理,得到应用日志数据包括:查找应用系统的日志格式化规则;基于日志格式化规则对原始日志进行格式化处理,得到格式化日志;对格式化日志进行日志解析处理,得到应用日志数据。
其中,日志格式化规则是指对原始日志进行格式化处理所使用的规则,格式化处理是把同类事物处理成相同的规格、样式。通过对原始日志的格式化处理,可以将不同应用系统上的原始日志整理为相同规格、样式下的日志数据,以便后续进行降级筛选所用,保证降级筛选过程的处理效率。日志解析处理是指对日志进行转化,将格式化后的原始日志转化成可用的应用日志数据的过程。原始日志通常是非结构化的,因此解析日志的目标为将非结构化的原始日志文本转化为结构化的应用日志数据。日志解析的具体方法可以包括:JSON(JavaScript Object Notation,JS对象简谱)解析、正则解析、XML(ExtensibleMarkup Language,可扩展标记语言)解析、提取关键字、syslog_pri解析、Key-Value(键-值)解析、数据脱敏等。
具体地,在对原始日志进行处理时,可以通过日志格式化以及日志解析等处理手段来对原始日志进行聚合分析处理。先查找出应用系统所对应的日志格式化规则。而后通过日志格式化规则来先对原始日志进行格式化处理,得到格式化日志,再对格式化日志进行日志解析处理,从而得到应用日志数据。在另一个实施例中,日志格式化规则不同于本申请中对原始日志进行格式化的规则,而是针对解析后的日志进行格式化处理,此时则先对原始日志进行解析,而后再针对原始解析的得到的日志进行格式化处理。这两种方式都可以得到格式统一化的应用日志数据,保证日志的可用性。在一个具体实施例中,针对日志进行格式化解析同一日志格式后,可以将其存储到日志信息库,完成日志落库的过程。而统一格式后的日志可以参照下表所示:
表1:统一格式后的应用日志数据
本实施例中,通过日志格式化规则来对应用原始日志进行格式化,并且还对格式化处理后的日志进行解析,可以有效地保证日志聚合分析处理过程的准确性以及效率,从而保证应用系统降级的效率。
在一个实施例中,对原始日志进行聚合分析处理,得到应用日志数据包括:查找应用系统的日志格式化工具,日志格式化工具通过将日志格式化软件开发工具包集成至应用系统的脚手架生成;基于日志格式化工具对原始日志进行格式化处理,得到格式化日志;对格式化日志进行日志解析处理,得到应用日志数据。
其中,日志格式化工具是指将日志格式化软件开发工具包集成至应用系统的脚手架的方式,提供至应用系统生成格式化日志的方法,规范应用日志数据的打印规范,将原始日志格式化为统一的格式化日志。日志格式化软件开发工具包即日志SDK(SoftwareDevelopment Kit),它是软件工程师为特定的软件包、软件框架、硬件平台、操作系统等建立应用软件时的开发工具的集合,由第三方服务商提供的实现软件产品某项功能的工具包,里面一般以集合kpi和文档、范例、工具的形式出现,也就是由很多类型文件的集合。本申请的方案中的日志格式化工具就是一种专门应用于原始日志的SDK,用于日志的格式化处理。脚手架原本是一种用在建筑领域的辅助工具,或者说是为了保证各施工过程顺利进行而搭设的工作平台。而对应到软件工程领域,脚手架可以解释为帮助开发人员在开发过程中使用的开发工具、开发框架,使用脚手架你无须从头开始搭建或者编写底层软件。
具体地,除了动态设置日志格式化规则外,还可以通过日志格式化软件开发工具包的方式来实现对原始日志的格式化处理。在需要日志格式化处理时,先查找应用系统的日志格式化工具,再基于日志格式化工具对原始日志进行格式化处理,得到格式化日志;对格式化日志进行日志解析处理,得到应用日志数据。本申请中将日志格式化软件开发工具包集成至应用系统的脚手架,可以有效地实现将日志格式化的功能。在一个具体地实施例中,如图4所示,本申请通过日志格式化工具和动态配置日志格式化规则相结合的方法来实现对原始日志的格式化处理;通过将日志格式化软件开发工具包集成到脚手架的方式提供给各个应用使用,规范应用的打印规范,对于二方或三方应用则通过动态配置日志解析规则来进行格式化,统一日常格式化后的输出,以便进行日志的解析。本实施例中,通过日志格式化工具来对应用原始日志进行格式化,并且还对格式化处理后的日志进行解析,可以有效地保证日志聚合分析处理过程的准确性以及效率,从而保证应用系统降级的效率。
在一个实施例中,步骤205之前,还包括:基于降级筛选条件以及降级阈值,生成多维度降维指标;通过责任链对多维度降维指标进行降维处理,得到各降级阈值对应的单维度降维指标;在责任链中依次基于单维度降维指标对应用日志数据进行判别。
其中,责任链是指责任链模式,它是一种设计模式。原本在责任链模式里,很多对象由每一个对象对其下家的引用而连接起来形成一条链。请求在这个链上传递,直到链上的某一个对象决定处理此请求。发出这个请求的客户端并不知道链上的哪一个对象最终处理这个请求,这使得系统可以在不影响客户端的情况下动态地重新组织和分配责任。而在本申请的方案中则是指将多维度降维指标拆分得到的单维度降维指标作为一个对象,将应用日志数据中降级筛选条件对应的数值作为一个请求,从而在责任链中依次基于单维度降维指标对应用日志数据进行判别。
具体地,本申请可以采用责任链的方式来将多维度的分析拆解成单维度解析的组合,这样可以支持维度的灵活调整。首先,需要先确定应用系统的降级筛选条件以及降级阈值。而后基于首先降级筛选条件多维度降维指标中涉及到的各个指标维度,同时基于降级阈值确定各个指标维度各自对应的具体数值,生成多维度降维指标。通过责任链对多维度降维指标进行降维处理,将降级的阈值要求拆解为多个单维度指标,比如:5分钟错误数、5分钟错误占比等;之后,再采用责任链的方式逐个处理每个维度指标,在责任链中依次基于单维度降维指标对应用日志数据进行判别,若某个维度指标未满足阈值要求,则终止责任传递,此时可以确定降级筛选条件筛选的应用日志数据不符合降级阈值,而如果全部满足,则说明基于降级筛选条件筛选的应用日志数据符合降级阈值,需要进行降级处理。在一个具体实施例中,如图5所示,可以基于应用日志数据采集的时间间隔X分钟来设置时间窗口,而后在时间窗口内,以及基于各个维度指标来进行判别,确定应用日志数据符合降级阈值,如何存在不符合的情况则可以直接终止,如果全部符合降级阈值,则确定需要进行降级处理,并生成对应的降级动作指令。本实施例中,通过责任链的方式来拆解多维度降维指标,从而在单维度降维指标下对应用日志数据进行判别,提高判别的效率以及准确性,保证应用系统降级处理过程的效率。
在其中一个实施例中,方法基于降级动作指令对应用系统异常告警消息对应的应用系统进行降级处理包括:对降级动作指令进行正则解析,识别降级动作指令的操作对象以及动作类型;基于操作对象以及动作类型查找动作插件;基于动作插件对应用系统进行降级处理。
其中,正则解析是指通过正则表达式来进行解析处理的过程,正则表达式是由普通字符以及特殊字符组成的文字模式。该模式对文本查找时需要匹配的一个或多个字符串描述,给出一个匹配模板。通过正则表达式可以有效地将降级动作指令进行拆分识别,得到其对应的操作对象以及动作类型。而操作对象指的是降级动作所操作的对象,包括数据库以及配置文件等。动作类型则是指降级所需要执行的动作类型。动作插件指的是执行降级操作的执行部件,动作插件包括了数据库插件、配置插件以及ES插件等。
具体地,本申请的方案可以采用插件化的方式来实现针对应用系统的降级处理,来支持不同中间件的降级管理,以便支持多样化的降级策略。在降级过程中包含有指令解析、指令识别、拆件查找以及降级处理等过程,首先,需要对降级动作指令进行正则解析,识别降级动作指令的操作对象以及动作类型。而后再基于操作对象以及动作类型查找动作插件;并基于动作插件对应用系统进行降级处理。在其中一个实施例中,如图6所示,降级过程具体通过降级模块来实现,降级模块中包括有不同的执行器件。包括正则解析器、动作执行器以及插件管理器等,其中正则解析器负责执行降级动作指令中动作内容解析。将动作内容解析的具体格式可以参照下表:
表2:动作内容解析格式示意表
字段 | 字段说明 | 示例说明 |
类型 | 表示降级或恢复 | 1:表示降级2:表示恢复 |
操作对象 | 表示操作的对象 | DB:表示数据库,CFG:表示配置文件 |
命令 | 表示要执行的动作 | 比如:open.degrade.show.label=false |
而对于动作执行器,其主要根据确定的操作对象从插件管理器中获取对应的插件来执行动作。最后则是插件管理器,主要用于负责查找对应的插件,并调用对应的插件来执行相关的动作;插件会将执行的命令转换为对应的参数,然后调用对应的api进行降级或恢复系统。在一个实施例中,本申请用于对购物车应用的后台应用系统进行降级,当确定需要降级后,处理过程的时序图可以参照图7所示,首先,降级管理所用的服务器的决策引擎通过降级动作指令下发降级请求参数到正则管理器,正则管理器解析后,确定降级命令为配置降级,同时确定降级动作为调用降级接口参数,而后动作执行器基于解析的动作以及参数调用插件管理器查找相应插件,而后插件管理器查找到配置插件后,调用配置插件来动态更新接口,实现对购物车应用的降级管理。本实施例中,通过降级模块来执行正则解析、动作执行、插件查找等步骤来进行降级处理,可以有效保证降级管理过程的有效性。
在其中一个实施例中,步骤203之前,还包括:获取筛选条件录入指令;根据筛选条件录入指令生成降级筛选条件,将降级筛选条件保存至筛选条件数据库。步骤203包括:在筛选条件数据库中查找应用系统对应的降级筛选条件以及降级筛选条件的降级阈值。
其中,筛选条件录入指令用于向实现应用系统降级管理的服务器中录入相应的各个降级筛选条件以及各个降级筛选条件的具体降级阈值。应用系统降级管理的服务器在接收到筛选条件录入指令,可以通过解析筛选条件录入指令,确定其对应的应用系统以及具体降级筛选条件。筛选条件数据库是指用于保存筛选条件具体数据的数据库,针对每个需要降级管理的应用系统,都可以在筛选条件数据库保存其对应的降级筛选条件,以便随时取用。筛选条件数据库可以随时进行数据录入、数据查找与数据更新的管理。
具体地,本申请可以预先针对每个应用系统设置好若干的降级筛选条件,而后再将这些降级筛选条件保存到筛选条件数据库,当需要进行针对应用系统的降级处理时吗,即可直接从筛选条件数据库中进行筛选,得到相应的降级筛选条件。而筛选条件数据库则会根据筛选条件录入指令来进行筛选条件的录入处理。工作人员可以直接基于筛选条件录入指令完成筛选条件的录入。在另外的实施例中,除了筛选条件录入指令工作人员还可以通过筛选条件修改指令来对筛选条件数据库中已有的筛选条件进行更新,或者通过筛选条件删除指令来删除现有的筛选条件。在一个具体地实施例中,日志中涉及的规则字段以及筛选条件(包括降级以及恢复)可以参照表3所示:
表3日志以及筛选条件涉及的规则字段以及字段说明表
本实施例中,通过筛选条件录入指令来向筛选条件数据库中录入筛选条件,可以有效地维持对筛选条件数据库的更新,保证针对应用系统进行降级识别的准确性。
在其中一个实施例中,步骤207之后,还包括:获取应用系统在降级处理后生成的降级日志数据;根据降级日志数据查找恢复筛选条件以及恢复筛选条件的恢复阈值;当降级日志数据符合恢复筛选条件以及恢复阈值时,生成恢复动作指令;基于恢复动作指令对应用系统异常告警消息对应的应用系统进行恢复处理。
其中,恢复筛选条件是指将应用系统从降级状态下恢复为正常状态的筛选条件,在应用系统降级之后,如果系统已经恢复正常,则可以尝试对已经降级的应用系统进行恢复,重新回归到未降级前的状态。恢复阈值则与恢复筛选条件是指与恢复筛选条件对应的参数数值。恢复动作指令与降级动作指令对应,用于控制已降级的应用系统进行升级恢复。
具体地,在应用系统降级处理之后,若符合系统恢复正常,且满足恢复筛选条件下的恢复要求,则可以对当前的应用系统进行一次恢复,将降级处理过程中的动作恢复过来。而恢复处理的过程与降级处理的过程类似,首先都是获取日志数据,而后根据降级日志数据查找恢复筛选条件以及恢复筛选条件的恢复阈值;当降级日志数据符合恢复筛选条件以及恢复阈值时,生成恢复动作指令;基于恢复动作指令对应用系统异常告警消息对应的应用系统进行恢复处理。在一个具体的实施例中,对于日志数据,可以通过定时轮询的方式来获取应用系统在降级处理后生成的降级日志数据。比如,设置轮询周期为5分钟,而后每5分钟就取一次日志数据进行识别,确定是否降级系统是否可以恢复正常。当降级日志数据表征可以进行应用系统回复时,即可生成恢复动作指令;基于恢复动作指令对应用系统异常告警消息对应的应用系统进行恢复处理。本实施例中,通过在应用系统在降级处理后对降级日志数据的识别处理,可以有效地判断应用系统是否可以进行回复,从而确保应用系统的工作效率。
本申请还提供一种应用场景,该应用场景应用上述的应用系统降级方法。
具体地,该应用系统降级方法在该应用场景的应用如下:
当用户需要同时对购物平台应用的多个后台系统进行维护时,由于应用系统的后台服务器可能随时因为代码发布、网络抖动以及硬件损坏等原因而导致异常,此时需要对应用系统进行降级处理。因此,可以通过搭载本申请应用系统降级方法的应用系统降级服务器来实现对这些应用后台服务器的降级处理。应用系统降级服务器包含了溯源模块、条件筛选模块、决策引擎以及降级模块等模块,在降级处理过程中,其整体系统交互流程图可以参照图8所示,首先,研发工作人员在应用中接入日志系统,根据业务场景打印对应的记录日志及异常日志,而后研发工作人员根据业务场景和相应的异常日志,在本申请的条件筛选模块配置相应降级筛选条件(触发条件及执行动作);当告警触发时,应用系统发送消息通知本申请的溯源模块;溯源模块根据告警发出的应用和告警的时间捞取最近1分钟的异常信息进行聚合分析,输出导致告警产生的异常码、异常码数量及异常码占比;溯源模块触发调用本申请的决策引擎,将告警策略名称、租户名、应用名、异常码、异常码数量及异常码占比传递给决策引擎;决策引擎根据应用名、租户名、异常码查找对应的降级筛选条件和阈值;决策引擎定时根据应用名,租户名、异常码拉取对应的异常码数量及异常码占比;若符合降级筛选条件所配置的阈值要求,则决策引擎将降级筛选条件配置的降级动作传递给降级模块执行系统的降级;比如:配置的是连续5分钟,异常码数量大于100;如果连续5分钟的异常码数量大于100,则决策引擎通知降级模块进行降级动作;降级模块通过调用动态配置系统的接口,对系统配置进行修改,同时下发触发应用服务器实时更新;决策引擎定时扫描已经开启降级的筛选条件,根据应用名,租户名、异常码拉取对应的异常码数量及异常码占比;若符合恢复筛选条件配置的恢复要求,则决策引擎将恢复筛选条件配置的恢复动作传递给降级模块执行系统的恢复;比如:配置的是连续5分钟,异常码数量小于10,如果连续5分钟的异常码数量小于10,则决策引擎通知降级模块进行恢复动作;最后降级模块通过调用动态配置系统的接口,对系统配置进行回滚,同时下发触发应用服务器实时更新进行恢复。系统架构设计与实现方案则可以参照图9所示,具体包含了溯源模块、条件筛选模块、决策引擎以及降级模块等模块。其中条件筛选模块用于录入筛选条件,并将其保存到规则库中,溯源模块与应用服务器的日志系统连接,用于告警消息的监测以及拉取日志等处理。决策引擎则包含有筛选条件查询、筛选条件解析、信息存储、筛选条件判定、定时轮询以及降级管理等单元,同时还包含决策信息以及降级信息库两个信息库,负责进行降级处理过程中的相关决策。降级模块则是与应用服务器连接,可以基于决策引擎的指令执行降级动作或者恢复动作。决策引擎的决策处理流程可以参照图10所示,首先筛选条件查询单元接收日志数据中的应用名、租户、异常码等数据,而后查询条件筛选模块,从中查找相应的筛选条件,而后进行筛选条件解析,得到决策信息。并确定筛选条件所包含的状态,开始时间,时长以及结果等阈值数据吗,并传达至决策信息库。同时,定时器会进行定时轮询,判断决策信息库中是否存在待决策筛选条件,并从日志系统中连续拉取分钟级的日志,在格式化处理后存储进日志信息库中进行存储。而后基于决策信息库中的筛选条件判断日志信息库中存储的数据判断是否触发阈值,包含降级阈值以及恢复阈值,而后根据判断结果控制降级模块执行相应动作来实现降级管理。
应该理解的是,虽然如上的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的应用系统降级方法的应用系统降级装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个应用系统降级装置实施例中的具体限定可以参见上文中对于应用系统降级方法的限定,在此不再赘述。
在一个实施例中,如图11所示,提供了一种应用系统降级装置,包括:
溯源模块1102,用于当接收到应用系统的异常告警消息时,确定异常告警消息中的系统异常时间节点,得到系统异常时间节点对应的时间窗口内应用系统的应用日志数据。
阈值筛选模块1104,用于查找应用系统对应的降级筛选条件以及降级筛选条件的降级阈值。
降级决策模块1106,用于当基于降级筛选条件筛选的应用日志数据符合降级阈值时,生成降级动作指令。
降级处理模块1108,用于基于降级动作指令对应用系统进行降级处理。
在一个实施例中,溯源模块1102具体用于:基于应用系统异常告警消息确定系统异常时间节点;查找系统异常时间节点对应的时间窗口,得到时间窗口内应用系统的原始日志;对原始日志进行聚合分析处理,得到应用日志数据。
在一个实施例中,溯源模块1102还用于:查找应用系统的日志格式化规则;基于日志格式化规则对原始日志进行格式化处理,得到格式化日志;对格式化日志进行日志解析处理,得到应用日志数据。
在一个实施例中,溯源模块1102还用于:查找应用系统的日志格式化工具,日志格式化工具通过将日志格式化软件开发工具包集成至应用系统的脚手架生成;基于日志格式化工具对原始日志进行格式化处理,得到格式化日志;对格式化日志进行日志解析处理,得到应用日志数据。
在一个实施例中,还包括责任链模块,用于:基于降级筛选条件以及降级阈值,生成多维度降维指标;通过责任链对多维度降维指标进行降维处理,得到各降级阈值对应的单维度降维指标;在责任链中依次基于单维度降维指标对应用日志数据进行判别。
在一个实施例中,降级处理模块1108具体用于:对降级动作指令进行正则解析,识别降级动作指令的操作对象以及动作类型;基于操作对象以及动作类型查找动作插件;基于动作插件对应用系统进行降级处理。
在一个实施例中,还包括条件录入模块,用于:获取筛选条件录入指令;根据筛选条件录入指令生成降级筛选条件,将降级筛选条件保存至筛选条件数据库。阈值筛选模块1104具体用于:在筛选条件数据库中查找应用系统对应的降级筛选条件以及降级筛选条件的降级阈值。
在一个实施例中,还包括降级恢复模块,用于:获取应用系统在降级处理后生成的降级日志数据;根据降级日志数据查找恢复筛选条件以及恢复筛选条件的恢复阈值;当降级日志数据符合恢复筛选条件以及恢复阈值时,生成恢复动作指令;基于恢复动作指令对应用系统异常告警消息对应的应用系统进行恢复处理。
在一个实施例中,降级恢复模块具体用于:通过定时轮询的方式获取应用系统在降级处理后生成的降级日志数据。
上述应用系统降级装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图12所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储应用系统降级相关数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种应用系统降级方法。
本领域技术人员可以理解,图12中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各方法实施例中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (13)
1.一种应用系统降级方法,其特征在于,所述方法包括:
当接收到应用系统的异常告警消息时,确定所述异常告警消息中的系统异常时间节点,得到所述系统异常时间节点对应的时间窗口内所述应用系统的应用日志数据;
查找所述应用系统对应的降级筛选条件以及所述降级筛选条件的降级阈值;
当基于所述降级筛选条件筛选的应用日志数据符合所述降级阈值时,生成降级动作指令;
基于所述降级动作指令对所述应用系统进行降级处理。
2.根据权利要求1所述的方法,其特征在于,所述确定所述异常告警消息中的系统异常时间节点,得到所述系统异常时间节点对应的时间窗口内所述应用系统的应用日志数据包括:
基于所述应用系统异常告警消息确定系统异常时间节点;
查找所述系统异常时间节点对应的时间窗口,得到所述时间窗口内所述应用系统的原始日志;
对所述原始日志进行聚合分析处理,得到应用日志数据。
3.根据权利要求2所述的方法,其特征在于,所述对所述原始日志进行聚合分析处理,得到应用日志数据包括:
查找所述应用系统的日志格式化规则;
基于所述日志格式化规则对所述原始日志进行格式化处理,得到格式化日志;
对所述格式化日志进行日志解析处理,得到应用日志数据。
4.根据权利要求2所述的方法,其特征在于,所述对所述原始日志进行聚合分析处理,得到应用日志数据包括:
查找所述应用系统的日志格式化工具,所述日志格式化工具通过将日志格式化软件开发工具包集成至所述应用系统的脚手架生成;
基于所述日志格式化工具对所述原始日志进行格式化处理,得到格式化日志;
对所述格式化日志进行日志解析处理,得到应用日志数据。
5.根据权利要求1所述的方法,其特征在于,所述当基于所述降级筛选条件筛选的应用日志数据符合所述降级阈值时,生成降级动作指令之前,还包括:
基于所述降级筛选条件以及所述降级阈值,生成多维度降维指标;
通过责任链对所述多维度降维指标进行降维处理,得到各降级阈值对应的单维度降维指标;
在所述责任链中依次基于所述单维度降维指标对所述应用日志数据进行判别。
6.根据权利要求1所述的方法,其特征在于,所述方法基于所述降级动作指令对所述应用系统异常告警消息对应的应用系统进行降级处理包括:
对所述降级动作指令进行正则解析,识别所述降级动作指令的操作对象以及动作类型;
基于所述操作对象以及所述动作类型查找动作插件;
基于所述动作插件对所述应用系统进行降级处理。
7.根据权利要求1所述的方法,其特征在于,所述查找所述应用系统对应的降级筛选条件以及所述降级筛选条件的降级阈值之前,还包括:
获取筛选条件录入指令;
根据所述筛选条件录入指令生成降级筛选条件,将所述降级筛选条件保存至筛选条件数据库;
所述查找所述应用系统对应的降级筛选条件以及所述降级筛选条件的降级阈值包括:
在所述筛选条件数据库中查找所述应用系统对应的降级筛选条件以及所述降级筛选条件的降级阈值。
8.根据权利要求1至7中任意一项所述的方法,其特征在于,所述基于所述降级动作指令对所述应用系统异常告警消息对应的应用系统进行降级处理之后,还包括:
获取所述应用系统在降级处理后生成的降级日志数据;
根据所述降级日志数据查找恢复筛选条件以及所述恢复筛选条件的恢复阈值;
当所述降级日志数据符合所述恢复筛选条件以及恢复阈值时,生成恢复动作指令;
基于所述恢复动作指令对所述应用系统异常告警消息对应的应用系统进行恢复处理。
9.根据权利要求8所述的方法,其特征在于,所述获取所述应用系统在降级处理后生成的降级日志数据包括:
通过定时轮询的方式获取所述应用系统在降级处理后生成的降级日志数据。
10.一种应用系统降级装置,其特征在于,所述装置包括:
溯源模块,用于当接收到应用系统的异常告警消息时,确定所述异常告警消息中的系统异常时间节点,得到所述系统异常时间节点对应的时间窗口内所述应用系统的应用日志数据;
阈值筛选模块,用于查找所述应用系统对应的降级筛选条件以及所述降级筛选条件的降级阈值;
降级决策模块,用于当基于所述降级筛选条件筛选的应用日志数据符合所述降级阈值时,生成降级动作指令;
降级处理模块,用于基于所述降级动作指令对所述应用系统进行降级处理。
11.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至9中任一项所述的方法的步骤。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至9中任一项所述的方法的步骤。
13.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至9中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211300702.2A CN117971527A (zh) | 2022-10-24 | 2022-10-24 | 应用系统降级方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211300702.2A CN117971527A (zh) | 2022-10-24 | 2022-10-24 | 应用系统降级方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117971527A true CN117971527A (zh) | 2024-05-03 |
Family
ID=90855245
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211300702.2A Pending CN117971527A (zh) | 2022-10-24 | 2022-10-24 | 应用系统降级方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117971527A (zh) |
-
2022
- 2022-10-24 CN CN202211300702.2A patent/CN117971527A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11238069B2 (en) | Transforming a data stream into structured data | |
US10678669B2 (en) | Field content based pattern generation for heterogeneous logs | |
CN107506451B (zh) | 用于数据交互的异常信息监控方法及装置 | |
CN106656536B (zh) | 一种用于处理服务调用信息的方法与设备 | |
CN107832196B (zh) | 一种用于实时日志异常内容的监测装置及监测方法 | |
CN105183860B (zh) | 数据同步方法和系统 | |
US20160034525A1 (en) | Generation of a search query to approximate replication of a cluster of events | |
US10572811B2 (en) | Methods and systems for determining probabilities of occurrence for events and determining anomalous events | |
CN105095048A (zh) | 一种基于业务规则的监控系统告警关联处理方法 | |
JP6996812B2 (ja) | 分散データベースにおけるデータブロックを処理する方法、プログラム、およびデバイス | |
CN111258798A (zh) | 监控数据的故障定位方法、装置、计算机设备及存储介质 | |
CN112600719A (zh) | 告警聚类方法、装置及存储介质 | |
US9870419B2 (en) | Application cache profiler | |
CN107330031B (zh) | 一种数据存储的方法、装置及电子设备 | |
JP5295062B2 (ja) | 複合イベント処理向けクエリ自動生成装置 | |
CN117376092A (zh) | 故障根因定位方法、装置、设备及存储介质 | |
JP2009245154A (ja) | シンプトンを評価するためのコンピュータ・システム、並びにその方法及びコンピュータ・プログラム | |
CN117971527A (zh) | 应用系统降级方法、装置、计算机设备和存储介质 | |
CN111680036B (zh) | 一种基于图存储的配置管理数据库 | |
CN114186278A (zh) | 数据库异常操作识别方法、装置与电子设备 | |
CN113672457A (zh) | 识别数据库中的异常操作的方法和装置 | |
CN112559238B (zh) | 用于Oracle数据库的排障策略生成方法装置、处理器和存储介质 | |
CN117389908B (zh) | 接口自动化测试用例的依赖关系分析方法、系统及介质 | |
CN117171364B (zh) | 运维知识图谱更新方法及装置 | |
CN115185921B (zh) | 数据库故障止损方法、装置、电子设备、介质及程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |