CN113886122A - 一种系统运行异常处理方法、装置、设备及存储介质 - Google Patents

一种系统运行异常处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN113886122A
CN113886122A CN202111165009.4A CN202111165009A CN113886122A CN 113886122 A CN113886122 A CN 113886122A CN 202111165009 A CN202111165009 A CN 202111165009A CN 113886122 A CN113886122 A CN 113886122A
Authority
CN
China
Prior art keywords
abnormal
exception
parameter information
preset
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111165009.4A
Other languages
English (en)
Other versions
CN113886122B (zh
Inventor
王亚勋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jinan Inspur Data Technology Co Ltd
Original Assignee
Jinan Inspur Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jinan Inspur Data Technology Co Ltd filed Critical Jinan Inspur Data Technology Co Ltd
Priority to CN202111165009.4A priority Critical patent/CN113886122B/zh
Publication of CN113886122A publication Critical patent/CN113886122A/zh
Application granted granted Critical
Publication of CN113886122B publication Critical patent/CN113886122B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3495Performance evaluation by tracing or monitoring for systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请公开了一种系统运行异常处理方法、装置、设备及存储介质。该方法包括:监测系统运行过程,当监测到运行异常状态时根据预先配置的映射关系确定出所述运行异常状态对应的异常类型;获取与所述运行异常状态对应的参数信息;通过调用预设脚本文件,根据所述异常类型和所述参数信息执行与所述运行异常状态对应的预设处理操作,并生成与所述异常类型对应的告警提示。针对不同类型的运行异常通过执行预设脚本文件内对应的预设处理操作,对系统异常进行自动处理,提高了系统异常处理的效率,以及系统针对不同异常错误的容错能力,避免可能因服务中断导致的损失,提高了系统的可靠性及稳定性,以保证系统业务正常运行。

Description

一种系统运行异常处理方法、装置、设备及存储介质
技术领域
本发明涉及计算机技术领域,特别涉及一种系统运行异常处理方法、装置、设备及存储介质。
背景技术
目前,在程序开发中可以简单的让程序运行起来,但如想让程序在遇到各种错综复杂的异常情况下也能坦然处非常困难,然而,在生产环境中这点显得格外重要。现有技术中,在出现异常时通过向维护人员发送提醒,由维护人员进行人工异常处理,并且,对于一些需要使用调试工具进行处理的异常,还要求维护人员熟悉调试工具的使用,不仅降低了异常处理的效率还浪费人力物力。因此,如何高效处理不同的错误异常是目前亟需解决的问题。
发明内容
有鉴于此,本发明的目的在于提供一种系统运行异常处理方法、装置、设备及介质,能够提高系统针对不同异常错误的容错能力,提高系统的可靠性及稳定性。其具体方案如下:
第一方面,本申请公开了一种系统运行异常处理方法,包括:
监测系统运行过程,当监测到运行异常状态时根据预先配置的映射关系确定出所述运行异常状态对应的异常类型;
获取与所述运行异常状态对应的参数信息;
通过调用预设脚本文件,根据所述异常类型和所述参数信息执行与所述运行异常状态对应的预设处理操作,并生成与所述异常类型对应的告警提示。
可选的,所述根据所述异常类型和所述参数信息执行与所述运行异常状态对应的预设处理操作之前,还包括:
查看异常处理配置文件,读取所述异常类型对应的异常处理标志位;
根据所述异常处理标志位判断是否执行所述根据所述异常类型和所述参数信息执行与所述运行异常状态对应的预设处理操作的步骤。
可选的,所述根据所述异常类型和所述参数信息执行与所述运行异常状态对应的预设处理操作,包括:
若所述运行异常状态对应的异常类型为轻度错误,则将所述参数信息中包含的节点信息、服务名称和程序错误信息发送给管理员;所述轻度错误包括业务运行异常。
可选的,所述根据所述异常类型和所述参数信息执行与所述运行异常状态对应的预设处理操作,包括:
若所述运行异常状态对应的异常类型为中度错误,则根据所述参数信息中包含的进程标识符和进程名确定出发生所述运行异常状态的目标服务,并重启所述目标服务;所述中度错误包括系统资源耗尽引起的掉线异常。
可选的,所述重启所述目标服务之前,还包括:
通过所述预设脚本文件监测所述目标服务的运行状态;
若在预设时间段内所述目标服务的运行状态均为非掉线状态,则不执行所述重启所述目标服务的步骤。
可选的,所述根据所述异常类型和所述参数信息执行与所述运行异常状态对应的预设处理操作,包括:
若所述运行异常状态对应的异常类型为重度错误,则读取并解析目标目录下以进程标识符字段为结尾命名的core文件以得到解析结果,并将所述解析结果发送给管理员;所述重度错误包括数组越界和数据溢出。
可选的,所述系统运行异常处理方法,还包括:
通过调用所述预设脚本文件,查看所述目标目录下是否存在以进程标识符字段为结尾命名的core文件;
若所述目标目录下存在以进程标识符字段为结尾命名的core文件,则读取并解析所述core文件以得到解析结果,并将所述解析结果发送给管理员。
第二方面,本申请公开了一种系统运行异常处理装置,包括:
异常类型确定模块,用于监测系统运行过程,当监测到运行异常状态时根据预先配置的映射关系确定出所述运行异常状态对应的异常类型;
参数信息获取模块,用于获取与所述运行异常状态对应的参数信息;
异常处理模块,用于通过调用预设脚本文件,根据所述异常类型和所述参数信息执行与所述运行异常状态对应的预设处理操作,并生成与所述异常类型对应的告警提示。
第三方面,本申请公开了一种电子设备,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序,以实现前述的系统运行异常处理方法。
第四方面,本申请公开了一种计算机可读存储介质,用于存储计算机程序;其中计算机程序被处理器执行时实现前述的系统运行异常处理方法。
本申请中,监测系统运行过程,当监测到运行异常状态时根据预先配置的映射关系确定出所述运行异常状态对应的异常类型;获取与所述运行异常状态对应的参数信息;通过调用预设脚本文件,根据所述异常类型和所述参数信息执行与所述运行异常状态对应的预设处理操作,并生成与所述异常类型对应的告警提示。可见,通过监测系统运行过程,在监测到系统存在运行异常状态时,确定出该运行异常状态对应的异常类型,并获取与该运行异常状态对应的参数信息,然后调用预先编写的含有多种预设处理操作流程的预设脚本文件,由此可以根据上述异常类型和参数信息执行与该运行异常状态对应的预设处理操作,并生成与该异常类型对应的告警提示。由此以来,可以针对不同类型的异常通过运行预设脚本文件内对应的预设处理操作,对系统异常进行自动处理,并生成与当前运行异常状态的异常类型对应的告警提示,提高了系统异常处理的效率,避免了人工进行异常处理导致的效率低下及耗费人力的问题,提高了系统针对不同异常错误的容错能力,避免可能因服务中断导致的损失,提高系统的可靠性及稳定性,保证系统业务正常运行。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请提供的一种系统运行异常处理方法流程图;
图2为本申请提供的一种具体的系统运行异常处理方法流程图;
图3为本申请提供的一种系统运行异常处理装置结构示意图;
图4为本申请提供的一种电子设备结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
现有技术中,在出现异常时通过向维护人员发送提醒,由维护人员进行人工异常处理,并且,对于一些需要使用调试工具进行处理的异常,还要求维护人员熟悉调试工具的使用,不仅降低了异常处理的效率还浪费人力物力。因此,如何高效处理不同的错误异常是目前亟需解决的问题。为克服上述技术问题,本申请提出一种系统运行异常处理方法,能够提高系统针对不同异常错误的容错能力,避免可能因服务中断导致的损失,提高系统的可靠性及稳定性。
本申请实施例公开了一种系统运行异常处理方法,参见图1所示,该方法可以包括以下步骤:
步骤S11:监测系统运行过程,当监测到运行异常状态时根据预先配置的映射关系确定出所述运行异常状态对应的异常类型。
本实施例中,检测系统运行过程,当捕捉到运行异常状态时,根据预先配置的映射关系确定出上述运行异常状态对应的异常类型。可以理解的是,根据系统运行过程中出现的各类运行异常,预先为每种运行异常状态定义出异常类型,然后建立各个运行异常状态与对应的异常类型的映射关系,其中,上述异常类型可以使用标识符表征。其中,上述异常类型可以根据异常的风险等级进行分类,具体可以包括轻度错误、中度错误和重度错误,轻度错误包括业务运行异常等错误,中度错误包括系统资源耗尽引起的掉线异常等错误,重度错误包括数组越界和数据溢出等错误。
步骤S12:获取与所述运行异常状态对应的参数信息。
本实施例中,确定运行异常状态对应的异常类型的同时,获取与该运行异常状态对应的参数信息,所述参数信息包括但不限于进程标识符(Process Identification,PID)、进程名、节点信息、服务名称和程序错误信息。
步骤S13:通过调用预设脚本文件,根据所述异常类型和所述参数信息执行与所述运行异常状态对应的预设处理操作,并生成与所述异常类型对应的告警提示。
本实施例中,确定出运行异常状态对应的异常类型后,调用预设脚本文件,根据异常类型和参数信息执行与上述运行异常状态对应的预设处理操作。可以理解的是,预设脚本文件可以为用户针对需要处理的系统异常自定义的脚本文件,预设脚本文件中包含多种类型的运行异常状态对应的处理方式,因此,在监测到运行异常时触发预设脚本文件的调用,通过将上述异常类型和参数信息输入给预设脚本文件,预设脚本文件可以执行与运行异常状态对应的预设处理操作,并生成与上述异常类型对应的告警提示,以提示使用者当前系统存在哪种类型的异常错误。上述预设脚本文件为python脚本。
本实施例中,所述根据所述异常类型和所述参数信息执行与所述运行异常状态对应的预设处理操作之前,还可以包括:查看异常处理配置文件,读取所述异常类型对应的异常处理标志位;根据所述异常处理标志位判断是否执行所述根据所述异常类型和所述参数信息执行与所述运行异常状态对应的预设处理操作的步骤。可以理解的是,除了建立运行异常状态与异常类型的映射关系,还可以通过异常处理配置文件配置每个异常类型对应的异常处理标志位,该标志位用于表征是否要执行该类异常的处理操作,具体的根据异常处理标志位判断是否执行所述根据所述异常类型和所述参数信息执行与所述运行异常状态对应的预设处理操作的步骤。例如,轻度错误对应的异常处理标志位为1时,执行与轻度错误对应的预设处理操作,若异常处理标志位为0,则不执行对应的预设处理操作。
例如图2所示,本实施例中,所述根据所述异常类型和所述参数信息执行与所述运行异常状态对应的预设处理操作,具体可以包括以下步骤:
步骤S131:若所述运行异常状态对应的异常类型为轻度错误,则将所述参数信息中包含的节点信息、服务名称和程序错误信息发送给管理员;所述轻度错误包括业务运行异常。
本实施例中,若运行异常状态对应的异常类型为轻度错误,则将参数信息中包含的节点信息、服务名称和程序错误信息发送给管理员,上述轻度错误包括业务运行异常。可以理解的是,业务层面轻量级的异常情况一般不会对程序造成恶劣影响,在抛出异常之后,程序并不会退出而是继续往下执行。因此,通过预先在上述预设脚本文件中定义轻度错误对应的处理操作具体为,将当前运行异常状态对应的参数信息中包含的节点信息、服务名称和程序错误信息发送给管理员,则当捕获到这类业务层面的轻度错误时,即可自动、实时的以邮件或其他形式向管理员即系通过维护人员等发送报告。
步骤S132:若所述运行异常状态对应的异常类型为中度错误,则根据所述参数信息中包含的进程标识符和进程名确定出发生所述运行异常状态的目标服务,并重启所述目标服务;所述中度错误包括系统资源耗尽引起的掉线异常。
本实施例中,若运行异常状态对应的异常类型为中度错误,则根据参数信息中包含的进程标识符和进程名确定出发生运行异常状态的目标服务,并重启该目标服务,其中,中度错误包括系统资源耗尽引起的掉线异常。可以理解的是,系统资源耗尽导致的掉线异常,通常是由于程序没有正常关闭一些资源,如通讯连接、监听端口等,经过长时间的累积导致系统资源耗尽,比如内存泄漏、句柄数超限等,这种异常错误会导致程序退出,但是通过重启服务便可将耗尽的资源回收,服务回归正常状态,因此将这类系统资源耗尽引起的掉线异常定义为中度错误,并在预设脚本文件中预先定义中度错误对应的处理操作具体为,根据参数信息中的进程标识符和进程名确定产生了中度错误的目标服务,并重启该目标服务,由此,在检测到系统出现由系统资源耗尽导致的异常时,可通过自动重启出现错误的目标服务使系统恢复正常运行,不仅提高了异常处理的效率,还可以保护业务的正常有序运行。
本实施例中,所述重启所述目标服务之前,还可以包括:通过所述预设脚本文件监测所述目标服务的运行状态;若在预设时间段内所述目标服务的运行状态均为非掉线状态,则不执行所述重启所述目标服务的步骤。可以理解的是,为方式由于监测的不准确性,导致误认为目标服务掉线的情况,本实施例中预设脚本文件在收到中度错误后,监测上述目标服务的运行状态,具体可以通过不断检查服务调用者状态,若在预设时间段内上述目标服务的运行状态均为非掉线状态,则不执行重启目标服务的操作,由此可以避免异常误报导致处理错误及浪费资源的问题。
步骤S133:若所述运行异常状态对应的异常类型为重度错误,则读取并解析目标目录下以进程标识符字段为结尾命名的core文件以得到解析结果,并将所述解析结果发送给管理员;所述重度错误包括数组越界和数据溢出。
本实施例中,若运行异常状态对应的异常类型为重度错误,则读取并解析目标目录下以进程标识符字段为结尾命名的core文件以得到解析结果,并将解析结果发送给管理员,其中,上述重度错误包括数组越界和数据溢出。可以理解的是,对于一些如数组越界、数据溢出等内存溢出错误时会导致系统崩溃,而当程序运行的过程中异常终止或崩溃,操作系统会将程序当时的内存状态记录下来保存在core文件中,因此,此时系统会在指定目录下生成一个core文件,在core文件中记录了当时的内存映像及一些调试信息。因此,当运行异常状态对应的异常类型为重度错误时,通过调用预设脚本文件,根据当前重度错误对应的参数信息内的进程标识符,从目标目录下存储的以进程标识符字段为结尾命名的core文件中,读取得到当前异常对应的core文件,并解析得到解析结果。以进程标识符字段为结尾命名的core文件即core.pid文件,此处pid即表征进程标识符,每个进程都有唯一的PID编号。可见,通过调用预设脚本文件,自动解析重度错误的core文件并将解析结果发送给管理员,不仅提高了异常处理效率,还可以避免需要人工使用gdb等调试工具才能进行解析的问题。
本实施例中,所述系统运行异常处理方法,还可以包括:通过调用所述预设脚本文件,查看所述目标目录下是否存在以进程标识符字段为结尾命名的core文件;若所述目标目录下存在以进程标识符字段为结尾命名的core文件,则读取并解析所述core文件以得到解析结果,并将所述解析结果发送给管理员。可以理解的是,除了在监测到重度错误进行对core文件的解析外,还可以通过定期查看目标目录下是否存在以进程标识符字段为结尾命名的core文件,若目标目录下存在以进程标识符字段为结尾命名的core文件,则读取并解析该core文件以得到解析结果,并将解析结果发送给管理员,由此可以进一步保证及时发现到系统运行中的重度错误,提高系统异常检测的效率。
由上可见,本实施例中监测系统运行过程,当监测到运行异常状态时根据预先配置的映射关系确定出所述运行异常状态对应的异常类型;获取与所述运行异常状态对应的参数信息;通过调用预设脚本文件,根据所述异常类型和所述参数信息执行与所述运行异常状态对应的预设处理操作,并生成与所述异常类型对应的告警提示。可见,通过监测系统运行过程,在监测到系统存在运行异常状态时,确定出该运行异常状态对应的异常类型,并获取与该运行异常状态对应的参数信息,然后调用预先编写的含有多种预设处理操作流程的预设脚本文件,由此可以根据上述异常类型和参数信息执行与该运行异常状态对应的预设处理操作,并生成与该异常类型对应的告警提示。由此以来,可以针对不同类型的异常通过运行预设脚本文件内对应的预设处理操作,对系统异常进行自动处理,并生成与当前运行异常状态的异常类型对应的告警提示,提高了系统异常处理的效率,避免了人工进行异常处理导致的效率低下及耗费人力的问题,提高了系统针对不同异常错误的容错能力,避免可能因服务中断导致的损失,提高系统的可靠性及稳定性,保证系统业务正常运行。
相应的,本申请实施例还公开了一种系统运行异常处理装置,参见图3所示,该装置包括:
异常类型确定模块11,用于监测系统运行过程,当监测到运行异常状态时根据预先配置的映射关系确定出所述运行异常状态对应的异常类型;
参数信息获取模块12,用于获取与所述运行异常状态对应的参数信息;
异常处理模块13,用于通过调用预设脚本文件,根据所述异常类型和所述参数信息执行与所述运行异常状态对应的预设处理操作,并生成与所述异常类型对应的告警提示。
由上可见,本实施例中监测系统运行过程,当监测到运行异常状态时根据预先配置的映射关系确定出所述运行异常状态对应的异常类型;获取与所述运行异常状态对应的参数信息;通过调用预设脚本文件,根据所述异常类型和所述参数信息执行与所述运行异常状态对应的预设处理操作,并生成与所述异常类型对应的告警提示。可见,通过监测系统运行过程,在监测到系统存在运行异常状态时,确定出该运行异常状态对应的异常类型,并获取与该运行异常状态对应的参数信息,然后调用预先编写的含有多种预设处理操作流程的预设脚本文件,由此可以根据上述异常类型和参数信息执行与该运行异常状态对应的预设处理操作,并生成与该异常类型对应的告警提示。由此以来,可以针对不同类型的异常通过运行预设脚本文件内对应的预设处理操作,对系统异常进行自动处理,并生成与当前运行异常状态的异常类型对应的告警提示,提高了系统异常处理的效率,避免了人工进行异常处理导致的效率低下及耗费人力的问题,提高了系统针对不同异常错误的容错能力,避免可能因服务中断导致的损失,提高系统的可靠性及稳定性,保证系统业务正常运行。
在一些具体实施例中,所述系统运行异常处理装置具体可以包括:
异常处理标志位读取单元,用于查看异常处理配置文件,读取所述异常类型对应的异常处理标志位;
执行判断单元,用于根据所述异常处理标志位判断是否执行所述根据所述异常类型和所述参数信息执行与所述运行异常状态对应的预设处理操作的步骤。
在一些具体实施例中,所述异常处理模块13具体可以包括:
第一处理单元,用于若所述运行异常状态对应的异常类型为轻度错误,则将所述参数信息中包含的节点信息、服务名称和程序错误信息发送给管理员;所述轻度错误包括业务运行异常。
在一些具体实施例中,所述异常处理模块13具体可以包括:
第二处理单元,用于若所述运行异常状态对应的异常类型为中度错误,则根据所述参数信息中包含的进程标识符和进程名确定出发生所述运行异常状态的目标服务,并重启所述目标服务;所述中度错误包括系统资源耗尽引起的掉线异常。
在一些具体实施例中,所述第二处理单元具体可以包括:
运行状态监测单元,用于通过所述预设脚本文件监测所述目标服务的运行状态;
重启执行单元,用于若在预设时间段内所述目标服务的运行状态均为非掉线状态,则不执行所述重启所述目标服务的步骤。
在一些具体实施例中,所述异常处理模块13具体可以包括:
第三处理单元,用于若所述运行异常状态对应的异常类型为重度错误,则读取并解析目标目录下以进程标识符字段为结尾命名的core文件以得到解析结果,并将所述解析结果发送给管理员;所述重度错误包括数组越界和数据溢出。
在一些具体实施例中,所述系统运行异常处理装置具体可以包括:
文件查看单元,用于通过调用所述预设脚本文件,查看所述目标目录下是否存在以进程标识符字段为结尾命名的core文件;
第四处理单元,用于若所述目标目录下存在以进程标识符字段为结尾命名的core文件,则读取并解析所述core文件以得到解析结果,并将所述解析结果发送给管理员。
进一步的,本申请实施例还公开了一种电子设备,参见图4所示,图中的内容不能被认为是对本申请的使用范围的任何限制。
图4为本申请实施例提供的一种电子设备20的结构示意图。该电子设备20,具体可以包括:至少一个处理器21、至少一个存储器22、电源23、通信接口24、输入输出接口25和通信总线26。其中,所述存储器22用于存储计算机程序,所述计算机程序由所述处理器21加载并执行,以实现前述任一实施例公开的系统运行异常处理方法中的相关步骤。
本实施例中,电源23用于为电子设备20上的各硬件设备提供工作电压;通信接口24能够为电子设备20创建与外界设备之间的数据传输通道,其所遵循的通信协议是能够适用于本申请技术方案的任意通信协议,在此不对其进行具体限定;输入输出接口25,用于获取外界输入数据或向外界输出数据,其具体的接口类型可以根据具体应用需要进行选取,在此不进行具体限定。
另外,存储器22作为资源存储的载体,可以是只读存储器、随机存储器、磁盘或者光盘等,其上所存储的资源包括操作系统221、计算机程序222及包括预设处理操作在内的数据223等,存储方式可以是短暂存储或者永久存储。
其中,操作系统221用于管理与控制电子设备20上的各硬件设备以及计算机程序222,以实现处理器21对存储器22中海量数据223的运算与处理,其可以是Windows Server、Netware、Unix、Linux等。计算机程序222除了包括能够用于完成前述任一实施例公开的由电子设备20执行的系统运行异常处理方法的计算机程序之外,还可以进一步包括能够用于完成其他特定工作的计算机程序。
进一步的,本申请实施例还公开了一种计算机存储介质,所述计算机存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现前述任一实施例公开的系统运行异常处理方法步骤。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本发明所提供的一种系统运行异常处理方法、装置、设备及介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种系统运行异常处理方法,其特征在于,包括:
监测系统运行过程,当监测到运行异常状态时根据预先配置的映射关系确定出所述运行异常状态对应的异常类型;
获取与所述运行异常状态对应的参数信息;
通过调用预设脚本文件,根据所述异常类型和所述参数信息执行与所述运行异常状态对应的预设处理操作,并生成与所述异常类型对应的告警提示。
2.根据权利要求1所述的系统运行异常处理方法,其特征在于,所述根据所述异常类型和所述参数信息执行与所述运行异常状态对应的预设处理操作之前,还包括:
查看异常处理配置文件,读取所述异常类型对应的异常处理标志位;
根据所述异常处理标志位判断是否执行所述根据所述异常类型和所述参数信息执行与所述运行异常状态对应的预设处理操作的步骤。
3.根据权利要求1所述的系统运行异常处理方法,其特征在于,所述根据所述异常类型和所述参数信息执行与所述运行异常状态对应的预设处理操作,包括:
若所述运行异常状态对应的异常类型为轻度错误,则将所述参数信息中包含的节点信息、服务名称和程序错误信息发送给管理员;所述轻度错误包括业务运行异常。
4.根据权利要求1所述的系统运行异常处理方法,其特征在于,所述根据所述异常类型和所述参数信息执行与所述运行异常状态对应的预设处理操作,包括:
若所述运行异常状态对应的异常类型为中度错误,则根据所述参数信息中包含的进程标识符和进程名确定出发生所述运行异常状态的目标服务,并重启所述目标服务;所述中度错误包括系统资源耗尽引起的掉线异常。
5.根据权利要求4所述的系统运行异常处理方法,其特征在于,所述重启所述目标服务之前,还包括:
通过所述预设脚本文件监测所述目标服务的运行状态;
若在预设时间段内所述目标服务的运行状态均为非掉线状态,则不执行所述重启所述目标服务的步骤。
6.根据权利要求1至5任一项所述的系统运行异常处理方法,其特征在于,所述根据所述异常类型和所述参数信息执行与所述运行异常状态对应的预设处理操作,包括:
若所述运行异常状态对应的异常类型为重度错误,则读取并解析目标目录下以进程标识符字段为结尾命名的core文件以得到解析结果,并将所述解析结果发送给管理员;所述重度错误包括数组越界和数据溢出。
7.根据权利要求6所述的系统运行异常处理方法,其特征在于,还包括:
通过调用所述预设脚本文件,查看所述目标目录下是否存在以进程标识符字段为结尾命名的core文件;
若所述目标目录下存在以进程标识符字段为结尾命名的core文件,则读取并解析所述core文件以得到解析结果,并将所述解析结果发送给管理员。
8.一种系统运行异常处理装置,其特征在于,包括:
异常类型确定模块,用于监测系统运行过程,当监测到运行异常状态时根据预先配置的映射关系确定出所述运行异常状态对应的异常类型;
参数信息获取模块,用于获取与所述运行异常状态对应的参数信息;
异常处理模块,用于通过调用预设脚本文件,根据所述异常类型和所述参数信息执行与所述运行异常状态对应的预设处理操作,并生成与所述异常类型对应的告警提示。
9.一种电子设备,其特征在于,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序,以实现如权利要求1至7任一项所述的系统运行异常处理方法。
10.一种计算机可读存储介质,其特征在于,用于存储计算机程序;其中计算机程序被处理器执行时实现如权利要求1至7任一项所述的系统运行异常处理方法。
CN202111165009.4A 2021-09-30 2021-09-30 一种系统运行异常处理方法、装置、设备及存储介质 Active CN113886122B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111165009.4A CN113886122B (zh) 2021-09-30 2021-09-30 一种系统运行异常处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111165009.4A CN113886122B (zh) 2021-09-30 2021-09-30 一种系统运行异常处理方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN113886122A true CN113886122A (zh) 2022-01-04
CN113886122B CN113886122B (zh) 2024-03-01

Family

ID=79005002

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111165009.4A Active CN113886122B (zh) 2021-09-30 2021-09-30 一种系统运行异常处理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN113886122B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116991640A (zh) * 2023-06-21 2023-11-03 深圳市晶存科技有限公司 脱机测试方法及其装置、电子设备、存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005339268A (ja) * 2004-05-27 2005-12-08 Nomura Research Institute Ltd 整合性チェックプログラム及び方法
CN109614290A (zh) * 2018-12-10 2019-04-12 苏州思必驰信息科技有限公司 容器中的进程异常信息记录方法及系统
CN109684847A (zh) * 2018-09-07 2019-04-26 平安科技(深圳)有限公司 脚本漏洞的自动修复方法、装置、设备及存储介质
CN109981491A (zh) * 2019-03-29 2019-07-05 新华三技术有限公司 异常处理方法及接口板
CN110011854A (zh) * 2019-04-12 2019-07-12 苏州浪潮智能科技有限公司 Mds故障处理方法、装置、存储系统及计算机可读存储介质
CN111124734A (zh) * 2019-12-25 2020-05-08 北京格林威尔科技发展有限公司 一种对脚本运行过程中的异常处理方法及装置
CN111563016A (zh) * 2020-04-27 2020-08-21 平安医疗健康管理股份有限公司 日志采集分析方法、装置、计算机系统及可读存储介质
CN112115026A (zh) * 2020-09-15 2020-12-22 招商局金融科技有限公司 服务器集群监控方法、装置、电子设备及可读存储介质
WO2020259392A1 (zh) * 2019-06-25 2020-12-30 深圳前海微众银行股份有限公司 一种异常任务的根因任务确定方法及装置
CN112181815A (zh) * 2020-09-21 2021-01-05 苏州浪潮智能科技有限公司 基于Python的异常捕获方法、装置及计算机可读存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005339268A (ja) * 2004-05-27 2005-12-08 Nomura Research Institute Ltd 整合性チェックプログラム及び方法
CN109684847A (zh) * 2018-09-07 2019-04-26 平安科技(深圳)有限公司 脚本漏洞的自动修复方法、装置、设备及存储介质
CN109614290A (zh) * 2018-12-10 2019-04-12 苏州思必驰信息科技有限公司 容器中的进程异常信息记录方法及系统
CN109981491A (zh) * 2019-03-29 2019-07-05 新华三技术有限公司 异常处理方法及接口板
CN110011854A (zh) * 2019-04-12 2019-07-12 苏州浪潮智能科技有限公司 Mds故障处理方法、装置、存储系统及计算机可读存储介质
WO2020259392A1 (zh) * 2019-06-25 2020-12-30 深圳前海微众银行股份有限公司 一种异常任务的根因任务确定方法及装置
CN111124734A (zh) * 2019-12-25 2020-05-08 北京格林威尔科技发展有限公司 一种对脚本运行过程中的异常处理方法及装置
CN111563016A (zh) * 2020-04-27 2020-08-21 平安医疗健康管理股份有限公司 日志采集分析方法、装置、计算机系统及可读存储介质
CN112115026A (zh) * 2020-09-15 2020-12-22 招商局金融科技有限公司 服务器集群监控方法、装置、电子设备及可读存储介质
CN112181815A (zh) * 2020-09-21 2021-01-05 苏州浪潮智能科技有限公司 基于Python的异常捕获方法、装置及计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
徐珊;: "调度自动化OPEN-3000系统显示异常的分析处理", 无线互联科技, no. 02, 25 January 2015 (2015-01-25) *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116991640A (zh) * 2023-06-21 2023-11-03 深圳市晶存科技有限公司 脱机测试方法及其装置、电子设备、存储介质

Also Published As

Publication number Publication date
CN113886122B (zh) 2024-03-01

Similar Documents

Publication Publication Date Title
CN110661659B (zh) 一种告警方法、装置、系统及电子设备
CN112631913B (zh) 应用程序的运行故障监控方法、装置、设备和存储介质
CN107241229B (zh) 一种基于接口测试工具的业务监控方法及装置
US8489941B2 (en) Automatic documentation of ticket execution
CN112416645A (zh) 一种基于人工智能的故障根因推断定位方法及装置
CN111324423B (zh) 容器内进程的监控方法、装置、存储介质和计算机设备
CN108845912B (zh) 服务接口调用故障的报警方法及计算设备
CN106202535B (zh) 一种rrd数据库的检测的方法及系统
US20240039821A1 (en) Mitigating failure in request handling
CN112769652B (zh) 一种节点服务监控方法、装置、设备及介质
CN111565135A (zh) 监控服务器运行的方法、监控服务器和存储介质
CN113886122B (zh) 一种系统运行异常处理方法、装置、设备及存储介质
CN111611057A (zh) 分布式重试方法、装置、电子设备和存储介质
CN111478792B (zh) 一种割接信息处理方法、系统及装置
CN112306871A (zh) 数据处理方法、装置、设备及存储介质
CN116230067A (zh) 一种固态硬盘自动化测试方法、系统、设备及介质
CN111181777A (zh) 一种服务降级的方法、装置、计算机设备及存储介质
CN115686921A (zh) 一种多路径异常检测修复方法、装置、设备及介质
CN115525568A (zh) 代码覆盖率的巡检方法、装置、计算机设备及存储介质
CN114676019A (zh) 一种中央处理器状态监测方法、装置、设备、存储介质
CN114385457A (zh) 应用程序数据采集方法、装置、设备及存储介质
CN112069027A (zh) 一种接口数据处理方法、装置、电子设备及存储介质
CN113342596A (zh) 一种设备指标的分布式监控方法、系统及装置
CN112783730A (zh) 一种接口的监测方法、装置、介质及电子设备
CN114428715A (zh) 一种日志处理方法、装置、系统及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant