CN106708638B - 系统错误检测方法和装置 - Google Patents

系统错误检测方法和装置 Download PDF

Info

Publication number
CN106708638B
CN106708638B CN201510776452.3A CN201510776452A CN106708638B CN 106708638 B CN106708638 B CN 106708638B CN 201510776452 A CN201510776452 A CN 201510776452A CN 106708638 B CN106708638 B CN 106708638B
Authority
CN
China
Prior art keywords
error
data
target system
information
warning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510776452.3A
Other languages
English (en)
Other versions
CN106708638A (zh
Inventor
杜智超
史岳斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Boya Network Games Development Shenzhen Co ltd
Original Assignee
Boya Network Games Development Shenzhen Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Boya Network Games Development Shenzhen Co ltd filed Critical Boya Network Games Development Shenzhen Co ltd
Priority to CN201510776452.3A priority Critical patent/CN106708638B/zh
Publication of CN106708638A publication Critical patent/CN106708638A/zh
Application granted granted Critical
Publication of CN106708638B publication Critical patent/CN106708638B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0775Content or structure details of the error report, e.g. specific table structure, specific error fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/80Database-specific techniques

Abstract

本发明涉及一种系统错误检测方法和装置,所述方法包括:定期向目标系统发送错误检测请求;接收所述目标系统根据所述错误检测请求返回的数据;通过预先训练获得的错误检测模型对所述目标系统返回的数据进行检测得到系统错误信息;根据所述系统错误信息中的错误类型在数据库中查找与所述错误类型对应的错误修复方式;根据查找到的所述错误修复方式对所述目标系统进行修复。这样通过定期向目标系统发送检测请求,保证了在系统发生错误时,能够及时检测到系统的错误,且在检测到目标系统中的错误时,能够保证及时对错误进行修复,缩短了修复错误的时间,提高了系统错误的检测和修复效率。

Description

系统错误检测方法和装置
技术领域
本发明涉及系统维护技术领域,特别是涉及一种系统错误检测方法和装置。
背景技术
随着互联网服务的发展,互联网已经渗透到人们生活的各个方面。而现在的互联网服务大多基于C/S或B/S模型,C/S模型即客户端与服务器结构,B/S模型即浏览器与服务器结构。在这两种模型中,服务器端扮演着服务提供者的角色,服务器处于网络服务的核心位置。如果服务器端出现了问题,则可能导致所有的客户端或浏览器端不能正常工作,致使整个网络服务发生瘫痪。为了保证服务器上运行的系统能够提供正常可靠的服务,需要对系统进行检测,并对检测出的错误进行处理。而目前的系统检测和错误处理都是靠人工完成的,因此不能保证在系统发生错误时,及时对错误进行检测,即使检测到错误之后,还需要人工进行错误确认,确认之后再由人工修复错误,修复错误所花时间较长,从而降低了系统错误检测和错误修复的效率。
发明内容
基于此,有必要针对系统错误检测和修复效率低的问题,提供一种能够提高系统错误的检测和修复效率的系统错误检测方法和装置。
一种系统错误检测方法,包括:
定期向目标系统发送错误检测请求;
接收所述目标系统根据所述错误检测请求返回的数据;
通过预先训练获得的错误检测模型对所述目标系统返回的数据进行检测得到系统错误信息;
根据所述系统错误信息中的错误类型在数据库中查找与所述错误类型对应的错误修复方式;
根据查找到的所述错误修复方式对所述目标系统进行修复。
在其中一个实施例中,所述通过预先训练获得的错误检测模型对所述目标系统返回的数据进行检测得到系统错误信息之后,还包括:
通过对所述系统错误信息进行筛选获得严重错误信息和警告错误信息;
根据所述严重错误信息和所述警告错误信息中的数据计算得出错误严重度;
如果所述错误严重度大于第一容错阈值,则执行所述根据所述系统错误信息中的错误类型在数据库中查找与所述错误类型对应的修复方式,根据查找到的所述错误修复方式对所述目标系统进行修复的步骤。
在其中一个实施例中,所述根据所述严重错误信息和所述警告错误信息中的数据计算得出错误严重度包括:
根据所述严重错误信息和所述警告错误信息中的数据计算错误总数;
通过预置的严重错误系数与预置的警告错误系数计算得到系数比率;
对所述错误总数和所述系数比率进行运算得到错误严重度。
在其中一个实施例中,所述根据所述严重错误信息和所述警告错误信息中的数据计算得出错误严重度之后还包括:
如果错误严重度小于第一容错阈值且大于第二容错阈值,根据所述系统错误信息中的错误类型在数据库中查找与所述错误类型对应的错误验证方式,根据所述错误验证方式向所述目标系统发送错误验证请求获取数据,并对所述数据进行验证;
若验证通过,则执行所述根据所述系统错误信息中的错误类型在数据库中查找与所述错误类型对应的修复方式,根据查找到的所述错误修复方式修复对所述目标系统进行修复的步骤。
在其中一个实施例中,所述系统错误检测方法还包括:
根据所述系统错误信息中的错误类型在数据库中查找错误原因;
根据所述系统错误信息和所述错误原因生成错误报告;
将所述错误报告发送至预设联系人所登录的终端。
上述系统错误检测方法,通过定期向目标系统发送错误检测请求,且根据错误检测请求获取相应的数据,并使用错误检测模型对数据进行检测,当检测到数据中的错误时生成系统错误信息,并能够及时根据系统错误信息中的错误类型在数据库中查找到与错误类型对应的修复方式,根据修复方式修复目标系统中检测到的错误。这样通过定期向目标系统发送检测请求,且根据错误检测模型对目标系统进行检测,保证了在系统发生错误时,能够及时检测到系统的错误,达到定期对系统检测的效果,并且也缩短了检测目标系统中错误的时间和提高了检测目标系统中错误的速度,且在检测到目标系统中的错误时,能够保证及时对错误进行修复,缩短了修复错误的时间,因此提高了系统错误的检测和修复效率。
一种系统错误检测装置,包括:
请求模块,用于定期向目标系统发送错误检测请求;接收所述目标系统根据所述错误检测请求返回的数据;
数据处理模块,用于通过预先训练获得的错误检测模型对所述目标系统返回的数据进行检测得到系统错误信息;
错误检测模块,用于根据所述系统错误信息中的错误类型在数据库中查找与所述错误类型对应的错误修复方式,根据查找到的所述错误修复方式对所述目标系统进行修复。
在其中一个实施例中,所述数据处理模块还用于通过对所述系统错误信息进行筛选得到严重错误信息和警告错误信息;根据所述严重错误信息和所述警告错误信息中的数据计算得出错误严重度;
所述错误检测模块还用于如果所述错误严重度大于第一容错阈值,则根据所述系统错误信息中的错误类型在数据库中查找与所述错误类型对应的修复方式,根据查找到的所述错误修复方式对所述目标系统进行修复。
在其中一个实施例中,所述数据处理模块还用于根据所述严重错误信息和所述警告错误信息中的数据计算错误总数,通过预置的严重错误系数与预置的警告错误系数计算得到系数比率,对所述错误总数和所述系数比率进行运算得到错误严重度。
在其中一个实施例中,所述错误检测模块还用于如果错误严重度小于第一容错阈值且大于第二容错阈值,根据所述系统错误信息中的错误类型在数据库中查找与所述错误类型对应的错误验证方式,根据所述错误验证方式向所述目标系统发送错误验证请求获取数据,并对所述数据进行验证;若验证通过,根据所述系统错误信息中的错误类型在数据库中查找与所述错误类型对应的修复方式,根据查找到的所述错误修复方式对所述目标系统进行修复。
在其中一个实施例中,所述系统错误检测装置还包括:
错误报告模块,用于根据所述系统错误信息中的错误类型在数据库中查找错误原因;根据所述系统错误信息和所述错误原因生成错误报告;将所述错误报告发送至预设联系人所登录的终端。
上述系统错误检测装置,请求模块通过定期向目标系统发送错误检测请求,且根据通过错误检测请求获取相应的数据,数据处理模块使用预先训练获得的错误检测模型对数据进行检测,当检测到数据中的错误时生成系统错误信息,错误检测模块能够及时根据系统错误信息中的错误类型在数据库中查找到与错误类型对应的修复方式,根据修复方式修复目标系统中检测到的错误。这样通过定期向目标系统发送检测请求,且根据错误检测模型对目标系统进行检测,保证了在系统发生错误时,能够及时检测到系统的错误,达到定期对系统检测的效果,并且也缩短了检测目标系统中错误的时间和提高了检测目标系统中错误的速度,且在检测到目标系统中的错误时,能够保证及时对错误进行修复,缩短了修复错误的时间,因此提高了系统错误的检测和修复效率。
附图说明
图1为一个实施例中系统错误检测方法的流程示意图;
图2为另一个实施例中系统错误检测方法的流程示意图;
图3为一个实施例中错误报告步骤的流程示意图;
图4为一个实施例中系统错误检测装置的结构框图;
图5为另一个实施例中系统错误检测装置的结构框图;
图6为一个实施例中系统错误检测装置检测目标系统的检测交互示意图;
图7为另一个例中系统错误检测装置中的请求模块内部流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,一种系统错误检测方法,本实施例以该方法应用于服务器上来举例。服务器上运行有与目标系统相互独立的系统错误检测程序,通过该系统错误检测程序来实施该系统错误检测方法。该方法具体包括以下步骤:
步骤102,定期向目标系统发送错误检测请求。
具体地,目标系统是系统错误检测方法所要检测的系统,该系统运行在服务器上。错误检测请求是服务器为了获取目标系统中的数据而发送的数据请求,错误检测请求中包括需要检测的数据的参数,目标系统读取到错误检测请求中数据的参数时,会根据数据的参数返回对应的数据,以便服务器对数据进行检测。
服务器根据预置的初始条件确定错误检测请求的参数和检测频率,再根据检测频率定期向目标系统发送错误检测请求。检测频率可以设置为一分钟、一小时或者一天等,如果检测频率设置为一分钟,则服务器每隔一分钟向目标系统发送一个错误检测请求,如此类推。预置的初始条件包括对目标系统的检测频率和需要检测的数据的参数,请求模块通过检测请求中的参数获取到与数据参数对应的数据,参数不同获取到的数据也不同。
步骤104,接收目标系统根据错误检测请求返回的数据。
具体地,目标系统在接收到服务器发送的错误检测请求后,对错误检测请求进行解析,根据解析得到的数据的参数查找相应的数据,并将查找到的数据返回给服务器。
步骤106,通过预先训练获得的错误检测模型对目标系统返回的数据进行检测得到系统错误信息。
具体地,服务器利用错误检测模型对目标系统返回的数据进行检测,错误检测模型在目标系统返回的数据中检测到错误时,则根据所检测到的错误生成系统错误信息。系统错误信息中包括错误类型和发生错误的数据,还可以包括发生错误的时间和检测到错误的时间中的至少一种。
错误检测模型是预先训练获得的。在一个实施例中,服务器获取目标系统的所有数据,在目标系统的所有数据中筛选错误检测指标。服务器根据筛选出来的错误检测指标选取模型样本数据,模型样本数据用于训练错误检测模型。在模型样本数据中随机选取一部分数据作为训练样本,剩下一部分作为测试样本。服务器利用训练样本训练得到错误检测模型,在利用测试样本对错误检测模型进行测试,如果测试准确,则错误检测模型训练成功,如果测试不准确,重新训练错误检测模型。不同的目标系统有不同的错误检测模型。
步骤108,根据系统错误信息中的错误类型在数据库中查找与错误类型对应的错误修复方式。
在一个实施例中,服务器提取系统错误信息中的错误类型,并根据错误类型在数据库中进行查找。在数据库中存储着错误类型和与错误类型对应的错误修复方式,服务器通过比对错误类型来查找错误类型对应的错误修复方式。错误修复方式可以是对目标系统中数据计算错误进行重新计算,并将目标系统各种的错误数据更新为重新计算得到的正确数值,也可以是对目标系统中的代码错误进行修复,错误修复方式中包括正确的代码,将目标系统中错误的代码替换为正确的代码。
在一个实施例中,数据库中存储着错误报告,错误报告中包括错误类型和与错误类型对应的错误修复方式。服务器在数据库中查找与错误类型对应的错误报告,并提取错误报告中的错误修复方式。
步骤110,根据查找到的错误修复方式对目标系统进行修复。
在一个实施例中,服务器根据错误类型在数据库中查找到错误修复方式,并根据错误修复方式对目标系统中发生错误的数据或者系统进行修复。具体地,服务器可对目标系统的配置文件进行修复,或者可对目标系统的代码进行修复。
本实施例中,通过定期向目标系统发送错误检测请求,且根据错误检测请求获取相应的数据,并使用错误检测模型对数据进行检测,当检测到数据中的错误时生成系统错误信息,并能够及时根据系统错误信息中的错误类型在数据库中查找到与错误类型对应的修复方式,根据修复方式修复目标系统中检测到的错误。这样通过定期向目标系统发送检测请求,且根据错误检测模型对目标系统进行检测,保证了在系统发生错误时,能够及时检测到系统的错误,并且也缩短了检测目标系统中错误的时间和提高了检测目标系统中错误的速度,且在检测到目标系统中的错误时,能够保证及时对错误进行修复,缩短了修复错误的时间,因此提高了系统错误的检测和修复效率。
如图2所示,在一个实施例中,一种系统错误检测方法,具体包括如下步骤:
步骤202,定期向目标系统发送错误检测请求。
步骤204,接收目标系统根据错误检测请求返回的数据。
步骤206,通过预先训练获得的错误检测模型对目标系统返回的数据进行检测得到系统错误信息。
步骤208,通过对系统错误信息进行筛选获得严重错误信息和警告错误信息。
在一个实施例中,服务器可预先将错误类型划分级别,根据系统错误信息中的错误类型的级别将系统错误信息分为严重错误信息和警告错误信息。
步骤210,根据严重错误信息和警告错误信息中的数据计算得出错误严重度。
在一个实施例中,计算严重错误信息中严重错误的数量与警告错误信息中警告错误数量的错误数量总和,以错误数量总和作为错误严重度,错误数量总和数值越大,错误严重度越高,错误数量总和数值越小,错误严重度越低。
步骤212,判断错误严重度是否大于第一容错阈值。如果错误严重度大于第一容错阈值,则执行步骤216;如果严重错误度小于或等于第一容错阈值,则执行步骤214。
具体地,服务器将计算得到的错误严重度与预置的第一容错阈值进行比较,判断错误严重度是否大于第一容错阈值。第一容错阈值是预置的用来判断目标系统所发生错误是否属于严重错误的系数,如果错误严重度大于第一容错阈值,则表示该错误为严重错误,则会直接对错误进行修复。
如果计算得出的错误严重度大于第一容错阈值,则根据系统错误信息中的错误类型在数据库中对应的错误修复方式,根据查找到的错误修复方式修复目标系统中的错误数据或者代码。
步骤214,如果错误严重度大于第二容错阈值,根据系统错误信息中的错误类型在数据库中查找与错误类型对应的错误验证方式,根据错误验证方式向目标系统发送错误验证请求获取数据,并对数据进行验证。
具体地,如果错误严重度小于或等于第一容错阈值且大于第二容错阈值,根据系统错误信息中的错误类型在数据库中查找与错误类型对应的错误验证方式,根据错误验证方式向目标系统发送错误验证请求获取数据,并对数据进行验证。若验证通过,则执行根据系统错误信息中的错误类型在数据库中查找与错误类型对应的修复方式,并根据查找到的错误修复方式修复错误的步骤。第二容错阈值是预置的用来判断目标系统发生的错误是否属于警告错误的系数,并且第二容错阈值小于第一容错阈值。当错误严重度小于等于第一阈值的同时大于第二容错阈值时,则属于警告错误,需要对错误进行再次确认,如果再次确认错误确实存在,则对错误进行修复。
如果在计算出的错误严重度小于第一容错阈值并且大于第二容错阈值时,服务器提取系统错误信息中的错误类型,并使用错误类型在数据库中查找与错误类型对应的错误验证方式。服务器根据错误验证方式向目标系统发送错误验证请求来获取发生错误的数据,并将所获取到的数据与系统错误信息中发生错误的数据进行比对,如果所获取到的数据与系统错误信息中发生错误的数据一致或者相同,服务器则认定目标系统中确实存在该错误,则验证通过。服务器根据错误类型在数据库中查找错误修复方式,并根据错误修复方式对错误进行修复。
如果验证没通过或者错误严重度小于第二容错阈值,说明目标系统中不存在错误,无需对错误进行修复,目标系统运行正常,不进行错误修复或错误报告。
步骤216,根据系统错误信息中的错误类型在数据库中查找与错误类型对应的错误修复方式。
步骤218,根据查找到的错误修复方式对目标系统进行修复。
本实施例中,在系统错误信息中筛选出严重错误信息和警告错误信息,并根据严重错误信息和警告错误信息计算出错误严重度,根据错误严重度可以反映出错误的严重情况,在错误严重度大于第一容错阈值时,对错误严重度较高的错误在数据库中查找修复方式进行修复,提高了错误修复的效率。在错误严重度没有达到第一容错阈值且大于第二阈值时,需要对检测到的错误进行验证确认,如果验证确认错误确实存在才对错误进行修复,进一步提高了错误检测的准确率,避免了由于错误检测不准确而浪费修复错误所需的资源。
在一个实施例中,步骤210包括:根据严重错误信息和警告错误信息中的数据计算错误总数,通过预置的严重错误系数与预置的警告错误系数计算得到系数比率,对错误总数和系数比率进行运算得到错误严重度。
具体地,可根据如下公式计算错误严重度:
Figure BDA0000845754970000091
其中Result表示错误严重度,a表示预置的严重错误系数,b表示预置的警告错误系数,x1表示将检测到的严重错误数据排序后的第一个严重错误数据,x2则表示将检测到的严重错误数据排序后的最后一个严重错误数据,x1至x2表示出现严重错误的范围内的数据。y1表示将检测到的警告错误数据排序后的第一个警告错误数据,y2则表示将检测到的警告错误数据排序后的最后一个警告错误数据,y1至y2表示出现警告错误的范围内的数据,x表示严重错误的数量,y表示警告错误的数量。
进一步地,服务器根据严重错误信息中的数据计算严重错误的数量x,再根据警告错误信息中的数据计算警告错误的数量y,其中严重错误信息和警告错误信息中的数据包括发生错误的数据以及错误类型。将严重错误的数量x和警告错误的数量y相加得到总的错误数量,再根据预置的严重错误系数a和预置的警告错误系数b计算系数比率,以总的错误数量乘以系数比率,得到严重错误在总的错误数量中所占的比率,即错误严重度Result。错误严重度越大,目标系统中的严重错误所占总的错误数量的比率越大。错误严重度越小,目标系统中的严重错误所占总的错误数量的比率越小。目标系统中的严重错误所占总的错误数的比率越大,越需要对目标系统中的错误进行修复。
本实施例中,通过总的错误数量和严重错误与警告错误数量的比率乘积得到的错误严重度,可以反映严重错误在总的错误数量中占有的比率,能够实际反映目标系统中发生严重错误的情况。
如图3所示,在一个实施例中,上述系统错误检测方法还包括错误报告生成的步骤,具体包括以下步骤:
步骤302,根据系统错误信息中的错误类型在数据库中查找错误原因。
在一个实施例中,服务器在检测到目标系统的错误之后,生成了系统错误信息,系统错误信息中包括错误类型。服务器提取系统错误信息中提取到错误类型,并根据错误类型在数据库中查找与错误类型对应的错误原因。
在一个实施例中,服务器根据错误类型在数据库中查找包括相同错误类型的错误报告,从错误报告中提取错误原因。
步骤304,根据系统错误信息和错误原因生成错误报告。
在一个实施例中,服务器提取系统错误信息中的发生错误的数据和错误类型,并根据发生错误的数据、错误类型和错误原因生成错误报告。错误报告还可以包括错误发生时间、错误检测时间、错误修复方式和错误验证方式中至少一种。
步骤306,将错误报告发送至预设联系人所登录的终端。
在一个实施例中,服务器在生成错误报告之后,将错误报告发送给预设联系人所登录的终端,方便技术人员通过错误报告了解目标系统的具体运行情况。同时,服务器也可将错误报告存储在数据库中,以便下次发生错误类型相同的错误时,在数据库中查找对应的错误报告,根据错误报告中的错误修复方式或者错误验证方式来对错误进行修复或者验证,也可以根据错误类型查找错误报告中的错误原因,并根据错误原因再次生成错误报告。
本实施例中,根据错误检测、错误修复和错误验证过程中产生的信息或数据生成错误报告,技术人员可以通过错误报告了解到目标系统具体的运行情况,同时可以保证以后目标系统出现相同错误时直接在数据库中查找错误报告,并根据错误报告来对错误进行处理,提高了错误处理效率。
如图4所示,在一个实施例中,提供一种系统错误检测装置400,包括:请求模块402、数据处理模块404和错误检测模块406。
请求模块402,用于定期向目标系统发送错误检测请求;接收目标系统根据错误检测请求返回数据。
数据处理模块404,用于通过预先训练获得的错误检测模型对目标系统返回的数据进行检测得到系统错误信息。
错误检测模块406,用于根据系统错误信息中的错误类型在数据库中查找与错误类型对应的错误修复方式,并根据查找到的错误修复方式对目标系统进行修复。
本实施例中,请求模块402通过定期向目标系统发送错误检测请求,且根据通过错误检测请求获取相应的数据,数据处理模块404使用预先训练获得的错误检测模型对数据进行检测,当检测到数据中的错误时生成系统错误信息。错误检测模块406可以连接到数据库,能够及时根据系统错误信息中的错误类型在数据库中查找到与错误类型对应的修复方式,根据修复方式修复目标系统中检测到的错误。这样通过定期向目标系统发送检测请求,且根据错误检测模型对目标系统进行检测,保证了在系统发生错误时,能够及时检测到系统的错误,达到定期对系统检测的效果,并且也缩短了检测目标系统中错误的时间和提高了检测目标系统中错误的速度,且在检测到目标系统中的错误时,能够保证及时对错误进行修复,缩短了修复错误的时间,因此提高了系统错误的检测和修复效率。
在一个实施例中,所述数据处理模块404还用于通过对系统错误信息进行筛选得到严重错误信息和警告错误信息;根据严重错误信息和警告错误信息中的数据计算得出错误严重度。
错误检测模块406还用于如果错误严重度大于第一容错阈值,则根据系统错误信息中的错误类型在数据库中查找与错误类型对应的修复方式,并根据查找到的错误修复方式对目标系统进行修复。
本实施例中,数据处理模块404在系统错误信息中筛选出严重错误信息和警告错误信息,并根据严重错误信息和警告错误信息计算出错误严重度。错误检测模块406根据错误严重度可以反映出错误的严重情况,对错误严重度较高的错误在数据库中查找修复方式进行修复,提高了错误修复的效率。
在一个实施例中,所述数据处理模块404还用于根据所述严重错误信息和所述警告错误信息中的数据计算错误总数,通过预置的严重错误系数与预置的警告错误系数计算得到系数比率,对所述错误总数和所述系数比率进行运算得到错误严重度。
本实施例中,数据处理模块404通过总的错误数量和严重错误与警告错误数量的比率乘积得到的错误严重度,可以反映严重错误在总的错误数量中占有的比率,能够实际反映目标系统中发生严重错误的情况。
在一个实施例中,所述错误检测模块406还用于如果错误严重度小于第一容错阈值且大于第二容错阈值,根据系统错误信息中的错误类型在数据库中查找与错误类型对应的错误验证方式,根据错误验证方式向目标系统发送错误验证请求获取数据,并对数据进行验证;若验证通过,根据系统错误信息中的错误类型在数据库中查找与所述错误类型对应的修复方式,根据查找到的错误修复方式对目标系统进行修复。
本实施例中,错误检测模块406在错误严重度没有达到第一容错阈值且大于第二阈值时,需要对检测到的错误进行验证确认,如果验证确认错误确实存在才对错误进行修复,进一步提高了错误检测的准确率,避免了由于错误检测不准确而浪费修复错误所需的资源。
如图5所示,在一个实施例中,系统错误检测装置400还包括:错误报告模块408,用于根据系统错误信息中的错误类型在数据库中查找错误原因;根据系统错误信息和错误原因生成错误报告;将错误报告发送至预设联系人所登录的终端。
本实施例中,错误报告模块408根据错误检测、错误修复和错误验证过程中产生的信息或数据生成错误报告,技术人员可以通过错误报告了解到目标系统具体的运行情况。错误报告模块408可以连接到数据库,可以保证以后目标系统出现相同错误时直接在数据库中查找错误报告,并根据错误报告来对错误进行处理,提高了错误处理效率。
如图6所示,在一个实施例中,系统错误检测装置400包括请求模块402、数据处理模块404、错误检测模块406和错误报告模块408。系统错误检测装置400用于检测目标系统500,目标系统500中运行有内部算法,不同的业务对应不同的内部算法。
参照图7,首先请求模块402执行步骤702,判断是否是由错误检测模块406发送的错误验证请求。如果不是错误检测模块406发送的错误验证请求,则执行步骤704,根据预置的初始条件确定检测请求的参数和频率,之后再执行步骤706,向目标系统发送请求;如果是错误检测模块406发送的错误验证请求,则执行步骤706,向目标系统发送请求。预置的初始条件包括对目标系统的检测频率和需要检测的数据的参数,请求模块402通过检测请求中的参数获取到与参数对应的数据,参数不同获取到的数据也不同。
目标系统500在接收到请求模块402发送的请求之后,根据请求查找与请求对应的数据,并将数据返回给系统错误检测装置400。系统错误检测装置400将目标系统500返回的数据发送给数据处理模块404。
数据处理模块404根据预先训练获得的错误检测模型对目标系统500返回的数据进行检测得到系统错误信息,并通过系统错误检测装置400将系统错误信息发送给错误检测模块406。
错误检测模块406提取系统错误信息中的错误类型,并根据错误类型在数据库中查找与错误类型对应的错误修复方式并根据错误修复方式对目标系统500中的错误进行修复;或者,根据错误类型在数据库中查找错误验证方式,根据错误验证方式通过系统错误检测装置400向请求模块402发送错误验证请求,用以调用请求模块402向目标系统500发送错误验证请求,在目标系统500返回的数据与发生错误的数据相同时,错误检测模块406在数据库中查找错误修复方式,并根据错误修复方式对目标系统500中的错误进行修复。
错误报告模块408通过系统错误检测装置400获取在错误处理过程中的所有信息或数据,包括系统错误信息、错误修复方式和错误验证方式等,且根据系统错误信息中的错误类型查找到错误原因,并根据错误过程中的生成的信息或数据以及错误原因生成错误报告,并将错误报告发送给预设联系人所登录的终端,同时将错误报告存储在数据库中。
系统错误检测装置400可以根据预置的频率来对目标系统500进行检测,预置的频率可以是1分钟、1小时或1天等。比如,预置的频率是1分钟,则系统错误检测装置400每隔1分钟就对目标系统500通过发送检测请求检测一次。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种系统错误检测方法,包括:
根据预置的初始条件确定错误检测请求的参数和检测频率,根据检测频率定期向目标系统发送错误检测请求;
接收所述目标系统根据所述错误检测请求返回的与所述参数对应的数据;
通过预先训练获得的错误检测模型对所述目标系统返回的数据进行检测得到系统错误信息;所述错误检测模型的训练步骤包括:获取目标系统的所有数据,在目标系统的所有数据中筛选错误检测指标;根据筛选出来的错误检测指标随机选取一部分数据作为模型样本数据,利用模型样本数据训练错误检测模型;
通过对所述系统错误信息进行筛选获得严重错误信息和警告错误信息;
根据所述严重错误信息和所述警告错误信息中的数据计算得出错误严重度;错误严重度的计算公式包括:
Figure FDA0002463824680000011
其中Result表示错误严重度,a表示预置的严重错误系数,b表示预置的警告错误系数,x1表示将检测到的严重错误数据排序后的第一个严重错误数据,x2表示将检测到的严重错误数据排序后的最后一个严重错误数据,x1至x2表示出现严重错误的范围内的数据,y1表示将检测到的警告错误数据排序后的第一个警告错误数据,y2则表示将检测到的警告错误数据排序后的最后一个警告错误数据,y1至y2表示出现警告错误的范围内的数据,x表示严重错误的数量,y表示警告错误的数量;
根据所述错误严重程度判断是否根据所述系统错误信息中的错误类型在数据库中查找与所述错误类型对应的错误修复方式;
当需要修复时,根据查找到的所述错误修复方式对所述目标系统进行修复,包括:对目标系统中数据计算错误进行重新计算,并将目标系统各种的错误数据更新为重新计算得到的正确数值。
2.根据权利要求1所述的系统错误检测方法,其特征在于,在所述根据所述严重错误信息和所述警告错误信息中的数据计算得出错误严重度之后,还包括:
如果所述错误严重度大于第一容错阈值,则执行所述根据所述系统错误信息中的错误类型在数据库中查找与所述错误类型对应的修复方式,根据查找到的所述错误修复方式对所述目标系统进行修复的步骤。
3.根据权利要求1所述的系统错误检测方法,其特征在于,所述根据所述严重错误信息和所述警告错误信息中的数据计算得出错误严重度之后,还包括:
如果错误严重度小于第一容错阈值且大于第二容错阈值,根据所述系统错误信息中的错误类型在数据库中查找与所述错误类型对应的错误验证方式,根据所述错误验证方式向所述目标系统发送错误验证请求获取数据,并对所述数据进行验证;
若验证通过,则执行所述根据所述系统错误信息中的错误类型在数据库中查找与所述错误类型对应的修复方式,根据查找到的所述错误修复方式对所述目标系统进行修复的步骤。
4.根据权利要求1所述的系统错误检测方法,其特征在于,还包括:
如果所述严重程度小于第二容错阈值,则表示所述目标系统中不存在错误,确定所述目标系统运行正常。
5.根据权利要求1所述的系统错误检测方法,其特征在于,所述系统错误检测方法还包括:
根据所述系统错误信息中的错误类型在数据库中查找错误原因;
根据所述系统错误信息和所述错误原因生成错误报告;
将所述错误报告发送至预设联系人所登录的终端。
6.一种系统错误检测装置,其特征在于,包括:
请求模块,用于根据预置的初始条件确定错误检测请求的参数和检测频率,根据检测频率定期向目标系统发送错误检测请求;接收所述目标系统根据所述错误检测请求返回的与所述参数对应的数据;
数据处理模块,用于通过预先训练获得的错误检测模型对所述目标系统返回的数据进行检测得到系统错误信息;所述错误检测模型的训练步骤包括:获取目标系统的所有数据,在目标系统的所有数据中筛选错误检测指标;根据筛选出来的错误检测指标随机选取一部分数据作为模型样本数据,利用模型样本数据训练错误检测模型;
所述数据处理模块还用于通过对所述系统错误信息进行筛选得到严重错误信息和警告错误信息;根据所述严重错误信息和所述警告错误信息中的数据计算得出错误严重度;错误严重度的计算公式包括:
Figure FDA0002463824680000031
其中Result表示错误严重度,a表示预置的严重错误系数,b表示预置的警告错误系数,x1表示将检测到的严重错误数据排序后的第一个严重错误数据,x2表示将检测到的严重错误数据排序后的最后一个严重错误数据,x1至x2表示出现严重错误的范围内的数据,y1表示将检测到的警告错误数据排序后的第一个警告错误数据,y2则表示将检测到的警告错误数据排序后的最后一个警告错误数据,y1至y2表示出现警告错误的范围内的数据,x表示严重错误的数量,y表示警告错误的数量;
错误检测模块,用于根据所述错误严重程度判断是否根据所述系统错误信息中的错误类型在数据库中查找与所述错误类型对应的错误修复方式,当需要修复时,根据查找到的所述错误修复方式对所述目标系统进行修复,包括:对目标系统中数据计算错误进行重新计算,并将目标系统各种的错误数据更新为重新计算得到的正确数值。
7.根据权利要求6所述的系统错误检测装置,其特征在于,所述错误检测模块还用于如果所述错误严重度大于第一容错阈值,则根据所述系统错误信息中的错误类型在数据库中查找与所述错误类型对应的修复方式,根据查找到的所述错误修复方式对所述目标系统进行修复。
8.根据权利要求6所述的系统错误检测装置,其特征在于,所述错误检测模块还用于如果错误严重度小于第一容错阈值且大于第二容错阈值,根据所述系统错误信息中的错误类型在数据库中查找与所述错误类型对应的错误验证方式,根据所述错误验证方式向所述目标系统发送错误验证请求获取数据,并对所述数据进行验证;若验证通过,根据所述系统错误信息中的错误类型在数据库中查找与所述错误类型对应的修复方式,根据查找到的所述错误修复方式修复对所述目标系统进行修复。
9.根据权利要求6所述的系统错误检测装置,其特征在于,所述错误检测模块还用于如果所述严重程度小于第二容错阈值,则表示所述目标系统中不存在错误,确定所述目标系统运行正常。
10.根据权利要求6所述的系统错误检测装置,其特征在于,所述系统错误检测装置还包括:
错误报告模块,用于根据所述系统错误信息中的错误类型在数据库中查找错误原因;根据所述系统错误信息和所述错误原因生成错误报告;将所述错误报告发送至预设联系人所登录的终端。
CN201510776452.3A 2015-11-12 2015-11-12 系统错误检测方法和装置 Active CN106708638B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510776452.3A CN106708638B (zh) 2015-11-12 2015-11-12 系统错误检测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510776452.3A CN106708638B (zh) 2015-11-12 2015-11-12 系统错误检测方法和装置

Publications (2)

Publication Number Publication Date
CN106708638A CN106708638A (zh) 2017-05-24
CN106708638B true CN106708638B (zh) 2020-08-25

Family

ID=58931435

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510776452.3A Active CN106708638B (zh) 2015-11-12 2015-11-12 系统错误检测方法和装置

Country Status (1)

Country Link
CN (1) CN106708638B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111858113B (zh) * 2019-04-30 2024-03-12 北京达佳互联信息技术有限公司 应用程序的修复方法、装置、业务系统及存储介质
CN110489314B (zh) * 2019-07-05 2022-07-12 中国平安人寿保险股份有限公司 模型异常检测方法、装置、计算机设备和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102710458A (zh) * 2012-05-08 2012-10-03 华为技术有限公司 测试过程的监控方法、测试管理服务器和测试服务器
CN104572999A (zh) * 2015-01-07 2015-04-29 北京数码大方科技股份有限公司 基于异构数据的错误数据的检测方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4012498B2 (ja) * 2003-11-18 2007-11-21 株式会社日立製作所 情報処理システム、情報処理装置、情報処理装置の制御方法及びプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102710458A (zh) * 2012-05-08 2012-10-03 华为技术有限公司 测试过程的监控方法、测试管理服务器和测试服务器
CN104572999A (zh) * 2015-01-07 2015-04-29 北京数码大方科技股份有限公司 基于异构数据的错误数据的检测方法和装置

Also Published As

Publication number Publication date
CN106708638A (zh) 2017-05-24

Similar Documents

Publication Publication Date Title
US20150346066A1 (en) Asset Condition Monitoring
EP2141595B1 (en) System and method for detecting combinations of performance indicators associated with a root cause
CN110178121B (zh) 一种数据库的检测方法及其终端
WO2018232936A1 (zh) 一种共享设备故障报修方法及装置
CN106844170B (zh) 一种故障处理、分析故障的影响面方法和设备
CN112363920A (zh) 测试用例的修复方法、装置、计算机设备和存储介质
CN112492567B (zh) 一种应急指挥通信中的故障分析和解决方法及装置
CN111191400B (zh) 基于用户报障数据的车辆零部件寿命预测方法及系统
CN111722058A (zh) 基于知识图谱的电力信息系统故障检测方法、装置及介质
CN106708638B (zh) 系统错误检测方法和装置
CN110874691A (zh) 一种总装下线控制方法及系统
CN110324207B (zh) 一种数据采集终端的检测方法及装置
CN115129810A (zh) 基于设备故障检测的寿命评估系统
CN109815124B (zh) 基于mbse的联锁功能缺陷分析的方法及装置、联锁系统
CN114691521A (zh) 一种基于人工智能的软件测试平台
CN111124809B (zh) 一种服务器传感器系统的测试方法及装置
CN108024090B (zh) 一种用于视频监控平台的异常定位方法及装置
KR101834247B1 (ko) 전장용 소프트웨어 안전성 분석 방법 및 장치
CN113010394A (zh) 一种用于数据中心的机房故障检测方法
CN111309584B (zh) 数据处理方法、装置、电子设备及存储介质
CN111413952A (zh) 机器人故障检测方法、装置、电子设备及可读存储介质
CN112787883B (zh) 一种设备nat故障检测方法、装置及设备
CN110689144B (zh) 一种智能回收装置的管理方法及装置
CN116633664B (zh) 一种用于网络安全监测的评估系统
CN112733524A (zh) 标准编号自动校正及标准状态批量核查方法、系统、装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant