CN111385157A - 一种服务器异常检测方法及装置 - Google Patents
一种服务器异常检测方法及装置 Download PDFInfo
- Publication number
- CN111385157A CN111385157A CN201811612978.8A CN201811612978A CN111385157A CN 111385157 A CN111385157 A CN 111385157A CN 201811612978 A CN201811612978 A CN 201811612978A CN 111385157 A CN111385157 A CN 111385157A
- Authority
- CN
- China
- Prior art keywords
- response
- test
- service
- server
- error
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0805—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
- H04L43/0817—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0654—Management of faults, events, alarms or notifications using network fault recovery
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/10—Active monitoring, e.g. heartbeat, ping or trace-route
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Environmental & Geological Engineering (AREA)
- Health & Medical Sciences (AREA)
- Cardiology (AREA)
- General Health & Medical Sciences (AREA)
- Debugging And Monitoring (AREA)
- Computer And Data Communications (AREA)
Abstract
本发明公开了一种服务器异常检测方法及装置。所公开的方法包括:自动向源站服务器和缓存节点发送相同的服务请求和/或测试请求;接收来自源站服务器的第一服务响应和/或测试响应和来自缓存节点的第二服务响应和/或测试响应;确定第一服务响应和/或测试响应和第二服务响应和/或测试响应是否是一致正确响应。所公开的技术方案能够自动发现源站服务器和缓存节点针对相同用户请求的响应可能会存在的不正确、不一致的异常问题,减少了人工处理成本。
Description
技术领域
本发明涉及计算机网络技术领域,尤其涉及一种服务器异常检测方法及装置。
背景技术
随着用户对网络访问速度、质量、或安全性等的更高要求,出现了专门提供CDN、VPN等网络接入服务的网络代理服务提供商,这些网络代理服务提供商为客户网站提供网络中转或代理服务,以提高用户访问客户网站的速度、质量或安全性等,增强用户体验。
以现有技术的CDN网络服务为例,作为中间或代理服务商,CDN服务提供商在执行服务上线测试时,主要是针对自建的CDN缓存节点进行功能和安全策略防护测试。
然而,CDN服务提供商自建的缓存节点通常无法完整复制客户源站(即,后端网站)的所有特征,只能做到在普遍认知上的优化。而且,用户前端浏览器、页面或APP界面的形式多样,后端服务器框架的种类繁多。因此,源站和缓存节点针对相同用户请求的响应可能会存在不正确、不一致的问题。CDN服务提供商需要解决这种问题。此时,如果直接使用(例如,对应于典型的浏览器和后端服务器平台的)通用框架来检测客户源站的服务响应和/或测试响应,而不进行与自建的CDN缓存节点之间的一致性检测的话,这种检测与客户自己上线前针对自建的源站的服务检测没有区别,没有任何意义。
另外,有些客户源站可能不支持带空格的请求(例如,用户通过页面发送的、包含用于表示内蒙古的字符串“Nei Monggol”的URL请求),客户源站会直接针对该类请求响应HTTP状态码400。严重时甚至会出现连客户自己也不清楚具体原因的各种异常问题。虽然这种问题属于客户的设计缺陷,然而,CDN服务提供商通常也需要对此类格式问题进行检测和预处理(例如,提前去除空格),从而实现为客户防护住不正确请求、转化特殊请求等目的。
然而,CDN服务提供商所使用的现有网站服务检测工具都不具备上述功能,而且,通用检测框架也不会去注意这样的业务性功能特征。即,现有技术缺少具有针对后端客户网站服务的同步能力,以及快速分析、解决上述问题的能力的系统工具。
因此,需要提出新的技术方案来解决上述问题。
发明内容
根据本发明的服务器异常检测方法,包括:
自动向源站服务器和缓存节点发送相同的服务请求和/或测试请求;
接收来自源站服务器的第一服务响应和/或测试响应和来自缓存节点的第二服务响应和/或测试响应;
确定第一服务响应和/或测试响应和第二服务响应和/或测试响应是否是一致正确响应。
根据本发明的服务器异常检测方法,还包括:
当确定第一服务响应和/或测试响应和第二服务响应和/或测试响应之间存在差异时,确定第一服务响应和/或测试响应和第二服务响应和/或测试响应中的正确响应,根据差异自动修复源站服务器或缓存节点中导致错误响应的处理步骤,
其中,导致错误响应的处理步骤包括下列中的至少一项:请求数据的格式处理步骤、响应数据的格式处理步骤、导致HTTP异常状态码的处理步骤。
根据本发明的服务器异常检测方法,还包括:
预先采集和存储错误响应实例、以及错误响应实例所对应的具体修复方法;
基于错误响应实例、以及错误响应实例所对应的具体修复方法,自动修复源站服务器或缓存节点中导致错误响应的处理步骤;和/或
当确定存在无法自动修复的错误响应时,发送通知,以通知技术人员进行人工修复。
根据本发明的服务器异常检测方法,还包括:
基于自定义的异常调试插件来确定第一服务响应和/或测试响应和第二服务响应和/或测试响应之间存在差异,和/或确定第一服务响应和/或测试响应和第二服务响应和/或测试响应中的正确响应,和/或根据差异自动修复源站服务器或缓存节点中导致错误响应的处理步骤。
根据本发明的服务器异常检测方法,其预先采集和存储错误响应实例、以及错误响应实例所对应的具体修复方法的步骤包括:
在HTTP异常状态码增多时触发HTTP异常状态码监控和采集操作,提取数量超过第一阈值的HTTP异常状态码,作为错误响应实例进行存储;
将人工修复错误响应实例的具体修复方法作为错误响应实例所对应的具体修复方法进行存储,
其中,HTTP异常状态码包括下列中的至少一种:除了以5开头的状态码、404、416之外的所有HTTP异常状态码,HTTP异常状态码包括下列类别中的至少一种:网络连接问题导致的异常、单一故障导致的异常、多个故障导致的异常。
根据本发明的服务器异常检测装置,包括:
自动测试模块,用于自动向源站服务器和缓存节点发送相同的服务请求和/或测试请求,接收来自源站服务器的第一服务响应和/或测试响应和来自缓存节点的第二服务响应和/或测试响应,确定第一服务响应和/或测试响应和第二服务响应和/或测试响应是否是一致正确响应。
根据本发明的服务器异常检测装置,还包括:
自动修复模块,用于当确定第一服务响应和/或测试响应和第二服务响应和/或测试响应之间存在差异时,确定第一服务响应和/或测试响应和第二服务响应和/或测试响应中的正确响应,根据差异自动修复源站服务器或缓存节点中导致错误响应的处理步骤,
其中,导致错误响应的处理步骤包括下列中的至少一项:请求数据的格式处理步骤、响应数据的格式处理步骤、导致HTTP异常状态码的处理步骤。
根据本发明的服务器异常检测装置,还包括:
采集模块,用于预先采集和存储错误响应实例、以及错误响应实例所对应的具体修复方法,
其中,自动修复模块还用于,基于错误响应实例、以及错误响应实例所对应的具体修复方法,自动修复源站服务器或缓存节点中导致错误响应的处理步骤;和/或
通知模块,用于当确定存在无法自动修复的错误响应时,发送通知,以通知技术人员进行人工修复。
根据本发明的服务器异常检测装置,其自动修复模块还用于:
基于自定义的异常调试插件来确定第一服务响应和/或测试响应和第二服务响应和/或测试响应之间存在差异,和/或确定第一服务响应和/或测试响应和第二服务响应和/或测试响应中的正确响应,和/或根据差异自动修复源站服务器或缓存节点中导致错误响应的处理步骤。
根据本发明的服务器异常检测装置,其采集模块还用于:
在HTTP异常状态码增多时触发HTTP异常状态码监控和采集操作,提取数量超过第一阈值的HTTP异常状态码,作为错误响应实例进行存储;
将人工修复错误响应实例的具体修复方法作为错误响应实例所对应的具体修复方法进行存储,
其中,HTTP异常状态码包括下列中的至少一种:除了以5开头的状态码、404、416之外的所有HTTP异常状态码,HTTP异常状态码包括下列类别中的至少一种:网络连接问题导致的异常、单一故障导致的异常、多个故障导致的异常。
根据本发明的上述技术方案,能够自动发现源站服务器和缓存节点针对相同用户请求的响应可能会存在的不正确、不一致的异常问题,减少了人工处理成本。
附图说明
并入到说明书中并且构成说明书的一部分的附图示出了本发明的实施例,并且与相关的文字描述一起用于解释本发明的原理。在这些附图中,类似的附图标记用于表示类似的要素。下面描述中的附图是本发明的一些实施例,而不是全部实施例。对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,可以根据这些附图获得其他的附图。
图1示例性地示出了根据本发明的服务器异常检测方法的示意流程图。
图2示例性地示出了根据本发明的服务器异常检测装置的示意框图。
图3示例性地示出了根据本发明的服务器异常检测方法的一个具体实施例的示意流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
图1示例性地示出了根据本发明的服务器异常检测方法的示意流程图。
如图1的实线框所示,根据本发明的服务器异常检测方法,包括:
步骤S102:自动向源站服务器和缓存节点发送相同的服务请求和/或测试请求;
步骤S104:接收来自源站服务器的第一服务响应和/或测试响应和来自缓存节点的第二服务响应和/或测试响应;
步骤S106:确定第一服务响应和/或测试响应和第二服务响应和/或测试响应是否是一致正确响应。
例如,所需要进行一致性和正确性响应检测的源站服务器和缓存节点所对应的域名可以预先指定。
例如,所需要进行一致性和正确性响应检测的第一服务响应和/或测试响应和/或第二服务响应和/或测试响应所对应的状态码可以预先指定。
可选地,如图1的虚线框所示,根据本发明的服务器异常检测方法,还包括:
步骤S108:当确定第一服务响应和/或测试响应和第二服务响应和/或测试响应之间存在差异时,确定第一服务响应和/或测试响应和第二服务响应和/或测试响应中的正确响应,根据差异自动修复源站服务器或缓存节点中导致错误响应的处理步骤,
其中,导致错误响应的处理步骤包括下列中的至少一项:请求数据的格式处理步骤、响应数据的格式处理步骤、导致HTTP异常状态码的处理步骤。
例如,上述步骤S102至步骤S108可以在客户源站服务器接入CDN服务提供商的CDN网络时执行。其中,步骤S102至步骤S106用于对比当前中间服务(提供)商(例如,CDN服务商)中转后的内容跟源站服务器直接支持的差别。
例如,可以将上述服务请求和/或测试请求和/或对应的服务响应和/或测试响应制作成模板(以供上述步骤S102自动调用),上述服务请求和/或测试请求可以是根据HTTP协议和业务经验总结成的经验案例(即,测试样例)。
例如,两个具体的经验案例如下:
1、当客户的post请求上传的form表单不完整时,服务器会默认等待客户端发完完整请求超时后会直接响应HTTP状态码400。这个测试样例就可以是故意设置包含不完整的form数据的URL请求(例如,可以用{user:dev;aim:test作为异常测试例,该异常测试例表示格式异常的表单数据提交方式,即缺少了右花括号},造成了格式错误)。正常中间服务提供商针对该异常测试例会响应状态码400,但是也有客户本身不支持post会响应与期望响应的状态码400不同的异常状态码200。
2、在HTTP协议中,其实并没有对URL长度做出限制,往往URL的最大长度和用户浏览器和Web服务器有关,不一样的浏览器,能接受的最大长度往往是不一样的,当然,不一样的Web服务器能够处理的最大长度的URL的能力也是不一样的。该测试样例的本质是,构造超过中间服务提供商和/或源站服务器默认承受的最大长度的URL作为服务请求和/或测试请求,来测试中间服务提供商和/或源站服务器。
例如,对应于上述步骤S102至步骤S108,可以执行以下具体操作:
1、按照已知经验归结的模板对客户服务器(即,客户源站服务器)与中间服务商进行测试(对应于上述步骤S102和步骤S104)。
例如,上述测试具体包括:客户源站服务器规则(例如,上述表单数据提交格式规则、URL长度规则等)探测、代理(即,中间服务商)域名规则探测。
2、两边响应结果对比,将响应结果、对比结果反馈客户(对应于上述步骤S106)。
3、按照实际需求修改,协商代理服务器(即,缓存节点)是否需要同步源站服务器策略,在问题发生之前做好预防(对应于上述步骤S108)。
可选地,如图1的虚线框所示,根据本发明的服务器异常检测方法,还包括:
步骤S110:预先采集和存储错误响应实例(该错误响应实例可以包括服务请求和/或测试请求和对应的服务响应和/或测试响应)、以及错误响应实例所对应的具体修复方法;
步骤S112:基于错误响应实例、以及错误响应实例所对应的具体修复方法,自动修复源站服务器或缓存节点中导致错误响应的处理步骤;和/或
步骤S114:当确定存在无法自动修复的错误响应时,发送通知,以通知技术人员进行人工修复。
可选地,如图1的虚线框所示,根据本发明的服务器异常检测方法,还包括:
步骤S116:基于自定义的异常调试插件来确定第一服务响应和/或测试响应和第二服务响应和/或测试响应之间存在差异,和/或确定第一服务响应和/或测试响应和第二服务响应和/或测试响应中的正确响应,和/或根据差异自动修复源站服务器或缓存节点中导致错误响应的处理步骤。
可选地,上述步骤S110包括:
在HTTP异常状态码增多时触发HTTP异常状态码监控和采集操作,提取数量超过第一阈值的HTTP异常状态码,作为错误响应实例进行存储;
将人工修复错误响应实例的具体修复方法作为错误响应实例所对应的具体修复方法进行存储,
其中,HTTP异常状态码包括下列中的至少一种:除了以5开头的状态码、404、416之外的所有HTTP异常状态码,HTTP异常状态码包括下列类别中的至少一种:网络连接问题导致的异常、单一故障导致的异常、多个故障导致的异常。
图2示例性地示出了根据本发明的服务器异常检测装置200的示意框图。
如图2的实线框所示,根据本发明的服务器异常检测装置200包括:
自动测试模块201,用于自动向源站服务器和缓存节点发送相同的服务请求和/或测试请求,接收来自源站服务器的第一服务响应和/或测试响应和来自缓存节点的第二服务响应和/或测试响应,确定第一服务响应和/或测试响应和第二服务响应和/或测试响应是否是一致正确响应。
可选地,如图2的虚线框所示,服务器异常检测装置200还包括:
自动修复模块203,用于当确定第一服务响应和/或测试响应和第二服务响应和/或测试响应之间存在差异时,确定第一服务响应和/或测试响应和第二服务响应和/或测试响应中的正确响应,根据差异自动修复源站服务器或缓存节点中导致错误响应的处理步骤,
其中,导致错误响应的处理步骤包括下列中的至少一项:请求数据的格式处理步骤、响应数据的格式处理步骤、导致HTTP异常状态码的处理步骤。
可选地,如图2的虚线框所示,服务器异常检测装置200还包括:
采集模块205,用于预先采集和存储错误响应实例、以及错误响应实例所对应的具体修复方法,
其中,自动修复模块203还用于,基于错误响应实例、以及错误响应实例所对应的具体修复方法,自动修复源站服务器或缓存节点中导致错误响应的处理步骤;和/或
自动反馈模块207,用于当确定存在无法自动修复的错误响应时,发送通知,以通知技术人员进行人工修复。
可选地,自动修复模块203还用于:
基于自定义的异常调试插件来确定第一服务响应和/或测试响应和第二服务响应和/或测试响应之间存在差异,和/或确定第一服务响应和/或测试响应和第二服务响应和/或测试响应中的正确响应,和/或根据差异自动修复源站服务器或缓存节点中导致错误响应的处理步骤。
可选地,采集模块205还用于:
在HTTP异常状态码增多时触发HTTP异常状态码监控和采集操作,提取数量超过第一阈值的HTTP异常状态码,作为错误响应实例进行存储;
将人工修复错误响应实例的具体修复方法作为错误响应实例所对应的具体修复方法进行存储,
其中,HTTP异常状态码包括下列中的至少一种:除了以5开头的状态码、404、416之外的所有HTTP异常状态码,HTTP异常状态码包括下列类别中的至少一种:网络连接问题导致的异常、单一故障导致的异常、多个故障导致的异常。
为了使本领域技术人员更清楚地理解根据本发明的上述技术方案,下面将结合具体实施例进行描述。
图3示例性地示出了根据本发明的服务器异常检测方法的一个具体实施例的示意流程图。
如图3中的宽箭头所示,该实施例包括以下四个处理过程(即,四个逻辑部分):自发现、自收集、自修复、自反馈。
一、自发现过程可以包括以下步骤:
1、异常状态码增多触发监控,将异常状态码取出分类(排除异常状态码5XX——即,上述以5开头的状态码、404、416等网络连接问题或是异常原因单一)。
2、将域名,筛选后的异常状态码,错误机器推向中心系统。中心机记录此次异常问题。
3、中心对错误机器下发异常调试任务,开启错误机器的异常调试功能。
自发现过程中的上述步骤1和步骤2对应于,结合图1所描述的、上述在HTTP异常状态码增多时触发HTTP异常状态码监控和采集操作,提取数量超过第一阈值的HTTP异常状态码,作为错误响应实例进行存储的步骤。自发现过程中的上述步骤3对应于,启动上述步骤S102至步骤S106(步骤S102中隐含了自发现过程中的上述步骤2中的域名信息)的执行。
二、自收集过程可以包括以下步骤:
1、(例如,可以通过自定义的监听插件来)同步在服务器(例如,CDN服务提供商的缓存节点服务器或其他服务器)上将针对该域名请求的相关数据信息(URL、header(session,cookie)、form)全部保存。
2、根据最后响应出去的状态码收集匹配的请求URL(例如,可以通过request_id等唯一标识匹配前后的请求,同时保存响应头部作为跟客户反馈时的依据)。
3、数据回传中心(例如,CDN服务提供商的缓存节点服务器或其他服务器),中心将请求中的数据进行特征提取,查找出特征值最明显的请求。即,如果是首次提取到,则作为上述错误响应实例进行存储;如果是非首次提取到,则匹配已存储的错误响应实例,为继续执行上述步骤S112,进行自动修复做准备。
自收集过程中的上述步骤1至步骤3对应于上述步骤S110、以及上述步骤S112中的错误响应实例匹配操作。
三、自修复过程(对应于上述步骤S112)可以包括以下步骤:
1、用特征值在经验模型库(即,上述采集模块205,采集模块205可以包括上述自定义的监听插件)中匹配相似问题,判断能否复用模型库的解决办法。用模型库中的解决办法修复后再测试,判断问题是否解决,能解决则流程结束。
2、判断请求状态是客户原网站(即,源站服务器)给出还是中间服务商(即,CDN服务商)的缓存节点拦截。
1)如果是客户源服务器给出则进入其他代理服务商测试逻辑。
2)如果是代理服务商给出,则将请求发送会源站服务器查看结果,
①如果源站服务器正常将告知中心以后全部放过该类请求,并对全网下发策略,进入反馈流程。
②如果源站服务器同样响应异常则进入其他代理服务器测试逻辑。
3、在其他代理服务提供商同样创建该域名,并发送同样请求查看是否异常。
1)如果正常,将告知中心以后将全部转发该类请求到友商代理服务器上。并对全网下发策略,进入反馈流程。
2)如果不能解决将快速进入反馈流程,由人员最后处理。
四、自反馈过程(对应于上述步骤S114)可以包括以下步骤:
1、能够通过将该请求转向源站服务器或者其他中间服务提供商暂时解决的,将形成报告邮件提交人工处理。针对该域名修改策略,同时更新模型规则,修复规则。
2、不能间接解决将直接告警相关人员,并反馈收集数据,缩短问题定位,问题场景复现时间。
根据本发明目的上述技术方案具有以下优点:
1、能够自动发现、解决、反馈源站服务器和缓存节点针对相同用户请求的响应可能会存在的不正确、不一致的上述异常问题,以及诸如格式处理问题等客户源站服务器存在的异常问题,能够执行流水化操作,减少了人工处理成本,降低了因为服务不对等产生的价值损失。即,能够智能发现所出现的上述异常问题,无须人工处理,快速识别异常状态。
2、能够直接解决中间代理服务商与客户需求之间的矛盾,适用于CDN服务提供商等中间服务提供商的日常服务。
3、适配各种服务架构的客户网站,当客户网站存在各式各样异常时,能够通过同步操作在客户源站服务器接入时提早发现异常问题。
4、能够主动收集涉及上述异常问题的异常历史数据(例如,异常状态码、引发异常的可疑请求等)和历史修复方法。即,能够(例如,通过调用异常监听插件)快速收集与指定异常(例如,异常状态码)相关的数据,找出异常状态码、引发异常的可疑请求,避免了在服务器庞大流量下进行抓包分析花费漫长时间的问题。
5、能够基于上述异常历史数据,自动地快速识别上述(自定义的)异常问题,无需系统监控和人工确认,节省了时间。
6、能够基于历史修复方法自动修复所识别出的异常问题,避免了长时间等待人工解决异常问题,最大程度地确保了中间服务提供商能够提供正常的代理服务。即,能够模拟可疑请求进行网站实测,寻找能够快速解决问题的方法,对于客户来说做到平滑无感知处理。
上面描述的内容可以单独地或者以各种方式组合起来实施,而这些变型方式都在本发明的保护范围之内。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器,如数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制。尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例的技术方案的精神和范围。
Claims (10)
1.一种服务器异常检测方法,其特征在于,包括:
自动向源站服务器和缓存节点发送相同的服务请求和/或测试请求;
接收来自源站服务器的第一服务响应和/或测试响应和来自缓存节点的第二服务响应和/或测试响应;
确定所述第一服务响应和/或测试响应和所述第二服务响应和/或测试响应是否是一致正确响应。
2.如权利要求1所述的服务器异常检测方法,其特征在于,还包括:
当确定所述第一服务响应和/或测试响应和所述第二服务响应和/或测试响应之间存在差异时,确定所述第一服务响应和/或测试响应和所述第二服务响应和/或测试响应中的正确响应,根据所述差异自动修复所述源站服务器或所述缓存节点中导致错误响应的处理步骤,
其中,所述导致错误响应的处理步骤包括下列中的至少一项:请求数据的格式处理步骤、响应数据的格式处理步骤、导致HTTP异常状态码的处理步骤。
3.如权利要求2所述的服务器异常检测方法,其特征在于,还包括:
预先采集和存储错误响应实例、以及错误响应实例所对应的具体修复方法;
基于所述错误响应实例、以及错误响应实例所对应的具体修复方法,自动修复所述源站服务器或所述缓存节点中导致错误响应的处理步骤;和/或
当确定存在无法自动修复的错误响应时,发送通知,以通知技术人员进行人工修复。
4.如权利要求2所述的服务器异常检测方法,其特征在于,还包括:
基于自定义的异常调试插件来确定所述第一服务响应和/或测试响应和所述第二服务响应和/或测试响应之间存在差异,和/或确定所述第一服务响应和/或测试响应和所述第二服务响应和/或测试响应中的正确响应,和/或根据所述差异自动修复所述源站服务器或所述缓存节点中导致错误响应的处理步骤。
5.如权利要求3所述的服务器异常检测方法,其特征在于,所述预先采集和存储错误响应实例、以及错误响应实例所对应的具体修复方法的步骤包括:
在HTTP异常状态码增多时触发HTTP异常状态码监控和采集操作,提取数量超过第一阈值的HTTP异常状态码,作为所述错误响应实例进行存储;
将人工修复所述错误响应实例的具体修复方法作为错误响应实例所对应的具体修复方法进行存储,
其中,HTTP异常状态码包括下列中的至少一种:除了以5开头的状态码、404、416之外的所有HTTP异常状态码,HTTP异常状态码包括下列类别中的至少一种:网络连接问题导致的异常、单一故障导致的异常、多个故障导致的异常。
6.一种服务器异常检测装置,其特征在于,包括:
自动测试模块,用于自动向源站服务器和缓存节点发送相同的服务请求和/或测试请求,接收来自源站服务器的第一服务响应和/或测试响应和来自缓存节点的第二服务响应和/或测试响应,确定所述第一服务响应和/或测试响应和所述第二服务响应和/或测试响应是否是一致正确响应。
7.如权利要求6所述的服务器异常检测装置,其特征在于,还包括:
自动修复模块,用于当确定所述第一服务响应和/或测试响应和所述第二服务响应和/或测试响应之间存在差异时,确定所述第一服务响应和/或测试响应和所述第二服务响应和/或测试响应中的正确响应,根据所述差异自动修复所述源站服务器或所述缓存节点中导致错误响应的处理步骤,
其中,所述导致错误响应的处理步骤包括下列中的至少一项:请求数据的格式处理步骤、响应数据的格式处理步骤、导致HTTP异常状态码的处理步骤。
8.如权利要求7所述的服务器异常检测装置,其特征在于,还包括:
采集模块,用于预先采集和存储错误响应实例、以及错误响应实例所对应的具体修复方法,
其中,所述自动修复模块还用于,基于所述错误响应实例、以及错误响应实例所对应的具体修复方法,自动修复所述源站服务器或所述缓存节点中导致错误响应的处理步骤;和/或
通知模块,用于当确定存在无法自动修复的错误响应时,发送通知,以通知技术人员进行人工修复。
9.如权利要求7所述的服务器异常检测装置,其特征在于,所述自动修复模块还用于:
基于自定义的异常调试插件来确定所述第一服务响应和/或测试响应和所述第二服务响应和/或测试响应之间存在差异,和/或确定所述第一服务响应和/或测试响应和所述第二服务响应和/或测试响应中的正确响应,和/或根据所述差异自动修复所述源站服务器或所述缓存节点中导致错误响应的处理步骤。
10.如权利要求8所述的服务器异常检测装置,其特征在于,所述采集模块还用于:
在HTTP异常状态码增多时触发HTTP异常状态码监控和采集操作,提取数量超过第一阈值的HTTP异常状态码,作为所述错误响应实例进行存储;
将人工修复所述错误响应实例的具体修复方法作为错误响应实例所对应的具体修复方法进行存储,
其中,HTTP异常状态码包括下列中的至少一种:除了以5开头的状态码、404、416之外的所有HTTP异常状态码,HTTP异常状态码包括下列类别中的至少一种:网络连接问题导致的异常、单一故障导致的异常、多个故障导致的异常。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811612978.8A CN111385157B (zh) | 2018-12-27 | 2018-12-27 | 一种服务器异常检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811612978.8A CN111385157B (zh) | 2018-12-27 | 2018-12-27 | 一种服务器异常检测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111385157A true CN111385157A (zh) | 2020-07-07 |
CN111385157B CN111385157B (zh) | 2022-06-03 |
Family
ID=71217986
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811612978.8A Active CN111385157B (zh) | 2018-12-27 | 2018-12-27 | 一种服务器异常检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111385157B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113452689A (zh) * | 2021-06-24 | 2021-09-28 | 北京丁牛科技有限公司 | 一种攻击模拟方法、系统、存储介质和电子设备 |
US20230179494A1 (en) * | 2020-05-20 | 2023-06-08 | Nec Corporation | Analysis apparatus, analysis method, and program |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101645930A (zh) * | 2009-08-25 | 2010-02-10 | 中兴通讯股份有限公司 | 一种动态内容分发业务中同步失败的处理方法及系统 |
CN102932466A (zh) * | 2012-11-07 | 2013-02-13 | 网宿科技股份有限公司 | 基于内容分发网络的分布式源监控方法和系统 |
CN103379139A (zh) * | 2012-04-17 | 2013-10-30 | 百度在线网络技术(北京)有限公司 | 分布式缓存内容的校验方法、系统和装置 |
CN105959358A (zh) * | 2016-04-25 | 2016-09-21 | 乐视控股(北京)有限公司 | Cdn服务器及其缓存数据的方法 |
US20180084018A1 (en) * | 2016-09-22 | 2018-03-22 | Verizon Patent And Licensing Inc. | Hls over multimedia broadcast multicast service (mbms) |
-
2018
- 2018-12-27 CN CN201811612978.8A patent/CN111385157B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101645930A (zh) * | 2009-08-25 | 2010-02-10 | 中兴通讯股份有限公司 | 一种动态内容分发业务中同步失败的处理方法及系统 |
CN103379139A (zh) * | 2012-04-17 | 2013-10-30 | 百度在线网络技术(北京)有限公司 | 分布式缓存内容的校验方法、系统和装置 |
CN102932466A (zh) * | 2012-11-07 | 2013-02-13 | 网宿科技股份有限公司 | 基于内容分发网络的分布式源监控方法和系统 |
CN105959358A (zh) * | 2016-04-25 | 2016-09-21 | 乐视控股(北京)有限公司 | Cdn服务器及其缓存数据的方法 |
US20180084018A1 (en) * | 2016-09-22 | 2018-03-22 | Verizon Patent And Licensing Inc. | Hls over multimedia broadcast multicast service (mbms) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230179494A1 (en) * | 2020-05-20 | 2023-06-08 | Nec Corporation | Analysis apparatus, analysis method, and program |
CN113452689A (zh) * | 2021-06-24 | 2021-09-28 | 北京丁牛科技有限公司 | 一种攻击模拟方法、系统、存储介质和电子设备 |
CN113452689B (zh) * | 2021-06-24 | 2022-09-27 | 丁牛信息安全科技(江苏)有限公司 | 一种攻击模拟方法、系统、存储介质和电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN111385157B (zh) | 2022-06-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107085549B (zh) | 故障信息生成的方法和装置 | |
KR20180079395A (ko) | 알람 정보 처리 방법 및 장치, 시스템, 및 컴퓨터 저장 매체 | |
CN112231271A (zh) | 数据迁移完整性校验方法、装置、设备及计算机可读介质 | |
CN111385157B (zh) | 一种服务器异常检测方法及装置 | |
CN111130938B (zh) | 指标采集方法、装置、电子设备及计算机可读存储介质 | |
CN112118153B (zh) | 一种基于grpc和spring mvc的链路监控方法及系统 | |
CN114363151A (zh) | 故障检测方法和装置、电子设备和存储介质 | |
CN111988170B (zh) | 一种终端故障定位方法及装置 | |
CN114143171B (zh) | 一种基于tr069协议的告警根源定位方法及系统 | |
CN111224807B (zh) | 分布式日志处理方法、装置、设备及计算机存储介质 | |
Wang et al. | Smart devices information extraction in home wi‐fi networks | |
CN113676509A (zh) | Http接口健康状态主动探测方法及系统 | |
CN111866921A (zh) | 一种5g基站业务故障查找方法、装置、设备及可存储介质 | |
CN108200586B (zh) | 用于移动网感知数据关联的方法和系统 | |
CN108880920B (zh) | 云服务管理方法、装置以及电子设备 | |
CN112312209B (zh) | 综合告警生成方法、装置、服务器、存储介质 | |
CN113965447B (zh) | 一种在线云诊断方法、装置、系统、设备及存储介质 | |
CN110896545B (zh) | 在线计费漫游故障定位方法及相关装置、存储介质 | |
CN112463572B (zh) | 一种跨境多服务拨测的软件测试系统及其方法 | |
CN107864057B (zh) | 一种基于联网状态的联机自动检查及告警方法 | |
CN107968720B (zh) | 一种信息传输方法及云系统、组件 | |
CN113141366B (zh) | 报文报送方法及装置、存储介质和电子设备 | |
CN113938377B (zh) | 专网终端故障诊断方法、装置及设备 | |
CN106936938A (zh) | 域名解析方法及系统 | |
CN117255005B (zh) | 一种基于cdn的业务告警处理方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |