CN106850272A - 中央服务器、业务服务器及其异常检测方法和系统 - Google Patents

中央服务器、业务服务器及其异常检测方法和系统 Download PDF

Info

Publication number
CN106850272A
CN106850272A CN201611269802.8A CN201611269802A CN106850272A CN 106850272 A CN106850272 A CN 106850272A CN 201611269802 A CN201611269802 A CN 201611269802A CN 106850272 A CN106850272 A CN 106850272A
Authority
CN
China
Prior art keywords
service server
information
cluster
service
system features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611269802.8A
Other languages
English (en)
Other versions
CN106850272B (zh
Inventor
张景逸
康凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Supreme Being Joins Information Technology Share Co Ltd
Original Assignee
Shanghai Supreme Being Joins Information Technology Share Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Supreme Being Joins Information Technology Share Co Ltd filed Critical Shanghai Supreme Being Joins Information Technology Share Co Ltd
Priority to CN201611269802.8A priority Critical patent/CN106850272B/zh
Publication of CN106850272A publication Critical patent/CN106850272A/zh
Application granted granted Critical
Publication of CN106850272B publication Critical patent/CN106850272B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • H04L67/1044Group management mechanisms 

Abstract

一种中央服务器、业务服务器及其异常检测方法和系统,所述方法包括:提取自身的系统特征信息并发送至预设的中央服务器,以使得所述中央服务器对集群中的业务服务器的系统特征信息进行汇总得到总系统特征信息;接收所述中央服务器发送的所述总系统特征信息;基于接收所述中央服务器发送的所述总系统特征信息中其他业务服务器的系统特征信息与自身的系统特征信息,计算得到对应的检测返回值;将计算得到的检测返回值发送至所述中央服务器,以使得所述中央服务器根据所有业务服务器发送的距离返回值确定存在异常的业务服务器的信息。上述的方案,可以在对集群中的业务服务器进行异常检测时节省成本,并提高效率。

Description

中央服务器、业务服务器及其异常检测方法和系统
技术领域
本发明属于服务器技术领域,特别是涉及一种中央服务器、业务服务器及其异常检测方法和系统。
背景技术
大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,需要经过处理模式的处理才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
集群一般由数量庞大的业务服务器组成,集群中的大数据的分析处理,如通过对集群中各业务服务器的系统特征信息的分析处理,一般通过大数据平台进行,以得到集群中业务服务器的运行异常检测结果。
但是,现有的集群中业务服务器的运行异常检测方法,存在着成本高且效率低下的问题。
发明内容
本发明实施例解决的问题是如何在对集群中的业务服务器进行异常检测时节省成本,并提高效率。
为解决上述问题,本发明实施例提供了一种业务服务器异常检测方法,所述方法包括:提取自身的系统特征信息并发送至预设的中央服务器,以使得所述中央服务器对集群中的业务服务器的系统特征信息进行汇总得到总系统特征信息;接收所述中央服务器发送的所述总系统特征信息;基于接收所述中央服务器发送的所述总系统特征信息中其他业务服务器的系统特征信息与自身的系统特征信息,计算得到对应的检测返回值;将计算得到的检测返回值发送至所述中央服务器,以使得所述中央服务器根据所有业务服务器发送的距离返回值确定存在异常的业务服务器的信息。
可选地,所述基于接收所述中央服务器发送的所述总系统特征信息中其他业务服务器的系统特征信息与自身的系统特征信息,计算对应的检测返回值,包括:。基于所述总系统特征信息中其他业务服务器的系统特征信息与自身的系统特征信息,计算自身所属的聚簇;基于自身所属的聚簇,计算自身的系统特征系统与所属聚簇中其他业务服务器的系统特征信息之间的距离;基于计算得到的自身的系统特征系统与所属聚簇中其他业务服务器的系统特征信息之间的距离,计算得到对应的检测返回值。
可选地,所述系统特征信息包括系统日志、应用日志、进程、流量、CPU用量和内存用量。
本发明实施例还提供了另一种业务服务器异常检测方法,包括:接收集群中各业务服务器发送的系统特征信息;将所接收的集群中各业务服务器的系统特征信息进行汇总,得到所述集群的总系统特征信息;将所得到的总系统特征信息分别发送至所述集群中的业务服务器,以使所述集群中的业务服务器基于接收的所述总系统特征信息中其他业务服务器的系统特征信息与自身的系统特征信息,计算对应的检测返回值;基于所接收到的集群中的各业务服务器发送的检测返回值,确定存在异常的业务服务器的信息。
可选地,所述基于所接收到的集群中的各业务服务器发送的检测返回值,确定存在异常的业务服务器的信息,包括:将集群中的各业务服务器发送的检测返回值按照递减的排序进行排序,并将排列在头部的预设数量的检测返回值对应的业务服务器作为存在异常的业务服务器。
可选地,所述方法还包括:基于所确定的存在异常的业务服务器的信息,生成对应的告警信息并输出。
可选地,所述系统特征信息包括系统日志、应用日志、进程、流量、CPU用量和内存用量。
本发明实施例还提供了一种业务服务器,包括:提取单元,适于提取自身的系统特征信息;第一发送单元,适于将所提取的自身的系统特征信息发送至预设的中央服务器,以使得所述中央服务器对集群中的业务服务器的系统特征信息进行汇总得到总系统特征信息;第一接收单元,适于接收所述中央服务器发送的所述总系统特征信息;计算单元,适于基于接收所述中央服务器发送的所述总系统特征信息中其他业务服务器的系统特征信息与自身的系统特征信息,计算得到对应的检测返回值;第二发送单元,适于将计算得到的检测返回值发送至所述中央服务器,以使得所述中央服务器根据所有业务服务器发送的距离返回值确定存在异常的业务服务器的信息。
可选地,所述计算单元,适于基于所述总系统特征信息中其他业务服务器的系统特征信息与自身的系统特征信息,计算自身所属的聚簇;基于自身所属的聚簇,计算自身的系统特征系统与所属聚簇中其他业务服务器的系统特征信息之间的距离;基于计算得到的自身的系统特征系统与所属聚簇中其他业务服务器的系统特征信息之间的距离,计算得到对应的检测返回值。
可选地,所述系统特征信息包括系统日志、应用日志、进程、流量、CPU用量和内存用量。
本发明实施例还提供了一种中央服务器,包括:第二接收单元,适于接收集群中各业务服务器发送的系统特征信息;汇总单元,适于将所接收的集群中各业务服务器的系统特征信息进行汇总,得到所述集群的总系统特征信息;第三发送单元,适于将所得到的总系统特征信息分别发送至所述集群中的业务服务器,以使所述集群中的业务服务器基于接收的所述总系统特征信息中其他业务服务器的系统特征信息与自身的系统特征信息,计算对应的检测返回值;确定单元,适于基于所接收到的集群中的各业务服务器发送的检测返回值,确定存在异常的业务服务器的信息。
可选地,所述确定单元,适于将集群中的各业务服务器发送的检测返回值按照递减的排序进行排序,并将排列在头部的预设数量的检测返回值对应的业务服务器作为存在异常的业务服务器。
可选地,所述中央服务器还包括:告警单元,适于基于所确定的存在异常的业务服务器的信息,生成对应的告警信息并输出。
可选地,所述系统特征信息包括系统日志、应用日志、进程、流量、CPU用量和内存用量。
本发明实施例还提供了一种业务服务器异常检测系统,包括多个上述的业务服务器和上述的中央服务器。
与现有技术相比,本发明的技术方案具有以下的优点:
上述的方案,通过集群中的各业务服务器将自身的系统特征信息发送至预设的中央服务器,所述中央服务器对集群中所有业务服务器的系统特征信息进行将汇总得到集群总特征信息并发送至集群中的各业务服务器,再由集群中的各业务服务器基于所接收的总系统特征信息与自身的系统特征信息,计算得到自身的异常检测结果,由于无需搭建专门的数据分析平台便可以对集群中的业务服务器进行异常检测,因而可以节省成本,并可以提高效率。
附图说明
图1是本发明实施例中一种的业务服务器异常检测方法的流程图;
图2是本发明实施例中另一种的业务服务器异常检测方法的流程图;
图3是本发明实施例中的一种业务服务器异常检测系统的结构示意图;
图4是本发明实施例中的一种业务服务器异常检测方法对应的信令流程图;
图5是本发明实施例中的业务服务器的结构示意图;
图6是本发明实施例中的中央服务器的结构示意图。
具体实施方式
正如背景技术所言,现有的集群中业务服务器的运行异常检测方法,一般通过搭建专门的数据处理平台或者通过专门设置的一台服务器对集群中的所有业务服务器的系统特征信息进行提取和分析,以得到集群中各业务服务器的运行异常检测结果。
但是,采用上述的方式,一方面,搭建专门的数据处理平台,需要消耗大量的资源,存在成本高的问题;另一方面,采用单台服务器对集群中数量庞大的业务服务器的系统特征信息进行分析处理,存在着效率低下的问题。
为解决上述问题,本发明实施例中的技术方案通过集群中的各业务服务器将自身的系统特征信息发送至预设的中央服务器,所述中央服务器对集群中所有业务服务器的系统特征信息进行将汇总得到集群总特征信息并发送至集群中的各业务服务器,再由集群中的各业务服务器基于所接收的总系统特征信息与自身的系统特征信息,计算得到自身的异常检测结果,可以节省成本,并可以提高效率。
为使本发明的上述目的、特征和优点能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
图1是本发明实施例中的一种业务服务器异常检测方法的流程图。如图1所示的业务服务器异常检测方法,可以包括:
步骤S101:提取自身的系统特征信息并发送至预设的中央服务器。
在具体实施中,集群中的业务服务器可以分别提取自身的系统特征信息并发送至预设的中央服务器,从而可以使得所述中央服务器可以获取集群中所有业务服务器的系统特征信息并进行汇总,以得到对应的总系统特征信息。
在具体实施中,业务服务器所提取的自身的系统特征信息可以业务服务器的异常检测的需要进行设置,如包括系统日志、应用日志、进程、流量、CPU用量以及内存用量的信息等。
步骤S102:接收所述中央服务器发送的所述总系统特征信息。
在具体实施中,所述中央服务器在接收到集群中的所有业务服务器发送的集群总特征信息时,可以将所接收的集群中的所有业务服务器的总系统特征信息进行汇总,并分别发送至集群中的各业务服务器,以使得集群中的各业务服务器可以获取所述总系统特征信息。
步骤S103:基于接收所述中央服务器发送的所述总系统特征信息中其他业务服务器的系统特征信息与自身的系统特征信息,计算得到对应的检测返回值。
在具体实施中,业务服务器在接收到中央服务器发送的集群总特征信息时,便可以基于所接收的总系统特征信息以及自身的系统特征信息,计算得到对应的检测返回值并发送至中央服务器,使得中央服务器可以获取对应的检测返回值。
步骤S104:将计算得到的检测返回值发送至所述中央服务器,以使得所述中央服务器根据所有业务服务器发送的距离返回值确定存在异常的业务服务器的信息。
在具体实施中,各业务服务器在计算得到对应的检测返回值时,可以将对应的检测返回值发送至中央服务器,以使得中央服务器可以基于各业务服务器基于各业务服务器的检测返回值确定集群中存在异常的业务服务器的信息。
图2示出了本发明实施例中的另一种业务服务器异常检测方法的流程图。参见图2,本发明实施例中的业务服务器异常检测方法,可以具体采用如下的操作实现:
步骤S201:接收集群中各业务服务器发送的系统特征信息。
在具体实施中,在进行集群中的业务服务器的异常检测时,可以首先接收集群中的各业务服务器发送的系统特征信息。
步骤S202:将所接收的集群中各业务服务器的系统特征信息进行汇总,得到所述集群的总系统特征信息。
在具体实施中,中央服务器在接收到各业务服务器发送的各自的系统特征信息时,可以将所接收的集群中的所有业务服务器的系统特征信息进行汇总,从而得到集群的总系统特征信息。例如,中央服务器可以生成对应的列表,在所述列表中包括集群中的各个业务服务器的标识以及该业务服务器的系统特征信息。其中,各个业务服务器的标识可以为IP地址等。
步骤S203:将所得到的总系统特征信息分别发送至所述集群中的业务服务器。
在具体实施中,中央服务器在汇总得到对应的总系统特征信息时,可以将所述总系统特征信息分别发送至集群中的各个业务服务器,以使所述集群中的业务服务器可以基于所接收的总系统特征信息与自身的系统特征信息,计算得到自身对应的检测返回值并发送。
步骤S204:基于所接收到的集群中的各业务服务器发送的检测返回值,确定存在异常的业务服务器的信息。
在具体实施中,中央服务器可以基于集群中各个业务服务器发送的检测返回值的信息,确定集群中存在异常的业务服务器的信息。
上述的方案,通过集群中的各业务服务器将自身的系统特征信息发送至预设的中央服务器,以使得所述中央服务器对集群中所有业务服务器的系统特征信息进行将汇总得到集群总特征信息并发送至集群中的各业务服务器,再由集群中的各业务服务器基于所接收的总系统特征信息与自身的系统特征信息,计算得到自身的异常检测结果,由于无需搭建专门的数据分析平台便可以是集群中业务服务器的异常检测,因而可以节省成本,并可以提高效率。
下面将对本发明实施例中的业务服务器异常检测方法进行详细的介绍。
为了便于理解,下面首先对本发明实施例中的业务服务器异常检测系统的结构进行介绍。
参见图3,本发明实施例中的一种业务服务器异常检测系统可以包括由多个业务服务器3011~301n组成的集群和中央服务器302。其中,集群中的业务服务器3011~301n分别与中央服务器302连接。
参见图4,本发明实施例中的一种业务服务器异常检测方法,用于对集群中的所有的业务服务器的运行异常状态进行检测,具体可以采用如下的操作实现:
步骤S401:集群中的业务服务器提取自身的系统特征信息并发送至中央服务器。
在具体实施中,在进行业务服务器异常检测时,可以首先设定相应的检测周期,当达到对应的检测周期时,可以启动业务服务器的异常检测。此时,确定达到对应的检测周期时,集群中的各业务服务器可以分别按照对应的系统特征信息的设置,从自身的系统中提取对应的系统特征信息,作为自身的系统特征信息并发送至中央服务器。其中,所设置的检测周期可以根据需要,如客户的需求进行设置等。
步骤S402:所述中央服务器接收业务服务器的总系统特征信息并进行汇总得到对应的总系统特征信息。
步骤S403:所述中央服务器将所述总系统特征信息发送至集群中的各个业务服务器。
在具体实施中,中央服务器在接收到集群中的所有业务服务器发送的集群总特征信息时,可以将所接收的集群中的所有业务服务器的总系统特征信息进行汇总,并分别发送至集群中的各业务服务器,以使得集群中的各业务服务器可以获取所述总系统特征信息。
步骤S404:所述业务服务器接收所述总系统特征信息。
在具体实施中,集群中的各个业务服务器所接收的系统总特征信息中不仅包括集群中其他业务服务器的系统特征信息,还包括自身的系统总特征信息。
步骤S405:各个业务服务器基于所接收到的系统总特征信息与自身的系统特征信息,确定自身所属的聚簇,并计算自身的系统特征信息与所属聚簇中其他业务服务器的系统特征信息之间的距离。
在具体实施中,集群中的各个业务服务器在接收到所述总系统特征信息时,采用相应的聚类算法确定自身所属的聚簇,也即是确定与自身属于同一聚簇中的其他业务服务器的信息。
当确定自身所属聚簇中的其他业务服务器的信息时,各个业务服务器可以采用自身的系统特征信息和聚簇中其他业务服务器的系统特征信息以及自身的系统特征信息,计算自身的系统特征信息与聚簇中其他业务服务器的系统特征信息之间的距离。
步骤S406:所述业务服务器基于计算自身的系统特征信息与所属聚簇中其他业务服务器的系统特征信息之间的距离,计算得到对应的检测返回值。
在具体实施中,当计算得到自身的系统特征信息与所属聚簇中其他业务服务器的系统特征信息之间的距离时,各个业务服务器可以采用计算得到自身的系统特征信息与所属聚簇中其他业务服务器的系统特征信息之间的距离,计算得到对应的检测返回值。
在具体实施中,各个业务服务器可以采用计算得到的自身的系统特征信息与所属聚簇中其他业务服务器的系统特征信息之间的距离,计算得到对应的检测返回值的方法可以根据实际的需要进行选取。例如,可以将计算得到的自身的系统特征信息与所属聚簇中其他业务服务器的系统特征信息之间的距离进行相加,得到对应的检测返回值等。
步骤S407:所述业务服务器将计算得到的对应的检测返回值发送至中央服务器。
在具体实施中,当计算得到对应的检测返回值时,集群中的各个业务服务器可以将对应的检测返回值发送至中央服务器。
步骤S408:所述中央服务器接收集群中各业务服务器发送的检测返回值的信息。
在具体实施中,中央服务器所接收的检测返回值与集群中的各个业务服务器一一对应。
步骤S409:所述中央服务器基于所接收的集群中各业务服务器的检测返回值确定存在异常的业务服务器的信息。
在具体实施中,当接收到集群中各业务服务器的检测返回值时,中央服务器可以基于集群中各业务服务器的检测返回值确定存在异常的业务服务器。其中,系统特征信息与聚簇中其他业务服务器的系统特征信息之间的距离越大时,也即聚簇中的离群点对应的检测返回值也较大。因此,可以将集群中各业务服务器的检测返回值进行排序,并将数值较大的预设数量的检测返回值对应的业务服务器,作为存在异常的业务服务器。
步骤S410:基于确定存在异常的业务服务器的信息,生成对应的告警信息并输出。
在具体实施中,中央服务器在确定集群中存在异常的离群点的信息时,便可以生成对应的告警信息并输出,从而可以使得用户获取存在异常的业务服务器的信息,以便客户可以采取相应的措施消除业务服务器的运行异常,从而可以提高集群的运行可靠性。
采用上述的方案对集群中业务服务器进行异常检测,可以显著提高异常检测的速度。以集群中包括20000台业务服务器为例,采用本发明实施例中异常检测方法时,最消耗计算资源的地方在于聚簇算法中需要计算每个业务服务器与其他业务服务器之间的距离。其中,当计算一台业务服务器与19999台其他业务服务器之间的距离分别需要0.4秒时,采用现有技术中的方法,需要消耗的时间为:0.4*20000=2.2小时。但是,采用本发明实施例中的服务器异常检测方法,每台业务服务器仅消耗0.4秒上传对应的检测返回值,中央服务器仅需做一个20000个数值的检测返回值的排序即可得到对应的异常检测结果,因而可以提高业务服务器的异常检测速度。
上述对本发明实施例中的业务服务器异常检测方法进行了详细的描述,下面将对上述的方法对应的装置进行介绍。
图5示出了本发明实施例中的一种业务服务器的结构。参见图5,本发明实施例中的一种业务服务器500可以包括提取单元501、第一发送单元502、第一接收单元503、计算单元504和第二发送单元505,其中:
提取单元501,适于提取自身的系统特征信息。
第一发送单元502,适于将所提取的自身的系统特征信息发送至预设的中央服务器,以使得所述中央服务器对集群中的业务服务器的系统特征信息进行汇总得到总系统特征信息。
第一接收单元503,适于接收所述中央服务器发送的所述总系统特征信息。
计算单元504,适于基于接收所述中央服务器发送的所述总系统特征信息中其他业务服务器的系统特征信息与自身的系统特征信息,计算得到对应的检测返回值。
第二发送单元505,适于将计算得到的检测返回值发送至所述中央服务器,以使得所述中央服务器根据所有业务服务器发送的距离返回值确定存在异常的业务服务器的信息。
在本发明一实施例中,所述计算单元504,适于基于所述总系统特征信息中其他业务服务器的系统特征信息与自身的系统特征信息,计算自身所属的聚簇;基于自身所属的聚簇,计算自身的系统特征系统与所属聚簇中其他业务服务器的系统特征信息之间的距离;基于计算得到的自身的系统特征系统与所属聚簇中其他业务服务器的系统特征信息之间的距离,计算得到对应的检测返回值。
在具体实施中,所述系统特征信息可以包括系统日志、应用日志、进程、流量、CPU用量和内存用量。
图6示出了本发明实施例中的一种中央服务器的结构。参见图6,一种中央服务器600可以包括第二接收单元601、汇总单元602、第三发送单元603和确定单元604,其中:
第二接收单元601,适于接收集群中各业务服务器发送的系统特征信息。
汇总单元602,适于将所接收的集群中各业务服务器的系统特征信息进行汇总,得到所述集群的总系统特征信息。
第三发送单元603,适于将所得到的总系统特征信息分别发送至所述集群中的业务服务器,以使所述集群中的业务服务器基于接收的所述总系统特征信息中其他业务服务器的系统特征信息与自身的系统特征信息,计算对应的检测返回值。
确定单元604,适于基于所接收到的集群中的各业务服务器发送的检测返回值,确定存在异常的业务服务器的信息。
在具体实施中,所述确定单元,适于将集群中的各业务服务器发送的检测返回值按照递减的排序进行排序,并将排列在头部的预设数量的检测返回值对应的业务服务器作为存在异常的业务服务器。
在本发明一实施例中,为了使得用户可以及时地获知业务服务器的异常信息,所述中央服务器600还可以包括告警单元605,其中:
告警单元605,适于基于所确定的存在异常的业务服务器的信息,生成对应的告警信息并输出。
在具体实施中,所述系统特征信息包括系统日志、应用日志、进程、流量、CPU用量和内存用量。
采用本发明实施例中的上述方案,通过集群中的各业务服务器将自身的系统特征信息发送至预设的中央服务器,以使得所述中央服务器对集群中所有业务服务器的系统特征信息进行将汇总得到集群总特征信息并发送至集群中的各业务服务器,再由集群中的各业务服务器基于所接收的总系统特征信息与自身的系统特征信息,计算得到自身的异常检测结果,由于无需搭建专门的数据分析平台便可以是集群中业务服务器的异常检测,因而可以节省成本,并可以提高效率。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
以上对本发明实施例的方法及系统做了详细的介绍,本发明并不限于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。

Claims (15)

1.一种业务服务器异常检测方法,其特征在于,包括:
提取自身的系统特征信息并发送至预设的中央服务器,以使得所述中央服务器对集群中的业务服务器的系统特征信息进行汇总得到总系统特征信息;
接收所述中央服务器发送的所述总系统特征信息;
基于接收所述中央服务器发送的所述总系统特征信息中其他业务服务器的系统特征信息与自身的系统特征信息,计算得到对应的检测返回值;
将计算得到的检测返回值发送至所述中央服务器,以使得所述中央服务器根据所有业务服务器发送的距离返回值确定存在异常的业务服务器的信息。
2.根据权利要求1所述的业务服务器异常检测方法,其特征在于,所述基于接收所述中央服务器发送的所述总系统特征信息中其他业务服务器的系统特征信息与自身的系统特征信息,计算对应的检测返回值,包括:
基于所述总系统特征信息中其他业务服务器的系统特征信息与自身的系统特征信息,计算自身所属的聚簇;
基于自身所属的聚簇,计算自身的系统特征系统与所属聚簇中其他业务服务器的系统特征信息之间的距离;
基于计算得到的自身的系统特征系统与所属聚簇中其他业务服务器的系统特征信息之间的距离,计算得到对应的检测返回值。
3.根据权利要求1所述的业务服务器异常检测方法,其特征在于,所述系统特征信息包括系统日志、应用日志、进程、流量、CPU用量和内存用量。
4.一种业务服务器异常检测方法,其特征在于,包括:
接收集群中各业务服务器发送的系统特征信息;
将所接收的集群中各业务服务器的系统特征信息进行汇总,得到所述集群的总系统特征信息;
将所得到的总系统特征信息分别发送至所述集群中的业务服务器,以使所述集群中的业务服务器基于接收的所述总系统特征信息中其他业务服务器的系统特征信息与自身的系统特征信息,计算对应的检测返回值;
基于所接收到的集群中的各业务服务器发送的检测返回值,确定存在异常的业务服务器的信息。
5.根据权利要求4所述的业务服务器异常检测方法,其特征在于,所述基于所接收到的集群中的各业务服务器发送的检测返回值,确定存在异常的业务服务器的信息,包括:
将集群中的各业务服务器发送的检测返回值按照递减的排序进行排序,并将排列在头部的预设数量的检测返回值对应的业务服务器作为存在异常的业务服务器。
6.根据权利要求5所述的业务服务器异常检测方法,其特征在于,还包括:基于所确定的存在异常的业务服务器的信息,生成对应的告警信息并输出。
7.根据权利要求5所述的业务服务器异常检测方法,其特征在于,所述系统特征信息包括系统日志、应用日志、进程、流量、CPU用量和内存用量。
8.一种业务服务器,其特征在于,包括:
提取单元,适于提取自身的系统特征信息;
第一发送单元,适于将所提取的自身的系统特征信息发送至预设的中央服务器,以使得所述中央服务器对集群中的业务服务器的系统特征信息进行汇总得到总系统特征信息;
第一接收单元,适于接收所述中央服务器发送的所述总系统特征信息;
计算单元,适于基于接收所述中央服务器发送的所述总系统特征信息中其他业务服务器的系统特征信息与自身的系统特征信息,计算得到对应的检测返回值;
第二发送单元,适于将计算得到的检测返回值发送至所述中央服务器,以使得所述中央服务器根据所有业务服务器发送的距离返回值确定存在异常的业务服务器的信息。
9.根据权利要求8所述的业务服务器,其特征在于,所述计算单元,适于基于所述总系统特征信息中其他业务服务器的系统特征信息与自身的系统特征信息,计算自身所属的聚簇;基于自身所属的聚簇,计算自身的系统特征系统与所属聚簇中其他业务服务器的系统特征信息之间的距离;基于计算得到的自身的系统特征系统与所属聚簇中其他业务服务器的系统特征信息之间的距离,计算得到对应的检测返回值。
10.根据权利要求8所述的业务服务器,其特征在于,所述系统特征信息包括系统日志、应用日志、进程、流量、CPU用量和内存用量。
11.一种中央服务器,其特征在于,包括:
第二接收单元,适于接收集群中各业务服务器发送的系统特征信息;
汇总单元,适于将所接收的集群中各业务服务器的系统特征信息进行汇总,得到所述集群的总系统特征信息;
第三发送单元,适于将所得到的总系统特征信息分别发送至所述集群中的业务服务器,以使所述集群中的业务服务器基于接收的所述总系统特征信息中其他业务服务器的系统特征信息与自身的系统特征信息,计算对应的检测返回值;
确定单元,适于基于所接收到的集群中的各业务服务器发送的检测返回值,确定存在异常的业务服务器的信息。
12.根据权利要求11所述的中央服务器,其特征在于,所述确定单元,适于将集群中的各业务服务器发送的检测返回值按照递减的排序进行排序,并将排列在头部的预设数量的检测返回值对应的业务服务器作为存在异常的业务服务器。
13.根据权利要求12所述的中央服务器,其特征在于,还包括:告警单元,适于基于所确定的存在异常的业务服务器的信息,生成对应的告警信息并输出。
14.根据权利要求12所述的中央服务器,其特征在于,所述系统特征信息包括系统日志、应用日志、进程、流量、CPU用量和内存用量。
15.一种业务服务器异常检测系统,其特征在于,包括多个权利要求8-10任一项所述的业务服务器和权利要求11-14任一项所述的中央服务器。
CN201611269802.8A 2016-12-30 2016-12-30 中央服务器、业务服务器及其异常检测方法和系统 Active CN106850272B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611269802.8A CN106850272B (zh) 2016-12-30 2016-12-30 中央服务器、业务服务器及其异常检测方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611269802.8A CN106850272B (zh) 2016-12-30 2016-12-30 中央服务器、业务服务器及其异常检测方法和系统

Publications (2)

Publication Number Publication Date
CN106850272A true CN106850272A (zh) 2017-06-13
CN106850272B CN106850272B (zh) 2019-10-22

Family

ID=59118578

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611269802.8A Active CN106850272B (zh) 2016-12-30 2016-12-30 中央服务器、业务服务器及其异常检测方法和系统

Country Status (1)

Country Link
CN (1) CN106850272B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107786544A (zh) * 2017-09-29 2018-03-09 贵州白山云科技有限公司 一种消息的任务状态处理方法及系统
CN108337232A (zh) * 2017-12-26 2018-07-27 努比亚技术有限公司 网络异常检测方法、网络安全设备及计算机可读存储介质
CN113377627A (zh) * 2021-06-10 2021-09-10 广州朗国电子科技有限公司 一种业务服务器异常检测方法、系统、设备、存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101505243A (zh) * 2009-03-10 2009-08-12 中国科学院软件研究所 一种Web应用性能异常侦测方法
CN102325036A (zh) * 2011-05-17 2012-01-18 中兴通讯股份有限公司 一种网络系统的故障诊断方法、系统及装置
CN103428035A (zh) * 2013-08-26 2013-12-04 福建省视通光电网络有限公司 一种基于tcp/ip协议的大型网络通信系统与方法
CN103580903A (zh) * 2012-08-02 2014-02-12 人人游戏网络科技发展(上海)有限公司 识别服务器系统中的热点和可能故障的方法、设备和系统
CN104579823A (zh) * 2014-12-12 2015-04-29 国家电网公司 一种基于大数据流的网络流量异常检测系统及方法
CN105306252A (zh) * 2015-09-19 2016-02-03 北京暴风科技股份有限公司 一种自动判别服务器故障的方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101505243A (zh) * 2009-03-10 2009-08-12 中国科学院软件研究所 一种Web应用性能异常侦测方法
CN102325036A (zh) * 2011-05-17 2012-01-18 中兴通讯股份有限公司 一种网络系统的故障诊断方法、系统及装置
CN103580903A (zh) * 2012-08-02 2014-02-12 人人游戏网络科技发展(上海)有限公司 识别服务器系统中的热点和可能故障的方法、设备和系统
CN103428035A (zh) * 2013-08-26 2013-12-04 福建省视通光电网络有限公司 一种基于tcp/ip协议的大型网络通信系统与方法
CN104579823A (zh) * 2014-12-12 2015-04-29 国家电网公司 一种基于大数据流的网络流量异常检测系统及方法
CN105306252A (zh) * 2015-09-19 2016-02-03 北京暴风科技股份有限公司 一种自动判别服务器故障的方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107786544A (zh) * 2017-09-29 2018-03-09 贵州白山云科技有限公司 一种消息的任务状态处理方法及系统
CN108337232A (zh) * 2017-12-26 2018-07-27 努比亚技术有限公司 网络异常检测方法、网络安全设备及计算机可读存储介质
CN113377627A (zh) * 2021-06-10 2021-09-10 广州朗国电子科技有限公司 一种业务服务器异常检测方法、系统、设备、存储介质
CN113377627B (zh) * 2021-06-10 2023-12-05 广州朗国电子科技股份有限公司 一种业务服务器异常检测方法、系统、设备、存储介质

Also Published As

Publication number Publication date
CN106850272B (zh) 2019-10-22

Similar Documents

Publication Publication Date Title
AU2010246208B2 (en) System and method for power utility usage, monitoring and management
US8661283B2 (en) Power distribution unit-device correlation
US8819018B2 (en) Virtual sub-metering using combined classifiers
CN108809745A (zh) 一种用户异常行为检测方法、装置及系统
CN104040963A (zh) 用于使用字符串的频谱进行垃圾邮件检测的系统和方法
CN107493277A (zh) 基于最大信息系数的大数据平台在线异常检测方法
CN110351251B (zh) 一种基于过滤技术的工控设备资产探测方法
CN106850272A (zh) 中央服务器、业务服务器及其异常检测方法和系统
JP2011015253A (ja) 通信トラヒック分類方法、装置、およびプログラム
CN107257351A (zh) 一种基于灰色lof流量异常检测系统及其检测方法
CN106646169A (zh) 一种电气设备局部放电检测数据收集云策略
Song et al. Real-time anomaly traffic monitoring based on dynamic k-NN cumulative-distance abnormal detection algorithm
JP2021022759A (ja) ネットワーク分析プログラム、ネットワーク分析装置及びネットワーク分析方法
JP6440810B1 (ja) データ収集システム、制御装置、制御プログラム、ゲートウェイ装置およびゲートウェイプログラム
JP2007243459A (ja) トラヒック状態抽出装置及び方法ならびにコンピュータプログラム
CN116866012A (zh) 电力设施管理平台的网络风险监测方法及系统
CN110738415A (zh) 基于用电采集系统和离群点算法的窃电用户分析方法
CN113098912B (zh) 用户账户异常的识别方法、装置、电子设备及存储介质
CN106789265A (zh) 一种服务集群的聚类方法及装置
CN106161339B (zh) 获取ip访问关系的方法及装置
CN109560978A (zh) 网络流量检测方法、装置及系统和计算机可读存储介质
CN113727348A (zh) 用户设备ue用户数据的检测方法、设备及存储介质
CN103701821B (zh) 文件类型识别方法及装置
CN109388512A (zh) 针对大规模计算机集群异常程度的评估与分析系统
CN105163181B (zh) 一种在线视频节目分类方法及其装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant