CN107864063A - 一种异常监控方法、装置及电子设备 - Google Patents

一种异常监控方法、装置及电子设备 Download PDF

Info

Publication number
CN107864063A
CN107864063A CN201711318750.3A CN201711318750A CN107864063A CN 107864063 A CN107864063 A CN 107864063A CN 201711318750 A CN201711318750 A CN 201711318750A CN 107864063 A CN107864063 A CN 107864063A
Authority
CN
China
Prior art keywords
client
connection
information
link information
abnormal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711318750.3A
Other languages
English (en)
Other versions
CN107864063B (zh
Inventor
冯浩
孙琦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201711318750.3A priority Critical patent/CN107864063B/zh
Publication of CN107864063A publication Critical patent/CN107864063A/zh
Application granted granted Critical
Publication of CN107864063B publication Critical patent/CN107864063B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring

Abstract

本发明实施例提供了一种异常监控方法、装置及电子设备,其中,该方法包括:实时接收各个客户端分别与服务器的连接信息,其中,任一客户端的连接信息包括该客户端与服务器当前时刻的连接数;分别根据各个客户端对应的当前时刻的连接数与已保存的上一时刻的连接数的变化情况,监控各个客户端是否异常;针对每个客户端,在监控到该客户端异常时,向该客户端发送报警信息。通过本发明实施例提供的异常监控方法、装置及电子设备,能够提高对异常监控的精准度。

Description

一种异常监控方法、装置及电子设备
技术领域
本发明涉及通信技术领域,特别是涉及一种异常监控方法、装置及电子设备。
背景技术
C-S(Client/Server,客户端/服务器)架构是网络通信中一种重要的架构。C-S架构中,对服务器来说,与多个客户端连接,而服务器与多个客户端连接,使得网络通信环境复杂。为了及时发现网络通信过程中的异常,需要对网络通信过程中的异常进行监控。
一般情况下,对于具体业务应用中的C-S架构,服务器与客户端的总连接数在阈值范围内变化,如果总连接数发生突变,则认为服务器与客户端的连接发生异常,其中,总连接数表示各个客户端分别与服务器连接的所有连接数的总和。现有的异常监控方法中,服务器针对与客户端的连接的总连接数,根据该总连接数变化的异常,对网络的异常进行监控。
然而,发明人在实现本发明的过程中发现,现有技术至少存在如下问题:
根据总连接数变化的异常,对网络的异常进行监控,使得仅能从总连接数的角度监控服务器与所有客户端的连接信息是否异常,对异常的监控精准度较低。
发明内容
本发明实施例的目的在于提供一种异常监控方法、装置及电子设备,以提高对异常监控的精准度。具体技术方案如下:
第一方面,本发明实施例提供了一种异常监控方法,包括:
实时接收各个客户端分别与服务器的连接信息,其中,任一客户端的连接信息包括该客户端与服务器当前时刻的连接数;
分别根据各个客户端对应的当前时刻的连接数与已保存的上一时刻的连接数的变化情况,监控各个客户端是否异常;
针对每个客户端,在监控到该客户端异常时,向该客户端发送报警信息。
可选的,在所述实时接收各个客户端分别与服务器的连接信息之后,所述方法还包括:
分别将所述各个客户端对应的所述连接信息保存至数据库中。
可选的,所述分别将所述各个客户端对应的所述连接信息保存至数据库中,包括:
针对每个客户端,对接收到的预设时长内不同时刻该客户端对应的所述连接信息进行数据压缩,得到连接信息数据;
将所述各个客户端对应的所述连接信息数据保存至数据库中。
可选的,在所述实时接收各个客户端分别与服务器的连接信息之后,还包括:
通过配置管理数据库CMDB,将不同客户端的所述连接信息进行关联,得到聚合集群的关联连接信息,其中,所述聚合集群包括按照业务类型的不同,聚合得到的多个客户端的集群;
根据所述聚合集群中所述关联连接信息的变化是否异常,监控所述聚合集群是否异常。
可选的,所述监控所述聚合集群是否异常之后,所述方法还包括:
在监控到所述聚合集群异常之后,向所述聚合集群中的各客户端发送报警信息。
可选的,在向该客户端发送报警信息之前,还包括:
接收该客户端发送的异常查询请求;或者,
按照预设周期触发报警查询请求。
可选的,所述连接信息还包括连接状态;
所述针对每个客户端,对接收到的预设时长内不同时刻该客户端对应的所述连接信息进行数据压缩,包括:
根据预设格式确定该客户端对应的编码信息,所述编码信息包括客户端连接状态标识、时间点、连接数和连接数重复次数计数值;
依次将接收到的该客户端对应的当前连接信息,与前一个连接信息进行比较,在所述当前连接信息中连接状态、与该客户端对应的编码信息中客户端连接状态标识表示的连接状态相同时,判断所述当前连接信息中的连接数,与该客户端对应的编码信息中的连接数之间差值的绝对值是否小于预设阈值;
如果是,将编码信息中的连接数重复次数计数值加1;
如果否,根据所述当前连接信息,将编码信息进行更新,将更新后的编码信息作为该客户端对应的编码信息。
第二方面,本发明实施例提供了一种异常监控装置,包括:
接收模块,用于实时接收各个客户端分别与服务器的连接信息,其中,任一客户端的连接信息包括该客户端与服务器当前时刻的连接数;
第一监控模块,用于分别根据各个客户端对应的当前时刻的连接数与已保存的上一时刻的连接数的变化情况,监控各个客户端是否异常;
第一报警模块,用于针对每个客户端,在监控到该客户端异常时,向该客户端发送报警信息。
可选的,所述装置还包括:
保存模块,用于分别将所述各个客户端对应的所述连接信息保存至数据库中。
可选的,所述保存模块包括:
压缩子模块,用于针对每个客户端,对接收到的预设时长内不同时刻该客户端对应的所述连接信息进行数据压缩,得到连接信息数据;
保存子模块,用于将所述各个客户端对应的所述连接信息数据保存至数据库中。
可选的,所述装置还包括:
关联模块,用于通过配置管理数据库CMDB,将不同客户端的所述连接信息进行关联,得到聚合集群的关联连接信息,其中,所述聚合集群包括按照业务类型的不同,聚合得到的多个客户端的集群;
第二监控模块,用于根据所述聚合集群中所述关联连接信息的变化是否异常,监控所述聚合集群是否异常。
可选的,所述装置还包括:
第二报警模块,用于在监控到所述聚合集群异常之后,向所述聚合集群中的各客户端发送报警信息。
可选的,所述装置还包括:
接收请求模块,用于接收该客户端发送的异常查询请求;或者,
触发模块,用于按照预设周期触发报警查询请求。
可选的,所述连接信息还包括连接状态;
所述压缩子模块,包括:
确定单元,用于根据预设格式确定该客户端对应的编码信息,所述编码信息包括客户端连接状态标识、时间点、连接数和连接数重复次数计数值;
比较单元,用于依次将接收到的该客户端对应的当前连接信息,与前一个连接信息进行比较;
判断单元,用于在所述当前连接信息中连接状态、与该客户端对应的编码信息中客户端连接状态标识表示的连接状态相同时,判断所述当前连接信息中的连接数,与该客户端对应的编码信息中的连接数之间差值的绝对值是否小于预设阈值;
增加单元,用于如果所述判断单元判断结果为是,将编码信息中的连接数重复次数计数值加1;
更新单元,用于如果所述判断单元判断结果为否,根据所述当前连接信息,将编码信息进行更新,将更新后的编码信息作为该客户端对应的编码信息。
第三方面,本发明实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现第一方面所述的方法步骤。
在本发明实施的又一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述第一方面所述的异常监控方法的方法步骤。
在本发明实施的又一方面,本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第一方面所述的异常监控方法的方法步骤。
本发明实施例提供的异常监控方法、装置及电子设备,可以实时接收各个客户端分别与服务器的连接信息,其中,任一客户端的连接信息包括该客户端与服务器当前时刻的连接数;分别根据各个客户端对应的当前时刻的连接数与已保存的上一时刻的连接数的变化情况,监控各个客户端是否异常;针对每个客户端,在监控到该客户端异常时,向该客户端发送报警信息。如此使得,可以从客户端角度监控异常,即可以在发生异常时,精准地定位到发生异常的客户端,能够提高异常监控的精准度。当然,实施本发明的任一产品或方法必不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例提供的异常监控方法的流程图;
图2为本发明实施例提供的具体实施例的流程图;
图3为本发明实施例提供的异常监控装置的结构示意图;
图4为本发明实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
为了能够及时发现网络中的异常,对异常的监控就显得尤为地重要。
现有的异常监控方法中,服务器针对与客户端的连接的总连接数,根据该总连接数变化的异常,对网络的异常进行监控。可以看出,现有的异常监控方法中,仅能从总连接数的角度监控服务器与所有客户端的连接信息是否异常,即在发生异常时,无法精准地定位到具体的发生异常的客户端,也即无法对具体的客户端的异常情况进行监控。
为了提高对异常监控的精准度,本发明实施例提供了一种异常监控方法,实时接收各个客户端分别与服务器的连接信息,并将该连接信息保存至数据库中,根据各个客户端对应的该连接信息的变化情况,对各个客户端的异常进行监控,在监控到该客户端异常时,向该客户端发送报警信息,进行报警。如此使得可以对各个客户端具体的异常情况进行监控,在出现异常时,精准地定位到发生异常的客户端。
同时,实时接收各个客户端分别与服务器的连接信息,将各个客户端各个时刻对应的连接信息保存至数据库中,使得用户可以通过客户端查询历史异常情况,使得监控数据能够回溯。另外,还可以通过CMDB(Configuration Management Database,配置管理数据库),按照业务类型的不同,将多个客户端进行聚合得到聚合集群,将不同客户端的连接信息进行关联,从聚合集群的角度对异常进行监控。如此使得能够从不同维度对异常进行监控,进一步提高异常监控的精准度。
本发明实施例提供了一种异常监控方法,如图1所示,包括:
S101,实时接收各个客户端分别与服务器的连接信息,其中,任一客户端的连接信息包括该客户端与服务器当前时刻的连接数。
本发明实施例提供的异常监控方法可以应用于服务器。
具体地,可以是服务器主动接收该连接信息,例如,向客户端发送请求。或者也可以是客户端主动向客户端发送该连接信息。
其中,连接信息可以是客户端与服务器的TCP(Transmission Control Protocol,传输控制协议)连接的连接数等。
S102,分别根据各个客户端对应的当前时刻的连接数与已保存的上一时刻的连接数的变化情况,监控各个客户端是否异常。
具体地,可以在各个客户端对应的当前时刻的连接数相对于已保存的上一时刻的连接数发生突变时,确定客户端发生异常。例如,任一客户端已保存的上一时刻的连接数为50,当前时刻的连接数突变为1000,则确定该客户端在当前时刻对应的时间点发生异常;任一客户端已保存的上一时刻的连接数为1500,当前时刻的连接数突变为40,确定该客户端在当前时刻对应的时间点发生异常。
S103,针对每个客户端,在监控到该客户端异常时,向该客户端发送报警信息。
在监控到客户端异常时,向发生异常的该客户端发送报警信息。具体地,可以将具体的异常数据等发送至客户端。
可以是服务器主动报警,例如,按照预设周期触发报警查询请求,在监控到客户端异常时,向发生异常的该客户端发送报警信息。或者是,服务器在接收到客户端发送的异常查询请求后,向发生异常的给客户端发送报警信息。
本发明实施例提供的异常监控方法,可以实时接收各个客户端分别与服务器的连接信息,根据各个客户端的连接信息的变化情况,监控各个客户端是否发生异常;并针对每个客户端,在监控到该客户端异常时,向该客户端发送报警信息。如此使得,可以从客户端角度监控异常,即可以在发生异常时,精准地定位到具体的发生异常的客户端,实现细粒度异常监控,能够提高异常监控的精准度。
本发明实施例一种可选的实施方式中,可以通过查看TCP连接的工具ss(socketstatistics,套接字数据)获取各个客户端分别与服务器的连接信息。为了数据传输更加方便,可以将连接信息封装成json(JavaScript Object Notation,JavaScript对象表示法)格式。
本发明实施例一种可选的实施例中,在实时接收各个客户端分别与服务器的连接信息之后,还包括:
分别将各个客户端对应的连接信息保存至数据库中。
具体地,针对每个客户端,对接收到的预设时长内不同时刻该客户端对应的连接信息进行数据压缩,得到连接信息数据;将各个客户端对应的连接信息数据保存至数据库中。
连接信息可以是TCP连接信息。TCP连接可以有不同的连接状态,不同的客户端通过客户端对应的IP(internet protocol,网络协议)进行标识。
具体地,根据预设格式确定该客户端对应的编码信息,编码信息包括客户端连接状态标识、时间点、连接数和连接数重复次数计数值。
依次将接收到的该客户端对应的当前连接信息,与前一个连接信息进行比较,在当前连接信息中连接状态、与该客户端对应的编码信息中客户端连接状态标识表示的连接状态相同时,判断当前连接信息中的连接数,与该客户端对应的编码信息中的连接数之间差值的绝对值是否小于预设阈值;如果是,将编码信息中的连接数重复次数计数值加1;如果否,根据当前连接信息,将编码信息进行更新,将更新后的编码信息作为该客户端对应的编码信息。其中,预设阈值可以为50等数值,可以理解为连接数之间差值在正负50之间,认为两个连接数处于同一区间,是相同数值的连接数。
例如,原始数据格式:shcema:time,ip,status.count;
原始数据(连接信息)data:
{t1,10.1.1.1,time_wait,50},{t2,10.1.1.1,time_wait,90},{t3,10.1.1.1,time_wait,500},{t4,10.1.1.1,time_wait,550},{t5,10.1.1.1,time_wait,1000};
压缩后数据格式:schema:{IP_TCPStatus,{[timestamp,count,repeatcout]}};
压缩后数据:{IP1_TW,[{t1,50,2},{t3,500,2},{t5,1000,1}]。
在本实施例中,对接收到的各个客户端分别对服务器的连接信息进行数据压缩,并将压缩后的连接信息保存至数据库。如此使得,保存不同时刻各个客户端对应的连接信息,且能够有效降低数据存储量,降低存储空间,节省资源空间。另外,本实施例中,数据压缩的过程中对多个连接信息进行了统计,对数据进行了降维处理,使得报警的过程中,可以直接根据统计完成的数据进行报警,不需要再实时地对原始的连接信息数据进行统计,提高了报警效率。
本发明实施例中,在实时接收各个客户端分别与服务器的连接信息之后,还包括:
通过CMDB,将不同客户端的连接信息进行关联,得到聚合集群的关联连接信息;根据聚合集群中关联连接信息的变化是否异常,监控聚合集群是否异常。
其中,聚合集群包括按照业务类型的不同,聚合得到的多个客户端的集群。
具体地,将各个客户端不同时刻对应的连接信息保存至数据库中,可以保存预设时间段内的连接信息,例如,一周内各个客户端对应的连接信息。
按照服务组、业务等属性,将不同客户端的连接信息进行集合,属于同一服务组或者具有相同业务的客户端可以关联为同一聚合集群。如此,可以从聚合集群的角度,监控客户端异常情况。可以显示聚合集群上的连接情况。例如,监控具体的哪一个业务对应的客户端发生异常,或者监控具体的哪一个服务组的客户端发生异常。
另外,还可以根据关联连接客户端的IP的机器信息,直接显示业务使用部分、项目等详细信息。
本实施例中,可以从集群的角度监控客户端的异常情况,提高异常监控的维度。另外,针对发生异常的客户端,可以按照时间顺序查看其连接状态等连接信息的变化情况,准确定位连接异常的时间点。
另外,在监控到聚合集群异常之后,向聚合集群中的各客户端发送报警信息。可以方便地进行异常连接的精准报警服务,第一时间通知业务。如此使得可以及时地通知发生异常的聚合集群中的客户端,使得在运维过程中高效且准确报警,帮助业务定位客户端,提高了运维效率,节省人工成本。
本发明实施例提供了一个具体的实施例,如图2所示。该实施例中,服务器包括实现不同功能的子服务器,例如,数据服务器、报警服务器等。
具体地,客户端收集器分别从各个客户端获取各个客户端与服务器的连接信息,例如,TCP连接状态等。将获取到的多个客户端对应的连接信息进行封装,得到连接信息数据,例如,封装成json格式。将封装后的连接信息数据发送至数据服务器。数据服务器对连接信息数据进行数据压缩,具体的数据压缩过程上述实施例已经进行了详细地描述,这里就不再赘述。对连接信息数据进行数据压缩后,将压缩后的连接信息数据保存至数据库中。如此,可以根据各个客户端对应的连接信息数据,直接对各个客户端进行异常监控,并且在监控到该客户端发生异常时,报警接入,通过报警服务器报警,如,向该客户端发送报警信息。需要说明的是,报警可以是用户通过客户端主动发送请求触发的,也可以是服务器按照预设周期触发的。
因为数据库中保存了各个客户端预设时间段内不同时刻的连接信息,也即不仅保存各个客户端当前时刻的连接信息,还保存了历史时刻的连接信息,所以用户还可以通过客户端查询不同时刻的具体连接信息以及异常情况。具体地,用户可以通过客户端向前端服务器发送查询请求,前端服务器在接收到客户端发送的查询请求后,从报警服务器获取客户端对应的连接信息以及异常情况等。如此,通过前端服务器可以进行故障现场的详细查询,使得能够重现过去某一时刻的具体连接情况,实现客户端连接信息的回溯。
另外,还可以结合CMDB对多个客户端的连接信息进行关联,使得可以从集群角度监控异常。在监控到集群发生异常时,通过报警服务器向集群中的各个客户端发送报警信息,实现对异常的报警。
本发明实施例还提供了一种异常监控装置,如图3所示,包括:
接收模块301,用于实时接收各个客户端分别与服务器的连接信息,其中,任一客户端的连接信息包括该客户端与服务器当前时刻的连接数;
第一监控模块302,用于分别根据各个客户端对应的当前时刻的连接数与已保存的上一时刻的连接数的变化情况,监控各个客户端是否异常;
第一报警模块303,用于针对每个客户端,在监控到该客户端异常时,向该客户端发送报警信息。
本发明实施例提供的异常监控装置,可以实时接收各个客户端分别与服务器的连接信息,根据各个客户端的连接信息的变化情况,监控各个客户端是否发生异常;并针对每个客户端,在监控到该客户端异常时,向该客户端发送报警信息。如此使得,可以从客户端角度监控异常,即可以在发生异常时,精准地定位到具体的发生异常的客户端,实现细粒度异常监控,能够提高异常监控的精准度。
可选的,该装置还包括:
保存模块,用于分别将各个客户端对应的连接信息保存至数据库中。
可选的,保存模块包括:
压缩子模块,用于针对每个客户端,对接收到的预设时长内不同时刻该客户端对应的连接信息进行数据压缩,得到连接信息数据;
保存子模块,用于将各个客户端对应的连接信息数据保存至数据库中。
可选的,该装置还包括:
关联模块,用于通过配置管理数据库CMDB,将不同客户端的连接信息进行关联,得到聚合集群的关联连接信息,其中,聚合集群包括按照业务类型的不同,聚合得到的多个客户端的集群;
第二监控模块,用于根据聚合集群中关联连接信息的变化是否异常,监控聚合集群是否异常。
可选的,该装置还包括:
第二报警模块,用于在监控到聚合集群异常之后,向聚合集群中的各客户端发送报警信息。
可选的,该装置还包括:
接收请求模块,用于接收该客户端发送的异常查询请求;或者,
触发模块,用于按照预设周期触发报警查询请求。
可选的,连接信息还包括连接状态;
压缩子模块,包括:
确定单元,用于根据预设格式确定该客户端对应的编码信息,编码信息包括客户端连接状态标识、时间点、连接数和连接数重复次数计数值;
比较单元,用于依次将接收到的该客户端对应的当前连接信息,与前一个连接信息进行比较;
判断单元,用于在当前连接信息中连接状态、与该客户端对应的编码信息中客户端连接状态标识表示的连接状态相同时,判断当前连接信息中的连接数,与该客户端对应的编码信息中的连接数之间差值的绝对值是否小于预设阈值;
增加单元,用于如果判断单元判断结果为是,将编码信息中的连接数重复次数计数值加1;
更新单元,用于如果判断单元判断结果为否,根据当前连接信息,将编码信息进行更新,将更新后的编码信息作为该客户端对应的编码信息。
需要说明的是,本发明实施例的异常监控装置是应用上述异常监控方法的装置,则上述异常监控方法的所有实施例均适用于该装置,且均能达到相同或相似的有益效果。
本发明实施例还提供了一种电子设备,如图4所示,包括处理器401、通信接口402、存储器403和通信总线404,其中,处理器401,通信接口402,存储器403通过通信总线404完成相互间的通信,
存储器403,用于存放计算机程序;
处理器401,用于执行存储器403上所存放的程序时,实现上述异常监控方法的方法步骤。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
本发明实施例提供的电子设备,可以实时接收各个客户端分别与服务器的连接信息,根据各个客户端的连接信息的变化情况,监控各个客户端是否发生异常;并针对每个客户端,在监控到该客户端异常时,向该客户端发送报警信息。如此使得,可以从客户端角度监控异常,即可以在发生异常时,精准地定位到具体的发生异常的客户端,实现细粒度异常监控,能够提高异常监控的精准度。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的异常监控方法的方法步骤。
本发明实施例提供的计算机可读存储介质,可以实时接收各个客户端分别与服务器的连接信息,根据各个客户端的连接信息的变化情况,监控各个客户端是否发生异常;并针对每个客户端,在监控到该客户端异常时,向该客户端发送报警信息。如此使得,可以从客户端角度监控异常,即可以在发生异常时,精准地定位到具体的发生异常的客户端,实现细粒度异常监控,能够提高异常监控的精准度。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的异常监控方法的方法步骤。
本发明实施例提供的计算机程序产品,可以实时接收各个客户端分别与服务器的连接信息,根据各个客户端的连接信息的变化情况,监控各个客户端是否发生异常;并针对每个客户端,在监控到该客户端异常时,向该客户端发送报警信息。如此使得,可以从客户端角度监控异常,即可以在发生异常时,精准地定位到具体的发生异常的客户端,实现细粒度异常监控,能够提高异常监控的精准度。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (15)

1.一种异常监控方法,其特征在于,包括:
实时接收各个客户端分别与服务器的连接信息,其中,任一客户端的连接信息包括该客户端与服务器当前时刻的连接数;
分别根据各个客户端对应的当前时刻的连接数与已保存的上一时刻的连接数的变化情况,监控各个客户端是否异常;
针对每个客户端,在监控到该客户端异常时,向该客户端发送报警信息。
2.根据权利要求1所述的方法,其特征在于,在所述实时接收各个客户端分别与服务器的连接信息之后,所述方法还包括:
分别将所述各个客户端对应的所述连接信息保存至数据库中。
3.根据权利要求2所述的方法,其特征在于,所述分别将所述各个客户端对应的所述连接信息保存至数据库中,包括:
针对每个客户端,对接收到的预设时长内不同时刻该客户端对应的所述连接信息进行数据压缩,得到连接信息数据;
将所述各个客户端对应的所述连接信息数据保存至数据库中。
4.根据权利要求1所述的方法,其特征在于,在所述实时接收各个客户端分别与服务器的连接信息之后,还包括:
通过配置管理数据库CMDB,将不同客户端的所述连接信息进行关联,得到聚合集群的关联连接信息,其中,所述聚合集群包括按照业务类型的不同,聚合得到的多个客户端的集群;
根据所述聚合集群中所述关联连接信息的变化是否异常,监控所述聚合集群是否异常。
5.根据权利要求4所述的方法,其特征在于,所述监控所述聚合集群是否异常之后,所述方法还包括:
在监控到所述聚合集群异常之后,向所述聚合集群中的各客户端发送报警信息。
6.根据权利要求1所述的方法,其特征在于,在向该客户端发送报警信息之前,还包括:
接收该客户端发送的异常查询请求;或者,
按照预设周期触发报警查询请求。
7.根据权利要求3所述的方法,其特征在于,所述连接信息还包括连接状态;
所述针对每个客户端,对接收到的预设时长内不同时刻该客户端对应的所述连接信息进行数据压缩,包括:
根据预设格式确定该客户端对应的编码信息,所述编码信息包括客户端连接状态标识、时间点、连接数和连接数重复次数计数值;
依次将接收到的该客户端对应的当前连接信息,与前一个连接信息进行比较,在所述当前连接信息中连接状态、与该客户端对应的编码信息中客户端连接状态标识表示的连接状态相同时,判断所述当前连接信息中的连接数,与该客户端对应的编码信息中的连接数之间差值的绝对值是否小于预设阈值;
如果是,将编码信息中的连接数重复次数计数值加1;
如果否,根据所述当前连接信息,将编码信息进行更新,将更新后的编码信息作为该客户端对应的编码信息。
8.一种异常监控装置,其特征在于,包括:
接收模块,用于实时接收各个客户端分别与服务器的连接信息,其中,任一客户端的连接信息包括该客户端与服务器当前时刻的连接数;
第一监控模块,用于分别根据各个客户端对应的当前时刻的连接数与已保存的上一时刻的连接数的变化情况,监控各个客户端是否异常;
第一报警模块,用于针对每个客户端,在监控到该客户端异常时,向该客户端发送报警信息。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
保存模块,用于分别将所述各个客户端对应的所述连接信息保存至数据库中。
10.根据权利要求9所述的装置,其特征在于,所述保存模块包括:
压缩子模块,用于针对每个客户端,对接收到的预设时长内不同时刻该客户端对应的所述连接信息进行数据压缩,得到连接信息数据;
保存子模块,用于将所述各个客户端对应的所述连接信息数据保存至数据库中。
11.根据权利要求8所述的装置,其特征在于,所述装置还包括:
关联模块,用于通过配置管理数据库CMDB,将不同客户端的所述连接信息进行关联,得到聚合集群的关联连接信息,其中,所述聚合集群包括按照业务类型的不同,聚合得到的多个客户端的集群;
第二监控模块,用于根据所述聚合集群中所述关联连接信息的变化是否异常,监控所述聚合集群是否异常。
12.根据权利要求11所述的装置,其特征在于,所述装置还包括:
第二报警模块,用于在监控到所述聚合集群异常之后,向所述聚合集群中的各客户端发送报警信息。
13.根据权利要求8所述的装置,其特征在于,所述装置还包括:
接收请求模块,用于接收该客户端发送的异常查询请求;或者,
触发模块,用于按照预设周期触发报警查询请求。
14.根据权利要求10所述的装置,其特征在于,所述连接信息还包括连接状态;
所述压缩子模块,包括:
确定单元,用于根据预设格式确定该客户端对应的编码信息,所述编码信息包括客户端连接状态标识、时间点、连接数和连接数重复次数计数值;
比较单元,用于依次将接收到的该客户端对应的当前连接信息,与前一个连接信息进行比较;
判断单元,用于在所述当前连接信息中连接状态、与该客户端对应的编码信息中客户端连接状态标识表示的连接状态相同时,判断所述当前连接信息中的连接数,与该客户端对应的编码信息中的连接数之间差值的绝对值是否小于预设阈值;
增加单元,用于如果所述判断单元判断结果为是,将编码信息中的连接数重复次数计数值加1;
更新单元,用于如果所述判断单元判断结果为否,根据所述当前连接信息,将编码信息进行更新,将更新后的编码信息作为该客户端对应的编码信息。
15.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-7任一所述的方法步骤。
CN201711318750.3A 2017-12-12 2017-12-12 一种异常监控方法、装置及电子设备 Active CN107864063B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711318750.3A CN107864063B (zh) 2017-12-12 2017-12-12 一种异常监控方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711318750.3A CN107864063B (zh) 2017-12-12 2017-12-12 一种异常监控方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN107864063A true CN107864063A (zh) 2018-03-30
CN107864063B CN107864063B (zh) 2021-09-17

Family

ID=61704032

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711318750.3A Active CN107864063B (zh) 2017-12-12 2017-12-12 一种异常监控方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN107864063B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108664603A (zh) * 2018-05-09 2018-10-16 北京奇艺世纪科技有限公司 一种修复时序数据的异常聚合值的方法及装置
CN109474494A (zh) * 2018-12-05 2019-03-15 深圳绿米联创科技有限公司 设备检测方法、装置、服务器及存储介质
CN109540332A (zh) * 2018-11-13 2019-03-29 中广核核电运营有限公司 容器内液体的参数监测方法、装置、设备和存储介质
CN109889399A (zh) * 2018-12-15 2019-06-14 中国平安人寿保险股份有限公司 RocketMQ客户端连接数监控方法、装置、电子设备及存储介质
CN110278269A (zh) * 2019-06-21 2019-09-24 广州小鹏汽车科技有限公司 一种用户行为记录方法和装置
CN110519102A (zh) * 2019-09-12 2019-11-29 贵阳动视云科技有限公司 一种服务器故障识别方法、装置及存储介质
CN111049705A (zh) * 2019-12-23 2020-04-21 深圳前海微众银行股份有限公司 一种监控分布式存储系统的方法及装置
CN111314158A (zh) * 2018-12-11 2020-06-19 杭州海康威视数字技术股份有限公司 大数据平台监控方法、装置及设备、介质
CN111556130A (zh) * 2020-04-24 2020-08-18 北京奇艺世纪科技有限公司 一种信息处理方法、装置、电子设备及存储介质
CN113791964A (zh) * 2021-09-27 2021-12-14 首约科技(北京)有限公司 一种基于传输控制协议四层的服务监控方法
CN113868643A (zh) * 2021-09-22 2021-12-31 苏州浪潮智能科技有限公司 运行资源的安全检测方法、装置、电子设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105897501A (zh) * 2015-12-17 2016-08-24 乐视云计算有限公司 数据监控方法及装置
CN106385341A (zh) * 2016-08-31 2017-02-08 福建天晴数码有限公司 客户端监控线程的方法及其系统
CN106411947A (zh) * 2016-11-24 2017-02-15 广州华多网络科技有限公司 一种实时阈值自适应流量预警方法及装置
US9729416B1 (en) * 2016-07-11 2017-08-08 Extrahop Networks, Inc. Anomaly detection using device relationship graphs
CN107086944A (zh) * 2017-06-22 2017-08-22 北京奇艺世纪科技有限公司 一种异常检测方法和装置
CN107181639A (zh) * 2017-03-31 2017-09-19 北京奇艺世纪科技有限公司 一种通信状态的监控方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105897501A (zh) * 2015-12-17 2016-08-24 乐视云计算有限公司 数据监控方法及装置
US9729416B1 (en) * 2016-07-11 2017-08-08 Extrahop Networks, Inc. Anomaly detection using device relationship graphs
CN106385341A (zh) * 2016-08-31 2017-02-08 福建天晴数码有限公司 客户端监控线程的方法及其系统
CN106411947A (zh) * 2016-11-24 2017-02-15 广州华多网络科技有限公司 一种实时阈值自适应流量预警方法及装置
CN107181639A (zh) * 2017-03-31 2017-09-19 北京奇艺世纪科技有限公司 一种通信状态的监控方法及装置
CN107086944A (zh) * 2017-06-22 2017-08-22 北京奇艺世纪科技有限公司 一种异常检测方法和装置

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108664603A (zh) * 2018-05-09 2018-10-16 北京奇艺世纪科技有限公司 一种修复时序数据的异常聚合值的方法及装置
CN108664603B (zh) * 2018-05-09 2022-06-03 北京奇艺世纪科技有限公司 一种修复时序数据的异常聚合值的方法及装置
CN109540332A (zh) * 2018-11-13 2019-03-29 中广核核电运营有限公司 容器内液体的参数监测方法、装置、设备和存储介质
CN109474494B (zh) * 2018-12-05 2020-10-30 深圳绿米联创科技有限公司 设备检测方法、装置、服务器及存储介质
CN109474494A (zh) * 2018-12-05 2019-03-15 深圳绿米联创科技有限公司 设备检测方法、装置、服务器及存储介质
CN111314158B (zh) * 2018-12-11 2022-05-31 杭州海康威视数字技术股份有限公司 大数据平台监控方法、装置及设备、介质
CN111314158A (zh) * 2018-12-11 2020-06-19 杭州海康威视数字技术股份有限公司 大数据平台监控方法、装置及设备、介质
CN109889399A (zh) * 2018-12-15 2019-06-14 中国平安人寿保险股份有限公司 RocketMQ客户端连接数监控方法、装置、电子设备及存储介质
CN110278269A (zh) * 2019-06-21 2019-09-24 广州小鹏汽车科技有限公司 一种用户行为记录方法和装置
CN110519102A (zh) * 2019-09-12 2019-11-29 贵阳动视云科技有限公司 一种服务器故障识别方法、装置及存储介质
CN111049705A (zh) * 2019-12-23 2020-04-21 深圳前海微众银行股份有限公司 一种监控分布式存储系统的方法及装置
CN111049705B (zh) * 2019-12-23 2023-09-12 深圳前海微众银行股份有限公司 一种监控分布式存储系统的方法及装置
CN111556130A (zh) * 2020-04-24 2020-08-18 北京奇艺世纪科技有限公司 一种信息处理方法、装置、电子设备及存储介质
CN111556130B (zh) * 2020-04-24 2022-10-25 北京奇艺世纪科技有限公司 一种信息处理方法、装置、电子设备及存储介质
CN113868643A (zh) * 2021-09-22 2021-12-31 苏州浪潮智能科技有限公司 运行资源的安全检测方法、装置、电子设备及存储介质
CN113868643B (zh) * 2021-09-22 2023-11-03 苏州浪潮智能科技有限公司 运行资源的安全检测方法、装置、电子设备及存储介质
CN113791964A (zh) * 2021-09-27 2021-12-14 首约科技(北京)有限公司 一种基于传输控制协议四层的服务监控方法

Also Published As

Publication number Publication date
CN107864063B (zh) 2021-09-17

Similar Documents

Publication Publication Date Title
CN107864063A (zh) 一种异常监控方法、装置及电子设备
CN107390650B (zh) 一种基于物联网的数据采集系统及基于该系统的数据压缩方法
CN110351118B (zh) 根因告警决策网络构建方法、装置和存储介质
US10148540B2 (en) System and method for anomaly detection in information technology operations
CN110868336A (zh) 数据管理方法、装置和计算机可读存储介质
WO2015090098A1 (zh) 一种实现故障定位的方法及装置
US20080174426A1 (en) Monitoring usage rate patterns in storage resources
US20080222068A1 (en) Inferring Candidates that are Potentially Responsible for User-Perceptible Network Problems
JPWO2016017208A1 (ja) 監視システム、監視装置、および検査装置
CN106034051B (zh) 网络监控数据处理方法及网络监控数据处理装置
JP2012508476A (ja) ネットワーク異常流量分析装置及び方法
KR20180120558A (ko) 딥러닝 기반 통신망 장비의 장애 예측 시스템 및 방법
US10594614B2 (en) Context aware routing
US20150256635A1 (en) Method and medium for implicit relationship discovery based on cumulative co-temporal activity
CN108182139B (zh) 预警方法、装置和系统
CN108173678B (zh) 客户端数据发送方法、客户端连接异常显示方法及装置
JP2015057930A (ja) ネットワーク装置、通信システム、異常トラヒックの検出方法およびプログラム
CN115038088B (zh) 一种智能网络安全检测预警系统和方法
CN107204875A (zh) 数据上报链路监测方法、装置、电子设备及存储介质
CN109783324A (zh) 系统运行预警方法及装置
CN114090366A (zh) 一种监控数据的方法、装置和系统
CN114443437A (zh) 告警根因输出方法、装置、设备、介质和程序产品
US20220413481A1 (en) Geometric aging data reduction for machine learning applications
CN110222034A (zh) 一种数据库维护方法及装置
JP5505930B2 (ja) 監視装置、監視方法及びプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant