CN105490835B - 信息监控方法和装置 - Google Patents

信息监控方法和装置 Download PDF

Info

Publication number
CN105490835B
CN105490835B CN201510810013.XA CN201510810013A CN105490835B CN 105490835 B CN105490835 B CN 105490835B CN 201510810013 A CN201510810013 A CN 201510810013A CN 105490835 B CN105490835 B CN 105490835B
Authority
CN
China
Prior art keywords
monitoring
information
value
attribute
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510810013.XA
Other languages
English (en)
Other versions
CN105490835A (zh
Inventor
周伟
郭宣佑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201510810013.XA priority Critical patent/CN105490835B/zh
Publication of CN105490835A publication Critical patent/CN105490835A/zh
Application granted granted Critical
Publication of CN105490835B publication Critical patent/CN105490835B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0604Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • H04L67/025Protocols based on web technology, e.g. hypertext transfer protocol [HTTP] for remote control or remote monitoring of applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L61/00Network arrangements, protocols or services for addressing or naming
    • H04L61/45Network directories; Name-to-address mapping
    • H04L61/4505Network directories; Name-to-address mapping using standardised directories; using standardised directory access protocols
    • H04L61/4511Network directories; Name-to-address mapping using standardised directories; using standardised directory access protocols using domain name system [DNS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请公开了信息监控方法和装置。该方法的一具体实施方式包括:接收客户端发送的监控信息,监控信息包括:监控对象的预设属性、与预设属性对应的属性值以及监控对象对应的监控值;基于预设属性与属性值,聚合监控信息中的监控值,生成监控值集合;基于监控值集合,确定监控对象是否存在故障。实现了基于多个预设属性、与预设属性对应的属性值即多维标签的监控信息,判断监控对象是否存在故障,从而使得监控信息可以快速地进行合并,缩短报警时间,进一步地,避免了针对每一个监控对象均需设置一个监控项所引起的云监控系统冗余的问题。

Description

信息监控方法和装置
技术领域
本申请涉及计算机领域,具体涉及云计算领域,尤其涉及信息监控方法和装置。
背景技术
在云计算技术中,通过云计算平台向用户提供云计算服务,为向用户提供稳定的云计算服务,通常,通过云监控系统对云计算平台的运行情况进行监控,确保云计算平台的正常运行。在现有的云监控系统中,对云计算平台进行监控的方式为:针对监控对象的多个属性,预先设置多个与属性对应的监控项,然后将采集到监控值在相应地监控项下显示。
然而,当采用上述方式进行监控时,一方面,由于需要针对监控对象的每一个属性均需设置监控项,增加了云监控系统的冗余。另一方面,由于监控项的名称的不同,无法实现对监控信息进行快速的合并,增加报警延迟的时间。
发明内容
本申请提供了信息监控方法和装置,用于解决上述背景技术部分存在的技术问题。
第一方面,本申请提供了信息监控方法,该方法包括:接收客户端发送的监控信息,监控信息包括:监控对象的预设属性、与预设属性对应的属性值以及监控对象对应的监控值;基于预设属性与属性值,聚合监控信息中的监控值,生成监控值集合;基于监控值集合,确定监控对象是否存在故障。
第二方面,本申请提供了信息监控装置,该装置包括:接收单元,配置用于接收客户端发送的监控信息,监控信息包括:监控对象的预设属性、与预设属性对应的属性值以及监控对象对应的监控值;聚合单元,配置用于基于预设属性与属性值,聚合监控信息中的监控值,生成监控值集合;确定单元,配置用于基于监控值集合,确定监控对象是否存在故障。
本申请提供的信息监控方法和装置,通过接收客户端发送的监控信息,监控信息包括:监控对象的预设属性、与预设属性对应的属性值以及监控对象对应的监控值;基于预设属性与属性值,聚合监控信息中的监控值,生成监控值集合;基于监控值集合,确定监控对象是否存在故障。实现了基于多个预设属性、与预设属性对应的属性值即多维标签的监控信息,判断监控对象是否存在故障,从而使得监控信息可以快速地进行合并,缩短报警时间,进一步地,避免了针对每一个监控对象均需设置一个监控项所引起的云监控系统冗余的问题。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请可以应用于其中的示例性系统架构图;
图2示出了根据本申请的信息监控方法的一个实施例的流程图;
图3示出了监控信息的格式的示意图;
图4示出了根据本申请的信息监控方法的另一个实施例的流程图;
图5A示出了现有的云监控系统中判断是否接收到监控信息的原理图;
图5B示出了本申请中判断是否接收到监控信息的原理图;
图6示出了根据本申请的信息监控装置的一个实施例的结构示意图;
图7是适于用来实现本申请实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的信息监控方法或信息监控装置的实施例的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供传输链路的介质。网络104可以包括各种连接类型,例如有线、无线传输链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯应用,例如网络安全类应用、即时通信工具等。
终端设备101、102、103可以是具有显示屏并且支持网络通信的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture ExpertsGroup Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving PictureExperts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上的监控类应用提供支持的服务器。服务器可以对接收到的监控请求进行处理,并将处理结果(例如监控数据)反馈给终端设备。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
请参考图2,其示出了根据本申请的信息监控方法的一个实施例的流程200。该方法包括以下步骤:
步骤201,接收客户端发送的监控信息。
在本实施例中,客户端并不特指某一类型的终端,可以将采集监控信息的终端称之为客户端。在本实施例中,监控信息包括:监控对象的预设属性、与预设属性对应的属性值以及监控对象对应的监控值。在本实施例中,监控对象可以为云计算平台中的云服务器的运行状态、网络参数等对象。
在本实施例的一些可选的实现方式中,监控对象包括以下之一:DNS、HTTP、FTP。在本实施例中,监控对象可以为DNS、HTTP、FTP等网络参数对象。监控对象的预设属性可以为监控对象对应的地域、该监控对象对应的机房的类型等属性。相应地,与地域这一预设属性对应的属性值为地域的名称,例如,北京、上海。与机房的类型这一预设属性对应的属性值为机房的类型的名称,例如,联通机房、移动机房。
在本实施例中,可以采用以下方式生成监控信息:采用预设格式存储预设属性与属性值,预设格式包括属性字段、属性值字段,其中,属性字段对应预设属性,属性值字段对应属性值。从而使得预设属性和预设属性对应的属性值在监控信息中以key-value形式进行存储,可以将以key-value形式进行存储的预设属性和预设属性称之为标签。
在本实施例中,在生成监控信息时,可以对在监控信息中加入任意的标签。请参考图3,其示出了监控信息的格式的示意图。在图3中,示出了多个标签,每一个标签对应于一个预设属性的字段以及一个与预设属性对应的属性值的字段。标签中的key存储于预设属性的字段内,例如,key1可以为地域,key2可以为机房的类型,相应地,value可以存储于与预设属性对应的属性值的字段内,例如,value1可以为上海,value2可以为联通机房。
步骤202,基于预设属性与属性值,聚合监控信息中的监控值,生成监控值集合。
在本实施例中,在接收当监控信息时,可以对监控信息进行解析,得到监控值,得到预设属性和预设属性对应的属性值以及监控值,可以基于预设属性与属性值,聚合监控信息中的监控值,生成监控值集合。以监控对象为DNS为例,可以通过解析监控信息得到DNS数据对应的监控值、预设属性即地域,以及预设属性对应的属性值(例如北京、上海)。
在本实施例的一些可选的实现方式中,基于预设属性与属性值,聚合监控值包括:查找出监控信息中包含相同的预设属性以及属性值的监控信息;聚合监控信息中的监控值,生成监控值集合。
在本实施例中,可以首先查找出包含有相同的预设属性以及同时包含有与该相同的预设属性对应的属性值的监控信息。以监控对象为DNS为例,在对上海的DNS数据进行监控时,接收到的监控信息中包含与上海的DNS数据对应的标签,即监控信息中包括预设属性即地域,以及预设属性对应的属性值即上海,从而可以首先查找出监控信息中,包含有相同的预设属性即地域以及与该相同的预设属性对应的属性值即上海的监控信息,然后将监控值进行聚合,得到上海的DNS数据对应的监控值集合。
下面说明本实施例中的多维标签与现有的云监控系统的一维数据的区别:以在一个监控任务中需要同时监控北京的DNS数据以及上海的DNS数据时为例,在现有的云监控系统中,需要分别配置北京DNS监控项、上海DNS监控项这两个监控项。在采集DNS数据时,每个监控项需要对应不同的监控信息,相应地,采集到的数据为一维数据,当需要监控相同的数据即同属于同一监控对象的数据时,由于监控对象的属性为多个,需要针对不同属性,设置多个不同的监控项,因此,增加了云监控系统的冗余以及对监控信息管理的复杂度。
在本实施例中,只需在采集北京的DNS数据以及上海的DNS数据时,根据北京的DNS数据以及上海的DNS数据各自对应的预设属性,例如地域、机房类型等,向监控信息中加入相应地标签,例如,在北京的DNS监控数据中加入预设属性即地域以及该预设属性对应的属性值(北京),在上海的DNS监控数据中加入预设属性即地域以及该预设属性对应的属性值(上海)即可。从而使得监控信息可以对应于多个标签,也可称之为多维度标签,实现利用多维度标签从地域、机房等多个维度描述监控信息。
步骤203,基于监控值集合,确定监控对象是否存在故障。
在本实施例中,可以通过对包含有多维度标签的监控信息的解析,获取对应到同一标签的监控信息,从而生成监控值集合,然后,可以基于该监控值集合,判断监控对象是否处于正常状态,从而生成指示信息。
在本实施例中,针对每一个监控对象,可以仅配置一个监控项。以监控对象为DNS数据为例,当需要对上海的DNS数据的监控时,只需要在监控信息中加入对应的标签,即在监控信息中加入预设属性即地域,以及该预设属性对应的属性值(例如上海),即可通过解析监控信息,对监控值进行聚合,获取到上海的DNS数据对应的监控值集合,从而利用上海的DNS数据对应的监控值集合,判断上海的DNS数据是否存在故障。
以下说明中本实施例中利用包含有多个标签的监控信息,判断监控对象是否存在故障与现有的云监控系统的区别:在现有的云监控系统中,监控的数据为一维的数据,以监控对象为DNS数据为例,在对每一个地域的DNS数据进行监控时,需要针对每一个地域分别配置监控项,例如,北京DNS监控项、上海DNS监控项等监控项。假如,用户配置了北京,上海,北京和上海三个监控任务,由于监控项对应的数据为一维数据,即仅包含监控值,因此,各监控项之间的数据是无关联的,需要分别计算每一个监控项下的DNS数据,即北京的DNS数据,上海的DNS数据,以及北京和上海的DNS数据,因此,在计算过程中,会产生很多的冗余计算。而在本实施例中,由于采用多维度数据,则在计算过程中,可以根据北京和上海的DNS的监控数据中与预设属性对应的属性值,对北京和上海的DNS数据的监控值进行区分,进一步地,可以分别计算出北京的DNS数据的平均值,算上海DNS数据的平均值,然后再用这两个平均值算北京和上海的DNS数据的平均值,则所有计算只需进行一次即可完成上述监控任务。
在本实施例的一些可选的实现方式中,基于监控值集合,确定监控对象是否存在故障包括:当监控值集合中不在预设数值范围内的监控值的数量大于数量阈值时,确定监控对象存在故障。
下面以一个机房中的路由出现故障为例,说明本实施例中的生成报警信息的过程与现有的云监控系统的区别:在现有的云监控系统中,是直接先由每一台主机发出报警信息,然后根据报警信息对故障进行判断,这样,存在报警信息冗余以及由于报警信息无法快速合并而造成的增加报警延迟的时间的问题。例如,在某个机房路由出现故障的情况下,基本上整个机房的机会都会出现异常,此时,不应该将每台机器的异常信息都出去,而是直接报出交换机故障信息。为了防止报警过多的发生,现有的云监控系统通常采用复杂的报警合并策略,造成增加报警延迟的时间。
在本实施例中,在对包含多维度标签的监控信息进行解析时,由于多维度标签是以key-value形式进行存储的,使得可以基于多维度标签,对监控信息中的监控值进行快速地合并。在对监控值的合并过程中,仅需O(1)的算法复杂度即可将监控值进行合并,从而对映射到同一个标签的所有监控值仅进行一次判断过程,即可生成报警信息。从而可以有效的减少判断的计算量,缩短报警延迟。在本实施例中,还可以在基于多维度标签的基础上,与数据挖掘技术结合,进一步挖掘出相关联的报警异常,进一步进行跨机房、跨地域报警收敛。
在本实施例中,一方面,相较于现有的云监控系统中的根据采集到的一维数据进行简单的阈值计算并且不能直接支持适用于基于多维度信息的判断规则,通过多维度标签,实现监控值的快速合并,从而可以支持不同的多维度信息的判断规则。另一方面,相较于现有的云监控系统中直接将异常事件全部报警并且异常事件存在大量冗余信息,仅需O(1)的算法复杂度即可将监控值进行合并,可以对映射到同一个标签的所有监控值仅进行一次判断过程,从而可以有效的减少判断的计算量,提升报警速度。
请参考图4,其示出了根据本申请的信息监控方法的另一个实施例的流程400。该方法包括以下步骤:
步骤401,接收客户端发送的监控信息。
在本实施例中,监控信息包括:监控对象的预设属性、与预设属性对应的属性值以及监控对象对应的监控值。在本实施例中,监控对象可以为DNS、HTTP、FTP等网络参数对象。监控对象的预设属性可以为监控对象对应的地域、该监控对象对应的机房的类型等属性。相应地,与地域这一预设属性对应的属性值为地域的名称,例如,北京、上海。与机房的类型这一预设属性对应的属性值为机房的类型的名称,例如,联通机房、移动机房。
步骤402,基于预设属性与属性值,聚合监控信息中的监控值,生成监控值集合。
在本实施例中,在接收当监控信息时,可以对监控信息进行解析,得到监控值,预设属性和预设属性对应的属性值。以监控对象为DNS为例,可以通过解析监控信息得到DNS的监控值、预设属性即地域,以及预设属性对应的属性值,例如,北京、上海。
在本实施例中,可以首先查找出包含有相同的预设属性以及同时包含有与该相同的预设属性对应的属性值的监控信息。以监控对象为DNS为例,在对上海的DNS数据进行监控时,接收到的监控信息中可以包含与上海的DNS数据对应的标签,即可以在监控信息中包括预设属性即地域,以及预设属性对应的属性值即上海,从而可以首先查找出监控信息中,包含有相同的预设属性即地域以及与该相同的预设属性对应的属性值即上海的监控信息,然后将监控值进行聚合,得到监控值集合,即上海的DNS数据。
步骤403,基于监控值集合,确定监控对象是否存在故障。
在本实施例中,可以通过对包含有多维度标签的监控信息的解析,获取对应到同一标签的监控信息,从而生成监控值集合,然后,可以基于该监控值集合,判断监控对象是否处于正常状态,生成指示监控对象处于正常状态的指示信息或生成指示监控对象处于异常状态的指示信息。
步骤404,检测预设时间段内是否接收到监控信息。
在本实施例中,可以采用以下方式检测预设时间段内是否接收到监控信息:确定接收监控信息之前的起始时间点;判断在起始时间点与预设时间点之间的时间内,是否接收到的监控信息,其中,预设时间点为起始时间点经预设时长后对应的时间点,预设时长为多个;若是,生成指示接收监控信息正常的指示信息。
在利用接收到监控信息判断监控对象是否正常时,为避免为获取到监控信息导致数据不足的情况,在现有的云监控系统中,通常会在提前固定的时间用于获取监控信息,这一时间可以称之为传输时即延timeLatency。在现有的云监控系统中,timeLatency的取值为采用数据传输时延的最大值(例如180秒),因此,当采用上述传输时延时,会增加报警延迟。在本实施例中,通过判断在一定时间段内是否获取到监控信息,来判断是否存在数据不足的情况。可以采用以下方式判断是否接收到监控信息:在本实施例中,在检测是否接收到监控信息时,可以首先设置起始时间点,然后,可以动态地对timeLatency进行调整,可以预先设置多个预设时间点,组成预设时间点集合{10秒,20秒,30秒,60秒,90秒,180秒},相应地,预设时间点对应一个相较于起始时间点的预设时长,也可称之为前移时间。然后,依次取预设时间点集合中的预设时间点,判断起始时间点到预设时间点之间的时间内是否接收到监控数据。在t时刻,判断是否获取到监控信息的时间段为【t-timeLatency-period,t-timeLatency-1】,其中,timeLatency为相较于起始时间点的前移时间,period为监控数据的采集周期。如果接收到监控数据,则立即停止判断过程,否则,继续检测是否接收到监控信息直至最大预设时长对应的预设时间点,即起始时间点与最大预设时长之和所对应的时间(例如180秒),如果还未获取到监控信息,则可以发出数据不足的报警。
在本实施例中,还可以利用历史前移时间来减少判断是否接收到监控信息的次数,例如,在前一次判断是否接收到监控信息的过程中,若timeLatency为60秒,则可以从timeLatency为60秒开始进行判断,如果连续N次均为60秒内之内接收到监控信息,则在下一次判断是否接收到监控数据时,可以从timeLatency为30秒开始进行判断。此外,还可以统计timeLatency的历史数据,调整timeLatency的取值。
请参考图5A与图5B,图5A与图5B分别示出了现有的云监控系统中判断是否获取到监控信息的原理图以及本申请中判断是否接收到监控信息的原理图。在现有的云监控系统中,固定提前t秒取数据(例如180秒)。因此,报警延迟为提前t的时间与报警判断的时间之和的时间。在本实施例中,报警延时的时间为动态调整的提前时间,例如30,60秒等时间与报警判断的时间之和的时间,并且由于在本实施例中,通过对标签的快速合并,报警时间小于现有的云监控系统中利用一位数据进行报警判断的时间,因此,进一步缩短了报警延迟。
请参考图6,其示出了根据本申请的信息监控装置的一个实施例的结构示意图。装置600包括:接收单元601,聚合单元602,确定单元603。其中,接收单元601配置用于接收客户端发送的监控信息,监控信息包括:监控对象的预设属性、与预设属性对应的属性值以及监控对象对应的监控值;聚合单元602配置用于基于预设属性与属性值,聚合监控信息中的监控值,生成监控值集合;确定单元603配置用于基于监控值集合,确定监控对象是否存在故障。
在本实施例的一些可选的实现方式中,监控对象包括以下之一:DNS、HTTP、FTP。
在本实施例的一些可选的实现方式中,聚合单元602包括:监控信息查找子单元(未示出),配置用于查找出监控信息中包含相同的预设属性以及属性值的监控信息;监控值集合生成子单元(未示出),配置用于聚合监控信息中的监控值,生成监控值集合。
在本实施例的一些可选的实现方式中,确定单元603包括:故障确定子单元(未示出),配置用于当监控值集合中不在预设数值范围内的监控值的数量大于数量阈值时,确定监控对象存在故障。
在本实施例的一些可选的实现方式中,装置600还包括:时间点确定单元(未示出),配置用于确定接收监控信息之前的起始时间点;判断单元(未示出),配置用于判断在起始时间点与预设时间点之间的时间内,是否接收到监控信息,其中,预设时间点为起始时间点经预设时长后对应的时间点,预设时长为多个;第一指示信息生成单元(未示出),配置用于当在起始时间点与预设时间点之间的时间内,接收到监控信息时,生成指示接收监控信息正常的指示信息。
在本实施例的一些可选的实现方式中,装置600还包括:第二指示信息生成单元(未示出),配置用于当在起始时间点与预设时长中最大预设时长对应的预设时间点之间的时间内,未接收到监控信息时,生成指示接收监控信息异常的指示信息。
图7示出了适于用来实现本申请实施例的终端设备或服务器的计算机系统的结构示意图。如图7所示,计算机系统700包括中央处理单元(CPU)701,其可以根据存储在只读存储器(ROM)702中的程序或者从存储部分708加载到随机访问存储器(RAM)703中的程序而执行各种适当的动作和处理。在RAM 703中,还存储有系统700操作所需的各种程序和数据。CPU 701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
以下部件连接至I/O接口705:包括键盘、鼠标等的输入部分706;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至I/O接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分708。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
作为另一方面,本申请还提供了一种非易失性计算机存储介质,该非易失性计算机存储介质可以是上述实施例中所述装置中所包含的非易失性计算机存储介质;也可以是单独存在,未装配入终端中的非易失性计算机存储介质。上述非易失性计算机存储介质存储有一个或者多个程序,当所述一个或者多个程序被一个设备执行时,使得所述设备:接收客户端发送的监控信息,所述监控信息包括:监控对象的预设属性、与所述预设属性对应的属性值以及监控对象对应的监控值;基于所述预设属性与所述属性值,聚合监控信息中的所述监控值,生成监控值集合;基于所述监控值集合,确定所述监控对象是否存在故障。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (10)

1.一种信息监控方法,其特征在于,所述方法包括:
接收客户端发送的监控信息,所述监控信息包括:监控对象的预设属性、与所述预设属性对应的属性值以及监控对象对应的监控值;
基于所述预设属性与所述属性值,聚合监控信息中的所述监控值,生成监控值集合;
基于所述监控值集合,确定所述监控对象是否存在故障,所述基于所述监控值集合,确定所述监控对象是否存在故障包括:当所述监控值集合中不在预设数值范围内的监控值的数量大于数量阈值时,确定所述监控对象存在故障。
2.根据权利要求1所述的方法,其特征在于,所述监控对象包括以下之一:DNS、HTTP、FTP。
3.根据权利要求1-2之一所述的方法,所述基于所述预设属性与所述属性值,聚合监控信息中的所述监控值,生成监控值集合包括:
查找出监控信息中包含相同的所述预设属性以及所述属性值的监控信息;
聚合所述监控信息中的监控值,生成监控值集合。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定接收所述监控信息之前的起始时间点;
判断在所述起始时间点与预设时间点之间的时间内,是否接收到所述监控信息,其中,所述预设时间点为所述起始时间点经预设时长后对应的时间点,所述预设时长为多个;
若是,生成指示接收监控信息正常的指示信息。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
当在所述起始时间点与所述预设时长中最大预设时长对应的预设时间点之间的时间内,未接收到所述监控信息时,生成指示接收监控信息异常的指示信息。
6.一种信息监控装置,其特征在于,所述装置包括:
接收单元,配置用于接收客户端发送的监控信息,所述监控信息包括:监控对象的预设属性、与所述预设属性对应的属性值以及监控对象对应的监控值;
聚合单元,配置用于基于所述预设属性与所述属性值,聚合监控信息中的所述监控值,生成监控值集合;
确定单元,配置用于基于所述监控值集合,确定所述监控对象是否存在故障,所述确定单元包括:故障确定子单元,配置用于当所述监控值集合中不在预设数值范围内的监控值的数量大于数量阈值时,确定所述监控对象存在故障。
7.根据权利要求6所述的装置,其特征在于,所述监控对象包括以下之一:DNS、HTTP、FTP。
8.根据权利要求6-7之一所述的装置,其特征在于,所述聚合单元包括:
监控信息查找子单元,配置用于查找出监控信息中包含相同的所述预设属性以及所述属性值的监控信息;
监控值集合生成子单元,配置用于聚合所述监控信息中的监控值,生成监控值集合。
9.根据权利要求6所述的装置,其特征在于,所述装置还包括:
时间点确定单元,配置用于确定接收所述监控信息之前的起始时间点;
判断单元,配置用于判断在所述起始时间点与预设时间点之间的时间内,是否接收到所述监控信息,其中,所述预设时间点为所述起始时间点经预设时长后对应的时间点,所述预设时长为多个;
第一指示信息生成单元,配置用于当在所述起始时间点与预设时间点之间的时间内,接收到监控信息时,生成指示接收监控信息正常的指示信息。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:
第二指示信息生成单元,配置用于当在所述起始时间点与所述预设时长中最大预设时长对应的预设时间点之间的时间内,未接收到监控信息时,生成指示接收监控信息异常的指示信息。
CN201510810013.XA 2015-11-20 2015-11-20 信息监控方法和装置 Active CN105490835B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510810013.XA CN105490835B (zh) 2015-11-20 2015-11-20 信息监控方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510810013.XA CN105490835B (zh) 2015-11-20 2015-11-20 信息监控方法和装置

Publications (2)

Publication Number Publication Date
CN105490835A CN105490835A (zh) 2016-04-13
CN105490835B true CN105490835B (zh) 2019-03-01

Family

ID=55677579

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510810013.XA Active CN105490835B (zh) 2015-11-20 2015-11-20 信息监控方法和装置

Country Status (1)

Country Link
CN (1) CN105490835B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106100928B (zh) * 2016-06-21 2019-02-26 北京百度网讯科技有限公司 应用于数据中心的监控数据的传输方法和装置
CN107885634B (zh) * 2016-09-29 2020-06-16 腾讯科技(深圳)有限公司 监控中异常信息的处理方法和装置
CN108234176A (zh) * 2016-12-21 2018-06-29 贵州白山云科技有限公司 一种监控系统及其方法
CN111008109B (zh) * 2019-12-06 2023-09-05 北京奇艺世纪科技有限公司 一种监控数据处理方法、装置、电子设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102064975A (zh) * 2009-11-17 2011-05-18 中国移动通信集团公司 网络设备监管方法及系统
EP2355407A1 (en) * 2010-01-26 2011-08-10 Hitachi Ltd. Failure display method, failure setting device and monitor control device
CN102736588A (zh) * 2012-05-25 2012-10-17 北京天地云箱科技有限公司 监控方法及系统
CN103365994A (zh) * 2013-07-11 2013-10-23 北京泛华恒兴科技有限公司 基于柔性测试技术的数据存储方法及装置
CN104065540A (zh) * 2014-07-11 2014-09-24 网之易信息技术(北京)有限公司 一种数据监控系统和方法
CN104765749A (zh) * 2014-01-07 2015-07-08 阿里巴巴集团控股有限公司 一种数据存储方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102064975A (zh) * 2009-11-17 2011-05-18 中国移动通信集团公司 网络设备监管方法及系统
EP2355407A1 (en) * 2010-01-26 2011-08-10 Hitachi Ltd. Failure display method, failure setting device and monitor control device
CN102736588A (zh) * 2012-05-25 2012-10-17 北京天地云箱科技有限公司 监控方法及系统
CN103365994A (zh) * 2013-07-11 2013-10-23 北京泛华恒兴科技有限公司 基于柔性测试技术的数据存储方法及装置
CN104765749A (zh) * 2014-01-07 2015-07-08 阿里巴巴集团控股有限公司 一种数据存储方法及装置
CN104065540A (zh) * 2014-07-11 2014-09-24 网之易信息技术(北京)有限公司 一种数据监控系统和方法

Also Published As

Publication number Publication date
CN105490835A (zh) 2016-04-13

Similar Documents

Publication Publication Date Title
US9553781B2 (en) Service level agreement based storage access
US10459780B2 (en) Automatic application repair by network device agent
US7590666B2 (en) Predicting capacity consumption in a memory component
CN105490835B (zh) 信息监控方法和装置
US9384114B2 (en) Group server performance correction via actions to server subset
CN104731690B (zh) 适应性度量收集、存储、和警告阈值
CN106878064A (zh) 数据监控方法和装置
US9811356B2 (en) Automated software configuration management
US9652349B2 (en) Quality of information assessment in dynamic sensor networks
US10785281B1 (en) Breaking down the load time of a web page into coherent components
CN109600254B (zh) 全链路日志的生成方法及相关系统
CN106575414A (zh) 上下文平台特征推荐
CN109284213A (zh) 报警方法、装置、电子设备及计算机可读存储介质
CN110007940B (zh) 灰度发布的验证方法、系统、服务器及可读存储介质
CN111385150A (zh) 用于获取信息的方法及装置
WO2017131777A1 (en) Application aware cluster monitoring
CN106790339A (zh) 元数据服务器、网络装置及自动资源管理方法
US9299112B2 (en) Utilizing social media for information technology capacity planning
CN105607983A (zh) 数据异常监控方法和装置
CN112702198B (zh) 异常根因定位方法、装置、电子设备及存储介质
US11218333B2 (en) Systems, methods and computer program products for aggregating building performance data from dissimilar sources
US20210241202A1 (en) Tracking of equipment utilization via distributed ledger
CN108933802A (zh) 用于监控操作的方法和装置
CN110266564A (zh) 探测装置及其执行的方法、以及控制装置及其执行的方法
CN110633182A (zh) 用于监控服务器稳定性的系统、方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant