CN103795580B - 一种数据监控方法、系统及相关设备 - Google Patents

一种数据监控方法、系统及相关设备 Download PDF

Info

Publication number
CN103795580B
CN103795580B CN201210420759.6A CN201210420759A CN103795580B CN 103795580 B CN103795580 B CN 103795580B CN 201210420759 A CN201210420759 A CN 201210420759A CN 103795580 B CN103795580 B CN 103795580B
Authority
CN
China
Prior art keywords
business
client
operation data
service operation
server end
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210420759.6A
Other languages
English (en)
Other versions
CN103795580A (zh
Inventor
余文锋
唐业上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201210420759.6A priority Critical patent/CN103795580B/zh
Priority to TW102138645A priority patent/TWI510955B/zh
Priority to PCT/CN2013/086100 priority patent/WO2014067439A1/en
Publication of CN103795580A publication Critical patent/CN103795580A/zh
Priority to US14/698,301 priority patent/US10200506B2/en
Application granted granted Critical
Publication of CN103795580B publication Critical patent/CN103795580B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5003Managing SLA; Interaction between SLA and QoS
    • H04L41/5009Determining service level performance parameters or violations of service level contracts, e.g. violations of agreed response time or mean time between failures [MTBF]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Debugging And Monitoring (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明实施例公开了数据监控方法、系统及相关设备,应用于通信技术领域。本发明实施例的数据监控方法中,数据监控系统中的服务器端会接收被监控的客户端发送的至少一个业务的业务运行数据,并获取各个业务对应的第一异常策略,如果有业务运行数据命中该业务运行数据对应业务的第一异常策略,则对命中的业务运行数据对应业务进行告警。由于本实施例的数据监控方法是基于客户端的业务进行监控的,则服务器端就会具体地通过各个业务对应的第一异常策略确定出客户端上运行的哪个业务发生异常而告警,不用用户根据监控系统界面上显示的该客户端上运行的所有数据进行人工分析而确定客户端运行业务的故障,从而简化了对于监控数据的分析。

Description

一种数据监控方法、系统及相关设备
技术领域
本发明涉及信息处理技术领域,特别涉及数据监控方法、系统及相关设备。
背景技术
目前的监控系统中大都是通过在被监控设备的外围设备上装载的数据采集进程,对被监控设备上运行的数据进行采集,即将机器的运行数据通过各种方式记录下来,然后该外围设备会通过网络将采集的数据上报给监控设备端,并在监控设备的监控系统界面上显示该数据。
现有技术中监控系统的监控是基于一个设备来进行监控,并由用户通过监控系统界面上展示的数据来人工分析被监控设备是否存在什么问题,这样会使得对于监控数据的分析较为复杂。
发明内容
本发明实施例提供数据监控方法、系统及相关设备,简化对于监控数据的分析。
本发明实施例提供一种数据监控方法,应用于服务器端,包括:
接收客户端发送的至少一个业务的业务运行数据,所述客户端上运行至少一个业务;
获取所述各个业务对应的第一异常策略;
如果所述业务运行数据命中该业务运行数据对应业务的第一异常策略时,对所述命中的业务运行数据对应业务进行告警。
本发明实施例还提供一种数据监控方法,应用于客户端,包括:
采集客户端上运行的至少一个业务的业务运行数据;
将所述采集的至少一个业务的业务运行数据发送给服务器端,以便所述服务器端确定所述业务运行数据命中该业务运行数据对应业务的第一异常策略时,对所述命中的业务运行数据对应业务进行告警。
本发明实施例还提供一种服务器端,包括:
业务数据接收单元,用于接收客户端发送的至少一个业务的业务运行数据,所述客户端上运行至少一个业务;
策略获取单元,用于获取所述各个业务对应的第一异常策略;
告警单元,用于如果所述业务运行数据命中该业务运行数据对应业务的第一异常策略时,对所述命中的业务运行数据对应业务进行告警。
本发明实施例还提供一种客户端,包括:
业务数据采集单元,用于采集客户端上运行的至少一个业务的业务运行数据;
业务数据发送单元,用于将所述采集的至少一个业务的业务运行数据发送给服务器端,以便所述服务器端确定所述业务运行数据命中该业务运行数据对应业务的第一异常策略时,对所述命中的业务运行数据对应业务进行告警。
本发明实施例还提供一种数据监控系统,包括服务器端和至少一个客户端,
所述客户端包括:
业务数据采集单元,用于采集客户端上运行的至少一个业务的业务运行数据;
业务数据发送单元,用于将所述采集的至少一个业务的业务运行数据发送给服务器端,以便所述服务器端确定所述业务运行数据命中该业务运行数据对应业务的第一异常策略时,对所述命中的业务运行数据对应业务进行告警;
所述服务器端包括:
业务数据接收单元,用于接收客户端发送的至少一个业务的业务运行数据,所述客户端上运行至少一个业务;
策略获取单元,用于获取所述各个业务对应的第一异常策略;
告警单元,用于如果所述业务运行数据命中该业务运行数据对应业务的第一异常策略时,对所述命中的业务运行数据对应业务进行告警。
本发明实施例的数据监控方法中,数据监控系统中的服务器端会接收被监控的客户端发送的至少一个业务的业务运行数据,并获取各个业务对应的第一异常策略,如果有业务运行数据命中该业务运行数据对应业务的第一异常策略,则对命中的业务运行数据对应业务进行告警。由于本实施例的数据监控方法是基于客户端的业务进行监控的,则服务器端就会具体地通过各个业务对应的第一异常策略确定出客户端上运行的哪个业务发生异常而告警,不用用户根据监控系统界面上显示的该客户端上运行的所有数据进行人工分析而确定客户端运行业务的故障,从而简化了对于监控数据的分析。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种数据监控系统的结构示意图;
图2是本发明实施例提供的一种数据监控方法的流程图;
图3是本发明实施例提供的另一种数据监控方法的流程图;
图4是本发明实施例提供的另一种数据监控方法的流程图;
图5是本发明实施例提供的另一种数据监控方法的流程图;
图6是本发明实施例提供的一种服务器端的结构示意图;
图7是本发明实施例提供的另一种服务器端的结构示意图;
图8是本发明实施例提供的另一种服务器端的结构示意图;
图9是本发明实施例提供的一种客户端的结构示意图;
图10是本发明实施例提供的另一种客户端的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种数据监控方法,主要是应用于如图1所示的数据监控系统中,具体包括至少一个客户端(图1中以多个客户端为例说明)及连接客户端的服务器端,其中,一个客户端上可以运行至少一个业务,即一个客户端可以包括至少一个业务系统(图1中多个业务系统为例),比如即时通讯的业务系统和文件下载的业务系统等,而服务器端可以对客户端上运行业务的业务数据进行监控。
该监控系统中的服务器端可以按照如下的步骤来对被监控的客户端上运行业务的业务数据进行监控,流程图如图2所示,包括:
步骤101,服务器端接收客户端发送的至少一个业务的业务运行数据,其中,在每个客户端上运行至少一个业务,而客户端发送的某一业务的业务运行数据可以指示客户端运行该业务的具体情况,具体地,业务运行数据可以包括唯一标识一项业务的业务标识,及客户端在运行该业务的过程中处理的数据,比如客户端的文件下载业务系统处理的网络下载数据量、数据扫描量和扫描性能等。
在实际应用中,客户端发送的业务运行数据是由客户端根据预置在该客户端中的业务采集频率进行采集并发送的,其中预置的业务采集频率可以由用户根据实际需要预置在客户端中,比如客户端对于数据的扫描性能等数据的采集可以是100s采集一次等;且客户端对于不同业务而预置的业务采集频率可以相同也可以不同,即客户端可以用不同的频率来采集不同的业务运行数据。
步骤102,服务器端获取各个业务对应的第一异常策略,其中第一异常策略可以包括当客户端运行业务出现异常时的业务参数值,比如客户端处理业务数据量大于一定的值等。
在服务器端会储存各个业务对应的第一异常策略,具体可以按照业务标识与第一异常策略的对应关系进行储存,比如对于客户端运行的即时通讯业务来说,该第一异常策略可以包括任务请求速度小于等于零时等。则服务器端在获取各个业务对应的第一异常策略时,可以根据客户端上报的业务运行数据中的业务标识,在服务器端储存的对应关系中查找,从而得到对应的第一异常策略。
步骤103,服务器端判断步骤101中接收的业务运行数据是否命中步骤102中获取的该业务运行数据对应业务的第一异常策略,即确定该业务运行数据是否满足第一异常策略中的规定,如果命中,执行步骤104,则说明该业务运行数据指示客户端运行该业务时发生异常;如果没有命中,则不会告警。
步骤104,服务器端对命中的业务运行数据对应业务进行告警,比如进行蜂鸣或弹出用户界面并通过弹出的用户界面进行告警。
可见,本发明实施例的数据监控方法中,数据监控系统中的服务器端会接收被监控的客户端发送的至少一个业务的业务运行数据,并获取各个业务对应的第一异常策略,如果有业务运行数据命中该业务运行数据对应业务的第一异常策略,则对命中的业务运行数据对应业务进行告警。由于本实施例的数据监控方法是基于客户端的业务进行监控的,则服务器端就会具体地通过各个业务对应的第一异常策略确定出客户端上运行的哪个业务发生异常而告警,不用用户根据监控系统界面上显示的该客户端上运行的所有数据进行人工分析而确定客户端运行业务的故障,从而简化了对于监控数据的分析。
在另一个具体的实施例中,服务器端不仅可以按照上述步骤101到103基于客户端运行的业务进行数据监控,还可以基于设备进行数据监控,则服务器端在上述步骤102中获取的第一异常策略中不仅可以包括客户端运行各个业务异常时的业务参数值比如数据下载量大于或等于预置的下载量等,还可以包括客户端的机器参数值即该客户端实际的硬件参数值比如CPU的占用率等,且第一异常策略中的机器参数值不一定能指示该客户端的硬件发生异常。参照图3所示,本实施例中的服务器端除了包括上述的步骤101到104,还可以执行步骤105,且上述步骤103中判断业务运行数据是否命中第一异常策略具体为判断业务运行数据是否命中第一异常策略中包括的业务参数值,如果命中则会进一步执行步骤106,具体地:
步骤105,服务器端接收客户端发送的机器运行数据,这里机器运行数据是指客户端实际硬件运行的数据,比如中央处理器(CPU)、内存、网络和磁盘等相关的数据,则客户端不仅可以采集该客户端上运行的各个业务的业务运行数据,还可以采集该客户端的机器运行数据,且客户端可以根据预置的机器采集频率来采集机器运行数据,数据监控系统的每个客户端中预置的机器采集频率可以相同或也可以不同,而对于一个客户端来说,预置的机器采集频率和业务采集频率可以相同也可以不同。
步骤106,服务器端判断步骤105中获接收的机器运行数据是否命中第一异常策略包括的机器参数值,即判断接收的机器运行数据是否满足机器参数值,如果命中,才会执行上述步骤104中对命中的业务运行数据对应业务进行告警,如果没有命中,则不会告警。这样服务器端在对业务进行告警时,可以兼顾到业务运行和机器两方面的因素,只有在客户端的机器运行数据和业务运行数据都分别符合一定的值时才对业务进行告警。
需要说明的是,上述步骤105与步骤101到103之间并没有绝对的顺序关系,且步骤106与步骤103之间也没有绝对的顺序关系,可以同时执行,也可以顺序执行,图3中所示的只是一种具体的实现方式。
在其它具体的实施例中,服务器端不仅可以按照上述步骤101到103基于客户端运行的业务进行数据监控并对异常的业务进行告警,还可以基于设备进行数据监控并对数据监控系统中异常的客户端进行告警,则参照图4所示,本实施例中的服务器端除了可以执行上述步骤101到104之外,还可以执行步骤107到109,具体地:
步骤107,服务器端接收多个客户端分别发送的机器运行数据,这里机器运行数据是指客户端实际硬件运行的数据,比如中央处理器(CPU)、内存、网络和磁盘等相关的数据,则客户端不仅可以采集该客户端上运行的各个业务的业务运行数据,还可以采集该客户端的机器运行数据,且客户端可以根据预置的机器采集频率来采集机器运行数据,数据监控系统的每个客户端中预置的机器采集频率可以相同或也可以不同,而对于一个客户端来说,预置的机器采集频率和业务采集频率可以相同也可以不同。
步骤108,服务器端判断步骤107中获接收的机器运行数据是否命中第二异常策略,即判断接收的机器运行数据是否满足第二异常策略的规则,如果命中,说明该客户端异常,才会执行上述步骤109,如果没有命中,则不会告警。其中第二异常策略可以指示客户端发生异常时的实际硬件参数值,比如CPU的占用率和温度等参数的值,该第二异常策略可以是对于每个客户端都不同,也可以是对所有客户端都相同。
步骤109,服务器端对命中的机器运行数据对应客户端进行告警。
需要说明的是,本实施例中的服务器端还可以对监控的客户端进行管理,具体地,可以储存监控的客户端列表,在列表中记载了每个被监控客户端的网络地址(IP)和客户端的状态(包括异常或正常)等,还可以记载每个客户端上运行业务的状态包括异常或正常的状态等。
上述步骤107到109与步骤101到103之间并没有绝对的顺序关系,可以同时执行,也可以顺序执行,图4中所示的只是一种具体的实现方式。且上述第一异常策略和第二异常策略并不是表示顺序关系,而是为了说明不同的异常策略。
进一步需要说明的是,上述步骤102中获取的某一业务的第一异常策略和步骤108中所述的第二异常策略都可以是由用户根据需要预置在服务器端的,对于第一异常策略来说,服务器端可以先获取某一业务的第一异常策略的第一配置信息,并用第一配置信息替换服务器端中储存的该业务对应的第一异常策略;对于第二异常策略来说,服务器端可以先获取客户端的第二异常策略的第二配置信息,并用第二配置信息替换服务器端中储存的第二异常策略,其中上述第一配置信息和第二配置信息都可以为脚本等。其中服务器端在获取第一配置信息和第二配置信息时可以是从其它设备中导入,或是服务器端从提供的用户界面上接收的用户输入的配置信息等。
通过上述的步骤101到109,服务器端可以对客户端上运行业务的异常进行告警,也可以对硬件发生异常的客户端进行告警,在其它具体的实施例中,服务器还可以在对异常业务进行告警后,即在执行完上述步骤104之后,根据命中的业务运行数据对应业务获得恢复指令,并将该恢复指令发送给上报该业务运行数据的客户端,以指示客户端执行该恢复指令,该恢复指令可以是根据具体的异常业务来获取,比如网络下载业务系统的业务异常,则服务器端可以生成指示客户端重启网络下载业务系统的恢复指令等。
且服务器端也可以再对异常客户端进行告警后,即在执行完上述步骤109后,根据命中的机器运行数据对应客户端获得恢复指令,并将该恢复指令发送给该机器运行数据的客户端,以指示客户端执行该恢复指令,该恢复指令可以是根据具体客户端来获取,比如客户端1异常,则服务器端可以生成指示重启客户端1的恢复指令等。这样可以通过客户端与服务器端之间的交互,可以使异常的客户端或异常的业务对应客户端进行适当调整,恢复正常状态。
本发明实施例还提供一种数据监控方法,主要应用于如图1所示的数据监控系统中,本实施例是系统中的客户端所执行的方法,流程图如图5所示,包括:
步骤201,采集客户端上运行的至少一个业务的业务运行数据,其中,在客户端上运行至少一个业务,而某一业务的业务运行数据可以指示客户端运行该业务的具体情况,具体地,业务运行数据可以包括唯一标识一项业务的业务标识,及客户端在运行该业务的过程中处理的数据,比如客户端的文件下载业务系统处理的网络下载数据量、数据扫描量和扫描性能等。
在实际应用中,客户端可以根据预置在该客户端中的业务采集频率进行采集,其中预置的业务采集频率可以由用户根据实际需要预置在客户端中,比如客户端对于数据的扫描性能等数据的采集可以是100s采集一次等;且客户端对于不同业务而预置的业务采集频率可以相同也可以不同,即客户端可以用不同的频率来采集不同的业务运行数据。
步骤202,将采集的至少一个业务的业务运行数据发送给服务器端,这样服务器端在业务运行数据命中该业务运行数据对应业务的第一异常策略时,对命中的业务运行数据对应业务进行告警,其中服务器端执行的数据监控方法可以参见图2所示流程图对应的实施例,在此不进行赘述。
可见,本发明实施例的数据监控方法中,数据监控系统中的客户端采集至少一个业务的业务运行数据,并将采集的业务运行数据发送给服务器端,这样当服务器端确定有业务运行数据命中该业务运行数据对应业务的第一异常策略,则对命中的业务运行数据对应业务进行告警。由于本实施例的数据监控方法是基于客户端的业务进行监控的,则服务器端就会具体地通过各个业务对应的第一异常策略确定出客户端上运行的哪个业务发生异常而告警,不用用户根据监控系统界面上显示的该客户端上运行的所有数据进行人工分析而确定客户端运行业务的故障,从而简化了对于监控数据的分析。
上述步骤201到202是由客户端采集业务运行数据并发送给服务器端,主要是基于业务进行数据监控,在另一个具体的实施例中,客户端除了可以执行上述步骤201到202之外,还可以基于设备进行数据监控,具体地,客户端可以对机器运行数据进行采集,即对客户端实际的硬件参数比如CPU的占用率等进行采集,并将采集的机器运行数据发送给服务器端,这样服务器端在确定机器运行数据命中第二异常策略时,对命中的机器运行数据对应客户端进行告警,或是服务器端可以按照图3所示流程图对应的数据监控方法进行异常业务的告警。
其中,客户端可以根据预置的机器采集频率来采集机器运行数据,数据监控系统的每个客户端中预置的机器采集频率可以相同或也可以不同,而对于一个客户端来说,预置的机器采集频率和业务采集频率可以相同也可以不同。
在其它具体的实施例中,客户端除了可以执行上述步骤201到202之外,还可以接收服务器端发送的恢复指令,该恢复指令是服务器端根据命中第一异常策略的业务运行数据对应业务或命中第二异常策略的客户端得到的,比如网络下载业务系统的业务异常,则服务器端可以生成指示客户端重启网络下载业务系统的恢复指令等;又比如客户端1异常,则服务器端可以生成指示重启客户端1的恢复指令等。这样可以通过客户端与服务器端之间的交互,在客户端执行了恢复指令后,可以使异常的客户端或异常的业务对应客户端进行适当调整,恢复正常状态。其中客户端与服务器端之间的通信可以基于用户数据报协议(User Datagram Protocol,UDP)等。
以下以一个具体的实施例来说明本发明实施例的数据监控方法,应用于如图1所示的数据监控系统中,参考图6所示,本实施例的服务器端可以包括监听进程、监控进程、共享内存、报警模块和配置模块,具体地:
(1)服务器端的监听进程可以监听客户端上报的业务运行数据和机器运行数据并储存到共享内存中,且监听进程可以向客户端返回对于客户端上报的数据应答;且监听进程还可以监听配置模块中配置的第一异常策略和第二异常策略,并储存到共享内存中。
具体地,客户端上述的业务运行数据和机器运行数据可以如下表1所示。下表1中的CPU负载、HANDLE和内存是机器运行数据,其它的数据为业务运行数据。
其中,字符串(String)的表示格式为开始用一个uint16t表示字符个数,然后接着字符串,且字符串不以0结尾;char表示整形数据,且对于未成功扫描样本的数据需要在扫描结果的基础上加上每个样本的唯一标志码即md5,而对于扫描时间长样本的数据需要在扫描结果的基础上加上样本的唯一标识码md5和扫描时间(单位为毫秒);ucDataCmd为主命令,而ucDataSubcmd为子命令:
表1
(2)服务器端的监听进程可以监听客户端上报的业务运行数据和机器运行数据并储存到共享内存中,这样监控进程可以读取共享内容中的业务运行数据和机器运行数据,且读取共享内存中的第一异常策略和第二异常策略,并按照上述图2到图4所示的流程进行数据监控,在此不进行赘述。
(3)如果需要对业务运行数据对应业务进行告警,则监控进程可以控制报警模块对该业务进行告警,通过可以下发该业务的恢复指令给客户端执行;如果需要对机器运行数据对应客户端进行告警,则监控进程可以控制报警模块对该客户端进行告警,通过可以下发该客户端的恢复指令给相应的客户端执行。
本发明实施例还提供一种服务器端,结构示意图如图7所示,包括:
业务数据接收单元10,用于接收客户端发送的至少一个业务的业务运行数据,所述客户端上运行至少一个业务;
策略获取单元11,用于获取所述各个业务对应的第一异常策略;
告警单元12,用于如果所述业务数据接收单元10接收的业务运行数据命中所述策略获取单元11获取的该业务运行数据对应业务的第一异常策略时,对所述命中的业务运行数据对应业务进行告警。
本发明实施例的服务器端中,业务数据接收单元10会接收被监控的客户端发送的至少一个业务的业务运行数据,策略获取单元11获取各个业务对应的第一异常策略,如果有业务运行数据命中该业务运行数据对应业务的第一异常策略,则告警单元12对命中的业务运行数据对应业务进行告警。由于本实施例的服务器端是基于客户端的业务进行监控的,且服务器端会具体通过各个业务对应的第一异常策略确定出客户端上运行的哪个业务发生异常而告警,不用用户根据监控系统界面上显示的该客户端上运行的所有数据进行人工分析而确定客户端运行业务的故障,从而简化了对于监控数据的分析。
参见图8所示,在一个具体的实施例中,服务器端除了包括如图7所示的结构外,还可以包括机器数据接收单元13、配置单元14和指令发送单元15,具体地:
机器数据接收单元13,用于接收所述客户端发送的机器运行数据;
配置单元14,用于获取某一业务对应的第一异常策略的第一配置信息,用所述第一配置信息替换所述服务器端中储存的该业务对应的第一异常策略,所述第一配置信息为脚本;和/或,用于获取所述客户端的第二异常策略的第二配置信息,用所述第二配置信息替换所述服务器端中储存的第二异常策略,所述第二配置信息为脚本。
指令发送单元15,用于根据所述命中的业务运行数据对应业务,发送恢复指令给所述客户端,以指示所述客户端执行所述恢复指令。
在本实施例的服务器端中,配置单元14可以对服务器端中储存的第一异常策略和第二异常策略进行配置,则策略获取单元11可以获取配置单元14配置后的第一异常策略。当策略获取单元11获取的第一异常策略包括业务参数值和机器参数值,则告警单元12会考虑到客户端上运行的业务及实际硬件的因素,在业务数据接收单元10接收的业务运行数据命中该业务运行数据对应业务的第一异常策略中的业务参数值,且机器数据接收单元13接收的机器运行数据命中第一异常策略中的机器参数值时,才对命中的业务运行数据对应业务进行告警,具体对于业务进行告警的过程可以参见图3所示流程图对应实施例。在另一个具体的实施例中,该告警单元12可以在所述机器数据接收单元13接收的机器运行数据命中第二异常策略时,对所述命中的机器运行数据对应客户端进行告警,具体对于客户端进行告警的过程可以参见图4所示流程图对应实施例。
进一步地,当告警单元12进行告警后,指令发送单元15可以根据告警单元12告警的业务或客户端得到恢复指令,并发送给客户端进行执行,例如告警单元12对网络下载业务系统的业务进行告警,则指令发送单元15可以生成指示客户端重启网络下载业务系统的恢复指令并发送等;又比如告警单元12对客户端1进行告警,则指令发送单元15可以生成指示重启客户端1的恢复指令并发送。
需要说明的是,本实施例的服务器端中还可以包括监控管理单元用来对监控的客户端进行管理,具体地,可以储存监控的客户端列表,在列表中记载了每个被监控客户端的网络地址(IP)和客户端的状态(包括异常或正常)等,还可以记载每个客户端上运行业务的状态包括异常或正常的状态等。
本发明实施例还提供一种客户端,结构示意图如图9所示,包括:
业务数据采集单元20,用于采集客户端上运行的至少一个业务的业务运行数据,该业务数据采集单元20可以根据预置在所述客户端中的业务采集频率进行采集业务运行数据,且在客户端中对于不同业务预置的业务采集频率相同或不同。
业务数据发送单元21,用于将所述业务数据采集单元20采集的至少一个业务的业务运行数据发送给服务器端,以便所述服务器端确定所述业务运行数据命中该业务运行数据对应业务的第一异常策略时,对所述命中的业务运行数据对应业务进行告警。
本发明实施例的客户端中,业务数据采集单元20采集至少一个业务的业务运行数据,业务数据发送单元21将采集的业务运行数据发送给服务器端,这样当服务器端确定有业务运行数据命中该业务运行数据对应业务的第一异常策略,则对命中的业务运行数据对应业务进行告警。由于本实施例的服务器端是基于客户端的业务进行监控的,则服务器端会具体地通过各个业务对应的第一异常策略确定出客户端上运行的哪个业务发生异常而告警,不用用户根据监控系统界面上显示的该客户端上运行的所有数据进行人工分析而确定客户端运行业务的故障,从而简化了对于监控数据的分析。
参见图10所示,在一个具体的实施例中,客户端除了包括如图9所示的结构外,还可以包括:机器数据采集单元22、机器数据发送单元23和指令执行单元24,具体地:
机器数据采集单元22,用于采集所述客户端的机器运行数据,该机器数据采集单元22可以根据预置在所述客户端中的机器采集频率进行采集所述机器运行数据,且在不同客户端中预置的机器采集频率相同或不同。
机器数据发送单元23,用于将所述机器数据采集单元22采集的机器运行数据发送给所述服务器端,以便所述服务器端确定所述机器运行数据命中第二异常策略时,对所述命中的机器运行数据对应客户端进行告警。
指令执行单元24,用于接收所述服务器端根据所述命中的业务运行数据对应业务发送的恢复指令,执行所述恢复指令。
本发明实施例还提供一种数据监控系统,结构示意图如图1所示,主要包括服务器端和至少一个客户端,其中每个客户端中包括至少一个业务系统,每个业务系统运行一个业务,具体地:
客户端,用于采集客户端中至少一个业务系统运行的业务运行数据,并将所述采集的至少一个业务的业务运行数据发送给服务器端;
服务器端,用于接收客户端发送的至少一个业务的业务运行数据,所述客户端上运行至少一个业务;获取所述各个业务对应的第一异常策略;如果所述业务运行数据命中该业务运行数据对应业务的第一异常策略时,对所述命中的业务运行数据对应业务进行告警。
进一步地,服务器端还可以根据对业务的告警,获得恢复指令并发送给客户端执行,指示客户端对某个业务系统进行调整比如重启某个业务系统等。本实施例的客户端可以如图9或10所示,而服务器端可以如图6到8任一图所示,在此不进行赘述。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM)、随机存取存储器(RAM)、磁盘或光盘等。
以上对本发明实施例所提供的数据监控方法、系统及相关设备进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (15)

1.一种数据监控方法,其特征在于,应用于服务器端,包括:
接收客户端发送的至少一个业务的业务运行数据,所述客户端上运行至少一个业务;
获取所述各个业务对应的第一异常策略;
如果所述业务运行数据命中该业务运行数据对应业务的第一异常策略时,对所述命中的业务运行数据对应业务进行告警;
根据所述命中的业务运行数据对应业务,发送恢复指令给所述客户端,以指示所述客户端执行所述恢复指令,对相应的业务系统进行调整。
2.如权利要求1所述的方法,其特征在于,所述第一异常策略包括业务参数值和机器参数值,则所述业务运行数据命中该业务运行数据对应业务的第一异常策略具体包括:所述业务运行数据命中该业务运行数据对应业务的第一异常策略中的业务参数值,所述方法还包括:
接收所述客户端发送的机器运行数据;
则如果所述业务运行数据命中该业务运行数据对应业务的第一异常策略中的业务参数值时,所述方法进一步包括:判断所述机器运行数据是否命中所述第一异常策略中的机器参数值,如果命中,则执行所述对命中的业务运行数据对应业务进行告警的步骤。
3.如权利要求1所述的方法,其特征在于,所述方法还包括:
接收多个客户端分别发送的机器运行数据;
如果所述机器运行数据命中第二异常策略时,对所述命中的机器运行数据对应客户端进行告警。
4.如权利要求3所述的方法,其特征在于,所述方法还包括:
获取某一业务对应的第一异常策略的第一配置信息,用所述第一配置信息替换所述服务器端中储存的该业务对应的第一异常策略,所述第一配置信息为脚本;和/或,
获取所述客户端的第二异常策略的第二配置信息,用所述第二配置信息替换所述服务器端中储存的第二异常策略,所述第二配置信息为脚本。
5.一种数据监控方法,其特征在于,应用于客户端,包括:
采集客户端上运行的至少一个业务的业务运行数据;
将所述采集的至少一个业务的业务运行数据发送给服务器端,以便所述服务器端确定所述业务运行数据命中该业务运行数据对应业务的第一异常策略时,对所述命中的业务运行数据对应业务进行告警;
接收所述服务器端根据所述命中的业务运行数据对应业务发送的恢复指令,执行所述恢复指令,对相应的业务系统进行调整。
6.如权利要求5所述的方法,其特征在于,所述方法还包括:
采集所述客户端的机器运行数据,并将所述机器运行数据发送给所述服务器端,以便所述服务器端确定所述机器运行数据命中第二异常策略时,对所述命中的机器运行数据对应客户端进行告警。
7.如权利要求6所述的方法,其特征在于,
所述业务运行数据是由所述客户端根据预置在所述客户端中的业务采集频率进行采集的;在客户端中对于不同业务预置的业务采集频率相同或不同;和/或,
所述机器运行数据是由所述客户端根据预置在所述客户端中的机器采集频率进行采集的;在不同客户端中预置的机器采集频率相同或不同。
8.一种服务器端,其特征在于,包括:
业务数据接收单元,用于接收客户端发送的至少一个业务的业务运行数据,所述客户端上运行至少一个业务;
策略获取单元,用于获取所述各个业务对应的第一异常策略;
告警单元,用于如果所述业务运行数据命中该业务运行数据对应业务的第一异常策略时,对所述命中的业务运行数据对应业务进行告警;
指令发送单元,用于根据所述命中的业务运行数据对应业务,发送恢复指令给所述客户端,以指示所述客户端执行所述恢复指令,对相应的业务系统进行调整。
9.如权利要求8所述的服务器端,其特征在于,
所述策略获取单元获取的第一异常策略包括业务参数值和机器参数值;
所述服务器端还包括:机器数据接收单元,用于接收所述客户端发送的机器运行数据;
则所述告警单元,用于在所述业务运行数据命中该业务运行数据对应业务的第一异常策略中的业务参数值,且所述机器运行数据命中所述第一异常策略中的机器参数值时,所述对命中的业务运行数据对应业务进行告警。
10.如权利要求9所述的服务器端,其特征在于,
所述告警单元,还用于在所述机器运行数据命中第二异常策略时,对所述命中的机器运行数据对应客户端进行告警。
11.如权利要求10所述的服务器端,其特征在于,还包括:
配置单元,用于获取某一业务对应的第一异常策略的第一配置信息,用所述第一配置信息替换所述服务器端中储存的该业务对应的第一异常策略,所述第一配置信息为脚本;和/或,
用于获取所述客户端的第二异常策略的第二配置信息,用所述第二配置信息替换所述服务器端中储存的第二异常策略,所述第二配置信息为脚本。
12.一种客户端,其特征在于,包括:
业务数据采集单元,用于采集客户端上运行的至少一个业务的业务运行数据;
业务数据发送单元,用于将所述采集的至少一个业务的业务运行数据发送给服务器端,以便所述服务器端确定所述业务运行数据命中该业务运行数据对应业务的第一异常策略时,对所述命中的业务运行数据对应业务进行告警;
指令执行单元,用于接收所述服务器端根据所述命中的业务运行数据对应业务发送的恢复指令,执行所述恢复指令,对相应的业务系统进行调整。
13.如权利要求12所述的客户端,其特征在于,还包括:
机器数据采集单元,用于采集所述客户端的机器运行数据;
机器数据发送单元,用于将所述机器运行数据发送给所述服务器端,以便所述服务器端确定所述机器运行数据命中第二异常策略时,对所述命中的机器运行数据对应客户端进行告警。
14.如权利要求13所述的客户端,其特征在于,
所述业务数据采集单元,用于根据预置在所述客户端中的业务采集频率进行采集业务运行数据;在客户端中对于不同业务预置的业务采集频率相同或不同;和/或,
所述机器数据发送单元,用于根据预置在所述客户端中的机器采集频率进行采集所述机器运行数据;在不同客户端中预置的机器采集频率相同或不同。
15.一种数据监控系统,其特征在于,包括服务器端和至少一个客户端,所述服务器端是如权利要求8至11任一项所述的服务器端,所述客户端是如权利要求12至14任一项所述的客户端。
CN201210420759.6A 2012-10-29 2012-10-29 一种数据监控方法、系统及相关设备 Active CN103795580B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201210420759.6A CN103795580B (zh) 2012-10-29 2012-10-29 一种数据监控方法、系统及相关设备
TW102138645A TWI510955B (zh) 2012-10-29 2013-10-25 Data monitoring method, system and its server side, the client side
PCT/CN2013/086100 WO2014067439A1 (en) 2012-10-29 2013-10-29 Method, system and device for monitorring data
US14/698,301 US10200506B2 (en) 2012-10-29 2015-04-28 Method, system and device for monitoring data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210420759.6A CN103795580B (zh) 2012-10-29 2012-10-29 一种数据监控方法、系统及相关设备

Publications (2)

Publication Number Publication Date
CN103795580A CN103795580A (zh) 2014-05-14
CN103795580B true CN103795580B (zh) 2016-10-26

Family

ID=50626486

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210420759.6A Active CN103795580B (zh) 2012-10-29 2012-10-29 一种数据监控方法、系统及相关设备

Country Status (4)

Country Link
US (1) US10200506B2 (zh)
CN (1) CN103795580B (zh)
TW (1) TWI510955B (zh)
WO (1) WO2014067439A1 (zh)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104581806B (zh) * 2014-12-19 2018-05-18 联动优势电子商务有限公司 一种监测业务系统的方法及终端
CN105471973A (zh) * 2015-11-18 2016-04-06 深圳云联讯数据科技有限公司 基于监控对象指示灯颜色的远程监控方法及系统
CN105553769B (zh) * 2015-12-15 2019-03-05 北京奇虎科技有限公司 一种数据采集分析系统和方法
US9843474B2 (en) 2015-12-23 2017-12-12 Intel Corporation Telemetry adaptation
CN107797902B (zh) * 2016-09-06 2021-07-30 北京百度网讯科技有限公司 用于监控机器人操作系统的消息传输频率的方法和装置
CN107181639A (zh) * 2017-03-31 2017-09-19 北京奇艺世纪科技有限公司 一种通信状态的监控方法及装置
CN107563713A (zh) * 2017-06-20 2018-01-09 华迪计算机集团有限公司 一种电子公文系统及其运行监控的方法
CN107943662A (zh) * 2017-12-12 2018-04-20 联想(北京)有限公司 一种信息处理方法和服务器
TWI644228B (zh) * 2017-12-25 2018-12-11 中華電信股份有限公司 伺服器及其監控方法
CN110300136B (zh) * 2018-03-22 2021-12-24 杭州萤石软件有限公司 一种云台控制优化方法和系统
CN109165137A (zh) * 2018-07-27 2019-01-08 曙光信息产业(北京)有限公司 数据分析及告警方法和系统
CN111555896B (zh) * 2019-02-12 2023-01-20 昆山纬绩资通有限公司 数据传输监控方法与系统
CN109842631A (zh) * 2019-03-21 2019-06-04 安徽威尔信通信科技有限责任公司 一种网络信息安全智能分析系统
CN110513252B (zh) * 2019-08-30 2020-11-24 湘电风能有限公司 一种风电场scada系统数据异常告警修复系统与方法
CN112532404B (zh) * 2019-09-17 2023-09-22 中国移动通信集团广东有限公司 一种数据监控方法、装置及电子设备
CN110650055A (zh) * 2019-09-30 2020-01-03 凌云天博光电科技股份有限公司 广电网络设备监测方法及系统
CN110990903B (zh) * 2019-11-29 2023-07-18 腾讯科技(深圳)有限公司 一种云端系统以及云端系统保护方法
CN111209165B (zh) * 2020-01-05 2021-03-16 光大兴陇信托有限责任公司 一种基于通道的两级监控处理方法
CN111327492B (zh) * 2020-01-21 2020-12-15 光大兴陇信托有限责任公司 一种全链路监控处理方法
CN111901140A (zh) * 2020-06-11 2020-11-06 北京百度网讯科技有限公司 异常处理方法、装置、电子设备及存储介质
CN113965781B (zh) * 2020-07-21 2023-11-24 东初智能科技(上海)有限公司 一种风控策略执行方法和装置
CN112016125B (zh) * 2020-09-08 2023-10-10 杭州海康威视数字技术股份有限公司 针对记录仪的异常处理方法、装置及设备
CN112650644A (zh) * 2020-12-22 2021-04-13 南方电网深圳数字电网研究院有限公司 一种基于prometheus的监控方法及系统
CN112685256B (zh) * 2020-12-30 2023-05-09 上海掌门科技有限公司 服务端监控方法、设备和介质
CN113190200B (zh) * 2021-05-10 2023-04-07 郑州魔王大数据研究院有限公司 展会数据安全的防护方法及装置
WO2024065238A1 (en) * 2022-09-28 2024-04-04 Yu Wenfeng Systems, methods, and media for protecting application programming interfaces

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101202649A (zh) * 2006-12-14 2008-06-18 英业达股份有限公司 计算机设备信息的收集和管理方法
CN201213268Y (zh) * 2008-05-15 2009-03-25 研华股份有限公司 具有监控远端设备的信息服务服务器
CN101714930A (zh) * 2009-12-30 2010-05-26 北京世纪互联宽带数据中心有限公司 一种实现网络监控的方法及系统
CN101826993A (zh) * 2010-02-04 2010-09-08 蓝盾信息安全技术股份有限公司 一种安全事件监测方法、系统及装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7197559B2 (en) * 2001-05-09 2007-03-27 Mercury Interactive Corporation Transaction breakdown feature to facilitate analysis of end user performance of a server system
US8974304B2 (en) * 2004-12-22 2015-03-10 Wms Gaming Inc. System, method, and apparatus for detecting abnormal behavior of a wagering game machine
US7647430B2 (en) * 2005-01-19 2010-01-12 Microsoft Corporation Remote command framework for devices
GB0624168D0 (en) * 2006-12-04 2007-01-10 Axiom Systems Ltd Service assembly and delivery
TWI318283B (en) * 2007-07-06 2009-12-11 Chunghwa Telecom Co Ltd Network-based air-conditioning equipment remote monitoring and management system
TWI439855B (zh) * 2007-11-09 2014-06-01 Inventec Appliances Corp 數據庫即時監控系統及方法
EP2098970A1 (en) * 2008-03-07 2009-09-09 British Telecommunications public limited company Abnormal event time thresholds
CN101668301A (zh) * 2008-09-03 2010-03-10 中兴通讯股份有限公司 一种监控短信中心内节点运行状态的方法和装置
TWI369623B (en) * 2008-11-07 2012-08-01 Chunghwa Telecom Co Ltd Control system and protection method for integrated information security service
US9629012B2 (en) * 2010-09-20 2017-04-18 Empire Technology Development Llc Dynamic mobile application quality-of-service monitor
CN102547807A (zh) * 2010-12-21 2012-07-04 中兴通讯股份有限公司 一种移动通讯设备故障的检测方法及系统
CN102609346B (zh) * 2012-01-16 2014-12-03 深信服网络科技(深圳)有限公司 基于业务操作的监控方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101202649A (zh) * 2006-12-14 2008-06-18 英业达股份有限公司 计算机设备信息的收集和管理方法
CN201213268Y (zh) * 2008-05-15 2009-03-25 研华股份有限公司 具有监控远端设备的信息服务服务器
CN101714930A (zh) * 2009-12-30 2010-05-26 北京世纪互联宽带数据中心有限公司 一种实现网络监控的方法及系统
CN101826993A (zh) * 2010-02-04 2010-09-08 蓝盾信息安全技术股份有限公司 一种安全事件监测方法、系统及装置

Also Published As

Publication number Publication date
WO2014067439A1 (en) 2014-05-08
CN103795580A (zh) 2014-05-14
US10200506B2 (en) 2019-02-05
US20150304457A1 (en) 2015-10-22
TW201416898A (zh) 2014-05-01
TWI510955B (zh) 2015-12-01

Similar Documents

Publication Publication Date Title
CN103795580B (zh) 一种数据监控方法、系统及相关设备
CN109769261B (zh) 一种网络故障处理方法及装置
CN108363662A (zh) 一种应用程序测试方法、存储介质及终端设备
CN112118174B (zh) 软件定义数据网关
CN105072139B (zh) 推荐方法和装置
US20090228586A1 (en) Periodic exporting of information over a flow protocol
CN107908686B (zh) 信息推送方法、装置、服务器以及可读存储介质
CN111400127B (zh) 业务日志的监控方法及装置、存储介质、计算机设备
CN112202635B (zh) 链路的监控方法、装置、存储介质以及电子装置
CN111538563A (zh) 一种对Kubernetes的事件分析方法及装置
CN104243282B (zh) 一种信息通知方法及服务器
CN109767509A (zh) 一种设备运维管理方法、装置、可读介质及电子设备
CN108520043A (zh) 数据对象采集方法、装置及系统、计算机可读存储介质
CN110430070A (zh) 一种服务状态分析方法、装置、服务器、数据分析设备及介质
CN113506137A (zh) 一种电子邮件营销分析方法、系统和设备
EP1622310A2 (en) Administration system for network management systems
CN109921920A (zh) 一种故障信息处理方法与相关装置
CN115567959A (zh) 一种路由器EasyMesh组网可视化评估系统及方法
CN113347045A (zh) 一种告警消息处理方法及装置
CN106485378A (zh) 业务数据的传输方法、系统和服务器
CN112055058A (zh) 数据的存储方法、装置及计算机可读存储介质
CN110430093B (zh) 一种数据处理方法、装置及计算机可读存储介质
CN114006936B (zh) 系统运行信息实时采集方法、服务器及客户端
CN114244698B (zh) 一种基于mqtt的cpe管理配置方法
CN113783755A (zh) 网络监测方法、装置、存储介质及电子装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant