CN104022902A - 一种监控服务器集群的方法和系统 - Google Patents

一种监控服务器集群的方法和系统 Download PDF

Info

Publication number
CN104022902A
CN104022902A CN201410240983.6A CN201410240983A CN104022902A CN 104022902 A CN104022902 A CN 104022902A CN 201410240983 A CN201410240983 A CN 201410240983A CN 104022902 A CN104022902 A CN 104022902A
Authority
CN
China
Prior art keywords
server
monitoring
data message
data
message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410240983.6A
Other languages
English (en)
Inventor
徐宝龙
江勇
冯玉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BOE Technology Group Co Ltd
Beijing BOE Display Technology Co Ltd
Original Assignee
BOE Technology Group Co Ltd
Beijing BOE Display Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BOE Technology Group Co Ltd, Beijing BOE Display Technology Co Ltd filed Critical BOE Technology Group Co Ltd
Priority to CN201410240983.6A priority Critical patent/CN104022902A/zh
Publication of CN104022902A publication Critical patent/CN104022902A/zh
Priority to US14/436,735 priority patent/US10084681B2/en
Priority to PCT/CN2014/086308 priority patent/WO2015180291A1/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/14Arrangements for monitoring or testing data switching networks using software, i.e. software packages
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/40Support for services or applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/149Network analysis or design for prediction of maintenance
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring

Abstract

本发明公开了一种监控服务器集群的方法和系统,用于解决现有技术中存在的无法对不同种类服务器进行统一监控和管理的问题。方法包括:获取用户输入的与需要监控的服务器相关的监控信息,该监控信息包括需要监控的服务器的标识信息、监控时间和监控内容;根据服务器标识信息与脚本语言的对应关系列表,确定出该服务器对应的脚本语言;根据获取到的监控内容,采用该服务器对应的脚本语言,生成监控命令,以指示该服务器按照监控内容返回相应的数据信息;在监控时间内,将监控命令发送给该服务器,以及接收该服务器返回的响应消息,该响应消息中携带该服务器根据监控命令得到的数据信息,从而实现了对不同种类的服务器的监控和管理。

Description

一种监控服务器集群的方法和系统
技术领域
本发明涉及网络通信技术领域,特别涉及一种监控服务器集群的方法和系统。
背景技术
随着信息技术的飞速发展,不同企业更多地使用服务器来管理企业的资源并为用户提供各种服务,服务器通常又分为文件服务器、数据库服务器和应用程序服务器等。目前,企业内部所使用的服务器种类以及数量越来越多,以满足企业正常运营的需求,对于数量庞大、种类繁多的服务器的管理和监控已成为企业系统管理员的业务重心。
服务器监控是指将远程服务器运行得到的数据通过各种方式记录下来,并在需要时可以随时调用监控记录以便进行查看。面对几十台甚至上百台的服务器以及服务器上的各种应用信息,系统管理员很难做到全面,实时的监控,因此,需要一种自动化的监控软件来对大量的服务器以及在这些服务器上运行的各类应用软件进行统一管理和监控,以达到全面、实时地监控。
目前的监控软件都是服务器生产商为自身制造的服务器量身定做的监控功能,不能实现对不同种类服务器的监控。而企业一般根据自身需求会购置不同种类的服务器,由于不同种类服务器的监控软件都是相对独立的,这样,企业只能使用各种类服务器对应的监控软件实现对该类服务器的监控,无法对不同种类服务器进行统一监控和管理。
基于现有的监控软件,若想要实现对不同种类服务器的管理,只能先通过各种类服务器对应的监控软件实现对该类服务器的监控,再由系统管理人员统计对不同种类的服务器监控得到的数据,以实现对不同种类的服务器的管理,但该方式处理效率低,容易出错。
发明内容
本发明实施例提供了一种监控服务器集群的方法和系统,用于解决现有对不同种类的服务器管理时,处理效率低,容易出错的问题。
本发明实施例提供的一种监控服务器集群的方法,该方法包括:
获取用户输入的与需要监控的服务器相关的监控信息,所述监控信息包括需要监控的服务器的标识信息、监控时间和监控内容;
根据服务器标识信息与脚本语言的对应关系列表,确定出所述服务器对应的脚本语言;
根据获取到的监控内容,采用所述服务器对应的脚本语言,生成监控命令,以指示所述服务器按照所述监控内容返回相应的数据信息;
在所述监控时间内,将所述监控命令发送给所述服务器,以及接收所述服务器返回的响应消息,所述响应消息中携带所述服务器根据所述监控命令得到的数据信息。
较佳地,在所述监控时间内,将所述监控命令发送给所述服务器,包括:
在所述监控时间内,按照所述监控信息所包含的发送频率,周期性将所述监控命令发送给所述服务器。
较佳地,接收到所述服务器返回的响应消息之后,该方法还包括:
从接收到的响应消息中,提取出所述响应消息中的所有数据信息;
根据提取出的数据信息,生成数据信息列表并保存,所述数据信息列表与所述服务器的标识信息对应,所述数据信息列表中包含数据名及其对应的数据信息。
较佳地,生成所述数据信息列表之后,该方法还包括:
对于所述数据信息列表中的每条数据信息,将该数据信息与设定的阈值范围进行比较;
在该数据信息超出所述阈值范围时,进行报警,并将该数据信息、对应的数据名以及对应的服务器标识信息通知给用户。
较佳地,生成所述数据信息列表之后,该方法还包括:
对所述数据信息列表中保存的同一数据名对应的所有数据信息,进行分析,确定出该数据名对应的所有数据信息的变化趋势;
根据确定出的变化趋势,预测所述服务器下一次返回的数据信息;
在预测出所述服务器下一次返回的数据信息超出设定的阈值范围时,进行报警,并将分析结果及对应的服务器标识信息通知给用户。
较佳地,该方法还包括:
接收用户发送的更新命令,并根据所述更新命令中携带的服务器标识信息与脚本语言,更新所述对应关系列表。
本发明实施例提供的一种监控服务器集群的系统,该系统包括:
获取单元,用于获取用户输入的与需要监控的服务器相关的监控信息,所述监控信息包括需要监控的服务器的标识信息、监控时间和监控内容;
处理单元,用于根据服务器标识信息与脚本语言的对应关系列表,确定出所述服务器对应的脚本语言;以及根据获取到的监控内容,采用所述服务器对应的脚本语言,生成监控命令,以指示所述服务器按照所述监控内容返回相应的数据信息;
通信单元,用于在所述监控时间内,将所述监控命令发送给所述服务器,以及接收所述服务器返回的响应消息,所述响应消息中携带所述服务器根据所述监控命令得到的数据信息。
较佳地,所述通信单元具体用于:
在所述监控时间内,按照所述监控信息所包含的发送频率,周期性将所述监控命令发送给所述服务器。
较佳地,所述处理单元还用于:
从所述通信单元接收到的响应消息中,提取出所述响应消息中的所有数据信息;根据提取出的数据信息,生成数据信息列表并保存,所述数据信息列表与所述服务器的标识信息对应,所述数据信息列表中包含数据名及其对应的数据信息。
较佳地,所述处理单元还用于:
对于所述数据信息列表中的每条数据信息,将该数据信息与设定的阈值范围进行比较;在该数据信息超出所述阈值范围时,进行报警,并将该数据信息、对应的数据名以及对应的服务器标识信息通知给用户。
较佳地,所述处理单元还用于:
对所述数据信息列表中保存的同一数据名对应的所有数据信息,进行分析,确定出该数据名对应的所有数据信息的变化趋势;根据确定出的变化趋势,预测所述服务器下一次返回的数据信息;以及在预测出所述服务器下一次返回的数据信息超出设定的阈值范围时,进行报警,并将分析结果及对应的服务器标识信息通知给用户。
较佳地,所述通信单元还用于:接收用户发送的更新命令;
所述处理单元还用于:根据所述更新命令中携带的服务器标识信息与脚本语言,更新所述对应关系列表。
本发明实施例提供的方法和系统中,在获取到用户输入的监控信息后,根据服务器标识信息与脚本语言的对应关系列表,确定出需要监控的服务器对应的脚本语言,根据获取到的监控内容,采用该服务器对应的脚本语言,生成该服务器能够识别的监控命令,以指示该服务器按照监控内容返回相应的数据信息,在监控时间内,将监控命令发送给该服务器,以及接收该服务器返回的响应消息,该响应消息中携带该服务器根据监控命令得到的数据信息。由于针对不同种类的服务器,采用服务器对应的脚本语言生成该服务器能够识别的监控命令,从而实现了对不同种类的服务器的监控和管理,采用本发明实施例提供的方案,处理速度快、效率高、且准确度高。
附图说明
图1为本发明实施例提供的一种监控服务器集群的方法的流程示意图;
图2为本发明实施例提供的一种监控服务器集群的系统的示意图。
具体实施方式
本发明针对不同种类的服务器,采用服务器对应的脚本语言生成该服务器能够识别的监控命令,从而实现了对不同种类的服务器的监控和管理。
下面结合说明书附图对本发明实施例作进一步详细描述。应当理解,此处所描述的实施例仅用于说明和解释本发明,并不用于限定本发明。
如图1所示,本发明实施例提供了一种监控服务器集群的方法,该方法包括以下步骤:
步骤11、获取用户输入的与需要监控的服务器相关的监控信息,该监控信息包括需要监控的服务器的标识信息、监控时间和监控内容。
其中,监控时间用于指示需要监控该服务器的时间范围,该监控时间包括监控起始时刻和监控终止时刻,或者,监控时间包括监控起始时刻和监控时长。
监控内容包括CPU监控,内存监控,硬盘(DISK)监控,网络信息等系统指标的监控。
需要监控的服务器可以为HP Unix服务器,HP Windows NT服务器,IBMAIX服务器,IBM Windows NT服务器,SUN Swith交换机,以及各种PC机等等。
步骤12、根据服务器标识信息与脚本语言的对应关系列表,确定出需要监控的服务器对应的脚本语言(Scripting Language)。
步骤13、根据获取到的监控内容,采用需要监控的服务器对应的脚本语言,生成监控命令,以指示需要监控的服务器按照监控内容返回相应的数据信息;
本步骤中,保存生成的监控命令及获取到的监控信息,在满足监控时间条件时,再将该监控命令发送给相应的服务器。
步骤14、在监控时间内,将监控命令发送给需要监控的服务器,以及接收需要监控的服务器返回的响应消息,该响应消息中携带需要监控的服务器根据监控命令得到的数据信息。
本发明实施例中,在获取到用户输入的监控信息后,根据服务器标识信息与脚本语言的对应关系列表,确定出需要监控的服务器对应的脚本语言,根据获取到的监控内容,采用该服务器对应的脚本语言,生成该服务器能够识别的监控命令,以指示该服务器按照监控内容返回相应的数据信息,在监控时间内,将监控命令发送给该服务器,以及接收该服务器返回的响应消息,该响应消息中携带该服务器根据监控命令得到的数据信息。由于针对不同种类的服务器,采用服务器对应的脚本语言生成该服务器能够识别的监控命令,从而实现了对不同种类的服务器的监控和管理,采用本发明实施例提供的方案,处理速度快、效率高、且准确度高。
较佳地,用户输入的监控信息还包括监控频率。
其中,监控频率可以是时间信息,相邻两次发送监控命令所间隔的时间,如每隔1小时发送一次监控命令;该监控频率也可以是次数信息,即在监控时间内需要发送监控命令的次数,如在监控时间内需要发送10次监控命令。本发明实施例不对监控频率的实现方式进行限定。
在实施中,采用脚本语言生成的监控命令一般是字符串,以指示需要监控的服务器返回的监控内容、以及返回数据信息时所采用的格式。例如,生成的监控命令为:
bdf|sed-n'2,$'p|awk'NF==1{printf$1;next}{print}'|awk-F'''{printf"%s%s\n",$6,$5}';
上述监控命令用于获取服务器各个文件系统空间的使用率,其中,上述监控命令中的bdf表示获取服务器各个文件系统空间的使用率,上述监控命令中除bdf之外的其他字符串表示返回数据信息时所采用的格式。
如果服务器仅执行上述监控命令中的bdf子命令,则返回的响应消息的格式如下:
其中,Filesystem参数表示逻辑卷(即文件)名称;kbytes参数表示文件总的内存大小,单位是KB;used参数表示该文件已使用的内存大小,单位是KB;avail参数表示该文件可用的内存大小,单位是KB;%used参数表示该文件的使用率,即已使用的内存大小占总的内存大小的百分比;Mounted on参数表示挂载的文件系统名字。
如果服务器执行上述完整的监控命令,则返回的响应消息的格式如下:
/  97%;
/stand 10%;
/var  2%;
……。
在实施中,若监控信息中包含发送频率,步骤14中,在监控时间内,将生成的监控命令发送给需要监控的服务器,包括:
在监控时间内,按照监控信息所包含的发送频率,周期性将该监控命令发送给需要监控的服务器。
基于上述任一实施例,步骤14中,在监控时间内,将生成的监控命令发送给需要监控的服务器,包括:
采用Telnet协议或SSH协议,将监控命令发送给该服务器;
接收需要监控的服务器返回的响应消息,包括:
采用Telnet协议或SSH协议,接收该服务器返回的响应消息。
其中,网络通信协议采用Telnet/SSH协议,Telnet协议是TCP/IP协议族中的一员,是Internet远程登陆服务的标准协议和主要方式,几乎所有的服务器都会遵循该协议。SSH是目前较可靠,专为远程登录会话和其他网络服务提供安全性的协议。
基于上述任一实施例,在实施中,步骤14之后,该方法还包括:
从接收到的响应消息中,提取出该响应消息中的所有数据信息;
根据提取出的数据信息,生成数据信息列表并保存,该数据信息列表与需要监控的服务器的标识信息对应,该数据信息列表中包含数据名(Name)及其对应的数据信息(Value)。
具体的,采用正则表达式技术对接收到的响应消息进行过滤,从而得到有用的信息(即服务器按照监控内容返回的所有数据信息)。其中,正则表达式技术现在JAVA,C++,Perl等编程语言以及脚本语言均可以支持的数据处理方式。再通过与监控命令对应的数据抓取规则,对过滤得到的各数据信息进行匹配,从而生成一个数据信息列表,该数据信息列表中包含数据名及其对应的数据信息,并将该列表与发送该数据信息的服务器的标识信息进行绑定。
优选的,该数据信息列表中还包括接收到各数据信息的时间。
优选的,在生成了数据信息列表之后,将该数据信息列表保存于数据库中。其中,数据库的连接可以采用ODBC,JBDC等的数据库连接技术,同时使用数据库连接池,使得该连接池中的连接可以得到高效、安全的复用,避免了数据库连接频繁建立、关闭的开销。
进一步,作为一种优选的处理方式,生成数据信息列表之后,该方法还包括:
对于数据信息列表中的每条数据信息,将该数据信息与设定的阈值范围进行比较;
在该数据信息超出设定的阈值范围时,进行报警,并将该数据信息、对应的数据名以及对应的服务器标识信息通知给用户。
具体的,将数据信息的类型分为值域型和波动型,值域型表示该数据在服务器中是一个类似线性增长或减少的数据,值域型又进一步包括数值类型和字符串类型,数值类型的数据信息在进行处理时比较数值的大小,字符串类型的数据信息在处理时比较字符串的内容是否一致,值域型一旦超出设定的阈值范围就需进行报警,以使用户能够及时解决问题,以达到出现问题及时定位,及时解决的目的;
波动型表示该数量在服务器上表现为一个波动的值,通过在设定时间内出现的超过设定的阈值范围的次数作为是否进行报警的标准。对于波动型数据信息,判断设定时间内超出设定的阈值范围的次数是否达到上限值,若是,则进行报警。
在实施中,对于数据信息列表中的每条数据信息,在对该条数据信息进行处理时,先判断该数据信息的类型;若为值域型,则在该数据信息超出设定的阈值范围时,进行报警;若波动型,则判断设定时间内超出设定的阈值范围的次数是否达到上限值,若是,则进行报警。
优选的,可以设定免检验数据列表,该免检验数据列表中的数据名对应的数据信息不需要进行报警检验。则在实施中,对于数据信息列表中的每条数据信息,在对该条数据信息进行处理时,先判断该数据信息对应的数据名是否包含的免检验数据列表中,若是,则不需要对该数据信息进行处理,若否,则判断该数据信息的类型,进一步判断是否需要进行报警。
作为一种优选的处理方式,生成数据信息列表之后,该方法还包括:
对数据信息列表中保存的同一数据名对应的所有数据信息,进行分析,确定出该数据名对应的所有数据信息的变化趋势;
根据确定出的变化趋势,预测需要监控的服务器下一次返回的数据信息;
在预测出该服务器下一次返回的数据信息超出设定的阈值范围时,进行报警,并将分析结果及对应的服务器标识信息通知给用户。
具体的,根据服务器返回的历史数据信息,进行预警,以达到在问题发生前预测问题的出现并在问题发生前及时解决问题。
基于上述任一实施例,在实施中,优选的,报警方式包括:通过邮件进行报警、通过UI进行报警、或者通过声音进行报警。
基于上述任一实施例,该方法还包括:
接收用户发送的更新命令,并根据该更新命令中携带的服务器标识信息与脚本语言,更新保存的服务器标识信息与脚本语言的对应关系列表。
上述方法处理流程可以用软件程序实现,该软件程序可以存储在存储介质中,当存储的软件程序被调用时,执行上述方法步骤。
基于同一发明构思,本发明实施提供了一种监控服务器集群的系统,参见图2所示,该系统包括:
获取单元21,用于获取用户输入的与需要监控的服务器相关的监控信息,所述监控信息包括需要监控的服务器的标识信息、监控时间和监控内容;
处理单元22,用于根据服务器标识信息与脚本语言的对应关系列表,确定出需要监控的服务器对应的脚本语言;以及根据获取到的监控内容,采用所述服务器对应的脚本语言,生成监控命令,以指示所述服务器按照所述监控内容返回相应的数据信息;
通信单元23,用于在所述监控时间内,将所述监控命令发送给所述服务器,以及接收所述服务器返回的响应消息,所述响应消息中携带所述服务器根据所述监控命令得到的数据信息。
在实施中,通信单元23具体用于:
在监控时间内,按照监控信息所包含的发送频率,周期性将处理单元22生成的监控命令发送给需要监控的服务器。
基于上述任一实施例,通信单元23具体用于:
采用Telnet协议或SSH协议,将监控命令发送给需要监控的服务器;以及采用Telnet协议或SSH协议,接收该服务器返回的响应消息。
基于上述任一实施例,在实施中,处理单元22还用于:
从通信单元23接收到的响应消息中,提取出该响应消息中的所有数据信息;根据提取出的数据信息,生成数据信息列表并保存,该数据信息列表与需要监控的服务器的标识信息对应,且该数据信息列表中包含数据名及其对应的数据信息。
进一步,作为一种优选的处理方式,处理单元22还用于:
对于数据信息列表中的每条数据信息,将该数据信息与设定的阈值范围进行比较;在该数据信息超出所述阈值范围时,进行报警,并将该数据信息、对应的数据名以及对应的服务器标识信息通知给用户。
作为另一种优选的处理方式,处理单元22还用于:
对数据信息列表中保存的同一数据名对应的所有数据信息,进行分析,确定出该数据名对应的所有数据信息的变化趋势;根据确定出的变化趋势,预测需要监控的服务器下一次返回的数据信息;以及在预测出该服务器下一次返回的数据信息超出设定的阈值范围时,进行报警,并将分析结果及对应的服务器标识信息通知给用户。
基于上述任一实施例,通信单元23还用于:接收用户发送的更新命令;
处理单元22还用于:根据该更新命令中携带的服务器标识信息与脚本语言,更新保存的服务器标识信息与脚本语言的对应关系列表。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (12)

1.一种监控服务器集群的方法,其特征在于,该方法包括:
获取用户输入的与需要监控的服务器相关的监控信息,所述监控信息包括需要监控的服务器的标识信息、监控时间和监控内容;
根据服务器标识信息与脚本语言的对应关系列表,确定出所述服务器对应的脚本语言;
根据获取到的监控内容,采用所述服务器对应的脚本语言,生成监控命令,以指示所述服务器按照所述监控内容返回相应的数据信息;
在所述监控时间内,将所述监控命令发送给所述服务器,以及接收所述服务器返回的响应消息,所述响应消息中携带所述服务器根据所述监控命令得到的数据信息。
2.如权利要求1所述的方法,其特征在于,在所述监控时间内,将所述监控命令发送给所述服务器,包括:
在所述监控时间内,按照所述监控信息所包含的发送频率,周期性将所述监控命令发送给所述服务器。
3.如权利要求1所述的方法,其特征在于,接收到所述服务器返回的响应消息之后,该方法还包括:
从接收到的响应消息中,提取出所述响应消息中的所有数据信息;
根据提取出的数据信息,生成数据信息列表并保存,所述数据信息列表与所述服务器的标识信息对应,所述数据信息列表中包含数据名及其对应的数据信息。
4.如权利要求3所述的方法,其特征在于,生成所述数据信息列表之后,该方法还包括:
对于所述数据信息列表中的每条数据信息,将该数据信息与设定的阈值范围进行比较;
在该数据信息超出所述阈值范围时,进行报警,并将该数据信息、对应的数据名以及对应的服务器标识信息通知给用户。
5.如权利要求3所述的方法,其特征在于,生成所述数据信息列表之后,该方法还包括:
对所述数据信息列表中保存的同一数据名对应的所有数据信息,进行分析,确定出该数据名对应的所有数据信息的变化趋势;
根据确定出的变化趋势,预测所述服务器下一次返回的数据信息;
在预测出所述服务器下一次返回的数据信息超出设定的阈值范围时,进行报警,并将分析结果及对应的服务器标识信息通知给用户。
6.如权利要求1所述的方法,其特征在于,该方法还包括:
接收用户发送的更新命令,并根据所述更新命令中携带的服务器标识信息与脚本语言,更新所述对应关系列表。
7.一种监控服务器集群的系统,其特征在于,该系统包括:
获取单元,用于获取用户输入的与需要监控的服务器相关的监控信息,所述监控信息包括需要监控的服务器的标识信息、监控时间和监控内容;
处理单元,用于根据服务器标识信息与脚本语言的对应关系列表,确定出所述服务器对应的脚本语言;以及根据获取到的监控内容,采用所述服务器对应的脚本语言,生成监控命令,以指示所述服务器按照所述监控内容返回相应的数据信息;
通信单元,用于在所述监控时间内,将所述监控命令发送给所述服务器,以及接收所述服务器返回的响应消息,所述响应消息中携带所述服务器根据所述监控命令得到的数据信息。
8.如权利要求7所述的系统,其特征在于,所述通信单元具体用于:
在所述监控时间内,按照所述监控信息所包含的发送频率,周期性将所述监控命令发送给所述服务器。
9.如权利要求7所述的系统,其特征在于,所述处理单元还用于:
从所述通信单元接收到的响应消息中,提取出所述响应消息中的所有数据信息;根据提取出的数据信息,生成数据信息列表并保存,所述数据信息列表与所述服务器的标识信息对应,所述数据信息列表中包含数据名及其对应的数据信息。
10.如权利要求9所述的系统,其特征在于,所述处理单元还用于:
对于所述数据信息列表中的每条数据信息,将该数据信息与设定的阈值范围进行比较;在该数据信息超出所述阈值范围时,进行报警,并将该数据信息、对应的数据名以及对应的服务器标识信息通知给用户。
11.如权利要求9所述的系统,其特征在于,所述处理单元还用于:
对所述数据信息列表中保存的同一数据名对应的所有数据信息,进行分析,确定出该数据名对应的所有数据信息的变化趋势;根据确定出的变化趋势,预测所述服务器下一次返回的数据信息;以及在预测出所述服务器下一次返回的数据信息超出设定的阈值范围时,进行报警,并将分析结果及对应的服务器标识信息通知给用户。
12.如权利要求7所述的系统,其特征在于,所述通信单元还用于:接收用户发送的更新命令;
所述处理单元还用于:根据所述更新命令中携带的服务器标识信息与脚本语言,更新所述对应关系列表。
CN201410240983.6A 2014-05-30 2014-05-30 一种监控服务器集群的方法和系统 Pending CN104022902A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201410240983.6A CN104022902A (zh) 2014-05-30 2014-05-30 一种监控服务器集群的方法和系统
US14/436,735 US10084681B2 (en) 2014-05-30 2014-09-11 Method and system for monitoring server cluster
PCT/CN2014/086308 WO2015180291A1 (zh) 2014-05-30 2014-09-11 监控服务器集群的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410240983.6A CN104022902A (zh) 2014-05-30 2014-05-30 一种监控服务器集群的方法和系统

Publications (1)

Publication Number Publication Date
CN104022902A true CN104022902A (zh) 2014-09-03

Family

ID=51439485

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410240983.6A Pending CN104022902A (zh) 2014-05-30 2014-05-30 一种监控服务器集群的方法和系统

Country Status (3)

Country Link
US (1) US10084681B2 (zh)
CN (1) CN104022902A (zh)
WO (1) WO2015180291A1 (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104202201A (zh) * 2014-09-16 2014-12-10 广州金山网络科技有限公司 一种日志处理方法、装置及终端
CN104811828A (zh) * 2015-04-27 2015-07-29 无锡天脉聚源传媒科技有限公司 一种数据处理方法及装置
WO2015180291A1 (zh) * 2014-05-30 2015-12-03 京东方科技集团股份有限公司 监控服务器集群的方法和系统
CN105354128A (zh) * 2015-11-11 2016-02-24 中国建设银行股份有限公司 一种计算机资源监控方法、装置及系统
CN105656724A (zh) * 2016-01-29 2016-06-08 佛山中科芯蔚科技有限公司 一种服务器的监控方法及系统
CN105897474A (zh) * 2016-04-08 2016-08-24 浪潮集团有限公司 一种利用wmi插件实现云计算环境下远程控制服务器的方法
CN106227641A (zh) * 2016-07-29 2016-12-14 北京润科通用技术有限公司 一种硬件性能监控方法及系统
CN106611222A (zh) * 2016-12-27 2017-05-03 北京奇艺世纪科技有限公司 一种通用任务管理方法及系统
CN107102929A (zh) * 2017-05-23 2017-08-29 郑州云海信息技术有限公司 故障的检测方法及装置
CN108880949A (zh) * 2018-09-26 2018-11-23 郑州云海信息技术有限公司 一种基于云平台的信息解析的方法和装置
CN109254899A (zh) * 2018-09-29 2019-01-22 郑州云海信息技术有限公司 一种服务器监控方法和装置
WO2019169765A1 (zh) * 2018-03-06 2019-09-12 平安科技(深圳)有限公司 电子装置、集群环境下状态信息的获取方法、系统及存储介质
CN110932938A (zh) * 2019-12-02 2020-03-27 安徽三实信息技术服务有限公司 一种主机运行远程监控系统
CN111274085A (zh) * 2020-01-14 2020-06-12 中科驭数(北京)科技有限公司 数据库监控系统及方法
CN111324518A (zh) * 2020-02-03 2020-06-23 中国银联股份有限公司 一种应用关联的方法及装置
CN111352807A (zh) * 2020-03-31 2020-06-30 中国建设银行股份有限公司 服务器资源实时监控方法及装置
CN113448793A (zh) * 2020-03-25 2021-09-28 大唐移动通信设备有限公司 一种兼容多操作系统的系统监控方法及装置
CN111324518B (zh) * 2020-02-03 2024-05-03 中国银联股份有限公司 一种应用关联的方法及装置

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105791028A (zh) * 2016-04-26 2016-07-20 浪潮(北京)电子信息产业有限公司 一种服务器集群的监控方法、服务器及系统
CN108365985A (zh) * 2018-02-07 2018-08-03 深圳壹账通智能科技有限公司 一种集群管理方法、装置、终端设备及存储介质
CN108563550A (zh) * 2018-04-23 2018-09-21 上海达梦数据库有限公司 一种分布式系统的监控方法、装置、服务器和存储介质
US10936215B2 (en) * 2018-04-30 2021-03-02 EMC IP Holding Company LLC Automated data quality servicing framework for efficient utilization of information technology resources
CN109783567B (zh) * 2018-12-18 2021-02-26 合肥天源迪科信息技术有限公司 用于企业的日志分析系统及其方法
CN110784377A (zh) * 2019-10-30 2020-02-11 国云科技股份有限公司 一种多云环境下的云监控数据统一管理的方法
CN113220536A (zh) * 2021-05-31 2021-08-06 中富通集团股份有限公司 机房动力设备运行环境监控的监控数据传输方法及其应用
CN114448831B (zh) * 2022-03-18 2023-09-01 以萨技术股份有限公司 一种集群所属服务器状态监控方法及系统

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101123616A (zh) * 2007-09-28 2008-02-13 北京金山软件有限公司 一种服务器管理的方法及一种服务器管理系统
US20090063509A1 (en) * 2007-08-30 2009-03-05 Sqlalert Corporation Method and Apparatus for Monitoring Network Servers
CN101877618A (zh) * 2010-06-30 2010-11-03 中兴通讯股份有限公司 基于无代理方式进行监控的方法、服务器及系统
CN102394901A (zh) * 2011-06-23 2012-03-28 北京新媒传信科技有限公司 一种服务器集群系统及其中的监控策略更新方法
CN102655519A (zh) * 2011-03-04 2012-09-05 腾讯科技(北京)有限公司 网络页面信息的处理方法和装置
CN103051496A (zh) * 2012-12-21 2013-04-17 大唐软件技术股份有限公司 一种监测点服务器的监控方法及装置
CN103136081A (zh) * 2011-12-05 2013-06-05 鸿富锦精密工业(深圳)有限公司 数据中心服务器稳定性测试装置及测试方法
CN103150241A (zh) * 2013-04-09 2013-06-12 上海市计量测试技术研究院 多服务器状态监控管理系统和方法
CN103595804A (zh) * 2013-11-20 2014-02-19 北京京东尚科信息技术有限公司 一种服务器集群监控系统
CN103677918A (zh) * 2013-12-10 2014-03-26 乐视网信息技术(北京)股份有限公司 转码服务器的脚本设置方法和系统

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6148335A (en) * 1997-11-25 2000-11-14 International Business Machines Corporation Performance/capacity management framework over many servers
US8024712B1 (en) * 2006-09-29 2011-09-20 Emc Corporation Collecting application logs
US8190763B2 (en) * 2007-09-14 2012-05-29 At&T Intellectual Property I, Lp System and method for trouble detection, isolation, and management
CN101312580B (zh) 2008-07-11 2011-12-28 深圳国人通信有限公司 一种直放站监控中心和直放站监控方法
WO2011041464A2 (en) * 2009-09-29 2011-04-07 Oracle International Corporation Agentless data collection
US8959191B2 (en) * 2012-04-06 2015-02-17 Hewlett-Packard Development Company, L.P. Script modification suggestion
TWI538441B (zh) * 2013-11-05 2016-06-11 衛信科技有限公司 用以建構網路結構部署圖之處理系統及其方法與內儲網路結構部署分析程式之電腦程式產品
CN104022902A (zh) * 2014-05-30 2014-09-03 京东方科技集团股份有限公司 一种监控服务器集群的方法和系统

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090063509A1 (en) * 2007-08-30 2009-03-05 Sqlalert Corporation Method and Apparatus for Monitoring Network Servers
CN101123616A (zh) * 2007-09-28 2008-02-13 北京金山软件有限公司 一种服务器管理的方法及一种服务器管理系统
CN101877618A (zh) * 2010-06-30 2010-11-03 中兴通讯股份有限公司 基于无代理方式进行监控的方法、服务器及系统
CN102655519A (zh) * 2011-03-04 2012-09-05 腾讯科技(北京)有限公司 网络页面信息的处理方法和装置
CN102394901A (zh) * 2011-06-23 2012-03-28 北京新媒传信科技有限公司 一种服务器集群系统及其中的监控策略更新方法
CN103136081A (zh) * 2011-12-05 2013-06-05 鸿富锦精密工业(深圳)有限公司 数据中心服务器稳定性测试装置及测试方法
CN103051496A (zh) * 2012-12-21 2013-04-17 大唐软件技术股份有限公司 一种监测点服务器的监控方法及装置
CN103150241A (zh) * 2013-04-09 2013-06-12 上海市计量测试技术研究院 多服务器状态监控管理系统和方法
CN103595804A (zh) * 2013-11-20 2014-02-19 北京京东尚科信息技术有限公司 一种服务器集群监控系统
CN103677918A (zh) * 2013-12-10 2014-03-26 乐视网信息技术(北京)股份有限公司 转码服务器的脚本设置方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
董波: "云集群服务器系统监控管理方法与设计实现的研究", 《中国优秀硕士学位论文全文数据库(电子期刊)》 *

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015180291A1 (zh) * 2014-05-30 2015-12-03 京东方科技集团股份有限公司 监控服务器集群的方法和系统
US10084681B2 (en) 2014-05-30 2018-09-25 Boe Technology Group Co., Ltd. Method and system for monitoring server cluster
CN104202201B (zh) * 2014-09-16 2018-01-23 广州金山网络科技有限公司 一种日志处理方法、装置及终端
CN104202201A (zh) * 2014-09-16 2014-12-10 广州金山网络科技有限公司 一种日志处理方法、装置及终端
CN104811828A (zh) * 2015-04-27 2015-07-29 无锡天脉聚源传媒科技有限公司 一种数据处理方法及装置
CN105354128A (zh) * 2015-11-11 2016-02-24 中国建设银行股份有限公司 一种计算机资源监控方法、装置及系统
CN105354128B (zh) * 2015-11-11 2018-05-18 中国建设银行股份有限公司 一种计算机资源监控方法、装置及系统
CN105656724A (zh) * 2016-01-29 2016-06-08 佛山中科芯蔚科技有限公司 一种服务器的监控方法及系统
CN105897474A (zh) * 2016-04-08 2016-08-24 浪潮集团有限公司 一种利用wmi插件实现云计算环境下远程控制服务器的方法
CN106227641A (zh) * 2016-07-29 2016-12-14 北京润科通用技术有限公司 一种硬件性能监控方法及系统
CN106227641B (zh) * 2016-07-29 2019-01-29 北京润科通用技术有限公司 一种硬件性能监控方法及系统
CN106611222A (zh) * 2016-12-27 2017-05-03 北京奇艺世纪科技有限公司 一种通用任务管理方法及系统
CN106611222B (zh) * 2016-12-27 2020-10-23 北京奇艺世纪科技有限公司 一种通用任务管理方法及系统
CN107102929A (zh) * 2017-05-23 2017-08-29 郑州云海信息技术有限公司 故障的检测方法及装置
WO2019169765A1 (zh) * 2018-03-06 2019-09-12 平安科技(深圳)有限公司 电子装置、集群环境下状态信息的获取方法、系统及存储介质
CN108880949A (zh) * 2018-09-26 2018-11-23 郑州云海信息技术有限公司 一种基于云平台的信息解析的方法和装置
CN109254899A (zh) * 2018-09-29 2019-01-22 郑州云海信息技术有限公司 一种服务器监控方法和装置
CN109254899B (zh) * 2018-09-29 2022-03-22 郑州云海信息技术有限公司 一种服务器监控方法和装置
CN110932938A (zh) * 2019-12-02 2020-03-27 安徽三实信息技术服务有限公司 一种主机运行远程监控系统
CN111274085A (zh) * 2020-01-14 2020-06-12 中科驭数(北京)科技有限公司 数据库监控系统及方法
CN111324518A (zh) * 2020-02-03 2020-06-23 中国银联股份有限公司 一种应用关联的方法及装置
CN111324518B (zh) * 2020-02-03 2024-05-03 中国银联股份有限公司 一种应用关联的方法及装置
CN113448793A (zh) * 2020-03-25 2021-09-28 大唐移动通信设备有限公司 一种兼容多操作系统的系统监控方法及装置
CN111352807A (zh) * 2020-03-31 2020-06-30 中国建设银行股份有限公司 服务器资源实时监控方法及装置

Also Published As

Publication number Publication date
US20160294666A1 (en) 2016-10-06
US10084681B2 (en) 2018-09-25
WO2015180291A1 (zh) 2015-12-03

Similar Documents

Publication Publication Date Title
CN104022902A (zh) 一种监控服务器集群的方法和系统
US10210036B2 (en) Time series metric data modeling and prediction
US20150133076A1 (en) Mobile device application monitoring software
CN105653425B (zh) 基于复杂事件处理引擎的监控系统
CN108092836A (zh) 一种服务器的监控方法及装置
US11573878B1 (en) Method and apparatus of establishing customized network monitoring criteria
US20180276019A1 (en) Ensuring operational integrity and performance of deployed converged infrastructure information handling systems
CN104022904A (zh) 分布式机房it设备统一管理平台
CN110727560A (zh) 云服务报警方法及装置
CN102196373A (zh) 一种短信告警系统及短信告警方法
CN110347694B (zh) 一种基于物联网的设备监控方法、装置及系统
CN103716173A (zh) 一种存储监控系统及监控告警发布的方法
WO2021167659A1 (en) Systems and methods of monitoring and controlling remote assets
CN103973484A (zh) 一种基于网络拓扑结构的运维管理系统
CN113259493B (zh) 基于Ukey机柜的Ukey信息获取方法、装置、设备和存储介质
CN110727563A (zh) 预设客户的云服务报警方法及装置
CN105119761A (zh) 运维监控及解决方案一体化管理系统及方法
CN104539449B (zh) 一种故障信息处理方法与相关装置
CN104468248A (zh) 业务性能的监控方法、反向代理服务器、统计分析服务器及系统
CN109800133A (zh) 一种统一监控告警的方法、一站式监控告警平台及系统
CN115543345A (zh) 一种针对电力时序数据的分布式计算系统及其实现方法
CN113254313A (zh) 一种监控指标异常检测方法、装置、电子设备及存储介质
CN107566187B (zh) 一种sla违例监测方法、装置和系统
CN105843728A (zh) 一种利用wmi插件实现云计算环境下远程控制服务器的方法
CN115378839B (zh) 采集任务的部署方法及相关设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20140903

RJ01 Rejection of invention patent application after publication