CN106559272A - 一种机房管理方法及装置 - Google Patents

一种机房管理方法及装置 Download PDF

Info

Publication number
CN106559272A
CN106559272A CN201611119520.XA CN201611119520A CN106559272A CN 106559272 A CN106559272 A CN 106559272A CN 201611119520 A CN201611119520 A CN 201611119520A CN 106559272 A CN106559272 A CN 106559272A
Authority
CN
China
Prior art keywords
network equipment
equipment
network
operational factor
alarm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611119520.XA
Other languages
English (en)
Inventor
沈林
蒋腾磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Communication Information System Co Ltd
Original Assignee
Inspur Communication Information System Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Communication Information System Co Ltd filed Critical Inspur Communication Information System Co Ltd
Priority to CN201611119520.XA priority Critical patent/CN106559272A/zh
Publication of CN106559272A publication Critical patent/CN106559272A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供了一种机房管理方法及装置,该方法包括:获取至少一个网络设备的地址信息;确定至少一个检测项目,以及每一个检测项目分别对应的告警阈值;针对所述至少一个网络设备中的每一个网络设备,均执行:获取所述网络设备的每一个所述检测项目分别对应的运行参数;当存在至少一个所述运行参数超过相对应的所述告警阈值时,根据所述网络设备的地址信息,确定对应所述网络设备的外部告警设备;控制所述外部报警设备进行报警。本发明能提高机房管理效率。

Description

一种机房管理方法及装置
技术领域
本发明涉及计算机技术领域,特别涉及一种机房管理方法及装置。
背景技术
随着信息系统应用的发展与普及,机房的规模正在高速发展,机房内的服务器等设备也越来越密集,为确保机房内各个设备的正常运作,需要对各个设备进行管理。
目前,主要采取人工方式管理机房中的各个设备,即机房的管理人员逐个对各个设备的各个配置元素(CPU和内存等)进行检测,当发现有设备异常时,例如,设备的CPU负荷过高,即对异常设备进行维护。
由于机房内的设备较多,并且每个设备又包括多个配置元素,采用人工方式进行管理时,效率较低。
发明内容
本发明实施例提供了一种机房管理方法及装置,能提高机房管理效率。
第一方面,本发明实施例提供了一种机房管理方法,包括:
获取至少一个网络设备的地址信息;
确定至少一个检测项目,以及每一个检测项目分别对应的告警阈值;
针对所述至少一个网络设备中的每一个网络设备,均执行:
获取所述网络设备的每一个所述检测项目分别对应的运行参数;
当存在至少一个所述运行参数超过相对应的所述告警阈值时,根据所述 网络设备的地址信息,确定对应所述网络设备的外部告警设备;
控制所述外部报警设备进行报警。
优选地,
当所述至少一个网络设备的个数为至少两个时,
在所述获取至少一个网络设备的地址信息之后,进一步包括:
根据各个所述网络设备的地址信息,确定各个所述网络设备之间的连接路径;
根据所述连接路径,生成各个所述网络设备的网络拓扑结构;
所述获取所述网络设备的每一个所述检测项目分别对应的运行参数,包括:
根据所述网络拓扑结构,分别获取所述网络设备与至少一个其他网络设备之间的连接参数,其中,所述连接参数包括连接正常或连接故障;
所述当存在至少一个所述运行参数超过相对应的所述告警阈值时,根据所述网络设备的地址信息,确定对应所述网络设备的外部告警设备,包括:
当存在至少一个所述连接参数为连接故障时,针对每一个所述连接故障,均执行:
根据所述连接故障,确定相对应的两个故障网络设备;
根据两个所述故障网络设备的地址信息,确定两个所述故障网络设备分别对应的外部告警装置。
优选地,
所述控制所述外部报警设备进行报警,包括:
控制所述外部报警设备以第一报警方式进行报警。
优选地:
所述网络设备包括:至少两个配置元素;
所述获取所述网络设备的每一个所述检测项目分别对应的运行参数,包 括:
获取所述网络设备中每一个配置元素的标识信息;
根据各个所述标识信息,分别获取对应的配置元素的运行参数。
优选地,
当存在至少两个所述运行参数超过相对应的所述告警阈值时,进一步包括:
获取运行参数超过相对应的所述告警阈值的至少两个配置元素;
判断所述至少两个配置元素是否具有关联关系,如果是,则根据所述关联关系,从所述至少两个配置元素中确定至少一个故障配置元素。
优选地,
所述控制所述外部报警设备进行报警,包括:
根据所述故障配置元素,控制所述外部报警设备以第二报警方式进行报警。
优选地,
在所述控制外部报警设备进行报警之后,进一步包括:
接收外部输入的维护请求,所述维护请求中包括待维护网络设备的地址信息;
根据所述待维护网路设备的地址信息,输出所述待维护网络设备中,所述运行参数超过所述告警阈值的检测项目。
第二方面,本发明实施例提供了一种机房管理装置,包括:地址获取单元、项目确定单元和管理单元;其中,
所述地址获取单元,用于获取至少一个网络设备的地址信息;
所述项目确定单元,用于确定至少一个检测项目,以及每一个检测项目分别对应的告警阈值;
所述管理单元,用于针对所述至少一个网络设备中的每一个网络设备, 均执行:获取所述网络设备的每一个所述检测项目分别对应的运行参数,当存在至少一个所述运行参数超过相对应的所述告警阈值时,根据所述地址获取单元获取到所述网络设备的地址信息,确定对应所述网络设备的外部告警设备,并控制所述外部报警设备进行报警。
优选地,
当所述至少一个网络设备的个数为至少两个时,进一步包括:路径确定单元和拓扑生成单元;其中,
所述路径确定单元,用于根据所述地址获取单元获取到的各个所述网络设备的地址信息,确定各个所述网络设备之间的连接路径;
所述拓扑生成单元,用于根据所述路径确定单元确定出的所述连接路径,生成各个所述网络设备的网络拓扑结构;
所述管理单元,包括获取子单元和确定子单元;其中,
所述获取子单元,用于根据所述拓扑生成单元生成的所述网络拓扑结构,分别获取所述网络设备与至少一个其他网络设备之间的连接参数,其中,所述连接参数包括连接正常或连接故障;
所述确定子单元,用于当所述获取子单元获取到的连接参数中,存在至少一个所述连接参数为连接故障时,针对每一个所述连接故障,均执行:根据所述连接故障,确定相对应的两个故障网络设备,并根据两个所述故障网络设备的地址信息,确定两个所述故障网络设备分别对应的外部告警装置。
优选地,
所述网络设备包括:至少两个配置元素;
所述管理单元,用于获取所述网络设备中的每一个配置元素的标识信息,并根据各个所述标识信息,分别获取对应的配置元素的运行参数。
本发明实施例提供了一种机房管理方法及装置,通过获取至少一个网络设备的地址信息,并确定至少一个检测项目,以及每一个检测项目分别对应 的告警阈值,然后获取每个网络设备中,每一个检测项目分别对应的运行参数,当存在至少一个运行参数超过相对应的告警阈值时,根据网络设备的地址信息,确定对应网络设备的外部告警设备,并控制外部报警设备进行报警。由于自动监测各个网络设备的检测项目,出现异常时即报警,而无需管理人员逐个检测各个网络设备的各个检测项目,从而提高了机房管理效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例提供的一种机房管理方法的流程图;
图2是本发明另一个实施例提供的一种机房管理方法的流程图;
图3是本发明又一个实施例提供的一种机房管理方法的流程图;
图4是本发明一个实施例提供的一种机房管理装置的结构示意图;
图5是本发明另一个实施例提供的一种机房管理装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供了一种机房管理方法,该方法可以包括以下步骤:
步骤101,获取至少一个网络设备的地址信息;
步骤102,确定至少一个检测项目,以及每一个检测项目分别对应的告警阈值;
步骤103,针对所述至少一个网络设备中的每一个网络设备,均执行:获取所述网络设备的每一个所述检测项目分别对应的运行参数;
步骤104,当存在至少一个所述运行参数超过相对应的所述告警阈值时,根据所述网络设备的地址信息,确定对应所述网络设备的外部告警设备;
步骤105,控制所述外部报警设备进行报警。
上述实施例中,通过获取至少一个网络设备的地址信息,并确定至少一个检测项目,以及每一个检测项目分别对应的告警阈值,然后获取每个网络设备中,每一个检测项目分别对应的运行参数,当存在至少一个运行参数超过相对应的告警阈值时,根据网络设备的地址信息,确定对应网络设备的外部告警设备,并控制外部报警设备进行报警。由于自动监测各个网络设备的检测项目,出现异常时即报警,而无需管理人员逐个检测各个网络设备的各个检测项目,从而提高了机房管理效率。
为了检测各个网络设备之间的连接关系是否正常,本发明一个实施例中,当所述至少一个网络设备的个数为至少两个时,在步骤101之后,可以进一步包括:
根据各个所述网络设备的地址信息,确定各个所述网络设备之间的连接路径;
根据所述连接路径,生成各个所述网络设备的网络拓扑结构;
步骤103的具体实施方式,可以包括:
根据所述网络拓扑结构,分别获取所述网络设备与至少一个其他网络设备之间的连接参数,其中,所述连接参数包括连接正常或连接故障;
步骤104的具体实施方式,可以包括:
当存在至少一个所述连接参数为连接故障时,针对每一个所述连接故障,均执行:
根据所述连接故障,确定相对应的两个故障网络设备;
根据两个所述故障网络设备的地址信息,确定两个所述故障网络设备分别对应的外部告警装置。
上述实施例中,首先根据各个网络设备的地址信息,生成各个网络设备的网络拓扑结构,监测网络拓扑结构中,网络设备与其他网络设备之间的连接参数,当存在至少一个连接参数为连接故障时,确定出与连接故障相对应的两个故障网络设备,并根据故障网络设备的地址信息,分别确定两个故障网络设备对应的外部报警装置。
由于网络拓扑结构中包括机房内的所有网络设备及其互联的路径,因此网络拓扑结构有利于全面反映网络设备在性能、告警、配置等方面的变化。另外,网络拓扑结构具有浏览、监测和编辑等功能,还可根据使用人员或网络设备的物理位置等来划分层次,对应的网络拓扑结构的视图的类别可以包括业务视图和地理视图等,并可在根据需要在不同视图间切换。
此外,为了进一步便于网络拓扑结构的查看,网络拓扑结构中可使用特定的不同图标来区分不同类型的网络设备,使用不同的显示方式来区别连接路径的类型。
另外,当机房中配置新的网络设备时,只要新的网络设备打开了SNMP(SimpleNetwork Management Protocol,简单网络管理协议),即可自动获取网络设备的地址信息和连接路径等,进而将新的网络设备加入到网络拓扑结构中。
当网络设备之间出现连接故障时,网络拓扑结构可结合网络的性能数据和告警数据,反映各个网络设备的运行状况,及时呈现网络设备的告警信息和对应的连接参数。
为了准确示意各个网络设备之间的连接故障,本发明一个实施例中,步骤105的具体实施方式,可以包括:
控制所述外部报警设备以第一报警方式进行报警。
例如,外部报警设备设置有不同的报警方式,用以区分机房中各个网络设备的各种故障,网路设备之间的连接故障对应红色警示,即可控制报警设备闪烁红色灯光,以提示机房管理人员网络设备之间出现了连接故障。另外,在报警之后,可记录相应网络设备的地址信息和报警时间,以便于后期维护时,进行相应信息的查询。
在网络设备中,存在多种配置元素,例如:CPU、内存和连接接口等,为了监控网络设备中,各个配置元素的运行情况,本发明一个实施例中,步骤103的具体实施方式,可以包括:
获取所述网络设备中每一个配置元素的标识信息;
根据各个所述标识信息,分别获取对应的配置元素的运行参数。
上述实施例中,获取各个配置元素的标识信息,再根据各个标识信息,获取对应的配置元素的运行参数,以便于监控各个配置元素的运行状况,例如:CPU负荷、内存利用率和接口连接状态等。
为了准确确定出故障配置元素,本发明一个实施例中,当存在至少两个所述运行参数超过相对应的所述告警阈值时,进一步包括:
获取运行参数超过相对应的所述告警阈值的至少两个配置元素;
判断所述至少两个配置元素是否具有关联关系,如果是,则根据所述关联关系,从所述至少两个配置元素中确定至少一个故障配置元素。
上述实施例中,当出现多个配置元素的运行参数超过相对应的告警阈值时,判断多个配置元素之间是否具有关联关系,如果是,再确定多个配置元素中,具体的故障配置元素。例如,网路设备中的风扇用于为CPU降温,风扇与CPU间有关联关系,当CPU和风扇的运行参数超过告警阈值时,确定 CPU和风扇中具体的故障配置元素;例如,当风扇停止转动引起CPU散热不良,即风扇为故障配置元素。
为了准确示意不同配置元素的故障,本发明一个实施例中,步骤105的具体实施方式,可以包括:
根据所述故障配置元素,控制所述外部报警设备以第二报警方式进行报警。
上述实施例中,根据不同的故障配置元素,采用相应的报警方式进行报警。例如,CPU对应的报警方式为闪烁黄光,风扇对应的报警方式为响起蜂鸣声,若确定出风扇为故障配置元素,则只响起蜂鸣声,若确定出风扇和CPU均为故障元素,则报警器在响起蜂鸣声的同时,还闪烁黄光。
为了便于各个网络设备的维护,本发明一个实施例中,在步骤105之后,可以进一步包括:
接收外部输入的维护请求,所述维护请求中包括待维护网络设备的地址信息;
根据所述待维护网路设备的地址信息,输出所述待维护网络设备中,所述运行参数超过所述告警阈值的检测项目。
上述实施例中,在管理人员根据报警信号对相应网路设备进行维护时,根据维护请求中包括的待维护网络设备的地址信息,输出待维护网络设备中,所述运行参数超过所述告警阈值的检测项目,这使管理人员可直接对相应检测项目进行维护,从而提高了设备维护效率。
为了便于查看各个网络设备的运行情况,在获取到各个检测项目的运行参数之后,生成统计报表,例如,记录一个网络设备的各个配置元素在不同时间的运行参数,有利于管理人员随时查看对应设备的运行状态。另外,还可根据网络拓扑结构生成机房内所有网络设备的统计报表,以便按设备类型统计目前网络上所有的设备资源总数。根据各个检测项目的报警状况,还可 生成针对故障信息的统计报表,例如,可在一个统计报表中,记录一个报警设备对应的区域中,各个超过告警阈值的运行参数所属的检测项目。
由此,管理人员在进行设备维护时,可根据统计报表,输出对应的故障检测项目,在完成故障检测项目的维护之后,更新统计报表,以便于实时查看各个设备的运行与维护情况。
对于机房的设备管理,可以包含以下两种管理场景:
场景1:针对各个网络设备之间的连接参数进行管理,如图2所示,该管理方法可以包括以下步骤:
步骤201,获取至少一个网络设备的地址信息。
步骤202,根据各个所述网络设备的地址信息,确定各个所述网络设备之间的连接路径。
步骤203,根据所述连接路径,生成各个所述网络设备的网络拓扑结构。
步骤201至步骤203中,根据各个网络设备的地址信息,确定各个网络设备的连接路径,并生成相应的网络拓扑结构,有利于反映各个网络设备的连接参数的变化。
步骤204,针对所述至少一个网络设备中的每一个网络设备,均执行:根据所述网络拓扑结构,分别获取所述网络设备与至少一个其他网络设备之间的连接参数,其中,所述连接参数包括连接正常或连接故障。
网络设备与其他网络设备之间的连接参数可表征网络设备之间的通信情况,当连接参数为连接正常时,表示网络设备之间的通信正常,当连接参数为连接故障时,表示网络设备之间出现了通信故障。
步骤205,当存在至少一个所述连接参数为连接故障时,针对每一个所述连接故障,均执行:根据所述连接故障,确定相对应的两个故障网络设备;
步骤206,根据两个所述故障网络设备的地址信息,确定两个所述故障网络设备分别对应的外部告警装置。
具体的,当存在至少一个连接参数为连接故障时,确定出与连接故障相对应的两个故障网络设备,并根据故障网络设备的地址信息,分别确定两个故障网络设备对应的外部告警装置。
步骤207,控制所述外部报警设备以第一报警方式进行报警。
例如,外部报警设备设置有不同的报警方式,用以区分机房中各个网络设备的各种故障,网路设备之间的连接故障对应红色警示,即可控制报警设备闪烁红色灯光,以提示机房管理人员网络设备之间出现了连接故障。
上述实施例中,首先根据各个网络设备的地址信息,生成各个网络设备的网络拓扑结构,监测网络拓扑结构中,网络设备与其他网络设备之间的连接参数,当存在至少一个连接参数为连接故障时,确定出与连接故障相对应的两个故障网络设备,并根据故障网络设备的地址信息,分别确定两个故障网络设备对应的外部报警装置,并控制外部告警装置以相应方式进行报警。
场景2:针对一个网络设备中的各个配置元素进行管理,例如:CPU、内存和连接接口等,如图3所示,该管理方法可以包括以下步骤:
步骤301,获取网络设备的地址信息。
步骤302,获取网络设备中每一个配置元素的标识信息和告警阈值。
步骤303,根据各个所述标识信息,分别获取对应的配置元素的运行参数。
具体的,获取各个配置元素的标识信息,再根据各个标识信息,获取对应的配置元素的运行参数,以便于监控各个配置元素的运行状况,例如:CPU负荷、内存利用率和接口连接状态等。
步骤304,当存在至少两个所述运行参数超过相对应的所述告警阈值时,获取运行参数超过相对应的所述告警阈值的至少两个配置元素。
步骤305,判断所述至少两个配置元素是否具有关联关系,如果是,则执行步骤306,否则执行步骤307。
步骤306,根据所述关联关系,从所述至少两个配置元素中确定至少一个故障配置元素,并执行步骤308。
步骤307,确定每一个配置元素均为故障配置元素,并执行步骤308。
具体地,当出现多个配置元素的运行参数超过相对应的告警阈值时,判断多个配置元素之间是否具有关联关系,如果是,再确定多个配置元素中,具体的故障配置元素。例如,网路设备中的风扇用于为CPU降温,风扇与CPU间有关联关系,当CPU和风扇的运行参数超过告警阈值时,确定CPU和风扇中具体的故障配置元素;例如,当风扇停止转动引起CPU散热不良,即风扇为故障配置元素。
步骤308,根据所述故障配置元素所属网络设备的地址信息,确定对应网络设备的外部告警设备。
步骤309,根据所述故障配置元素,控制所述外部报警设备以第二报警方式进行报警。
根据不同的故障配置元素,采用相应的报警方式进行报警。例如,CPU对应的报警方式为闪烁黄光,风扇对应的报警方式为响起蜂鸣声,若确定出风扇为故障配置元素,则只响起蜂鸣声,若确定出风扇和CPU均为故障元素,则报警器在响起蜂鸣声的同时,还闪烁黄光。
步骤310,接收外部输入的维护请求,所述维护请求中包括待维护网络设备的地址信息;
步骤311,根据所述待维护网路设备的地址信息,输出所述待维护网络设备中,所述运行参数超过所述告警阈值的配置元素。
步骤310和步骤311中,在管理人员根据报警信号对相应网路设备进行维护时,根据维护请求中包括的待维护网络设备的地址信息,输出待维护网络设备中,所述运行参数超过所述告警阈值的配置元素,这使管理人员可直接对相应配置元素进行维护,从而提高了设备维护效率。
上述实施例中,检测网络设备中各个配置元素的运行情况,当存在至少两个所述运行参数超过相对应的所述告警阈值时,准确确定出故障配置元素,并以对应的报警方式进行报警,利于对故障配置元素直接进行维护,提高机房管理效率。
如图4所示,本发明实施例提供了一种机房管理装置,该装置可以包括:地址获取单元401、项目确定单元402和管理单元403;其中,
所述地址获取单元401,用于获取至少一个网络设备的地址信息;
所述项目确定单元402,用于确定至少一个检测项目,以及每一个检测项目分别对应的告警阈值;
所述管理单元403,用于针对所述至少一个网络设备中的每一个网络设备,均执行:获取所述网络设备的每一个所述检测项目分别对应的运行参数,当存在至少一个所述运行参数超过相对应的所述告警阈值时,根据所述地址获取单元401获取到所述网络设备的地址信息,确定对应所述网络设备的外部告警设备,并控制所述外部报警设备进行报警。
上述实施例中,通过获取至少一个网络设备的地址信息,并确定至少一个检测项目,以及每一个检测项目分别对应的告警阈值,然后获取每个网络设备中,每一个检测项目分别对应的运行参数,当存在至少一个运行参数超过相对应的告警阈值时,根据网络设备的地址信息,确定对应网络设备的外部告警设备,并控制外部报警设备进行报警。由于自动监测各个网络设备的检测项目,出现异常时即报警,而无需管理人员逐个检测各个网络设备的各个检测项目,从而提高了机房管理效率。
为了检测各个网络设备之间的连接关系是否正常,如图5所示,本发明一个实施例中,当所述至少一个网络设备的个数为至少两个时,进一步包括:路径确定单元501和拓扑生成单元502;其中,
所述路径确定单元501,用于根据所述地址获取单元401获取到的各个 所述网络设备的地址信息,确定各个所述网络设备之间的连接路径;
所述拓扑生成单元502,用于根据所述路径确定单元501确定出的所述连接路径,生成各个所述网络设备的网络拓扑结构;
所述管理单元403,包括获取子单元503和确定子单元504;其中,
所述获取子单元503,用于根据所述拓扑生成单元502生成的所述网络拓扑结构,分别获取所述网络设备与至少一个其他网络设备之间的连接参数,其中,所述连接参数包括连接正常或连接故障;
所述确定子单元504,用于当所述获取子单元503获取到的连接参数中,存在至少一个所述连接参数为连接故障时,针对每一个所述连接故障,均执行:根据所述连接故障,确定相对应的两个故障网络设备,并根据两个所述故障网络设备的地址信息,确定两个所述故障网络设备分别对应的外部告警装置。
上述实施例中,首先根据各个网络设备的地址信息,生成各个网络设备的网络拓扑结构,监测网络拓扑结构中,网络设备与其他网络设备之间的连接参数,当存在至少一个连接参数为连接故障时,确定出与连接故障相对应的两个故障网络设备,并根据故障网络设备的地址信息,分别确定两个故障网络设备对应的外部报警装置。
在网络设备中,存在多种配置元素,例如:CPU、内存和连接接口等,为了监控网络设备中,各个配置元素的运行情况,本发明一个实施例中,所述管理单元,用于获取所述网络设备中的每一个配置元素的标识信息,并根据各个所述标识信息,分别获取对应的配置元素的运行参数。
上述实施例中,获取各个配置元素的标识信息,再根据各个标识信息,获取对应的配置元素的运行参数,以便于监控各个配置元素的运行状况,例如:CPU负荷、内存利用率和接口连接状态等。
上述装置内的各单元之间的信息交互、执行过程等内容,由于与本发明 方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
本发明还提供了一种计算机存储介质,存储用于使一机器执行如本文所述的程序代码的审核方法的指令。具体地,可以提供配有存储介质的系统或者装置,在该存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该系统或者装置的计算机(或CPU或MPU)读出并执行存储在存储介质中的程序代码。
在这种情况下,从存储介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能,因此程序代码和存储程序代码的存储介质构成了本发明的一部分。
用于提供程序代码的存储介质实施例包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RAM、DVD-RW、DVD+RW)、磁带、非易失性存储卡和ROM。可选择地,可以由通信网络从服务器计算机上下载程序代码。
此外,应该清楚的是,不仅可以通过执行计算机所读出的程序代码,而且可以通过基于程序代码的指令使计算机上操作的操作系统等来完成部分或者全部的实际操作,从而实现上述实施例中任意一项实施例的功能。
此外,可以理解的是,将由存储介质读出的程序代码写到插入计算机内的扩展板中所设置的存储器中或者写到与计算机相连接的扩展单元中设置的存储器中,随后基于程序代码的指令使安装在扩展板或者扩展单元上的CPU等来执行部分和全部实际操作,从而实现上述实施例中任一实施例的功能。
综上所述,本发明的各个实施例至少具有如下有益效果:
1、本发明实施例中,通过获取至少一个网络设备的地址信息,并确定至少一个检测项目,以及每一个检测项目分别对应的告警阈值,然后获取每个网络设备中,每一个检测项目分别对应的运行参数,当存在至少一个运行参 数超过相对应的告警阈值时,根据网络设备的地址信息,确定对应网络设备的外部告警设备,并控制外部报警设备进行报警。由于自动监测各个网络设备的检测项目,出现异常时即报警,而无需管理人员逐个检测各个网络设备的各个检测项目,从而提高了机房管理效率。
2、本发明实施例中,根据各个网络设备的地址信息,生成各个网络设备的网络拓扑结构,监测网络拓扑结构中,网络设备与其他网络设备之间的连接参数,当存在至少一个连接参数为连接故障时,确定出与连接故障相对应的两个故障网络设备,并根据故障网络设备的地址信息,分别确定两个故障网络设备对应的外部报警装置,由于网络拓扑结构中包括机房内的所有网络设备及其互联的路径,因此网络拓扑结构有利于全面反映网络设备在性能和配置等方面的变化,从而更利于机房的设备管理。
3、本发明实施例中,获取各个配置元素的标识信息,再根据各个标识信息,获取对应的配置元素的运行参数,以便于监控各个配置元素的运行状况。当出现多个配置元素的运行参数超过相对应的告警阈值时,判断多个配置元素之间是否具有关联关系,如果是,再确定多个配置元素中,具体的故障配置元素,并根据不同的故障配置元素,采用相应的报警方式进行报警,从而准确示意出不同配置元素的故障。
4、在管理人员根据报警信号对相应网路设备进行维护时,根据维护请求中包括的待维护网络设备的地址信息,输出待维护网络设备中,所述运行参数超过所述告警阈值的检测项目,这使管理人员可直接对相应检测项目进行维护,从而提高了设备维护效率。
需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素 的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同因素。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储在计算机可读取的存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质中。
最后需要说明的是:以上所述仅为本发明的较佳实施例,仅用于说明本发明的技术方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种机房管理方法,其特征在于,包括:
获取至少一个网络设备的地址信息;
确定至少一个检测项目,以及每一个检测项目分别对应的告警阈值;
针对所述至少一个网络设备中的每一个网络设备,均执行:
获取所述网络设备的每一个所述检测项目分别对应的运行参数;
当存在至少一个所述运行参数超过相对应的所述告警阈值时,根据所述网络设备的地址信息,确定对应所述网络设备的外部告警设备;
控制所述外部报警设备进行报警。
2.根据权利要求1所述的方法,其特征在于,
当所述至少一个网络设备的个数为至少两个时,
在所述获取至少一个网络设备的地址信息之后,进一步包括:
根据各个所述网络设备的地址信息,确定各个所述网络设备之间的连接路径;
根据所述连接路径,生成各个所述网络设备的网络拓扑结构;
所述获取所述网络设备的每一个所述检测项目分别对应的运行参数,包括:
根据所述网络拓扑结构,分别获取所述网络设备与至少一个其他网络设备之间的连接参数,其中,所述连接参数包括连接正常或连接故障;
所述当存在至少一个所述运行参数超过相对应的所述告警阈值时,根据所述网络设备的地址信息,确定对应所述网络设备的外部告警设备,包括:
当存在至少一个所述连接参数为连接故障时,针对每一个所述连接故障,均执行:
根据所述连接故障,确定相对应的两个故障网络设备;
根据两个所述故障网络设备的地址信息,确定两个所述故障网络设备分别对应的外部告警装置。
3.根据权利要求2所述的方法,其特征在于,
所述控制所述外部报警设备进行报警,包括:
控制所述外部报警设备以第一报警方式进行报警。
4.根据权利要求1所述的方法,其特征在于,包括:
所述网络设备包括:至少两个配置元素;
所述获取所述网络设备的每一个所述检测项目分别对应的运行参数,包括:
获取所述网络设备中每一个配置元素的标识信息;
根据各个所述标识信息,分别获取对应的配置元素的运行参数。
5.根据权利要求4所述的方法,其特征在于,
当存在至少两个所述运行参数超过相对应的所述告警阈值时,进一步包括:
获取运行参数超过相对应的所述告警阈值的至少两个配置元素;
判断所述至少两个配置元素是否具有关联关系,如果是,则根据所述关联关系,从所述至少两个配置元素中确定至少一个故障配置元素。
6.根据权利要求5所述的方法,其特征在于,
所述控制所述外部报警设备进行报警,包括:
根据所述故障配置元素,控制所述外部报警设备以第二报警方式进行报警。
7.根据权利要求1至6中任一所述的方法,其特征在于,
在所述控制外部报警设备进行报警之后,进一步包括:
接收外部输入的维护请求,所述维护请求中包括待维护网络设备的地址信息;
根据所述待维护网路设备的地址信息,输出所述待维护网络设备中,所述运行参数超过所述告警阈值的检测项目。
8.一种机房管理装置,其特征在于,包括:地址获取单元、项目确定单元和管理单元;其中,
所述地址获取单元,用于获取至少一个网络设备的地址信息;
所述项目确定单元,用于确定至少一个检测项目,以及每一个检测项目分别对应的告警阈值;
所述管理单元,用于针对所述至少一个网络设备中的每一个网络设备,均执行:获取所述网络设备的每一个所述检测项目分别对应的运行参数,当存在至少一个所述运行参数超过相对应的所述告警阈值时,根据所述地址获取单元获取到所述网络设备的地址信息,确定对应所述网络设备的外部告警设备,并控制所述外部报警设备进行报警。
9.根据权利要求8所述的管理装置,其特征在于,
当所述至少一个网络设备的个数为至少两个时,进一步包括:路径确定单元和拓扑生成单元;其中,
所述路径确定单元,用于根据所述地址获取单元获取到的各个所述网络设备的地址信息,确定各个所述网络设备之间的连接路径;
所述拓扑生成单元,用于根据所述路径确定单元确定出的所述连接路径,生成各个所述网络设备的网络拓扑结构;
所述管理单元,包括获取子单元和确定子单元;其中,
所述获取子单元,用于根据所述拓扑生成单元生成的所述网络拓扑结构,分别获取所述网络设备与至少一个其他网络设备之间的连接参数,其中,所述连接参数包括连接正常或连接故障;
所述确定子单元,用于当所述获取子单元获取到的连接参数中,存在至少一个所述连接参数为连接故障时,针对每一个所述连接故障,均执行:根据所述连接故障,确定相对应的两个故障网络设备,并根据两个所述故障网络设备的地址信息,确定两个所述故障网络设备分别对应的外部告警装置。
10.根据权利要求8所述的管理装置,其特征在于,
所述网络设备包括:至少两个配置元素;
所述管理单元,用于获取所述网络设备中的每一个配置元素的标识信息,并根据各个所述标识信息,分别获取对应的配置元素的运行参数。
CN201611119520.XA 2016-12-08 2016-12-08 一种机房管理方法及装置 Pending CN106559272A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611119520.XA CN106559272A (zh) 2016-12-08 2016-12-08 一种机房管理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611119520.XA CN106559272A (zh) 2016-12-08 2016-12-08 一种机房管理方法及装置

Publications (1)

Publication Number Publication Date
CN106559272A true CN106559272A (zh) 2017-04-05

Family

ID=58445252

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611119520.XA Pending CN106559272A (zh) 2016-12-08 2016-12-08 一种机房管理方法及装置

Country Status (1)

Country Link
CN (1) CN106559272A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101958803A (zh) * 2010-09-09 2011-01-26 中兴通讯股份有限公司 基于通讯网络的告警压缩系统及方法
CN103810823A (zh) * 2014-02-27 2014-05-21 神华集团有限责任公司 报警处理方法和装置
CN104579745A (zh) * 2014-12-04 2015-04-29 国家电网公司 一种移动终端及网络巡检系统
CN105245381A (zh) * 2015-10-22 2016-01-13 上海斐讯数据通信技术有限公司 云服务器宕机监控迁移系统和方法
CN105872061A (zh) * 2016-04-01 2016-08-17 浪潮电子信息产业股份有限公司 一种服务器集群管理方法、装置及系统
CN106130761A (zh) * 2016-06-22 2016-11-16 北京百度网讯科技有限公司 数据中心的故障网络设备的识别方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101958803A (zh) * 2010-09-09 2011-01-26 中兴通讯股份有限公司 基于通讯网络的告警压缩系统及方法
CN103810823A (zh) * 2014-02-27 2014-05-21 神华集团有限责任公司 报警处理方法和装置
CN104579745A (zh) * 2014-12-04 2015-04-29 国家电网公司 一种移动终端及网络巡检系统
CN105245381A (zh) * 2015-10-22 2016-01-13 上海斐讯数据通信技术有限公司 云服务器宕机监控迁移系统和方法
CN105872061A (zh) * 2016-04-01 2016-08-17 浪潮电子信息产业股份有限公司 一种服务器集群管理方法、装置及系统
CN106130761A (zh) * 2016-06-22 2016-11-16 北京百度网讯科技有限公司 数据中心的故障网络设备的识别方法和装置

Similar Documents

Publication Publication Date Title
CN102591591B (zh) 磁盘检测系统、磁盘检测方法以及网络存储系统
KR100617310B1 (ko) 네트워크 트래픽 이상 징후 감지 장치 및 그 방법
US20050091369A1 (en) Method and apparatus for monitoring data storage devices
CN1996326A (zh) 信息系统服务级安全风险分析
CN108038043A (zh) 一种分布式存储集群告警方法、系统及设备
CN103049365B (zh) 信息与应用资源运行状态监控及评价方法
CN115038088B (zh) 一种智能网络安全检测预警系统和方法
CN110191004A (zh) 一种端口检测方法及系统
CN114553672B (zh) 一种应用系统性能瓶颈确定方法、装置、设备、介质
CN106980572B (zh) 分布式系统的在线调试方法和系统
WO2006001260A1 (ja) 機能管理装置
CN109597731A (zh) 一种处理器的状态测试方法
CN114328107A (zh) 光磁融合存储服务器集群的监控方法、系统及电子设备
CN105825641A (zh) 一种业务报警方法和装置
CN106559272A (zh) 一种机房管理方法及装置
CN107622011A (zh) 一种动态日志控制方法及系统
KR101079036B1 (ko) 제어망 이상 징후 탐지 장치 및 방법
CN113010375B (zh) 设备告警方法及相关设备
JP5081761B2 (ja) アーカイブ装置,不正アクセス検出方法及び不正アクセス検出プログラム
CN113726779B (zh) 规则误报测试方法、装置、电子设备及计算机存储介质
JP2003203022A (ja) 簡易ネットワーク管理プロトコルマネージャーでネットワーク要素の代表状態を管理及び表示する方法及びそのコンピュータ読取可能媒体
CN103197981B (zh) 存储空间预警方法和系统
CN107766191A (zh) Linux 系统的自动巡检存储信息及健康状态的测试方法
CN102802134A (zh) 无线网络灾备方法、后台服务器和汇聚网关
CN109992483A (zh) 一种温度监控方法、装置、设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170405