CN101453383B - 设备、网络状态分析方法及装置 - Google Patents

设备、网络状态分析方法及装置 Download PDF

Info

Publication number
CN101453383B
CN101453383B CN2007101788765A CN200710178876A CN101453383B CN 101453383 B CN101453383 B CN 101453383B CN 2007101788765 A CN2007101788765 A CN 2007101788765A CN 200710178876 A CN200710178876 A CN 200710178876A CN 101453383 B CN101453383 B CN 101453383B
Authority
CN
China
Prior art keywords
equipment
network
parameter
temperature parameter
temperature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2007101788765A
Other languages
English (en)
Other versions
CN101453383A (zh
Inventor
周兆民
孙少陵
周文辉
罗治国
李威
孙金霞
徐萌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN2007101788765A priority Critical patent/CN101453383B/zh
Publication of CN101453383A publication Critical patent/CN101453383A/zh
Application granted granted Critical
Publication of CN101453383B publication Critical patent/CN101453383B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明涉及一种设备、网络状态分析方法及装置,设备状态分析方法包括:采集设备中各工作单元的实际温度参数;根据各实际温度参数获得温度变化参数,进而获得设备温度参数;由所述设备温度参数获得设备健康状态。进一步地还包括:采集设备中各工作单元的实际使用参数;根据各实际使用参数获得设备使用参数;由所述设备温度参数和设备使用参数获得设备运行状态。本发明通过监控设备/网络中各元素在不同业务负载下的温度情况得到设备/网络的健康状态,进一步地通过监控设备/网络中各元素温度参数和使用参数获得设备/网络的运行状态,可发现各种情况引起的设备/网络状态隐患,实现有效的优化管理。

Description

设备、网络状态分析方法及装置
技术领域
本发明涉及一种设备、网络的分析方法及装置,特别是一种设备、网络状态分析方法及装置。
背景技术
计算机网络是由多个计算机通过通信模式连接起来的计算机组,完整的计算机网络系统是由网络硬件系统和网络软件系统组成。组成计算机局域网络的硬件有网络服务器、网络工作站、网络适配器(或称网络接口卡、网卡)和连接线(或称传输介质、传输媒体,主要包括电缆、双绞线和光纤),组成计算机广域网络还需要增加通信连接设备,如调制解调器、集线器、网桥和路由器等。网络设备一般主要指处于网络层及网络层以上(传输层、应用层)的网络设备,它们通常可以被视为一个大型、复杂的计算机,或是多个计算机的合成,都包含一些通用的组成部件,如主板、CPU、内存、硬盘和风扇等。
随着计算机网络的广泛使用,人们对它的依赖越来越大,一旦计算机网络发生严重故障或性能明显下降,就会给人们带来不便,甚至导致十分严重的后果。为此,现有技术一般采用网络管理系统对网络设备进行监测和评估,以保证网络设备的可靠运转。目前,传统的网络管理系统主要针对设备的使用性能进行监测、评估和控制。例如现有技术对内存利用率、CPU利用率、硬盘使用率等使用参数进行监测,通过对这些元素的监控来评估设备或网络的工作状态,当某些使用参数超过某个预定阀值时,予以告警。
但在实际使用中,上述使用参数并不能完全反映设备或网络的实际工作状况。例如,当网络的某个设备或设备的某个单元发生故障前,可能设备或单元的利用率并不高,或者说,设备或单元的故障并不全是由高利用率、高使用率导致的,因此仅仅采用设备或单元利用率、使用率作为监控参数来评估设备或网络的工作状态是不准确、不全面的。
发明内容
本发明的目的是提供一种设备、网络状态分析方法及装置,通过设备/网络的温度监控,可准确、全面地评估设备/网络的健康状态和运行状态。
为了实现上述目的,本发明提供了一种设备状态分析方法,包括:
采集设备中各工作单元的实际温度参数;
根据各工作单元的实际温度参数获得各工作单元的温度变化参数,根据各工作单元的温度变化参数获得设备温度参数;
根据预先设置的设备温度参数与设备健康状态之间的对应关系,由所述设备温度参数获得设备健康状态。
进一步地,还包括步骤:
采集设备中各工作单元的实际使用参数;
根据各工作单元的实际使用参数获得设备使用参数;
根据预先设置的设备温度参数和设备使用参数与设备运行状态之间的对应关系,由所述设备温度参数和设备使用参数获得设备运行状态。
为了实现上述目的,本发明还提供了一种设备状态分析装置,包括:
设备温度采集模块,包括设置在各工作单元的温度采集器,用于采集设备中各工作单元的实际温度参数;
设备温度处理模块,与所述设备温度采集模块中各温度采集器连接,用于根据各工作单元的实际温度参数获得各工作单元的温度变化参数,进而获得设备温度参数;
设备健康评估模块,与所述设备温度处理模块连接,用于根据预先设置的设备温度参数与设备健康状态之间的对应关系,由所述设备温度参数获得设备健康状态。
进一步地,还包括:
设备使用采集模块,包括设置在各工作单元的性能采集器,用于采集设备中各工作单元的实际使用参数;
设备使用处理模块,与所述设备使用采集模块中各性能采集器连接,用于根据各工作单元的实际使用参数获得设备使用参数;
设备运行评估模块,与所述设备温度处理模块和设备使用处理模块连接,用于根据预先设置的设备温度参数和设备使用参数与设备运行状态之间的对应关系,由所述设备温度参数和设备使用参数获得设备运行状态。
为了实现上述目的,本发明提供了一种网络状态分析方法,包括:
采集网络中各设备的设备温度参数;
根据各设备的设备温度参数获得整个网络的网络温度参数;
根据预先设置的网络温度参数与网络健康状态之间的对应关系,由所述网络温度参数获得网络健康状态。
进一步地,还包括步骤:
采集网络中各设备的设备使用参数;
根据各设备的设备使用参数获得整个网络的网络使用参数;
根据预先设置的网络温度参数和网络使用参数与网络运行状态之间的对应关系,由所述网络温度参数和网络使用参数获得网络运行状态。
为了实现上述目的,本发明还提供了一种网络状态分析装置,包括:
网络温度采集模块,用于获得网络中各设备的设备温度参数;
网络温度处理模块,与所述网络温度采集模块连接,用于根据各设备的设备温度参数获得网络温度参数;
网络健康评估模块,与所述网络温度处理模块连接,用于根据预先设置的网络温度参数与网络健康状态之间的对应关系,由所述网络温度参数获得网络健康状态。
进一步地,还包括:
网络使用采集模块,用于获得网络中各设备的设备使用参数;
网络使用处理模块,与所述网络使用采集模块连接,用于根据各设备的设备使用参数获得网络使用参数;
网络运行评估模块,与所述网络温度处理模块和网络使用处理模块连接,用于根据预先设置的网络温度参数和网络使用参数与网络运行状态之间的对应关系,由所述网络温度参数和网络使用参数获得网络运行状态。
本发明提出了一种设备、网络状态分析方法及装置,通过监控设备/网络中各元素在不同业务负载下的温度情况,进而分析设备/网络的健康状态,进一步地通过监控设备/网络中各元素温度和使用情况,获得设备/网络的运行状态,并且通过分析和评估,可对设备/网络进行相应的调整,实现有效的优化管理。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
图1为本发明设备状态分析方法第一实施例的流程图;
图2为本发明设备状态分析方法第二实施例的流程图;
图3为本发明设备状态分析装置第一实施例的结构示意图;
图4为本发明设备状态分析装置第一实施例的实施示意图;
图5为本发明设备状态分析装置第二实施例的结构示意图;
图6为本发明网络状态分析方法第一实施例的流程图;
图7为本发明网络状态分析方法第二实施例的流程图;
图8为本发明网络状态分析装置第一实施例的结构示意图;
图9为本发明网络状态分析装置第一实施例的实施示意图;
图10为本发明网络状态分析装置第二实施例的结构示意图。
附图标记说明:
11-设备温度采集模块;  12-设备温度处理模块;  13-设备健康评估模块;
14-设备优化处理模块;  15-设备使用采集模块;  16-设备使用处理模块;
17-设备运行评估模块;  21-网络温度采集模块;  22-网络温度处理模块;
23-网络健康评估模块;  24-网络优化处理模块;  25-网络使用采集模块;
26-网络使用处理模块;  27-网络运行评估模块。
具体实施方式
图1为本发明设备状态分析方法第一实施例的流程图,具体包括步骤:
步骤11、采集设备中各工作单元的实际温度参数;
步骤12、根据各工作单元的实际温度参数获得各工作单元的温度变化参数,根据各工作单元的温度变化参数获得设备温度参数;
步骤13、根据预先设置的设备温度参数与设备健康状态之间的对应关系,由所述设备温度参数获得设备健康状态。
发明人大量研究表明,现有技术根据设备内各工作单元的使用参数(如内存利用率、CPU利用率、硬盘使用率等)来评估设备工作状态并不能完全反映设备的实际状况,有时甚至偏差很大。例如,当设备的某个工作单元发生故障前,其使用率可能并不高,但往往会出现温度过热等特征。为此,本发明提供了一种通过设备内各工作单元的温度监控实现对设备健康状态进行分析评估的方法,将温度作为“结果”参数来评估设备的健康状态和运行状态,不仅可以体现设备性能(如利用率)情况,还在相当程度上体现了设备的潜在故障(如风扇损坏等),进一步地,温度作为“结果”参数还可以用于设备瓶颈点分析,通过温度参数分析可以提供设备配置是否合理、设备质量是否稳定等设备综合性能数据,为设备优化提供准确、全面的支持。
本实施例技术方案中,首先在设备中设置相应的温度传感单元,对设备中各工作单元的实际温度进行监测,根据设备的工作性质可以调整被监测的工作单元以及工作单元数目,本实施例以计算类设备为例,将计算类设备中的中心处理器、内存和硬盘作为被监测的工作单元,同时在设备运行环境中设置采集环境温度的温度传感单元。在设备工作时,各温度传感单元将采集的各实际温度参数传送到处理单元进行处理,处理单元根据各工作单元的实际温度参数获得各工作单元的温度变化参数,并根据各工作单元的温度变化参数获得设备温度参数,最后根据预先设置的设备温度参数与设备健康状态之间的对应关系,由设备温度参数获得设备的设备健康状态。
其中,各工作单元的温度变化参数可通过下式计算:
TSi=(Ti-T0)/(T1i-T0)
其中TSi为各工作单元的温度变化参数,Ti为各工作单元的实际温度参数,T1i为各工作单元预先设置的最高温度参数,T0为设备运行环境的环境温度参数。
而设备温度参数可通过下式计算:
TK=∑TSi×Ai
其中TK为设备温度参数,TSi为各工作单元的温度变化参数,Ai为预先设置的各工作单元的单元温度加权值,且∑Ai=1,i=1~n,n为工作单元的数目。
由于不同工作单元保证正常工作状态的温度范围不同,因此本发明将各工作单元的实际温度参数转化为温度变化参数,以综合反映工作单元的相对温度情况。各工作单元预先设置的最高温度参数T1i可以是其最高忍耐温度,也可以是设定的阀值温度,环境温度参数T0可以是设备内的平均温度,也可以是室内温度。
根据环境温度参数T0、各工作单元的最高温度参数T1i以及实际温度参数Ti即可得到各工作单元的温度变化参数TSi,温度变化参数TSi反映了各工作单元的温度变化状态。实际上,反映温度变化状态的温度变化参数TSi还可以通过其他关系式获得,例如,TSi=Ti/T1i,用各工作单元的当前实际温度与最高温度的比值反映温度变化状态。
在得到各工作单元的温度变化参数TSi后,通过对各工作单元的温度变化参数TSi进行加权处理即可获得设备温度参数TK。单元温度加权值Ai与设备的性质和设备内各工作单元的关注程度等因素有关,根据不同的设备,关注程度大的工作单元的单元温度加权值Ai较大。本实施例中,各工作单元的单元温度加权值见表1。
表1  各工作单元的单元温度加权值
  设备类型     中心处理器     硬盘     内存
  网络交换设备     0.4     0.2     0.4
  计算类设备     0.6     0.2     0.2
  服务器类设备     0.2     0.5     0.3
实际上,设备温度参数TK还可以通过其他关系式获得。
在得到设备温度参数TK后,根据预先设置的设备温度参数与设备健康状态之间的对应关系,由设备温度参数获得该设备的设备健康状态。本实施例中,预先设置的设备温度参数与设备健康状态关系见表2。
表2  设备温度参数与设备健康状态关系
  设备类型   设备温度参数≤P1 P1<设备温度参数<P2   设备温度参数≥P2
  网络交换设备   正常工作状态 亚健康工作状态   危险工作状态
  计算类设备   正常工作状态 亚健康工作状态   危险工作状态
  服务器类设备   正常工作状态 亚健康工作状态   危险工作状态
表2表明,只有当设备温度参数小于或等于P1时,设备才是正常工作状态。只要设备温度参数大于或等于P2,设备即为危险工作状态。当设备温度参数在P1和P2之间时,设备为亚健康工作状态。其中,P1=0.3~0.5,P2=0.7~0.9。
在本实施例上述技术方案基础上,根据设备健康状态的结论可以对设备进行相应的管理和优化,可发现各种情况引起设备状态变化的隐患。例如,对于危险工作状态可以采用报警、给出故障原因列表、调整控制参数等处理手段,对于亚健康工作状态可以采用警示、提示检修列表、调整控制参数等处理手段,通过向设备中的各执行部件发送控制信息(包括设备新的参数),使设备做出适当的响应,进而达到预期的优化效果。其中调整控制参数主要是针对确定设备进行温度调控,如提高制冷力度、加强风扇转速等,给出故障原因列表或提示检修列表主要是针对确定设备进行提示,如风扇损坏、空调停止等,管理和优化过程可以采用多种技术手段实现。
本实施例设备温度参数还可以作为设备综合性能评价的指导,例如,在特定的设备性能参数条件下,较低设备温度参数的设备要优于较高设备温度参数的设备,而多个工作单元或关键单元的组合中,可使设备温度参数较低的组合方式也要优于使设备温度参数较高的组合方式。进一步地,通过分析还可以得出一系列结论,例如,可以找出同类元件中哪个厂家的元件较好,可以分析出特定组合方式下设备性能和稳定的瓶颈点,以及评估出各类组合方式的优劣等等。
图2为本发明设备状态分析方法第二实施例的流程图,具体包括步骤:
步骤21、采集设备中各工作单元的实际温度参数;采集设备中各工作单元的实际使用参数;
步骤22、根据各工作单元的实际温度参数获得各工作单元的温度变化参数,根据各工作单元的温度变化参数获得设备温度参数;根据各工作单元的实际使用参数获得设备使用参数;
步骤23、根据预先设置的设备温度参数与设备健康状态之间的对应关系,由所述设备温度参数获得设备健康状态;根据预先设置的设备温度参数和设备使用参数与设备运行状态之间的对应关系,由所述设备温度参数和设备使用参数获得设备运行状态。
本实施例是在图1所示本发明设备状态分析方法第一实施例的技术方案基础上,通过增加设备内各工作单元的使用率监控,充分考虑负载动态变化时设备的状态变化,使温度参数和使用参数一起作为“结果”参数,实现设备运行中设备健康状态和设备运行状态的综合分析评估,为设备优化提供更准确、更全面的支持。
本实施例技术方案中,有关通过各工作单元的实际温度参数Ti获得温度变化参数TSi、进而获得设备温度参数TK以及获得设备健康状态的处理过程在图1所示本发明设备状态分析方法第一实施例中已经详细介绍,这里只简单介绍设备使用参数及设备运行状态的处理过程。
首先在设备中设置相应的性能参数传感单元,对设备中各工作单元的实际性能进行监测,性能参数可以是利用率(针对内存和中心处理器)、读存速度或有效空间(针对硬盘)、数据吞吐量(针对端口)等主要反映其运行状态的参数,根据设备的工作性质可以调整被监测的工作单元以及工作单元数目,本实施例以计算类设备为例,将计算类设备中的中心处理器、内存和硬盘作为被监测的工作单元。在设备工作时,各性能参数传感单元将采集的各性能参数传送到处理单元进行处理,处理单元根据各工作单元的实际使用参数获得设备使用参数,最后根据预先设置的设备温度参数和设备使用参数与设备运行状态之间的对应关系,由设备温度参数和设备使用参数获得设备运行状态。
其中,设备使用参数可通过下式计算:
UK=∑Ui×Bi
其中UK为设备使用参数,Ui为各工作单元的实际使用参数,Bi为预先设置的各工作单元的单元使用加权值,且∑Bi=1,i=1~n,n为工作单元的数目。
在得到各工作单元的实际使用参数Ui后,通过对各工作单元的实际使用参数Ui进行加权处理即可获得设备使用参数UK。单元使用加权值Bi与设备的性质和设备内各工作单元的关注程度等因素有关,根据不同的设备,关注程度大的工作单元的单元使用加权值Bi较大。本实施例中,各工作单元的单元使用加权值见表3。
表3  各工作单元的单元使用加权值
  设备类型     中心处理器     内存     端口
  网络交换设备     0.2     0.2     0.6
  计算类设备     0.6     0.2     0.2
  服务器类设备     0.35     0.3     0.35
在得到设备温度参数TK和设备使用参数UK后,即可以根据预先设置的设备温度参数与设备健康状态之间的对应关系,由设备温度参数获得该设备的设备健康状态,也可以根据预先设置的设备温度参数和设备使用参数与设备运行状态之间的对应关系,由所述设备温度参数和设备使用参数获得设备运行状态。以计算类设备为例,本实施例预先设置的设备温度参数和设备使用参数与设备运行状态关系见表4。
表4  设备温度参数和设备使用参数与设备运行状态关系
计算类设备   设备温度参数≤P1 P1<设备温度参数<P2   设备温度参数≥P2
设备使用参数≤Q1   正常运行状态a 亚健康运行状态b   危险运行状态c
Q1<设备使用参数<Q2   亚健康运行状态d 亚健康运行状态e   危险运行状态f
设备使用参数≥Q2   危险运行状态g 危险运行状态h   危险运行状态i
表4表明,只有当设备温度参数小于P1和设备使用参数小于Q1时,设备才是正常运行状态。只要当设备温度参数大于P2或设备使用参数大于Q2,设备即为危险运行状态。当设备温度参数在P1和P2之间且设备使用参数小于Q2时,或当设备使用参数在Q1和Q2之间且设备温度参数小于P2时,设备为亚健康运行状态。其中,P1=0.3~0.5,P2=0.7~0.9,Q1=0.5~0.7,Q2=0.7~0.9。
根据表4得到的设备运行状态,本实施例可以给出故障原因列表或提示检修列表。根据预先设置的故障判断9种状态(正常运行状态a~危险运行状态i),可以给出相应的故障提示内容和具体措施。例如:
1.危险状态
(1)对于由温度导致的危险运行状态,即处于危险运行状态c、危险运行状态f和危险运行状态i情况时,进行高温报警,给出的建议措施为:
①判断是否为温控装置故障引起,比如风扇损坏、空调停止等;
②针对确定设备进行温度调控,比如加强制冷力度、提高风扇转速等;
(2)对于由利用率导致的危险运行状态,即处于危险运行状态g、危险运行状态h和危险运行状态i情况时,进行利用率报警,给出的建议措施为:
①判断是否为负载引起,比如负载过高等;
②针对确定设备进行性能提升,比如加大相应元件速度或容量;
2.亚健康状态
(1)对于处于亚健康运行状态b或亚健康运行状态e情况,表明温度已经超过预设值,需要关注;
(2)对于处于亚健康运行状态d或亚健康运行状态e情况,表明利用率可能超过预设值,需要关注。
在本实施例上述技术方案基础上,根据设备运行状态的结论可以对设备进行相应的管理和优化,由于设备运行状态考虑了设备温度参数和设备使用参数,因此管理和优化的效果更加明显。相关内容已在本发明设备状态分析方法第一实施例中已经详细介绍,不再赘述。
图3为本发明设备状态分析装置第一实施例的结构示意图。本实施例是采用图1所示本发明设备状态分析方法第一实施例技术方案的实施装置,通过设置温度采集装置获得设备的设备温度参数,实现对设备健康状态的分析评估。具体地,本实施例设备状态分析装置包括设备温度采集模块11、设备温度处理模块12和设备健康评估模块13,设备温度采集模块11包括设置在各工作单元的温度采集器,用于采集设备中各工作单元的实际温度参数;设备温度处理模块12与设备温度采集模块111中各温度采集器连接,用于根据各工作单元的实际温度参数获得各工作单元的温度变化参数,进而获得设备温度参数;设备健康评估模块13与设备温度处理模块12连接,用于根据预先设置的设备温度参数与设备健康状态之间的对应关系,由设备温度参数获得设备健康状态。进一步地,本实施例设备状态分析装置还可以包括设备优化处理模块14,设备优化处理模块14与设备健康评估模块13连接,用于根据设备状态对设备进行分析评估,根据分析评估结果通过向设备中的各执行部件发送控制信息实现设备的优化。
图4为本发明设备状态分析装置第一实施例的实施示意图,以计算类设备为例,在设备中的中心处理器、内存和硬盘处设置处理器温度采集器111、内存温度采集器112和硬盘温度采集器113,同时在设备运行环境中设置采集环境温度的环境温度采集器110。在设备工作时,各温度采集器将采集的实际温度参数传送到设备温度处理模块12进行处理,设备温度处理模块12根据各实际温度参数分别获得中心处理器、内存和硬盘的温度变化参数,并进一步获得设备温度参数后向设备健康评估模块13发送。设备健康评估模块13接收到设备温度参数后,根据预先设置的设备温度参数与设备健康状态之间的对应关系,由设备温度参数获得设备的设备健康状态。设备健康评估模块13预先设置有设备温度参数与设备健康状态关系(见表2),通过设备温度参数的值域判断出设备的健康状态。进一步地,设备健康评估模块13将设备健康状态和设备温度参数发送给设备优化处理模块14,设备优化处理模块14根据设备状态对设备进行分析评估,根据分析评估结果生成相应的控制信号向设备中的一个或多个执行部件发送,一个或多个执行部件使设备做出相应的反应,例如通过加强制冷力度、提高风扇转速等手段达到预期的优化效果。此外,设备优化处理模块14还可以给出故障原因列表或提示检修列表,针对确定设备进行提示,如风扇损坏、空调停止等。本实施例设备优化处理模块的分析评估结果还可以作为设备综合性能评价的指导,例如,在特定的设备性能参数条件下,较低设备温度参数的设备要优于较高设备温度参数的设备,而多个工作单元或关键单元的组合中,可使设备温度参数较低的组合方式也要优于使设备温度参数较高的组合方式。进一步地,通过分析还可以得出一系列结论,例如,可以找出同类元件中哪个厂家的元件较好,可以分析出特定组合方式下设备性能和稳定的瓶颈点,以及评估出各类组合方式的优劣等等。
图5为本发明设备状态分析装置第二实施例的结构示意图。本实施例是采用图2所示本发明设备状态分析方法第二实施例技术方案的实施装置,通过设置温度采集装置和使用采集装置获得设备的设备温度参数和设备使用参数,实现设备运行中设备健康状态和设备运行状态的综合分析评估,为设备优化提供更准确、更全面的支持。
具体地,本实施例设备状态分析装置包括二部分:设备温度参数部分和设备使用参数部分。设备温度参数部分包括设备温度采集模块11、设备温度处理模块12和设备健康评估模块13,设备温度采集模块11包括设置在各工作单元的温度采集器,用于采集设备中各工作单元的实际温度参数;设备温度处理模块12与设备温度采集模块11中各温度采集器连接,用于根据各工作单元的实际温度参数获得各工作单元的温度变化参数,进而获得设备温度参数;设备健康评估模块13与设备温度处理模块12连接,用于根据预先设置的设备温度参数与设备健康状态之间的对应关系,由设备温度参数获得设备健康状态。设备使用参数部分包括设备使用采集模块15、设备使用处理模块16和设备运行评估模块17,设备使用采集模块15包括设置在各工作单元的性能采集器,用于采集设备中各工作单元的实际使用参数;设备使用处理模块16与设备使用采集模块15中各性能采集器连接,用于根据各工作单元的实际使用参数获得设备使用参数;设备运行评估模块17与设备温度处理模块12和设备使用处理模块16连接,用于根据预先设置的设备温度参数和设备使用参数与设备运行状态之间的对应关系(见表4),由设备温度参数和设备使用参数获得设备运行状态。进一步地,本实施例设备状态分析装置还可以包括设备优化处理模块14,设备优化处理模块14分别与设备健康评估模块13和设备运行评估模块17连接,用于根据设备状态对设备进行分析评估,根据分析评估结果通过向设备中的各执行部件发送控制信息实现设备的优化。
本实施例技术方案的工作过程与图3和图4所示本发明设备状态分析装置第一实施例基本相同,不同之处在于增加了各使用采集器以及使用参数的处理过程,由于设备运行状态考虑了设备温度参数和设备使用参数,因此管理和优化的效果更加明显。
图6为本发明网络状态分析方法第一实施例的流程图,具体包括步骤:
步骤31、采集网络中各设备的设备温度参数;
步骤32、根据各设备的设备温度参数获得整个网络的网络温度参数;
步骤33、根据预先设置的网络温度参数与网络健康状态之间的对应关系,由所述网络温度参数获得网络健康状态。
本实施例是在图1所示本发明设备状态分析方法第一实施例的技术方案基础上,通过设备温度参数的监控,实现网络运行中网络健康状态的分析评估,为网络优化提供准确、全面的支持。
网络中各设备的处理单元在完成设备温度参数处理后,将处理得到的各设备温度参数传送到中心处理单元进一步处理,获得整个网络的网络温度参数,最后根据预先设置的网络温度参数与网络健康状态之间的对应关系,由网络温度参数获得整个网络的网络健康状态。本实施例中,网络分为二级:子网级和整网级。子网级是指在受系统监控的整个网络中,可能需要对某个子网进行网络级的分析评估,在此情况下,需要将此子网做为一个分析处理对象;整网级是指受系统监控的最大范围的网络。
其中,网络温度参数可通过下式计算:
TW=∑TKj×Cj
其中TW为网络温度参数,TKj为网络内各设备的设备温度参数,Cj为预先设置的各设备的设备温度加权值,且∑Cj=1,j=1~m,m为网络内设备的数目。
在得到各设备的设备温度参数TKj后,通过对各设备的设备温度参数TKj进行加权处理即可获得网络温度参数TW。设备温度加权值Cj与网络的性质和网络内各设备的关注程度等因素有关,根据不同的网络,关注程度大设备的温度加权值Cj较大。本实施例中各设备的设备温度加权值见表5。
表5各设备的设备温度加权值
    网络类型     服务器     路由器     外部设备
    数据交换网络     0.4     0.2     0.4
    存储网络     0.6     0.2     0.2
    服务类网络     0.2     0.5     0.3
在得到网络温度参数TW后,根据预先设置的网络温度参数与网络健康状态之间的对应关系,由网络温度参数获得整个网络的网络健康状态。本实施例中,预先设置的网络温度参数与网络健康状态关系见表6。
表6  网络温度参数与网络健康状态关系
  网络类型   网络温度参数≤R1   R1<网络温度参数<R2   网络温度参数≥R2
  数据交换网络   正常工作状态   亚健康工作状态   危险工作状态
  存储网络   正常工作状态   亚健康工作状态   危险工作状态
  服务类网络   正常工作状态   亚健康工作状态   危险工作状态
表6表明,只有当网络温度参数小于或等于R1时,网络才是正常工作状态。只要网络温度参数大于或等于R2,网络即为危险工作状态。当网络温度参数在R1和R2之间时,网络为亚健康工作状态。其中,R1=0.3~0.5,R2=0.7~0.9。
在本实施例上述技术方案基础上,根据网络健康状态的结论可以对网络进行相应的管理和优化,可发现各种情况引起网络状态变化的隐患,该管理和优化过程可以采用多种技术手段实现,不再赘述。
本实施例网络温度参数还可以作为网络综合性能评价的指导,例如,在特定的网络性能参数条件下,较低网络温度参数的网络要优于较高网络温度参数的网络,而多个设备或关键设备的组合中,可使网络温度参数较低的组合方式也要优于使网络温度参数较高的组合方式。进一步地,通过分析还可以得出一系列结论,例如,可以分析出特定组合方式下网络性能和稳定的瓶颈点,以及评估出各类网元组合方式的优劣等等。
图7为本发明网络状态分析方法第二实施例的流程图,具体包括步骤:
步骤41、采集网络中各设备的设备温度参数和设备使用参数;
步骤42、根据各设备的设备温度参数获得整个网络的网络温度参数,根据各设备的设备使用参数获得整个网络的网络使用参数;
步骤43、根据预先设置的网络温度参数与网络健康状态之间的对应关系,由所述网络温度参数获得网络健康状态,根据预先设置的网络温度参数和网络使用参数与网络运行状态之间的对应关系,由所述网络温度参数和网络使用参数获得网络运行状态。
本实施例是在图2所示本发明网络状态分析方法第二实施例的技术方案基础上,通过网络温度参数和网络使用参数的监控,实现网络运行中网络健康状态和网络运行状态的综合分析评估,为网络优化提供更准确、更全面的支持。
本实施例技术方案中,有关网络温度参数以及网络健康状态的处理过程在图6所示本发明网络状态分析方法第一实施例中已经详细介绍,这里只简单介绍网络使用参数及网络运行状态的处理过程。
网络中各设备的处理单元在完成设备使用参数处理后,将处理得到的各设备使用参数传送到中心处理单元进一步处理,获得整个网络的网络使用参数,最后根据预先设置的网络温度参数和网络使用参数与网络运行状态之间的对应关系,由网络温度参数和网络使用参数获得网络运行状态。
其中,网络使用参数可通过下式计算:
UW=∑UKj×Dj
其中UW为网络使用参数,UKj为网络内各设备的设备使用参数,Dj为预先设置的各设备的设备使用加权值,且∑Dj=1,j=1~m,m为网络设备的数目。
在得到各设备的设备使用参数UKj后,通过对各设备的设备使用参数UKj进行加权处理即可获得网络使用参数UW。设备使用加权值Dj与网络的性质和网络内各设备的关注程度等因素有关,根据不同的网络,关注程度大的单元使用加权值Dj较大。本实施例中,各设备的设备使用加权值见表7。
表7  各设备的单元使用加权值
    网络类型     服务器     路由器     外部设备
    数据交换网络     0.2     0.2     0.6
    存储网络     0.6     0.2     0.2
    服务类网络     0.35     0.3     0.35
在得到网络温度参数TW和网络使用参数UW后,即可以根据预先设置的网络温度参数与网络健康状态之间的对应关系,由网络温度参数获得整个网络的网络健康状态,也可以根据预先设置的网络温度参数和网络使用参数与网络运行状态之间的对应关系,由所述网络温度参数和网络使用参数获得网络运行状态。以存储网络为例,本实施例预先设置的网络温度参数和网络使用参数与网络运行状态关系见表8。
表8  网络温度参数和网络使用参数与网络运行状态关系
存储网络   网络温度参数≤R1 R1<网络温度参数<2   网络温度参数≥R2
网络使用参数≤S1   正常运行状态 亚健康运行状态   危险运行状态
S1<网络使用参数<S2   亚健康运行状态 亚健康运行状态   危险运行状态
网络使用参数≥S2   危险运行状态 危险运行状态   危险运行状态
表8表明,只有当网络温度参数小于R1和网络使用参数小于S1时,网络才是正常运行状态。只要当网络温度参数大于R2或网络使用参数大于S2,网络即为危险运行状态。当网络温度参数在R1和R2之间且网络使用参数小于S2时,或当网络使用参数在S1和S2之间且网络温度参数小于R2时,网络为亚健康运行状态。其中,R1=0.3~0.5,R2=0.7~0.9,S1=0.5~0.7,S 2=0.7~0.9。
在本实施例上述技术方案基础上,根据网络运行状态的结论可以对网络进行相应的管理和优化,由于网络运行状态考虑了网络温度参数和网络使用参数,因此管理和优化的效果更加明显。
图8为本发明网络状态分析装置第一实施例的结构示意图。本实施例是采用图6所示本发明网络状态分析方法第一实施例技术方案的实施装置,而且包含了图3所示本发明设备状态分析装置第一实施例的技术方案,通过设置温度采集装置获得网络的网络温度参数,实现对网络健康状态的分析评估。具体地,本实施例网络状态分析装置包括网络温度采集模块21、网络温度处理模块22和网络健康评估模块23,网络温度采集模块21用于获得网络中各设备的设备温度参数,具体地说,网络温度采集模块21与图2所示设备状态分析装置中的设备温度处理模块12连接;网络温度处理模块22与网络温度采集模块21连接,用于根据各设备的设备温度参数获得网络温度参数;网络健康评估模块23与网络温度处理模块22连接,用于根据预先设置的网络温度参数与网络健康状态之间的对应关系,由网络温度参数获得网络健康状态。进一步地,本实施例网络状态分析装置还可以包括网络优化处理模块24,网络优化处理模块24与网络健康评估模块23连接,用于根据网络状态对网络进行分析评估,根据分析评估结果通过向网络中的各执行部件发送控制信息实现网络的优化。本实施例中,网络分为二级:子网级和整网级。子网级是指在受系统监控的整个网络中,可能需要对某个子网进行网络级的分析评估,在此情况下,需要将此子网做为一个分析处理对象;整网级是指受系统监控的最大范围的网络。
图9为本发明网络状态分析装置第一实施例的实施示意图,以存储网络为例,在网络中的服务器、路由器和外部设备处设置服务器温度采集器211、路由器温度采集器212和外部设备温度采集器213,上述采集器均与设置在该处的本发明设备状态分析装置中的设备温度处理模块连接。在网络工作时,各温度采集器将采集的设备温度参数传送到网络温度处理模块22进行处理,网络温度处理模块22获得网络温度参数后向网络健康评估模块23发送。网络健康评估模块23接收到网络温度参数后,根据预先设置的网络温度参数与网络健康状态之间的对应关系,由网络温度参数获得网络健康状态。网络健康评估模块23预先设置有网络温度参数与网络健康状态关系(见表6),通过网络温度参数的值域判断出网络的健康状态。进一步地,网络健康评估模块23将网络健康状态和网络温度参数发送给网络优化处理模块24,网络优化处理模块24根据网络状态对网络进行分析评估,根据分析评估结果生成相应的控制信号向网络中的一个或多个执行部件发送,一个或多个执行部件使网络做出相应的反应,达到预期的优化效果。本实施例网络优化处理模块的分析评估结果还可以作为网络综合性能评价的指导,例如,在特定的网络性能参数条件下,较低网络温度参数的网络要优于较高网络温度参数的网络,而多个网元的组合中,可使网络温度参数较低的组合方式也要优于使网络温度参数较高的组合方式。进一步地,通过分析还可以得出一系列结论,例如,可以找出同类网元中哪个厂家的网元较好,可以分析出特定组合方式下网络性能和稳定的瓶颈点,以及评估出各类组合方式的优劣等等。
图10为本发明网络状态分析装置第二实施例的结构示意图。本实施例是采用图7所示本发明网络状态分析方法第二实施例技术方案的实施装置,而且包含了图5所示本发明设备状态分析装置第二实施例的技术方案,通过设置温度采集装置和使用采集装置获得网络的网络温度参数和网络使用参数,实现网络运行中网络健康状态和网络运行状态的综合分析评估,为网络优化提供更准确、更全面的支持。
具体地,本实施例网络状态分析装置包括二部分:网络温度参数部分和网络使用参数部分。网络温度参数部分包括网络温度采集模块21、网络温度处理模块22和网络健康评估模块23,网络温度采集模块21用于获得网络中各设备的设备温度参数,具体地说,网络温度采集模块21与图5所示设备状态分析装置中的设备温度处理模块12连接;网络温度处理模块22与网络温度采集模块21连接,用于获得网络温度参数;网络健康评估模块23与网络温度处理模块22连接,用于根据预先设置的网络温度参数与网络健康状态之间的对应关系(见表8),由网络温度参数获得网络健康状态。网络使用参数部分包括网络使用采集模块25、网络使用处理模块26和网络运行评估模块27,网络使用采集模块25用于获得网络中各设备的设备使用参数,具体地说,网络使用采集模块25与图5所示设备状态分析装置中的设备使用处理模块16连接;网络使用处理模块26与网络使用采集模块25连接,用于获得网络使用参数;网络运行评估模块27与网络温度处理模块22和网络使用处理模块26连接,用于根据预先设置的网络温度参数和网络使用参数与网络运行状态之间的对应关系,由网络温度参数和网络使用参数获得网络运行状态。进一步地,本实施例网络状态分析装置还可以包括网络优化处理模块24,网络优化处理模块24分别与网络健康评估模块23和网络运行评估模块27连接,用于根据网络状态对网络进行分析评估,根据分析评估结果通过向网络中的各执行部件发送控制信息实现网络的优化。
本实施例技术方案的工作过程与图8和图9所示本发明网络状态分析装置第一实施例基本相同,不同之处在于增加了各使用采集器以及使用参数的处理过程,由于网络运行状态考虑了网络温度参数和网络使用参数,因此管理和优化的效果更加明显。
最后应说明的是:以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围。

Claims (17)

1.一种设备状态分析方法,其特征在于,包括: 
采集设备中各工作单元的实际温度参数; 
根据各工作单元的实际温度参数获得各工作单元的温度变化参数,根据各工作单元的温度变化参数获得设备温度参数; 
根据预先设置的设备温度参数与设备健康状态之间的对应关系,由所述设备温度参数获得设备健康状态。 
2.根据权利要求1所述的设备状态分析方法,其特征在于,根据各工作单元的实际温度参数获得各工作单元的温度变化参数具体为:通过TSi=(Ti-T0)/(T1i-T0)计算各工作单元的温度变化参数,其中TSi为各工作单元的温度变化参数,Ti为各工作单元的实际温度参数,T1i为各工作单元预先设置的最高温度参数,T0为设备运行环境的环境温度参数。 
3.根据权利要求2所述的设备状态分析方法,其特征在于,根据各工作单元的温度变化参数获得设备温度参数具体为:通过TK=∑TSi×Ai计算设备温度参数,其中TK为设备温度参数,TSi为各工作单元的温度变化参数,Ai 为预先设置的各工作单元的单元温度加权值,且∑Ai=1,i=1~n,n为工作单元的数目。 
4.根据权利要求1所述的设备状态分析方法,其特征在于,还包括步骤: 
采集设备中各工作单元的实际使用参数; 
根据各工作单元的实际使用参数获得设备使用参数; 
根据预先设置的设备温度参数和设备使用参数与设备运行状态之间的对应关系,由所述设备温度参数和设备使用参数获得设备运行状态。 
5.根据权利要求4所述的设备状态分析方法,其特征在于,根据各工作单元的实际使用参数获得设备使用参数具体为:通过UK=∑Ui× Bi计算设备使用参数,其中UK为设备使用参数,Ui为各工作单元的实际使用参数,Bi为预先设置的各工作单元的单元使用加权值,且∑Bi=1,i=1~n,n为工作单元的 数目。 
6.根据权利要求1~5中任一权利要求所述的设备状态分析方法,其特征在于,还包括步骤:根据设备状态对设备进行分析评估,并根据分析评估结果对所述设备进行优化处理。 
7.一种设备状态分析装置,其特征在于,包括: 
设备温度采集模块,包括设置在各工作单元的温度采集器,用于采集设备中各工作单元的实际温度参数; 
设备温度处理模块,与所述设备温度采集模块中各温度采集器连接,用于根据各工作单元的实际温度参数获得各工作单元的温度变化参数,进而获得设备温度参数; 
设备健康评估模块,与所述设备温度处理模块连接,用于根据预先设置的设备温度参数与设备健康状态之间的对应关系,由所述设备温度参数获得设备健康状态。 
8.根据权利要求7所述的设备状态分析装置,其特征在于,还包括: 
设备使用采集模块,包括设置在各工作单元的性能采集器,用于采集设备中各工作单元的实际使用参数; 
设备使用处理模块,与所述设备使用采集模块中各性能采集器连接,用于根据各工作单元的实际使用参数获得设备使用参数; 
设备运行评估模块,与所述设备温度处理模块和设备使用处理模块连接,用于根据预先设置的设备温度参数和设备使用参数与设备运行状态之间的对应关系,由所述设备温度参数和设备使用参数获得设备运行状态。 
9.根据权利要求8所述的设备状态分析装置,其特征在于,还包括:
设备优化处理模块,与所述设备健康评估模块和设备运行评估模块连接,用于根据设备状态对设备进行分析评估,根据分析评估结果通过向设备中的各执行部件发送控制信息实现设备的优化。
10.一种网络状态分析方法,其特征在于,包括: 
采集网络中各设备的设备温度参数; 
根据各设备的设备温度参数获得整个网络的网络温度参数; 
根据预先设置的网络温度参数与网络健康状态之间的对应关系,由所述网络温度参数获得网络健康状态。 
11.根据权利要求10所述的网络状态分析方法,其特征在于,根据各设备的设备温度参数获得整个网络的网络温度参数具体为:通过TW=∑TKj×Cj计算网络温度参数,其中TW为网络温度参数,TKj为网络内各设备的设备温度参数,Cj为预先设置的各设备的设备温度加权值,且∑Cj=1,j=1~m,m为网络内设备的数目。 
12.根据权利要求10所述的网络状态分析方法,其特征在于,还包括步骤: 
采集网络中各设备的设备使用参数; 
根据各设备的设备使用参数获得整个网络的网络使用参数; 
根据预先设置的网络温度参数和网络使用参数与网络运行状态之间的对应关系,由所述网络温度参数和网络使用参数获得网络运行状态。 
13.根据权利要求12所述的网络状态分析方法,其特征在于,根据各设备的设备使用参数获得整个网络的网络使用参数具体为:通过UW=∑UKj×Dj计算网络使用参数,其中UW为网络使用参数,UKj为网络内各设备的设备使用参数,Dj为预先设置的各设备的设备使用加权值,且∑Dj=1,j=1~m,m为网络设备的数目。 
14.根据权利要求10~13中任一权利要求所述的网络状态分析方法,其特征在于,还包括步骤:根据网络状态对网络进行分析评估,并根据分析评估结果对所述网络进行优化处理。 
15.一种网络状态分析装置,其特征在于,包括: 
网络温度采集模块,用于获得网络中各设备的设备温度参数; 
网络温度处理模块,与所述网络温度采集模块连接,用于根据各设备的 设备温度参数获得网络温度参数; 
网络健康评估模块,与所述网络温度处理模块连接,用于根据预先设置的网络温度参数与网络健康状态之间的对应关系,由所述网络温度参数获得网络健康状态。 
16.根据权利要求15所述的网络状态分析装置,其特征在于,还包括:
网络使用采集模块,用于获得网络中各设备的设备使用参数;
网络使用处理模块,与所述网络使用采集模块连接,用于根据各设备的设备使用参数获得网络使用参数;
网络运行评估模块,与所述网络温度处理模块和网络使用处理模块连接,用于根据预先设置的网络温度参数和网络使用参数与网络运行状态之间的对应关系,由所述网络温度参数和网络使用参数获得网络运行状态。
17.根据权利要求16所述的网络状态分析装置,其特征在于,还包括:
网络优化处理模块,与所述网络健康评估模块和网络运行评估模块连接,用于根据网络状态对网络进行分析评估,根据分析评估结果通过向网络中的各执行部件发送控制信息实现网络的优化。 
CN2007101788765A 2007-12-06 2007-12-06 设备、网络状态分析方法及装置 Active CN101453383B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2007101788765A CN101453383B (zh) 2007-12-06 2007-12-06 设备、网络状态分析方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2007101788765A CN101453383B (zh) 2007-12-06 2007-12-06 设备、网络状态分析方法及装置

Publications (2)

Publication Number Publication Date
CN101453383A CN101453383A (zh) 2009-06-10
CN101453383B true CN101453383B (zh) 2011-06-15

Family

ID=40735412

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007101788765A Active CN101453383B (zh) 2007-12-06 2007-12-06 设备、网络状态分析方法及装置

Country Status (1)

Country Link
CN (1) CN101453383B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102889665B (zh) * 2011-07-22 2014-11-26 珠海格力电器股份有限公司 空调远程监控系统及监控方法
CN113656238B (zh) * 2021-08-17 2023-07-04 北京京航计算通讯研究所 一种智能终端的ai工业应用能力测试方法和系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1512382A (zh) * 2002-12-27 2004-07-14 ������������ʽ���� 设备监测系统、监测程序和监测方法及装置
CN1642101A (zh) * 2004-01-15 2005-07-20 英业达股份有限公司 全程远程控制系统及方法
CN1956395A (zh) * 2005-10-24 2007-05-02 中兴通讯股份有限公司 电信网络管理系统中多设备性能监测的方法
JP2007214761A (ja) * 2006-02-08 2007-08-23 Fujitsu Ltd データ転送装置におけるデバイスの発熱制御装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1512382A (zh) * 2002-12-27 2004-07-14 ������������ʽ���� 设备监测系统、监测程序和监测方法及装置
CN1642101A (zh) * 2004-01-15 2005-07-20 英业达股份有限公司 全程远程控制系统及方法
CN1956395A (zh) * 2005-10-24 2007-05-02 中兴通讯股份有限公司 电信网络管理系统中多设备性能监测的方法
JP2007214761A (ja) * 2006-02-08 2007-08-23 Fujitsu Ltd データ転送装置におけるデバイスの発熱制御装置

Also Published As

Publication number Publication date
CN101453383A (zh) 2009-06-10

Similar Documents

Publication Publication Date Title
US11140056B2 (en) Flexible and safe monitoring of computers
US7702780B2 (en) Monitoring method, system, and computer program based on severity and persistence of problems
CN107943668A (zh) 计算机服务器集群日志监控方法及监控平台
KR100748246B1 (ko) 침입탐지 로그수집 엔진과 트래픽 통계수집 엔진을 이용한다단계 통합보안 관리 시스템 및 방법
CN100356729C (zh) 监控网络业务性能的方法及系统
CN107273273A (zh) 一种分布式集群硬件故障预警方法及系统
CN104881352A (zh) 基于移动端的系统资源监控装置
CN104378262A (zh) 一种云计算下智能监控分析方法及系统
CN104574219A (zh) 电网业务信息系统运行工况的监测预警方法及系统
CN105262210A (zh) 一种变电站网络安全性分析预警系统和方法
CN105808415A (zh) 一种基于云计算环境的业务运行状态评估方法及其装置
CN106646186B (zh) 一种芯片的批量测试方法及系统
CN109032904A (zh) 被监控、管理服务器及数据获取、分析方法和管理系统
CN101815317B (zh) 一种传感器节点和传感器网络的测量方法及系统
CN115733762A (zh) 具有大数据分析能力的监控系统
CN101453383B (zh) 设备、网络状态分析方法及装置
CN108055152B (zh) 基于分布式服务日志的通信网络信息系统异常检测方法
CN103297281A (zh) 一种电力专用业务通道运行状态监测的方法和系统
CN109766243B (zh) 一种基于幂函数的多核主机性能监控方法
CN101494568A (zh) 一种缩短性能告警产生的方法
CN106341474A (zh) 一种基于icn与sdn网络的资料管控中心及其内容管理方法
CN102025553A (zh) 信息与应用资源运行状态评价方法
Mehrotra et al. Energy Efficient and Fault Tolerant Area Monitoring for Sensor Networks
CN110932938A (zh) 一种主机运行远程监控系统
CN111245632A (zh) 一种基于云分析的安全日志存储与管理系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant