CN105653430A - 一种处理服务器管理信息的方法、装置及系统 - Google Patents

一种处理服务器管理信息的方法、装置及系统 Download PDF

Info

Publication number
CN105653430A
CN105653430A CN201610004326.0A CN201610004326A CN105653430A CN 105653430 A CN105653430 A CN 105653430A CN 201610004326 A CN201610004326 A CN 201610004326A CN 105653430 A CN105653430 A CN 105653430A
Authority
CN
China
Prior art keywords
abnormal
vector
feature vector
threshold
equipment end
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610004326.0A
Other languages
English (en)
Inventor
刘�东
赵瑞东
吴登勇
孙超
李保来
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Chaoyue Numerical Control Electronics Co Ltd
Original Assignee
Shandong Chaoyue Numerical Control Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Chaoyue Numerical Control Electronics Co Ltd filed Critical Shandong Chaoyue Numerical Control Electronics Co Ltd
Priority to CN201610004326.0A priority Critical patent/CN105653430A/zh
Publication of CN105653430A publication Critical patent/CN105653430A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/328Computer systems status display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/321Display for diagnostics, e.g. diagnostic result display, self-test user interface

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • Human Computer Interaction (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种处理服务器管理信息的方法、装置及系统,该方法包括:设备端利用基板管理控制器BMC实时监测其自身的运行状态,在监测到运行异常时,将相应的异常信息发送至设备维护端;设备维护端接收该异常信息,生成相应的异常特征向量,并判断在故障库内的所有特征向量中是否存在目标特征向量与该异常特征向量相匹配;若存在,则解析故障库中的与该目标特征向量相对应的解决方案,并将生成的相应处理指令反馈至设备端,以使设备端执行相应操作,因此,本方案能够自动解决服务器的常见故障问题。

Description

一种处理服务器管理信息的方法、装置及系统
技术领域
本发明涉及服务器管理领域,特别涉及一种处理服务器管理信息的方法、装置及系统。
背景技术
IPMI(IntelligentPlatformManagementInterface,智能平台管理接口)是一种用于进行系统管理和监控的标准的计算机硬件接口,用户可以通过IPMI规范来监视服务器的物理健康特征,从而达到远程监测、管理和恢复服务器功能的效果。BMC(BaseboardManagementController,基板管理控制器)是IPMI的核心,是可以安装在服务器主板上,但又独立于服务器的具有自备电源的微处理器。BMC负责设备维护端与设备端的沟通,例如,设备维护端对设备端的温度、电压、电源状态等的监控都是通过与BMC的通信而实现的。
目前的服务器管理模式为,在设备端出现故障而报警时,服务器管理人员根据设备端服务器中的BMC发送的监测信息,分析故障原因,明确相应的解决方案,并将与该解决方案对应的指令反馈至BMC中,以解决设备端的故障问题。
但是,在设备端频繁出现一些常见故障问题时,仍需服务器管理人员亲自分析问题以解决故障,而不能使系统自动解决常见故障。
发明内容
本发明提供了一种处理服务器管理信息的方法、装置及系统,能够自动解决服务器的常见故障问题。
为了达到上述目的,本发明是通过如下技术方案实现的:
一方面,本发明提供了一种处理服务器管理信息的方法,应用于设备维护端,预先确定内部故障库中的所有特征向量及相应的所有解决方案,还包括:
S1:在设备端中的基板管理控制器BMC监测到所述设备端出现异常情况时,接收由所述BMC发送的与所述异常情况相对应的异常信息;
S2:生成与所述异常信息相对应的异常特征向量;
S3:判断在所述所有特征向量中是否存在目标特征向量与所述异常特征向量相匹配,若存在,则解析与所述目标特征向量相对应的目标解决方案,生成相应的处理指令,并将所述处理指令反馈至所述设备端,以使所述设备端根据所述处理指令执行相应操作。
进一步地,所述S2,包括:
对所述异常信息中的异常数据流进行规格化预处理,获得预处理后的异常数据流;
对所述预处理后的异常数据流进行小波变换,获得相应的异常变换系数流;
根据所述异常变换系数流,生成相应的异常特征向量。
进一步地,在所述对所述异常信息中的异常数据流进行规格化预处理之前,还包括:预先获取所述BMC中的第一阈值Ua和第二阈值Ub,其中,所述第一阈值Ua不大于所述第二阈值Ub
所述对所述异常信息中的异常数据流进行规格化预处理,包括:将所述异常信息中的异常数据流U1,U2,……,Un预处理为U1′,U2′,……,Un′,其中,所述预处理的执行方式为:
在Ui<Ua时,Ui′=︱Ui-Ua︱/Ui,(i=1,2,……,n);
在Ui>Ub时,Ui′=︱Ui-Ub︱/Ui,(i=1,2,……,n)。
进一步地,所述对所述预处理后的异常数据流进行小波变换,获得相应的异常变换系数流,包括:对所述预处理后的异常数据流U1′,U2′,……,Un′进行离散一维小波变换,提取与各异常数据Ui′相对应的特征系数ωi,得到异常变换系数流ω1,ω2,……,ωn
进一步地,在所述判断在所述所有特征向量中是否存在目标特征向量与所述异常特征向量相匹配之前,还包括:预先设置目标阈值,其中,所述目标阈值介于0和1之间;
所述判断在所述所有特征向量中是否存在目标特征向量与所述异常特征向量相匹配,包括:
分别计算所述异常特征向量与所述所有特征向量中的每一个特征向量的夹角余弦值;
判断在所述夹角余弦值中是否存在不小于所述目标阈值的目标夹角余弦值,且在存在至少一个所述目标夹角余弦值时,确定与所述至少一个所述目标夹角余弦值中的最大目标夹角余弦值所对应的特征向量为所述目标特征向量。
进一步地,在S3之后,还包括:根据所述目标特征向量与所述异常特征向量将所述故障库中的所述目标特征向量更新为其中,所述更新的执行方式为:
另一方面,本发明提供了一种设备维护端,包括:
确定单元,用于确定内部故障库中的所有特征向量及相应的所有解决方案,并发送至处理单元;
接收单元,用于在设备端中的BMC监测到所述设备端出现异常情况时,接收由所述BMC发送的与所述异常情况相对应的异常信息,以及向生成单元输出所述异常信息;
所述生成单元,用于生成与所述异常信息相对应的异常特征向量,以及向所述处理单元输出所述异常特征向量;
所述处理单元,用于接收所述确定单元发送的所述所有特征向量及相应的所有解决方案,根据所述生成单元输出的所述异常特征信息,判断在所述所有特征向量中是否存在目标特征向量与所述异常特征向量相匹配,若存在,则解析与所述目标特征向量相对应的目标解决方案,生成相应的处理指令,并将所述处理指令反馈至所述设备端,以使所述设备端根据所述处理指令执行相应操作。
进一步地,所述生成单元,包括:
预处理子单元,用于对所述异常信息中的异常数据流进行规格化预处理,获得预处理后的异常数据流;
数据变换子单元,用于对所述预处理后的异常数据流进行小波变换,获得相应的异常变换系数流;
生成子单元,用于根据所述异常变换系数流,生成相应的异常特征向量。
进一步地,该设备维护端还包括:获取单元,用于获取所述BMC中的第一阈值Ua和第二阈值Ub,其中,所述第一阈值Ua不大于所述第二阈值Ub
所述预处理子单元,具体用于将所述异常信息中的异常数据流U1,U2,……,Un预处理为U1′,U2′,……,Un′,其中,所述预处理的执行方式为:
在Ui<Ua时,Ui′=︱Ui-Ua︱/Ui,(i=1,2,……,n);
在Ui>Ub时,Ui′=︱Ui-Ub︱/Ui,(i=1,2,……,n)。
进一步地,所述数据变换子单元,具体用于对所述预处理后的异常数据流U1′,U2′,……,Un′进行离散一维小波变换,提取与各异常数据Ui′相对应的特征系数ωi,得到异常变换系数流ω1,ω2,……,ωn
进一步地,该设备维护端还包括:设置单元,用于设置目标阈值,其中,所述目标阈值介于0和1之间;
所述处理单元,具体用于分别计算所述异常特征向量与所述所有特征向量中的每一个特征向量的夹角余弦值;判断在所述夹角余弦值中是否存在不小于所述目标阈值的目标夹角余弦值,且在存在至少一个所述目标夹角余弦值时,确定与所述至少一个所述目标夹角余弦值中的最大目标夹角余弦值所对应的特征向量为所述目标特征向量。
进一步地,该设备维护端还包括:更新单元,用于根据所述目标特征向量与所述异常特征向量将所述故障库中的所述目标特征向量更新为其中,所述更新的执行方式为:
另一方面,本发明提供了一种处理服务器管理信息的系统,包括:上述任一所述的设备维护端,以及设备端,其中,
所述设备端,用于利用内部BMC实时监测所述设备端在运行过程中特征指标的变化,在监测到所述特征指标出现异常情况时,将与所述异常情况相对应的异常信息发送至所述设备维护端,并根据所述设备维护端反馈的相应处理指令,执行相应操作。
本发明提供了一种处理服务器管理信息的方法、装置及系统,设备端利用BMC实时监测其自身的运行状态,在监测到运行异常时,将相应的异常信息发送至设备维护端;设备维护端接收该异常信息,生成相应的异常特征向量,并判断在故障库内的所有特征向量中是否存在目标特征向量与该异常特征向量相匹配;若存在,则解析故障库中的与该目标特征向量相对应的解决方案,并将生成的相应处理指令反馈至设备端,以使设备端执行相应操作,因此,本发明能够自动解决服务器的常见故障问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例提供的一种处理服务器管理信息的方法的流程图;
图2是本发明一实施例提供的另一种处理服务器管理信息的方法的流程图;
图3是本发明一实施例提供的一种设备维护端的示意图;
图4是本发明一实施例提供的另一种设备维护端的示意图;
图5是本发明一实施例提供的另一种处理服务器管理信息的系统的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供了一种处理服务器管理信息的方法,应用于设备维护端,可以包括以下步骤:
步骤101:预先确定内部故障库中的所有特征向量及相应的所有解决方案。
步骤102:在设备端中的BMC(BaseboardManagementController,基板管理控制器)监测到所述设备端出现异常情况时,接收由所述BMC发送的与所述异常情况相对应的异常信息。
步骤103:生成与所述异常信息相对应的异常特征向量。
步骤104:判断在所述所有特征向量中是否存在目标特征向量与所述异常特征向量相匹配,若存在,则解析与所述目标特征向量相对应的目标解决方案,生成相应的处理指令,并将所述处理指令反馈至所述设备端,以使所述设备端根据所述处理指令执行相应操作。
本发明实施例提供了一种处理服务器管理信息的方法,设备端利用BMC实时监测其自身的运行状态,在监测到运行异常时,将相应的异常信息发送至设备维护端;设备维护端接收该异常信息,生成相应的异常特征向量,并判断在故障库内的所有特征向量中是否存在目标特征向量与该异常特征向量相匹配;若存在,则解析故障库中的与该目标特征向量相对应的解决方案,并将生成的相应处理指令反馈至设备端,以使设备端执行相应操作,因此,本发明实施例能够自动解决服务器的常见故障问题。
在一种可能的实现方式中,为了能够根据故障库中存储的常见故障信息,对当前的异常信息进行快速、准确的判断和匹配,所以,所述步骤103,包括:
对所述异常信息中的异常数据流进行规格化预处理,获得预处理后的异常数据流;
对所述预处理后的异常数据流进行小波变换,获得相应的异常变换系数流;
根据所述异常变换系数流,生成相应的异常特征向量。
在一种可能的实现方式中,为了去除异常数据自身幅值的差异对后续特征系数提取过程的影响,所以,在所述对所述异常信息中的异常数据流进行规格化预处理之前,进一步包括:预先获取所述BMC中的第一阈值Ua和第二阈值Ub,其中,所述第一阈值Ua不大于所述第二阈值Ub
所述对所述异常信息中的异常数据流进行规格化预处理,包括:将所述异常信息中的异常数据流U1,U2,……,Un预处理为U1′,U2′,……,Un′,其中,所述预处理的执行方式为:
在Ui<Ua时,Ui′=︱Ui-Ua︱/Ui,(i=1,2,……,n);
在Ui>Ub时,Ui′=︱Ui-Ub︱/Ui,(i=1,2,……,n)。
在一种可能的实现方式中,为了减少异常数据特征系数提取过程的计算量,所以,所述对所述预处理后的异常数据流进行小波变换,获得相应的异常变换系数流,包括:对所述预处理后的异常数据流U1′,U2′,……,Un′进行离散一维小波变换,提取与各异常数据Ui′相对应的特征系数ωi,得到异常变换系数流ω1,ω2,……,ωn
在一种可能的实现方式中,为了能够根据故障库中存储的常见特征向量,对当前的异常特征向量进行快速、准确的判断和匹配,所以,在所述判断在所述所有特征向量中是否存在目标特征向量与所述异常特征向量相匹配之前,进一步包括:预先设置目标阈值,其中,所述目标阈值介于0和1之间;
所述判断在所述所有特征向量中是否存在目标特征向量与所述异常特征向量相匹配,包括:
分别计算所述异常特征向量与所述所有特征向量中的每一个特征向量的夹角余弦值;
判断在所述夹角余弦值中是否存在不小于所述目标阈值的目标夹角余弦值,且在存在至少一个所述目标夹角余弦值时,确定与所述至少一个所述目标夹角余弦值中的最大目标夹角余弦值所对应的特征向量为所述目标特征向量。
在一种可能的实现方式中,为了提高故障库的适用性和准确性,以方便快速准确的解决日后可能出现的其他常见故障问题,所以,在步骤104之后,进一步包括:根据所述目标特征向量与所述异常特征向量将所述故障库中的所述目标特征向量更新为其中,所述更新的执行方式为: ω → l i b ′ = ( ω → + ω → l i b ) / 2.
为使本发明的目的、技术方案和优点更加清楚,下面结合附图及具体实施例对本发明作进一步地详细描述。
如图2所示,本发明实施例提供了另一种处理服务器管理信息的方法,该方法可以包括以下步骤:
步骤201:确定设备维护端内部故障库中的所有特征向量及相应的所有解决方案;获取设备端内部BMC中的第一阈值Ua和第二阈值Ub;设置目标阈值。
具体地,所述第一阈值Ua不大于所述第二阈值Ub
具体地,所述目标阈值介于0和1之间。
在本实施例中,所述第一阈值、所述第二阈值和所述目标阈值均可以根据实际情况或各用户的自身应用需求进行灵活设置。例如,第一阈值和第二阈值可以分别设置为标准值的95%和105%,目标阈值可以设置为0.9。
详细地,BMC可以负责设备维护端和设备端之间的信息沟通,将能够反映设备端工作状态的IPMI(IntelligentPlatformManagementInterface,智能平台管理接口)格式信息进行打包,并通过LAN接口发送至设备维护端,同时接收并解析由设备维护端反馈的相应打包信息,以将解决相应故障问题的信息反馈至设备端。
步骤202:利用所述BMC实时监测所述设备端在运行过程中特征指标的变化,在监测到所述特征指标出现异常情况时,将相应的异常信息发送至所述设备维护端。
具体地,所述特征指标包括温度、电压、风扇转速和电源状态中的任意一种或多种。相对应地,由于被监测的特征指标不同,故障库可以相应的分为不同的类别,例如,电压故障库、温度故障库、风扇故障库,且各故障库中存放着具有代表性的故障特征向量及相应的建议性解决方案。
详细地,所述温度包括设备端中各部件,例如,CPU、风扇、PCH的温度;所述电压包括设备端中各部件,例如,CPU、主板、内存的电压。此外,所述电源状态包括供电和未供电,本实施例对此不作具体限定。
在本实施例中,所述BMC可以每间隔100毫秒对设备端中的各特征指标进行测试,从而达到实时监测的效果。
步骤203:所述设备维护端接收所述异常信息,对所述异常信息中的异常数据流进行规格化预处理,获得预处理后的异常数据流。
在本实施例中,不仅可以对设备端各特征指标的实际监测值和设定阈值进行对比,还可以监测各特征指标的变化趋势,从而在变化趋势出现异常时,将相应的异常变化趋势发送至设备维护端,而非一旦出现异常监测值,便将该异常检测值发送至设备维护端,故这一实现方式在一定程度上可以避免因监测信息模式单一所造成的弊端。
具体地,所述设备维护端将所述异常数据流U1,U2,……,Un预处理为U1′,U2′,……,Un′,其中,所述预处理的执行方式为:
在Ui<Ua时,Ui′=︱Ui-Ua︱/Ui,(i=1,2,……,n);
在Ui>Ub时,Ui′=︱Ui-Ub︱/Ui,(i=1,2,……,n)。
明显地,也可以根据不同用户的实际应用需求,选择其他的规格化预处理方式。
步骤204:对所述预处理后的异常数据流进行离散一维小波变换,获得相应的异常变换系数流。
详细地,可以对预处理后的异常数据流U1′,U2′,……,Un′进行离散一维小波变换,提取与各异常数据Ui′相对应的特征系数ωi,得到异常变换系数流ω1,ω2,……,ωn。明显地,也可以根据不同用户的实际应用需求,选择其他的变换系数提取方式。
步骤205:根据所述异常变换系数流,生成相应的异常特征向量。
详细地,可以将异常变换系数流ω1,ω2,……,ωn转换为异常特征向量其中, ω → = ( ω 1 , ω 2 , ... ... , ω n ) .
步骤206:分别计算所述异常特征向量与所述所有特征向量中的每一个特征向量的夹角余弦值。
在本实施例中,通过计算两个特征向量的夹角余弦值,可以明确该两个向量的匹配程度,显然的,夹角余弦值越接近于1,相应的两个特征向量的匹配度越高。
步骤207:判断在所述夹角余弦值中是否存在不小于所述目标阈值的目标夹角余弦值。
步骤208:在判断结果包括存在所述目标夹角余弦值时,解析与所述目标夹角余弦值相对应的目标解决方案,生成相应的处理指令,并将所述处理指令反馈至所述设备端。
具体地,在判断结果包括存在至少一个所述目标夹角余弦值时,确定其中的最大目标夹角余弦值及相应的目标特征向量,并解析与该目标特征向量相对应的目标解决方案。
此外,在判断结果包括不存在所述目标夹角余弦值时,说明在故障库中不存在与当前的设备端故障问题相对应的解决方案,故可以报警提醒,并获取用户输入的处理指令,并将该处理指令反馈至设备端。
在本实施例中,根据不同用户的实际应用需求,可以在设备维护端进行自动解析解决方案和发送处理指令之前,显示全部的可执行解决方案,并提醒用户进行查看,以根据实际情况选择合适的解决方案,或输入其他特定解决方案。通过这一实现方式,可以使管理人员了解不同故障问题的产生原因、现象及相应的解决方案,有效指导管理人员对被监控设备相关故障的排查,极大地提高了监测数据的可利用价值和管理人员分析解决问题的能力,尤其有益于快速增强新晋管理人员处理问题的经验和能力。
步骤209:所述设备端接收所述处理指令,并执行相应操作。
步骤210:根据所述目标特征向量与所述异常特征向量,更新所述故障库。
具体地,根据所述目标特征向量与所述异常特征向量将所述故障库中的所述目标特征向量更新为其中,所述更新的执行方式为:此外,也可以根据不同用户的实际应用需求,选择其他的特定更新方式。
在本实施例中,在故障库中不存在与当前的设备端故障问题相对应的解决方案时,将用户输入的处理指令整合为相应的解决方案,并将该解决方案及相应的异常特征向量插入至故障库中,以更新和完善故障库。
通过这一实现方式,在设备端出现常见故障问题时,可以调用故障库中的现有解决方案,从而完成设备端常见故障问题的实时自动处理,在设备端出现不常见故障问题时,可以提醒用户输入相应的特定解决方案,从而完成设备端不常见故障问题的协同处理,同时可以采用不同的故障库更新方式,将故障库进行更新和完善,扩大故障库的故障问题适用范围,以便于日后相似故障问题的实时自动处理。
在本实施例中,在故障库内容完善的情况下,可以实现设备端大量常见故障问题的实时自动解决,提高设备维护系统解决故障问题的自动性,从而在一定程度上可以减少设备维护端相关管理人员的投入成本,同时故障问题的自动快速解决,也有效减少了因人为处理故障问题不及时所造成的损失。
如图3所示,本发明实施例提供了一种设备维护端30,包括:
确定单元301,用于确定内部故障库中的所有特征向量及相应的所有解决方案,并发送至处理单元304;
接收单元302,用于在设备端50中的BMC监测到所述设备端50出现异常情况时,接收由所述BMC发送的与所述异常情况相对应的异常信息,以及向生成单元303输出所述异常信息;
所述生成单元303,用于生成与所述异常信息相对应的异常特征向量,以及向所述处理单元304输出所述异常特征向量;
所述处理单元304,用于接收所述确定单元301发送的所述所有特征向量及相应的所有解决方案,根据所述生成单元303输出的所述异常特征信息,判断在所述所有特征向量中是否存在目标特征向量与所述异常特征向量相匹配,若存在,则解析与所述目标特征向量相对应的目标解决方案,生成相应的处理指令,并将所述处理指令反馈至所述设备端50,以使所述设备端50根据所述处理指令执行相应操作。
在一种可能的实现方式中,所述生成单元303,包括:
预处理子单元3031,用于对所述异常信息中的异常数据流进行规格化预处理,获得预处理后的异常数据流;
数据变换子单元3032,用于对所述预处理后的异常数据流进行小波变换,获得相应的异常变换系数流;
生成子单元3033,用于根据所述异常变换系数流,生成相应的异常特征向量。
在一种可能的实现方式中,请参考图4,该设备维护端30还可以包括:
获取单元401,用于获取所述BMC中的第一阈值Ua和第二阈值Ub,其中,所述第一阈值Ua不大于所述第二阈值Ub
所述预处理子单元3031,具体用于将所述异常信息中的异常数据流U1,U2,……,Un预处理为U1′,U2′,……,Un′,其中,所述预处理的执行方式为:
在Ui<Ua时,Ui′=︱Ui-Ua︱/Ui,(i=1,2,……,n);
在Ui>Ub时,Ui′=︱Ui-Ub︱/Ui,(i=1,2,……,n)。
在一种可能的实现方式中,所述数据变换子单元3032,具体用于对所述预处理后的异常数据流U1′,U2′,……,Un′进行离散一维小波变换,提取与各异常数据Ui′相对应的特征系数ωi,得到异常变换系数流ω1,ω2,……,ωn
在一种可能的实现方式中,请参考图4,该设备维护端30还可以包括:
设置单元402,用于设置目标阈值,其中,所述目标阈值介于0和1之间;
所述处理单元304,具体用于分别计算所述异常特征向量与所述所有特征向量中的每一个特征向量的夹角余弦值;判断在所述夹角余弦值中是否存在不小于所述目标阈值的目标夹角余弦值,且在存在至少一个所述目标夹角余弦值时,确定与所述至少一个所述目标夹角余弦值中的最大目标夹角余弦值所对应的特征向量为所述目标特征向量。
在一种可能的实现方式中,请参考图4,该设备维护端30还可以包括:
更新单元403,用于根据所述目标特征向量与所述异常特征向量将所述故障库中的所述目标特征向量更新为其中,所述更新的执行方式为: ω → l i b ′ = ( ω → + ω → l i b ) / 2.
如图5所示,本发明实施例提供了一种处理服务器管理信息的系统,包括:设备维护端30,以及设备端50,其中,
所述设备端50,用于利用内部BMC实时监测所述设备端50在运行过程中特征指标的变化,在监测到所述特征指标出现异常情况时,将与所述异常情况相对应的异常信息发送至所述设备维护端30,并根据所述设备维护端30反馈的相应处理指令,执行相应操作。
在本实施例中,一个设备维护端可以对应于至少一个设备端,各设备端共用同一个故障库,并利用各设备端可能出现的大量不同故障问题和相应的解决方案对故障库进行更新,这一实现方式有益于故障库的不断完善和信息资源的充分利用,以及各设备端的集中管理和监控。
上述装置内的各单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
综上所述,本发明实施例提供了一种处理服务器管理信息的方法、装置及系统,本发明实施例可具有如下有益效果:
1、本发明实施例提供了一种处理服务器管理信息的方法、装置及系统,设备端利用BMC实时监测其自身的运行状态,在监测到运行异常时,将相应的异常信息发送至设备维护端;设备维护端接收该异常信息,生成相应的异常特征向量,并判断在故障库内的所有特征向量中是否存在目标特征向量与该异常特征向量相匹配;若存在,则解析故障库中的与该目标特征向量相对应的解决方案,并将生成的相应处理指令反馈至设备端,以使设备端执行相应操作,因此,本发明实施例能够自动解决服务器的常见故障问题。
2、本发明实施例提供了一种处理服务器管理信息的方法、装置及系统,不仅可以对设备端各特征指标的实际监测值和设定阈值进行对比,还可以监测各特征指标的变化趋势,从而在变化趋势出现异常时,将相应的异常变化趋势发送至设备维护端,而非一旦出现异常监测值,便将该异常检测值发送至设备维护端,故这一实现方式在一定程度上可以避免因监测信息模式单一所造成的弊端。
3、本发明实施例提供了一种处理服务器管理信息的方法、装置及系统,根据不同用户的实际应用需求,可以在设备维护端进行自动解析解决方案和发送处理指令之前,显示全部的可执行解决方案,并提醒用户进行查看,以根据实际情况选择合适的解决方案,或输入其他特定解决方案。通过这一实现方式,可以使管理人员了解不同故障问题的产生原因、现象及相应的解决方案,有效指导管理人员对被监控设备相关故障的排查,极大地提高了监测数据的可利用价值和管理人员分析解决问题的能力,尤其有益于快速增强新晋管理人员处理问题的经验和能力。
4、本发明实施例提供了一种处理服务器管理信息的方法、装置及系统,在设备端出现常见故障问题时,可以调用故障库中的现有解决方案,从而完成设备端常见故障问题的实时自动处理,在设备端出现不常见故障问题时,可以提醒用户输入相应的特定解决方案,从而完成设备端不常见故障问题的协同处理,同时可以采用不同的故障库更新方式,将故障库进行更新和完善,扩大故障库的故障问题适用范围,以便于日后相似故障问题的实时自动处理。
5、本发明实施例提供了一种处理服务器管理信息的方法、装置及系统,在故障库内容完善的情况下,可以实现设备端大量常见故障问题的实时自动解决,提高设备维护系统解决故障问题的自动性,从而在一定程度上可以减少设备维护端相关管理人员的投入成本,同时故障问题的自动快速解决,也有效减少了因人为处理故障问题不及时所造成的损失。
6、本发明实施例提供了一种处理服务器管理信息的方法、装置及系统,一个设备维护端可以对应于至少一个设备端,各设备端共用同一个故障库,并利用各设备端可能出现的大量不同故障问题和相应的解决方案对故障库进行更新,这一实现方式有益于故障库的不断完善和信息资源的充分利用,以及各设备端的集中管理和监控。
最后需要说明的是:以上所述仅为本发明的较佳实施例,仅用于说明本发明的技术方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种处理服务器管理信息的方法,其特征在于,应用于设备维护端,预先确定内部故障库中的所有特征向量及相应的所有解决方案,该方法还包括:
S1:在设备端中的基板管理控制器BMC监测到所述设备端出现异常情况时,接收由所述BMC发送的与所述异常情况相对应的异常信息;
S2:生成与所述异常信息相对应的异常特征向量;
S3:判断在所述所有特征向量中是否存在目标特征向量与所述异常特征向量相匹配,若存在,则解析与所述目标特征向量相对应的目标解决方案,生成相应的处理指令,并将所述处理指令反馈至所述设备端,以使所述设备端根据所述处理指令执行相应操作。
2.根据权利要求1所述的方法,其特征在于,所述S2,包括:
对所述异常信息中的异常数据流进行规格化预处理,获得预处理后的异常数据流;
对所述预处理后的异常数据流进行小波变换,获得相应的异常变换系数流;
根据所述异常变换系数流,生成相应的异常特征向量。
3.根据权利要求2所述的方法,其特征在于,
在所述对所述异常信息中的异常数据流进行规格化预处理之前,进一步包括:预先获取所述BMC中的第一阈值Ua和第二阈值Ub,其中,所述第一阈值Ua不大于所述第二阈值Ub
所述对所述异常信息中的异常数据流进行规格化预处理,包括:将所述异常信息中的异常数据流U1,U2,……,Un预处理为U1′,U2′,……,Un′,其中,所述预处理的执行方式为:
在Ui<Ua时,Ui′=︱Ui-Ua︱/Ui,(i=1,2,……,n);
在Ui>Ub时,Ui′=︱Ui-Ub︱/Ui,(i=1,2,……,n);
和/或,
所述对所述预处理后的异常数据流进行小波变换,获得相应的异常变换系数流,包括:对所述预处理后的异常数据流U1′,U2′,……,Un′进行离散一维小波变换,提取与各异常数据Ui′相对应的特征系数ωi,得到异常变换系数流ω1,ω2,……,ωn
4.根据权利要求1所述的方法,其特征在于,
在所述判断在所述所有特征向量中是否存在目标特征向量与所述异常特征向量相匹配之前,进一步包括:预先设置目标阈值,其中,所述目标阈值介于0和1之间;
所述判断在所述所有特征向量中是否存在目标特征向量与所述异常特征向量相匹配,包括:
分别计算所述异常特征向量与所述所有特征向量中的每一个特征向量的夹角余弦值;
判断在所述夹角余弦值中是否存在不小于所述目标阈值的目标夹角余弦值,且在存在至少一个所述目标夹角余弦值时,确定与所述至少一个所述目标夹角余弦值中的最大目标夹角余弦值所对应的特征向量为所述目标特征向量。
5.根据权利要求1至4中任一所述的方法,其特征在于,在S3之后,进一步包括:根据所述目标特征向量与所述异常特征向量将所述故障库中的所述目标特征向量更新为其中,所述更新的执行方式为: ω → l i b ′ = ( ω → + ω → l i b ) / 2.
6.一种设备维护端,其特征在于,包括:
确定单元,用于确定内部故障库中的所有特征向量及相应的所有解决方案,并发送至处理单元;
接收单元,用于在设备端中的BMC监测到所述设备端出现异常情况时,接收由所述BMC发送的与所述异常情况相对应的异常信息,以及向生成单元输出所述异常信息;
所述生成单元,用于生成与所述异常信息相对应的异常特征向量,以及向所述处理单元输出所述异常特征向量;
所述处理单元,用于接收所述确定单元发送的所述所有特征向量及相应的所有解决方案,根据所述生成单元输出的所述异常特征信息,判断在所述所有特征向量中是否存在目标特征向量与所述异常特征向量相匹配,若存在,则解析与所述目标特征向量相对应的目标解决方案,生成相应的处理指令,并将所述处理指令反馈至所述设备端,以使所述设备端根据所述处理指令执行相应操作。
7.根据权利要求6所述的设备维护端,其特征在于,所述生成单元,包括:
预处理子单元,用于对所述异常信息中的异常数据流进行规格化预处理,获得预处理后的异常数据流;
数据变换子单元,用于对所述预处理后的异常数据流进行小波变换,获得相应的异常变换系数流;
生成子单元,用于根据所述异常变换系数流,生成相应的异常特征向量。
8.根据权利要求7所述的设备维护端,其特征在于,
进一步包括:获取单元,用于获取所述BMC中的第一阈值Ua和第二阈值Ub,其中,所述第一阈值Ua不大于所述第二阈值Ub
所述预处理子单元,具体用于将所述异常信息中的异常数据流U1,U2,……,Un预处理为U1′,U2′,……,Un′,其中,所述预处理的执行方式为:
在Ui<Ua时,Ui′=︱Ui-Ua︱/Ui,(i=1,2,……,n);
在Ui>Ub时,Ui′=︱Ui-Ub︱/Ui,(i=1,2,……,n);
和/或,
所述数据变换子单元,具体用于对所述预处理后的异常数据流U1′,U2′,……,Un′进行离散一维小波变换,提取与各异常数据Ui′相对应的特征系数ωi,得到异常变换系数流ω1,ω2,……,ωn
9.根据权利要求6所述的设备维护端,其特征在于,
进一步包括:设置单元,用于设置目标阈值,其中,所述目标阈值介于0和1之间;
所述处理单元,具体用于分别计算所述异常特征向量与所述所有特征向量中的每一个特征向量的夹角余弦值;判断在所述夹角余弦值中是否存在不小于所述目标阈值的目标夹角余弦值,且在存在至少一个所述目标夹角余弦值时,确定与所述至少一个所述目标夹角余弦值中的最大目标夹角余弦值所对应的特征向量为所述目标特征向量;
和/或,
进一步包括:更新单元,用于根据所述目标特征向量与所述异常特征向量将所述故障库中的所述目标特征向量更新为其中,所述更新的执行方式为: ω → l i b ′ = ( ω → + ω → l i b ) / 2.
10.一种处理服务器管理信息的系统,其特征在于,包括如权利要求6至9中任一所述的设备维护端,以及设备端,其中,
所述设备端,用于利用内部BMC实时监测所述设备端在运行过程中特征指标的变化,在监测到所述特征指标出现异常情况时,将与所述异常情况相对应的异常信息发送至所述设备维护端,并根据所述设备维护端反馈的相应处理指令,执行相应操作。
CN201610004326.0A 2016-01-04 2016-01-04 一种处理服务器管理信息的方法、装置及系统 Pending CN105653430A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610004326.0A CN105653430A (zh) 2016-01-04 2016-01-04 一种处理服务器管理信息的方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610004326.0A CN105653430A (zh) 2016-01-04 2016-01-04 一种处理服务器管理信息的方法、装置及系统

Publications (1)

Publication Number Publication Date
CN105653430A true CN105653430A (zh) 2016-06-08

Family

ID=56491438

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610004326.0A Pending CN105653430A (zh) 2016-01-04 2016-01-04 一种处理服务器管理信息的方法、装置及系统

Country Status (1)

Country Link
CN (1) CN105653430A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108763037A (zh) * 2018-06-07 2018-11-06 郑州云海信息技术有限公司 一种服务器监控管理方法及装置
CN110430261A (zh) * 2019-08-02 2019-11-08 内蒙古自治区大气探测技术保障中心 探测设备故障处理方法及装置
WO2019223061A1 (zh) * 2018-05-22 2019-11-28 平安科技(深圳)有限公司 一种系统告警方法、存储介质、服务器和装置
CN110825768B (zh) * 2019-10-10 2021-10-29 安徽康佳电子有限公司 一种基于云分析的远程电视异常处理方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2431847A (en) * 2005-10-27 2007-05-02 Hewlett Packard Development Co Management device tool using vector graphics
CN101582195A (zh) * 2009-06-09 2009-11-18 深圳中兴力维技术有限公司 一种在动力环境监控系统中的告警生成方法
CN102141808A (zh) * 2010-09-28 2011-08-03 上海电力学院 汽轮发电机组嵌入式故障预诊断系统及方法
CN103412805A (zh) * 2013-07-31 2013-11-27 交通银行股份有限公司 一种it故障源诊断方法及系统
CN103684828A (zh) * 2012-09-18 2014-03-26 亿阳信通股份有限公司 一种电信设备故障的处理方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2431847A (en) * 2005-10-27 2007-05-02 Hewlett Packard Development Co Management device tool using vector graphics
CN101582195A (zh) * 2009-06-09 2009-11-18 深圳中兴力维技术有限公司 一种在动力环境监控系统中的告警生成方法
CN102141808A (zh) * 2010-09-28 2011-08-03 上海电力学院 汽轮发电机组嵌入式故障预诊断系统及方法
CN103684828A (zh) * 2012-09-18 2014-03-26 亿阳信通股份有限公司 一种电信设备故障的处理方法和装置
CN103412805A (zh) * 2013-07-31 2013-11-27 交通银行股份有限公司 一种it故障源诊断方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019223061A1 (zh) * 2018-05-22 2019-11-28 平安科技(深圳)有限公司 一种系统告警方法、存储介质、服务器和装置
CN108763037A (zh) * 2018-06-07 2018-11-06 郑州云海信息技术有限公司 一种服务器监控管理方法及装置
CN110430261A (zh) * 2019-08-02 2019-11-08 内蒙古自治区大气探测技术保障中心 探测设备故障处理方法及装置
CN110825768B (zh) * 2019-10-10 2021-10-29 安徽康佳电子有限公司 一种基于云分析的远程电视异常处理方法及系统

Similar Documents

Publication Publication Date Title
CN112162878B (zh) 数据库故障发现方法、装置、电子设备及存储介质
CN109934356B (zh) 一种基于大数据的机房巡检方法及相关设备
US6973415B1 (en) System and method for monitoring and modeling system performance
CN105653430A (zh) 一种处理服务器管理信息的方法、装置及系统
Haslum et al. Diagnosis as planning: Two case studies
CN109471845A (zh) 日志管理方法、服务器及计算机可读存储介质
CN109934268B (zh) 异常交易检测方法及系统
CN103227734A (zh) 一种OpenStack云平台异常的检测方法
CN110221145A (zh) 电力设备故障诊断方法、装置及终端设备
CN110333995A (zh) 对工业设备运行状态进行监测的方法及装置
CN109450094A (zh) 一种变电站继电保护巡检方法及系统
CN113313280B (zh) 云平台的巡检方法、电子设备及非易失性存储介质
CN108337266A (zh) 一种高效的协议客户端漏洞发掘方法与系统
CN110888985A (zh) 一种报警信息处理方法、装置、电子设备及存储介质
CN111767193A (zh) 一种服务器数据异常检测方法、装置、存储介质及设备
CN108845285B (zh) 电能计量装置检测方法和系统
CN112541011A (zh) 基于rpa和ai的电网终端故障处理方法及装置
CN114460519A (zh) 基于电力互感器检验的现场与终端融合管理系统和方法
Shepperd et al. Metrics, outlier analysis and the software design process
CN206237041U (zh) 一种输变电设备电力数据的聚类系统
CN115905338A (zh) 故障数据的处理方法、装置及电子设备
CN111813872B (zh) 一种故障排查模型的生成方法、装置、设备
CN114327988A (zh) 一种可视化网络故障关系确定方法和装置
CN113254781A (zh) 推荐系统中的模型确定方法、装置、电子设备和存储介质
CN115544202A (zh) 告警处理方法、装置及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160608