CN106250255A - 一种系统异常的管理方法及装置 - Google Patents

一种系统异常的管理方法及装置 Download PDF

Info

Publication number
CN106250255A
CN106250255A CN201610587628.5A CN201610587628A CN106250255A CN 106250255 A CN106250255 A CN 106250255A CN 201610587628 A CN201610587628 A CN 201610587628A CN 106250255 A CN106250255 A CN 106250255A
Authority
CN
China
Prior art keywords
main control
control card
management module
behalf
fan
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610587628.5A
Other languages
English (en)
Other versions
CN106250255B (zh
Inventor
王茂松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Maipu Communication Technology Co Ltd
Original Assignee
Maipu Communication Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Maipu Communication Technology Co Ltd filed Critical Maipu Communication Technology Co Ltd
Priority to CN201610587628.5A priority Critical patent/CN106250255B/zh
Publication of CN106250255A publication Critical patent/CN106250255A/zh
Application granted granted Critical
Publication of CN106250255B publication Critical patent/CN106250255B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3031Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a motherboard or an expansion card

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Power Sources (AREA)

Abstract

本发明公开了一种异常系统的管理方法及装置,涉及信息技术领域,可以避免资源浪费。首先主控卡在系统启动后,确定其中一个线路接口卡为代理主控卡,然后代理主控卡实时监测主控卡输出的状态信息,并根据状态信息,判断主控卡是否处于异常状态,若处于异常状态,则代理主控卡启动监测系统中风扇管理模块和/或温度管理模块和/或电源管理模块的状态,并获取风扇管理模块和/或温度管理模块和/或电源管理模块输出的告警信息,最后代理主控卡依据告警信息对系统中的风扇和/或电源进行调整或者对外发送系统告警信息。本发明适用于当主控卡出现故障时,线路接口卡代替主控卡监测系统中风扇管理模块和/或温度管理模块和/或电源管理模块的状态。

Description

一种系统异常的管理方法及装置
技术领域
本发明涉及信息技术领域,特别涉及一种系统异常的管理方法及装置。
背景技术
机架式通信设备包括主控卡以及线路接口卡(简称线卡),一般地,主控卡除了用于管理线路接口卡,还用于管理和控制设备内的风扇管理模块、温度管理模块、电源管理模块等,线路接口卡为用户提供业务接口以及处理数据。机架式通信设备由复杂的硬件系统以及复杂的软件系统组成,并且需要处理复杂的网络信息,如何保证机架式通信设备的长期稳定工作,成为一个重要问题。
目前,为了保证通信设备的可靠性,客户一般会购置两张主控卡,两张主控卡互为备份。也就是说通常情况下,只有一张主控卡处于工作状态,另外一张主控卡处于闲置状态,当其中一张主控卡出现故障时,另一张备用的主控卡代替故障的主控卡管理和控制通信设备内的相关模块。
然而,客户如果购买两张主控卡,成本比较高;而且绝大多数情况下,其中一张主控卡处于闲置状态,从而导致资源的浪费。但是如果只配置一张主控卡,当主控卡故障时,如何对系统内的风扇、温度、电源等模块进行有效管理从而保证系统的可靠性成为亟待解决的问题。
发明内容
本发明提供一种系统异常的管理方法及装置,解决在系统只配置了一张主控卡的情况下系统异常的管理问题,保证系统的可靠性,同时可以避免资源的浪费。
本发明采用的技术方案为:
第一方面,本发明提供一种系统异常的管理方法,所述系统包括一个主控卡以及至少一个线路接口卡,所述方法包括:
所述主控卡在系统启动后,指定其中一个线路接口卡为代理主控卡;
所述代理主控卡实时监测所述主控卡输出的状态信息;
所述代理主控卡根据所述状态信息,判断所述主控卡是否处于异常状态;
若所述主控卡处于异常状态,则所述代理主控卡启动监测系统中风扇管理模块和/或温度管理模块和/或电源管理模块的状态,并获取所述风扇管理模块和/或温度管理模块和/或电源管理模块输出的告警信息;
所述代理主控卡依据所述告警信息对所述系统中的风扇和/或电源进行调整或者对外发送系统告警信息。
第二方面,一种系统异常的管理装置,所述装置包括:一个主控卡以及至少一个线路接口卡,所述主控卡与所述线路接口卡之间通过管理总线进行连接;
所述主控卡,用于在系统启动后,确定其中一个线路接口卡为代理主控卡;
所述线路接口卡,用于在被所述主控卡确定为代理主控卡后,实时监测所述主控卡输出的状态信息,根据所述状态信息,判断所述主控卡是否处于异常状态,若所述主控卡处于异常状态,则启动监测系统中风扇管理模块和/或温度管理模块和/或电源管理模块的状态,并获取所述风扇管理模块和/或温度管理模块输出的告警信息,依据所述告警信息对系统中的风扇和/或电源进行调整或者对外发送系统告警信息。
本发明提供的异常系统的管理方法及装置,系统包括:一个主控卡以及至少一个线路接口卡;首先主控卡在系统启动后,确定其中一个线路接口卡为代理主控卡,然后代理主控卡实时监测主控卡输出的状态信息,并根据状态信息,判断主控卡是否处于异常状态,若主控卡处于异常状态,则代理主控卡代替主控卡启动监测系统中风扇管理模块和/或温度管理模块和/或电源管理模块的状态,并获取风扇管理模块和/或温度管理模块和/或电源管理模块输出的告警信息,最后代理主控卡依据告警信息对系统中的风扇和/或电源进行调整或者对外发送系统告警信息。与目前通信设备通过两张主控卡管理和控制通信设备内的风扇管理模块和/或温度管理模块和/或电源管理模块相比,本发明实现了在系统只配置了一张主控卡的情况下,通过当系统启动后,主控卡确定其中一个线路接口卡为代理主控卡,能够使得代理主控卡实时监测主控卡输出的状态信息,并且当主控卡异常时,代替主控卡监测以及调整风扇管理模块和/或温度管理模块和/或电源管理模块,对系统异常进行管理,保证系统的可靠性,无需在通信设备中设置两张主控卡,从而可以避免资源的浪费。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对本发明或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例中系统架构图;
图2为本发明实施例中一种异常系统的管理方法流程图;
图3为本发明实施例中另一种异常系统的管理方法流程图;
图4为本发明实施例中又一种异常系统的管理方法流程图;
图5为本发明实施例中又一种异常系统的管理方法流程图;
图6为本发明实施例中又一种异常系统的管理方法流程图;
图7为本发明实施例中异常系统的管理装置结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明实施例提供一种系统,所述系统包括:一个主控卡、至少一个线路接口卡、风扇管理模块、温度管理模块以及电源管理模块,如图1所示,其中,主控卡和线路接口卡通过管理总线进行连接,主控卡、线路接口卡与风扇管理模块、温度管理模块和电源管理模块,通过监控总线进行连接。
本发明实施例公开了一种异常系统管理的方法,能够在系统只配置一张主控的情况下,在主控卡故障时,由线路接口卡代替主控卡对系统异常进行管理,保证系统的可靠性,如图2所示,所述方法包括:
201、主控卡在系统启动后,确定其中一个线路接口卡为代理主控卡。
对于本发明实施例,系统中存在至少一个线路接口卡,因此,主控卡在启动之后,确定其中一个线路接口卡作为代理主控卡,并通过管理总线,告知该线路接口卡为代理主控卡。
例如,系统中存在两个线路接口卡,分别为线路接口卡1以及线路接口卡2,主控卡确定线路接口卡1为代理主控卡,则主控卡通过管理总线,告知线路接口卡1为代理主控卡。
202、代理主控卡实时监测主控卡输出的状态信息。
对于本发明实施例,代理主控卡能够实时通过管理总线获取主控卡输出的状态信息。
203、代理主控卡根据状态信息,判断主控卡是否处于异常状态。
对于本发明实施例,代理主控卡获取到主控卡输出的状态信息,并根据状态信息,判断主控卡当前是否处于异常状态。
204、若主控卡处于异常状态,则代理主控卡启动监测系统中风扇管理模块和/或温度管理模块和/或电源管理模块的状态。
对于本发明实施例,当代理主控卡判断出主控卡当前处于异常状态时,代理主控卡代替主控卡,监测系统中风扇管理模块和/或温度管理模块和/或电源管理模块的状态。
例如,代理主控卡可以监测系统中风扇管理模块,确定是否出现风扇故障;代理主控卡可以监测系统中的温度管理模块,确定系统中的温度是否过高;代理主控卡可以监测系统中的电源管理模块,确定系统中的电源模块是否故障。
205、代理主控卡获取风扇管理模块和/或温度管理模块和/或电源管理模块输出的告警信息。
对于本发明实施例,当风扇管理模块和/或温度管理模块和/或电源管理模块出现故障时,将通过监控总线输出告警信息,至代理主控卡,以使得代理主控卡确定发生故障的模块。
206、代理主控卡依据告警信息对系统中的风扇和/或电源进行调整或者对外发送系统告警信息。
例如,当代理主控卡获取温度监控模块输出告警信息,并确定系统中的温度过高时,代理主控卡通过监控总线控制风扇管理模块,以使得风扇管理模块,调高风扇转速,降低系统中的温度;当代理主控卡获取风扇管理模块输出告警信息时,代理主控卡通过告警信息,确定发生故障的风扇,或者通过监控总线向风扇管理模块发送请求消息,以确定风扇管理模块中发生故障的风扇,之后代理主控卡通过监控总线,控制其它未发生故障的风扇调高转速。
本发明实施例提供的异常系统的管理方法,系统包括:一个主控卡以及至少一个线路接口卡;首先主控卡在系统启动后,确定其中一个线路接口卡为代理主控卡,然后代理主控卡实时监测主控卡输出的状态信息,并根据状态信息,判断主控卡是否处于异常状态,若主控卡处于异常状态,则代理主控卡代替主控卡启动监测系统中风扇管理模块和/或温度管理模块和/或电源管理模块的状态,并获取风扇管理模块和/或温度管理模块和/或电源管理模块输出的告警信息,最后代理主控卡依据告警信息对系统中的风扇和/或电源进行调整或者对外发送系统告警信息。与目前通信设备通过两张主控卡管理和控制通信设备内的风扇管理模块和/或温度管理模块和/或电源管理模块相比,本发明实施例实现了在系统只配置一张主控卡的情况下,通过当系统启动后,由主控卡确定其中一个线路接口卡为代理主控卡,能够使得代理主控卡实时监测主控卡输出的状态信息,并且当主控卡异常时,代替主控卡监测以及调整风扇管理模块和/或温度管理模块和/或电源管理模块,,对系统异常进行管理,保证系统的可靠性,无需在通信设备中设置两张主控卡,从而可以避免资源的浪费。
本发明实施例的另一种可能的实现方式,在如图2所示的基础上,步骤205、代理主控卡获取风扇管理模块和/或温度管理模块和/或电源管理模块输出的告警信息,之后还包括如图3所示的步骤301。
301、代理主控卡记录风扇管理模块和/或温度管理模块和/或电源管理模块输出的告警信息。
对于本发明实施例,当代理主控卡获取到系统中风扇管理模块和/或温度管理模块和/或电源管理模块输出的告警信息时,代理主控卡记录系统中风扇管理模块和/或温度管理模块和/或电源管理模块输出的告警信息。
对于本发明实施例,代理主控卡通过记录系统中风扇管理模块和/或温度管理模块和/或电源管理模块输出的告警信息,能够记录系统中风扇管理模块和/或温度管理模块和/或电源管理模块的状态,从而能够根据已记录的告警信息,监控系统中风扇管理模块和/或温度管理模块和/或电源管理模块,进而可以提高对系统监控的准确度。
本发明实施例的另一种可能的实现方式,在如图2或者如图3所示的基础上,所述方法还包括如图4所示的步骤401。
401、当代理主控卡启动监测系统中风扇管理模块和/或温度管理模块和/或电源管理模块的状态后,并且代理主控卡监测到主控卡输出的状态信息为正常状态时,代理主控卡将记录的风扇管理模块和/或温度管理模块和/或电源管理模块输出的告警信息,发送至主控卡。
对于本发明实施例,步骤401发生在代理主控卡监测主控卡为异常状态且启动监测系统中风扇管理模块和/或温度管理模块和/或电源管理模块的状态后,可以位于步骤204之后,也可以位于步骤205之后,还可以位于步骤206之后。在本发明实施例中不做限定。
对于本发明实施例,当更换发生异常的主控卡或者发生异常的主控卡重新启动之后,主控卡由之前的异常状态变为当前正常状态;此时代理主控卡已经启动监测系统中风扇管理模块和/或温度管理模块和/或电源管理模块的状态,若代理主控卡监测主控卡的工作状态为正常状态(由之前监测到的异常状态变为当前的正常状态),则代理主控卡需要将之前记录的系统中风扇管理模块和/或温度管理模块和/或电源管理模块输出的告警信息,通过管理总线发送至主控卡,并且代理主控卡不再监测系统中风扇管理模块和/或温度管理模块和/或电源管理模块的状态。
对于本发明实施例,当主控卡由的工作状态由之前的异常状态变为当前的正常状态时,代理主控卡通过将记录的系统中风扇管理模块和/或温度管理模块和/或电源管理模块输出的告警信息,发送至主控卡,以使得恢复正常状态的主控卡能够确定系统中各个被管理模块的状态,从而可以提高主控卡管理系统的准确度。
本发明实施例的另一种可能的实现方式,在如图4所示的基础上,步骤401、当代理主控卡启动监测系统中风扇管理模块和/或温度管理模块和/或电源管理模块的状态后,代理主控卡监测到主控卡输出的状态信息为正常状态时,代理主控卡将记录的风扇管理模块和/或温度管理模块和/或电源管理模块输出的告警信息,发送至主控卡,之后还包括如图5所示的步骤501。
501、主控卡监测风扇管理模块和/或温度管理模块和/或电源管理模块的状态。
对于本发明实施例,当发生异常的主控卡重新启动或者更换发生异常的主控卡之后,主控卡处于正常状态时,代理主控卡不需要再监测以及管理系统中风扇管理模块和/或温度管理模块和/或电源管理模块的状态,正常状态下的主控卡恢复监测系统中风扇管理模块和/或温度管理模块和/或电源管理模块的状态。
本发明实施例的另一种可能的实现方式,在如图5所示的基础上,步骤203、代理主控卡根据状态信息,判断主控卡是否处于异常状态,之后还包括如图6所示的步骤601。
601、若主控卡不处于异常状态,则主控卡监测系统中风扇管理模块和/或温度管理模块和/或电源管理模块的状态。
对于本发明实施例,由于主控卡实时输出当前自身的状态信息,当主控卡当前处于正常状态,则主控卡不需要代理主控卡执行监测系统中风扇管理模块和/或温度管理模块和/或电源管理模块的状态。
对于本发明实施例,当系统中设置有两个主控卡时,两个主控卡均实时通过管理总线输出状态信息,线路接口卡获取状态信息,并根据状态信息,能够确定系统中存在两个主控卡,则线路接口卡可以设置为静默状态,不执行系统的监测以及管理任务。在本发明实施例中,当其中一个主控卡处于异常状态时,另一个主控卡接替异常的主控卡负责监测以及管理任务。
本发明实施例提供了另一种异常系统的管理方法,代理主控卡代替异常的主控卡监测并记录系统中风扇管理模块和/或温度管理模块和/或电源管理模块输出的告警信息,并能够根据对系统中风扇管理模块和/或温度管理模块和/或电源管理模块的异常进行管理,代理主控卡依据告警信息对系统中的风扇和/或电源进行调整或者对外发送系统告警信息,进而可以提高系统的可靠性;当主控卡由之前监测到的异常状态变为当前的正常状态时,代理主控卡通过将记录的系统中风扇管理模块和/或温度管理模块和/或电源管理模块输出的告警信息,发送至主控卡,以使得恢复正常状态的主控卡能够确定系统中各个被管理模块的状态,从而可以提高系统运行的可靠性。
作为对图2-图6所示方法的实现,本发明实施例还提供了一种异常系统的管理装置,用于可以避免资源浪费,如图7所示,装置包括:一个主控卡71以及至少一个线路接口卡72,主控卡71与线路接口卡72之间通过管理总线进行连接。
主控卡71,用于在系统启动后,确定其中一个线路接口卡为代理主控卡;
线路接口卡72,用于在被主控卡71确定为代理主控卡后,实时监测主控卡输出的状态信息,根据状态信息,判断主控卡71是否处于异常状态,若主控卡71处于异常状态,则启动监测系统中风扇管理模块和/或温度管理模块和/或电源管理模块的状态,并获取风扇管理模块和/或温度管理模块输出的告警信息,依据告警信息对系统中的风扇和/或电源进行调整或者对外发送系统告警信息。
进一步地,如图7所示,线路接口卡72包括:第一监测单元721、状态判断单元722、第二监测单元723、异常管理单元724。
第一监测单元721,用于实时监测主控卡71输出的状态信息;
状态判断单元722,用于判断主控卡71输出的状态信息是否处于异常状态,若主控卡71处于异常状态,则触发第二监测单元723启动。
第二监测单元723,用于监测系统中风扇管理模块和/或温度管理模块和/或电源管理模块的状态,并获取风扇管理模块和/或温度管理模块和/或电源管理模块输出的告警信息;
异常管理单元724,用于依据告警信息对系统中的风扇和/或电源进行调整或者对外发送系统告警信息。
异常管理单元724,还用于记录风扇管理模块和/或温度管理模块和/或电源管理模块输出的告警信息。
进一步地,如图7所示,线路接口卡72还包括发送单元725。
状态判断单元722,还用于当触发第二监测单元723启动后,判断主控卡输出的状态信息为正常状态时,通知发送单元725。
发送单元725,用于将异常管理单元724记录的风扇管理模块和/或温度管理模块和/或电源管理模块输出的告警信息,发送至主控卡71。
进一步地,如图7所示,主控卡71包括:确定单元711、通知单元712。
确定单元711,用于在至少一个线路接口卡中确定其中一个线路接口卡为代理主控卡;
通知单元712,用于将确定单元711确定的代理主控卡通知给对应的线路接口卡72。
本发明实施例提供的异常系统的管理装置,系统包括:一个主控卡以及至少一个线路接口卡;首先主控卡在系统启动后,确定其中一个线路接口卡为代理主控卡,然后代理主控卡实时监测主控卡输出的状态信息,并根据状态信息,判断主控卡是否处于异常状态,若主控卡处于异常状态,则代理主控卡启动监测系统中风扇管理模块和/或温度管理模块和/或电源管理模块的状态,即代替主控卡监测系统中风扇管理模块和/或温度管理模块和/或电源管理模块的状态,并获取风扇管理模块和/或温度管理模块和/或电源管理模块输出的告警信息,最后代理主控卡依据告警信息对系统中的风扇和/或电源进行调整或者对外发送系统告警信息。本发明实施例通过当系统启动后,确定其中一个线路接口卡为代理主控卡,代理主控卡实时监测主控卡输出的状态信息,并且当主控卡异常时,代替主控卡监测以及调整风扇管理模块和/或温度管理模块和/或电源管理模块,无需在通信设备中设置两张主控卡,从而可以避免资源的浪费。
本发明实施例提供了另一种异常系统的管理装置,代理主控卡通过监测并记录系统中风扇管理模块和/或温度管理模块和/或电源管理模块输出的告警信息,能够对系统中风扇管理模块和/或温度管理模块和/或电源管理模块的状的异常进行管理,代理主控卡依据告警信息对系统中的风扇和/或电源进行调整或者对外发送系统告警信息,进而可以提高系统的可靠性;当主控卡由之前监测到的异常状态变为当前的正常状态时,代理主控卡通过将记录的系统中风扇管理模块和/或温度管理模块和/或电源管理模块输出的告警信息,发送至主控卡,以使得恢复正常状态的主控卡能够确定系统中各个被管理模块的状态,从而可以提高系统运行的可靠性。
需要说明的是,本发明实施例中提供的异常系统的管理装置中各单元所对应的其他相应描述,可以参考图2-图6中的对应描述,在此不再赘述。
本发明实施例提供的异常系统的管理装置可以实现上述提供的方法实施例,具体功能实现请参见方法实施例中的说明,在此不再赘述。本发明实施例提供的异常系统的管理方法及装置可以适用于当系统中主控卡出现故障时,线路接口卡代替主控卡监测系统中风扇管理模块和/或温度管理模块和/或电源管理模块的状态。但不仅限于此。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (10)

1.一种系统异常的管理方法,其特征在于,所述系统包括一个主控卡以及至少一个线路接口卡,所述方法包括:
所述主控卡在系统启动后,确定其中一个线路接口卡为代理主控卡;
所述代理主控卡实时监测所述主控卡输出的状态信息;
所述代理主控卡根据所述状态信息,判断所述主控卡是否处于异常状态;
若所述主控卡处于异常状态,则所述代理主控卡启动监测系统中风扇管理模块和/或温度管理模块和/或电源管理模块的状态,并获取所述风扇管理模块和/或温度管理模块和/或电源管理模块输出的告警信息;
所述代理主控卡依据所述告警信息对所述系统中的风扇和/或电源进行调整或者对外发送系统告警信息。
2.根据权利要求1所述的系统异常的管理方法,其特征在于,所述获取所述风扇管理模块和/或温度管理模块和/或电源管理模块输出的告警信息的步骤之后,还包括:
所述代理主控卡记录所述风扇管理模块和/或温度管理模块和/或电源管理模块输出的告警信息。
3.根据权利要求1或2所述的系统异常的管理方法,其特征在于,所述方法还包括:
当所述代理主控卡启动监测系统中风扇管理模块和/或温度管理模块和/或电源管理模块的状态后,并且所述代理主控卡监测到所述主控卡输出的状态信息为正常状态时,所述代理主控卡将记录的所述风扇管理模块和/或温度管理模块和/或电源管理模块输出的告警信息,发送至所述主控卡。
4.根据权利要求3所述的方法,其特征在于,所述代理主控卡将记录的所述风扇管理模块和/或温度管理模块和/或电源管理模块输出的告警信息,发送至所述主控卡的步骤之后,还包括:
所述主控卡监测所述风扇管理模块和/或温度管理模块和/或电源管理模块的状态。
5.根据权利要求4所述的方法,其特征在于,所述代理主控卡根据所述状态信息,判断所述主控卡是否处于异常状态的步骤之后,还包括:
若所述主控卡不处于异常状态,则所述主控卡监测系统中所述风扇管理模块和/或温度管理模块和/或电源管理模块的状态。
6.一种系统异常的管理装置,其特征在于,所述装置包括:一个主控卡以及至少一个线路接口卡,所述主控卡与所述线路接口卡之间通过管理总线进行连接;
所述主控卡,用于在系统启动后,确定其中一个线路接口卡为代理主控卡;
所述线路接口卡,用于在被所述主控卡确定为代理主控卡后,实时监测所述主控卡输出的状态信息,根据所述状态信息,判断所述主控卡是否处于异常状态,若所述主控卡处于异常状态,则启动监测系统中风扇管理模块和/或温度管理模块和/或电源管理模块的状态,并获取所述风扇管理模块和/或温度管理模块输出的告警信息,依据所述告警信息对系统中的风扇和/或电源进行调整或者对外发送系统告警信息。
7.如权利要求6所述的异常系统的管理装置,其特征在于,所述线路接口卡包括:
第一监测单元,用于实时监测所述主控卡输出的状态信息;
状态判断单元,用于判断所述主控卡输出的状态信息是否处于异常状态,若所述主控卡处于异常状态,则触发第二监测单元启动;
所述第二监测单元,用于监测系统中风扇管理模块和/或温度管理模块和/或电源管理模块的状态,并获取所述风扇管理模块和/或温度管理模块和/或电源管理模块输出的告警信息;
异常管理单元,用于依据所述告警信息对系统中的风扇和/或电源进行调整或者对外发送系统告警信息。
8.根据权利要求7所述的装置,其特征在于,
所述异常管理单元,还用于记录所述风扇管理模块和/或温度管理模块和/或电源管理模块输出的告警信息。
9.根据权利要求8所述的装置,其特征在于,所述线路接口卡还包括发送单元;
所述状态判断单元,还用于当触发第二监测单元启动后,判断所述主控卡输出的状态信息为正常状态时,通知所述发送单元;
所述发送单元,用于将所述异常管理单元记录的所述风扇管理模块和/或温度管理模块和/或电源管理模块输出的告警信息,发送至所述主控卡。
10.根据权利要求6-9任一项所述的装置,其特征在于,所述主控卡包括:
确定单元,用于在所述至少一个线路接口卡中确定其中一个线路接口卡为代理主控卡;
通知单元,用于将确定单元确定的代理主控卡通知给对应的线路接口卡。
CN201610587628.5A 2016-07-22 2016-07-22 一种系统异常的管理方法及装置 Active CN106250255B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610587628.5A CN106250255B (zh) 2016-07-22 2016-07-22 一种系统异常的管理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610587628.5A CN106250255B (zh) 2016-07-22 2016-07-22 一种系统异常的管理方法及装置

Publications (2)

Publication Number Publication Date
CN106250255A true CN106250255A (zh) 2016-12-21
CN106250255B CN106250255B (zh) 2018-12-28

Family

ID=57603648

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610587628.5A Active CN106250255B (zh) 2016-07-22 2016-07-22 一种系统异常的管理方法及装置

Country Status (1)

Country Link
CN (1) CN106250255B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107420340A (zh) * 2017-09-29 2017-12-01 迈普通信技术股份有限公司 散热风扇控制方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080010517A1 (en) * 2006-06-27 2008-01-10 Lenovo (Singapore) Pte. Ltd. Apparatus and methods for improved computer system error reporting and management
CN101576826A (zh) * 2009-06-12 2009-11-11 成都市华为赛门铁克科技有限公司 接口卡加载方法和系统、接口卡及控制板
CN101707536A (zh) * 2009-11-25 2010-05-12 成都市华为赛门铁克科技有限公司 故障检测方法、线卡及主控卡
CN101777951A (zh) * 2009-12-30 2010-07-14 中兴通讯股份有限公司 一种数据监测的方法和系统
CN104035849A (zh) * 2014-06-19 2014-09-10 浪潮电子信息产业股份有限公司 一种防止Rack机柜风扇管理失效的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080010517A1 (en) * 2006-06-27 2008-01-10 Lenovo (Singapore) Pte. Ltd. Apparatus and methods for improved computer system error reporting and management
CN101576826A (zh) * 2009-06-12 2009-11-11 成都市华为赛门铁克科技有限公司 接口卡加载方法和系统、接口卡及控制板
CN101707536A (zh) * 2009-11-25 2010-05-12 成都市华为赛门铁克科技有限公司 故障检测方法、线卡及主控卡
CN101777951A (zh) * 2009-12-30 2010-07-14 中兴通讯股份有限公司 一种数据监测的方法和系统
CN104035849A (zh) * 2014-06-19 2014-09-10 浪潮电子信息产业股份有限公司 一种防止Rack机柜风扇管理失效的方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107420340A (zh) * 2017-09-29 2017-12-01 迈普通信技术股份有限公司 散热风扇控制方法及系统

Also Published As

Publication number Publication date
CN106250255B (zh) 2018-12-28

Similar Documents

Publication Publication Date Title
CN109032849B (zh) 热备份系统、热备份方法和计算机设备
CN102708150A (zh) 异步复制数据的方法、装置和系统
CN109768884A (zh) 通信系统及其高可用性的实现方法、装置和计算机设备
CN105425932A (zh) 一种整机柜服务器电源的管理方法及系统
CN114764380A (zh) 一种基于etcd的分布式集群控制方法和装置
CN103324554A (zh) 备用系统设备、控制方法及其程序
CN111984471B (zh) 一种机柜电源bmc冗余管理系统及方法
CN112527570B (zh) I2c通信恢复方法、装置、设备及计算机可读存储介质
CN106250255A (zh) 一种系统异常的管理方法及装置
CN107071189A (zh) 一种通讯设备物理接口的连接方法
CN101930382B (zh) 一种终端记忆性开机方法、电路和终端
CN112099990A (zh) 一种容灾备份方法、装置、设备及机器可读存储介质
US11093014B2 (en) Method for monitoring, control and graceful shutdown of control and/or computer units
JP2008225567A (ja) 情報処理システム
CN114968129B (zh) 磁盘阵列冗余方法、系统、计算机设备和存储介质
CN111880992A (zh) 一种存储设备中控制器状态的监测及维护方法
CN116823587A (zh) 一种图形处理器控制方法、装置、电子设备及存储介质
CN116339479A (zh) 服务器电源的控制方法及装置、存储介质及电子装置
JP2007028118A (ja) ノード装置の故障判断方法
CN112822039B (zh) 双机热备系统主备模式切换的方法
CN106326042B (zh) 一种运行状态确定方法及装置
CN115098305A (zh) 一种主板备电切换方法、装置、电子设备和存储介质
CN115291708A (zh) 一种掉电保护方法、装置及电子设备
CN114138567A (zh) 一种基板管理控制模块维护方法、装置、设备及存储介质
CN100362811C (zh) 一种获取配置信息的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant