CN106598788B - 服务器管理装置 - Google Patents

服务器管理装置 Download PDF

Info

Publication number
CN106598788B
CN106598788B CN201510678442.6A CN201510678442A CN106598788B CN 106598788 B CN106598788 B CN 106598788B CN 201510678442 A CN201510678442 A CN 201510678442A CN 106598788 B CN106598788 B CN 106598788B
Authority
CN
China
Prior art keywords
module
server
management
signal
control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201510678442.6A
Other languages
English (en)
Other versions
CN106598788A (zh
Inventor
阳梦良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hongfujin Precision Electronics Tianjin Co Ltd
Original Assignee
Hongfujin Precision Electronics Tianjin Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hongfujin Precision Electronics Tianjin Co Ltd filed Critical Hongfujin Precision Electronics Tianjin Co Ltd
Priority to CN201510678442.6A priority Critical patent/CN106598788B/zh
Priority to US14/950,628 priority patent/US10003504B2/en
Publication of CN106598788A publication Critical patent/CN106598788A/zh
Application granted granted Critical
Publication of CN106598788B publication Critical patent/CN106598788B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/24Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using dedicated network management hardware
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0659Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities

Abstract

一种服务器管理装置,包括管理模块、第一服务器、第一控制模块,及第一执行模块。所述管理模块通过所述第一服务器连接于所述第一控制模块;所述第一执行模块连接所述第一控制模块;当所述第一服务器工作正常时,所述第一服务器输出第一信号至所述第一控制模块,所述第一控制模块依据所述第一信号控制所述第一执行模块;当所述第一服务器工作异常时,所述管理模块输出第二信号,所述第一控制模块依据所述第二信号控制所述第一执行模块。所述服务器管理装置可以实现针对第一执行模块的冗余管理。

Description

服务器管理装置
技术领域
本发明涉及一种服务器管理装置。
背景技术
随着云计算技术的发展,在数据中心中会有很多服务器及服务器机架,每个机架中都包含有几十台服务器,在每个服务器中都会包括若干处理模块,通常服务器会通过基板管理控制器来控制所述若干处理模块。然而,当服务器其他部件发生故障,很有可能会波及所述若干处理模块,导致所述若干处理模块停止工作,这样会导致工作效率下降。
发明内容
鉴于此,有必要提供一种冗余管理功能的服务器管理装置。
一种服务器管理装置,包括:
一管理模块;
第一服务器;
第一控制模块,所述管理模块通过所述第一服务器连接于所述第一控制模块;及
第一执行模块,所述第一执行模块连接所述第一控制模块;当所述第一服务器工作正常时,所述第一服务器输出第一信号至所述第一控制模块,所述第一控制模块依据所述第一信号控制所述第一执行模块;当所述第一服务器工作异常时,所述管理模块输出第二信号,所述第一控制模块依据所述第二信号控制所述第一执行模块。
所述服务器管理装置可以在服务器发生故障时通过管理模块直接接管所述第一执行模块,以控制所述第一执行模块继续工作,实现冗余管理。
附图说明
图1为本发明服务器管理装置的较佳实施方式的方框图。
主要元件符号说明
服务器管理装置 100
管理模块 10
第一服务器 11
第二服务器 12
第一控制模块 21
第二控制模块 22
第一信号转换模块 31
第二信号转换模块 32
第一执行模块 41
第二执行模块 42
第一扩展单元 51
如下具体实施方式将结合上述附图进一步说明本发明。
具体实施方式
请参考图1,本发明服务器管理装置100的较佳实施方式包括管理模块10、第一服务器11、第二服务器12、第一控制模块21、第二控制模块22、第一信号转换模块31、第二信号转换模块32、第一执行模块41、第二执行模块42以及第一扩展单元51。
所述管理模块10通过所述第一服务器11连接于所述第一控制模块21。所述管理模块10通过所述第二服务器12连接于所述第二控制模块22。所述管理模块10通过第一扩展单元51连接于所述第一信号转换模块31。所述管理模块10还通过所述第一扩展单元51连接于所述第二信号转换模块32。所述第一控制模块21还连接于所述第一信号转换模块31及所述第一执行模块41。所述第二控制模块22还连接于所述第二信号转换模块32及所述第二执行模块42。
本实施方式中,当所述第一服务器11工作正常时,所述第一服务器11输出第一信号至所述第一控制模块21,所述第一控制模块21依据所述第一信号控制所述第一执行模块41工作;当所述第一服务器11工作异常时,所述管理模块10输出第二信号,
所述管理模块10通过智能平台管理总线将所述第二信号输出至第一扩展单元51,所述第一扩展单元51将所述第二信号传输至所述第一信号转换模块31,所述第一信号转换模块31将所述第二信号转换为第三信号输出至所述第一控制模块21,所述第一控制模块21依据所述第三信号控制所述第一执行模块41工作。当然,在其他实施方式中,所述第一控制模块21也可以直接依据所述管理模块10输出第二信号控制所述第一执行模块41工作。
本实施方式中,所述管理模块10通过串行器、解串器与所述第一服务器11相连。所述管理模块10通过所述串行器、解串器与所述第一服务器11进行信号传输。所述管理模块10通过传输信号判断所述第一服务器11的工作状态,若第一服务器11的状态符合第一预设条件,所述管理模块10判断所述第一服务器11工作正常,所述管理模块10提高所述第一服务器11的优先级,即所述第一服务器11取得所述第一控制模块21的控制权。若所述第一服务器11的状态不符合第一预设条件,所述管理模块10判断所述第一服务器11工作异常,所述第一服务器11失去所述第一控制模块21的控制权,所述管理模块10直接对所述第一控制模块21进行控制。
在其他实施方式中,一些特定情况下所述管理模块10及所述第一服务器11会同时对所述第一控制模块21输出控制信号,此时所述第一控制模块21通过时序判断最后输入的控制信号并执行该控制信号。
类似地,当所述第二服务器12工作正常时,所述第二服务器12输出第四信号至所述第二控制模块22,所述第二控制模块22依据所述第四信号控制所述第二执行模块42工作;当所述第二服务器12工作异常时,所述管理模块10输出第五信号,所述第二控制模块22依据所述第五信号控制所述第二执行模块42工作。
本实施方式中,所述管理模块10通过智能平台管理总线将所述第五信号输出至第一扩展单元51,所述第一扩展单元51将所述第五信号传输至所述第二信号转换模块32,所述第二信号转换模块32将所述第五信号转换为第六信号输出至所述第二控制模块22,所述第二控制模块22依据所述第六信号控制所述第二执行模块42。
本实施方式中,所述管理模块10通过串行器、解串器与所述第二服务器12相连。所述管理模块10通过所述串行器、解串器与所述第二服务器12进行信号传输。所述管理模块10通过传输信号判断所述第二服务器12的工作状态,若第二服务器12的状态符合第二预设条件,所述管理模块10判断所述第二服务器12工作正常,所述管理模块10提高所述第二服务器12的优先级,即所述第二服务器12取得所述第二控制模块22的控制权。若所述第一服务器12的状态不符合第二预设条件,所述管理模块10判断所述第二服务器12工作异常,所述第二服务器12失去所述第二控制模块22的控制权,所述管理模块10直接对所述第二控制模块22进行控制。
在其他实施方式中,一些特定情况下所述管理模块10及所述第二服务器12会同时对所述第二控制模块22输出控制信号,此时所述第二控制模块22通过时序判断最后输入的控制信号并执行该控制信号。
本实施方式中,所述管理模块10包括一机柜控制器,所述机柜控制器用于控制位于机柜中的第一服务器11及第二服务器12。
本实施方式中,所述第一扩展单元包括一两线式串行扩展单元,所述两线式串行扩展单元用于对两线式串行总线进行扩展。
本实施方式中,所述第一控制模块21及第二控制模块22均包括一可编程逻辑芯片。所述第一信号转换模块31及所述第二信号转换模块32均用于将两线式串行信号转换为所述可编程逻辑芯片可识别的控制信号。
在其他实施方式中,所述第一服务器11可以通过第一控制模块21控制更多的执行模块;所述第二服务器12可以通过所述第二控制模块22控制更多的执行模块。所述第一服务器11及所述第二服务器12还可以通过若干控制模块对应控制更多的执行模块,在此不再赘述。
通过上述冗余管理设计,所述服务器管理装置100可以在服务器发生故障时通过管理模块100直接接管对应执行模块,以控制执行模块继续工作。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (9)

1.一种服务器管理装置,包括:
一第一服务器;
一第一控制模块;
一管理模块,所述管理模块通过所述第一服务器连接于所述第一控制模块;及
第一执行模块,所述第一执行模块连接所述第一控制模块;当所述第一服务器工作正常时,所述第一服务器输出第一信号至所述第一控制模块,所述第一控制模块依据所述第一信号控制所述第一执行模块工作;当所述第一服务器工作异常时,所述管理模块输出第二信号,所述第一控制模块依据所述第二信号控制所述第一执行模块工作;所述管理模块通过两线式串行总线判断所述第一服务器工作状态,当所述管理模块判断所述第一服务器工作正常时,所述管理模块提高所述第一服务器的优先级以通过所述第一服务器控制所述第一执行模块,当所述管理模块判断所述第一服务器工作异常时,所述管理模块直接控制所述第一执行模块。
2.如权利要求1所述的服务器管理装置,其特征在于:所述服务器管理装置还包括第一信号转换模块,所述第一信号转换模块连接所述管理模块以及所述第一控制模块,所述第一信号转换模块接收所述管理模块输出的第二信号,所述第一信号转换模块将所述第二信号转换为第三信号并将第三信号输出至所述第一控制模块,所述第一控制模块依据第三信号控制所述第一执行模块。
3.如权利要求2所述的服务器管理装置,其特征在于:所述管理模块及所述第一信号转换模块通过智能平台管理总线进行信号传输。
4.如权利要求1所述的服务器管理装置,其特征在于:所述第一控制模块包括一可编程逻辑芯片。
5.如权利要求1或4任一项所述的服务器管理装置,其特征在于:所述管理模块与所述第一服务器通过串行器、解串器进行信号传输。
6.如权利要求1所述的服务器管理装置,其特征在于:当所述第一执行模块同时接受所述管理模块及所述第一服务器的控制信号时,所述第一执行模块通过时序判断最后输入的控制信号并执行该控制信号。
7.如权利要求1所述的服务器管理装置,其特征在于:所述管理模块包括一机柜控制器。
8.如权利要求1所述的服务器管理装置,其特征在于:所述服务器管理装置还包括第二服务器及第二执行模块,当所述管理模块判断所述第二服务器工作正常时,所述第二服务器控制所述第二执行模块,当所述管理模块判断所述第二服务器工作异常时,所述管理模块控制所述第二执行模块。
9.如权利要求8所述的服务器管理装置,其特征在于:所述服务器管理装置还包括一两线式串行扩展单元,所述两线式串行扩展单元用于对两线式串行总线进行扩展。
CN201510678442.6A 2015-10-20 2015-10-20 服务器管理装置 Expired - Fee Related CN106598788B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201510678442.6A CN106598788B (zh) 2015-10-20 2015-10-20 服务器管理装置
US14/950,628 US10003504B2 (en) 2015-10-20 2015-11-24 Management device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510678442.6A CN106598788B (zh) 2015-10-20 2015-10-20 服务器管理装置

Publications (2)

Publication Number Publication Date
CN106598788A CN106598788A (zh) 2017-04-26
CN106598788B true CN106598788B (zh) 2020-08-28

Family

ID=58524527

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510678442.6A Expired - Fee Related CN106598788B (zh) 2015-10-20 2015-10-20 服务器管理装置

Country Status (2)

Country Link
US (1) US10003504B2 (zh)
CN (1) CN106598788B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1761939A (zh) * 2003-03-17 2006-04-19 精工爱普生株式会社 阻止病毒感染的方法及系统
CN102082781A (zh) * 2009-11-27 2011-06-01 宏正自动科技股份有限公司 服务器管理系统及其方法
CN102495785A (zh) * 2011-12-23 2012-06-13 创新科存储技术(深圳)有限公司 整机柜服务器集中管理方法和装置
CN104102291A (zh) * 2014-07-22 2014-10-15 浪潮(北京)电子信息产业有限公司 刀片服务器、刀片服务器的监控管理方法和系统
CN104378218A (zh) * 2013-08-12 2015-02-25 鸿富锦精密工业(深圳)有限公司 机柜内服务器管理系统及方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6697897B1 (en) * 1999-10-28 2004-02-24 Microchip Technology Incorporated Data communication interface between host and slave processors
JP3851810B2 (ja) * 2001-12-07 2006-11-29 富士通株式会社 プログラマブル論理回路およびそのクロック制御方法
US7614059B2 (en) * 2002-07-11 2009-11-03 Topia Technology System and method for the discovery and usage of local resources by a mobile agent object
US6968406B2 (en) * 2003-02-20 2005-11-22 Dell Products L.P. System and method for arbitrating access between common access requests on a bus
US7844866B2 (en) * 2007-10-02 2010-11-30 International Business Machines Corporation Mechanism to report operating system events on an intelligent platform management interface compliant server
US7289334B2 (en) * 2003-08-27 2007-10-30 Epicenter, Inc. Rack architecture and management system
US8099624B1 (en) * 2009-09-10 2012-01-17 Network Appliance, Inc. Recovery mechanism for I/O module using out-of-band control path
CN104734902B (zh) * 2013-12-23 2018-03-23 展讯通信(上海)有限公司 测试系统及其服务端

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1761939A (zh) * 2003-03-17 2006-04-19 精工爱普生株式会社 阻止病毒感染的方法及系统
CN102082781A (zh) * 2009-11-27 2011-06-01 宏正自动科技股份有限公司 服务器管理系统及其方法
CN102495785A (zh) * 2011-12-23 2012-06-13 创新科存储技术(深圳)有限公司 整机柜服务器集中管理方法和装置
CN104378218A (zh) * 2013-08-12 2015-02-25 鸿富锦精密工业(深圳)有限公司 机柜内服务器管理系统及方法
CN104102291A (zh) * 2014-07-22 2014-10-15 浪潮(北京)电子信息产业有限公司 刀片服务器、刀片服务器的监控管理方法和系统

Also Published As

Publication number Publication date
CN106598788A (zh) 2017-04-26
US10003504B2 (en) 2018-06-19
US20170111238A1 (en) 2017-04-20

Similar Documents

Publication Publication Date Title
US10838816B2 (en) Detecting and sparing of optical PCIE cable channel attached IO drawer
US10467111B2 (en) Implementing cable failover in multiple cable PCI express IO interconnections
CN106603265B (zh) 管理方法、网络装置以及非暂态计算机可读介质
US9697167B2 (en) Implementing health check for optical cable attached PCIE enclosure
US10572426B2 (en) System-level redundancy in PCI express equipment
US10614011B2 (en) Apparatus, method, and electronic device for implementing solid-state drive data interaction
US9928206B2 (en) Dedicated LAN interface per IPMI instance on a multiple baseboard management controller (BMC) system with single physical network interface
US9804575B2 (en) Multiplex control device
CN102724093A (zh) 一种atca机框及其ipmb连接方法
EP2917836B1 (en) Redundancy device unit and method for determining fault in industrial control system, industrial control system and industrial system comprising redundancy device unit
CN110967969A (zh) 高可用性工业自动化系统及通过该系统传送信息的方法
RU2015109465A (ru) Стойка с функцией автоматического восстановления и способ автоматического восстановления для этой стойки
RU2011114637A (ru) Микропроцессорная система централизации стрелок и сигналов
US10986556B2 (en) Circuit for monitoring a data processing system
CN109388526B (zh) 一种控制电路及复位操作的方法
CN113918383A (zh) 核心板复位方法、装置、设备、存储介质以及程序产品
CN106603276B (zh) 一种serdes链路组的故障处理方法和故障处理装置
CN106598788B (zh) 服务器管理装置
KR101462230B1 (ko) 스마트 배전 연계 게이트웨이
US11342935B2 (en) Cyclic redundancy check (CRC) system for detecting error in data communication
US9513680B2 (en) Relaying device, relaying method, and power control system
CN104216850B (zh) 接口传输设备
CN115705267A (zh) 监控采集设备、基于监控采集设备的主备切换方法及系统
CN105468557A (zh) 一种避免smbus受干扰的隔离方法
JP5592189B2 (ja) ディジタル保護制御装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20180302

Address after: Haiyun Binhai Economic and Technological Development Zone, Tianjin City, No. 80 300457 Street

Applicant after: HONGFUJIN PRECISION ELECTRONICS (TIANJIN) Co.,Ltd.

Address before: Haiyun Binhai Economic and Technological Development Zone, Tianjin City, No. 80 300457 Street

Applicant before: HONGFUJIN PRECISION ELECTRONICS (TIANJIN) Co.,Ltd.

Applicant before: HON HAI PRECISION INDUSTRY Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200828

Termination date: 20211020

CF01 Termination of patent right due to non-payment of annual fee