CN110985426A - 一种PCIE Switch产品的风扇控制系统及方法 - Google Patents

一种PCIE Switch产品的风扇控制系统及方法 Download PDF

Info

Publication number
CN110985426A
CN110985426A CN201911203450.XA CN201911203450A CN110985426A CN 110985426 A CN110985426 A CN 110985426A CN 201911203450 A CN201911203450 A CN 201911203450A CN 110985426 A CN110985426 A CN 110985426A
Authority
CN
China
Prior art keywords
fan
control
signal
bmc
board
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911203450.XA
Other languages
English (en)
Other versions
CN110985426B (zh
Inventor
魏文星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN201911203450.XA priority Critical patent/CN110985426B/zh
Publication of CN110985426A publication Critical patent/CN110985426A/zh
Application granted granted Critical
Publication of CN110985426B publication Critical patent/CN110985426B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F04POSITIVE - DISPLACEMENT MACHINES FOR LIQUIDS; PUMPS FOR LIQUIDS OR ELASTIC FLUIDS
    • F04DNON-POSITIVE-DISPLACEMENT PUMPS
    • F04D27/00Control, e.g. regulation, of pumps, pumping installations or pumping systems specially adapted for elastic fluids
    • F04D27/004Control, e.g. regulation, of pumps, pumping installations or pumping systems specially adapted for elastic fluids by varying driving speed
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F04POSITIVE - DISPLACEMENT MACHINES FOR LIQUIDS; PUMPS FOR LIQUIDS OR ELASTIC FLUIDS
    • F04DNON-POSITIVE-DISPLACEMENT PUMPS
    • F04D27/00Control, e.g. regulation, of pumps, pumping installations or pumping systems specially adapted for elastic fluids
    • F04D27/008Stop safety or alarm devices, e.g. stop-and-go control; Disposition of check-valves
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • G06F1/206Cooling means comprising thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Mechanical Engineering (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Cooling Or The Like Of Electrical Apparatus (AREA)

Abstract

本发明提出的一种PCIE Switch产品的风扇控制系统及方法,包括多个控制板和一个风扇板、用于PCIE Switch产品散热的风扇和逻辑电路,所述控制板分别与一台主机信号连接,所述风扇板通过逻辑电路分别与每个控制板、风扇信号连接。本发明通过增加多个控制器控制风扇来实现冗余设计,同时能够避免出现多个控制器控制风扇时的冲突问题。

Description

一种PCIE Switch产品的风扇控制系统及方法
技术领域
本发明涉及计算机技术领域,更具体的说是涉及一种PCIE Switch产品的风扇控制系统及方法。
背景技术
随着云计算、大数据业务、AI技术的发展,客户对服务器的计算能力要求越来越高,PCIE Switch Box产品通过PCIE Switch芯片将各种类型PCIE计算卡(GPU、FPGA)与服务器相连,可以快速提升现有服务器的运算能力。
为了提高计算密度,PCIE Switch Box产品往往会在一定空间里尽可能多的安装各种计算卡,所以PCIE Switch Box产品具有功耗高、散热量大的特点。因此风扇的可靠性对这类产品很重要。在现有的产品中,一般只有一个风扇控制器去控制风扇,当这一套风扇系统坏掉后,整个系统的散热功能将会失效,从而引起灾难性故障。
在目前产品设计中,如图1所示,主机1和主机2都通过一个风扇控制器去控制风扇,如果控制器坏了,整个系统散热也出现问题。为了实现风扇冗余控制,可以每个主机通过一个控制器控制风扇,但会带来控制冲突问题。
由此可见,目前的产品设计存在的缺陷如下:
1、整个产品只使用一个控制器控制风扇的方案,没有冗余设计,无法在控制器失效的是否保证系统散热。
2、如果简单的使用多个控制器控制风扇,会存在控制冲突的问题。
发明内容
针对以上问题,本发明的目的在于提供一种PCIE Switch产品的风扇控制系统及方法,通过增加多个控制器控制风扇来实现冗余设计,同时能够避免出现多个控制器控制风扇时的冲突问题。
本发明为实现上述目的,通过以下技术方案实现:一种PCIE Switch产品的风扇控制系统,包括多个控制板和一个风扇板、用于PCIE Switch产品散热的风扇和逻辑电路,所述控制板分别与一台主机信号连接,所述风扇板通过逻辑电路分别与每个控制板、风扇信号连接;
所述控制板用于监控主机的运行状态和风扇调速控制;
所述风扇板用于接收控制板传递过来的控制信号,通过预设的逻辑判断算法,选择一个控制板的控制信号控制风扇;
所述逻辑电路用于传输风扇板与控制板之间的在位检测信号CMB_n_Present、指示控制板内置的BMC工作状态的心跳信号BMC_Hb、BMC发给风扇的转速控制信号BMC_FAN_PW、风扇反馈给BMC的转速信息信号FAN_BMC_TACH,还用于传输风扇板控制风扇的信号FAN_PWM和FAN_TACH、风扇在位信号Hot_plug。
进一步,所述预设的逻辑判断算法用于判断控制板是否在位,并在异常状态下确定处理方法。
进一步,所述CMB_n_Present信号的一端与控制板n连接,CMB_n_Present信号在控制板n上的管脚接地,其中,n为控制板的编号;CMB_n_Present信号的另一端通过上拉电阻连接到风扇板内置的CPLD管脚内;当CPLD检测到CMB_n_Present信号为高电平时认为控制板n不在位,当检测到低电平时,认为控制板n在位。
进一步,所述BMC_Hb信号的一端接控制板上的BMC芯片的一个GPIO口,另一端接风扇板上的CPLD管脚;当BMC正常工作时,BMC_Hb信号为1Hz的方波,当BMC不工作时该信号为高电平;CPLD通过BMC_Hb信号获取BMC的工作状态信息。
进一步,所述BMC_FAN_PWM信号和FAN_BMC_TACH信号为一组信号,用于形成一个闭环控制。
进一步,所述FAN_PWM信号和FAN_TACH信号由控制板发送至风扇板后,经过风扇板上的CPLD逻辑处理后,作为最终控制风扇的信号发送至风扇;所述风扇板接收到的Hot_plug信号若为低电平,则风扇在位,若为高电平,则风扇不在位。
进一步,所述多个控制板,当其中一个控制板确定为主控板时,其余的控制板均作为备用板。
相应的,本发明还公开了一种PCIE Switch产品的风扇控制方法,包括如下步骤:
S1:系统上电后,风扇板上的CPLD先检测Hot_plug信号,若Hot_plug信号为高电平,则风扇不在位,通知主机系统散热异常;若Hot_plug信号为低电平,则风扇在位,转到下一步;
S2:风扇板依次检测每个控制板的控制板在位检测信号判断控制板是否在位;
S3:读取每个控制板的BMC_FAN_PWM信号和FAN_BMC_TACH信号,解析风扇控制信息,并确定一个控制板为主控板;
S4:将所述主控板的BMC_Hb信号调整为方波,若CPLD检测到BMC_Hb信号为方波,则主控板工作正常;若BMC_Hb信号不是方波,CPLD认定主控板发生故障,将异常上报信息主机,同时将备用板设定为主控板,控制风扇运行。
进一步,所述步骤S2包括:
将所述n个控制板依次命名为控制板1至控制板n;
风扇板按照控制板的命名编号依次升序读取每个控制板的控制板在位检测信号,若CMB_X_Present信号为低电平,则设定控制板X板为主控板,其他控制板为备用板,其中1≤X≤n;若控制板X不在位则设控制板X+1为主控板,其他控制板为备用板,依次类推;若检测到所有控制板都不在位,则通知主机散热系统故障,同时控制风扇全速转。
进一步,所述步骤S3包括:
在CPLD中,预设每个控制板对应的风扇控制策略,若设定控制板X板为主控板,CPLD选取对应的策略X作为风扇控制策略。
对比现有技术,本发明有益效果在于:本发明提供了一种PCIE Switch产品的风扇控制系统及方法,通过增加多个控制板控制风扇来实现冗余设计,同时避免出现多个控制板控制风扇时的冲突问题。在硬件上,所有的CMB板上的风扇控制信号先进入风扇板的CPLD内,软件上,CPLD做完逻辑处理后再将控制信号发送给风扇。
由此可见,本发明与现有技术相比,具有突出的实质性特点和显著的进步,其实施的有益效果也是显而易见的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
附图1是本发明现有技术的系统结构图。
附图2是本发明的系统结构图。
附图3是本发明的逻辑处理电路的结构示意图。
附图4是本发明的方法流程图。
具体实施方式
下面结合附图对本发明的具体实施方式做出说明。
本发明提供了一种PCIE Switch产品的风扇控制系统,通过增加多个控制板控制风扇来实现冗余设计,同时避免出现多个控制器控制风扇时的冲突问题。
如图2所示,具体包括:
多个控制板,即CMB(Control Management Board)板,其功能是作为整系统监控及风扇调速控制。每个板供一个主机使用,多个CMB板中,一个作为主控板,其余作为备用板。
一种风扇板,该风扇板包含逻辑处理电路,用来接受CMB板传递过来的控制信息,通过逻辑判断,确定用那个CMB板的控制信息去控制风扇
一种逻辑判断的算法,该算法主要功能是判断CMB板是否在位,选择那个CMB板作为主控板,遇到异常状态如何处理。
其中,每个主机都通过一个控制板控制风扇,这样的冗余设计可以在某一个控制板失效时保证系统正常散热。为了解决多控制板控制风扇冲突问题,风扇板增加逻辑处理电路,用来管理CMB板、风扇;对CMB板的管理权进行仲裁、对异常情况进行处理。
如图3所示,逻辑处理电路包括:
信号CMB_1_Present:该信号一端接CMB1板,CMB板上该管脚接地处理,另一端接风扇板,通过1K电阻上拉接到CPLD管脚内,该信号用作CMB板的在位检测。原理如下,当CMB板不在位时,由于CMB_1_Present在风扇板端被上拉,CPLD检测到高电平;当CMB板在位时,由于CMB板端接地,该信号被拉低,CPLD检测到低电平。综上,当CPLD检测到CMB_1_Present信号为高电平时认为CMB板不在位,当检测到低电平时,认为CMB板在位。
信号BMC_Hb:该信号一端接CMB上的BMC芯片的一个GPIO口,另一端接风扇板上的CPLD管脚。该信号为指示BMC工作状态的心跳信号。当BMC正常工作时,该信号为1Hz的方波,当BMC不工作时该信号为高电平。CPLD可以通过该信号知道BMC的工作状态。
信号BMC_FAN_PWM和FAN_BMC_TACH:这两个是一组信号,PWM是BMC发给风扇的转速控制信号,TACH是风扇反馈给BMC的转速信息,两个信号形成一个闭环控制。
信号FAN_PWM和FAN_TACH:这两个信号是CMB板上的信号经过风扇板上CPLD逻辑处理后的、最终控制风扇的信号。
信号Hot_plug:该信号是风扇在位信号,低电平表示风扇在位,高电平表示风扇不在位。
特别指出的是,图3中只提供两个CMB板的系统,由本实施例可以延伸到多个CMB板的系统。
相应的,如图4所示,本发明还公开了一种PCIE Switch产品的风扇控制方法,包括如下步骤:
1、系统上电后,CPLD先检测Hot_plug信号,该信号为高时表明风扇不在位,通知主机系统散热异常;该信号为低时,表明风扇在位,继续下一步。
2、依次检测CMB_1_Present到CMB_n_Present信号判断CMB板是否在位。若CMB_1在位则设定CMB_1板为主控板,其他CMB板为备用板;若CMB_1板不在位则设CMB_2板为主控板,其他CMB板为备用板,依次类推;若检测到CMB板都不在位,则通知主机散热系统故障,同时控制风扇全速转,保证系统散热。
3、读取每个CMB板的BMC_FAN_PWM和FAN_BMC_TACH信号,解析风扇控制信息,依次定义为“策略1”…“策略n”,例如设置CMB_1板为主控板时,CPLD选取“策略1”作为风扇控制策略。
4、当某个CMB板设置为主控板时,其BMC_Hb信号变为1Hz方波,CPLD检测到方波时认为该CMB板正常工作,如果该信号变为非1Hz方波(高电平或低电平)时,CPLD认为该CMB板发生故障,将该异常上报主机,同时将备用CMB板设定为主控板,控制风扇,保证系统正常散热
本实施例提供了一种PCIE Switch产品的风扇控制系统及方法,利用多控制器实现了风扇冗余拓扑架构;利用多控制器实现了风扇冗余硬件设计,还实现了用来避免多控制器对风扇控制冲突的逻辑设计。
结合附图和具体实施例,对本发明作进一步说明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所限定的范围。

Claims (10)

1.一种PCIE Switch产品的风扇控制系统,其特征在于,包括多个控制板和一个风扇板、用于PCIE Switch产品散热的风扇和逻辑电路,所述控制板分别与一台主机信号连接,所述风扇板通过逻辑处理电路分别与每个控制板、风扇信号连接;
所述控制板用于监控主机的运行状态和风扇调速控制;
所述风扇板用于接收控制板传递过来的控制信号,通过预设的逻辑判断算法,选择一个控制板的控制信号控制风扇;
所述逻辑处理电路用于传输风扇板与控制板之间的在位检测信号CMB_n_Present、指示控制板内置的BMC工作状态的心跳信号BMC_Hb、BMC发给风扇的转速控制信号BMC_FAN_PW、风扇反馈给BMC的转速信息信号FAN_BMC_TACH,还用于传输风扇板控制风扇的信号FAN_PWM和FAN_TACH、风扇在位信号Hot_plug。
2.根据权利要求1所述的PCIE Switch产品的风扇控制系统,其特征在于,所述预设的逻辑判断算法用于判断控制板是否在位,并在异常状态下确定处理方法。
3.根据权利要求1所述的PCIE Switch产品的风扇控制系统,其特征在于,所述CMB_n_Present信号的一端与控制板n连接,CMB_n_Present信号在控制板n上的管脚接地,其中,n为控制板的编号;CMB_n_Present信号的另一端通过上拉电阻连接到风扇板内置的CPLD管脚内;当CPLD检测到CMB_n_Present信号为高电平时认为控制板n不在位,当检测到低电平时,认为控制板n在位。
4.根据权利要求1所述的PCIE Switch产品的风扇控制系统,其特征在于,所述BMC_Hb信号的一端接控制板上的BMC芯片的一个GPIO口,另一端接风扇板上的CPLD管脚;当BMC正常工作时,BMC_Hb信号为1Hz的方波,当BMC不工作时该信号为高电平;CPLD通过BMC_Hb信号获取BMC的工作状态信息。
5.根据权利要求1所述的PCIE Switch产品的风扇控制系统,其特征在于,所述BMC_FAN_PWM信号和FAN_BMC_TACH信号为一组信号,用于形成一个闭环控制。
6.根据权利要求1所述的PCIE Switch产品的风扇控制系统,其特征在于,所述FAN_PWM信号和FAN_TACH信号由控制板发送至风扇板后,经过风扇板上的CPLD逻辑处理后,作为最终控制风扇的信号发送至风扇;所述风扇板接收到的Hot_plug信号若为低电平,则风扇在位,若为高电平,则风扇不在位。
7.根据权利要求1所述的PCIE Switch产品的风扇控制系统,其特征在于,所述多个控制板,当其中一个控制板确定为主控板时,其余的控制板均作为备用板。
8.一种PCIE Switch产品的风扇控制方法,其特征在于,包括如下步骤:
S1:系统上电后,风扇板上的CPLD先检测Hot_plug信号,若Hot_plug信号为高电平,则风扇不在位,通知主机系统散热异常;若Hot_plug信号为低电平,则风扇在位,转到下一步;
S2:风扇板依次检测每个控制板的控制板在位检测信号判断控制板是否在位;
S3:读取每个控制板的BMC_FAN_PWM信号和FAN_BMC_TACH信号,解析风扇控制信息,并确定一个控制板为主控板;
S4:将所述主控板的BMC_Hb信号调整为方波,若CPLD检测到BMC_Hb信号为方波,则主控板工作正常;若BMC_Hb信号不是方波,CPLD认定主控板发生故障,将异常上报信息主机,同时将备用板设定为主控板,控制风扇运行。
9.根据权利要求8所述的PCIE Switch产品的风扇控制方法,其特征在于,所述步骤S2包括:
将所述n个控制板依次命名为控制板1至控制板n;
风扇板按照控制板的命名编号依次升序读取每个控制板的控制板在位检测信号,若CMB_X_Present信号为低电平,则设定控制板X板为主控板,其他控制板为备用板,其中1≤X≤n;若控制板X不在位则设控制板X+1为主控板,其他控制板为备用板,依次类推;若检测到所有控制板都不在位,则通知主机散热系统故障,同时控制风扇全速转。
10.根据权利要求9所述的PCIE Switch产品的风扇控制方法,其特征在于,所述步骤S3包括:
在CPLD中,预设每个控制板对应的风扇控制策略,若设定控制板X板为主控板,CPLD选取对应的策略X作为风扇控制策略。
CN201911203450.XA 2019-11-29 2019-11-29 一种PCIE Switch产品的风扇控制系统及方法 Active CN110985426B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911203450.XA CN110985426B (zh) 2019-11-29 2019-11-29 一种PCIE Switch产品的风扇控制系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911203450.XA CN110985426B (zh) 2019-11-29 2019-11-29 一种PCIE Switch产品的风扇控制系统及方法

Publications (2)

Publication Number Publication Date
CN110985426A true CN110985426A (zh) 2020-04-10
CN110985426B CN110985426B (zh) 2021-10-22

Family

ID=70088444

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911203450.XA Active CN110985426B (zh) 2019-11-29 2019-11-29 一种PCIE Switch产品的风扇控制系统及方法

Country Status (1)

Country Link
CN (1) CN110985426B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112416711A (zh) * 2020-11-20 2021-02-26 恒为科技(上海)股份有限公司 一种四线风扇在位检测方法、装置和四线风扇控制系统
CN112416678A (zh) * 2020-11-18 2021-02-26 北京东土科技股份有限公司 一种风扇在位检测装置和方法
CN114922840A (zh) * 2022-05-30 2022-08-19 苏州浪潮智能科技有限公司 一种冗余风扇的控制系统及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108008624A (zh) * 2017-12-08 2018-05-08 北京交大思诺科技股份有限公司 抢权逻辑控制单元
CN208311110U (zh) * 2018-04-02 2019-01-01 郑州云海信息技术有限公司 一种服务器风扇控制机构
CN109882439A (zh) * 2019-03-19 2019-06-14 浪潮商用机器有限公司 一种风扇控制系统、方法及服务器

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108008624A (zh) * 2017-12-08 2018-05-08 北京交大思诺科技股份有限公司 抢权逻辑控制单元
CN208311110U (zh) * 2018-04-02 2019-01-01 郑州云海信息技术有限公司 一种服务器风扇控制机构
CN109882439A (zh) * 2019-03-19 2019-06-14 浪潮商用机器有限公司 一种风扇控制系统、方法及服务器

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112416678A (zh) * 2020-11-18 2021-02-26 北京东土科技股份有限公司 一种风扇在位检测装置和方法
CN112416711A (zh) * 2020-11-20 2021-02-26 恒为科技(上海)股份有限公司 一种四线风扇在位检测方法、装置和四线风扇控制系统
CN114922840A (zh) * 2022-05-30 2022-08-19 苏州浪潮智能科技有限公司 一种冗余风扇的控制系统及方法

Also Published As

Publication number Publication date
CN110985426B (zh) 2021-10-22

Similar Documents

Publication Publication Date Title
US8656003B2 (en) Method for controlling rack system using RMC to determine type of node based on FRU's message when status of chassis is changed
CN110985426B (zh) 一种PCIE Switch产品的风扇控制系统及方法
US4677566A (en) Power control network for multiple digital modules
US8812913B2 (en) Method and apparatus for isolating storage devices to facilitate reliable communication
US8990632B2 (en) System for monitoring state information in a multiplex system
CN111767244B (zh) 基于国产龙芯平台的双冗余计算机设备
US20120136502A1 (en) Fan speed control system and fan speed reading method thereof
CN210129215U (zh) 一种双余度机电管理计算机架构
TWI665549B (zh) 電源分配板、模組化機箱系統及其運作方法
JP2003150280A (ja) バックアップ管理システムおよび方法
CN107943623A (zh) 一种存储系统
CN212541329U (zh) 基于国产龙芯平台的双冗余计算机设备
US8095820B2 (en) Storage system and control methods for the same
CN106940676B (zh) 机柜的监控系统
WO2023029375A1 (zh) 一种四路服务器电源功耗管理装置
US11910558B2 (en) Chassis management controller monitored overcurrent protection for modular information handling systems
CN113868161B (zh) 一种基于i3c的设备管理方法、装置、设备及可读介质
CN111737037A (zh) 基板管理控制方法、主从异构bmc控制系统及存储介质
CN115047954B (zh) 一种设备散热控制方法、系统、装置、设备及存储介质
CN109726055B (zh) 检测PCIe芯片异常的方法及计算机设备
US20190146572A1 (en) Storage system with power saving function
TWI546682B (zh) 藉助於混和管理路徑來管理一儲存系統之方法與裝置
CN113535472A (zh) 集群服务器
CN113535471A (zh) 集群服务器
CN113535473A (zh) 集群服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant