CN109388210B - 分布式机箱、分布式机箱的管理方法及装置 - Google Patents

分布式机箱、分布式机箱的管理方法及装置 Download PDF

Info

Publication number
CN109388210B
CN109388210B CN201811489935.5A CN201811489935A CN109388210B CN 109388210 B CN109388210 B CN 109388210B CN 201811489935 A CN201811489935 A CN 201811489935A CN 109388210 B CN109388210 B CN 109388210B
Authority
CN
China
Prior art keywords
board card
fan
chassis
temperature
main control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811489935.5A
Other languages
English (en)
Other versions
CN109388210A (zh
Inventor
莫慧光
包彩军
谭业赞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Comba Network Systems Co Ltd
Original Assignee
Comba Network Systems Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Comba Network Systems Co Ltd filed Critical Comba Network Systems Co Ltd
Priority to CN201811489935.5A priority Critical patent/CN109388210B/zh
Publication of CN109388210A publication Critical patent/CN109388210A/zh
Application granted granted Critical
Publication of CN109388210B publication Critical patent/CN109388210B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/18Packaging or power distribution
    • G06F1/183Internal mounting support structures, e.g. for printed circuit boards, internal connecting means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Computer Hardware Design (AREA)
  • Power Engineering (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Cooling Or The Like Of Electrical Apparatus (AREA)

Abstract

本发明提供一种分布式机箱、分布式机箱的管理方法及装置,该分布式机箱包括:主控板卡、电源板卡、风扇板卡和至少一个业务板卡;业务板卡上设置有多个业务芯片,用于实现机箱的业务功能;风扇板卡用于驱动机箱内风扇,进行散热;电源板卡用于为机箱内其他板卡进行供电;主控板卡、电源板卡、风扇板卡和业务板卡上均设置有微控制模块和温度传感器,各个板卡上的温度传感器分别用于采集各板卡上预设温度采集点的温度值;主控板卡分别与电源板卡、风扇板卡和业务板卡连接,根据其他板卡采集的温度值和板卡自身采集的温度值控制风扇板卡进行散热。本发明将机箱内部分布式部署在不同板卡,并将不同位置的板卡当作一个节点,对机箱进行综合监控管理。

Description

分布式机箱、分布式机箱的管理方法及装置
技术领域
本发明涉及通信设备技术领域,尤其涉及一种分布式机箱、分布式机箱的管理方法及装置。
背景技术
随着云计算和大数据的广泛应用,不仅对通信设备的需求越来越大,而且对其性能的要求也越来越高。通信设备的机箱内,往往需要安装多个板卡,因此整机功耗较高,在设备工作中常会出现机箱内部温度过高、电压异常等问题,这不仅会影响整机的工作性能,甚至会对硬件产生损坏,最终导致整机故障。因此使用一套完善的管理系统对机箱内部运行的物理环境进行监控和管理是非常必要的。通过管理系统可以对机箱进行综合监控管理,在机箱发生重大故障前自动采取应急处理措施,从而可以避免系统崩溃、硬件烧坏等情况的发生。
现有的大部分机箱其内部管理系统不仅功能单一,还存在以下不足之处:
1、让机箱内部的风扇保持全速运行,这样不仅增大了整个机箱的功耗,而且缩短的风扇的使用寿命,增大了安全隐患。
2、机箱内部只设置一处温度采集点,无法获取机箱内部整体温度状态。
3、电压监控只是设置了硬件保护,当发生电压异常故障时由于没有软件的记录,导致维修人员很难定位到发生故障的原因。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的分布式机箱、分布式机箱的管理方法及装置。
本发明的一个方面,提供了一种分布式机箱,包括置于机箱内部的主控板卡、电源板卡、风扇板卡和至少一个业务板卡;
所述至少一个业务板卡上设置有多个业务芯片,用于实现机箱的业务功能;
所述风扇板卡,用于驱动机箱内风扇,进行散热;
所述电源板卡,用于为机箱内其他板卡进行供电;
所述主控板卡、电源板卡、风扇板卡和各个业务板卡上均设置有微控制模块和至少一个温度传感器,各个板卡上的温度传感器分别用于采集各板卡上预设温度采集点的温度值;
所述主控板卡分别与所述电源板卡、风扇板卡和各个业务板卡连接,以获取所述电源板卡、风扇板卡和各个业务板卡的温度采集点的温度值,并根据获取的温度值和板卡自身采集的温度值控制风扇板卡。
其中,所述主控板卡、电源板卡、风扇板卡和各个业务板卡上还设置有电压检测模块,分别用于采集各板卡的工作电压;
所述电源板卡、风扇板卡和各个业务板卡定时将各自采集的工作电压上报所述主控板卡。
其中,所述主控板卡、电源板卡、风扇板卡和各个业务板卡上均设置有用于记录异常日志的存储模块。
其中,所述风扇板卡还包括风扇驱动模块,所述风扇驱动模块用于根据所述主控板卡的控制命令驱动机箱内风扇。
其中,所述主控板卡通过CAN总线分别与所述电源板卡、风扇板卡和至少一个业务板卡连接。
本发明的另一个方面,提供了一种分布式机箱的管理方法,该方法包括:
获取部署在机箱各个板卡上的温度采集点的温度值,根据采集到的各个温度值确定风扇转速参数;
根据所述风扇转速参数生成控制命令,并将所述控制命令发送到机箱内风扇所属的风扇板卡,以供所述风扇板卡根据所述控制命令控制风扇转速并监控所述风扇转速;
当风扇转速异常时,接收风扇板卡上报的转速异常信息,并将所述转速异常信息作为日志记录进行保存。
其中,所述方法还包括:
接收部署在机箱内的各个板卡上报的电压异常信息,并将所述电压异常信息作为日志记录进行保存,其中,部署在机箱内的各个板卡监控自身的电压状态。
本发明的再一个方面,提供了一种分布式机箱的管理装置,包括:
温度管理单元,用于获取部署在机箱各个板卡上的温度采集点的温度值,根据采集到的各个温度值确定风扇转速参数;
所述温度管理单元,还用于根据所述风扇转速参数生成控制命令,并将所述控制命令发送到机箱内风扇所属的风扇板卡,以供所述风扇板卡根据所述控制命令控制风扇转速并监控所述风扇转速;
状态监测单元,用于当风扇转速异常时,接收风扇板卡上报的转速异常信息,并将所述转速异常信息作为日志记录进行保存。
其中,所述状态监测单元,还用于接收部署在机箱内的各个板卡上报的电压异常信息,并将所述电压异常信息作为日志记录进行保存,其中,部署在机箱内的各个板卡监控自身的电压状态。
此外,本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述方法的步骤。
此外,本发明还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上所述方法的步骤。
本发明实施例提供的分布式机箱、分布式机箱的管理方法及装置,通过将机箱内部分布式部署在不同板卡,并将不同位置的板卡当作一个节点,对机箱进行综合监控管理,根据每个节点的温度信息,进行综合分析来确定风扇转速。一定程度上降低了因散热异常而发生事故的风险。而且,机箱内部设置了多处温度采集点,能够全面分析机箱内部散热状态,最大限度的避免系统崩溃、硬件烧坏等事故的发生。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为本发明实施例提供的分布式机箱的结构框图;
图2为本发明实施例提供的主控板卡和业务板卡的结构框图;
图3为本发明实施例提供的风扇板卡的结构框图;
图4为本发明实施例提供的电源板卡的结构框图;
图5为本发明实施例的分布式机箱的管理方法的流程图;
图6示意性示出了本发明实施例的分布式机箱的管理装置的结构框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非被特定定义,否则不会用理想化或过于正式的含义来解释。
本发明提供了一种分布式机箱、分布式机箱的管理方法及装置,通过将机箱内部分布在不同位置的板卡当作一个节点,对机箱进行综合监控管理,最大限度的避免系统崩溃、硬件烧坏等事故的发生。
图1为本发明实施例提供的分布式机箱的结构框图。参照图1,本发明实施例的分布式机箱,置于机箱内部的主控板卡1、电源板卡3、风扇板卡4和至少一个业务板卡51、52……5n。其中,所述主控板卡1通过CAN总线2分别与电源板卡3、风扇板卡4和各个业务板卡51、52……5n连接。
本实施例中,机箱内分布式部署的各个板卡中:
各个业务板卡51、52……5n上均设置有多个业务芯片,用于实现机箱的业务功能;
所述风扇板卡4,用于驱动机箱内风扇,进行散热。风扇板卡4包括有风扇驱动模块,风扇驱动模块用于根据所述主控板卡1的控制命令驱动机箱内风扇。
所述电源板卡3,用于为机箱内其他板卡进行供电;
所述主控板卡1、电源板卡3、风扇板卡4和各个业务板卡51、52……5n 上均设置有微控制模块和至少一个温度传感器,各个板卡上的温度传感器分别用于采集各板卡上预设温度采集点的温度值;
所述主控板卡1分别与所述电源板卡3、风扇板卡4和各个业务板卡51、 52……5n连接,以获取所述电源板卡3、风扇板卡4和各个业务板卡51、 52……5n的温度采集点的温度值,并根据获取的温度值和板卡自身采集的温度值控制风扇板卡4。风扇板卡4根据主控板卡1的控制命令控制风扇转速并监控所述风扇转速。
在一个具体实施例中,所述主控板卡1、电源板卡3、风扇板卡4和各个业务板卡51、52……5n上还设置有电压检测模块,分别用于采集各板卡的工作电压。所述电源板卡3、风扇板卡4和各个业务板卡51、52……5n定时将各自采集的工作电压上报所述主控板卡1。
进一步地,主控板卡1、电源板卡3、风扇板卡4和至少一个业务板卡51、 52……5n上均设置有用于记录异常日志的存储模块。其中存储模块可采用 FLASH芯片或其他存储芯片实现。在本实施例中,电源板卡3、风扇板卡4和各个业务板卡51上的存储模块用于记录各自板卡的异常日志。主控板卡1上的存储模块用于记录机箱内部所有板卡的异常日志。例如,风扇板卡4根据主控板卡1的控制命令控制风扇转速并监控所述风扇转速,当风扇转速异常时,风扇板卡4上报的转速异常信息,主控板卡1接收到风扇板卡上报的转速异常信息时,将所述转速异常信息作为日志记录进行保存。又如,主控板卡1接收到各个板卡上报的电压异常信息时,将所述电压异常信息作为日志记录进行保存。
本发明实施例中,所述主控板卡1和各个业务板卡上预设有多个温度采集点,每个温度采集点设置有温度传感器,主控板卡和各个业务板卡上的温度传感器分别通过I2C总线连接到对应板卡的微控制模块。在一个具体实施例中,主控板卡和各个业务板卡上的温度传感器分别布设在对应板卡上的芯片分布位置,多个温度传感器用于采集主控板卡中不同芯片和不同位置的温度,多个温度传感器分别通过I2C总线2连接到对应板卡的微控制模块。在另一个具体实施例中,主控板卡和各个业务板卡上的温度传感器也可以均匀布设在对应板卡上,实现对各个板卡不同位置的温度采集。
在一个具体实施例中,参见图2,主控板卡1上设有微控制模块8、电压检测模块10、多路温度传感器12、CAN模块9、存储模块11。电压检测模块 10用于检测主控板卡1内各路电压是否正常;多个温度传感器12用于采集主控板卡1中不同芯片的工作温度;CAN模块9用于和其他板卡进行信息交互;存储模块11用于记录异常日志。
进一步地,业务板卡和主控板卡的结构相同。参见图2,业务板卡上也设有微控制模块8、电压检测模块10、多路温度传感器12、CAN模块9、存储模块11。其中,电压检测模块10用于检测业务板内各路电压是否正常;多个温度传感器12用于采集业务板卡中不同芯片的工作温度;CAN模块9用于和主控板卡进行信息交互;存储模块11用于记录异常日志。
其中,在一个具体示例中,多路温度传感器12可以设置5组,其具体型号可以包括ADT7461和TMP175等两种温度传感器,且分别通过I2C总线与所述微控制模块8相连接。
参照图3所示,所述风扇板卡4用于驱动机箱内部的风扇,进行散热,包含微控制模块13、电压检测模块15、温度传感器16、CAN模块14、存储模块17和驱动模块18。电压检测模块15用于检测风扇板内各路电压是否正常;温度传感器16用于检测风扇板温度;CAN模块14用于和主控板卡1进行信息交互;存储模块17用于记录异常日志;驱动模块18用于驱动风扇运转。
在一个具体示例中,所述温度传感器16具体型号可以为TMP175,且分别通过I2C总线与所述微控制模块13相连接,驱动模块18接收来自微控制模块13的PWM信号,对风扇进行调速,并且将风扇的转速信号(脉冲信号) 反馈回微控制模块13实现转速监控,驱动模块18可以使用SM7095-12芯片实现。
参照图4所示,所述电源板卡3用于给整机提供电源,包含微控制模块22、电压检测模块24、温度传感器25、CAN模块23、存储模块26和电源模块27。电压检测模块24用于检测电源板内各路电压是否正常;温度传感器25用于检测电源板温度;CAN模块23用于和主控板1进行信息交互;存储模块26用于记录异常日志;电源模块27用于给其他版卡提供电源,并受微控制模块22 的控制。
在一个具体示例中,所述温度传感器25具体型号可以为TMP175,且分别通过I2C总线与所述微控制模块22相连接。
进一步的,所述微控制模块(8、13、22)可以为同一型号,例如可以采用TM4C1230系列单片机,所述电压检测模块(10、15、24)为ADC电压检测模块,可使用微控制模块(8、13、22)的内部ADC模块实现,所述CAN 模块(9、14、23)具体可使用TCAN332芯片实现,所述存储模块(11、17、 26)为FLASH芯片,可以为同一型号,例如可以采用AT45DB641E实现。
需要说明的是,以上器件的型号为本实例中应用的器件型号,本发明并不限制于一种型号,相同功能的器件亦可使用,本发明对此不做限定。
图5为本发明实施例的分布式机箱的管理方法的流程图。参照图5,本发明实施例的分布式机箱的管理方法具体包括以下步骤:
S101、获取部署在机箱各个板卡的温度采集点的温度值,根据采集到的各个温度值确定风扇转速参数。
本实施例中,可定时获取部署在机箱各个板卡的温度采集点的温度值,通过分析各个板卡上各处的温度数值,确定风扇转速参数。
具体的,通过提取获取的温度值中的最高温度值,根据所述最高温度值查找预设第一映射关系,以获取最高温度值对应的风扇转速参数。所述第一映射关系中包括有温度值与风扇转速参数之间的对应关系。其中,温度值与风扇转速参数之间的对应关系具体可以设置如下:风扇转速设置6000转/分钟、4500 转/分钟、3000转/分钟、1500转/分钟4个档位,分别对应的参考温度值范围为:80-100度、60-80度、40-60度、40度以下。
S102、根据所述风扇转速参数生成控制命令,并将所述控制命令发送到机箱内风扇所属的风扇板卡,以供所述风扇板卡根据所述控制命令控制风扇转速并监控所述风扇转速。
S103、当风扇转速异常时,接收风扇板卡上报的转速异常信息,并将所述转速异常信息作为日志记录进行保存。
具体的,当风扇板卡获取到风扇转速小于或等于预设值时,则认为风扇异常。
本发明实施例提供的分布式机箱的管理方法,通过将机箱内部分布式部署在不同板卡,并将不同位置的板卡当作一个节点,对机箱进行综合监控管理,根据每个节点的温度信息,进行综合分析来确定风扇转速。一定程度上降低了因散热异常而发生事故的风险。而且,机箱内部设置了多处温度采集点,能够全面分析机箱内部散热状态,最大限度的避免系统崩溃、硬件烧坏等事故的发生。
本发明实施例中,主控板卡的微控制模块接收部署在机箱内的各个板卡上报的电压异常信息,并将所述电压异常信息作为日志记录进行保存。具体的,各板卡上的微控制模块通过电压检测模块定时查询本板的电压值,并对采集到的数值与预设值进行分析对比,确定电压是否异常。
下面通过一个具体实施例对本发明提供的分布式机箱的管理方法进行解释说明。以上述实施例提到的分布式机箱为例,所述分布式机箱的管理方法具体实现如下:
步骤S1:每一个板卡上的微控制模块定时查询本板上温度传感器数值。
步骤S2:主控板卡上的微控制模块通过CAN总线定时获取多个业务板卡、电源板卡和风扇板卡上的温度数值。
步骤S3:主控板卡通过分析各个节点的温度数值,确定风扇转速参数。
步骤S4:主控板卡通过CAN总线将命令发送至风扇板卡,风扇板卡接收到命令后对风扇速度进行设置,从而实现风扇调速控制。
进一步的,所述步骤S1中微控制模块定时查询本板上温度传感器,定时时间为2秒。
进一步的,所述步骤S2主控板卡上的微控制模块通过CAN总线定时获取其他板卡温度值,定时时间为5秒。
进一步的,所述步骤S3中主控板卡获取到其他节点的温度数值,取其中温度值最高的一组作为参考温度值。风扇转速设置6000转/分钟、4500转/分钟、 3000转/分钟、1500转/分钟4个档位,分别对应的参考温度值范围为:80-100 度、60-80度、40-60度、40度以下。
步骤S5:电压监控指各板卡上的微控制模块通过电压检测模块定时查询本板的电压值,并对采集到的数值进行分析对比,确定电压是否异常。
步骤S6:风扇转速监控指风扇板卡定时监控风扇转速是否正常。
步骤S7:当某个板卡电压异常或风扇转速异常时候,能够通过CAN总线将异常信息上报至主控板卡,并将异常信息作为日志记录到本板存储模块中。主控板卡接收到其他板卡的异常上报信息后将会做出统一处理。
进一步的,所述步骤S5中各板卡上的微控制模块通过电压检测模块定时查询本板的电压值,定时时间为2秒。
进一步的,所述步骤S6中风扇板卡定时监控风扇转速,定时时间为30秒,风扇板卡获取到风扇转速为0时候,则认为风扇异常。
本发明实施例提供的分布式机箱的管理方法,统将机箱内部分布在不同位置的板卡当作一个节点,对机箱进行综合监控管理,具体具有以下有益效果:
1、根据每个节点的温度信息,进行综合分析来确定风扇转速。一定程度上降低了因散热异常而发生事故的风险。
2、机箱内部设置了多处温度采集点,全面分析机箱内部散热状态。
3.使用CAN总线将机箱内所有板卡连接在一起,对机箱进行综合监控管理,最大限度的避免系统崩溃、硬件烧坏等事故的发生。
4.设置日志记录功能,当发生故障后能很快定位到发生故障的原因。
对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
图6示意性示出了本发明实施例的分布式机箱的管理装置的结构框图。所述控制装置可采用微控制模块实现。在一个具体实施例中可利用主控板卡原本就有的微控制模块实现。参照图6,本发明实施例的分布式机箱的管理装置具体包括温度管理单元201和状态监测单元202,其中:
温度管理单元201,用于获取部署在机箱各个板卡的温度采集点的温度值,根据采集到的各个温度值确定风扇转速参数;
所述温度管理单元201,还用于根据所述风扇转速参数生成控制命令,并将所述控制命令发送到机箱内风扇所属的风扇板卡,以供所述风扇板卡根据所述控制命令控制风扇转速并监控所述风扇转速;
状态监测单元202,用于当风扇转速异常时,接收风扇板卡上报的转速异常信息,并将所述转速异常信息作为日志记录进行保存。
本发明实施例中,所述状态监测单元202,还用于接收部署在机箱内的各个板卡上报的电压异常信息,并将所述电压异常信息作为日志记录进行保存,其中,部署在机箱内的各个板卡监控自身的电压状态。
所述的温度管理单元201,具体用于提取获取的温度值中的最高温度值,根据所述最高温度值查找预设第一映射关系,以获取最高温度值对应的风扇转速参数。所述第一映射关系中包括有温度值与风扇转速参数之间的对应关系。
本实施例中,所述温度管理单元201主要包括各节点温度采集和风扇转速控制两部分,实现过程:每一个板卡上的微控制模块定时查询本板上温度传感器数值,主控板卡上的微控制模块通过CAN总线定时获取多个业务板卡、电源板卡和风扇板卡上的温度数值。主控板卡通过分析各个节点的温度数值,确定风扇转速参数,并通过CAN总线将命令发送至风扇板卡,风扇板卡接收到命令后对风扇速度进行设置,从而实现风扇调速控制。
所述状态监控单元202主要包括电压监控和风扇转速监控两部分,电压监控指各板卡上的微控制模块通过电压检测模块定时查询本板的电压值,并对采集到的数值进行分析对比,判断电压是否异常。风扇转速监控指风扇板卡定时监控风扇转速是否正常。当某个板卡电压异常或风扇转速异常时,能够通过 CAN总线将异常信息上报至主控板卡,并将异常信息作为日志记录到本板存储模块,如Flash芯片中。主控板卡接收到其他板卡的异常上报信息后将会做出统一处理。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
此外,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述分布式机箱的管理方法的步骤。
本实施例中,所述分布式机箱的管理装置集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
本发明实施例还提供了一种的电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述各个分布式机箱的管理方法实施例中的步骤,例如图5所示各个步骤。或者,所述处理器执行所述计算机程序时实现上述各分布式机箱的管理装置实施例中各模块/单元的功能,例如图6所示的各个模块。
示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述分布式机箱的管理装置中的执行过程。例如,所述计算机程序可以被分割成温度管理单元201和状态监测单元202。
所述电子设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述电子设备可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,本发明提供的电子设备,还可以包括更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述设备还可以包括输入输出设备、网络接入设备、总线等。
所述处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列 (Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述设备的控制中心,利用各种接口和线路连接整个设备的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述设备的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(FlashCard)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
在本发明实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性或其它的形式。
本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (7)

1.一种分布式机箱的管理方法,其特征在于,分布式机箱包括置于机箱内部的主控板卡、电源板卡、风扇板卡和至少一个业务板卡;
所述至少一个业务板卡上设置有多个业务芯片,用于实现机箱的业务功能;
所述风扇板卡,用于驱动机箱内风扇,进行散热;
所述电源板卡,用于为机箱内其他板卡进行供电;
所述主控板卡、电源板卡、风扇板卡和各个业务板卡上均设置有微控制模块、CAN模块、电压检测模块和多个温度传感器;
各个板卡上的温度传感器均匀布设在对应板卡上,分别连接到对应板卡的微控制模块,用于采集各板卡上预设温度采集点的温度值;
主控板卡上的CAN模块用于和其他板卡上的CAN模块进行信息交互;
所述主控板卡分别与所述电源板卡、风扇板卡和各个业务板卡连接,以获取所述电源板卡、风扇板卡和各个业务板卡的温度采集点的温度值,并根据获取的温度值和主控板卡自身温度采集点的温度值控制风扇板卡;所述主控板卡、电源板卡、风扇板卡和各个业务板卡上的电压检测模块分别用于采集各板卡的工作电压,所述电源板卡、风扇板卡和各个业务板卡定时将各自采集的工作电压上报所述主控板卡;
所述分布式机箱的管理方法包括:
获取部署在机箱各个板卡上的温度采集点的温度值,根据采集到的各个温度值确定风扇转速参数;
所述根据采集到的各个温度值确定风扇转速参数包括:提取获取的温度值中的最高温度值,根据所述最高温度值查找预设第一映射关系,以获取最高温度值对应的风扇转速参数;所述第一映射关系中包括有温度值与风扇转速参数之间的对应关系;
根据所述风扇转速参数生成控制命令,并将所述控制命令发送到机箱内风扇所属的风扇板卡,以供所述风扇板卡根据所述控制命令控制风扇转速并监控所述风扇转速;
当风扇转速异常时,接收风扇板卡上报的转速异常信息,并将所述转速异常信息作为日志记录进行保存;
接收部署在机箱内的各个板卡上报的电压异常信息,并将所述电压异常信息作为日志记录进行保存,其中,部署在机箱内的各个板卡监控自身的电压状态。
2.根据权利要求1所述的分布式机箱的管理方法,其特征在于,所述主控板卡、电源板卡、风扇板卡和各个业务板卡上均设置有用于记录异常日志的存储模块。
3.根据权利要求1-2任一项所述的分布式机箱的管理方法,其特征在于,所述风扇板卡还包括风扇驱动模块,所述风扇驱动模块用于根据所述主控板卡的控制命令驱动机箱内风扇。
4.根据权利要求1所述的分布式机箱的管理方法,其特征在于,所述主控板卡通过CAN总线分别与所述电源板卡、风扇板卡和各个业务板卡连接。
5.一种分布式机箱的管理装置,其特征在于,分布式机箱包括置于机箱内部的主控板卡、电源板卡、风扇板卡和至少一个业务板卡;
所述至少一个业务板卡上设置有多个业务芯片,用于实现机箱的业务功能;
所述风扇板卡,用于驱动机箱内风扇,进行散热;
所述电源板卡,用于为机箱内其他板卡进行供电;
所述主控板卡、电源板卡、风扇板卡和各个业务板卡上均设置有微控制模块、CAN模块、电压检测模块和多个温度传感器;
各个板卡上的温度传感器均匀布设在对应板卡上,分别连接到对应板卡的微控制模块,用于采集各板卡上预设温度采集点的温度值;
主控板卡上的CAN模块用于和其他板卡上的CAN模块进行信息交互;
所述主控板卡分别与所述电源板卡、风扇板卡和各个业务板卡连接,以获取所述电源板卡、风扇板卡和各个业务板卡的温度采集点的温度值,并根据获取的温度值和主控板卡自身温度采集点的温度值控制风扇板卡;所述主控板卡、电源板卡、风扇板卡和各个业务板卡上的电压检测模块分别用于采集各板卡的工作电压,所述电源板卡、风扇板卡和各个业务板卡定时将各自采集的工作电压上报所述主控板卡;
所述分布式机箱的管理装置包括:
温度管理单元,用于获取部署在机箱各个板卡上的温度采集点的温度值,根据采集到的各个温度值确定风扇转速参数;
所述的温度管理单元,具体用于提取获取的温度值中的最高温度值,根据所述最高温度值查找预设第一映射关系,以获取最高温度值对应的风扇转速参数;所述第一映射关系中包括有温度值与风扇转速参数之间的对应关系;
所述温度管理单元,还用于根据所述风扇转速参数生成控制命令,并将所述控制命令发送到机箱内风扇所属的风扇板卡,以供所述风扇板卡根据所述控制命令控制风扇转速并监控所述风扇转速;
状态监测单元,用于当风扇转速异常时,接收风扇板卡上报的转速异常信息,并将所述转速异常信息作为日志记录进行保存;
所述状态监测单元,还用于接收部署在机箱内的各个板卡上报的电压异常信息,并将所述电压异常信息作为日志记录进行保存,其中,部署在机箱内的各个板卡监控自身的电压状态。
6.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-4中任一项所述方法的步骤。
7.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-4中任一项所述方法的步骤。
CN201811489935.5A 2018-12-06 2018-12-06 分布式机箱、分布式机箱的管理方法及装置 Active CN109388210B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811489935.5A CN109388210B (zh) 2018-12-06 2018-12-06 分布式机箱、分布式机箱的管理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811489935.5A CN109388210B (zh) 2018-12-06 2018-12-06 分布式机箱、分布式机箱的管理方法及装置

Publications (2)

Publication Number Publication Date
CN109388210A CN109388210A (zh) 2019-02-26
CN109388210B true CN109388210B (zh) 2024-03-29

Family

ID=65429183

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811489935.5A Active CN109388210B (zh) 2018-12-06 2018-12-06 分布式机箱、分布式机箱的管理方法及装置

Country Status (1)

Country Link
CN (1) CN109388210B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111918518B (zh) * 2019-05-07 2022-04-05 杭州海康威视数字技术股份有限公司 一种温度控制方法、装置及机框式设备
CN110865923A (zh) * 2019-11-26 2020-03-06 国网江苏省电力有限公司南通供电分公司 一种分布式机箱、分布式机箱的管理方法
CN111400158A (zh) * 2020-03-31 2020-07-10 新华三信息安全技术有限公司 一种信息收集方法和装置
CN112905425A (zh) * 2021-03-31 2021-06-04 国家广播电视总局监管中心 一种监控板卡
CN113419443B (zh) * 2021-04-23 2022-08-19 山东英信计算机技术有限公司 一种风扇板的控制方法、系统、设备以及介质
CN113719463A (zh) * 2021-07-20 2021-11-30 深圳市风云实业有限公司 一种机架设备的散热系统及其异常识别方法
CN113625624A (zh) * 2021-07-29 2021-11-09 南京长峰航天电子科技有限公司 一种通用基板管理控制系统及控制方法
CN113518547A (zh) * 2021-08-26 2021-10-19 中科长城海洋信息系统有限公司长沙分公司 一种负载板卡液冷散热系统及方法
CN115167569B (zh) * 2022-09-07 2023-01-03 中国电子科技集团公司第十五研究所 一种应用于vpx设备的冷却工质流速调节系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103995758A (zh) * 2014-05-21 2014-08-20 浪潮电子信息产业股份有限公司 一种主板故障信息的延时显示方法
CN104699589A (zh) * 2013-12-09 2015-06-10 鸿富锦精密工业(深圳)有限公司 风扇错误侦测系统及方法
CN105975029A (zh) * 2016-06-13 2016-09-28 天津欧迈通信技术有限公司 分布式温度控制的机箱散热系统
CN106896884A (zh) * 2017-02-28 2017-06-27 深圳市风云实业有限公司 Atca架构设备散热管理方法及装置
CN108803435A (zh) * 2018-07-13 2018-11-13 北京计算机技术及应用研究所 一种基于国产化微控制器的vpx板卡的通用智能管理装置
CN209028540U (zh) * 2018-12-06 2019-06-25 京信通信系统(中国)有限公司 分布式机箱

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104699589A (zh) * 2013-12-09 2015-06-10 鸿富锦精密工业(深圳)有限公司 风扇错误侦测系统及方法
CN103995758A (zh) * 2014-05-21 2014-08-20 浪潮电子信息产业股份有限公司 一种主板故障信息的延时显示方法
CN105975029A (zh) * 2016-06-13 2016-09-28 天津欧迈通信技术有限公司 分布式温度控制的机箱散热系统
CN106896884A (zh) * 2017-02-28 2017-06-27 深圳市风云实业有限公司 Atca架构设备散热管理方法及装置
CN108803435A (zh) * 2018-07-13 2018-11-13 北京计算机技术及应用研究所 一种基于国产化微控制器的vpx板卡的通用智能管理装置
CN209028540U (zh) * 2018-12-06 2019-06-25 京信通信系统(中国)有限公司 分布式机箱

Also Published As

Publication number Publication date
CN109388210A (zh) 2019-02-26

Similar Documents

Publication Publication Date Title
CN109388210B (zh) 分布式机箱、分布式机箱的管理方法及装置
CN107870845B (zh) 面向微服务架构应用的管理方法及系统
US7925911B2 (en) Managing computer power among a plurality of computers
US7069349B2 (en) IPMI dual-domain controller
US20170139797A1 (en) System for monitoring a to-be-monitored unit of a rack
EP2472402B1 (en) Remote management systems and methods for mapping operating system and management controller located in a server
US8560688B2 (en) Monitoring sensors for systems management
CN111131936B (zh) 一种光模块的监控方法、监控装置、交换机及存储介质
US8907609B2 (en) Electronic device and method for monitoring fan
US10860071B2 (en) Thermal excursion detection in datacenter components
US10296431B2 (en) Generation of debugging log list in a blade server environment
CN103853678A (zh) 板卡管理装置及使用其的板卡管理系统和控制卡
CN104298583A (zh) 基于基板管理控制器的主板管理系统及方法
CN110985427A (zh) 一种模块化风扇电路及控制方法
CN103678087A (zh) 服务器风扇状态监控方法及系统
CN103809680A (zh) 电脑系统
CN110069371B (zh) 一种识别固态硬盘性能的方法及固态硬盘
CN113487182B (zh) 设备健康状态评估方法、装置、计算机设备和介质
CN110532150B (zh) 一种机箱管理方法、装置、存储介质及处理器
CN210038709U (zh) 一种电源监控管理扣板
CN109783286B (zh) 机内测试方法、测试装置、及终端设备和存储介质
CN102541705A (zh) 计算机的测试方法和工装板
US11537501B2 (en) Method and device for monitoring server based on recordings of data from sensors, and non-transitory storage medium
CN112486785B (zh) 一种服务器定位宕机阶段的方法、系统、终端及存储介质
CN115509978A (zh) 一种外插设备物理位置确定方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20200201

Address after: 510663 Guangzhou Science City, Guangdong Shenzhou Road, No. 10

Applicant after: COMBA TELECOM SYSTEMS (CHINA) Ltd.

Address before: 510663 Shenzhou Road 10, Guangzhou Science City, Guangdong, Guangzhou

Applicant before: COMBA TELECOM SYSTEMS (CHINA) Ltd.

Applicant before: COMBA TELECOM SYSTEMS (GUANGZHOU) Ltd.

Applicant before: COMBA TELECOM TECHNOLOGY (GUANGZHOU) Ltd.

Applicant before: TIANJIN COMBA TELECOM SYSTEMS Ltd.

CB02 Change of applicant information
CB02 Change of applicant information

Address after: 510663 Shenzhou Road 10, Science City, Guangdong, Guangzhou

Applicant after: Jingxin Network System Co.,Ltd.

Address before: 510663 Shenzhou Road 10, Science City, Guangdong, Guangzhou

Applicant before: COMBA TELECOM SYSTEMS (CHINA) Ltd.

GR01 Patent grant
GR01 Patent grant