CN115562942A - 服务器背板系统及服务器运行控制方法 - Google Patents
服务器背板系统及服务器运行控制方法 Download PDFInfo
- Publication number
- CN115562942A CN115562942A CN202211262202.4A CN202211262202A CN115562942A CN 115562942 A CN115562942 A CN 115562942A CN 202211262202 A CN202211262202 A CN 202211262202A CN 115562942 A CN115562942 A CN 115562942A
- Authority
- CN
- China
- Prior art keywords
- equipment
- programmable logic
- management controller
- server
- logic device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 239000000758 substrate Substances 0.000 claims abstract description 33
- 239000000872 buffer Substances 0.000 claims description 33
- 230000002159 abnormal effect Effects 0.000 claims description 31
- 238000004891 communication Methods 0.000 claims description 19
- 230000001960 triggered effect Effects 0.000 claims description 6
- 238000012544 monitoring process Methods 0.000 claims description 5
- 238000007726 management method Methods 0.000 description 63
- 230000005540 biological transmission Effects 0.000 description 20
- 230000006870 function Effects 0.000 description 13
- 238000012545 processing Methods 0.000 description 12
- 238000004590 computer program Methods 0.000 description 5
- 238000013461 design Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000005856 abnormality Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000013021 overheating Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 238000004377 microelectronic Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000013024 troubleshooting Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3089—Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
- G06F11/3093—Configuration details thereof, e.g. installation, enabling, spatial arrangement of the probes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3055—Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3089—Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
- G06F11/3096—Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents wherein the means or processing minimize the use of computing system or of computing system component resources, e.g. non-intrusive monitoring which minimizes the probe effect: sniffing, intercepting, indirectly deriving the monitored data from other directly available data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/14—Handling requests for interconnection or transfer
- G06F13/36—Handling requests for interconnection or transfer for access to common bus or bus system
- G06F13/362—Handling requests for interconnection or transfer for access to common bus or bus system with centralised access control
- G06F13/366—Handling requests for interconnection or transfer for access to common bus or bus system with centralised access control using a centralised polling arbiter
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Computing Systems (AREA)
- Programmable Controllers (AREA)
Abstract
本申请公开了一种服务器背板系统及服务器运行控制方法,包括基板管理控制器、可编程逻辑器件、背板设备及传感器设备;可编程逻辑器件一端与背板设备及传感器设备连接,另一端与基板管理控制器连接;可编程逻辑器件在上电加载完成情况下通过串行总线轮询背板设备及传感器设备并读取设备参数;可编程逻辑器件在设备参数读取完毕情况下通过串行总线将设备参数上报给基板管理控制器,由此本申请中以可编程逻辑器件作为系统的主控制器连接背板设备及传感器设备,由于可编程逻辑器件具备可编辑特点,因此无需使用拓展芯片即可实现总线拓展,由此可降低硬件结构复杂度,减轻基板管理控制器数据处理压力,并提高服务器运行稳定性。
Description
技术领域
本申请涉及计算机技术领域,具体而言,涉及一种服务器背板系统及服务器运行控制方法。
背景技术
在服务器设计方案中背板、风扇板及其他子卡通常负责连接硬盘、风扇等外围设备。服务器运行过程中这些设备的温度、运行状态、类型等参数信息需要上报给基板管理控制器进行监控,或者显示在可视化界面上供使用者参考,服务器运行过程中基板管理控制器能否与这些设备保持稳定的通信决定了服务器的可使用性和稳定性。
在服务器的现有架构中,基板管理控制器通常作为一个主控制器,而服务器中的其他设备作为从控制器挂载在串行总线下,例如I2C总线,设备信息及设备状态、类型等参数信息由基板管理控制器通过I2C总线轮询获得。
现有技术方案中,由于基板管理控制器的串行总线的接口数量有线,因此通常在硬件设计上会使用接口扩展芯片,例如以i2c switch芯片来实现I2C总线拓展为代表进行说明。
现有技术方案中,每一个i2c switch都需要单独的供电和复位线路,因此会造成硬件线路复杂,进而提高电路设计难度并增加生产成本,且常用的i2c switch芯片可拓展至2路、4路和8路,而背板上I2C总线下挂载的设备数量不定,因此经常出现I2C接口浪费的情况且设备可拓展性也受到限制,另外当某一个设备出现问题可能导致I2C总线挂死,甚至影响到基板管理控制器正常工作,造成整个服务器运行出现问题。
发明内容
本申请提供一种服务器背板系统及服务器运行控制方法,用于解决现有技术方案中采用基板管理控制器通常作为一个主控制器,而服务器中的其他设备作为从控制器挂载在串行总线下,且通过使用接口扩展芯片芯片来实现基板管理控制器的串行总线拓展,进而导致会出现以上的技术问题的技术缺陷。
本申请提供一种服务器背板系统,包括基板管理控制器、可编程逻辑器件、背板设备及用于监测设备温度的传感器设备;
所述可编程逻辑器件的一端通过串行总线与所述背板设备及所述传感器设备连接,所述可编程逻辑器件的另一端通过所述串行总线与所述基板管理控制器连接;
所述可编程逻辑器件在上电加载完成的情况下通过所述串行总线轮询所述背板设备及所述传感器设备,并读取设备参数;
所述可编程逻辑器件在设备参数读取完毕的情况下通过所述串行总线将所述设备参数上报给所述基板管理控制器。
根据本申请提供的服务器背板系统,所述可编程逻辑器件内部设有缓存器,所述缓存器用于缓存所述可编程逻辑器件在轮询所述背板设备及所述传感器设备的情况下读取的设备参数。
根据本申请提供的服务器背板系统,所述基板管理控制器通过所述串行总线与所述缓存器连接;
所述基板管理控制器用于在从所述缓存器中读取所述设备参数后清除所述设备参数。
根据本申请提供的服务器背板系统,所述可编程逻辑器件还用于在监测到存在异常的目标设备或者所述目标设备的串行链路存在异常的情况下发送复位信号至所述目标设备,并将相应的异常记录上报给所述基板管理控制器。
根据本申请提供的服务器背板系统,所述可编程逻辑器件还包括模拟串行链路,所述模拟串行链路用于实现串行总线拓展。
根据本申请提供的服务器背板系统,所述模拟串行链路连接硬盘设备,所述模拟串行链路用于实现所述硬盘设备与所述基板管理控制器之间的通信。
本申请还提供一种应用于以上所述的服务器背板系统的服务器运行控制方法,包括:
在上电加载完成的情况下,轮询所述背板设备及所述传感器设备,并读取设备参数;
将所述设备参数缓存至所述缓存器中,并发送相应的通知信号至所述基板管理控制器,以通知所述基板管理控制器基于所述缓存器中缓存的设备参数进行服务器状态监控。
根据本申请提供的服务器运行控制方法,所述轮询所述背板设备及所述传感器设备之后,还包括:
在监测到存在异常的目标设备或者所述目标设备的串行链路存在异常的情况下,发送复位信号至所述目标设备;
生成所述目标设备相应的异常记录,并将所述异常记录上报给所述基板管理控制器。
根据本申请提供的服务器运行控制方法,所述在上电加载完成的情况下,轮询所述背板设备及所述传感器设备之前,还包括:
在监测到串行总线拓展需求的情况下,基于用户设定的可编程逻辑代码生成模拟串行链路,并基于所述模拟串行链路连接待扩展的功能设备。
根据本申请提供的服务器运行控制方法,所述发送相应的通知信号至所述基板管理控制器之后,还包括:
在监测到所述基板管理控制器触发的读事件的情况下,在所述读事件执行完毕后清除所述读事件对应的设备参数数据;或者,
在监测到所述基板管理控制器触发的写事件的情况下,在所述写事件执行完毕后判断是否接收到数据清除信号,并在接收到数据清除信号后清除所述写事件对应的设备参数数据。
本申请提供的服务器背板系统及服务器运行控制方法,包括基板管理控制器、可编程逻辑器件、背板设备及传感器设备;可编程逻辑器件的一端与背板设备及传感器设备连接,另一端与基板管理控制器连接;可编程逻辑器件在上电加载完成的情况下通过串行总线轮询背板设备及传感器设备,并读取设备参数;可编程逻辑器件在设备参数读取完毕的情况下通过串行总线将设备参数上报给基板管理控制器,由此本申请中以可编程逻辑器件作为系统的主控制器连接背板设备及传感器设备,由于可编程逻辑器件具备可编辑特点,因此无需使用拓展芯片即可实现串行总线拓展,由此可降低硬件结构复杂度,减轻基板管理控制器数据处理压力,并提高服务器运行稳定性。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请提供的服务器背板系统的拓扑结构示意图;
图2是本申请提供的服务器运行控制方法的流程示意图;
图3为本申请提供的电子设备的结构示意图。
附图标记:
110:基板管理控制器;120:可编程逻辑器件;1201:缓存器;130:背板设备;140:传感器设备;150:硬盘设备。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
图1是本申请提供的服务器背板系统的拓扑结构示意图,如图1所示,该服务器背板系统包括基板管理控制器110、可编程逻辑器件120、背板设备130及用于监测设备温度的传感器设备140。
其中,基板管理控制器110(BMC,Baseboard Management Controller)可在本地和远程对服务器的运行状态进行管理,支持可视化控制台界面,可轻松对服务器进行硬件管理和故障排除。
可编程逻辑器件120指代用户根据自己的需要,定义其逻辑功能的器件,例如:现场可编程门阵列和复杂可编程逻辑器件等。
优先地,本实施例中采用复杂可编程逻辑器件(Complex Programmable logicdevice,CPLD),其主成由逻辑块、可编程互联通道和I/O(输入/输出)块三部分构成。
进一步地需要说明的是,逻辑块也即逻辑阵列模块,复杂可编程逻辑器件包括若干个逻辑块,每一个逻辑块相当于一个单独的可编程逻辑器件单元,其含有4~20个左右的宏单元,该宏单元具备扩展项,提供可操控的乘积项分配和扩展。
逻辑块之间的互联称为可编程互联通道,其是实现复杂可编程逻辑器件灵活可编程的关键,其主要提供逻辑块、宏单元、输入/输出引脚间的互连网络。
输入/输出块则提供内部逻辑到器件输入/输出引脚之间的接口。
具体地,本实施例中的传感器设备140主要包括温度传感器及电流传感器。
传感器设备140可监测的设备包括但不限于背板设备130、中央处理器CPU、内存、硬盘等温度过高会影响其正常运行的设备,本实施对此不作限制。
本实施例中,可直接部署温度传感器来直接采集系统中各设备的温度,还可以通过部署电流传感器采集系统中各设备的电流,由此间接采集各设备的温度,当设备有较大的电流经过时,且在服务器长时间运行过程中,设备的热量会不断累积,进而会导致设备表面温度过高而影响设备正常运行。
本实施例中,由于可编程逻辑器件120具备可编辑特点,因此将可编程逻辑器件120作为系统的主控制器连接背板设备130及传感器设备140,来轮询获取各设备的设备参数。
具体地,所述可编程逻辑器件120的一端通过串行总线与所述背板设备130及所述传感器设备140连接,所述可编程逻辑器件120的另一端通过所述串行总线与所述基板管理控制器110连接。
其中,本实施例中的串行总线指代用于实现串行通信的通信总线,在实际应用中,虽然串行通信速率低,但在数据通信吞吐量不是很大的微处理电路中则显得更加简易、方便、灵活,因此采用串行总线实现系统内部各处理器的通信连接。
可选地,本实施例中的串行总线包括但不限于I2C总线、SPI总线、RS232总线、UART总线、USB总线等。
优先地,本实施例中的串行总线为I2C总线,I2C总线是近年来在微电子通信控制领域广泛采用的一种新型总线标准。它是同步通信的一种特殊形式,具有接口线少,控制方式简化,器件封装形式小,通信速率较高等优点,在主从通信中,可以有多个I2C总线器件同时接到I2C总线上,通过地址来识别通信对象。本实施例中在此以I2C总线为代表进行解释说明,也即可编程逻辑器件120的一端的I/O引脚通过I2C总线与所述背板设备130的通信接口及所述传感器设备140的通信接口连接,所述背板设备130及所述传感器设备140的设备参数通过I2C总线输入至可编程逻辑器件120,依次经过可编程逻辑器件120的逻辑块、可编程互联通道及逻辑块之后,经由另一端的I/O引脚及I2C总线将设备参数传递给基板管理控制器110。
在实际应用中,所述可编程逻辑器件120在上电加载完成的情况下通过所述I2C总线轮询所述背板设备130及所述传感器设备140,并读取设备参数,所述可编程逻辑器件120在设备参数读取完毕的情况下通过所述I2C总线将所述设备参数上报给所述基板管理控制器110。
其中,设备参数主要包括设备的运行状态参数,例如硬件温度、内存使用率、CPU使用率、磁盘使用率等。
由于可编程逻辑器件120具备高速度的特点,可编程逻辑器件120上电加载速度很快,通常可以达到毫秒级,因此在服务器上电初期就可以监控设备状态并及早发现异常。
背板设备130连接系统的所有硬盘,其可靠性运行对于数据业务的稳定起着关键的作用,当背板设备130在运行使用中,若背板设备130出现供电电流过流、局部区域过热等故障时,会存在烧板、数据丢失等事件,对系统的整体稳定性运行会产生较大的弊端,因此本实施中,将背板设备130及传感器设备140作为从控制器挂载在可编程逻辑器件120的I2C总线下,进而可依靠可编程逻辑器件120的轮询实时监控背板设备130的设备温度、硬盘设备状态、数据资产信息等。
本申请实施例提供的服务器背板系统,包括基板管理控制器、可编程逻辑器件、背板设备及传感器设备;可编程逻辑器件的一端与背板设备及传感器设备连接,另一端与基板管理控制器连接;可编程逻辑器件在上电加载完成的情况下通过I2C总线轮询背板设备及传感器设备,并读取设备参数;可编程逻辑器件在设备参数读取完毕的情况下通过I2C总线将设备参数上报给基板管理控制器,由此本申请中以可编程逻辑器件作为系统的主控制器连接背板设备及传感器设备,由于可编程逻辑器件具备可编辑特点,因此无需使用拓展芯片即可实现I2C总线拓展,由此可降低硬件结构复杂度,减轻基板管理控制器数据处理压力,并提高服务器运行稳定性。
基于上述任一实施例,所述可编程逻辑器件120内部设有缓存器1201,所述缓存器1201用于缓存所述可编程逻辑器件120在轮询所述背板设备130及所述传感器设备140的情况下读取的设备参数。
本实施例中,在设备参数获取阶段上,由于可编程逻辑器件120作为系统的主控制器,负责轮询背板设备130及传感器设备140来读取设备参数,在设备参数的处理阶段上,可编程逻辑器件120又作为系统的从控制器,负责将设备参数汇报给作为主控制器角色的基板管理控制器110,由此可编程逻辑器件120仅负责获取设备参数,基板管理控制器110仅负责处理设备参数,因此即可加快服务器运行控制流程速度,又可以保障在服务器中的某一个设备出现问题导致I2C总线挂死,避免影响基板管理控制器110正常工作,进而造成整个服务器运行出现问题。
因此为了实现以上功能,优选地,在可编程逻辑器件120内部建立缓存器1201为FIFO缓存器(First Input First Output,先入先出队列),也即当FIFO缓存器在某一时间段来不及响应所有的指令时,指令会被安排在先入先出队列中,当FIFO缓存器完成当前指令以后,就会从先入先出队列中选取出第一次序进入队列排名第一的指令先执行,接着执行完毕后继续从先入先出队列中就行取出当前排名第一的指令…以此类推,直至执行完毕。
由此FIFO缓存器也基于先入先出的原则依次将可编程逻辑器件120读取到的设备参数进行缓存,在接收到基板管理控制器110的数据读取指令的情况下,按顺序依次将缓存的各设备参数传输给基板管理控制器110,由此保障数据的有序处理,进而提高服务器运行稳定性。
进一步地,本实施例中,FIFO缓存器可缓存的数据数量可基于实际情况灵活设置,对此不作限制。
基于上述任一实施例,所述基板管理控制器110通过所述I2C总线与所述缓存器1201连接;所述基板管理控制器110用于在从所述缓存器1201中读取所述设备参数后清除所述设备参数。
容易理解地,由于缓存器1201的缓存容量有限,因此为了保障缓存器1201内部可以一直缓存实时读取的设备参数,本实施例中定时清除缓存器1201内部缓存的历史设备参数。
优选地,基板管理控制器110在从缓存器1201中读取数据后,可对读取到的数据进行分析,当分析出当前读取的数据为重要数据的情况下,则不触发删除请求,当读取的数据为非重要数据的情况下在,饿立即触发删除请求将缓存的数据清除,由此减少可编程逻辑器件120的缓存器1201为缓存数据所占用的资源。
进一步地,在另一实施例中,由于设备参数是源源不断地缓存至缓存器1201中,也即需要缓存的数据量较大,由此为了保障缓存器1201中可以及时缓存所有的数据,当接收到基板管理控制器110发送的读请求的情况下,响应读请求,并在监测到读请求执行完毕后立即清除该读请求对应的数据,基板管理控制器110在读取该数据后,当解析出该数据为重要数据,则可向基本管理控制器110发送携带该数据的写请求,以将该数据继续暂时写入至缓存器1201中,基板管控控制器110在接收到基板管理控制器110发送的该数据对应的删除指令的情况下,再删除该数据。
基于上述任一实施例,所述可编程逻辑器件120还用于在监测到存在异常的目标设备或者所述目标设备的串行链路存在异常的情况下发送复位信号至所述目标设备,并将相应的异常记录上报给所述基板管理控制器110。
其中,目标设备异常指代可编程逻辑器件120检测不到该设备相应的设备参数,或者可编程逻辑器件120监测到该设备未正常启动运行。
其中,串行链路指代信息的各位数据被逐位按顺序传送的线路,本实施例中以I2C链路为代表进行说明。
I2C链路存在异常则指代该I2C链路中的SCL信号长时间为低电平,也即该目标设备的设备参数传输存在异常状况。
需要说明的是,I2C是一种两线式串行总线,包括数据线SDA和时钟信号线SCL,通过两者不同的相位组合表示不同的帧,起始帧、地址数据帧、结束帧构成一次I2C传输。其可连接各种温度、电压、电流等类型的传感器,还可以用来连接内存条上,用来获取内存条的信息。
正常数据传输场景下,当SCL电平为高时,SDA的下降则表示一次I2C传输的开始,SDA的上升则表示一次I2C传输的结束。在SCL每个时钟周期的高电平时,按序采样SDA的值,依次得到B1/B2..../B3,作为链路上传输的原始数据。
由此可知,当I2C链路中的SCL信号长时间为低电平,则表征该I2C链路中传输的数据缺失时钟信号,也即该I2C链路对应的目标设备的数据无效。
由此为了保障服务器运行稳定性,在监测到存在异常的目标设备或者目标设备的I2C链路存在异常的情况下,立刻发送复位信号至目标设备,以重置该设备,并将此次监测到的异常记录上报给基板管理控制器110,以通知基板管理控制器110及时做应急处理。
基于上述任一实施例,所述可编程逻辑器件120还包括模拟串行链路,所述模拟串行链路用于实现串行总线拓展。
具体地,模拟串行链路指代基于接口扩展芯片的数据传输功能所模拟出的数据传输线路,例如根据i2c switch芯片的数据传输功能模生成模拟2C链路。
本实施例中,由于可编程逻辑器件120可根据用户根据自己的需要定义其逻辑功能,因此本实施例中,为了避免使用i2c switch芯片造成硬件线路复杂,提高电路设计难度并增加生产成本,采用根据i2cswitch芯片的数据传输功能编辑可编程逻辑器件120的逻辑块及可编程互联通道对应的逻辑代码,由此生成模拟2C链路,进而在不改变硬件线路的情况下实现I2C总线拓展。
具体地,逻辑块也即逻辑阵列模块,复杂可编程逻辑器件包括若干个逻辑块,每一个逻辑块相当于一个单独的可编程逻辑器件单元,其含有4~20个左右的宏单元,该宏单元具备扩展项,提供可操控的乘积项分配和扩展,逻辑块之间的互联称为可编程互联通道,其是实现复杂可编程逻辑器件灵活可编程的关键,其主要提供逻辑块、宏单元、输入/输出引脚间的互连网络,因此本实施例中根据i2c switch芯片的数据传输功能对宏单元和可编程互联通道进行编辑。由此实现在不改变硬线线路的情况下进行I2C总线拓展。
基于上述任一实施例,所述模拟串行链路连接硬盘设备150,所述模拟串行链路用于实现所述硬盘设备150与所述基板管理控制器110之间的通信。
进一步地,在另一实施例中,若需要增加串行总线下挂载的设备数量,则对可编程逻辑器件120的逻辑代码进行相应的调整,再将需要新增的设备使用串行接口连接至可编程逻辑器件120的调整后的输入/输出块端即可。
基于上述任一实施例,图2是本申请提供的应用于服务器背板系统的服务器运行控制方法的流程示意图,如图2所示,该方法应用于上述实施例中的服务器背板系统,包括步骤210和步骤220。
步骤210,在上电加载完成的情况下,轮询所述背板设备及所述传感器设备,并读取设备参数;
该步骤中,在设备参数获取阶段,由于可编程逻辑器件具备高速度的特点,可编程逻辑器件上电加载速度很快,通常可以达到毫秒级,因此将可编程逻辑器件作为此阶段的主控制器,通过轮询获取各设备参数,由此在服务器上电初期就可以监控设备状态并及早发现异常。
其中,设备参数主要包括设备的运行状态参数,例如硬件温度、内存使用率、CPU使用率、磁盘使用率等。
背板设备连接系统的所有硬盘,其可靠性运行对于数据业务的稳定起着关键的作用,当背板设备在运行使用中,若背板设备出现供电电流过流、局部区域过热等故障时,会存在烧板、数据丢失等事件,对系统的整体稳定性运行会产生较大的弊端,因此该步骤中,将背板设备及传感器设备作为从控制器挂载在可编程逻辑器件的串行总线下,进而可依靠可编程逻辑器件的轮询实时监控背板设备的设备温度、硬盘设备状态、数据资产信息等。
步骤220,将所述设备参数缓存至所述缓存器中,并发送相应的通知信号至所述基板管理控制器,以通知所述基板管理控制器基于所述缓存器中缓存的设备参数进行服务器状态监控。
在设备参数获取阶段上,由于可编程逻辑器件作为系统的主控制器,负责轮询背板设备及传感器设备来读取设备参数,在设备参数的处理阶段上,可编程逻辑器件又作为系统的从控制器,负责将设备参数汇报给作为主控制器角色的基板管理控制器,由此可编程逻辑器件仅负责获取设备参数,基板管理控制器仅负责处理设备参数,因此即可加快服务器运行控制流程速度,又可以保障在服务器中的某一个设备出现问题导致串行总线挂死,避免影响基板管理控制器正常工作,进而造成整个服务器运行出现问题。
因此为了实现以上功能,将设备参数缓存至缓存器中,优选地,采用FIFO缓存器。由此FIFO缓存器也基于先入先出的原则依次将可编程逻辑器件读取到的设备参数进行缓存,在接收到基板管理控制器的数据读取指令的情况下,按顺序依次将缓存的各设备参数传输给基板管理控制器,由此保障数据的有序处理,进而提高服务器运行稳定性。
本申请实施例提供的服务器运行控制方法,在设备参数获取阶段以可编程逻辑器件作为系统的主控制器读取设备参数,在设备参数的处理阶段上,可编程逻辑器件又作为系统的从控制器,负责将设备参数汇报给作为主控制器角色的基板管理控制器,由此可编程逻辑器件仅负责获取设备参数,基板管理控制器仅负责处理设备参数,因此即可加快服务器运行控制流程速度,又可以保障在服务器中的某一个设备出现问题导致串行总线挂死,避免影响基板管理控制器正常工作,进而造成整个服务器运行出现问题。
基于上述任一实施例,所述轮询所述背板设备及所述传感器设备之后,还包括:
在监测到存在异常的目标设备或者所述目标设备的串行链路存在异常的情况下,发送复位信号至所述目标设备;
生成所述目标设备相应的异常记录,并将所述异常记录上报给所述基板管理控制器。
其中,目标设备异常指代可编程逻辑器件检测不到该设备相应的设备参数,或者可编程逻辑器件监测到该设备未正常启动运行。
其中,串行链路指代信息的各位数据被逐位按顺序传送的线路,本实施例中以I2C链路为代表进行说明。
I2C链路存在异常则指代该I2C链路中的SCL信号长时间为低电平,也即该目标设备的设备参数传输存在异常状况。
需要说明的是,I2C是一种两线式串行总线,包括数据线SDA和时钟信号线SCL,通过两者不同的相位组合表示不同的帧,起始帧、地址数据帧、结束帧构成一次I2C传输。其可连接各种温度、电压、电流等类型的传感器,还可以用来连接内存条上,用来获取内存条的信息。
正常数据传输场景下,当SCL电平为高时,SDA的下降则表示一次I2C传输的开始,SDA的上升则表示一次I2C传输的结束。在SCL每个时钟周期的高电平时,按序采样SDA的值,依次得到B1/B2..../B3,作为链路上传输的原始数据。
由此可知,当I2C链路中的SCL信号长时间为低电平,则表征该I2C链路中传输的数据缺失时钟信号,也即该I2C链路对应的目标设备的数据无效。
由此为了保障服务器运行稳定性,在监测到存在异常的目标设备或者目标设备的I2C链路存在异常的情况下,立刻发送复位信号至目标设备,以重置该设备,并将此次监测到的异常记录上报给基板管理控制器,以通知基板管理控制器及时做应急处理。
基于上述任一实施例,所述在上电加载完成的情况下,轮询所述背板设备及所述传感器设备之前,还包括:
在监测到串行总线拓展需求的情况下,基于用户设定的可编程逻辑代码生成模拟串行链路,并基于所述模拟串行链路连接待扩展的功能设备。
具体地,模拟串行链路指代基于接口扩展芯片的数据传输功能所模拟出的数据传输线路,例如根据i2c switch芯片的数据传输功能模生成模拟2C链路。
本实施例中,由于可编程逻辑器件可根据用户根据自己的需要定义其逻辑功能,因此本实施例中,为了避免使用i2c switch芯片造成硬件线路复杂,提高电路设计难度并增加生产成本,采用根据i2cswitch芯片的数据传输功能编辑可编程逻辑器件的逻辑块及可编程互联通道对应的逻辑代码,由此生成模拟2C链路,进而在不改变硬件线路的情况下实现I2C总线拓展。
具体地,逻辑块也即逻辑阵列模块,复杂可编程逻辑器件包括若干个逻辑块,每一个逻辑块相当于一个单独的可编程逻辑器件单元,其含有4~20个左右的宏单元,该宏单元具备扩展项,提供可操控的乘积项分配和扩展,逻辑块之间的互联称为可编程互联通道,其是实现复杂可编程逻辑器件灵活可编程的关键,其主要提供逻辑块、宏单元、输入/输出引脚间的互连网络,因此本实施例中根据i2c switch芯片的数据传输功能对宏单元和可编程互联通道进行编辑。由此实现在不改变硬线线路的情况下进行I2C总线拓展。
基于上述任一实施例,所述发送相应的通知信号至所述基板管理控制器之后,还包括:
在监测到所述基板管理控制器触发的读事件的情况下,在所述读事件执行完毕后清除所述读事件对应的设备参数数据;或者,
在监测到所述基板管理控制器触发的写事件的情况下,在所述写事件执行完毕后判断是否接收到数据清除信号,并在接收到数据清除信号后清除所述写事件对应的设备参数数据。
由于设备参数是源源不断地缓存至缓存器中,也即需要缓存的数据量较大,由此为了保障缓存器中可以及时缓存所有的数据,当接收到基板管理控制器发送的读请求的情况下,响应读请求,并在监测到读请求执行完毕后立即清除该读请求对应的数据,基板管理控制器在读取该数据后,当解析出该数据为重要数据,则可向基本管理控制器发送携带该数据的写请求,以将该数据继续暂时写入至缓存器中,基板管控控制器在接收到基板管理控制器发送的该数据对应的删除指令的情况下,再删除该数据。
基于上述任一实施例,图3为本申请提供的电子设备的结构示意图,如图3所示,该电子设备可以包括:处理器(Processor)310、通信接口(Communications Interface)320、存储器(Memory)330和通信总线(Communications Bus)340,其中,处理器310,通信接口320,存储器330通过通信总线340完成相互间的通信。处理器310可以调用存储器330中的逻辑命令,以执行如下方法:
在上电加载完成的情况下,轮询所述背板设备及所述传感器设备,并读取设备参数;将所述设备参数缓存至所述缓存器中,并发送相应的通知信号至所述基板管理控制器,以通知所述基板管理控制器基于所述缓存器中缓存的设备参数进行服务器状态监控。
此外,上述的存储器330中的逻辑命令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干命令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本申请实施例提供的电子设备中的处理器可以调用存储器中的逻辑指令,实现上述方法,其具体的实施方式与前述方法实施方式一致,且可以达到相同的有益效果,此处不再赘述。
本申请实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的方法,其具体的实施方式与前述方法实施方式一致,且可以达到相同的有益效果,此处不再赘述。
本申请实施例提供一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时实现如上述方法的步骤。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干命令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (10)
1.一种服务器背板系统,其特征在于,包括:基板管理控制器、可编程逻辑器件、背板设备及用于监测设备温度的传感器设备;
所述可编程逻辑器件的一端通过串行总线与所述背板设备及所述传感器设备连接,所述可编程逻辑器件的另一端通过所述串行总线与所述基板管理控制器连接;
所述可编程逻辑器件在上电加载完成的情况下通过所述串行总线轮询所述背板设备及所述传感器设备,并读取设备参数;
所述可编程逻辑器件在设备参数读取完毕的情况下通过所述串行总线将所述设备参数上报给所述基板管理控制器。
2.根据权利要求1所述的服务器背板系统,其特征在于,所述可编程逻辑器件内部设有缓存器,所述缓存器用于缓存所述可编程逻辑器件在轮询所述背板设备及所述传感器设备的情况下读取的设备参数。
3.根据权利要求1所述的服务器背板系统,其特征在于,所述基板管理控制器通过所述串行总线与所述缓存器连接;
所述基板管理控制器用于在从所述缓存器中读取所述设备参数后清除所述设备参数。
4.根据权利要求1所述的服务器背板系统,其特征在于,所述可编程逻辑器件还用于在监测到存在异常的目标设备或者所述目标设备的串行链路存在异常的情况下发送复位信号至所述目标设备,并将相应的异常记录上报给所述基板管理控制器。
5.根据权利要求1至4任一项所述的服务器背板系统,其特征在于,所述可编程逻辑器件还包括模拟串行链路,所述模拟串行链路用于实现串行总线拓展。
6.根据权利要求5所述的服务器背板系统,其特征在于,所述模拟串行链路连接硬盘设备,所述模拟串行链路用于实现所述硬盘设备与所述基板管理控制器之间的通信。
7.一种应用于权利要求1至6任一项所述的服务器背板系统的服务器运行控制方法,其特征在于,包括:
在上电加载完成的情况下,轮询所述背板设备及所述传感器设备,并读取设备参数;
将所述设备参数缓存至所述缓存器中,并发送相应的通知信号至所述基板管理控制器,以通知所述基板管理控制器基于所述缓存器中缓存的设备参数进行服务器状态监控。
8.根据权利要求7所述的服务器运行控制方法,其特征在于,所述轮询所述背板设备及所述传感器设备之后,还包括:
在监测到存在异常的目标设备或者所述目标设备的串行链路存在异常的情况下,发送复位信号至所述目标设备;
生成所述目标设备相应的异常记录,并将所述异常记录上报给所述基板管理控制器。
9.根据权利要求7所述的服务器运行控制方法,其特征在于,所述在上电加载完成的情况下,轮询所述背板设备及所述传感器设备之前,还包括:
在监测到串行总线拓展需求的情况下,基于用户设定的可编程逻辑代码生成模拟串行链路,并基于所述模拟串行链路连接待扩展的功能设备。
10.根据权利要求7所述的服务器运行控制方法,其特征在于,所述发送相应的通知信号至所述基板管理控制器之后,还包括:
在监测到所述基板管理控制器触发的读事件的情况下,在所述读事件执行完毕后清除所述读事件对应的设备参数数据;或者,
在监测到所述基板管理控制器触发的写事件的情况下,在所述写事件执行完毕后判断是否接收到数据清除信号,并在接收到数据清除信号后清除所述写事件对应的设备参数数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211262202.4A CN115562942A (zh) | 2022-10-14 | 2022-10-14 | 服务器背板系统及服务器运行控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211262202.4A CN115562942A (zh) | 2022-10-14 | 2022-10-14 | 服务器背板系统及服务器运行控制方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115562942A true CN115562942A (zh) | 2023-01-03 |
Family
ID=84747236
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211262202.4A Pending CN115562942A (zh) | 2022-10-14 | 2022-10-14 | 服务器背板系统及服务器运行控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115562942A (zh) |
-
2022
- 2022-10-14 CN CN202211262202.4A patent/CN115562942A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106603265B (zh) | 管理方法、网络装置以及非暂态计算机可读介质 | |
US10649820B2 (en) | Method of managing event generation for an industrial controller | |
CN112422178B (zh) | 光模块监控方法、电子设备及存储介质 | |
CN110399220A (zh) | 一种fpga加速卡的管理方法及相关装置 | |
CN110658758A (zh) | 控制方法和控制系统 | |
CN110162446A (zh) | 一种基于bmc的背板硬盘点灯方法 | |
CN114003445A (zh) | Bmc的i2c监控功能测试方法、系统、终端及存储介质 | |
WO2024131133A1 (zh) | 电子设备数据处理方法、装置、电子设备和存储介质 | |
CN109839890A (zh) | 控制装置、控制方法以及计算机可读存储介质 | |
CN103092735A (zh) | 节点状态更新方法 | |
CN115562942A (zh) | 服务器背板系统及服务器运行控制方法 | |
CN116795761A (zh) | I2c总线复用器的控制方法、装置与电子设备 | |
CN111459768A (zh) | 一种硬盘管理方法、装置、设备及机器可读存储介质 | |
CN115934616A (zh) | 串口信息保存方法、装置、服务器、电子设备和存储介质 | |
CN114185720B (zh) | 服务器动态热备份的方法、装置、设备及存储介质 | |
CN110430091A (zh) | 适用于redis的主从时延监控方法及装置、存储介质 | |
CN115599617A (zh) | 总线检测方法、装置、服务器及电子设备 | |
CN115098342A (zh) | 系统日志收集方法、系统、终端及存储介质 | |
CN108959026A (zh) | 一种精确监控raid卡的方法 | |
CN115168141A (zh) | 光口管理系统、方法、装置、可编程逻辑器件及存储介质 | |
CN113900718A (zh) | 一种bmc与bios资产信息的解耦方法、系统及装置 | |
CN113849355A (zh) | I2c速率自适应调整方法、系统、终端及存储介质 | |
CN114253573A (zh) | PCIe设备固件批量升级方法、系统、终端及存储介质 | |
CN111159088A (zh) | 一种基于异构多核处理器的iic总线通信方法及系统 | |
CN110647435A (zh) | 服务器、硬盘远程控制方法及控制组件 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |