CN111949465A - 一种内存温度读取方法及系统 - Google Patents

一种内存温度读取方法及系统 Download PDF

Info

Publication number
CN111949465A
CN111949465A CN202010900820.1A CN202010900820A CN111949465A CN 111949465 A CN111949465 A CN 111949465A CN 202010900820 A CN202010900820 A CN 202010900820A CN 111949465 A CN111949465 A CN 111949465A
Authority
CN
China
Prior art keywords
memory
temperature
controller
management bus
system management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202010900820.1A
Other languages
English (en)
Inventor
徐智亨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202010900820.1A priority Critical patent/CN111949465A/zh
Publication of CN111949465A publication Critical patent/CN111949465A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2205Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • Programmable Controllers (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

本发明公开了一种内存温度读取方法及系统,所述方法包括:控制器通过系统管理总线同时读取服务器多个内存条的温度;当基板管理控制器询问特定内存条的温度时,控制器通过系统管理总线告知基板管理控制器当下读取的内存条温度。本发明公开的内存温度读取系统包括控制器,用于通过系统管理总线同时读取服务器多个内存条的温度;基板管理控制器,用于通过系统管理总线获取控制器当下读取的内存条温度。本发明通过复杂可编程逻辑器件的固件设计,使复杂可编程逻辑器件与每一内存条、基板管理控制器和中央处理器分别独立连接,能够使内存温度监控结果更为实时,有助于及时发现和应对内存温度异常情况。

Description

一种内存温度读取方法及系统
技术领域
本发明涉及服务器设计领域,具体涉及一种内存温度读取方法及系统。
背景技术
在标准X86的服务器平台设计上,需要在中央处理器(Central Processing Unit,CPU)旁边搭配内存条从而为CPU提供足够的内存空间进行运算,而一般在CPU与内存条的连接的众多讯号中,CPU会透过其中的系统管理总线(System Management Bus,SMBus)通道去读取内存条的温度。
基板管理控制器(Baseboard Management Controller,BMC)监控内存条温度的方法,一般是通过SMBus去向X86系统询问,但在X86系统的内存架构,多根内存之间共享一条SMBus,所以CPU读取每个内存条的时间必须要错开,也就是以轮询的机制去取得每根内存条的温度。若BMC向X86系统询问温度时,CPU正好需要较久的时间才会轮询到该内存条,则所读取到的温度为上一次轮询获取的温度,相对而言就是较久以前的温度,BMC也就无法实时针对温度异常现象做出实时反应,此现象在同一组SMBus连接越多内存条时,情况会越明显。
发明内容
为了解决上述技术问题,本发明提出了一种内存温度读取方法及系统,能够使内存温度监控结果更为实时,有助于及时发现和应对内存温度异常情况。
为实现上述目的,本发明采用以下技术方案:
一种内存温度读取方法,包括:
控制器通过系统管理总线同时读取服务器多个内存条的温度;
当基板管理控制器询问特定内存条的温度时,控制器通过系统管理总线告知基板管理控制器当下读取的内存条温度。
进一步地,所述控制器为复杂可编程逻辑器件。
进一步地,所述复杂可编程逻辑器件与每一内存条通过系统管理总线独立连接。
进一步地,服务器收到开机指令时,控制器通过系统管理总线读取内存条带电可擦可编程只读存储器的串行存在检测,并将获取的内容存储在内部缓存器中;
系统开机,中央处理器通过系统管理总线读取控制器内存储的串行存在检测信息,启动与内存条的传输。
进一步地,中央处理器根据读取的串行存在检测信息调整驱动参数。
进一步地,所述温度通过内存条带电可擦可编程只读存储器的温度传感器获取。
本发明还提出了一种内存温度读取系统,包括:
控制器,用于通过系统管理总线同时读取服务器多个内存条的温度;
基板管理控制器,用于通过系统管理总线获取控制器当下读取的内存条温度。
进一步地,所述控制器为复杂可编程逻辑器件。
进一步地,所述复杂可编程逻辑器件与每一内存条通过系统管理总线独立连接。
本发明的有益效果是:
本发明通过提出一种内存温度读取方法及系统,通过复杂可编程逻辑器件的固件设计,使复杂可编程逻辑器件可以针对每一条内存设计独立的SMBus通道读取温度,能够实现持续读取温度。并且将CPU、BMC的SMBus也分别独立连接到复杂可编程逻辑器件上,使BMC在询问特定内存条温度时,能够获得更接近实时的温度。若内存条出现温度异常情况,BMC能够更及时作出反应,从而提高产品整体的可靠性。
附图说明
图1是本发明实施例一内存温度读取方法流程示意图;
图2是本发明实施例二内存温度读取方法流程示意图;
图3是本发明实施例内存温度读取系统结构示意图。
具体实施方式
为能清楚说明本方案的技术特点,下面通过具体实施方式,并结合其附图,对本发明进行详细阐述。下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开,下文中对特定例子的部件和设置进行描述。此外,本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例和/或设置之间的关系。应当注意,在附图中所图示的部件不一定按比例绘制。本发明省略了对公知组件和处理技术及工艺的描述以避免不必要地限制本发明。
如图1所示,本发明实施例一公开了一种内存温度读取方法,包括:
控制器通过系统管理总线同时读取服务器多个内存条的温度;
当基板管理控制器询问特定内存条的温度时,控制器通过系统管理总线告知基板管理控制器当下读取的内存条温度。
优选地,所述控制器可选为复杂可编程逻辑器件(Complex Programming LogicDevice,CPLD)。所述温度通过内存条带电可擦可编程只读存储器(Electrically ErasableProgrammable Read Only Memory,EEPROM)的温度传感器获取。
所述EEPROM还存有该内存条的串行存在检测(Serial Presence Detect,SPD)SPD储存着关于该内存条的规格信息,用于判断内存条规格是否受到支持,并依照此规格进行资料传输。
图2示出了本发明实施例二内存温度读取方法流程示意图,兼具CPU读取SPD和BMC读取实时温度的功能:
服务器收到开机指令时,控制器通过系统管理总线读取内存条带电可擦可编程只读存储器的串行存在检测,并将获取的内容存储在内部缓存器中;
系统开机,中央处理器通过系统管理总线读取控制器内存储的串行存在检测信息,启动与内存条的传输;
启动传输后,控制器每组SMBus持续读取对应内存条的温度,当BMC询问特定内存条的温度时,控制器通过与BMC连接的SMBus告知该内存条的温度。
所述复杂可编程逻辑器件与每一内存条通过系统管理总线独立连接,因此每组SMBus均持续读取同一根内存条的温度。
如图3所示,本发明实施例还公开了一种内存温度读取系统,包括:
控制器,用于通过系统管理总线同时读取服务器多个内存条的温度;
基板管理控制器,用于通过系统管理总线获取控制器当下读取的内存条温度。
所述控制器可选为复杂可编程逻辑器件。
所述复杂可编程逻辑器件与每一内存条通过系统管理总线独立连接。具体为,CPLD的SMBus A连接CPU,用于获取内存条的SPD,CPLD的SMBus B/C/D/E分别与内存条1/2/3/4独立连接,每组SMBus均可以持续读取同一根内存条的温度,当BMC通过SMBus F询问特定内存条的温度时,即可获得较为实时的温度。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制。对于所属领域的技术人员来说,在上述说明的基础上还可以做出其它不同形式的修改或变形。这里无需也无法对所有的实施方式予以穷举。在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims (9)

1.一种内存温度读取方法,其特征在于,包括:
控制器通过系统管理总线同时读取服务器多个内存条的温度;
当基板管理控制器询问特定内存条的温度时,控制器通过系统管理总线告知基板管理控制器当下读取的内存条温度。
2.根据权利要求1所述的内存温度读取方法,其特征在于,所述控制器为复杂可编程逻辑器件。
3.根据权利要求2所述的内存温度读取方法,其特征在于,所述复杂可编程逻辑器件与每一内存条通过系统管理总线独立连接。
4.根据权利要求1所述的内存温度读取方法,其特征在于,服务器收到开机指令时,控制器通过系统管理总线读取内存条带电可擦可编程只读存储器的串行存在检测,并将获取的内容存储在内部缓存器中;
系统开机,中央处理器通过系统管理总线读取控制器内存储的串行存在检测信息,启动与内存条的传输。
5.根据权利要求4所述的内存温度读取方法,其特征在于,中央处理器根据读取的串行存在检测信息调整驱动参数。
6.根据权利要求1所述的内存温度读取方法,其特征在于,所述温度通过内存条带电可擦可编程只读存储器的温度传感器获取。
7.一种内存温度读取系统,其特征在于,包括:
控制器,用于通过系统管理总线同时读取服务器多个内存条的温度;
基板管理控制器,用于通过系统管理总线获取控制器当下读取的内存条温度。
8.根据权利要求7所述的内存温度读取系统,其特征在于,所述控制器为复杂可编程逻辑器件。
9.根据权利要求7所述的内存温度读取系统,其特征在于,所述复杂可编程逻辑器件与每一内存条通过系统管理总线独立连接。
CN202010900820.1A 2020-09-02 2020-09-02 一种内存温度读取方法及系统 Withdrawn CN111949465A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010900820.1A CN111949465A (zh) 2020-09-02 2020-09-02 一种内存温度读取方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010900820.1A CN111949465A (zh) 2020-09-02 2020-09-02 一种内存温度读取方法及系统

Publications (1)

Publication Number Publication Date
CN111949465A true CN111949465A (zh) 2020-11-17

Family

ID=73367225

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010900820.1A Withdrawn CN111949465A (zh) 2020-09-02 2020-09-02 一种内存温度读取方法及系统

Country Status (1)

Country Link
CN (1) CN111949465A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112506745A (zh) * 2020-12-11 2021-03-16 浪潮电子信息产业股份有限公司 内存温度读取方法、装置及计算机可读存储介质
CN112965930A (zh) * 2021-05-18 2021-06-15 中科可控信息产业有限公司 访问控制器、访问控制方法、计算机设备及可读存储介质
CN113407005A (zh) * 2021-08-18 2021-09-17 深圳市嘉合劲威电子科技有限公司 一种笔记本用高效散热内存系统
CN114924998A (zh) * 2022-06-09 2022-08-19 北京东土科技股份有限公司 内存信息读取装置及方法、计算设备主板、设备和介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN202033111U (zh) * 2011-04-11 2011-11-09 天津英瑞圣华生物技术有限公司 深低温温度集线器
CN107255526A (zh) * 2017-07-27 2017-10-17 郑州云海信息技术有限公司 一种温度检测方法、检测模块及检测系统
CN111198795A (zh) * 2019-12-23 2020-05-26 曙光信息产业股份有限公司 基板控制器获取内存温度的方法以及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN202033111U (zh) * 2011-04-11 2011-11-09 天津英瑞圣华生物技术有限公司 深低温温度集线器
CN107255526A (zh) * 2017-07-27 2017-10-17 郑州云海信息技术有限公司 一种温度检测方法、检测模块及检测系统
CN111198795A (zh) * 2019-12-23 2020-05-26 曙光信息产业股份有限公司 基板控制器获取内存温度的方法以及装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112506745A (zh) * 2020-12-11 2021-03-16 浪潮电子信息产业股份有限公司 内存温度读取方法、装置及计算机可读存储介质
CN112506745B (zh) * 2020-12-11 2024-02-09 浪潮电子信息产业股份有限公司 内存温度读取方法、装置及计算机可读存储介质
CN112965930A (zh) * 2021-05-18 2021-06-15 中科可控信息产业有限公司 访问控制器、访问控制方法、计算机设备及可读存储介质
CN112965930B (zh) * 2021-05-18 2021-08-31 中科可控信息产业有限公司 访问控制器、访问控制方法、计算机设备及可读存储介质
CN113407005A (zh) * 2021-08-18 2021-09-17 深圳市嘉合劲威电子科技有限公司 一种笔记本用高效散热内存系统
CN114924998A (zh) * 2022-06-09 2022-08-19 北京东土科技股份有限公司 内存信息读取装置及方法、计算设备主板、设备和介质
CN114924998B (zh) * 2022-06-09 2023-05-23 北京东土科技股份有限公司 内存信息读取装置及方法、计算设备主板、设备和介质

Similar Documents

Publication Publication Date Title
CN111949465A (zh) 一种内存温度读取方法及系统
US10890931B2 (en) Memory module thermal management
CN106571954B (zh) 一种ap设备的异常重启原因检测方法及装置
US7589624B2 (en) Component unit monitoring system and component unit monitoring method
CN103077102A (zh) 计算机开机侦测系统
CN105700999A (zh) 记录处理器操作的方法及系统
CN111198795A (zh) 基板控制器获取内存温度的方法以及装置
US20100274999A1 (en) Control system and method for memory
CN101346705A (zh) 高速缓存解除关联检测
CN102750109A (zh) 资料同步系统及方法
US20230004459A1 (en) Error reporting for non-volatile memory modules
CN109614273B (zh) 增量数据的读取方法和系统
US11513933B2 (en) Apparatus with temperature mitigation mechanism and methods for operating the same
US9158646B2 (en) Abnormal information output system for a computer system
CN114996065A (zh) 内存故障预测方法、装置及设备
CN117707884A (zh) 一种监控电源管理芯片的方法、系统、设备和介质
CN112667483A (zh) 用于服务器主板的内存信息读取装置、方法及服务器
CN114625213B (zh) 存储设备转接卡、存储设备测试系统以及方法
US11755475B2 (en) System and method for utilizing enhanced thermal telemetry for differential storage of data on a memory module
CN112015600B (zh) 日志信息处理系统、日志信息处理方法及装置和交换机
CN111459733B (zh) 一种获取cpu温度的测试方法、系统及计算机存储介质
JP7183841B2 (ja) 電子制御装置
CN115878441A (zh) 基于一致性缓存的高可用计算服务方法、系统及设备
EP1845447B1 (en) Method, apparatus and software for preventing switch failures in the presence of faults
CN112015600A (zh) 日志信息处理系统、日志信息处理方法及装置和交换机

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20201117

WW01 Invention patent application withdrawn after publication