WO2023179684A1

WO2023179684A1 - 一种中央处理器状态监测方法、装置、设备、存储介质

Info

Publication number: WO2023179684A1
Application number: PCT/CN2023/083130
Authority: WO
Inventors: 梅飞
Original assignee: 苏州浪潮智能科技有限公司
Priority date: 2022-03-25
Filing date: 2023-03-22
Publication date: 2023-09-28
Also published as: CN114676019B; CN114676019A

Abstract

本申请公开了一种中央处理器状态监测方法、装置、设备、存储介质，包括：通过预先与中央处理器建立通信连接的专用单线型总线，读取中央处理器内部的预设寄存器中记录的中央处理器的当前状态信息，并在本地保存当前状态信息；判断当前状态信息和本地保存的中央处理器的上一状态信息之间是否一致；如果当前状态信息和上一状态信息之间不一致，则根据预设的异常状态告警规则进行相应的异常状态告警或者解除异常状态告警。通过本申请能够获取精确的中央处理器的当前状态信息并及时上报告知管理员，有利于维持中央处理器良好的使用性能和延长使用寿命，同时尽量避免了因中央处理器高温导致的服务器宕机等问题，能够有效防止告警误解除的情况发生。

Description

一种中央处理器状态监测方法、装置、设备、存储介质

相关申请的交叉引用

本申请要求于2022年3月25日提交中国专利局，申请号为202210302352.7，申请名称为“一种中央处理器状态监测方法、装置、设备、存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及服务器管理软件技术领域，特别涉及一种中央处理器状态监测方法、装置、设备、存储介质。

背景技术

当前，CPU(Central Processing Unit，中央处理器)作为服务器系统的运算和控制的核心部件，在使用过程中需要对CPU的状态进行监测，防止出现处理器过热(CPU Prochot)或处理器错误(CPU Error)。CPU Prochot信号会在CPU温度达到预设高温阈值时触发。

目前，在EGS(Eagle Stream)平台，由于CPU Prochot管脚被设计为单向输入管脚，CPLD(Complex Programmable Logic Device，复杂可编程逻辑器件)只能获取VR(Voltage Regulator，电压调节器)芯片检测的CPU附近环境温度、进而根据CPU附近环境温度情况决定是否触发CPU Prochot信号。因此，由于VR芯片检测到CPU附近环境温度迟滞于CPU核心温度，使得BMC(Baseboard Management Controller，基板管理控制器)无法及时通过CPLD获取CPU Prochot状态并及时触发告警。

发明内容

有鉴于此，本申请的目的在于提供一种中央处理器状态监测方法、装置、设备、存储介质，能够准确进行中央处理器状态监测，并能准确实现异常状态告警，有利于运维人员及时调整散热策略或排查故障。其具体方案如下：

本申请公开了一种中央处理器状态监测方法，应用于基板管理控制器，包括：

通过预先与中央处理器建立通信连接的专用单线型总线，读取中央处理器内部的预设寄存器中记录的中央处理器的当前状态信息，并在本地保存当前状态信息；

判断当前状态信息和本地保存的中央处理器的上一状态信息之间是否一致；

如果当前状态信息和上一状态信息之间不一致，则根据预设的异常状态告警规则进行相应的异常状态告警或者解除异常状态告警。

本申请一些实施例中，通过预先与中央处理器建立通信连接的专用单线型总线，读取中央处理器内部的预设寄存器中记录的中央处理器的当前状态信息，并在本地保存当前状态信息，包括：

通过预先与中央处理器建立通信连接的平台环境式控制接口，读取中央处理器内部的预设寄存器中记录的中央处理器的当前温度状态信息，并在本地保存当前温度状态信息。

本申请一些实施例中，判断当前状态信息和本地保存的中央处理器的上一状态信息之间是否一致，包括：

如果当前温度状态信息和本地保存的中央处理器的上一温度状态信息一致，则不进行相应的异常状态告警或者解除异常状态告警，并重新跳转至执行通过预先与中央处理器建立通信连接的平台环境式控制接口，读取中央处理器内部的预设寄存器中记录的中央处理器的当前温度状态信息，并在本地保存当前温度状态信息的步骤。

本申请一些实施例中，如果当前状态信息和本地保存的中央处理器的上一状态信息不一致，则根据预设的异常状态告警规则进行相应的异常状态告警，包括：

如果当前温度状态信息和本地保存的中央处理器的上一温度状态信息不一致，且当前温度状态信息为温度异常状态信息，则触发温度状态异常上报指令，并通过基板管理控制器记录温度异常状态产生的告警日志并进行相应的温度异常状态告警。

本申请一些实施例中，如果当前状态信息和本地保存的中央处理器的上一状态信息不一致，则根据预设的异常状态告警规则进行相应的解除异常状态告警，包括：

检测并记录每一次中央处理器处于温度异常状态时服务器的系统时间；

如果当前温度状态信息和本地保存的中央处理器的上一温度状态信息不一致，且当前温度状态信息为温度正常状态信息，则计算当前服务器的系统时间与中央处理器的上一温度异常状态信息时服务器的系统时间的时间差；

根据时间差以及电压调节器内置的温度传感器检测的中央处理器温度状态信息选择是否解除异常状态告警。

本申请一些实施例中，根据时间差以及电压调节器内置的温度传感器检测的中央处理器温度状态信息选择是否解除异常状态告警，包括：

当时间差小于预设时间差，则不进行解除异常状态告警的操作，并重新跳转至执行通过预先与中央处理器建立通信连接的平台环境式控制接口，读取中央处理器内部的预设寄存器中记录的中央处理器的当前温度状态信息，并在本地保存当前温度状态信息的步骤。

如果时间差大于预设时间差，并且电压调节器内置的温度传感器检测到的中央处理器温度状态信息为温度正常状态信息，则通过基板管理控制器记录温度正常状态产生的日志并解除异常状态告警。

本申请公开了一种中央处理器状态监测装置，包括：

信息读取模块，用于通过预先与中央处理器建立通信连接的专用单线型总线，读取中央处理器内部的预设寄存器中记录的中央处理器的当前状态信息，并在本地保存当前状态信息；

信息判断模块，用于判断当前状态信息和本地保存的中央处理器的上一状态信息之间是否一致；

状态监测模块，用于如果当前状态信息和上一状态信息之间不一致，则根据预设的异常状态告警规则进行相应的异常状态告警或者解除异常状态告警。

本申请公开了一种电子设备，包括：

存储器，用于保存计算机程序；

处理器，用于执行计算机程序，以实现如前述公开的中央处理器状态监测方法的步骤。

本申请公开了一种非易失性可读存储介质，用于存储计算机程序；其中，计算机程序被处理器执行时实现如前述公开的中央处理器状态监测方法的步骤。

可见，本申请公开了一种中央处理器状态监测方法，应用于基板管理控制器，包括：通过预先与中央处理器建立通信连接的专用单线型总线，读取中央处理器内部的预设寄存器中记录的中央处理器的当前状态信息，并在本地保存当前状态信息；判断当前状态信息和本地保存的中央处理器的上一状态信息之间是否一致；如果当前状态信息和上一状态信息之间不一致，则根据预设的异常状态告警规则进行相应的异常状态告警或者解除异常状态告警。由此可见，本申请通过预先与中央处理器建立通信连接的专用单线型总线直接获取中央处理器的当前状态信息，能够获取精确的中央处理器的当前状态信息，有利于维持中央处理器良好的使用性能和延长使用寿命，同时尽量避免了因中央处理器高温导致的服务器宕机等问题，具有客观的经济效益。然后根据预设的异常状态告警规则进行相应的异常状态告警或者解除异常状态告警，能够有效地防止了告警误解除的情况发生。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本申请公开的一种中央处理器状态监测方法流程图；

图2为本申请公开的一种具体的中央处理器状态监测方法流程图；

图3为本申请公开的一种具体的中央处理器状态监测方法流程图；

图4为本申请公开的一种中央处理器状态监测装置结构示意图；

图5为本申请公开的一种电子设备结构图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

当前，在EGS平台，由于CPU Prochot管脚被设计为单向输入管脚，CPLD只能获取VR芯片检测的CPU附近环境温度、进而根据CPU附近环境温度情况决定是否触发CPU Prochot信号。因此，由于VR芯片检测到CPU附近环境温度迟滞于CPU核心温度，使得BMC无法及时通过CPLD获取CPU Prochot状态并及时触发告警。

为此，本申请提供了一种中央处理器状态监测方案，能够实现准确的中央处理器状态监测，并能准确实现异常状态告警，进而有利于运维人员及时调整散热策略或排查故障。

参照图1所示，本申请实施例公开了一种中央处理器状态监测方法，应用于基板管理控制器，具体包括：

步骤S11：通过预先与中央处理器建立通信连接的专用单线型总线，读取中央处理器内部的预设寄存器中记录的中央处理器的当前状态信息，并在本地保存当前状态信息。

本申请一些实施例中，通过预先与中央处理器建立通信连接的平台环境式控制接口，读取中央处理器内部的预设寄存器中记录的中央处理器的当前温度状态信息，并在本地保存当前温度状态信息。可以理解的是，BMC定期通过PECI(Platform Environment Control Interface，平台环境式控制接口)读取CPU Package Thermal Status寄存器中bit 0位的值，寄存器中的bit 0位为表征CPU Prochot状态的位，其中，1表示处于Prochot状态，0表示处于正常状态，并将温度状态信息保存至本地。

步骤S12：判断当前状态信息和本地保存的中央处理器的上一状态信息之间是否一致。

本申请一些实施例中，判断当前状态信息和本地保存的中央处理器的上一状态信息之间是否一致，如果当前温度状态信息和本地保存的中央处理器的上一温度状态信息一致，则不进行相应的异常状态告警或者解除异常状态告警，并重新跳转至执行通过预先与中央处理器建立通信连接的平台环境式控制接口，读取中央处理器内部的预设寄存器中记录的中央处理器的当前温度状态信息，并在本地保存当前温度状态信息的步骤。可以理解的是，根据读取到的当前温度状态信息与本地保存的上一温度状态信息进行比较，例如：检测到当前的CPU Package Thermal Status寄存器中bit 0位的值，然后从本地中取出上一温度状态信息进行比较，比较此次读取到的bit 0位的数值与上一次读取到的bit 0位数值，如果当前读取到的bit 0位的数值为0，上次读取的bit 0位的数值为0，比较结果一致，说明两次的CPU内部的温度都属于正常状态，BMC无需上报；如果当前读取到的bit 0位的数值为1，上次读取的bit 0位的数值为1，比较结果一致，说明两次的CPU内部的温度都属于异常状态，此时仍处于温度告警状态，表明CPU内部的温度一直未改变，BMC无需上报。

步骤S13：如果当前状态信息和上一状态信息之间不一致，则根据预设的异常状态告警规则进行相应的异常状态告警或者解除异常状态告警。

本申请一些实施例中，如果当前温度状态信息和本地保存的中央处理器的上一温度状态信息不一致，且当前温度状态信息为温度异常状态信息，则触发温度状态异常上报指令，并通过基板管理控制器记录温度异常状态产生的告警日志并进行相应的温度异常状态告警。可以理解的是，检测到当前的CPU Package Thermal Status寄存器中bit 0位的值为1，本地保存的上一次的bit 0位的值为0，则表明上一次检测到CPU温度状态为正常状态，而当前检测到CPU温度状态为异常状态，前后两次的温度状态信息不一致，且当前温度状态为异常状态，说明CPU上一个Prochot触发/解除完整周期后，触发温度状态异常上报指令，BMC需要记录告警日志并进行相应的异常状态告警。

本申请一些实施例中，如果当前温度状态信息和本地保存的中央处理器的上一温度状态信息不一致，且当前温度状态信息为温度正常状态信息，则根据异常状态告警规则解除异常状态告警。可以理解的是，检测到当前的CPU Package Thermal Status寄存器中bit 0位的值为0，本地保存的上一次的bit 0位的值为1，则表明上一次检测到CPU温度状态为异常状态，而当前检测到CPU温度状态为正常状态，前后两次的温度状态信息不一致，且当前温度状态为正常状态，这时由于CPU Package Thermal Status寄存器的bit0位处于震荡状态，还不能立即解除异常状态告警，还需要基于异常状态告警规则，进一步判断是否解除状态告警。

进一步的，本申请还可以对CPU ERROR状态进行监测，CPU ERROR状态具体可以包括但不限于：IERR(internal error，内部错误)、Processor Disabled(处理器损坏)、UCE(Uncorrectable Machine Check Exception，处理器不可恢复性错误)、CE(Correctable Machine Check Error，处理器可恢复性错误)等。

参照图2和图3所示，本申请实施例公开了一种具体的中央处理器状态监测方法。具体的：

步骤S21：通过预先与中央处理器建立通信连接的平台环境式控制接口，读取中央处理器内部的预设寄存器中记录的中央处理器的当前温度状态信息，并在本地保存当前温度状态信息。

本申请一些实施例中，通过PECI读取中央处理器内部的预设寄存器中记录的中央处理器的当前温度状态信息，并在本地保存当前温度状态信息，可以理解的是，通过PECI直接读取中央处理器内部的预设寄存器中记录的中央处理器内部的当前温度状态信息，而不是通过CPLD获取的由VR芯片检测CPU附近的环境温度，BMC能够通过PECI及时准确地获取CPU Prochot状态。

步骤S22：判断当前温度状态信息和本地保存的中央处理器的上一温度状态信息之间是否一致。

步骤S23：检测并记录每一次中央处理器处于温度异常状态时服务器的系统时间；如果当前温度状态信息和本地保存的中央处理器的上一温度状态信息不一致，且当前温度状态信息为温度正常状态信息，则计算当前服务器的系统时间与中央处理器的上一温度异常状态信息时服务器的系统时间的时间差。

本申请一些实施例中，检测并记录每一次中央处理器处于温度异常状态时服务器的系统时间，例如：检测到CPU Package Thermal Status寄存器的bit 0位的值为1时，记录并保存服务器的系统时间；如果当前温度状态信息和本地保存的中央处理器的上一温度状态信息不一致，如：now_value≠last_value时，且检测到CPU Package Thermal Status寄存器的bit 0位的值为0时，也即当前温度状态信息为温度正常状态信息，此时由于CPU核心温度刚上升至prochot阈值，bit 0位处于震荡状态，也即数值在0和1间反复跳变，为防止误解除异常状态告警，需要计算当前服务器的系统时间与中央处理器的上一温度异常状态信息时服务器的系统时间的时间差，进而确定是否解除异常状态告警。

步骤S24：根据时间差以及电压调节器内置的温度传感器检测的中央处理器温度状态信息选择是否解除异常状态告警。

本申请一些实施例中，比较当前服务器的系统时间与记录的上一次CPU Package Thermal Status寄存器的bit 0为1时的时间差与预设时间差的大小关系，在一些实施例中，当时间差小于预设时间差，则不进行解除异常状态告警的操作，并重新跳转至执行通过预先与中央处理器建立通信连接的平台环境式控制接口，读取中央处理器内部的预设寄存器中记录的中央处理器的当前温度状态信息，并在本地保存当前温度状态信息的步骤。可以理解的是，预设时间差为20s，如果时间差为13s，则小于预设时间差time_now-time_last＜20s，说明此时的CPU Package Thermal Status寄存器的bit 0位处于震荡状态，不能解除异常状态告警，并继续重新跳转至执行通过预先与中央处理器建立通信连接的平台环境式控制接口，读取中央处理器内部的预设寄存器中记录的中央处理器的当前温度状态信息，并在本地保存当前温度状态信息的步骤。

本申请一些实施例中，如果时间差大于预设时间差，并且电压调节器内置的温度传感器检测到的中央处理器温度状态信息为温度正常状态信息，则通过基板管理控制器记录温度正常状态产生的日志并解除异常状态告警。可以理解的是，预设时间差为20s，如果时间差为26s，则time_now-time_last＞20s，大于预设时间差，此时需要根据VR芯片中内置的温度传感器中检测的中央处理器附近的环境温度状态进行辅助判断，如果VR芯片检测到中央处理器附近的环境温度也处于正常温度状态，则通过BMC记录温度正常状态产生的日志并解除异常状态告警；如果VR芯片检测到中央处理器附近的环境温度处于异常温度状态，则不解除异常状态告警。

可见，本申请实施例通过PECI读取CPU Package Thermal Status寄存器bit 0位的值，可以实时、准确监控CPU内部Prochot状态。这种方式解决了EGS平台BMC无法监控服务器CPU核心温度高温告警的问题，并且较原先通过CPLD透传读取Prochot管脚传递信号的方式更为迅捷，并且通过这种异常状态告警或者及时准确的进行解除异常状态告警，可以更为及时地上报告知管理员，利于运维人员及时调整散热策略或排查故障，有利于维持CPU良好的使用性能和延长使用寿命，同时尽量避免了因CPU高温导致的服务器宕机等问题，具有客观的经济效益。

参照图4所示，本申请实施例公开了一种中央处理器状态监测装置，包括：

信息读取模块11，用于通过预先与中央处理器建立通信连接的专用单线型总线，读取中央处理器内部的预设寄存器中记录的中央处理器的当前状态信息，并在本地保存当前状态信息；

信息判断模块12，用于判断当前状态信息和本地保存的中央处理器的上一状态信息之间是否一致；

状态监测模块13，用于如果当前状态信息和上一状态信息之间不一致，则根据预设的异常状态告警规则进行相应的异常状态告警或者解除异常状态告警。

进一步的，本申请实施例还公开了一种电子设备，图5是示例性示出的电子设备20结构图，图中的内容不能认为是对本申请的使用范围的任何限制。

图5为本申请实施例提供的一种电子设备20的结构示意图。该电子设备20，具体可以包括：至少一个处理器21、至少一个存储器22、电源23、通信接口24、输入输出接口25和通信总线26。其中，存储器22用于存储计算机程序，计算机程序由处理器21加载并执行，以实现前述任一实施例公开的中央处理器状态监测方法中的相关步骤。另外，本实施例中的电子设备20具体可以为电子计算机。

本申请一些实施例中，电源23用于为电子设备20上的各硬件设备提供工作电压；通信接口24能够为电子设备20创建与外界设备之间的数据传输通道，其所遵循的通信协议是能够适用于本申请技术方案的任意通信协议，在此不对其进行具体限定；输入输出接口25，用于获取外界输入数据或向外界输出数据，其具体的接口类型可以根据具体应用需要进行选取，在此不进行具体限定。

另外，存储器22作为资源存储的载体，可以是只读存储器、随机存储器、磁盘或者光盘等，其上所存储的资源可以包括操作系统221、计算机程序222等，存储方式可以是短暂存储或者永久存储。

其中，操作系统221用于管理与控制电子设备20上的各硬件设备以及计算机程序222，其可以是Windows Server、Netware、Unix、Linux等。计算机程序222除了包括能够用于完成前述任一实施例公开的由电子设备20执行的中央处理器状态监测方法的计算机程序之外，还可以进一步包括能够用于完成其他特定工作的计算机程序。

进一步的，本申请还公开了一种非易失性可读存储介质，用于存储计算机程序；其中，计算机程序被处理器执行时实现前述公开的中央处理器状态监测方法。关于该方法的具体步骤可以参考前述实施例中公开的相应内容，在此不再进行赘述。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其它实施例的不同之处，各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

专业人员还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上对本申请所提供的一种中央处理器状态监测方法、装置、设备、存储介质进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

一种中央处理器状态监测方法，其特征在于，应用于基板管理控制器，包括：

通过预先与中央处理器建立通信连接的专用单线型总线，读取所述中央处理器内部的预设寄存器中记录的所述中央处理器的当前状态信息，并在本地保存所述当前状态信息；

判断所述当前状态信息和本地保存的所述中央处理器的上一状态信息之间是否一致；

如果所述当前状态信息和所述上一状态信息之间不一致，则根据预设的异常状态告警规则进行相应的异常状态告警或者解除异常状态告警。
根据权利要求1所述的中央处理器状态监测方法，其特征在于，所述通过预先与中央处理器建立通信连接的专用单线型总线，读取所述中央处理器内部的预设寄存器中记录的所述中央处理器的当前状态信息，并在本地保存所述当前状态信息，包括：

通过预先与中央处理器建立通信连接的平台环境式控制接口，读取所述中央处理器内部的预设寄存器中记录的所述中央处理器的当前温度状态信息，并在本地保存所述当前温度状态信息。
根据权利要求2所述的中央处理器状态监测方法，其特征在于，所述通过预先与中央处理器建立通信连接的平台环境式控制接口，读取所述中央处理器内部的预设寄存器中记录的所述中央处理器的当前温度状态信息，包括：

通过预先与中央处理器建立通信连接的平台环境式控制接口，读取所述中央处理器内部的预设寄存器中表征中央处理器温度状态的比特位的值。
根据权利要求2所述的中央处理器状态监测方法，其特征在于，所述判断所述当前状态信息和本地保存的所述中央处理器的上一状态信息之间是否一致，包括：

如果所述当前温度状态信息和本地保存的所述中央处理器的上一温度状态信息一致，则不进行相应的异常状态告警或者解除异常状态告警，并重新跳转至执行所述通过预先与中央处理器建立通信连接的平台环境式控制接口，读取所述中央处理器内部的预设寄存器中记录的所述中央处理器的当前温度状态信息，并在本地保存所述当前温度状态信息的步骤。
根据权利要求4所述的中央处理器状态监测方法，其特征在于，所述判断所述当前状态信息和本地保存的所述中央处理器的上一状态信息之间是否一致，包括：

如果当前读取到的表征中央处理器温度状态的比特位的数值为0，且本地保存的上一次读取到的表征中央处理器温度状态的比特位的数值为0，则确定所述当前温度状态信息和本地保存的所述中央处理器的上一温度状态信息一致，且所述当前状态信息和本地保存的所述中央处理器的上一状态信息均为温度正常状态信息。
根据权利要求4所述的中央处理器状态监测方法，其特征在于，所述判断所述当前状态信息和本地保存的所述中央处理器的上一状态信息之间是否一致，包括：

如果当前读取到的表征中央处理器温度状态的比特位的数值为1，且本地保存的上一次读取到的表征中央处理器温度状态的比特位的数值为1，则确定所述当前温度状态信息和本地保存的所述中央处理器的上一温度状态信息一致，且所述当前状态信息和本地保存的所述中央处理器的上一状态信息均为温度异常状态信息。
根据权利要求4所述的中央处理器状态监测方法，其特征在于，所述判断所述当前状态信息和本地保存的所述中央处理器的上一状态信息之间是否一致，包括：

如果当前读取到的表征中央处理器温度状态的比特位的数值为1，且本地保存的上一次读取到的表征中央处理器温度状态的比特位的数值为0，则确定所述当前温度状态信息和本地保存的所述中央处理器的上一温度状态信息不一致，且所述当前状态信息为温度异常状态信息，本地保存的所述中央处理器的上一温度状态信息为温度正常状态信息。
根据权利要求4所述的中央处理器状态监测方法，其特征在于，所述判断所述当前状态信息和本地保存的所述中央处理器的上一状态信息之间是否一致，包括：

如果当前读取到的表征中央处理器温度状态的比特位的数值为0，且本地保存的上一次读取到的表征中央处理器温度状态的比特位的数值为1，则确定所述当前温度状态信息和本地保存的所述中央处理器的上一温度状态信息不一致，且所述当前状态信息为温度正常状态信息，本地保存的所述中央处理器的上一温度状态信息为温度异常状态信息。
根据权利要求2所述的中央处理器状态监测方法，其特征在于，所述如果所述当前状态信息和本地保存的所述中央处理器的上一状态信息不一致，则根据预设的异常状态告警规则进行相应的异常状态告警，包括：

如果所述当前温度状态信息和本地保存的所述中央处理器的上一温度状态信息不一致，且所述当前温度状态信息为温度异常状态信息，则触发温度状态异常上报指令，并通过基板管理控制器记录温度异常状态产生的告警日志并进行相应的温度异常状态告警。
根据权利要求2所述的中央处理器状态监测方法，其特征在于，所述如果所述当前状态信息和本地保存的所述中央处理器的上一状态信息不一致，则根据预设的异常状态告警规则进行相应的解除异常状态告警，包括：

如果所述当前温度状态信息和本地保存的所述中央处理器的上一温度状态信息不一致，且所述当前温度状态信息为温度正常状态信息，则根据预设的异常状态告警规则进行相应的解除异常状态告警。
根据权利要求10所述的中央处理器状态监测方法，其特征在于，所述如果所述当前温度状态信息和本地保存的所述中央处理器的上一温度状态信息不一致，且所述当前温度状态信息为温度正常状态信息，则根据预设的异常状态告警规则进行相应的解除异常状态告警，包括：

检测并记录每一次中央处理器处于温度异常状态时服务器的系统时间；

如果所述当前温度状态信息和本地保存的所述中央处理器的上一温度状态信息不一致，且所述当前温度状态信息为温度正常状态信息，则计算当前服务器的系统时间与所述中央处理器的上一温度异常状态信息时服务器的系统时间的时间差；

根据所述时间差以及电压调节器内置的温度传感器检测的所述中央处理器温度状态信息选择是否解除异常状态告警。
根据权利要求11所述的中央处理器状态监测方法，其特征在于，所述根据所述时间差以及电压调节器内置的温度传感器检测的所述中央处理器温度状态信息选择是否解除异常状态告警，包括：

当所述时间差小于预设时间差，则不进行解除异常状态告警的操作，并重新跳转至执行所述通过预先与中央处理器建立通信连接的平台环境式控制接口，读取所述中央处理器内部的预设寄存器中记录的所述中央处理器的当前温度状态信息，并在本地保存所述当前温度状态信息的步骤。
根据权利要求12所述的中央处理器状态监测方法，其特征在于，所述当所述时间差小于预设时间差，则不进行解除异常状态告警的操作，包括：

当所述时间差小于预设时间差，则确定所述中央处理器内部的预设寄存器中表征中央处理器温度状态的比特位处于震荡状态，不进行解除异常状态告警的操作。
根据权利要求11所述的中央处理器状态监测方法，其特征在于，所述根据所述时间差以及电压调节器内置的温度传感器检测的所述中央处理器温度状态信息选择是否解除异常状态告警，包括：

如果所述时间差大于预设时间差，并且电压调节器内置的温度传感器检测到的所述中央处理器温度状态信息为温度正常状态信息，则通过基板管理控制器记录温度正常状态产生的日志并解除异常状态告警。
根据权利要求14所述的中央处理器状态监测方法，其特征在于，所述如果所述时间差大于预设时间差，并且电压调节器内置的温度传感器检测到的所述中央处理器温度状态信息为温度正常状态信息，则通过基板管理控制器记录温度正常状态产生的日志并解除异常状态告警，包括：

如果所述时间差大于预设时间差，并且VR芯片中电压调节器内置的温度传感器检测到的所述中央处理器附近的环境温度处于正常温度状态，则通过基板管理控制器记录温度正常状态产生的日志并解除异常状态告警。
根据权利要求11所述的中央处理器状态监测方法，其特征在于，所述根据所述时间差以及电压调节器内置的温度传感器检测的所述中央处理器温度状态信息选择是否解除异常状态告警，包括：

如果所述时间差大于预设时间差，并且VR芯片中电压调节器内置的温度传感器检测到的所述中央处理器附近的环境温度处于异常温度状态，则不解除异常状态告警。
根据权利要求1所述的中央处理器状态监测方法，其特征在于，所述方法还包括：

监测所述中央处理器的错误状态信息；其中，所述错误状态信息包括但不限于：内部错误、处理器损坏、处理器不可恢复性错误、处理器可恢复性错误。
一种中央处理器状态监测装置，其特征在于，包括：

信息读取模块，用于通过预先与中央处理器建立通信连接的专用单线型总线，读取所述中央处理器内部的预设寄存器中记录的所述中央处理器的当前状态信息，并在本地保存所述当前状态信息；

信息判断模块，用于判断所述当前状态信息和本地保存的所述中央处理器的上一状态信息之间是否一致；

状态监测模块，用于如果所述当前状态信息和所述上一状态信息之间不一致，则根据预设的异常状态告警规则进行相应的异常状态告警或者解除异常状态告警。
一种电子设备，其特征在于，包括：

存储器，用于保存计算机程序；

处理器，用于执行所述计算机程序，以实现如权利要求1至17任一项所述的中央处理器状态监测方法的步骤。
一种非易失性可读存储介质，其特征在于，用于存储计算机程序；其中，所述计算机程序被处理器执行时实现如权利要求1至17任一项所述的中央处理器状态监测方法的步骤。