CN115599617A - 总线检测方法、装置、服务器及电子设备 - Google Patents

总线检测方法、装置、服务器及电子设备 Download PDF

Info

Publication number
CN115599617A
CN115599617A CN202211529449.8A CN202211529449A CN115599617A CN 115599617 A CN115599617 A CN 115599617A CN 202211529449 A CN202211529449 A CN 202211529449A CN 115599617 A CN115599617 A CN 115599617A
Authority
CN
China
Prior art keywords
target
bus
register
detection
detection process
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211529449.8A
Other languages
English (en)
Other versions
CN115599617B (zh
Inventor
张加书
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202211529449.8A priority Critical patent/CN115599617B/zh
Publication of CN115599617A publication Critical patent/CN115599617A/zh
Application granted granted Critical
Publication of CN115599617B publication Critical patent/CN115599617B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2205Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
    • G06F11/221Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested to test buses, lines or interfaces, e.g. stuck-at or open line faults
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2273Test methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请实施例提供了一种总线检测方法、装置、服务器及电子设备,其中,该方法包括:创建第一目标检测进程,其中,第一目标检测进程用于按照预设频率对目标总线进行轮询监控;通过目标寄存器设置目标总线为挂死状态,并向目标总线发送恢复指令,其中,恢复指令用于指示目标总线从挂死状态恢复;在向目标总线发送恢复指令后,通过第一目标检测进程确定目标总线的工作状态,并依据检测结果确定目标总线是否异常。通过本申请,解决了相关技术中从硬件层面将总线挂死再对总线进行检测造成的检测效率低的问题,进而达到了避免因不能及时发现总线故障导致的服务器异常运行的效果。

Description

总线检测方法、装置、服务器及电子设备
技术领域
本申请实施例涉及计算机领域,具体而言,涉及一种总线检测方法、装置、服务器及电子设备。
背景技术
目前相关技术中在对总线进行检修时,常用的方法是直接从硬件层面将总线挂死,再对总线进行检测。这种方式效率较低,导致不能及时发现总线是否存在故障。
发明内容
本申请实施例提供了一种总线检测方法、装置、服务器及电子设备,以至少解决相关技术中从硬件层面将总线挂死再对总线进行检测造成的检测效率低的问题。
根据本申请的一个实施例,提供了一种总线检测方法,包括:创建第一目标检测进程,其中,第一目标检测进程用于按照预设频率对目标总线进行轮询监控;通过目标寄存器设置目标总线为挂死状态,并向目标总线发送恢复指令,其中,恢复指令用于指示目标总线从挂死状态恢复;在向目标总线发送恢复指令后,通过第一目标检测进程确定目标总线的工作状态,并依据检测结果确定目标总线是否异常。
在一些示例性实施例中,通过第一目标检测进程确定目标总线的工作状态的步骤包括:确定命令状态寄存器中的目标地址,其中,目标地址对应的目标数据用于表示目标总线的工作状态;依据目标地址从命令状态寄存器中获取目标数据;依据目标数据确定目标总线的工作状态,其中,工作状态包括:空闲状态、非空闲状态。
在一些示例性实施例中,依据检测结果确定目标总线是否异常的步骤包括:在检测结果指示工作状态为非空闲状态且处于非空闲状态的持续时长大于预设时长时,确认目标总线异常。
在一些示例性实施例中,确认目标总线异常的步骤之后,总线检测方法还包括:通过目标总线的驱动层指示目标总线自动恢复。
在一些示例性实施例中,目标总线包括目标数据线和目标时钟线,其中,通过目标总线的驱动层设置目标总线执行自动恢复动作包括:通过驱动层在目标总线对应的系统控制单元寄存器中重新写入用于指示目标总线自恢复的数据;在重新写入用于指示目标总线自恢复的数据后,通过驱动层向与目标总线对应的命令状态寄存器发送预设数量个串行时钟电平信号。
在一些示例性实施例中,通过驱动层向与目标总线对应的命令状态寄存器发送预设数量个串行时钟电平信号的步骤包括:确定命令状态寄存器中与目标总线自恢复功能对应的寄存器地址;向寄存器地址发送预设数量个串行时钟电平信号。
在一些示例性实施例中,创建第一目标检测进程的步骤包括:创建第二目标检测进程,其中,第二目标检测进程的进程类型包括数据总线服务进程;在第二目标检测进程中创建第一目标对象,得到第一目标检测进程,其中,第一目标对象中设置有定时器事件源,第一目标对象用于通过定时器事件源按照预设频率对目标总线进行轮询监控。
在一些示例性实施例中,在第二目标检测进程中创建目标对象的步骤包括:在第二目标检测进程中创建第二目标对象;在第二目标对象中添加第一目标对象,其中,第一目标对象的对象类型为事件对象。
在一些示例性实施例中,定时器事件源中的时钟类型包括以下至少之一:单调时钟,即时时钟,引导时间时钟。
在一些示例性实施例中,第二目标检测进程和第一目标检测进程均运行在服务层中。
在一些示例性实施例中,定时器事件源的事件源类型为异步事件源,对第一目标对象用于通过定时器事件源对目标总线进行异步等待轮询监控。
在一些示例性实施例中,通过目标寄存器设置目标总线为挂死状态的步骤包括:在目标寄存器中写入目标指令,其中,目标指令用于修改目标寄存器中与目标总线对应的寄存器数据,目标寄存器中的寄存器数据用于设定目标总线的工作状态。
在一些示例性实施例中,在目标寄存器中写入目标指令的步骤之前,总线检测方法还包括:通过目标寄存器,将目标总线设置为通用型输入输出模式。
在一些示例性实施例中,目标寄存器为与目标总线对应的系统控制单元寄存器。
在一些示例性实施例中,总线检测方法还包括:在应用层中设置目标监控函数,其中,目标监控函数用于监控目标总线对应的设备节点状态信息;记录设备节点状态信息,并生成设备节点状态信息对应的设备节点状态维护日志。
在一些示例性实施例中,在创建第一目标检测进程的步骤之前,总线检测方法还包括:响应目标对象的选择指令,从目标服务器对应的至少一条总线中确定目标总线。
根据本申请的另一个实施例,提供了一种服务器,包括基板管理控制器,目标总线,第一寄存器,第二寄存器,其中,基板管理控制器,被配置为执行创建第一目标检测进程,其中,第一目标检测进程用于按照预设频率对目标总线进行轮询监控;通过第一寄存器设置目标总线为挂死状态,并向目标总线发送恢复指令,其中,恢复指令用于指示目标总线从挂死状态恢复;在向目标总线发送恢复指令后,通过第一目标检测进程和第二寄存器确定目标总线的工作状态,并依据检测结果确定目标总线是否异常。
在一些示例性实施例中,目标总线的数量为多条,基板管理控制器还用于确定多条目标总线中的每条目标总线在第一寄存器和第二寄存器中对应的寄存器地址信息。
根据本申请的又一个实施例,提供了一种总线检测装置,包括:第一检测模块,用于创建第一目标检测进程,其中,第一目标检测进程用于按照预设频率对目标总线进行轮询监控;处理模块,用于通过目标寄存器设置目标总线为挂死状态,并向目标总线发送恢复指令,其中,恢复指令用于指示目标总线从挂死状态恢复;第二检测模块,用于在向目标总线发送恢复指令后,通过第一目标检测进程确定目标总线的工作状态,并依据检测结果确定目标总线是否异常。
根据本申请的又一个实施例,还提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,其中,计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
根据本申请的又一个实施例,还提供了一种电子设备,包括存储器和处理器,存储器中存储有计算机程序,处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
通过本申请,由于通过设定第一目标检测进程来对总线的工作状态进行轮询监控,并通过操作目标寄存器来让总线执行挂死动作,因此,可以解决相关技术中从硬件层面将总线挂死再对总线进行检测造成的检测效率低的问题,达到提高总线检测效率,及时发现总线是否存在故障的效果。
附图说明
图1是根据本申请实施例的计算机终端的结构框图;
图2是根据本申请实施例的总线检测方法的流程图;
图3是根据本申请实施例的服务器的结构框图;
图4是根据本申请实施例的总线检测装置的结构框图;
图5是根据本申请实施例的计算机可读存储介质的结构框图;
图6是根据本申请实施例的电子设备的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为了更好地理解本申请实施例,以下将本申请实施例中涉及的技术术语解释如下:
BMC(基板管理控制器):是服务器的核心控制单元,是一个在ARM架构上的用来管理服务器的主板处理器,OpenBmc是一个用来构建完整BMC的专用Linux系统映像的开源软件架构。
事件源对象:是c++处理事件的一种机制策略,支持64位优先级、支持自动向服务管理器发送看门狗通知消息、支持挂起自恢复策略、支持设置事件循环监控状态等用来处理业务实现逻辑中的一种策略。
I2C总线:是OpenBmc服务器系统中最为常用的串行总线,只需要一根数据线和一根时钟线就可以通过外部连线进行硬件检测,便于系统故障诊断和调试。每个挂在总线上的i2c设备都有一个唯一的地址,并可以通过软件寻址,设备故障可以立即被寻址定位。I2C异常检测方法在OpenBmc服务器设备监控、故障诊断、系统稳定中起着重要作用。
另外,I2C总线在openBmc服务器中可以实现以下功能:板载监控主板、io板、riser卡、cpu等温度传感器、板载eeprom写保护信号、fru、psu、主板cpld、风扇板cpld等各种服务器关键设备器件都会挂载在i2c总线上;通过pca9555等switch芯片可扩展多路io进行设备功能拓展使用,方便、高效的解决硬件资源问题;通过switch芯片进行cpu power的监控管理。
sd_event对象:是一种多事件源循环处理的一种机制,其事件源分为I/O事件源以及定时器事件源以及unix进程信号事件。本发明采用定时器事件源的一种clock_monotonic定时器机制进行进程循环监控。事件循环设计是在每个线程中运行单独的事件循环实例,并且遵循优先级内核调度。
Openbmc:是BMC(基板管理控制器)的linux发行版,是一种开源的服务器bmc实现方式。
目前随着物联网技术等信息技术的发展与成熟,高速数据运行、高效数据处理与数据安全存储的技术需求日趋庞大,对服务器的要求也越来越高。而服务器的数据处理能力和运行状态与服务器中的总线的工作状态息息相关。但是相关技术中在对总线的工作状态进行检测时,通常会选择从硬件层面采用外部链接的方式对总线进行检测。这种方式需要运维人员人工操作,导致检测效率较低,不能及时发现总线是否发生故障。
为了解决该问题,本申请实施例中提供了相关的解决方案,以下详细说明。
根据本申请实施例,提供了一种数据格式转换方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例所提供的方法实施例可以在移动终端、计算机终端、服务器或者类似的运算装置中执行。图1示出了一种用于实现数据格式转换方法的计算机终端的硬件结构框图。如图1所示,计算机终端10可以包括一个或多个(图中采用102a、102b,……,102n来示出)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输模块106。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为BUS总线的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
应当注意到的是上述一个或多个处理器102和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算机终端10(或移动设备)中的其他元件中的任意一个内。如本申请实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
存储器104可用于存储应用软件的软件程序以及模块,如本申请实施例中的数据格式转换方法对应的程序指令/数据存储装置,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的应用程序的漏洞检测方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与计算机终端10(或移动设备)的用户界面进行交互。
需要说明的是,当本方法用于对服务器的总线进行检测时,执行本方法的可以是服务器中的处理器或基板管理控制器,也可以是可以与服务器之间通信并互相传递数据的终端设备。也就是说,本申请所提供的总线检测方法可以实现远程对目标总线进行检测。
在上述运行环境下,本申请实施例提供了一种数据格式转换方法,图2是根据本申请实施例的的流程图,如图2所示,该流程包括如下步骤:
步骤S202,创建第一目标检测进程,其中,第一目标检测进程用于按照预设频率对目标总线进行轮询监控;
在步骤S202所提供的技术方案中,创建第一目标检测进程的步骤包括:创建第一目标检测进程,其中,第一目标检测进程的进程类型包括数据总线服务进程;在第一目标检测进程中创建第一目标对象,其中,第一目标对象中设置有定时器事件源,目标对象用于通过定时器事件源按照预设频率对目标总线进行轮询监控。
在本申请的一些实施例中,在第二目标检测进程中创建目标对象的步骤包括:在第二目标检测进程中创建第二目标对象;在第二目标对象中添加第一目标对象,其中,第一目标对象的对象类型为事件对象。
作为一种可选地实施方式,定时器事件源中的时钟类型包括以下至少之一:单调时钟(CLOCK_MONOTONIC),即时时钟(CLOCK_REALTIME),引导时间时钟(CLOCK_BOOTIME)。
需要说明的是,第二目标检测进程和第一目标检测进程均运行在服务层中。
具体地,当目标总线为Openbmc服务器中的总线时,可以在服务器中创建一个dbus服务进程(也就是数据总线服务进程),然后在这个服务进程中创建一个数据总线对象(sdbus对象),并在数据总线对象中添加一个用于通过定时器事件源来按照预设频率对目标总线的工作状态进行轮询监控的sd_event_plus对象。
另外,在本申请的一些实施例中,为了提高处理效率,可以设定定时器事件源的事件源类型为异步事件源,对第一目标对象用于通过定时器事件源对目标总线进行异步等待轮询监控。
作为一种可选地实施方式,步骤S202中的创建目标进程可以是由执行总线检测方法的设备依据预设的规则自行设定,或者在响应目标对象的操作指令后设定。具体地,在目标进程是在响应目标对象的操作指令后设定的情况下,目标对象可以直接通过该设备的人机交互截面输入操作指令,或通过与该设备之间存在连接关系的其他设备来进行远程操作。
由于在实际应用过程中,服务器通常不会只有一条总线,并且不同的总线对应的寄存器中的寄存器地址不同,因此,在执行步骤S202中所述的创建第一目标检测进程的步骤之前,还需要响应目标对象的选择指令,从目标服务器对应的至少一条总线中确定目标总线。需要说明的是,目标总线的数量可以为多条。
步骤S204,通过目标寄存器设置目标总线为挂死状态,并向目标总线发送恢复指令,其中,恢复指令用于指示目标总线从挂死状态恢复;
在步骤S204所提供的技术方案中,通过目标寄存器设置目标总线为挂死状态的步骤包括:在目标寄存器中写入目标指令,其中,目标指令用于修改所述目标寄存器中与所述目标总线对应的寄存器数据,所述目标寄存器中的寄存器数据用于设定所述目标总线的工作状态。
作为一种可选地实施方式,在目标寄存器中写入目标指令的步骤之前,还需要通过目标寄存器,将目标总线设置为通用型输入输出模式(GPIO)。
具体地,可以基于与openbmc服务器连接的设备终端,并通过devmen等测试工具直接操作目标寄存器,从而在目标寄存器中进行写数据操作。其中,目标寄存器可以是系统控制单元寄存器。
步骤S206,在向目标总线发送恢复指令后,通过第一目标检测进程确定目标总线的工作状态,并依据检测结果确定目标总线是否异常。
在步骤S206所提供的技术方案中,通过第一目标检测进程确定目标总线的工作状态的步骤包括:确定命令状态寄存器中的目标地址,其中,目标地址对应的目标数据用于表示目标总线的工作状态;依据目标地址从命令状态寄存器中获取目标数据;依据目标数据确定目标总线的工作状态,其中,工作状态包括:空闲状态、非空闲状态。
其中,命令状态寄存器中的不同的bit位可以提供不同的信息,例如,可以从命令状态寄存器的10-22bit位中获取对应的目标总线的工作状态。
作为一种可选地实施方式,依据检测结果确定目标总线是否异常的步骤包括:在检测结果指示工作状态为非空闲状态且处于非空闲状态的持续时长大于预设时长时,确认目标总线异常。
在本申请的一些实施例中,确认目标总线异常之后,还可以通过目标总线的驱动层指示目标总线自动恢复。
具体地,可以在目标总线的驱动层中设置具有超时触发机制的自恢复程序,用于在发现目标总线处于异常状态的时长超过预设时长时对目标总线中的时钟线和数据线进行自恢复动作处理。
在本申请的一些实施例中,当确定目标总线处于异常工作状态时,还可以先确定目标总线的异常原因,并根据异常原因来进行下一步的处理操作。具体地,当确定目标总线的异常原因为连接到目标总线上的从机故障时,可以先确定发生故障的从机位置,然后将从机位置发送给对应的运维人员,指示运维人员对从机进行维修。
另外,作为一种可选的实施方式,上述目标检测进程可以设置为定期读取命令状态寄存器中对应比特位的数据,从而确定设备中目标总线的状态,并在确定发生异常时及时通知运维人员进行处理。
作为一种可选地实施方式,为了记录目标总线中各个设备节点的状态,还可以在应用层中设置目标监控函数,其中,目标监控函数用于监控目标总线对应的设备节点状态信息;通过目标监控函数记录设备节点状态信息,并生成设备节点状态信息对应的设备节点状态维护日志。
通过创建第一目标检测进程,其中,第一目标检测进程用于按照预设频率对目标总线进行轮询监控;通过目标寄存器设置目标总线执行挂死动作,并向目标总线发送恢复指令,其中,恢复指令用于指示目标总线从挂死状态恢复;在向目标总线发送恢复指令后,通过第一目标检测进程确定目标总线的工作状态,并依据检测结果确定目标总线是否异常,解决了相关技术中从硬件层面将总线挂死再对总线进行检测造成的检测效率低的问题,提高了总线检测效率,从而保障了服务器的稳定运行。
另外,本申请还提供了一种模拟I2C总线挂死并监控I2C总线的工作状态的方法,和相关技术中直接从硬件层面进行操作的方式相比,更加简单高效,可以在openbmc服务器的开发维护进程中,节约测试资源,减少投入成本,从而有效提高开发效率。
其中,上述步骤的执行主体可以为服务器、终端等,但不限于此。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例的方法。
在本申请实施例中还提供了一种总线检测设备。该设备可用于实现上述实施例及优选实施方式,因此对总线检测方法的相关解释说明也适用于该设备中,故已经进行过说明的内容在此不再赘述。
具体地,该总线检测设备中可设置有用于执行总线检测方法的处理器,和与目标服务器之间进行通信的通信模块。其中,该处理器可用于执行如下总线检测方法:创建第一目标检测进程,其中,第一目标检测进程用于按照预设频率对目标总线进行轮询监控;通过目标寄存器设置目标总线为挂死状态,并向目标总线发送恢复指令,其中,恢复指令用于指示目标总线从挂死状态恢复;在向目标总线发送恢复指令后,通过第一目标检测进程确定目标总线的工作状态,并依据检测结果确定目标总线是否异常。
作为一种可选地实施方式,处理器通过第一目标检测进程确定目标总线的工作状态的步骤包括:确定命令状态寄存器中的目标地址,其中,目标地址对应的目标数据用于表示目标总线的工作状态;依据目标地址从命令状态寄存器中获取目标数据;依据目标数据确定目标总线的工作状态,其中,工作状态包括:空闲状态、非空闲状态。
作为一种可选地实施方式,处理器依据检测结果确定目标总线是否异常的步骤包括:在检测结果指示工作状态为非空闲状态且处于非空闲状态的持续时长大于预设时长时,确认目标总线异常。
作为一种可选地实施方式,确认目标总线异常的步骤之后,处理器还被配置为执行:通过目标总线的驱动层指示目标总线执行自动恢复。
作为一种可选地实施方式,处理器创建第一目标检测进程的步骤包括:创建第一目标检测进程,其中,第一目标检测进程的进程类型包括数据总线服务进程;在第一目标检测进程中创建目标对象,其中,目标对象中设置有定时器事件源,目标对象用于通过定时器事件源按照预设频率对目标总线进行轮询监控。
作为一种可选地实施方式,处理器通过第一寄存器设置目标总线为挂死状态的步骤包括:在第一寄存器中写入目标指令,其中,目标指令用于指示目标总线中的目标时钟线和目标数据线执行挂死动作。
作为一种可选地实施方式,上述通信模块包括有线通信模块或无线通信模块。具体地,当通信模块为有线通信模块时,总线检测设备可以在验证通过的情况下通过数据线与目标服务器连接,从而实现与目标服务器之间的数据互通,包括在目标服务器中建立目标进程,以及对目标服务器中的寄存器执行写数据操作从而设置目标总线的工作状态,或从命令状态寄存器中读取相应的数据来确定总线状态等。
当通信模块为无线通信模块时,总线检测设备和目标服务器之间可以通过蓝牙,WLAN或NFC等方式实现数据互通。
在本实施例中还提供了一种服务器,该服务器用于实现上述实施例及优选实施方式,因此对总线检测方法的相关解释说明也适用于该服务器中,故已经进行过说明的不再赘述。
图3是根据本申请实施例的服务器的结构框图,如图3所示,服务器包括基板管理控制器30,目标总线32,第一寄存器34,第二寄存器36,其中,基板管理控制器30,被配置为执行创建第一目标检测进程,其中,第一目标检测进程用于按照预设频率对目标总线32进行轮询监控;通过第一寄存器34设置目标总线32为挂死状态,并向目标总线32发送恢复指令,其中,恢复指令用于指示目标总线32从挂死状态恢复;在向目标总线32发送恢复指令后,通过第一目标检测进程和第二寄存器36确定目标总线32的工作状态,并依据检测结果确定目标总线32是否异常。
作为一种可选地实施方式,基板管理控制器30通过第一目标检测进程确定目标总线32的工作状态的步骤包括:确定命令状态寄存器中的目标地址,其中,目标地址对应的目标数据用于表示目标总线32的工作状态;依据目标地址从命令状态寄存器中获取目标数据;依据目标数据确定目标总线32的工作状态,其中,工作状态包括:空闲状态、非空闲状态。
具体地,当目标总线32为Openbmc服务器中的总线时,可以在服务器中创建一个dbus服务进程(也就是数据总线服务进程),然后在这个服务进程中创建一个数据总线对象(sdbus对象),并在数据总线对象中添加一个用于通过定时器事件源来按照预设频率对目标总线32的工作状态进行轮询监控的sd_event_plus对象。
在创建目标进程时,可以是由执行总线检测方法的基板管理控制器30依据预设的规则自行设定,或者在响应目标对象的操作指令后设定。具体地,在目标进程是在响应目标对象的操作指令后设定的情况下,目标对象可以直接通过服务器的人机交互截面输入操作指令,或通过与服务器之间存在连接关系的其他设备来进行远程操作。
作为一种可选地实施方式,基板管理控制器30依据检测结果确定目标总线32是否异常的步骤包括:在检测结果指示工作状态为非空闲状态且处于非空闲状态的持续时长大于预设时长时,确认目标总线32异常。
作为一种可选地实施方式,确认目标总线32异常的步骤之后,基板管理控制器30还被配置为执行:通过目标总线32的驱动层设置目标总线32执行自动恢复动作。
在本申请的一些实施例中,当确定目标总线32处于异常工作状态时,还可以先确定目标总线32的异常原因,并根据异常原因来进行下一步的处理操作。具体地,当确定目标总线32的异常原因为连接到目标总线32上的从机故障时,可以先确定发生故障的从机位置,然后将从机位置发送给对应的运维人员,指示运维人员对从机进行维修。
另外,作为一种可选的实施方式,上述目标检测进程可以设置为定期读取命令状态寄存器中对应比特位的数据,从而确定设备中目标总线32的状态,并在确定发生异常时及时通知运维人员进行处理。
具体地,服务器中可以设置有与基板管理控制器30相连的警报装置,基板管理控制器30可以将相关故障信息发送给警报装置,并由警报装置通知运维人员进行处理。
作为一种可选地实施方式,基板管理控制器30创建第一目标检测进程的步骤包括:创建第一目标检测进程,其中,第一目标检测进程的进程类型包括数据总线服务进程;在第一目标检测进程中创建目标对象,其中,目标对象中设置有定时器事件源,目标对象用于通过定时器事件源按照预设频率对目标总线32进行轮询监控。
作为一种可选地实施方式,基板管理控制器30通过第一寄存器34设置目标总线32执行挂死动作的步骤包括:在第一寄存器34中写入目标指令,其中,目标指令用于指示目标总线32中的目标时钟线和目标数据线执行挂死动作。
需要说明的是,上述目标总线32的数量为多条,基板管理控制器30还用于确定多条目标总线32中的每条目标总线32在第一寄存器34和第二寄存器36中对应的寄存器地址信息。
在本实施例中还提供了一种总线检测装置,该装置用于实现上述实施例及优选实施方式,因此对总线检测方法的相关解释说明也适用于该装置中,故已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图4是根据本申请实施例的总线检测装置的结构框图,如图4所示,该装置包括第一检测模块40,用于创建第一目标检测进程,其中,第一目标检测进程用于按照预设频率对目标总线进行轮询监控;处理模块42,用于通过目标寄存器设置目标总线为挂死状态,并向目标总线发送恢复指令,其中,恢复指令用于指示目标总线从挂死状态恢复;第二检测模块44,用于在向目标总线发送恢复指令后,通过第一目标检测进程确定目标总线的工作状态,并依据检测结果确定目标总线是否异常。需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
在本申请的一些实施例中,第一检测模块40在创建第一目标检测进程前,还用于响应目标对象的选择指令,从目标服务器对应的至少一条总线中确定目标总线。
在本申请的一些实施例中,第一检测模块40创建第一目标检测进程的步骤包括:创建第一目标检测进程,其中,第一目标检测进程的进程类型包括数据总线服务进程;在第一目标检测进程中创建第一目标对象,其中,第一目标对象中设置有定时器事件源,第一目标对象用于通过定时器事件源按照预设频率对目标总线进行轮询监控。
在本申请的一些实施例中,第一检测模块40在第二目标检测进程中创建目标对象的步骤包括:在第二目标检测进程中创建第二目标对象;在第二目标对象中添加第一目标对象,其中,第一目标对象的对象类型为事件对象。
在本申请的一些实施例中,定时器事件源中的时钟类型包括以下至少之一:单调时钟,即时时钟,引导时间时钟。
在本申请的一些实施例中,第二目标检测进程和第一目标检测进程均运行在服务层中。
在本申请的一些实施例中,定时器事件源的事件源类型为异步事件源,对第一目标对象用于通过定时器事件源对目标总线进行异步等待轮询监控。
具体地,当目标总线为Openbmc服务器中的总线时,可以在服务器中创建一个dbus服务进程(也就是数据总线服务进程),然后在这个服务进程中创建一个数据总线对象(sdbus对象),并在数据总线对象中添加一个用于通过定时器事件源来按照预设频率对目标总线的工作状态进行轮询监控的sd_event_plus对象。
作为一种可选地实施方式,在创建目标进程时可以由执行总线检测方法的设备依据预设的规则自行设定,或者在响应目标对象的操作指令后设定。具体地,在目标进程是在响应目标对象的操作指令后设定的情况下,目标对象可以直接通过该设备的人机交互截面输入操作指令,或通过与该设备之间存在连接关系的其他设备来进行远程操作。
在本申请的一些实施例中,处理模块42通过目标寄存器设置目标总线执行挂死动作的步骤包括:在目标寄存器中写入目标指令,其中,目标指令用于指示目标总线中的目标时钟线和目标数据线执行挂死动作。
在本申请的一些实施例中,处理模块42在目标寄存器中写入目标指令的步骤之前,还可以通过目标寄存器,将目标总线设置为通用型输入输出模式。
在本申请的一些实施例中,第二检测模块44通过第一目标检测进程确定目标总线的工作状态的步骤包括:确定命令状态寄存器中的目标地址,其中,目标地址对应的目标数据用于表示目标总线的工作状态;依据目标地址从命令状态寄存器中获取目标数据;依据目标数据确定目标总线的工作状态,其中,工作状态包括:空闲状态、非空闲状态。
在本申请的一些实施例中,第二检测模块44依据检测结果确定目标总线是否异常的步骤包括:在检测结果指示工作状态为非空闲状态且处于非空闲状态的持续时长大于预设时长时,确认目标总线异常。
在本申请的一些实施例中,确认目标总线异常的步骤之后,第二检测模块44还可以通过目标总线的驱动层设置目标总线执行自动恢复动作。
在本申请的一些实施例中,目标总线包括目标数据线和目标时钟线,其中,第二检测模块44通过目标总线的驱动层设置目标总线执行自动恢复动作包括:通过驱动层在目标总线对应的系统控制单元寄存器中重新写入用于指示目标总线自恢复的数据,指示目标数据线执行自动恢复动作;以及,通过驱动层向与目标总线对应的命令状态寄存器发送预设数量个串行时钟电平信号,指示目标时钟线执行自动恢复动作。
在本申请的一些实施例中,第二检测模块44通过驱动层向与目标总线对应的命令状态寄存器发送预设数量个串行时钟电平信号的步骤包括:确定命令状态寄存器中与目标总线自恢复功能对应的寄存器地址;向寄存器地址发送预设数量个串行时钟电平信号。
另外,当第二检测模块44确定目标总线处于异常工作状态时,还可以先确定目标总线的异常原因,并根据异常原因来进行下一步的处理操作。具体地,当确定目标总线的异常原因为连接到目标总线上的从机故障时,可以先确定发生故障的从机位置,然后将从机位置发送给对应的运维人员,指示运维人员对从机进行维修。
在本申请的一些实施例中,上述目标检测进程可以设置为定期读取命令状态寄存器中对应比特位的数据,从而确定设备中目标总线的状态,并在确定发生异常时及时通知运维人员进行处理。
在本申请的一些实施例中,第二检测模块44还用于在应用层中设置目标监控函数,其中,所述目标监控函数用于监控所述目标总线对应的设备节点状态信息;通过所述目标监控函数记录所述设备节点状态信息,并生成所述设备节点状态信息对应的设备节点状态维护日志。
本申请的实施例还提供了一种如图5所示的计算机可读存储介质50,该计算机可读存储介质50中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤,例如,该计算机程序在运行时可执行如下总线检测方法:创建第一目标检测进程,其中,第一目标检测进程用于按照预设频率对目标总线进行轮询监控;通过目标寄存器设置目标总线处于挂死状态,并向目标总线发送恢复指令,其中,恢复指令用于指示目标总线从挂死状态恢复;在向目标总线发送恢复指令后,通过第一目标检测进程确定目标总线的工作状态,并依据检测结果确定目标总线是否异常。
在一些示例性实施例中,上述计算机可读存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
另外,如图5所示,上述计算机可读存储介质50还设置有数据接口52,电子设备或处理器等可通过该数据接口52从计算机可读存储介质50中读取或写入数据。
本申请的实施例还提供了一种如图6所示的电子设备,包括存储器60和处理器62,该存储器60中存储有计算机程序,该处理器62被设置为运行计算机程序以执行上述任一项方法实施例中的步骤,例如,该处理器62在运行计算机程序时可以执行如下总线检测方法:创建第一目标检测进程,其中,第一目标检测进程用于按照预设频率对目标总线进行轮询监控;通过目标寄存器设置目标总线为挂死状态,并向目标总线发送恢复指令,其中,恢复指令用于指示目标总线从挂死状态恢复;在向目标总线发送恢复指令后,通过第一目标检测进程确定目标总线的工作状态,并依据检测结果确定目标总线是否异常。
在一些示例性实施例中,上述电子设备还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器62连接,该输入输出设备和上述处理器62连接。
本实施例中的具体示例可以参考上述实施例及示例性实施方式中所描述的示例,本实施例在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对相关技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (21)

1.一种总线检测方法,其特征在于,包括:
创建第一目标检测进程,其中,所述第一目标检测进程用于按照预设频率对目标总线进行轮询监控;
通过目标寄存器设置所述目标总线为挂死状态,并向所述目标总线发送恢复指令,其中,所述恢复指令用于指示所述目标总线从挂死状态恢复;
在向所述目标总线发送恢复指令后,通过所述第一目标检测进程确定所述目标总线的工作状态,并依据检测结果确定所述目标总线是否异常。
2.根据权利要求1所述的总线检测方法,其特征在于,所述通过所述第一目标检测进程确定所述目标总线的工作状态的步骤包括:
确定命令状态寄存器中的目标地址,其中,所述目标地址对应的目标数据用于表示所述目标总线的工作状态;
依据所述目标地址从所述命令状态寄存器中获取目标数据;
依据所述目标数据确定所述目标总线的工作状态,其中,所述工作状态包括:空闲状态、非空闲状态。
3.根据权利要求2所述的总线检测方法,其特征在于,所述依据检测结果确定所述目标总线是否异常的步骤包括:
在所述检测结果指示所述工作状态为非空闲状态且处于所述非空闲状态的持续时长大于预设时长时,确认所述目标总线异常。
4.根据权利要求3所述的总线检测方法,其特征在于,所述确认所述目标总线异常的步骤之后,所述总线检测方法还包括:
通过目标总线的驱动层指示所述目标总线自动恢复。
5.根据权利要求4所述的总线检测方法,其特征在于,所述目标总线包括目标数据线和目标时钟线,其中,所述通过目标总线的驱动层设置所述目标总线执行自动恢复动作包括:
通过所述驱动层在所述目标总线对应的系统控制单元寄存器中重新写入用于指示所述目标总线自恢复的数据;
在重新写入用于指示所述目标总线自恢复的数据后,通过所述驱动层向与所述目标总线对应的命令状态寄存器发送预设数量个串行时钟电平信号。
6.根据权利要求4所述的总线检测方法,其特征在于,所述通过所述驱动层向与所述目标总线对应的命令状态寄存器发送预设数量个串行时钟电平信号的步骤包括:
确定所述命令状态寄存器中与所述目标总线自恢复功能对应的寄存器地址;
向所述寄存器地址发送所述预设数量个串行时钟电平信号。
7.根据权利要求1所述的总线检测方法,其特征在于,所述创建第一目标检测进程的步骤包括:
创建第二目标检测进程,其中,所述第二目标检测进程的进程类型包括数据总线服务进程;
在所述第二目标检测进程中创建第一目标对象,得到所述第一目标检测进程,其中,所述第一目标对象中设置有定时器事件源,所述第一目标对象用于通过所述定时器事件源按照所述预设频率对所述目标总线进行轮询监控。
8.根据权利要求7所述的总线检测方法,其特征在于,所述在所述第二目标检测进程中创建目标对象的步骤包括:
在所述第二目标检测进程中创建第二目标对象;
在所述第二目标对象中添加所述第一目标对象,其中,所述第一目标对象的对象类型为事件对象。
9.根据权利要求7所述的总线检测方法,其特征在于,所述定时器事件源中的时钟类型包括以下至少之一:单调时钟,即时时钟,引导时间时钟。
10.根据权利要求7所述的总线检测方法,其特征在于,所述第二目标检测进程和所述第一目标检测进程均运行在服务层中。
11.根据权利要求7所述的总线检测方法,其特征在于,所述定时器事件源的事件源类型为异步事件源,对所述第一目标对象用于通过所述定时器事件源对所述目标总线进行异步等待轮询监控。
12.根据权利要求1所述的总线检测方法,其特征在于,所述通过目标寄存器设置所述目标总线为挂死状态的步骤包括:
在所述目标寄存器中写入目标指令,其中,所述目标指令用于修改所述目标寄存器中与所述目标总线对应的寄存器数据,所述目标寄存器中的寄存器数据用于设定所述目标总线的工作状态。
13.根据权利要求12所述的总线检测方法,其特征在于,所述在所述目标寄存器中写入目标指令的步骤之前,所述总线检测方法还包括:
通过所述目标寄存器,将所述目标总线设置为通用型输入输出模式。
14.根据权利要求1所述的总线检测方法,其特征在于,所述目标寄存器为与所述目标总线对应的系统控制单元寄存器。
15.根据权利要求1所述的总线检测方法,其特征在于,所述总线检测方法还包括:
在应用层中设置目标监控函数,其中,所述目标监控函数用于监控所述目标总线对应的设备节点状态信息;
通过所述目标监控函数记录所述设备节点状态信息,并生成所述设备节点状态信息对应的设备节点状态维护日志。
16.根据权利要求1所述的总线检测方法,其特征在于,在所述创建第一目标检测进程的步骤之前,所述总线检测方法还包括:响应目标对象的选择指令,从目标服务器对应的至少一条总线中确定所述目标总线。
17.一种服务器,其特征在于,包括基板管理控制器,目标总线,第一寄存器,第二寄存器,其中,
所述基板管理控制器,被配置为执行创建第一目标检测进程,其中,所述第一目标检测进程用于按照预设频率对目标总线进行轮询监控;通过第一寄存器设置所述目标总线为挂死状态,并向所述目标总线发送恢复指令,其中,所述恢复指令用于指示所述目标总线从挂死状态恢复;在向所述目标总线发送恢复指令后,通过所述第一目标检测进程和所述第二寄存器确定所述目标总线的工作状态,并依据检测结果确定所述目标总线是否异常。
18.根据权利要求17所述的服务器,其特征在于,所述目标总线的数量为多条,所述基板管理控制器还用于确定多条所述目标总线中的每条目标总线在所述第一寄存器和所述第二寄存器中对应的寄存器地址信息。
19.一种总线检测装置,其特征在于,包括:
第一检测模块,用于创建第一目标检测进程,其中,所述第一目标检测进程用于按照预设频率对目标总线进行轮询监控;
处理模块,用于通过目标寄存器设置所述目标总线为挂死状态,并向所述目标总线发送恢复指令,其中,所述恢复指令用于指示所述目标总线从挂死状态恢复;
第二检测模块,用于在向所述目标总线发送恢复指令后,通过所述第一目标检测进程确定所述目标总线的工作状态,并依据检测结果确定所述目标总线是否异常。
20.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被处理器执行时实现所述权利要求1至16任一项中所述的总线检测方法的步骤。
21.一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现所述权利要求1至16任一项中所述的总线检测方法的步骤。
CN202211529449.8A 2022-12-01 2022-12-01 总线检测方法、装置、服务器及电子设备 Active CN115599617B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211529449.8A CN115599617B (zh) 2022-12-01 2022-12-01 总线检测方法、装置、服务器及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211529449.8A CN115599617B (zh) 2022-12-01 2022-12-01 总线检测方法、装置、服务器及电子设备

Publications (2)

Publication Number Publication Date
CN115599617A true CN115599617A (zh) 2023-01-13
CN115599617B CN115599617B (zh) 2023-07-21

Family

ID=84852151

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211529449.8A Active CN115599617B (zh) 2022-12-01 2022-12-01 总线检测方法、装置、服务器及电子设备

Country Status (1)

Country Link
CN (1) CN115599617B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117331872A (zh) * 2023-11-30 2024-01-02 珠海市芯动力科技有限公司 防止总线死锁的方法及相关装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100180162A1 (en) * 2009-01-15 2010-07-15 International Business Machines Corporation Freeing A Serial Bus Hang Condition by Utilizing Distributed Hang Timers
CN103645975A (zh) * 2013-11-28 2014-03-19 华为技术有限公司 一种异常恢复的方法及串行总线传输装置
US20180203779A1 (en) * 2017-01-17 2018-07-19 Quanta Computer Inc. Bus hang detection and find out
CN113778734A (zh) * 2021-09-02 2021-12-10 上海砹芯科技有限公司 芯片、芯片总线的检测系统、检测方法及存储介质
CN114003445A (zh) * 2021-09-29 2022-02-01 苏州浪潮智能科技有限公司 Bmc的i2c监控功能测试方法、系统、终端及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100180162A1 (en) * 2009-01-15 2010-07-15 International Business Machines Corporation Freeing A Serial Bus Hang Condition by Utilizing Distributed Hang Timers
CN103645975A (zh) * 2013-11-28 2014-03-19 华为技术有限公司 一种异常恢复的方法及串行总线传输装置
US20180203779A1 (en) * 2017-01-17 2018-07-19 Quanta Computer Inc. Bus hang detection and find out
CN113778734A (zh) * 2021-09-02 2021-12-10 上海砹芯科技有限公司 芯片、芯片总线的检测系统、检测方法及存储介质
CN114003445A (zh) * 2021-09-29 2022-02-01 苏州浪潮智能科技有限公司 Bmc的i2c监控功能测试方法、系统、终端及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117331872A (zh) * 2023-11-30 2024-01-02 珠海市芯动力科技有限公司 防止总线死锁的方法及相关装置
CN117331872B (zh) * 2023-11-30 2024-02-09 珠海市芯动力科技有限公司 防止总线死锁的方法及相关装置

Also Published As

Publication number Publication date
CN115599617B (zh) 2023-07-21

Similar Documents

Publication Publication Date Title
US6697963B1 (en) Method of updating a system environmental setting
US8910172B2 (en) Application resource switchover systems and methods
US10698788B2 (en) Method for monitoring server, and monitoring device and monitoring system using the same
US6065053A (en) System for resetting a server
CN107479721B (zh) 远程多计算机切换技术的存储装置、系统及方法
US6330690B1 (en) Method of resetting a server
US6088816A (en) Method of displaying system status
US10049010B2 (en) Method, computer, and apparatus for migrating memory data
US6138250A (en) System for reading system log
JP2017517060A (ja) 障害処理方法、関連装置、およびコンピュータ
US7318171B2 (en) Policy-based response to system errors occurring during OS runtime
WO2018095107A1 (zh) 一种bios程序的异常处理方法及装置
US11157373B2 (en) Prioritized transfer of failure event log data
WO2012046293A1 (ja) 障害監視装置、障害監視方法及びプログラム
US11438249B2 (en) Cluster management method, apparatus and system
TW201828071A (zh) 開關裝置及偵測積體電路匯流排之方法
CN112596568B (zh) 一种读取电压调节器报错信息的方法、系统、设备及介质
JP2017091077A (ja) 擬似故障の発生プログラム、発生方法、及び発生装置
CN114600088A (zh) 使用基板管理控制器的服务器状态监测系统和方法
CN115599617B (zh) 总线检测方法、装置、服务器及电子设备
CN114003445A (zh) Bmc的i2c监控功能测试方法、系统、终端及存储介质
CN114189429A (zh) 一种服务器集群故障的监测系统、方法、装置及介质
JP2013109722A (ja) コンピュータ、コンピュータシステム、および障害情報管理方法
CN113742113B (zh) 一种嵌入式系统健康管理方法、设备及储存介质
CN114138600A (zh) 一种固件关键信息的存储方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant