CN116126571A - 故障诊断方法、故障监测电路和服务器 - Google Patents

故障诊断方法、故障监测电路和服务器 Download PDF

Info

Publication number
CN116126571A
CN116126571A CN202211595085.3A CN202211595085A CN116126571A CN 116126571 A CN116126571 A CN 116126571A CN 202211595085 A CN202211595085 A CN 202211595085A CN 116126571 A CN116126571 A CN 116126571A
Authority
CN
China
Prior art keywords
information
server
fault
circuit
logic device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211595085.3A
Other languages
English (en)
Inventor
任凤臣
毛峰
秦晨
邹小兵
晏显栋
刘源
杜晟劼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongke Controllable Information Industry Co Ltd
Original Assignee
Zhongke Controllable Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongke Controllable Information Industry Co Ltd filed Critical Zhongke Controllable Information Industry Co Ltd
Priority to CN202211595085.3A priority Critical patent/CN116126571A/zh
Publication of CN116126571A publication Critical patent/CN116126571A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2205Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computer Hardware Design (AREA)
  • Hardware Redundancy (AREA)

Abstract

本申请涉及一种故障诊断方法、故障监测电路和服务器。该方法包括:通过故障监测电路分别获取至少一个服务器中处理器的监测信息,并根据各服务器中处理器的监测信息,对应确定各服务器的故障诊断结果。采用上述方法可以通过通信方式直接获取服务器中处理器的监测信息,然后通过服务器的中处理器的监测信息确定服务器的故障诊断结果,避免了人工参与故障诊断过程,减少人工参与误差,进而提高确定的故障诊断结果的准确性,并提高了故障诊断效率;同时,该方法能够获取到准确性较高的故障诊断结果,从而还能够为精准修复故障作参考依据;再者,该方法不需要搭建故障环境和复现故障,就能够对故障进行诊断,从而也能够提高故障诊断的速度和效率。

Description

故障诊断方法、故障监测电路和服务器
技术领域
本申请涉及服务器技术领域,特别是涉及一种故障诊断方法、故障监测电路和服务器。
背景技术
随着计算机技术的发展,服务器的应用领域越来越广泛。目前,服务器出现故障的概率也越来越大,若无法诊断服务器故障以修复故障,这会对后期服务器运行的稳定性带来一定影响。因此,对服务器的故障进行诊断越来越引起行业内的关注。
传统技术中,主要是从机架上将服务器取下来,然后将服务器开盖后再对服务器的故障进行诊断。但是,传统技术会导致故障诊断效率较低。
发明内容
基于此,有必要针对上述技术问题,提供一种故障诊断方法、故障监测电路和服务器,能够提高故障诊断效率。
第一方面,本申请实施例提供了一种故障诊断方法,该方法包括:
通过故障监测电路分别获取至少一个服务器中处理器的监测信息;其中,故障监测电路与各服务器之间通过可拆卸接口通信连接;
根据各服务器中处理器的监测信息,对应确定各服务器的故障诊断结果。
本申请实施例中的技术方案,可以通过故障监测电路分别获取至少一个服务器中处理器的监测信息,并根据各服务器中处理器的监测信息,对应确定各服务器的故障诊断结果。采用上述方法可以通过有线通信方式直接获取服务器中处理器的监测信息,然后通过服务器的中处理器的监测信息确定服务器的故障诊断结果,避免了人工参与故障诊断过程,减少人工参与误差,进一步提高确定的故障诊断结果的准确性,并且提高了故障诊断效率;同时,该方法在故障诊断的过程中,不需要用户将服务器从机架上取下开盖操作,从而能够提高故障诊断的速度和效率,并且还可以节省人力资源成本;另外,该方法能够获取到准确性较高的故障诊断结果,从而还能够为精准修复故障作参考依据;再者,该方法不需要搭建故障环境和复现故障,就能够对故障进行诊断,从而也能够提高故障诊断的速度和效率。
在其中一个实施例中,故障监测电路包括逻辑器件和信息采集接口电路,逻辑器件与各服务器通过可拆卸接口通信连接,信息采集接口电路与逻辑器件连接;
通过故障监测电路分别获取至少一个服务器中处理器的监测信息,包括:
通过逻辑器件触发各服务器进入目标诊断模式;
在各服务器处于目标诊断模式下,通过逻辑器件和信息采集接口电路采集各服务器中处理器的监测信息。
本申请实施例中的技术方案,可以通过逻辑器件触发各服务器进入目标诊断模式,并在各服务器处于目标诊断模式下,通过逻辑器件和信息采集接口电路采集各服务器中处理器的监测信息;该方法可以触发服务器内的处理器处于不同的诊断模式,并逐个获取服务器内处理器中的不同器件的监测信息,进一步能够根据处理器中的不同器件的监测信息对处理器中的不同器件进行故障诊断,以准确诊断出服务器内处理器中的故障器件,使得故障定位更加精细。
在其中一个实施例中,信息采集接口电路包括信息转换器和传输接口,信息转换器与逻辑器件之间通过多个不同的信息接口连接,传输接口与信息转换器连接;
通过逻辑器件和信息采集接口电路采集各服务器中处理器的监测信息,包括:
将各监测信息经过逻辑器件后,通过目标信息接口传入信息转换器,并经过信息转换器进入传输接口,以完成各监测信息的采集;目标信息接口为与目标诊断模式对应的信息接口。
本申请实施例中的技术方案,可以将各监测信息经过逻辑器件后,通过目标信息接口传入信息转换器,并经过信息转换器进入传输接口,以完成各监测信息的采集;该方法可以通过故障监测电路中的信息转换器,将逻辑器件接收到的各服务器中处理器的监测信息转换成符合输出接口输出格式的信息后输出,以提高各服务器中处理器的监测信息输出的成功率,也即故障监测电路对监测信息的采集成功率,避免发生监测信息不符合输出接口输出格式的要求导致故障监测电路漏采集的情况。
在其中一个实施例中,故障监测电路还包括交互按键,交互按键与逻辑器件连接;通过逻辑器件触发各服务器进入目标诊断模式,包括:
通过触发交互按键产生目标诊断模式的执行指令,以使执行指令通过逻辑器件触发各服务器进入目标诊断模式。
本申请实施例中的技术方案,可以通过触发交互按键产生目标诊断模式的执行指令,以使执行指令通过逻辑器件触发各服务器进入目标诊断模式;该方法可以使通过触发交互按键就能够自动化控制服务器进入不同的诊断模式,操作比较简单,并且为了控制服务器进入不同的诊断模式,也不需要用户具备较高的专业能力,对用户的要求较低,从而使得该方法的广泛适用性较大。
在其中一个实施例中,上述方法还包括:
若交互按键的触发次数为第一值,则目标诊断模式为各处理器中的中央处理器的诊断模式;
若交互按键的触发次数为第二值,则目标诊断模式为各处理器中的基板管理控制器的诊断模式;
若交互按键的触发次数为第三值,则目标诊断模式为混合诊断模式;混合诊断模式表示各处理器中的中央处理器和基板管理控制器均混合的诊断模式。
本申请实施例中的技术方案,可以通过交互按键的触发次数,确定对应的目标诊断模式,以使逻辑器件控制服务器中的处理器进入目标诊断模式;该方法仅通过服务器外的硬件结构,即交互按键,采用一键触发的方式就能够快速使服务器中的处理器进入不同的诊断模式,进一步能够提高故障诊断的速度和效率,并且采用上述方法切换服务器中的处理器进入不同的诊断模式比较简单。
在其中一个实施例中,故障监测电路还包括显示电路,上述方法还包括:
在通过触发交互按键产生目标诊断模式的执行指令后,通过显示电路显示第一标识信息;第一标识信息表示各服务器当前处于目标诊断模式下;或者,
在通过预设方式触发交互按键后,通过显示电路显示第二标识信息,第二标识信息表示各服务器内部的故障硬件。
本申请实施例中的技术方案,可以通过故障监测电路中的显示电路显示服务器内处理器所处的目标诊断模式对应的标识信息,或服务器内故障硬件对应的标识信息,从而能够让用户直观、快速确定服务器内的故障硬件,以快速对故障硬件进行定位修复;同时,还可以通过故障监测电路中的显示电路显示服务器所处的诊断模式,以使用户能够根据当前诊断模式快速切换下一目标诊断模式。
第二方面,本申请实施例提供了一种故障监测电路,该故障监测电路与至少一个服务器通过可拆卸接口通信连接;
故障监测电路,用于分别获取各服务器中处理器的监测信息;各服务器中处理器的监测信息用于确定各服务器的故障诊断结果。
本申请实施例中的技术方案,可以与服务器之间通过可拆卸接口建立通信连接,以获取服务器内处理器的监测信息。上述故障监测电路通过可拆卸接口的设计方式可以使得故障监测电路与任何型号的服务器均能通信连接,从而提高了故障监测电路的广泛适用性;同时,上述故障监测电路与服务器通过通信连接,以使故障监测电路获取到服务器内处理器的监测信息,操作方法简单,并且获取过程不需要人工参与,还可以提高服务器内处理器的监测信息的获取效率,进一步在监测信息获取效率较高的基础上,还可以提高故障诊断效率;另外,采用上述故障监测电路可以不需要搭建故障环境和复现故障,使得计算机设备就能够获取到服务器内处理器的监测信息,进而通过服务器内处理器的监测信息对故障进行诊断,从而也能够提高故障诊断的速度和效率。
在其中一个实施例中,故障监测电路包括逻辑器件和信息采集接口电路;逻辑器件与各服务器通过可拆卸接口通信连接,信息采集接口电路与逻辑器件连接;
逻辑器件,用于触发各服务器进入目标诊断模式;
信息采集接口电路用于采集各服务器中处理器的监测信息。
本申请实施例中的技术方案,可以通过逻辑器件触发各服务器进入不同的诊断模式,并逐个获取服务器内处理器中的不同器件的监测信息,进一步能够根据处理器中的不同器件的监测信息对处理器中的不同器件进行故障诊断,以准确诊断出服务器内处理器中的故障器件,使得故障定位更加精细。
在其中一个实施例中,信息采集接口电路包括信息转换器和传输接口,信息转换器与逻辑器件之间通过多个不同的信息接口连接,传输接口与信息转换器连接;
逻辑器件,用于将各监测信息通过目标信息接口传入信息转换器,并经过信息转换器进入传输接口,以完成各监测信息的采集;目标信息接口为与目标诊断模式对应的信息接口。
本申请实施例中的技术方案,可以通过信息转换器将逻辑器件接收到的各服务器中处理器的监测信息,转换成符合输出接口输出格式的信息后输出,以提高各服务器中处理器的监测信息输出的成功率,也即故障监测电路对监测信息的采集成功率,避免发生监测信息不符合输出接口输出格式的要求导致故障监测电路漏采集的情况;同时,故障监测电路中的传输接口设置于服务器的箱耳上,以方便故障监测电路通过传输接口与计算机设备进行通信连接,使故障监测电路通过传输接口将监测信息发送给计算机设备,进一步方便计算机设备根据接收到的监测信息进行故障诊断,使得整个故障诊断过程简单化。
在其中一个实施例中,故障监测电路还包括交互按键,交互按键与逻辑器件连接;
交互按键,用于触发目标诊断模式的执行指令,以使执行指令通过逻辑器件触发各服务器进入目标诊断模式。
本申请实施例中的技术方案,可以通过触发交互按键产生目标诊断模式的执行指令,以使执行指令通过逻辑器件触发各服务器进入目不同的诊断模式,操作比较简单,并且为了控制服务器进入不同的诊断模式,也不需要用户具备较高的专业能力,对用户的要求较低,从而使得该故障监测电路的广泛适用性较大。
在其中一个实施例中,故障监测电路还包括显示电路,显示电路与各处理器连接;
显示电路用于在通过触发交互按键产生目标诊断模式的执行指令后,显示第一标识信息;第一标识信息表示各服务器当前处于目标诊断模式下;或者,在通过预设方式触发交互按键后,显示第二标识信息,第二标识信息表示各服务器内部的故障硬件。
本申请实施例中的技术方案,可以通过显示电路显示服务器内处理器所处的目标诊断模式对应的标识,或服务器内故障硬件对应的标识,从而能够让用户直观、快速确定服务器内的故障硬件,以快速对故障硬件进行定位修复;同时,还可以通过显示电路显示服务器所处的诊断模式,以使用户能够根据当前诊断模式快速切换下一目标诊断模式。
在其中一个实施例中,显示电路包括驱动电路和数码管,驱动电路与数码管连接;
驱动电路,用于将各服务器中的处理器输出的目标诊断模式的执行信号转换成第一输出信号输入至数码管,或者,将各服务器中的处理器输出的故障硬件的状态信息转换成第二输出信号输入至数码管;
数码管,用于根据第一输出信号输出第一标识信息,或,根据第二输出信号输出第二标识信息。
本申请实施例中的技术方案,可以通过数码管显示服务器内处理器所处的目标诊断模式对应的标识信息,或服务器内故障硬件对应的标识信息,从而能够让用户直观、快速确定服务器内的故障硬件,以快速对故障硬件进行定位修复;同时,还可以通过显示电路显示服务器所处的诊断模式,以使用户能够根据当前诊断模式快速切换下一目标诊断模式。
第三方面,本申请实施例提供了一种服务器,该服务器包括上述第二方面中任一实施例的故障监测电路,故障监测电路设置在服务器上。
第四方面,本申请实施例提供了一种故障诊断装置,该装置包括:
监测信息获取模块,用于通过故障监测电路分别获取至少一个服务器中处理器的监测信息;其中,故障监测电路与各服务器之间通过可拆卸接口通信连接;
诊断结果确定模块,用于根据各服务器中处理器的监测信息,对应确定各服务器的故障诊断结果。
第五方面,本申请实施例提供了一种计算机设备,计算机设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述第一方面中任一实施例的方法的步骤。
第六方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述第一方面中任一实施例的方法的步骤。
第七方面,本申请实施例还提供了一种计算机程序产品,计算机程序产品包括计算机程序,该计算机程序被处理器执行时实现上述第一方面中任一实施例的方法的步骤。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
图1为一个实施例中故障诊断方法的应用环境图;
图2为一实施例中故障诊断方法的流程示意图;
图3为另一实施例中故障诊断方法的流程示意图;
图4为一个实施例中故障诊断装置的结构框图;
图5为一个实施例中服务器与故障监测电路之间的结构图;
图6为一个实施例中服务器与故障监测电路之间的结构图;
图7为另一个实施例中服务器与故障监测电路之间的结构图;
图8为另一个实施例中服务器与故障监测电路之间的结构图;
图9为另一个实施例中服务器与故障监测电路之间的结构图;
图10为另一个实施例中服务器与故障监测电路之间的结构图;
图11为另一个实施例中服务器与故障监测电路之间的结构图;
图12为另一个实施例中服务器与故障监测电路之间的结构图;
图13为另一个实施例中单节点服务器与故障监测电路之间的结构图;
图14为另一个实施例中多节点服务器与故障监测电路之间的结构图;
图15为一个实施例中服务器的内部结构图。
附图标记说明:
故障监测电路              10;    逻辑器件              11;
信息采集接口电路          12;    信息转换器            121;
传输接口                  122;   交互按键              13;
显示电路                  14;    驱动电路              141;
数码管                    142;   服务器                20;
处理器                    21。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在服务器的故障修复领域,主要是获取准确度较高的故障诊断结果,然后基于故障诊断结果实现故障修复,使服务器能够快速正常运行,从而避免服务器影响业务的处理速度。
相关技术中,主要是从机架上将服务器取下来,然后将服务器开盖后再对服务器进行故障诊断。但是,采用相关技术对服务器进行故障诊断,会导致故障诊断效率较低。基于此,本申请实施例提供了一种故障诊断方法,能够提高对服务器的故障诊断效率,以进一步提高服务器的故障修复速度。
上述故障诊断方法,可以适用于图1所示的故障诊断系统,该故障诊断系统包括服务器和计算机设备,该服务器中包括故障监测电路,该服务器与计算机设备可以通过线缆连接通信,并且在本申请实施例中,服务器与计算机设备通过线缆连接实际上可以理解为服务器中的故障监测电路的可拆卸接口与计算机设备通过线缆连接。其中,上述服务器可以为可以但不限于是独立的服务器或者是由多个服务器组成的服务器集群来实现,本实施例对服务器的具体形式不做限定;计算机设备可以但不限于是各种个人计算机、笔记本电脑、智能手机和平板电脑。下述实施例中将具体介绍故障诊断方法的具体过程,并且以执行主体为计算机设备来介绍故障诊断方法的具体过程。
如图2所示,为本申请实施例提供的故障诊断方法的流程示意图,该方法可以包括以下步骤:
S100、通过故障监测电路分别获取至少一个服务器中处理器的监测信息。其中,故障监测电路与各服务器之间通过可拆卸接口通信连接。
具体地,上述故障监测电路可以设置于服务器外,当然,还可以设置于服务器上;这里设置于服务器上可以理解为故障监测电路中的部分电路设置于服务器内或外,另外一部分电路设置于服务器的外表面上。可选地,故障监测电路可以与至少一个服务器连接,每个服务器与故障监测电路的连接方式相同,其中,故障监测电路与各服务器之间通过可拆卸接口通信连接。
在本申请实施例中,服务器内设置有处理器,该处理器可以包括中央处理器(central processing unit,CPU)、基板管理控制器(Bulk Molding Compound,BMC)和/或深度计算单元(Drive Control Unit,DCU)等等。
其中,计算机设备与故障监测电路通过线缆通信连接,然后计算机设备可以通过线缆接收故障监测电路分别获取到的至少一个服务器中处理器的监测信息。可选地,处理器的监测信息可以理解为处理器在运行过程中的调试信息。可选地,不同服务器内的处理器产生的监测信息可以相同,也可以不相同。
S200、根据各服务器中处理器的监测信息,对应确定各服务器的故障诊断结果。
具体地,计算机设备可以基于上文步骤获取到的各服务器中处理器的监测信息,对应确定各服务器的故障诊断结果。可选地,上述故障诊断结果可以为处理器发生故障的具体位置和/或故障类型等等。
一实施例中,根据各服务器中处理器的监测信息确定各服务器的故障诊断结果的方式可以是预先训练一种算法模型,然后将依次各服务器中处理器的监测信息输入至算法模型中,该算法模型依次输出各服务器的故障诊断结果。
又一实施例中,根据各服务器中处理器的监测信息确定各服务器的故障诊断结果的方式还可以是分别在映射关系中查找与各服务器中处理器的监测信息相同的监测信息,然后从映射关系中获取查找到的监测信息对应的故障诊断结果确定为各服务器的故障诊断结果。可选地,映射关系中可以包括不同服务器内不同处理器的监测信息、各服务器对应的故障诊断结果和这两者之间的对应关系。
本申请实施例提供的故障诊断方法,可以通过故障监测电路分别获取至少一个服务器中处理器的监测信息,并根据各服务器中处理器的监测信息,对应确定各服务器的故障诊断结果。采用上述方法可以通过有线通信方式直接获取服务器中处理器的监测信息,然后通过服务器的中处理器的监测信息确定服务器的故障诊断结果,避免了人工参与故障诊断过程,减少人工参与误差,进一步提高确定的故障诊断结果的准确性,并且提高了故障诊断效率;同时,该方法在故障诊断的过程中,不需要用户将服务器从机架上取下开盖操作,从而能够提高故障诊断的速度和效率,并且还可以节省人力资源成本;另外,该方法能够获取到准确性较高的故障诊断结果,从而还能够为精准修复故障作参考依据;再者,该方法不需要搭建故障环境和复现故障,就能够对故障进行诊断,从而也能够提高故障诊断的速度和效率。
由于服务器中处理器包括CPU、BMC和/或DCU等等,因此需要对处理器设置对应的诊断模式后,才能获取到服务器对应的监测信息,下面对如何获取服务器的监测信息进行说明。在一实施例中,故障监测电路包括逻辑器件和信息采集接口电路,逻辑器件与各服务器通过可拆卸接口通信连接,信息采集接口电路与逻辑器件连接;如图3所示,上述S100中通过故障监测电路分别获取至少一个服务器中处理器的监测信息的步骤,可以通过以下方式实现:
S110、通过逻辑器件触发各服务器进入目标诊断模式。
其中,故障监测电路中逻辑器件与各服务器内的处理器通过可拆卸接口通信连接。可选地,计算机设备可以通过故障监测电路中的逻辑器件触发与逻辑器件连接的各服务器进入目标诊断模式,也可以理解的是,故障监测电路中的逻辑器件可以接收并响应用户输入的目标诊断模式请求指令,控制与逻辑器件连接的各服务器进入目标诊断模式。可选地,用户向逻辑器件输入目标诊断模式请求指令的方式可以为键盘、语音或手势等方式。
在本申请实施例中,上述目标诊断模式可以包括多个不同诊断模式,不同诊断模式表示服务器中处理器会向逻辑器件输出不同的监测信息,该监测信息可以对应处理器中的CPU、BMC和/或DCU对应的监测信息。对应地,控制与逻辑器件连接的各服务器进入目标诊断模式可以理解为控制各服务器中处理器包括的CPU、BMC和/或DCU阻止向逻辑器件输出监测信息。
若逻辑器件触发处理器中的CPU进入诊断模式,此时逻辑器件可以控制关闭与处理器中的BMC和DCU之间通信连接的开关,以阻止接收BMC和DCU向外输出的监测信息;若逻辑器件触发处理器中的BMC进入诊断模式,此时逻辑器件可以控制关闭与处理器中的CPU和DCU之间通信连接的开关,以阻止接收CPU和DCU向外输出的监测信息;若逻辑器件触发处理器中的DCU进入诊断模式,此时逻辑器件可以控制关闭与处理器中的CPU和BMC之间通信连接的开关,以阻止接收CPU和BMC向外输出的监测信息;若逻辑器件触发处理器中的CPU和BMC进入诊断模式,此时逻辑器件可以控制关闭与处理器中的DCU之间通信连接的开关,以阻止接收DCU向外输出的监测信息;若逻辑器件触发处理器中的CPU和DCU进入诊断模式,此时逻辑器件可以控制关闭与处理器中的BMC之间通信连接的开关,以阻止接收BMC向外输出的监测信息;若逻辑器件触发处理器中的BMC和DCU进入诊断模式,此时逻辑器件可以控制关闭与处理器中的CPU之间通信连接的开关,以阻止接收CPU向外输出的监测信息;若逻辑器件触发处理器中的CPU、BMC和DCU均进入诊断模式,此时,逻辑器件可以控制开启与处理器中的CPU、BMC和DCU之间通信连接的开关,以接收CPU、BMC和DCU向外输出的监测信息。
S120、在各服务器处于目标诊断模式下,通过逻辑器件和信息采集接口电路采集各服务器中处理器的监测信息。
其中,计算机设备通过故障监测电路中的逻辑器件,在触发各服务器处于目标诊断模式时,可以通过逻辑器件和信息采集接口电路采集各服务器中处理器的监测信息。
本申请实施例中的技术方案,可以通过逻辑器件触发各服务器进入目标诊断模式,并在各服务器处于目标诊断模式下,通过逻辑器件和信息采集接口电路采集各服务器中处理器的监测信息;该方法可以触发服务器内的处理器处于不同的诊断模式,并逐个获取服务器内处理器中的不同器件的监测信息,进一步能够根据处理器中的不同器件的监测信息对处理器中的不同器件进行故障诊断,以准确诊断出服务器内处理器中的故障器件,使得故障定位更加精细。
下面对上述通过逻辑器件和信息采集接口电路采集各服务器中处理器的监测信息的过程进行说明。在一实施例中,上述信息采集接口电路包括信息转换器和传输接口,信息转换器与逻辑器件之间通过多个不同的信息接口连接,传输接口与信息转换器连接;上述S120中的步骤,可以包括:将各监测信息经过逻辑器件后,通过目标信息接口传入信息转换器,并经过信息转换器进入传输接口,以完成各监测信息的采集;目标信息接口为与目标诊断模式对应的信息接口。
在本申请实施例中,信息转换器与逻辑器件之间可以通过一个或多个不同的信息接口连接,将任意一个或多个信息接口可以确定为目标信息接口,与目标诊断模式对应的信息接口可以为一个或多个。其中,每个信息接口仅能传输一种类型的监测信息。
可选地,上述信息转换器可以为视频图形阵列(Video Graphics Array,VGA)接口转换器、高清晰度多媒体接口(High Definition Multimedia Interface,HDMI)转换器或数字视频接口(Digital Visual Interface,DVI)转换器等等,对应地,传输接口可以为VGA接口、HDMI接口或DVI接口等等。
这里需要说明的是,若信息转换器为VGA接口转换器时,信息转换器可以用于将监测信息转换成VGA协议的信息,对应地,传输接口用于将信息转换器输出的VGA协议的信息输出;若信息转换器为HDMI接口转换器时,信息转换器可以用于将监测信息转换成HDMI协议的信息,对应地,传输接口用于将信息转换器输出的HDMI协议的信息输出;若信息转换器为DVI接口转换器时,信息转换器可以用于将监测信息转换成DVI协议的信息,对应地,传输接口用于将信息转换器输出的DVI协议的信息输出。
其中,将各服务器中处理器在目标诊断模式下的监测信息经过故障监测电路中的逻辑器件后,通过目标信息接口传入故障监测电路中的信息转换器,并经过故障监测电路中的信息转换器进入传输接口,以使计算机设备通过故障监测电路完成各服务器中处理器的监测信息的采集。
本申请实施例中的技术方案,可以将各监测信息经过逻辑器件后,通过目标信息接口传入信息转换器,并经过信息转换器进入传输接口,以完成各监测信息的采集;该方法可以通过故障监测电路中的信息转换器,将逻辑器件接收到的各服务器中处理器的监测信息转换成符合输出接口输出格式的信息后输出,以提高各服务器中处理器的监测信息输出的成功率,也即故障监测电路对监测信息的采集成功率,避免发生监测信息不符合输出接口输出格式的要求导致故障监测电路漏采集的情况。
在一些场景中,可以基于交互按键使逻辑器件触发各服务器进入目标诊断模式,下面对上述通过逻辑器件触发各服务器进入目标诊断模式的过程进行说明。在一实施例中,故障监测电路还包括交互按键,交互按键与逻辑器件连接;上述S110中的步骤可以包括:通过触发交互按键产生目标诊断模式的执行指令,以使执行指令通过逻辑器件触发各服务器进入目标诊断模式。
在实际应用中,故障监测电路中的交互按键可以是以按钮形式设置的,还可以是以触摸屏的形式设置的。其中,若交互按键是以按钮形式设置的,则交互按键可以包括多个功能按钮,用户触发不同功能按钮时交互按键会产生不同诊断模式的执行指令,从而使逻辑器件控制各服务器中的处理器进入不同的诊断模式;若交互按键是以触摸屏的形式设置的,则交互按键可以包括多个可视化触摸功能控件,用户触发不同可视化触摸功能控件时交互按键会产生不同诊断模式的执行指令,从而使逻辑器件控制各服务器中的处理器进入不同的诊断模式。其中,故障监测电路中的交互按键与逻辑器件之间可以通信连接,以使交互按键向逻辑器件发送对应指令时,逻辑器件能够响应接收到的执行指令。可选地,不同诊断模式的执行指令用于指示逻辑器件控制各服务器中的处理器进入不同的诊断模式。
具体地,用户可以触发交互按键产生目标诊断模式的执行指令,之后交互按键可以将目标诊断模式的执行指令发送给逻辑器件,逻辑器件响应接收到的执行指令后控制各服务器中的处理器进入目标诊断模式。
本申请实施例中的技术方案,可以通过触发交互按键产生目标诊断模式的执行指令,以使执行指令通过逻辑器件触发各服务器进入目标诊断模式;该方法可以使通过触发交互按键就能够自动化控制服务器进入不同的诊断模式,操作比较简单,并且为了控制服务器进入不同的诊断模式,也不需要用户具备较高的专业能力,对用户的要求较低,从而使得该方法的广泛适用性较大。
在一些场景中,为了减小故障监测电路的体积,故障监测电路中的交互按键为一个按钮形式的硬件结构,且交互按键包括一个功能按钮,用户通过这一个功能按键可以触发交互按键产生不同诊断模式的执行指令,下面将介绍根据用户触发交互按键的次数控制各服务器中处理器处于不同诊断模式的过程进行说明。
在一实施例中,上述故障诊断方法还可以包括:若交互按键的触发次数为第一值,则目标诊断模式为各处理器中的中央处理器的诊断模式;若交互按键的触发次数为第二值,则目标诊断模式为各处理器中的基板管理控制器的诊断模式;若交互按键的触发次数为第三值,则目标诊断模式为混合诊断模式;混合诊断模式表示各处理器中的中央处理器和基板管理控制器均混合的诊断模式。
在实际应用中,交互按键可以根据用户触发自身的触发次数产生对应诊断模式的执行指令,进一步将对应诊断模式的执行指令发送给逻辑器件,逻辑器件响应接收到的执行指令后控制各服务器中的处理器进入对应诊断模式。在本申请实施例中,以处理器包括CPU和BMC为例进行说明。
具体地,若交互按键的触发次数为第一值时,交互按键可以产生中央处理器CPU诊断模式的执行指令,并将CPU诊断模式的执行指令发送给逻辑器件,逻辑器件响应接收到的CPU诊断模式的执行指令后控制各服务器中的CPU进入诊断模式;若交互按键的触发次数为第二值时,交互按键可以产生基板管理控制器BMC诊断模式的执行指令,并将BMC诊断模式的执行指令发送给逻辑器件,逻辑器件响应接收到的BMC诊断模式的执行指令后控制各服务器中的BMC进入诊断模式;若交互按键的触发次数为第三值时,交互按键可以产生混合诊断模式的执行指令,并将混合诊断模式的执行指令发送给逻辑器件,逻辑器件响应接收到的混合诊断模式的执行指令后控制各服务器中的CPU和BMC同时进入诊断模式。可选地,控制服务器中的CPU和/或BMC进入诊断模式可以理解为,控制CPU和/或BMC向逻辑器件输出监测信息,也就是未进入诊断模式时,逻辑器件无法接收到CPU和/或BMC输出的监测信息。
其中,上述第一值、第二值和第三值是预先设置的数值,三者不相等。其中,第一值可以为1,第二值可以为2,第三值可以为4,对应地,根据交互按键的不同触发次数可以产生不同诊断模式的执行指令;另外,第一值还可以为1,第二值可以为3,第三值可以为4,对这三者的数值与不同诊断模式之间的映射关系本申请实施例不做限定。但在实际应用中,为了方便用户控制触发交互按键的次数,可以将第一值、第二值和第三值分别设置为连续数值,避免出现第一值、第二值和第三值不连续导致触发混乱,以无法使交互按键产生目标诊断模式的执行指令。
本申请实施例中的技术方案,可以通过交互按键的触发次数,确定对应的目标诊断模式,以使逻辑器件控制服务器中的处理器进入目标诊断模式;该方法仅通过服务器外的硬件结构,即交互按键,采用一键触发的方式就能够快速使服务器中的处理器进入不同的诊断模式,进一步能够提高故障诊断的速度和效率,并且采用上述方法切换服务器中的处理器进入不同的诊断模式比较简单。
在一些场景中,为了让用户直观、快速了解服务器内的故障硬件和服务器所处的诊断模式,需要将服务器内的故障硬件的标识信息和服务器所处的诊断模式进行显示,以供用户方便查看。基于此,在一实施例中,故障监测电路还包括显示电路;上述方法还包括以下步骤:在通过触发交互按键产生目标诊断模式的执行指令后,通过显示电路显示第一标识信息,第一标识信息表示各服务器当前处于目标诊断模式下;或者,在通过预设方式触发交互按键后,通过显示电路显示第二标识信息,第二标识信息表示各服务器内部的故障硬件。
其中,在故障监测电路中的逻辑器件接收到交互按键发送的目标诊断模式的执行指令后,可以生成目标诊断模式对应的第一标识信息,然后将目标诊断模式对应的第一标识信息发送给故障监测电路中的显示电路进行显示,以供用户查看各服务器中的处理器当前时刻所处的目标诊断模式。
同时,在用户通过预设方式触发交互按键后,交互按键可以产生各服务器内部的故障硬件监测结果的输出指令,并将各服务器内部的故障硬件监测结果的输出指令发送给逻辑器件,逻辑器件再将输出指令发送给各服务器中的BMC,BMC响应输出指令后生成各服务器内部的故障硬件的第二标识信息,然后将故障硬件的第二标识信息发送给故障监测电路中的显示电路进行显示,以供用户查看各服务器中的故障硬件。其中,故障硬件监测结果的输出指令用于指示显示电路将故障硬件监测结果输出显示。
可选地,各服务器中的处理器均会包括BMC,可以从所有BMC中选取一个主BMC,其它BMC均称为从BMC,在实际应用中,实际上逻辑器件在将接收到的输出指令发送给主BMC,其中,主BMC和各从BMC均可以实时监测与自身连接的各个硬件的运行状态,将运行状态异常的硬件称为故障硬件,并且主BMC可以统计自身和各从BMC监测到的故障硬件监测结果。可选地,同一时刻,主BMC和各从BMC中的任一个BMC可以监测到一个故障硬件,此时,主BMC可以根据对应的故障硬件监测结果生成故障硬件的第二标识信息,并发送给显示电路进行显示。可选地,故障硬件监测结果可以通过数值表示,若故障硬件监测结果为1,则非故障硬件监测结果可以为0;对应地,故障硬件监测结果为1,表示对应硬件已发生故障,故障硬件监测结果为0,表示对应硬件未发生故障。
可选地,服务器内的硬件可以包括散热风扇FAN、CPU、稳压器VR和独立磁盘冗余阵列(即RAID)卡等等,其中,服务器内的BMC监测散热风扇FAN的运行状态时,是通过逻辑器件间接监测的。同时,不同故障硬件对应的第二标识信息不同。例如,故障硬件为FAN,对应的第二标识信息可以为F;故障硬件为CPU,对应的第二标识信息可以为C;故障硬件为VR,对应的第二标识信息可以为P;故障硬件为RAID卡,对应的第二标识信息可以为H。
在本申请实施例中,第二标识信息与第二标识信息不同,用于让用户区分显示电路显示的是诊断模式还是故障硬件。可选地,若第二标识信息与第二标识信息均为可视化图标,则第二标识信息与第二标识信息分别为不同的可视化图标;若第二标识信息与第二标识信息均为字母,则第二标识信息与第二标识信息分别为不同的字母,若第二标识信息与第二标识信息均为数值,则第二标识信息与第二标识信息分别为不同的数值。
这里需要说明的是,故障监测电路开始启动后,若用户通过不同诊断模式触发方式触发交互按键时,显示电路会一直显示各服务器中的处理器在不同时刻所处的目标诊断模式;若用户通过预设方式触发交互按键后,显示电路可以显示各服务器内部的故障硬件的第二标识信息。在本申请实施例中,上述不同诊断模式触发方式可以理解为交互按键被用户触发一次的持续时长不超过预设的触发时长;上述预设方式可以理解为交互按键被用户触发一次的持续时长大于或等于预设的触发时长。其中,预设的触发时长可以为任意比较小的时长,如2s、3s或4s等等,对此本申请实施例不做限定。
在实际应用中,同一时刻,显示电路仅可以显示目标诊断模式对应的第一标识信息,或故障硬件对应的第二标识信息。
本申请实施例中的技术方案,可以通过故障监测电路中的显示电路显示服务器内处理器所处的目标诊断模式对应的标识信息,或服务器内故障硬件对应的标识信息,从而能够让用户直观、快速确定服务器内的故障硬件,以快速对故障硬件进行定位修复;同时,还可以通过故障监测电路中的显示电路显示服务器所处的诊断模式,以使用户能够根据当前诊断模式快速切换下一目标诊断模式。
一种实施例中,本申请还提供一种故障诊断方法,该方法包括以下过程:
(1)通过触发故障监测电路中的交互按键产生目标诊断模式的执行指令,以使执行指令通过故障监测电路中的逻辑器件触发各服务器进入目标诊断模式;
其中,若交互按键的触发次数为第一值,则目标诊断模式为各处理器中的中央处理器的诊断模式;
若交互按键的触发次数为第二值,则目标诊断模式为各处理器中的基板管理控制器的诊断模式;
若交互按键的触发次数为第三值,则目标诊断模式为混合诊断模式;混合诊断模式表示各处理器中的中央处理器和基板管理控制器均混合的诊断模式。
(2)在通过触发故障监测电路中的交互按键产生目标诊断模式的执行指令后,通过故障监测电路中的显示电路显示第一标识信息;第一标识信息表示各服务器当前处于目标诊断模式下;或者,
(3)在通过预设方式触发交互按键后,通过显示电路显示第二标识信息,第二标识信息表示各服务器内部的故障硬件。
(4)在各服务器处于目标诊断模式下,将各服务器中处理器的监测信息经过故障监测电路中的逻辑器件后,通过目标信息接口传入故障监测电路中的信息转换器,并经过故障监测电路中的信息转换器进入故障监测电路中的传输接口,以完成各监测信息的采集;目标信息接口为与目标诊断模式对应的信息接口。
以上(1)至(4)中的执行过程具体可以参见上述实施例的描述,其实现原理和技术效果类似,在此不再赘述。
应该理解的是,虽然如上的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的故障诊断方法的故障诊断装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个故障诊断装置实施例中的具体限定可以参见上文中对于故障诊断方法的限定,在此不再赘述。
在一个实施例中,如图4所示,提供了一种故障诊断装置,包括:监测信息获取模块01和诊断结果确定模块02,其中:
监测信息获取模块01,用于通过故障监测电路分别获取至少一个服务器中处理器的监测信息;其中,故障监测电路与各服务器之间通过可拆卸接口通信连接;
诊断结果确定模块02,用于根据各服务器中处理器的监测信息,对应确定各服务器的故障诊断结果。
本实施例提供的故障诊断装置,可以执行上述方法实施例,其实现原理和技术效果类似,在此不再赘述。
在其中一个实施例中,故障监测电路包括逻辑器件和信息采集接口电路,逻辑器件与各服务器通过可拆卸接口通信连接,信息采集接口电路与逻辑器件连接;监测信息获取模块01包括:诊断模式触发单元和监测信息采集单元;
诊断模式触发单元,用于通过逻辑器件触发各服务器进入目标诊断模式;
监测信息采集单元,用于在各服务器处于目标诊断模式下,通过逻辑器件和信息采集接口电路采集各服务器中处理器的监测信息。
本实施例提供的故障诊断装置,可以执行上述方法实施例,其实现原理和技术效果类似,在此不再赘述。
在其中一个实施例中,信息采集接口电路包括信息转换器和传输接口,信息转换器与逻辑器件之间通过多个不同的信息接口连接,传输接口与信息转换器连接;监测信息采集单元具体用于:
将各监测信息经过逻辑器件后,通过目标信息接口传入信息转换器,并经过信息转换器进入传输接口,以完成各监测信息的采集;目标信息接口为与目标诊断模式对应的信息接口。
本实施例提供的故障诊断装置,可以执行上述方法实施例,其实现原理和技术效果类似,在此不再赘述。
在其中一个实施例中,故障监测电路还包括交互按键,交互按键与逻辑器件连接;诊断模式触发单元具体用于:通过触发交互按键产生目标诊断模式的执行指令,以使执行指令通过逻辑器件触发各服务器进入目标诊断模式;
其中,若交互按键的触发次数为第一值,则目标诊断模式为各处理器中的中央处理器的诊断模式;
若交互按键的触发次数为第二值,则目标诊断模式为各处理器中的基板管理控制器的诊断模式;
若交互按键的触发次数为第三值,则目标诊断模式为混合诊断模式;混合诊断模式表示各处理器中的中央处理器和基板管理控制器均混合的诊断模式。
本实施例提供的故障诊断装置,可以执行上述方法实施例,其实现原理和技术效果类似,在此不再赘述。
在其中一个实施例中,故障监测电路还包括显示电路;故障诊断装置还包括:第一显示模块和第二显示模块,其中:
第一显示模块,用于在通过触发交互按键产生目标诊断模式的执行指令后,通过显示电路显示第一标识信息;第一标识信息表示各服务器当前处于目标诊断模式下;或者,
第二显示模块,用于在通过预设方式触发交互按键后,通过显示电路显示第二标识信息,第二标识信息表示各服务器内部的故障硬件。
本实施例提供的故障诊断装置,可以执行上述方法实施例,其实现原理和技术效果类似,在此不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来命令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
同时,如图5所示为本申请实施例提供的故障监测电路10的结构图,该故障监测电路10与至少一个服务器20通过可拆卸接口通信连接;
故障监测电路10,用于分别获取各服务器20中处理器21的监测信息;各服务器20中处理器21的监测信息用于确定各服务器20的故障诊断结果。
其中,故障监测电路10与至少一个服务器20通过可拆卸接口通信连接,可拆卸接口可以为数据总线接口,该数据总线接口可以为工业标准体系结构(Industry StandardArchitecture,ISA)总线、扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线、视频电子标准协会(Video Electronics StandardAssociation,VESA)局域总线和/或外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线等等。
在实际应用中,可以通过对应总线将故障监测电路10的可拆卸接口与至少一个服务器20的可拆卸接口连接进行通信。其中,上述故障监测电路10可以设置于服务器20外,当然,还可以设置于服务器20上;这里设置于服务器20上可以理解为故障监测电路10中的部分电路设置于服务器20内或外,另外一部分电路设置于服务器20的外表面上。
其中,服务器20内设置有处理器21,该处理器21可以包括CPU、BMC和/或DCU等等。在本申请实施例中,以处理器21包括CPU和BMC为例进行说明的。
这里需要说明的是,故障监测电路10用于获取与其连接的各服务器20中处理器21的监测信息。在实际应用中,计算机设备通过故障监测电路10获取到各服务器20中处理器21的监测信息,然后根据各服务器20中处理器21的监测信息确定各服务器20的故障诊断结果。
本申请实施例提供的故障监测电路,可以与服务器之间通过可拆卸接口建立通信连接,以获取服务器内处理器的监测信息。上述故障监测电路通过可拆卸接口的设计方式可以使得故障监测电路与任何型号的服务器均能通信连接,从而提高了故障监测电路的广泛适用性;同时,上述故障监测电路与服务器通过通信连接,以使故障监测电路获取到服务器内处理器的监测信息,操作方法简单,并且获取过程不需要人工参与,还可以提高服务器内处理器的监测信息的获取效率,进一步在监测信息获取效率较高的基础上,还可以提高故障诊断效率;另外,采用上述故障监测电路可以不需要搭建故障环境和复现故障,使得计算机设备就能够获取到服务器内处理器的监测信息,进而通过服务器内处理器的监测信息对故障进行诊断,从而也能够提高故障诊断的速度和效率。
在一实施例中,如图6所示,故障监测电路10包括逻辑器件11和信息采集接口电路12;逻辑器件11与各服务器20通过可拆卸接口通信连接,信息采集接口电路12与逻辑器件11连接;其中,逻辑器件11,用于触发各服务器20进入目标诊断模式;信息采集接口电路12用于采集各服务器20中处理器21的监测信息。
具体地,故障监测电路10中的逻辑器件11和至少一个服务器20通过可拆卸接口通信连接。可选地,上述逻辑器件11可以为可编程逻辑器件11(programmable logic device,PLD),但在本申请实施例中,上述逻辑器件11为复杂可编程逻辑芯片(ComplexProgrammable Logic Device,CPLD)。
同时,各服务器20中的处理器21包括CPU和BMC,因此,各服务器20中的CPU和BMC均与CPLD进行通信连接,其中,CPU与CPLD通过异步收发传输器(Universal AsynchronousReceiver/Transmitter,UART)总线和联合测试工作组(Joint Test Action Group,JTAG)总线通信连接,BMC与CPLD通过集成电路互联总线(Inter-Integrated Circuit Bus,I2C)和UART总线连接。可选地,CPU可以通过UART总线和/或JTAG总线均向CPLD输出CPU的监测信息,但CPU通过不同总线向CPLD输出的监测信息不同,其中,CPU通过UART总线可以向CPLD输出未加密的监测信息,CPU通过JTAG总线可以向CPLD输出加密的监测信息;BMC可以通过I2C读取CPLD中的目标诊断模式的执行指令,BMC还可以通过UART总线向CPLD输出BMC的监测信息。
在本申请实施例中,BMC的监测信息可以为BMC的调试信息,CPU的监测信息可以为CPU的调试信息。
可选地,故障监测电路10中的信号采集接口电路可以包括信号收集器和传输接口,其中,在各服务器20处于目标诊断模式下,逻辑器件11可以获取各服务器20的处理器21输出的监测信息,然后逻辑器件11将接收到各服务器20中处理器21的监测信息发送给信号收集器,信号收集器对逻辑器件11输出的各服务器20中处理器21的监测信息进行统一收集,之后将收集到的所有监测信息通过传输接口输出。可选地,上述传输接口可以为高清多媒体接口(High Definition Multimedia Interface,HDMI)、迷你高清多媒体接口(MiniHigh Definition Multimedia Interface,Mini HDMI)或微型高清多媒体接口(MicroHigh Definition Multimedia Interface,Micro HDMI)等等。
在本申请实施例中,针对单节点服务器而言,上述监测信息可以服务器20内的CPU的监测信息或BMC的监测信息;针对多节点服务器而言,上述监测信息可以包括各服务器20内的CPU的监测信息和BMC的监测信息。
其中,逻辑器件11可以接收并响应用户通过语音、键盘或手势等方式输入的目标诊断模式请求指令,控制与逻辑器件11连接的各服务器20进入目标诊断模式。
本申请实施例中的故障监测电路,可以通过逻辑器件触发各服务器进入不同的诊断模式,并逐个获取服务器内处理器中的不同器件的监测信息,进一步能够根据处理器中的不同器件的监测信息对处理器中的不同器件进行故障诊断,以准确诊断出服务器内处理器中的故障器件,使得故障定位更加精细。
在一实施例中,如图7所示,故障监测电路10中的信息采集接口电路12包括信息转换器121和传输接口122,信息转换器121与逻辑器件11之间通过多个不同的信息接口连接,传输接口122与信息转换器121连接。其中,逻辑器件11,用于将各监测信息通过目标信息接口传入信息转换器121,并经过信息转换器121进入传输接口122,以完成各监测信息的采集;目标信息接口为与目标诊断模式对应的信息接口。
在本申请实施例中,信息转换器121与逻辑器件11之间可以通过一个或多个不同的信息接口连接,将任意一个或多个信息接口可以确定为目标信息接口,与目标诊断模式对应的信息接口可以为一个或多个。其中,每个信息接口仅能传输一种类型的监测信息。同时,信息采集接口电路12中的传输接口122设置于服务器20的箱耳上。
可选地,上述信息转换器121可以为VGA接口转换器、HDMI转换器或DVI转换器等等,对应地,传输接口122可以为VGA接口、HDMI接口或DVI接口等等。这里需要说明的是,若信息转换器121为VGA接口转换器时,信息转换器121可以用于将监测信息转换成VGA协议的信息,对应地,传输接口122用于将信息转换器121输出的VGA协议的信息输出;若信息转换器121为HDMI接口转换器时,信息转换器121可以用于将监测信息转换成HDMI协议的信息,对应地,传输接口122用于将信息转换器121输出的HDMI协议的信息输出;若信息转换器121为DVI接口转换器时,信息转换器121可以用于将监测信息转换成DVI协议的信息,对应地,传输接口122用于将信息转换器121输出的DVI协议的信息输出。
在本申请实施例中,上述信息转换器121设置为USB转换器;传输接口122设置为通用串行总线(Universal Serial Bus,USB)接口;上述USB接口可以为标准USB接口、迷你USB(即Mini USB)接口和微型USB(即Micro USB)接口,上述标准USB接口可以为USB Type-A接口、USB Type-B接口。其中,USB转换器与USB接口之间通过USB总线连接,并且在故障诊断场景中,USB接口与计算机设备也可以通过USB总线连接。
对应地,故障监测电路10中的信号转换器可以将监测信息转换成USB协议的信息。其中,故障监测电路10中的UART总线可以传输UART协议的监测信息,JTAG总线可以传输JTAG协议的监测信息,因此,若逻辑器件11接收到UART协议的监测信息后,则对应信号转换器可以将UART协议的监测信息转换成USB协议的监测信息;若逻辑器件11接收到JTAG协议的监测信息后,则对应信号转换器可以将JTAG协议的监测信息转换成USB协议的监测信息。
由于服务器20中处理器21包括CPU和BMC,则在本申请实施例中,USB转换器包括至少一个输入接口和1个输出接口,至少一个输入接口包括BMC UART输入接口、CPU UART输入接口和CPU JTAG输入接口中的至少一个。对应地,如图8所示为单节点服务器内处理器21中的CPU和BMC与故障监测电路10的连接关系图,图8中的信号转换器包括3个输入接口(即BMCUART输入接口、CPU UART输入接口和CPU JTAG输入接口)和1个输出接口。
其中,各服务器20中处理器21在目标诊断模式下的监测信息可以通过故障监测电路10中逻辑器件11后,经过目标信息接口传入故障监测电路10中的信息转换器121,并经过故障监测电路10中的信息转换器121进入传输接口122,以完成各服务器20中处理器21的监测信息的采集。
本申请实施例中的故障监测电路,可以通过信息转换器将逻辑器件接收到的各服务器中处理器的监测信息,转换成符合输出接口输出格式的信息后输出,以提高各服务器中处理器的监测信息输出的成功率,也即故障监测电路对监测信息的采集成功率,避免发生监测信息不符合输出接口输出格式的要求导致故障监测电路漏采集的情况;同时,故障监测电路中的传输接口设置于服务器的箱耳上,以方便故障监测电路通过传输接口与计算机设备进行通信连接,使故障监测电路通过传输接口将监测信息发送给计算机设备,进一步方便计算机设备根据接收到的监测信息进行故障诊断,使得整个故障诊断过程简单化。
在一实施例中,如图9所示,故障监测电路10还包括交互按键13,交互按键13与逻辑器件11连接;其中,交互按键13,用于触发目标诊断模式的执行指令,以使执行指令通过逻辑器件11触发各服务器20进入目标诊断模式。
其中,故障监测电路10中的交互按键13可以设置于能够触碰到的位置,在本申请实施例中,交互按键13设置于服务器20的箱耳上。可选地,该交互按键13可以是以按钮形式设置的,还可以是以触摸屏的形式设置的。在本申请实施例中,为了减小故障监测电路10的体积,故障监测电路10中的交互按键13为一个按钮形式的硬件结构,且交互按键13包括一个功能按钮,用户通过这一个功能按键可以触发交互按键13产生不同诊断模式的执行指令,以使执行指令通过逻辑器件11触发各服务器20进入目标诊断模式。
本申请实施例中的故障监测电路可以通过触发交互按键产生目标诊断模式的执行指令,以使执行指令通过逻辑器件触发各服务器进入目不同的诊断模式,操作比较简单,并且为了控制服务器进入不同的诊断模式,也不需要用户具备较高的专业能力,对用户的要求较低,从而使得该故障监测电路的广泛适用性较大。
在一实施例中,如图10所示,故障监测电路10还包括显示电路14,显示电路14与各处理器21连接;
显示电路14用于在通过触发交互按键13产生目标诊断模式的执行指令后,显示第一标识信息;第一标识信息表示各服务器20当前处于目标诊断模式下;或者,在通过预设方式触发交互按键13后,显示第二标识信息,第二标识信息表示各服务器20内部的故障硬件。
其中,故障监测电路10中的显示电路14可以包括显示器,该显示器可以为阴极射线显像管或液晶显示器等等。在本申请实施例中,显示电路14与处理器21中的BMC连接,图10仅示出了单节点服务器中的BMC与显示电路14连接。
可选地,在故障监测电路10中的逻辑器件11接收到交互按键13发送的目标诊断模式的执行指令后,可以生成目标诊断模式对应的第一标识信息,然后将目标诊断模式对应的第一标识信息发送给故障监测电路10中的显示电路14进行显示,以供用户查看各服务器20中的处理器21当前时刻所处的目标诊断模式。
同时,在用户通过预设方式触发交互按键13后,交互按键13可以产生各服务器20内部的故障硬件监测结果的输出指令,并将各服务器20内部的故障硬件监测结果的输出指令发送给逻辑器件11,逻辑器件11再将输出指令发送给各服务器20中的BMC,BMC响应输出指令后生成各服务器20内部的故障硬件的第二标识信息,然后将故障硬件的第二标识信息发送给故障监测电路10中的显示电路14进行显示,以供用户查看各服务器20中的故障硬件。可选地,服务器20内的硬件可以包括FAN、CPU、VR和RAID卡等等。其中,故障硬件监测结果的输出指令用于指示显示电路14将故障硬件监测结果输出显示。
如图11所示,在服务器20的内部结构中,服务器20内的FAN与CPLD通过脉宽调制(Pulse Width Modulation,PWM)总线和转速表(TACHOMETER,TACH)总线连接,BMC与CPU通过I2C和本地过程调用(Low pin count,LPC)总线连接,BMC与VR通过I2C连接,BMC与RAID卡通过I2C连接,其中,这里的CPLD可以为服务器20内的CPLD。可选地,CPLD可以通过PWM总线读取FAN的PWM信号,还可以通过TACH总线读取TACH信号,进一步,BMC可以通过I2C从CPLD中读取FAN的PWM信号和TACH信号;同时,BMC可以通过I2C分别从CPU、VR和RAID卡中读取CPU、VR和RAID卡的调试信息。
另外,BMC获取到PWM信号、TACH信号、CPU的调试信息、VR的调试信息和RAID卡的调试信息后,可以分别对其进行分析处理,确定FAN、CPU、VR和RAID卡的运行状态,并根据FAN、CPU、VR和RAID卡的运行状态确定故障硬件监测结果,然后将得到的故障硬件监测结果上报至所有服务器中的主BMC,之后主BMC可以根据FAN、CPU、VR和RAID卡对应的故障硬件监测结果生成故障硬件的第二标识信息,并发送给显示电路进行显示。可选地,FAN、CPU、VR和RAID卡对应的故障硬件监测结果可以相同,也可以不相同。
在实际应用中,同一时刻,FAN、CPU、VR和RAID卡中仅有一个为故障硬件,也就是,同一时刻,显示电路14仅可以显示一个故障硬件的标识信息;同时,同一时刻,显示电路14仅可以显示目标诊断模式对应的第一标识信息,或故障硬件对应的第二标识信息,其中,第二标识信息与第二标识信息不同,用于让用户区分显示电路14显示的是诊断模式还是故障硬件。
另外,在本申请实施例中,逻辑器件11接收到目标诊断模式请求指令后,可以累计寄存器数值,然后处理器21从逻辑器件11中读取当前寄存器数值,并且处理器21将当前寄存器数值发送给显示电路14,以让显示电路14输出目标诊断模式的标识信息。可选地,故障监测电路10启动的初始时刻,寄存器数值为0,用户每触发一次交互按键13也就是逻辑器件11每接收一次目标诊断模式请求指令,寄存器数值会加1。
本申请实施例中的故障监测电路,可以通过显示电路显示服务器内处理器所处的目标诊断模式对应的标识,或服务器内故障硬件对应的标识,从而能够让用户直观、快速确定服务器内的故障硬件,以快速对故障硬件进行定位修复;同时,还可以通过显示电路显示服务器所处的诊断模式,以使用户能够根据当前诊断模式快速切换下一目标诊断模式。
在一实施例中,如图12所示,故障监测电路10中的显示电路14包括驱动电路141和数码管142,驱动电路141与数码管142连接;其中,驱动电路141,用于将各服务器20中的处理器21输出的目标诊断模式的执行信号转换成第一输出信号输入至数码管142,或者,将各服务器20中的处理器21输出的故障硬件的状态信息转换成第二输出信号输入至数码管142;数码管142,用于根据第一输出信号输出第一标识信息,或,根据第二输出信号输出第二标识信息。
在本申请实施例中,故障监测电路10中的显示电路14包括驱动电路141和数码管142,驱动电路141与数码管142之间通信连接,且服务器20内处理器21中的BMC与驱动电路141通过I2C通信连接。其中,数码管142可以设置于服务器20的箱耳上,不仅能够让用户方便查看标识信息,还能够避免将数码管142设置在服务器20的箱体内导致服务器20体积过大的问题。
其中,故障监测电路10开始启动后,若用户通过不同诊断模式触发方式触发交互按键13时,交互按键13可以产生对应诊断模式的执行信号输出指令,并将对应诊断模式的执行信号输出指令通过逻辑器件11发送给BMC,BMC接收并响应逻辑器件11发送的对应诊断模式的执行信号输出指令,将对应诊断模式的执行信号发送给驱动电路141,驱动电路141接收到对应诊断模式的执行信号后,将对应诊断模式的执行信号转换成对应诊断模式的输出信号,并将对应诊断模式的输出信号输入至数码管142。
在本申请实施例中,驱动电路141包括1个输入接口和8个输出接口,也即驱动电路141为I2C口转8个通用输入输出(General-Purpose Input/Output,GPIO)接口(即SEG0~SEG7)。因此,上述第一输出信号和第二输出信号均可以为8位二进制数值。其中,驱动电路141中的8个GPIO直接与数码管142连接。在实际应用中,数码管142根据接收到的第一输出信号可以输出第一标识信息,同时,数码管142根据接收到的第二输出信号可以输出第二标识信息。
为了能够让用户快速区分数码管142上显示的是诊断模式还是故障硬件,对应地,若数码管142输出的第一标识信息为字母,则数码管142输出的第二标识信息可以为数值;若数码管142输出的第一标识信息为数值,则数码管142输出的第二标识信息可以为字母。
示例性地,如图13所示为单节点服务器与故障监测电路10连接的具体电路结构图,如图14所示为多节点服务器与故障监测电路10连接的具体电路结构图,图14中多节点服务器包括节点1、节点2、...、节点N,其中,图14中未示出各BMC与驱动电路141通过I2C通信连接关系以及各BMC之间通过I2C通信连接关系。
本申请实施例中的故障监测电路,可以通过数码管显示服务器内处理器所处的目标诊断模式对应的标识信息,或服务器内故障硬件对应的标识信息,从而能够让用户直观、快速确定服务器内的故障硬件,以快速对故障硬件进行定位修复;同时,还可以通过显示电路显示服务器所处的诊断模式,以使用户能够根据当前诊断模式快速切换下一目标诊断模式。
另外,本申请实施例还提供了一种服务器20,服务器20包括上述任一实施例中的故障监测电路10,故障监测电路10设置在服务器20上。
其中,故障监测电路10设置在服务器20上可以理解为故障监测电路10中的全部电路结构均设置于服务器20的箱耳上,还可以理解为故障监测电路10中的部分电路结构设置于服务器20的箱体内,另一部分电路结构设置于服务器20的箱耳上。
在本申请实施例中,故障监测电路10包括逻辑器件11、信息转换器121、传输接口122、交互按键13、驱动电路141和数码管142,故障监测电路10中的逻辑器件11、信息转换器121和驱动电路141均设置于服务器20的箱体内,故障监测电路10中的传输接口122、交互按键13和数码管142均设置于服务器20的箱耳上,以便用户能够触碰到传输接口122、交互按键13和数码管142。
为了节省故障监测电路10的经济成本,故障监测电路10中的逻辑器件11、信息转换器121和传输接口122,与服务器20中设置的逻辑器件11、信息转换器121和传输接口122共用。
在故障诊断环境中,故障诊断系统包括服务器20和计算机设备,服务器20通过传输接口122与计算机设备通信连接,并且在实际应用中,计算机设备可以根据信息转换器121输入接口的数量虚拟处对应数量的串口(即COM口),以通过对应串口获取各服务器20中处理器21的监测信息。可选地,信息转换器121的输入接口包括处理器21中BMC UART输入接口、CPU UART输入接口和/或CPU JTAG输入接口。
在本申请实施例中,若需要对单节点服务器进行故障诊断,则计算机设备可以虚拟出1个串口,这1个串口用于获取通过信息转换器121的BMC UART输入接口、CPU UART输入接口或CPU JTAG输入接口输出的对应监测信息;若需要对多节点服务器进行故障诊断,则计算机设备可以虚拟出3个串口,这3个串口分别用于获取通过信息转换器121的BMC UART输入接口、CPU UART输入接口或CPU JTAG输入接口输出的对应监测信息。
本申请实施例提供的服务器,可以包括上述任一实施例提供的故障监测电路,其实现原理和技术效果类似,在此不再赘述。
在一个实施例中,提供了一种服务器,该服务器内部结构图可以如图15所示。该服务器包括通过系统总线连接的处理器、存储器和网络接口。其中,该服务器的处理器用于提供计算和控制能力。该服务器的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该服务器的数据库用于存储监测信息。该服务器的网络接口用于与外部的终点通过网络连接通信。
本领域技术人员可以理解,图15中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的服务器可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (13)

1.一种故障诊断方法,其特征在于,所述方法包括:
通过故障监测电路分别获取至少一个服务器中处理器的监测信息;其中,所述故障监测电路与各所述服务器之间通过可拆卸接口通信连接;
根据各所述服务器中处理器的监测信息,对应确定各所述服务器的故障诊断结果。
2.根据权利要求1所述的方法,其特征在于,所述故障监测电路包括逻辑器件和信息采集接口电路,所述逻辑器件与各所述服务器通过所述可拆卸接口通信连接,所述信息采集接口电路与所述逻辑器件连接;
所述通过故障监测电路分别获取至少一个服务器中处理器的监测信息,包括:
通过所述逻辑器件触发各所述服务器进入目标诊断模式;
在各所述服务器处于目标诊断模式下,通过所述逻辑器件和所述信息采集接口电路采集各所述服务器中处理器的监测信息。
3.根据权利要求2所述的方法,其特征在于,所述信息采集接口电路包括信息转换器和传输接口,所述信息转换器与所述逻辑器件之间通过多个不同的信息接口连接,所述传输接口与所述信息转换器连接;
所述通过所述逻辑器件和所述信息采集接口电路采集各所述服务器中处理器的监测信息,包括:
将各所述监测信息经过所述逻辑器件后,通过目标信息接口传入所述信息转换器,并经过所述信息转换器进入所述传输接口,以完成各所述监测信息的采集;所述目标信息接口为与所述目标诊断模式对应的信息接口。
4.根据权利要求2或3所述的方法,其特征在于,所述故障监测电路还包括交互按键,所述交互按键与所述逻辑器件连接;所述通过所述逻辑器件触发各所述服务器进入目标诊断模式,包括:
通过触发所述交互按键产生所述目标诊断模式的执行指令,以使所述执行指令通过所述逻辑器件触发各所述服务器进入所述目标诊断模式。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
若所述交互按键的触发次数为第一值,则所述目标诊断模式为各所述处理器中的中央处理器的诊断模式;
若所述交互按键的触发次数为第二值,则所述目标诊断模式为各所述处理器中的基板管理控制器的诊断模式;
若所述交互按键的触发次数为第三值,则所述目标诊断模式为混合诊断模式;所述混合诊断模式表示各所述处理器中的中央处理器和基板管理控制器均混合的诊断模式。
6.根据权利要求4所述的方法,其特征在于,所述故障监测电路还包括显示电路,所述方法还包括:
在通过触发所述交互按键产生所述目标诊断模式的执行指令后,通过所述显示电路显示第一标识信息;所述第一标识信息表示各所述服务器当前处于所述目标诊断模式下;或者,
在通过预设方式触发所述交互按键后,通过所述显示电路显示第二标识信息,所述第二标识信息表示各所述服务器内部的故障硬件。
7.一种故障监测电路,其特征在于,所述故障监测电路与至少一个服务器通过可拆卸接口通信连接;
所述故障监测电路,用于分别获取各所述服务器中处理器的监测信息;各所述服务器中处理器的监测信息用于确定各所述服务器的故障诊断结果。
8.根据权利要求7所述的故障监测电路,其特征在于,所述故障监测电路包括逻辑器件和信息采集接口电路;所述逻辑器件与各所述服务器通过所述可拆卸接口通信连接,所述信息采集接口电路与所述逻辑器件连接;
所述逻辑器件,用于触发各服务器进入目标诊断模式;
所述信息采集接口电路用于采集各所述服务器中处理器的监测信息。
9.根据权利要求8所述的故障监测电路,其特征在于,所述信息采集接口电路包括信息转换器和传输接口,所述信息转换器与所述逻辑器件之间通过多个不同的信息接口连接,所述传输接口与所述信息转换器连接;
所述逻辑器件,用于将各所述监测信息通过目标信息接口传入所述信息转换器,并经过所述信息转换器进入所述传输接口,以完成各所述监测信息的采集;所述目标信息接口为与所述目标诊断模式对应的信息接口。
10.根据权利要求7-9中任一项所述的故障监测电路,其特征在于,所述故障监测电路还包括交互按键,所述交互按键与逻辑器件连接;
所述交互按键,用于触发目标诊断模式的执行指令,以使所述执行指令通过所述逻辑器件触发各所述服务器进入所述目标诊断模式。
11.根据权利要求7-9中任一项所述的故障监测电路,其特征在于,所述故障监测电路还包括显示电路,所述显示电路与各所述处理器连接;
所述显示电路用于在通过触发交互按键产生目标诊断模式的执行指令后,显示第一标识信息;所述第一标识信息表示各所述服务器当前处于所述目标诊断模式下;或者,在通过预设方式触发所述交互按键后,显示第二标识信息,所述第二标识信息表示各所述服务器内部的故障硬件。
12.根据权利要求11所述的故障监测电路,其特征在于,所述显示电路包括驱动电路和数码管,所述驱动电路与所述数码管连接;
所述驱动电路,用于将各所述服务器中的处理器输出的所述目标诊断模式的执行信号转换成第一输出信号输入至所述数码管,或者,将各所述服务器中的处理器输出的故障硬件的状态信息转换成第二输出信号输入至所述数码管;
所述数码管,用于根据所述第一输出信号输出所述第一标识信息,或,根据所述第二输出信号输出所述第二标识信息。
13.一种服务器,其特征在于,所述服务器包括故障监测电路,所述故障监测电路设置在所述服务器上。
CN202211595085.3A 2022-12-13 2022-12-13 故障诊断方法、故障监测电路和服务器 Pending CN116126571A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211595085.3A CN116126571A (zh) 2022-12-13 2022-12-13 故障诊断方法、故障监测电路和服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211595085.3A CN116126571A (zh) 2022-12-13 2022-12-13 故障诊断方法、故障监测电路和服务器

Publications (1)

Publication Number Publication Date
CN116126571A true CN116126571A (zh) 2023-05-16

Family

ID=86307096

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211595085.3A Pending CN116126571A (zh) 2022-12-13 2022-12-13 故障诊断方法、故障监测电路和服务器

Country Status (1)

Country Link
CN (1) CN116126571A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104182314A (zh) * 2014-08-25 2014-12-03 浪潮集团有限公司 一种提高龙芯处理器服务器主板可维护性方法
CN107957924A (zh) * 2016-10-17 2018-04-24 北京计算机技术及应用研究所 基于cpld和bmc的自主可控服务器启动过程监控诊断方法
CN109032862A (zh) * 2018-07-12 2018-12-18 江苏慧学堂系统工程有限公司 一种计算机系统故障诊断系统及方法
CN113076210A (zh) * 2021-03-26 2021-07-06 山东英信计算机技术有限公司 服务器故障诊断结果通知方法、系统、终端及存储介质
CN114461461A (zh) * 2021-12-28 2022-05-10 曙光信息产业股份有限公司 故障诊断卡、方法、装置、设备、存储介质和程序产品
CN114579400A (zh) * 2022-02-26 2022-06-03 苏州浪潮智能科技有限公司 一种串口信息收集装置、方法及服务器
CN114756416A (zh) * 2022-04-29 2022-07-15 苏州浪潮智能科技有限公司 一种多路服务器的日志记录系统、方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104182314A (zh) * 2014-08-25 2014-12-03 浪潮集团有限公司 一种提高龙芯处理器服务器主板可维护性方法
CN107957924A (zh) * 2016-10-17 2018-04-24 北京计算机技术及应用研究所 基于cpld和bmc的自主可控服务器启动过程监控诊断方法
CN109032862A (zh) * 2018-07-12 2018-12-18 江苏慧学堂系统工程有限公司 一种计算机系统故障诊断系统及方法
CN113076210A (zh) * 2021-03-26 2021-07-06 山东英信计算机技术有限公司 服务器故障诊断结果通知方法、系统、终端及存储介质
CN114461461A (zh) * 2021-12-28 2022-05-10 曙光信息产业股份有限公司 故障诊断卡、方法、装置、设备、存储介质和程序产品
CN114579400A (zh) * 2022-02-26 2022-06-03 苏州浪潮智能科技有限公司 一种串口信息收集装置、方法及服务器
CN114756416A (zh) * 2022-04-29 2022-07-15 苏州浪潮智能科技有限公司 一种多路服务器的日志记录系统、方法及装置

Similar Documents

Publication Publication Date Title
WO2018082176A1 (zh) 处理终端设备的故障的方法和终端设备
CN100375054C (zh) 一种电脑主板故障的监测诊断装置
EP4238851A1 (en) Test method and apparatus for electric locomotive control circuit, and mobile terminal
CN104077203A (zh) 一种可经由usb接口实现计算机硬件诊断的方法及装置
CN107544883B (zh) 服务器的诊断装置、系统和方法
US20210216429A1 (en) Diagnostic system
CN113010122A (zh) 图像形成装置监控装置、方法、系统和存储介质
CN111176958B (zh) 信息监测方法、系统和存储介质
CN116126571A (zh) 故障诊断方法、故障监测电路和服务器
CN115576737B (zh) 异常检测方法、装置、电子设备及存储介质
US7356683B2 (en) System and method for monitoring BIOS messages of remote computers by a local server
US20120226941A1 (en) Debug card and method for diagnosing faults
CN111045876A (zh) 闪屏检测方法、装置、存储介质和电子设备
CN106095628A (zh) 计算机调试方法及装置
CN109376052A (zh) 一种监测硬盘状态的方法、电子设备
CN116860565A (zh) 异常显示检测方法、装置、电子设备及存储介质
CN114706371A (zh) 整车网络不休眠诊断方法、装置、电子设备及存储介质
CN113960991A (zh) 车辆故障诊断系统、方法、装置、片上系统芯片及车辆
CN206193766U (zh) 一种获取诊断信息的装置和电子设备
US20050081100A1 (en) System and method for automatically initializing and diagnosing backplanes of electronic devices
GB2518846A (en) Diagnosing graphics display problems
CN117082107B (zh) 通讯调试设备、通讯调试方法
US20170139796A1 (en) Bus interface card detection system and method for detecting bus interface card
US20240004748A1 (en) Abnormality Detection Method and Apparatus
US20090089003A1 (en) Accessory-testing device and method therefor

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination