CN114090379A - 服务器总线故障定位方法、装置、电子设备及存储介质 - Google Patents
服务器总线故障定位方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114090379A CN114090379A CN202111383298.5A CN202111383298A CN114090379A CN 114090379 A CN114090379 A CN 114090379A CN 202111383298 A CN202111383298 A CN 202111383298A CN 114090379 A CN114090379 A CN 114090379A
- Authority
- CN
- China
- Prior art keywords
- server bus
- data
- fault
- information
- server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 230000002159 abnormal effect Effects 0.000 claims abstract description 42
- 238000012544 monitoring process Methods 0.000 claims abstract description 30
- 230000015654 memory Effects 0.000 claims description 72
- 238000012545 processing Methods 0.000 claims description 12
- 238000013500 data storage Methods 0.000 claims description 11
- 230000005540 biological transmission Effects 0.000 claims description 7
- 230000004807 localization Effects 0.000 claims description 2
- 238000004458 analytical method Methods 0.000 abstract description 5
- 230000001960 triggered effect Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000001360 synchronised effect Effects 0.000 description 4
- 238000007405 data analysis Methods 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3058—Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3055—Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/805—Real-time
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明实施例涉及一种服务器总线故障定位方法、装置、电子设备及存储介质,所述方法包括:监测服务器总线的状态信息;在所述状态信息出现异常时,接收故障中断提醒;基于所述故障中断提醒,获取所述状态信息出现异常时的服务器总线的数据信息;基于所述数据信息确定所述服务器总线的故障位置,由此方法,可以实现对服务器总线的实时数据采集、解析、存储,快速进行故障定位与记录,避免服务器故障出现后无故障现场,小概率问题难以分析等情况,提高故障定位速率。
Description
技术领域
本发明实施例涉及服务器总线故障处理领域,尤其涉及一种服务器总线故障定位方法、装置、电子设备及存储介质。
背景技术
服务器设计中会使用较多总线类信号,主要分为高速和低速几种,高速的用于大量、快速的数据传输,例如PCIE、SAS、SATA、UPI等,低速的常用于管理、监控类信号的传输,例如I2C、I3C、SPI、ESPI、LPC、SGPIO等。
服务器低速总线常用于传输管理、监控类信号,以I2C为例,常用于电压监控、温度监控、管理信号获取、设备状态获取等,在I2C信号存在信号质量问题的时候,可能会引起传输数据误读的问题,目前信号质量的检测主要依赖示波器量测。
但是,示波器量测存在如下弊端:在总线信号出现问题时,需要进行故障复现,还原发生问题的场景,对于低概率的问题,需要耗费大量时间复现;问题复现过程中需要挂接示波器,并且示波器抓取的波形需要人工识别是否有信号质量问题,这就造成了量测耗时长、效率低的问题。
发明内容
鉴于此,为解决上述技术问题或部分技术问题,本发明实施例提供一种服务器总线故障定位方法、装置、电子设备及存储介质。
第一方面,本发明实施例提供一种服务器总线故障定位方法,包括:
监测服务器总线的状态信息;
在所述状态信息出现异常时,接收故障中断提醒;
基于所述故障中断提醒,获取所述状态信息出现异常时的服务器总线的数据信息;
基于所述数据信息确定所述服务器总线的故障位置。
在一个可能的实施方式中,所述方法还包括:
实时采集所述服务器总线传输数据时的第一波形信息;
基于所述第一波形信息,恢复所述服务器总线传输的第一数据;
将所述第一数据存储至第一存储器。
在一个可能的实施方式中,所述方法还包括:
基于所述状态信息出现异常的时间信息,从所述第一存储器存储的第一数据中获取对应所述时间信息的服务器总线的数据信息。
在一个可能的实施方式中,所述方法还包括:
所述服务器总线的状态信息至少包括服务器总线传输的数据;
若所述服务器总线传输的数据与标准数据出现差异,则确定所述状态信息出现异常,接收故障中断提醒。
在一个可能的实施方式中,所述方法还包括:
将所述数据信息存储至第二存储器;
基于所述数据信息对故障进行处理。
在一个可能的实施方式中,所述方法还包括:
基于对所述服务器总线的监测速率确定所述第一存储器的数据存储量;
基于预设时间及所述第一存储器的数据存储量,对所述第一数据进行周期性存储。
第二方面,本发明实施例提供一种服务器总线故障定位装置,包括:
监测模块,用于监测服务器总线的状态信息;
接收模块,用于在所述状态信息出现异常时,接收故障中断提醒;
获取模块,用于基于所述故障中断提醒,获取所述状态信息出现异常时的服务器总线的数据信息;
确定模块,用于基于所述数据信息确定所述服务器总线的故障位置。
在一个可能的实施方式中,所述获取模块,具体用于实时采集所述服务器总线传输数据时的第一波形信息;基于所述第一波形信息,恢复所述服务器总线传输的第一数据;将所述第一数据存储至第一存储器。
第三方面,本发明实施例提供一种电子设备,包括:处理器和存储器,所述处理器用于执行所述存储器中存储的服务器总线故障定位程序,以实现上述第一方面中所述的服务器总线故障定位方法。
第四方面,本发明实施例提供一种存储介质,包括:所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现上述第一方面中所述的服务器总线故障定位方法。
本发明实施例提供的服务器总线故障定位方案,通过监测服务器总线的状态信息;在所述状态信息出现异常时,接收故障中断提醒;基于所述故障中断提醒,获取所述状态信息出现异常时的服务器总线的数据信息;基于所述数据信息确定所述服务器总线的故障位置,相比于现有技术使用示波器量测,在总线信号出现问题时,需要进行故障复现,还原发生问题的场景,对于低概率的问题,需要耗费大量时间复现;问题复现过程中需要挂接示波器,并且示波器抓取的波形需要人工识别是否有信号质量问题,造成量测耗时长、效率低的问题,由本方案,可以实现对服务器总线的实时数据采集、解析、存储,快速进行故障定位与记录,避免服务器故障出现后无故障现场,小概率问题难以分析等情况,提高故障定位速率。
附图说明
图1为本发明实施例提供的一种服务器总线故障定位方法流程示意图;
图2为本发明实施例提供的另一种服务器总线故障定位方法流程示意图;
图3为本发明实施例提供的一种服务器总线故障定位装置结构示意图;
图4为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为便于对本发明实施例的理解,下面将结合附图以具体实施例做进一步的解释说明,实施例并不构成对本发明实施例的限定。
图1为本发明实施例提供的一种服务器总线故障定位方法流程示意图,如图1所示,该方法具体包括:
S11、监测服务器总线的状态信息。
本发明优先适用于服务器低速总线的故障定位的场景,本发明实施例中,服务器总线故障定位系统架构可以包括:BMC监测模块、数据采集模块、FPGA处理器、存储器以及多个时钟模块。
可以通过BMC监测模块实现监测服务器总线的状态,例如,监测服务器总线传输的温度数据或者监测其他数据时与服务器总线的连接状态。
S12、在所述状态信息出现异常时,接收故障中断提醒。
本发明实施例中,在BMC监测模块与服务器总线断开连接无法监测服务器总线时,或者监测到的传输数据与标准数据存在差异时,例如正常的CPU温度可以为10~50度,但是当前监测到的服务器总线传输的CPU温度数据为60度,则可以判定状态信息出现异常,此时,触发故障中断提醒,即BMC监测模块向FPGA处理器发送故障中断提醒。
S13、基于所述故障中断提醒,获取所述状态信息出现异常时的服务器总线的数据信息。
本发明实施例中,数据采集模块可以通过高速ADC芯片实现服务器总线传输的数据的采集,也可使用其他同类芯片,高速ADC芯片主要实现的是高采样率的波形采集,数据采样后通过LVDS总线传输给FPGA处理器的数据解析模块。
进一步的,在FPGA处理器在接收到故障中断提醒后,基于故障中断的时间信息,截取数据采集模块对应时间内采集到的服务器总线的数据信息。
S14、基于所述数据信息确定所述服务器总线的故障位置。
对截取到的数据信息进行分析,确定服务器总线的故障位置或故障信息,进一步的,可以根据确定的故障信息或故障位置,对故障进行处理解决。
本发明实施例提供的服务器总线故障定位方法,通过监测服务器总线的状态信息;在所述状态信息出现异常时,接收故障中断提醒;基于所述故障中断提醒,获取所述状态信息出现异常时的服务器总线的数据信息;基于所述数据信息确定所述服务器总线的故障位置,相比于现有技术使用示波器量测,在总线信号出现问题时,需要进行故障复现,还原发生问题的场景,对于低概率的问题,需要耗费大量时间复现;问题复现过程中需要挂接示波器,并且示波器抓取的波形需要人工识别是否有信号质量问题,造成量测耗时长、效率低的问题,由本方法,可以实现对服务器总线的实时数据采集、解析、存储,快速进行故障定位与记录,避免服务器故障出现后无故障现场,小概率问题难以分析等情况,提高故障定位速率。
图2为本发明实施例提供的另一种服务器总线故障定位方法流程示意图,如图2所示,该方法具体包括:
S21、若所述服务器总线传输的数据与标准数据出现差异,则确定所述状态信息出现异常,接收故障中断提醒。
本发明实施例中,服务器总线的状态信息至少包括服务器总线传输的数据;例如正常的CPU温度可以为10~50度,但是当前监测到的服务器总线传输的CPU温度数据为60度,则可以判定状态信息出现异常,此时,触发故障中断提醒,即BMC监测模块向FPGA处理器发送故障中断提醒。
可选的,若BMC监测模块与服务器总线断开连接无法监测服务器总线时,也可以认为状态信息出现异常,触发故障中断提醒。
S22、实时采集所述服务器总线传输数据时的第一波形信息。
本发明实施例中,数据采集模块可以通过高速ADC芯片实现服务器总线传输的数据的采集,例如,ADS4225芯片,也可使用其他同类芯片,高速ADC芯片主要实现的是高采样率的波形采集,实时采集服务器总线传输数据时的第一波形信息,波形采样后通过LVDS总线传输给FPGA处理器的数据解析模块。
S23、基于所述第一波形信息,恢复所述服务器总线传输的第一数据。
S24、将所述第一数据存储至第一存储器。
FPGA处理器的数据解析模块在接收到第一波形信息后,对第一波形信息进行数据恢复,恢复的数据包括数据传输时间与传输数据的对应关系。
进一步的,将恢复的服务器总线传输的数据存储到第一存储器,该第一存储器可以是Nand flash存储器。
需要说明的是,Nand flash存储器的容量选型可依据数据采集模块的采集速率或服务器总线的类型制定,采集速率低或低速服务器总线可选择容量较小的存储器,基于预设时间及Nand flash存储器的数据存储量,对数据进行周期性存储。
例如,可以将存储周期设置为10分钟,FPGA处理器将前10分钟的总线波形采集、恢复数据存储至Nand flash存储器,在这段时间内故障中断提醒未触发,FPGA处理器重新存储的数据可从这段数据初始进行覆盖,实现循环记录。
S25、基于所述状态信息出现异常的时间信息,从所述第一存储器存储的第一数据中获取对应所述时间信息的服务器总线的数据信息。
在状态信息出现异常时触发故障中断提醒后,基于故障中断提醒的时间信息,在Nand flash存储器存储的全部数据中,截取数据采集模块对应时间内采集到的服务器总线的数据信息。
S26、将所述数据信息存储至第二存储器。
将故障出现时截取到的数据信息存储到第二存储器,其中,第二存储器可以为另一Nand flash存储器,在该存储器内对数据进行解析,确认故障发生时服务器总线是否有信号质量问题等,确定服务器总线的故障位置和故障信息。
S27、基于所述数据信息对故障进行处理。
基于确定的故障位置和故障信息可以对故障进行及时处理修复。
本发明实施例提供的服务器总线故障定位方法,通过监测服务器总线的状态信息;在所述状态信息出现异常时,接收故障中断提醒;基于所述故障中断提醒,获取所述状态信息出现异常时的服务器总线的数据信息;基于所述数据信息确定所述服务器总线的故障位置,相比于现有技术使用示波器量测,在总线信号出现问题时,需要进行故障复现,还原发生问题的场景,对于低概率的问题,需要耗费大量时间复现;问题复现过程中需要挂接示波器,并且示波器抓取的波形需要人工识别是否有信号质量问题,造成量测耗时长、效率低的问题,由本方法,可以实现对服务器总线的实时数据采集、解析、存储,快速进行故障定位与记录,避免服务器故障出现后无故障现场,小概率问题难以分析等情况,提高故障定位速率。
图3为本发明实施例提供的一种服务器总线故障定位装置的结构示意图,具体包括:
监测模块301,用于监测服务器总线的状态信息;
接收模块302,用于在所述状态信息出现异常时,接收故障中断提醒;
获取模块303,用于基于所述故障中断提醒,获取所述状态信息出现异常时的服务器总线的数据信息;
确定模块304,用于基于所述数据信息确定所述服务器总线的故障位置。
在一个可能的实施方式中,所述获取模块303,具体用于实时采集所述服务器总线传输数据时的第一波形信息;基于所述第一波形信息,恢复所述服务器总线传输的第一数据;将所述第一数据存储至第一存储器。
在一个可能的实施方式中,所述获取模块303,还用于基于所述状态信息出现异常的时间信息,从所述第一存储器存储的第一数据中获取对应所述时间信息的服务器总线的数据信息。
在一个可能的实施方式中,所述获取模块303,还用于将所述数据信息存储至第二存储器;基于所述数据信息对故障进行处理。
在一个可能的实施方式中,所述接收模块302,具体用于若所述服务器总线传输的数据与标准数据出现差异,则确定所述状态信息出现异常,接收故障中断提醒。
在一个可能的实施方式中,所述确定模块304,具体用于基于对所述服务器总线的监测速率确定所述第一存储器的数据存储量;基于预设时间及所述第一存储器的数据存储量,对所述第一数据进行周期性存储。
本实施例提供的服务器总线故障定位装置可以是如图3中所示的服务器总线故障定位装置,可执行如图1-2中服务器总线故障定位方法的所有步骤,进而实现图1-2所示服务器总线故障定位方法的技术效果,具体请参照图1-2相关描述,为简洁描述,在此不作赘述。
图4为本发明实施例提供的一种电子设备的结构示意图,图4所示的电子设备400包括:至少一个处理器401、存储器402、至少一个网络接口404和其他用户接口403。电子设备400中的各个组件通过总线系统405耦合在一起。可理解,总线系统405用于实现这些组件之间的连接通信。总线系统405除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图4中将各种总线都标为总线系统405。
其中,用户接口403可以包括显示器、键盘或者点击设备(例如,鼠标,轨迹球(trackball)、触感板或者触摸屏等。
可以理解,本发明实施例中的存储器402可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data RateSDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synch link DRAM,SLDRAM)和直接内存总线随机存取存储器(DirectRambus RAM,DRRAM)。本文描述的存储器402旨在包括但不限于这些和任意其它适合类型的存储器。
在一些实施方式中,存储器402存储了如下的元素,可执行单元或者数据结构,或者他们的子集,或者他们的扩展集:操作系统4021和应用程序4022。
其中,操作系统4021,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序4022,包含各种应用程序,例如媒体播放器(Media Player)、浏览器(Browser)等,用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序4022中。
在本发明实施例中,通过调用存储器402存储的程序或指令,具体的,可以是应用程序4022中存储的程序或指令,处理器401用于执行各方法实施例所提供的方法步骤,例如包括:
监测服务器总线的状态信息;在所述状态信息出现异常时,接收故障中断提醒;基于所述故障中断提醒,获取所述状态信息出现异常时的服务器总线的数据信息;基于所述数据信息确定所述服务器总线的故障位置。
在一个可能的实施方式中,实时采集所述服务器总线传输数据时的第一波形信息;基于所述第一波形信息,恢复所述服务器总线传输的第一数据;将所述第一数据存储至第一存储器。
在一个可能的实施方式中,基于所述状态信息出现异常的时间信息,从所述第一存储器存储的第一数据中获取对应所述时间信息的服务器总线的数据信息。
在一个可能的实施方式中,所述服务器总线的状态信息至少包括服务器总线传输的数据;若所述服务器总线传输的数据与标准数据出现差异,则确定所述状态信息出现异常,接收故障中断提醒。
在一个可能的实施方式中,将所述数据信息存储至第二存储器;基于所述数据信息对故障进行处理。
在一个可能的实施方式中,基于对所述服务器总线的监测速率确定所述第一存储器的数据存储量;基于预设时间及所述第一存储器的数据存储量,对所述第一数据进行周期性存储。
上述本发明实施例揭示的方法可以应用于处理器401中,或者由处理器401实现。处理器401可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器401中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器401可以是通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(FieldProgrammable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件单元组合执行完成。软件单元可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器402,处理器401读取存储器402中的信息,结合其硬件完成上述方法的步骤。
可以理解的是,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(ApplicationSpecific Integrated Circuits,ASIC)、数字信号处理器(Digital Signal Processing,DSP)、数字信号处理设备(DSPDevice,DSPD)、可编程逻辑设备(Programmable LogicDevice,PLD)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。
对于软件实现,可通过执行本文所述功能的单元来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
本实施例提供的电子设备可以是如图4中所示的电子设备,可执行如图1-2中服务器总线故障定位方法的所有步骤,进而实现图1-2所示服务器总线故障定位方法的技术效果,具体请参照图1-2相关描述,为简洁描述,在此不作赘述。
本发明实施例还提供了一种存储介质(计算机可读存储介质)。这里的存储介质存储有一个或者多个程序。其中,存储介质可以包括易失性存储器,例如随机存取存储器;存储器也可以包括非易失性存储器,例如只读存储器、快闪存储器、硬盘或固态硬盘;存储器还可以包括上述种类的存储器的组合。
当存储介质中一个或者多个程序可被一个或者多个处理器执行,以实现上述在电子设备侧执行的服务器总线故障定位方法。
所述处理器用于执行存储器中存储的服务器总线故障定位程序,以实现以下在电子设备侧执行的服务器总线故障定位方法的步骤:
监测服务器总线的状态信息;在所述状态信息出现异常时,接收故障中断提醒;基于所述故障中断提醒,获取所述状态信息出现异常时的服务器总线的数据信息;基于所述数据信息确定所述服务器总线的故障位置。
在一个可能的实施方式中,实时采集所述服务器总线传输数据时的第一波形信息;基于所述第一波形信息,恢复所述服务器总线传输的第一数据;将所述第一数据存储至第一存储器。
在一个可能的实施方式中,基于所述状态信息出现异常的时间信息,从所述第一存储器存储的第一数据中获取对应所述时间信息的服务器总线的数据信息。
在一个可能的实施方式中,所述服务器总线的状态信息至少包括服务器总线传输的数据;若所述服务器总线传输的数据与标准数据出现差异,则确定所述状态信息出现异常,接收故障中断提醒。
在一个可能的实施方式中,将所述数据信息存储至第二存储器;基于所述数据信息对故障进行处理。
在一个可能的实施方式中,基于对所述服务器总线的监测速率确定所述第一存储器的数据存储量;基于预设时间及所述第一存储器的数据存储量,对所述第一数据进行周期性存储。
专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种服务器总线故障定位方法,其特征在于,包括:
监测服务器总线的状态信息;
在所述状态信息出现异常时,接收故障中断提醒;
基于所述故障中断提醒,获取所述状态信息出现异常时的服务器总线的数据信息;
基于所述数据信息确定所述服务器总线的故障位置。
2.根据权利要求1所述的方法,其特征在于,所述获取所述状态信息出现异常时的服务器总线的数据信息,包括:
实时采集所述服务器总线传输数据时的第一波形信息;
基于所述第一波形信息,恢复所述服务器总线传输的第一数据;
将所述第一数据存储至第一存储器。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
基于所述状态信息出现异常的时间信息,从所述第一存储器存储的第一数据中获取对应所述时间信息的服务器总线的数据信息。
4.根据权利要求1所述的方法,其特征在于,所述服务器总线的状态信息至少包括服务器总线传输的数据;
所述在所述状态信息出现异常时,接收故障中断提醒,包括:
若所述服务器总线传输的数据与标准数据出现差异,则确定所述状态信息出现异常,接收故障中断提醒。
5.根据权利要求3所述的方法,其特征在于,所述方法还包括:
将所述数据信息存储至第二存储器;
基于所述数据信息对故障进行处理。
6.根据权利要求2所述的方法,其特征在于,所述方法还包括:
基于对所述服务器总线的监测速率确定所述第一存储器的数据存储量;
基于预设时间及所述第一存储器的数据存储量,对所述第一数据进行周期性存储。
7.一种服务器总线故障定位装置,其特征在于,包括:
监测模块,用于监测服务器总线的状态信息;
接收模块,用于在所述状态信息出现异常时,接收故障中断提醒;
获取模块,用于基于所述故障中断提醒,获取所述状态信息出现异常时的服务器总线的数据信息;
确定模块,用于基于所述数据信息确定所述服务器总线的故障位置。
8.根据权利要求7所述的装置,其特征在于,所述获取模块,具体用于实时采集所述服务器总线传输数据时的第一波形信息;基于所述第一波形信息,恢复所述服务器总线传输的第一数据;将所述第一数据存储至第一存储器。
9.一种电子设备,其特征在于,包括:处理器和存储器,所述处理器用于执行所述存储器中存储的服务器总线故障定位程序,以实现权利要求1~6中任一项所述的服务器总线故障定位方法。
10.一种存储介质,其特征在于,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现权利要求1~6中任一项所述的服务器总线故障定位方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111383298.5A CN114090379A (zh) | 2021-11-19 | 2021-11-19 | 服务器总线故障定位方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111383298.5A CN114090379A (zh) | 2021-11-19 | 2021-11-19 | 服务器总线故障定位方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114090379A true CN114090379A (zh) | 2022-02-25 |
Family
ID=80302797
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111383298.5A Withdrawn CN114090379A (zh) | 2021-11-19 | 2021-11-19 | 服务器总线故障定位方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114090379A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115934450A (zh) * | 2023-03-08 | 2023-04-07 | 苏州浪潮智能科技有限公司 | 数据传输质量的检测方法、装置、存储介质及电子装置 |
WO2023173874A1 (zh) * | 2022-03-14 | 2023-09-21 | 苏州浪潮智能科技有限公司 | 设备故障诊断系统及故障诊断方法 |
WO2024066444A1 (zh) * | 2022-09-27 | 2024-04-04 | 超聚变数字技术有限公司 | 一种告警方法、计算设备及存储介质 |
-
2021
- 2021-11-19 CN CN202111383298.5A patent/CN114090379A/zh not_active Withdrawn
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023173874A1 (zh) * | 2022-03-14 | 2023-09-21 | 苏州浪潮智能科技有限公司 | 设备故障诊断系统及故障诊断方法 |
WO2024066444A1 (zh) * | 2022-09-27 | 2024-04-04 | 超聚变数字技术有限公司 | 一种告警方法、计算设备及存储介质 |
CN115934450A (zh) * | 2023-03-08 | 2023-04-07 | 苏州浪潮智能科技有限公司 | 数据传输质量的检测方法、装置、存储介质及电子装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114090379A (zh) | 服务器总线故障定位方法、装置、电子设备及存储介质 | |
US9355003B2 (en) | Capturing trace information using annotated trace output | |
US10304522B2 (en) | Method for low power operation and test using DRAM device | |
US20140129875A1 (en) | Method for reading kernel log upon kernel panic in operating system | |
US8996928B2 (en) | Devices for indicating a physical layer error | |
CN109669798B (zh) | 崩溃分析方法、装置、电子设备,及存储介质 | |
US9916217B2 (en) | Accessing hidden diagnostic registers | |
JP2018116679A (ja) | バスハング検出 | |
US20140244203A1 (en) | Testing system and method of inter-integrated circuit bus | |
CN113791741B (zh) | 固态硬盘的数据巡检方法、装置、计算机设备及存储介质 | |
KR101505258B1 (ko) | 프로브리스 트레이스 캡처를 갖는 아키텍처 실행의 재생 | |
CN111338864B (zh) | 内存问题检测方法、装置、计算机设备及存储介质 | |
CN113468009A (zh) | 一种压力测试方法、装置、电子设备及存储介质 | |
CN112445749A (zh) | 一种信号检测记录方法、系统、设备以及介质 | |
US9442823B2 (en) | Memory error tracking in a multiple-user development environment | |
CN111240923A (zh) | 车载导航系统复现问题的自动测试方法、装置和存储介质 | |
US20190163554A1 (en) | Recovery of first failure data capture logs | |
CN107766385B (zh) | 一种转换虚拟磁盘文件格式的方法与设备 | |
CN114443442A (zh) | 日志存储方法及电子设备 | |
CN109525470B (zh) | 网络接入方法及网络接入系统 | |
CN111124771A (zh) | 一种定位故障的方法、设备及介质 | |
JP6901171B1 (ja) | 情報処理装置、情報処理方法及びプログラム | |
CN115794761A (zh) | 故障溯源方法、装置、电子设备及存储介质 | |
US9372783B2 (en) | Recording the core data of a computer process which provides trace data | |
CN113986517B (zh) | Api调用日志采集方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20220225 |
|
WW01 | Invention patent application withdrawn after publication |