CN114168396B - 一种故障定位方法及相关组件 - Google Patents

一种故障定位方法及相关组件 Download PDF

Info

Publication number
CN114168396B
CN114168396B CN202111391570.4A CN202111391570A CN114168396B CN 114168396 B CN114168396 B CN 114168396B CN 202111391570 A CN202111391570 A CN 202111391570A CN 114168396 B CN114168396 B CN 114168396B
Authority
CN
China
Prior art keywords
controller
bus connection
address data
fault
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111391570.4A
Other languages
English (en)
Other versions
CN114168396A (zh
Inventor
胡佑铭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202111391570.4A priority Critical patent/CN114168396B/zh
Publication of CN114168396A publication Critical patent/CN114168396A/zh
Application granted granted Critical
Publication of CN114168396B publication Critical patent/CN114168396B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2205Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
    • G06F11/221Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested to test buses, lines or interfaces, e.g. stuck-at or open line faults
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/26Functional testing
    • G06F11/273Tester hardware, i.e. output processing circuits

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种故障定位方法及相关组件,该方案中,在接收到控制器发送的故障检查触发指令时,获取控制器的总线连接硬件地址数据和控制器的代码中的总线连接配置地址数据;通过比对总线连接硬件地址数据和总线连接配置地址数据是否一致;从而判断故障为控制器的数据处理代码部分或控制器的总线连接硬件部分。基于此,当控制器发送故障检查触发指令后,本申请可先对故障进行定位,从而使用户对故障定位的部分进行检查,减轻了用户故障检测时的工作量,提高了用户对控制器的维护效率。

Description

一种故障定位方法及相关组件
技术领域
本发明涉及故障检测领域,特别是涉及一种故障定位方法及相关组件。
背景技术
现有技术中的处理器在进行数据传输,或对外界设备进行控制时,会进行多层代码的调用,并通过自身与外界设备之间的硬件连接来实现。但是,当控制器传输数据失败,或对外界设备的控制失败时,无法确定失败原因是错误调用代码导致或是错误的硬件连接导致的,工程师需从控制器调用的多层代码开始依次进行查错处理,直至对硬件连接进行查错,若最终故障出自硬件连接,由于对软件和硬件均进行了查错,这就会导致对控制器查错的效率较低,提高维护成本。
发明内容
本发明的目的是提供一种故障定位方法及相关组件,当控制器发送故障检查触发指令后,本申请可先对故障进行定位,从而使用户对故障定位的部分进行检查,减轻了用户故障检测时的工作量,提高了用户对控制器的维护效率。
为解决上述技术问题,本发明提供了一种故障定位方法,应用于控制器,所述控制器用于在检测到自身输出的数据异常时输出故障检查触发指令;所述方法包括:
在接收到所述故障检查触发指令时获取所述控制器的总线连接硬件地址数据和所述控制器的代码中的总线连接配置地址数据;
判断所述总线连接硬件地址数据和所述总线连接配置地址数据是否一致;
若是,则将所述控制器的故障定位为所述控制器的数据处理代码部分;
若否,则将所述控制器的故障定位为所述控制器的总线连接硬件部分。
优选地,在接收到所述故障检查触发指令时获取所述控制器的总线连接硬件地址数据和所述控制器的代码中的总线连接配置地址数据,包括:
在接收到所述故障检查触发指令时获取所述控制器的I2C总线连接地址数据和所述控制器的代码中的I2C配置地址数据;
判断所述总线连接硬件地址数据和所述总线连接配置地址数据是否一致,包括:
判断所述I2C总线连接地址数据和所述I2C配置地址数据是否一致;
若不一致,则判定所述I2C总线在和所述控制器连接时,存在连接失效的I2C总线,并将所述控制器的故障定位为所述控制器的I2C总线连接硬件部分。
优选地,所述控制器用于在检测到自身输出的数据异常时输出故障检查触发指令,包括:
所述控制器具体用于在检测到自身无法向数据显示模块显示通过所述I2C配置地址数据获取的外界设备的期望数据时输出所述故障检查触发指令。
优选地,在接收到所述故障检查触发指令时获取所述控制器的总线连接硬件地址数据和所述控制器的代码中的总线连接配置地址数据,包括:
在接收到所述故障检查触发指令时获取所述控制器的GPIO连接数据和所述控制器的代码中的GPIO配置数据;
判断所述总线连接硬件地址数据和所述总线连接配置地址数据是否一致,包括:
判断所述GPIO连接数据和所述GPIO配置数据是否一致;
若不一致,则判定所述控制器的GPIO与外界设备连接失效,并将所述控制器的故障定位为所述控制器的GPIO连接硬件部分。
优选地,所述控制器用于在检测到自身输出的数据异常时输出故障检查触发指令,包括:
所述控制器具体用于在检测到未接收到自身基于所述GPIO配置数据输出到所述外界设备的控制指令数据后,所述外界设备对所述控制指令数据执行并发送的反馈信号时输出所述故障检查触发指令。
优选地,所述控制器为基板管理控制器BMC。
优选地,在判断所述总线连接硬件地址数据和所述总线连接配置地址数据是否一致之后,还包括:
若所述总线连接硬件地址数据和所述总线连接配置地址数据一致,则控制第一提示模块提示用户所述控制器的故障定位为所述控制器的数据处理代码部分;
若所述总线连接硬件地址数据和所述总线连接配置地址数据不一致,则控制第二提示模块提示用户所述控制器的故障定位为所述控制器的总线连接硬件部分。
为解决上述技术问题,本发明提供了一种故障定位系统,应用于控制器,所述控制器用于在检测到自身输出的数据异常时输出故障检查触发指令;所述系统包括:
获取单元,用于在接收到所述故障检查触发指令时获取所述控制器的总线连接硬件地址数据和所述控制器的代码中的总线连接配置地址数据;
判断单元,用于判断所述总线连接硬件地址数据和所述总线连接配置地址数据是否一致;
第一故障定位单元,用于在所述总线连接硬件地址数据和所述总线连接配置地址数据一致时,将所述控制器的故障定位为所述控制器的数据处理代码部分;
第二故障定位单元,用于在所述总线连接硬件地址数据和所述总线连接配置地址数据不一致时,将所述控制器的故障定位为所述控制器的总线连接硬件部分。
为解决上述技术问题,本发明提供了一种故障定位装置,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上述所述故障定位方法的步骤。
为解决上述技术问题,本发明提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述所述的故障定位方法的步骤。
本申请提供了一种故障定位方法及相关组件,该方案中,在接收到控制器发送的故障检查触发指令时,获取控制器的总线连接硬件地址数据和控制器的代码中的总线连接配置地址数据;通过比对总线连接硬件地址数据和总线连接配置地址数据是否一致;从而判断故障为控制器的数据处理代码部分或控制器的总线连接硬件部分。基于此,当控制器发送故障检查触发指令后,本申请可先对故障进行定位,从而使用户对故障定位的部分进行检查,减轻了用户故障检测时的工作量,提高了用户对控制器的维护效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对现有技术和实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的一种故障定位方法的流程示意图;
图2为本发明提供的一种故障定位系统的结构示意图;
图3为本发明提供的一种故障定位装置的结构示意图。
具体实施方式
本发明的核心是提供一种故障定位方法及相关组件,当控制器发送故障检查触发指令后,本申请可先对故障进行定位,从而使用户对故障定位的部分进行检查,减轻了用户故障检测时的工作量,提高了用户对控制器的维护效率。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参照图1,图1为本发明提供的一种故障定位方法的流程示意图,该方法应用于控制器,控制器用于在检测到自身输出的数据异常时输出故障检查触发指令;方法包括:
S11:在接收到故障检查触发指令时获取控制器的总线连接硬件地址数据和控制器的代码中的总线连接配置地址数据;
申请人考虑到现有技术中控制器在和外界设备进行数据交互时需要输出数据,例如,服务器由许多重要的计算机部件组成,如CPU(central processingunit,中央处理器)及内存等,微小的电流、电压和温度变化都会对这些部件的健康状态产生影响,因此需要控制器对影响服务器部件正常运行的供电和温度等参数值进行实时监控,并且对外展示这些数值,以方便管理人员及时获取服务器运行状态信息。控制器可以实现对上述参数得监控,根据控制器的代码架构,通常是通过和服务器之间连接的硬件获取原始数据,经过控制器中软件代码的计算处理,最终把需要展示的结果展示出来。总体来说,控制器在显示数据时涉及到从硬件获取信息,和通过软件部分转换、处理以及显示两个过程。
例如:BMC(Baseboard Management Controller,基板管理控制器)通过VR芯片(用于给CPU、内存相关部件供电/电压转换的芯片)监控CPU相关的电压,并通过显示模块显示电压读值。监控原理是VR芯片挂在BMC上特定的I2CBus(Inter-Integrated Circuit Bus)下,BMC可以通过I2C这一物理链路对VR芯片进行访问,并根据VR芯片的规格书,读取VR芯片对应的寄存器,将读取到的数据通过软件代码进行计算,转换等操作,最终得到真实的电压数值,并存放在BMC的数据库中,BMC再通过ipmi(Intelligent PlatformManagementInterface,智能平台管理接口)/Web(World Wide Web,全球广域网)等接口将数据展示给用户。
在这个过程中,若BMC通过ipmi或Web进行数据展示时可能会出现硬件与软件两方面的错误,无论何种错误都会导致经过BMC通过软件代码处理后得到的实际数据不正常,也即表现为用户获取到的数据显示异常。BMC工程师进行debug的过程中,往往需要首先判断该报错是否是由于硬件的错误引起或由于软件的错误引起,若问题出自硬件部分,会导致BMC工程师需要花费大量的时间精力来进行与BMC业务无关的验证,降低了查错效率。
为了解决上述技术问题,本申请中首先在控制器输出故障检查触发指令后获取控制器的总线连接硬件地址数据和控制器的代码中的总线连接配置地址数据,也即获取控制器的总线硬件连接情况和控制器的代码中对总线连接配置的情况,从而先判定该故障检测触发指令是否是因控制器的总线连接硬件部分导致的。
S12:判断总线连接硬件地址数据和总线连接配置地址数据是否一致;
在获取控制器的总线连接硬件地址数据和控制器的代码中的总线连接配置地址数据后,将二者一一比对,例如,当控制器通过多条总线和外界设备进行连接时,控制器的代码中也会进行相应的配置。理想情况下代码中配置的总线连接配置地址数据和控制器实际的总线连接硬件地址数据应是一一对应的。
S13:若总线连接硬件地址数据和总线连接配置地址数据一致,则将控制器的故障定位为控制器的数据处理代码部分;
若不一致,则表明控制器期望从自身的总线连接配置地址对应的总线连接硬件地址进行发送或接收数据时会失败,从而输出故障检查触发指令;
S14:若总线连接硬件地址数据和总线连接配置地址数据不一致,则将控制器的故障定位为控制器的总线连接硬件部分。
而若代码中配置的总线连接配置地址数据和控制器实际的总线连接硬件地址数据应是一一对应,则说明控制器的总线连接硬件部分并未出现问题,而是控制器的数据处理代码部分出现问题,在对数据进行处理时出现错误,导致控制器无法发送或接收正确的数据。
需要说明的是,本申请中的控制器可以但不限定为BMC。
综上,当控制器发送故障检查触发指令后,本申请可先对故障进行定位,从而使用户对故障定位的部分进行检查,减轻了用户故障检测时的工作量,提高了用户对控制器的维护效率。
在上述实施例的基础上:
作为一种优选的实施例,在接收到故障检查触发指令时获取控制器的总线连接硬件地址数据和控制器的代码中的总线连接配置地址数据,包括:
在接收到故障检查触发指令时获取控制器的I2C总线连接地址数据和控制器的代码中的I2C配置地址数据;
判断总线连接硬件地址数据和总线连接配置地址数据是否一致,包括:
判断I2C总线连接地址数据和I2C配置地址数据是否一致;
若不一致,则判定I2C总线在和控制器连接时,存在连接失效的I2C总线,并将控制器的故障定位为控制器的I2C总线连接硬件部分。
本实施例中的总线连接硬件地址数据为I2C总线连接地址数据,其中,控制器通过I2C总线和外界设备进行连接,若接收到故障检查触发指令,本实施例中判断控制器与外界设备连接的I2C总线地址和控制器内代码配置的I2C配置地址是否一致,具体地,可先获取控制器连接的各个I2CBus地址,再分别确定各个I2CBus地址中各个slave地址,判断控制器的代码中配置的I2C配置地址数据是否为I2C总线连接地址数据,若I2C配置地址数据中存在I2C总线连接地址数据中不存在的数据,则可以判定存在连接失效的I2C总线,控制器无法通过I2C配置地址数据获取期望数据,可以判定控制器的故障定位为控制器的I2C总线连接硬件部分。
基于此,本实施例可以在判定是由于控制器的I2C总线连接硬件部分出现故障时,使用户及时对控制器的I2C总线连接硬件部分进行故障检测以及维护,保证控制器能够及时正常工作。
作为一种优选的实施例,控制器用于在检测到自身输出的数据异常时输出故障检查触发指令,包括:
控制器具体用于在检测到自身无法向数据显示模块显示通过I2C配置地址数据获取的外界设备的期望数据时输出故障检查触发指令。
本实施例中控制器通过I2C配置地址数据获取的外界设备的期望数据,若无法向数据显示模块显示通过I2C配置地址数据获取的外界设备的期望数据,则可能是因为控制器的总线连接硬件部分存在故障而导致控制器无法获取期望数据,也可能是因为控制器的数据处理代码部分存在故障而导致控制器无法对期望数据进行正常处理,基于此,控制器能够技术输出故障检测触发指令,以便对故障进行及时的排查,保证控制器能够及时正常工作。
作为一种优选的实施例,在接收到故障检查触发指令时获取控制器的总线连接硬件地址数据和控制器的代码中的总线连接配置地址数据,包括:
在接收到故障检查触发指令时获取控制器的GPIO连接数据和控制器的代码中的GPIO配置数据;
判断总线连接硬件地址数据和总线连接配置地址数据是否一致,包括:
判断GPIO连接数据和GPIO配置数据是否一致;
若不一致,则判定控制器的GPIO与外界设备连接失效,并将控制器的故障定位为控制器的GPIO连接硬件部分。
本实施例中的总线连接硬件地址数据为GPIO连接数据,其中,控制器通过GPIO和外界设备进行连接,若接收到故障检查触发指令,本实施例中判断控制器与外界设备连接的GPIO连接数据和控制器内代码配置的GPIO配置数据是否一致,具体地,可先获取控制器连接的各个GPIO配置数据,例如控制器通过GPIO1和外界设备连接,而控制器的GPIO配置数据为GPIO2,此时,控制器无法通过GPIO2和外界设备连接,也无法和外界设备进行数据交互,基于此,本实施例可以在判定是由于控制器的GPIO连接硬件部分出现故障时,使用户及时对控制器的GPIO连接硬件部分进行故障检测以及维护,保证控制器能够及时正常工作。
当然,本申请中的总线连接配置地址数据不限定为GPIO配置数据或I2C配置地址数据。
作为一种优选的实施例,控制器用于在检测到自身输出的数据异常时输出故障检查触发指令,包括:
控制器具体用于在检测到未接收到自身基于GPIO配置数据输出到外界设备的控制指令数据后,外界设备对控制指令数据执行并发送的反馈信号时输出故障检查触发指令。
本实施例中控制器通过GPIO配置数据向外界设备发送控制指令数据,外界设备接收到控制指令数据后进行相应的执行,例如开机,从而输出反馈信号至控制器,以便控制器得知外界设备已正常执行控制指令数据,若未接收到反馈信号,可能是因为GPIO连接硬件部分出现故障,控制器无法向外界设备发送控制指令数据,也可能是控制器内部的数据处理代码部分出现故障,对控制指令数据进行处理时出现故障,导致外界设备无法执行,基于此,控制器能够技术输出故障检测触发指令,以便对故障进行及时的排查,保证控制器能够及时正常工作。
作为一种优选的实施例,在判断总线连接硬件地址数据和总线连接配置地址数据是否一致之后,还包括:
若总线连接硬件地址数据和总线连接配置地址数据一致,则控制第一提示模块提示用户控制器的故障定位为控制器的数据处理代码部分;
若总线连接硬件地址数据和总线连接配置地址数据不一致,则控制第二提示模块提示用户控制器的故障定位为控制器的总线连接硬件部分。
本实施例中,在对控制器的故障进行定位后,还想用户发出提示,以使用户对故障定位的部分进行维护处理,保证控制器的正常工作。
请参照图2,图2为本发明提供的一种故障定位系统的结构示意图,该系统应用于控制器,控制器用于在检测到自身输出的数据异常时输出故障检查触发指令;系统包括:
获取单元21,用于在接收到故障检查触发指令时获取控制器的总线连接硬件地址数据和控制器的代码中的总线连接配置地址数据;
判断单元22,用于判断总线连接硬件地址数据和总线连接配置地址数据是否一致;
第一故障定位单元23,用于在总线连接硬件地址数据和总线连接配置地址数据一致时,将控制器的故障定位为控制器的数据处理代码部分;
第二故障定位单元24,用于在总线连接硬件地址数据和总线连接配置地址数据不一致时,将控制器的故障定位为控制器的总线连接硬件部分。
对于本发明提供的一种故障定位系统的介绍请参照上述方法实施例,本发明在此不再赘述。
请参照图3,图3为本发明提供的一种故障定位装置的结构示意图,该装置包括:
存储器31,用于存储计算机程序;
处理器32,用于执行计算机程序时实现如上述故障定位方法的步骤。
对于本发明提供的一种故障定位装置的介绍请参照上述方法实施例,本发明在此不再赘述。
本发明中的计算机可读存储介质上存储有计算机程序,计算机程序被处理器32执行时实现如上述的故障定位方法的步骤。
对于本发明提供的计算机可读存储介质的介绍请参照上述方法实施例,本发明在此不再赘述。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其他实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (7)

1.一种故障定位方法,其特征在于,应用于控制器,所述控制器用于在检测到自身输出的数据异常时输出故障检查触发指令;所述方法包括:
在接收到所述故障检查触发指令时获取所述控制器的总线连接硬件地址数据和所述控制器的代码中的总线连接配置地址数据;
判断所述总线连接硬件地址数据和所述总线连接配置地址数据是否一致;
若是,则将所述控制器的故障定位为所述控制器的数据处理代码部分;
若否,则将所述控制器的故障定位为所述控制器的总线连接硬件部分;
在接收到所述故障检查触发指令时获取所述控制器的总线连接硬件地址数据和所述控制器的代码中的总线连接配置地址数据,包括:
在接收到所述故障检查触发指令时获取所述控制器的I2C总线连接地址数据和所述控制器的代码中的I2C配置地址数据;
判断所述总线连接硬件地址数据和所述总线连接配置地址数据是否一致,包括:
判断所述I2C总线连接地址数据和所述I2C配置地址数据是否一致;
若不一致,则判定所述I2C总线在和所述控制器连接时,存在连接失效的I2C总线,并将所述控制器的故障定位为所述控制器的I2C总线连接硬件部分;
或,在接收到所述故障检查触发指令时获取所述控制器的总线连接硬件地址数据和所述控制器的代码中的总线连接配置地址数据,包括:
在接收到所述故障检查触发指令时获取所述控制器的GPIO连接数据和所述控制器的代码中的GPIO配置数据;
判断所述总线连接硬件地址数据和所述总线连接配置地址数据是否一致,包括:
判断所述GPIO连接数据和所述GPIO配置数据是否一致;
若不一致,则判定所述控制器的GPIO与外界设备连接失效,并将所述控制器的故障定位为所述控制器的GPIO连接硬件部分。
2.如权利要求1所述的故障定位方法,其特征在于,所述控制器用于在检测到自身输出的数据异常时输出故障检查触发指令,包括:
所述控制器具体用于在检测到自身无法向数据显示模块显示通过所述I2C配置地址数据获取的外界设备的期望数据时输出所述故障检查触发指令;
或,所述控制器具体用于在检测到未接收到自身基于所述GPIO配置数据输出到所述外界设备的控制指令数据后,所述外界设备对所述控制指令数据执行并发送的反馈信号时输出所述故障检查触发指令。
3.如权利要求1所述的故障定位方法,其特征在于,所述控制器为基板管理控制器BMC。
4.如权利要求1-3任一项所述的故障定位方法,其特征在于,在判断所述总线连接硬件地址数据和所述总线连接配置地址数据是否一致之后,还包括:
若所述总线连接硬件地址数据和所述总线连接配置地址数据一致,则控制第一提示模块提示用户所述控制器的故障定位为所述控制器的数据处理代码部分;
若所述总线连接硬件地址数据和所述总线连接配置地址数据不一致,则控制第二提示模块提示用户所述控制器的故障定位为所述控制器的总线连接硬件部分。
5.一种故障定位系统,其特征在于,应用于控制器,所述控制器用于在检测到自身输出的数据异常时输出故障检查触发指令;所述系统包括:
获取单元,用于在接收到所述故障检查触发指令时获取所述控制器的总线连接硬件地址数据和所述控制器的代码中的总线连接配置地址数据;
判断单元,用于判断所述总线连接硬件地址数据和所述总线连接配置地址数据是否一致;
第一故障定位单元,用于在所述总线连接硬件地址数据和所述总线连接配置地址数据一致时,将所述控制器的故障定位为所述控制器的数据处理代码部分;
第二故障定位单元,用于在所述总线连接硬件地址数据和所述总线连接配置地址数据不一致时,将所述控制器的故障定位为所述控制器的总线连接硬件部分;
所述获取单元具体用于在接收到所述故障检查触发指令时获取所述控制器的I2C总线连接地址数据和所述控制器的代码中的I2C配置地址数据;
所述判断单元具体用于判断所述I2C总线连接地址数据和所述I2C配置地址数据是否一致;
所述第二故障定位单元具体用于在所述I2C总线连接地址数据和所述I2C配置地址数据不一致时,判定所述I2C总线在和所述控制器连接时,存在连接失效的I2C总线,并将所述控制器的故障定位为所述控制器的I2C总线连接硬件部分;
或,所述获取单元具体用于在接收到所述故障检查触发指令时获取所述控制器的GPIO连接数据和所述控制器的代码中的GPIO配置数据;
所述判断单元具体用于判断所述GPIO连接数据和所述GPIO配置数据是否一致;
所述第二故障定位单元具体用于在所述GPIO连接数据和所述GPIO配置数据不一致时,判定所述控制器的GPIO与外界设备连接失效,并将所述控制器的故障定位为所述控制器的GPIO连接硬件部分。
6.一种故障定位装置,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至4任一项所述故障定位方法的步骤。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述的故障定位方法的步骤。
CN202111391570.4A 2021-11-19 2021-11-19 一种故障定位方法及相关组件 Active CN114168396B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111391570.4A CN114168396B (zh) 2021-11-19 2021-11-19 一种故障定位方法及相关组件

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111391570.4A CN114168396B (zh) 2021-11-19 2021-11-19 一种故障定位方法及相关组件

Publications (2)

Publication Number Publication Date
CN114168396A CN114168396A (zh) 2022-03-11
CN114168396B true CN114168396B (zh) 2024-01-12

Family

ID=80480342

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111391570.4A Active CN114168396B (zh) 2021-11-19 2021-11-19 一种故障定位方法及相关组件

Country Status (1)

Country Link
CN (1) CN114168396B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1725190A (zh) * 2004-07-20 2006-01-25 华为技术有限公司 一种地址总线的故障检测方法
CN103745751A (zh) * 2013-12-23 2014-04-23 华为技术有限公司 一种故障告警方法与装置
CN105589776A (zh) * 2015-12-23 2016-05-18 华为技术有限公司 一种故障定位方法及服务器
US9529686B1 (en) * 2014-10-29 2016-12-27 Xilinx, Inc. Error protection for bus interconnect circuits
CN209343321U (zh) * 2019-02-27 2019-09-03 天津经纬恒润科技有限公司 一种计算机故障检测装置
CN112148515A (zh) * 2020-09-16 2020-12-29 锐捷网络股份有限公司 一种故障定位方法、系统、装置、介质和设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1725190A (zh) * 2004-07-20 2006-01-25 华为技术有限公司 一种地址总线的故障检测方法
CN103745751A (zh) * 2013-12-23 2014-04-23 华为技术有限公司 一种故障告警方法与装置
US9529686B1 (en) * 2014-10-29 2016-12-27 Xilinx, Inc. Error protection for bus interconnect circuits
CN105589776A (zh) * 2015-12-23 2016-05-18 华为技术有限公司 一种故障定位方法及服务器
CN209343321U (zh) * 2019-02-27 2019-09-03 天津经纬恒润科技有限公司 一种计算机故障检测装置
CN112148515A (zh) * 2020-09-16 2020-12-29 锐捷网络股份有限公司 一种故障定位方法、系统、装置、介质和设备

Also Published As

Publication number Publication date
CN114168396A (zh) 2022-03-11

Similar Documents

Publication Publication Date Title
EP0474058A2 (en) Problem analysis of a node computer with assistance from a central site
CN111324192A (zh) 一种系统板卡电源检测方法、装置、设备及存储介质
US20120137027A1 (en) System and method for monitoring input/output port status of peripheral devices
TW201423385A (zh) 電腦測試系統及方法
CN112783703A (zh) 一种sas链路故障定位方法、装置、设备及存储介质
CN111488050B (zh) 一种电源监控方法、系统及服务器
US20090119067A1 (en) System and method to minimize downtimes of medical apparatuses
CN114168396B (zh) 一种故障定位方法及相关组件
CN110247833B (zh) 通信控制方法、装置、子设备和通信系统
CN113992501A (zh) 一种故障定位系统、方法及计算装置
CN114490213A (zh) 电脑主板故障的监测诊断方法、系统、装置及存储介质
TWI675293B (zh) 主機開機檢測方法及其系統
CN114969752A (zh) 一种安全验证平台和安全验证方法
CN118132358B (zh) 注错方法、系统、上位机、控制器、设备和存储介质
CN106909489B (zh) 一种测试EventLog状态的方法及装置
JPH11345003A (ja) プラント制御システム
JPH04245309A (ja) 制御用ディジタルコントローラ
CN114545064B (zh) 一种设备的故障监控方法、装置及系统
CN111324495B (zh) 主机开机检测方法及其系统
CN116382968B (zh) 外部设备的故障检测方法以及装置
CN115955416B (zh) 测试upi降带宽的方法、装置、设备及存储介质
CN112084049B (zh) 用于监控基板管理控制器的常驻程序的方法
CN117687876A (zh) 故障指示装置及方法
CN116841374A (zh) 一种电源在位状态修正方法、装置、设备及可读存储介质
CN115223652A (zh) 测试监控设备、方法、装置、存储介质和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant