CN113176971A - 一种单板自检方法及装置 - Google Patents

一种单板自检方法及装置 Download PDF

Info

Publication number
CN113176971A
CN113176971A CN202110268154.9A CN202110268154A CN113176971A CN 113176971 A CN113176971 A CN 113176971A CN 202110268154 A CN202110268154 A CN 202110268154A CN 113176971 A CN113176971 A CN 113176971A
Authority
CN
China
Prior art keywords
board
single board
target
self
inspection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110268154.9A
Other languages
English (en)
Inventor
唐朋武
张鑫
任昕乐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New H3C Security Technologies Co Ltd
Original Assignee
New H3C Security Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by New H3C Security Technologies Co Ltd filed Critical New H3C Security Technologies Co Ltd
Priority to CN202110268154.9A priority Critical patent/CN113176971A/zh
Publication of CN113176971A publication Critical patent/CN113176971A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2273Test methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2205Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
    • G06F11/2236Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested to test CPU or processors

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Stored Programmes (AREA)

Abstract

本申请涉及网络通信技术领域,特别涉及一种单板自检方法及装置。该方法应用于网络设备的主控单板,所述网络设备上维护有各单板的单板标识与检查策略的关联关系,所述方法包括:获取目标单板的单板标识,并基于所述单板标识和所述各单板的单板标识与检查策略的关联关系,获取所述目标单板的目标检查策略;将所述目标检查策略发送给所述目标单板,以使得所述目标单板基于接收到的目标检查策略进行自检操作,并向所述主控单板反馈自检结果;接收所述目标单板返回的自检结果,并基于所述自检结果判断所述目标单板的运行状态。

Description

一种单板自检方法及装置
技术领域
本申请涉及网络通信技术领域,特别涉及一种单板自检方法及装置。
背景技术
随着5G技术的发展,对高性能路由器大单机、多集群的需求也愈加迫切,因此对生产高性能路由器的厂家来说,产品的良品率是十分重要的指标。设备复杂度的提高对可维护性提出了更高的要求,尤其是在信息收集和处理方面面临着新的挑战。
以往出厂前的检查仅仅是在生产的最后环节进行硬件功能的常规性检查,例如:接口功能、芯片型号以及单板链路状态的检查。并不能覆盖到软件层面以及部分寄存器的读写检查,且在完成生产后无法保证在运输过程中的突发情况对单板的影响,无法完全确定交付于用户的产品与预期产品的差异。
目前,部分厂商通过采用告警单板的设计对单板环境和对应的物理参数进行实时的监测,将告警单板与通讯设备系统相连接,当参数超过告警的阀值时,告警单板点亮相应的指示灯。然而,上述方法仅能确定故障单板的相应参数超标,无法检查单板的配置信息和单板芯片型号是否与预期相同。无法对单板实时运行的业务故障及单板器件本身的故障进行监测。且添加告警单板的监测,减少了设备可使用业务单板的使用数量,降低了业务功能。部分厂商通过主控单板启动监控通信接口状态任务,各单板基于预设周期向主控单板发送单板消息,如果主控单板在预定时间内未接收到单板信息,则上报该单板状态。然而,上述方法仅能确定单板发生故障,无法确定单板的故障信息以及故障的发生原因。更无法对单板实时运行的业务故障及单板器件本身的故障进行监测。且无法在用户使用前确定单板是否存在隐形故障,提前排除故障的存在。
发明内容
本申请提供了一种单板自检方法及装置,用以解决现有技术中存在的无法确定具体故障信息,故障原因,无法确定单板是否存在隐形故障的问题。
第一方面,本申请提供了一种单板自检方法,应用于网络设备的主控单板,所述网络设备上维护有各单板的单板标识与检查策略的关联关系,所述方法包括:
获取目标单板的单板标识,并基于所述单板标识和所述各单板的单板标识与检查策略的关联关系,获取所述目标单板的目标检查策略;
将所述目标检查策略发送给所述目标单板,以使得所述目标单板基于接收到的目标检查策略进行自检操作,并向所述主控单板反馈自检结果;
接收所述目标单板返回的自检结果,并基于所述自检结果判断所述目标单板的运行状态。
可选地,所述网络设备预设有包含各单板标识和单板名称的第一配置文件,包含各单板名称和各单板对应的检查策略的第二配置文件,其中,一个单板对应的检查策略包括:软件相关检查项目和/或硬件相关检查项目。
可选地,软件相关检查项目至少包括:单板上芯片个数,各芯片的软件版本号,各芯片的CPU类型,各芯片的内存大小,各芯片的运行的软件版本号,各芯片的芯片状态,各芯片的电源类型、状态,各芯片的底层软件驱动版本;
硬件相关检查项目至少包括:单板到主控板的链路状态;单板唯一标识码检测;电源黑盒信息,内存测试,闪存测试,硬盘测试,单板到子卡的链路测试;CPU测试;单板温度测试。
可选地,获取目标单板的单板标识,并基于所述单板标识和所述各单板的单板标识与检查策略的关联关系,获取所述目标单板的目标检查策略的步骤包括:
读取所述第一配置文件,获取目标单板的单板标识,并基于所述单板标识确定所述目标单板的单板名称;
读取所述第二配置文件,基于所述单板名称,从所述第二配置文件中获取所述目标单板对应的检查策略。
可选地,所述检查策略中针对每一软件相关检查项目预设有对应的参数值;接收所述目标单板返回的自检结果,并基于所述自检结果判断所述目标单板的运行状态的步骤包括:
若所述自检结果为软件相关检查项目的自检结果,则针对每一软件相关检查项目的自检结果与预设的参数值进行比对,得到对应的比对结果,并基于所述比对结果判断所述目标单板的运行状态;
若所述自检结果为硬件相关检查项目的自检结果,则基于所述硬件相关检查项目的自检结果判断所述目标单板的运行状态。
第二方面,本申请提供了一种单板自检装置,应用于网络设备的主控单板,所述网络设备上维护有各单板的单板标识与检查策略的关联关系,所述装置包括:
获取单元,用于获取目标单板的单板标识,并基于所述单板标识和所述各单板的单板标识与检查策略的关联关系,获取所述目标单板的目标检查策略;
发送单元,用于将所述目标检查策略发送给所述目标单板,以使得所述目标单板基于接收到的目标检查策略进行自检操作,并向所述主控单板反馈自检结果;
接收单元,用于接收所述目标单板返回的自检结果,并基于所述自检结果判断所述目标单板的运行状态。
可选地,所述网络设备预设有包含各单板标识和单板名称的第一配置文件,包含各单板名称和各单板对应的检查策略的第二配置文件,其中,一个单板对应的检查策略包括:软件相关检查项目和/或硬件相关检查项目。
可选地,软件相关检查项目至少包括:单板上芯片个数,各芯片的软件版本号,各芯片的CPU类型,各芯片的内存大小,各芯片的运行的软件版本号,各芯片的芯片状态,各芯片的电源类型、状态,各芯片的底层软件驱动版本;
硬件相关检查项目至少包括:单板到主控板的链路状态;单板唯一标识码检测;电源黑盒信息,内存测试,闪存测试,硬盘测试,单板到子卡的链路测试;CPU测试;单板温度测试。
可选地,获取目标单板的单板标识,并基于所述单板标识和所述各单板的单板标识与检查策略的关联关系,获取所述目标单板的目标检查策略时,所述获取单元具体用于:
读取所述第一配置文件,获取目标单板的单板标识,并基于所述单板标识确定所述目标单板的单板名称;
读取所述第二配置文件,基于所述单板名称,从所述第二配置文件中获取所述目标单板对应的检查策略。
可选地,所述检查策略中针对每一软件相关检查项目预设有对应的参数值;接收所述目标单板返回的自检结果,并基于所述自检结果判断所述目标单板的运行状态时,所述接收单元具体用于:
若所述自检结果为软件相关检查项目的自检结果,则针对每一软件相关检查项目的自检结果与预设的参数值进行比对,得到对应的比对结果,并基于所述比对结果判断所述目标单板的运行状态;
若所述自检结果为硬件相关检查项目的自检结果,则基于所述硬件相关检查项目的自检结果判断所述目标单板的运行状态。
第三方面,本申请提供了一种网络设备,该网络设备包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序指令执行如上述第一方面中任一项所述的方法的步骤。
第四方面,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使所述计算机执行如上述第一方面中任一项所述方法的步骤。
综上可知,本申请实施例提供的单板自检方法,应用于网络设备的主控单板,所述网络设备上维护有各单板的单板标识与检查策略的关联关系,所述方法包括:获取目标单板的单板标识,并基于所述单板标识和所述各单板的单板标识与检查策略的关联关系,获取所述目标单板的目标检查策略;将所述目标检查策略发送给所述目标单板,以使得所述目标单板基于接收到的目标检查策略进行自检操作,并向所述主控单板反馈自检结果;接收所述目标单板返回的自检结果,并基于所述自检结果判断所述目标单板的运行状态。
采用本申请实施例提供的单板自检方法,在主控单板上预设各单板和其对应的检测策略的关联关系,在确定要进行单板自检时,获取目标单板的目标检测策略,并将该检测策略发送至目标单板,以使得目标单板基于检查策略进行自检操作,并反馈检测结果,用户可以通过该检测结果判断单板是否存在故障,以及故障的具体信息,发生故障的原因等。进一步地,还可以根据检测结果包括的各项参数,判断单板是否存在隐形故障,从而提升设备的可靠性。
附图说明
为了更加清楚地说明本申请实施例或者现有技术中的技术方案,下面将对本申请实施例或者现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据本申请实施例的这些附图获得其他的附图。
图1为本申请实施例提供的一种单板自检方法的详细流程图;
图2为本申请实施例提供的单板自检装置的结构示意图;
图3为本申请实施例提供的一种网络设备的结构示意图。
具体实施方式
在本申请实施例使用的术语仅仅是出于描述特定实施例的目的,而非限制本申请。本申请和权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其它含义。还应当理解,本文中使用的术语“和/或”是指包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请实施例可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,此外,所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
示例性的,参阅图1所示,为本申请实施例提供的一种单板自检方法的详细流程图,该方法应用于网络设备的主控单板,所述网络设备上维护有各单板的单板标识与检查策略的关联关系,该方法包括以下步骤:
步骤100:获取目标单板的单板标识,并基于上述单板标识和上述各单板的单板标识与检查策略的关联关系,获取上述目标单板的目标检查策略。
本申请实施例中,所述网络设备预设有包含各单板标识和单板名称的第一配置文件,包含各单板名称和各单板对应的检查策略的第二配置文件,其中,一个单板对应的检查策略包括:软件相关检查项目和/或硬件相关检查项目。
也就是说,预先在网络设备的主控单板中添加第一配置文件(如,LIP配置文件)和第二配置文件(包括各单板的检查内容的配置文件),其中,该第一配置文件包括各板卡的板卡标识和板卡名称之间的关联关系,该第二配置文件中包括各板卡对应的检查策略,各检查策略以板卡名称为索引,即基于各板卡名称即可从第二配置文件中确定出该板卡对应的检查策略。这样,即在主控板卡中建立了各板卡标识和/或板卡名称与其丢应的检查策略之间的关联关系。当然,第二配置文件中包括的各板卡对应的检查策略也可以以各板卡的板卡标识为索引。本申请实施例中,在此不做具体限定。
实际应用中,板卡自检的项目可以包括软件相关检查项目和硬件相关检查项目。
具体地,软件相关检查项目至少包括:单板上芯片个数,各芯片的软件版本号,各芯片的CPU类型,各芯片的内存大小,各芯片的运行的软件版本号,各芯片的芯片状态,各芯片的电源类型、状态,各芯片的底层软件驱动版本等信息。
硬件相关检查项目至少包括:单板到主控板的链路状态;单板唯一标识码检测;电源黑盒信息,内存测试,闪存测试,硬盘测试,单板到子卡的链路测试;CPU测试;单板温度测试等。
本申请实施例中,软件相关检查项目可以是一个预设的包括各项软件相关检查参数的配置文件(如,软件适配参数表),具体地,可以包括各单板分别对应的软件适配参数表,如,单板1对应的软件适配参数表,单板2对应的软件适配参数表,……,单板n对应的软件适配参数表。本申请实施例中,一种较佳地实现方式为,一个单板对应的软件适配参数表中包括该单板所需检查的各软件参数项,以及预设的各软件参数的正常参数值。该正常参数值用于与检查结果进行比对,以判断该项软件参数是否正常,进而判断单板状态是否正常。
本申请实施例中,获取目标单板的单板标识,并基于所述单板标识和所述各单板的单板标识与检查策略的关联关系,获取所述目标单板的目标检查策略时,一种较佳地实现方式为,读取所述第一配置文件,获取目标单板的单板标识,并基于所述单板标识确定所述目标单板的单板名称;读取所述第二配置文件,基于所述单板名称,从所述第二配置文件中获取所述目标单板对应的检查策略。
实际应用中,触发单板自检的条件包括但不限于以下情况:在网络设备初始化,单板启动时,触发单板自检操作;或者,网络设备在接收到用户触发的单板自检命令时,触发单板自检操作;或者,网络设备在运行过程中,基于预设周期进行自检操作。
步骤110:将上述目标检查策略发送给上述目标单板,以使得上述目标单板基于接收到的目标检查策略进行自检操作,并向上述主控单板反馈自检结果。
需要说明的是,网络设备中各单板(包括主控单板)均需执行自检操作,那么,本申请实施例中,在执行单板自检时,目标单板也可以是主控单板,即主控单板获取自身的检查策略,并基于该检查策略执行自检操作,得到自检结果,并根据自检结果判断自身的运行状态。
也就是说,主控单板在获取到各单板对应的检查策略后,将各检查策略分别发送至各单板,如,主控单板与其它单板通过socket通信,将检查策略发送给对应单板,单板在接收到检查策略之后,经解析得到需要检查的功能项目,通过功能检查将检查结果收集,得到自检结果后,将自检结果反馈给主控单板。
步骤120:接收上述目标单板返回的自检结果,并基于上述自检结果判断上述目标单板的运行状态。
本申请实施例中,所述检查策略中针对每一软件相关检查项目预设有对应的参数值。那么,在接收所述目标单板返回的自检结果,并基于所述自检结果判断所述目标单板的运行状态时,一种较佳地实现方式为,若所述自检结果为软件相关检查项目的自检结果,则针对每一软件相关检查项目的自检结果与预设的参数值进行比对,得到对应的比对结果,并基于所述比对结果判断所述目标单板的运行状态;若所述自检结果为硬件相关检查项目的自检结果,则基于所述硬件相关检查项目的自检结果判断所述目标单板的运行状态。
本申请实施例中,主控单板接收各单板反馈的自检结果,针对软件相关检查项目,则需要将自检结果中的该参数值与预设的正常参数值进行比对,以判断该参数值是否正常,进而通过多个比对结果,综合判断单板的运行状态。针对硬件相关检查项目,从检查项目的具体内容可知,无需预设正常参数值,根据自检结果即可判断单板的运行状态。
实际应用中,主控单板可以将自检结果存储在本地flash中,以供用户在需要时从主控单板本地获取自检结果,进一步地,主控单板还可以将自检结果发送至与之网络通信的终端上,并在终端上进行自检结果的展示,以供用户参阅分析单板的运行状态。
基于与上述方法实施例同样的发明构思,示例性的,参阅图2所示,为本申请实施例提供的一种单板自检装置的结构示意图,该装置应用于网络设备的主控单板,所述网络设备上维护有各单板的单板标识与检查策略的关联关系,所述装置包括:
获取单元20,用于获取目标单板的单板标识,并基于所述单板标识和所述各单板的单板标识与检查策略的关联关系,获取所述目标单板的目标检查策略;
发送单元21,用于将所述目标检查策略发送给所述目标单板,以使得所述目标单板基于接收到的目标检查策略进行自检操作,并向所述主控单板反馈自检结果;
接收单元22,用于接收所述目标单板返回的自检结果,并基于所述自检结果判断所述目标单板的运行状态。
可选地,所述网络设备预设有包含各单板标识和单板名称的第一配置文件,包含各单板名称和各单板对应的检查策略的第二配置文件,其中,一个单板对应的检查策略包括:软件相关检查项目和/或硬件相关检查项目。
可选地,软件相关检查项目至少包括:单板上芯片个数,各芯片的软件版本号,各芯片的CPU类型,各芯片的内存大小,各芯片的运行的软件版本号,各芯片的芯片状态,各芯片的电源类型、状态,各芯片的底层软件驱动版本;
硬件相关检查项目至少包括:单板到主控板的链路状态;单板唯一标识码检测;电源黑盒信息,内存测试,闪存测试,硬盘测试,单板到子卡的链路测试;CPU测试;单板温度测试。
可选地,获取目标单板的单板标识,并基于所述单板标识和所述各单板的单板标识与检查策略的关联关系,获取所述目标单板的目标检查策略时,所述获取单元20具体用于:
读取所述第一配置文件,获取目标单板的单板标识,并基于所述单板标识确定所述目标单板的单板名称;
读取所述第二配置文件,基于所述单板名称,从所述第二配置文件中获取所述目标单板对应的检查策略。
可选地,所述检查策略中针对每一软件相关检查项目预设有对应的参数值;接收所述目标单板返回的自检结果,并基于所述自检结果判断所述目标单板的运行状态时,所述接收单元22具体用于:
若所述自检结果为软件相关检查项目的自检结果,则针对每一软件相关检查项目的自检结果与预设的参数值进行比对,得到对应的比对结果,并基于所述比对结果判断所述目标单板的运行状态;
若所述自检结果为硬件相关检查项目的自检结果,则基于所述硬件相关检查项目的自检结果判断所述目标单板的运行状态。
以上这些单元可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器(digital singnal processor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个单元通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(CentralProcessing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些单元可以集成在一起,以片上系统(system-on-a-chip,简称SOC)的形式实现。
进一步地,本申请实施例提供的主控单板,从硬件层面而言,所述主控单板的硬件架构示意图可以参见图3所示,所述主控单板可以包括:存储器30和处理器31,
存储器30用于存储程序指令;处理器31调用存储器30中存储的程序指令,按照获得的程序指令执行上述方法实施例。具体实现方式和技术效果类似,这里不再赘述。
可选地,本申请还提供一种网络设备,包括用于执行上述方法实施例的至少一个处理元件(或芯片)。
可选地,本申请还提供一种程序产品,例如计算机可读存储介质,该计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令用于使该计算机执行上述方法实施例。
这里,机器可读存储介质可以是任何电子、磁性、光学或其它物理存储装置,可以包含或存储信息,如可执行指令、数据,等等。例如,机器可读存储介质可以是:RAM(RadomAccess Memory,随机存取存储器)、易失存储器、非易失性存储器、闪存、存储驱动器(如硬盘驱动器)、固态硬盘、任何类型的存储盘(如光盘、dvd等),或者类似的存储介质,或者它们的组合。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可以由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其它可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其它可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
而且,这些计算机程序指令也可以存储在能引导计算机或其它可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或者多个流程和/或方框图一个方框或者多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其它可编程数据处理设备上,使得在计算机或者其它可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其它可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。

Claims (10)

1.一种单板自检方法,其特征在于,应用于网络设备的主控单板,所述网络设备上维护有各单板的单板标识与检查策略的关联关系,所述方法包括:
获取目标单板的单板标识,并基于所述单板标识和所述各单板的单板标识与检查策略的关联关系,获取所述目标单板的目标检查策略;
将所述目标检查策略发送给所述目标单板,以使得所述目标单板基于接收到的目标检查策略进行自检操作,并向所述主控单板反馈自检结果;
接收所述目标单板返回的自检结果,并基于所述自检结果判断所述目标单板的运行状态。
2.如权利要求1所述的方法,其特征在于,所述网络设备预设有包含各单板标识和单板名称的第一配置文件,包含各单板名称和各单板对应的检查策略的第二配置文件,其中,一个单板对应的检查策略包括:软件相关检查项目和/或硬件相关检查项目。
3.如权利要求2所述的方法,其特征在于,软件相关检查项目至少包括:单板上芯片个数,各芯片的软件版本号,各芯片的CPU类型,各芯片的内存大小,各芯片的运行的软件版本号,各芯片的芯片状态,各芯片的电源类型、状态,各芯片的底层软件驱动版本;
硬件相关检查项目至少包括:单板到主控板的链路状态;单板唯一标识码检测;电源黑盒信息,内存测试,闪存测试,硬盘测试,单板到子卡的链路测试;CPU测试;单板温度测试。
4.如权利要求2或3所述的方法,其特征在于,获取目标单板的单板标识,并基于所述单板标识和所述各单板的单板标识与检查策略的关联关系,获取所述目标单板的目标检查策略的步骤包括:
读取所述第一配置文件,获取目标单板的单板标识,并基于所述单板标识确定所述目标单板的单板名称;
读取所述第二配置文件,基于所述单板名称,从所述第二配置文件中获取所述目标单板对应的检查策略。
5.如权利要求2或3所述的方法,其特征在于,所述检查策略中针对每一软件相关检查项目预设有对应的参数值;接收所述目标单板返回的自检结果,并基于所述自检结果判断所述目标单板的运行状态的步骤包括:
若所述自检结果为软件相关检查项目的自检结果,则针对每一软件相关检查项目的自检结果与预设的参数值进行比对,得到对应的比对结果,并基于所述比对结果判断所述目标单板的运行状态;
若所述自检结果为硬件相关检查项目的自检结果,则基于所述硬件相关检查项目的自检结果判断所述目标单板的运行状态。
6.一种单板自检装置,其特征在于,应用于网络设备的主控单板,所述网络设备上维护有各单板的单板标识与检查策略的关联关系,所述装置包括:
获取单元,用于获取目标单板的单板标识,并基于所述单板标识和所述各单板的单板标识与检查策略的关联关系,获取所述目标单板的目标检查策略;
发送单元,用于将所述目标检查策略发送给所述目标单板,以使得所述目标单板基于接收到的目标检查策略进行自检操作,并向所述主控单板反馈自检结果;
接收单元,用于接收所述目标单板返回的自检结果,并基于所述自检结果判断所述目标单板的运行状态。
7.如权利要求6所述的装置,其特征在于,所述网络设备预设有包含各单板标识和单板名称的第一配置文件,包含各单板名称和各单板对应的检查策略的第二配置文件,其中,一个单板对应的检查策略包括:软件相关检查项目和/或硬件相关检查项目。
8.如权利要求7所述的装置,其特征在于,软件相关检查项目至少包括:单板上芯片个数,各芯片的软件版本号,各芯片的CPU类型,各芯片的内存大小,各芯片的运行的软件版本号,各芯片的芯片状态,各芯片的电源类型、状态,各芯片的底层软件驱动版本;
硬件相关检查项目至少包括:单板到主控板的链路状态;单板唯一标识码检测;电源黑盒信息,内存测试,闪存测试,硬盘测试,单板到子卡的链路测试;CPU测试;单板温度测试。
9.如权利要求7或8所述的装置,其特征在于,获取目标单板的单板标识,并基于所述单板标识和所述各单板的单板标识与检查策略的关联关系,获取所述目标单板的目标检查策略时,所述获取单元具体用于:
读取所述第一配置文件,获取目标单板的单板标识,并基于所述单板标识确定所述目标单板的单板名称;
读取所述第二配置文件,基于所述单板名称,从所述第二配置文件中获取所述目标单板对应的检查策略。
10.如权利要求7或8所述的装置,其特征在于,所述检查策略中针对每一软件相关检查项目预设有对应的参数值;接收所述目标单板返回的自检结果,并基于所述自检结果判断所述目标单板的运行状态时,所述接收单元具体用于:
若所述自检结果为软件相关检查项目的自检结果,则针对每一软件相关检查项目的自检结果与预设的参数值进行比对,得到对应的比对结果,并基于所述比对结果判断所述目标单板的运行状态;
若所述自检结果为硬件相关检查项目的自检结果,则基于所述硬件相关检查项目的自检结果判断所述目标单板的运行状态。
CN202110268154.9A 2021-03-11 2021-03-11 一种单板自检方法及装置 Pending CN113176971A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110268154.9A CN113176971A (zh) 2021-03-11 2021-03-11 一种单板自检方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110268154.9A CN113176971A (zh) 2021-03-11 2021-03-11 一种单板自检方法及装置

Publications (1)

Publication Number Publication Date
CN113176971A true CN113176971A (zh) 2021-07-27

Family

ID=76921959

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110268154.9A Pending CN113176971A (zh) 2021-03-11 2021-03-11 一种单板自检方法及装置

Country Status (1)

Country Link
CN (1) CN113176971A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023185266A1 (zh) * 2022-03-30 2023-10-05 中兴通讯股份有限公司 自动化检测方法、单板、电子设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1288161A (zh) * 1999-09-11 2001-03-21 深圳市华为技术有限公司 单板测式方法和装置
CN1503480A (zh) * 2002-11-23 2004-06-09 深圳市中兴通讯股份有限公司 一种业务单板的测试方法
CN101118513A (zh) * 2006-08-03 2008-02-06 鸿富锦精密工业(深圳)有限公司 板卡测试系统及方法
CN101291261A (zh) * 2008-04-28 2008-10-22 华为技术有限公司 一种板内设备测试方法和系统
CN101631345A (zh) * 2009-08-13 2010-01-20 中兴通讯股份有限公司 单板运行状态的监控方法及装置
CN107315665A (zh) * 2017-06-07 2017-11-03 深圳市鼎盛光电有限公司 一种多媒体板卡的检测方法及其装置
CN109788273A (zh) * 2018-12-06 2019-05-21 安徽站乾科技有限公司 一种卫星电视系统的故障自我检测方法
CN112311851A (zh) * 2020-09-25 2021-02-02 新华三大数据技术有限公司 一种网络策略配置方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1288161A (zh) * 1999-09-11 2001-03-21 深圳市华为技术有限公司 单板测式方法和装置
CN1503480A (zh) * 2002-11-23 2004-06-09 深圳市中兴通讯股份有限公司 一种业务单板的测试方法
CN101118513A (zh) * 2006-08-03 2008-02-06 鸿富锦精密工业(深圳)有限公司 板卡测试系统及方法
CN101291261A (zh) * 2008-04-28 2008-10-22 华为技术有限公司 一种板内设备测试方法和系统
CN101631345A (zh) * 2009-08-13 2010-01-20 中兴通讯股份有限公司 单板运行状态的监控方法及装置
CN107315665A (zh) * 2017-06-07 2017-11-03 深圳市鼎盛光电有限公司 一种多媒体板卡的检测方法及其装置
CN109788273A (zh) * 2018-12-06 2019-05-21 安徽站乾科技有限公司 一种卫星电视系统的故障自我检测方法
CN112311851A (zh) * 2020-09-25 2021-02-02 新华三大数据技术有限公司 一种网络策略配置方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023185266A1 (zh) * 2022-03-30 2023-10-05 中兴通讯股份有限公司 自动化检测方法、单板、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN111897671A (zh) 故障恢复方法、计算机设备及存储介质
CN109324959B (zh) 一种自动转移数据的方法、服务器及计算机可读存储介质
CN111881014A (zh) 一种系统测试方法、装置、存储介质及电子设备
CN112579327A (zh) 一种故障检测方法、装置及设备
CN109278678A (zh) 车辆故障判断系统
CN110674149B (zh) 业务数据处理方法、装置、计算机设备和存储介质
CN113176971A (zh) 一种单板自检方法及装置
CN110874311A (zh) 数据库检测方法、装置、计算机设备和存储介质
CN114609995A (zh) 故障控制方法、装置、系统、设备、介质及产品
CN114500249B (zh) 一种根因定位方法和装置
CN110231921B (zh) 日志打印方法、装置、设备及计算机可读存储介质
CN113708986A (zh) 服务器监控装置、方法及计算机可读存储介质
CN116599881A (zh) 云平台租户建模测试的方法、装置、设备及存储介质
CN115525568A (zh) 代码覆盖率的巡检方法、装置、计算机设备及存储介质
CN114416442A (zh) 硬件变更的检测方法、装置、电子设备及可读存储介质
CN107797915B (zh) 故障的修复方法、装置及系统
CN112068935A (zh) kubernetes程序部署监控方法、装置以及设备
CN112529438B (zh) 分布调度系统工作流处理方法、装置、计算机设备及存储介质
CN116579466B (zh) 一种晶圆加工过程中的预约方法和预约装置
CN115454954B (zh) 数据处理方法、系统、装置及电子设备
CN117290151B (zh) 电源模块的故障原因确定方法、装置、设备、系统和介质
US20240159812A1 (en) Method for monitoring in a distributed system
US11409566B2 (en) Resource control device, resource control method, and computer readable medium
CN107783827B (zh) 异步任务处理方法及装置
CN117149492A (zh) 一种服务器故障检测方法、装置、设备及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210727