CN115756941B - 设备的自动修复方法、装置、电子设备及存储介质 - Google Patents

设备的自动修复方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN115756941B
CN115756941B CN202310028696.8A CN202310028696A CN115756941B CN 115756941 B CN115756941 B CN 115756941B CN 202310028696 A CN202310028696 A CN 202310028696A CN 115756941 B CN115756941 B CN 115756941B
Authority
CN
China
Prior art keywords
link
port
transmission rate
bandwidth
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310028696.8A
Other languages
English (en)
Other versions
CN115756941A (zh
Inventor
周含方
艾山彬
李道童
贾帅帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202310028696.8A priority Critical patent/CN115756941B/zh
Publication of CN115756941A publication Critical patent/CN115756941A/zh
Application granted granted Critical
Publication of CN115756941B publication Critical patent/CN115756941B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Communication Control (AREA)

Abstract

本发明实施例提供了一种设备的自动修复方法、装置、电子设备及存储介质,涉及信息处理技术领域,首先获取PCIe设备对应端口的链路状态信息以及链路性能信息,若链路状态信息中传输速率与第一链路性能信息中传输速率不一致,或,若链路状态信息中带宽信息小于链路性能信息中带宽信息对应的预设带宽阈值,则确定PCIe设备对应端口为异常端口,并对异常端口的链路控制寄存器中链路禁用位进行链路重启,完成对PCIe设备的自动判断与修复,极大提高了对设备降速降带宽的处理修复效率,降低了人力成本以及修复成本,提高了对设备资源预留的精确度,还增加了基本输入输出系统修复方面的力度。

Description

设备的自动修复方法、装置、电子设备及存储介质
技术领域
本发明涉及信息处理技术领域,特别是涉及一种设备的自动修复方法、一种设备的自动修复装置、一种电子设备以及一种计算机可读存储介质。
背景技术
随着互联网技术的不断发展,使得人们对于BIOS(Base Input/Output System,基本输入输出系统)适配设备需求也日益增长,在进行资源分配时,资源分配方往往需结合不同客户的实际需求以及设备的实际情况,从而容易导致在诸多项目上面出现资源分配异常问题,并且随着客户需求的日益增长,容易反复出现同样的问题,导致大大增加资源分配的人力成本与时间消耗。
目前而言,在进行设备的资源分配或者资源更新时,为保证设备运行的稳定性,当检测出需对设备进行降级修复时,一般通过加载资源包进行热更新的内容或功能实现降级修复,但采用该方式进行修复,可修复设备的适配范围小,无法对设备链路末端的设备进行修复,同时,依赖资源包的加载实现修复存在不稳定性,而对于设备的资源预留,也容易出现设备识别错误,预留资源不够精确等问题。
发明内容
本发明实施例是提供一种设备的自动修复方法、装置、电子设备以及计算机可读存储介质,以解决或部分解决现有设备修复方法中可修复设备适配范围小,且因容易出现设备识别错误,导致预留资源不够精确的问题。
本发明实施例公开了一种设备的自动修复方法,所述方法包括:
获取PCIe设备对应端口的第一链路状态信息以及第一链路性能信息,所述第一链路状态信息至少包括所述PCIe设备对应端口的第一传输速率以及第一带宽信息,所述第一链路性能信息至少包括所述PCIe设备对应端口所在链路的第二传输速率以及第二带宽信息;
若所述第一传输速率与所述第二传输速率不一致,则确定所述PCIe设备对应端口为第一异常端口;
若所述第一带宽信息小于所述第二带宽信息对应的预设带宽阈值,则确定所述PCIe设备对应端口为第一异常端口;
对所述第一异常端口的链路控制寄存器中链路禁用位进行链路重启,完成对所述PCIe设备的修复。
可选地,所述对所述第一异常端口的链路控制寄存器中链路禁用位进行链路重启,包括:
将所述第一异常端口的链路控制寄存器中链路禁用位先设为1,再设为0,对所述第一异常端口进行链路重启。
可选地,所述将所述第一异常端口的链路控制寄存器中链路禁用位先设为1,再设为0,对所述第一异常端口进行链路重启,包括:
将所述第一异常端口的链路控制寄存器中链路禁用位先设为1,并在预设延时时长之后,再将所述链路禁用位设为0,对所述第一异常端口进行链路重启。
可选地,所述若所述第一带宽信息小于所述第二带宽信息对应的预设带宽阈值,则确定所述PCIe设备对应端口为第一异常端口,包括:
若所述第一带宽信息小于所述第二带宽信息对应的上下行端口最低带宽,则所述第一链路状态信息对应的带宽与所述第一链路性能信息对应的带宽不一致,将所述PCIe设备对应端口确定为第一异常端口。
可选地,所述方法还包括:
若所述第一带宽信息等于所述第二带宽信息对应的预设带宽阈值,则确定所述PCIe设备运行状态正常,无需对所述PCIe设备对应端口进行修复。
可选地,所述若所述第一带宽信息等于所述第二带宽信息对应的预设带宽阈值,则确定所述PCIe设备运行状态正常,包括:
若所述第一带宽信息等于所述第二带宽信息对应的上下行端口最低带宽,则所述第一链路状态信息对应的带宽与所述第一链路性能信息对应的带宽一致,确定所述PCIe设备运行状态正常。
可选地,在所述对所述第一异常端口的链路控制寄存器中链路禁用位进行链路重启之后,所述方法还包括:
若进行链路重启后的第一传输速率与第二传输速率仍然不一致,或,若进行链路重启后的第一带宽信息仍小于第二带宽信息对应的预设带宽阈值,则对所述第一异常端口的链路控制寄存器中链路禁用位再次进行链路重启。
可选地,所述对所述第一异常端口的链路控制寄存器中链路禁用位再次进行链路重启,包括:
将所述第一异常端口的链路控制寄存器中链路禁用位再次先设为1,并在预设延时时长之后,再将所述链路禁用位设为0,完成对所述第一异常端口的二次链路重启。
可选地,在所述对所述第一异常端口的链路控制寄存器中链路禁用位再次进行链路重启之后,所述方法还包括:
若在进行预设次数链路重启后的第一传输速率与第二传输速率仍然不一致,则对基本输入输出系统进行重启操作。
可选地,在所述对所述第一异常端口的链路控制寄存器中链路禁用位再次进行链路重启之后,所述方法还包括:
若在进行预设次数链路重启后的第一带宽信息仍小于第二带宽信息对应的预设带宽阈值,则对基本输入输出系统进行重启操作。
可选地,所述方法还包括:
若链路重启的重启次数小于或等于预设次数,且在进行所述重启次数的链路重启后第一传输速率与第二传输速率一致、则继续启动基本输入输出系统。
可选地,所述方法还包括:
若链路重启的重启次数小于或等于预设次数,且在进行所述重启次数的链路重启后第一带宽信息等于第二带宽信息对应的预设带宽阈值,则继续启动基本输入输出系统。
可选地,所述方法还包括:
若所述第一传输速率与所述第二传输速率一致,则确定所述PCIe设备运行状态正常,无需对所述PCIe设备对应端口进行修复。
可选地,所述方法还包括:
若检测到与外置存储卡建立通信连接,则获取所述外置存储卡对应端口的第二链路状态信息以及第二链路性能信息,所述第二链路状态信息至少包括所述外置存储卡对应端口的第三传输速率,所述第二链路性能信息至少包括所述外置存储卡对应端口所在链路的第四传输速率;
若所述第三传输速率与所述第四传输速率不一致,且所述第三传输速率小于预设传输速率,则确定所述外置存储卡对应端口为第二异常端口;
对所述第二异常端口的链路控制寄存器中链路禁用位进行链路重启,完成对所述外置存储卡的修复。
可选地,所述方法还包括:
若所述第三传输速率与所述第四传输速率一致,则确定所述外置存储卡运行状态正常,无需对所述外置存储卡对应端口进行修复。
可选地,在所述对所述第二异常端口的链路控制寄存器中链路禁用位进行链路重启之后,所述方法还包括:
若进行链路重启后的第三传输速率与第四传输速率仍然不一致,则对所述第二异常端口的链路控制寄存器中链路禁用位再次进行链路重启。
可选地,所述对所述第二异常端口的链路控制寄存器中链路禁用位再次进行链路重启,包括:
将所述第二异常端口的链路控制寄存器中链路禁用位再次先设为1,并在预设延时时长之后,再将所述链路禁用位设为0,完成对所述第二异常端口的二次链路重启。
本发明实施例还公开了一种设备的自动修复装置,所述装置包括:
设备链路信息获取模块,用于获取PCIe设备对应端口的第一链路状态信息以及第一链路性能信息,所述第一链路状态信息至少包括所述PCIe设备对应端口的第一传输速率以及第一带宽信息,所述第一链路性能信息至少包括所述PCIe设备对应端口所在链路的第二传输速率以及第二带宽信息;
第一传输速率比较模块,用于若所述第一传输速率与所述第二传输速率不一致,则确定所述PCIe设备对应端口为第一异常端口;
第一带宽信息比较模块,用于若所述第一带宽信息小于所述第二带宽信息对应的预设带宽阈值,则确定所述PCIe设备对应端口为第一异常端口;
设备链路重启模块,用于对所述第一异常端口的链路控制寄存器中链路禁用位进行链路重启,完成对所述PCIe设备的修复。
可选地,所述设备链路重启模块具体用于:
将所述第一异常端口的链路控制寄存器中链路禁用位先设为1,再设为0,对所述第一异常端口进行链路重启。
可选地,所述设备链路重启模块具体用于:
将所述第一异常端口的链路控制寄存器中链路禁用位先设为1,并在预设延时时长之后,再将所述链路禁用位设为0,对所述第一异常端口进行链路重启。
可选地,所述第一带宽信息比较模块具体用于:
若所述第一带宽信息小于所述第二带宽信息对应的上下行端口最低带宽,则所述第一链路状态信息对应的带宽与所述第一链路性能信息对应的带宽不一致,将所述PCIe设备对应端口确定为第一异常端口。
可选地,所述装置还包括:
第一带宽信息比较子模块,用于若所述第一带宽信息等于所述第二带宽信息对应的预设带宽阈值,则确定所述PCIe设备运行状态正常,无需对所述PCIe设备对应端口进行修复。
可选地,所述第一带宽信息比较子模块具体用于:
若所述第一带宽信息等于所述第二带宽信息对应的上下行端口最低带宽,则所述第一链路状态信息对应的带宽与所述第一链路性能信息对应的带宽一致,确定所述PCIe设备运行状态正常。
可选地,所述装置还包括:
设备链路再次重启模块,用于若进行链路重启后的第一传输速率与第二传输速率仍然不一致,或,若进行链路重启后的第一带宽信息仍小于第二带宽信息对应的预设带宽阈值,则对所述第一异常端口的链路控制寄存器中链路禁用位再次进行链路重启。
可选地,所述设备链路再次重启模块具体用于:
将所述第一异常端口的链路控制寄存器中链路禁用位再次先设为1,并在预设延时时长之后,再将所述链路禁用位设为0,完成对所述第一异常端口的二次链路重启。
可选地,所述装置还包括:
基本输入输出系统重启模块,用于若在进行预设次数链路重启后的第一传输速率与第二传输速率仍然不一致,则对基本输入输出系统进行重启操作。
可选地,所述装置还包括:
基本输入输出系统重启子模块,用于若在进行预设次数链路重启后的第一带宽信息仍小于第二带宽信息对应的预设带宽阈值,则对基本输入输出系统进行重启操作。
可选地,所述装置还包括:
基本输入输出系统启动模块,用于若链路重启的重启次数小于或等于预设次数,且在进行所述重启次数的链路重启后第一传输速率与第二传输速率一致、则继续启动基本输入输出系统。
可选地,所述装置还包括:
基本输入输出系统启动子模块,用于若链路重启的重启次数小于或等于预设次数,且在进行所述重启次数的链路重启后第一带宽信息等于第二带宽信息对应的预设带宽阈值,则继续启动基本输入输出系统。
可选地,所述装置还包括:
第一传输速率比较子模块,用于若所述第一传输速率与所述第二传输速率一致,则确定所述PCIe设备运行状态正常,无需对所述PCIe设备对应端口进行修复。
可选地,所述装置还包括:
外置存储卡链路信息获取模块,用于若检测到与外置存储卡建立通信连接,则获取所述外置存储卡对应端口的第二链路状态信息以及第二链路性能信息,所述第二链路状态信息至少包括所述外置存储卡对应端口的第三传输速率,所述第二链路性能信息至少包括所述外置存储卡对应端口所在链路的第四传输速率;
第三传输速率比较模块,用于若所述第三传输速率与所述第四传输速率不一致,且所述第三传输速率小于预设传输速率,则确定所述外置存储卡对应端口为第二异常端口;
外置存储卡链路重启模块,用于对所述第二异常端口的链路控制寄存器中链路禁用位进行链路重启,完成对所述外置存储卡的修复。
可选地,所述装置还包括:
第三传输速率比较子模块,用于若所述第三传输速率与所述第四传输速率一致,则确定所述外置存储卡运行状态正常,无需对所述外置存储卡对应端口进行修复。
可选地,所述装置还包括:
外置存储卡链路再次重启模块,用于若进行链路重启后的第三传输速率与第四传输速率仍然不一致,则对所述第二异常端口的链路控制寄存器中链路禁用位再次进行链路重启。
可选地,所述外置存储卡链路再次重启模块具体用于:
将所述第二异常端口的链路控制寄存器中链路禁用位再次先设为1,并在预设延时时长之后,再将所述链路禁用位设为0,完成对所述第二异常端口的二次链路重启。
本发明实施例还公开了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口以及所述存储器通过所述通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行存储器上所存放的程序时,实现如本发明实施例所述的方法。
本发明实施例还公开了一种计算机可读存储介质,其上存储有指令,当由一个或多个处理器执行时,使得所述处理器执行如本发明实施例所述的方法。
本发明实施例包括以下优点:
在本发明实施例中,提供了一种设备的自动修复方法,首先获取PCIe设备对应端口的链路状态信息以及链路性能信息,若链路状态信息中传输速率与第一链路性能信息中传输速率不一致,或,若链路状态信息中带宽信息小于链路性能信息中带宽信息对应的预设带宽阈值,则确定PCIe设备对应端口为异常端口,并对异常端口的链路控制寄存器中链路禁用位进行链路重启,完成对PCIe设备的自动判断与修复,极大提高了对设备降速降带宽的处理修复效率,降低了人力成本以及修复成本,提高了对设备资源预留的精确度,还增加了基本输入输出系统修复方面的力度。
附图说明
图1是本发明实施例中提供的一种设备的自动修复方法的步骤流程图;
图2是本发明实施例中提供的一种链路控制寄存器中链路禁用位示意图;
图3是本发明实施例中提供的一种设备的自动修复方法的流程示意图;
图4是本发明实施例中提供的一种设备的自动修复装置的结构框图;
图5是本发明实施例中提供的一种计算机可读存储介质的示意图;
图6是本发明实施例中提供的一种电子设备的框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
作为一种示例,随着互联网技术的不断发展,使得人们对于BIOS(Base Input/Output System,基本输入输出系统)适配设备需求也日益增长,在进行资源分配时,资源分配方往往需结合不同客户的实际需求以及设备的实际情况,从而容易导致在诸多项目上面出现资源分配异常问题,并且随着客户需求的日益增长,容易反复出现同样的问题,导致大大增加资源分配的人力成本与时间消耗。
目前而言,在进行设备的资源分配或者资源更新时,为保证设备运行的稳定性,当检测出需对设备进行降级修复时,一般通过加载资源包进行热更新的内容或功能实现降级修复,但采用该方式进行修复,可修复设备的适配范围小,无法对设备链路末端的设备进行修复,同时,依赖资源包的加载实现修复存在不稳定性,而对于设备的资源预留,也容易出现设备识别错误,预留资源不够精确等问题。
以服务器为例,在使用服务器过程中,PCIe(Peripheral ComponentInterconnect Express,高速串行计算机扩展总线标准)设备的带宽与速率是较受关注的两个参数,带宽与速率对PCIe设备的性能具有较大的影响,其中,PCIe设备的带宽指的是实现数据传输的Lane(LAN Emulation/Local Area Network Emulation,局域网仿真)数量,一般情况下,带宽包括x1,x2,x4,x8,x16几种类型,PCIe设备的速率指的是每条Lane的速率,以Gen(PCIe硬件链路传输比特流的速度)或Gb/s(Gigabyte/second,千兆字节/秒)表示,如Gen1(2.5Gb/s)、Gen2(5Gb/s)、Gen3(8Gb/s)、Gen4(16Gb/s),在某些服务平台上最大可支持Gen4的速率。可以看出,假设PCIe设备的带宽或者速率出现异常,则该PCIe设备的功能会受到影响,甚至会导致不能够有效地被使用。
对此,本发明实施例的核心发明点之一在于:提供一种设备的自动修复方法,首先获取PCIe设备对应端口的链路状态信息以及链路性能信息,若链路状态信息中传输速率与第一链路性能信息中传输速率不一致,或,若链路状态信息中带宽信息小于链路性能信息中带宽信息对应的预设带宽阈值,则确定PCIe设备对应端口为异常端口,并对异常端口的链路控制寄存器中链路禁用位进行链路重启,完成对PCIe设备的自动判断与修复,极大提高对设备降速降带宽的处理修复效率,降低人力成本以及修复成本,提高对设备资源预留的精确度,增加基本输入输出系统修复方面的力度。
参照图1,示出了本发明实施例中提供的一种设备的自动修复方法的步骤流程图,具体可以包括如下步骤:
步骤101,获取PCIe设备对应端口的第一链路状态信息以及第一链路性能信息,所述第一链路状态信息至少包括所述PCIe设备对应端口的第一传输速率以及第一带宽信息,所述第一链路性能信息至少包括所述PCIe设备对应端口所在链路的第二传输速率以及第二带宽信息;
以服务器架构作为示例进行说明,链路状态(LinkSta)指的是接口(即端口)及其邻接网络设备关系的描述,接口的信息就是链路的信息,即链路的状态(信息)。链路状态信息可以包括接口的IPv6(Internet Protocol Version 6,互联网协议第6版)前缀(prefix)、子网掩码、接口连接的网络(链路)类型、与该接口在同一网络(链路)上的路由器等信息,链路状态信息也可以包括状态参数,如带宽、时延、传输速率等都可作为状态参数。链路性能(Linkcap)指的是链路功能特质的量化描述,主要包括功能实现的程度,功能维持的持久度,以及功能适用的范围,功能的实现条件等等,链路性能信息可以表示为在规定技术指标及相关约束条件下链路功能特质的必然表现或反映,如链路对应的带宽或者传输速率等,因本发明中主要以PCIe设备的带宽与速率这两个参数作为修复判断标准,因此本实施例中仅结合链路状态信息的带宽信息、传输速率,以及链路性能信息的带宽信息、传输速率作为降速率/降带宽的判断标准。
在具体的实现中,可以获取PCIe设备对应端口的第一链路状态信息以及第一链路性能信息,其中,第一链路状态信息至少包括PCIe设备对应端口的第一传输速率以及第一带宽信息,第一链路性能信息至少包括PCIe设备对应端口所在链路的第二传输速率以及第二带宽信息,从而可以通过获取PCIe设备对应的链路状态信息以及链路性能信息,以在后续设备修复过程中将获取的信息作为降级修复判断标准。
步骤102,若所述第一传输速率与所述第二传输速率不一致,则确定所述PCIe设备对应端口为第一异常端口;
接着可以比对第一传输速率与第二传输速率,判断两者的传输速率是否一致,当第一传输速率与第二传输速率不一致时,如第一传输速率为Gen2(5Gb/s),第二传输速率为Gen3(8Gb/s),此时可以判定需对PCIe设备对应端口执行修复策略,则可以确定PCIe设备对应端口为第一异常端口,以便对该异常端口实现自动修复。
在另一种情况中,若第一传输速率与第二传输速率一致,如第一传输速率与第二传输速率均为Gen3(8Gb/s),则可以确定PCIe设备运行状态正常,无需对PCIe设备对应端口进行修复,可以正确对设备进行识别,从而通过对链路状态与链路性能的传输速率的比对,将传输速率作为降速判断标准,实现对于PCIe设备的自动判断,在两者传输速率不一致时实现设备的自动修复,并在两者传输速率一致时自动判断无需对设备进行修复,从而无需进行人工排查即可自动实现判断与修复过程,简化了修复流程,提高了修复效率。
步骤103,若所述第一带宽信息小于所述第二带宽信息对应的预设带宽阈值,则确定所述PCIe设备对应端口为第一异常端口;
同时,对于降带宽的判断与修复,可以将链路状态的带宽以及链路状态的带宽间的比对结果作为降带宽判断标准,在具体的实现中,若第一带宽信息小于第二带宽信息对应的预设带宽阈值,则确定PCIe设备对应端口为第一异常端口,以便对该异常端口实现自动修复。
作为一种可选实施例,可以将链路性能信息中第二带宽信息对应的上下行端口最低带宽作为降带宽判断依据,则若第一带宽信息小于第二带宽信息对应的预设带宽阈值,则确定PCIe设备对应端口为第一异常端口,具体可以为:若第一带宽信息小于第二带宽信息对应的上下行端口最低带宽,则第一链路状态信息对应的带宽与第一链路性能信息对应的带宽不一致,将PCIe设备对应端口确定为第一异常端口,例如,第一带宽信息对应带宽为x2,第二带宽信息对应的上下行端口最低带宽为x4,此时第一带宽信息对应带宽x2小于第二带宽信息对应的上下行端口最低带宽x4,此时可以判定需对PCIe设备对应端口执行修复策略,则可以确定PCIe设备对应端口为第一异常端口,以便对该异常端口实现自动修复。
在另一种情况中,若第一带宽信息等于第二带宽信息对应的预设带宽阈值,则确定PCIe设备运行状态正常,无需对PCIe设备对应端口进行修复。进一步地,若第一带宽信息等于第二带宽信息对应的预设带宽阈值,则确定PCIe设备运行状态正常,具体可以为:若第一带宽信息等于第二带宽信息对应的上下行端口最低带宽,如第一带宽信息对应带宽为x4,第二带宽信息对应的上下行端口最低带宽也为x4,则第一链路状态信息对应的带宽与第一链路性能信息对应的带宽一致,确定PCIe设备运行状态正常,无需对PCIe设备对应端口进行修复。
从而通过对链路状态与链路性能的带宽信息的比对,将带宽作为降带宽判断标准,实现对于PCIe设备的自动判断,在两者带宽不一致时实现设备的自动修复,并在两者带宽一致时自动判断无需对设备进行修复,从而无需进行人工排查即可自动实现判断与修复过程,简化了修复流程,提高了修复效率。
步骤104,对所述第一异常端口的链路控制寄存器中链路禁用位进行链路重启,完成对所述PCIe设备的修复。
当确定需对PCIe设备执行修复策略,并确定第一异常端口之后,可以通过对第一异常端口的链路控制寄存器中链路禁用位进行链路重启,完成对PCIe设备的修复,从而实现对于PCIe设备的自动判断与修复。
示例性地,参照图2,示出了本发明实施例中提供的一种链路控制寄存器中链路禁用位示意图,其中,链路控制寄存器(Link Control Register)中有16位(Bit),为0~15,第4位(Bit 4)即为本发明实施例中需用到的链路禁用位(Link Disable),需要指出的是,因除第4位之外的其他位号在本发明实施例中并未涉及,因此并未在附图中进行标示,可以理解的是,链路控制寄存器并不只包含链路禁用位,本发明对此不作限制。
则结合图2,对第一异常端口的链路控制寄存器中链路禁用位进行链路重启,可以为:将第一异常端口的链路控制寄存器中链路禁用位先设为1,再设为0,对第一异常端口进行链路重启,从而将链路控制寄存器先Disable Port(使能端口)后Enable Port(启用端口),实现链路重启。
进一步地,对于端口的链路重启过程,为确保能达到更好的修复效果,可以在将链路禁用位设为1后,延时一小段时间后,如延时100ms,再将链路禁用位设为0,并在延时100ms之后再次通过传输速率或者带宽比对,判断链路重启操作是否成功,以判断是否实现对于设备的自动修复,在具体的实现中,将第一异常端口的链路控制寄存器中链路禁用位先设为1,再设为0,对第一异常端口进行链路重启,可以为:将第一异常端口的链路控制寄存器中链路禁用位先设为1,并在预设延时时长之后,再将链路禁用位设为0,对第一异常端口进行链路重启,从而通过对链路控制寄存器中链路禁用位的链路重启操作,实现对于PCIe设备的自动修复。
作为一种可选实施例,可能存在经链路重启操作之后仍无法修复成功PCIe设备的情况,则可以对链路控制寄存器的链路禁用位再次进行链路重启操作,以实现针对PCIe设备的二次修复,具体地,在对第一异常端口的链路控制寄存器中链路禁用位进行链路重启之后,若进行链路重启后的第一传输速率与第二传输速率仍然不一致,或,若进行链路重启后的第一带宽信息仍小于第二带宽信息对应的预设带宽阈值,则对第一异常端口的链路控制寄存器中链路禁用位再次进行链路重启。
进一步地,对第一异常端口的链路控制寄存器中链路禁用位再次进行链路重启,可以为:将第一异常端口的链路控制寄存器中链路禁用位再次先设为1,并在预设延时时长之后,再将链路禁用位设为0,完成对第一异常端口的二次链路重启,从而通过对链路控制寄存器的链路禁用位再次进行链路重启操作,实现针对PCIe设备的二次自动修复。
作为一种可选实施例,针对降速率判断过程,可能存在重启数次仍无法修复PCIe设备的情况,此时如果再一直进行链路重启操作,也可能无法修复PCIe设备,可以采取重启基本输入输出系统的措施,直接进行整个服务器的链路重启,则在对第一异常端口的链路控制寄存器中链路禁用位再次进行链路重启之后,若在进行预设次数链路重启后的第一传输速率与第二传输速率仍然不一致,则对基本输入输出系统进行重启操作,作为一种示例,假设在进行3次链路重启后的第一传输速率与第二传输速率仍然不一致,则对基本输入输出系统进行重启操作,从而通过对基本输入输出系统的重启操作,重启整个链路,以实现对于PCIe设备的自动修复,需要指出的是,将预设次数设置为3次仅作为一种示例性说明,本领域技术人员可以根据实际情况对链路重启次数进行设定,本发明对此不作限制。
作为一种可选实施例,针对降带宽判断过程,可能存在重启数次仍无法修复PCIe设备的情况,此时如果再一直进行链路重启操作,也可能无法修复PCIe设备,可以采取重启基本输入输出系统的措施,直接进行整个服务器的链路重启,则在对第一异常端口的链路控制寄存器中链路禁用位再次进行链路重启之后,若在进行预设次数链路重启后的第一带宽信息仍小于第二带宽信息对应的预设带宽阈值,则对基本输入输出系统进行重启操作,从而通过对基本输入输出系统的重启操作,重启整个链路,以实现对于PCIe设备的自动修复。
在另一种情况中,采用链路控制寄存器中链路禁用位进行链路重启,假设不到预设次数就实现了对于PCIe设备的修复,则此时可以继续启动基本输入输出系统,具体地,若链路重启的重启次数小于或等于预设次数,且在进行重启次数的链路重启后第一传输速率与第二传输速率一致、则继续启动基本输入输出系统,同样地,若链路重启的重启次数小于或等于预设次数,且在进行重启次数的链路重启后第一带宽信息等于第二带宽信息对应的预设带宽阈值,则继续启动基本输入输出系统,从而通过链路控制寄存器中链路禁用位进行链路重启,可以使状态机更稳定,节约服务器的开机时间。
作为一种可选实施例,本发明实施例中的设备还可以为外置存储卡,则同样可以采用相似自动修复方法对外置存储卡进行自动判断及修复,具体地,若检测到与外置存储卡建立通信连接,则获取外置存储卡对应端口的第二链路状态信息以及第二链路性能信息,第二链路状态信息至少包括外置存储卡对应端口的第三传输速率,第二链路性能信息至少包括外置存储卡对应端口所在链路的第四传输速率,若第三传输速率与第四传输速率不一致,且第三传输速率小于预设传输速率,则确定外置存储卡对应端口为第二异常端口,接着对第二异常端口的链路控制寄存器中链路禁用位进行链路重启,完成对外置存储卡的修复。
作为一种可选实施例,若第三传输速率与第四传输速率一致,则确定外置存储卡运行状态正常,无需对外置存储卡对应端口进行修复,可以正确对外置存储卡进行识别,从而针对设备为外置存储卡情形,依然可以通过对外置存储卡对应的链路状态与链路性能的传输速率的比对,将传输速率作为降速判断标准,实现对于外置存储卡的自动判断,在两者传输速率不一致时实现设备的自动修复,并在两者传输速率一致时自动判断无需对设备进行修复,从而无需进行人工排查即可自动实现判断与修复过程,简化了修复流程,提高了修复效率。
进一步地,在对第二异常端口的链路控制寄存器中链路禁用位进行链路重启之后,若进行链路重启后的第三传输速率与第四传输速率仍然不一致,则对第二异常端口的链路控制寄存器中链路禁用位再次进行链路重启,具体地,对第二异常端口的链路控制寄存器中链路禁用位再次进行链路重启,可以为:将第二异常端口的链路控制寄存器中链路禁用位再次先设为1,并在预设延时时长之后,再将链路禁用位设为0,完成对第二异常端口的二次链路重启,因前述实施例中对链路控制寄存器中链路禁用位进行链路重启,以及当链路重启预设次数之后仍无法实现修复的相应措施等相关过程进行了详细描述,此处不再赘述。
从而通过本发明实施例所采用的设备自动修复方法,除了可以通过读取VID(Vendor ID,设备厂商ID号)、DID(Device ID,设备标识)信息识别设备信息之外,还根据PCIe设备的带宽以及速率进行自动化判断,并将判断结果作为资源分配的判断指标,分配预留资源,优化资源分配机制,大大减少了因设备读取识别失败导致的资源预留不足情况的发生。
此外,本发明实施例以服务器架构作为说明示例,但本发明实施例所提供的方法并不仅限于服务器,也不仅限于服务器系统,而是适用于其它平台的服务器系统或者其他计算机系统,可以理解的是,本发明对此不作限制。
需要说明的是,本发明实施例包括但不限于上述示例,可以理解的是,本领域技术人员在本发明实施例的思想指导下,还可以根据实际需求进行设置,本发明对此不作限制。
在本发明实施例中,提供了一种设备的自动修复方法,首先获取PCIe设备对应端口的链路状态信息以及链路性能信息,若链路状态信息中传输速率与第一链路性能信息中传输速率不一致,或,若链路状态信息中带宽信息小于链路性能信息中带宽信息对应的预设带宽阈值,则确定PCIe设备对应端口为异常端口,并对异常端口的链路控制寄存器中链路禁用位进行链路重启,完成对PCIe设备的自动判断与修复,极大提高了对设备降速降带宽的处理修复效率,降低了人力成本以及修复成本,提高了对设备资源预留的精确度,还增加了基本输入输出系统修复方面的力度。
为了使本领域技术人员更好地理解本发明实施例的技术方案,下面通过一个例子进行解释、说明:
参照图3,示出了本发明实施例中提供的一种设备的自动修复方法的流程示意图,其中,本示例中以服务器作为架构、针对PCIe设备的自动判断及修复为例,具体的修复策略为“将PCIe设备对应的异常端口的链路控制寄存器中链路禁用位先设为1,并延时100ms,再设为0,并延时100ms,进行链路重启”,其中,将延时时长设为100ms,重启次数设为3次,为本发明实施例中经过反复验证之后的参考执行方案,既可以实现设备降速降带宽情况的处理,不干扰代码的正常运行,还可以更大程度提高修复概率,可以理解的是,本发明对此不作限制。
具体地,本示例所涉及设备的判断及修复流程主要可以包括以下步骤:
S301、获取PCIe设备对应端口的链路状态信息以及链路性能信息,链路状态信息至少包括PCIe设备对应端口的第一传输速率以及第一带宽信息,链路性能信息至少包括PCIe设备对应端口所在链路的第二传输速率以及第二带宽信息;
S302、判断第一传输速率与第二传输速率是否一致,若一致,则不执行修复策略;若不一致,则执行修复策略;
S303、判断第一带宽信息是否小于第二带宽信息对应的上下行端口最低带宽,若小于,则执行修复策略;若不小于(即等于),则不执行修复策略;
S304、执行修复策略后,若仍未修复成功,则再次执行修复策略;
S305、若执行修复策略次数小于等于3次可以修复成功,则继续启动基本输入输出系统;
S306、若执行修复策略次数大于3次仍未修复成功,则重启基本输入输出系统。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图4,示出了本发明实施例中提供的一种设备的自动修复装置的结构框图,具体可以包括如下模块:
设备链路信息获取模块401,用于获取PCIe设备对应端口的第一链路状态信息以及第一链路性能信息,所述第一链路状态信息至少包括所述PCIe设备对应端口的第一传输速率以及第一带宽信息,所述第一链路性能信息至少包括所述PCIe设备对应端口所在链路的第二传输速率以及第二带宽信息;
第一传输速率比较模块402,用于若所述第一传输速率与所述第二传输速率不一致,则确定所述PCIe设备对应端口为第一异常端口;
第一带宽信息比较模块403,用于若所述第一带宽信息小于所述第二带宽信息对应的预设带宽阈值,则确定所述PCIe设备对应端口为第一异常端口;
设备链路重启模块404,用于对所述第一异常端口的链路控制寄存器中链路禁用位进行链路重启,完成对所述PCIe设备的修复。
在一种可选实施例中,所述设备链路重启模块404具体用于:
将所述第一异常端口的链路控制寄存器中链路禁用位先设为1,再设为0,对所述第一异常端口进行链路重启。
在一种可选实施例中,所述设备链路重启模块404具体用于:
将所述第一异常端口的链路控制寄存器中链路禁用位先设为1,并在预设延时时长之后,再将所述链路禁用位设为0,对所述第一异常端口进行链路重启。
在一种可选实施例中,所述第一带宽信息比较模块403具体用于:
若所述第一带宽信息小于所述第二带宽信息对应的上下行端口最低带宽,则所述第一链路状态信息对应的带宽与所述第一链路性能信息对应的带宽不一致,将所述PCIe设备对应端口确定为第一异常端口。
在一种可选实施例中,所述装置还包括:
第一带宽信息比较子模块,用于若所述第一带宽信息等于所述第二带宽信息对应的预设带宽阈值,则确定所述PCIe设备运行状态正常,无需对所述PCIe设备对应端口进行修复。
在一种可选实施例中,所述第一带宽信息比较子模块具体用于:
若所述第一带宽信息等于所述第二带宽信息对应的上下行端口最低带宽,则所述第一链路状态信息对应的带宽与所述第一链路性能信息对应的带宽一致,确定所述PCIe设备运行状态正常。
在一种可选实施例中,所述装置还包括:
设备链路再次重启模块,用于若进行链路重启后的第一传输速率与第二传输速率仍然不一致,或,若进行链路重启后的第一带宽信息仍小于第二带宽信息对应的预设带宽阈值,则对所述第一异常端口的链路控制寄存器中链路禁用位再次进行链路重启。
在一种可选实施例中,所述设备链路再次重启模块具体用于:
将所述第一异常端口的链路控制寄存器中链路禁用位再次先设为1,并在预设延时时长之后,再将所述链路禁用位设为0,完成对所述第一异常端口的二次链路重启。
在一种可选实施例中,所述装置还包括:
基本输入输出系统重启模块,用于若在进行预设次数链路重启后的第一传输速率与第二传输速率仍然不一致,则对基本输入输出系统进行重启操作。
在一种可选实施例中,所述装置还包括:
基本输入输出系统重启子模块,用于若在进行预设次数链路重启后的第一带宽信息仍小于第二带宽信息对应的预设带宽阈值,则对基本输入输出系统进行重启操作。
在一种可选实施例中,所述装置还包括:
基本输入输出系统启动模块,用于若链路重启的重启次数小于或等于预设次数,且在进行所述重启次数的链路重启后第一传输速率与第二传输速率一致、则继续启动基本输入输出系统。
在一种可选实施例中,所述装置还包括:
基本输入输出系统启动子模块,用于若链路重启的重启次数小于或等于预设次数,且在进行所述重启次数的链路重启后第一带宽信息等于第二带宽信息对应的预设带宽阈值,则继续启动基本输入输出系统。
在一种可选实施例中,所述装置还包括:
第一传输速率比较子模块,用于若所述第一传输速率与所述第二传输速率一致,则确定所述PCIe设备运行状态正常,无需对所述PCIe设备对应端口进行修复。
在一种可选实施例中,所述装置还包括:
外置存储卡链路信息获取模块,用于若检测到与外置存储卡建立通信连接,则获取所述外置存储卡对应端口的第二链路状态信息以及第二链路性能信息,所述第二链路状态信息至少包括所述外置存储卡对应端口的第三传输速率,所述第二链路性能信息至少包括所述外置存储卡对应端口所在链路的第四传输速率;
第三传输速率比较模块,用于若所述第三传输速率与所述第四传输速率不一致,且所述第三传输速率小于预设传输速率,则确定所述外置存储卡对应端口为第二异常端口;
外置存储卡链路重启模块,用于对所述第二异常端口的链路控制寄存器中链路禁用位进行链路重启,完成对所述外置存储卡的修复。
在一种可选实施例中,所述装置还包括:
第三传输速率比较子模块,用于若所述第三传输速率与所述第四传输速率一致,则确定所述外置存储卡运行状态正常,无需对所述外置存储卡对应端口进行修复。
在一种可选实施例中,所述装置还包括:
外置存储卡链路再次重启模块,用于若进行链路重启后的第三传输速率与第四传输速率仍然不一致,则对所述第二异常端口的链路控制寄存器中链路禁用位再次进行链路重启。
在一种可选实施例中,所述外置存储卡链路再次重启模块具体用于:
将所述第二异常端口的链路控制寄存器中链路禁用位再次先设为1,并在预设延时时长之后,再将所述链路禁用位设为0,完成对所述第二异常端口的二次链路重启。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
另外,本发明实施例还提供了一种电子设备,包括:处理器,存储器,存储在存储器上并可在处理器上运行的计算机程序,该计算机程序被处理器执行时实现上述设备的自动修复方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
如图5所示,本发明实施例还提供了一种计算机可读存储介质501,计算机可读存储介质501上存储有计算机程序,计算机程序被处理器执行时实现上述设备的自动修复方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质501,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
图6为实现本发明各个实施例的一种电子设备的硬件结构示意图。
该电子设备600包括但不限于:射频单元601、网络模块602、音频输出单元603、输入单元604、传感器605、显示单元606、用户输入单元607、接口单元608、存储器609、处理器610、以及电源611等部件。本领域技术人员可以理解,本发明实施例中所涉及的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本发明实施例中,电子设备包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、以及计步器等。
应理解的是,本发明实施例中,射频单元601可用于收发信息或通话过程中,信号的接收和发送,具体的,将来自基站的下行数据接收后,给处理器610处理;另外,将上行的数据发送给基站。通常,射频单元601包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元601还可以通过无线通信系统与网络和其他设备通信。
电子设备通过网络模块602为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。
音频输出单元603可以将射频单元601或网络模块602接收的或者在存储器609中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元603还可以提供与电子设备600执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元603包括扬声器、蜂鸣器以及受话器等。
输入单元604用于接收音频或视频信号。输入单元604可以包括图形处理器(Graphics Processing Unit,GPU)6041和麦克风6042,图形处理器6041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元606上。经图形处理器6041处理后的图像帧可以存储在存储器609(或其它存储介质)中或者经由射频单元601或网络模块602进行发送。麦克风6042可以接收声音,并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元601发送到移动通信基站的格式输出。
电子设备600还包括至少一种传感器605,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板6061的亮度,接近传感器可在电子设备600移动到耳边时,关闭显示面板6061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别电子设备姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;传感器605还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。
显示单元606用于显示由用户输入的信息或提供给用户的信息。显示单元606可包括显示面板6061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode, OLED)等形式来配置显示面板6061。
用户输入单元607可用于接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元607包括触控面板6071以及其他输入设备6072。触控面板6071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板6071上或在触控面板6071附近的操作)。触控面板6071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器610,接收处理器610发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板6071。除了触控面板6071,用户输入单元607还可以包括其他输入设备6072。具体地,其他输入设备6072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
进一步的,触控面板6071可覆盖在显示面板6061上,当触控面板6071检测到在其上或附近的触摸操作后,传送给处理器610以确定触摸事件的类型,随后处理器610根据触摸事件的类型在显示面板6061上提供相应的视觉输出。可以理解的是,在一种实施例中,触控面板6071与显示面板6061是作为两个独立的部件来实现电子设备的输入和输出功能,但是在某些实施例中,可以将触控面板6071与显示面板6061集成而实现电子设备的输入和输出功能,具体此处不做限定。
接口单元608为外部装置与电子设备600连接的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元608可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到电子设备600内的一个或多个元件或者可以用于在电子设备600和外部装置之间传输数据。
存储器609可用于存储软件程序以及各种数据。存储器609可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器609可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器610是电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器609内的软件程序和/或模块,以及调用存储在存储器609内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。处理器610可包括一个或多个处理单元;优选的,处理器610可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器610中。
电子设备600还可以包括给各个部件供电的电源611(比如电池),优选的,电源611可以通过电源管理系统与处理器610逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
另外,电子设备600包括一些未示出的功能模块,在此不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。
本领域普通技术人员可以意识到,结合本发明实施例中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
此外,本发明实施例中可能会涉及到对用户数据的使用,在实际应用中,可以在符合所在国的适用法律法规要求的情况下(例如,用户明确同意,对用户切实通知,等),在适用法律法规允许的范围内在本文描述的方案中使用用户特定的个人数据。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (18)

1.一种设备的自动修复方法,其特征在于,包括:
获取PCIe设备对应端口的第一链路状态信息以及第一链路性能信息,所述第一链路状态信息至少包括所述PCIe设备对应端口的第一传输速率以及第一带宽信息,所述第一链路性能信息至少包括所述PCIe设备对应端口所在链路的第二传输速率以及第二带宽信息;
若所述第一传输速率与所述第二传输速率不一致,则确定所述PCIe设备对应端口为第一异常端口;
若所述第一带宽信息小于所述第二带宽信息对应的预设带宽阈值,则确定所述PCIe设备对应端口为第一异常端口;
对所述第一异常端口的链路控制寄存器中位于指定位置的链路禁用位进行链路重启,完成对所述PCIe设备的修复;
其中,所述若所述第一带宽信息小于所述第二带宽信息对应的预设带宽阈值,则确定所述PCIe设备对应端口为第一异常端口,包括:
若所述第一带宽信息小于所述第二带宽信息对应的上下行端口最低带宽,则所述第一链路状态信息对应的带宽与所述第一链路性能信息对应的带宽不一致,将所述PCIe设备对应端口确定为第一异常端口;
其中,所述方法还包括:
若检测到与外置存储卡建立通信连接,则获取所述外置存储卡对应端口的第二链路状态信息以及第二链路性能信息,所述第二链路状态信息至少包括所述外置存储卡对应端口的第三传输速率,所述第二链路性能信息至少包括所述外置存储卡对应端口所在链路的第四传输速率;
若所述第三传输速率与所述第四传输速率不一致,且所述第三传输速率小于预设传输速率,则确定所述外置存储卡对应端口为第二异常端口;
对所述第二异常端口的链路控制寄存器中链路禁用位进行链路重启,完成对所述外置存储卡的修复。
2.根据权利要求1所述的方法,其特征在于,所述对所述第一异常端口的链路控制寄存器中位于指定位置的链路禁用位进行链路重启,包括:
将所述第一异常端口的链路控制寄存器中链路禁用位先设为1,再设为0,对所述第一异常端口进行链路重启。
3.根据权利要求1所述的方法,其特征在于,所述将所述第一异常端口的链路控制寄存器中链路禁用位先设为1,再设为0,对所述第一异常端口进行链路重启,包括:
将所述第一异常端口的链路控制寄存器中链路禁用位先设为1,并在预设延时时长之后,再将所述链路禁用位设为0,对所述第一异常端口进行链路重启。
4.根据权利要求1所述的方法,其特征在于,还包括:
若所述第一带宽信息等于所述第二带宽信息对应的预设带宽阈值,则确定所述PCIe设备运行状态正常,无需对所述PCIe设备对应端口进行修复。
5.根据权利要求4所述的方法,其特征在于,所述若所述第一带宽信息等于所述第二带宽信息对应的预设带宽阈值,则确定所述PCIe设备运行状态正常,包括:
若所述第一带宽信息等于所述第二带宽信息对应的上下行端口最低带宽,则所述第一链路状态信息对应的带宽与所述第一链路性能信息对应的带宽一致,确定所述PCIe设备运行状态正常。
6.根据权利要求1所述的方法,其特征在于,在所述对所述第一异常端口的链路控制寄存器中位于指定位置的链路禁用位进行链路重启之后,所述方法还包括:
若进行链路重启后的第一传输速率与第二传输速率仍然不一致,或,若进行链路重启后的第一带宽信息仍小于第二带宽信息对应的预设带宽阈值,则对所述第一异常端口的链路控制寄存器中链路禁用位再次进行链路重启。
7.根据权利要求6所述的方法,其特征在于,所述对所述第一异常端口的链路控制寄存器中链路禁用位再次进行链路重启,包括:
将所述第一异常端口的链路控制寄存器中链路禁用位再次先设为1,并在预设延时时长之后,再将所述链路禁用位设为0,完成对所述第一异常端口的二次链路重启。
8.根据权利要求6所述的方法,其特征在于,在所述对所述第一异常端口的链路控制寄存器中链路禁用位再次进行链路重启之后,所述方法还包括:
若在进行预设次数链路重启后的第一传输速率与第二传输速率仍然不一致,则对基本输入输出系统进行重启操作。
9.根据权利要求6所述的方法,其特征在于,在所述对所述第一异常端口的链路控制寄存器中链路禁用位再次进行链路重启之后,所述方法还包括:
若在进行预设次数链路重启后的第一带宽信息仍小于第二带宽信息对应的预设带宽阈值,则对基本输入输出系统进行重启操作。
10.根据权利要求6所述的方法,其特征在于,还包括:
若链路重启的重启次数小于或等于预设次数,且在进行所述重启次数的链路重启后第一传输速率与第二传输速率一致、则继续启动基本输入输出系统。
11.根据权利要求6所述的方法,其特征在于,还包括:
若链路重启的重启次数小于或等于预设次数,且在进行所述重启次数的链路重启后第一带宽信息等于第二带宽信息对应的预设带宽阈值,则继续启动基本输入输出系统。
12.根据权利要求1所述的方法,其特征在于,还包括:
若所述第一传输速率与所述第二传输速率一致,则确定所述PCIe设备运行状态正常,无需对所述PCIe设备对应端口进行修复。
13.根据权利要求1所述的方法,其特征在于,还包括:
若所述第三传输速率与所述第四传输速率一致,则确定所述外置存储卡运行状态正常,无需对所述外置存储卡对应端口进行修复。
14.根据权利要求1所述的方法,其特征在于,在所述对所述第二异常端口的链路控制寄存器中链路禁用位进行链路重启之后,所述方法还包括:
若进行链路重启后的第三传输速率与第四传输速率仍然不一致,则对所述第二异常端口的链路控制寄存器中链路禁用位再次进行链路重启。
15.根据权利要求14所述的方法,其特征在于,所述对所述第二异常端口的链路控制寄存器中链路禁用位再次进行链路重启,包括:
将所述第二异常端口的链路控制寄存器中链路禁用位再次先设为1,并在预设延时时长之后,再将所述链路禁用位设为0,完成对所述第二异常端口的二次链路重启。
16.一种设备的自动修复装置,其特征在于,包括:
设备链路信息获取模块,用于获取PCIe设备对应端口的第一链路状态信息以及第一链路性能信息,所述第一链路状态信息至少包括所述PCIe设备对应端口的第一传输速率以及第一带宽信息,所述第一链路性能信息至少包括所述PCIe设备对应端口所在链路的第二传输速率以及第二带宽信息;
第一传输速率比较模块,用于若所述第一传输速率与所述第二传输速率不一致,则确定所述PCIe设备对应端口为第一异常端口;
第一带宽信息比较模块,用于若所述第一带宽信息小于所述第二带宽信息对应的预设带宽阈值,则确定所述PCIe设备对应端口为第一异常端口;
设备链路重启模块,用于对所述第一异常端口的链路控制寄存器中位于指定位置的链路禁用位进行链路重启,完成对所述PCIe设备的修复;
其中,所述第一带宽信息比较模块具体用于:
若所述第一带宽信息小于所述第二带宽信息对应的上下行端口最低带宽,则所述第一链路状态信息对应的带宽与所述第一链路性能信息对应的带宽不一致,将所述PCIe设备对应端口确定为第一异常端口;
其中,所述装置还包括:
外置存储卡链路信息获取模块,用于若检测到与外置存储卡建立通信连接,则获取所述外置存储卡对应端口的第二链路状态信息以及第二链路性能信息,所述第二链路状态信息至少包括所述外置存储卡对应端口的第三传输速率,所述第二链路性能信息至少包括所述外置存储卡对应端口所在链路的第四传输速率;
第三传输速率比较模块,用于若所述第三传输速率与所述第四传输速率不一致,且所述第三传输速率小于预设传输速率,则确定所述外置存储卡对应端口为第二异常端口;
外置存储卡链路重启模块,用于对所述第二异常端口的链路控制寄存器中链路禁用位进行链路重启,完成对所述外置存储卡的修复。
17.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口以及所述存储器通过所述通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行存储器上所存放的程序时,实现如权利要求1-15任一项所述的方法。
18.一种计算机可读存储介质,其上存储有指令,当由一个或多个处理器执行时,使得所述处理器执行如权利要求1-15任一项所述的方法。
CN202310028696.8A 2023-01-09 2023-01-09 设备的自动修复方法、装置、电子设备及存储介质 Active CN115756941B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310028696.8A CN115756941B (zh) 2023-01-09 2023-01-09 设备的自动修复方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310028696.8A CN115756941B (zh) 2023-01-09 2023-01-09 设备的自动修复方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN115756941A CN115756941A (zh) 2023-03-07
CN115756941B true CN115756941B (zh) 2023-04-28

Family

ID=85348746

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310028696.8A Active CN115756941B (zh) 2023-01-09 2023-01-09 设备的自动修复方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN115756941B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115576730A (zh) * 2022-10-25 2023-01-06 苏州浪潮智能科技有限公司 存储服务器pcie卡故障修复方法、系统即及计算机设备

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106789409A (zh) * 2016-12-06 2017-05-31 曙光信息产业(北京)有限公司 一种服务器插槽的检测方法和装置
CN106681878A (zh) * 2017-01-05 2017-05-17 郑州云海信息技术有限公司 一种pcie通道带宽的测试方法
CN108664361B (zh) * 2017-03-27 2021-07-16 杭州宏杉科技股份有限公司 Pcie非透明通道修复方法及装置
CN111209146B (zh) * 2019-12-23 2023-08-22 曙光信息产业(北京)有限公司 一种raid卡老化测试方法及系统
CN111488233A (zh) * 2020-04-02 2020-08-04 苏州浪潮智能科技有限公司 一种处理PCIe设备掉带宽问题的方法及系统
CN111988196B (zh) * 2020-07-21 2022-04-01 中国长城科技集团股份有限公司 一种带宽检测方法、装置、电子设备和存储介质
CN113590511B (zh) * 2021-10-08 2022-02-22 苏州浪潮智能科技有限公司 一种带宽降速修复方法、装置及电子设备
CN113688087B (zh) * 2021-10-25 2022-02-18 苏州浪潮智能科技有限公司 一种pcie设备枚举方法、系统、存储介质及设备

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115576730A (zh) * 2022-10-25 2023-01-06 苏州浪潮智能科技有限公司 存储服务器pcie卡故障修复方法、系统即及计算机设备

Also Published As

Publication number Publication date
CN115756941A (zh) 2023-03-07

Similar Documents

Publication Publication Date Title
CN110831041B (zh) 小区波束失败处理方法、移动通信终端和网络侧设备
CN111615156B (zh) 一种切换方法及终端
CN109560591B (zh) 充电方法、装置和终端
CN108282834B (zh) 一种终端接入lte网络的方法及终端
US20210091845A1 (en) Beam state detection method and terminal
CN111818658B (zh) 调度请求发送方法、调度请求接收方法、终端和网络设备
US11617177B2 (en) Beam failure recovery method and terminal
CN110958710B (zh) 信道接入方法、配置方法、终端及网络侧设备
US20220400378A1 (en) Authorization and policy parameter configuration method, terminal, and network function
CN111343710B (zh) 一种功率调整方法及电子设备
US20220159735A1 (en) Random access method, configuration method, terminal, and network side device
CN108419283B (zh) 一种wifi热点扫描的方法及移动终端
CN111131930B (zh) 设备资源控制方法、第一电子设备及计算机可读存储介质
CN111159738B (zh) 权限配置方法、应用登录方法及装置
CN110740265B (zh) 图像处理方法及终端设备
CN110475303B (zh) 一种数据传输方法及终端设备
CN112437476A (zh) 网络切换管控方法、装置、智能终端及可读存储介质
CN110167202B (zh) 会话处理方法、装置、终端及介质
CN115756941B (zh) 设备的自动修复方法、装置、电子设备及存储介质
CN108541003B (zh) 一种VoWiFi通话的控制方法和装置
CN108400994B (zh) 用户认证方法、移动终端、服务器及计算机可读存储介质
CN108391288B (zh) 一种优化通信业务质量的方法及移动终端
CN110377458B (zh) 数据恢复方法、移动终端及计算机可读存储介质
CN107820292B (zh) 一种无线局域网络的接入方法及移动终端
CN111356183B (zh) 一种传输方法、网络设备及终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant