CN111858148A - 一种PCIE Switch芯片配置文件恢复系统及方法 - Google Patents

一种PCIE Switch芯片配置文件恢复系统及方法 Download PDF

Info

Publication number
CN111858148A
CN111858148A CN201911331875.9A CN201911331875A CN111858148A CN 111858148 A CN111858148 A CN 111858148A CN 201911331875 A CN201911331875 A CN 201911331875A CN 111858148 A CN111858148 A CN 111858148A
Authority
CN
China
Prior art keywords
pcie switch
controller
switch chip
configuration file
flash
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201911331875.9A
Other languages
English (en)
Inventor
魏文星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN201911331875.9A priority Critical patent/CN111858148A/zh
Publication of CN111858148A publication Critical patent/CN111858148A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1469Backup restoration techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/24Resetting means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/40Bus structure
    • G06F13/4004Coupling between buses
    • G06F13/4022Coupling between buses using switching circuits, e.g. switching matrix, connection or expansion network
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/42Bus transfer protocol, e.g. handshake; Synchronisation
    • G06F13/4282Bus transfer protocol, e.g. handshake; Synchronisation on a serial bus, e.g. I2C bus, SPI bus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/445Program loading or initiating
    • G06F9/44505Configuring for program initiating, e.g. using registry, configuration files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2213/00Indexing scheme relating to interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F2213/0026PCI express

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明提供一种PCIE Switch芯片配置文件恢复系统及方法,所述系统包括:主机,所述主机连接所述PCIE Switch芯片的上端口,所述主机连接控制器,所述控制器和所述PCIE Switch芯片的下端口均通过切换电路连接Flash芯片。本发明能够提高PCIE Switch产品的可靠性,即Switch产品的配置文件损坏后可以自动对其恢复,该方案使用范围广,可以应用于多种PCIE Switch芯片。

Description

一种PCIE Switch芯片配置文件恢复系统及方法
技术领域
本发明涉及PCIE Switch产品技术领域,具体涉及一种PCIE Switch芯片配置文件恢复系统及方法。
背景技术
云计算、大数据推进了互联网行业的飞速发展,同时对服务器的需求也更加灵活。因此在大型数据中心往往希望不做大的设备改动就可以使用不同的资源。使用PCIESwitch产品对服务器资源进行池化的应用场景也越来越多。
PCIE Switch实际上是对服务器PCIE总线的扩展,使用PCIE Switch设计的产品目的是将服务器所需要的资源进行集中管理,按需分配。PCIE Switch产品通过上行PCIE总线链接HOST服务器,下行PCIE端口连可接Nvme硬盘、GPU、计算卡、网卡等Host服务器所需要的资源。因为服务器和PCIE Switch产品是两个独立物理机器,因此对PCIE Switch资源进行修改、增减时不会影响到服务器的正常运行。
PCIE Switch产品通过配置文件可以灵活的对下行端口进行配置和分配,包括端口的数量、种类、性能等,以此来实现对资源的集中管理和按需分配。因此配置文件的安全性、可靠性对PCIE Switch产品的运行很重要。通常配置文件都会存放在Flash中PCIESwitch芯片通过SPI总线读取Flash中的配置文件。在系统运行中一些外界干扰、非法操作、突然掉电等状况会引起Flash中的配置文件损坏从而导致产品的宕机,因此提高配置文件的可靠性是一件很必要的事情。
对于提升Flash中文件可靠性一般有几种方法:在设计时严格按照芯片手册进行设计,保证供电、时序正确,layout时避免关键信号受到干扰。使用双Flash进行设计,配置文件放在两个Flash中。使用单Flash,双镜像设计。
对于上述的现有技术,是一些通用的做法,例如1),基本所有设计都会尽可能按照设计规范做。对于2)3)可以提高系统冗余度,但前提是PCIE switch芯片或系统支持。对于PCIE Switch芯片来说,不同的厂家和不同的型号可能不支持双Flash或双镜像功能。因此传统的技术可能无法应用到PCIE Switch产品中。
发明内容
针对现有技术的上述不足,本发明提供一种PCIE Switch芯片配置文件恢复系统及方法,以解决上述技术问题。
第一方面,本发明提供一种PCIE Switch芯片配置文件恢复系统,所述系统包括:
主机,所述主机连接所述PCIE Switch芯片的上端口,所述主机连接控制器,所述控制器和所述PCIE Switch芯片的下端口均通过切换电路连接Flash芯片。
进一步的,所述控制器和所述PCIE Switch芯片均通过SPI总线连接Flash芯片。
进一步的,所述控制器为PCIE Switch产品的BMC,所述BMC的SPI接口接到切换线路,BMC的第一GPIO口和第二GPIO口均连接PCIE Switch芯片,其中第一GPIO口用于发送异常故障中断信号,第二GPIO口用于发送复位PCIE Switch芯片信号;BMC的第三GPIO口连接切换电路,用于向切换电路下发切换命令。
进一步的,所述切换电路为PCIE Switch产品的CPLD。
第二方面,本发明提供一种PCIE Switch芯片配置文件恢复方法,所述方法包括:
所述控制器接收到所述主机下发的配置文件恢复命令后立即控制切换电路将Flash的SPI总线从PCIE Switch芯片连接链路切换到控制器的SPI接口上;
所述控制器接收主机下发的备份配置文件;
所述控制器将所述备份配置文件通过控制器SPI接口写入所述Flash,并清除Flash原有文件。
进一步的,所述方法还包括:
所述主机监控PCIE Switch芯片工作状态;
若监控到PCIE Switch芯片读取Flash内的配置文件失败,则生成配置文件恢复命令并将所述配置文件恢复命令下发至所述控制器。
进一步的,所述方法还包括:
所述控制器通过拉低电位控制切换电路将Flash的SPI总线从PCIE Switch芯片连接链路切换到控制器的SPI接口上。
进一步的,所述方法还包括:
所述控制器将所述备份配置文件全部烧录至Flash后,向主机发送烧录完成信息;
所述控制器接收到主机返回的系统复位指令后,向PCIE Switch芯片发送复位信号。
本发明的有益效果在于,
本发明提供的PCIE Switch芯片配置文件恢复系统及方法,通过在主机中存储备份配置文件,在Flash内的配置文件被损坏导致PCIE Switch芯片无法读取配置文件后,主机将备份配置文件发送至控制器,由控制器将备份配置文件烧录至Flash,实现受损配置文件的恢复。本发明能够提高PCIE Switch产品的可靠性,即Switch产品的配置文件损坏后可以自动对其恢复,该方案使用范围广,可以应用于多种PCIE Switch芯片。
此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例的方法的实施硬件的示意性架构图。
图2是本发明一个实施例的方法的示意性流程图。
图3是本发明一个实施例的方法的实施硬件的示意性架构图。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
实施例1
参考图1,本实施例提供一种PCIE Switch芯片配置文件恢复系统,所述系统包括:主机,所述主机连接所述PCIE Switch芯片的上端口,所述主机连接控制器,所述控制器和所述PCIE Switch芯片的下端口均通过切换电路连接Flash芯片。
实施例2
本实施例提供一种PCIE Switch芯片配置文件恢复系统,所述系统包括:主机,所述主机连接所述PCIE Switch芯片的上端口,所述主机连接控制器,所述控制器和所述PCIESwitch芯片的下端口均通过切换电路连接Flash芯片。且控制器和PCIE Switch芯片均通过SPI总线连接Flash芯片。
其中主机可以监控PCIE Switch工作状态,当发现PCIe Switch配置文件损坏,PCIE Switch宕机时可以利用备份配置文件(保存在主机系统中)将受损配置文件修复。
控制器具有SPI总线接口,即可以读写SPI设备;同时该设备具有和主机系统通讯的功能,可以接受主机的命令及数据。本实施例中,控制器为PCIE Switch产品的BMC,所述BMC的SPI接口接到切换线路,BMC的第一GPIO口和第二GPIO口均连接PCIE Switch芯片,其中第一GPIO口用于发送异常故障中断信号,第二GPIO口用于发送复位PCIE Switch芯片信号;BMC的第三GPIO口连接切换电路,用于向切换电路下发切换命令。
切换电路可以切换SPI总线,可以将Flash的SPI总线断开切换到控制器上去。本实施例中切换电路为PCIE Switch产品的CPLD。
实施例3
如图2所示,本实施例提供的PCIE Switch芯片配置文件恢复方法100包括:
步骤110,所述控制器接收到所述主机下发的配置文件恢复命令后立即控制切换电路将Flash的SPI总线从PCIE Switch芯片连接链路切换到控制器的SPI接口上;
步骤120,所述控制器接收主机下发的备份配置文件;
步骤130,所述控制器将所述备份配置文件通过控制器SPI接口写入所述Flash,并清除Flash原有文件。
实施例4
本实施例提供一种PCIE Switch芯片配置文件恢复方法,如下:
系统运行或启动过程中,主机系统监控PCIE Switch的工作状态,如果配置文件损坏导致PCIE Switch读取失败,主机发送指令给控制器开始配置文件回复工作。控制器会操作切换电路将Flash的SPI总线从PCIE Switch芯片上断开,接到控制器的SPI接口上,同时主机系统将备份的文件通过数据链路发送给控制器,控制器接收到备份的配置文件后通过自己的SPI接口将其写入到Flash中,覆盖掉损坏的配置文件。已上步骤完成后,控制器通知主机,主机下达指令将PCIE Switch产品进行重新启动,到此整个恢复工作完成。
实施例5
请参考图3,本实施例提供一种PCIE Switch芯片配置文件恢复方法,其中PCIESwitch池化系统中都会有一台或多台服务器作为Host。因此可以选择一台或服务器做为主机系统,将备份配置文件放在主机上。主机和PCIE Switch产品物理上通过4根X4的MiniSASHD线缆相连,这四根线缆可以提供PCIE x16的数据链路和一组I2C的控制链路。选择PCIESwitch产品上的BMC作为控制器,BMC的一组I2C链路Host_BMC_I2C通过MiniSAS HD线缆接到Host上,作为控制链路及数据链路。BMC的一组SPI接口接到切换线路上,另外选择三个GPIO口其中两个接到PCIE Switch芯片上,分别用作异常故障中断和复位PCIE Switch芯片;一个接到切换电路上,用作通知切换电路进行总线切换。选择PCIE Switch产品上的CPLD作为总线切换电路,BMC/PCIE Switch芯片/Flash三者的SPI信号线均接到CPLD上,CPLD接受BMC的控制,将Flash的SPI信号连接到BMC上或者PCIE Switch芯片上。
具体的,所述PCIE Switch芯片配置文件恢复方法如下:
当配置文件损坏、PCIE Switch读取失败时,将FW_FAIL_INT信号拉低,通知BMC出现故障,BMC通过Host_BMC_I2C链路告诉主机需要对配置文件进行恢复。主机通知BMC开始进行文件恢复工作,并将备份的配置文件通过Host_BMC_I2C链路发送给BMC。BMC将SW_PCIE_BMC_CTL拉低,CPLD将Flash的SPI总线从PCIE Switch上断开,切换到BMC上,BMC开始将备份文件烧录到Flash中。烧录完成后,BMC通知主机完成烧录,主机发送系统复位指令,BMC将PCIE_Switch_RST信号拉低将PCIE Switch产品复位。
尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (8)

1.一种PCIE Switch芯片配置文件恢复系统,其特征在于,所述系统包括:
主机,所述主机连接所述PCIE Switch芯片的上端口,所述主机连接控制器,所述控制器和所述PCIE Switch芯片的下端口均通过切换电路连接Flash芯片。
2.根据权利要求1所述的系统,其特征在于,所述控制器和所述PCIE Switch芯片均通过SPI总线连接Flash芯片。
3.根据权利要求1所述的系统,其特征在于,所述控制器为PCIE Switch产品的BMC,所述BMC的SPI接口接到切换线路,BMC的第一GPIO口和第二GPIO口均连接PCIE Switch芯片,其中第一GPIO口用于发送异常故障中断信号,第二GPIO口用于发送复位PCIE Switch芯片信号;BMC的第三GPIO口连接切换电路,用于向切换电路下发切换命令。
4.根据权利要求1所述的系统,其特征在于,所述切换电路为PCIE Switch产品的CPLD。
5.一种PCIE Switch芯片配置文件恢复方法,其特征在于,所述方法包括:
所述控制器接收到所述主机下发的配置文件恢复命令后立即控制切换电路将Flash的SPI总线从PCIE Switch芯片连接链路切换到控制器的SPI接口上;
所述控制器接收主机下发的备份配置文件;
所述控制器将所述备份配置文件通过控制器SPI接口写入所述Flash,并清除Flash原有文件。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
所述主机监控PCIE Switch芯片工作状态;
若监控到PCIE Switch芯片读取Flash内的配置文件失败,则生成配置文件恢复命令并将所述配置文件恢复命令下发至所述控制器。
7.根据权利要求5所述的方法,其特征在于,所述方法还包括:
所述控制器通过拉低电位控制切换电路将Flash的SPI总线从PCIE Switch芯片连接链路切换到控制器的SPI接口上。
8.根据权利要求5所述的方法,其特征在于,所述方法还包括:
所述控制器将所述备份配置文件全部烧录至Flash后,向主机发送烧录完成信息;
所述控制器接收到主机返回的系统复位指令后,向PCIE Switch芯片发送复位信号。
CN201911331875.9A 2019-12-21 2019-12-21 一种PCIE Switch芯片配置文件恢复系统及方法 Withdrawn CN111858148A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911331875.9A CN111858148A (zh) 2019-12-21 2019-12-21 一种PCIE Switch芯片配置文件恢复系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911331875.9A CN111858148A (zh) 2019-12-21 2019-12-21 一种PCIE Switch芯片配置文件恢复系统及方法

Publications (1)

Publication Number Publication Date
CN111858148A true CN111858148A (zh) 2020-10-30

Family

ID=72970827

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911331875.9A Withdrawn CN111858148A (zh) 2019-12-21 2019-12-21 一种PCIE Switch芯片配置文件恢复系统及方法

Country Status (1)

Country Link
CN (1) CN111858148A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112748948A (zh) * 2021-01-07 2021-05-04 苏州浪潮智能科技有限公司 PCIe switch工作模式更新方法及相关组件
CN113190484A (zh) * 2021-04-13 2021-07-30 山东英信计算机技术有限公司 一种管理jtag接口芯片的方法、服务器及介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112748948A (zh) * 2021-01-07 2021-05-04 苏州浪潮智能科技有限公司 PCIe switch工作模式更新方法及相关组件
CN112748948B (zh) * 2021-01-07 2022-06-07 苏州浪潮智能科技有限公司 PCIe switch工作模式更新方法及相关组件
CN113190484A (zh) * 2021-04-13 2021-07-30 山东英信计算机技术有限公司 一种管理jtag接口芯片的方法、服务器及介质

Similar Documents

Publication Publication Date Title
CN105700970A (zh) 服务器系统
CN100492305C (zh) 一种计算机系统的快速恢复方法及设备
US7568119B2 (en) Storage control device and storage control device path switching method
CN103488498A (zh) 一种计算机启动方法及计算机
CN102880527B (zh) 一种基板管理控制器的数据恢复方法
CN112667066B (zh) 一种扩展硬盘存储容量的方法、系统及介质
CN104679610B (zh) 计算机系统的管理方法和装置
CN112825011A (zh) PCIe设备的上下电控制方法以及系统
CN111858148A (zh) 一种PCIE Switch芯片配置文件恢复系统及方法
CN114116280A (zh) 交互式bmc自恢复方法、系统、终端及存储介质
US20190079675A1 (en) Data Synchronization Method and Out-of-Band Management Device
CN116820827B (zh) 一种节点服务器的基板管理控制器的控制方法及其系统
CN114003445A (zh) Bmc的i2c监控功能测试方法、系统、终端及存储介质
CN110740066B (zh) 一种席位不变的跨机故障迁移方法和系统
CN105490844A (zh) 一种PCIe端口重构方法
US20180145869A1 (en) Debugging method of switches
CN218824636U (zh) 一种用于服务器硬盘背板的电源检测装置
CN201047943Y (zh) 一种计算机系统的快速恢复设备
TWI776612B (zh) 儲存裝置及其操作方法
US6801973B2 (en) Hot swap circuit module
CN115098342A (zh) 系统日志收集方法、系统、终端及存储介质
CN115098324A (zh) 硬盘维护方法、装置、设备和存储介质
CN103378902B (zh) 光线路终端系统的主备切换方法及光线路终端系统
CN219533773U (zh) 固件烧录电路及系统
CN106844113B (zh) 一种采用冗余pch的服务器故障恢复系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20201030