CN112783696A - 一种网卡冗余系统及服务器 - Google Patents

一种网卡冗余系统及服务器 Download PDF

Info

Publication number
CN112783696A
CN112783696A CN202110083108.1A CN202110083108A CN112783696A CN 112783696 A CN112783696 A CN 112783696A CN 202110083108 A CN202110083108 A CN 202110083108A CN 112783696 A CN112783696 A CN 112783696A
Authority
CN
China
Prior art keywords
network card
target network
network
target
cards
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110083108.1A
Other languages
English (en)
Inventor
杨文静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202110083108.1A priority Critical patent/CN112783696A/zh
Publication of CN112783696A publication Critical patent/CN112783696A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1608Error detection by comparing the output signals of redundant hardware
    • G06F11/1616Error detection by comparing the output signals of redundant hardware where the redundant component is an I/O device or an adapter therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1608Error detection by comparing the output signals of redundant hardware
    • G06F11/1625Error detection by comparing the output signals of redundant hardware in communications, e.g. transmission, interfaces

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种网卡冗余系统及服务器,包括多个网卡、网卡选通电路及控制电路。控制电路用于按照预设网卡选通策略从多个网卡中确定当前所需选通的目标网卡,并控制网卡选通电路选通目标网卡与自身控制电路之间的通信链路,以通过与目标网卡交互实现系统网络功能;若目标网卡发生故障,则按照预设网卡选通策略从剩余网卡中重新确定目标网卡,并返回执行控制网卡选通电路选通目标网卡与自身控制电路之间的通信链路的操作,直至系统中所有网卡均发生故障。可见,本申请采用多网卡的设计,当正在使用的目标网卡发生故障时,可从剩余网卡中重新选择一网卡代替发生故障的目标网卡继续工作,保证系统与外网的通信不中断,从而有利于服务器用户使用。

Description

一种网卡冗余系统及服务器
技术领域
本发明涉及服务器与外网的通信领域,特别是涉及一种网卡冗余系统及服务器。
背景技术
目前,OCP3.0(Open Compute Project,开放计算项目)网卡具有便于插拔维护的优点,其在物理形态和电气特性上符合绝大多数服务器用户的使用需求,因此,OCP3.0网卡被作为服务器第一优先级业务网络应用于各种类型的服务器设计中。但是,现有的服务器大都采用单一OCP3.0网卡的设计,一旦OCP3.0网卡发生故障,服务器系统与外网的通信就断了,从而影响服务器用户使用。
因此,如何提供一种解决上述技术问题的方案是本领域的技术人员目前需要解决的问题。
发明内容
本发明的目的是提供一种网卡冗余系统及服务器,采用多网卡的设计,当正在使用的目标网卡发生故障时,可从剩余网卡中重新选择一网卡代替发生故障的目标网卡继续工作,保证系统与外网的通信不中断,从而有利于服务器用户使用。
为解决上述技术问题,本发明提供了一种网卡冗余系统,包括:
多个网卡;
与多个网卡连接的网卡选通电路;
与所述网卡选通电路连接的控制电路,用于按照预设网卡选通策略从多个网卡中确定当前所需选通的目标网卡,并控制所述网卡选通电路选通所述目标网卡与自身控制电路之间的通信链路,以通过与所述目标网卡交互实现系统网络功能;若所述目标网卡发生故障,则按照预设网卡选通策略从剩余网卡中重新确定目标网卡,并返回执行控制所述网卡选通电路选通所述目标网卡与自身控制电路之间的通信链路的操作,直至系统中所有网卡均发生故障。
优选地,所述控制电路包括:
I/O扩展芯片;
分别与多个网卡、所述网卡选通电路及所述I/O扩展芯片连接的主控制芯片,用于检测多个网卡的在位信号,并将所述在位信号经所述I/O扩展芯片发送至电源控制芯片;在多个网卡均在位时按照预设网卡选通策略从多个网卡中确定当前所需选通的目标网卡,并控制所述网卡选通电路选通所述目标网卡与自身控制电路之间的通信链路;在接收到电源使能信号后,控制所述目标网卡上电;若处于工作状态的目标网卡发生故障,则将网卡故障信号经所述I/O扩展芯片发送至所述电源控制芯片,并在接收到电源下电信号后控制所述目标网卡下电,且按照预设网卡选通策略从剩余网卡中重新确定目标网卡,并重新控制所述网卡选通电路选通所述目标网卡与自身控制电路之间的通信链路,且返回执行控制所述目标网卡上电的操作,直至系统中所有网卡均发生故障;
与所述I/O扩展芯片连接的电源控制芯片,用于在根据所述在位信号确定多个网卡均在位后,将电源使能信号经所述I/O扩展芯片发送至所述主控制芯片;在接收到所述网卡故障信号后,将电源下电信号经所述I/O扩展芯片发送至所述主控制芯片;
分别与多个网卡连接的复位芯片,用于在接收到所述目标网卡的上电完成信号后,将所述目标网卡进行复位以使所述目标网卡进入工作状态。
优选地,所述网卡冗余系统还包括:
与所述主控制芯片连接的指示装置;
所述主控制芯片还用于在检测到所述目标网卡发生故障时,控制所述指示装置发出表征所述目标网卡故障的指示信息。
优选地,所述网卡冗余系统还包括:
与所述主控制芯片连接、且与多个网卡一一对应的多个热插拔开关;
所述主控制芯片还用于在所述目标网卡对应的热插拔开关被按下时,执行所述目标网卡热插拔的一系列控制操作,并在重新检测到所述目标网卡的在位信号时确定所述目标网卡更换成功。
优选地,所述I/O扩展芯片为PCA9555芯片;所述主控制芯片为BMC;所述电源控制芯片为经SMBUS总线与所述I/O扩展芯片连接的CPU;所述复位芯片为CPLD。
优选地,预设网卡选通策略的设置过程,包括:
预先对多个网卡进行网络性能测试,并根据多个网卡的网络性能测试结果评估多个网卡的性能分值;
将性能分值最高的网卡作为当前所需选通的目标网卡。
优选地,所述控制电路检测所述目标网卡是否发生故障的过程,包括:
向所述目标网卡发送功能检测信号,并判断所述目标网卡在预设时间内是否返回功能正常信号;
若是,则确定所述目标网卡未发生故障;
若否,则确定所述目标网卡发生故障。
为解决上述技术问题,本发明还提供了一种服务器,包括上述任一种网卡冗余系统。
本发明提供了一种网卡冗余系统,包括多个网卡、网卡选通电路及控制电路。控制电路用于按照预设网卡选通策略从多个网卡中确定当前所需选通的目标网卡,并控制网卡选通电路选通目标网卡与自身控制电路之间的通信链路,以通过与目标网卡交互实现系统网络功能;若目标网卡发生故障,则按照预设网卡选通策略从剩余网卡中重新确定目标网卡,并返回执行控制网卡选通电路选通目标网卡与自身控制电路之间的通信链路的操作,直至系统中所有网卡均发生故障。可见,本申请采用多网卡的设计,当正在使用的目标网卡发生故障时,可从剩余网卡中重新选择一网卡代替发生故障的目标网卡继续工作,保证系统与外网的通信不中断,从而有利于服务器用户使用。
本发明还提供了一种服务器,与上述网卡冗余系统具有相同的有益效果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对现有技术和实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种网卡冗余系统的结构示意图;
图2为本发明实施例提供的一种网卡冗余系统的具体结构示意图。
具体实施方式
本发明的核心是提供一种网卡冗余系统及服务器,采用多网卡的设计,当正在使用的目标网卡发生故障时,可从剩余网卡中重新选择一网卡代替发生故障的目标网卡继续工作,保证系统与外网的通信不中断,从而有利于服务器用户使用。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参照图1,图1为本发明实施例提供的一种网卡冗余系统的结构示意图。
该网卡冗余系统包括:
多个网卡S;
与多个网卡S连接的网卡选通电路1;
与网卡选通电路1连接的控制电路2,用于按照预设网卡选通策略从多个网卡S中确定当前所需选通的目标网卡,并控制网卡选通电路1选通目标网卡与自身控制电路之间的通信链路,以通过与目标网卡交互实现系统网络功能;若目标网卡发生故障,则按照预设网卡选通策略从剩余网卡中重新确定目标网卡,并返回执行控制网卡选通电路1选通目标网卡与自身控制电路之间的通信链路的操作,直至系统中所有网卡S均发生故障。
具体地,本申请的网卡冗余系统包括多个网卡S(如OCP网卡)、网卡选通电路1(如SWITCH(开关)电路)及控制电路2,其工作原理为:
本申请为同一服务器设置多个网卡S,并提前设置一个网卡选通策略,目的是按照预设网卡选通策略从多个网卡S中确定当前所需选通的网卡,供服务器系统使用。
更具体地,本申请由控制电路2按照预设网卡选通策略从多个网卡S中确定当前所需选通的网卡(称为目标网卡),并控制网卡选通电路1选通目标网卡与自身控制电路之间的通信链路,以通过控制电路2与目标网卡交互实现系统网络功能。在控制电路2与目标网卡交互的过程中,控制电路2还检测目标网卡是否发生故障,若目标网卡未发生故障,则控制电路2可继续与目标网卡交互实现系统网络功能;若目标网卡发生故障,则控制电路2按照预设网卡选通策略从剩余网卡(多个网卡S中除去发生故障的目标网卡)中重新确定当前所需选通的目标网卡,并控制网卡选通电路1重新选通重新确定的目标网卡与自身控制电路之间的通信链路,以通过控制电路2与重新确定的目标网卡交互继续实现系统网络功能。
同样地,在控制电路2与重新确定的目标网卡交互的过程中,控制电路2还检测重新确定的目标网卡是否发生故障,若重新确定的目标网卡未发生故障,则控制电路2可继续与重新确定的目标网卡交互实现系统网络功能;若重新确定的目标网卡发生故障,则控制电路2按照预设网卡选通策略从剩余网卡(多个网卡S中除去发生故障的目标网卡)中再次重新确定当前所需选通的目标网卡,并控制网卡选通电路1重新选通再次重新确定的目标网卡与自身控制电路之间的通信链路,以通过控制电路2与再次重新确定的目标网卡交互继续实现系统网络功能,如此循环下去,直至系统中所有网卡S均发生故障。
需要说明的是,网卡选通电路1每次只选通一个网卡与控制电路2之间的通信链路,以避免网卡使用冲突。
本发明提供了一种网卡冗余系统,包括多个网卡、网卡选通电路及控制电路。控制电路用于按照预设网卡选通策略从多个网卡中确定当前所需选通的目标网卡,并控制网卡选通电路选通目标网卡与自身控制电路之间的通信链路,以通过与目标网卡交互实现系统网络功能;若目标网卡发生故障,则按照预设网卡选通策略从剩余网卡中重新确定目标网卡,并返回执行控制网卡选通电路选通目标网卡与自身控制电路之间的通信链路的操作,直至系统中所有网卡均发生故障。可见,本申请采用多网卡的设计,当正在使用的目标网卡发生故障时,可从剩余网卡中重新选择一网卡代替发生故障的目标网卡继续工作,保证系统与外网的通信不中断,从而有利于服务器用户使用。
在上述实施例的基础上:
请参照图2,图2为本发明实施例提供的一种网卡冗余系统的具体结构示意图。
作为一种可选的实施例,控制电路2包括:
I/O扩展芯片;
分别与多个网卡S、网卡选通电路1及I/O扩展芯片连接的主控制芯片,用于检测多个网卡S的在位信号,并将在位信号经I/O扩展芯片发送至电源控制芯片;在多个网卡S均在位时按照预设网卡选通策略从多个网卡中确定当前所需选通的目标网卡,并控制网卡选通电路1选通目标网卡与自身控制电路之间的通信链路;在接收到电源使能信号后,控制目标网卡上电;若处于工作状态的目标网卡发生故障,则将网卡故障信号经I/O扩展芯片发送至电源控制芯片,并在接收到电源下电信号后控制目标网卡下电,且按照预设网卡选通策略从剩余网卡中重新确定目标网卡,并重新控制网卡选通电路1选通目标网卡与自身控制电路之间的通信链路,且返回执行控制目标网卡上电的操作,直至系统中所有网卡S均发生故障;
与I/O扩展芯片连接的电源控制芯片,用于在根据在位信号确定多个网卡S均在位后,将电源使能信号经I/O扩展芯片发送至主控制芯片;在接收到网卡故障信号后,将电源下电信号经I/O扩展芯片发送至主控制芯片;
分别与多个网卡S连接的复位芯片,用于在接收到目标网卡的上电完成信号后,将目标网卡进行复位以使目标网卡进入工作状态。
具体地,本申请的控制电路2包括I/O(Input/Output,输入/输出)扩展芯片、主控制芯片、电源控制芯片及复位芯片,其工作原理为:
主控制芯片检测多个网卡S的在位信号(PRSENT),一方面将多个网卡S的在位信号经I/O扩展芯片发送至电源控制芯片;另一方面根据多个网卡S的在位信号判断多个网卡S是否均在位,并在多个网卡S均在位时按照预设网卡选通策略从多个网卡S中确定当前所需选通的目标网卡(称为网卡0),且控制网卡选通电路1(Select pin)选通网卡0与自身控制电路之间的通信链路。电源控制芯片在接收到多个网卡S的在位信号后,根据多个网卡S的在位信号判断多个网卡S是否均在位,并在确定多个网卡S均在位后将电源使能信号经I/O扩展芯片发送至主控制芯片。主控制芯片在接收到电源使能信号(Power EN)后,控制网卡0上电。网卡0在自身上电完成后会生成上电完成信号(Power_GD)至复位芯片。复位芯片在接收到网卡0的上电完成信号后,向网卡0发送复位信号(Reset),以将网卡0进行复位,使网卡0进入工作状态。主控制芯片在网卡0进入工作状态后,可与网卡0交互实现系统网络功能。在主控制芯片与网卡0交互的过程中,主控制芯片还检测网卡0是否发生故障,若网卡0未发生故障,则主控制芯片可继续与网卡0交互实现系统网络功能;若网卡0发生故障,则主控制芯片将网卡故障信号(ATTN_Button)经I/O扩展芯片发送至电源控制芯片。电源控制芯片在接收到网卡故障信号后,将电源下电信号经I/O扩展芯片发送至主控制芯片。主控制芯片在接收到电源下电信号后,控制网卡0下电,并按照预设网卡选通策略从剩余网卡(多个网卡S中除去发生故障的网卡0)中重新确定当前所需选通的目标网卡(称为网卡1),并控制网卡选通电路1重新选通网卡1与自身控制电路之间的通信链路,然后控制网卡1上电。
同样地,网卡1在自身上电完成后会生成上电完成信号至复位芯片。复位芯片在接收到重新确定的网卡1的上电完成信号后,向网卡1发送复位信号,以将网卡1进行复位,使网卡1进入工作状态。主控制芯片在网卡1进入工作状态后,可与网卡1交互实现系统网络功能。在主控制芯片与网卡1交互的过程中,主控制芯片还检测网卡1是否发生故障,若网卡1未发生故障,则主控制芯片可继续与网卡1交互实现系统网络功能;若网卡1发生故障,则主控制芯片将网卡故障信号经I/O扩展芯片发送至电源控制芯片。电源控制芯片在接收到网卡故障信号后,将电源下电信号经I/O扩展芯片发送至主控制芯片。主控制芯片在接收到电源下电信号后,控制网卡1下电,并按照预设网卡选通策略从剩余网卡(多个网卡S中除去发生故障的网卡0、网卡1)中再次重新确定当前所需选通的目标网卡,并控制网卡选通电路1重新选通再次重新确定的目标网卡与自身控制电路之间的通信链路,然后控制再次重新确定的目标网卡上电。如此循环下去,直至系统中所有网卡S均发生故障。
作为一种可选的实施例,网卡冗余系统还包括:
与主控制芯片连接的指示装置;
主控制芯片还用于在检测到目标网卡发生故障时,控制指示装置发出表征目标网卡故障的指示信息。
进一步地,本申请的网卡冗余系统还包括指示装置,其工作原理为:
主控制芯片在检测到目标网卡发生故障时,控制指示装置发出表征目标网卡故障的指示信息,供服务器用户查看。
更具体地,本申请的指示装置包括与多个网卡S一一对应的多个错误指示灯(Error led),主控制芯片在检测到目标网卡发生故障时,控制与目标网卡对应的错误指示灯点亮。
作为一种可选的实施例,网卡冗余系统还包括:
与主控制芯片连接、且与多个网卡S一一对应的多个热插拔开关;
主控制芯片还用于在目标网卡对应的热插拔开关被按下时,执行目标网卡热插拔的一系列控制操作,并在重新检测到目标网卡的在位信号时确定目标网卡更换成功。
进一步地,本申请的网卡冗余系统还包括多个热插拔开关(Button),其工作原理为:
本申请的网卡S具有热插拔功能。在目标网卡发生故障时,可利用目标网卡的热插拔功能在系统运行时实现对目标网卡进行更换。每个热插拔开关均对应一个网卡,在对目标网卡进行热插拔时,按下目标网卡对应的热插拔开关,主控制芯片在检测到目标网卡对应的热插拔开关被按下时,执行目标网卡热插拔的一系列控制操作。在目标网卡拔下时,目标网卡的在位信号失效,主控制芯片检测不到目标网卡的在位信号,待故障的目标网卡更换成功后,主控制芯片可重新检测到更换后的目标网卡的在位信号,所以主控制芯片在重新检测到目标网卡的在位信号时确定故障的目标网卡更换成功。
此外,主控制芯片还可对多个网卡S的故障状态进行记录,具体将多个网卡S的初始状态设为正常,在目标网卡发生故障时,将目标网卡的状态改为故障;待确定故障的目标网卡更换成功后,将目标网卡的状态改为正常;则按照预设网卡选通策略从剩余网卡中重新确定目标网卡的过程,包括:按照预设网卡选通策略从状态为正常的网卡中重新确定目标网卡。
作为一种可选的实施例,I/O扩展芯片为PCA9555芯片;主控制芯片为BMC;电源控制芯片为经SMBUS总线与I/O扩展芯片连接的CPU;复位芯片为CPLD。
具体地,如图2所示,本申请的I/O扩展芯片可选用PCA9555芯片;主控制芯片可选用BMC(Baseboard Management Controller,基板管理控制器),BMC与OCP网卡通过NCSI(Network Controller Sideband Interface,边带接口网络控制器)信号交互;电源控制芯片可选用CPU(中央处理器),CPU与PCA9555芯片经SMBUS(System Management Bus,系统管理总线)连接,CPU可与OCP网卡通过PCIE(peripheral component interconnect express,高速串行计算机扩展总线标准)信号交互;复位芯片可选用CPLD(Complex ProgrammableLogic Device,复杂可编程逻辑器件)。
作为一种可选的实施例,预设网卡选通策略的设置过程,包括:
预先对多个网卡S进行网络性能测试,并根据多个网卡S的网络性能测试结果评估多个网卡S的性能分值;
将性能分值最高的网卡作为当前所需选通的目标网卡。
具体地,本申请的网卡选通策略的原理为:提前对服务器内的多个网卡S进行网络性能测试,得到多个网卡S的网络性能测试结果,并根据多个网卡S的网络性能测试结果评估多个网卡S的性能分值,可以理解的是,网卡的网络性能较好,其性能分值越高。而本申请从多个网卡S中确定当前所需选通的目标网卡的依据是优先选用网络性能较好的网卡,所以本申请将多个网卡S中性能分值最高的网卡作为当前所需选通的目标网卡。
作为一种可选的实施例,控制电路2检测目标网卡是否发生故障的过程,包括:
向目标网卡发送功能检测信号,并判断目标网卡在预设时间内是否返回功能正常信号;
若是,则确定目标网卡未发生故障;
若否,则确定目标网卡发生故障。
具体地,本申请的控制电路2在检测目标网卡是否发生故障时,可轮询向目标网卡发送功能检测信号,目标网卡在功能正常的情况下会返回功能正常信号给控制电路2。基于此,控制电路2在从向目标网卡发送功能检测信号时开始计时,当计时时间到达预设时间时,若控制电路2接收到目标网卡返回的功能正常信号,则确定目标网卡未发生故障;若控制电路2未接收到目标网卡返回的功能正常信号,则确定目标网卡发生故障。
本申请还提供了一种服务器,包括上述任一种网卡冗余系统。
本申请提供的服务器的介绍请参考上述网卡冗余系统的实施例,本申请在此不再赘述。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其他实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (8)

1.一种网卡冗余系统,其特征在于,包括:
多个网卡;
与多个网卡连接的网卡选通电路;
与所述网卡选通电路连接的控制电路,用于按照预设网卡选通策略从多个网卡中确定当前所需选通的目标网卡,并控制所述网卡选通电路选通所述目标网卡与自身控制电路之间的通信链路,以通过与所述目标网卡交互实现系统网络功能;若所述目标网卡发生故障,则按照预设网卡选通策略从剩余网卡中重新确定目标网卡,并返回执行控制所述网卡选通电路选通所述目标网卡与自身控制电路之间的通信链路的操作,直至系统中所有网卡均发生故障。
2.如权利要求1所述的网卡冗余系统,其特征在于,所述控制电路包括:
I/O扩展芯片;
分别与多个网卡、所述网卡选通电路及所述I/O扩展芯片连接的主控制芯片,用于检测多个网卡的在位信号,并将所述在位信号经所述I/O扩展芯片发送至电源控制芯片;在多个网卡均在位时按照预设网卡选通策略从多个网卡中确定当前所需选通的目标网卡,并控制所述网卡选通电路选通所述目标网卡与自身控制电路之间的通信链路;在接收到电源使能信号后,控制所述目标网卡上电;若处于工作状态的目标网卡发生故障,则将网卡故障信号经所述I/O扩展芯片发送至所述电源控制芯片,并在接收到电源下电信号后控制所述目标网卡下电,且按照预设网卡选通策略从剩余网卡中重新确定目标网卡,并重新控制所述网卡选通电路选通所述目标网卡与自身控制电路之间的通信链路,且返回执行控制所述目标网卡上电的操作,直至系统中所有网卡均发生故障;
与所述I/O扩展芯片连接的电源控制芯片,用于在根据所述在位信号确定多个网卡均在位后,将电源使能信号经所述I/O扩展芯片发送至所述主控制芯片;在接收到所述网卡故障信号后,将电源下电信号经所述I/O扩展芯片发送至所述主控制芯片;
分别与多个网卡连接的复位芯片,用于在接收到所述目标网卡的上电完成信号后,将所述目标网卡进行复位以使所述目标网卡进入工作状态。
3.如权利要求2所述的网卡冗余系统,其特征在于,所述网卡冗余系统还包括:
与所述主控制芯片连接的指示装置;
所述主控制芯片还用于在检测到所述目标网卡发生故障时,控制所述指示装置发出表征所述目标网卡故障的指示信息。
4.如权利要求3所述的网卡冗余系统,其特征在于,所述网卡冗余系统还包括:
与所述主控制芯片连接、且与多个网卡一一对应的多个热插拔开关;
所述主控制芯片还用于在所述目标网卡对应的热插拔开关被按下时,执行所述目标网卡热插拔的一系列控制操作,并在重新检测到所述目标网卡的在位信号时确定所述目标网卡更换成功。
5.如权利要求2所述的网卡冗余系统,其特征在于,所述I/O扩展芯片为PCA9555芯片;所述主控制芯片为BMC;所述电源控制芯片为经SMBUS总线与所述I/O扩展芯片连接的CPU;所述复位芯片为CPLD。
6.如权利要求1-5任一项所述的网卡冗余系统,其特征在于,预设网卡选通策略的设置过程,包括:
预先对多个网卡进行网络性能测试,并根据多个网卡的网络性能测试结果评估多个网卡的性能分值;
将性能分值最高的网卡作为当前所需选通的目标网卡。
7.如权利要求6所述的网卡冗余系统,其特征在于,所述控制电路检测所述目标网卡是否发生故障的过程,包括:
向所述目标网卡发送功能检测信号,并判断所述目标网卡在预设时间内是否返回功能正常信号;
若是,则确定所述目标网卡未发生故障;
若否,则确定所述目标网卡发生故障。
8.一种服务器,其特征在于,包括如权利要求1-7任一项所述的网卡冗余系统。
CN202110083108.1A 2021-01-21 2021-01-21 一种网卡冗余系统及服务器 Pending CN112783696A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110083108.1A CN112783696A (zh) 2021-01-21 2021-01-21 一种网卡冗余系统及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110083108.1A CN112783696A (zh) 2021-01-21 2021-01-21 一种网卡冗余系统及服务器

Publications (1)

Publication Number Publication Date
CN112783696A true CN112783696A (zh) 2021-05-11

Family

ID=75758258

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110083108.1A Pending CN112783696A (zh) 2021-01-21 2021-01-21 一种网卡冗余系统及服务器

Country Status (1)

Country Link
CN (1) CN112783696A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104133799A (zh) * 2014-08-06 2014-11-05 曙光信息产业(北京)有限公司 一种多网卡ncsi管理系统
CN107463456A (zh) * 2017-08-04 2017-12-12 郑州云海信息技术有限公司 一种提升双网卡ncsi管理系统切换效率的系统及方法
CN108259246A (zh) * 2018-01-15 2018-07-06 郑州云海信息技术有限公司 一种支持ncsi信号管理功能自动切换的电路及服务器

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104133799A (zh) * 2014-08-06 2014-11-05 曙光信息产业(北京)有限公司 一种多网卡ncsi管理系统
CN107463456A (zh) * 2017-08-04 2017-12-12 郑州云海信息技术有限公司 一种提升双网卡ncsi管理系统切换效率的系统及方法
CN108259246A (zh) * 2018-01-15 2018-07-06 郑州云海信息技术有限公司 一种支持ncsi信号管理功能自动切换的电路及服务器

Similar Documents

Publication Publication Date Title
CN100388219C (zh) 冗余控制器仲裁方法和系统
CN100477547C (zh) 通信设备主从切换方法及通信设备
CN111339010B (zh) 一种pcie设备热插拔识别方法、系统及相关组件
US20070234123A1 (en) Method for detecting switching failure
RU2614569C2 (ru) Стойка с функцией автоматического восстановления и способ автоматического восстановления для этой стойки
CN101271332A (zh) 紧凑型一体化冗余控制器及其控制方法
CN111767244A (zh) 基于国产龙芯平台的双冗余计算机设备
CN112463689A (zh) 一种ocp卡热插拔装置、方法及计算机可读存储介质
CN105739656A (zh) 具有自动重置功能的机柜及其自动重置方法
US10678739B1 (en) Electronic system, host device and control method
US20240220385A1 (en) Power source consumption management apparatus for four-way server
CN212541329U (zh) 基于国产龙芯平台的双冗余计算机设备
CN207869116U (zh) 一种主备设备的切换控制系统
CN116137603B (zh) 链路故障的检测方法和装置、存储介质及电子装置
CN113609051A (zh) 一种扩展板的热插拔方法、系统、装置及计算机存储介质
CN102841634A (zh) 服务器主板
CN110764829B (zh) 一种多路服务器cpu隔离方法及系统
CN112783696A (zh) 一种网卡冗余系统及服务器
CN218824636U (zh) 一种用于服务器硬盘背板的电源检测装置
CN109726055B (zh) 检测PCIe芯片异常的方法及计算机设备
CN114185721B (zh) 一种服务器的热存储备份系统及方法
CN115309340A (zh) 存储器控制方法、存储器控制器与电子设备
CN115408240A (zh) 一种冗余系统主备方法、装置、设备及储存介质
CN106649007A (zh) 一种基于龙芯3a系统的可信验证方法
CN103532728A (zh) 一种对故障dsp芯片复位的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210511