CN108334425A - 一种服务器qpi链路的冗余替换方法、装置及设备 - Google Patents

一种服务器qpi链路的冗余替换方法、装置及设备 Download PDF

Info

Publication number
CN108334425A
CN108334425A CN201810078114.6A CN201810078114A CN108334425A CN 108334425 A CN108334425 A CN 108334425A CN 201810078114 A CN201810078114 A CN 201810078114A CN 108334425 A CN108334425 A CN 108334425A
Authority
CN
China
Prior art keywords
link
qpi link
qpi
server
redundancy replacement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810078114.6A
Other languages
English (en)
Inventor
王棚辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201810078114.6A priority Critical patent/CN108334425A/zh
Publication of CN108334425A publication Critical patent/CN108334425A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2002Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2041Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with more than one idle spare processing component

Abstract

本发明公开了一种服务器QPI链路的冗余替换方法,包括根据接收到的中断信号,将系统由工作状态切换为静默状态;其中,所述中断信号中包括故障QPI链路的链路信息;在所述静默状态下,根据所述链路信息关闭所述故障QPI链路;配置路由,构建无故障QPI链路;将系统由所述静默状态切换为所述工作状态。该冗余替换方法可在服务器不停机的状态下,将出现故障的QPI链路进行冗余替换,并利用新建的QPI链路进行数据传输,大大提高了系统的稳定性。本发明还公开了一种服务器QPI链路的冗余替换装置、设备及计算机可读存储介质,均具有上述有益效果。

Description

一种服务器QPI链路的冗余替换方法、装置及设备
技术领域
本发明涉及服务器领域,特别涉及一种服务器QPI链路的冗余替换方法,还涉及一种服务器QPI链路的冗余替换装置、设备及计算机可读存储介质。
背景技术
在服务器领域,系统运行的稳定性和可靠性是非常重要的,随着日常生活中的业务越来越多,越来越复杂,对服务器的稳定性要求也越来越高,为提高服务器的稳定性,单靠提高单个CPU节点的稳定性已经无法满足人们对服务器稳定性的要求,因此需要提高服务器系统整体的稳定性。在服务器日常运转中,通常需要保持7*24小时,甚至24*365天的待机能力,以保证商业网站、电信系统、银行系统等的持续运转。然而,当服务器中的QPI链路出现故障时,服务器则需要停机,而服务器停机则会对业务带来极大的不便。
因此,如何提供一种解决上述问题的技术方案,是本领域技术人员亟待解决的问题。
发明内容
本发明的目的是提供一种服务器QPI链路的冗余替换方法,该冗余替换方法可在服务器不停机的状态下,将出现故障的QPI链路进行冗余替换,并利用新建的QPI链路进行数据传输,大大提高了系统的稳定性;本发明的另一目的是提供一种服务器QPI链路的冗余替换装置、设备及计算机可读存储介质,均具有上述有益效果。
为解决上述技术问题,本发明提供一种服务器QPI链路的冗余替换方法,该方法包括:
根据接收到的中断信号,将系统由工作状态切换为静默状态;其中,所述中断信号中包括故障QPI链路的链路信息;
在所述静默状态下,根据所述链路信息关闭所述故障QPI链路;
配置路由,构建无故障QPI链路;
将系统由所述静默状态切换为所述工作状态。
优选的,所述根据接收到的中断信号,将系统由工作状态切换为静默状态包括:
根据所述中断信号执行中断服务程序,将系统由所述工作状态切换为所述静默状态。
优选的,所述配置路由,构建无故障QPI链路包括:
构建所述无故障QPI链路的路由表;
在所述路由表中配置所述无故障QPI链路的参数信息,构建所述无故障QPI链路。
为解决上述技术问题,本发明还提供一种服务器QPI链路的冗余替换装置,包括:
接收模块,用于根据接收到的中断信号,将系统由工作状态切换为静默状态;其中,所述中断信号中包括故障QPI链路的链路信息;
关闭模块,用于在所述静默状态下,根据所述链路信息关闭所述故障QPI链路;
构建模块,用于配置路由,构建无故障QPI链路;
切换模块,用于将系统由所述静默状态切换为所述工作状态。
优选的,所述接收模块具体用于根据所述中断信号执行中断服务程序,将系统由所述工作状态切换为所述静默状态。
优选的,所述构建模块包括:
构建子模块,用于构建所述无故障QPI链路的路由表;
配置子模块,用于在所述路由表中配置所述无故障QPI链路的参数信息,构建所述无故障QPI链路。
为解决上述问题,本发明还提供一种服务器QPI链路的冗余替换设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现上述任意一项所述服务器QPI链路的冗余替换方法的步骤。
为解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述服务器QPI链路的冗余替换方法的步骤。
本发明所提供的一种服务器QPI链路的冗余替换方法,包括根据接收到的中断信号,将系统由工作状态切换为静默状态;其中,所述中断信号中包括故障QPI链路的链路信息;在所述静默状态下,根据所述链路信息关闭所述故障QPI链路;配置路由,构建无故障QPI链路;将系统由所述静默状态切换为所述工作状态。
可见,本发明提供的技术方案,可以自动监控QPI链路的情况,一旦QPI链路出现错误,通过对服务器由工作状态到静默状态的切换,在服务器不停机的状态下,能够快速方便的将出现故障的QPI链路进行冗余替换,然后退出静默状态,并利用新建的QPI链路进行数据传输,由此大大提高了系统的稳定性。
本发明提供的一种服务器QPI链路的冗余替换装置、设备及计算机可读存储介质,均具有上述有益效果,在此不再赘述。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明所提供的一种服务器QPI链路的冗余替换方法的流程示意图;
图2为本发明所提供的一种服务器的构成框图;
图3为本发明所提供的一种服务器QPI链路的冗余替换装置的示意图;
图4为本发明所提供的一种服务器QPI链路的冗余替换设备的示意图。
具体实施方式
本发明的核心是提供一种服务器QPI链路的冗余替换方法,该冗余替换方法可在服务器不停机的状态下,将出现故障的QPI链路进行冗余替换,并利用新建的QPI链路进行数据传输,大大提高了系统的稳定性;本发明的另一核心是提供一种服务器QPI链路的冗余替换装置、设备及计算机可读存储介质,均具有上述有益效果。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参考图1,图1为本发明所提供的一种服务器QPI链路的冗余替换方法的流程示意图,该方法可以包括:
S101:根据接收到的中断信号,将系统由工作状态切换为静默状态;其中,中断信号中包括故障QPI链路的链路信息;
具体的,请参考图2,图2为本发明所提供的一种服务器的构成框图。在服务器中,各个处理器CPU之间均通过相应的QPI链路进行连接。当其中的QPI链路发生故障时,相关数据无法进行传输,此时处理器则会接收到相应的中断信号;进一步,根据该中断信号可将系统由工作状态切换为静默状态。在静默状态下,服务器并未停机,除无法进行相关数据的传输外,其余工作不受影响,有效避免了由于服务器停机对其他业务带来的不便性。其中,上述中断信号中包括有发生故障QPI链路的链路信息,即故障QPI链路的链路信息,以告知处理器在服务器中发生故障的QPI链路。
优选的,上述根据接收到的中断信号,将系统由工作状态切换为静默状态可以包括根据中断信号执行中断服务程序,将系统由工作状态切换为静默状态。
具体的,处理器在接收到中断信号后,即可根据该中断信号执行对应的中断服务程序,通过该中断服务程序将系统由工作状态切换为静默状态,以停止相关数据的传输。其中,该中断服务程序可以存储于相应的存储器中,处理器直接执行该程序即可。
S102:在静默状态下,根据链路信息关闭故障QPI链路;
具体的,在整个系统进入到静默状态之后,即可根据链路信息获知发生故障的QPI链路,即故障QPI链路;进一步,通过BIOS系统(Basic Input Output System,基本输入输出系统)将该故障QPI链路关闭。
S103:配置路由,构建无故障QPI链路;
具体的,在将故障QPI链路关闭后,即可通过BIOS系统重新配置路由,以重新构建无故障QPI链路,以便于之前在故障QPI链路上传输的相关数据可以在新建的无故障QPI链路上进行传输。
优选的,上述配置路由,构建无故障QPI链路可以包括:构建无故障QPI链路的路由表;在路由表中配置无故障QPI链路的参数信息,构建无故障QPI链路。
具体的,在重新构建无故障QPI链路时,首先可以构建无故障QPI链路的路由表,其中,该路由表中可以存储指向特定网络地址的路径;进一步,在该路由表中对无故障QPI链路的相关参数信息进行重新配置,以完成无故障QPI链路的重新构建。
当然,上述无故障QPI链路的路由表的重新构建,仅为本发明所提供的一种优选实施方式,但并不唯一,可实现无故障QPI链路的重新构建,并可进行相关数据的传输即可。
S104:将系统由静默状态切换为工作状态。
具体的,无故障QPI链路重新构建完毕后,即可将整个系统退出静默状态,切换为工作状态,相关数据则可以通过重新构建的无故障QPI链路继续进行传输。
本发明所提供的服务器QPI链路的冗余替换方法,可在服务器不停机的状态下,将出现故障的QPI链路进行冗余替换,并利用新建的QPI链路进行数据传输,大大提高了系统的稳定性。
为解决上述问题,请参考图3,图3为本发明所提供的一种服务器QPI链路的冗余替换装置的示意图,该冗余替换装置可以包括:
接收模块1,用于根据接收到的中断信号,将系统由工作状态切换为静默状态;其中,中断信号中包括故障QPI链路的链路信息;
关闭模块2,用于在静默状态下,根据链路信息关闭故障QPI链路;
构建模块3,用于配置路由,构建无故障QPI链路;
切换模块4,用于将系统由静默状态切换为工作状态。
作为一种优选实施例,接收模块1具体用于根据中断信号执行中断服务程序,将系统由工作状态切换为静默状态。
作为一种优选实施例,构建模块3可以包括:
构建子模块,用于构建无故障QPI链路的路由表;
配置子模块,用于在路由表中配置无故障QPI链路的参数信息,构建无故障QPI链路。
对于本发明提供的冗余替换装置的介绍请参照上述方法实施例,本发明在此不做赘述。
为解决上述问题,请参考图4,图4为本发明所提供的一种服务器QPI链路的冗余替换设备的示意图,该冗余替换设备包括:
存储器10,用于存储计算机程序;
处理器20,用于执行计算机程序时实现如下步骤:
根据接收到的中断信号,将系统由工作状态切换为静默状态;其中,中断信号中包括故障QPI链路的链路信息;在静默状态下,根据链路信息关闭故障QPI链路;配置路由,构建无故障QPI链路;将系统由静默状态切换为工作状态。
对于本发明提供的冗余替换设备的介绍请参照上述方法实施例,本发明在此不做赘述。
为解决上述问题,本发明还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如下步骤:
根据接收到的中断信号,将系统由工作状态切换为静默状态;其中,中断信号中包括故障QPI链路的链路信息;在静默状态下,根据链路信息关闭故障QPI链路;配置路由,构建无故障QPI链路;将系统由静默状态切换为工作状态。
对于本发明提供的计算机可读存储介质的介绍请参照上述方法实施例,本发明在此不做赘述。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本发明所提供的服务器QPI链路的冗余替换方法、装置、设备及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围要素。

Claims (8)

1.一种服务器QPI链路的冗余替换方法,其特征在于,包括:
根据接收到的中断信号,将系统由工作状态切换为静默状态;其中,所述中断信号中包括故障QPI链路的链路信息;
在所述静默状态下,根据所述链路信息关闭所述故障QPI链路;
配置路由,构建无故障QPI链路;
将系统由所述静默状态切换为所述工作状态。
2.如权利要求1所述的冗余替换方法,其特征在于,所述根据接收到的中断信号,将系统由工作状态切换为静默状态包括:
根据所述中断信号执行中断服务程序,将系统由所述工作状态切换为所述静默状态。
3.如权利要求2所述的冗余替换方法,其特征在于,所述配置路由,构建无故障QPI链路包括:
构建所述无故障QPI链路的路由表;
在所述路由表中配置所述无故障QPI链路的参数信息,构建所述无故障QPI链路。
4.一种服务器QPI链路的冗余替换装置,其特征在于,包括:
接收模块,用于根据接收到的中断信号,将系统由工作状态切换为静默状态;其中,所述中断信号中包括故障QPI链路的链路信息;
关闭模块,用于在所述静默状态下,根据所述链路信息关闭所述故障QPI链路;
构建模块,用于配置路由,构建无故障QPI链路;
切换模块,用于将系统由所述静默状态切换为所述工作状态。
5.如权利要求4所述的冗余替换装置,其特征在于,所述接收模块具体用于根据所述中断信号执行中断服务程序,将系统由所述工作状态切换为所述静默状态。
6.如权利要求5所述的冗余替换装置,其特征在于,所述构建模块包括:
构建子模块,用于构建所述无故障QPI链路的路由表;
配置子模块,用于在所述路由表中配置所述无故障QPI链路的参数信息,构建所述无故障QPI链路。
7.一种服务器QPI链路的冗余替换设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至3任意一项所述的服务器QPI链路的冗余替换方法的步骤。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至3任意一项所述的服务器QPI链路的冗余替换方法的步骤。
CN201810078114.6A 2018-01-26 2018-01-26 一种服务器qpi链路的冗余替换方法、装置及设备 Pending CN108334425A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810078114.6A CN108334425A (zh) 2018-01-26 2018-01-26 一种服务器qpi链路的冗余替换方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810078114.6A CN108334425A (zh) 2018-01-26 2018-01-26 一种服务器qpi链路的冗余替换方法、装置及设备

Publications (1)

Publication Number Publication Date
CN108334425A true CN108334425A (zh) 2018-07-27

Family

ID=62925873

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810078114.6A Pending CN108334425A (zh) 2018-01-26 2018-01-26 一种服务器qpi链路的冗余替换方法、装置及设备

Country Status (1)

Country Link
CN (1) CN108334425A (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101667864A (zh) * 2009-09-28 2010-03-10 中兴通讯股份有限公司 一种下行物理链路故障诊断的方法、系统及装置
CN101753397A (zh) * 2010-01-29 2010-06-23 上海埃德电子股份有限公司 一种以太环网快速自愈的系统、方法及设备
CN101827025A (zh) * 2010-04-02 2010-09-08 华为技术有限公司 一种通信网络组播保护方法、系统及设备
CN102104489A (zh) * 2009-12-16 2011-06-22 中兴通讯股份有限公司 一种通信链路保护方法、装置和系统
CN102118266A (zh) * 2011-01-19 2011-07-06 武汉迈威光电技术有限公司 工业以太网双链路冗余技术
CN102984014A (zh) * 2012-12-18 2013-03-20 北京华为数字技术有限公司 数据发送方法及网络系统
CN103368753A (zh) * 2012-03-26 2013-10-23 上海地面通信息网络有限公司 一种多链路互为冗余备份的网络路由控制系统
CN103944697A (zh) * 2014-03-27 2014-07-23 广东佳和通信技术有限公司 一种双链路双服务器的语音调度系统及冗余备份方法
CN106603261A (zh) * 2015-10-15 2017-04-26 华为技术有限公司 热备份方法、第一主用设备、备用设备和通信系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101667864A (zh) * 2009-09-28 2010-03-10 中兴通讯股份有限公司 一种下行物理链路故障诊断的方法、系统及装置
CN102104489A (zh) * 2009-12-16 2011-06-22 中兴通讯股份有限公司 一种通信链路保护方法、装置和系统
CN101753397A (zh) * 2010-01-29 2010-06-23 上海埃德电子股份有限公司 一种以太环网快速自愈的系统、方法及设备
CN101827025A (zh) * 2010-04-02 2010-09-08 华为技术有限公司 一种通信网络组播保护方法、系统及设备
CN102118266A (zh) * 2011-01-19 2011-07-06 武汉迈威光电技术有限公司 工业以太网双链路冗余技术
CN103368753A (zh) * 2012-03-26 2013-10-23 上海地面通信息网络有限公司 一种多链路互为冗余备份的网络路由控制系统
CN102984014A (zh) * 2012-12-18 2013-03-20 北京华为数字技术有限公司 数据发送方法及网络系统
CN103944697A (zh) * 2014-03-27 2014-07-23 广东佳和通信技术有限公司 一种双链路双服务器的语音调度系统及冗余备份方法
CN106603261A (zh) * 2015-10-15 2017-04-26 华为技术有限公司 热备份方法、第一主用设备、备用设备和通信系统

Similar Documents

Publication Publication Date Title
CN109450666B (zh) 分布式系统网络管理方法及装置
US8804485B2 (en) Method and apparatus for coordinating fault recovery techniques among domains
CN102882704B (zh) 一种issu的软重启升级过程中的链路保护方法和设备
US10938667B2 (en) Incremental intent checking for stateful networks
CN109474466A (zh) 在dds中间件上实现双冗余网卡切换的方法
CN103560955A (zh) 冗余设备切换方法及装置
CN109391691A (zh) 一种单节点故障下nas服务的恢复方法及相关装置
CN109088818A (zh) 一种设备联动切换的方法及装置
CN102523113B (zh) 以太网oam中跨芯片聚合链路上配置mep的芯片实现方法及系统
CN104486128A (zh) 一种实现双控制器节点间冗余心跳的系统及方法
EP3618350A1 (en) Protection switching method, device and system
EP3348044B1 (en) Backup communications scheme in computer networks
CN113612778A (zh) 一种资源池化的防火墙集群系统及通信方法
JP2005124204A (ja) ネットワークの監視方法およびシステム
US20140298076A1 (en) Processing apparatus, recording medium storing processing program, and processing method
CN108334425A (zh) 一种服务器qpi链路的冗余替换方法、装置及设备
CN107707397A (zh) 一种虚拟机数据服务系统及方法
CN111131035A (zh) 数据传输方法及装置
JP4478719B2 (ja) リングシステムを復元する方法
CN105550065A (zh) 一种进行数据库服务器通信管理的方法和装置
CN111416726B (zh) 一种资源管理的方法、发送端设备和接收端设备
CN106559331B (zh) Mstp网络中的报文传输方法、装置及网络系统
JP2016151965A (ja) 冗長構成システム及び冗長構成制御方法
CN109218198B (zh) 数据交互方法、装置、mpls网络系统及储存介质
CN111984376B (zh) 协议处理方法、装置、设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180727

RJ01 Rejection of invention patent application after publication