CN104412228A - 动态迁移协议和群集服务器故障转移协议 - Google Patents
动态迁移协议和群集服务器故障转移协议 Download PDFInfo
- Publication number
- CN104412228A CN104412228A CN201380026288.3A CN201380026288A CN104412228A CN 104412228 A CN104412228 A CN 104412228A CN 201380026288 A CN201380026288 A CN 201380026288A CN 104412228 A CN104412228 A CN 104412228A
- Authority
- CN
- China
- Prior art keywords
- lpar
- configuration file
- computer system
- host computer
- port
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/2033—Failover techniques switching over of hardware resources
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/1658—Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit
- G06F11/1662—Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit the resynchronized component or unit being a persistent storage device
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2046—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share persistent storage
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/815—Virtual
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Hardware Redundancy (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Stored Programmes (AREA)
Abstract
本发明提供了一种用于LPAR迁移的方法和系统,所述方法和系统包括为包括一个或多个LPAR的主机系统上的逻辑分区创建配置文件,其中所述配置文件与第一名称相关联。另外,在所述配置文件内,将所述LPAR的客户端虚拟小型计算机系统接口(SCSI)适配器的端口映射至所述主机系统的虚拟输入/输出服务器(VIOS)的服务器虚拟SCSI适配器的端口。将所述VIOS的所述服务器端口设置为接受所述主机系统的所述一个或多个LPAR的虚拟客户端SCSI适配器的任何端口。在所述VIOS内,将所述VIOS的所述服务器端口映射至设备名(即,LPAR)以及映射至目标设备(即,共享存储磁盘),以用于实现所述LPAR的适当故障转移,其中所述目标设备包括用于所述LPAR的操作系统。
Description
背景技术
在IBM AIX环境中可将计算资源的逻辑分区(LPAR)虚拟化为独立的虚拟机。计算资源可划分为一个或多个LPAR,其中一个或多个虚拟机在单个物理计算资源下运行。另外,其他计算资源也可支持一个或多个LPAR,使得另一个计算资源可支持一个或多个虚拟机。因此,计算资源网络可包括多个LPAR。
另外,可将第一物理计算资源的特定LPAR迁移至第二计算资源以保持由所迁移LPAR提供的应用程序和服务的可操作性。具体地讲,第一和第二计算资源彼此协作以将来自第一计算资源的LPAR迁移至第二计算资源。例如,在其中实施迁移的典型场景中,可计划第一计算资源以进行维护。因此,为了保持在LPAR上运行的应用程序的连续性,可将该LPAR迁移至第二计算资源。
然而,当使用迁移协议将LPAR从第一计算资源迁移至第二计算资源时,将从第一或源计算资源中删除LPAR的配置文件和底层磁盘映射。这种信息删除可对涉及LPAR的其他功能和服务产生不利影响。例如,故障转移协议可依赖于所删除的信息并且可变得无效。因此,迁移和故障转移协议(和/或其他协议)之间缺乏兼容性将阻止云环境中的应用程序可用性和移动性。
发明内容
用于LPAR迁移的系统和方法,所述系统和方法与群集管理故障转移协议兼容,诸如Veritas群集服务器(VCS)。该方法包括为包括一个或多个LPAR的主机系统上的逻辑分区创建配置文件,其中配置文件与第一名称相关联。该方法还包括,在配置文件内,将LPAR的虚拟小型计算机系统接口(SCSI)适配器的客户端端口映射至主机系统的虚拟输入/输出服务器(VIOS)的虚拟SCSI适配器的服务器端口。该方法包括将VIOS的服务器端口设置为接受主机系统的所述一个或多个LPAR的虚拟SCSI适配器的任何端口。该方法还包括,在VIOS内,将VIOS的服务器端口映射至设备名(即,LPAR)以及映射至目标设备(即,共享存储磁盘),以用于实施LPAR的适当故障转移,其中目标设备包括用于LPAR的操作系统。
在一些实施例中,系统包括有形的非暂态计算机可读存储介质,在该存储介质上存储有计算机可执行指令,所述指令当被执行时使计算机系统执行用于LPAR迁移的方法,该方法与群集管理故障转移协议兼容。该方法包括为包括一个或多个LPAR的主机系统上的逻辑分区创建配置文件,其中配置文件与第一名称相关联。该方法还包括,在配置文件内,将LPAR的虚拟SCSI适配器的客户端端口映射至主机系统的VIOS的虚拟SCSI适配器的服务器端口。该方法还包括将VIOS的服务器端口设置为接受主机系统的所述一个或多个LPAR的虚拟SCSI适配器的任何端口。另外,该方法包括,在VIOS内,将VIOS的服务器端口映射至设备名(即,LPAR)以及映射至目标设备(即,共享存储磁盘),以用于实施LPAR的适当故障转移,其中目标设备包括用于LPAR的操作系统。
在一个实施例中,计算机系统包括处理器,该处理器连接到其中存储有指令的内存,所述指令如果由计算机系统执行则使计算机执行用于LPAR迁移的方法,该方法与群集管理故障转移协议兼容。该方法包括为包括一个或多个LPAR的主机系统上的逻辑分区创建配置文件,其中配置文件与第一名称相关联。该方法还包括,在配置文件内,将LPAR的虚拟SCSI适配器的客户端端口映射至主机系统的VIOS的虚拟SCSI适配器的服务器端口。该方法还包括将VIOS的服务器端口设置为接受主机系统的所述一个或多个LPAR的虚拟SCSI适配器的任何端口。另外,该方法包括,在VIOS内,将VIOS的服务器端口映射至设备名(即,LPAR)以及映射至目标设备(即,共享存储磁盘),以用于实施LPAR的适当故障转移,其中磁盘包括用于LPAR的操作系统。
因此,根据本发明的实施例,由群集服务器协议(诸如Veritas群集服务器(VCS))提供的LPAR故障转移功能与迁移协议(诸如由国际商用机器公司(IBM)动态分区移动性(LPM)服务提供的那些协议)共存,以使得即使当在计算资源上遇到不可预见的故障时应用程序和LPAR也高度可用。
在阅读以下在各个附图中示出的实施例的详细描述后,本领域的普通技术人员将认识到本发明各种实施例的这些以及其他目的和优点。
附图说明
附图结合到本说明书中并且形成本说明书的一部分,并且其中类似数字表示类似元素,所述附图示出了本发明的实施例,并且与描述一起用于解释本发明的原理。
图1示出了根据本发明一个实施例的适用于实施本发明方法的示例性计算机系统的框图。
图2是根据本发明一个实施例的示出了网络体系结构的框图。
图3是根据本发明一个实施例的群集服务器环境的框图,该群集服务器环境包括具有一个或多个LPAR的一种或多种主机计算资源,其中LPAR能够从主机迁移至主机,并同时在故障转移情况下保持LPAR可用性。
图4是根据本发明一个实施例的数据流程图,其示出了LPAR从第一主机迁移至第二主机,以及LPAR故障转移回到第一主机。
图5是根据本发明一个实施例的流程图,其示出了一种在故障转移情况下保持LPAR可用性的同时进行LPAR迁移的方法。
图6A-B是根据本发明一个实施例的流程图,其示出了一种LPAR迁移和故障转移的方法,其中LPAR能够从主机迁移至主机,并同时在故障转移情况下保持LPAR可用性。
具体实施方式
现在将详细参考本发明的各种实施例,其例子在附图中示出。虽然结合这些实施例进行描述,但应当理解,它们并不旨在将本发明限于这些实施例。相反,本发明旨在涵盖可包括在如所附权利要求所定义的本发明精神和范围内的替代形式、修改形式和等同形式。此外,在本发明的以下详细描述中,阐述了许多具体细节,以便提供对本发明的透彻理解。然而,应当理解,可以在没有这些具体细节的情况下实践本发明。在其他情况下,没有详细描述公知的方法、程序、组件和电路,以免不必要地混淆本发明的方面。
随后的详细描述中的一些部分是以程序、逻辑块、处理和计算机内存内数据位的操作的其他符号表示来呈现的。这些描述和表示是由数据处理领域的那些技术人员用于将其工作的本质最有效地传达给本领域的其他技术人员的手段。在本申请中,程序、逻辑块、处理等被认为是导致期望结果的步骤或指令的自相一致序列。步骤是指利用物理量的物理操控的那些步骤。通常,尽管并非必需,但这些量采用能够在计算机系统中存储、传输、组合、比较以及以其他方式操控的电信号或磁信号的形式。已经证明,主要出于常见用法的原因,有时方便将这些信号称为事务、位、值、元素、符号、字符、样本、像素等。
然而,应该牢记,这些和类似术语中的全部都将与适当的物理量相关,并且仅仅是应用于这些量的方便标记。如从以下讨论中显而易见的是,除非另外明确指出,否则应当认识到,在整个本发明中,利用术语(诸如“创建”、“确定”、“映射”、“设置”等)的讨论是指计算机系统或类似电子计算设备或处理器(例如,图1的系统110)的操作和过程(例如,图5的流程图5)。计算机系统或类似电子计算设备操控并转换在计算机系统内存、寄存器或其他此类信息存储装置、传输或显示设备内表示为物理(电子)量的数据。
本文所述的实施例可在由一个或多个计算机或其他设备执行的驻留在某种形式的计算机可读存储介质诸如程序模块上的计算机可执行指令的一般背景中进行讨论。以举例而不是限制的方式,计算机可读存储介质可包括非暂态计算机存储介质和通信介质。一般来讲,程序模块包括执行特定任务或实施特定抽象数据类型的例程、程序、对象、组件、数据结构等。在各种实施例中,可根据需要组合或分配程序模块的功能。
计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术来实施的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括但不限于随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程ROM(EEPROM)、闪存存储器或其他存储器技术、光盘ROM(CD-ROM)、数字通用光盘(DVD)或其他光学存储装置、磁盒、磁带、磁盘存储装置或其他磁存储设备,或可用于存储所需信息并且可经访问以检索该信息的任何其他介质。
通信介质可体现为计算机可执行指令、数据结构和程序模块,并且包括任何信息传递介质。以举例而不是限制的方式,通信介质包括有线介质(诸如有线网络或直接有线连接)和无线介质(诸如声学、无线电频率(RF)、红外线和其他无线介质)。以上任何一者的组合也可包括在计算机可读介质的范围内。
图1是能够实施本发明实施例的计算系统110的例子的框图。计算系统110在广义上表示能够执行计算机可读指令的任何单处理器或多处理器计算设备或系统。计算系统110的例子包括但不限于工作站、笔记本电脑、客户端方终端、服务器、分布式计算系统、手持式设备或任何其他计算系统或设备。在其最基本的配置中,计算系统110可包括至少一个处理器114和系统内存116。
处理器114通常表示能够处理数据或解译和执行指令的任何类型或形式的处理单元。在某些实施例中,处理器114可接收来自软件应用程序或模块的指令。这些指令可使处理器114执行本文描述和/或示出的一个或多个示例性实施例的功能。例如,处理器114可执行和/或作为一种方法单独或与其他元件共同执行本文所述的识别、确定、使用、实施、转译、跟踪、接收、移动以及提供中的一者或多者。处理器114还可执行和/或作为一种方法来执行本文描述和/或示出的任何其他步骤、方法或过程。
系统内存116通常表示能够存储数据和/或其他计算机可读指令的任何类型或形式的易失性或非易失性存储设备或介质。系统内存116的例子包括但不限于RAM、ROM、闪存存储器或任何其他适用的内存设备。尽管不是必需的,但在某些实施例中,计算系统110可包括易失性存储器单元(诸如系统内存116)和非易失性存储设备(诸如,主要存储设备132)。
除处理器114和系统内存116之外,计算系统110还可包括一个或多个组件或元件。例如,在图1的实施例中,计算系统110包括内存控制器118、输入/输出(I/O)控制器120和通信接口122,它们中的每一者均可通过通信基础结构112互连。通信基础结构112通常表示能够促进计算设备的一个或多个组件之间的通信的任何类型或形式的基础结构。通信基础结构112的例子包括但不限于通信总线(诸如工业标准体系结构(ISA))、外围组件互连(PCI)、PCI Express(PCle)或类似的总线)和网络。
内存控制器118通常表示能够处理内存或数据或控制计算系统110的一个或多个组件之间的通信的任何类型或形式的设备。例如,内存控制器118可通过通信基础结构112来控制处理器114、系统内存116和I/O控制器120之间的通信。内存控制器可执行和/或作为一种方法单独或与其他元件共同执行本文所述的操作或功能中的一者或多者。
I/O控制器120通常表示能够协调和/或控制计算设备的输入和输出功能的任何类型或形式的模块。例如,I/O控制器120可控制或促进计算系统110的一个或多个元件之间的数据传输,所述元件诸如处理器114、系统内存116、通信接口122、显示适配器126、输入接口130和存储接口134。I/O控制器120可例如用于执行和/或作为一种方法单独或与其他元件共同执行本文所述的操作中的一者或多者。I/O控制器120还可用于执行和/或作为一种方法来执行本发明中阐述的其他操作和功能。
通信接口122在广义上表示能够促进示例性计算系统110与一个或多个附加设备之间的通信的任何类型或形式的通信设备或适配器。例如,通信接口122可促进计算系统110与包括附加计算系统的专用或公共网络之间的通信。通信接口122的例子包括但不限于有线网络接口(诸如网络接口卡)、无线网络接口(诸如无线网络接口卡)、调制解调器和任何其他合适的接口。在一个实施例中,通信接口122可通过与网络(诸如互联网)的直接链路来提供与远程服务器的直接连接。通信接口122还可通过例如局域网(诸如以太网网络)、个人区域网、电话或电缆网络、蜂窝电话连接、卫星数据连接或任何其他合适的连接来间接提供此类连接。
通信接口122还可表示主机适配器,该主机适配器可被配置为通过外部总线或通信信道来促进计算系统110与一个或多个附加网络或存储设备之间的通信。主机适配器的例子包括但不限于小型计算机系统接口(SCSI)主机适配器、通用串行总线(USB)主机适配器、IEEE(电气与电子工程师协会)1394主机适配器、串行高级技术附件(SATA)和外部SATA(eSATA)主机适配器、高级技术附件(ATA)和并行ATA(PATA)主机适配器、光纤信道接口适配器、以太网适配器等。通信接口122还可允许计算系统110参与分布式或远程计算。例如,通信接口122可接收来自远程设备的指令或将指令发送到远程设备以供执行。通信接口122可执行和/或作为一种方法单独或与其他元件共同执行本文所公开的操作中的一者或多者。通信接口122还可用于执行和/或作为一种方法来执行本发明中阐述的其他操作和功能。
如图1所示,计算系统110还可包括至少一个显示设备124,该显示设备124通过显示适配器126连接到通信基础结构112。显示设备124通常表示能够以可视方式显示显示适配器126转发的信息的任何类型或形式的设备。类似地,显示适配器126通常表示被配置为转发来自通信基础结构112(或来自帧缓冲器,如本领域所已知)的图形、文本和其他数据以在显示设备124上显示的任何类型或形式的设备。
如图1所示,计算系统110还可包括通过输入接口130连接到通信基础结构112的至少一个输入设备128。输入设备128通常表示能够向计算系统110提供输入(由计算机或人生成)的任何类型或形式的输入设备。输入设备128的例子包括但不限于键盘、指向设备、语音识别设备或任何其他输入设备。在一个实施例中,输入设备128可执行和/或作为一种方法单独或与其他元件共同执行本文所公开的操作中的一者或多者。输入设备128还可用于执行和/或作为一种方法来执行本发明中阐述的其他操作和功能。
如图1所示,计算系统110还可包括主要存储设备132和经由存储接口134连接到通信基础结构112的备份存储设备133。存储设备132和133通常表示能够存储数据和/或其他计算机可读指令的任何类型或形式的存储设备或介质。例如,存储设备132和133可为磁盘驱动器(例如,所谓的硬盘驱动器)、软盘驱动器、磁带驱动器、光盘驱动器、闪存驱动器等等。存储接口134通常表示用于在计算系统110的存储设备132和133与其他组件之间传输数据的任何类型或形式的接口或设备。
在一个例子中,数据库140可存储在主要存储设备132中。数据库140可表示单个数据库或计算设备或者多个数据库或计算设备的部分。例如,数据库140可表示(存储于)计算系统110的一部分和/或图2(下面)中的示例性网络体系结构200的部分。作为另外一种选择,数据库140可表示(存储于)能够通过计算设备访问的一个或多个物理独立设备,诸如计算系统110和/或网络体系结构200的部分。
继续参考图1,存储设备132和133可被配置为读取可移除存储单元和/或写入到可移除存储单元,该可移除存储单元被配置为存储计算机软件、数据或其他计算机可读信息。合适的可移除存储单元的实例包括但不限于软盘、磁带、光盘、闪存设备等。存储设备132和133还可包括用于允许将计算机软件、数据或其他计算机可读指令加载到计算系统110内的其他类似结构或设备。例如,存储设备132和133可被配置为读取和写入软件、数据或其他计算机可读信息。存储设备132和133还可为计算系统110的一部分,或者可为通过其他接口系统进行访问的独立设备。
存储设备132和133可用于执行和/或作为一种方法单独或与其他元件共同执行本文所公开的操作中的一者或多者。存储设备132和133还可用于执行和/或作为一种方法来执行本发明中阐述的其他操作和功能。
可将多个其他设备或子系统连接到计算系统110。相反地,无需提供图1中示出的所有组件和设备,亦可实践本文所述的实施例。上文提及的设备和子系统也可通过不同于图1所示的方式互连。计算系统110也可采用任何数量的软件、固件和/或硬件配置。例如,本文所公开的示例性实施例可被编码为计算机可读介质上的计算机程序(也称为计算机软件、软件应用程序、计算机可读指令或计算机控制逻辑)。
可将包含计算机程序的计算机可读介质加载到计算系统110中。然后可将计算机可读介质上存储的全部或部分计算机程序存储在系统内存116中和/或存储设备132和133的各个部分中。当由处理器114执行时,加载到计算系统110中的计算机程序可使处理器114执行和/或作为一种方法来执行本文描述和/或示出的示例性实施例的功能。除此之外或作为另外一种选择,可在固件和/或硬件中实施本文描述和/或示出的示例性实施例。例如,计算系统110可被配置为用于实施本文所公开的一个或多个实施例的专用集成电路(ASIC)。
图2是网络体系结构200的例子的框图,其中客户端系统210、220和230以及服务器240和245可连接到网络250。客户端系统210、220和230通常表示任何类型或形式的计算设备或系统,诸如图1中的计算系统110。在一个实施例中,客户端在服务器系统上运行,并且其中服务器可包括执行负载平衡的流量方向功能。
类似地,服务器240和245通常表示被配置为提供各种数据库服务和/或运行特定软件应用程序的计算设备或系统,诸如应用程序服务器或数据库服务器。网络250通常表示任何电信或计算机网络,包括例如内联网、广域网(WAN)、局域网(LAN)、个人区域网(PAN)或互联网。
如图2所示,一个或多个存储设备260(1)-(L)可直接连接到服务器240。类似地,一个或多个存储设备270(1)-(N)可直接连接到服务器245。存储设备260(1)-(L)和存储设备270(1)-(N)通常表示能够存储数据和/或其他计算机可读指令的任何类型或形式的存储设备或介质。存储设备260(1)-(L)和存储设备270(1)-(N)可表示被配置为使用各种协议,诸如网络文件系统(NFS)、服务器消息块(SMB)或通用互联网文件系统(CIFS),来与服务器240和245进行通信的网络连接存储(NAS)设备。
服务器240和245也可连接到存储区域网络(SAN)光纤网280。SAN光纤网280通常表示能够促进存储设备之间的通信的任何类型或形式的计算机网络或体系结构。SAN光纤网280可促进服务器240和245与存储设备290(1)-(M)和/或智能存储阵列295之间的通信。SAN光纤网280还可通过网络250以及服务器240和245以这样的方式促进客户端系统210、220和230与存储设备290(1)-(M)和/或智能存储阵列295之间的通信:设备290(1)-(M)和阵列295呈现为客户端系统210、220和230的本地连接设备。与存储设备260(1)-(L)和存储设备270(1)-(N)相同,存储设备290(1)-(M)和智能存储阵列295通常表示能够存储数据和/或其他计算机可读指令的任何类型或形式的存储设备或介质。
参考图1的计算系统110,通信接口,诸如通信接口122,可用于在每个客户端系统210、220和230与网络250之间提供连接。客户端系统210、220和230可能够使用例如网页浏览器或其他客户端软件来访问服务器240或245上的信息。此类软件可允许客户端系统210、220和230访问由服务器240、服务器245、存储设备260(1)-(L)、存储设备270(1)-(N)、存储设备290(1)-(M)或智能存储阵列295托管的数据。尽管图2示出了使用网络(诸如互联网)来交换数据,但本文所述的实施例并非仅限于互联网或任何特定的基于网络的环境。
返回图2,在一个实施例中,本文所公开的示例性实施例中的一者或多者的全部或一部分可被编码为计算机程序并加载到服务器240、服务器245、存储设备260(1)-(L)、存储设备270(1)-(N)、存储设备290(1)-(M)、智能存储阵列295或它们的任意组合上并加以执行。本文所公开的示例性实施例中的一者或多者的全部或一部分也可被编码为计算机程序,存储在服务器240中,由服务器245运行,以及通过网络250分配到客户端系统210、220和230。因此,网络体系结构200可执行和/或作为一种方法单独或与其他元件共同执行本文所公开的操作中的一者或多者。网络体系结构200也可用于执行和/或作为一种方法来执行本发明中阐述的其他操作和功能。
因此,本发明的实施例示出了用于将LPAR从第一主机系统迁移至第二主机系统的迁移序列的实施,该序列与故障转移协议兼容,其中第二主机系统上的所迁移LPAR中的故障可用于操作回到第一主机系统上。本发明的其他实施例提供上述优点,并且还提供在多个主机系统上高度可用的虚拟LPAR上运行的应用程序,尤其是当LPAR从第一主机系统迁移至第二主机系统时。本发明的又其他实施例提供上述优点,并且还提供使虚拟LPAR迁移之后的主机系统停机时间减到最少,以便将其配置重新初始化以提供应用程序的群集范围可用性。
图3是根据本发明一个实施例的群集服务器环境300的框图,该群集服务器环境包括具有一个或多个LPAR的一个或多个主机系统或计算资源(下文中称为“主机”或“主机系统”),其中LPAR能够从主机迁移至主机,并同时在故障转移情况下保持LPAR可用性。在一个实施例中,群集服务器环境可在图2中示出的网络体系结构200内实施。
如图3所示,群集服务器环境300包括第一主机A和第二主机B,这两者均为物理计算资源。主机A和B中的每一者的硬件资源均逻辑划分为一个或多个逻辑分区(LPAR),其中每个LPAR为计算资源的虚拟实例。例如,主机A划分为LPAR-1311、LPAR-2312并且最大至LPAR-N 313。另外,主机B划分为LPAR-1321、LPAR-2322并且最大至LPAR-N 323。
通过由虚拟输入/输出服务器(VIOS)所提供的虚拟层将给定主机中的LPAR进行虚拟化。具体地讲,VIOS提供存储装置和网络的虚拟化,并且还在不使用物理硬件的情况下促进虚拟LPAR之间的通信。例如,在一个实施例中,VIOS包括虚拟SCSI适配器以促进该主机系统内的LPAR之间的输入/输出(I/O)通信,以及促进通过物理SCSI适配器与外部设备的通信,诸如与共享存储装置350中的磁盘或与外部单元330和340的通信。其他实施例非常适合于根据LPAR所使用的操作环境来实施其他虚拟化通信设备,诸如虚拟以太网适配器、虚拟光纤信道适配器、虚拟串行适配器等。如图3所示,主机A中的LPAR 311、312和313通过VIOS 319进行虚拟化。另外,主机B中的LPAR 321、322和323通过VIOS 329进行虚拟化。
另外,群集服务器环境300包括硬件管理控制台(HMC),其用于配置和控制主机设备(例如,主机A和主机B)中的一者或多者。具体地讲,HMC 360用作接口以创建和管理给定主机系统内的LPAR。在一些实施例中,HMC 360通过两个主机系统的协作促进LPAR从一个主机系统迁移至另一个主机系统。
HMC 360负责创建定义给定LPAR的配置的分区配置文件。例如,配置文件定义分配给逻辑分区的系统资源(例如,处理器资源、内存资源、I/O资源等)并且包括信息,诸如分配给逻辑分区的物理系统资源的最小和最大量。HMC 360在整个群集服务器网络300中管理LPAR及其配置文件的实施。然而,HMC 360被配置为提供并且促进LPAR从一个主机迁移至另一个主机,以及允许LPAR从一个主机故障转移至另一个主机。
此外,每个主机系统包括实施主机系统之间群集感知的专用LPAR中的群集服务器模块。这些群集服务器模块称为高可用性(HA)模块,并且彼此通信,使得HA模块可协作以提供整个群集服务器环境300中的LPAR及其对应应用程序的故障转移协议和高可用性。例如,Veritas群集服务器(VCS)管理将在物理和/或虚拟机的群集上高度可用的计算资源(例如,LPAR)的群集。例如,主机A包括HA 315,并且主机B包括HA325,其中主机A的HA 315被配置为与主机B的HA 325进行通信以实施故障转移和高可用性协议。即,通过实施HA 315和325,一个主机系统中的LPAR通过实施故障转移和/或高可用性协议在故障情况下可用于另一个主机系统。
另外,群集服务器环境300包括共享存储装置350。在一个实施中,共享存储装置包括存储装置的一个或多个物理磁盘,诸如磁盘1,2…N。共享存储装置350中的磁盘包括用于整个群集服务器环境300中的每个LPAR的内存资源。另外,共享存储装置350中的磁盘包括用于整个群集服务器环境300中的每个虚拟化LPAR的操作系统。这样,可通过使用故障转移协议使故障主机系统上存在的活动实例LPAR的操作系统恢复,使得可在第二主机系统处启用LPAR。为了使磁盘可用于特定LPAR,将该磁盘分配或映射至对应VIOS的特定服务器虚拟SCSI适配器。例如,可通过VIOS319内的适当映射将共享存储装置350中的磁盘1分配、映射或关联于主机A的LPAR-1311。
图4是根据本发明一个实施例的数据流程图400,其示出了LPAR(例如,LPAR-1)从第一主机(例如,主机A)迁移至第二主机(例如,主机B),以及在群集服务器环境中将LPAR(例如,LPAR-1)故障转移回到第一主机。在一个实施例中,LPAR-1的迁移和故障转移可在图3的群集服务器环境300内实施。
如图4所示,主机A包括LPAR-l的活动实例。另外,主机A包括VIOS 425以促进主机A的LPAR之间的通信以及促进与外部设备的通信,诸如与主机A中提供的资源的通信。LPAR-1与通过HMC模块460创建的配置文件相关联。
通过HMC模块460的帮助,使用迁移协议将主机A上存在的LPAR-1迁移至主机B。另外将LPAR-1配置文件的活动实例迁移至主机B。具体地讲,HMC模块460通过两个主机A和B的协作来协调LPAR-1的迁移。这样,HMC模块460允许LPAR-1的单个实例在两个主机计算资源之间进行迁移的过程中是活动的。
本发明的实施例提供迁移协议与故障转移(和/或高可用性)协议之间的兼容性。即,在LPAR-1成功迁移至主机B之后,在LPAR-1出现故障或失效或者主机B自身出现故障或失效的情况下,本发明的实施例能够实施故障转移序列和/或协议,以重新在主机A上激活LPAR-1而不需要主机A和主机B两者的协作,尤其是由于主机B可能是不活动的。通过主机系统的每一者中的对应HA模块(未示出)来促进实施故障转移和/或高可用性协议。
图5是根据本发明一个实施例的流程图500,其示出了一种在故障转移情况下保持LPAR可用性的同时进行LPAR迁移的计算机实现的方法。在另一个实施例中,流程图500在计算机系统内实施,该计算机系统包括处理器和内存,该内存连接到处理器并且在其中存储有指令,所述指令当由计算机系统执行时使系统执行用于LPAR迁移的方法。在又一个实施例中,用于执行该方法的指令存储在具有计算机可执行指令的非暂态计算机可读存储介质上,以用于使计算机系统执行用于LPAR迁移的方法,如流程图500所概述。在本发明的实施例中,流程图500的操作在图3的群集服务器环境300内以及在图4的数据流程图400内实施。更具体地讲,在本发明的实施例中,LPAR迁移的方法可在对应主机设备的VIOS和HA模块内实施,其中该方法允许实施故障转移协议并且与故障转移协议的实施兼容。
在510处,该方法包括为在第一主机系统上活动的LPAR创建第一配置文件。主机系统包括一个或多个LPAR,并且包括用于促进LPAR的虚拟化的其他组件,诸如VIOS。在一些实施例中,迁移协议与故障转移协议的兼容性通过借助单个主机设备的配置从单个主机设备开始而实施。
更具体地讲,在520处,在第一配置文件内,该方法包括将LPAR的虚拟SCSI适配器的客户端端口映射至VIOS的虚拟SCSI适配器的服务器端口,从而通过第一主机系统来协调LPAR的虚拟化。这样,LPAR将理解其需要与VIOS的虚拟SCSI适配器上的特定服务器端口通信。
在530处,将VIOS的服务器端口设置为接受第一主机系统的所述一个或多个LPAR的客户端虚拟SCSI适配器的任何端口。即,按类属地将SCSI端口分配给LPAR中的任一者,并且不以一对一为基础分配。在一个实施例中,将端口分配给“任何插槽/任何分区”。这样,因为按类属地分配了SCSI端口,因此通过由HMC实施的任何迁移协议均不会删除与VIOS的虚拟SCSI适配器的服务器端口相关联的映射。另一方面,将VIOS的服务器SCSI端口分配给VIOS中的LPAR的客户端SCSI端口时,当该LPAR迁移时,将自动删除该映射信息,从而在实施故障转移协议之后,在没有相当长停机时间的情况下防止任何故障转移协议使该LPAR回到当前的第一主机系统。
在540处,在第一主机系统的VIOS内,该方法包括将VIOS SCSI适配器的服务器端口映射至设备名(例如,LPAR)。另外,将VIOS SCSI适配器的服务器端口映射至目标设备,诸如包括用于LPAR的操作系统的磁盘,其中磁盘包括在共享存储装置内。由于在类属上将VIOS中的SCSI适配器的服务器端口设置为接受任何LPAR(例如,任何插槽/任何分区),因此将LPAR映射至另一个主机系统(例如,第二主机系统)时,还会保留而不是擦除底层映射。
另外,还创建用于在第一主机系统上活动的LPAR的第一配置文件的备份配置文件。备份配置文件还将LPAR的虚拟SCSI适配器的对应客户端端口映射至VIOS的虚拟SCSI适配器的对应服务器端口,从而通过第一主机系统来协调LPAR的虚拟化。另外,将位于第一主机系统上的备份配置文件映射至包括用于LPAR的操作系统的共享存储装置中的相同磁盘。备份配置文件独立于第一配置文件而引用(例如,不同配置文件名)并且也位于第一主机系统上。因此,备份配置文件用作第一主机系统内部的备份。
另外,为了进行故障转移,也在第二主机系统上创建在第一主机系统上活动的LPAR的第一配置文件。位于第二主机系统上的LPAR的该第二配置文件被类似地引用为第一主机系统上的第一配置文件(例如,相同配置文件名)。例如,第二配置文件提供类似的端口到端口SCSI适配器映射,并且还映射至包含用于底层LPAR的操作系统的共享存储装置中的相同磁盘。因此,如果LPAR在第一主机系统上出现故障,则LPAR可在第一和第二主机系统不进行协作的情况下使用第二配置文件故障转移到第二主机系统。
另外,还创建用于第二主机系统上的LPAR的第二配置文件的备份配置文件。备份配置文件还将LPAR的虚拟SCSI适配器的对应客户端端口映射至VIOS的虚拟SCSI适配器的对应服务器端口,从而通过第二主机系统来协调LPAR的虚拟化。另外将第二主机系统上的备份配置文件也映射至包含用于底层LPAR的操作系统的共享存储装置中的相同磁盘。第二主机系统上的备份配置文件独立于第二配置文件而引用(例如,不同配置文件名)并且位于第二主机系统上。因此,该备份配置文件用作位于第二主机系统上的第二配置文件的内部备份。
图6A-B示出了根据本发明一个实施例的流程图600,其示出了LPAR迁移和故障转移的计算机实现的方法,其中LPAR能够从主机迁移到主机,并同时在故障转移情况下保持LPAR可用性。流程图600示出了将LPAR从第一主机迁移至第二主机时所执行的操作,以便确保与故障转移协议兼容。在另一个实施例中,流程图600在计算机系统内实施,该计算机系统包括处理器和内存,该内存连接到处理器并且在其中存储有指令,所述指令当由计算机系统执行时使系统执行用于LPAR迁移和故障转移的方法。在又一个实施例中,用于执行该方法的指令存储在具有计算机可执行指令的非暂态计算机可读存储介质上,以用于使计算机系统执行用于LPAR迁移和故障转移的方法,如流程图600所概述。在本发明的实施例中,流程图600的操作在图3的群集服务器环境300内以及在图4的数据流程图400内实施。更具体地讲,在本发明的实施例中,LPAR迁移的方法可在对应主机设备的VIOS和HA模块内实施,其中该方法允许实施故障转移协议并且与故障转移协议的实施兼容。
在整个流程图600中引用了配置文件名。提供给配置文件名的任何特定标注仅仅为了说明,并非旨在将配置文件的名称限于该标注。相反,引用旨在示出驻留在不同主机设备上的配置文件的名称之间的区别。
在610处,针对在第一主机系统(“主机A”)上活动的LPAR-1创建配置文件。该配置文件称为“PRO LPAR-1(主机A)”,其中出于惯例,在整个本申请中,将名称定义为“PRO LPAR-1”并且“(主机A)”指示配置文件“PRO LPAR-1”存储在主机A中。另外,从LPAR-1的角度来看,配置文件由客户端虚拟SCSI适配器组成,该适配器映射至对应VIOS的虚拟SCSI适配器的特定服务器端口(例如,端口X),该VIOS提供主机A内的LPAR的虚拟化。例如,在HMC模块的帮助下创建配置文件“PRO LPAR-1(主机A)”。
在620处,将与LPAR-1相关联的SCSI适配器的对应服务器端口X设置为接受主机A上VIOS中的LPAR的SCSI适配器的任何通用端口。例如,当在群集环境内管理LPAR(诸如,由VCS管理)时,将服务器虚拟SCSI适配器的端口X在VIOS中设置为“任何插槽/任何分区”。另外,将用于主机A的VIOS的虚拟SCSI适配器的服务器端口X映射至LPAR-1中的正确客户端SCSI适配器。另外,还将用于主机A中VIOS的虚拟SCSI适配器中的服务器端口映射至共享存储装置中的适当磁盘,其中磁盘包含用于LPAR-l的操作系统。这样,通过按类属地将服务器端口X设置为接受任何LPAR的任何插槽,当主机A中的LPAR迁移至主机B时,就不会删除用于主机A的VIOS中的虚拟SCSI适配器的服务器端口X的底层映射。
出于群集感知和高可用性的目的,在615处,也在第二主机系统(主机B)上创建用于LPAR-1的配置文件。具体地讲,在第二主机系统(例如,主机B)处为LPAR-1创建第二配置文件,以用于实施故障转移协议。该配置文件称为“PRO LPAR-1(主机B)”,其中配置文件名定义为“PRO LPAR-1”并且“(主机B)”指示配置文件“PRO LPAR-1”存储在主机B上。如所定义,用于存储在主机A和B中的LPAR的配置文件被类似地引用。另外,两个LPAR-1配置文件类似,使得包含在“PROLPAR-1(主机A)”中的信息与“PRO LPAR-1(主机B)”中的信息类似。例如,在HMC模块的帮助下创建配置文件“PRO LPAR-1(主机B)”用于主机B中的LPAR-1的配置文件是不活动的。另外,从LPAR-1的角度来看,配置文件由客户端虚拟SCSI适配器组成,该适配器映射至对应VIOS的虚拟SCSI适配器的特定服务器端口(例如,端口X),该VIOS提供主机A内的LPAR的虚拟化。
在622处,在主机B中,将与不活动LPAR-1相关联的SCSI适配器的服务器端口X设置为接受主机B上VIOS中的LPAR的SCSI适配器的任何通用客户端端口。例如,当在群集环境内管理LPAR(诸如,由VCS管理)时,将虚拟SCSI适配器的服务器端口X设置为VIOS中的“任何插槽/任何分区”。另外,将用于主机B的VIOS的虚拟SCSI适配器的服务器端口X映射至不活动的LPAR-1中的正确客户端SCSI适配器。另外,还将用于主机B中VIOS的虚拟SCSI适配器中的服务器端口X映射至共享存储装置中的适当磁盘,其中磁盘包含用于LPAR-1的操作系统。因此,将在主机B上创建的用于LPAR-1的第二配置文件映射至共享存储装置中的磁盘,该磁盘包含用于底层LPAR-1的操作系统。
在625处,在主机A上创建用于LPAR-1的备份配置文件。该备份配置文件用作主机A内的内部备份,以用于在迁移之后进行故障转移。该配置文件称为“PRO-BACK LPAR-1(主机A)”。例如,在HMC模块的帮助下创建备份配置文件。如所定义,备份配置文件的配置文件名(PRO-BACK LPAR-1)与用于LPAR-1的初始命名配置文件(PRO LPAR-1)不同。主机A上的备份配置文件也映射至共享存储装置中的相同磁盘,该磁盘包含用于底层LPAR的操作系统。用于
主机A中的LPAR-1的备份配置文件是不活动的。
在630处,在主机B上创建用于LPAR-1的备份配置文件。该备份配置文件用作主机B内的内部备份,以用于在迁移之后进行故障转移。该配置文件称为“PRO-BACK LPAR-1(主机B)”。例如,在HMC模块的帮助下创建备份配置文件。如所定义,该备份配置文件的名称(PRO-BACKLPAR-1)与主机B上用于LPAR-1的初始命名配置文件(PRO LPAR-1)不同。主机B上的备份配置文件也映射至包含用于底层LPAR的操作系统的共享存储装置中的相同磁盘。主机B中用于LPAR-1的备份配置文件是不活动的。
在635处,重新启动主机A的VIOS。这样操作以使得在执行任何将来的迁移和/或故障转移序列之前使配置设置实例化。这样,在已设置配置之后,每当执行任何将来的迁移和/或故障转移序列时,则主机A均不会经历相关联的停机时间。另外,在637处重新启动主机B的VIOS。这样操作以使得在执行任何将来的迁移和/或故障转移序列之前使配置设置实例化。这样,在已设置配置之后,每当执行任何将来的迁移和/或故障转移序列时,则主机B均不会经受相关联的停机时间。
在640处,迁移序列开始。例如,群集服务器环境的HMC模块能够执行将LPAR-1从主机A迁移至主机B。实施LPAR迁移的一个典型场景是当主机A中的计算资源正历经维护时。在该情况下,主机A中的LPAR迁移至主机B,使得由那些LPAR支持的应用程序仍然可用。
另外,在主机B上,在643处,对为了进行群集感知而创建的LPAR-1的配置文件重命名。这样,存储在主机A上用于LPAR-1的配置文件独立于存储在主机B上用于LPAR-1的配置文件而引用。例如,将配置文件“PRO LPAR-1(主机B)”重命名为“PRO-PRIME LPAR-1(主机B)”,使得存储在主机A和主机B上的用于LPAR-1的配置文件被独立地引用。完成该配置文件的这种重命名,使得将出现迁移序列,因为如果主机B已具有类似引用的配置文件(例如,相同名称),则HMC可不将LPAR及其关联配置文件从主机A迁移至主机B。即,在群集服务器环境中,在迁移过程中,如果迁移协议(例如,LPM验证的实施)的验证在目标主机服务器(例如,主机B)上发现具有相同名称的配置文件,则该验证失败。如果迁移失败,则重命名的配置文件“PRO-PRIME LPAR-1(主机B)”用作LPAR-1的另一个备份配置文件。
在645处,LPAR-1从主机A迁移至主机B。更具体地讲,将用于LPAR-1的配置文件PRO LPAR-1(主机A)内继续的信息迁移至主机B。
继续参考图6B,通过流程图600的连接器A,在650处,将用于LPAR-1的配置文件从主机A迁移至主机B。存储在主机B上用于LPAR-1的活动实例的新配置文件称为“PRO LPAR-1(主机B)”。例如,在迁移序列过程中,HMC模块用于在主机B中创建新配置文件“PRO LPAR-1(主机B)”。
在655处,以与主机B相关联的方式执行测试以确定从主机A至主机B的LPAR-1迁移是否成功。如果LPAR-1的迁移成功,则流程图600继续进行到660。另一方面,如果LPAR-1的迁移不成功,则流程图继续500进行到680。
例如,成功迁移之后,在660处,从主机A中自动删除LPAR-1的实例及其配置文件(例如,“PRO LPAR-1(主机A)”)。另外,在665处,对在主机A上创建的备份配置文件重命名,以用于进行群集感知和故障转移。即,将用于LPAR-1的备份配置文件重新存储在主机A上并且再次称为“PRO LPAR-1(主机A)”。例如,使用HMC模块执行重命名。配置文件“PRO-LPAR-1(主机A)”是不活动的。
在670处,在一个实施中,任选地删除在主机B上创建的备份配置文件“PRO-PRIME LPAR-1(主机B)”。在另一个实施中,保持备份配置文件以用于在将配置文件迁移至LPAR-l之后提供故障转移。
另一方面,如果LPAR-1的迁移不成功,则主机A上的LPAR-1仍需要是活动的。具体地讲,在680处,在迁移不成功之后,将主机B上的备份配置文件“PRO-PRIME LPAR-1(主机B)”重命名回“PRO LPAR-1(主机B)”,以用于进行群集感知。因此,在故障转移的情况下,LPAR-1能够故障转移至主机B。在一个实施例中,这通过登记到迁移事件经由VCS脚本来实现。
因此,根据本发明的实施例,描述了系统和方法,其中群集服务器协议(例如,VCS)中的LPAR故障转移功能与其他LPAR迁移协议兼容,以确保在成功迁移之后适当地实施故障转移序列。
虽然上述发明使用特定框图、流程图和例子阐述了各种实施例,但每个框图组件、流程图步骤、操作和/或本文描述和/或示出的组件可使用广泛范围的硬件、软件或固件(或其任何组合)配置单独和/或共同来实现。此外,包含在其他组件内的组件的任何公开内容应当被视为例子,因为可实施许多其他体系结构来实现相同功能。
本文描述和/或示出的过程参数和步骤序列仅通过举例的方式给出并且可根据需要改变。例如,虽然本文示出和/或描述的步骤可以特定顺序示出或讨论,但这些步骤不必按示出或讨论的顺序来执行。本文描述和/或示出的各种示例性方法也可省略本文描述或示出的步骤中的一者或多者,或除了所公开的那些步骤之外还包括附加步骤。
虽然本文已经在全功能计算系统的上下文中描述和/或示出了各种实施例,但这些示例性实施例中的一者或多者可作为各种形式的程序产品来分配,而不考虑用于实际进行分配的计算机可读介质的特定类型。本文所公开的实施例也可使用执行某些任务的软件模块来实现。这些软件模块可包括脚本、批处理或可存储在计算机可读存储介质上或计算系统中的其他可执行文件。这些软件模块可将计算系统配置为执行本文所公开的示例性实施例中的一者或多者。可在云计算环境中实施本文所公开的软件模块中的一者或多者。云计算环境可通过互联网提供各种服务和应用程序。这些基于云的服务(例如软件即服务(software as a service)、平台即服务(platform as a service)、基础结构即服务等(infrastructure as a service))可以通过网页浏览器或其他远程接口进行访问。本文所述的各种功能可以通过远程桌面环境或任何其他基于云的计算环境提供。
出于解释目的,已参考特定实施例描述了以上说明书。然而,以上示例性讨论并非旨在是穷举的或将本发明限制为所公开的精确形式。鉴于上述教导,许多修改形式和变型形式都是可能的。为了最好地解释本发明的原理及其实际应用,选择并描述了实施例,由此使得本领域其他技术人员能最好地利用本发明以及具有可适合所设想的具体用途的各种修改形式的各种实施例。
从而描述了根据本发明的实施例。虽然已经在特定实施例中对本发明进行了描述,但应当认识到,不应当将本发明理解为是受到此类实施例的限制,而是应当根据以下权利要求来进行理解。
Claims (20)
1.一种用于迁移的计算机实现的方法,包括:
为包括一个或多个LPAR的第一主机系统上的逻辑分区(LPAR)创建第一配置文件,其中所述第一配置文件与第一名称相关联;
在所述第一配置文件内,将所述LPAR的虚拟小型计算机系统接口(SCSI)适配器的客户端端口映射至所述第一主机系统的虚拟输入/输出服务器(VIOS)的虚拟SCSI适配器的服务器端口;
将所述VIOS的所述服务器端口设置为接受所述第一主机系统的所述一个或多个LPAR的虚拟SCSI适配器的任何端口;以及
在所述VIOS内,将所述VIOS的所述服务器端口映射至所述LPAR以及映射至目标设备,以用于实现所述第一配置文件的适当故障转移,其中所述目标设备包括用于所述LPAR的操作系统。
2.根据权利要求1所述的计算机实现的方法,其中所述设置所述服务器端口包括:
将所述VIOS的所述服务器端口设置为“任何插槽/任何分区”。
3.根据权利要求1所述的计算机实现的方法,还包括:
重新启动所述VIOS。
4.根据权利要求1所述的计算机实现的方法,还包括:
为包括一个或多个LPAR的第二主机系统上的所述LPAR创建第二配置文件,以用于备份所述LPAR,其中所述第一和第二配置文件类似,以及
用所述第一名称命名所述第二配置文件,使得类似地引用所述第一和第二配置文件。
5.根据权利要求4所述的计算机实现的方法,还包括:
在所述第一主机系统上创建所述第一配置文件的备份配置文件,其中所述备份配置文件与第二名称相关联;
在所述第二主机系统上重命名所述第二配置文件,使得独立地引用所述第一配置文件和所述第二配置文件;以及
将具有所述第一名称的所述第一配置文件迁移至所述第二主机系统。
6.根据权利要求5所述的计算机实现的方法,还包括:
确定是否成功迁移了所述第一配置文件;
如果不成功,则在所述第一主机系统上自动删除所述第一LPAR的所述第一配置文件;以及
将所述第一LPAR的所述备份配置文件重命名回所述第一名称,以用于实现所述第一配置文件的适当故障转移。
7.根据权利要求6所述的计算机实现的方法,还包括:
删除所述第二主机系统上的所述第二配置文件。
8.根据权利要求5所述的计算机实现的方法,还包括:
确定是否成功迁移了所述第一配置文件;
如果不成功,则将所述第一LPAR的所述第二配置文件重命名回所述第一名称,以用于实现所述第一配置文件的适当故障转移。
9.一种计算机系统,包括:
处理器;和
内存,所述内存连接到所述处理器并且在其中存储有指令,如果所述指令由所述计算机系统执行,则所述指令使所述计算机系统执行用于迁移的方法,所述方法包括:
为包括一个或多个LPAR的第一主机系统上的逻辑分区(LPAR)创建第一配置文件,其中所述第一配置文件与第一名称相关联;
在所述第一配置文件内,将所述LPAR的虚拟小型计算机系统接口(SCSI)适配器的客户端端口映射至所述第一主机系统的虚拟输入/输出服务器(VIOS)的虚拟SCSI适配器的服务器端口;
将所述VIOS的所述服务器端口设置为接受所述第一主机系统的所述一个或多个LPAR的虚拟SCSI适配器的任何端口;以及
在所述VIOS内,将所述VIOS的所述服务器端口映射至所述LPAR以及映射至目标设备,以用于实现所述第一配置文件的适当故障转移,其中所述目标设备包括用于所述LPAR的操作系统。
10.根据权利要求9所述的计算机系统,其中所述方法还包括:
重新启动所述VIOS。
11.根据权利要求9所述的计算机系统,其中所述方法还包括:
为包括一个或多个LPAR的第二主机系统上的所述LPAR创建第二配置文件,以用于备份所述LPAR,其中所述第一和所述第二配置文件类似,
用所述第一名称命名所述第二配置文件,使得类似地引用所述第一和第二配置文件。
在所述第一主机系统上创建所述第一配置文件的备份配置文件,其中所述备份配置文件与第二名称相关联;
对所述第二主机系统上的所述第二配置文件重命名,使得独立地引用所述第一配置文件和所述第二配置文件;以及
将具有所述第一名称的所述第一配置文件迁移至所述第二主机系统。
12.根据权利要求11所述的计算机系统,其中所述方法还包括:
确定是否成功迁移了所述第一配置文件;
如果不成功,则在所述第一主机系统上删除所述第一LPAR的所述第一配置文件;以及
将所述第一LPAR的所述备份配置文件重命名回所述第一名称,以用于实现所述第一配置文件的适当故障转移。
13.一种具有计算机可执行指令的非暂态计算机可读存储介质,所述指令用于使计算机系统执行用于迁移的方法,所述方法包括:
为包括一个或多个LPAR的第一主机系统的逻辑分区(LPAR)创建第一配置文件,其中所述第一配置文件与第一名称相关联;
在所述第一配置文件内,将所述LPAR的虚拟小型计算机系统接口(SCSI)适配器的客户端端口映射至所述第一主机系统的虚拟输入/输出服务器(VIOS)的虚拟SCSI适配器的服务器端口;
将所述VIOS的所述服务器端口设置为接受所述第一主机系统的所述一个或多个LPAR的虚拟SCSI适配器的任何端口;以及
在所述VIOS内,将所述VIOS的所述服务器端口映射至所述LPAR以及映射至目标设备,以用于实现所述第一配置文件的适当故障转移,其中所述目标设备包括用于所述LPAR的操作系统。
14.根据权利要求13所述的非暂态计算机可读存储介质,其中所述方法中的所述设置所述服务器端口包括:
将所述VIOS的所述服务器端口设置为“任何插槽/任何分区”。
15.根据权利要求13所述的非暂态计算机可读存储介质,其中所述方法还包括:
重新启动所述VIOS。
16.根据权利要求13所述的非暂态计算机可读存储介质,其中所述方法还包括:
为包括一个或多个LPAR的第二主机系统上的所述LPAR创建第二配置文件,以用于备份所述LPAR,其中所述第一和所述第二配置文件类似,以及
用所述第一名称命名所述第二配置文件,使得类似地引用所述第一和第二配置文件。
17.根据权利要求16所述的非暂态计算机可读存储介质,其中所述方法还包括:
在所述第一主机系统上创建所述第一配置文件的备份配置文件,其中所述备份配置文件与第二名称相关联;
对所述第二主机系统上的所述第二配置文件重命名,使得独立地引用所述第一配置文件和所述第二配置文件;以及
将具有所述第一名称的所述第一配置文件迁移至所述第二主机系统。
18.根据权利要求17所述的非暂态计算机可读存储介质,其中所述方法还包括:
确定是否成功迁移了所述第一配置文件;
如果不成功,则在所述第一主机系统上删除所述第一LPAR的所述第一配置文件;以及
将所述第一LPAR的所述备份配置文件重命名回所述第一名称,以用于实现所述第一配置文件的适当故障转移。
19.根据权利要求18所述的非暂态计算机可读存储介质,其中所述方法还包括:
删除所述第二主机系统上的所述第二配置文件。
20.根据权利要求17所述的非暂态计算机可读存储介质,其中所述方法还包括:
确定是否成功迁移了所述第一配置文件;
如果不成功,则在所述第一主机系统上移除所述第一LPAR的所述备份配置文件;以及
将所述第一LPAR的所述第二配置文件重命名回所述第一名称,以用于实现所述第一配置文件的适当故障转移。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/439,684 US8880934B2 (en) | 2012-04-04 | 2012-04-04 | Method and system for co-existence of live migration protocols and cluster server failover protocols |
US13/439684 | 2012-04-04 | ||
PCT/US2013/035308 WO2013152215A1 (en) | 2012-04-04 | 2013-04-04 | Live migration protocols and cluster server failover protocols |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104412228A true CN104412228A (zh) | 2015-03-11 |
CN104412228B CN104412228B (zh) | 2017-10-31 |
Family
ID=49293275
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380026288.3A Active CN104412228B (zh) | 2012-04-04 | 2013-04-04 | 用于逻辑分区迁移的方法、计算机系统和存储介质 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8880934B2 (zh) |
EP (1) | EP2834734B1 (zh) |
JP (1) | JP6132323B2 (zh) |
CN (1) | CN104412228B (zh) |
WO (1) | WO2013152215A1 (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107273044A (zh) * | 2017-05-22 | 2017-10-20 | 云宏信息科技股份有限公司 | 逻辑分区自动挂载磁盘的方法、电子设备及存储介质 |
CN107864055A (zh) * | 2017-10-31 | 2018-03-30 | 云宏信息科技股份有限公司 | 虚拟化系统的管理方法及平台 |
CN107977280A (zh) * | 2017-12-08 | 2018-05-01 | 郑州云海信息技术有限公司 | 一种故障转移时验证ssd cache加速有效性的方法 |
CN112968809A (zh) * | 2021-02-02 | 2021-06-15 | 杭州安恒信息技术股份有限公司 | 一种系统稳定性和兼容性的测试方法和装置 |
CN113300953A (zh) * | 2021-07-27 | 2021-08-24 | 苏州浪潮智能科技有限公司 | 一种多路径故障转移组的管理方法、系统及相关装置 |
Families Citing this family (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI610166B (zh) * | 2012-06-04 | 2018-01-01 | 飛康國際網路科技股份有限公司 | 自動災難復原和資料遷移系統及方法 |
US8909980B1 (en) * | 2012-06-29 | 2014-12-09 | Emc Corporation | Coordinating processing for request redirection |
US9755889B2 (en) * | 2013-02-13 | 2017-09-05 | International Business Machines Corporation | Service failover and failback using enterprise service bus |
US20140289198A1 (en) * | 2013-03-19 | 2014-09-25 | Ramya Malangi Chikkalingaiah | Tracking and maintaining affinity of machines migrating across hosts or clouds |
US11157664B2 (en) | 2013-07-09 | 2021-10-26 | Oracle International Corporation | Database modeling and analysis |
US9747311B2 (en) | 2013-07-09 | 2017-08-29 | Oracle International Corporation | Solution to generate a scriptset for an automated database migration |
US9792321B2 (en) | 2013-07-09 | 2017-10-17 | Oracle International Corporation | Online database migration |
US10776244B2 (en) | 2013-07-09 | 2020-09-15 | Oracle International Corporation | Consolidation planning services for systems migration |
US9996562B2 (en) * | 2013-07-09 | 2018-06-12 | Oracle International Corporation | Automated database migration architecture |
US9967154B2 (en) | 2013-07-09 | 2018-05-08 | Oracle International Corporation | Advanced customer support services—advanced support cloud portal |
US9762461B2 (en) | 2013-07-09 | 2017-09-12 | Oracle International Corporation | Cloud services performance tuning and benchmarking |
US9491072B2 (en) | 2013-07-09 | 2016-11-08 | Oracle International Corporation | Cloud services load testing and analysis |
US9805070B2 (en) | 2013-07-09 | 2017-10-31 | Oracle International Corporation | Dynamic migration script management |
WO2015052836A1 (ja) * | 2013-10-11 | 2015-04-16 | 株式会社日立製作所 | ストレージ装置及びフェールオーバ方法 |
US9584883B2 (en) | 2013-11-27 | 2017-02-28 | Vmware, Inc. | Placing a fibre channel switch into a maintenance mode in a virtualized computing environment via path change |
US9164695B2 (en) * | 2013-12-03 | 2015-10-20 | Vmware, Inc. | Placing a storage network device into a maintenance mode in a virtualized computing environment |
US9207873B2 (en) | 2013-12-19 | 2015-12-08 | Netapp, Inc. | Parallel migration of data objects to clustered storage |
US9858058B2 (en) * | 2014-03-31 | 2018-01-02 | International Business Machines Corporation | Partition mobility for partitions with extended code |
US9983917B2 (en) | 2015-11-30 | 2018-05-29 | International Business Machines Corporation | Monitoring and responding to operational conditions of a logical partition from a separate logical partition |
US9846602B2 (en) | 2016-02-12 | 2017-12-19 | International Business Machines Corporation | Migration of a logical partition or virtual machine with inactive input/output hosting server |
US10042720B2 (en) | 2016-02-22 | 2018-08-07 | International Business Machines Corporation | Live partition mobility with I/O migration |
US10042723B2 (en) | 2016-02-23 | 2018-08-07 | International Business Machines Corporation | Failover of a virtual function exposed by an SR-IOV adapter |
US10002018B2 (en) | 2016-02-23 | 2018-06-19 | International Business Machines Corporation | Migrating single root I/O virtualization adapter configurations in a computing system |
US10025584B2 (en) | 2016-02-29 | 2018-07-17 | International Business Machines Corporation | Firmware management of SR-IOV adapters |
US11036696B2 (en) | 2016-06-07 | 2021-06-15 | Oracle International Corporation | Resource allocation for database provisioning |
US9720863B1 (en) | 2016-10-21 | 2017-08-01 | International Business Machines Corporation | Migrating MMIO from a source I/O adapter of a source computing system to a destination I/O adapter of a destination computing system |
US9720862B1 (en) | 2016-10-21 | 2017-08-01 | International Business Machines Corporation | Migrating interrupts from a source I/O adapter of a computing system to a destination I/O adapter of the computing system |
US10360058B2 (en) * | 2016-11-28 | 2019-07-23 | International Business Machines Corporation | Input/output component selection for virtual machine migration |
US20180150331A1 (en) * | 2016-11-30 | 2018-05-31 | International Business Machines Corporation | Computing resource estimation in response to restarting a set of logical partitions |
US10382313B2 (en) * | 2017-02-16 | 2019-08-13 | International Business Machines Corporation | Test building for testing server operation |
CN109525406A (zh) * | 2017-09-18 | 2019-03-26 | 飞狐信息技术(天津)有限公司 | 一种业务系统配置方法及装置 |
US10708309B2 (en) * | 2018-01-10 | 2020-07-07 | Cisco Technology, Inc. | Fine granularity authorization control in FC-NVMe storage area network |
US11048556B2 (en) | 2018-04-12 | 2021-06-29 | International Business Machines Corporation | Multi-channel, multi-control logical partition migration |
US11188369B2 (en) | 2018-11-26 | 2021-11-30 | International Business Machines Corporation | Interrupt virtualization |
US11073996B2 (en) | 2019-04-30 | 2021-07-27 | EMC IP Holding Company LLC | Host rescan for logical volume migration |
US11256671B2 (en) | 2019-09-13 | 2022-02-22 | Oracle International Corporation | Integrated transition control center |
US20240069980A1 (en) * | 2022-08-24 | 2024-02-29 | International Business Machines Corporation | Disabling a processor facility on a new processor generation without breaking binary compatibility |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020064149A1 (en) * | 1996-11-18 | 2002-05-30 | Elliott Isaac K. | System and method for providing requested quality of service in a hybrid network |
CN1783017A (zh) * | 2004-12-02 | 2006-06-07 | 国际商业机器公司 | 在逻辑分区之间转移网络业务的方法及系统 |
CN101271409A (zh) * | 2007-03-23 | 2008-09-24 | 国际商业机器公司 | 用于迁移逻辑分区的装置和方法以及产品 |
US7984108B2 (en) * | 2003-10-08 | 2011-07-19 | Unisys Corporation | Computer system para-virtualization using a hypervisor that is implemented in a partition of the host system |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6772161B2 (en) * | 2001-12-19 | 2004-08-03 | Hewlett-Packard Development Company, L.P. | Object-level migration in a partition-based distributed file system |
US7213246B1 (en) * | 2002-03-28 | 2007-05-01 | Veritas Operating Corporation | Failing over a virtual machine |
JP4295184B2 (ja) * | 2004-09-17 | 2009-07-15 | 株式会社日立製作所 | 仮想計算機システム |
US7634595B1 (en) * | 2004-12-16 | 2009-12-15 | Emc Corporation | Method for suspending a discovery process, saving the state of the discovery process, and resuming the discovery process during a distributed copy operation |
US8090908B1 (en) * | 2006-04-26 | 2012-01-03 | Netapp, Inc. | Single nodename cluster system for fibre channel |
US8205207B2 (en) * | 2007-03-15 | 2012-06-19 | International Business Machines Corporation | Method of automated resource management in a partition migration capable environment |
JP4744480B2 (ja) * | 2007-05-30 | 2011-08-10 | 株式会社日立製作所 | 仮想計算機システム |
US8041987B2 (en) * | 2008-11-10 | 2011-10-18 | International Business Machines Corporation | Dynamic physical and virtual multipath I/O |
US20110125979A1 (en) * | 2009-11-25 | 2011-05-26 | International Business Machines Corporation | Migrating Logical Partitions |
US8726274B2 (en) | 2010-09-10 | 2014-05-13 | International Business Machines Corporation | Registration and initialization of cluster-aware virtual input/output server nodes |
US8495412B2 (en) | 2010-09-10 | 2013-07-23 | International Business Machines Corporation | Autonomous propagation of virtual input/output (VIO) operation(s) to second VIO server (VIOS) due to a detected error condition at a first VIOS |
US8819190B2 (en) * | 2011-03-24 | 2014-08-26 | International Business Machines Corporation | Management of file images in a virtual environment |
-
2012
- 2012-04-04 US US13/439,684 patent/US8880934B2/en active Active
-
2013
- 2013-04-04 EP EP13772995.0A patent/EP2834734B1/en active Active
- 2013-04-04 CN CN201380026288.3A patent/CN104412228B/zh active Active
- 2013-04-04 WO PCT/US2013/035308 patent/WO2013152215A1/en active Application Filing
- 2013-04-04 JP JP2015504732A patent/JP6132323B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020064149A1 (en) * | 1996-11-18 | 2002-05-30 | Elliott Isaac K. | System and method for providing requested quality of service in a hybrid network |
US7984108B2 (en) * | 2003-10-08 | 2011-07-19 | Unisys Corporation | Computer system para-virtualization using a hypervisor that is implemented in a partition of the host system |
CN1783017A (zh) * | 2004-12-02 | 2006-06-07 | 国际商业机器公司 | 在逻辑分区之间转移网络业务的方法及系统 |
CN101271409A (zh) * | 2007-03-23 | 2008-09-24 | 国际商业机器公司 | 用于迁移逻辑分区的装置和方法以及产品 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107273044A (zh) * | 2017-05-22 | 2017-10-20 | 云宏信息科技股份有限公司 | 逻辑分区自动挂载磁盘的方法、电子设备及存储介质 |
CN107273044B (zh) * | 2017-05-22 | 2020-06-09 | 云宏信息科技股份有限公司 | 逻辑分区自动挂载磁盘的方法、电子设备及存储介质 |
CN107864055A (zh) * | 2017-10-31 | 2018-03-30 | 云宏信息科技股份有限公司 | 虚拟化系统的管理方法及平台 |
CN107977280A (zh) * | 2017-12-08 | 2018-05-01 | 郑州云海信息技术有限公司 | 一种故障转移时验证ssd cache加速有效性的方法 |
CN107977280B (zh) * | 2017-12-08 | 2020-07-24 | 苏州浪潮智能科技有限公司 | 一种故障转移时验证ssd cache加速有效性的方法 |
CN112968809A (zh) * | 2021-02-02 | 2021-06-15 | 杭州安恒信息技术股份有限公司 | 一种系统稳定性和兼容性的测试方法和装置 |
CN113300953A (zh) * | 2021-07-27 | 2021-08-24 | 苏州浪潮智能科技有限公司 | 一种多路径故障转移组的管理方法、系统及相关装置 |
WO2023005037A1 (zh) * | 2021-07-27 | 2023-02-02 | 苏州浪潮智能科技有限公司 | 一种多路径故障转移组的管理方法、系统及相关装置 |
Also Published As
Publication number | Publication date |
---|---|
US8880934B2 (en) | 2014-11-04 |
US20130268800A1 (en) | 2013-10-10 |
JP2015515690A (ja) | 2015-05-28 |
EP2834734B1 (en) | 2019-07-24 |
EP2834734A1 (en) | 2015-02-11 |
CN104412228B (zh) | 2017-10-31 |
JP6132323B2 (ja) | 2017-05-24 |
EP2834734A4 (en) | 2016-01-13 |
WO2013152215A1 (en) | 2013-10-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104412228A (zh) | 动态迁移协议和群集服务器故障转移协议 | |
US10073747B2 (en) | Reducing recovery time in disaster recovery/replication setup with multitier backend storage | |
US11243845B2 (en) | Method and device for data backup | |
US11442825B2 (en) | Establishing a synchronous replication relationship between two or more storage systems | |
US10999208B2 (en) | Handling path issues for storage copy services | |
CN105556478A (zh) | 用于保护虚拟机数据的系统和方法 | |
CN104603739A (zh) | 对并行存储的块级访问 | |
US10361995B2 (en) | Management of clustered and replicated systems in dynamic computing environments | |
US11093141B2 (en) | Method and apparatus for caching data | |
US10425475B2 (en) | Distributed data management | |
CN111212111A (zh) | 对象存储服务管理方法及电子设备 | |
US9569316B2 (en) | Managing VIOS failover in a single storage adapter environment | |
CN104750428A (zh) | 块储存存取和网关模块、储存系统和方法与内容递送装置 | |
CN105095103A (zh) | 用于云环境下的存储设备管理方法和装置 | |
CN105453039A (zh) | 用于在高输入/输出负载环境中即时恢复虚拟机的系统和方法 | |
CN110633046A (zh) | 一种分布式系统的存储方法、装置、存储设备及存储介质 | |
CN107924324A (zh) | 数据访问加速器 | |
US10628055B2 (en) | Management of storage replication consistency groups using automatic replication group identifiers | |
US10884888B2 (en) | Facilitating communication among storage controllers | |
US20160034548A1 (en) | System and Method for Obtaining Automated Scaling of a Virtual Desktop Environment | |
CN110870275A (zh) | 共享存储器文件传输 | |
US9471223B2 (en) | Volume class management | |
US9223513B2 (en) | Accessing data in a dual volume data storage system using virtual identifiers |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |