CN111209085A - 一种集群高可用接入控制策略配置方法及系统 - Google Patents

一种集群高可用接入控制策略配置方法及系统 Download PDF

Info

Publication number
CN111209085A
CN111209085A CN202010029362.9A CN202010029362A CN111209085A CN 111209085 A CN111209085 A CN 111209085A CN 202010029362 A CN202010029362 A CN 202010029362A CN 111209085 A CN111209085 A CN 111209085A
Authority
CN
China
Prior art keywords
cluster
access control
host
resources
strategy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202010029362.9A
Other languages
English (en)
Inventor
栗丽霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202010029362.9A priority Critical patent/CN111209085A/zh
Publication of CN111209085A publication Critical patent/CN111209085A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/4557Distribution of virtual machine instances; Migration and load balancing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45587Isolation or security of virtual machine instances
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45595Network integration; Enabling network access in virtual machine instances

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明公开了一种集群高可用接入控制策略配置方法,包括:获取集群资源占用情况,判断是否启用接入控制;若启用接入控制,判断选择启用的策略类型;配置启用的策略,预留集群高可用资源。本发明还公开了一种集群高可用接入控制策略配置系统,包括:集群资源监测模块、接入控制配置模块、资源预留策略管理模块和专用故障切换主机策略管理模块。本发明通过在集群中预留一定的资源,确保发生故障时,集群其他资源足以运行宕机虚拟机,使故障主机上原来运行的虚拟机重新开机,接入集群继续提供服务。通过接入控制策略的选择,能适应集群实际资源占用情况,更好地更灵活地满足用户虚拟化环境中高可用的需求,提高在同类产品中的竞争力。

Description

一种集群高可用接入控制策略配置方法及系统
技术领域
本发明涉及集群管理领域,具体涉及一种集群高可用接入控制策略配置方法及系统。
背景技术
目前,针对物理服务器或者存储器的高可用大多采用设置冗余的硬件设备的方法,利用主-从机制,在单节点发生故障时,可以将服务自动快速地切换至备节点,以保证用户服务的业务连续性。但是这种方法需要采购更多的硬件设备,增加成本,并且并不可能为保证业务的高可用将所有的物理服务器或存储器都采购2份,导致高可用的效果是有限的。
随着虚拟机化技术的发展,物理服务器集群管理化,并支持在单台物理服务器上创建多个虚拟机,这些虚拟机互相之间业务隔离,可以当做物理服务器部署用户业务,更好地利用了物理资源,那么如何实现虚拟机的高可用就成为亟待解决的问题。
通常虚拟机高可用都是针对集群来说,产生宕机的虚拟机后,对于符合迁移条件的虚拟机,会触发高可用,迁移至其他主机上开机,但是集群上的资源也是有限的,客户为了节约成本,通常会充分利用集群中的主机资源,当一台主机发生故障,其他的主机并没有足够的资源来保证故障主机上原先运行的虚拟机的重新接入到集群中,导致虚拟机失去服务能力。
发明内容
为了解决上述技术问题,本发明提出了一种集群高可用接入控制策略配置方法及系统,能够根据虚拟环境灵活为集群虚拟机宕机故障预留资源。
为实现上述目的,本发明采用以下技术方案:
一种集群高可用接入控制策略配置方法,包括:
获取集群资源占用情况,判断是否启用接入控制;
若启用接入控制,判断选择启用的策略类型;
配置启用的策略,预留集群高可用资源。
进一步地,所述判断是否启用接入控制,包括:
若集群内所有主机的CPU或内存使用率均超过75%,则禁用接入控制;
若集群内所有主机的CPU或内存使用率未超过75%,则启用接入控制。
进一步地,所述判断选择启用的策略类型,包括:
若集群内存在至少一台主机的CPU和内存使用率均低于25%,选择启用专用故障切换主机策略;
若集群内所有主机的CPU或内存使用率均不低于25%,选择启用资源预留策略。
进一步地,所述专用故障切换主机策略,包括:
将所述CPU和内存使用率均低于25%的主机选为专用故障切换主机;
将专用故障切换主机上虚拟机迁至其他主机;
将专用故障切换主机的是否专用故障切换的标志位改为true;
创建或迁移虚拟机时专用故障切换主机不可用。
进一步地,所述资源预留策略,包括:
设置集群CPU和内存预留比例;
批量开启集群虚拟机;
当集群剩余CPU或内存比例低于预留比例时,虚拟机开机失败。
进一步地,所述批量开启集群虚拟机,包括:
集群CPU和内存加锁;
获取集群剩余资源大小,当集群剩余资源大于设置的预留比例时,为集群预分配虚拟机需要的配置资源,下发虚拟机开机指令;
集群CPU和内存释放锁;
等待虚拟机开机成功后,集群CPU和内存加锁;
更新虚拟机状态为运行,集群CPU和内存释放锁。
进一步地,所述集群剩余资源大小为:
集群剩余资源=集群所有主机资源之和-集群所有主机已用资源之和-集群预分配资源。
本发明还提供了一种集群高可用接入控制策略配置系统,包括:
集群资源监测模块,用于获取集群资源占用情况;
接入控制配置模块,用于控制是否启用接入控制,根据集群资源占用情况,选择启用资源预留策略管理实现模块或专用故障切换主机策略管理实现模块;
资源预留策略管理模块,用于配置资源预留策略;
专用故障切换主机策略管理模块,用于配置专用故障切换主机策略。
本发明的有益效果是:
本发明通过提出一种集群高可用接入控制策略配置方法及系统,解决了集群中的部分主机发生故障时,导致其上运行的虚拟机宕机,失去服务能力的问题。通过在集群中预留一定的资源,确保发生故障时,集群其他资源足以运行宕机虚拟机,使故障主机上原来运行的虚拟机重新开机,接入集群继续提供服务。
通过接入控制策略的选择,能适应集群实际资源占用情况,更好地更灵活地满足用户虚拟化环境中高可用的需求,提高在同类产品中的竞争力。
本发明不需要在发生虚拟机宕机时再寻找符合开机条件的主机,可以实现资源专用,提高了虚拟机宕机后恢复服务能力的效率。
附图说明
图1是本发明集群高可用接入控制策略配置方法流程示意图;
图2是本发明专用故障切换主机策略流程示意图;
图3是本发明资源预留策略流程示意图;
图4是本发明集群高可用接入控制策略配置系统结构示意图。
具体实施方式
为能清楚说明本方案的技术特点,下面通过具体实施方式,并结合其附图,对本发明进行详细阐述。下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开,下文中对特定例子的部件和设置进行描述。此外,本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例和/或设置之间的关系。应当注意,在附图中所图示的部件不一定按比例绘制。本发明省略了对公知组件和处理技术及工艺的描述以避免不必要地限制本发明。
如图1所示,本发明实施例公开了一种集群高可用接入控制策略配置方法,包括:
获取集群资源占用情况,判断是否启用接入控制;
若启用接入控制,判断选择启用的策略类型;
配置启用的策略,预留集群高可用资源。
具体地,获取集群当前资源占用情况,根据集群内所有主机的CPU和内存的占用情况,判断是否启用接入控制,具体为:
若集群内所有主机的CPU或内存使用率均超过75%,则禁用接入控制;
若集群内所有主机的CPU或内存使用率未超过75%,则启用接入控制。
当集群资源紧张时,禁用接入控制,把预留的资源释放回资源池。
所述判断选择启用的策略类型包括专用故障切换主机策略和资源预留策略,具体地,若集群内存在至少一台主机的CPU和内存使用率均低于25%,选择启用专用故障切换主机策略;
若集群内所有主机的CPU或内存使用率均不低于25%,选择启用资源预留策略。
所述专用故障切换主机策略的流程示意图如图2所示,包括:
将所述CPU和内存使用率均低于25%的主机选为专用故障切换主机;
将专用故障切换主机上虚拟机迁至其他主机;
将专用故障切换主机的是否专用故障切换的标志位改为true;
创建或迁移虚拟机时专用故障切换主机不可用。
负载均衡调度主机也需要将专用故障切换主机排除在外。
当一台主机被设置为专用故障切换主机后,该主机不允许打开虚拟机电源,不允许迁入虚拟机,只有触发高可用的虚拟机可以迁入。
当某台主机故障时,其上关机前运行的虚拟机触发高可用,首选在专用故障切换主机上开机,当专用故障切换主机资源不能满足宕机虚拟机需求时,继续选用其他非专用故障切换主机触发虚拟机开机。
所述资源预留策略的流程示意图如图3所示,包括:
设置集群CPU和内存预留比例;
批量开启集群虚拟机;
当集群剩余CPU或内存比例低于预留比例时,虚拟机开机失败。
具体地,所预留的CPU和内存比例专门用于集群高可用,当某主机发生故障时,用于其上虚拟机的恢复。优选地,所述预留比例可设为CPU和内存各预留10%。
集群虚拟机批量开机时,多线程之间数据不可见,首先要判断集群中的CPU和内存资源的利用率,预判虚拟机开机后的剩余资源百分比有没有超过设定的预留比例,通过以下步骤保证并发控制:
集群CPU和内存加锁;
获取集群剩余资源大小,当集群剩余资源大于设置的预留比例时,为集群预分配虚拟机需要的配置资源,下发虚拟机开机指令;
集群CPU和内存释放锁;
等待虚拟机开机成功后,集群CPU和内存加锁;
更新虚拟机状态为运行,集群CPU和内存释放锁。
具体地,所述集群剩余资源大小为:
集群剩余资源=集群所有主机资源之和-集群所有主机已用资源之和-集群预分配资源。
通过上述步骤,保证了CPU和内存资源在批量打开虚拟机电源时安全地分配,并能保证可用的剩余资源在设定的预留比例之上。
此时,当某台主机发生故障,虚拟机宕机时,该主机关机前其上处于开机状态的虚拟机会触发高可用而迁移到集群中其他主机上运行,触发高可用开机的虚拟机不再进行集群剩余资源判断,直接在其他主机上开机。
本发明实施例还提供了一种集群高可用接入控制策略配置系统,如图4所示,包括:
集群资源监测模块,用于获取集群资源占用情况;
接入控制配置模块,用于控制是否启用接入控制,根据集群资源占用情况,选择启用资源预留策略管理实现模块或专用故障切换主机策略管理实现模块;
资源预留策略管理模块,用于配置资源预留策略;
专用故障切换主机策略管理模块,用于配置专用故障切换主机策略。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制。对于所属领域的技术人员来说,在上述说明的基础上还可以做出其它不同形式的修改或变形。这里无需也无法对所有的实施方式予以穷举。在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims (8)

1.一种集群高可用接入控制策略配置方法,其特征在于,包括:
获取集群资源占用情况,判断是否启用接入控制;
若启用接入控制,判断选择启用的策略类型;
配置启用的策略,预留集群高可用资源。
2.根据权利要求1所述的集群高可用接入控制策略配置方法,其特征在于,所述判断是否启用接入控制,包括:
若集群内所有主机的CPU或内存使用率均超过75%,则禁用接入控制;
若集群内所有主机的CPU或内存使用率未超过75%,则启用接入控制。
3.根据权利要求2所述的集群高可用接入控制策略配置方法,其特征在于,所述判断选择启用的策略类型,包括:
若集群内存在至少一台主机的CPU和内存使用率均低于25%,选择启用专用故障切换主机策略;
若集群内所有主机的CPU或内存使用率均不低于25%,选择启用资源预留策略。
4.根据权利要求3所述的集群高可用接入控制策略配置方法,其特征在于,所述专用故障切换主机策略,包括:
将所述CPU和内存使用率均低于25%的主机选为专用故障切换主机;
将专用故障切换主机上虚拟机迁至其他主机;
将专用故障切换主机的是否专用故障切换的标志位改为true;
创建或迁移虚拟机时专用故障切换主机不可用。
5.根据权利要求3所述的集群高可用接入控制策略配置方法,其特征在于,所述资源预留策略,包括:
设置集群CPU和内存预留比例;
批量开启集群虚拟机;
当集群剩余CPU或内存比例低于预留比例时,虚拟机开机失败。
6.根据权利要求5所述的集群高可用接入控制策略配置方法,其特征在于,所述批量开启集群虚拟机,包括:
集群CPU和内存加锁;
获取集群剩余资源大小,当集群剩余资源大于设置的预留比例时,为集群预分配虚拟机需要的配置资源,下发虚拟机开机指令;
集群CPU和内存释放锁;
等待虚拟机开机成功后,集群CPU和内存加锁;
更新虚拟机状态为运行,集群CPU和内存释放锁。
7.根据权利要求6所述的集群高可用接入控制策略配置方法,其特征在于,所述集群剩余资源大小为:
集群剩余资源=集群所有主机资源之和-集群所有主机已用资源之和-集群预分配资源。
8.一种集群高可用接入控制策略配置系统,其特征在于,包括:
集群资源监测模块,用于获取集群资源占用情况;
接入控制配置模块,用于控制是否启用接入控制,根据集群资源占用情况,选择启用资源预留策略管理实现模块或专用故障切换主机策略管理实现模块;
资源预留策略管理模块,用于配置资源预留策略;
专用故障切换主机策略管理模块,用于配置专用故障切换主机策略。
CN202010029362.9A 2020-01-11 2020-01-11 一种集群高可用接入控制策略配置方法及系统 Withdrawn CN111209085A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010029362.9A CN111209085A (zh) 2020-01-11 2020-01-11 一种集群高可用接入控制策略配置方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010029362.9A CN111209085A (zh) 2020-01-11 2020-01-11 一种集群高可用接入控制策略配置方法及系统

Publications (1)

Publication Number Publication Date
CN111209085A true CN111209085A (zh) 2020-05-29

Family

ID=70790048

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010029362.9A Withdrawn CN111209085A (zh) 2020-01-11 2020-01-11 一种集群高可用接入控制策略配置方法及系统

Country Status (1)

Country Link
CN (1) CN111209085A (zh)

Similar Documents

Publication Publication Date Title
US7802127B2 (en) Method and computer system for failover
EP3253028B1 (en) Method for managing instance node and management device
US9032180B2 (en) Managing CPU resources for high availability micro-partitions
CN111290834A (zh) 一种基于云管理平台实现业务高可用的方法、装置及设备
CN105159798A (zh) 一种虚拟机的双机热备方法、双机热备管理服务器和系统
US9244826B2 (en) Managing CPU resources for high availability micro-partitions
CN111880906A (zh) 虚拟机高可用性管理方法、系统以及存储介质
US9043575B2 (en) Managing CPU resources for high availability micro-partitions
CN111181780A (zh) 基于ha集群的主机池切换方法、系统、终端及存储介质
CN111935244B (zh) 一种业务请求处理系统及超融合一体机
JP2011227766A (ja) 記憶手段の管理方法、仮想計算機システムおよびプログラム
CN114518955A (zh) 一种基于kubernetes的Flink云原生部署架构方法及系统
US20200409806A1 (en) Virtual-machine-specific failover protection
JP6556726B2 (ja) コンピューティング環境においてアダプティブビジーウェイトをサポートするためのシステムおよび方法
CN105208111A (zh) 一种信息处理的方法及物理机
CN111209085A (zh) 一种集群高可用接入控制策略配置方法及系统
CN109284169B (zh) 基于进程虚拟化的大数据平台进程管理方法及计算机设备
CN105743696A (zh) 一种云计算平台管理方法
CN113590306A (zh) 一种实现域控制器双系统之间可靠通讯的方法
CN102662702B (zh) 设备管理系统、装置、基板管理装置及方法
CN107315624B (zh) 信息处理方法及虚拟化管理器
Chen et al. The design of high availability in the dawning server consolidation system
CN117714386A (zh) 分布式系统部署方法、配置方法、系统、设备及介质
CN115510167A (zh) 一种分布式数据库系统及电子设备
CN117692500A (zh) 运行方法、装置、设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20200529

WW01 Invention patent application withdrawn after publication