CN202798798U - 基于云计算技术的高可用系统 - Google Patents

基于云计算技术的高可用系统 Download PDF

Info

Publication number
CN202798798U
CN202798798U CN2012203465030U CN201220346503U CN202798798U CN 202798798 U CN202798798 U CN 202798798U CN 2012203465030 U CN2012203465030 U CN 2012203465030U CN 201220346503 U CN201220346503 U CN 201220346503U CN 202798798 U CN202798798 U CN 202798798U
Authority
CN
China
Prior art keywords
server
virtual machine
image file
cloud host
application server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CN2012203465030U
Other languages
English (en)
Inventor
马勇
付萍萍
李凡
梁良
余鹏飞
李文军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
INFORMATION COMMUNICATION BRANCH JIANGXI ELECTRIC POWER CO Ltd
Original Assignee
INFORMATION COMMUNICATION BRANCH JIANGXI ELECTRIC POWER CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by INFORMATION COMMUNICATION BRANCH JIANGXI ELECTRIC POWER CO Ltd filed Critical INFORMATION COMMUNICATION BRANCH JIANGXI ELECTRIC POWER CO Ltd
Priority to CN2012203465030U priority Critical patent/CN202798798U/zh
Priority to US13/677,103 priority patent/US9141491B2/en
Application granted granted Critical
Publication of CN202798798U publication Critical patent/CN202798798U/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2028Failover techniques eliminating a faulty processor or activating a spare
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2094Redundant storage or storage space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/40Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass for recovering from a failure of a protocol instance or entity, e.g. service redundancy protocols, protocol state redundancy or protocol service redirection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45562Creating, deleting, cloning virtual machine instances
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/815Virtual

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Hardware Redundancy (AREA)

Abstract

本实用新型提供一种基于云计算技术的高可用系统,包括中央控制管理服务器、云主机服务器、存储服务器和至少一个应用服务器;中央控制管理服务器与至少一个应用服务器连接,用于对至少一个应用服务器分别进行监控,若监控到至少一个应用服务器中存在发生故障的应用服务器,则向云主机服务器发送第一指令信息;云主机服务器与中央控制管理服务器连接,用于接收中央控制管理服务器发送的第一指令信息,并根据第一指令信息的指示,从存储服务器中调用目标虚拟机镜像文件,并运行目标虚拟机镜像文件;存储服务器与云主机服务器连接,用于存储与至少一个应用服务器分别对应的虚拟机镜像文件,有效地提高了高可用系统的资源利用率。

Description

基于云计算技术的高可用系统
技术领域
本实用新型涉及计算机技术,尤其涉及一种基于云计算技术的高可用系统。
背景技术
目前,为了保证服务器系统的高可用性,主要采用双机热备份技术,双机热备份技术是一种软硬件结合的较高容错的应用方案。
采用双机热备份技术实现高可用系统,即高可用服务器系统,在主用服务器和备用服务器上分别安装操作系统和管理软件,并且在主用服务器与备用服务器之间按照一定的时间间隔相互发送通信信号,以向对端服务器表明其自身当前的运行状态。若主用服务器发生故障,或者备用服务器无法收到主用服务器发送的通信信号,则管理软件判断出主用服务器当前处于故障状态,则停止主用服务器的工作,将系统资源转移到备用服务器上,由备用服务器替代主用服务器进行工作,以保证服务器系统的运行不间断,从而实现高可用性。
但是,采用双机热备份技术实现服务器系统高可用性的技术方案中,由于每台主用服务器均需要配置相应的备用服务器,在主用服务器正常工作时,相应的备用服务器一直处于空闲状态,造成备用系统资源的浪费,从而造成高可用系统的资源利用率降低。
发明内容
本实用新型提供一种基于云计算技术的高可用系统,用以提高系统资源的利用率。
本实用新型提供的基于云计算技术的高可用系统包括中央控制管理服务器、云主机服务器、存储服务器和至少一个应用服务器;
所述中央控制管理服务器与所述至少一个应用服务器连接,用于对所述至少一个应用服务器分别进行监控,若监控到所述至少一个应用服务器中存在发生故障的应用服务器,则向所述云主机服务器发送第一指令信息;
所述云主机服务器与所述中央控制管理服务器连接,用于接收所述中央控制管理服务器发送的所述第一指令信息,并根据所述第一指令信息的指示,从所述存储服务器中调用所述目标虚拟机镜像文件,并运行所述目标虚拟机镜像文件;其中,所述目标虚拟机镜像文件为与发生故障的应用服务器对应的虚拟机镜像文件;
所述存储服务器与所述云主机服务器连接,用于存储与所述至少一个应用服务器分别对应的虚拟机镜像文件,以供所述云主机服务器调用所述虚拟机镜像文件中的所述目标虚拟机镜像文件。
所述中央控制管理服务器还用于:
在监控到所述发生故障的应用服务器恢复正常之后,向所述云主机服务器发送第二指令信息;
相应地,所述云主机服务器还用于接收所述第二指令信息,并根据所述第二指令信息停止运行所述目标虚拟机镜像文件。
所述中央控制管理服务器包括:
监控模块,用于对所述至少一个应用服务器分别进行监控,获取监控结果,并将所述监控结果发送给第一收发模块;
所述第一收发模块,用于接收所述监控模块发送的所述监控结果,并在所述监控结果表明所述至少一个应用服务器中存在发生故障的应用服务器时,向所述云主机服务器发送所述第一指令信息;
相应地,所述云主机服务器包括:
第二收发模块,用于接收所述第一收发模块发送的所述第一指令信息,并根据所述第一指令信息的指示,从所述存储服务器中调用所述目标虚拟机镜像文件,并将所述目标虚拟机镜像文件发送至运行模块;
所述运行模块,用于接收所述第二收发模块发送的所述目标虚拟机镜像文件,并运行所述目标虚拟机镜像文件。
所述第一收发模块还用于:
在所述监控结果表明所述发生故障的应用服务器恢复正常之后,向所述云主机服务器发送第二指令信息;
相应地,所述第二收发模块还用于,接收所述第一收发模块发送的所述第二指令信息,并将所述第二指令信息发送给所述运行模块;
所述运行模块还用于,根据所述第二指令信息停止运行所述目标虚拟机镜像文件。
所述高可用系统中的所述云主机服务器为多个;
相应地,所述第一收发模块还用于,在所述监控结果表明所述至少一个应用服务器中存在发生故障的应用服务器时,向多个云主机服务器中满足预设条件的云主机服务器发送所述第一指令信息。
所述云主机服务器的数量小于或等于所述至少一个应用服务器的数量。
所述中央控制管理服务器和所述存储服务器合设在同一服务器设备中。
所述应用服务器为数据库服务器。
本实用新型提供的基于云计算技术的高可用系统,通过在中央控制管理服务器监控到有应用服务器发生故障之后,向云主机服务器发送第一指令信息,以使云主机服务器从存储服务器中调用与发生故障的应用服务器对应的虚拟机镜像文件,由云主机服务器运行该虚拟机镜像文件,使得发生故障的应用服务器无法正常工作时,云主机服务器可以在中央管理控制服务器的指示下,通过模拟与该应用服务器相同的运行环境,继续运行该应用服务器上的应用,而无需为各应用服务器分别配置备用服务器设备,从而有效地提高了高可用系统的资源利用率,有效地提高了高可用系统对各应用服务器进行监控管理的效率和便捷性。
附图说明
图1为本实用新型基于云计算技术的高可用系统一实施例的系统结构示意图;
图2为本实用新型基于云计算技术的高可用系统另一实施例的系统结构示意图;
图3为本实用新型基于云计算技术的高可用系统又一实施例的系统结构示意图。
具体实施方式
图1为本实用新型基于云计算技术的高可用系统一实施例的系统结构示意图,如图1所示,该高可用系统包括中央控制管理服务器11、云主机服务器12、存储服务器13和至少一个应用服务器14。
其中,所述中央控制管理服务器11与所述至少一个应用服务器14连接,用于对所述至少一个应用服务器14分别进行监控,若监控到所述至少一个应用服务器14中存在发生故障的应用服务器14,则向所述云主机服务器12发送第一指令信息;其中,所述应用服务器14可以为数据库服务器。
所述云主机服务器12与所述中央控制管理服务器11连接,用于接收所述中央控制管理服务器11发送的所述第一指令信息,并根据所述第一指令信息的指示,从所述存储服务器13中调用所述目标虚拟机镜像文件,并运行所述目标虚拟机镜像文件;其中,所述目标虚拟机镜像文件为与发生故障的应用服务器14对应的虚拟机镜像文件。
所述存储服务器13与所述云主机服务器12连接,用于存储与所述至少一个应用服务器14分别对应的虚拟机镜像文件,以供所述云主机服务器12调用所述虚拟机镜像文件中的所述目标虚拟机镜像文件。
在本实用新型实施例的高可用系统包括中央控制管理服务器11、云主机服务器12、存储服务器13以及一个或多个应用服务器14。
高可用系统中的中央控制管理服务器11与一个或多个应用服务器14分别连接,还与云主机服务器12连接。中央控制管理服务器11对其所连接的一个或多个应用服务器14进行监控,中央控制管理服务器11对应用服务器14进行监控的内容中包括监控是否有应用服务器14发生故障。若中央控制管理服务器11监控到一个或多个应用服务器14中有应用服务器14发生故障时,向其所连接的云主机服务器12发送第一指令信息,该第一指令信息用于指示云主机服务器12从其所连接的存储服务器13中调用与发生故障的应用服务器14对应的虚拟机镜像文件。
可选的实现方式为,中央控制管理服务器11在监控到一个或多个应用服务器14中存在发生故障的应用服务器14时,将唯一标识该发生故障的应用服务器14的标识信息携带在发送给云主机服务器12的第一指令信息中;云主机服务器12在接收到该第一指令信息之后,根据该第一指令信息中携带的标识信息,调用存储服务器13中与该标识信息对应的虚拟机镜像文件。可以理解的是,在此实现方式中,中央控制管理服务器11中存储有其所连接的各应用服务器14各自的标识信息,并且存储服务器13中所存储的虚拟机镜像文件是与应用服务器14的标识信息对应的,也就是说,通过与标识信息对应的虚拟机镜像文件即为与该标识信息对应的应用服务器14的虚拟机镜像文件。
与中央控制管理服务器11连接的应用服务器14还可以为数据库服务器,或者其他类型的服务器或设备。由于在本实用新型实施例中,中央控制管理服务器11对其所连接的应用服务器14是否发生故障进行监控,而应用服务器14的具体功能并不影响中央控制管理服务器11对其进行的监控,因此,本实用新型实施例并不对应用服务器14的功能进行限定。
高可用系统中的云主机服务器12分别与中央控制管理服务器11和存储服务器13连接。当中央控制管理服务器11监控到有应用服务器14发生故障之后,向云主机服务器12发送第一指令信息,相应地,云主机服务器12接收中央控制管理服务器11发送的第一指令信息。云主机服务器12接收到第一指令信息之后,根据该第一指令信息的指示,从其所连接的存储服务器13中调用与发生故障的应用服务器14对应的虚拟机镜像文件。该与发生故障的应用服务器14对应的虚拟机镜像文件,即为目标虚拟机镜像文件,云主机服务器12从存储服务器13中调用目标虚拟机镜像文件之后,运行该目标虚拟机镜像文件。
由于虚拟机镜像文件是对应用服务器14运行环境进行模拟的操作文件,因此云主机服务器12在其上运行目标虚拟机镜像文件时,相当于运行的是发生故障的应用服务器14的运行环境,也就是说,在应用服务器14发生故障时,由云主机服务器12通过运行与该应用服务器14对应的虚拟机镜像文件,相当于应用服务器14中的应用继续运行。
可选的实现方式为,中央控制管理服务器11向云主机服务器12发送的第一指令信息中携带有发生故障的应用服务器14的标识信息,从而云主机服务器12可以利用该标识信息调用存储服务器13中与该标识信息对应的虚拟机镜像文件。相应地,存储服务器13中存储的虚拟机镜像文件是分别与各应用服务器14的标识信息对应的。
高可用系统中的存储服务器13与云主机服务器12连接,存储服务器13中预先存储有中央控制管理服务器11所连接的一个或多个应用服务器14各自的虚拟机镜像文件。也就是说,存储服务器13中所存储的一个或多个虚拟机镜像文件是分别与各应用服务器14对应的。从而云主机服务器12可以在接收到中央控制管理服务器11向其发送的第一指令信息之后,根据该第一指令信息从存储服务器13所存储的一个或多个虚拟机镜像文件中调用与发生故障的应用服务器14对应的虚拟机镜像文件,即目标虚拟机镜像文件。
可选的实现方式为,存储服务器13所存储的一个或多个虚拟机镜像文件是与各应用服务器14的标识信息对应的。也就是说,各虚拟机镜像文件是分别与各应用服务器14对应的,并且各应用服务器14是由各自的标识信息进行标识的,根据标识信息能够对各应用服务器14进行区分,因此存储服务器13中的各虚拟机镜像文件是与各应用服务器14的标识信息对应的,以便于云主机服务器12根据应用服务器14的标识信息从存储服务器13中调用与该标识信息对应的虚拟机镜像文件。可以理解的是,中央控制管理服务器11向云主机服务器12发送的第一指令信息中携带有发生故障的应用服务器14的标识信息。
当中央控制管理服务器11所连接的一个或多个应用服务器14中有两个或多个应用服务器14均发生故障时,中央控制管理服务器11向云主机服务器12发送第一指令信息,由云主机服务器12调用与发生故障的两个或多个应用服务器14分别对应的虚拟机镜像文件,并分别运行各虚拟机镜像文件。
云主机服务器12从存储服务器13中调用目标虚拟机镜像文件的方式可以为,云主机服务器12从存储服务器13中复制该与发生故障的应用服务器14对应的目标虚拟机镜像文件。
进一步地,中央控制管理服务器11对其所连接的应用服务器14进行监控,以及向云主机服务器12发送指令信息的实现方式可以为,预先在云主机服务器12和各应用服务器14中分别安装代理(Agent)软件。中央控制管理服务器11通过该代理软件即可实现对其所连接的各应用服务器14的监控,并且,中央控制管理服务器11通过向该代理软件发送指令信息,由该代理软件对指令信息进行解析,从而在云主机服务器12上执行相应的操作。以上仅为中央控制管理服务器11对应用服务器14和云主机服务器12进行控制的一种实现方式,可选的实现方式并不仅限于此。
进一步地,所述中央控制管理服务器11和所述存储服务器13还可以根据高可用系统的需求,合设在同一服务器设备中。
本实用新型实施例中的基于云计算技术的高可用系统,通过在中央控制管理服务器监控到有应用服务器发生故障之后,向云主机服务器发送第一指令信息,以使云主机服务器从存储服务器中调用与发生故障的应用服务器对应的虚拟机镜像文件,由云主机服务器运行该虚拟机镜像文件,使得发生故障的应用服务器无法正常工作时,云主机服务器可以在中央管理控制服务器的指示下,通过模拟与该应用服务器相同的运行环境,继续运行该应用服务器上的应用,而无需为各应用服务器分别配置备用服务器设备,从而有效地提高了高可用系统的资源利用率,有效地提高了高可用系统对各应用服务器进行监控管理的效率和便捷性。
进一步地,在上述实施例的基础上,所述中央控制管理服务器11还用于,在监控到所述发生故障的应用服务器14恢复正常之后,向所述云主机服务器12发送第二指令信息;
相应地,所述云主机服务器12还用于接收所述第二指令信息,并根据所述第二指令信息停止运行所述目标虚拟机镜像文件。
当中央控制管理服务器11监控到发生故障的应用服务器14恢复正常之后,向云主机服务器12发送第二指令信息,指示该云主机服务器12停止运行与发生故障的应用服务器14对应的虚拟机镜像文件。云主机服务器12在接收到第二指令信息之后,根据第二指令信息的指示,停止运行目标虚拟机镜像文件,即停止运行发生故障的应用服务器14对应的虚拟机镜像文件,释放云主机服务器12上相应的系统资源。
当有两个或多个应用服务器14恢复正常时,云主机服务器12根据第二指令信息,停止运行与该两个或多个应用服务器14分别对应的虚拟机镜像文件。
可选的实现方式为,第二指令信息中携带有恢复正常的应用服务器14的标识信息,从而云主机服务器12根据第二指令信息的指示,停止运行与标识信息对应的虚拟机镜像文件。
本实用新型实施例提供的基于云计算技术的高可用系统,通过在中央控制管理服务器监控到发生故障的应用服务器恢复正常之后,向云主机服务器发送第二指令信息,以使云主机服务器停止运行目标虚拟机镜像文件,实现云主机服务器在应用服务器故障期间模拟故障的应用服务器的运行环境运行应用,在故障的应用服务器恢复正常之后,云主机服务器的系统资源被释放出来,以供在其他应用服务器发生故障时运行相应地虚拟机镜像文件,有效地提高了高可用系统的资源利用率。
图2为本实用新型基于云计算技术的高可用系统另一实施例的系统结构示意图,如图2所示,所述中央控制管理服务器11包括监控模块111和第一收发模块112;所述云主机服务器12包括第二收发模块121和运行模块122。其中,监控模块111,用于对所述至少一个应用服务器14分别进行监控,获取监控结果,并将所述监控结果发送给第一收发模块112;所述第一收发模块112,用于接收所述监控模块111发送的所述监控结果,并在所述监控结果表明所述至少一个应用服务器14中存在发生故障的应用服务器14时,向所述云主机服务器12发送所述第一指令信息;第二收发模块121,用于接收所述第一收发模块112发送的所述第一指令信息,并根据所述第一指令信息的指示,从所述存储服务器13中调用所述目标虚拟机镜像文件,并将所述目标虚拟机镜像文件发送至运行模块122;所述运行模块122,用于接收所述第二收发模块121发送的所述目标虚拟机镜像文件,并运行所述目标虚拟机镜像文件。
中央控制管理服务器11中的监控模块111,与一个或多个应用服务器14分别连接,监控模块111对其所连接的一个或多个应用服务器14进行监控,监控模块111对应用服务器14进行监控的内容中包括监控是否有应用服务器14发生故障。监控模块111将获取到的监控结果发送给第一收发模块112。第一收发模块112所接收到的监控结果若表明一个或多个应用服务器14中有应用服务器14发生故障,则向云主机服务器12上的第二收发模块121发送第一指令信息。云主机服务器12上的第二收发模块121在接收到中央控制管理服务器11的第一收发模块112发送的第一指令信息之后,根据第一指令信息的指示,从其所连接的存储服务器13中调用与发生故障的应用服务器14对应的虚拟机镜像文件。该与发生故障的应用服务器14对应的虚拟机镜像文件,即为目标虚拟机镜像文件。第二收发模块121从存储服务器13中调用目标虚拟机镜像文件之后,将该目标虚拟机镜像文件发送至运行模块122,由运行模块122运行该目标虚拟机镜像文件。
本实用新型实施例中的基于云计算技术的高可用系统,通过中央控制管理服务器的监控模块对应用服务器进行监控,并将监控结果发送给中央控制管理服务器的第一收发模块,第一收发模块在接收到的监控结果表明有应用服务器发生故障时,向云主机服务器的第二收发模块发送第一指令信息,以使第二收发模块从存储服务器中调用与发生故障的应用服务器对应的虚拟机镜像文件,由云主机服务器的运行模块运行该虚拟机镜像文件,使得发生故障的应用服务器无法正常工作时,云主机服务器可以在中央管理控制服务器的指示下,通过模拟与该应用服务器相同的运行环境,继续运行该应用服务器上的应用,而无需为各应用服务器分别配置备用服务器设备,从而有效地提高了高可用系统的资源利用率,有效地提高了高可用系统对各应用服务器进行监控管理的效率和便捷性。
进一步地,在上述各实施例的基础上,所述第一收发模块112还用于,在所述监控结果表明所述发生故障的应用服务器14恢复正常之后,向所述云主机服务器12发送第二指令信息;相应地,所述第二收发模块121还用于,接收所述第一收发模块112发送的所述第二指令信息,并将所述第二指令信息发送给所述运行模块122;所述运行模块122还用于,根据所述第二指令信息停止运行所述目标虚拟机镜像文件。
当中央控制管理服务器11的第一收发模块112所接收到的监控结果表明发生故障的应用服务器14恢复正常之后,向云主机服务器12的第二收发模块121发送第二指令信息,第二收发模块121在接收到第二指令信息之后,将该第二指令信息发送给云主机服务器12的运行模块122,运行模块122在接收到第二指令信息之后,根据该第二指令信息停止运行目标虚拟机镜像文件,即停止运行发生故障的应用服务器14对应的虚拟机镜像文件。
当有两个或多个应用服务器14恢复正常时,运行模块122根据第二指令信息,停止运行与该两个或多个应用服务器14分别对应的虚拟机镜像文件。
本实用新型实施例提供的基于云计算技术的高可用系统,通过在监控模块监控到发生故障的应用服务器恢复正常之后,由中央控制管理服务器的第一收发模块向云主机服务器的第二收发模块发送第二指令信息,以使云主机服务器的运行模块停止运行目标虚拟机镜像文件,实现云主机服务器在应用服务器故障期间模拟故障的应用服务器的运行环境运行应用,在故障的应用服务器恢复正常之后,云主机服务器的系统资源被释放出来,以供在其他应用服务器发生故障时云主机服务器运行相应地虚拟机镜像文件,有效地提高了高可用系统的资源利用率。
进一步地,在上述各实施例的基础上,所述高可用系统中的所述云主机服务器12为多个;相应地,所述第一收发模块112还用于,在所述监控结果表明所述至少一个应用服务器14中存在发生故障的应用服务器14时,向多个云主机服务器12中满足预设条件的云主机服务器发送所述第一指令信息。
本实用新型实施例中的云主机服务器12可以为多个,即由多台云主机服务器12组成云主机服务器资源池,如图3所示。图3为本实用新型基于云计算技术的高可用系统又一实施例的系统结构示意图。本实用新型实施例高可用系统中的各设备之间通过高速网络系统,即千兆交换机,进行通信连接。当中央控制管理服务器11中的监控模块111向第一收发模块112发送的监控结果中表明,监控模块111所连接的一个或多个应用服务器14中有应用服务器14发生故障时,第一收发模块112向云主机服务器资源池中满足预设条件的云主机服务器12的第二收发模块121发送第一指令信息。
其中,预设条件可以为对云主机服务器12中空闲的系统资源的要求,也就是说,在云主机服务器资源池中,具有足够系统资源能够运行相应的虚拟机镜像文件的云主机服务器为满足预设条件的云主机服务器12。
进一步地,所述云主机服务器12的数量小于或等于所述至少一个应用服务器14的数量。例如,利用5台云主机服务器12组成的云主机服务器资源池,可以实现对20台应用服务器14的备份。
本实用新型实施例提供的基于云计算技术的高可用系统,通过在高可用系统中设置多台云主机服务器作为云主机服务器资源池,从而使得在高可用系统中的应用服务器较多时,保证一个或多个应用服务器发生故障时,有足够的系统资源保证相应的虚拟机镜像文件的运行,并且中央控制管理服务器从云主机服务器资源池中选择满足预设条件的云主机服务器以运行相应的虚拟机镜像文件,从而保证了高可用系统的高可用性,并且有效地提高了高可用系统的资源利用率。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本实用新型的技术方案,而非对其限制;尽管参照前述各实施例对本实用新型进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本实用新型各实施例技术方案的范围。

Claims (8)

1.一种基于云计算技术的高可用系统,其特征在于,包括:
中央控制管理服务器、云主机服务器、存储服务器和至少一个应用服务器;
所述中央控制管理服务器与所述至少一个应用服务器连接,用于对所述至少一个应用服务器分别进行监控,若监控到所述至少一个应用服务器中存在发生故障的应用服务器,则向所述云主机服务器发送第一指令信息;
所述云主机服务器与所述中央控制管理服务器连接,用于接收所述中央控制管理服务器发送的所述第一指令信息,并根据所述第一指令信息的指示,从所述存储服务器中调用所述目标虚拟机镜像文件,并运行所述目标虚拟机镜像文件;其中,所述目标虚拟机镜像文件为与发生故障的应用服务器对应的虚拟机镜像文件;
所述存储服务器与所述云主机服务器连接,用于存储与所述至少一个应用服务器分别对应的虚拟机镜像文件,以供所述云主机服务器调用所述虚拟机镜像文件中的所述目标虚拟机镜像文件。
2.根据权利要求1所述的基于云计算技术的高可用系统,其特征在于,所述中央控制管理服务器还用于:
在监控到所述发生故障的应用服务器恢复正常之后,向所述云主机服务器发送第二指令信息;
相应地,所述云主机服务器还用于接收所述第二指令信息,并根据所述第二指令信息停止运行所述目标虚拟机镜像文件。
3.根据权利要求1或2所述的基于云计算技术的高可用系统,其特征在于,所述中央控制管理服务器包括:
监控模块,用于对所述至少一个应用服务器分别进行监控,获取监控结果,并将所述监控结果发送给第一收发模块;
所述第一收发模块,用于接收所述监控模块发送的所述监控结果,并在所述监控结果表明所述至少一个应用服务器中存在发生故障的应用服务器时,向所述云主机服务器发送所述第一指令信息;
相应地,所述云主机服务器包括:
第二收发模块,用于接收所述第一收发模块发送的所述第一指令信息,并根据所述第一指令信息的指示,从所述存储服务器中调用所述目标虚拟机镜像文件,并将所述目标虚拟机镜像文件发送至运行模块;
所述运行模块,用于接收所述第二收发模块发送的所述目标虚拟机镜像文件,并运行所述目标虚拟机镜像文件。
4.根据权利要求3所述的基于云计算技术的高可用系统,其特征在于,所述第一收发模块还用于:
在所述监控结果表明所述发生故障的应用服务器恢复正常之后,向所述云主机服务器发送第二指令信息;
相应地,所述第二收发模块还用于,接收所述第一收发模块发送的所述第二指令信息,并将所述第二指令信息发送给所述运行模块;
所述运行模块还用于,根据所述第二指令信息停止运行所述目标虚拟机镜像文件。
5.根据权利要求3所述的基于云计算技术的高可用系统,其特征在于,所述高可用系统中的所述云主机服务器为多个;
相应地,所述第一收发模块还用于,在所述监控结果表明所述至少一个应用服务器中存在发生故障的应用服务器时,向多个云主机服务器中满足预设条件的云主机服务器发送所述第一指令信息。
6.根据权利要求5所述的基于云计算技术的高可用系统,其特征在于,所述云主机服务器的数量小于或等于所述至少一个应用服务器的数量。
7.根据权利要求1所述的基于云计算技术的高可用系统,其特征在于,所述中央控制管理服务器和所述存储服务器合设在同一服务器设备中。
8.根据权利要求1所述的基于云计算技术的高可用系统,其特征在于,所述应用服务器为数据库服务器。
CN2012203465030U 2012-07-17 2012-07-17 基于云计算技术的高可用系统 Expired - Lifetime CN202798798U (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN2012203465030U CN202798798U (zh) 2012-07-17 2012-07-17 基于云计算技术的高可用系统
US13/677,103 US9141491B2 (en) 2012-07-17 2012-11-14 Highly available server system based on cloud computing

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012203465030U CN202798798U (zh) 2012-07-17 2012-07-17 基于云计算技术的高可用系统

Publications (1)

Publication Number Publication Date
CN202798798U true CN202798798U (zh) 2013-03-13

Family

ID=47825967

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012203465030U Expired - Lifetime CN202798798U (zh) 2012-07-17 2012-07-17 基于云计算技术的高可用系统

Country Status (2)

Country Link
US (1) US9141491B2 (zh)
CN (1) CN202798798U (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104702422A (zh) * 2013-12-04 2015-06-10 北京信威通信技术股份有限公司 实现通信设备高可用性的方法、装置和系统
CN109547290A (zh) * 2018-12-05 2019-03-29 平安科技(深圳)有限公司 云平台垃圾数据检测处理方法、装置、设备及存储介质
CN110196722A (zh) * 2019-05-07 2019-09-03 平安科技(深圳)有限公司 云主机批量管理方法、系统、设备及存储介质
CN110333974A (zh) * 2019-06-03 2019-10-15 腾讯科技(深圳)有限公司 一种云存储服务的切换方法和设备
CN112560026A (zh) * 2020-12-15 2021-03-26 国网四川省电力公司信息通信公司 一种信息系统告警智能跟踪分析自愈的实现方法

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8769048B2 (en) 2008-06-18 2014-07-01 Commvault Systems, Inc. Data protection scheduling, such as providing a flexible backup window in a data protection system
US8352954B2 (en) 2008-06-19 2013-01-08 Commvault Systems, Inc. Data storage resource allocation by employing dynamic methods and blacklisting resource request pools
US9128883B2 (en) 2008-06-19 2015-09-08 Commvault Systems, Inc Data storage resource allocation by performing abbreviated resource checks based on relative chances of failure of the data storage resources to determine whether data storage requests would fail
US8725688B2 (en) 2008-09-05 2014-05-13 Commvault Systems, Inc. Image level copy or restore, such as image level restore without knowledge of data object metadata
US9633216B2 (en) 2012-12-27 2017-04-25 Commvault Systems, Inc. Application of information management policies based on operation with a geographic entity
US9459968B2 (en) 2013-03-11 2016-10-04 Commvault Systems, Inc. Single index to query multiple backup formats
US9798596B2 (en) 2014-02-27 2017-10-24 Commvault Systems, Inc. Automatic alert escalation for an information management system
US9648100B2 (en) 2014-03-05 2017-05-09 Commvault Systems, Inc. Cross-system storage management for transferring data across autonomous information management systems
US9740574B2 (en) 2014-05-09 2017-08-22 Commvault Systems, Inc. Load balancing across multiple data paths
US9852026B2 (en) 2014-08-06 2017-12-26 Commvault Systems, Inc. Efficient application recovery in an information management system based on a pseudo-storage-device driver
US11249858B2 (en) 2014-08-06 2022-02-15 Commvault Systems, Inc. Point-in-time backups of a production application made accessible over fibre channel and/or ISCSI as data sources to a remote application by representing the backups as pseudo-disks operating apart from the production application and its host
CN104184837A (zh) * 2014-09-15 2014-12-03 北京尖峰合讯科技有限公司 高可用云计算一体机
US9444811B2 (en) 2014-10-21 2016-09-13 Commvault Systems, Inc. Using an enhanced data agent to restore backed up data across autonomous storage management systems
CN104391735B (zh) * 2014-11-14 2018-11-06 深信服网络科技(深圳)有限公司 虚拟化一体机集群中虚拟机调度方法及系统
KR101679149B1 (ko) * 2014-12-17 2016-11-24 경희대학교 산학협력단 이동 단말기를 통해 관리가 가능한 클라우드 컴퓨팅 시스템
US9766825B2 (en) 2015-07-22 2017-09-19 Commvault Systems, Inc. Browse and restore for block-level backups
US10296368B2 (en) 2016-03-09 2019-05-21 Commvault Systems, Inc. Hypervisor-independent block-level live browse for access to backed up virtual machine (VM) data and hypervisor-free file-level recovery (block-level pseudo-mount)
US10838821B2 (en) 2017-02-08 2020-11-17 Commvault Systems, Inc. Migrating content and metadata from a backup system
CN108446102A (zh) * 2017-02-15 2018-08-24 中国石油化工股份有限公司 一种开发部署应用程序的一体化系统及方法
US10740193B2 (en) 2017-02-27 2020-08-11 Commvault Systems, Inc. Hypervisor-independent reference copies of virtual machine payload data based on block-level pseudo-mount
US10891069B2 (en) 2017-03-27 2021-01-12 Commvault Systems, Inc. Creating local copies of data stored in online data repositories
US10776329B2 (en) 2017-03-28 2020-09-15 Commvault Systems, Inc. Migration of a database management system to cloud storage
US11074140B2 (en) 2017-03-29 2021-07-27 Commvault Systems, Inc. Live browsing of granular mailbox data
US10664352B2 (en) 2017-06-14 2020-05-26 Commvault Systems, Inc. Live browsing of backed up data residing on cloned disks
US10795927B2 (en) 2018-02-05 2020-10-06 Commvault Systems, Inc. On-demand metadata extraction of clinical image data
US10761942B2 (en) 2018-03-12 2020-09-01 Commvault Systems, Inc. Recovery point objective (RPO) driven backup scheduling in a data storage management system using an enhanced data agent
US10789387B2 (en) 2018-03-13 2020-09-29 Commvault Systems, Inc. Graphical representation of an information management system
US10860443B2 (en) 2018-12-10 2020-12-08 Commvault Systems, Inc. Evaluation and reporting of recovery readiness in a data storage management system
US11308034B2 (en) 2019-06-27 2022-04-19 Commvault Systems, Inc. Continuously run log backup with minimal configuration and resource usage from the source machine
US11086649B2 (en) * 2019-07-17 2021-08-10 Red Hat, Inc. Minimizing downtime of highly available virtual machines
CN111143170A (zh) * 2019-12-31 2020-05-12 北京云派网络科技有限公司 云手机监控系统和方法
CN113407403B (zh) * 2020-03-16 2023-04-25 顺丰科技有限公司 一种云主机管理方法、装置、计算机设备及存储介质
CN111698116B (zh) * 2020-04-01 2022-10-21 新华三技术有限公司 一种资源释放方法、装置、设备及机器可读存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009108943A2 (en) * 2008-02-29 2009-09-03 Doyenz Incorporated Automation for virtualized it environments
US8606897B2 (en) * 2010-05-28 2013-12-10 Red Hat, Inc. Systems and methods for exporting usage history data as input to a management platform of a target cloud-based network
US8739157B2 (en) * 2010-08-26 2014-05-27 Adobe Systems Incorporated System and method for managing cloud deployment configuration of an application
US9020996B2 (en) * 2011-06-24 2015-04-28 Stephen P. LORD Synthetic view
US20120041889A1 (en) * 2011-10-28 2012-02-16 Match Link Partners LLC Systems and methods for matching and linking employees with employers of application-based positions

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104702422A (zh) * 2013-12-04 2015-06-10 北京信威通信技术股份有限公司 实现通信设备高可用性的方法、装置和系统
CN109547290A (zh) * 2018-12-05 2019-03-29 平安科技(深圳)有限公司 云平台垃圾数据检测处理方法、装置、设备及存储介质
CN110196722A (zh) * 2019-05-07 2019-09-03 平安科技(深圳)有限公司 云主机批量管理方法、系统、设备及存储介质
CN110196722B (zh) * 2019-05-07 2023-11-28 平安科技(深圳)有限公司 云主机批量管理方法、系统、设备及存储介质
CN110333974A (zh) * 2019-06-03 2019-10-15 腾讯科技(深圳)有限公司 一种云存储服务的切换方法和设备
CN110333974B (zh) * 2019-06-03 2022-04-15 腾讯科技(深圳)有限公司 一种云存储服务的切换方法和设备
CN112560026A (zh) * 2020-12-15 2021-03-26 国网四川省电力公司信息通信公司 一种信息系统告警智能跟踪分析自愈的实现方法

Also Published As

Publication number Publication date
US9141491B2 (en) 2015-09-22
US20140026000A1 (en) 2014-01-23

Similar Documents

Publication Publication Date Title
CN202798798U (zh) 基于云计算技术的高可用系统
CN102981931B (zh) 虚拟机备份方法及装置
US8626936B2 (en) Protocol independent server replacement and replication in a storage area network
CN103345470B (zh) 一种数据库容灾方法、系统及服务器
CN102346779B (zh) 分布式文件系统和主控节点的备份方法
CN110807064B (zh) Rac分布式数据库集群系统中的数据恢复装置
CN106357787A (zh) 一种存储容灾控制系统
US8032786B2 (en) Information-processing equipment and system therefor with switching control for switchover operation
CN104468521A (zh) 在线迁移方法、装置和系统
CN106919473B (zh) 一种数据灾备系统及业务处理方法
CN105302661A (zh) 一种实现虚拟化管理平台高可用的系统和方法
CN103019889A (zh) 分布式文件系统及其故障处理方法
CN107329859B (zh) 一种数据保护方法及存储设备
CN102739451B (zh) 一种主备切换条件更新方法、装置、服务器及系统
CN102739453A (zh) 主备切换方法、设备及系统
CN106874142B (zh) 一种实时数据容错处理方法及系统
CN103297502B (zh) 一种负载均衡系统及方法
CN102752093A (zh) 基于分布式文件系统的数据处理方法、设备和系统
CN102035683A (zh) 一种主备板倒换的控制方法和系统
CN104424052A (zh) 一种自动冗余的分布式存储系统及方法
CN102708027A (zh) 一种避免通信设备运行中断的方法及系统
CN110979404A (zh) 列车自动监督系统的双机热备系统及方法
CN102571311B (zh) 主备切换的通讯系统和通讯方法
CN113961397A (zh) 一种基于备份容灾系统的高可用集群容灾方法
CN105159846A (zh) 一种支持虚拟化磁盘双控切换的方法和存储系统

Legal Events

Date Code Title Description
C14 Grant of patent or utility model
GR01 Patent grant
CB03 Change of inventor or designer information

Inventor after: Ma Yong

Inventor after: Zhang Xiaosong

Inventor after: Fu Pingping

Inventor after: Li Fan

Inventor after: Liang Liang

Inventor after: Hao Hanyong

Inventor after: Yu Pengfei

Inventor after: Li Wenjun

Inventor before: Ma Yong

Inventor before: Fu Pingping

Inventor before: Li Fan

Inventor before: Liang Liang

Inventor before: Yu Pengfei

Inventor before: Li Wenjun

COR Change of bibliographic data
CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20130313