CN106612314A - 基于虚拟机实现软件定义存储的系统 - Google Patents

基于虚拟机实现软件定义存储的系统 Download PDF

Info

Publication number
CN106612314A
CN106612314A CN201510703883.7A CN201510703883A CN106612314A CN 106612314 A CN106612314 A CN 106612314A CN 201510703883 A CN201510703883 A CN 201510703883A CN 106612314 A CN106612314 A CN 106612314A
Authority
CN
China
Prior art keywords
storage
node
virtual machine
host
host node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510703883.7A
Other languages
English (en)
Inventor
王铁磊
伍治平
徐培杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Baosight Software Co Ltd
Original Assignee
Shanghai Baosight Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Baosight Software Co Ltd filed Critical Shanghai Baosight Software Co Ltd
Priority to CN201510703883.7A priority Critical patent/CN106612314A/zh
Publication of CN106612314A publication Critical patent/CN106612314A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于虚拟机实现软件定义存储的系统,包括两个存储系统,这两个存储系统通过局域网形成互为主备的集群;所述存储系统包括:嵌入式系统、x86虚拟机、x86主机;嵌入式系统安装在x86虚拟机中,x86虚拟机使用所在的x86主机的硬盘提供存储服务,嵌入式系统管理存储。本发明通过整合通用软、硬件技术,从而提出一套存储解决方案,同时拥有商用存储解决方案的主要特性,最终使其能够承担在云环境下的存储服务。本发明可以依托开源免费软件,以及通用的x86硬件平台,组建出高效的软件定义存储环境,可以有效提高x86主机计算资源的使用率。

Description

基于虚拟机实现软件定义存储的系统
技术领域
本发明涉及存储服务领域,具体地,涉及基于虚拟机实现软件定义存储的系统,尤其是在云环境下提供存储服务的技术方案。
背景技术
在现有的云环境的存储解决方案中,已经有各种各样的软件定义存储的商用方案,但这些方案都有一个共同点,那就是都属于使用专用设备构建的相对封闭的解决方案。这导致现有技术存在着如下不足之处:
1、依赖厂商。一旦采用了某一厂商的存储解决方案,那么今后此方案的扩容,改进都需要厂商的支持。
2、成本过高。由于采用专用设备,所以设备本身的研发及制造成本就会比较高,再加上与厂商的绑定,整体采购及运营成本居高不下。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种基于虚拟机实现软件定义存储的系统。
根据本发明提供的一种基于虚拟机实现软件定义存储的系统,包括两个存储系统,这两个存储系统通过局域网形成互为主备的集群;
所述存储系统包括:嵌入式系统、x86虚拟机、x86主机;嵌入式系统安装在x86虚拟机中,x86虚拟机使用所在的x86主机的硬盘提供存储服务,嵌入式系统管理存储。
优选地,这两个存储系统的嵌入式系统分别使用各自所在的x86主机的硬盘,并通过HAST协议实现存储高可用;这两个存储系统中的一个存储系统作为主节点,主设备中的嵌入式系统在高可用存储资源上创建并管理文件系统,并实现文件系统的共享,再通过CARP协议实现存储共享访问高可用;用户通过网络访问存储服务的访问地址为:CARP协议配置的虚拟IP地址。
优选地,这两个存储系统分别作为主节点、备节点;主节点、备节点的配置均通过节点上的管理网IP访问节点控制台完成。
优选地,当节点重启或关机时,直接关闭该节点上的CARP服务;
主节点正常运行时,每个请求,都同步地在备节点内存中建立操作镜像;即,主节点所有没有写入磁盘的数据信息以及共享服务程序的上下文信息,都在备节点上有基于内存的备份;
当发生主节点故障时,备节点内存的备份直接接管主节点中的相关内存信息。
与现有技术相比,本发明具有如下的有益效果:
本发明通过整合通用软、硬件技术,从而提出一套存储解决方案,同时拥有商用存储解决方案的主要特性,最终使其能够承担在云环境下的存储服务。本发明可以依托开源免费软件,以及通用的x86硬件平台,组建出高效的软件定义存储环境,可以有效提高x86主机计算资源的使用率。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为基于x86虚拟机的软件定义存储高可用增强补丁包示意图。
图2为基于x86虚拟机的软件定义存储逻辑结构示意图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
具体地,根据本发明提供的一种基于虚拟机实现软件定义存储的系统,包括两个存储系统,这两个存储系统通过局域网形成互为主备的集群;所述存储系统包括:嵌入式系统、x86虚拟机、x86主机;嵌入式系统安装在x86虚拟机中,x86虚拟机使用所在的x86主机的硬盘提供存储服务,嵌入式系统管理存储。
这两个存储系统的嵌入式系统分别使用各自所在的x86主机的硬盘,并通过HAST协议实现存储高可用;这两个存储系统中的一个存储系统作为主节点,主设备中的嵌入式系统在高可用存储资源上创建并管理文件系统,并实现文件系统的共享,再通过CARP协议实现存储共享访问高可用;用户通过网络访问存储服务的访问地址为:CARP协议配置的虚拟IP地址。
这两个存储系统分别作为主节点、备节点;主节点、备节点的配置均通过节点上的管理网IP访问节点控制台完成。当节点重启或关机时,直接关闭该节点上的CARP服务;主节点正常运行时,每个请求,都同步地在备节点内存中建立操作镜像;即,主节点所有没有写入磁盘的数据信息以及共享服务程序的上下文信息,都在备节点上有基于内存的备份;当发生主节点故障时,备节点内存的备份直接接管主节点中的相关内存信息。
更为具体地,本发明基于通用操作系统进行定制化,从而产出一个专用、精简、稳定的专门用于管理存储的嵌入式系统。将这个通用的嵌入式系统安装到通用的x86虚拟机中。x86虚拟机直接使用所在x86主机中的硬盘,用于提供存储服务。建立两个这样的系统,通过局域网形成互为主备的高可用集群。
其中,x86虚拟机是x86主机通过安装通用的虚拟化软件得到的,从而能在x86主机之上虚拟出x86虚拟主机。x86虚拟主机可以直接使用其所在x86主机中安装的存储设备。
使用NAS4Free作为管理存储的嵌入式系统,ESXi和vCenter作为x86主机的虚拟化及管理软件。其中,NAS4Free是基于FreeBSD平台定制的开源嵌入式的管理存储的专用系统。vCenter和ESXi是商用的主机虚拟化软件,也可以使用其它主机虚拟化软件代替,如XenServer。
以主节点为例(图2的M标识的节点),在x86虚拟机(图2的x86VM)中的NAS4Free系统(图2的M-NAS4Free)安装在宿主主机(图2的M-x86Server)的本地硬盘(图2的M-disk0,使用方法为used)上。安装完毕后,首先在主、备节点(图2的S标识的节点为备节点)的NAS4Free直接使用其宿主主机的硬盘(主节点为图2的M-disk1和M-disk2,备节点为图2的S-disk1和S-disk2,使用方法为passthrough),并且通过HAST协议实现存储高可用(图2的HAST-disk1和HAST-disk2)。然后主节点上的NAS4Free(图2的M-NAS4Free)在高可用存储资源上使用ZFS创建并管理文件系统,并通过NFS/CIFS/iSCSI实现文件系统的共享。最后NAS4Free再通过CARP协议实现存储共享访问高可用。用户通过网络访问存储服务,访问地址为:CARP协议配置的虚拟IP地址(图2的192.168.1.203)
另外,主、备节点的配置均通过节点上的管理网IP访问节点控制台完成。主节点为192.168.1.201,备节点为192.168.1.202。
其中,HAST是FreeBSD中提供的通用的高可用存储协议,CARP是FreeBSD中提供的通用的网络地址高可用协议。ZFS是一个开源的文件管理系统,可以实现RAID功能,同时可以实现存储资源的虚拟化管理。并对存储数据具有压缩,除重等高级功能。由于两个节点用于存储数据的硬盘通过HAST协议进行了高可用配置,所以通过主节点的一切数据操作都会实时的同步到备节点的存储上。NFS/CIFS/iSCSI是通过网络提供存储的协议。
用于提供存储服务的机柜的硬件配置,将和用于提供计算服务的机柜一样,只需要通用的x86服务器以及连接服务器的交换机。由于主机的计算资源提供给了NAS4Free所在的虚拟机,根据现有的计算密度,根本用不完。所以还可以在这些计算资源上继续创建其它虚拟机,用于其它的用途。
进一步地,软件定义存储的方法在实际使用中,存在以下三个主要问题:
第一:当主节点正常重启或关机时,会出现挂死现象,并且挂死过程中,主节点还是主节点,不能自动正常切换;
第二:主节点异常重启或宕机后,备节点能立即切换成主节点,但这时主节点上的NFS文件共享服务会挂死,正在进行中的读写操作会中断,新的读写操作请求也没有响应;
第三:当NFS文件共享服务不挂死时,也会了出现正在进行中的读写操作会被强制中断。
以上三个问题都会导致这个方案无法提供完整的高可用存储服务。因此,通过一个自主开发的高可用增强补丁包来解决这些问题。补丁包解决问题的思路如下:当节点重启或关机时,直接关闭该节点上的CARP服务(经测试,是CARP服务导致第一个问题的)。主节点正常运行时,每个请求,都同步的在备节点内存中建立操作镜像。即主节点所有没有写入磁盘的数据信息(如图1中的“读写序列数据”)以及共享服务程序的上下文信息(如图1中的“共享协议进程数据”,支持NFS/CIFS/iSCSI。),都在备节点上有基于内存的备份。当发生主节点故障时,备节点内存的备份会直接接管主节点中的相关内存信息,这时就能解决第二个与第三个问题。
在本发明的一个优选的具体实施方式中,按照上述方案部署完成后,正常情况下,存储服务通过CARP配置的虚拟IP地址对外服务,服务协议支持NFS/CIFS/iSCSI。并且服务的所有负载都落到主节点上,备节点只做数据的实时同步。当主节点出现故障时,CARP首先会自动调用脚本,使备节点上的存储变成主存储,从而使备节点变成主节,接着让存储服务的负载导向新的主节点并对外提供服务。这时,原来的主节点可以完全离线进行维修。等其维修好后,可以作为备节点加入集群,从新的主节点处实时同步数据。为下次主节点故障做好高可用准备。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。

Claims (4)

1.一种基于虚拟机实现软件定义存储的系统,其特征在于,包括两个存储系统,这两个存储系统通过局域网形成互为主备的集群;
所述存储系统包括:嵌入式系统、x86虚拟机、x86主机;嵌入式系统安装在x86虚拟机中,x86虚拟机使用所在的x86主机的硬盘提供存储服务,嵌入式系统管理存储。
2.根据权利要求1所述的基于虚拟机实现软件定义存储的系统,其特征在于,这两个存储系统的嵌入式系统分别使用各自所在的x86主机的硬盘,并通过HAST协议实现存储高可用;这两个存储系统中的一个存储系统作为主节点,主设备中的嵌入式系统在高可用存储资源上创建并管理文件系统,并实现文件系统的共享,再通过CARP协议实现存储共享访问高可用;用户通过网络访问存储服务的访问地址为:CARP协议配置的虚拟IP地址。
3.根据权利要求1所述的基于虚拟机实现软件定义存储的系统,其特征在于,这两个存储系统分别作为主节点、备节点;主节点、备节点的配置均通过节点上的管理网IP访问节点控制台完成。
4.根据权利要求1所述的基于虚拟机实现软件定义存储的系统,其特征在于,
当节点重启或关机时,直接关闭该节点上的CARP服务;
主节点正常运行时,每个请求,都同步地在备节点内存中建立操作镜像;即,主节点所有没有写入磁盘的数据信息以及共享服务程序的上下文信息,都在备节点上有基于内存的备份;
当发生主节点故障时,备节点内存的备份直接接管主节点中的相关内存信息。
CN201510703883.7A 2015-10-26 2015-10-26 基于虚拟机实现软件定义存储的系统 Pending CN106612314A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510703883.7A CN106612314A (zh) 2015-10-26 2015-10-26 基于虚拟机实现软件定义存储的系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510703883.7A CN106612314A (zh) 2015-10-26 2015-10-26 基于虚拟机实现软件定义存储的系统

Publications (1)

Publication Number Publication Date
CN106612314A true CN106612314A (zh) 2017-05-03

Family

ID=58614001

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510703883.7A Pending CN106612314A (zh) 2015-10-26 2015-10-26 基于虚拟机实现软件定义存储的系统

Country Status (1)

Country Link
CN (1) CN106612314A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107220104A (zh) * 2017-05-27 2017-09-29 郑州云海信息技术有限公司 一种虚拟机备灾方法和装置
CN107329856A (zh) * 2017-06-30 2017-11-07 郑州云海信息技术有限公司 一种基于raid的sds部署方法及系统
CN110427247A (zh) * 2019-07-05 2019-11-08 苏州浪潮智能科技有限公司 一种虚拟化系统和虚拟化系统中sds节点磁盘使用的方法
CN110908723A (zh) * 2019-11-29 2020-03-24 新华三大数据技术有限公司 操作系统的主备切换方法、装置及相关设备
CN113687867A (zh) * 2021-08-24 2021-11-23 济南浪潮数据技术有限公司 一种云平台集群的关机方法、系统、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102355369A (zh) * 2011-09-27 2012-02-15 华为技术有限公司 虚拟化集群系统及其处理方法和设备
CN104219298A (zh) * 2014-08-27 2014-12-17 深圳市深信服电子科技有限公司 集群系统及其数据备份的方法
CN104301430A (zh) * 2014-10-29 2015-01-21 北京麓柏科技有限公司 软件定义存储系统、方法及其集中控制设备
US20150186256A1 (en) * 2013-12-27 2015-07-02 Emc Corporation Providing virtual storage pools for target applications

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102355369A (zh) * 2011-09-27 2012-02-15 华为技术有限公司 虚拟化集群系统及其处理方法和设备
US20150186256A1 (en) * 2013-12-27 2015-07-02 Emc Corporation Providing virtual storage pools for target applications
CN104219298A (zh) * 2014-08-27 2014-12-17 深圳市深信服电子科技有限公司 集群系统及其数据备份的方法
CN104301430A (zh) * 2014-10-29 2015-01-21 北京麓柏科技有限公司 软件定义存储系统、方法及其集中控制设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
徐宁宁: "云平台中软件定义存储资源", 《通讯世界》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107220104A (zh) * 2017-05-27 2017-09-29 郑州云海信息技术有限公司 一种虚拟机备灾方法和装置
CN107329856A (zh) * 2017-06-30 2017-11-07 郑州云海信息技术有限公司 一种基于raid的sds部署方法及系统
CN110427247A (zh) * 2019-07-05 2019-11-08 苏州浪潮智能科技有限公司 一种虚拟化系统和虚拟化系统中sds节点磁盘使用的方法
CN110908723A (zh) * 2019-11-29 2020-03-24 新华三大数据技术有限公司 操作系统的主备切换方法、装置及相关设备
CN113687867A (zh) * 2021-08-24 2021-11-23 济南浪潮数据技术有限公司 一种云平台集群的关机方法、系统、设备及存储介质
CN113687867B (zh) * 2021-08-24 2023-12-29 济南浪潮数据技术有限公司 一种云平台集群的关机方法、系统、设备及存储介质

Similar Documents

Publication Publication Date Title
US10169173B2 (en) Preserving management services with distributed metadata through the disaster recovery life cycle
US9753761B1 (en) Distributed dynamic federation between multi-connected virtual platform clusters
US9575894B1 (en) Application aware cache coherency
US8996477B2 (en) Multiple node/virtual input/output (I/O) server (VIOS) failure recovery in clustered partition mobility
CN102110071B (zh) 一种虚拟机集群系统及其实现方法
CN106528327B (zh) 一种数据处理方法以及备份服务器
US8667490B1 (en) Active/active storage and virtual machine mobility over asynchronous distances
US8533164B2 (en) Method and tool to overcome VIOS configuration validation and restoration failure due to DRC name mismatch
US11789638B2 (en) Continuing replication during storage system transportation
CN106850260A (zh) 一种虚拟化资源管理平台的部署方法和装置
US20230308507A1 (en) Commissioning and decommissioning metadata nodes in a running distributed data storage system
US11836513B2 (en) Transitioning volumes between storage virtual machines
CN106612314A (zh) 基于虚拟机实现软件定义存储的系统
KR102016095B1 (ko) 트랜잭셔널 미들웨어 머신 환경에서 트랜잭션 레코드들을 유지하기 위한 시스템 및 방법
CN110912991A (zh) 一种基于超融合双节点高可用的实现方法
US20120151095A1 (en) Enforcing logical unit (lu) persistent reservations upon a shared virtual storage device
US9563478B1 (en) Scalable concurrent execution of distributed workflows sharing common operations
CN103763383A (zh) 一体化云存储系统及其存储方法
US20230418716A1 (en) Anti-entropy-based metadata recovery in a strongly consistent distributed data storage system
CN112256477A (zh) 一种虚拟化容错方法及设备
CN111935244A (zh) 一种业务请求处理系统及超融合一体机
US20220398163A1 (en) High frequency snapshot technique for improving data replication in disaster recovery environment
CN117632374A (zh) 容器镜像的读取方法、介质、装置和计算设备
US10684985B2 (en) Converting storage objects between formats in a copy-free transition
US10747635B1 (en) Establishing quorums on an object-by-object basis within a management system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170503