CN105978987B - 一种针对Exadata存储节点的虚拟化方法 - Google Patents

一种针对Exadata存储节点的虚拟化方法 Download PDF

Info

Publication number
CN105978987B
CN105978987B CN201610428894.3A CN201610428894A CN105978987B CN 105978987 B CN105978987 B CN 105978987B CN 201610428894 A CN201610428894 A CN 201610428894A CN 105978987 B CN105978987 B CN 105978987B
Authority
CN
China
Prior art keywords
exadata
memory space
disk
memory
virtual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610428894.3A
Other languages
English (en)
Other versions
CN105978987A (zh
Inventor
游录金
彭俊杰
焦圣品
叶磊
尹雪蓉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI DRAGONNET TECHNOLOGY CO LTD
Original Assignee
SHANGHAI DRAGONNET TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI DRAGONNET TECHNOLOGY CO LTD filed Critical SHANGHAI DRAGONNET TECHNOLOGY CO LTD
Priority to CN201610428894.3A priority Critical patent/CN105978987B/zh
Publication of CN105978987A publication Critical patent/CN105978987A/zh
Application granted granted Critical
Publication of CN105978987B publication Critical patent/CN105978987B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0662Virtualisation aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种针对Exadata存储节点的虚拟化方法,该方法可以实现对Exadata存储空间的充分利用,该方法包括下列步骤:根据使用需求,保留部分Exadata存储节点上的磁盘,按照Exadata的管理方式交给Exadata Oracle数据库使用;将剩余磁盘通过数据交换设备交由存储空间虚拟设备管理;存储空间虚拟设备判断Exadata是否需要更多空间,若是则释放占用的剩余磁盘,若否则继续判断直至Exadata需要更多空间。与现有技术相比,本发明具有存储空间利用充分、使用灵活以及充分发挥数据库一体机的技术优势等优点。

Description

一种针对Exadata存储节点的虚拟化方法
技术领域
本发明涉及存储技术,尤其是涉及一种针对Exadata存储节点的虚拟化方法。
背景技术
随着数据库技术的进步发展,很多公司都推出了一体机的产品,这些产品突出的特性是将软硬件结合在一起,提供很好的数据库性能。而各个技术的核心思路,很大一部分都在解决存储性能的瓶颈上。以Oracle推出的Exadata数据库一体机为例,如图1所示,包括计算密集型处理数据库服务池1和数据密集型处理智能存储池2,两者之间通过InfiniBand实现高速互联的数据交换,该技术是建立在X86架构Pcserver、X86存储、高速Flash、高速infiniband技术上的一体化数据库技术。
这种技术最让人感到有特色的地方在于存储性能的飞跃提升,通过InfiniBand交换机40Gb/s的交换能力,大幅提升了存储系统网络吞吐能力,而且通过大规模并发访问的方式能让数据传输的带宽达到TB/s的级别,而通过在传统硬盘基础上增加高性能FlashSSD,结合优化热点数据调度策略,就能够让每个存储节点的IOPS达到10万以上、吞吐量也能达到5GB/s。更有价值的是数据访问特性实现基于开放的标准PC服务器,在标准硬件和SSD模块等模块基础上,通过软硬件集成创新带来了卓越的性价比以及管理开放性。
虽然Exadata一体机通过开放的X86平台组建了优越的存储性能,但是,这样的存储在现有架构下只能应用于Oracle数据库自身,由Oracle的ASM进行数据的管理,对于数据库而言,ASM能看到的只有GRIDDISK。因此,即使在Exadata一体机的存储空间和存储性能对现有业务来说非常富余的情况下,如空间剩余8TB、IOPS不足系统整体性能50%时,其他的业务应用是没有办法利用Exadata富余的数据空间,从而造成空间富裕的浪费。
发明内容
本发明的目的是针对上述问题提供一种存储空间利用充分、使用灵活以及充分发挥数据库一体机的技术优势的针对Exadata存储节点的虚拟化方法。
本发明的目的可以通过以下技术方案来实现:
一种针对Exadata存储节点的虚拟化方法,该方法可以实现对Exadata存储空间的充分利用,该方法包括下列步骤:
1)根据使用需求,保留部分Exadata存储节点上的磁盘,按照Exadata的管理方式交给Exadata Oracle数据库使用;
2)将步骤1)中的剩余磁盘通过数据交换设备交由存储空间虚拟设备管理;
3)存储空间虚拟设备判断Exadata是否需要更多空间,若是则进入步骤4),若否则继续判断;
4)存储空间虚拟设备释放占用的剩余磁盘,将其交还给Exadata Oracle数据库使用。
所述步骤2)中将剩余磁盘通过数据交换设备交由存储空间虚拟设备管理具体为:
21)存储空间虚拟设备将剩余磁盘合并为一个磁盘池作为存储空间;
22)存储空间虚拟设备对步骤21)中的存储空间,进行数据的条带化冗余分布;
23)部分业务主机通过NFS协议访问存储空间内的数据;
24)其他业务主机通过ISCSI协议调用存储空间。
所述进行数据的条带化冗余分布为以一定数量为一组对存储空间内的磁盘进行分片,同时将每一个数据写在2个以上的磁盘之中。
所述一定数量包括4、8或16。
所述业务主机包括Linux主机或UNIX主机。
所述步骤4)中存储空间虚拟设备释放占用的剩余磁盘具体为:
41)存储空间虚拟设备发送释放命令至业务主机;
42)业务主机判断当前使用的为哪种协议,若为NFS协议则进入步骤43),若为ISICI协议则进入步骤44);
43)业务主机断开和存储空间的连接;
44)业务主机直接释放调用的存储空间。
所述Exadata的管理方式包括Disk、Lun、Cell Disk、Grid Disk或ASM disk。
所述存储空间虚拟设备的部署地点包括Exadata服务器节点、存储节点或加入InfiniBand网络环境的主机上。
所述数据交换设备为InfiniBand交换机。
与现有技术相比,本发明具有以下有益效果:
(1)对Exadata存储节点内的富裕空间二次应用,充分利用了Exadata内的存储空间,避免了浪费;
(2)将Exadata存储节点的空间映射为传统磁盘模式以供其他业务使用,解除了Exadata对该空间的锁定,可以更加精确细致的使用Exadata的存储空间;
(3)在Exadata本身有空间或性能需求时可以将占用的空间释放回归,保证了Exadata一体机的性能,更加灵活地对Exadata内的空间进行了使用;
(4)利用存储空间虚拟化设备对存储空间进行虚拟化映射,该存储空间虚拟化设备可以部署在Exadata服务器节点、存储节点以及加入InfiniBand网络环境的其他主机上,使用灵活而且广泛。
附图说明
图1为Exadata数据库一体机部署示意图;
图2为Exadata数据访问模式;
图3为应用服务器对Oracle一体机存储使用示意图;
图4为虚拟存储设备的工作原理示意图;
其中,1为计算密集型处理数据库服务池,2为数据密集型处理智能存储池,3为ASM工具,4为数据库文件,5为集群软件文件,6为Exadata存储服务器,7为磁盘组,8为计算节点,9为应用服务器,10为存储节点,11为InfiniBand交换机,12为ISCSI协议主机,13为NFS协议主机。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
如图2所示,Exadata传统的数据访问模式为:所有存储节点的数据都由应用主机的ASM工具3控制,数据的读写由ASM进行整体管理。这样虽然Exadata一体机存储节点有非常高的性能,但是必须锁定到Oracle公司业务中。Exadata一体机的存储在现有架构下只能应用于Oracle数据库自身,由Oracle的ASM进行数据的管理,对于数据库而言,ASM能看到的只有GRIDDISK。所有存储节点的数据都由应用主机的ASM工具控制,数据的读写由ASM进行整体管理。这样虽然Exadata一体机存储节点有非常高的性能,但是必须锁定到Oracle公司业务中。
为了让更多的应用利用到Exadata一体机存储节点,本发明将其中一部分富余的存储节点的空间划分出来,不通过ASM工具,而由存储虚拟化工具进行管理。如图3所示,将多个存储节点10上的磁盘,保留一部分使用Exadata原有的协议和管理方式,分为Disk、Lun、Cell Disk、Grid Disk和ASM disk的管理模式交付给Exadata Oracle数据库试用。而另外一部分盘将通过SRP协议,通过InfiniBand交换机11交由带有存储虚拟化管理工具的应用服务器9进行管理,进行数据的分配和可靠性管理。这样,我们将能够充分使用Exadata的空间,而且在Exadata需要空间的时候,可以释放占用的磁盘,将空间交由存储节点从新加入ASM环境,对生产系统没有影响。
基于上述描述,本实施例提供一种针对Exadata存储节点的虚拟化方法,实现对Exadata存储空间的充分利用,如图4所示,该方法包括下列步骤:
1)根据使用需求,保留部分Exadata存储节点上的磁盘,按照Exadata的管理方式交给Exadata Oracle数据库使用。Exadata的管理方式包括Disk、Lun、Cell Disk、GridDisk或ASM disk。
2)将步骤1)中的剩余磁盘通过数据交换设备交由存储空间虚拟设备管理,具体为:
21)存储空间虚拟设备将剩余磁盘合并为一个磁盘池作为存储空间;
22)存储空间虚拟设备对步骤21)中的存储空间,进行数据的条带化冗余分布;进行数据的条带化冗余分布为以一定数量(如4、8、16等)为一组对存储空间内的磁盘进行分片,同时将每一个数据写在2个以上的磁盘之中;
23)部分业务主机通过NFS协议访问存储空间内的数据,业务主机包括Linux主机或UNIX主机;
24)其他业务主机通过ISCSI协议调用存储空间。
存储空间虚拟设备的部署地点包括Exadata服务器节点、存储节点或加入InfiniBand网络环境的主机上。数据交换设备为InfiniBand交换机。
3)存储空间虚拟设备判断Exadata是否需要更多空间,若是则进入步骤4),若否则继续判断。
4)存储空间虚拟设备释放占用的剩余磁盘,将其交还给Exadata Oracle数据库使用,其中存储空间虚拟设备释放占用的剩余磁盘具体为:
41)存储空间虚拟设备发送释放命令至业务主机;
42)业务主机判断当前使用的为哪种协议,若为NFS协议则进入步骤43),若为ISICI协议则进入步骤44);
43)业务主机断开和存储空间的连接;
44)业务主机直接释放调用的存储空间。
如图4所示,所有的磁盘映射给应用服务器9上部署的Exadata存储虚拟化工具,即存储空间虚拟设备,由其负责相关的数据处理,Exadata存储虚拟化工具可以部署在Exadata服务器节点、存储节点、或者加入InfiniBand网络环境的其他主机上,具备灵活的特性。
Exadata存储虚拟化工具实现的主要功能如下:
针对Exadata存储上划分出来的磁盘进行管理。将所有的磁盘化为一个大的磁盘池,并进行数据的条带化分布,默认以8个磁盘为一组,也可以动态调整比如4或16个,进行磁盘并行分片,并确保不同数据至少写在两个不同磁盘中。保证整体的性能的同时,也确保数据具备1:1的冗余度,不会因为单一存储节点或者磁盘故障而丢失数据。
将管辖的存储空间,通过NFS、ISCSI等协议映射给其他服务器主机使用,具体为:
NFS是Network File System的简写,即网络文件系统,是在Linux、UNIX主机上通常使用的网络共享方式。但是存储系统的管理是由存储系统自己完成,存储系统设置自己的文件系统和数据管理工作,业务主机通过使用NFS,用户和程序可以象访问本地文件一样访问远端系统上的文件。
ISCSI协议是将现有SCSI接口与以太网络(Ethernet)技术结合,使服务器可与使用IP网络的储存装置互相交换资料。但是一般情况iSCSI协议是作为块设备方式访问,需要在本地建立文件系统对iSCSI协议映射过来的设备做文件系统管理。这样设备一般都是独享方式。
当多个主机共同共享本存储系统的时候,大家共享的是一个物理实体,具体协议选择根据业务主机不同而作适当配置。
当需要对存储空间进行释放时,如果是NFS方式,主机释放空间仅仅是断开如存储系统连接,其空间管理是由存储系统管理。当ISCSI协议映射的业务主机释放存储空间时,其空间由存储系统回收。

Claims (7)

1.一种针对Exadata存储节点的虚拟化方法,该方法可以实现对Exadata存储空间的充分利用,其特征在于,该方法包括下列步骤:
1)根据使用需求,保留部分Exadata存储节点上的磁盘,按照Exadata的管理方式交给Exadata Oracle数据库使用;
2)将步骤1)中的剩余磁盘通过数据交换设备交由存储空间虚拟设备管理;
3)存储空间虚拟设备判断Exadata是否需要更多空间,若是则进入步骤4),若否则继续判断;
4)存储空间虚拟设备释放占用的剩余磁盘,将其交还给Exadata Oracle数据库使用;
所述存储空间虚拟设备的部署地点包括Exadata服务器节点、存储节点或加入InfiniBand网络环境的主机上;
所述步骤2)中将剩余磁盘通过数据交换设备交由存储空间虚拟设备管理具体为:
21)存储空间虚拟设备将剩余磁盘合并为一个磁盘池作为存储空间;
22)存储空间虚拟设备对步骤21)中的存储空间,进行数据的条带化冗余分布;
23)部分业务主机通过NFS协议访问存储空间内的数据;
24)其他业务主机通过ISCSI协议调用存储空间。
2.根据权利要求1所述的针对Exadata存储节点的虚拟化方法,其特征在于,所述进行数据的条带化冗余分布为以一定数量为一组对存储空间内的磁盘进行分片,同时将每一个数据写在2个以上的磁盘之中。
3.根据权利要求2所述的针对Exadata存储节点的虚拟化方法,其特征在于,所述一定数量包括4、8或16。
4.根据权利要求1所述的针对Exadata存储节点的虚拟化方法,其特征在于,所述业务主机包括Linux主机或UNIX主机。
5.根据权利要求1所述的针对Exadata存储节点的虚拟化方法,其特征在于,所述步骤4)中存储空间虚拟设备释放占用的剩余磁盘具体为:
41)存储空间虚拟设备发送释放命令至业务主机;
42)业务主机判断当前使用的为哪种协议,若为NFS协议则进入步骤43),若为ISICI协议则进入步骤44);
43)业务主机断开和存储空间的连接;
44)业务主机直接释放调用的存储空间。
6.根据权利要求1所述的针对Exadata存储节点的虚拟化方法,其特征在于,所述Exadata的管理方式包括Disk、Lun、Cell Disk、Grid Disk或ASM disk。
7.根据权利要求1所述的针对Exadata存储节点的虚拟化方法,其特征在于,所述数据交换设备为InfiniBand交换机。
CN201610428894.3A 2016-06-16 2016-06-16 一种针对Exadata存储节点的虚拟化方法 Active CN105978987B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610428894.3A CN105978987B (zh) 2016-06-16 2016-06-16 一种针对Exadata存储节点的虚拟化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610428894.3A CN105978987B (zh) 2016-06-16 2016-06-16 一种针对Exadata存储节点的虚拟化方法

Publications (2)

Publication Number Publication Date
CN105978987A CN105978987A (zh) 2016-09-28
CN105978987B true CN105978987B (zh) 2019-04-26

Family

ID=57022466

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610428894.3A Active CN105978987B (zh) 2016-06-16 2016-06-16 一种针对Exadata存储节点的虚拟化方法

Country Status (1)

Country Link
CN (1) CN105978987B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110515535B (zh) * 2018-05-22 2021-01-01 杭州海康威视数字技术股份有限公司 硬盘读写控制方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103595799A (zh) * 2013-11-18 2014-02-19 北京中创信测科技股份有限公司 一种实现分布式共享数据库的方法
CN105205067A (zh) * 2014-06-18 2015-12-30 中国移动通信集团浙江有限公司 一种存储扩容方法、装置、计算节点及存储设备
CN106201328A (zh) * 2015-05-29 2016-12-07 中国移动通信集团浙江有限公司 一种管理存储节点的磁盘空间的方法、装置和服务器

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103595799A (zh) * 2013-11-18 2014-02-19 北京中创信测科技股份有限公司 一种实现分布式共享数据库的方法
CN105205067A (zh) * 2014-06-18 2015-12-30 中国移动通信集团浙江有限公司 一种存储扩容方法、装置、计算节点及存储设备
CN106201328A (zh) * 2015-05-29 2016-12-07 中国移动通信集团浙江有限公司 一种管理存储节点的磁盘空间的方法、装置和服务器

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
《计算资源虚拟化在神华集团新一代数据中心的应用实践》;孟君;《神华科技》;20140726(第4期);全文

Also Published As

Publication number Publication date
CN105978987A (zh) 2016-09-28

Similar Documents

Publication Publication Date Title
US7877545B2 (en) Online restriping technique for distributed network based virtualization
US7181578B1 (en) Method and apparatus for efficient scalable storage management
JP5026283B2 (ja) 協調的共用ストレージアーキテクチャ
CN103793271B (zh) 用于在镜像卷之间进行切换的方法和系统
Cully et al. Strata:{High-Performance} Scalable Storage on Virtualized Non-volatile Memory
CN106688217A (zh) 用于融合联网和存储的方法和系统
US20070094466A1 (en) Techniques for improving mirroring operations implemented in storage area networks and network based virtualization
US20070094465A1 (en) Mirroring mechanisms for storage area networks and network based virtualization
US9058127B2 (en) Data transfer in cluster storage systems
CN106066890B (zh) 一种分布式高性能数据库一体机系统
CN103873559A (zh) 一种高速存储的数据库一体机
US20090259816A1 (en) Techniques for Improving Mirroring Operations Implemented In Storage Area Networks and Network Based Virtualization
US8677014B2 (en) Fine granularity exchange level load balancing in a multiprocessor storage area network
US20120259961A1 (en) System of managing remote resources
WO2008067370A2 (en) Virtualization support in a multiprocessor storage area network
CN101542448B (zh) 多处理器存储区域网中锁定管理器的轮换
CN106888116A (zh) 一种双控制器集群共享资源的调度方法
US8356072B1 (en) Systems and methods for scalable heterogeneous and homogeneous unified enterprise storage clusters
CN105978987B (zh) 一种针对Exadata存储节点的虚拟化方法
CN106201328B (zh) 一种管理存储节点的磁盘空间的方法、装置和服务器
US9641613B2 (en) Volume hierarchy download in a storage area network
Gong et al. Research and application of distributed storage technology in power grid enterprise database
Xiao et al. TH-VSS: An asymmetric storage virtualization system for the SAN environment
Qu et al. The study of mixed storage scheme of private cloud platform based on Ceph
CN115065693A (zh) 一种基于异构指令集的虚拟化存储池及其方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant