WO2014101896A1

WO2014101896A1 - 一种共享存储资源的方法和系统

Info

Publication number: WO2014101896A1
Application number: PCT/CN2013/091253
Authority: WO
Inventors: 顾炯炯; 闵小勇
Original assignee: 华为技术有限公司
Priority date: 2012-12-31
Filing date: 2013-12-31
Publication date: 2014-07-03
Also published as: US11042311B2; EP3188449B1; ES2624412T3; EP3188449A1; US20140189128A1; US10082972B2; JP2016507814A; US20200065010A1; WO2014101218A1; CN103503414B; US10481804B2; EP2930910A4; US20150301759A1; EP2930910A1; US20170336998A1; US9733848B2; CN103503414A; EP2930910B1; JP6019513B2

Abstract

本发明实施例共享存储资源的方法和系统，将硬盘和存储阵列的存储资源划分为多个存储分区并组成共享存储资源池，为所述每个存储分区分配读写控制模块，并生成全局分区信息以记录所述共享存储资源池中的每个存储分区与读写控制模块的对应关系，使得后续接收到存储请求消息，能够确定所述存储请求消息对应的存储分区，并根据所述全局分区信息，确定所述存储请求消息对应的存储分区对应的读写控制模块，最终能够向确定的所述读写控制模块发送所述存储请求消息，以使所述读写控制模块执行所述存储请求消息所请求的操作。本发明实施例实现异构存储资源之间的快速简单融合，可以高效地利用各种存储资源，节约成本以及避免资源浪费。

Description

一种共享存储资源的方法和系统技术领域本发明涉及通信技术领域，尤其涉及一种共享存储资源的方法和系统。背景技术

在云计算应用中，服务器集群系统整合计算资源、存储资源和网络资源，利用虚拟化等技术并通过网络提供给用户使用。应用的形式例如为虚拟机 ( Virtual Machine, 简称为 "VM" ) 、计算能力、存储能力租用等。

目前，由于资源需求的类型不同等原因，服务器集群系统提供的存储资源通常釆用不同的设备，存储资源来源多样化。例如，服务器节点的自带的存储资源，以及独立部署的存储资源，例如存储区域网络（ Storage Area Network, 简称为 "SAN" )等专用存储阵列或存储服务器。

现有技术中，服务器集群系统各存储设备独立对外提供存储服务，存储资源的联合利用率并不高。再一方面，企业原始积累的网络存储设备的存储资源并不能那个被服务器集群系统再次利用，造成了极大的浪费。发明内容本发明实施例提供一种共享存储资源的方法和系统，以对异构存储资源进行整合和共享利用，提高存储资源利用率。第一方面，本发明实施例提出了一种共享存储资源的方法，应用于服务器集群系统，所述服务器集群系统包括服务器节点和网络存储节点，所述服务器节点包括硬盘，所述网络存储节点包括存储阵列，所述方法包括：将所述硬盘和所述存储阵列的存储资源划分为多个存储分区，所述多个存储分区组成共享存储资源池；为所述每个存储分区分配读写控制模块；生成全局分区信息，所述全局分区信息记录了所述共享存储资源池中的每个存储分区与读写控制模块的对应关系；接收存储请求消息，确定所述存储请求消息对应的存储分区；根据所述全局分区信息，确定所述存储请求消息对应的存储分区对应的读写控制模块；向确定的所述读写控制模块发送所述存储请求消息，以使所述读写控制模块执行所述存储请求消息所请求的操作。结合第一方面，在第一种可能的实现方式中，所述确定所述存储请求消息对应的存储分区包括：确定所述存储请求消息待操作的数据所在的用户卷 ID 和所述待操作的数据的至少一个数据块的逻辑块地址 LBA; 根据所述用户卷 ID和所述至少一个数据块的 LBA,确定所述至少一个数据块对应的存储分区。结合第一方面的第一种可能的实现方式，在第二种可能的实现方式中，所述方法还包括：建立所述共享存储资源池的每个存储分区的元数据，所述每个存储分区的元数据记录本存储分区 ID与被分配到本存储分区的数据块 ID的对应关系；则，所述根据所述用户卷 ID和所述至少一个数据块的 LBA,确定所述至少一个数据块对应的存储分区包括：根据所述用户卷 ID和所述至少一个数据块的 LBA确定所述至少一个数据块的 ID, 查询所述每个存储分区的元数据，确定所述至少一个数据块对应的存储分区的 ID。结合第一方面或者第一方面的第一种可能的实现方式，在第三种可能的实现方式中，所述根据所述用户卷 ID和所述至少一个数据块的 LBA,确定所述至少一个数据块对应的存储分区包括：将所述用户卷 ID和每个数据块的 LBA组成所述每个数据块的 key值，计算所述每个数据块的 key值对应的 value值，根据所述 value值确定所述每个数据块对应的存储分区。结合第一方面的第一种可能的实现方式或者第一方面的第二种可能的实现方式或者第一方面的第三种可能的实现方式，在第四种可能的实现方式中，所述接收存储请求消息包括：接收创建用户卷的命令，所述创建用户卷的命令指示所述用户卷的大小；则所述确定所述存储请求消息待操作的数据所在的用户卷 ID 和所述待操作的数据的至少一个数据块的逻辑块地址 LBA,根据所述用户卷 ID和所述至少一个数据块的 LBA, 确定所述至少一个数据块对应的存储分区，包括：为所述用户卷分配所述用户卷 ID; 根据所述所述用户卷的大小，确定分配给所述用户卷的初始存储资源的大小，根据所述初始存储资源的大小确定至少一个数据块的 LBA; 根据所述用户卷 ID和所述至少一个数据块的 LBA,确定所述至少一个数据块对应的存储分区。结合第一方面的第一种可能的实现方式或者第一方面的第二种可能的实现方式或者第一方面的第三种可能的实现方式，在第五种可能的实现方式中，所述接收存储请求消息包括：接收写数据操作请求；根据所述写数据操作请求携带的文件名，确定当前写操作对应的用户卷

ID; 将待写入的数据划分为多个待写入数据块，并为每个待写入数据块分配 LBA; 根据所述当前写操作对应的用户卷 ID和所述每个待写入数据块的 LBA, 确定所述每个待写入数据块对应的存储分区；根据所述全局分区信息，确定所述每个待写入数据块对应的存储分区所对应的读写控制模块；生成多个数据块写命令，其中，每个数据块写命令对应一个所述待写入数据块，所述每个数据块写命令携带待写入数据块以及待写入数据的 ID; 分别向所述每个待写入数据块对应的读写控制模块发送所述每个数据块写命令，以使得所述每个待写入数据块对应的读写控制模块将所述每个待写入数据块写入存储硬件资源。结合第一方面的第一种可能的实现方式或者第一方面的第二种可能的实现方式或者第一方面的第三种可能的实现方式，在第五种可能的实现方式中，所述接收存储请求消息包括：接收读数据操作请求，所述读数据操作请求携带文件名和待读取数据的偏移量；则根据所述读数据操作请求携带的文件名，确定当前读操作对应的用户卷 ID; 根据所述待读取数据的偏移量信息，确定多个待读取数据块的 LBA; 根据所述当前读操作对应的用户卷 ID和每个待读取数据块的 LBA,确定所述每个待读取数据块对应的存储分区；根据所述全局分区信息，确定所述多个待读取数据块对应的存储分区所对应的读写控制模块；生成多个数据块读命令，其中，每个数据块读命令对应一个所述待读取数据块，所述每个数据块读命令携带待读取数据块以及待读取数据块的 ID; 分别向所述每个待读取数据块对应的读写控制模块发送所述每个数据块读命令，以使得所述每个待读取数据块对应的读写控制模块读取所述每个待读取数据块。

第二方面，本发明实施例提出了一种服务器集群系统，所述服务器集群系统包括服务器节点和网络存储节点，所述服务器节点包括硬盘，所述网络存储节点包括存储阵列，所述服务器节点上运行分布式存储控制器，所述分布式存储控制器包括：元数据控制器，用于将所述硬盘和所述存储阵列的存储资源划分为多个存储分区，所述多个存储分区组成共享存储资源池，为所述每个存储分区分配读写控制模块，生成全局分区信息，所述全局分区信息记录了所述共享存储资源池中的每个存储分区与读写控制模块的对应关系，以及向虚拟块服务模块下发所述全局分区信息；

所述虚拟块服务模块，用于面向业务层，接收存储请求消息，确定所述存储请求消息对应的存储分区，根据所述全局分区信息，确定所述存储请求消息对应的存储分区对应的读写控制模块，以及向确定的所述读写控制模块发送所述存储请求消息；

所述读写控制模块，用于面向所述硬盘或所述网络存储节点，执行所述存储请求消息所请求的操作。

结合第二方面，在第一种可能的实现方式中，所述读写控制模块包括对象存储代理和网络存储代理；

所述元数据控制器具体用于为所述本地硬盘组成的存储分区分配所述对象存储代理作为读写控制模块，为所述存储阵列组成的存储分区分配所述网络存储代理作为读写控制模块；所述对象存储代理，用于接收存储请求消息，确定所述存储请求消息对应的物理地址，根据所述物理地址在所述硬盘上执行所述存储请求消息所请求的操作；

所述网络存储代理，用于接收存储请求消息，确定所述存储请求消息对应的网络存储节点的逻辑地址，根据所述逻辑地址在所述存储阵列上执行所述存储请求消息所请求的操作。

结合第二方面，在第二种可能的实现方式中，所述虚拟块服务模块，具体用于确定所述存储请求消息待操作的数据所在的用户卷 ID 和所述待操作的数据的至少一个数据块的逻辑块地址 LBA,根据所述用户卷 ID和所述至少一个数据块的 LBA, 确定所述至少一个数据块对应的存储分区。

结合第二方面的第二种可能的实现方式，在第三种可能的实现方式中，所述虚拟块服务模块，具体用于建立所述共享存储资源池的每个存储分区的元数据，所述每个存储分区的元数据记录本存储分区 ID与被分配到本存储分区的数据块 ID的对应关系，根据所述用户卷 ID和所述至少一个数据块的 LBA 确定所述至少一个数据块的 ID, 查询所述每个存储分区的元数据，确定所述至少一个数据块对应的存储分区的 ID。

结合第二方面的第二种可能的实现方式，在第四种可能的实现方式中，所述虚拟块服务模块，具体用于将所述用户卷 ID和每个数据块的 LBA组成所述每个数据块的 key值，计算所述每个数据块的 key值对应的 value值，根据所述 value值确定所述每个数据块对应的存储分区。

结合第二方面以及第二方面的任意一种可能的实现方式，在第五种可能的实现方式中，所述虚拟块服务模块，具体用于接收创建用户卷的命令，所述创建用户卷的命令指示所述用户卷的大小，为所述用户卷分配所述用户卷 ID, 根据所述所述用户卷的大小，确定分配给所述用户卷的初始存储资源的大小，根据所述初始存储资源的大小确定至少一个数据块的 LBA, 以及根据所述用户卷 ID和所述至少一个数据块的 LBA,确定所述至少一个数据块对应的存储分区。结合第二方面以及第二方面的任意一种可能的实现方式，在第六种可能的实现方式中，所述虚拟块服务模块，具体用于接收写数据操作请求，根据所述写数据操作请求携带的文件名，确定当前写操作对应的用户卷 ID, 将待写入的数据划分为多个待写入数据块，并为每个待写入数据块分配 LBA, 根据所述当前写操作对应的用户卷 ID和所述每个待写入数据块的 LBA,确定所述每个待写入数据块对应的存储分区，根据所述全局分区信息，确定所述每个待写入数据块对应的存储分区所对应的读写控制模块，生成多个数据块写命令，其中，每个数据块写命令对应一个所述待写入数据块，所述每个数据块写命令携带待写入数据块以及待写入数据的 ID, 以及分别向所述每个待写入数据块对应的读写控制模块发送所述每个数据块写命令。结合第二方面以及第二方面的任意一种可能的实现方式，在第七种可能的实现方式中，所述虚拟块服务模块，具体用于接收读数据操作请求，所述读数据操作请求携带文件名和待读取数据的偏移量，根据所述读数据操作请求携带的文件名，确定当前读操作对应的用户卷 ID, 根据所述待读取数据的偏移量信息，确定多个待读取数据块的 LBA, 以及根据所述当前读操作对应的用户卷 ID和每个待读取数据块的 LBA,确定所述每个待读取数据块对应的存储分区，根据所述全局分区信息，确定所述多个待读取数据块对应的存储分区所对应的读写控制模块，生成多个数据块读命令，其中，每个数据块读命令对应一个所述待读取数据块，所述每个数据块读命令携带待读取数据块以及待读取数据块的 ID, 以及分别向所述每个待读取数据块对应的读写控制模块发送所述每个数据块读命令。

结合第二方面以及第二方面的任意一种可能的实现方式，在第八种可能的实现方式中，所述元数据控制器，还用于分别确定所述对象存储代理和所述网络存储代理在所述服务器节点上的部署情况，并根据确定的部署情况生成读写控制模块的视图信息，所述读写控制模块的视图信息用于指示每个读写控制模块部署的服务器节点的信息，以及向所述虚拟块服务模块下发所述读写控制模块的视图信息；所述虚拟块服务模块，具体用于根据所述读写控制模块的视图信息确定读写控制模块的路由信息，向确定的所述读写控制模块发送所述存储请求消息。

结合第二方面的第八种可能的实现方式，在第九种可能的实现方式中，所述元数据控制器具体用于确定将所述对象存储代理部署在所述服务器集群系统中具备硬盘资源的服务器节点上，以及确定将所述网络存储代理部署在所述服务器集群系统中的负载小的服务器节点上。结合第二方面的第八种可能的实现方式，在第十种可能的实现方式中，所述元数据控制器，还用于搜集所述服务器节点的硬盘的可用存储资源和所述网络存储节点的存储阵列的可用存储资源，将所述硬盘和所述存储阵列的可用存储资源划分为多个存储分区。

第三方面，本发明实施例提供一种计算机。第四方面，本发明实施例提供一种计算机存储介质。由上述技术方案可知，本发明实施例，将硬盘和存储阵列的存储资源划分为多个存储分区并组成共享存储资源池，为所述每个存储分区分配读写控制模块，并生成全局分区信息以记录所述共享存储资源池中的每个存储分区与读写控制模块的对应关系，使得后续接收到存储请求消息，能够确定所述存储请求消息对应的存储分区，并根据所述全局分区信息，确定所述存储请求消息对应的存储分区对应的读写控制模块，最终能够向确定的所述读写控制模块发送所述存储请求消息 , 以使所述读写控制模块执行所述存储请求消以高效地利用各种存储资源，节约成本以及避免资源浪费。

附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例。

图 1为本发明实施例提供的服务器集群系统的示意性框图；

图 2为本发明实施例提供的共享存储资源的划分示意图；

图 3为本发明实施例提供的使用共享存储资源的流程图；

图 4为本发明实施例提供的使用共享存储资源的又一流程图；

图 5为本发明实施例提供的使用共享存储资源的又一流程图；

图 6为本发明实施例提供的服务器集群系统的又一示意性框图；图 7是根据本发明实施例提供的一种计算机的组成图。具体实施方式为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。

另外，本文中术语"和 /或"，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如， A和 /或 B, 可以表示：单独存在 A, 同时存在 A 和 B, 单独存在 B这三种情况。另外，本文中字符 ", —般表示前后关联对象是一种"或"的关系。

本发明实施例提供的技术方案通过在服务器上部署分布式控制器来实现异构存储资源的融合，实现无需另外购买异构存储融合的设备，即可实现异构存储资源的融合和利用，提升系统的性价比。

本发明实施例在实现计算资源与存储资源的垂直融合的基础上，再将各种存储资源进行水平整合，尤其是对异构存储资源进行整合和利用 , 本发明实施例通过在服务器上部署分布式存储控制器，将各种异构存储资源组成集群共享存储资源池，统一进行存储资源的分配和管理。通过这种方法，可以实现异构存储资源之间的快速简单融合，可以高效地利用各种存储资源，节约成本以及避免资源浪费。

本发明实施例所说的异构存储资源，指的是两种或者两种以上不同类型的存储设备，具体来说，第一种存储设备意指服务器节点自带的本地硬盘，例如固态硬盘（Solid State Disk, SSD ) 、机械硬盘（Hard Disk, HD ) 、混合硬盘（Hybrid Hard Disk, HHD )等；第二种存储设备意指网络存储节存储设备，也可以是网络附加存储 (Network Attached Storage, NAS)存储设备，所述的网络存储节点为服务器外置的硬件设备，并非服务器自身所带的设备。

如图 1 所示，为本发明实施例提供的服务器集群系统的组成图，该服务器集群系统通过网络层与应用客户端或者存储管理中心通信，所述服务器集群系统由服务器节点和网络存储节点 (本实施例以 SAN存储设备为例)组成，服务器节点和网络存储节点均可以是一个或多个，本实施例以 2台 SAN存储节点为例，每台服务器节点的物理设备包含 CPU、内存、网络和硬盘等，网络存储节点的物理设备包含存储阵列和存储阵列的控制器，本实施例将服务器节点的 CPU 和内存等用于为接入所述服务器集群系统的应用程序提供计算资源的物理设备统称为所述服务器集群系统的计算资源，其为组成计算层的基础，将存储资源层的服务器节点的硬盘和网络存储节点的存储阵列统称为统称为所述服务器集群系统的存储资源。

所述服务器集群用于对外将计算资源提供给不同的应用程序使用，例如可以在所述服务器集群上运行 WEB应用或者 HADOOP分布式集群系统。所述服务器集群的计算资源还可以进一步被抽象成多台虚拟机，在每台虚拟机上运行不同的应用程序，或者多台虚拟机组成虚拟机集群从而为同一个应用程序提供服务，本实施例对具体实现形式不拘一格。当所述服务器集群上运行应用程序，所述应用程序的相关数据可以存储在所述服务器集群系统的存储资源上，即存储在服务器节点的硬盘上或者 SAN节点的存储阵列中，也可以同时存储在服务器节点的硬盘和 SAN节点的存储阵列中。

本发明实施例的所述服务器集群系统还运行了分布式存储控制器，所述分布式存储控制器用于将服务器节点的硬盘和网络存储节点（如 SAN )提供的存储阵列的存储资源划分为多个存储分区，所述多个存储分区组成所述服务器集群系统的共享存储资源池，运行在所述服务器集群上的应用程序可以从所述共享存储资源池中获得分布的存储资源块并进行使用，保证了存储资源的较高的利用率和存储的均勾分布，并由此提升了存储资源的读写效率。在本发明实施例中所述分布式存储控制器通过安装在服务器的硬件设备上的软件模块来实现，从而可以避免另外购置硬件设备作为存储控制设备的问题，解决方案更加经济并节约成本。

本发明实施例所述分布式存储控制器是对每台服务器节点上运行的存储控制功能模块的统称，作为解决方案提供的分布式存储控制器可以包含不同的功能模块，而在实际部署的时候，每台服务器节点根据其功能和部署策略可以运行分布式存储控制器的不同的功能模块，也就是说，根据服务器集群的部署策略，可以在不同的服务器节点上运行分布式存储控制器的不同的功能模块，每台服务器节点可以运行分布式存储控制器所有的功能模块，也可以运行分布式存储控制器部分的功能模块，具体部署方式下文将详细描述。

所述分布式存储控制器主要用于：对所述服务器集群系统的计算资源提供数据访问的接口，以及对所述服务器集群系统的共享存储资源进行管理和读写控制。

具体地，所述分布式存储控制器从功能上可以划分为如下模块：元数据控制器 MDC,用于获取服务器节点本地硬盘的存储资源和网络存储节点的存储阵列的存储资源，将所述服务器节点的存储资源和网络存储节点的存储资源划分为多个存储分区（partition ) , 并为每个存储分区分配一个存储分区标识，再将所述多个存储分区组成一个共享存储资源池，以供运行在所述服务器集群系统上的应用程序使用共享存储资源。

具体地，所述 MDC可以先对服务器节点的硬盘资源和网络存储节点的存储阵列进行健康检查，搜集其中可用的存储资源形成所述共享存储资源池。所述 MDC 在划分分区的时候，可以划分为相同大小的存储分区，例如以 10GB为单位划分。其中，所述 MDC搜集的所述存储资源可以包括：每块硬盘的容量和 ID、每块硬盘所在的服务器的 ID、每个存储阵列包含的每个逻辑存储单元 LUN的容量和 ID, 以及每个 LUN所在的网络存储节点的 ID。

所述 MDC搜集到的存储资源的信息举例如下： Disk ID=1 , Disk Capacity=50GB, Server ID=1；

Disk ID=2, Disk Capacity=50GB, Server ID=1；

Disk ID=3, Disk Capacity=50GB, Server ID=2;

LUN =1 , LUN Capacity=50GB, SAN ID=1 ;

LUN =2, LUN Capacity=50GB, SAN ID=1 ;

LUN =3, LUN Capacity=50GB, SAN ID=1。

MDC搜集到上述存储资源的信息后，将上述 Disk1 -3和 LUN1 -3的存储资源划分为多个存储分区，每个存储分区可以是均分，也可以是不均分，例如，以 10GB大小均分所述存储资源，将所述 DISK和 LUN的存储资源划分为 30个存储分区，每个存储分区为 10GB,每个存储分区的分区标识为 1 -30, 即 P1 -P30, MDC将 P1 -P30组成一个共享存储资源池，其中 P1 -P15由服务器节点自带的硬盘的存储资源组成， P16-P30由 SAN节点的存储阵列的存储资源组成。即，所述共享存储资源包括两类存储分区，第一类存储分区为 P1 -P15, 第二类存储分区为 P16-P30。

所述分布式存储控制器还包括读写控制模块，本实施例中读写控制模块包括对象存储代理（ Object Storage Delegate, OSD )和网络存储代理 (SAN Storage Agent, SSA), 其中，所述 OSD用于对服务器节点自带的硬盘的存储资源进行读写控制，即实现数据到服务器节点的本地硬盘的存放与获取，例如对本实施例中的存储分区 P1 -P15进行读写控制；所述 SSA对 SAN节点的存储阵列的存储资源进行读写控制，即实现数据到 SAN节点的存储阵列的存放与获取，例如对本实施例中的存储分区 P16-P30进行读写控制。所述 0SD和所述 SSA均为所述分布式存储控制器的功能模块，所述 MDC在搜集服务器集群系统的存储资源的信息后，还可以根据存储资源的部署情况确定所述 0SD 和 SSA如何在所述服务器集群系统中进行部署。具体地，所述 MDC可以将 0SD运行在所述服务器集群系统中具有本地硬盘的每个服务器节点中，所述 MDC可以将 SSA运行在所述服务器集群系统中的每个服务器节点中，也可以根据每个服务器节点的负载情况将 SSA部署在负载较小的服务器节点上，例如，所述 MDC可以统一计算所有服务器节点上的计算资源的负载情况，并根据每个 SAN存储节点的存储阵列的容量大小，按照权重生成全局的 SSA的部署信息。在本实施例中，例如所述 MDC在服务器节点 1 上运行 OSD1 ,在服务器节点 2上运行 OSD2,在服务器节点 2上运行 SSA1。所述 MDC所述 MDC确定所述 OSD和 SSA的部署情况之后，还可以记录 OSD视图信息和 SSA视图信息，所述 OSD视图信息包括 OSD对应部署在哪个服务器上，用于指示所述 OSD的路由信息，进一步地，所述 OSD 视图还可以包含每个 OSD 以及其对应的状态以及每个 OSD对应管理哪些 DISK, 所述 SSA视图信息包括 SSA对应部署在哪个服务器上，用于指示所述 SSA的路由信息，进一步地，还包括每个 SSA的状态以及每个 SSA对应管理哪些 SAN存储阵列的 LUN ,例如下表一和表二分别为 OSD视图信息和 SSA视图信息：

表二： SSA视图信息

上述表一和表二将 OSD和 SSA的视图信息分开描述，本领域技术人员也可以将上述表一和表二合并为一个读写控制模块的视图信息。

所述 MDC在划分了存储分区和确定了读写控制模块的部署之后，还可以为每个存储分区配置对应的读写控制模块，所述分配过程可以比较灵活，由所述 MDC根据存储分区的划分情况和实际运行负载确定，例如 P1 -10对应部署在服务器节点 1上，由服务器节点 1上运行的 OSD1作为所述存储分区的读写控制模块， P1 1 -20对应部署在服务器节点 2上，由服务器节点 2上运行的 OSD2作为所述存储分区的读写控制模块， P21 -30对应部署在服务器节点 2上，由服务器节点 2上运行的 SSA1作为所述存储分区的读写控制模块。

进一步，所述 MDC还可以生成全局分区信息（本发明实施例以全局分区信息表为例），所述全局分区信息表记录了所述服务器集群系统中的存储分区的分布情况，如图 2和表三所示，所述全局分区信息表中记录每个存储分区对应的读写控制模块（ OSD或 SSA )。所述全局分区信息表还可以记录每个存储分区对应的源存储设备的信息，例如磁盘编号或者物理地址信息。

如表三， P1对应的读写控制模块为 OSD1 , P1对应的源存储单元为 SERVER1 中的 DISK1 , P1对应的源物理地址为 100-199。

表三：全局分区信息表

所述分布式存储控制器还包括虚拟块服务 VBS。所述 MDC完成存储分区和读写控制模块的部署之后，还可以将上述全局分区信息表和读写控制模块视图信息下发到所述 VBS。所述 VBS根据所述 MDC下发的信息获得 I/O 视图，所述 I/O视图是全局分区信息表的一个子表，用于表明每个存储分区实际的读写控制模块，其包含存储分区与读写控制模块的对应关系，所述 I/O 视图可以是所述 MDC直接下发给所述 VBS的，也可以是所述 VBS根据 MDC 模块下发的全局分区信息表生成的。

所述 VBS可以运行在所述服务器集群系统中的每个服务器节点上，作为存储的驱动层，用于向所述服务器集群系统的应用模块提供块访问接口，例如基于 SCSI的块设备访问接口，所述 VBS接收上层应用下发的数据读写请求后，确定所述数据读写请求所需要读写的存储分区，并根据所述 I/O视图中的视图规则，确定当前数据读写请求所请求的存储分区所对应的读写控制模块（OSD和 SSA ) , 将读写数据请求下发给对应的读写控制模块，以完成数据的读写。

具体地，所述 VBS还可以支持对全局元数据进行管理，所述全局元数据记录所述服务器集群系统中的共享存储资源池中的存储分区的全局使用情况以及每个存储分区的元数据。所述全局使用情况包括已经占用的存储分区的信息和空闲的存储分区的信息。所述每个存储分区的元数据用于表明每个存储分区的分配情况，本发明实施例中存储分区的分配釆用块数据的存储分配方式，也就是说，每个存储分区的使用单位釆用数据块为单位，所述存储分区的使用包括读、写或者分配等方式，例如所述存储分区在被分配到用户卷的时候，釆用数据块为单位进行分配，举例来说，本发明实施例中的每个存储分区的大小为 10GB,所述 10GB可以被均分为 10240个数据块（Block ) , 读取数据到每个存储分区或者写入数据到每个存储分区的时候，以数据块为单位进行读写，因此，每个存储分区的元数据具体包括每个存储分区所分配的 Block ID的对应关系，每个存储分区被分配了多个数据块。每个数据块的大小可以平均，也可以不限定，本发明实施例以每个数据块的大小为 1 MB为例。另外，本发明实施例中每个数据块的 ID可以由该数据块对应的用户卷的 ID组成，也可以由该数据块对应的用户卷的 ID和逻辑块地址（ Logical Block Address, LBA )组成。

每个存储分区的元数据，例如，如表四所示:

表四：存储分区的元数据

其中，存储分区与分配的数据块的对应关系可以釆用 Key-Value索引形式，其中，数据块的 ID为 Key值，例如 Key值与用户卷的标识和数据块的逻辑块地址有关，存储分区的 ID为 Value值。需要说明的是，如果是釆用 Key-Value索引形式，所述 VBS也可以不用维护上述表四，而直接通过算法确定对应关系。所述 VBS可以在启动的时候，通过遍历服务器节点的硬盘和 SAN节点的存储阵列的磁盘，获取存储资源的分配信息，并根据 MDC下发的全局分区信息表，对存储元数据进行初始化。

所述分布式存储控制器还包括读写控制模块，例如对服务器节点的硬盘资源进行读写控制的 OSD, 以及对网络存储节点的存储阵列的存储资源进行读写控制的 SSA。

具体地，所述 OSD主要接收 VBS的读写命令，完成数据到服务器节点的硬盘的存放与获取。所述 SSA主要接收 VBS的读写命令，完成数据到 SAN 节点的硬盘的存放与获取，所述 SSA用于实现 SAN设备在主机上的代理，每一个物理 SAN 设备的存储信息在 SSA 中都建立了视图，对每个物理 SAN/NAS设备的访问都是通过其代理进行的， SSA增加了 iSCSI的接口功能。

进一步，如果对所述共享存储资源池中的存储分区釆用统一地址的方式分配物理地址，则所述 SSA还可以维护统一的物理地址与 SAN节点上的原始 LUN地址的对应关系，所述 SSA还可以根据所述对应关系，确定读写请求所对应的原始 LUN的地址。

上述的服务器集群系统，由于运行了分布式存储控制器，所述分布式存储控制器上的 MDC、 VBS以及 OSD、 SSA能够实现对异构存储资源进行整合和利用，将各种异构存储资源组成集群共享资源池，统一进行存储资源的分配和管理，提高存储资源的利用率，并且可以实现多个存储分区同时读或写，则提高了读写性能，提升了系统的息率。

结合图 1 , 图 3为本发明实施例提供的釆用异构存储资源整合的服务器集群系统中创建用户卷的处理流程：

S301 : 服务器集群系统中的一个服务器节点上部署的 VBS接收到应用端发送的创建用户卷的命令；

具体地，运行在所述服务器集群上的应用端的某应用程序（例如某台虚拟机）发起创建用户卷的命令，该命令被应用管理器转发到所述服务器集群中的任意一个服务器节点上部署的 VBS (—种优选的方式是，发起命令的虚拟机的计算资源所在的服务器节点的 VBS接收到该创建用户卷的命令 )；优选地，如果本发明实施例中的服务器集群系统进一步提供主备 VBS的功能，则该接收到创建用户卷的命令后，可以进一步判断自身是不是所述服务器集群中的主 VBS,如果不是，将所述创建用户卷的命令转发给主 VBS。事实上， VBS 的部署比较灵活，所述服务器集群系统每个服务器节点上安装的 VBS 可以不分主次，此时每个 VBS的配置和功能等同，也可以在服务器集群系统中选择一个 VBS作为主 VBS, 其它 VBS作为备份 VBS, 主 VBS用于实现用户卷 /数据块的分配以及存储分区的元数据管理，备份 VBS用于向主 VBS 查询元数据以及根据主 VBS的命令执行操作。本发明实施例以服务器集群系统实现主备 VBS为例。

S302: 所述主 VBS才艮据所述创建用户卷的命令所指示的卷的大小信息，查询全局元数据，确定共享存储资源池的剩余资源是否满足要求，如果满足，则创建所述用户卷，即确定所述用户卷的卷标识（ID ) , 并为所述用户卷分配初始存储分区，将所述用户卷的标识和分配的初始存储分区的信息记录在所述初始存储分区的元数据中。

具体地，如果所述创建用户卷的命令已经指定所述用户卷的 ID, 则所述主 VBS直接使用所述创建用户卷的命令中的所述用户卷的 ID, 如果所述创建用户卷的命令未指定所述用户卷的 ID, 则所述 VBS为所述用户卷分配用户卷的 ID。

所述 VBS在创建所述用户卷的过程中，还可以进一步为所述用户卷分配初始存储分区，即从空闲的存储分区中挑选某些存储分区作为所述用户卷的初始存储分区。所述用户卷的初始存储资源的大小可以根据所述创建用户卷的命令指定的用户卷的容量灵活分配，可以将所述创建用户卷的命令指定的用户卷的容量全部作为初始存储分区的容量，例如所述创建用户卷的命令请求创建一个 5GB的用户卷，所述 VBS可以将 5GB全部分配给所述用户卷作为初始存储分区，即将 5GB划分为 5120个 1 MB的数据块，将这 5120个数据块分布部署在 P1 -P30的存储分区中，此时初始存储分区的大小为 5GB; 所述 VBS也可以使用瘦分配的方式，根据所述共享存储资源池中的实际情况为所述用户卷分配一部分的存储资源，例如为所述用户卷分配 1 GB的初始存储资源，将 1 GB划分为 1024个 1 MB的数据块，将这 1024个数据块分布部署在 P1 -P30的存储分区中，此时初始存储分区的大小为 1 GB。所述 VBS将所述用户卷 ID和分配的初始存储分区的信息记录到全局元数据中的每个初始存储分区的元数据信息中。

所述 VBS在为所述用户卷分配初始存储分区的时候，也为每个用户卷的每个数据块分配对应的源物理地址。

S303: 所述主 VBS挂载所述用户卷，并在挂载成功后，生成一个虚拟存储设备；

S305:所述主 VBS将所述全局元数据返回给服务器集群系统中的 MDC, 以供所述 MDC根据所述全局元数据更新全局分区信息表。

其中，步骤 305为可选步骤，其实施顺序也可灵活进行。

结合图 1 , 图 4为本发明实施例提供的釆用异构存储资源整合的服务器集群系统中用户写数据的处理流程：

S401：运行在所述服务器进群系统上的任意一个应用程序发起写数据操作之后，服务器集群系统中的 VBS接收到写数据操作请求。

所述写数据操作请求携带文件名和待写入数据本身。

S402: 所述 VBS根据所述写数据操作请求携带的文件名，确定当前写操作对应的用户卷 ID;

所述 VBS还可以根据所述待写入数据计算待写入数据的大小。

所述 VBS为所述待写入数据分配 LBA (本步骤分配 LBA为可选的，所述 VBS也可以在此步骤不为所述待写入数据分配 LBA ) 。

例如，所述 VBS确定所述当前写操作的 Volume ID 1 , Size= 1 GB, LBA: 001 x -221 x 。

S403: 所述 VBS将所述待写入数据分割为多个数据块，并为所述每个数据块分配 LBA。

其中，所述 VBS分割所述待写入数据可以按照一定单位大小进行均匀分割，例如按照 1 MB进行分割，即按照每个存储分区的每次的使用单位进行分割，在本实施例中，所述 VBS将所述 Size= 1 GB的待写入数据分割为 1024 个数据块，每个数据块的大小为 1 MB, 若待写入数据的余数不足 1 MB, 最后一个数据块的大小为余数的实际大小。所述 VBS还为每个数据块分配对应的 LBA。例如：

Blockl LBA:0000-1024

Block2 LBA: 1025-2048 S404: 所述 VBS为所述每个数据块确定对应的存储分区；

具体地，所述 VBS先确定每个待写入数据块的逻辑块地址（LBA ) ，再将所述用户卷 ID和每个数据块的 LBA组合成每个数据块 key值，根据分布式存储的算法，例如哈希算法，为每个数据块确定对应的存储分区。这里的 LBA可以是对原 LBA处理后的值，如 blockl对应的 LBA 0000-1024对应 1 , block2对应的 LBA1025-2048对应 2。

S405: 所述 VBS生成多个数据块写命令，其中，每个所述数据块对应一个所述数据块写命令，每个数据块写命令携带待写入数据块本身，以及待写入数据块 ID (例如 Block ID由用户卷 ID和待写入数据块 LBA组成）。

本步骤也可以在后续步骤执行完成后再执行，具体实施无时序限定。

S406: 所述 VBS根据所述每个数据块对应的存储分区，确定每个数据块所对应的读写控制模块。

具体地，所述 VBS根据全局分区信息表，确定每个数据块对应的读写控制模块。

S407: 所述 VBS分别向每个数据块对应的读写控制模块发送所述每个数据块写命令，以使得每个数据块对应的读写控制模块将所述每个数据块写入存储硬件资源上。

具体地，如果是 OSD接收到数据块写命令，所述 OSD根据所述待写入数据块的 ID查询自身保存的数据块元数据确定是否自身是否对该数据块 ID 进行第一次操作，如果是第一次操作，则为所述待写入数据块分配实际的物理地址，将所述待写入数据块写入所述物理地址对应的磁盘中，并更新自身保存的数据块元数据，记录所述待写入数据块的 ID与物理地址的对应关系；如果非第一次操作，所述 OSD根据所述待写入数据块的 ID查询自身保存的数据块元数据，确定所述待写入数据块对应的物理地址，将所述待写入数据块写入所述查询到的物理地址。

如果是 SSA接收到数据块写命令，所述 SSA根据所述待写入数据块的 ID查询自身保存的数据块元数据确定是否自身是否对该数据块 ID进行第一次操作，如果是第一次操作，则为所述待写入数据块分配实际的 SAN存储节点的存储阵列上的逻辑地址，即 LUN的地址，将所述待写入数据块写入所述 LUN的地址对应的磁盘中，并更新自身保存的数据块元数据，记录所述待写入数据块的 ID与 LUN的地址的对应关系；如果非第一次操作，所述 OSD根据所述待写入数据块的 ID查询自身保存的数据块元数据，确定所述待写入数据块对应的 LUN的地址，将所述待写入数据块写入所述查询到的 LUN的地址。

其中，所述 OSD或者 SSA在写操作的时候，可以将所述数据块先写到本地高速緩存层即返回响应消息，提高存储效率。

结合图 1 , 图 5为本发明实施例提供的釆用异构存储资源整合的服务器集群系统中用户读数据的处理流程：

S501：运行在所述服务器进群系统上的任意一个应用程序发起读数据操作之后，服务器集群系统中的 VBS接收到读数据操作请求。

所述读数据操作请求携带文件名和待读取数据的偏移量信息。

S502: 所述 VBS根据所述读数据操作请求携带的文件名，确定当前读操作对应的用户卷 ID, 根据所述待读取数据的偏移量信息确定所述待读取数据的 LBA。

S503: 所述 VBS根据所述用户卷的 ID和待读取数据的 LBA, 确定多个待读取数据块。

具体地，所述每个待读取数据块的 ID由所述用户卷和每个数据块的 LBA 组成，每个数据块的 LBA可以根据待读取的数据量的大小和待读取的数据的偏移量确定。

S504: 所述 VBS为所述每个待读取数据块确定对应的存储分区；具体地，所述 VBS先确定每个待读取数据块的逻辑块地址（LBA ) ，再将所述用户卷 ID和每个数据块的 LBA组合成每个数据块 key值，根据分布式存储的算法，例如哈希算法，为每个数据块确定对应的存储分区。

S505: 所述 VBS生成多个数据块读命令，其中，每个所述数据块对应一个所述数据块读命令，每个数据块读命令携带待读取数据块的 ID (例如 Block ID由用户卷 ID和待读取数据块 LBA组成。 S506: 所述 VBS根据所述每个数据块对应的存储分区，确定每个数据块所对应的读写控制模块。

S507: 所述 VBS分别向每个数据块对应的读写控制模块发送所述每个数据块读命令，以使得每个数据块对应的读写控制模块从存储硬件资源读取每个待读取数据块。

具体地，如果是 OSD接收到数据块读命令，所述 OSD根据所述待读取的物理地址，从所述物理地址对应的磁盘读取所述待写入数据块中。

如果是 SSA接收到数据块写命令，所述 SSA根据所述待写入数据块的储节点的存储阵列上的逻辑地址，即 LUN的地址，从所述 LUN的地址对应的磁盘中读取所述待读取数据块。

通过本发明实施例提供计算存储融合的集群系统，在硬件上解决了现有技术中因为使用专用 SAN而导致的操作复杂、成本较高的问题；存储设备可以有多个，每个存储设备上都可以部署緩存，在硬件上极大的提升了存储端緩存的扩展能力；存储资源不依赖于计算资源，存储资源可以独立的增加和减少，增强了系统的可扩展性；将系统中的持久化磁盘、緩存资源虚拟化为共享资源池并被所有计算共享，数据读写时所有计算和存储都可以参与，通过并发性的提高而提升了系统的存储性能。另外，由于本发明实施例提供计算存储融合的集群系统釆用高速数据交换网络进行通信，进一步加快了数据的交换速度。如图 6所示，为本发明实施例提供的服务器集群系统的又一组成图，所述服务器集群系统包括服务器节点 1和 2, 以及网络存储节点，即 A厂家的 SAN设备，所述服务器节点 1 包括硬盘 1和 2, 所述服务器节点 2包括硬盘 3, 所述网络存储节点包括存储阵列，即 LUN1和 LUN2, 所述服务器节点上运行分布式存储控制器，所述分布式存储控制器包括：

元数据控制器，本实施例中部署在两个服务器节点上，其中，部署在服务器节点 1的为主 MDC, 部署在服务器节点 2的为备 MDC, 所述元数据控制器用于将所述硬盘和所述存储阵列的存储资源划分为多个存储分区，所述多个存储分区组成共享存储资源池，为所述每个存储分区分配读写控制模块，生成全局分区信息，所述全局分区信息记录了所述共享存储资源池中的每个存储分区与读写控制模块的对应关系，以及向虚拟块服务模块下发所述全局分区信息；所述虚拟块服务模块，本实施例中每个服务器节点都部署了 VBS, 用于面向业务层，接收存储请求消息，确定所述存储请求消息对应的存储分区，根据所述全局分区信息，确定所述存储请求消息对应的存储分区对应的读写控制模块，以及向确定的所述读写控制模块发送所述存储请求消息；所述读写控制模块，用于面向所述硬盘或所述网络存储节点，执行所述存储请求消息所请求的操作。本实施例中包括部署在服务器节点 1 的 OSD1和 OSD2, 以及部署在服务器节点 2的 OSD3、 SSA1和 SSA2,其中，所述 OSD1用于对硬盘 1进行读写控制，所述 OSD2用于对硬盘 2进行读写控制，所述 OSD3用于对硬盘 3进行读写控制，所述 SSA1用于对 LUN1进行读写控制，所述 SSA2用于对 LUN2进行读写控制。所述元数据控制器，还用于分别确定所述对象存储代理和所述网络存储代理在所述服务器节点上的部署情况，并根据确定的部署情况生成读写控制模块的视图信息，所述读写控制模块的视图信息用于指示每个读写控制模块部署的服务器节点的信息，以及向所述虚拟块服务模块下发所述读写控制模块的视图信息；进一步，所述元数据控制器具体用于确定将所述对象存储代理部署在所述服务器集群系统中具备硬盘资源的服务器节点上，以及确定将所述网络存储代理部署在所述服务器集群系统中的负载小的服务器节点上。如本实施例中，所述元数据控制器将 SSA1和 SSA2部署在服务器节点

2上。所述虚拟块服务模块，具体用于根据所述读写控制模块的视图信息确定读写控制模块的路由信息，向确定的所述读写控制模块发送所述存储请求消息。图 6所示的本实施例，还可以执行如图 3-5任意之一所说的方法，本发明实施例在此不再赘述。如图 7, 为本发明实施例的计算机的结构组成示意图。本发明实施例的计算机可包括：处理器 701、存储器 702、系统总线 704和通信接口 705。 CPU701、存储器 702和通信接口 705之间通过系统总线 704连接并完成相互间的通信。处理器 701可能为单核或多核中央处理单元，或者为特定集合成电路，或者为被配置成实施本发明实施例的一个或多个集合成电路。存储器 702 可以为高速 RAM 存储器，也可以为非易失性存储器

( non-volatile memory ) , 例^口至少一个磁盘存 4诸器。存储器 702用于计算机执行指令 703。具体的，计算机执行指令 703中可以包括程序代码。当计算机运行时，处理器 701运行计算机执行指令 703, 可以执行本发明实施例任意一个实施例所提供的方法。更具体地说，本发明实施例中所述的分布式存储控制器如果通过计算机代码实现，则所述计算机执行本发明实施例的分布式存储控制器的功能。应理解，在本发明实施例中， "与 Α相应的 Β" 表示 B与 A相关联，根据 A可以确定 B。但还应理解，根据 A确定 B并不意味着仅仅根据 A确定 B, 还可以根据 A和 /或其它信息确定 B。本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

在本申请所提供的实施例中，应该理解到，所揭露的系统，可以通过其它的方式实现。例如，以上所描述的系统实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接，也可以是电的，机械的或其它的形式连接。为单元显示的部;可以是或者也可不是理单

可以根据实际的,、即可以位于一个地方，或者也可以分布到多个网络单元上。需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以釆用硬件的形式实现，也可以釆用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分，或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备 (可以是个人计算机，服务器，或者网络设备等）执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括： U盘、移动硬盘、只读存储器（ ROM, Read-Only Memory ) 、随机存取存储器 ( RAM, Random Access Memory ) 、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

权利要求书

1、一种共享存储资源的方法，其特征在于，应用于服务器集群系统，所述服务器集群系统包括服务器节点和网络存储节点，所述服务器节点包括硬盘，所述网络存储节点包括存储阵列，所述方法包括：将所述硬盘和所述存储阵列的存储资源划分为多个存储分区，所述多个存储分区组成共享存储资源池；为所述每个存储分区分配读写控制模块；生成全局分区信息，所述全局分区信息记录了所述共享存储资源池中的每个存储分区与读写控制模块的对应关系；接收存储请求消息，确定所述存储请求消息对应的存储分区；根据所述全局分区信息，确定所述存储请求消息对应的存储分区对应的读写控制模块；

向确定的所述读写控制模块发送所述存储请求消息，以使所述读写控制模块执行所述存储请求消息所请求的操作。

2、如权利要求 1 所述的方法，其特征在于，所述确定所述存储请求消息对应的存储分区包括：确定所述存储请求消息待操作的数据所在的用户卷 ID 和所述待操作的数据的至少一个数据块的逻辑块地址 LBA; 根据所述用户卷 ID和所述至少一个数据块的 LBA, 确定所述至少一个数据块对应的存储分区。

3、如权利要求 2所述的方法，其特征在于，所述方法还包括：建立所述共享存储资源池的每个存储分区的元数据，所述每个存储分区的元数据记录本存储分区 ID与被分配到本存储分区的数据块 ID的对应关系；则，所述根据所述用户卷 ID和所述至少一个数据块的 LBA, 确定所述至少一个数据块对应的存储分区包括：根据所述用户卷 ID和所述至少一个数据块的 LBA确定所述至少一个数据块的 ID , 查询所述每个存储分区的元数据，确定所述至少一个数据块对应的存储分区的 ID。

4、如权利要求 2所述的方法，其特征在于，所述根据所述用户卷 ID和所述至少一个数据块的 LBA,确定所述至少一个数据块对应的存储分区包括：

将所述用户卷 ID和每个数据块的 LBA组成所述每个数据块的 key值，计算所述每个数据块的 key值对应的 value值，根据所述 value值确定所述每个数据块对应的存储分区。

5、如权利要求 2或 3或 4所述的方法，其特征在于，所述接收存储请求消息包括：接收创建用户卷的命令，所述创建用户卷的命令指示所述用户卷的大小；则所述确定所述存储请求消息待操作的数据所在的用户卷 ID 和所述待操作的数据的至少一个数据块的逻辑块地址 LBA, 根据所述用户卷 ID 和所述至少一个数据块的 LBA, 确定所述至少一个数据块对应的存储分区，包括：

为所述用户卷分配所述用户卷 ID; 根据所述所述用户卷的大小，确定分配给所述用户卷的初始存储资源的大小，根据所述初始存储资源的大小确定至少一个数据块的 LBA;

根据所述用户卷 ID和所述至少一个数据块的 LBA, 确定所述至少一个数据块对应的存储分区。

6、如权利要求 5所述的方法，其特征在于，所述确定分配给所述用户卷的初始存储资源的大小包括：

所述初始存储资源的大小小于或等于所述创建用户卷的命令指示的所述用户卷的大小。

7、如权利要求 2或 3或 4所述的方法，其特征在于，所述接收存储请求消息包括：接收写数据操作请求；则所述确定所述存储请求消息待操作的数据所在的用户卷 ID 和所述待操作的数据的至少一个数据块的逻辑块地址 LBA, 根据所述用户卷 ID 和所述至少一个数据块的 LBA, 确定所述至少一个数据块对应的存储分区，包括：根据所述写数据操作请求携带的文件名，确定当前写操作对应的用户卷

ID; 将待写入的数据划分为多个待写入数据块，并为每个待写入数据块分配 LBA; 根据所述当前写操作对应的用户卷 ID 和所述每个待写入数据块的 LBA, 确定所述每个待写入数据块对应的存储分区。

8、如权利要求 7所述的方法，其特征在于，所述将待写入的数据划分为大小平均的所述多个待写入数据块。

9、如权利要求 8所述的方法，其特征在于，所述根据所述全局分区信息，确定所述存储请求消息对应的读写控制模块；向确定的所述读写控制模块发送所述存储请求消息，以使所述读写控制模块执行所述存储请求消息所请求的操作，包括：根据所述全局分区信息，确定所述每个待写入数据块对应的存储分区所对应的读写控制模块；生成多个数据块写命令，其中，每个数据块写命令对应一个所述待写入数据块，所述每个数据块写命令携带待写入数据块以及待写入数据的 ID; 分别向所述每个待写入数据块对应的读写控制模块发送所述每个数据块写命令，以使得所述每个待写入数据块对应的读写控制模块将所述每个待写入数据块写入存储硬件资源。

10、如权利要求 2或 3或 4所述的方法，其特征在于，所述接收存储请求消息包括：接收读数据操作请求，所述读数据操作请求携带文件名和待读取数据的偏移量；则所述确定所述存储请求消息待操作的数据所在的用户卷 ID 和所述待操作的数据的至少一个数据块的逻辑块地址 LBA, 根据所述用户卷 ID 和所述至少一个数据块的 LBA , 确定所述至少一个数据块对应的存储分区，包括：根据所述读数据操作请求携带的文件名，确定当前读操作对应的用户卷 ID; 根据所述待读取数据的偏移量信息，确定多个待读取数据块的 LBA; 根据所述当前读操作对应的用户卷 ID和每个待读取数据块的 LBA, 确定所述每个待读取数据块对应的存储分区。

1 1、如权利要求 10 所述的方法，其特征在于，根据所述待读取数据的偏移量信息，确定多个大小平均的所述待读取数据块。

12、如权利要求 10所述的方法，其特征在于，所述根据所述全局分区信息，确定所述存储请求消息对应的读写控制模块；向确定的所述读写控制模块发送所述存储请求消息，以使所述读写控制模块执行所述存储请求消息所请求的操作，包括：根据所述全局分区信息，确定所述多个待读取数据块对应的存储分区所对应的读写控制模块；生成多个数据块读命令，其中，每个数据块读命令对应一个所述待读取数据块，所述每个数据块读命令携带待读取数据块以及待读取数据块的 ID; 分别向所述每个待读取数据块对应的读写控制模块发送所述每个数据块读命令，以使得所述每个待读取数据块对应的读写控制模块读取所述每个待读取数据块。

13、一种服务器集群系统，其特征在于，所述服务器集群系统包括服务器节点和网络存储节点，所述服务器节点包括硬盘，所述网络存储节点包括存储阵列，所述服务器节点上运行分布式存储控制器，所述分布式存储控制器包括：元数据控制器，用于将所述硬盘和所述存储阵列的存储资源划分为多个存储分区，所述多个存储分区组成共享存储资源池，为所述每个存储分区分配读写控制模块，生成全局分区信息，所述全局分区信息记录了所述共享存储资源池中的每个存储分区与读写控制模块的对应关系，以及向虚拟块服务模块下发所述全局分区信息；

14、如权利要求 13所述的系统，其特征在于，所述读写控制模块包括对象存储代理和网络存储代理；所述元数据控制器具体用于为所述本地硬盘组成的存储分区分配所述对象存储代理作为读写控制模块，为所述存储阵列组成的存储分区分配所述网络存储代理作为读写控制模块；所述对象存储代理，用于接收存储请求消息，确定所述存储请求消息对应的物理地址，根据所述物理地址在所述硬盘上执行所述存储请求消息所请求的操作；所述网络存储代理，用于接收存储请求消息，确定所述存储请求消息对应的网络存储节点的逻辑地址，根据所述逻辑地址在所述存储阵列上执行所述存储请求消息所请求的操作。

15、如权利要求 13 所述的系统，其特征在于，所述虚拟块服务模块，具体用于确定所述存储请求消息待操作的数据所在的用户卷 ID 和所述待操作的数据的至少一个数据块的逻辑块地址 LBA, 根据所述用户卷 ID和所述至少一个数据块的 LBA, 确定所述至少一个数据块对应的存储分区。

16、如权利要求 15 所述的系统，其特征在于，所述虚拟块服务模块，具体用于建立所述共享存储资源池的每个存储分区的元数据，所述每个存储分区的元数据记录本存储分区 ID与被分配到本存储分区的数据块 ID的对应关系，根据所述用户卷 ID和所述至少一个数据块的 LBA确定所述至少一个数据块的 ID , 查询所述每个存储分区的元数据，确定所述至少一个数据块对应的存储分区的 ID。

17、如权利要求 15 所述的系统，其特征在于，所述虚拟块服务模块，具体用于将所述用户卷 ID 和每个数据块的 LBA 组成所述每个数据块的 key值，计算所述每个数据块的 key值对应的 value值，根据所述 value 值确定所述每个数据块对应的存储分区。

18、如权利要求 13-17任一项所述的系统，其特征在于，所述虚拟块服务模块，具体用于接收创建用户卷的命令，所述创建用户卷的命令指示所述用户卷的大小，为所述用户卷分配所述用户卷 ID , 根据所述所述用户卷的大小，确定分配给所述用户卷的初始存储资源的大小，根据所述初始存储资源的大小确定至少一个数据块的 LBA, 以及居所述用户卷 ID和所述至少一个数据块的 LBA, 确定所述至少一个数据块对应的存储分区。

19、如权利要求 13-17任一项所述的系统，其特征在于，所述虚拟块服务模块，具体用于接收写数据操作请求，根据所述写数据操作请求携带的文件名，确定当前写操作对应的用户卷 ID, 将待写入的数据划分为多个待写入数据块，并为每个待写入数据块分配 LBA, 根据所述当前写操作对应的用户卷 ID和所述每个待写入数据块的 LBA,确定所述每个待写入数据块对应的存储分区，根据所述全局分区信息，确定所述每个待写入数据块对应的存储分区所对应的读写控制模块，生成多个数据块写命令，其中，每个数据块写命令对应一个所述待写入数据块，所述每个数据块写命令携带待写入数据块以及待写入数据的 ID, 以及分别向所述每个待写入数据块对应的读写控制模块发送所述每个数据块写命令。

20、如权利要求 13-17任一项所述的系统，其特征在于，所述虚拟块服务模块，具体用于接收读数据操作请求，所述读数据操作请求携带文件名和待读取数据的偏移量，根据所述读数据操作请求携带的文件名，确定当前读操作对应的用户卷 ID, 根据所述待读取数据的偏移量信息，确定多个待读取数据块的 LBA, 以及根据所述当前读操作对应的用户卷 ID和每个待读取数据块的 LBA, 确定所述每个待读取数据块对应的存储分区，根据所述全局分区信息，确定所述多个待读取数据块对应的存储分区所对应的读写控制模块，生成多个数据块读命令，其中，每个数据块读命令对应一个所述待读取数据块，所述每个数据块读命令携带待读取数据块以及待读取数据块的 ID, 以及分别向所述每个待读取数据块对应的读写控制模块发送所述每个数据块读命令。

21、如权利要求 13-17任一项所述的系统，其特征在于，所述元数据控制器，还用于分别确定所述对象存储代理和所述网络存储代理在所述服务器节点上的部署情况，并根据确定的部署情况生成读写控制模块的视图信息，所述读写控制模块的视图信息用于指示每个读写控制模块部署的服务器节点的信息，以及向所述虚拟块服务模块下发所述读写控制模块的视图信息；所述虚拟块服务模块，具体用于根据所述读写控制模块的视图信息确定读写控制模块的路由信息，向确定的所述读写控制模块发送所述存储请求消息。

22、如权利要求 21 所述的系统，其特征在于，所述元数据控制器具体用于确定将所述对象存储代理部署在所述服务器集群系统中具备硬盘资源的服务器节点上，以及确定将所述网络存储代理部署在所述服务器集群系统中的负载小的服务器节点上。

23、如权利要求 21 所述的系统，其特征在于，所述元数据控制器，还用于搜集所述服务器节点的硬盘的可用存储资源和所述网络存储节点的存储阵列的可用存储资源，将所述硬盘和所述存储阵列的可用存储资源划分为多个存储分区。

24、一种计算机，其特征在于，包括：处理器、存储器、总线和通信接口；

所述存储器用于存储计算机执行指令，所述处理器与所述存储器通过所述总线连接，当所述计算机运行时，所述处理器执行所述存储器存储的所述计算机执行指令，以使所述计算机执行如权利要求 1 -12任一项所述的创建虚拟机的方法。

25、一种计算机可读介质，其特征在于，包括计算机执行指令，当计算机的处理器执行所述计算机执行指令时，所述计算机执行如权利要求 1 -12任一项所述的创建虚拟机的方法。