CN110222013A - 一种集群存储容量确定的方法、系统、设备及存储介质 - Google Patents

一种集群存储容量确定的方法、系统、设备及存储介质 Download PDF

Info

Publication number
CN110222013A
CN110222013A CN201910500907.7A CN201910500907A CN110222013A CN 110222013 A CN110222013 A CN 110222013A CN 201910500907 A CN201910500907 A CN 201910500907A CN 110222013 A CN110222013 A CN 110222013A
Authority
CN
China
Prior art keywords
cluster
group
order
data object
mapping relations
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910500907.7A
Other languages
English (en)
Other versions
CN110222013B (zh
Inventor
张伯言
张晓伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sangfor Technologies Co Ltd
Original Assignee
Sangfor Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sangfor Technologies Co Ltd filed Critical Sangfor Technologies Co Ltd
Priority to CN201910500907.7A priority Critical patent/CN110222013B/zh
Publication of CN110222013A publication Critical patent/CN110222013A/zh
Application granted granted Critical
Publication of CN110222013B publication Critical patent/CN110222013B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • G06F16/137Hash-based
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请公开了一种集群存储容量确定的方法,包括:根据集群状态信息构建OSD与归置组的映射关系;计算集群中归置组的数量;通过Hash算法确定归置组与数据对象的映射关系,并确定数据对象的数量;根据数据对象的数量及数据对象的大小确定集群的存储容量。本申请不需要实际部署集群存储环境便可推算出集群实际可用的存储容量及数据分布情况,便于用户对集群的存储池类型、磁盘种类、磁盘数量及节点类型做选择,对客户及测试人员能够起到指导作用,极大的提高了用户友好度。本申请同时还提供了一种集群存储容量确定的系统、设备及计算机可读存储介质,具有上述有益效果。

Description

一种集群存储容量确定的方法、系统、设备及存储介质
技术领域
本申请涉及集群领域,特别涉及一种集群存储容量确定的方法、系统、设备及计算机可读存储介质。
背景技术
Ceph是一种为优秀的性能、可靠性和可扩展性而设计的统一的、分布式文件系统,Ceph分布式文件系统可以轻松地扩展到PB容量,如此大的集群存储容量都是通过一个个磁盘组建起来的。磁盘是数据的最终载体,当集群存在的磁盘数量一定的时候,集群所储存的数据量也是固定的。
然而,由于Ceph文件系统本身会占用存储空间(例如每个OSD有两个系统相关的固定分区占用为100M和15G),而且不同的存储池类型会对容量产生影响,同时对于特殊的磁盘容量限制(例如集群某个磁盘达到存储容量上限之后,集群不允许存储数据),导致在没有实际部署集群存储环境的情况下集群的存储容量无法计算,也无法满足在客户现场规定硬盘的种类,估算出在这种场景下所能存储的最大容量的要求。
因此,如何在没有实际部署集群存储环境的情况下计算集群存储容量是本领域技术人员目前需要解决的技术问题。
发明内容
本申请的目的是提供一种集群存储容量确定的方法、系统、设备及计算机可读存储介质,用于在没有实际部署集群存储环境的情况下计算集群存储容量。
为解决上述技术问题,本申请提供一种集群存储容量确定的方法,该方法包括:
获取集群状态信息;
根据所述集群状态信息构建OSD与归置组的映射关系;
根据所述OSD与所述归置组的映射关系及所述集群状态信息计算所述集群中所述归置组的数量;
通过Hash算法确定所述归置组与数据对象的映射关系,并根据所述归置组与所述数据对象的映射关系及所述归置组的数量确定所述数据对象的数量;
根据所述数据对象的数量及所述数据对象的大小确定所述集群的存储容量。
可选的,所述通过Hash算法确定所述归置组与数据对象的映射关系,包括:
计算所述数据对象的Hash值,并将所述数据对象的Hash值与所述归置组数量取余,得到所述数据对象映射的归置组编号,以确定所述归置组与所述数据对象的映射关系。
可选的,所述集群状态信息包括存储池类型、磁盘种类及节点类型,所述根据所述集群状态信息构建OSD与归置组的映射关系,包括:
根据所述存储池类型、所述磁盘种类及所述节点类型通过集群CRUSH算法构建OSD与归置组的映射关系。
可选的,所述集群状态信息还包括磁盘数量,所述根据所述OSD与所述归置组的映射关系及所述集群状态信息计算所述集群中所述归置组的数量,包括:
根据所述OSD与所述归置组的映射关系、所述磁盘种类及所述磁盘数量分别计算所述集群中的各磁盘中归置组的数量;
将各所述磁盘中归置组的数量的和作为所述集群中所述归置组的数量。
可选的,在根据所述OSD与所述归置组的映射关系、所述磁盘种类及所述磁盘数量分别计算所述集群中的各磁盘中归置组的数量之后,还包括:
根据所述归置组与所述数据对象的映射关系及各所述磁盘中归置组的数量分别确定各所述磁盘中数据对象的数量;
根据各所述磁盘中数据对象的数量确定所述集群的数据分布情况。
本申请还提供一种集群存储容量确定的系统,该系统包括:
获取模块,用于获取集群状态信息;
构建模块,用于根据所述集群状态信息构建OSD与归置组的映射关系;
计算模块,用于根据所述OSD与所述归置组的映射关系及所述集群状态信息计算所述集群中所述归置组的数量;
第一确定模块,用于通过Hash算法确定所述归置组与数据对象的映射关系,并根据所述归置组与所述数据对象的映射关系及所述归置组的数量确定所述数据对象的数量;
第二确定模块,用于根据所述数据对象的数量及所述数据对象的大小确定所述集群的存储容量。
可选的,所述第一确定模块包括:
确定子模块,用于计算所述数据对象的Hash值,并将所述数据对象的Hash值与所述归置组数量取余,得到所述数据对象映射的归置组编号,以确定所述归置组与所述数据对象的映射关系。
可选的,所述集群状态信息包括存储池类型、磁盘种类及节点类型,所述构建模块包括:
构建子模块,用于根据所述存储池类型、所述磁盘种类及所述节点类型通过集群CRUSH算法构建OSD与归置组的映射关系。
本申请还提供一种集群存储容量确定设备,该集群存储容量确定设备包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上述任一项所述集群存储容量确定的方法的步骤。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一项所述集群存储容量确定的方法的步骤。
本申请所提供集群存储容量确定的方法,包括:获取集群状态信息;根据集群状态信息构建OSD与归置组的映射关系;根据OSD与归置组的映射关系及集群状态信息计算集群中归置组的数量;通过Hash算法确定归置组与数据对象的映射关系,并根据归置组与数据对象的映射关系及归置组的数量确定数据对象的数量;根据数据对象的数量及数据对象的大小确定集群的存储容量。
本申请所提供的技术方案,通过获取到的集群状态信息模拟集群数据分布的规律,不需要实际部署集群存储环境便可推算出集群实际可用的存储容量及数据分布情况,能够满足在客户现场规定硬盘的种类,估算出在这种场景下所能存储的最大容量的要求,便于用户对集群的存储池类型、磁盘种类、磁盘数量及节点类型做选择,对客户及测试人员能够起到指导作用,极大的提高了用户友好度。本申请同时还提供了一种集群存储容量确定的系统、设备及计算机可读存储介质,具有上述有益效果,在此不再赘述。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例所提供的一种集群存储容量确定的方法的流程图;
图2为图1所提供的一种集群存储容量确定的方法中S103的一种实际表现方式的流程图;
图3为本申请实施例所提供的一种集群存储容量确定的系统的结构图;
图4为本申请实施例所提供的另一种集群存储容量确定的系统的结构图;
图5为本申请实施例所提供的一种集群存储容量确定设备的结构图。
具体实施方式
本申请的核心是提供一种集群存储容量确定的方法、系统、设备及计算机可读存储介质,用于在没有实际部署集群存储环境的情况下计算集群存储容量。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参考图1,图1为本申请实施例所提供的一种集群存储容量确定的方法的流程图。
其具体包括如下步骤:
S101:获取集群状态信息;
Ceph分布式文件系统的不同存储池类型会限制数据在磁盘上的备份存储情况,不同的备份会造成实际存储空间的不同。同时,由于Ceph采用的crush算法为伪随机算法,所以数据分布不是绝对均匀的。集群在某一个磁盘容量达到最大阈值时,为防止数据丢失,集群会停止读写,这就导致在没有实际部署集群存储环境的情况下集群的存储容量无法计算,也无法满足在客户现场规定硬盘的种类,估算出在这种场景下所能存储的最大容量的要求,而本申请提供了一种集群存储容量确定的方法,用于解决上述问题;
在Ceph的原有逻辑中,数据从上到下的存储至少要经历三次映射:
(1)从文件到Object对象的映射;
(2)从Object对象到归置组的映射;
(3)从归置组到对象存储设备的映射;
第一次映射是直接切分文件,第二次映射使用了Hash算法,第三次映射就是使用的CRUSH算法,由此看出在集群状态信息一定的情况下,数据分布是可以模拟出来的。本申请以CRUSH算法为基础,在没有实际部署集群存储环境的情况下只根据磁盘种类和存储池类型便能够计算出实际存储可用容量;
这里提到的集群状态信息具体可以包括集群的存储池类型、磁盘种类、磁盘数量及节点类型,其中:
集群的存储池类型包括多副本类型和EC类型,本申请可以根据集群具体的存储池类型选择映射的容量计算方法;其中,多副本类型的存储池需更多原始存储空间,但已实现所有Ceph操作;EC类型的存储池所需原始存储空间较少,但目前仅实现了部分Ceph操作;
磁盘种类及磁盘数量用于确定集群的全部容量,是后面计算可用容量的基础;其中,磁盘种类具体可以包括固态硬盘、机械硬盘、混合硬盘等;
节点类型包括单节点类型和三节点类型,指定了算法映射的集群规模及故障域。
S102:根据集群状态信息构建OSD与归置组的映射关系;
这里提到的OSD即为Object Storage Device,对象存储设备,它的主要功能是存储数据、复制数据、平衡数据、恢复数据等,与其它OSD间进行心跳检查等,并将一些变化情况上报给Ceph监视器,一般情况下一块硬盘对应一个OSD,由OSD来对硬盘存储进行管理,一个分区也可以成为一个OSD;
这里提到的归置组(Placement Group,PG)的用途是对存储中的数据对象进行组织和位置映射,这是一个逻辑的概念,一个PG会被映射到n个OSD上,而每个OSD上都会承载大量的PG,即,PG和OSD之间是“多对多”映射关系;
这里提到的根据集群状态信息构建OSD与归置组的映射关系的目的在于,根据OSD与归置组的映射关系计算归置组的数量;
可选的,该集群状态信息可以包括存储池类型、磁盘种类及节点类型,相应的,这里提到的根据集群状态信息构建OSD与归置组的映射关系,其具体可以为:
根据存储池类型、磁盘种类及节点类型通过集群CRUSH算法构建OSD与归置组的映射关系;
CRUSH算法是受控复制的分布式Hash算法,是Ceph里面用于控制数据分布的一种方法,能够高效稳定的将数据分布在普通的结构化的集群中。它是一种伪随机的算法,在相同的环境下,相似的输入得到的结果之间没有相关性,相同的输入得到的结果是确定的。它只需要一个集群的描述地图和一些规则就可以根据一个整型的输入得到存放数据的一个设备列表。
本申请实施例以CRUSH算法为基础,将集群状态信息作为CRUSH算法的输入,得到集群中的PG与OSD之间的映射关系,再根据PG与OSD的映射关系结合集群状态信息计算集群中归置组的数量,进而计算集群的容量。
S103:根据OSD与归置组的映射关系及集群状态信息计算集群中归置组的数量;
S104:通过Hash算法确定归置组与数据对象的映射关系,并根据归置组与数据对象的映射关系及归置组的数量确定数据对象的数量;
这里提到的数据对象即为文件传到rados层时被切分成的Object对象,Object对象是Ceph最底层的存储单元,每个Object对象包含元数据和原始数据,每个Object对象会映射多个PG;
可选的,这里提到的通过Hash算法确定归置组与数据对象的映射关系,其具体可以为:
计算数据对象的Hash值,并将数据对象的Hash值与归置组数量取余,得到数据对象映射的归置组编号,以确定归置组与数据对象的映射关系。
S105:根据数据对象的数量及数据对象的大小确定集群的存储容量。
由于系统写入的数据对象具有固定大小,因此在明确了数据对象与PG的映射关系及PG的数量后,便可以根据数据对象与PG的映射关系及PG的数量确定集群的容量;
例如,数据对象大小为m,在明确了数据对象与PG的映射关系为3:1、PG的数量为n后,便可以确定集群的容量为m×n×3=3mn;
基于上述技术方案,本申请所提供的一种集群存储容量确定的方法,通过根据获取到的集群状态信息模拟集群数据分布的规律,不需要实际部署集群存储环境便可推算出集群实际可用的存储容量及数据分布情况,能够满足在客户现场规定硬盘的种类,估算出在这种场景下所能存储的最大容量的要求,便于用户对集群的存储池类型、磁盘种类、磁盘数量及节点类型做选择,对客户及测试人员能够起到指导作用,极大的便提高了用户友好度。
基于上述实施例,该集群状态信息还可以包括磁盘数量,相应的,步骤S103中所描述的根据OSD与归置组的映射关系及集群状态信息计算集群中归置组的数量,其具体也可以为如图2所示的步骤,下面结合图2进行说明。
请参考图2,图2为图1所提供的一种集群存储容量确定的方法中S103的一种实际表现方式的流程图。
其具体包括以下步骤:
S201:根据OSD与归置组的映射关系、磁盘种类及磁盘数量分别计算集群中的各磁盘中归置组的数量;
S202:将各磁盘中归置组的数量的和作为集群中归置组的数量。
可选的,在根据OSD与归置组的映射关系、磁盘种类及磁盘数量分别计算集群中的各磁盘中归置组的数量之后,还可以执行如下步骤:
根据归置组与数据对象的映射关系及各磁盘中归置组的数量分别确定各磁盘中数据对象的数量;
根据各磁盘中数据对象的数量确定集群的数据分布情况。
进一步的,还可以根据集群的容量及集群的数据分布情况生成集群数据分布报告,并通过指定路径发送集群数据分布报告,以使用户能够及时获取到该数据分布报告,并根据该数据分布报告确定集群实际可用的存储容量及数据分布情况,能够对客户及测试人员起指导作用。除此之外,虚拟出的模型可以模拟出虚拟的存储环境,对于研究学习相关原理起到一定辅助作用;
其中,该通过指定路径发送集群数据分布报告可以包括但不限于通过邮件、短信、服务器IP地址等路径发送该集群数据分布报告。
请参考图3,图3为本申请实施例所提供的一种集群存储容量确定的系统的结构图。
该系统可以包括:
获取模块100,用于获取集群状态信息;
构建模块200,用于根据集群状态信息构建OSD与归置组的映射关系;
计算模块300,用于根据OSD与归置组的映射关系及集群状态信息计算集群中归置组的数量;
第一确定模块400,用于通过Hash算法确定归置组与数据对象的映射关系,并根据归置组与数据对象的映射关系及归置组的数量确定数据对象的数量;
第二确定模块500,用于根据数据对象的数量及数据对象的大小确定集群的存储容量。
请参考图4,图4为本申请实施例所提供的另一种集群存储容量确定的系统的结构图。
该第一确定模块400可以包括:
第一确定子模块,用于计算数据对象的Hash值,并将数据对象的Hash值与归置组数量取余,得到数据对象映射的归置组编号,以确定归置组与数据对象的映射关系。
该集群状态信息包括存储池类型、磁盘种类及节点类型,该构建模块200可以包括:
构建子模块,用于根据存储池类型、磁盘种类及节点类型通过集群CRUSH算法构建OSD与归置组的映射关系。
该计算模块300可以包括:
计算子模块,用于根据OSD与归置组的映射关系、磁盘种类及磁盘数量分别计算集群中的各磁盘中归置组的数量;
求和子模块,用于将各磁盘中归置组的数量的和作为集群中归置组的数量。
该计算模块300还可以包括:
第二确定子模块,用于根据归置组与数据对象的映射关系及各磁盘中归置组的数量分别确定各磁盘中数据对象的数量;
数据分布子模块,用于根据各磁盘中数据对象的数量确定集群的数据分布情况。
由于系统部分的实施例与方法部分的实施例相互对应,因此系统部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。
请参考图5,图5为本申请实施例所提供的一种集群存储容量确定设备的结构图。
该集群存储容量确定设备600可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)622(例如,一个或一个以上处理器)和存储器632,一个或一个以上存储应用程序642或数据644的存储介质630(例如一个或一个以上海量存储设备)。其中,存储器632和存储介质630可以是短暂存储或持久存储。存储在存储介质630的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对装置中的一系列指令操作。更进一步地,处理器622可以设置为与存储介质630通信,在集群存储容量确定设备600上执行存储介质630中的一系列指令操作。
集群存储容量确定设备600还可以包括一个或一个以上电源626,一个或一个以上有线或无线网络接口650,一个或一个以上输入输出接口658,和/或,一个或一个以上操作系统641,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
上述图1至图2所描述的集群存储容量确定的方法中的步骤由集群存储容量确定设备基于该图5所示的结构实现。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和模块的具体工作过程,可以参考前述方法实施例中的映射过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置、设备和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,功能调用装置,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上对本申请所提供的一种集群存储容量确定的方法、系统、设备及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (10)

1.一种集群存储容量确定的方法,其特征在于,包括:
获取集群状态信息;
根据所述集群状态信息构建OSD与归置组的映射关系;
根据所述OSD与所述归置组的映射关系及所述集群状态信息计算所述集群中所述归置组的数量;
通过Hash算法确定所述归置组与数据对象的映射关系,并根据所述归置组与所述数据对象的映射关系及所述归置组的数量确定所述数据对象的数量;
根据所述数据对象的数量及所述数据对象的大小确定所述集群的存储容量。
2.根据权利要求1所述的方法,其特征在于,所述通过Hash算法确定所述归置组与数据对象的映射关系,包括:
计算所述数据对象的Hash值,并将所述数据对象的Hash值与所述归置组数量取余,得到所述数据对象映射的归置组编号,以确定所述归置组与所述数据对象的映射关系。
3.根据权利要求1所述的方法,其特征在于,所述集群状态信息包括存储池类型、磁盘种类及节点类型,所述根据所述集群状态信息构建OSD与归置组的映射关系,包括:
根据所述存储池类型、所述磁盘种类及所述节点类型通过集群CRUSH算法构建OSD与归置组的映射关系。
4.根据权利要求3所述的方法,其特征在于,所述集群状态信息还包括磁盘数量,所述根据所述OSD与所述归置组的映射关系及所述集群状态信息计算所述集群中所述归置组的数量,包括:
根据所述OSD与所述归置组的映射关系、所述磁盘种类及所述磁盘数量分别计算所述集群中的各磁盘中归置组的数量;
将各所述磁盘中归置组的数量的和作为所述集群中所述归置组的数量。
5.根据权利要求4所述的方法,其特征在于,在根据所述OSD与所述归置组的映射关系、所述磁盘种类及所述磁盘数量分别计算所述集群中的各磁盘中归置组的数量之后,还包括:
根据所述归置组与所述数据对象的映射关系及各所述磁盘中归置组的数量分别确定各所述磁盘中数据对象的数量;
根据各所述磁盘中数据对象的数量确定所述集群的数据分布情况。
6.一种集群存储容量确定的系统,其特征在于,包括:
获取模块,用于获取集群状态信息;
构建模块,用于根据所述集群状态信息构建OSD与归置组的映射关系;
计算模块,用于根据所述OSD与所述归置组的映射关系及所述集群状态信息计算所述集群中所述归置组的数量;
第一确定模块,用于通过Hash算法确定所述归置组与数据对象的映射关系,并根据所述归置组与所述数据对象的映射关系及所述归置组的数量确定所述数据对象的数量;
第二确定模块,用于根据所述数据对象的数量及所述数据对象的大小确定所述集群的存储容量。
7.根据权利要求6所述的系统,其特征在于,所述第一确定模块包括:
确定子模块,用于计算所述数据对象的Hash值,并将所述数据对象的Hash值与所述归置组数量取余,得到所述数据对象映射的归置组编号,以确定所述归置组与所述数据对象的映射关系。
8.根据权利要求6所述的系统,其特征在于,所述集群状态信息包括存储池类型、磁盘种类及节点类型,所述构建模块包括:
构建子模块,用于根据所述存储池类型、所述磁盘种类及所述节点类型通过集群CRUSH算法构建OSD与归置组的映射关系。
9.一种集群存储容量确定设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至5任一项所述集群存储容量确定的方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述集群存储容量确定的方法的步骤。
CN201910500907.7A 2019-06-11 2019-06-11 一种集群存储容量确定的方法、系统、设备及存储介质 Active CN110222013B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910500907.7A CN110222013B (zh) 2019-06-11 2019-06-11 一种集群存储容量确定的方法、系统、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910500907.7A CN110222013B (zh) 2019-06-11 2019-06-11 一种集群存储容量确定的方法、系统、设备及存储介质

Publications (2)

Publication Number Publication Date
CN110222013A true CN110222013A (zh) 2019-09-10
CN110222013B CN110222013B (zh) 2023-05-12

Family

ID=67816483

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910500907.7A Active CN110222013B (zh) 2019-06-11 2019-06-11 一种集群存储容量确定的方法、系统、设备及存储介质

Country Status (1)

Country Link
CN (1) CN110222013B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111752483A (zh) * 2020-05-28 2020-10-09 苏州浪潮智能科技有限公司 一种存储集群中存储介质变更减少重构数据的方法及系统
CN111857592A (zh) * 2020-07-21 2020-10-30 星辰天合(北京)数据科技有限公司 基于对象存储系统的数据存储方法及装置、电子设备
CN112148219A (zh) * 2020-09-16 2020-12-29 北京优炫软件股份有限公司 一种ceph类型的分布式存储集群设计方法及装置
CN112214447A (zh) * 2020-10-10 2021-01-12 中科声龙科技发展(北京)有限公司 工作量证明运算芯片集群数据动态重构方法、系统和装置
WO2021077745A1 (zh) * 2019-10-25 2021-04-29 浪潮电子信息产业股份有限公司 一种分布式存储系统的数据读写方法
CN114138181A (zh) * 2021-10-24 2022-03-04 济南浪潮数据技术有限公司 一种绑定池放置组选主的方法、装置、设备及可读介质
CN115499304A (zh) * 2022-07-29 2022-12-20 天翼云科技有限公司 一种分布式存储的自动化部署方法、装置、设备及产品

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050055510A (ko) * 2003-12-08 2005-06-13 한국전자통신연구원 메모리 기반의 스냅샷 상태 테이블을 이용한 대용량 공유저장장치의 스냅샷 수행방법
EP2375346A1 (en) * 2010-04-12 2011-10-12 Tixel GmbH Computer system comprising a clustered storage device and method for operating the same
CN102855294A (zh) * 2012-08-13 2013-01-02 北京联创信安科技有限公司 一种智能哈希数据布局方法、集群存储系统及其方法
CN104376109A (zh) * 2014-11-28 2015-02-25 国家电网公司 一种基于数据分布库的多维度数据分布方法
US20160291892A1 (en) * 2015-03-30 2016-10-06 Formation Data Systems, Inc. Volume Admission Control for High-Performance Distributed Data Storage System
US20160330281A1 (en) * 2015-05-07 2016-11-10 Dell Products L.P. Systems and methods to improve read/write performance in object storage applications
CN106980647A (zh) * 2017-02-24 2017-07-25 深圳市中博睿存信息技术有限公司 一种分布式文件系统数据分布方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050055510A (ko) * 2003-12-08 2005-06-13 한국전자통신연구원 메모리 기반의 스냅샷 상태 테이블을 이용한 대용량 공유저장장치의 스냅샷 수행방법
EP2375346A1 (en) * 2010-04-12 2011-10-12 Tixel GmbH Computer system comprising a clustered storage device and method for operating the same
CN102855294A (zh) * 2012-08-13 2013-01-02 北京联创信安科技有限公司 一种智能哈希数据布局方法、集群存储系统及其方法
CN104376109A (zh) * 2014-11-28 2015-02-25 国家电网公司 一种基于数据分布库的多维度数据分布方法
US20160291892A1 (en) * 2015-03-30 2016-10-06 Formation Data Systems, Inc. Volume Admission Control for High-Performance Distributed Data Storage System
US20160330281A1 (en) * 2015-05-07 2016-11-10 Dell Products L.P. Systems and methods to improve read/write performance in object storage applications
CN106980647A (zh) * 2017-02-24 2017-07-25 深圳市中博睿存信息技术有限公司 一种分布式文件系统数据分布方法及装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021077745A1 (zh) * 2019-10-25 2021-04-29 浪潮电子信息产业股份有限公司 一种分布式存储系统的数据读写方法
CN111752483A (zh) * 2020-05-28 2020-10-09 苏州浪潮智能科技有限公司 一种存储集群中存储介质变更减少重构数据的方法及系统
CN111857592A (zh) * 2020-07-21 2020-10-30 星辰天合(北京)数据科技有限公司 基于对象存储系统的数据存储方法及装置、电子设备
CN112148219A (zh) * 2020-09-16 2020-12-29 北京优炫软件股份有限公司 一种ceph类型的分布式存储集群设计方法及装置
CN112214447A (zh) * 2020-10-10 2021-01-12 中科声龙科技发展(北京)有限公司 工作量证明运算芯片集群数据动态重构方法、系统和装置
CN114138181A (zh) * 2021-10-24 2022-03-04 济南浪潮数据技术有限公司 一种绑定池放置组选主的方法、装置、设备及可读介质
CN114138181B (zh) * 2021-10-24 2024-06-11 郑州浪潮数据技术有限公司 一种绑定池放置组选主的方法、装置、设备及可读介质
CN115499304A (zh) * 2022-07-29 2022-12-20 天翼云科技有限公司 一种分布式存储的自动化部署方法、装置、设备及产品
CN115499304B (zh) * 2022-07-29 2024-03-08 天翼云科技有限公司 一种分布式存储的自动化部署方法、装置、设备及产品

Also Published As

Publication number Publication date
CN110222013B (zh) 2023-05-12

Similar Documents

Publication Publication Date Title
CN110222013A (zh) 一种集群存储容量确定的方法、系统、设备及存储介质
US20160349993A1 (en) Data-driven ceph performance optimizations
CN104639406B (zh) 基于动态使用关系建模计算机网络拓扑
CN111290699B (zh) 数据迁移方法、装置及系统
JP2017530454A (ja) エクステントごとのチェックサムを用いたファイルシステム
CN110110174A (zh) 数据可视化页面的生成、监听及展示方法、浏览器及服务器
CN104158748B (zh) 一种面向云计算网络的拓扑探测方法
US7024652B1 (en) System and method for adaptive partitioning of circuit components during simulation
CN106993064A (zh) 一种基于Openstack云平台实现海量数据可伸缩性存储的系统及其构建方法与应用
CN110048896A (zh) 一种集群数据获取方法、装置及设备
CN106878388A (zh) 对分布式存储系统中慢节点的检测
CN106557531A (zh) 将复杂结构对象转换成平面化数据
US7409328B1 (en) System and method for communicating simulation solutions between circuit components in a hierarchical data structure
CN106779791A (zh) 一种搭配对象图片组合的生成方法及装置
CN114722092A (zh) 时序数据处理方法、系统、存储介质和电子设备
US7792966B2 (en) Zone control weights
CN106909556A (zh) 内存集群的存储均衡方法及装置
CN105635285A (zh) 一种基于状态感知的vm迁移调度方法
Gullhav et al. A branch and price approach for deployment of multi-tier software services in clouds
Burdakov et al. Estimation models for NoSQL database consistency characteristics
CN106201655B (zh) 虚拟机分配方法和虚拟机分配系统
CN108399089A (zh) 视图界面的显示方法及装置
US7392170B1 (en) System and method for dynamically compressing circuit components during simulation
CN110532243A (zh) 数据处理方法、装置和电子设备
CN114726744B (zh) 一种仿真网络中虚拟端口上线方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant