CN113885805A - 一种区块分配方法、装置、设备及存储介质 - Google Patents
一种区块分配方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN113885805A CN113885805A CN202111214998.1A CN202111214998A CN113885805A CN 113885805 A CN113885805 A CN 113885805A CN 202111214998 A CN202111214998 A CN 202111214998A CN 113885805 A CN113885805 A CN 113885805A
- Authority
- CN
- China
- Prior art keywords
- blocks
- copies
- logic
- dividing
- disaster tolerance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000013507 mapping Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 3
- 238000000638 solvent extraction Methods 0.000 claims description 3
- 238000011084 recovery Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 10
- 230000003287 optical effect Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 239000013307 optical fiber Substances 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/061—Improving I/O performance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0638—Organizing or formatting or addressing of data
- G06F3/064—Management of blocks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0638—Organizing or formatting or addressing of data
- G06F3/0644—Management of space entities, e.g. partitions, extents, pools
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0662—Virtualisation aspects
- G06F3/0665—Virtualisation aspects at area level, e.g. provisioning of virtual or logical volumes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/067—Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种区块分配方法、装置、设备及存储介质。该方法包括:获取待扩展数据文件的属性信息,其中,所述属性信息包括:副本数m、n个逻辑区块和容灾域数,n和m均为正整数;根据所述副本数和所述容灾域数确定目标区块数s;根据所述目标区块数对所述n个逻辑区块进行划分,得到s个区域;从容灾域中取出n×m个物理区块;将n×m个物理区块映射到s个区域中的逻辑区块中,通过本发明的技术方案,能够在最小的时间段内各容灾域的副本分布和日志负载均衡。
Description
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种区块分配方法、装置、设备及存储介质。
背景技术
创建或扩展文件时文件的副本分配策略既决定了系统剩余可分配副本所支持的最大副本数,也决定了后续长期运行时的IO负载是否均衡(数据文件的读写只涉及其副本所在的存储节点)。
现有技术中,当文件扩展n个区块,每个区块为m个副本时,系统根据负载均衡策略从容灾域中取出n*m个待分配空闲副本(这一步后可以保证所有容灾域剩余空闲副本尽量平衡),然后把这n*m个副本依次分配给所有区块的1号副本,再依次分配给2号、3号直到m号副本,这样可以保证每个区块的m个副本落在不同的容灾域中。
该策略虽然在整体上可以保证数据存储和各容灾域的IO负载均衡,但在某些修改数据文件具有时效性的场景下(如事务型数据库处理大量数据插入操作会顺序向数据文件写入数据,因此某一时刻内只有文件的部分逻辑区块存在IO压力),局部时间内的负载并不均衡,很容易形成局部性能瓶颈。
例如:在3个容灾域、区块大小为2M、副本数为2的数据文件的分布式数据库系统中,每个容灾域都有足够的空闲区块,当数据文件需要扩展600M空间以执行插入操作时,扩展所需逻辑区块数为600M/2M=300,需要分配的空闲副本数为300*2=600,根据前文描述的剩余副本均衡分配策略,每个容灾域都需要提供200个物理区块并依次分配给逻辑区块的1号副本和2号副本,最终副本分布如表1所示:
表1
副本分配完成后插入操作依次向区块1-300写入数据(表现为计算节点将插入操作的回放日志发送给对应容灾域的存储节点执行回放),整体上每个容灾域都有400M数据对应的日志回放压力,但在局部时间段内,如T1只涉及区块1-100,则只有容灾域1和2的存储节点会各自写入200M数据,此时如果各容灾域的数据写入速度小于200M/T1就会形成了性能瓶颈,而容灾域3又因为没有区块1-100对应的副本无法分担写入压力。T2和T3时间段同理。
发明内容
本发明实施例提供一种区块分配方法、装置、设备及存储介质,以实现能够在最小的时间段内各容灾域的副本分布和日志负载均衡。
第一方面,本发明实施例提供了一种区块分配方法,包括:获取待扩展数据文件的属性信息,其中,所述属性信息包括:副本数m、n个逻辑区块和容灾域数,n和m均为正整数;
根据所述副本数和所述容灾域数确定目标区块数s;
根据所述目标区块数对所述n个逻辑区块进行划分,得到s个区域;
从容灾域中取出n×m个物理区块;
将n×m个物理区块映射到s个区域中的逻辑区块中。
第二方面,本发明实施例还提供了一种区块分配装置,该装置包括:
获取模块,用于获取待扩展数据文件的属性信息,其中,所述属性信息包括:副本数m、n个逻辑区块和容灾域数,n和m均为正整数;
确定模块,用于根据所述副本数和所述容灾域数确定目标区块数s;
划分模块,用于根据所述目标区块数对所述n个逻辑区块进行划分,得到s个区域;
取出模块,用于从容灾域中取出n×m个物理区块;
映射模块,用于将n×m个物理区块映射到s个区域中的逻辑区块中。
第三方面,本发明实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本发明实施例中任一所述的区块分配方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例中任一所述的区块分配方法。
本发明实施例通过获取待扩展数据文件的属性信息,其中,所述属性信息包括:副本数m、n个逻辑区块和容灾域数,n和m均为正整数;根据所述副本数和所述容灾域数确定目标区块数s;根据所述目标区块数对所述n个逻辑区块进行划分,得到s个区域;从容灾域中取出n×m个物理区块;将n×m个物理区块映射到s个区域中的逻辑区块中,解决了在某些修改数据文件具有时效性的场景下,局部时间内的负载并不均衡,很容易形成局部性能瓶颈的问题,能够在最小的时间段内各容灾域的副本分布和日志负载均衡。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是本发明实施例中的一种区块分配方法的流程图;
图1a是本发明实施例中的基于日志回放的分布式数据库系统的结构示意图;
图1b是本发明实施例中文件扩展的区块分配算法流程图;
图2是本发明实施例中的一种区块分配装置的结构示意图;
图3是本发明实施例中的一种电子设备的结构示意图;
图4是本发明实施例中的一种包含计算机程序的计算机可读存储介质的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。此外,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。此外,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
本发明使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
图1为本发明实施例提供的一种区块分配方法的流程图,本实施例可适用于区块分配的情况,该方法可以由本发明实施例中的区块分配装置来执行,该区块分配装置可采用软件和/或硬件的方式实现,如图1所示,该区块分配方法具体包括如下步骤:
S110,获取待扩展数据文件的属性信息,其中,所述属性信息包括:副本数m、n个逻辑区块和容灾域数,n和m均为正整数。
其中,所述属性信息可以为场景信息,例如可以是,所述属性信息为:副本数为m的数据文件要扩展n个逻辑区块,且有k个容灾域为其提供足够的空闲区块。
在一个具体的例子中,如图1a所示,基于日志回放的分布式数据库系统结构和相关概念定义如下:计算节点:接收客户端请求并做数据处理,相关的数据修改会形成回放日志经日志转发层发送给存储节点完成回放落地。存储节点:接收并回放计算节点发送的日志。容灾域:一组存储节点的逻辑组合。逻辑区块:计算节点修改的数据文件被划分为固定大小的多个区块,称为逻辑区块。物理区块:存储节点的物理文件也划分为固定大小的多个区块,称为物理区块。副本:每个逻辑区块都对应多个容灾域的物理区块,这里的物理区块称为逻辑区块的副本。分布式计算:数据库系统可以根据计算压力任意扩展多个计算节点提供分布式计算服务。分布式存储:每个逻辑区块可映射到多个不同存储节点的物理区块上,从而在整体上实现数据文件的多副本分布式存储。回放日志:描述计算节点对逻辑数据文件的修改动作。日志转发:日志转发层收到计算节点的回放日志后,根据其修改的逻辑区块找到对应的多个物理区块,并将回放日志转发到每个物理区块所在的存储节点进行回放。
需要说明的是,创建或扩展文件时文件的副本分配策略既决定了系统剩余可分配副本所支持的最大副本数,也决定了后续长期运行时的IO负载是否均衡(数据文件的读写只涉及其副本所在的存储节点)。
S120,根据所述副本数和所述容灾域数确定目标区块数s。
其中,所述目标区块数为保证所有副本均匀分布的最小连续逻辑区块数。
具体的,根据副本数和容灾域数确定目标区块数的方式可以为:获取副本数和容灾域数的最小公倍数,将副本数和容灾域数的最小公倍数除以副本数得到的结果确定为目标区块数,需要说明的是,目标区块数为正整数。例如可以是,基于如下公式计算得到目标区块数:s=LCM(m,k)/m,其中,s为目标区块数,m为副本数,k为容灾域数,LCM(m,k)为k和m的最小公倍数。
S130,根据所述目标区块数对所述n个逻辑区块进行划分,得到s个区域。
具体的,根据所述目标区块数对所述n个逻辑区块进行划分,得到s个区域的方式可以为:先获取n个逻辑区块的逻辑区块号,再根据n个逻辑区块的逻辑区块号确定n个逻辑区块号模s的值;根据所述n个逻辑区块号模s的值对n个逻辑区块进行划分,得到s个区域,例如可以是:将逻辑区块号模s的值为i的区块划分到区域L(i),其中,i为自然数。
S140,从容灾域中取出n×m个物理区块。
具体的,根据逻辑区块数和副本数从容灾域中取出物理区块,例如可以是,若逻辑区块数为300,副本数为2,则从容灾域中取出600个物理区块。
S150,将n×m个物理区块映射到s个区域中的逻辑区块中。
具体的,将n×m个物理区块映射到s个区域中的逻辑区块中的方式可以为:根据区域内的逻辑区块号依次将n×m个物理区块映射到逻辑区块中。
可选的,根据所述目标区块数对所述n个逻辑区块进行划分,得到s个区域,包括:
获取n个逻辑区块号模s的值;
根据所述n个逻辑区块号模s的值对n个逻辑区块进行划分,得到s个区域。
具体的,获取n个逻辑区块号模s的值的方式可以为:获取n个逻辑区块的逻辑区块号,根据n个逻辑区块的逻辑区块号确定n个逻辑区块号模s的值。
可选的,根据所述n个逻辑区块号模s的值对n个逻辑区块进行划分,得到s个区域,包括:
将逻辑区块号模s的值为i的区块划分到区域L(i),其中,i为自然数。
具体的,将逻辑区块号模s的值为i的区块划分到区域L(i),例如可以是,若s=3,逻辑区块号为4,则将逻辑区块号模s的值为1,则将逻辑区块号为4的逻辑区块划分到区域L(1)。
可选的,通过如下公式获取目标区块数:
s=LCM(m,k)/m;
其中,s为目标区块数,m为副本数,k为容灾域数,LCM(m,k)为k和m的最小公倍数。
可选的,将n×m个物理区块映射到s个区域中的逻辑区块中,包括:
根据区域内的逻辑区块号依次将n×m个物理区块映射到逻辑区块中。
需要说明的是,如表1所示,上述时间段T的大小可以使用该时间段内修改的连续的逻辑区块数i做等价表述,记为T(i)。显而易见,在时间段T(1)内,由于修改一个区块最多只涉及2个容灾域,因此无论如何也做不到回放日志负载均衡。本发明实施例可以提供一种方法来算出一个最小的时间段T(s),使得在该时间段内各容灾域的副本分布和日志负载是均衡的,根据T(i)的定义,s即为保证所有副本均匀分布的最小连续逻辑区块数。
在一个具体的例子中,假定以下场景:副本数为m的数据文件要扩展n个逻辑区块,且有k个容灾域为其提供足够的空闲区块。显然,时间段T(s)共涉及t=s*m个副本。因为单个副本不可再拆分,保证t个副本在k个容灾域均匀分布的前提是t等于k的整数倍;又因为t也是m的整数倍(因为t=s*m),可得出t的最小取值为k和m的最小公倍数,记为LCM(m,k),因此有t=s*m=LCM(m,k),从而算出s=LCM(m,k)/m。
计算出s后,再将n个区块平均划分为s个区域(n向下取s的整数倍,最后多出的不足s的区块单独分配),记为L(0)-L(s-1)。已知连续s个区块对应的s*m个副本可以平均分布到k个容灾域,将这里的区块等比扩大为区域后,每个区域对应的容灾域也一定是固定的,且s个区域涉及的各容灾域总数一定相等。由此可得,从s个区域各取出一个区块,其所涉及的副本一定平均分布在k个容灾域。最后,将n个区块中区块号模s为i的区块划分到区域L(i)中即可保证每s个连续的区块一定分属不同的区域,因此其对应的副本也一定平均分布在k个容灾域。继续以前面的例子做说明,其中n=300,m=2,k=3,根据s=LCM(m,k)/m得出s=3,表示每3个连续的区块所涉及到的s*m=6个副本可以均匀分布到3个容灾域中。为做到这一点,我们将300个区块划分为s=3个区域:L0-L2,L(i)包含所有MOD(区块号,3)=i的区块。最终的分布结果如表2所示:
表2
如表2所示,时间段T(3)涉及区块2-4,共包含3*2=6个副本,每个容灾域都分布了2个副本。又因为依次分配的副本对应的副本号未变,因此不会产生同一区块的2个副本落在同一容灾域的情况。
当用户对至少s个连续的区块进行操作时,所有容灾域都会参与,而不会产生部分容灾域成为热点,其他容灾域空闲的情况。
在另一个具体的例子中,图1b为本发明文件扩展的区块分配算法流程图,如图1b所示,根据原副本分配策略取出待分配副本,计算s=LCM(m,k)/m,其中,s为目标区块数,m为副本数,k为容灾域数,LCM(m,k)为k和m的最小公倍数,根据s重新调整n个区块的排列顺序,按照新的区块顺序依次映射到待分配副本。
本实施例的技术方案,通过获取待扩展数据文件的属性信息,其中,所述属性信息包括:副本数m、n个逻辑区块和容灾域数,n和m均为正整数;根据所述副本数和所述容灾域数确定目标区块数s;根据所述目标区块数对所述n个逻辑区块进行划分,得到s个区域;从容灾域中取出n×m个物理区块;将n×m个物理区块映射到s个区域中的逻辑区块中,解决了在某些修改数据文件具有时效性的场景下,局部时间内的负载并不均衡,很容易形成局部性能瓶颈的问题,能够在最小的时间段内各容灾域的副本分布和日志负载均衡。
图2为本发明实施例提供的一种区块分配装置的结构示意图。本实施例可适用于区块分配的情况,该区块分配装置可采用软件和/或硬件的方式实现,该区块分配装置可集成在任何提供区块分配功能的设备中,如图2所示,所述区块分配装置具体包括:获取模块210、确定模块220、划分模块230、取出模块240和映射模块250。
其中,获取模块,用于获取待扩展数据文件的属性信息,其中,所述属性信息包括:副本数m、n个逻辑区块和容灾域数,n和m均为正整数;
确定模块,用于根据所述副本数和所述容灾域数确定目标区块数s;
划分模块,用于根据所述目标区块数对所述n个逻辑区块进行划分,得到s个区域;
取出模块,用于从容灾域中取出n×m个物理区块;
映射模块,用于将n×m个物理区块映射到s个区域中的逻辑区块中。
可选的,所述划分模块具体用于:
获取n个逻辑区块号模s的值;
根据所述n个逻辑区块号模s的值对n个逻辑区块进行划分,得到s个区域。
可选的,所述划分模块具体用于:
将逻辑区块号模s的值为i的区块划分到区域L(i),其中,i为自然数。
上述产品可执行本发明任意实施例所提供的方法,具备执行方法相应的功能模块和有益效果。
本实施例的技术方案,通过获取待扩展数据文件的属性信息,其中,所述属性信息包括:副本数m、n个逻辑区块和容灾域数,n和m均为正整数;根据所述副本数和所述容灾域数确定目标区块数s;根据所述目标区块数对所述n个逻辑区块进行划分,得到s个区域;从容灾域中取出n×m个物理区块;将n×m个物理区块映射到s个区域中的逻辑区块中,解决了在某些修改数据文件具有时效性的场景下,局部时间内的负载并不均衡,很容易形成局部性能瓶颈的问题,能够在最小的时间段内各容灾域的副本分布和日志负载均衡。
图3为本发明实施例三提供的一种电子设备的结构示意图。图3示出了适于用来实现本发明实施方式的电子设备312的框图。图3显示的电子设备312仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。设备312是典型的轨迹拟合功能的计算设备。
如图3所示,电子设备312以通用计算设备的形式表现。电子设备312的组件可以包括但不限于:一个或者多个处理器316,存储装置328,连接不同系统组件(包括存储装置328和处理器316)的总线318。
总线318表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture,ISA)总线,微通道体系结构(Micro Channel Architecture,MCA)总线,增强型ISA总线、视频电子标准协会(Video Electronics Standards Association,VESA)局域总线以及外围组件互连(Peripheral Component Interconnect,PCI)总线。
电子设备312典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备312访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储装置328可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory,RAM)330和/或高速缓存存储器332。电子设备312可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统334可以用于读写不可移动的、非易失性磁介质(图3未显示,通常称为“硬盘驱动器”)。尽管图3中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如只读光盘(Compact Disc-Read Only Memory,CD-ROM)、数字视盘(Digital Video Disc-Read Only Memory,DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线318相连。存储装置328可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块326的程序336,可以存储在例如存储装置328中,这样的程序模块326包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块326通常执行本发明所描述的实施例中的功能和/或方法。
电子设备312也可以与一个或多个外部设备314(例如键盘、指向设备、摄像头、显示器324等)通信,还可与一个或者多个使得用户能与该电子设备312交互的设备通信,和/或与使得该电子设备312能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口322进行。并且,电子设备312还可以通过网络适配器320与一个或者多个网络(例如局域网(Local Area Network,LAN),广域网Wide Area Network,WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器320通过总线318与电子设备312的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备312使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、磁盘阵列(Redundant Arrays of Independent Disks,RAID)系统、磁带驱动器以及数据备份存储系统等。
处理器316通过运行存储在存储装置328中的程序,从而执行各种功能应用以及数据处理,例如实现本发明上述实施例所提供的区块分配方法:
获取待扩展数据文件的属性信息,其中,所述属性信息包括:副本数m、n个逻辑区块和容灾域数,n和m均为正整数;
根据所述副本数和所述容灾域数确定目标区块数s;
根据所述目标区块数对所述n个逻辑区块进行划分,得到s个区域;
从容灾域中取出n×m个物理区块;
将n×m个物理区块映射到s个区域中的逻辑区块中。
图4为本发明实施例中的一种包含计算机程序的计算机可读存储介质的结构示意图。本发明实施例提供了一种计算机可读存储介质61,其上存储有计算机程序610,该程序被一个或多个处理器执行时实现如本申请所有发明实施例提供的区块分配方法:
获取待扩展数据文件的属性信息,其中,所述属性信息包括:副本数m、n个逻辑区块和容灾域数,n和m均为正整数;
根据所述副本数和所述容灾域数确定目标区块数s;
根据所述目标区块数对所述n个逻辑区块进行划分,得到s个区域;
从容灾域中取出n×m个物理区块;
将n×m个物理区块映射到s个区域中的逻辑区块中。
可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(Hyper Text TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络包括局域网(LAN)或广域网(WAN)连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (10)
1.一种区块分配方法,其特征在于,包括:
获取待扩展数据文件的属性信息,其中,所述属性信息包括:副本数m、n个逻辑区块和容灾域数,n和m均为正整数;
根据所述副本数和所述容灾域数确定目标区块数s;
根据所述目标区块数对所述n个逻辑区块进行划分,得到s个区域;
从容灾域中取出n×m个物理区块;
将n×m个物理区块映射到s个区域中的逻辑区块中。
2.根据权利要求1所述的方法,其特征在于,根据所述目标区块数对所述n个逻辑区块进行划分,得到s个区域,包括:
获取n个逻辑区块号模s的值;
根据所述n个逻辑区块号模s的值对n个逻辑区块进行划分,得到s个区域。
3.根据权利要求2所述的方法,其特征在于,根据所述n个逻辑区块号模s的值对n个逻辑区块进行划分,得到s个区域,包括:
将逻辑区块号模s的值为i的区块划分到区域L(i),其中,i为自然数。
4.根据权利要求1所述的方法,其特征在于,通过如下公式获取目标区块数:
s=LCM(m,k)/m;
其中,s为目标区块数,m为副本数,k为容灾域数,LCM(m,k)为k和m的最小公倍数。
5.根据权利要求1所述的方法,其特征在于,将n×m个物理区块映射到s个区域中的逻辑区块中,包括:
根据区域内的逻辑区块号依次将n×m个物理区块映射到逻辑区块中。
6.一种区块分配装置,其特征在于,包括:
获取模块,用于获取待扩展数据文件的属性信息,其中,所述属性信息包括:副本数m、n个逻辑区块和容灾域数,n和m均为正整数;
确定模块,用于根据所述副本数和所述容灾域数确定目标区块数s;
划分模块,用于根据所述目标区块数对所述n个逻辑区块进行划分,得到s个区域;
取出模块,用于从容灾域中取出n×m个物理区块;
映射模块,用于将n×m个物理区块映射到s个区域中的逻辑区块中。
7.根据权利要求6所述的装置,其特征在于,所述划分模块具体用于:
获取n个逻辑区块号模s的值;
根据所述n个逻辑区块号模s的值对n个逻辑区块进行划分,得到s个区域。
8.根据权利要求7所述的装置,其特征在于,所述划分模块具体用于:
将逻辑区块号模s的值为i的区块划分到区域L(i),其中,i为自然数。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述处理器实现如权利要求1-5中任一所述的方法。
10.一种包含计算机程序的计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被一个或多个处理器执行时实现如权利要求1-5中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111214998.1A CN113885805A (zh) | 2021-10-19 | 2021-10-19 | 一种区块分配方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111214998.1A CN113885805A (zh) | 2021-10-19 | 2021-10-19 | 一种区块分配方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113885805A true CN113885805A (zh) | 2022-01-04 |
Family
ID=79003480
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111214998.1A Pending CN113885805A (zh) | 2021-10-19 | 2021-10-19 | 一种区块分配方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113885805A (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104395904A (zh) * | 2012-04-27 | 2015-03-04 | 网络装置公司 | 高效的数据对象存储和检索 |
CN110058822A (zh) * | 2019-04-26 | 2019-07-26 | 北京计算机技术及应用研究所 | 一种磁盘阵列横向拓展方法 |
-
2021
- 2021-10-19 CN CN202111214998.1A patent/CN113885805A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104395904A (zh) * | 2012-04-27 | 2015-03-04 | 网络装置公司 | 高效的数据对象存储和检索 |
CN110058822A (zh) * | 2019-04-26 | 2019-07-26 | 北京计算机技术及应用研究所 | 一种磁盘阵列横向拓展方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111078147B (zh) | 一种缓存数据的处理方法、装置、设备及存储介质 | |
US11093148B1 (en) | Accelerated volumes | |
KR102486243B1 (ko) | 데이터 저장소를 파티셔닝하고 리밸런싱하는 기법 | |
WO2017107414A1 (zh) | 文件操作方法和装置 | |
US10015229B2 (en) | Metadata sharing to decrease file transfer time | |
CN113806300B (zh) | 数据存储方法、系统、装置、设备及存储介质 | |
CN110633046A (zh) | 一种分布式系统的存储方法、装置、存储设备及存储介质 | |
CN111930317B (zh) | 基于ceph数据分布方法、装置、服务器及存储介质 | |
US9389997B2 (en) | Heap management using dynamic memory allocation | |
CN111930713B (zh) | Ceph放置组的分配方法、装置、服务器及存储介质 | |
US9317520B2 (en) | State scope data file sharing | |
CN114048152A (zh) | 一种数据缓存方法、装置、电子设备和存储介质 | |
CN113407637A (zh) | 一种数据同步方法、装置、电子设备以及存储介质 | |
US10956125B2 (en) | Data shuffling with hierarchical tuple spaces | |
CN113885805A (zh) | 一种区块分配方法、装置、设备及存储介质 | |
AU2021268828B2 (en) | Secure data replication in distributed data storage environments | |
US10891274B2 (en) | Data shuffling with hierarchical tuple spaces | |
US9025900B1 (en) | Distributed image storage using cloud | |
CN106897278B (zh) | 用于键值数据库的数据读写处理方法及设备 | |
CN116820354B (zh) | 数据存储方法、数据存储装置和数据存储系统 | |
US11593498B2 (en) | Distribution of user specific data elements in a replication environment | |
Lim et al. | Design of cache backend using remote memory for network file system | |
US11822570B2 (en) | Database synchronization employing parallel poll threads | |
Milev | Technological approaches for presentation of data analysis in web applications | |
US20160202924A1 (en) | Diagonal organization of memory blocks in a circular organization of memories |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |