CN113220237A - 一种分布式存储方法、装置、设备及存储介质 - Google Patents
一种分布式存储方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN113220237A CN113220237A CN202110534375.6A CN202110534375A CN113220237A CN 113220237 A CN113220237 A CN 113220237A CN 202110534375 A CN202110534375 A CN 202110534375A CN 113220237 A CN113220237 A CN 113220237A
- Authority
- CN
- China
- Prior art keywords
- data block
- size
- target data
- file
- configuration information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000013500 data storage Methods 0.000 claims abstract description 72
- 238000012545 processing Methods 0.000 claims abstract description 26
- 230000003044 adaptive effect Effects 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 8
- 238000010586 diagram Methods 0.000 description 17
- 230000008569 process Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 230000003287 optical effect Effects 0.000 description 9
- 238000007726 management method Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/061—Improving I/O performance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0629—Configuration or reconfiguration of storage systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0638—Organizing or formatting or addressing of data
- G06F3/064—Management of blocks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/067—Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开了一种分布式存储方法,首先接收用户输入的数据存储请求,然后获取用户的数据块配置信息,再根据数据块配置信息确定目标数据块大小,最后根据目标数据块大小处理数据存储请求。本发明实施例公开的分布式存储方法,通过为用户提供两种数据块配置策略,使得数据的存储更加灵活,适应性更强,并且对于采用自适应模式的用户,把决定数据块大小的步骤移到了文件写入阶段,简化了文件创建操作,提高了数据读写效率,提升了系统性能。
Description
技术领域
本发明实施例涉及一种数据处理技术,尤其涉及一种分布式存储方法、装置、设备及存储介质。
背景技术
随着信息化社会的不断发展,数据成为各行各业不断发展中最重要的资产。数据能否安全,可靠,高效地存储成为企业信息化建设的核心考量。分布式存储架构以低成本,高可靠,高性能以及高扩展性的特点备受企业青睐,逐渐被越来越多的企业用来替换传统存储架构。
在分布式存储系统中,多租户环境是指多个租户共用相同的系统,并且仍然确保各用户间逻辑数据、系统功能等方面的隔离性和正确性的一种软件架构技术。多租户环境既实现了多租户之间系统实例的共享和统一管理,又提供了租户的个性化定制和数据隔离,实现多个租户之间的资源复用,可以有效节省开发应用的成本。
在多租户环境中,传统方式的文件在磁盘中的组织形式为相同大小的数据块,数据块需要用索引结构进行索引才能根据访问文件的偏移定位到数据的具体位置。如果数据块取的比较小,则随机访问的性能比较好(因为非对齐的偏移读和写不需要加载太多无关的数据),但是相同大小的吞吐就需要读和写更多的数据块,带来更大的索引搜索成本,并且索引元数据额外占用的磁盘空间较大;如果数据块取的比较大,则批量读写时效率更高(因为磁盘IO更大并且加载的数据块数量更少),索引搜索成本较低,索引额外占用的磁盘空间也更小,但是随机改写一个长度比数据块小的数据,就需要加载和重新写入更多的邻近数据。所以无论数据块大小怎么设置,假如应用场景中的访问模式跟文件系统中的数据块大小不匹配的情况下,都会出现性能降级,导致吞吐降低,IO延迟升高。
发明内容
本发明实施例提供了一种分布式存储方法,可以实现增强系统适应性和灵活性,提高数据读写效率,提升系统性能的目的。
第一方面,本发明实施例提供了一种分布式存储方法,包括:
接收用户输入的数据存储请求;
获取所述用户的数据块配置信息;
根据所述数据块配置信息确定目标数据块大小;
根据所述目标数据块大小处理所述数据存储请求。
进一步地,所述方法应用于多命名空间和多租户环境。
进一步地,所述数据块配置信息包括固定模式和自适应模式。
进一步地,根据所述数据块配置信息确定目标数据块大小,包括:
若所述数据块配置信息为固定模式,则将所述固定模式对应的数据块大小确定为目标数据块大小。
进一步地,根据所述目标数据块大小处理所述数据存储请求,包括:
判断所述数据存储请求是否合法;
若合法,则在主节点上根据所述目标数据块大小创建主节点文件;
所述主节点转发所述数据存储请求到从节点,使得所述从节点根据所述目标数据块大小创建从节点文件;
若主从节点创建文件成功数量超过总节点数量的一半,则创建文件成功;
将目标数据块大小的数据写入创建成功的文件中。
进一步地,根据所述数据块配置信息确定目标数据块大小,包括:
若所述数据块配置信息为自适应模式,则根据初次存储的数据大小确定目标数据块大小。
进一步地,在根据所述数据块配置信息确定目标数据块大小之前,还包括:
判断所述数据存储请求是否合法;
若合法,则在主节点创建空文件;
所述主节点转发所述数据存储请求到从节点,使得所述从节点创建空文件;
若主从节点创建空文件成功数量超过总节点数量的一半,则创建空文件成功。
进一步地,根据所述目标数据块大小处理所述数据存储请求,包括:
主节点根据所述目标数据块大小将数据写入主节点上的空文件;
从节点根据目标数据块大小将数据写入从节点上的空文件。
第二方面,本发明实施例还提供了一种分布式存储装置,包括:
数据存储请求接收模块,用于接收用户输入的数据存储请求;
数据块配置信息获取模块,用于获取所述用户的数据块配置信息;
目标数据块大小确定模块,用于根据所述数据块配置信息确定目标数据块大小;
数据存储请求处理模块,用于根据所述目标数据块大小处理所述数据存储请求。
可选的,目标数据块大小确定模块还用于:
若所述数据块配置信息为固定模式,则将所述固定模式对应的数据块大小确定为目标数据块大小。
可选的,数据存储请求处理模块还用于:
判断所述数据存储请求是否合法;
若合法,则在主节点上根据所述目标数据块大小创建主节点文件;
所述主节点转发所述数据存储请求到从节点,使得所述从节点根据所述目标数据块大小创建从节点文件;
若主从节点创建文件成功数量超过总节点数量的一半,则创建文件成功;
将目标数据块大小的数据写入创建成功的文件中。
可选的,目标数据块大小确定模块还用于:
若所述数据块配置信息为自适应模式,则根据初次存储的数据大小确定目标数据块大小。
可选的,分布式存储装置还包括空文件创建模块,用于:
判断所述数据存储请求是否合法;
若合法,则在主节点创建空文件;
所述主节点转发所述数据存储请求到从节点,使得所述从节点创建空文件;
若主从节点创建空文件成功数量超过总节点数量的一半,则创建空文件成功。
可选的,数据存储请求处理模块还用于:
主节点根据所述目标数据块大小将数据写入主节点上的空文件;
从节点根据目标数据块大小将数据写入从节点上的空文件。
第三方面,本发明实施例还提供了一种分布式存储设备,该设备包括:
包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本发明实施例任一所述的分布式存储方法。
第四方面,本发明实施例还提供了一种分布式存储介质,其上存储有计算机程序,该程序被处理装置执行时实现如本发明实施例任一所述的分布式存储方法。
本发明实施例公开的分布式存储方法,通过为用户提供两种数据块配置策略,使得数据的存储更加灵活,适应性更强,并且对于采用自适应模式的用户,简化了文件创建操作,提高了数据读写效率,提升了系统性能。
附图说明
图1是现有技术中的一种分布式存储方法流程图;
图2是本发明实施例一中的一种分布式存储系统架构图;
图3是本发明实施例一中的一种自适应模式下空文件创建过程示意图;
图4是本发明实施例一中的一种固定模式下数据存储过程示意图;
图5是本发明实施例一中的一种自适应模式下数据写入过程示意图;
图6是本发明实施例二中的一种分布式存储装置结构示意图;
图7是本发明实施例三中的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种分布式存储方法流程图,本实施例可适用于在多租户环境下为用户提供个性化数据服务的情况,该方法可以由分布式存储装置来执行,该装置可由硬件和/或软件组成,并一般可集成在具有分布式存储功能的设备中,该设备可以是服务器或服务器集群等电子设备。如图1所示,具体包括如下步骤:
步骤110、接收用户输入的数据存储请求。
其中,用户可以是应用本发明实施例中的分布式存储方法的分布式存储系统的用户,数据存储请求可以是用户基于业务需要在系统中进行数据存储的请求。
图2是本发明实施例一提供的一种分布式存储系统架构图,如图所示,系统包括客户端、存储服务模块集群、元数据服务模块和配置管理模块,其中,存储服务模块集群包括多个节点集群,用于处理用户的请求;元数据服务模块用于提供确认和检索、著录描述、资源管理、资源保护与长期保存等服务;配置管理模块用于对配置数据进行增加、删除、修改、查询、存储、备份、恢复等操作。
本发明实施例所提供的分布式存储方法可以处理多个用户的数据存储请求,优选的,可以应用于多租户环境和多命名空间。
在多租户环境中,客户端面向的用户有多个,系统为用户提供了多命名空间,不同的命名空间可以应用不同的数据块大小设置模式。根据自身业务的不同,不同的用户可能有不同的数据存储需要。
可选的,系统可以通过客户端接收用户输入的数据存储请求,
步骤120、获取用户的数据块配置信息。
其中,系统配置信息可以是使设备正常运行的数据,如硬件数据、对接数据、信令数据、路由数据、号码分析数据等,系统配置信息包括数据块配置信息。在本实施例中,数据块配置信息可以是表示数据块大小设置方式的信息,包括固定模式和自适应模式。
具体的,固定模式指用户创建的所有文件均使用相同的数据块大小配置;自适应模式指用户创建的所有文件数据块大小由初次写入文件大小来决定。对用户来说,有的用户可以通过分析得出适合自身业务的数据块大小,即用户可以确定一个固定的数据块大小用于自身文件数据的读写,这种用户可以选择固定模式的数据块配置;有的用户无法确定与自身业务匹配的数据块大小,这种用户可以选择自适应模式的数据块配置,无需自己确定数据块大小,而是由初次写入的文件数据大小决定。
可选的,数据块大小的设置方式可以由用户在系统配置中进行设置,对于固定模式,数据块配置信息还包括确定的数据块大小。接收用户输入的数据存储请求后,系统可以在系统配置信息中获取数据块配置信息,进一步通过获取用户的数据块大小设置方式。
步骤130、根据数据块配置信息确定目标数据块大小。
其中,目标数据块大小指响应用户的数据存储请求建立的用于存储用户文件数据的数据块大小。
在本实施例中,根据数据块配置信息确定目标数据块大小的方式可以是:若数据块配置信息为固定模式,则将固定模式对应的数据块大小确定为目标数据块大小。
可选的,若根据数据块配置信息获取到用户选择固定模式进行数据块大小的设置,则可以将数据块配置信息中的数据块大小作为目标数据块大小,即在写入用户需要存储的数据之前已经确定了数据块大小。
在本实施例中,根据数据块配置信息确定目标数据块大小的方式还可以是:若数据块配置信息为自适应模式,则根据初次存储的数据大小确定目标数据块大小。
可选的,若根据数据块配置信息获取到用户选择自适应模式进行数据块大小的设置,则在写入用户需要存储的数据之前不能确定数据块大小,而是在进行初次的数据写入时,根据写入的数据大小进行计算得到。
进一步地,在根据数据块配置信息确定目标数据块大小之前,还可以:判断数据存储请求是否合法;若合法,则在主节点创建空文件;主节点转发数据存储请求到从节点,使得从节点创建空文件;若主从节点创建空文件成功数量超过总节点数量的一半,则创建空文件成功。
可选的,对于自适应模式,在确定目标数据块大小之前可以先创建空文件。图3是本实施例提供的一种自适应模式下空文件创建过程示意图,如图所示,创建空文件的具体操作为:
1、用户在主节点创建空文件,不指定数据块大小(文件为空的情况下后续可以调整数据块大小)。
2、执行若干合法性判断。
3、在主节点将创建文件的唯一标识信息写入本地索引引擎模块,用来标记文件已存在。失败则创建文件流程失败返回。
4、主节点将请求转发到从节点,在从节点将创建文件的唯一标识信息写入本地索引引擎模块,用来标记文件已存在。
5、若创建文件成功的主从节点数量超过总节点个数的一半,则创建空文件成功。
6、将文件元数据信息保存到元数据服务模块进行管理。
7、若所有主从节点创建文件成功,则删除主从节点索引引擎模块上的唯一标识信息。
在上述步骤中,用户的数据存储请求通过合法性判断之后,主节点和从节点在创建空文件时会产生唯一标识信息,表示文件存在,若所有创建文件成功的节点数量超过总节点数量的一半,则表示系统创建空文件成功。文件元数据信息为描述数据的数据,即对数据及信息资源的描述性信息,可以用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。创建空文件成功后,相应生成的元数据信息可以保存到系统的元数据服务模块中,创建的空文件不具有大小属性。
步骤140、根据目标数据块大小处理数据存储请求。
在本实施例中,根据目标数据块大小处理数据存储请求的方式可以是:判断数据存储请求是否合法;若合法,则在主节点上根据目标数据块大小创建主节点文件;主节点转发数据存储请求到从节点,使得从节点根据目标数据块大小创建从节点文件;若主从节点创建文件成功数量超过总节点数量的一半,则创建文件成功;将目标数据块大小的数据写入创建成功的文件中。
可选的,在固定模式下,根据数据块配置信息可直接获得目标数据块大小,图4是本实施例提供的种固定模式下数据存储过程示意图,如图所示,固定模式下数据存储过程的具体操作为:
1、用户在主节点创建文件,数据块配置信息中携带目标数据块大小。
2、执行若干合法性判断。
3、在主节点创建文件,生成文件属性数据。失败则创建文件流程失败返回。
4、主节点将数据存储请求转发到从节点,在从节点创建文件,生成文件属性数据。
5、若创建文件成功的主从节点数量超过总节点个数的一半,则创建文件成功。
6、若有节点提示出现数据块大小冲突,则需要进入修复流程,使各节点数据块大小一致。
7、将文件元数据信息保存到元数据服务进行管理。
8、响应用户的文件数据写入请求,主节点操作本地文件数据,同时发送复制文件写入请求到下游从节点。从节点收到上游发送来的文件写入请求,操作本地文件数据,继续发送复制写请求到下游从节点,依次完成所有节点的文件数据写请求。
在上述步骤中,用户的数据存储请求通过合法性判断之后,主从节点创建文件时直接确定数据块的大小,生成文件属性数据,不需要生成唯一标识信息,若所有创建文件成功的节点数量超过总节点数量的一半,则表示系统创建空文件成功。数据块大小冲突的情况可能是节点获取到的目标数据块大小与原有数据块大小不同,出现的原因可能是节点创建文件失败,再次创建文件时目标数据块大小与上次创建文件时不同,在此情况下,可以通过修复流程进行修复,使得所有节点中的创建的文件一致。所有节点创建文件完成后,可以响应用户的文件数据写入请求将目标数据块大小的数据写入创建成功的文件中。
在本实施例中,根据目标数据块大小处理数据存储请求的方式还可以是:主节点根据目标数据块大小将数据写入主节点上的空文件;从节点根据目标数据块大小将数据写入从节点上的空文件。
可选的,在自适应模式下,创建空文件之后可以响应用户的文件数据写入请求进行数据写入。图5是本实施例中的一种自适应模式下数据写入过程示意图,如图所示,自适应模式下数据写入的具体操作为:
1、响应用户的数据写入请求,根据写入的文件数据大小确定目标数据块大小,根据目标数据块大小在主从节点生成文件属性数据(流程与固定模式下文件创建流程3-5相同)。
2、若有节点提示出现数据块大小冲突,则需要进入修复流程,使各节点数据块大小一致。
3、主节点操作本地文件数据,同时发送复制文件写入请求到下游从节点。从节点收到上游发送来的文件写入请求,操作本地文件数据,继续发送复制写请求到下游从节点,依次完成所有节点的文件数据写请求。
在上述步骤中,根据写入的文件数据大小可以计算得到目标数据块大小,然后可以根据目标数据块大小响应用户数据写入请求完成数据的写入。确定目标数据块大小之后的具体操作与固定模式下的操作类似,此处不再赘述。
本发明实施例首先接收用户输入的数据存储请求,然后获取用户的数据块配置信息,再根据数据块配置信息确定目标数据块大小,最后根据目标数据块大小处理数据存储请求。本发明实施例公开的分布式存储方法,通过为用户提供两种数据块配置策略,使得数据的存储更加灵活,适应性更强,并且对于采用自适应模式的用户,把决定数据块大小的步骤移到了文件写入阶段,简化了文件创建操作,提高了数据读写效率,提升了系统性能。
实施例二
图6为本发明实施例二提供的一种分布式存储装置结构示意图。如图6所示,该装置包括:数据存储请求接收模块210,数据块配置信息获取模块220,目标数据块大小确定模块230,数据存储请求处理模块240。
数据存储请求接收模块210,用于接收用户输入的数据存储请求。
数据块配置信息获取模块220,用于获取用户的数据块配置信息。
目标数据块大小确定模块230,用于根据数据块配置信息确定目标数据块大小。
可选的,目标数据块大小确定模块230还用于:
若数据块配置信息为固定模式,则将固定模式对应的数据块大小确定为目标数据块大小。
可选的,目标数据块大小确定模块230还用于:
若数据块配置信息为自适应模式,则根据初次存储的数据大小确定目标数据块大小。
数据存储请求处理模块240,用于根据目标数据块大小处理数据存储请求。
可选的,数据存储请求处理模块240还用于:
判断数据存储请求是否合法;若合法,则在主节点上根据目标数据块大小创建主节点文件;主节点转发数据存储请求到从节点,使得从节点根据目标数据块大小创建从节点文件;若主从节点创建文件成功数量超过总节点数量的一半,则创建文件成功;将目标数据块大小的数据写入创建成功的文件中。
可选的,数据存储请求处理模块240还用于:
主节点根据目标数据块大小将数据写入主节点上的空文件;从节点根据目标数据块大小将数据写入从节点上的空文件。
可选的,分布式存储装置还包括空文件创建模块,用于:
判断数据存储请求是否合法;若合法,则在主节点创建空文件;主节点转发数据存储请求到从节点,使得从节点创建空文件;若主从节点创建空文件成功数量超过总节点数量的一半,则创建空文件成功。
上述装置可执行本公开前述所有实施例所提供的方法,具备执行上述方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本公开前述所有实施例所提供的方法。
实施例三
图7为本发明实施例三提供的一种计算机设备的结构示意图。图7示出了适于用来实现本发明实施方式的计算机设备312的框图。图7显示的计算机设备312仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。设备312是典型的分布式存储计算设备。
如图7所示,计算机设备312以通用计算设备的形式表现。计算机设备312的组件可以包括但不限于:一个或者多个处理器316,存储装置328,连接不同系统组件(包括存储装置328和处理器316)的总线318。
总线318表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture,ISA)总线,微通道体系结构(Micro Channel Architecture,MCA)总线,增强型ISA总线、视频电子标准协会(Video Electronics Standards Association,VESA)局域总线以及外围组件互连(Peripheral Component Interconnect,PCI)总线。
计算机设备312典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备312访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储装置328可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory,RAM)330和/或高速缓存存储器332。计算机设备312可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统334可以用于读写不可移动的、非易失性磁介质(图7未显示,通常称为“硬盘驱动器”)。尽管图7中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如只读光盘(Compact Disc-Read Only Memory,CD-ROM)、数字视盘(Digital Video Disc-Read Only Memory,DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线318相连。存储装置328可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块326的程序336,可以存储在例如存储装置328中,这样的程序模块326包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块326通常执行本发明所描述的实施例中的功能和/或方法。
计算机设备312也可以与一个或多个外部设备314(例如键盘、指向设备、摄像头、显示器324等)通信,还可与一个或者多个使得用户能与该计算机设备312交互的设备通信,和/或与使得该计算机设备312能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口322进行。并且,计算机设备312还可以通过网络适配器320与一个或者多个网络(例如局域网(Local AreaNetwork,LAN),广域网Wide Area Network,WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器320通过总线318与计算机设备312的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备312使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、磁盘阵列(Redundant Arrays of IndependentDisks,RAID)系统、磁带驱动器以及数据备份存储系统等。
处理器316通过运行存储在存储装置328中的程序,从而执行各种功能应用以及数据处理,例如实现本发明上述实施例所提供的分布式存储方法。
实施例四
本发明实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该程序被处理装置执行时实现如本发明实施例中的分布式存储方法。本发明上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:接收用户输入的数据存储请求;获取用户的数据块配置信息;根据数据块配置信息确定目标数据块大小;根据目标数据块大小处理数据存储请求。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言,诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络连接到用户计算机,包括局域网(LAN)或广域网(WAN),或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (11)
1.一种分布式存储方法,其特征在于,包括:
接收用户输入的数据存储请求;
获取所述用户的数据块配置信息;
根据所述数据块配置信息确定目标数据块大小;
根据所述目标数据块大小处理所述数据存储请求。
2.根据权利要求1所述的方法,其特征在于,所述方法应用于多命名空间和多租户环境。
3.根据权利要求1所述的方法,其特征在于,所述数据块配置信息包括固定模式和自适应模式。
4.根据权利要求3所述的方法,其特征在于,根据所述数据块配置信息确定目标数据块大小,包括:
若所述数据块配置信息为固定模式,则将所述固定模式对应的数据块大小确定为目标数据块大小。
5.根据权利要求4所述的方法,其特征在于,根据所述目标数据块大小处理所述数据存储请求,包括:
判断所述数据存储请求是否合法;
若合法,则在主节点上根据所述目标数据块大小创建主节点文件;
所述主节点转发所述数据存储请求到从节点,使得所述从节点根据所述目标数据块大小创建从节点文件;
若主从节点创建文件成功数量超过总节点数量的一半,则创建文件成功;
将目标数据块大小的数据写入创建成功的文件中。
6.根据权利要求3所述的方法,其特征在于,根据所述数据块配置信息确定目标数据块大小,包括:
若所述数据块配置信息为自适应模式,则根据初次存储的数据大小确定目标数据块大小。
7.根据权利要求6所述的方法,其特征在于,在根据所述数据块配置信息确定目标数据块大小之前,还包括:
判断所述数据存储请求是否合法;
若合法,则在主节点创建空文件;
所述主节点转发所述数据存储请求到从节点,使得所述从节点创建空文件;
若主从节点创建空文件成功数量超过总节点数量的一半,则创建空文件成功。
8.根据权利要求7所述的方法,其特征在于,根据所述目标数据块大小处理所述数据存储请求,包括:
主节点根据所述目标数据块大小将数据写入主节点上的空文件;
从节点根据目标数据块大小将数据写入从节点上的空文件。
9.一种分布式存储装置,其特征在于,包括:
数据存储请求接收模块,用于接收用户输入的数据存储请求;
数据块配置信息获取模块,用于获取所述用户的数据块配置信息;
目标数据块大小确定模块,用于根据所述数据块配置信息确定目标数据块大小;
数据存储请求处理模块,用于根据所述目标数据块大小处理所述数据存储请求。
10.一种计算机设备,其特征在于,所述设备包括:包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1-8任一所述的分布式存储方法。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理装置执行时实现如权利要求1-8中任一所述的分布式存储方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110534375.6A CN113220237B (zh) | 2021-05-17 | 2021-05-17 | 一种分布式存储方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110534375.6A CN113220237B (zh) | 2021-05-17 | 2021-05-17 | 一种分布式存储方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113220237A true CN113220237A (zh) | 2021-08-06 |
CN113220237B CN113220237B (zh) | 2024-08-20 |
Family
ID=77092352
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110534375.6A Active CN113220237B (zh) | 2021-05-17 | 2021-05-17 | 一种分布式存储方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113220237B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113886264A (zh) * | 2021-10-20 | 2022-01-04 | 北京锐安科技有限公司 | 分布式数据库的内嵌方法、装置、设备及存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101808095A (zh) * | 2010-03-22 | 2010-08-18 | 华中科技大学 | 一种分布式存储环境下的加密副本组织方法 |
CN104520814A (zh) * | 2012-08-07 | 2015-04-15 | 超威半导体公司 | 用于配置云计算系统的系统和方法 |
US20150317407A1 (en) * | 2014-05-02 | 2015-11-05 | Netapp, Inc. | System and method for adaptive data placement within a distributed file system |
US20170220284A1 (en) * | 2016-01-29 | 2017-08-03 | Netapp, Inc. | Block-level internal fragmentation reduction using a heuristic-based approach to allocate fine-grained blocks |
CN110119425A (zh) * | 2018-02-06 | 2019-08-13 | 三星电子株式会社 | 固态驱动器、分布式数据存储系统和利用键值存储的方法 |
CN110427156A (zh) * | 2019-07-16 | 2019-11-08 | 华中科技大学 | 一种基于分片的mbr的并行读方法 |
CN110515918A (zh) * | 2019-08-19 | 2019-11-29 | 南京邮电大学 | 一种基于hdfs的分布式存储平台及构建方法 |
CN110989922A (zh) * | 2019-10-28 | 2020-04-10 | 烽火通信科技股份有限公司 | 一种分布式数据存储方法及系统 |
CN112306986A (zh) * | 2020-11-12 | 2021-02-02 | 苏州浪潮智能科技有限公司 | 分布式文件系统的存储方法、装置、设备及存储介质 |
-
2021
- 2021-05-17 CN CN202110534375.6A patent/CN113220237B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101808095A (zh) * | 2010-03-22 | 2010-08-18 | 华中科技大学 | 一种分布式存储环境下的加密副本组织方法 |
CN104520814A (zh) * | 2012-08-07 | 2015-04-15 | 超威半导体公司 | 用于配置云计算系统的系统和方法 |
US20150317407A1 (en) * | 2014-05-02 | 2015-11-05 | Netapp, Inc. | System and method for adaptive data placement within a distributed file system |
US20170220284A1 (en) * | 2016-01-29 | 2017-08-03 | Netapp, Inc. | Block-level internal fragmentation reduction using a heuristic-based approach to allocate fine-grained blocks |
CN110119425A (zh) * | 2018-02-06 | 2019-08-13 | 三星电子株式会社 | 固态驱动器、分布式数据存储系统和利用键值存储的方法 |
CN110427156A (zh) * | 2019-07-16 | 2019-11-08 | 华中科技大学 | 一种基于分片的mbr的并行读方法 |
CN110515918A (zh) * | 2019-08-19 | 2019-11-29 | 南京邮电大学 | 一种基于hdfs的分布式存储平台及构建方法 |
CN110989922A (zh) * | 2019-10-28 | 2020-04-10 | 烽火通信科技股份有限公司 | 一种分布式数据存储方法及系统 |
CN112306986A (zh) * | 2020-11-12 | 2021-02-02 | 苏州浪潮智能科技有限公司 | 分布式文件系统的存储方法、装置、设备及存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113886264A (zh) * | 2021-10-20 | 2022-01-04 | 北京锐安科技有限公司 | 分布式数据库的内嵌方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113220237B (zh) | 2024-08-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11314451B2 (en) | Method and apparatus for storing data | |
CN113485962B (zh) | 日志文件的存储方法、装置、设备和存储介质 | |
CN112965761B (zh) | 一种数据处理方法、系统、电子设备及存储介质 | |
CN111400246B (zh) | 异步导入文件方法、装置、计算机设备和存储介质 | |
CN110633046A (zh) | 一种分布式系统的存储方法、装置、存储设备及存储介质 | |
CN111818145B (zh) | 一种文件传输方法、装置、系统、设备及存储介质 | |
CN112948409A (zh) | 一种数据处理方法、装置、电子设备及存储介质 | |
CN111338834B (zh) | 数据存储方法和装置 | |
CN115408391A (zh) | 一种数据库表变更方法、装置、设备和存储介质 | |
CN111694639A (zh) | 进程容器地址的更新方法、装置和电子设备 | |
US11567814B2 (en) | Message stream processor microbatching | |
US9684668B1 (en) | Systems and methods for performing lookups on distributed deduplicated data systems | |
CN113220237B (zh) | 一种分布式存储方法、装置、设备及存储介质 | |
CN110888972A (zh) | 一种基于Spark Streaming的敏感内容识别方法及装置 | |
CN107526838B (zh) | 数据库集群扩容的方法和装置 | |
CN113886264A (zh) | 分布式数据库的内嵌方法、装置、设备及存储介质 | |
CN113448770B (zh) | 用于恢复数据的方法、电子设备和计算机程序产品 | |
US20210216507A1 (en) | Method, device and computer program product for storage management | |
CN111444148A (zh) | 基于MapReduce的数据传输方法和装置 | |
CN112988738A (zh) | 用于区块链的数据分片方法和装置 | |
US20230188619A1 (en) | Methods and systems for event management | |
CN116049142A (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN112764897B (zh) | 任务请求的处理方法、装置、系统及计算机可读存储介质 | |
CN113986833A (zh) | 文件合并方法、系统、计算机系统及存储介质 | |
CN111090530B (zh) | 一种分布式跨进程间通信总线系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 100000 Unit 501A, Floor 5, 101, Building 1, Yard 5, Laiguangying West Road, Chaoyang District, Beijing Applicant after: Beijing Qingyun Science and Technology Co.,Ltd. Address before: 100020 601, 6 floor, 16 building, No. 36 Chuang Yuan Road, Chaoyang District, Beijing. Applicant before: Beijing Qingyun Science and Technology Co.,Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |