CN114116652A - 一种数据聚合存储方法、系统、设备及介质 - Google Patents

一种数据聚合存储方法、系统、设备及介质 Download PDF

Info

Publication number
CN114116652A
CN114116652A CN202111434335.0A CN202111434335A CN114116652A CN 114116652 A CN114116652 A CN 114116652A CN 202111434335 A CN202111434335 A CN 202111434335A CN 114116652 A CN114116652 A CN 114116652A
Authority
CN
China
Prior art keywords
user data
data
special
persistent storage
storage device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111434335.0A
Other languages
English (en)
Inventor
何文龙
武模仁
李欢欢
陶桐桐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202111434335.0A priority Critical patent/CN114116652A/zh
Publication of CN114116652A publication Critical patent/CN114116652A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/172Caching, prefetching or hoarding of files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/174Redundancy elimination performed by the file system
    • G06F16/1744Redundancy elimination performed by the file system using compression, e.g. sparse files

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种数据聚合存储方法,该方法包括:根据用户数据的文本属性生成特殊标记,并将所述用户数据存储到持久化存储设备中;响应于所述用户数据存储完成,将所述特殊标记添加到所述用户数据的元数据中;响应于从所述持久化存储设备中读取所述用户数据,获取所述用户数据的特殊标记,所述用户数据根据所述特殊标记还原所述用户数据。本发明还涉及一种数据聚合存储、系统、设备及介质。本发明提出一种分布式对象存储系统中支持聚合压缩小对象的方案,解决当前聚合方案中不支持聚合压缩对象的问题,提高了对象存储中特性的兼容性,不仅减少了对象数量,提高了重构速度和系统的性能,并进一步提高了存储空间利用率。

Description

一种数据聚合存储方法、系统、设备及介质
技术领域
本发明属于计算机分布式存储领域,具体涉及一种数据聚合存储方法、系统、设备及介质。
背景技术
当前的分布式对象存储系统中,利用服务器端压缩技术已经实现对上传对象的压缩后存储以及下载对象时的解压缩后返回的功能,大大节省了存储空间。
当前的分布式对象存储系统中,针对普通海量小对象已经实现了小对象聚合的功能,把多个小对象聚合为一个大对象,减少了Rados(Reliable,Autonomic DistributedObject Store,一种可靠分布式的对象存储技术)的对象数量,可以大大加快集群的重构速度,并提高系统的性能。但是当前小对象聚合功能并不支持聚合压缩对象,问题点在于压缩之后对象的数据会减少很多,直接读取到的数据并不是对象实际的数据,直接聚合的话,下载时就无法正确获取对象实际数据。
因此,亟需一种支持聚合压缩小对象的方案,使得聚合功能支持聚合压缩小对象数据,在减少对象数量的基础上,进一步提高空间利用率,同时,在下载聚合后压缩小对象时,也可以正确返回数据给客户端。
发明内容
为解决上述问题,本发明提出了一种数据聚合存储方法,包括:
根据用户数据的文本属性生成特殊标记,并将所述用户数据存储到持久化存储设备中;
响应于所述用户数据存储完成,将所述特殊标记添加到所述用户数据的元数据中;
响应于从所述持久化存储设备中读取所述用户数据,获取所述用户数据的特殊标记,所述用户数据根据所述特殊标记还原所述用户数据。
在本发明的一些实施方式中,根据用户数据的文本属性生成特殊标记,并将所述用户数据存储到持久化存储设备中,包括:
将所述用户数据根据文本类型选择不同的压缩方式压缩并将所述压缩方式作为所述特殊标记;
响应于所述用户数据满足预定大小,将所述用户数据写入到持久化存储设备中。
在本发明的一些实施方式中,响应于所述用户数据存储完成,将所述特殊标记添加到所述用户数据的元数据中,包括:
将所述用户数据的所述压缩方式添加到所述用户数据的元数据中。
在本发明的一些实施方式中,响应于从所述持久化存储设备中读取所述用户数据,获取所述用户数据的特殊标记,所述用户数据根据所述特殊标记还原所述用户数据,包括:
响应于从所述持久化存储设备中读取到所述用户数据,根据所述用户数据的压缩方式将所述用户数据解压。
在本发明的一些实施方式中,根据用户数据的文本属性生成特殊标记,并将所述用户数据存储到持久化存储设备中,还包括:
响应于所述用户数据不满足预定大小,将所述用户数据压缩后临时存储,响应于多个所述用户数据的大小的总和满足所述预定大小,将多个所述用户数据压缩并聚合成一个聚合文件,存储到所述持久化存储设备中。
在本发明的一些实施方式中,响应于所述用户数据存储完成,将所述特殊标记添加到所述用户数据的元数据中,包括:
将所述聚合文件的聚合信息添加到所述用户数据的元数据中。
在本发明的一些实施方式中,响应于从所述持久化存储设备中读取所述用户数据,获取所述用户数据的特殊标记,所述用户数据根据所述特殊标记还原所述用户数据,包括:
根据所述聚合信息,从所述持久化存储设备中读取所述用户数据。
本发明的另一方面还提出了一种数据聚合存储系统,包括:
存储模块,所述存储模块配置用于根据用户数据的文本属性生成特殊标记,并将所述用户数据存储到持久化存储设备中;
标记模块,所述标记模块配置用于响应于所述用户数据存储完成,将所述特殊标记添加到所述用户数据的元数据中;
读取模块,所述读取模块配置用于响应于从所述持久化存储设备中读取所述用户数据,获取所述用户数据的特殊标记,所述用户数据根据所述特殊标记还原所述用户数据。
本发明的又一方面还提出了一种计算机设备,包括:
至少一个处理器;以及
存储器,所述存储器存储有可在所述处理器上运行的计算机指令,所述指令由所述处理器执行时实现上述实施方式中任意一项所述方法的步骤。
本发明的再一方面还提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述实施方式中任意一项所述方法的步骤。
本发明提出一种分布式对象存储系统中支持聚合压缩小对象的方案,解决当前聚合方案中不支持聚合压缩对象的问题,提高了对象存储中特性的兼容性,不仅减少了对象数量,提高重构速度和系统的性能,并进一步提高存储空间利用率,给客户带来了良好的用户体验,同时丰富了对象存储的功能,提高了分布式对象产品的市场竞争力。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种数据聚合存储方法的实施例流程图;
图2为本发明实施例提供的一种数据聚合存储系统的结构示意图;
图3为本发明实施例提供的一种计算机设备的结构示意图;
图4为本发明实施例提供的一种计算机可读存储介质的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。
需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。
本发明所应用的领域是对象存储领域,对象存储,也叫做基于对象的存储,是用来描述解决和处理离散单元的方法的通用术语,这些离散单元被称作为对象。就像文件一样,对象包含数据,但是和文件不同的是,对象在一个层结构中不会再有层级结构。每个对象都在一个被称作存储池的扁平地址空间的同一级别里,一个对象不会属于另一个对象的下一级。文件和对象都有与它们所包含的数据相关的元数据(元数据与数据的关系,可参考书籍的结构中的目录和内容的关系,根据目录可以直接找到对应的数据,元数据相当于数据可大概比喻成数据的目录),但是对象是以扩展元数据为特征的。每个对象都被分配一个唯一的标识符,允许一个服务器或者最终用户来检索对象,而不必知道数据的物理地址。这种方法对于在云计算环境中自动化和简化数据存储有帮助。
而现有的对象存储中,每一个文件在对象存储系统中,无论其数据大小都将作为一个对象,因此如果将每一个文件无论其大小就将其作为一个对象的话,那么建立起来的庞大数据(数据内容不大,数据的个数庞大)的元数据则非常庞大,例如,有1GB的1组数据,每个数据仅有1KB,如果要对这一组数据使用对象存储系统进行存储时,则需要建立100万条元数据(类似于书籍,目录100页,内容10页),同样,如果1个数据的大小为1GB,则对该数据使用对象存储系统存储时,则只需建立1条元数据(类似于目录1页不到,内容10页)。因此,如果将多个小的文件聚合成一个较大的文件,可以有效降低在元数据方面的开销(可以理解为目录减少)。这一方式仅可实现元数据的优化,而无法实现对数据内容的优化。为弥补这一技术空白,本发明提出一种有效解决方案,如本发明其他部分所述。
如图1所示,本发明提出了一种数据聚合存储方法,该方法可以包括以下步骤:
步骤S1、根据用户数据的文本属性生成特殊标记,并将所述用户数据存储到持久化存储设备中;
步骤S2、响应于所述用户数据存储完成,将所述特殊标记添加到所述用户数据的元数据中;
步骤S3、响应于从所述持久化存储设备中读取所述用户数据,获取所述用户数据的特殊标记,所述用户数据根据所述特殊标记还原所述用户数据。
在步骤S1中,在接收到用户数据后,提取用户数据的文本属性,并将文本属性作为标记用户数据的特殊标记,然后将该数据存储到持久化存储设备中。需要说明的是,在本发明所应用的存储结构中,持久化存储设备可以是机械硬盘等大容量掉电数据持久保存的设备,或者是大容量的SSD固态硬盘,还有用于临时存储用户数据的更快速的缓存盘。
在步骤S2中,在将用户的数据存储到持久化存储设备之后,在为该数据创建元数据时,将上述从该用户数据提取的文本属性添加到元数据中自定义的字段中。
在步骤S3中,在用户从持久化存储设备读取数据时通过元数据找到对应的数据,然后根据元数据中的文本信息还原该数据的格式等信息并发送给用户。
在本发明的一些实施方式中,根据用户数据的文本属性生成特殊标记,并将所述用户数据存储到持久化存储设备中,包括:
将所述用户数据根据文本类型选择不同的压缩方式压缩并将所述压缩方式作为所述特殊标记;
响应于所述用户数据满足预定大小,将所述用户数据写入到持久化存储设备中。
在本实施例中,对用户数据,根据数据的文本类型,选择合适的压缩算法压进行压缩,同时判断文本数据的大小是否满足预定大小,如果满足预定大小,则将数据写入到持久化设存储设备中。即在本实施例中采用聚合存储方式,当用户数据大于4MB(在一些实施例中可设置更小,例如512K,预定大小的值可能就实际的业务需求而设定,此处便于方便解释比喻选择4MB)时,将用户数据压缩后保存到持久化存储设备中。
在本发明的一些实施方式中,响应于所述用户数据存储完成,将所述特殊标记添加到所述用户数据的元数据中,包括:
将所述用户数据的所述压缩方式添加到所述用户数据的元数据中。
在本实施例中,在用户数据保存完成之后,将上述实施例中生成的该数据的压缩信息保存到元数据中,具体地,重构元数据的数据结构,添加压缩方式字段,用于保存对应数据的压缩信息。在保存用户数据时,将该数据的压缩方式等压缩信息通过自定义实现的功能函数写入对应的元数据的压缩方式字段中。
在本发明的一些实施方式中,响应于从所述持久化存储设备中读取所述用户数据,获取所述用户数据的特殊标记,所述用户数据根据所述特殊标记还原所述用户数据,包括:
响应于从所述持久化存储设备中读取到所述用户数据,根据所述用户数据的压缩方式将所述用户数据解压。
在本实施例中,当用户从持久化存储设备中根据元数据读取数据时,在获取到对应的数据之后(通过元数据),判断元数据中是否存在压缩方式字段,如果存在压缩方式字段,则对获取到的数据按照压缩方式字段中的压缩信息选择对应的算法进行解压。然后将解压后的数据作为用户数据返回给用户。
在本发明的一些实施方式中,根据用户数据的文本属性生成特殊标记,并将所述用户数据存储到持久化存储设备中,还包括:
响应于所述用户数据不满足预定大小,将所述用户数据压缩后临时存储,响应于多个所述用户数据的大小的总和满足所述预定大小,将多个所述用户数据压缩并聚合成一个聚合文件,存储到所述持久化存储设备中。
在本发明的一些实施方式中,响应于所述用户数据存储完成,将所述特殊标记添加到所述用户数据的元数据中,包括:
将所述聚合文件的聚合信息添加到所述用户数据的元数据中。
在本实施例中,如果用户数据小于4MB,则先将数据缓存到快速缓存盘中,继续接收用户数据,当多个用户数据的总和大于4MB时,将数据从快速缓存盘读取到内存中进行拼接,拼接成1个聚合数据,并且分别记录拼接后的聚合数据中不同用户数据的偏移地址,并将偏移地址写入到元数据中,同时将聚合数据的聚合信息也保存到元数据中。
进一步,在本发明的实施例中,用户数据在聚合数据中的偏移量和聚合信息均保存到用户数据的元数据中,在本实施例将上述的偏移量和聚合信息保存到本发明自定义实现的元数据的结构体中的聚合字段中。
在本发明的一些实施方式中,响应于从所述持久化存储设备中读取所述用户数据,获取所述用户数据的特殊标记,所述用户数据根据所述特殊标记还原所述用户数据,包括:
根据所述聚合信息,从所述持久化存储设备中读取所述用户数据。
在本实施例中,在用户获取数据时,通过用户数据对应的元数据中的聚合信息从对应的持久化设备读取聚合数据,然后再根据用户数据中的偏移地址和用户数据本身大小计算得到用户数据的偏移量,并从聚合数据中的偏移量所限定的区域读取出对应的数据。
在本发明的一些实施例中,在接收到用数据接之后,先判断用户数据的大小是否大于4MB。如果大于4MB,则通过用户数据的文本类型选择合适的压缩算法对数据进行压缩。然后将压缩后的数据存储到持久化存储设备中,并将用户数据的压缩信息保存到该用户数据所对应的元数据的压缩方式字段中。如果用户数据的大小小于4MB,则先将数据缓存到快速的缓存盘中保存,当多个用户数据的总和达到4MB时,将多个数据先根据数据的不同格式或文本类型选择不同的压缩算法进行压缩,并将各个用户数据的压缩格式作为其特殊标记,然后将多个用户数据聚合成一个数据,并将压缩信息作为特殊标记,将压缩后的文件存储到持久化存储设备中后,将压缩信息添加到该数据的元数据中。同时将用户数据的在聚合数据中的偏移地址以及聚合数据的ID同样地添加到元数据中。
进一步,在读取数据时,根据用户数据的元数据从持久化存储设备读取聚合数据,然后根据元数据中的偏移地址,在聚合数据中找到对应的区域的数据,再根据元数据中的压缩信息对该数据解压,解压后发送给用户。
本发明提出一种分布式对象存储系统中支持聚合压缩小对象的方案,解决当前聚合方案中不支持聚合压缩对象的问题,提高了对象存储中特性的兼容性,不仅减少了对象数量,提高重构速度和系统的性能,并进一步提高存储空间利用率,给客户带来了良好的用户体验,同时丰富了对象存储的功能,提高了分布式对象产品的市场竞争力。
如图2所示,本发明的另一方面还提出了一种数据聚合存储系统,该系统可以包括:
存储模块1,所述存储模块1配置用于根据用户数据的文本属性生成特殊标记,并将所述用户数据存储到持久化存储设备中。
标记模块2,所述标记模块2配置用于响应于所述用户数据存储完成,将所述特殊标记添加到所述用户数据的元数据中;
读取模块3,所述读取模块3配置用于响应于从所述持久化存储设备中读取所述用户数据,获取所述用户数据的特殊标记,所述用户数据根据所述特殊标记还原所述用户数据。
如图3所示,本发明的又一方面还提出了一种计算机设备,该计算机设备可以包括:
至少一个处理器21;以及
存储器22,所述存储器存储有可在所述处理器上运行的计算机指令23,所述指令23由所述处理器21执行时实现一种数据聚合存储方法,包括:
根据用户数据的文本属性生成特殊标记,并将所述用户数据存储到持久化存储设备中。
响应于所述用户数据存储完成,将所述特殊标记添加到所述用户数据的元数据中;
响应于从所述持久化存储设备中读取所述用户数据,获取所述用户数据的特殊标记,所述用户数据根据所述特殊标记还原所述用户数据。
在本发明的一些实施方式中,根据用户数据的文本属性生成特殊标记,并将所述用户数据存储到持久化存储设备中,包括:
将所述用户数据根据文本类型选择不同的压缩方式压缩并将所述压缩方式作为所述特殊标记;
响应于所述用户数据满足预定大小,将所述用户数据写入到持久化存储设备中。
在本发明的一些实施方式中,响应于所述用户数据存储完成,将所述特殊标记添加到所述用户数据的元数据中,包括:
将所述用户数据的所述压缩方式添加到所述用户数据的元数据中。
在本发明的一些实施方式中,响应于从所述持久化存储设备中读取所述用户数据,获取所述用户数据的特殊标记,所述用户数据根据所述特殊标记还原所述用户数据,包括:
响应于从所述持久化存储设备中读取到所述用户数据,根据所述用户数据的压缩方式将所述用户数据解压。
在本发明的一些实施方式中,根据用户数据的文本属性生成特殊标记,并将所述用户数据存储到持久化存储设备中,还包括:
响应于所述用户数据不满足预定大小,将所述用户数据压缩后临时存储,响应于多个所述用户数据的大小的总和满足所述预定大小,将多个所述用户数据压缩并聚合成一个聚合文件,存储到所述持久化存储设备中。
在本发明的一些实施方式中,响应于所述用户数据存储完成,将所述特殊标记添加到所述用户数据的元数据中,包括:
将所述聚合文件的聚合信息添加到所述用户数据的元数据中。
在本发明的一些实施方式中,响应于从所述持久化存储设备中读取所述用户数据,获取所述用户数据的特殊标记,所述用户数据根据所述特殊标记还原所述用户数据,包括:
根据所述聚合信息,从所述持久化存储设备中读取所述用户数据。
本发明的再一方面还提出了一种计算机可读存储介质401,所述计算机可读存储介质401存储有计算机程序402,所述计算机程序402被处理器执行时实现一种数据聚合存储方法,该方法可以包括:
根据用户数据的文本属性生成特殊标记,并将所述用户数据存储到持久化存储设备中。
响应于所述用户数据存储完成,将所述特殊标记添加到所述用户数据的元数据中;
响应于从所述持久化存储设备中读取所述用户数据,获取所述用户数据的特殊标记,所述用户数据根据所述特殊标记还原所述用户数据。
在本发明的一些实施方式中,根据用户数据的文本属性生成特殊标记,并将所述用户数据存储到持久化存储设备中,包括:
将所述用户数据根据文本类型选择不同的压缩方式压缩并将所述压缩方式作为所述特殊标记;
响应于所述用户数据满足预定大小,将所述用户数据写入到持久化存储设备中。
在本发明的一些实施方式中,响应于所述用户数据存储完成,将所述特殊标记添加到所述用户数据的元数据中,包括:
将所述用户数据的所述压缩方式添加到所述用户数据的元数据中。
在本发明的一些实施方式中,响应于从所述持久化存储设备中读取所述用户数据,获取所述用户数据的特殊标记,所述用户数据根据所述特殊标记还原所述用户数据,包括:
响应于从所述持久化存储设备中读取到所述用户数据,根据所述用户数据的压缩方式将所述用户数据解压。
在本发明的一些实施方式中,根据用户数据的文本属性生成特殊标记,并将所述用户数据存储到持久化存储设备中,还包括:
响应于所述用户数据不满足预定大小,将所述用户数据压缩后临时存储,响应于多个所述用户数据的大小的总和满足所述预定大小,将多个所述用户数据压缩并聚合成一个聚合文件,存储到所述持久化存储设备中。
在本发明的一些实施方式中,响应于所述用户数据存储完成,将所述特殊标记添加到所述用户数据的元数据中,包括:
将所述聚合文件的聚合信息添加到所述用户数据的元数据中。
在本发明的一些实施方式中,响应于从所述持久化存储设备中读取所述用户数据,获取所述用户数据的特殊标记,所述用户数据根据所述特殊标记还原所述用户数据,包括:
根据所述聚合信息,从所述持久化存储设备中读取所述用户数据。
最后需要说明的是,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关硬件来完成,程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,程序的存储介质可为磁碟、光盘、只读存储记忆体(ROM)或随机存储记忆体(RAM)等。上述计算机程序的实施例,可以达到与之对应的前述任意方法实施例相同或者相类似的效果。
本领域技术人员还将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。为了清楚地说明硬件和软件的这种可互换性,已经就各种示意性组件、方块、模块、电路和步骤的功能对其进行了一般性的描述。这种功能是被实现为软件还是被实现为硬件取决于具体应用以及施加给整个系统的设计约束。本领域技术人员可以针对每种具体应用以各种方式来实现的功能,但是这种实现决定不应被解释为导致脱离本发明实施例公开的范围。
以上是本发明公开的示例性实施例,但是应当注意,在不背离权利要求限定的本发明实施例公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外,尽管本发明实施例公开的元素可以以个体形式描述或要求,但除非明确限制为单数,也可以理解为多个。
应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。
上述本发明实施例公开实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。

Claims (10)

1.一种数据聚合存储方法,其特征在于,包括:
根据用户数据的文本属性生成特殊标记,并将所述用户数据存储到持久化存储设备中;
响应于所述用户数据存储完成,将所述特殊标记添加到所述用户数据的元数据中;
响应于从所述持久化存储设备中读取所述用户数据,获取所述用户数据的特殊标记,根据所述特殊标记还原所述用户数据。
2.根据权利要求1所述的方法,其特征在于,所述根据用户数据的文本属性生成特殊标记,并将所述用户数据存储到持久化存储设备中,包括:
将所述用户数据根据文本类型选择不同的压缩方式压缩并将所述压缩方式作为所述特殊标记;
响应于所述用户数据满足预定大小,将所述用户数据写入到持久化存储设备中。
3.根据权利要求2所述的方法,其特征在于,所述响应于所述用户数据存储完成,将所述特殊标记添加到所述用户数据的元数据中,包括:
将所述用户数据的所述压缩方式添加到所述用户数据的元数据中。
4.根据权利要求3所述的方法,其特征在于,所述响应于从所述持久化存储设备中读取所述用户数据,获取所述用户数据的特殊标记,所述用户数据根据所述特殊标记还原所述用户数据,包括:
响应于从所述持久化存储设备中读取到所述用户数据,根据所述用户数据的压缩方式将所述用户数据解压。
5.根据权利要求2所述的方法,其特征在于,所述根据用户数据的文本属性生成特殊标记,并将所述用户数据存储到持久化存储设备中,还包括:
响应于所述用户数据不满足预定大小,将所述用户数据压缩后临时存储,响应于多个所述用户数据的大小的总和满足所述预定大小,将多个所述用户数据压缩并聚合成一个聚合文件,存储到所述持久化存储设备中。
6.根据权利要求5所述的方法,其特征在于,所述响应于所述用户数据存储完成,将所述特殊标记添加到所述用户数据的元数据中,包括:
将所述聚合文件的聚合信息添加到所述用户数据的元数据中。
7.根据权利要求6所述的方法,其特征在于,所述响应于从所述持久化存储设备中读取所述用户数据,获取所述用户数据的特殊标记,所述用户数据根据所述特殊标记还原所述用户数据,包括:
根据所述聚合信息,从所述持久化存储设备中读取所述用户数据。
8.一种数据聚合存储系统,其特征在于,包括:
存储模块,所述存储模块配置用于根据用户数据的文本属性生成特殊标记,并将所述用户数据存储到持久化存储设备中;
标记模块,所述标记模块配置用于响应于所述用户数据存储完成,将所述特殊标记添加到所述用户数据的元数据中;
读取模块,所述读取模块配置用于响应于从所述持久化存储设备中读取所述用户数据,获取所述用户数据的特殊标记,根据所述特殊标记还原所述用户数据。
9.一种计算机设备,其特征在于,包括:
至少一个处理器;以及
存储器,所述存储器存储有可在所述处理器上运行的计算机指令,所述指令由所述处理器执行时实现权利要求1-7任意一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7任意一项所述方法的步骤。
CN202111434335.0A 2021-11-29 2021-11-29 一种数据聚合存储方法、系统、设备及介质 Pending CN114116652A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111434335.0A CN114116652A (zh) 2021-11-29 2021-11-29 一种数据聚合存储方法、系统、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111434335.0A CN114116652A (zh) 2021-11-29 2021-11-29 一种数据聚合存储方法、系统、设备及介质

Publications (1)

Publication Number Publication Date
CN114116652A true CN114116652A (zh) 2022-03-01

Family

ID=80371542

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111434335.0A Pending CN114116652A (zh) 2021-11-29 2021-11-29 一种数据聚合存储方法、系统、设备及介质

Country Status (1)

Country Link
CN (1) CN114116652A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106709025A (zh) * 2016-12-28 2017-05-24 郑州云海信息技术有限公司 更新聚合对象的方法及装置
CN108763473A (zh) * 2018-05-29 2018-11-06 郑州云海信息技术有限公司 一种分布式存储的本地对象存储方法及装置
CN109101639A (zh) * 2018-08-21 2018-12-28 赛凡信息科技(厦门)有限公司 一种提高文件系统性能的聚合模式
CN109787638A (zh) * 2019-01-10 2019-05-21 杭州幻方科技有限公司 一种数据压缩存储处理装置及方法
CN111339078A (zh) * 2018-12-19 2020-06-26 北京京东尚科信息技术有限公司 数据实时存储方法、数据查询方法、装置、设备、介质
CN112260694A (zh) * 2020-09-21 2021-01-22 广州中望龙腾软件股份有限公司 一种仿真文件的数据压缩方法
CN113285720A (zh) * 2021-05-28 2021-08-20 中科计算技术西部研究院 基因数据无损压缩方法、集成电路及无损压缩设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106709025A (zh) * 2016-12-28 2017-05-24 郑州云海信息技术有限公司 更新聚合对象的方法及装置
CN108763473A (zh) * 2018-05-29 2018-11-06 郑州云海信息技术有限公司 一种分布式存储的本地对象存储方法及装置
CN109101639A (zh) * 2018-08-21 2018-12-28 赛凡信息科技(厦门)有限公司 一种提高文件系统性能的聚合模式
CN111339078A (zh) * 2018-12-19 2020-06-26 北京京东尚科信息技术有限公司 数据实时存储方法、数据查询方法、装置、设备、介质
CN109787638A (zh) * 2019-01-10 2019-05-21 杭州幻方科技有限公司 一种数据压缩存储处理装置及方法
CN112260694A (zh) * 2020-09-21 2021-01-22 广州中望龙腾软件股份有限公司 一种仿真文件的数据压缩方法
CN113285720A (zh) * 2021-05-28 2021-08-20 中科计算技术西部研究院 基因数据无损压缩方法、集成电路及无损压缩设备

Similar Documents

Publication Publication Date Title
CN107911461B (zh) 云存储系统中的对象处理方法、存储服务器及云存储系统
CN113157655B (zh) 一种数据压缩、解压方法、装置、电子设备和存储介质
US9317213B1 (en) Efficient storage of variably-sized data objects in a data store
CN111324665B (zh) 一种日志回放方法及装置
CN106951375B (zh) 在存储系统中删除快照卷的方法及装置
US9727479B1 (en) Compressing portions of a buffer cache using an LRU queue
CN107817946B (zh) 用于混合存储设备读写数据的方法以及装置
CN104657401A (zh) 一种web缓存的更新方法
CN101783740B (zh) 消息文件管理方法及装置
US8296270B2 (en) Adaptive logging apparatus and method
CN108108247A (zh) 分布式图片存储服务系统和方法
CN107423425B (zh) 一种对k/v格式的数据快速存储和查询方法
CN114020691B (zh) 读写分离的数据更新方法及其装置、kv存储系统
CN115114232A (zh) 一种历史版本对象列举方法、装置及其介质
CN111625531B (zh) 基于可编程装置的合并装置、数据合并方法及数据库系统
CN106708911A (zh) 一种云环境下数据文件同步的方法和装置
CN110633261A (zh) 一种图片存储方法、图片查询方法及装置
US11194498B1 (en) Inline compression with small-write compression avoidance
CN112286457B (zh) 对象重删方法、装置、电子设备及机器可读存储介质
CN115774699B (zh) 数据库共享字典压缩方法、装置、电子设备及存储介质
CN103593259A (zh) 虚拟集群内存快照方法和装置
CN114116652A (zh) 一种数据聚合存储方法、系统、设备及介质
CN113625952B (zh) 一种对象存储方法、装置、设备及存储介质
CN114003573A (zh) 文件系统的压缩方法、装置、设备、存储介质、程序产品
CN115481086A (zh) 一种海量小文件读写方法、系统、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination