CN114374392A - 一种数据压缩存储方法、装置、终端设备及可读存储介质 - Google Patents
一种数据压缩存储方法、装置、终端设备及可读存储介质 Download PDFInfo
- Publication number
- CN114374392A CN114374392A CN202111556128.2A CN202111556128A CN114374392A CN 114374392 A CN114374392 A CN 114374392A CN 202111556128 A CN202111556128 A CN 202111556128A CN 114374392 A CN114374392 A CN 114374392A
- Authority
- CN
- China
- Prior art keywords
- data
- stored
- result
- instance
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000013144 data compression Methods 0.000 title claims abstract description 26
- 238000005192 partition Methods 0.000 claims abstract description 38
- 238000012545 processing Methods 0.000 claims abstract description 25
- 238000013500 data storage Methods 0.000 claims abstract description 18
- 238000007781 pre-processing Methods 0.000 claims abstract description 15
- 238000004590 computer program Methods 0.000 claims description 20
- 238000007906 compression Methods 0.000 claims description 3
- 230000006835 compression Effects 0.000 claims description 3
- 230000008569 process Effects 0.000 abstract description 12
- 238000010586 diagram Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请适用于数据处理技术领域,提供了一种数据压缩存储方法、装置、终端设备及可读存储介质,方法包括:对待存储数据进行预处理,得到有序列结果,根据有序列结果确定多个数据分区,将数据分区合并得到待存储数据的压缩存储结果。本申请通过对待存储数据进行预处理以减小数据重复率,减少冗余的数据量,得到有序列结果,基于有序列结果确定多个数据分区,将数据分区合并得到对应的压缩存储结果,实现在存储过程中对数据进行归类存储,提高数据的存储效率。
Description
技术领域
本申请属于数据处理技术领域,尤其涉及一种数据压缩存储方法、装置、终端设备及可读存储介质。
背景技术
在数据存储的过程中,如果存在多种指向于同一个对象的数据结构,且需要将整个对象保存到文件内的情况时,通常是通过直接写入的方式对上述对象进行保存,然而,该方法可能出现多次写入重复的内容的情况,导致出现数据冗余,存储文件过大的问题,从而降低数据存储效率。
发明内容
本申请实施例提供了一种数据压缩存储方法、装置、终端设备及可读存储介质,可以解决相关数据存储方法存在的数据重复写入而导致的数据冗余、存储文件过大的问题。
第一方面,本申请实施例提供了一种数据压缩存储方法,包括:
对待存储数据进行预处理,得到有序列结果;
根据有序列结果确定多个数据分区,将所述数据分区合并得到待存储数据的压缩存储结果。
在一个实施例中,所述对待存储数据进行预处理,得到有序列结果,包括:
扫描得到待存储数据结构中的所有数据对象,作为所述待存储数据;
对所述待存储数据进行去重处理,得到有序列结果。
在一个实施例中,所述对所述待存储数据进行去重处理,得到有序列结果,包括:
按照数据存储的顺序将所述预处理后的待存储数据分成多个比较对象;
基于预定义数据类型对所述多个比较对象进行去重处理,得到有序列结果;其中,有序列结果包括多个不同的包含预定义数据类型的实例。
在一个实施例中,所述数据分区包括文件头、索引区和数据段;
所述根据有序列结果确定多个数据分区,将所述数据分区合并得到待存储数据的压缩存储结果,包括:
根据所述有序列结果确定每个实例中,预定义数据类型的第一长度以及每个基本数据类型的第二长度;
基于所述第一长度和所述第二长度,确定索引区和数据段;
基于所述数据段和所述索引区确定文件头;
将所述文件头、索引区和所述数据段合并,得到待存储数据的压缩存储结果。
在一个实施例中,所述基于所述第一长度和所述第二长度,确定索引区和数据段,包括:
根据每个实例的第一长度和第二长度,确定每个实例的总长度;
确定每个实例的相对偏移量,基于每个实例的总长度和相对偏移量确定索引区;
根据每个实例的总长度及每个实例包含的字段信息,确定数据段;其中,数据段包括所有实例。
在一个实施例中,所述根据每个实例的总长度及每个实例包含的字段信息,确定数据段,包括:
根据每个实例的总长度,确定数据段的总长度;
根据数据段的总长度和每个实例包含的字段信息,确定数据段。
在一个实施例中,所述将所述文件头、索引区和所述数据段合并,得到待存储数据的压缩存储结果,包括:
按照预设组合顺序将所述文件头、所述索引区和所述数据段合并,并写入文件中,得到待存储数据的压缩存储结果。
第二方面,本申请实施例提供了一种数据压缩存储装置,包括:
预处理模块,用于对待存储数据进行预处理,得到有序列结果;
压缩存储模块,用于根据有序列结果确定多个数据分区,将所述数据分区合并得到待存储数据的压缩存储结果。
在一个实施例中,所述预处理模块,包括:
扫描子模块,用于扫描得到待存储数据结构中的所有数据对象,作为所述待存储数据;
去重处理子模块,用于对所述待存储数据进行去重处理,得到有序列结果。
在一个实施例中,所述去重处理子模块,包括:
划分单元,用于按照数据存储的顺序将所述预处理后的待存储数据分成多个比较对象;
去重处理单元,用于基于预定义数据类型对所述多个比较对象进行去重处理,得到有序列结果;其中,有序列结果包括多个不同的包含预定义数据类型的实例。
在一个实施例中,所述数据分区包括文件头、索引区和数据段;
所述压缩存储模块,包括:
第一确定子模块,用于根据所述有序列结果确定每个实例中,预定义数据类型的第一长度以及每个基本数据类型的第二长度;
第二确定子模块,用于基于所述第一长度和所述第二长度,确定索引区和数据段;
第三确定子模块,用于基于所述数据段和所述索引区确定文件头;
合并子模块,用于将所述文件头、索引区和所述数据段合并,得到待存储数据的压缩存储结果。
在一个实施例中,所述第二确定子模块,包括:
第一确定单元,用于根据每个实例的第一长度和第二长度,确定每个实例的总长度;
第二确定单元,用于确定每个实例的相对偏移量,基于每个实例的总长度和相对偏移量确定索引区;
第三确定单元,用于根据每个实例的总长度及每个实例包含的字段信息,确定数据段;其中,数据段包括所有实例。
在一个实施例中,所述第三确定单元,包括:
第一确定子单元,用于根据每个实例的总长度,确定数据段的总长度;
第二确定子单元,用于根据数据段的总长度和每个实例包含的字段信息,确定数据段。
在一个实施例中,所述合并子模块具体用于按照预设组合顺序将所述文件头、所述索引区和所述数据段合并,并写入文件中,得到待存储数据的压缩存储结果。
第三方面,本申请实施例提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面中任一项所述的数据压缩存储方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面中任一项所述的数据压缩存储方法。
第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述第一方面中任一项所述的数据压缩存储方法。
本申请实施例与现有技术相比存在的有益效果是:通过对待存储数据进行预处理以减小数据重复率,减少冗余的数据量,得到有序列结果,根据有序列结果确定多个数据分区,将数据分区合并得到待存储数据的压缩存储结果,实现在存储过程中对数据进行归类存储,提高数据的存储效率。
可以理解的是,上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例一提供的数据压缩存储方法的流程示意图;
图2是本申请实施例一提供的文件头的示意图;
图3是本申请实施例一提供的索引区的示意图;
图4是本申请实施例一提供的数据段的示意图;
图5是本申请实施例一提供的实例的示意图;
图6是本申请实施例二提供的数据压缩存储装置的结构示意图;
图7是本申请实施例三提供的终端设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
本申请实施例提供的数据压缩存储方法可以应用于手机、平板电脑、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本、个人数字助理(personal digital assistant,PDA)等终端设备上,本申请实施例对终端设备的具体类型不作任何限制。
实施例一
图1示出了本申请提供的数据压缩存储方法的示意性流程图,作为示例而非限定,该方法可以应用于上述笔记本电脑中。
S101、对待存储数据进行预处理,得到有序列结果。
具体地,对任意的包含多个相同数据类型的字段的多个数据结构,需要存储至同一存储文件中时,可采用递归的方式对每个数据结构进行实例化的保存。在保存前,需要对待存储数据进行预处理,以降低待存储数据的重复率。其中,预处理方式包括但不限于扫描、拆分去重等中的任一项或多项。其中,有序列结果包括多个不同的包含预定义数据类型的实例,实例为最小的包含预定义数据类型的数据字段。预定义数据类型是指根据用户根据实际需求预先设定的,不同于基本数据类型的特定数据类型,其用于将多个不同数据字段区分成多个不同的实例,便于将待存储数据进行分割存储。
可以理解的是,每个实例均由预定义数据类型和基本数据类型构成。例如,预定义数据类型为T0,基本数据类型包括T1,T2,T3;按照数据结构中数据存储的顺序,预定义数据类型对待存储数据进行处理,得到的有序列结果包括第一实例(由T0,T2构成),第二实例以(由T0,T1构成)及第三实例(由T0,T3构成)。
S102、根据有序列结果确定多个数据分区,将所述数据分区合并得到待存储数据的压缩存储结果。
具体地,根据有序列结果确定预设的多个数据分区的具体字段信息,将所有数据分区合并写入存储文件中,得到待存储数据的压缩存储结果。
在本实施例中,数据分区包括但不限于索引区、数据段和文件头。
其中,文件头用于存储数据格式信息;例如,标记位(标识该文件属于什么类型的文件,或存储什么内容)、版本号(用于区分采用哪种方式来解析该文件的格式、或用于表示对文件进行升级、降级的方式)、文件的内存大小,和索引区、数据段等数据分区的起始偏移量和字段长度(如图2所示,示例性的提供了一种文件头的示意图)。索引区用于存储每个实例的总长度以及每个实例的相对偏移量(如图3所示,示例性的提供了一种索引区的示意图)。数据段用于存储所有实例的总长度、每个实例的字段信息(如图4所示,示例性的提供了一种数据段的示意图)。
在一个实施例中,所述对待存储数据进行预处理,包括:
扫描得到待存储数据结构中的所有数据对象,作为所述待存储数据;
对所述待存储数据进行去重处理,得到有序列结果。
具体地,对需要进行数据存储的数据结构进行扫描,确定该数据结构中待存储数据中的所有数据对象,作为待存储数据;对待存储数据进行去重处理,筛选掉重复的数据,降低待存储数据的重复率,得到有序列结果。
在一个实施例中,所述对所述待存储数据进行去重处理,得到有序列结果,包括:
按照数据存储的顺序将所述预处理后的待存储数据分成多个比较对象;
基于预定义数据类型对所述多个比较对象进行去重处理,得到有序列结果;其中,有序列结果包括多个不同的包含预定义数据类型的实例。
具体地,确定比较对象的大小,按照待存储数据结构中数据存储的顺序将预处理后的待存储数据分成多个比较对象,基于预定义数据类型对多个比较对象进行去重处理,得到有序列结果。其中,比较对象的大小可根据用户需求进行具体设定。例如,比较对象的大小可以设定为成员(field)或比特(bit)。
例如,设定比较对象的大小为成员(field),此时需要将按照待存储数据结构中数据存储的顺序将预处理后的待存储数据分成多个成员,分别将每个成员与预定义的数据类型进行比较来做去重处理,得到多个不同的包含预定义数据类型的实例(即有序列结果)。
例如,预定义数据类型为TT,此时按照成员将预处理后的待存储数据分成的多个比较对象包括:TT0;TT1;TT2;TT3;TT4;假设TT2与TT1相等,TT3、TT4与TT1相等,对应的即有序列结果可以为:TT0;TT1。
作为示例而非限定,每个实例中的字段信息包括:预定义数据类型的第一字段信息和基本数据类型的第二字段信息。
在一个实施例中,实例中还包括但不限于每个实例的总长度、预定义数据类型的第一长度以及基本数据类型的第二长度。
在一个实施例中,所述数据分区包括文件头、索引区和数据段;
所述根据有序列结果确定多个数据分区,将所述数据分区合并得到待存储数据的压缩存储结果,包括:
根据所述有序列结果确定每个实例中,预定义数据类型的第一长度以及每个基本数据类型的第二长度;
基于所述第一长度和所述第二长度,确定索引区和数据段;
基于所述数据段和所述索引区确定文件头;
将所述文件头、索引区和所述数据段合并,得到待存储数据的压缩存储结果。
具体地,根据有序列结果确定其中的每个实例中包含的预定义数据类型的第一长度,和基本数据类型的第二长度,基于每个实例的第一长度和第二长度确定每个实例的总长度,从而基于每个实例的总长度以及每个实例的字段信息确定索引区和数据段包含的字段信息。基于索引区包含的字段信息确定索引区的第一总长度和第一起始偏移量,根据数据段包含的字段信息确定数据段的第二总长度和第二起始偏移量,并确定待存储数据的总长度,从而确定文件头,将文件头、索引区和数据段合并,写入存储文件中,得到待存储数据的压缩存储结果。
在一个实施例中,所述基于所述第一长度和所述第二长度,确定索引区和数据段,包括:
根据每个实例的第一长度和第二长度,确定每个实例的总长度;
确定每个实例的相对偏移量,基于每个实例的总长度和相对偏移量确定索引区;
根据每个实例的总长度及每个实例包含的字段信息,确定数据段;其中,数据段包括所有实例。
具体地,根据每个实例中包含的预定义数据类型的第一长度和基本数据类型的第二长度,计算得到每个实例的总长度,确定每个实例的相对偏移量,根据每个实例的总长度、每个实例的相对偏移量确定索引区的字段信息,根据每个实例的总长度及每个实例包含的字段信息,确定数据段的字段信息,并根据索引区的字段信息遍历数据段内的所有字段,重新修正数据段内的预定义数据类型的字段信息。
在一个实施例中,所述根据每个实例的总长度及每个实例包含的字段信息,确定数据段,包括:
根据每个实例的总长度,确定数据段的总长度;
根据数据段的总长度和每个实例包含的字段信息,确定数据段。
具体地,计算得到每个实例的总长度的和,得到数据段的总长度;根据每个实例包含的字段信息(即每个实例包含的预定义数据类型的第一字段信息和基本数据类型的第二字段信息),以及每个实例在有序列结果中的排列顺序,得到数据段。
可以理解的是,每个实例中可包含多种预定义数据类型,以及多种基本数据类型。每种基本数据字段均包括该字段的数据类型ID和数据信息。每种预定义数据类型均包括该字段的相对偏移量和是否引用该对象(bool)信息。
图5示例性的提供了一种实例的示意图。
根据图5可知,该实例中包含实例的总长度、基本数据类型的总长度,每个基本数据类型的字段信息、预定义数据类型的总长度以及每个预定义数据类型的字段信息。
在一个实施例中,所述将所述文件头、索引区和所述数据段合并,得到待存储数据的压缩存储结果,包括:
按照预设组合顺序将所述文件头、所述索引区和所述数据段合并,并写入文件中,得到待存储数据的压缩存储结果。
具体地,确定每个数据分区的存储顺序,得到预设组合顺序,按照预设组合顺序将文件头、索引区和数据段合并,并写入文件中,得到待存储数据的压缩存储结果。
其中,预设组合顺序可根据实际需求进行具体设定,基于文件头、索引区和数据段存储的数据内容,确定预设组合顺序为文件头,索引区,数据段依次合并存储写入文件中。
本实施例通过对待存储数据进行预处理以减小数据重复率,减少冗余的数据量,得到有序列结果,根据有序列结果确定多个数据分区,将数据分区合并得到待存储数据的压缩存储结果,实现在存储过程中对数据进行归类存储,提高数据的存储效率。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
实施例二
对应于上文实施例所述的数据压缩存储方法,图6示出了本申请实施例提供的数据压缩存储装置的结构框图,为了便于说明,仅示出了与本申请实施例相关的部分。
参照图6,该数据压缩存储装置100包括:
预处理模块101,用于对待存储数据进行预处理,得到有序列结果;
压缩存储模块102,用于根据有序列结果确定多个数据分区,将所述数据分区合并得到待存储数据的压缩存储结果。
在一个实施例中,所述预处理模块,包括:
扫描子模块,用于扫描得到待存储数据结构中的所有数据对象,作为所述待存储数据;
去重处理子模块,用于对所述待存储数据进行去重处理,得到有序列结果。
在一个实施例中,所述去重处理子模块,包括:
划分单元,用于按照数据存储的顺序将所述预处理后的待存储数据分成多个比较对象;
去重处理单元,用于基于预定义数据类型对所述多个比较对象进行去重处理,得到有序列结果;其中,有序列结果包括多个不同的包含预定义数据类型的实例。
在一个实施例中,所述数据分区包括文件头、索引区和数据段;
所述压缩存储模块,包括:
第一确定子模块,用于根据所述有序列结果确定每个实例中,预定义数据类型的第一长度以及每个基本数据类型的第二长度;
第二确定子模块,用于基于所述第一长度和所述第二长度,确定索引区和数据段;
第三确定子模块,用于基于所述数据段和所述索引区确定文件头;
合并子模块,用于将所述文件头、索引区和所述数据段合并,得到待存储数据的压缩存储结果。
在一个实施例中,所述第二确定子模块,包括:
第一确定单元,用于根据每个实例的第一长度和第二长度,确定每个实例的总长度;
第二确定单元,用于确定每个实例的相对偏移量,基于每个实例的总长度和相对偏移量确定索引区;
第三确定单元,用于根据每个实例的总长度及每个实例包含的字段信息,确定数据段;其中,数据段包括所有实例。
在一个实施例中,所述第三确定单元,包括:
第一确定子单元,用于根据每个实例的总长度,确定数据段的总长度;
第二确定子单元,用于根据数据段的总长度和每个实例包含的字段信息,确定数据段。
在一个实施例中,所述合并子模块具体用于按照预设组合顺序将所述文件头、所述索引区和所述数据段合并,并写入文件中,得到待存储数据的压缩存储结果。
本实施例通过对待存储数据进行预处理以减小数据重复率,减少冗余的数据量,得到有序列结果,根据有序列结果确定多个数据分区,将数据分区合并得到待存储数据的压缩存储结果,实现在存储过程中对数据进行归类存储,提高数据的存储效率。
需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
实施例三
图7为本实施例提供的终端设备的结构示意图。如图7所示,该实施例的终端设备7包括:至少一个处理器70(图7中仅示出一个)处理器、存储器71以及存储在所述存储器71中并可在所述至少一个处理器70上运行的计算机程序72,所述处理器70执行所述计算机程序72时实现上述任意各个数据压缩存储方法实施例中的步骤。
所述终端设备7可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。该终端设备可包括,但不仅限于,处理器70、存储器71。本领域技术人员可以理解,图7仅仅是终端设备7的举例,并不构成对终端设备7的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如还可以包括输入输出设备、网络接入设备等。
所称处理器70可以是中央处理单元(Central Processing Unit,CPU),该处理器70还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器71在一些实施例中可以是所述终端设备7的内部存储单元,例如终端设备7的硬盘或内存。所述存储器71在另一些实施例中也可以是所述终端设备7的外部存储设备,例如所述终端设备7上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字卡(Secure Digital,SD),闪存卡(Flash Card)等。进一步地,所述存储器71还可以既包括所述终端设备7的内部存储单元也包括外部存储设备。所述存储器71用于存储操作系统、应用程序、引导装载程序(BootLoader)、数据以及其他程序等,例如所述计算机程序的程序代码等。所述存储器71还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。
本申请实施例提供了一种计算机程序产品,当计算机程序产品在移动终端上运行时,使得移动终端执行时实现可实现上述各个方法实施例中的步骤。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/网络设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/网络设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (10)
1.一种数据压缩存储方法,其特征在于,包括:
对待存储数据进行预处理,得到有序列结果;
根据有序列结果确定多个数据分区,将所述数据分区合并得到待存储数据的压缩存储结果。
2.如权利要求1所述的数据压缩存储方法,其特征在于,所述对待存储数据进行预处理,得到有序列结果,包括:
扫描得到待存储数据结构中的所有数据对象,作为所述待存储数据;
对所述待存储数据进行去重处理,得到有序列结果。
3.如权利要求2所述的数据压缩存储方法,其特征在于,所述对所述待存储数据进行去重处理,得到有序列结果,包括:
按照数据存储的顺序将所述预处理后的待存储数据分成多个比较对象;
基于预定义数据类型对所述多个比较对象进行去重处理,得到有序列结果;其中,有序列结果包括多个不同的包含预定义数据类型的实例。
4.如权利要求1所述的数据压缩存储方法,其特征在于,所述数据分区包括文件头、索引区和数据段;
所述根据有序列结果确定多个数据分区,将所述数据分区合并得到待存储数据的压缩存储结果,包括:
根据所述有序列结果确定每个实例中,预定义数据类型的第一长度以及每个基本数据类型的第二长度;
基于所述第一长度和所述第二长度,确定索引区和数据段;
基于所述数据段和所述索引区确定文件头;
将所述文件头、索引区和所述数据段合并,得到待存储数据的压缩存储结果。
5.如权利要求4所述的数据压缩存储方法,其特征在于,所述基于所述第一长度和所述第二长度,确定索引区和数据段,包括:
根据每个实例的第一长度和第二长度,确定每个实例的总长度;
确定每个实例的相对偏移量,基于每个实例的总长度和相对偏移量确定索引区;
根据每个实例的总长度及每个实例包含的字段信息,确定数据段;其中,数据段包括所有实例。
6.如权利要求4所述的数据压缩存储方法,其特征在于,所述根据每个实例的总长度及每个实例包含的字段信息,确定数据段,包括:
根据每个实例的总长度,确定数据段的总长度;
根据数据段的总长度和每个实例包含的字段信息,确定数据段。
7.如权利要求4所述的数据压缩存储方法,其特征在于,所述将所述文件头、索引区和所述数据段合并,得到待存储数据的压缩存储结果,包括:
按照预设组合顺序将所述文件头、所述索引区和所述数据段合并,并写入文件中,得到待存储数据的压缩存储结果。
8.一种数据压缩存储装置,其特征在于,包括:
预处理模块,用于对待存储数据进行预处理,得到有序列结果;
压缩存储模块,用于根据有序列结果确定多个数据分区,将所述数据分区合并得到待存储数据的压缩存储结果。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111556128.2A CN114374392A (zh) | 2021-12-17 | 2021-12-17 | 一种数据压缩存储方法、装置、终端设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111556128.2A CN114374392A (zh) | 2021-12-17 | 2021-12-17 | 一种数据压缩存储方法、装置、终端设备及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114374392A true CN114374392A (zh) | 2022-04-19 |
Family
ID=81139434
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111556128.2A Pending CN114374392A (zh) | 2021-12-17 | 2021-12-17 | 一种数据压缩存储方法、装置、终端设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114374392A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115630065A (zh) * | 2022-10-18 | 2023-01-20 | 天津神舟通用数据技术有限公司 | 一种基于多压缩模式子分区表的存储和查询方法 |
CN117950600A (zh) * | 2024-03-27 | 2024-04-30 | 广东力创信息技术有限公司 | 一种数据存储方法以及相关装置 |
-
2021
- 2021-12-17 CN CN202111556128.2A patent/CN114374392A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115630065A (zh) * | 2022-10-18 | 2023-01-20 | 天津神舟通用数据技术有限公司 | 一种基于多压缩模式子分区表的存储和查询方法 |
CN115630065B (zh) * | 2022-10-18 | 2023-08-22 | 天津神舟通用数据技术有限公司 | 一种基于多压缩模式子分区表的存储和查询方法 |
CN117950600A (zh) * | 2024-03-27 | 2024-04-30 | 广东力创信息技术有限公司 | 一种数据存储方法以及相关装置 |
CN117950600B (zh) * | 2024-03-27 | 2024-06-04 | 广东力创信息技术有限公司 | 一种数据存储方法以及相关装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111090628B (zh) | 一种数据处理方法、装置、存储介质及电子设备 | |
CN109299164B (zh) | 一种数据查询方法、计算机可读存储介质及终端设备 | |
CN108376364B (zh) | 一种支付系统对账的方法、设备及终端设备 | |
CN114374392A (zh) | 一种数据压缩存储方法、装置、终端设备及可读存储介质 | |
CN108628898B (zh) | 数据入库的方法、装置和设备 | |
CN112395322B (zh) | 一种基于分级缓存的列表数据显示方法、装置及终端设备 | |
CN110598993B (zh) | 数据加工方法及装置 | |
CN113129150A (zh) | 交易数据的处理方法、装置、终端设备及可读存储介质 | |
CN111159329A (zh) | 敏感词检测方法、装置、终端设备和计算机可读存储介质 | |
CN111752944A (zh) | 数据分摊方法、装置、计算机设备及存储介质 | |
CN112269665A (zh) | 内存的处理方法和装置、电子设备和存储介质 | |
CN111522574B (zh) | 差分包生成方法及相关设备 | |
CN112506950A (zh) | 数据聚合处理方法、计算节点、计算集群及存储介质 | |
CN114996173A (zh) | 一种管理存储设备写操作的方法和装置 | |
CN115392235A (zh) | 字符匹配方法、装置、电子设备及可读存储介质 | |
CN112379835B (zh) | 一种oob区数据提取方法、终端设备及存储介质 | |
CN111708715B (zh) | 内存分配方法、内存分配装置及终端设备 | |
CN112465564A (zh) | 一种供应商推荐方法、装置、终端 | |
CN111459937A (zh) | 数据表关联方法、装置、服务器及存储介质 | |
CN111143240A (zh) | 图像存储方法、系统及终端设备 | |
CN115454343A (zh) | 一种基于raid芯片的数据处理方法、装置及介质 | |
CN111198857A (zh) | 一种基于全闪存阵列的数据压缩方法及系统 | |
CN114419193A (zh) | 图像绘制方法、装置、电子设备及计算机可读存储介质 | |
CN111158994B (zh) | 一种压测性能测试方法及装置 | |
CN114445222A (zh) | 一种资金交易追踪方法、终端设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |