CN113868206A - 一种数据压缩方法、解压缩方法、装置及存储介质 - Google Patents
一种数据压缩方法、解压缩方法、装置及存储介质 Download PDFInfo
- Publication number
- CN113868206A CN113868206A CN202111168996.3A CN202111168996A CN113868206A CN 113868206 A CN113868206 A CN 113868206A CN 202111168996 A CN202111168996 A CN 202111168996A CN 113868206 A CN113868206 A CN 113868206A
- Authority
- CN
- China
- Prior art keywords
- binary
- bit
- file
- binary coding
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 67
- 230000006837 decompression Effects 0.000 title claims abstract description 42
- 238000013144 data compression Methods 0.000 title claims abstract description 39
- 238000007906 compression Methods 0.000 claims abstract description 46
- 230000006835 compression Effects 0.000 claims abstract description 45
- 238000012545 processing Methods 0.000 claims abstract description 16
- 230000004927 fusion Effects 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 5
- 230000000295 complement effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/17—Details of further file system functions
- G06F16/174—Redundancy elimination performed by the file system
- G06F16/1744—Redundancy elimination performed by the file system using compression, e.g. sparse files
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明公开了一种数据压缩方法、解压缩方法、装置及存储介质,压缩方法包括:获取待压缩数据的二进制编码文件;将二进制编码文件划分为多个依次排列的二进制编码段,对每个二进制编码段进行编码处理;编码处理包括:提取二进制编码段中标识bit的分布特征,标识bit为0或1;将所有二进制编码段的分布特征按照二进制编码段在二进制编码文件中的排列顺序进行组合获得二进制编码文件的压缩文件。将数据处理的单位降低到单个bit,以bit为单位进行压缩编码,处理的粒度更细,去掉了基于bit的数据冗余,压缩效果更好。单次压缩效果达到7%‑10%,为提高压缩效率可对多个二进制编码段并行压缩,还可通过多次压缩达到更好的压缩比。
Description
技术领域
本发明涉及数据压缩技术领域,特别是涉及一种数据压缩方法、解压缩方法、装置及存储介质。
背景技术
随着多媒体和信息技术的不断发展,处于互联网环境中的个人和机构每天均会产生大量数据,而大规模的数据则给储存设备和通信交换系统都带来巨大压力。为此,一般会对产生的数据进行适当压缩,以降低数据对存储空间的需求和节约数据传输所需的带宽。数据压缩分为有损压缩和无损压缩,相对有损压缩无损压缩可能够完全恢复原始数据而不引起任何失真。
在现代无损压缩编码算法中,往往采用以字节为单位的基于统计学原理的压缩编码算法。典型的无损压缩算法有:哈夫曼压缩方法、基于算术编码的压缩方法、基于游程编码的压缩方法、基于字典编码技术的LZW压缩方法等。游程编码和LZW编码属于基于字典模型的压缩算法,而哈夫曼编码和算术编码属于基于统计模型的压缩算法,前者与原始数据的排列次序有关而与其出现频率无关,后者则正好相反。这些算法均是以字节为单位对信息进行编码压缩。这样势必会带来bit级别的数据冗余,某些信息本来一个bit就可以表示,却被编码为一个字节,浪费了存储空间。
发明内容
本发明旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种数据压缩方法、解压缩方法、装置及存储介质。
为了实现本发明的上述目的,根据本发明的第一个方面,本发明提供了一种数据压缩方法,包括:获取待压缩数据的二进制编码文件;将所述二进制编码文件划分为多个依次排列的二进制编码段,对每个二进制编码段进行编码处理;所述编码处理包括:提取二进制编码段中标识bit的分布特征,所述标识bit为0或1;将所有二进制编码段的分布特征按照二进制编码段在二进制编码文件中的排列顺序进行组合获得所述二进制编码文件的压缩文件。
为了实现本发明的上述目的,根据本发明的第二个方面,本发明提供了一种数据压缩方法,包括:获取待压缩数据的二进制编码文件;按照本发明第一个方面的一种数据压缩方法对所述二进制编码文件进行多次压缩直到达到预设条件,获得压缩文件,并记录压缩次数,为所述压缩文件添加后缀,所述后缀包括压缩次数。
为了实现本发明的上述目的,根据本发明的第三个方面,本发明提供了一种数据解压缩方法,包括:获取按照本发明第一方面所述的一种数据压缩方法获得的压缩文件;从所述压缩文件中依次识别出所有前缀以及所述前缀对应的分布特征;还原出每个分布特征对应的二进制编码段;还原出的二进制编码段按照分布特征在压缩文件中的排列顺序进行依次拼接,完成数据解压缩处理。
为了实现本发明的上述目的,根据本发明的第四个方面,本发明提供了一种数据解压缩方法,包括:获取本发明第二方面所述的一种数据压缩方法获得的压缩文件,从压缩文件的后缀中获取压缩次数;按照本发明第三个方面所述的一种数据解压缩方法对压缩文件进行多次解压,并记录解压次数,直到解压次数等于压缩次数时停止解压。
为了实现本发明的上述目的,根据本发明的第五个方面,本发明提供了一种数据压缩装置,包括:数据获取模块,用于获取待压缩数据的二进制编码文件;二进制编码段提取模块,将所述二进制编码文件划分为多个依次排列的二进制编码段;编码处理模块,提取二进制编码段中标识bit的分布特征,将所有二进制编码段的分布特征按照二进制编码段在二进制编码文件中的排列顺序进行组合获得所述二进制编码文件的压缩文件。
为了实现本发明的上述目的,根据本发明的第六个方面,本发明提供了一种解压缩装置,包括:压缩文件获取模块,获取按照本发明第一个方面所述的一种数据压缩方法获得的压缩文件;识别模块,从所述压缩文件中依次识别出所有前缀以及所述前缀关联的分布特征;二进制编码段还原模块,依据每个分布特征还原出所述分布特征对应的二进制编码段;拼接模块,还原出的二进制编码段按照对应的分布特征在压缩文件中的排列顺序进行依次拼接,完成数据解压缩处理。
为了实现本发明的上述目的,根据本发明的第七个方面,本发明提供了一种存储介质,所述存储介质用于存储指令,所述指令用于执行如本发明第一个方面或第二方面所述的一种数据压缩方法或者如本发明第三个方面或第四个方面所述的一种数据解压缩方法。
综上所述,由于采用了上述技术方案,本发明的有益效果是:本发明提供的数据压缩方法是对待压缩数据的二进制比特流进行压缩处理,将数据处理的单位降低到单个bit,以bit为单位进行压缩编码,处理的粒度更细,去掉了基于bit的数据冗余,压缩效果更好。在压缩过程中,通过分布特征来表达二进制编码段,分布特征包括了标识bit数量以及其位置特征,这样能缩短大部分二进制编码段的长度,起到很好的压缩效果,实验证明,单次压缩效果达到了7%-10%。同时,为提高压缩效率,还可以并行地对多个二进制编码段进行压缩处理获得对应分布特征,本发明提供的压缩方法,还可以通过多次压缩达到更好的压缩比。本发明数据压缩方法提供的压缩文件中,除表示二进制编码段的分布特征外,不需要其他特殊标记,在解压时能够自动识别出分布特征的前缀作为二进制编码段之间的隔断标志,进而得到多个位置特征,为提高解压效率,可以并行地对多个分布特征进行还原。
附图说明
图1是本发明第一种优选实施方式中数据压缩方法的流程示意图;
图2是本发明第二种优选实施方式中数据压缩方法的流程示意图;
图3是本发明第三种优选实施方式中数据解压缩方法的流程示意图;
图4是本发明第四种优选实施方式中数据解压缩方法的流程示意图;
图5是本发明第一种压缩文件结构示意图;
图6是本发明第二种压缩文件结构示意图;
图7是本发明第三种压缩文件结构示意图;
图8是本发明第四种压缩文件结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,需要理解的是,术语“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明的描述中,除非另有规定和限定,需要说明的是,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是机械连接或电连接,也可以是两个元件内部的连通,可以是直接相连,也可以通过中间媒介间接相连,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
本发明公开了第一种数据压缩方法,在一种优选实施方式中,如图1所示,包括:
步骤101,获取待压缩数据的二进制编码文件;二进制编码文件即待压缩数据的二进制01样式的码流。
步骤102,将二进制编码文件划分为多个依次排列的二进制编码段;
步骤103,对每个二进制编码段进行编码处理;编码处理包括:提取二进制编码段中标识bit的分布特征,标识bit为0或1,该分布特征主要是二进制编码段中标识bit(0或1)的数量以及分布位置情况;可以将0作为标识bit,也可以将1作为标识bit。当0作为标识bit时,则1作为非标识bit,当1作为标识bit时,则0作为非标识bit。
步骤104,将所有二进制编码段的分布特征按照二进制编码段在二进制编码文件中的排列顺序进行组合获得二进制编码文件的压缩文件。
在本实施方式中,待压缩数据优选但不限于为文档数据、图片数据或图像数据。
在本实施方式中,在步骤102和步骤103中,对于多个二进制编码段可以并行或串行进行编码处理。当并行处理时,可先执行步骤102,先将二进制编码文件划分为多个依次排列的二进制编码段,并记录各二进制编码段的排列顺序,再对多个二进制编码段并行执行步骤103,最后执行步骤104。并行处理能够提升效率。当串行处理时,可交叉执行步骤102和步骤103,先从二进制编码文件中取出一个二进制编码段,再基于步骤103对该二进制编码段进行编码处理获得分布特征,再返回步骤102取出下一个二进制编码段,再对下一个二进制编码段执行步骤103获得分布特征,将该分布特征拼接在上一次的分布特征后面,依次往复,直到完成二进制编码文件中所有二进制编码段的提取、编码处理以及分布特征拼接后,得到压缩文件。串行处理不需要记录二进制编码段的排列顺序,不易出错,可靠性高。
在本实施方式中,在步骤102中,多个二进制编码段的长度可以相同也可以不同,多个二进制编码段的长度相同时能够简化计算以及节省空间。需要说明的是,当压缩方和解压缩方对二进制编码段的长度以及标识bit达成共识时,在压缩文件中不需要设置二进制编码段的长度标签和标识bit,当压缩方和解压缩方对二进制编码段的长度或者标识bit未达成共识时,在压缩文件中还需要设置二进制编码段的长度标签和标识bit,以便解压缩方解压处理。二进制编码段的长度可自定义设置,如40bit、20bit等。
在本实施方式中,优选的,分布特征包括位置特征和与位置特征关联的前缀;前缀为二进制编码段中标识bit的数量K,K为整数;位置特征包括K个标识bit在二进制编码段中的位置信息的融合值。前缀除了具备不同二进制编码段位置特征的区分以外,还具有表示标识bit的数量的作用,非单纯的间隔符,能够减小整体存储空间。优选的,前缀为固定长度比特串,比特串的数值大小与标识bit的数量K相等。为了加大压缩比率,优选的,标识bit可根据二进制编码文件中0、1的总数量确定,选择数量较少的作为标识bit,这样能够减少所有前缀的长度累积值。
在本实施方式中,当二进制编码文件的bit位总量是二进制编码段的长度的整数倍时,压缩文件如图5所示,前缀1和位置特征1表示第一个二进制编码段的分布特征。在步骤102中,当二进制编码文件的bit位总数不是二进制编码段的长度的整数倍时,即从二进制编码文件取出最后一个二进制编码段后,二进制编码文件中剩余的bit位数小于二进制编码段长度,可将剩余的bit位放置在压缩文件的末尾,如图6所示;也可给剩余的bit末尾补足0或1,以满足二进制编码段的长度,对新的二进制编码段进行编码处理,并在压缩文件中设置一个补足标签,如图7所示,补足标签包括补数类型和补数长度,补数类型为0或1。
在一种优选实施方式中,获取二进制编码段的位置特征的过程包括:
设二进制编码段包括N位二进制bit,N为正整数,N≥K;
设二进制编码段中第n个bit的位置序号为n,n∈[0,N-1];
获取二进制编码段中K个标识bit的位置序号,设第k个标识bit的位置序号为nk,k∈[1,K],若k=1,则第k个标识bit的位置信息为0,若k>1,则第k个标识bit的位置信息为符合位数为nk且标识bit数量为k的二进制编码组合数;
获取K个标识bit在二进制编码段中的位置信息的融合值,将该融合值与第1位标识bit的位置序号n1进行组合获得所述二进制编码段的位置特征。优选的,该融合值为K位标识bit的位置信息的累计和,以便于计算。
在本实施方式中,优选的,符合位数为nk且标识bit数量为k的二进制编码组合数通过combin函数获取,该数量可表示为combin(nk,k),表示在nk位bit中标识bit数量为k的二进制编码组合数。combin函数,为计算从给定数目的对象集合中提取若干对象的组合数,利用函数combin可以确定一组对象所有可能的组合数。
本发明还公开了第二种数据压缩方法,如图2所示,在一种优选实施方式中,该数据压缩方法包括:
步骤201,获取待压缩数据的二进制编码文件;
步骤202,按照本发明提供的第一种数据压缩方法对二进制编码文件进行多次压缩直到达到预设条件,获得压缩文件,并记录压缩次数,为压缩文件添加后缀,后缀包括压缩次数,最终的压缩文件的结构如图8所示。
在本实施方式中,预设条件可以为预设的最大压缩次数或者为压缩比例阈值,当压缩次数达到预设的最大压缩次数或者压缩比率达到压缩比例阈值时,停止压缩。
本发明还公开了第一种数据解压缩方法,如图3所示,在一种优选实施方式中,该数据解压缩方法包括:
步骤301,获取按照本发明第一种数据压缩方法获得的压缩文件;
步骤302,从压缩文件中依次识别出所有前缀以及前缀对应的分布特征;
步骤303,依据每个分布特征还原出分布特征对应的二进制编码段,具体包括:从分布特征的前缀中获取标识bit的个数K;基于分布特征中的位置特征、标识bit的个数K和二进制编码段的长度N还原出二进制编码段;
步骤304,还原出的二进制编码段按照对应的分布特征在压缩文件中的排列顺序进行依次拼接,完成数据解压缩处理。
在本实施方式中,优选的,基于分布特征中的位置特征、标识bit的个数K和二进制编码段的长度N还原出二进制编码段的过程包括:从该位置特征中取出K位标识bit的位置信息累计和,记为第一数值;获取符合bit数为N且包含K个标识bit的所有二进制编码,求取每个二进制编码的K位标识bit的位置信息累计和,记为第二数值,若第二数值与第一数值相等,则认为该二进制编码为还原得到的二进制编码段,若第二数值与第一数值不相等,则认为该二进制编码不是还原得到的二进制编码段,进行下一个二进制编码验证。
在一种优选实施方式中,还原出每个分布特征对应的二进制编码段,具体包括:
从分布特征中提取出前缀和位置特征,从位置特征中分离出K位标识bit的位置信息融合值M和第1位标识bit的位置序号n1;
获取K位标识bit在二进制编码段的位置序号,具体包括:
步骤S1,设置滑动位置序号变量i、标识bit数量变量j和差值变量△M,所述i的初始值为N-1,所述j的初始值为K,所述△M的初始值为M;
步骤S2,获取符合位数为i且标识bit的数量为j的二进制编码的数量q,若q<△M,则认为ni为一个标识bit的位置序号,令j=j-1,△M=△M-q,i=i-1,进入步骤S3,若q>△M,则令i=i-1,进入步骤S3;若q=△M,则位置序号小于等于i的bit位均为标识bit,结束获取K位标识bit在二进制编码段的位置序号的步骤;
步骤S3,若j=1,则已获取到K位标识bit在二进制编码段的位置序号,若j大于1,则返回执行步骤S2;
根据获取的K位标识bit在二进制编码段的位置序号还原二进制编码段。
在本实施方式的一种应用场景中,设N为16,标识bit为1。从前缀中得到标识bit的数量K为8,从位置信息融合值中得到n1为3,则计算出8位标识bit的位置信息累计和M为6759。△M初始值为6759。还原的过程为:
计算最高位为1时的组合数,combin(15,8)=6435,因为6435<△M,则位置序号为15的位置上为标识bit,为1,△M更新为(6759-6435)=324。
测试位置序号为14的位置是否为标识bit,计算combin(14,7)=3432,由于3432大于324,因此位置序号为14的位置上是非标识bit,为0;
依次类推,直到位置序号为11时,计算combin(11,7)=330,由于330大于324,因此位置序号为11的位置上是非标识bit,为0;
测试位置序号为10的位置是否为标识bit,计算combin(10,7)=120,由于120小于324,因此位置序号为10的位置上是标识bit,为1;△M更新为(324-120)=204;
依次类推,直到判断出测试位置序号为4的位置为标识bit,为1,由于n1为3,因此最终得到的原始二进制编码段为1000011111011000。
本发明还公开了第二种数据解压缩方法,如图4所示,在一种优选实施方式中,该数据解压缩方法包括:
步骤401,获取根据本发明第二种数据压缩方法获得的压缩文件,从压缩文件的后缀中获取压缩次数;
步骤402,按照本发明第一种数据解压缩方法对压缩文件进行多次解压,并记录解压次数,直到解压次数等于压缩次数时停止解压。
本发明还公开了一种数据压缩装置,在一种优选实施方式中,该数据压缩装置包括:数据获取模块,用于获取待压缩数据的二进制编码文件;二进制编码段提取模块,将二进制编码文件划分为多个依次排列的二进制编码段;编码处理模块,提取二进制编码段中标识bit的分布特征,将所有二进制编码段的分布特征按照二进制编码段在二进制编码文件中的排列顺序进行组合获得二进制编码文件的压缩文件。
本发明还公开了一种解压缩装置,在一种优选实施方式中,该解压缩装置包括:压缩文件获取模块,获取本发明提供的第一种数据压缩方法获得的压缩文件;识别模块,从压缩文件中依次识别出所有前缀以及前缀关联的分布特征;二进制编码段还原模块,依据每个分布特征还原出分布特征对应的二进制编码段,具体包括:从分布特征的前缀中获取标识bit的个数K;基于分布特征中的位置特征、标识bit的个数K和二进制编码段的长度N还原出二进制编码段;拼接模块,还原出的二进制编码段按照对应的分布特征在压缩文件中的排列顺序进行依次拼接,完成数据解压缩处理。
本发明还公开了一种设备,该设备包括上述解压装置和上述数据压缩装置,还设备可以是个人电脑、手机等。
本发明还公开了一种存储介质,在一种优选实施方式中,存储介质用于存储指令,指令用于执行本发明提供的数据压缩方法或者本发明提供的数据解压缩方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
Claims (10)
1.一种数据压缩方法,其特征在于,包括:
获取待压缩数据的二进制编码文件;
将所述二进制编码文件划分为多个依次排列的二进制编码段,对每个二进制编码段进行编码处理;
所述编码处理包括:提取二进制编码段中标识bit的分布特征,所述标识bit为0或1;
将所有二进制编码段的分布特征按照二进制编码段在二进制编码文件中的排列顺序进行组合获得所述二进制编码文件的压缩文件。
2.如权利要求1所述的数据压缩方法,其特征在于,所述分布特征包括位置特征和与所述位置特征关联的前缀;
所述前缀为所述二进制编码段中标识bit的数量K,所述K为整数;
所述位置特征包括K个标识bit在所述二进制编码段中的位置信息的融合值。
3.如权利要求2所述的数据压缩方法,其特征在于,获取二进制编码段的位置特征的过程包括:
设二进制编码段包括N位二进制bit,N为正整数,N≥K;
设二进制编码段中第n个bit的位置序号为n,n∈[0,N-1];
获取二进制编码段中K个标识bit的位置序号,设第k个标识bit的位置序号为nk,k∈[1,K],若k=1,则第k个标识bit的位置信息为0,若k>1,则第k个标识bit的位置信息为符合位数为nk且标识bit数量为k的二进制编码组合数;
获取K个标识bit在二进制编码段中的位置信息的融合值,将所述融合值与第1位标识bit的位置序号n1进行组合获得所述二进制编码段的位置特征。
4.一种数据压缩方法,其特征在于,包括:
获取待压缩数据的二进制编码文件;
按照权利要求1-3任一项所述的一种数据压缩方法对所述二进制编码文件进行多次压缩直到达到预设条件,获得压缩文件,并记录压缩次数,为所述压缩文件添加后缀,所述后缀包括压缩次数。
5.一种数据解压缩方法,其特征在于,包括:
获取按照权利要求1-3任一项所述的一种数据压缩方法获得的压缩文件;
从所述压缩文件中依次识别出所有前缀以及所述前缀对应的分布特征;
依据每个分布特征还原出所述分布特征对应的二进制编码段;
还原出的二进制编码段按照对应的分布特征在压缩文件中的排列顺序进行依次拼接,完成数据解压缩处理。
6.如权利要求5所述的数据解压缩方法,其特征在于,所述还原出每个分布特征对应的二进制编码段,具体包括:
从分布特征中提取出前缀和位置特征,从位置特征中分离出K位标识bit的位置信息融合值M和第1位标识bit的位置序号n1;
获取K位标识bit在二进制编码段的位置序号,具体包括:
步骤S1,设置滑动位置序号变量i、标识bit数量变量j和差值变量△M,所述i的初始值为N-1,所述j的初始值为K,所述△M的初始值为M;
步骤S2,获取符合位数为i且标识bit的数量为j的二进制编码组合数q,若q<△M,则认为ni为一个标识bit的位置序号,令j=j-1,△M=△M-q,i=i-1,进入步骤S3,若q>△M,则令i=i-1,进入步骤S3;若q=△M,则位置序号小于等于i的bit位均为标识bit,结束所述获取K位标识bit在二进制编码段的位置序号的步骤;
步骤S3,若j=1,则已获取到K位标识bit在二进制编码段的位置序号,若j大于1,则返回执行步骤S2;
根据获取的K位标识bit在二进制编码段的位置序号还原二进制编码段。
7.一种数据解压缩方法,其特征在于,包括:
获取根据权利要求4所述的一种数据压缩方法获得的压缩文件,从压缩文件的后缀中获取压缩次数;
按照权利要求5或6所述的一种数据解压缩方法对压缩文件进行多次解压,并记录解压次数,直到解压次数等于压缩次数时停止解压。
8.一种数据压缩装置,其特征在于,包括:
数据获取模块,用于获取待压缩数据的二进制编码文件;
二进制编码段提取模块,将所述二进制编码文件划分为多个依次排列的二进制编码段;
编码处理模块,提取二进制编码段中标识bit的分布特征,将所有二进制编码段的分布特征按照二进制编码段在二进制编码文件中的排列顺序进行组合获得所述二进制编码文件的压缩文件。
9.一种解压缩装置,其特征在于,包括:
压缩文件获取模块,获取按照权利要求1-3任一项所述的一种数据压缩方法获得的压缩文件;
识别模块,从所述压缩文件中依次识别出所有前缀以及所述前缀关联的分布特征;
二进制编码段还原模块,依据每个分布特征还原出所述分布特征对应的二进制编码段;
拼接模块,还原出的二进制编码段按照对应的分布特征在压缩文件中的排列顺序进行依次拼接,完成数据解压缩处理。
10.一种存储介质,所述存储介质用于存储指令,所述指令用于执行如权利要求1-4任一项所述的一种数据压缩方法或者如权利要求5-7任一项所述的一种数据解压缩方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111168996.3A CN113868206A (zh) | 2021-10-08 | 2021-10-08 | 一种数据压缩方法、解压缩方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111168996.3A CN113868206A (zh) | 2021-10-08 | 2021-10-08 | 一种数据压缩方法、解压缩方法、装置及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113868206A true CN113868206A (zh) | 2021-12-31 |
Family
ID=79001624
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111168996.3A Pending CN113868206A (zh) | 2021-10-08 | 2021-10-08 | 一种数据压缩方法、解压缩方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113868206A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114817831A (zh) * | 2022-06-30 | 2022-07-29 | 四川公路工程咨询监理有限公司 | 建筑工程经济用的计算辅助方法 |
CN115276664A (zh) * | 2022-09-23 | 2022-11-01 | 南通卓科智能装备有限公司 | 基于访客登记信息的访客数据管理方法 |
CN115499016A (zh) * | 2022-11-15 | 2022-12-20 | 中科声龙科技发展(北京)有限公司 | 基于二进制的数据处理的方法、装置、设备及存储介质 |
CN115529357A (zh) * | 2022-11-24 | 2022-12-27 | 武汉惠强新能源材料科技有限公司 | 基于mes互通互联生产数据的更新异常匹配方法 |
CN116996698A (zh) * | 2023-08-16 | 2023-11-03 | 武汉精臣智慧标识科技有限公司 | 一种图像点阵数据压缩方法及装置 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007050018A1 (en) * | 2005-10-24 | 2007-05-03 | Algo Trim Ab | Method and system for compressing data |
CN1984336A (zh) * | 2005-12-05 | 2007-06-20 | 华为技术有限公司 | 一种二进制化方法及装置 |
CN103067022A (zh) * | 2012-12-19 | 2013-04-24 | 中国石油天然气集团公司 | 一种整型数据无损压缩方法、解压缩方法及装置 |
CN103546161A (zh) * | 2013-10-31 | 2014-01-29 | 江苏引跑网络科技有限公司 | 基于二进制位处理的无损压缩方法 |
WO2014056188A1 (zh) * | 2012-10-12 | 2014-04-17 | 深圳市英威腾电气股份有限公司 | 编解码方法及其相关装置和编解码系统 |
FR3028118A3 (fr) * | 2014-11-04 | 2016-05-06 | Remy Bernard Louis Blanc | Compression de donnees informatiques |
US20170338834A1 (en) * | 2015-02-16 | 2017-11-23 | Mitsubishi Electric Corporation | Data compression apparatus, data decompression apparatus, data compression method, data decompression method, and computer readable medium |
CN110504973A (zh) * | 2018-05-16 | 2019-11-26 | 北京京东尚科信息技术有限公司 | 文件压缩、解压方法和装置 |
US10541711B1 (en) * | 2019-03-29 | 2020-01-21 | Mitsubishi Electric Research Laboratories, Inc. | Short block length distribution matching algorithm |
CN110795747A (zh) * | 2019-10-18 | 2020-02-14 | 浪潮电子信息产业股份有限公司 | 一种数据加密存储方法、装置、设备及可读存储介质 |
CN112118010A (zh) * | 2020-08-25 | 2020-12-22 | 中电信用服务有限公司 | 一种字符串的压缩处理方法、装置和存储介质 |
-
2021
- 2021-10-08 CN CN202111168996.3A patent/CN113868206A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007050018A1 (en) * | 2005-10-24 | 2007-05-03 | Algo Trim Ab | Method and system for compressing data |
CN1984336A (zh) * | 2005-12-05 | 2007-06-20 | 华为技术有限公司 | 一种二进制化方法及装置 |
WO2014056188A1 (zh) * | 2012-10-12 | 2014-04-17 | 深圳市英威腾电气股份有限公司 | 编解码方法及其相关装置和编解码系统 |
CN103067022A (zh) * | 2012-12-19 | 2013-04-24 | 中国石油天然气集团公司 | 一种整型数据无损压缩方法、解压缩方法及装置 |
CN103546161A (zh) * | 2013-10-31 | 2014-01-29 | 江苏引跑网络科技有限公司 | 基于二进制位处理的无损压缩方法 |
FR3028118A3 (fr) * | 2014-11-04 | 2016-05-06 | Remy Bernard Louis Blanc | Compression de donnees informatiques |
US20170338834A1 (en) * | 2015-02-16 | 2017-11-23 | Mitsubishi Electric Corporation | Data compression apparatus, data decompression apparatus, data compression method, data decompression method, and computer readable medium |
CN110504973A (zh) * | 2018-05-16 | 2019-11-26 | 北京京东尚科信息技术有限公司 | 文件压缩、解压方法和装置 |
US10541711B1 (en) * | 2019-03-29 | 2020-01-21 | Mitsubishi Electric Research Laboratories, Inc. | Short block length distribution matching algorithm |
CN110795747A (zh) * | 2019-10-18 | 2020-02-14 | 浪潮电子信息产业股份有限公司 | 一种数据加密存储方法、装置、设备及可读存储介质 |
CN112118010A (zh) * | 2020-08-25 | 2020-12-22 | 中电信用服务有限公司 | 一种字符串的压缩处理方法、装置和存储介质 |
Non-Patent Citations (2)
Title |
---|
陆军,刘大昕,陈立岩: "基于排列组合的常数级压缩方法", 大连海事大学学报, vol. 34, no. 4, 15 November 2008 (2008-11-15), pages 28 - 32 * |
陆军: "基于组合学的数据编码方法研究", 中国博士学位论文全文数据库 基础科学辑, no. 07, 15 July 2011 (2011-07-15), pages 002 - 41 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114817831A (zh) * | 2022-06-30 | 2022-07-29 | 四川公路工程咨询监理有限公司 | 建筑工程经济用的计算辅助方法 |
CN114817831B (zh) * | 2022-06-30 | 2022-09-23 | 四川公路工程咨询监理有限公司 | 建筑工程经济用的计算辅助方法 |
CN115276664A (zh) * | 2022-09-23 | 2022-11-01 | 南通卓科智能装备有限公司 | 基于访客登记信息的访客数据管理方法 |
CN115276664B (zh) * | 2022-09-23 | 2022-12-30 | 南通卓科智能装备有限公司 | 基于访客登记信息的访客数据管理方法 |
CN115499016A (zh) * | 2022-11-15 | 2022-12-20 | 中科声龙科技发展(北京)有限公司 | 基于二进制的数据处理的方法、装置、设备及存储介质 |
CN115529357A (zh) * | 2022-11-24 | 2022-12-27 | 武汉惠强新能源材料科技有限公司 | 基于mes互通互联生产数据的更新异常匹配方法 |
CN116996698A (zh) * | 2023-08-16 | 2023-11-03 | 武汉精臣智慧标识科技有限公司 | 一种图像点阵数据压缩方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113868206A (zh) | 一种数据压缩方法、解压缩方法、装置及存储介质 | |
US7365658B2 (en) | Method and apparatus for lossless run-length data encoding | |
KR100894002B1 (ko) | 선택적 압축과 복원 및 압축 데이터에 대한 데이터 포맷을위한 장치 및 방법 | |
EP0729237A2 (en) | Adaptive multiple dictionary data compression | |
CN107682016B (zh) | 一种数据压缩方法、数据解压方法及相关系统 | |
US20120130965A1 (en) | Data compression method | |
CN110933438B (zh) | 一种jpeg图像可逆信息隐藏方法 | |
CN112332853A (zh) | 一种基于电力系统的时序数据压缩与恢复方法 | |
CN102014283A (zh) | 一阶差分前缀表示的图像数据无损压缩的编码方法 | |
JP5913748B2 (ja) | セキュアで損失のないデータ圧縮 | |
CA2770348A1 (en) | Compression of bitmaps and values | |
CN101751897A (zh) | 压缩及解压缩查找表的方法及其相关装置 | |
KR101023536B1 (ko) | 데이터 무손실 압축 방법 | |
US20080252498A1 (en) | Coding data using different coding alphabets | |
JP5472610B2 (ja) | 数値データ列の符号化/復号化の方法および装置 | |
CN116805537B (zh) | 用于心肺康复管理系统的数据处理方法 | |
EP0635807B1 (en) | Coding apparatus for image compression | |
CN101657973B (zh) | 采用位精度的编码装置和编码方法 | |
CN116208171A (zh) | 数据压缩和解压缩方法、装置、电子设备及存储介质 | |
CN109660809A (zh) | 基于inter解码的colmv数据无损压缩方法及系统 | |
JP5626440B2 (ja) | 数値データ列の符号化/復号化の方法および装置 | |
CN111274950A (zh) | 特征向量数据编解码方法及服务器和终端 | |
CN115514967B (zh) | 基于二进制块双向编码的图像压缩方法及图像解压方法 | |
Shu et al. | A two-stage data compression method for real-time database | |
CN112669396B (zh) | 图像无损压缩方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |