CN107247562A - 一种压缩优化方法及其装置 - Google Patents

一种压缩优化方法及其装置 Download PDF

Info

Publication number
CN107247562A
CN107247562A CN201710521672.0A CN201710521672A CN107247562A CN 107247562 A CN107247562 A CN 107247562A CN 201710521672 A CN201710521672 A CN 201710521672A CN 107247562 A CN107247562 A CN 107247562A
Authority
CN
China
Prior art keywords
data
compression
rewritten
memory block
compressed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710521672.0A
Other languages
English (en)
Other versions
CN107247562B (zh
Inventor
刘丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201710521672.0A priority Critical patent/CN107247562B/zh
Publication of CN107247562A publication Critical patent/CN107247562A/zh
Application granted granted Critical
Publication of CN107247562B publication Critical patent/CN107247562B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0608Saving storage space on storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • G06F3/0631Configuration or reconfiguration of storage systems by allocating resources to storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • G06F3/0644Management of space entities, e.g. partitions, extents, pools

Abstract

本发明公开了一种压缩优化方法及其装置,包括压缩待压缩数据,并将压缩后的数据依次存储至固定大小的存储块中;对压缩后的数据进行数据重写后,为重写后的新数据分配空闲存储空间进行存储,并标记被重写的数据;本发明采用优化释放算法释放被重写的数据占用的存储空间。能够及时释放被重写后的数据所占用的存储区域,减少无用数据的积累,提高存储空间利用率高。

Description

一种压缩优化方法及其装置
技术领域
本发明涉及数据压缩技术领域,特别是涉及一种压缩优化方法及其装置。
背景技术
在大数据时代,压缩技术能够大大的节省实际存储空间,降低产品的成本。压缩技术对于用户来说使用广泛,如zip以及gzip等工具的使用。
但是,由于用户经常会对压缩后的数据进行重写,而目前的方法中,由于重写后会导致数据进行重新压缩,而重新压缩后的数据与上次压缩后的数据大小往往会发生改变,这种情况下即导致了无用数据占用的存储空间越来越多,造成压缩空间浪费,存储空间的利用率低。
因此,如何提供一种存储空间利用率高的压缩优化方法及其装置是本领域技术人员目前需要解决的问题。
发明内容
本发明的目的是提供一种压缩优化方法及其装置,能够及时释放被重写后的数据所占用的存储区域,减少无用数据的积累,提高存储空间利用率高。
为解决上述技术问题,本发明提供了一种压缩优化方法,包括:
压缩待压缩数据,并将压缩后的数据依次存储至固定大小的存储块中;
对压缩后的数据进行数据重写后,为重写后的新数据分配空闲存储空间进行存储,并标记被重写的数据;
采用优化释放算法释放所述被重写的数据占用的存储空间。
优选地,所述压缩待压缩数据的过程具体为:
在待压缩数据写入过程中,每隔预设时间段,则将该预设时间段内接收到的待压缩数据进行压缩,并存储至相应的存储块中。
优选地,所述采用优化释放算法释放被重写的数据占用的存储空间的过程包括:
检查被重写过的存储块中被重写过的部分所占的比例,若存在被完全重写的存储块,则释放该存储块。
为解决上述技术问题,本发明还提供了一种压缩优化装置,包括:
压缩模块,用于压缩待压缩数据,并将压缩后的数据依次存储至固定大小的存储块中;
重写模块,用于对压缩后的数据进行数据重写后,为重写后的新数据分配空闲存储空间进行存储,并标记被重写的数据;
释放模块,用于采用优化释放算法释放被重写的数据占用的存储空间。
优选地,所述压缩模块具体包括:
计时单元,用于在待压缩数据写入过程中,每隔预设时间段,触发一次实时压缩单元;
实时压缩单元,用于将该预设时间段内接收到的待压缩数据进行压缩,并存储至相应的存储块中。
优选地,所述释放模块包括:
存储块检查单元,用于检查被重写过的存储块中被重写过的部分所占的比例,若存在被完全重写的存储块,触发存储块释放单元;
所述存储块释放单元,用于释放相应存储块。
本发明提供了一种压缩优化方法及其装置,将压缩后的数据存放至固定大小的存储块中,压缩数据重写后,将重写后的新数据写入新存储空间内,而被重写的旧数据进行标记,之后采用预设的优化释放算法释放掉被重写的数据占用的存储空间。本发明通过将压缩数据的存储区域划分为固定大小的存储块,方便了后续对被重写的数据所占用的存储空间的释放,且本发明通过数据的释放操作,避免了大量无用数据的积累,减少了压缩空间的浪费,提高了存储空间利用率高。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对现有技术和实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的一种压缩优化方法的过程的流程图;
图2为本发明提供的另一种压缩优化方法的过程的流程图;
图3为本发明提供的一种压缩优化装置的结构示意图。
具体实施方式
本发明的核心是提供一种压缩优化方法及其装置,能够及时释放被重写后的数据所占用的存储区域,减少无用数据的积累,提高存储空间利用率高。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供了一种压缩优化方法,参见图1所示,图1为本发明提供的一种压缩优化方法的过程的流程图;该方法包括:
步骤s1:压缩待压缩数据,并将压缩后的数据依次存储至固定大小的存储块中;
步骤s2:对压缩后的数据进行数据重写后,为重写后的新数据分配空闲存储空间进行存储,并标记被重写的数据;
步骤s3:采用优化释放算法释放被重写的数据占用的存储空间。
具体的,步骤s1中压缩待压缩数据的过程具体为:
在待压缩数据写入过程中,每隔预设时间段,则将该预设时间段内接收到的待压缩数据进行压缩,并存储至相应的存储块中。
可以理解的是,上述压缩方式可以理解为实时压缩,即压缩窗口由传统的滑动窗口变为时间为轴的窗口,数据持续写入的过程中,每个预设时间段,则将该段连续时间段内输入的数据进行压缩,这种方式相比目前数据全部写入后,再将其按照数据大小进行划分然后压缩的方式,首先压缩时间短,另外,也方便了将数据压缩至各个固定大小的存储块内。
作为优选地,步骤s3的过程包括:
检查被重写过的存储块中被重写过的部分所占的比例,若存在被完全重写的存储块,则释放该存储块。
可以理解的是,通过划分存储块,可以使得连续输入的数据一般会存储与同一个或相邻的存储块中,因此在进行数据重写时,被重写的数据一般会处于同一个或相邻的存储块中,这样只要控制存储块的大小,即能够使得在经过几次数据重写后,比较容易达到一个或几个存储块内的数据均被重写过,进而释放,这些存储块,达到减少无用数据的目的。而若压缩后的数据存储的空间并未划分为同等大小的存储块,则在对其进行释放操作时,所需的算法要比目前的算法复杂的多,且容易误删除其他未被重写的数据。
进一步的,还可以将每个存储块分为多个存储页,每个存储页内存储的数据较少,这样一旦一个存储页内的数据全部被重写,即仅释放该存储页。这种方式能够进一步减少无用数据占用的空间大小,提高存储空间的利用率。
当然,这里的优化释放算法的目的是为了释放无用数据占用的存储空间,其具体算法内容本发明不作限定。
参见图2所示,图2为本发明提供的另一种压缩优化方法的过程的流程图。
本发明提供了一种压缩优化方法,将压缩后的数据存放至固定大小的存储块中,压缩数据重写后,将重写后的新数据写入新存储空间内,而被重写的旧数据进行标记,之后采用预设的优化释放算法释放掉被重写的数据占用的存储空间。本发明通过将压缩数据的存储区域划分为固定大小的存储块,方便了后续对被重写的数据所占用的存储空间的释放,且本发明通过数据的释放操作,避免了大量无用数据的积累,减少了压缩空间的浪费,提高了存储空间利用率高。
本发明还提供了一种压缩优化装置,参见图3所示,图3为本发明提供的一种压缩优化装置的结构示意图。该装置包括:
压缩模块1,用于压缩待压缩数据,并将压缩后的数据依次存储至固定大小的存储块中;
重写模块2,用于对压缩后的数据进行数据重写后,为重写后的新数据分配空闲存储空间进行存储,并标记被重写的数据;
释放模块3,用于采用优化释放算法释放被重写的数据占用的存储空间。
其中,压缩模块1具体包括:
计时单元,用于在待压缩数据写入过程中,每隔预设时间段,触发一次实时压缩单元;
实时压缩单元,用于将该预设时间段内接收到的待压缩数据进行压缩,并存储至相应的存储块中。
另外,释放模块3包括:
存储块检查单元,用于检查被重写过的存储块中被重写过的部分所占的比例,若存在被完全重写的存储块,触发存储块释放单元;
存储块释放单元,用于释放相应存储块。
本发明提供了一种压缩优化装置,将压缩后的数据存放至固定大小的存储块中,压缩数据重写后,将重写后的新数据写入新存储空间内,而被重写的旧数据进行标记,之后采用预设的优化释放算法释放掉被重写的数据占用的存储空间。本发明通过将压缩数据的存储区域划分为固定大小的存储块,方便了后续对被重写的数据所占用的存储空间的释放,且本发明通过数据的释放操作,避免了大量无用数据的积累,减少了压缩空间的浪费,提高了存储空间利用率高。
需要说明的是,在本说明书中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其他实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (6)

1.一种压缩优化方法,其特征在于,包括:
压缩待压缩数据,并将压缩后的数据依次存储至固定大小的存储块中;
对压缩后的数据进行数据重写后,为重写后的新数据分配空闲存储空间进行存储,并标记被重写的数据;
采用优化释放算法释放所述被重写的数据占用的存储空间。
2.根据权利要求1所述的方法,其特征在于,所述压缩待压缩数据的过程具体为:
在待压缩数据写入过程中,每隔预设时间段,则将该预设时间段内接收到的待压缩数据进行压缩,并存储至相应的存储块中。
3.根据权利要求1或2所述的方法,其特征在于,所述采用优化释放算法释放被重写的数据占用的存储空间的过程包括:
检查被重写过的存储块中被重写过的部分所占的比例,若存在被完全重写的存储块,则释放该存储块。
4.一种压缩优化装置,其特征在于,包括:
压缩模块,用于压缩待压缩数据,并将压缩后的数据依次存储至固定大小的存储块中;
重写模块,用于对压缩后的数据进行数据重写后,为重写后的新数据分配空闲存储空间进行存储,并标记被重写的数据;
释放模块,用于采用优化释放算法释放被重写的数据占用的存储空间。
5.根据权利要求4所述的装置,其特征在于,所述压缩模块具体包括:
计时单元,用于在待压缩数据写入过程中,每隔预设时间段,触发一次实时压缩单元;
实时压缩单元,用于将该预设时间段内接收到的待压缩数据进行压缩,并存储至相应的存储块中。
6.根据权利要求4或5所述的装置,其特征在于,所述释放模块包括:
存储块检查单元,用于检查被重写过的存储块中被重写过的部分所占的比例,若存在被完全重写的存储块,触发存储块释放单元;
所述存储块释放单元,用于释放相应存储块。
CN201710521672.0A 2017-06-30 2017-06-30 一种压缩优化方法及其装置 Active CN107247562B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710521672.0A CN107247562B (zh) 2017-06-30 2017-06-30 一种压缩优化方法及其装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710521672.0A CN107247562B (zh) 2017-06-30 2017-06-30 一种压缩优化方法及其装置

Publications (2)

Publication Number Publication Date
CN107247562A true CN107247562A (zh) 2017-10-13
CN107247562B CN107247562B (zh) 2020-03-06

Family

ID=60014247

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710521672.0A Active CN107247562B (zh) 2017-06-30 2017-06-30 一种压缩优化方法及其装置

Country Status (1)

Country Link
CN (1) CN107247562B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1630371A (zh) * 2003-12-19 2005-06-22 联想(北京)有限公司 一种应用于实时传输的无损图像压缩方法
CN101326492A (zh) * 2005-10-06 2008-12-17 雷德本德有限公司 用于更新包括压缩版本的内容的方法和系统
CN101346883A (zh) * 2005-10-26 2009-01-14 斯多维兹有限公司 用于块模式访问存储的数据压缩的方法和系统
CN101359293A (zh) * 2008-09-04 2009-02-04 腾讯科技(深圳)有限公司 制作部分更新包的方法和装置
US20140258650A1 (en) * 2013-03-06 2014-09-11 Ab Initio Technology Llc Managing operations on stored data units
CN104424188A (zh) * 2013-08-19 2015-03-18 携程计算机技术(上海)有限公司 对获取的网页数据进行更新的系统及方法
US20150370698A1 (en) * 2013-01-18 2015-12-24 International Business Machines Corporation Re-aligning a compressed data array
CN106681659A (zh) * 2016-12-16 2017-05-17 郑州云海信息技术有限公司 数据压缩的方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1630371A (zh) * 2003-12-19 2005-06-22 联想(北京)有限公司 一种应用于实时传输的无损图像压缩方法
CN101326492A (zh) * 2005-10-06 2008-12-17 雷德本德有限公司 用于更新包括压缩版本的内容的方法和系统
CN101346883A (zh) * 2005-10-26 2009-01-14 斯多维兹有限公司 用于块模式访问存储的数据压缩的方法和系统
CN101359293A (zh) * 2008-09-04 2009-02-04 腾讯科技(深圳)有限公司 制作部分更新包的方法和装置
US20150370698A1 (en) * 2013-01-18 2015-12-24 International Business Machines Corporation Re-aligning a compressed data array
US20140258650A1 (en) * 2013-03-06 2014-09-11 Ab Initio Technology Llc Managing operations on stored data units
CN104424188A (zh) * 2013-08-19 2015-03-18 携程计算机技术(上海)有限公司 对获取的网页数据进行更新的系统及方法
CN106681659A (zh) * 2016-12-16 2017-05-17 郑州云海信息技术有限公司 数据压缩的方法及装置

Also Published As

Publication number Publication date
CN107247562B (zh) 2020-03-06

Similar Documents

Publication Publication Date Title
CN103488709B (zh) 一种索引建立方法及系统、检索方法及系统
CN104462141B (zh) 一种数据存储与查询的方法、系统及存储引擎装置
CN104239493B (zh) 跨集群数据迁移方法和系统
US20100161567A1 (en) Compressed data page with uncompressed data fields
CN105191144B (zh) 压缩装置、压缩方法、解压装置、解压方法以及信息处理系统
CN103701469B (zh) 一种大规模图数据的压缩存储方法
CN101692252B (zh) 文件空闲块的分配和回收方法
CN105631035B (zh) 数据存储方法和装置
CN104205065B (zh) 用于列表数据压缩的多重分类
CN103037344B (zh) 一种话单去重方法及装置
CN103810246B (zh) 一种索引创建方法和装置以及索引查询方法和装置
CN106202213A (zh) 一种fpga二进制文件压缩、解压方法及压缩、解压装置
CN108153483A (zh) 一种基于属性分组的时序数据压缩方法
CN102541925A (zh) 一种实现详细话单的快速存储和检索的方法及装置
CN103714013A (zh) 一种文件系统的存储空间的配置方法及装置
CN106980541A (zh) 一种大页内存压缩回收系统及方法
CN104123309B (zh) 用于数据管理的方法和系统
CN104408128B (zh) 一种基于b+树异步更新索引的读优化方法
HK1062947A1 (en) Hash technique eliminating pointer storage to reduce ram size
CN104199783A (zh) Fpga内以太网数据帧的缓存与转发的方法及装置
CN107247562A (zh) 一种压缩优化方法及其装置
CN101188457A (zh) 一种基于通信设备的红外数据的学习以及存取方法
CN107180051A (zh) 一种日志管理方法、服务器
CN101334795B (zh) 数据存储方法和装置
CN105630410B (zh) 使用非易失随机读写存储芯片动态管理文件存储区的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant