WO2021243531A1

WO2021243531A1 - 数据压缩方法、装置、电子设备及存储介质

Info

Publication number: WO2021243531A1
Application number: PCT/CN2020/093846
Authority: WO
Inventors: 郭子亮
Original assignee: 深圳市欢太科技有限公司; Oppo广东移动通信有限公司
Priority date: 2020-06-02
Filing date: 2020-06-02
Publication date: 2021-12-09
Also published as: CN115398406A

Abstract

一种数据压缩方法、装置、电子设备及存储介质，涉及电子设备技术领域，所述方法包括：获取内存中的待压缩数据（S101）；获取所述待压缩数据在所述内存中持续存储的时间长度，作为第一时间（S102）；如果所述第一时间大于或者等于第一时间阈值，则利用第一压缩算法对所述待压缩数据进行压缩，得到第一压缩数据（S103）；如果所述第一压缩数据满足预设条件，则对所述第一压缩数据再次进行压缩得到第二压缩数据（S104）。本方法可以节省内存空间，提升内存利用率。

Description

数据压缩方法、装置、电子设备及存储介质

技术领域

本申请涉及电子设备技术领域，更具体地，涉及一种数据压缩方法、装置、电子设备及存储介质。

背景技术

现有的电子设备，例如手机、平板电脑等，已经成为人们日常生活中最常用的消费型电子产品之一。随着用户需求的不断增加，电子设备中存储及运行的数据越来越多，因此其内存空间以及磁盘空间的利用成为了研究问题。

发明内容

鉴于上述问题，本申请提出了一种数据压缩方法、装置、电子设备及存储介质，以改善上述问题。

第一方面，本申请实施例提供了一种数据压缩方法，所述方法包括：获取内存中的待压缩数据；获取所述待压缩数据在所述内存中持续存储的时间长度，作为第一时间；如果所述第一时间大于或者等于第一时间阈值，则利用第一压缩算法对所述待压缩数据进行压缩，得到第一压缩数据；如果所述第一压缩数据满足预设条件，则对所述第一压缩数据再次进行压缩得到第二压缩数据。

第二方面，本申请实施例提供了一种数据压缩装置，所述装置包括：数据获取模块、时间获取模块、第一压缩模块以及第二压缩模块，其中，数据获取模块用于获取内存中的待压缩数据。时间获取模块，用于获取所述待压缩数据在所述内存中持续存储的时间长度，作为第一时间。第一压缩模块，用于如果所述第一时间大于或者等于第一时间阈值，则利用第一压缩算法对所述待压缩数据进行压缩，得到第一压缩数据。第二压缩模块，用于如果所述第一压缩数据满足预设条件，则对所述第一压缩数据再次进行压缩得到第二压缩数据。

第三方面，本申请实施例提供了一种电子设备，包括：一个或多个处理器；存储器；一个或多个应用程序，其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行，所述一个或多个程序配置用于执行上述第一方面提供的数据压缩方法。

第四方面，本申请实施例提供了一种计算机可读取存储介质，所述计算机可读取存储介质中存储有程序代码，所述程序代码可被处理器调用执行上述第一方面提供的数据压缩方法。

本申请提供的方案，通过获取内存中的待压缩数据以及该待压缩数据在内存中持续存储的时间长度来实现第一压缩，即当待压缩数据在内存中持续存储的时间长度大于或者等于第一时间阈值时，利用第一压缩算法对待压缩数据进行压缩，得到第一压缩数据，而后当该第一压缩数据满足预设条件时，本申请可以对第一压缩数据再次进行压缩得到第二压缩数据，其在一定程度上不仅可以节省内存和磁盘的空间，同时可以提升内存及磁盘利用率。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了根据本申请一个实施例的数据压缩方法流程图。

图2示出了根据本申请另一个实施例的数据压缩方法流程图。

图3示出了根据本申请又一个实施例的数据压缩方法流程图。

图4示出了根据本申请再一个实施例的数据压缩方法流程图。

图5示出了根据本申请一个实施例的数据压缩装置的一种框图。

图6示出了根据本申请一个实施例的数据压缩装置中第二压缩模块的框图。

图7示出了根据本申请一个实施例的数据压缩装置中第二压缩模块的另一框图。

图8示出了根据本申请一个实施例的数据压缩装置中第二压缩模块的又一框图。

图9是本申请实施例的用于执行根据本申请实施例的数据压缩方法的电子设备的框图。

图10是本申请实施例的用于保存或者携带实现根据本申请实施例的数据压缩方法的程序代码的存储单元。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述。

随着科技水平的发展，时序数据库作为一种时序数据存储系统基础设施，逐渐被广泛应用于监控系统中。时序数据是指同一指标按时间顺序记录的数据序列，而时序数据库是用于存储和管理时序数据的专业化数据库，即用于存放时间序列的海量数据，这些海量数据按照时间顺序变化，并且需要支持时序数据的快速写入、持久化、多维度的聚合查询等基本功能。电子设备中，内存和磁盘是重要的部件之一，内存是与CPU进行沟通的桥梁，而电子设备中大部分数据均存储于磁盘中，因此内存和磁盘的性能对电子设备的影响较大。

由于时序数据具有海量的特性，所以无法将数据全量存储于电子设备的内存中，现有技术中，通常是把当前指定时间内的数据置于内存中，作为热数据，以此来提供快速的查询服务。鉴于内存成本高，所以数据在内存中的周期超过指定时间后，时序数据库会对数据进行压缩，作为冷数据持久化到磁盘中。然而在多数应用实践中，用户对于持久化手的数据仍有大量的查询需求，即虽然单一的压缩算法可以实现时序数据的高压缩比，但相应的解压性能难以满足大规模冷数据的查询需求，甚至成为电子设备的性能瓶颈。

针对上述问题，发明人提出了本申请实施例提供的数据压缩方法、装置、电子设备以及存储介质，可以对内存中的待压缩数据进行有效的压缩。其中，具体的数据压缩方法在后续的实施例中进行详细的说明。

请参阅图1，图1示出了本申请一个实施例提供的数据压缩方法的流程示意图。所述数据压缩方法用于对电子设备中，当内存中的数据满足预设条件时本申请可以对压缩获取的数据再次进行压缩，从而不仅可以节省内存空间，提升内存利用率，同时可以对第一压缩数据进行再次压缩以节省磁盘的空间利用率。在具体的实施例中，所述数据压缩方法应用于如图5所示的数据压缩装置500以及配置有所述数据压缩装置500的电子设备100(图9)。下面将以电子设备为例，说明本实施例的具体流程，当然，可以理解的，本实施例所应用的电子设备可以为智能手机、平板电脑、电子书、智能手表等，在此不做限定。从图1可以看出该数据压缩方法可以包括步骤S101至步骤S104。

步骤S101：获取内存中的待压缩数据。

在本申请实施例中，待压缩数据可以为首次写入内存的数据，内存(又称随机存取存储器，random access memory，RAM)表示运行程序时使用的内存(即运行内存)，只能临时存储数据，用于与处理器交换高速缓存数据，但是内存本身不能用于长期存储数据。应用在运行的状态下需要占用内存空间来存储运行过程中的数据，不同的应用在不同的运行状态占用的内存空间大小不一定相同。

在一种实施方式中，首次写入内存的数据可以为时序数据中的热数据，时序数据是指时间序列数据。时间序列数据是依据统一指标按时间顺序记录的数据列，所述时序数据包括时间信息、数据类型和数据信息。其中的时间信息具体可以是时间戳，但本申请中对其具体实现形式不做固定限制，只要是能够区分表示不同时间的数据即可。数据类型可以为已知的或未来可能出现的数据类型，如现有的数据类型可以包括Integer、Long、Float、Double、String、Binary Array、Image等类型。其中的数据信息可以为数据本身，即不包含时间信息和数据类型等描述内容的原始数据。

由于时序数据具有海量的特性所以无法将数据全量存储于电子设备的内存中，为了解决该问题本申请将当前指定时间内的数据置于内存中，作为热数据，而后当该热数据超过指定时间后，电子设备会对其进行压缩，最后作为冷数据持久化。本申请实施例中，热数据可以是频繁访问的数据，通常情况下其存储在高速缓存存储设备中，冷数据是指访问频率较低和访问性能要求较低的数据，如短期内不会访问甚至在未来不再需要的数据。

作为一种实施方式，电子设备可以每间隔设定时长，获取内存中的待压缩数据，以从这些待压缩数据中确定后续可以被压缩的数据，对确定的待压缩数据进行压缩，即进入步骤S102。

作为另一种实施方式，电子设备也可以根据用户输入的触发指令，执行获取内存中当前存储的待压缩数据的操作，以从这些待压缩数据中确定后续可以被压缩的数据，对确定的待压缩数据进行压缩，也就是说进入步骤S102。当然，具体触发步骤S101的方式在本申请实施例中可以不作为限定。

步骤S102：获取所述待压缩数据在所述内存中持续存储的时间长度，作为第一时间。

在一种实施方式中，电子设备获取到内存中的待压缩数据后，可以获取到所述待压缩数据在内存中存储的时间，即获取待压缩数据在内存中持续存储的时间长度，该时间长度可以是待压缩数据的生命周期。换句话说，当待压缩数据进入内存后，电子设备就可以开始执行时间记录操作，而后将其记录的时间作为第一时间。例如，数据A进入内存的时间为2019年9月10日7点45分，当前时刻为2019年9月10日16点45分，此时数据A在内存中持续存储的时间长度则为7小时。

步骤S103：如果所述第一时间大于或者等于第一时间阈值，则利用第一压缩算法对所述待压缩数据进行压缩，得到第一压缩数据。

本申请实施例中，电子设备获取到待压缩数据在内存中持续存储的时间长度第一时间后，可以判断所述第一时间是否大于或者等于第一时间阈值，如果第一时间大于或者等于第一时间阈值，则利用第一压缩算法对所述待压缩数据进行压缩，得到第一压缩数据。其中，第一时间阈值可以是预先设置好的，也可以根据经验值获取的，或者也可以是内存中所有数据生命周期的平均值，第一时间阈值具体为哪个这里不进行明确限制。

在一种实施方式中，电子设备获取到第一时间和第一时间阈值后，可以将所述第一时间和第一时间阈值进行对比，并判断所述第一时间与第一时间阈值是否相等，如果第一时间与第一时间阈值相等，则可以利用第一压缩算法对第一时间对应的待压缩数据进行压缩。例如，内存中存在待压缩数据A和待压缩数据B，待压缩数据A对应的第一时间T _A＝5小时，待压缩数据B对应的时间为T _B＝1小时，第一时间阈值T为5小时，通过对比可以发现待压缩数据A对应的第一时间T _A与第一时间阈值T相同，此时就可以利用第一压缩算法对待压缩数据A进行压缩。

本申请实施例中，第一压缩算法包括但不限于DFCM((Differential Finite Context Metho，差分有限上下文预测方法)算法、FCM(Finite Context Method，有限上下文预测方法)算法或者LZ4算法等。其中，LZ4压缩算法是一种对以快速和资源开销小为目标的压缩算法。在另一些实施例中，电子设备中可以包括多个第一压缩算法，而后可以利用所述多个第一压缩算法分别对待压缩数据进行压缩，得到多个压缩结果，并将所述多个压缩结果进行排序比对，将占用存储最小的压缩结果作为目标压缩结果，最后将该目标压缩结果对应的压缩算法作为目标压缩算法。

在一些实施方式中，电子设备在利用第一压缩算法对待压缩数据进行压缩时，可以先判断即将要压缩的数据是否为二进制机器语言，如果待压缩数据不是二进制机器语言，则利用第一压缩算法对所述待压缩数据进行压缩。另外，如果待压缩数据为二进制机器语言，则不对其进行压缩。因为二进制机器语言经过压缩得到的数据所占磁盘空间多数不会发生改变，有时候二进制机器语言经过压缩获取的数据占用磁盘空间反而会更大，且对二进制机器语言进行压缩不仅会增加数据压缩的时间，而且在一定程度上会浪费电子设备的系统资源，所以当待压缩数据为二进制机器语言时，本申请可以不对其进行压缩。

需要说明的是，利用第一压缩算法对所述待压缩数据进行压缩得到第一压缩数据之后，电子设备可以将所述第一压缩数据进行持久化，得到持久化数据，持久化数据是信息处理中访问频率较低并且不会修改的数据，即所谓持久化就是将第一压缩数据保存到磁盘中，使得在应用程序或机器重启后可以继续访问之前保存的该数据。本申请可以利用属性列表plist、偏好设置preference、归档解档NSKeyedArchiver、数据库 SQLite或者数据库CoreData进行数据的持久化。其中，属性列表是一种明文的轻量级存储方式、其存储格式有多种，最常规格式为xml格式，属性列表的安全性很低，其主要用于指定应用的默认设置于相应的数据存储；偏好设置主要用于保存应用程序的配置信息，其可以将电子设备中的所有数据保存在同一个文件中；归档、解档是进行数据加密处理的，其安全性较高；数据库SQLite是一个轻量级、跨平台的小型数据库、其拥有可移植性高、有着和MySql几乎相同的数据库语句以及无需服务器即可使用的优点；数据库CoreData：将本地数据放到内存中使得访问速度更快。本申请可以只利用上述任意一种持久化方式对第一压缩数据进行持久化，也可以结合上述任意两种或者两种以上的持久化方式对第一压缩数据进行持久化，具体如何将第一压缩数据进行持久化这里不进行明确限制，可以根据实际需求进行选择。

步骤S104：如果所述第一压缩数据满足预设条件，则对所述第一压缩数据再次进行压缩得到第二压缩数据。

本申请实施例中，电子设备将第一压缩数据持久化到磁盘后，可以对所述第一压缩数据进行持续监测，并判断所述第一压缩数据是否满足预设条件，如果所述第一压缩数据满足预设条件，则对所述第一压缩数据进行压缩得到第二压缩数据；如果所述第一压缩数据不满足预设条件，则不对其进行压缩，即保证所述第一压缩数据不发生改变。其中，预设条件可以是：第一压缩数据在磁盘中持续存储的时间长度大于第二时间阈值，也可以是第一压缩数据的使用次数大于预设次数，或者是所述第一压缩数据的使用时长大于预设时长等。

本申请实施例提供的数据压缩方法，通过获取内存中的待压缩数据和该数据在内存中持续存储的时间长度得到第一压缩数据，即当第一时间大于或者等于第一时间阈值，利用第一压缩算法对待压缩数据进行压缩，得到第一压缩数据，而后当第一压缩数据满足预设条件时，电子设备可以对第一压缩数据再次进行压缩得到第二压缩数据，本申请通过对数据的梯度压缩，不仅可以节省内存空间，同时可以提升磁盘空间的利用率。另外，当待压缩数据为二进制机器语言时本申请可以不对其进行压缩，如此在一定程度上不仅可以减少因数据压缩造成的时间浪费，而且可以提高电子设备系统资源的利用率。

请参阅图2，图2示出了本申请另一个实施例提供的数据压缩方法的流程示意图。该方法应用于上述电子设备，下面将针对图2所示的流程进行详细的阐述，所从图2可以看出数据压缩方法可以包括步骤S201至步骤S205。

步骤S201：获取内存中的待压缩数据。

步骤S202：获取所述待压缩数据在所述内存中持续存储的时间长度，作为第一时间；

步骤S203：如果所述第一时间大于或者等于第一时间阈值，则利用第一压缩算法对所述待压缩数据进行压缩，得到第一压缩数据。

在本申请实施例中，步骤S201以及步骤S203可以参阅前述实施例的内容，在此不再赘述。

步骤S204：获取所述第一压缩数据在磁盘中持续存储的时间长度，作为第二时间。

通过上述介绍可以知道，电子设备利用第一压缩算法对待压缩数据进行压缩得到第一压缩数据之后，可以将所述第一压缩数据存储至电子设备的磁盘中，而当所述第一压缩数据存储至磁盘后电子设备可以对其存储的时间进行记录，该时间可以为起始时间。例如，第一压缩数据A于2019年9月18日19点20分存储至电子设备磁盘的，则其起始时间即为2019年9月18日19点20分。本申请实施例中，电子设备可以获取所述第一压缩数据在磁盘中持续存储的时间长度，作为第二时间，即第二时间为当前时间与起始时间之间的时间差。例如，第一压缩数据A的起始时间为2019年9月18日19点20分，当前时间为2019年9月19日20点30分，此时即可确定出第一压缩数据在磁盘中持续存储的时间长度为25小时10分钟，即第二时间为25小时10分钟。

步骤S205：如果所述第二时间大于第二时间阈值，则利用第二压缩算法对所述第一压缩数据再次进行压缩，所述第二压缩算法与第一算法不同。

本申请实施例中，电子设备获取到第一压缩数据在磁盘中持续存储的时间长度第二时间后，可以判断所述第二时间是否大于第二时间阈值，如果第二时间大于第二时间阈值，则利用第二压缩算法对第二压缩数据再次进行压缩；如果第二时间小于第二时间阈值则不对所述第一压缩数据再次进行压缩。在一些实施方式中，当第一时间等于第二时间阈值时，电子设备可以利用第二压缩算法对所述第一压缩数据再次进行压缩。其中，第二压缩算法与第一压缩算法不同，本申请中第二压缩算法为异或差量压缩算法(exclusive OR，XOR算法)，异或差量压缩算法是一种基于数据点间分级XOR的差量数据压缩编码算法，通过存储数据的差量可以极大的提高数据的压缩率。

在一些实施方式中，对第一压缩数据再次进行压缩得到第二压缩数据之后，电子设备可以获取其磁盘的剩余存储空间，如果所述磁盘的剩余存储空间小于存储阈值，电子设备则可以对所述第二压缩数据再次进行压缩，并重新获取所述磁盘的剩余存储空间，直至所述磁盘的剩余存储空间大于存储阈值。另外，在此过程中电子设备可以对第二压缩数据被压缩的次数进行统计，即获取第二压缩数据的被压缩次数，并判断所述被压缩次数是否小于设定次数，如果被压缩次数小于设定次数，则对第二压缩数据再次进行压缩。例如，对第一压缩数据A再次进行压缩得到第二压缩数据B，获取到磁盘的剩余存储空间为285M，而存储阈值为300M，显然，剩余存储空间为285M小于存储阈值为300M，此时则可以对所述第二压缩数据B再次压缩，再次获取磁盘的剩余存储空间，并判断其是否小于存储阈值。在此过程中，电子设备可以记录压缩操作的次数，即第二压缩数据的被压缩次数，当该次数小于设定次数，则继续执行压缩操作，而当压缩次数大于或者等于设定次数，则停止压缩操作。例如，经过统计确定出针对所述第二压缩数据B执行的压缩操作次数为3次，而设定次数也为3次，此时则停止压缩。

在另一些实施方式中，如果被压缩次数小于设定次数，电子设备则可以获取该第二压缩数据对应的压缩率，所述压缩率为所述第二压缩数据在被压缩前其数据大小和被压缩后数据大小之间的比值，即待压缩数据被压缩前后的数据比值，在此过程中电子设备可以判断所述第二压缩数据对应的压缩率是否小于预设压缩率。如果第二压缩数据对应的压缩率小于预设压缩率，则可以对所述第二压缩数据再次进行压缩，并重新获取所述第二压缩数据对应的压缩率，并再次判断该压缩率是否小于预设压缩率，直至所述压缩率小于预设压缩率。可以理解的，当第二压缩数据被压缩多次后，第二压缩数据被压缩的层级越深(压缩次数越多)，其每次可压缩的难度会加大，压缩大小相应的也会变小，因此，本申请可以利用压缩率，来确定是否继续对第二压缩数据进行压缩。压缩率指第二压缩数据压缩后的大小与压缩前的大小之比。例如，第二压缩数据在进行第一层级的压缩时，压缩率可以为0.33，第二压缩数据在进行第二层级的压缩时，压缩率可以为0.44，在进行第三层级的压缩时，压缩率可以为0.5，当然，以上压缩率仅为举例，并不代表对本申请实施例中具体的压缩率的限定。

本申请实施例提供的数据压缩方法，通过获取第一压缩数据在磁盘中持续存储的时间长度，作为第二时间来确定是否将所述第一压缩数据进行压缩，具体的，当第二时间大于第二时间阈值时，本申请可以利用第二压缩算法对第一压缩数据再次进行压缩，电子设备可以自动对待压缩数据进行多阶段压缩，不仅可以使持久化数据保持最高压缩比，而且可以解决冷数据访问性能的问题，在一定程度上可以打破用户对冷数据大量查询的性能瓶颈，提高用户的使用体验。

请参阅图3，图3示出了本申请又一个实施例提供的数据压缩方法的流程示意图。该方法应用于上述电子设备，下面将针对图3所示的流程进行详细的阐述，所从图3 可以看出数据压缩方法可以包括步骤S301至步骤S305。

步骤S301：获取内存中的待压缩数据。

步骤S302：获取所述待压缩数据在所述内存中持续存储的时间长度，作为第一时间；

步骤S303：如果所述第一时间大于或者等于第一时间阈值，则利用第一压缩算法对所述待压缩数据进行压缩，得到第一压缩数据。

在本申请实施例中，步骤S301以及步骤S303可以参阅前述实施例的内容，在此不再赘述。

步骤S304：获取所述第一压缩数据的使用次数，并判断所述第一压缩数据的使用次数是否小于预设次数。

在一种实施方式中，电子设备利用第一压缩算法对待压缩数据进行压缩得到第一压缩数据，而后可以将所述第一压缩数据存储至电子设备的磁盘中，电子设备可以检测该第一压缩数据是否被使用，如果被使用则可以获取其被使用的次数。本申请实施例中，电子设备获取到第一压缩数据的使用次数时可以判断所述第一压缩数据的使用次数是否小于预设次数，如果第一压缩数据的使用次数小于预设次数，则利用第二压缩算法对所述第一压缩数据再次进行压缩，即进入步骤S305；如果第一压缩数据的使用次数大于预设次数，则不对所述第二压缩数据进行再次压缩。第一压缩数据的使用次数越多，则表示该第一压缩数据被使用的可能性越高，及数据被使用的次数越多，则其压缩率越高，以避免第一压缩数据被再次使用时的解压难度较大，增加电子设备的系统负担，本申请对使用次数大于预设次数的第一压缩数据不进行再次压缩。需要说明的是，预设次数可以是预先设置的，也可以是根据所述第一压缩数据的使用次数分析获取的。例如，所述使用次数可以是多个第一压缩数据中使用次数最少的，本申请对预设次数的获取不进行明确限制。

步骤S305：如果所述第一压缩数据的使用次数小于预设次数，则利用第二压缩算法对所述第一压缩数据再次进行压缩，所述第二压缩算法与第一算法不同。

在本申请实施例中，步骤S305可以参阅前述实施例的内容，在此不再赘述。

在一些实施方式中，电子设备对第一压缩数据再次进行压缩得到第二压缩数据之后，其可以判断电子设备的磁盘中是否包括多个第二压缩数据，如果磁盘中包括多个第二压缩数据，则可以获取每个所述第二压缩数据的访问优先级，并对所述访问优先级进行排序，而后根据所述访问优先级的顺序对第二压缩数据再次进行压缩。

在另一些实施方式中，电子设备可以根据第二压缩数据的访问时间和访问优先级获取每个第二压缩数据的优先级。具体的，先获取每个所述第二压缩数据的访问时间和访问次数，而后通过每个所述第二压缩数据的访问时间和访问次数，获取每个所述第二压缩数据的访问总时间，并根据所述访问总时间确定每个所述第二压缩数据的访问优先级。其中，访问总时间越长其对应的访问优先级越高。另外，本申请可以根据访问优先级从低到高的顺序对第二压缩数据再次进行压缩，即电子设备在确定磁盘中包括多个第二压缩数据时，可以先对优先级较低的数据进行压缩。

需要说明的是，如果同一优先级存在多个第二压缩数据，本申请则可以获取所述同一优先级中每个第二压缩数据的最近一次被使用的时间，作为第三时间，而后对每个所述第三时间按照时间先后顺序进行排序，获得排序结果，最后根据该排序结果对同一优先级的所述第二压缩数据进行压缩。

本申请实施例提供的数据压缩方法，通过判断第一压缩数据的使用次数是否满足预设条件来确定是否对第一压缩数据进行再次压缩，即判断第一压缩数据的使用次数是否小于预设次数，如果小于预设次数，则利用第二压缩算法对第一压缩数据再次进行压缩。本申请通过将第一压缩数据的使用次数和预设次数比较，避免不必要数据的解压缩，其在节省磁盘空间，提升磁盘利用率的同时，也避免了第一压缩数据被再次使用时的解压难度较大，降低电子设备的系统负担。

请参阅图4，图4示出了本申请再一个实施例提供的数据压缩方法的流程示意图。该方法应用于上述电子设备，下面将针对图4所示的流程进行详细的阐述，所从图4可以看出数据压缩方法可以包括步骤S401至步骤S405。

步骤S401：获取内存中的待压缩数据。

步骤S402：获取所述待压缩数据在所述内存中持续存储的时间长度，作为第一时间；

在本申请实施例中，步骤S401以及步骤S402可以参阅前述实施例的内容，在此不再赘述。

步骤S403：如果所述第一时间大于或者等于第一时间阈值，则利用第一压缩算法对所述待压缩数据进行压缩，得到第一压缩数据。

本申请实施例中，利用第一压缩算法对待压缩数据进行压缩时，可以先判断内存中是否包含多个待压缩数据，如果内存中包括多个待压缩数据，电子设备则可以判断所述多个待压缩数据中，是否包括重复数据，如果多个待压缩数据中存在重复数据，则对所述多个待压缩数据进行去重操作，并对执行去重操作后的待压缩数据进行压缩。例如，内存中包括待压缩数据A、待压缩数据B和待压缩数据C，通过对比判定待压缩数据A和待压缩数据C为重复数据，此时则可以对待压缩数据A和待压缩数据C执行去重操作，即去掉待压缩数据A或者去掉待压缩数据C，而后对剩余的待压缩数据进行压缩，如果去掉待压缩数据A，则对待压缩数据B和待压缩数据C进行压缩，如果去掉待压缩数据C，则对待压缩数据A和待压缩数据B进行压缩。

在另一些实施方式中，电子设备利用第一压缩算法对待压缩数据进行压缩，得到第一压缩数据之后，其可以获取所述待压缩数据在被压缩前数据占用内存的大小，以及该待压缩数据被压缩后其占用内存的大小。然后，电子设备可以判断所述第一压缩数据占用内存的大小是否小于待压缩数据占用内存的大小，如果第一压缩数据占用内存的大小小于待压缩数据占用内存的大小，则对所述第一压缩数据进行存储。另外，电子设备也可以判断第一压缩数据占用磁盘的大小是否小于待压缩数据占用磁盘的大小，如果第一压缩数据占用磁盘的大小小于待压缩数据占用磁盘的大小，则将第一压缩数据存储于磁盘中，而如果第一压缩数据占用磁盘的大小大于或者等于待压缩数据占用磁盘的大小，则不对所述第一压缩数据进行存储。如此可以避免无用的压缩操作为磁盘空间带来不必要的负担。例如，待压缩数据A在未压缩之前其占用磁盘的空间是102M，被压缩后其占用磁盘的空间为150M，显然，将待压缩数据A压缩后其占用磁盘的空间不仅没有减少，而且增大了，此时则不需要对压缩后的数据进行存储，即保持待压缩数据A不变。

步骤S404：获取所述第一压缩数据的使用时长，并判断所述第一压缩数据的使用时长是否小于预设时长。

在一种实施方式中，电子设备利用第一压缩算法对待压缩数据进行压缩得到第一压缩数据，而后可以将所述第一压缩数据存储至电子设备的磁盘中，电子设备可以检测该第一压缩数据是否被使用，如果被使用则记录其被使用的时长。本申请实施例中，第一压缩数据的使用时长可以是单次使用时长，也可以是多次使用的总时长，具体是哪个这里不进行明确限制可以根据实际情况进行选择。

可选地，电子设备获取到第一压缩数据的使用时长后可以判断所述第一压缩数据的时长是否小于预设时长，如果第一压缩数据的使用时长小于预设时长，则利用第二压缩算法对所述第一压缩数据再次进行压缩，即进入步骤S405；如果第一压缩数据的使用时长大于预设时长，则不对所述第二压缩数据进行再次压缩。第一压缩数据的使用时长越长，则表示该第一压缩数据越重要，以避免第一压缩数据被使用时的解压难度较大，增加电子设备的系统负担，因此本申请对使用时长大于预设时长的第一压缩数据不进行再次压缩。需要说明的是，预设时长可以是预先设置的，也可以是根据所述第一压缩数据的使用时长分析获取的。例如，所述使用时长可以是多个第一压缩数据中使用时长最短的，本申请对预设时长的获取不进行明确限制。

步骤S405：如果所述第一压缩数据的使用时长小于预设时长，则利用第二压缩算法对所述第一压缩数据再次进行压缩，所述第二压缩算法与第一算法不同。

在本申请实施例中，步骤S405可以参阅前述实施例的内容，在此不再赘述。

本申请实施例提供的数据压缩方法，通过判断第一压缩数据的使用时长是否满足预设条件来确定是否对第一压缩数据进行再次压缩，即判断第一压缩数据的使用时长是否小于预设时长，如果小于预设时长，则利用第二压缩算法对第一压缩数据再次进行压缩。本申请通过将第一压缩数据的使用时长和预设时长比较，避免不必要数据的解压缩，其不但可以在节省磁盘的空间，提升磁盘的利用率，同时也可以降低电子设备系统的负担。

请参阅图5，其示出了本申请实施例提供的一种数据压缩装置500的结构框图。该数据压缩装置500应用上述的电子设备，该数据压缩装置500包括：数据获取模块501、时间获取模块502、第一压缩模块503以及第二压缩模块504。

数据获取模块501，用于获取内存中的待压缩数据。

时间获取模块502，用于获取所述待压缩数据在所述内存中持续存储的时间长度，作为第一时间。

第一压缩模块503，用于如果所述第一时间大于或者等于第一时间阈值，则利用第一压缩算法对所述待压缩数据进行压缩，得到第一压缩数据。

进一步的，第一压缩模块503还用于当所述内存中包括多个待压缩数据时，判断所述多个待压缩数据中是否存在重复数据，如果所述多个待压缩数据中存在重复数据，则对所述多个待压缩数据进行去重操作，并对执行去重操作后的待压缩数据进行压缩。

进一步的，利用第一压缩算法对所述待压缩数据进行压缩，得到第一压缩数据之后，包括：判断所述第一压缩数据的大小是否小于待压缩数据的大小；如果小于，则对所述第一压缩数据进行存储。如果第一压缩数据的大小大于或者等于待压缩数据的大小，则不对所述第一压缩数据进行存储。

进一步的，第一压缩模块503还用于判断所述待压缩数据是否为二进制机器语言，如果待压缩数据不是二进制机器语言，则利用第一压缩算法对所述待压缩数据进行压缩。如果待压缩数据为二进制机器语言，则不对所述待压缩数据进行压缩。

第二压缩模块504，用于如果所述第一压缩数据满足预设条件，则对所述第一压缩数据再次进行压缩得到第二压缩数据。

请参阅图6，第二压缩模块504可以包括时间长度获取单元5041和第一压缩单元5042。

时间长度获取单元5041，用于获取所述第一压缩数据在磁盘中持续存储的时间长度，作为第二时间。

第一压缩单元5042，用于如果所述第二时间大于第二时间阈值，则利用第二压缩算法对所述第一压缩数据再次进行压缩，所述第二压缩算法与第一算法不同。

请参阅图7，第二压缩模块504可以包括时间长度获取单元5043和第二压缩单元5044。

使用次数获取单元5043，用于获取所述第一压缩数据的使用次数，并判断所述第一压缩数据的使用次数是否小于预设次数。

第二压缩单元5044，用于如果所述第一压缩数据的使用次数小于预设次数，则利用第二压缩算法对所述第一压缩数据再次进行压缩，所述第二压缩算法与第一算法不同。

请参阅图8，第二压缩模块504可以包括时间长度获取单元5045和第三压缩单元5046。

使用时长获取单元5045，用于获取所述第一压缩数据的使用时长，并判断所述第一压缩数据的使用时长是否小于预设时长。

第三压缩单元5046，用于如果所述第一压缩数据的使用时长小于预设时长，则利用第二压缩算法对所述第一压缩数据再次进行压缩，所述第二压缩算法与第一算法不同。

进一步的，所述第二压缩算法为异或差量压缩算法。

进一步的，该数据压缩装置500还用于获取磁盘的剩余存储空间，如果所述磁盘的剩余存储空间小于存储阈值，则对所述第二压缩数据再次进行压缩，并重新获取所述磁盘的剩余存储空间，直至所述磁盘的剩余存储空间大于存储阈值。对所述第二压缩数据再次进行压缩，包括：获取所述第二压缩数据的被压缩次，如果所述被压缩次数小于设定次数，则对所述第二压缩数据再次进行压缩。另外，如果所述被压缩次数小于设定次数，则对所述第二压缩数据再次进行压缩，包括：如果所述被压缩次数小于设定次数，则获取所述第二压缩数据对应的压缩率，所述压缩率为所述第二压缩数据压缩后与压缩前的数据比值，当所述第二压缩数据对应的压缩率小于预设压缩率时，对所述第二压缩数据再次进行压缩，并重新获取所述第二压缩数据对应的压缩率，直至所述压缩率小于预设压缩率。

进一步的，该数据压缩装置500还用于判断磁盘中是否包括多个第二压缩数据，如果所述磁盘中包括多个第二压缩数据，则获取每个所述第二压缩数据的访问优先级，并对所述访问优先级进行排序，根据所述访问优先级的顺序对所述第二压缩数据再次进行压缩。获取每个所述第二压缩数据的访问优先级，包括：获取每个所述第二压缩数据的访问时间和访问次数，通过每个所述第二压缩数据的访问时间和访问次数，获取每个所述第二压缩数据的访问总时间，根据所述访问总时间确定每个所述第二压缩数据的访问优先级，所述访问总时间越长对应的访问优先级越高。根据所述访问优先级的顺序对所述第二压缩数据再次进行压缩，包括：根据所述访问优先级从低到高的顺序对所述第二压缩数据再次进行压缩。另外，根据所述访问优先级从低到高的顺序对所述第二压缩数据再次进行压缩，包括：如果同一优先级包括多个第二压缩数据，则获取同一优先级中每个所述第二压缩数据的最近一次被使用的时间，作为第三时间，对每个所述第三时间按照时间先后顺序进行排序，获得排序结果，根据排序结果对同一优先级的第二压缩数据进行压缩。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述装置和模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，模块相互之间的耦合可以是电性，机械或其它形式的耦合。

另外，在本申请各个实施例中的各功能模块可以集成在一个处理模块中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。

综上所述，本申请提供的方案，通过获取内存中当前已被压缩的内存页，获取内存页的历史使用数据，根据历史使用数据，获取内存页中满足历史使用条件的内存页，作为目标内存页，对目标内存页再次进行压缩并存储，从而实现对内存页的深度压缩，可以节省内存空间，提升内存利用率。

请参考图9，其示出了本申请实施例提供的一种电子设备的结构框图。该电子设备100可以是智能手机、平板电脑、电子书、智能穿戴设备等能够运行应用程序的电子设备。本申请中的电子设备100可以包括一个或多个如下部件：处理器110、存储器120、以及一个或多个应用程序，其中一个或多个应用程序可以被存储在存储器120中并被配置为由一个或多个处理器110执行，一个或多个程序配置用于执行如前述方法实施例所描述的方法。

处理器110可以包括一个或者多个处理核。处理器110利用各种接口和线路连接整个电子设备100内的各个部分，通过运行或执行存储在存储器120内的指令、程序、代码集或指令集，以及调用存储在存储器120内的数据，执行电子设备100的各种功能和处理数据。可选地，处理器110可以采用数字信号处理(Digital Signal Processing，DSP)、现场可编程门阵列(Field－Programmable Gate Array，FPGA)、可编程逻辑阵列(Programmable Logic Array，PLA)中的至少一种硬件形式来实现。处理器110可集成中央处理器(Central Processing Unit，CPU)、图像处理器(Graphics Processing Unit，GPU)和调制解调器等中的一种或几种的组合。其中，CPU主要处理操作系统、用户界面和应用程序等；GPU用于负责显示内容的渲染和绘制；调制解调器用于处理无线通信。可以理解的是，上述调制解调器也可以不集成到处理器110中，单独通过一块通信芯片进行实现。

存储器120可以包括随机存储器(Random Access Memory，RAM)，也可以包括只读存储器(Read-Only Memory)。存储器120可用于存储指令、程序、代码、代码集或指令集。存储器120可包括存储程序区和存储数据区，其中，存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现下述各个方法实施例的指令等。存储数据区还可以存储终端100在使用中所创建的数据(比如电话本、音视频数据、聊天记录数据)等。

请参考图10，其示出了本申请实施例提供的一种计算机可读存储介质的结构框图。该计算机可读介质800中存储有程序代码，所述程序代码可被处理器调用执行上述方法实施例中所描述的方法。

计算机可读存储介质800可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。可选地，计算机可读存储介质800包括非易失性计算机可读介质(non-transitory computer-readable storage medium)。计算机可读存储介质800具有执行上述方法中的任何方法步骤的程序代码810的存储空间。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。程序代码810可以例如以适当形式进行压缩。

最后应说明的是：以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不驱使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

一种数据压缩方法，其特征在于，包括：

获取内存中的待压缩数据；

获取所述待压缩数据在所述内存中持续存储的时间长度，作为第一时间；

如果所述第一时间大于或者等于第一时间阈值，则利用第一压缩算法对所述待压缩数据进行压缩，得到第一压缩数据；

如果所述第一压缩数据满足预设条件，则对所述第一压缩数据再次进行压缩得到第二压缩数据。
根据权利要求1所述的方法，其特征在于，所述如果所述第一压缩数据满足预设条件，则对所述第一压缩数据再次进行压缩得到第二压缩数据，包括：

获取所述第一压缩数据在磁盘中持续存储的时间长度，作为第二时间；

如果所述第二时间大于第二时间阈值，则利用第二压缩算法对所述第一压缩数据再次进行压缩，所述第二压缩算法与第一算法不同。
根据权利要求1所述的方法，其特征在于，所述如果所述第一压缩数据满足预设条件，则对所述第一压缩数据再次进行压缩得到第二压缩数据，包括：

获取所述第一压缩数据的使用次数，并判断所述第一压缩数据的使用次数是否小于预设次数；

如果所述第一压缩数据的使用次数小于预设次数，则利用第二压缩算法对所述第一压缩数据再次进行压缩，所述第二压缩算法与第一算法不同。
根据权利要求1所述的方法，其特征在于，所述如果所述第一压缩数据满足预设条件，则对所述第一压缩数据再次进行压缩得到第二压缩数据，包括：

获取所述第一压缩数据的使用时长，并判断所述第一压缩数据的使用时长是否小于预设时长；

如果所述第一压缩数据的使用时长小于预设时长，则利用第二压缩算法对所述第一压缩数据再次进行压缩，所述第二压缩算法与第一算法不同。
根据权利要求1-4任一项所述的方法，其特征在于，所述对所述第一压缩数据再次进行压缩得到第二压缩数据之后，包括：

获取磁盘的剩余存储空间；

如果所述磁盘的剩余存储空间小于存储阈值，则对所述第二压缩数据再次进行压缩，并重新获取所述磁盘的剩余存储空间，直至所述磁盘的剩余存储空间大于存储阈值。
根据权利要求5所述的方法，其特征在于，所述对所述第二压缩数据再次进行压缩，包括：

获取所述第二压缩数据的被压缩次数；

如果所述被压缩次数小于设定次数，则对所述第二压缩数据再次进行压缩。
根据权利要求6所述的方法，其特征在于，所述如果所述被压缩次数小于设定次数，则对所述第二压缩数据再次进行压缩，包括：

如果所述被压缩次数小于设定次数，则获取所述第二压缩数据对应的压缩率，所述压缩率为所述第二压缩数据压缩后与压缩前的数据比值；

当所述第二压缩数据对应的压缩率小于预设压缩率时，对所述第二压缩数据再次进行压缩，并重新获取所述第二压缩数据对应的压缩率，直至所述压缩率小于预设压缩率。
根据权利要求1-4任一项所述的方法，其特征在于，所述对所述第一压缩数据再次进行压缩得到第二压缩数据之后，包括：

判断磁盘中是否包括多个第二压缩数据；

如果所述磁盘中包括多个第二压缩数据，则获取每个所述第二压缩数据的访问优先级，并对所述访问优先级进行排序；

根据所述访问优先级的顺序对所述第二压缩数据再次进行压缩。
根据权利要求8所述的方法，其特征在于，所述获取每个所述第二压缩数据的访问优先级，包括：

获取每个所述第二压缩数据的访问时间和访问次数；

通过每个所述第二压缩数据的访问时间和访问次数，获取每个所述第二压缩数据的访问总时间；

根据所述访问总时间确定每个所述第二压缩数据的访问优先级，所述访问总时间越长对应的访问优先级越高。
根据权利要求8所述的方法，其特征在于，所述根据所述访问优先级的顺序对所述第二压缩数据再次进行压缩，包括：

根据所述访问优先级从低到高的顺序对所述第二压缩数据再次进行压缩。
根据权利要求10任一项所述的方法，其特征在于，所述根据所述访问优先级从低到高的顺序对所述第二压缩数据再次进行压缩，包括：

如果同一优先级包括多个第二压缩数据，则获取同一优先级中每个所述第二压缩数据的最近一次被使用的时间，作为第三时间；

对每个所述第三时间按照时间先后顺序进行排序，获得排序结果；

根据排序结果对同一优先级的第二压缩数据进行压缩。
根据权利要求1-4任一项所述的方法，其特征在于，所述利用第一压缩算法对所述待压缩数据进行压缩，包括：

当所述内存中包括多个待压缩数据时，判断所述多个待压缩数据中是否存在重复数据；

如果所述多个待压缩数据中存在重复数据，则对所述多个待压缩数据进行去重操作，并对执行去重操作后的待压缩数据进行压缩。
根据权利要求1-4任一项所述的方法，其特征在于，所述利用第一压缩算法对所述待压缩数据进行压缩，得到第一压缩数据之后，包括：

判断所述第一压缩数据的大小是否小于待压缩数据的大小；

如果小于，则对所述第一压缩数据进行存储。
根据权利要求13所述的方法，其特征在于，所述方法还包括：

如果第一压缩数据的大小大于或者等于待压缩数据的大小，则不对所述第一压缩数据进行存储。
根据权利要求1-4任一项所述的方法，其特征在于，所述利用第一压缩算法对所述待压缩数据进行压缩，包括：

判断所述待压缩数据是否为二进制机器语言；

如果待压缩数据不是二进制机器语言，则利用第一压缩算法对所述待压缩数据进行压缩。
根据权利要求15所述的方法，其特征在于，所述方法还包括：

如果待压缩数据为二进制机器语言，则不对所述待压缩数据进行压缩。
根据权利要求2-4任一项所述的方法，其特征在于，所述第二压缩算法为异或差量压缩算法。
一种数据压缩装置，其特征在于，所述装置包括：

数据获取模块，用于获取内存中的待压缩数据；

时间获取模块，用于获取所述待压缩数据在所述内存中持续存储的时间长度，作为第一时间；

第一压缩模块，用于如果所述第一时间大于或者等于第一时间阈值，则利用第一压缩算法对所述待压缩数据进行压缩，得到第一压缩数据；

第二压缩模块，用于如果所述第一压缩数据满足预设条件，则对所述第一压缩数据再次进行压缩得到第二压缩数据。
一种电子设备，其特征在于，包括：

一个或多个处理器；

存储器；

一个或多个应用程序，其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行，所述一个或多个程序配置用于执行如权利要求1-17任一项所述的方法。
一种计算机可读取存储介质，其特征在于，所述计算机可读取存储介质中存储有程序代码，所述程序代码可被处理器调用执行如权利要求1-17任一项所述的方法。