WO2016008070A1

WO2016008070A1 - 数据写入的方法及装置

Info

Publication number: WO2016008070A1
Application number: PCT/CN2014/082147
Authority: WO
Inventors: 王元钢; 徐君; 朱冠宇
Original assignee: 华为技术有限公司
Priority date: 2014-07-14
Filing date: 2014-07-14
Publication date: 2016-01-21
Also published as: CN105518790B; CN105518790A

Abstract

本发明公开了一种数据写入的方法及装置，涉及数据存储领域，用于解决写时延的降低效果不稳定的问题。所述方法包括：根据预设抽样算法对待写入数据进行抽样，得到目标标签，所述目标标签用于表示所述待写入数据中数据位的数值分布情况；从预设组标签集合中查找与所述目标标签相似度最高的目标组标签，所述预设组标签集合由至少一个组标签组成，每个组标签对应具有相似数据特征的至少两个空闲数据页；从所述目标组标签对应的至少一个空闲数据页中选择目标空闲数据页；将所述待写入数据中与所述目标空闲数据页存在差异的数据位，写入所述目标空闲数据页中的对应位置。本发明主要应用于数据读写操作过程中。

Description

数据写入的方法及装置技术领域

本发明涉及数据存储领域，尤其涉及一种数据写入的方法及装置。背景技术

随着緩存技术的发展，在动态随机存取存储器（Dynami c Random Acces s Memory , 简称 DRAM )之后，业界开发出了用于替换 DRAM的新的存储器相变内存（Pha se-Change Memory , 简称 PCM )。由于相变内存结合了 DRAM内存的高速存取特性，以及闪存在关闭电源之后保留数据的特性，因此相变内存被业界视为未来替代 DRAM的闪存和内存。但是，在相变内存的读写操作中，写时延远大于读时延，其原因在于：在写 0和写 1时的时延具有不对称性，即写 0 (也称 res et ) 的时延艮低，写 1 (也称 set ) 时延^艮大，两者的时延相差十几倍以上。而读 0和读 1的读时延基本相同。

为了提高数据写入的速度，现有技术提供了一种数据写入方法，在该发那个发中仅将发生变化的数据进行写入。具体的：按照空闲数据页的地址顺序或者空闲数据页产生的时间顺序为待写入数据分配空闲数据页，空闲数据页的地址为写入地址，获取写入地址上当前已存储的数据（写入地址为待写入数据即将存入的地址），将该数据与待写入数据进行比较，得到差异的数据位，对该差异的数据位进行写操作。上述在写入之前将写入地址中已存储的数据进行读出并与待写入数据进行比较的步骤成为写前读。

在实现上述数据写入的过程中，发明人发现现有技术中至少存在如下问题：当待写入数据与已存储的数据差别完全不同时，需要将待写入数据的各个数据位全部存储到该写入地址中写操作涉及的数据量，与不进行写前读直接进行写入的数据量相同，即不会减少写 1 操作的数量，进而无法降低写时延。可见，现有技术中仅按照空闲数据页的地址顺序或者空闲数据页产生的时间顺序将空闲数据页分配用于写入待写入数据，由于按照此种方式获得的空闲数据页可能出现与待写入数据完全不同或基本不同，此时进行差异写入将造成大量的写操作，无法保证降低写入量，写时延的降低效果不稳定。发明内容

本发明的实施例提供一种数据写入的方法及装置，用于解决写时延的降低效果不稳定的问题。

第一方面，本发明提供了一种数据写入的方法，所述方法包括：根据预设抽样算法对待写入数据进行抽样，得到目标标签，所述目标标签用于表示所述待写入数据中数据位的数值分布情况；

从预设组标签集合中查找与所述目标标签相似度最高的目标组标签，所述预设组标签集合由至少一个组标签组成，每个组标签对应具有相似数据特征的至少两个空闲数据页；

从所述目标组标签对应的至少一个空闲数据页中选择目标空闲数据页；将所述待写入数据中与所述目标空闲数据页存在差异的数据位，写入所述目标空闲数据页中的对应位置。

结合第一方面，在所述第一方面的第一种可能的实现方式中，所述根据预设抽样算法对待写入数据进行抽样，得到目标标签，包括：

将所述待写入数据划分为预设数量的数据区域；

分别分析每个数据区域中数据的分布特征，根据所述分布特征确定每个数据区域的标识位；

根据确定出的每个数据区域的标识位确定所述目标标签。

结合第一方面，在所述第一方面的实现方式中，还提供了所述第一方面的第二种可能的实现方式，在所述第一方面的第二种可能的实现方式中，所述根据预设抽样算法对待写入数据进行抽样，得到目标标签，包括：

根据待写入数据中的数据内容，将待写入数据转换为二值图像；对所述二值图像进行图像分析得到特征值，所述特征值用于表示所述二值图像的图形特征；

将所述特征值确定为目标标签。

结合第一方面，在所述第一方面的实现方式中，还提供了所述第一方面的第三种可能的实现方式，在所述第一方面的第三种可能的实现方式中，所述将所述待写入数据中与所述目标空闲数据页存在差异的数据位，写入所述目标空闲数据页中的对应位置，包括：

分别判断所述待写入数据中每个数据位与所述目标空闲数据页中相同位置的数据位中的数据是否相同；

如果所述待写入数据中当前数据位与所述目标空闲数据页中相同位置的数据位中的数据内容不同，则确定所述相同数据位为待写入数据位；

将所述待写入数据中位于所述待写入数据位的数据写入到所述目标空闲数据页的待写入数据位中。

结合第一方面，在所述第一方面的第一种可能或第二种可能的实现方式中，还提供了所述第一方面的第四种可能的实现方式，在所述第一方面的第四种可能的实现方式中，在所述根据预设抽样算法对待写入数据进行抽样，得到目标标签之前，所述方法还包括：

根据所述预设抽样算法对空闲数据页进行抽样，得到每个空闲数据页对应的空闲数据页标签，所述空闲数据页为系统中处于闲置状态的数据页；将具有相同空闲数据页标签的空闲数据页划分为一个预设空闲数据页分组，将所述空闲数据页标签确定为所述预设空闲数据页分组对应的组标签。

结合第一方面，在所述第一方面的第四种可能的实现方式中，还提供了所述第一方面的第五种可能的实现方式，在所述第一方面的第五种可能的实现方式中，在所述将具有相同空闲数据页标签的空闲数据页划分为一个预设空闲数据页分组，将所述空闲数据页标签确定为所述预设空闲数据页分组的组标签之后，所述方法还包括：

当产生新空闲数据页时，根据所述预设抽样算法对所述新空闲数据页进行抽样，得到所述新空闲数据页对应的新空闲数据页标签；

从所述预设组标签集合中的查找与所述新空闲数据页标签相似度最高的组标签；

将所述新空闲数据页添加到所述相似度最高的组标签对应的预设空闲数据页分组中。

第二方面，本发明提供了一种数据写入的装置，所述装置包括：抽样单元，用于根据预设抽样算法对待写入数据进行抽样，得到目标标签，所述目标标签用于表示所述待写入数据中数据位的数值分布情况；

查找单元，用于从预设组标签集合中查找与所述抽样单元得到的所述目标标签相似度最高的目标组标签，所述预设组标签集合由至少一个组标签组成，每个组标签对应具有相似数据特征的至少两个空闲数据页；

选择单元，用于从所述查找单元查找到的所述目标组标签对应的至少一个空闲数据页中选择目标空闲数据页；

写入单元，用于将所述待写入数据中与所述选择单元选择的所述目标空闲数据页存在差异的数据位，写入所述目标空闲数据页中的对应位置。

结合第二方面，在所述第二方面的第一种可能的实现方式中，所述抽样单元包括：

划分子单元，用于将所述待写入数据划分为预设数量的数据区域；标识位确定子单元，用于分别分析所述划分子单元划分的每个数据区域中数据的分布特征，根据所述分布特征确定每个数据区域的标识位；

第一目标标签确定子单元，用于根据所述标识位确定子单元确定出的每个数据区域的标识位确定所述目标标签。

结合第二方面，在所述第二方面的实现方式中，还提供了所述第二方面的第二种可能的实现方式，在所述第二方面的第二种可能的实现方式中，所述抽样单元还包括：

转换子单元，用于根据待写入数据中的数据内容，将待写入数据转换为二值图像；

图像分析子单元，用于对转换子单元得到的所述二值图像进行图像分析得到特征值，所述特征值用于表示所述二值图像的图形特征；

第二目标标签确定子单元，用于将所述图像分析子单元得到的所述特征值确定为目标标签。

结合第二方面，在所述第二方面的实现方式中，还提供了所述第二方面的第三种可能的实现方式，在所述第二方面的第三种可能的实现方式中，所述写入单元，包括：

判断子单元，用于判断所述待写入数据中每个数据位与所述目标空闲数据页中相同位置的数据位中的数据是否相同；

待写入数据位确定子单元，用于当所述判断单元得到所述待写入数据中当前数据位与所述目标空闲数据页中相同位置的数据位中的数据不同时，则确定所述相同数据位为待写入数据位；

写入子单元，用于将所述待写入数据中位于所述待写入数据位确定子单元确定的所述待写入数据位的数据写入到所述目标空闲数据页的待写入数据位中。

结合第二方面，在所述第二方面的第一种可能或第二种可能的实现方式中，还提供了所述第二方面的第四种可能的实现方式，在所述第二方面的第四种可能的实现方式中，所述抽样单元还用于，根据所述预设抽样算法对空闲数据页进行抽样，得到每个空闲数据页对应的空闲数据页标签，所述空闲数据页为系统中处于闲置状态的数据页；

所述装置还包括：

分组单元，用于将具有相同空闲数据页标签的空闲数据页划分为一个预设空闲数据页分组，将所述空闲数据页标签确定为所述预设空闲数据页分组对应的组标签。

结合第二方面，在所述第二方面的第四种可能的实现方式中，还提供了所述第二方面的第五种可能的实现方式，在所述第二方面的第五种可能的实现方式中，所述抽样单元还用于，当产生新空闲数据页时，根据所述预设抽样算法对所述新空闲数据页进行抽样，得到所述新空闲数据页对应的新空闲数据页标签；

所述查找单元还用于，从所述预设组标签集合中的查找与所述抽样单元得到的所述新空闲数据页标签相似度最高的组标签；

所述装置还包括：

添加单元，用于将所述新空闲数据页添加到所述查找单元查找到的所述相似度最高的组标签对应的预设空闲数据页分组中。第三方面，本发明提供了一种数据写入的装置，所述装置包括：处理器，用于根据预设抽样算法对待写入数据进行抽样，得到目标标签，所述目标标签用于表示所述待写入数据中数据位的数值分布情况；

存储器，用于存储所述预设组标签集合；

从所述存储器存储的预设组标签集合中查找与所述目标标签相似度最高的目标组标签，所述预设组标签集合由至少一个组标签组成，每个组标签对应具有相似数据特征的至少两个空闲数据页；

所述存储器还用于存储所述空闲数据页；

所述处理器还用于，从所述目标组标签对应的至少一个空闲数据页中选择目标空闲数据页；

将所述待写入数据中与所述目标空闲数据页存在差异的数据位，写入所述目标空闲数据页中的对应位置。

结合第三方面，在所述第三方面的第一种可能的实现方式中，所述处理器还用于：

将所述待写入数据划分为预设数量的数据区域；

根据确定出的每个数据区域的标识位确定所述目标标签。

结合第三方面，在所述第三方面的实现方式中，还提供了所述第三方面的第二种可能的实现方式，在所述第三方面的第二种可能的实现方式中，所述处理器还用于：

根据待写入数据中的数据内容，将待写入数据转换为二值图像；

对所述二值图像进行图像分析得到特征值，所述特征值用于表示所述二值图像的图形特征；

将所述特征值确定为目标标签。

结合第三方面，在所述第三方面的实现方式中，还提供了所述第三方面的第三种可能的实现方式，在所述第三方面的第三种可能的实现方式中，所述处理器还用于：

如果所述待写入数据中当前数据位与所述目标空闲数据页中相同位置的数据位中的数据不同，则确定所述相同数据位为待写入数据位；

结合第三方面，在所述第三方面的第一种可能或第二种可能的实现方式中，还提供了所述第三方面的第四种可能的实现方式，在所述第三方面的第四种可能的实现方式中，所述处理器还用于：

根据所述预设抽样算法对存储器中存储的空闲数据页进行抽样，得到每个空闲数据页对应的空闲数据页标签，所述空闲数据页为系统中处于闲置状态的数据页；

将具有相同空闲数据页标签的空闲数据页划分为一个预设空闲数据页分组，将所述空闲数据页标签确定为所述预设空闲数据页分组对应的组标签。

结合第三方面，在所述第三方面的第四种可能的实现方式中，还提供了所述第三方面的第五种可能的实现方式，在所述第三方面的第五种可能的实现方式中，所述处理器还用于：

从所述存储器存储的所述预设组标签集合中的查找与所述新空闲数据页标签相似度最高的组标签；

本发明提供的数据写入的方法及装置，能够在为对待写入数据分配存储地址之前，先对待写入数据进行抽样，获得表示待写入数据的数据特征的目标标签，再从预设组标签集合中查找与所述目标标签相似度最高的目标组标签，从目标组标签对应的多个空闲数据页中选择目标空闲数据页，再将待写入数据中与所述目标空闲数据页存在差异的数据位写入所述目标空闲数据页中的对应位置。现有技术中，仅按照空闲数据页的地址顺序或者空闲数据页产生的时间顺序将空闲数据页分配用于写入待写入数据，由于按照此种方式获得的空闲数据页可能出现与待写入数据完全不同或基本不同（ 90%以上不同），此时进行差异写入将造成大量的写操作，因此现有技术无法保证降低写入量。现有技术中在分配空白数据页时，并未考虑空白数据页与待写入数据的相似程度，存在为分配的空白数据页与待写入数据的内容部分或全部相同或相似的情况。现有技术直接为待写入数据分配空闲数据页，使分配的空闲数据页的数据特征与待写入数据的结构特征存在较大差异，导致写操作数量与普通写入操作的写操作数量近似或相同，使得写时延的降低效果不稳定。本发明中，能够根据待写入数据与空白数据页的相似程度确定分配的空白数据页，由于在为待写入数据分配空闲数据页之前，将目标标签和组标签进行匹配，得到与待写入数据最接近的一组空闲数据页，再从该组空闲数据页中选择一张空闲数据页进行差异存储，因此本发明中为待写入数据分配的空白数据页为与待写入数据具有最高相似度的空白数据页，进而在进行差异存储时，能够减少写操作的数量，达到稳定减少写操作数量的效果。附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图 1为本发明实施例中第一个数据写入的方法的流程图；

图 1为本发明实施例中第二个数据写入的方法的流程图；

图 3为本发明实施例中第三个数据写入的方法的流程图；

图 4为本发明实施例中第四个数据写入的方法的流程图；

图 5为本发明实施例中第五个数据写入的方法的流程图；图 6为本发明实施例中第六个数据写入的方法的流程图；

图 7为本发明实施例中一个使用场景的数据流示意图；

图 8为本发明实施例中第一个数据写入的装置的结构示意图；

图 9为本发明实施例中第二个数据写入的装置的结构示意图；

图 1 0为本发明实施例中第三个数据写入的装置的结构示意图；

图 1 1为本发明实施例中第四个数据写入的装置的结构示意图；

图 12为本发明实施例中第五个数据写入的装置的结构示意图；

图 1 3为本发明实施例中第六个数据写入的装置的结构示意图；

图 14为本发明实施例中第七个数据写入的装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例提供了一种数据写入的方法，所述方法运用于具有数据存储及处理能力的电子设备中，所述电子设备如服务器、个人电脑、移动终端等，如图 1所示，所述方法包括：

步骤 101、根据预设抽样算法对待写入数据进行抽样，得到目标标签，目标标签用于表示待写入数据中数据位的数值分布情况。

预设抽样算法包括两种，分别为：

一、将待写入数据转换为图形，根据图形识别算法获取该图形的特征值，将该特征值作为目标标签。

二、将待写入数据按照固定数据单元划分为多个数据区域，根据每个数据区域中数据的分布特征确定每个区域的标识位，根据各标识位生成目标标签。例如，将一个 64Byte (字节）的待写入数据按照每 8b划分为一个数据区域，形成 64个数据区域，分别对每个数据区域中的分布特征进行分析，得到 64个标识位，该 64个标识位顺序排列组成 64b i t的目标标签。根据数据区域的数量和待写入数据的大小的不同，目标标签还可以是 256bi t或 512bi t等。需要说明的是，上述抽样算法除了用于对待写入数据进行抽样，还用于对空闲数据页和新空闲数据页进行抽样。由于在进行写操作时，通常以数据页为单位进行写入，因此无论待写入的数据（如一部电影）的总数据量为如何，在进行写入操作时，将待写入数据写入到系统空闲的数据页中完成写入操作，每次写入的数据量为一个数据页（如将电影拆分后的数据片段）的大小。因此，所述待写入数据（即每次写入的数据）的数据大小为一个数据页大小，在进行读取和处理时可将待写入数据作为一个数据页进行处理。空闲数据页为闲置的用于存储数据的物理页面。同时，空闲数据页、新空闲数据页的数据格式相同，命名的区别仅用于区分不同阶段的数据页，方便描述。可选的，该数据页为非易失固态存储（Non-Viola te Memory , 简称 NVM ) 页面。

步骤 102、从预设组标签集合中查找与目标标签相似度最高的目标组标签，预设组标签集合由至少一个组标签组成，每个组标签对应具有相似数据特征的至少两个空闲数据页。

目标组标签与目标标签存在下述两种关系：

1、目标组标签和目标标签完全相同。

2、目标组标签和目标标签不完全相同。但是，目标组标签为预设组标签集合中与目标标签相同的内容，多于预设组标签集合中除目标组标签以外任意一个组标签与目标标签相同的内容。

步骤 103、从目标组标签对应的至少一个空闲数据页中选择目标空闲数据页。

从目标组标签对应的至少一个空闲数据页中 , 随机选取或顺序选取目标空闲数据页。如果至少一个空闲数据页之间采用链表形式存储，则在选取目标空闲数据页后，更新所述目标空闲数据页相关的指针。

步骤 104、将待写入数据中与目标空闲数据页存在差异的数据位，写入目标空闲数据页中的对应位置。在向目标空闲数据页中写入待写入数据的数据时，仅对差异的数据位进行写入。例如：待写入数据和目标空闲数据页仅第 10个数据位中的内容不同，具体的，待写入数据中第 10个数据位的内容为 1 , 目标空闲数据页中第 10个数据位的内容为 0 , 则仅向目标空闲数据页的第 10个数据位执行写操作。

本发明提供的数据写入的方法，能够在为对待写入数据分配存储地址之前，先对待写入数据进行抽样，获得表示待写入数据的数据特征的目标标签，再从预设组标签集合中查找与所述目标标签相似度最高的目标组标签，从目标组标签对应的多个空闲数据页中选择目标空闲数据页，再将待写入数据中与所述目标空闲数据页存在差异的数据位写入所述目标空闲数据页中的对应位置。现有技术中，仅按照空闲数据页的地址顺序或者空闲数据页产生的时间顺序将空闲数据页分配用于写入待写入数据，由于按照此种方式获得的空闲数据页可能出现与待写入数据完全不同或基本不同（90%以上不同），此时进行差异写入将造成大量的写操作，因此现有技术无法保证降低写入量。现有技术中在分配空白数据页时，并未考虑空白数据页与待写入数据的相似程度，存在为分配的空白数据页与待写入数据的内容部分或全部相同或相似的情况。现有技术直接为待写入数据分配空闲数据页，使分配的空闲数据页的数据特征与待写入数据的结构特征存在较大差异，导致写操作数量与普通写入操作的写操作数量近似或相同，使得写时延的降低效果不稳定。本发明中，能够根据待写入数据与空白数据页的相似程度确定分配的空白数据页，由于在为待写入数据分配空闲数据页之前，将目标标签和组标签进行匹配，得到与待写入数据最接近的一组空闲数据页，再从该组空闲数据页中选择一张空闲数据页进行差异存储，因此本发明中为待写入数据分配的空白数据页为与待写入数据具有最高相似度的空白数据页，进而在进行差异存储时，能够减少写操作的数量，达到稳定减少写操作数量的效果。

本发明实施例还提供了一种数据写入的方法，作为对图 1 所示方法的具体说明，如图 2所示，步骤 101、根据预设抽样算法对待写入数据进行抽样，得到目标标签，可通过下述方式进行实施：步骤 201、将待写入数据划分为预设数量的数据区域。

步骤 202、分别分析每个数据区域中数据的分布特征，根据分布特征确定每个数据区域的标识位。

标识位为 0或 1。标识位的确定规则包括下述任意一种：

1、根据数据区域中数据内容（"0" 或 "1" ) 的出现次数的多少，确定标识位。

例如：数据区域共包含 8个数据位，其中 "1" 出现 5次， "0" 出现 3次，则该数据区域的标识位为 1。

2、根据数据区域中前半段数据内容（"0" 或 "1" ) 的出现次数与后半段数据内容（"0" 或 "1" ) 的出现次数的差，确定标识位。

1 )如果前半段中 "1" 出现的次数多于后半段中 "1" 出现的次数，则标识位为 1。如果前半段中 "1" 出现的次数少于后半段中 "1" 出现的次数，则标识位为 0。

例如：数据区域共包含 8个数据位，前半段对应第一个到第四个数据位，后半段对应第五个到第八个数据位，该数据区域的数据内容为 "1101 0100" 在前半段中 "1" 出现的次数（3次）多与后半段中 "1" 出现的次数（1次），因此确定该数据区域的标志位为 1。

2)如果前半段中 "1" 出现的次数少于后半段中 "1" 出现的次数，则标识位为 1。如果前半段中 "1" 出现的次数多于后半段中 "1" 出现的次数，则标识位为 0。

例如：数据区域共包含 8个数据位，前半段对应第一个到第四个数据位，后半段对应第五个到第八个数据位，该数据区域的数据内容为 "1101 0100" 在前半段中 "0" 出现的次数（1次）少于后半段中 "0" 出现的次数（3次），因此确定该数据区域的标志位为 0。

步骤 203、根据确定出的每个数据区域的标识位确定目标标签。

将每个数据区域中的标识位顺序排列，得到目标标签。例如：待写入数据被划分为 8 个数据区域，每个数据区域的标识位分别为 "1"、 "0"、 "0"、 T、 "0"、 T、 Τ、 "0" , 则该待写入数据的目标标签为 "10010110"。本发明实施例提供的数据写入的方法，能够对待写入数据进行划分，分别对划分出的数据区域进行分析得到表示每个数据区域的标识位，再根据得到的标识位确定待写入数据的目标标签，通过细化分析对象（数据区域）能够提高目标标签的精确度，使得目标标签更为准确的表示待写入数据的数据特征。

本发明实施例还提供了一种数据写入的方法，作为对图 1 所示方法的具体说明，如图 3所示，步骤 101、根据预设抽样算法对待写入数据进行抽样，得到目标标签，包括：

步骤 301、根据待写入数据中的数据内容，将待写入数据转换为二值图像。待写入数据中的数据内容为 "0" 或 "1 " , 在二值图像中 0表示白色， 1 表示黑色。

步骤 302、对二值图像进行图像分析得到特征值，特征值用于表示二值图像的图形特征。

图像分析可采用现有技术中的图像分析方法，可根据使用需要自行选择。步骤 303、将该特征值确定为目标标签。

本发明实施例提供的数据写入的方法，能够将待写入数据转换为二值图像，由于现有技术中在图像分析领域已有较为成熟的技术方案，因此在本案中通过对转换后得到的二值图像进行分析，能够得到准确体现待写入数据排列特征的目标标签，提高目标标签的精确度。

本发明实施例还提供了一种数据写入的方法，作为对图 1 所示方法的具体说明，如图 4所示，步骤 104、将所述待写入数据中与所述目标空闲数据页存在差异的数据位，写入所述目标空闲数据页中的对应位置，包括：

步骤 401、分别判断待写入数据中每个数据位与目标空闲数据页中相同位置的数据位中的数据是否相同。

在进行比较时，可按位进行比较，也可按数据页中的行或列或预设个数的位作为每次读取的数据单元。如果系统在 CPU与存储器之间还设置有高速緩存 ( Cache ), 则根据 Cache的处理能力确定数据单元的大小。

步骤 402、如果待写入数据中当前数据位与目标空闲数据页中相同位置的数据位中的数据内容不同，则确定相同数据位为待写入数据位。

如果待写入数据中当前数据位与目标空闲数据页中相同位置的数据位中的数据内容相同，则无需对当前数据位进行写入。

步骤 403、将待写入数据中位于待写入数据位的数据写入到目标空闲数据页的待写入数据位中。

本发明实施例提供的数据写入的方法，能够以数据位的粒度对待写入数据和目标空闲数据页进行比较，确定待写入数据位，准确定位需要写入的数据位，提高数据写入的效率。

本发明实施例还提供了一种数据写入的方法，作为对图 1 所示方法的进一步说明，如图 5所示，在步骤 1 01、所述根据预设抽样算法对待写入数据进行抽样，得到目标标签之前，所述方法还包括：

步骤 501、根据预设抽样算法对空闲数据页进行抽样，得到每个空闲数据页对应的空闲数据页标签，空闲数据页为系统中处于闲置状态的数据页。

当处理器结束处理某段代码或者删除某数据时，会释放该段代码或该数据占用的存储空间，释放后存储空间中的数据页将成为空闲数据页，空闲数用，即被释放的数据页处于闲置状态。

步骤 502、将具有相同空闲数据页标签的空闲数据页划分为一个预设空闲数据页分组，将空闲数据页标签确定为预设空闲数据页分组对应的组标签。

可选的，将具有相似空闲数据页标签的空闲数据页划分为一个预设空闲数据页分组，将空闲数据页标签确定为预设空闲数据页分组对应的组标签。

所述相似为各空闲数据页标签之间的存在预设比例以上的相似度，所述预设比例如 90%。

本发明实施例提供的数据写入的方法，能够将空闲数据页根据空闲数据页标签进行分组，每个分组具有相同空闲数据页标签（组标签），进而实现对系统中处于闲置状态的数据页进行管理，为对待写入数据分配空闲数据页时，能够直接根据组标签确定所要使用的分组，进而提高数据写入效率。

本发明实施例还提供了一种数据写入的方法，作为对图 5 所示方法的进一步说明，如图 6所述，在步骤 502、将具有相同空闲数据页标签的空闲数据页划分为一个预设空闲数据页分组，将所述空闲数据页标签确定为所述预设空闲数据页分组的组标签之后，所述方法还包括：

步骤 601、当产生新空闲数据页时，根据预设抽样算法对新空闲数据页进行抽样，得到新空闲数据页对应的新空闲数据页标签。

步骤 602、从预设组标签集合中的查找与新空闲数据页标签相似度最高的组标签。

步骤 603、将新空闲数据页添加到相似度最高的组标签对应的预设空闲数据页分组中。

新空闲数据页为新产生的空闲数据页。由于在产生新空闲数据页之前，系统中的全部空闲数据页均已分组，因此当某数据页被闲置后，根据现有的空闲数据页分组将该数据页添加到现有分组中。

本发明实施例提供的数据写入的方法，能够根据新空闲数据页标签将新空闲数据页添加到已有的预设空闲数据页分组中，实时更新预设空闲数据页分组中的空闲数据页，提高数据写入效率。

下面通过一个实施例对上述方法进行具体说明，当需要对待写入数据进行写入时，分为两步：一、为待写入数据分配相似度最高的空闲数据页。二、在分配的空闲数据页写入待写入数据。在如图 7 所示的数据流示意图中，步骤一采用下述流程：

步骤 101、根据预设抽样算法对待写入数据 X进行抽样，得到目标标签。步骤 102、从预设组标签集合中查找与所述目标标签相似度最高的目标组标签。

图 7 中，举出了具有三个组标签的与涉足标签集合，组标签分别为组标签 A、组标签 B和组标签（。 H没组标签 C为与目标标签相似度最高的组标签，则目标组标签为组标签 c。

步骤 103、从所述目标组标签对应的至少一个空闲数据页中选择目标空闲数据页。

组标签 A对应空闲数据页分组 a ,空闲数据页分组 a包括 2个空闲数据页，分别为空闲数据页 a l和空闲数据页 a2。

组标签 B对应空闲数据页分组 b ,空闲数据页分组 b包括 3个空闲数据页，分别为空闲数据页 bl、空闲数据页 b2和空闲数据页 b3。

组标签 C对应空闲数据页分组 c ,空闲数据页分组 c包括 3个空闲数据页，分别为空闲数据页 cl、空闲数据页 c2和空闲数据页 c 3。

如果目标组标签为组标签 C ,则从空闲数据分组 c中随机或顺序选取一个空闲数据页作为目标空闲数据页，如空闲数据页 c2 , 空闲数据页 c2为目标空闲数据页。

在步骤一确定目标空闲数据页后，步骤二将待写入数据 X与目标空闲数据页 c2进行比较，确定存在差异的数据位，对存在差异的数据位进行写操作。

本发明实施例还提供了一种数据写入的装置，如图 8 所示，所述装置用于实现上述方法，所述装置包括：

抽样单元 81 , 用于根据预设抽样算法对待写入数据进行抽样，得到目标标签，所述目标标签用于表示所述待写入数据中数据位的数值分布情况；查找单元 82 ,用于从预设组标签集合中查找与所述抽样单元 81得到的所述目标标签相似度最高的目标组标签，所述预设组标签集合由至少一个组标签组成，每个组标签对应具有相似数据特征的至少两个空闲数据页；

选择单元 83 ,用于从所述查找单元 82查找到的所述目标组标签对应的至少一个空闲数据页中选择目标空闲数据页；

写入单元 84 ,用于将所述待写入数据中与所述选择单元 83选择的所述目标空闲数据页存在差异的数据位，写入所述目标空闲数据页中的对应位置。

本发明提供的数据写入的装置，能够在为对待写入数据分配存储地址之前，先对待写入数据进行抽样，获得表示待写入数据的数据特征的目标标签，再从预设组标签集合中查找与所述目标标签相似度最高的目标组标签，从目标组标签对应的多个空闲数据页中选择目标空闲数据页，再将待写入数据中与所述目标空闲数据页存在差异的数据位写入所述目标空闲数据页中的对应位置。现有技术中，仅按照空闲数据页的地址顺序或者空闲数据页产生的时间顺序将空闲数据页分配用于写入待写入数据，由于按照此种方式获得的空闲数据页可能出现与待写入数据完全不同或基本不同（90%以上不同），此时进行差异写入将造成大量的写操作，因此现有技术无法保证降低写入量。现有技术中在分配空白数据页时，并未考虑空白数据页与待写入数据的相似程度，存在为分配的空白数据页与待写入数据的内容部分或全部相同或相似的情况。现有技术直接为待写入数据分配空闲数据页，使分配的空闲数据页的数据特征与待写入数据的结构特征存在较大差异，导致写操作数量与普通写入操作的写操作数量近似或相同，使得写时延的降低效果不稳定。本发明中，能够根据待写入数据与空白数据页的相似程度确定分配的空白数据页，由于在为待写入数据分配空闲数据页之前，将目标标签和组标签进行匹配，得到与待写入数据最接近的一组空闲数据页，再从该组空闲数据页中选择一张空闲数据页进行差异存储，因此本发明中为待写入数据分配的空白数据页为与待写入数据具有最高相似度的空白数据页，进而在进行差异存储时，能够减少写操作的数量，达到稳定减少写操作数量的效果。

本发明实施例还提供了一种数据写入的装置，作为对图 8 所示装置的具体说明，如图 9所示，所述抽样单元 81包括：

划分子单元 81 1 , 用于将所述待写入数据划分为预设数量的数据区域；标识位确定子单元 812 ,用于分别分析所述划分子单元 81 1划分的每个数据区域中数据的分布特征，根据所述分布特征确定每个数据区域的标识位；第一目标标签确定子单元 81 3 ,用于根据所述标识位确定子单元 812确定出的每个数据区域的标识位确定所述目标标签。

本发明实施例还提供了一种数据写入的装置，作为对图 8 所示装置的具体说明，如图 10所示，所述抽样单元 81还包括：转换子单元 814 , 用于根据待写入数据中的数据内容，将待写入数据转换为二值图像；

图像分析子单元 815 ,用于对转换子单元 814得到的所述二值图像进行图像分析得到特征值，所述特征值用于表示所述二值图像的图形特征；

第二目标标签确定子单元 816 ,用于将所述图像分析子单元 815得到的所述特征值确定为目标标签。

本发明实施例还提供了一种数据写入的装置，作为对图 8 所示装置的具体说明，如图 1 1所示，所述写入单元 84 , 包括：

判断子单元 841 ,用于判断所述待写入数据中每个数据位与所述目标空闲数据页中相同位置的数据位中的数据是否相同；

待写入数据位确定子单元 842 ,用于当所述判断单元得到所述待写入数据中当前数据位与所述目标空闲数据页中相同位置的数据位中的数据不同时，则确定所述相同数据位为待写入数据位；

写入子单元 843 ,用于将所述待写入数据中位于所述待写入数据位确定子单元 842 确定的所述待写入数据位的数据写入到所述目标空闲数据页的待写入数据位中。

本发明实施例还提供了一种数据写入的装置，作为对图 9和图 1 0所示装置的具体说明，如图 12所示，

所述抽样单元 81还用于，根据所述预设抽样算法对空闲数据页进行抽样，得到每个空闲数据页对应的空闲数据页标签，所述空闲数据页为系统中处于闲置状态的数据页；

所述装置还包括：

分组单元 85 , 用于将具有相同空闲数据页标签的空闲数据页划分为一个预设空闲数据页分组，将所述空闲数据页标签确定为所述预设空闲数据页分组对应的组标签。

本发明实施例还提供了一种数据写入的装置，作为对图 12所示装置的具体说明，如图 1 3所示，所述抽样单元 81还用于，当产生新空闲数据页时，根据所述预设抽样算法对所述新空闲数据页进行抽样，得到所述新空闲数据页对应的新空闲数据页标签；

所述查找单元 82还用于，从所述预设组标签集合中的查找与所述抽样单元 81得到的所述新空闲数据页标签相似度最高的组标签；

所述装置还包括：

添加单元 86 ,用于将所述新空闲数据页添加到所述查找单元 82查找到的所述相似度最高的组标签对应的预设空闲数据页分组中。

本发明实施例还提供了一种数据写入的装置，所述装置用于实施上述方法，如图 14所示，所述装置包括：

处理器 1401 , 用于根据预设抽样算法对待写入数据进行抽样，得到目标标签，所述目标标签用于表示所述待写入数据中数据位的数值分布情况；存储器 1402 , 用于存储所述预设组标签集合；

从所述存储器 1402存储的预设组标签集合中查找与所述目标标签相似度最高的目标组标签，所述预设组标签集合由至少一个组标签组成，每个组标签对应具有相似数据特征的至少两个空闲数据页；

所述存储器还用于存储所述空闲数据页；

进一步的，所述处理器 1401还用于：

将所述待写入数据划分为预设数量的数据区域；

根据确定出的每个数据区域的标识位确定所述目标标签。

进一步的，所述处理器 1401还用于：

将所述特征值确定为目标标签。

进一步的，所述处理器 1401还用于：

根据所述预设抽样算法对存储器 1402中存储的空闲数据页进行抽样，得到每个空闲数据页对应的空闲数据页标签，所述空闲数据页为系统中处于闲置状态的数据页；

进一步的，所述处理器 1401还用于：

从所述存储器 1402存储的所述预设组标签集合中的查找与所述新空闲数据页标签相似度最高的组标签；

需要说明的是，本发明除了可以运用到相变内存中以外，还可运用到其他具有读、写速度存在差异的介质中，如磁性随机存储器（Magnet i c Random Acces s Memory , 简称 MRAM )等。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

Claims

权利要求书

1、一种数据写入的方法，其特征在于，所述方法包括：

根据预设抽样算法对待写入数据进行抽样，得到目标标签，所述目标标签用于表示所述待写入数据中数据位的数值分布情况；

2、根据权利要求 1所述的数据写入的方法，其特征在于，所述根据预设抽样算法对待写入数据进行抽样，得到目标标签，包括：

将所述待写入数据划分为预设数量的数据区域；

根据确定出的每个数据区域的标识位确定所述目标标签。

3、根据权利要求 1所述的数据写入的方法，其特征在于，所述根据预设抽样算法对待写入数据进行抽样，得到目标标签，包括：

将所述特征值确定为目标标签。

4、根据权利要求 1所述的数据写入的方法，其特征在于，所述将所述待写入数据中与所述目标空闲数据页存在差异的数据位，写入所述目标空闲数据页中的对应位置，包括：

分别判断所述待写入数据中每个数据位与所述目标空闲数据页中相同位置的数据位中的数据是否相同；如果所述待写入数据中当前数据位与所述目标空闲数据页中相同位置的数据位中的数据内容不同，则确定所述相同数据位为待写入数据位；

5、根据权利要求 2或 3所述的数据写入的方法，其特征在于，在所述根据预设抽样算法对待写入数据进行抽样，得到目标标签之前，所述方法还包括：根据所述预设抽样算法对空闲数据页进行抽样，得到每个空闲数据页对应的空闲数据页标签，所述空闲数据页为系统中处于闲置状态的数据页；

6、根据权利要求 5所述的数据写入的方法，其特征在于，在所述将具有相同空闲数据页标签的空闲数据页划分为一个预设空闲数据页分组，将所述空闲数据页标签确定为所述预设空闲数据页分组的组标签之后，所述方法还包括：当产生新空闲数据页时，根据所述预设抽样算法对所述新空闲数据页进行抽样，得到所述新空闲数据页对应的新空闲数据页标签；

7、一种数据写入的装置，其特征在于，所述装置包括：

抽样单元，用于根据预设抽样算法对待写入数据进行抽样，得到目标标签，所述目标标签用于表示所述待写入数据中数据位的数值分布情况；

选择单元，用于从所述查找单元查找到的所述目标组标签对应的至少一个空闲数据页中选择目标空闲数据页；写入单元，用于将所述待写入数据中与所述选择单元选择的所述目标空闲数据页存在差异的数据位，写入所述目标空闲数据页中的对应位置。

8、根据权利要求 7所述的数据写入的装置，其特征在于，所述抽样单元包括：

9、根据权利要求 7所述的数据写入的方法，其特征在于，所述抽样单元还包括：

10、根据权利要求 7所述的数据写入的装置，其特征在于，所述写入单元，包括：

11、根据权利要求 8或 9所述的数据写入的装置，其特征在于，所述抽样单元还用于，根据所述预设抽样算法对空闲数据页进行抽样，得到每个空闲数据页对应的空闲数据页标签，所述空闲数据页为系统中处于闲置状态的数据页；

所述装置还包括：

12、根据权利要求 11所述的数据写入的装置，其特征在于，

所述抽样单元还用于，当产生新空闲数据页时，根据所述预设抽样算法对所述新空闲数据页进行抽样，得到所述新空闲数据页对应的新空闲数据页标签；所述查找单元还用于，从所述预设组标签集合中的查找与所述抽样单元得到的所述新空闲数据页标签相似度最高的组标签；

所述装置还包括：

添加单元，用于将所述新空闲数据页添加到所述查找单元查找到的所述相似度最高的组标签对应的预设空闲数据页分组中。

13、一种数据写入的装置，其特征在于，所述装置包括：

处理器，用于根据预设抽样算法对待写入数据进行抽样，得到目标标签，所述目标标签用于表示所述待写入数据中数据位的数值分布情况；

存储器，用于存储所述预设组标签集合；

所述存储器还用于存储所述空闲数据页；

14、根据权利要求 1 3所述的数据写入的装置，其特征在于，所述处理器还用于：

将所述待写入数据划分为预设数量的数据区域；

根据确定出的每个数据区域的标识位确定所述目标标签。

15、根据权利要求 1 3所述的数据写入的方法，其特征在于，所述处理器还用于：

将所述特征值确定为目标标签。

16、根据权利要求 1 3所述的数据写入的装置，其特征在于，所述处理器还用于：

17、根据权利要求 14或 1 5所述的数据写入的装置，其特征在于，所述处理器还用于：

18、根据权利要求 17所述的数据写入的装置，其特征在于，所述处理器还用于：