WO2020000492A1

WO2020000492A1 - 一种存储碎片管理方法及终端

Info

Publication number: WO2020000492A1
Application number: PCT/CN2018/093930
Authority: WO
Inventors: 俞超; 陈浩; 童碧峰; 郑成亮; 周喜渝
Original assignee: 华为技术有限公司
Priority date: 2018-06-30
Filing date: 2018-06-30
Publication date: 2020-01-02
Also published as: CN110945486B; EP3789883A1; CN110945486A; EP3789883A4; US11842046B2; US20210223958A1

Abstract

本申请提供一种存储碎片管理方法及终端，可以应用于终端的文件系统中，该文件系统包括至少一个段，该方法包括：终端先根据段的老化程度和段的有效块占比，从该文件系统中确定出源段；然后终端根据源段的老化程度，从所述文件系统中确定出与该源段的老化程度一致的目标段。最后，终端将该源段中的有效块的数据搬移该目标段的空闲块中。该方法用以解决现有日志结构化文件系统对存储碎片进行数据搬移存在功耗大的问题。

Description

一种存储碎片管理方法及终端

技术领域

本申请涉及存储管理技术领域，尤其涉及一种存储碎片管理方法及终端。

背景技术

日志结构化文件系统(log structured file system，LFS)是将整个存储器件的存储空间当做一个日志。当有写入数据请求时，在当前写入位置不断的往后写入；利用记录日志的原理，将原本可能离散的写数据聚合成连续的写数据，再提交给存储器件，从而获得较高的随机写性能。然而LFS中，随着应用不断在该LFS中创建、修改、删除文件，LFS的空闲空间会出现碎片化。而写数据需要连续的空闲空间，因此LFS中会进行存储碎片的空闲空间回收，即将碎片化空闲空间整理成连续的空闲空间，来满足日志结构连续写入的模式。

目前LFS将日志划分为多个段(segment)，所谓段即固定大小的存储区域。LFS是以段为存储单位，段又被划分为块。现有技术提供的存储碎片管理方法是：识别出现存储碎片的段，复制这些段内有效块的数据，并将这些有效块的数据连续写入空闲段中；此操作完成后，这些出现存储碎片的段所占的存储空间会被释放，重新被标记为空闲段。但是这样做的缺点是：如果出现存储碎片的段中有效块的数据是热数据，也就是这些数据被更新的机率较大，那么可能这些有效块的数据被写入到空闲段之后，该段中的这些数据很快又会被更新或者删除，导致该段再次出现存储碎片。因此需要再次搬移该段中的有效块的数据，所以会产生额外的功耗。

发明内容

本申请提供一种存储碎片管理方法及终端，用以解决现有日志结构化文件系统对存储碎片进行数据搬移存在功耗大的问题。

第一方面，本申请实施例提供了一种存储碎片管理方法，该方法可以应用于终端的文件系统中，该文件系统包括至少一个段，该方法包括：终端先根据段的老化程度和段的有效块占比，从该文件系统中确定出源段；然后终端根据源段的老化程度，从所述文件系统中确定出与该源段的老化程度一致的目标段。最后，终端将该源段中的有效块的数据搬移该目标段的空闲块中。

在本申请实施例中，因源段和目标段的老化程度一致，所以搬移后，目标段中的数据冷热程度相当。由此，目标段中各个块的数据再次发生更新或者删除的时间也基本一致，不太容易导致该目标段再次碎片化，所以可以减少搬移的次数，一定程度上能够降低功耗。

在一种可能的设计中，源段是文件系统中老化程度大于或等于第一阈值、且有效块占比最小的段。具体地，终端可以先遍历一遍文件系统中的段，确定出第一备选集合，该第一备选集合中的段的老化程度大于或等于第一阈值，然后终端从第一备选集合中确定出有效块占比最小的段作为源段。这样，终端每次选择出来的源段中的有效块数据都是最少的，所以可以减少搬移时的写入数据量，一定程度上降低了功耗。

在一种可能的设计中，当第一备选集合中的段的个数小于或者等于第二阈值时，终端从所述第一备选集合中确定出有效块占比最小的段作为源段；或者是，当所述第一备选集合中的段的个数大于所述第二阈值时，所述终端将老化程度最小的至少一个段从所述第一备选集合中移除，直至所述第一备选集合中的段的个数小于或者等于所述第二阈值，然后从所述第一备选集合中确定出有效块占比最小的段作为源段。这样的话，因第一备选集合中的段均是相对老化程度较大的段，所以选择出来的源段的老化程度足够大。而且终端选择出来的源段中的有效块数据都是最少的，所以可以减少回刷时的写入数据量，一定程度上降低了功耗。

在一种可能的设计中，上述存储碎片管理方法中目标段的老化程度与源段的老化程度一致，可以理解为：目标段的老化程度大于或等于第一阈值，而且目标段的老化程度在设定的取值区间内。需要说明的是，设定的取值区间是根据源段的老化程度生成的，例如设定取值区间的中心值是源段的老化程度。这样的话，目标段与源段的老化程度相同或临近，所以搬移后，目标段中的数据冷热程度相当。

在另一种可能的设计中，上述存储碎片管理方法中目标段的老化程度与源段的老化程度一致，还可以理解为：目标段的老化程度大于或等于第一阈值，而且目标段的老化程度在设定的取值区间内，同时，目标段是老化程度大于或等于所述第一阈值、且老化程度在所述设定的取值区间内的段中有效块占比最大的段。这样的话，不仅目标段与源段的老化程度相同或临近，而且目标段被源段的有效块数据填满的概率也比较大。所以搬移后，目标段中的空闲块被充分利用，且目标段中的数据冷热程度相当。

在一种可能的设计中，可以通过如下步骤确定目标段，具体包括：终端遍历文件系统中的段，确定出第二备选集合，其中，第二备选集合中的段的老化程度大于或等于所述第一阈值，接着终端再从该第二备选集合中确定出第三备选集合，而且第三备选集合中的段的老化程度的值在所述设定取值区间内。最后，终端从第三备选集合中选择出有效块占比最大的段作为目标段。这样的话，终端可以实现确定出来的目标段与源段的老化程度一致，而且目标段的空闲块也可以被填满，从而得到充分利用。

在一种可能的设计中，触发终端从所述文件系统中确定出源段的条件可以是：当所述文件系统中空闲段的个数低于到第三阈值时，终端根据段的老化程度和段的有效块占比，从文件系统中确定出源段；也可以是所述终端周期性的根据段的老化程度和段的有效块占比，从文件系统中确定出源段。也就是说，终端可能是因为LFS空闲段不足，从而触发存储碎片管理，也可能是因为终端自身有清理线程在周期地地确定源段，将源段中的数据进行搬移，无论哪种触发条件，都有利于终端及时回收自身的存储空间。

需要说明的是，在一种可能的设计中，在本申请实施例中提及的文件系统可以是LFS。

第二方面，本申请实施例提供一种终端，包括处理器和存储器。其中，存储器用于存储一个或多个计算机程序；当存储器存储的一个或多个计算机程序被处理器执行时，使得终端能够实现第一方面的任意一种可能的设计的方法。

第三方面，本申请实施例还提供了一种终端，所述终端包括执行第一方面或者第一方面的任意一种可能的设计的方法的模块/单元。这些模块/单元可以通过硬件实现，也可以通过硬件执行相应的软件实现。

第四方面，本申请实施例中还提供一种计算机可读存储介质，所述计算机可读存储介质包括计算机程序，当计算机程序在终端上运行时，使得所述终端执行第一方面或上述第一方面的任意一种可能的设计的方法。

第五方面，本申请实施例还提供一种包含计算机程序产品，当所述计算机程序产品在终端上运行时，使得所述终端执行第一方面或上述第一方面的任意一种可能的设计的方法。

本申请的这些方面或其他方面在以下实施例的描述中会更加简明易懂。

附图说明

图1为本申请实施例提供的一种日志结构化文件系统的存储器件布局示意图；

图2为本申请实施例提供的一种日志结构化文件系统的日志结构示意图；

图3为本申请实施例提供的一种日志结构化文件系统示意图；

图4为现有技术提供的一种存储碎片管理方法示意图；

图5为本申请实施例提供的一种存储碎片管理方法流程示意图；

图6为本申请实施例提供的一种源段的选择方法流程示意图；

图7为本申请实施例提供的一种目标段的选择方法流程示意图；

图8为本申请实施例提供的另一种目标段的选择方法流程示意图

图9为本申请实施例提供的另一种存储碎片管理方法流程示意图；

图10为本申请实施例提供的一种LFS系统垃圾回收示意图；

图11为本申请实施例提供的一种终端的单元模块示意图；

图12为本申请实施例提供的一种终端结构示意图；

图13为本申请实施例提供的一种手机结构示意图。

具体实施方式

下面将结合附图对本申请实施例作进一步地详细描述。

本申请实施例提供一种存储碎片管理方法及终端，用以解决现有日志结构化文件系统对存储碎片进行数据搬移存在功耗大的问题。其中，本申请所述方法和终端基于同一发明构思，由于方法及终端解决问题的原理相似，因此设备与方法的实施可以相互参见，重复之处不再赘述。

以下，对本申请中的部分用语进行解释说明。

1)文件系统(file system，FS)是存储和组织计算机文件和数据的方法。文件系统的种类繁多，有基于对象的文件系统；有基于log(日志)的文件系统，例如LFS。

2)垃圾回收(garbage collection，垃圾回收)是对存储器件中空闲空间的管理，其目标是要提供新数据写入所需要的大的空闲块。

3)存储器件可以为非易失存储器、动态随机存储器、静态随机存储器、Flash闪存、嵌入式多媒体存储卡(embeded multi media card，EMMC)等。

4)多个，是指两个或两个以上。

5)在本申请的描述中，“第一”、“第二”等词汇，仅用于区分描述的目的，而不能理解为指示或暗示相对重要性，也不能理解为指示或暗示顺序。

下文，以存储器件是磁盘为例，先详细阐述关于日志结构化文件系统的相关信息。

1、日志结构化文件系统的数据结构

LFS在存储器件上的主要数据结构及其作用和位置见表1。检查点区域是存储器件上的一个固定位置，用来定位索引结点图所在的磁盘块或者闪存块，并确定日志中的最后一个检查点。用索引结点图来维护每个索引结点的当前位置，其活动部分缓存在内存中，因而查找时几乎不需要访问存储器件。

表1 LFS在存储器件上的主要数据结构

2、日志结构化文件系统的磁盘布局

在LFS中，日志是磁盘结构。为便于对空闲空间的管理，LFS把日志划分为段。LFS的元数据(meta data)主要分布在检查点和段中，其磁盘布局如图1所示。索引结点的指针和由索引结点图给出了索引结点的当前位置都经常改变。利用在检查点中的时间戳，可以确定最后一个成功的检查点。

3、日志结构化文件系统的日志结构

LFS的日志使用顺序的、只增的数据结构。LFS的描述仍采用传统的索引组织方式。LFS在日志中接入索引结点，索引结点使LFS能够以随机访问方式从日志中找回文件的相关信息。LFS中查找一个索引结点的步骤是：在位于磁盘上固定区域的检查点中，找到最近的索引结点图；由索引结点图找到索引结点的最近版本；由索引结点就可以找到相应的数据块。如图2所示，在检查点区域中找到索引结点图，然后由索引结点图找到三个索引结点，由各个索引结点找到相应的数据块。

4、日志结构化文件系统的段的状态和段中块的状态

在日志结构化文件系统中，每个段都是由多个块组成的序列。块的状态可以是：1)空闲的；2)有效的。这些块的状态的定义如表2所示。

表2

所谓块的状态是有效的，意味着块中存在有效的数据，对于块的状态，可以依据段摘要或段使用表的信息确定，本申请实施例列举如下两种确定方式进行说明。

方式一：在LFS中，为每一个块记录了摘要信息。该摘要信息包含inode number(索引结点序号，用于指示这个磁盘块属于哪个文件)和offset(偏移量，用于指示属于文件第几个磁盘块)。这个信息保存在段的头部的segment summary block(段摘要块)中。根据段摘要块的这个信息，就可以很直接的判定一个块中是否存在有效的数据，若存在有效的数据，则是有效块，否则就是空闲块。

方式二，bolcks(块)的有效性可以通过检查文件的索引结点(Inode)或间接块(Indirect block)的块指针是否仍然指向这些块来判断，若指针仍指向这些块，则这些块是有效块，否则是空闲块。

因为段是由块组成的，所以段中块的状态的不同组合决定了段的状态，其中，段的状态可以是1)空闲的；2)脏的；3)有效的。这些段的状态的定义如表3所示。

表3

段的状态	描述
空闲的	段中的所有块都是空闲块。
脏的	段中有有效块和空闲块。
有效的	段中的所有块都是有效块。

如图3所示，日志结构化文件系统400包括41、42、43。每个段是物理磁盘块或者闪存块的集合，例如段的容量为8MB。段41中的所有块都是空闲块，所以段41的状态是空闲的；段42中有两个有效块和四个空闲块，所以段42的状态是脏的；段43中所有块都是有效块，所以段43的状态是有效的。

一般地，段中有效块中的数据可能存在热数据和冷数据的区别。所谓热数据是指该有效块中的数据可能很快会被更新或者删除，所谓冷数据是指该有效块中的数据可能过了很长时间才会被更新或者删除。因为段是由块组成的，所以如果段中的有效块中的数据基本是冷数据，那么该段也属于冷的段；若段中的有效块中的数据基本是热数据，那么该段也属于热的段。换句话说，如果有效块中的数据是冷数据，那么段使用表(Segment use table)中所保存的最后一次被更新的数据的时间一般距离当前时间较久，也就是说该有效块比较老。一般也可以用老化程度来衡量各个的段的冷热程度。其中老化程度的一种定义方式如下：

其中，系统最后更新时间是指日志结构化文件系统最后一次更新的时间。系统最早更新时间是指日志结构化文件系统第一次更新的时间。段更新时间是指该段中所有有效块的平均更新时间。n为该段中有效块的数量，T1是指该段第一个有效块的更新时间，T2是指该段第二个有效块的更新时间，Tn是指该段第n个有效块的更新时间。

本申请实施例提供了一种存储碎片管理方法，该方法可以用以对存储器件中的存储碎片进行垃圾回收。之所以要进行垃圾回收，通过LFS的设计原理可以了解，在LFS中，随着应用不断在该LFS中创建、修改、删除文件，LFS的空闲空间会出现碎片化，造成不能再进行大量连续的写操作，因此需要整理存储器件上的可用空间。目前现有技术中，日志结构化文件系统通常采用的垃圾回收方式：垃圾清理过程中，每次选择脏状态的段中有效块占比最少的段作为源段，将该源段中所有有效块中的数据搬移到连续的空闲空间中，然后回收源段所占用的存储空间。如图4所示，在垃圾回收前，源段中有三个有效块和三个空闲块，目标段全是空闲块；当垃圾回收后，源段中的有效块的数据被搬移走，源段被空闲块填充，目标段中前三个为有效块，后三个为空闲块。但是这样做的缺点是如果源段中存储的数据是热数据，那么可能该源段中的有效块中的数据很快会被更新或者删除，导致重复的搬移，产生额外的功耗。

本申请实施例提供的存储碎片管理方法，在选择目标段和源段的过程中结合考虑了段的老化程度。本申请实施例的方法尽可能选择老化程度较大的源段，并将该源段中的有效块中的数据搬移到与之老化程度一致的目标段的空闲块中。这样，搬移后目标段中的数据冷热程度相当。由此，段中各个块的数据再次发生更新或者删除的时间也基本一致，不太容易导致该目标段再次碎片化，所以可以减少搬移的次数，一定程度上能够降低功耗。

为了更加清晰地描述本申请实施例的技术方案，下面结合附图，对本申请实施例提供的存储碎片管理方法及终端进行详细说明。参阅图5所示，本申请实施例提供了一种存储碎片管理方法，该方法可以由终端执行，具体流程包括：

步骤501、终端根据段的老化程度和段的有效块占比，从文件系统中确定出源段。

具体来说，以文件系统是LFS为例，终端的处理器发起清理线程。该清理线程可以先遍历日志结构化文件系统中的所有的段，确定出老化程度和有效块占比均满足设定条件的源段，然后将源段中的有效块中的数据写入到缓存中。设定条件可以是：LFS中源段的老化程度大于第一阈值，且有效块占比最小的段。当然，设定条件也可以是：LFS中源段的老化程度大于第一阈值，且有效块占比仅次于最小的段。或者说，设定条件也可以是：LFS中源段的老化程度大于第一阈值，且有效块占比小于某一阈值的段。即，源段可以是老化程度较大，且有效块占比较小。

一般地，清理线程采用多次循环遍历LFS，每次遍历均选择LFS中老化程度大于第一阈值，且有效块占比最小的段作为源段。这样，由于清理线程每次确定出的源段的有效块占比最小，所以有效块的数据量也是最小的，所以要搬移的数据量也是最小的，相较而言，这一条件可以减少搬移时的写入量，一定程度上降低了功耗。同样的，当每次遍历均选择老化程度大于第一阈值、且有效块占比较小(小于某一阈值)的一个段作为源段时，需要搬移的数据量也是较小的，也可以减少搬移时的写入量，降低功耗。

具体的，在一种可能的设计中，终端可以是先遍历一遍日志结构化文件系统中段，将脏的状态的且老化程度大于第一阈值的段均加入第一备选集合中；然后再遍历第一备选集合，从中确定出有效块占比最小的段作为源段。然后将该源段中的有效块的数据加载到缓存中，并对该段添加标识。

补充来说，当第一备选集合中的段的个数小于或者等于第二阈值时，终端从所述第一备选集合中确定出有效块占比最小的段作为源段。

另外，当所述第一备选集合中的段的个数大于第二阈值时，终端可以将老化程度较小的一些段从所述第一备选集合中移除，直至第一备选集合中的段的个数小于或者等于所述第二阈值，然后再从第一备选集合中确定出有效块占比最小的段作为源段。这样的话，因第一备选集合中的段的均是相对老化程度较大的段，所以选择出来的源段的老化程度足够大。而且终端选择出来的源段中的有效块数据都是最少的，所以可以减少回刷时的写入数据量，一定程度上降低了功耗。

步骤502、终端根据所述源段的老化程度，从所述文件系统中确定出与源段老化程度一致的目标段。

具体地，在一种可能的设计中，上述存储碎片管理方法中目标段的老化程度与源段的老化程度一致，可以理解为：目标段的老化程度与源段的老化程度相同或相近。具体在选取目标段时，可以从所述文件系统中选取老化程度大于或等于第一阈值、且老化程度在设定的取值区间内的一个段作为目标段。其中，该第一阈值可以与确定源段时使用的第一阈值相同。所述设定的取值区间是根据源段的老化程度生成的。例如设定取值区间的中心值是源段的老化程度。这样的话，目标段与源段的老化程度相同或临近，所以搬移后，目标段中的数据冷热程度相当。

具体地，在一种可能的设计中，清理线程可以先遍历一遍日志结构化文件系统中的段，从脏的状态的段中选择出老化程度大于第一阈值的段，并将选择出来的这些段均加入第二备选集合中；然后再遍历该第二备选集合，从中确定出老化程度在设定的取值区间内的段，将这些段加入到第三备选集合；之后终端再从第三备选集合中选择与源段的老化程度最接近的段为目标段，或者是任意选择一个段作为目标段，又或者选择老化程度最大的段作为目标段。

示例性地，假设源段的老化程度为a(例如0.8)，预设的取值区间可以为[a-0.3，a+0.3],所以说第三备选集合中的段的老化程度的值均在[a-0.3,a+0.3]内，然后终端再从第三备选集合中选择一个段作为目标段。

再比如，在一种可能的设计中，终端可以对第二备选集合中的段按照老化程度从大到小排序。然后以源段的老化程度值为中心，以K为半径，选择该源段的老化程度值前后各K各段，并将选择出来的段加入到第三备选集合中。示例性地，假设源段的老化程度为a(例如0.8)，从排序后的第二备选集合中可以选择出比a小的k(k例如为3)个段，以及比a大的k个段，将选择的2k或者2k+1个段作为第三备选集合；然后从第三备选集合中选择出一个段作为目标段。其中，若第二备选集合中包含有老化程度为a的段，则选择作为第三备选集合的为2k+1个段；若第二备选集合中没有包含老化程度为a的段，则选择作为第三备选集合的为2k个段。

在另一种可能的设计中，上述存储碎片管理方法中目标段的老化程度与源段的老化程度一致，还可以理解为：目标段是老化程度大于或等于所述第一阈值、且老化程度在所述设定的取值区间内的段中有效块占比最大的段。这样的话，不仅目标段与源段的老化程度相同或临近，而且目标段被源段的有效块数据填满的概率也比较大，所以搬移后，目标段中的空闲块被充分利用，且目标段中的数据冷热程度相当。

具体地，在一种可能的设计中，清理线程可以先遍历一遍日志结构化文件系统中的段，从脏的状态的段中选择出老化程度大于第一阈值的段，并将选择出来的这些段均加入第二备选集合中；然后再遍历该第二备选集合，从中确定出老化程度在设定的取值区间内的段，将这些段加入到第三备选集合，终端再从第三备选集合选择有效块占比最大的段作为目标段。

示例性地，假设源段的老化程度为a(例如0.8)，预设的取值区间可以为[a-0.3，a+0.3],所以说第三备选集合中的段的老化程度的值均在[a-0.3,a+0.3]内，然后终端再从第三备选集合中选择有效块占比最大的段作为目标段。

步骤503，终端将源段中的有效块的数据搬移到目标段的空闲块。

在步骤503中，当终端扫描到源段后，可以先将源段中的有效块的数据先加载到缓存中。然后针对缓存中的每个有效块，终端依据缓存中的有效块的数据索引找到所在的源段标识，从而根据该源段的老化程度确定出目标段。再将该有效块的的数据写入到该目标段的空闲块中。同时，终端将该源段标识对应源段占用的存储空间释放掉。

一般地，存储碎片管理的触发条件有多种，下文列举出几种条件。

一种触发条件可以是，当文件系统中空闲段的个数低于第三阈值(例如20个)时，处理器才在内核中生成一个用于垃圾回收的清理线程。该清理线程循环执行步骤501至步骤503，直至文件系统中空闲段的个数上升到一定阈值(例如100个)时停止执行。这种存储碎片管理方式也可以称为前台垃圾回收。

一种触发条件可以是，处理器在内核中配置一个用于垃圾回收的清理线程。该清理线程实时地或者周期地执行步骤501。当终端确定出来的源段中的有效块的数据加载到缓存中时，该源段也被标记为待垃圾回收的段。一种情况下，当缓存中有效块的数据的占比缓存的比例大于或者等于一定比例时，例如80％，则触发执行步骤502至步骤503。另一种情况下，缓存中所加载的有效块的数据被加载的同时会记录加载时刻且标识为脏，一但缓存管理器监控到该有效块的数据被置脏时间超过一定时长时，则触发执行步骤502至步骤503，并清空缓存中该有效块的数据。这种存储碎片管理方式也可以称为后台垃圾回收。

下面分别针对后台垃圾回收和前台垃圾回收这两种场景，以LFS为例，对该存储碎片的执行过程进行具体说明。

后台垃圾回收场景

终端的处理器会在内核中生成一个用于垃圾回收的清理线程，该清理线程用于执行如下三个阶段的处理，三个阶段包括：阶段一，实时地或者周期地选择源段；阶段二，选择目标段；阶段三，垃圾回收。

阶段一、实时地或者周期地选择源段，下面结合附图6进行系统说明。

步骤601、清理线程扫描LFS中的所有的段，获取段的老化程度。

步骤602、该清理线程判断扫描到的段是否存在老化程度大于或等于第一阈值的段，若存在，则跳转到步骤603，若不存在，则跳转到步骤601。

步骤603、该清理线程将老化程度大于第一阈值的段加入到第一备选集合中。

步骤604、该清理线程判断第一备选集合中的段的个数是否不超过第二阈值，若是，则跳转到步骤606，若否，则跳转到步骤605。

步骤605、该清理线程将老化程度最小的段从第一备选集合中移除，然后执行步骤604。

步骤606、该清理线程从当前的第一备选集合中，选择出有效块的占比最小的段为源段。

最后，在一种可能的设计中，该清理线程将每次选择出的源段中的有效块中的数据加载到缓存中，然后为该源段添加待垃圾回收的标识。

执行阶段二，选择目标段

当缓存中有效块的数据的占据缓存的比例达到一定比例时，例如80％，触发清理线程选择目标段，或者是，缓存中有效块的数据被置脏时长超过设定时长，则触发清理线程选择目标段。

在阶段二，主要是从LFS中的状态为脏的段中选择目标段。目标段的选择策略可以是依据老化程度这个因素，也可以依据老化程度和有效块的占比这两个因素。最终选择出来目标段的老化程度与源段的老化程度一致。具体地，清理线程针对缓存中的每个有效块，依据缓存中的有效块的数据对应的索引结点索引到该有效块所在的源段的标识，从而根据该源段标识对应的源段的老化程度确定出目标段。下面结合附图7进行系统说明。

步骤701、清理线程扫描LFS中的所有的段，获取段的老化程度。

步骤702、该清理线程判断扫描到的段是否存在老化程度超过第一阈值的段，若存在，则跳转到步骤703，若不存在，则跳转到步骤701。

步骤703、该清理线程将老化程度大于第一阈值的段加入到第二备选集合中。

需要说明的是，因选择目标段可能是在缓存中有效块的数据的占比达到一定比例时才触发的，选择目标段发生在源段选择出来之后，所以步骤701中清理线程扫描LFS中的段的状态与步骤601中清理线程扫描LFS中的段的状态很可能不同，所以得到的第二备选集合与第一备选集合也可能不同。

步骤704、清理线程根据源段的老化程度，遍历第二备选集合，判断是否存在段的老化程度值不在设定的取值区间内的段。若是，则跳转至步骤805a，否则跳转至步骤806a。

具体地，假设源段的老化程度为a(例如0.8)，设定的取值区间可以为[a-0.3，a+0.3]，清理线程判断第二备选集合中是否存在段的老化程度的值不在[a-0.3，a+0.3]中。

步骤705、清理线程将老化程度值不在舍得的取值区间的段从第二备选集合中移除，然后执行步骤704。

步骤706、清理线程从当前的第三备选集合中选择出一个有效块占比最大的段为目标段。

需要说明的是，上述步骤706也可以是：清理线程从当前的第三备选集合中选择与源段的老化程度最接近的段为目标段，也可以是任意选择出一个段为目标段，或者选择老化程度最老的段为目标段。

需要说明的是，确定出第二备选集之后，也可以采用另一种方式确定出目标段，本文结合图8进行说明。

步骤801至步骤803同上文步骤701至步骤703所述，不再赘述。

步骤804、清理线程将第二备选集合中的段按照老化程度大小排序，其中可以按照从大到小排序，或者也可以按照从小到大排序。

步骤805、清理线程根据源段的老化程度，遍历第二备选集合，判断是否存在段超出个数半径，是则跳转至步骤806，否则跳转至步骤807。

例如，源段的老化程度为a(例如0.8)，从排序后的第二备选集合中，判断除了小于a的连续3个段，以及大于a大的连续3个段之外，是否还有别的段。

步骤806、将超出个数半径的段从第二备选集合中移除，然后执行步骤805b。

步骤807、清理线程从第三备选集合中选择出一个有效块占比最大的段为目标段。

需要说明的是，清理线程最终确定出来的目标段也可以大于1个，例如从第三备选集合中选择出一个有效块占比最大的段，和仅次于最大的段均为目标段。这样可以避免一个目标段空闲块太少，不能够完全写入该源端中有效的数据的问题。

阶段三，垃圾回收

清理线程针对缓存中的每个有效块，将缓存中该有效块的数据写入到对应的目标段中。当缓存中的有效块的数据均写入完成后，再将待垃圾回收的标识对应的源段占用的存储空间释放掉。

需要说明的是，上述阶段二和阶段三可以是循环执行的，直至缓存中有效块的数据占据缓存的比例小于一定比例时(例如20％)停止执行。另外，上述阶段二和阶段三也可以是周期执行的。比如说清理线程每隔五分钟确定出一个源段，并把该源段的有效块的数据加载到缓存中；在清理线程将一个源段的有效块的数据加载到缓存中后，再隔5秒钟清理线程就会根据缓存中的每个有效块索引到对应的源段，然后根据源段的老化程度确定出目标段，之后将该有效块的数据写入到目标段的空闲块中。

另外，清理线程可以直接将源段中的有效块的数据写入到目标段的空闲块中，也可以是清理线程将源段中的有效块的数据写加载到缓存中，然后再将缓存中的数据写入到目标段的空闲块中，本申请对其并不做具体限定。

前台垃圾回收场景

若LFS的清理线程收到资源回收指令，或者当LFS系统中的空闲段的个数下降到设定的阈值(例如20个)时，处理器会生成清理线程，该清理线程用于执行如下三个阶段的处理，三个阶段包括：阶段一，选择源段和目标段；阶段二，垃圾回收。下面结合附图9进行系统说明。

阶段一、选择源段和目标段

步骤901、清理线程扫描LFS中的所有的段，获取段的老化程度。

步骤902、该清理线程判断扫描到的段是否有老化程度超过第一阈值的段，若有，则跳转到步骤903，若没有，则跳转到步骤901。

步骤903、该清理线程将老化程度大于第一阈值的段加入到第一备选集合中。

步骤904、该清理线程判断第一备选集合中的段的个数是否不超过第二阈值阈值，若是，则跳转到步骤906，若否，则跳转到步骤905。

步骤905，该清理线程将老化程度最小的段从第一备选集合中移除，然后跳转到步骤904。

步骤906、该清理线程从当前的第一备选集合中，选择出有效块的占比最小的段为源段。

步骤907、清理线程根据源段的老化程度，遍历第一备选集合，判断是否存在段的老化程度值不在设定的取值区间内的段。若是，则跳转至步骤908，否则跳转至步骤909。

具体地，假设源段的老化程度为a(例如0.8)，设定的取值区间可以为[a-0.3，a+0.3]，清理线程判断第一备选集合中是否存在段的老化程度的值不在[a-0.3，a+0.3]中。

步骤908、清理线程将该老化程度的值不在设定的取值区间内的段从第一备选集合中移除，然后跳转到步骤907，直至第一备选集合段的老化程度的值都在预设的取值区间内。

步骤909，清理线程从当前的第一备选集合中选择出一个有效块占比最大的段为目标段。

需要说明的是，上述步骤909也可以是：清理线程从当前的第一备选集合中选择与源段的老化程度最接近的段为目标段，也可以是任意选择出一个段为目标段，或者选择老化程度最老的段为目标段。

阶段二，垃圾回收

清理线程将源段中的有效块中的数据写入到目标段中，然后重复执行步骤901至909，直至LFS系统中的空闲段的个数上升到设定的阈值(例如80个)时。具体地，清理线程可以直接将源段中的有效块的数据写入到目标段的空闲块中，也可以是清理线程将源段中的有效块的数据写加载到缓存中，然后再将缓存中的数据写入到目标段的空闲块中，本申请对其并不做具体限定。

其中，清理线程最终确定出来的目标段也可以大于1个，例如从第一备选集合中选择出一个有效块占比最大的段，和仅次于最大的段均为目标段。这样可以避免一个目标段空闲块太少，不能够完全写入该源端中有效的数据的问题。

另外，需要说明的是，在图9选择目标段的方式也可以采用图7b所示的方式，在此不再重复赘述。另外，需要说明的，图9所示的源段和目标段可以都是从第一备选集合中确定出来的，也可以是从不同的备选集合中确定出来的。例如源段是在第一时刻对应的LFS的段中选择出来的，而目标段是在第二时刻对应的LFS的段中筛选出来的；其中，第二时刻在第一时刻之后，这两个时刻对应的LFS的段可能不相同，由此，这两个时刻对应的第一备选集合也可能不相同。

对应垃圾回收阶段，举例来说，如图10所示，在垃圾回收前，源段中有3个有效块和三个空闲块，目标段中有三个空闲块和三个有效块，在进行前台垃圾回收或者后台垃圾回收时，源段中的六个段全部为空闲段，目标段被有效块填满了。当完成垃圾回收后，该源段对应的存储空间被回收，源段重新被置为空闲段，可以再次被写入新数据。

需要说明的是，在一种可能的设计中，在进行垃圾回收时，若源段的有效块中的数据属于同一目录的文件有多个，则可以优先地将同一个目录中的文件搬移到一个目标段中；在另一种可能的设计中，在进行垃圾回收时，按照源段的有效块的最后修改时间，对有效块进行分组，将相同或者相近的时间的有效地块放在同一个组中，然后这些组的有效块的数据搬移到同一个目标段中。

本申请实施例中还提供一种计算机可读存储介质，所述计算机可读存储介质包括计算机程序，当计算机程序在终端上运行时，使得所述终端执行上述存储碎片管理方法任意一种可能的实现。

本申请实施例还提供一种包含计算机程序产品，当所述计算机程序产品在终端上运行时，使得所述终端执行上述存储碎片管理方法任意一种可能的实现。

在本申请的一些实施例中，本申请实施例公开了一种终端，如图11所示，该终端用于实现以上各个方法实施例中记载的方法，其包括：状态缓存模块1001、源段选择模块1002、目标段选择模块1003以及垃圾回收模块1004。该终端包括的模块可以在安卓操作系统的内核层实现。其中，状态缓存模块1001获取LFS中段的状态，计算各个段的老化程度和有效块占比，源段选择模块1002用于支持终端执行图5中的步骤501，目标段选择模块 1003用于支持终端执行图5中的步骤502，垃圾回收模块1004用于支持终端执行图5中的步骤503。上述方法实施例涉及的各步骤的所有相关内容均可以援引到对应功能模块的功能描述，在此不再赘述。

在本申请的另一些实施例中，本申请实施例公开了一种终端，如图12所示，该终端可以包括：一个或多个处理器1101；存储器1102；显示器1103；一个或多个应用程序(未示出)；以及一个或多个计算机程序1104，上述各器件可以通过一个或多个通信总线1105连接。其中该一个或多个计算机程序1104被存储在上述存储器1102中并被配置为被该一个或多个处理器1101执行，该一个或多个计算机程序1104包括指令，上述指令可以用于执行如图5及相应实施例中的各个步骤。

上述终端可以为手机、平板电脑、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer，UMPC)、上网本、个人数字助理(personal digital assistant，PDA)等终端设备，下面以终端为手机为例进行说明，图13示出的是与本发明各实施例相关的手机20的部分结构的框图。

如图13所示，手机20包括显示设备210、处理器220以及存储器230。存储器230可用于存储软件程序以及数据，存储器230可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如图像采集功能等)等；存储数据区可存储根据手机200的使用所创建的数据(比如音频数据、电话本、图像等)等。此外，存储器230可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。本发明实例提供的存储碎片管理方法适用于对存储器230中的存储碎片的管理。

处理器220通过运行存储在存储器230的软件程序以及数据，从而执行手机200的各种功能应用以及数据处理。处理器220是手机200的控制中心，利用各种接口和线路连接整个手机的各个部分，通过运行或执行存储在存储器230内的软件程序和/或数据，执行手机200的各种功能和处理数据，从而对手机进行整体监控。处理器220可以包括一个或多个通用处理器，还可包括一个或多个DSP(digital signal processor，数字信号处理器)，也可以包括一个或者多个ISP(image signal processor，图像信号处理器)，用于执行相关操作，以实现本申请实施例所提供的技术方案。

手机200中还包括用于拍摄图像或视频的摄像头260。摄像头260可以是普通摄像头，也可以是对焦摄像头。

手机200还可以包括输入设备240，用于接收输入的数字信息、字符信息或接触式触摸操作/非接触式手势，以及产生与手机200的用户设置以及功能控制有关的信号输入等。

显示设备210，包括的显示面板211，用于显示由用户输入的信息或提供给用户的信息以及手机200的各种菜单界面等，在本申请实施例中主要用于显示手机100中摄像头或者传感器获取的待检测图像。可选的，显示面板可以采用液晶显示器(liquid crystal display，LCD)或OLED(organic light-emitting diode，有机发光二极管)等形式来配置显示面板211。

除以上之外，手机200还可以包括用于给其他模块供电的电源250。手机200还可以包括一个或多个传感器270，例如图像传感器、红外传感器、激光传感器等。手机200还可以包括无线射频(radio frequency，RF)电路280，用于与无线网络设备进行网络通信，还可以包括WiFi模块290，用于与其他设备进行WiFi通信，获取其他设备传输的图像或者数据等。

通过以上的实施方式的描述，所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请实施例各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：快闪存储器、移动硬盘、只读存储器、随机存取存储器、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本申请实施例的具体实施方式，但本申请实施例的保护范围并不局限于此，任何在本申请实施例揭露的技术范围内的变化或替换，都应涵盖在本申请实施例的保护范围之内。因此，本申请实施例的保护范围应以所述权利要求的保护范围为准。

Claims

一种存储碎片管理方法，应用于终端的文件系统中，所述文件系统包括至少一个段，其特征在于，所述方法包括：

终端根据段的老化程度和段的有效块占比，从所述文件系统中确定出源段；

所述终端根据所述源段的老化程度，从所述文件系统中确定出目标段，所述目标段的老化程度与所述源段的老化程度一致；

所述终端将所述源段中的有效块的数据搬移所述目标段的空闲块中。
如权利要求1所述的方法，其特征在于，所述源段是所述文件系统中老化程度大于或等于第一阈值、且有效块占比最小的段。
如权利要求2所述的方法，其特征在于，所述终端根据段的老化程度和段的有效块占比，从所述文件系统中确定出源段，包括：

所述终端遍历所述文件系统中的段，确定出第一备选集合，所述第一备选集合中的段的老化程度大于或等于所述第一阈值；

所述终端从所述第一备选集合中确定出有效块占比最小的段作为所述源段。
如权利要求3所述的方法，其特征在于，所述终端从所述第一备选集合中确定出有效块占比最小的段作为所述源段，包括：

当所述第一备选集合中的段的个数小于或者等于第二阈值时，所述终端从所述第一备选集合中确定出有效块占比最小的段作为所述源段；或者

当所述第一备选集合中的段的个数大于所述第二阈值时，所述终端将老化程度最小的至少一个段从所述第一备选集合中移除，直至所述第一备选集合中的段的个数小于或者等于所述第二阈值，然后从所述第一备选集合中确定出有效块占比最小的段作为所述源段。
如权利要求1至4任一项所述的方法，其特征在于，所述目标段的老化程度与所述源段的老化程度一致，包括：所述目标段的老化程度大于或等于所述第一阈值，且所述目标段的老化程度在设定的取值区间内；所述设定的取值区间是根据所述源段的老化程度生成的。
如权利要求5所述的方法，其特征在于，所述目标段是老化程度大于或等于所述第一阈值、且老化程度在所述设定的取值区间内的段中有效块占比最大的段。
如权利要求6所述的方法，其特征在于，所述终端根据所述源段的老化程度，从所述文件系统中确定出目标段，包括：

所述终端遍历所述文件系统中的段，确定出第二备选集合，所述第二备选集合中的段的老化程度大于或等于所述第一阈值；

所述终端从所述第二备选集合中确定出第三备选集合，所述第三备选集合中的段的老化程度的值在所述设定取值区间内；

所述终端从所述第三备选集合中选择出有效块占比最大的段作为所述目标段。
如权利要求5至7任一项所述的方法，其特征在于，其中，所述设定取值区间的中心值是所述源段的老化程度。
如权利要求1至8任一项所述的方法，其特征在于，所述终端根据段的老化程度和段的有效块占比，从所述文件系统中确定出源段，包括：

当所述文件系统中空闲段的个数低于到第三阈值时，所述终端根据段的老化程度和段的有效块占比，从文件系统中确定出源段；或者

所述终端周期性的根据段的老化程度和段的有效块占比，从所述文件系统中确定出源段。
如权利要求1至9任一项所述的方法，其特征在于，所述文件系统为日志结构化文件系统LFS。
一种终端，其特征在于，包括处理器和存储器；

所述存储器用于存储一个或多个计算机程序；

当所述存储器存储的一个或多个计算机程序被所述处理器执行时，使得所述终端执行：

根据段的老化程度和段的有效块占比，从所述文件系统中确定出源段；

根据所述源段的老化程度，从所述文件系统中确定出目标段，所述目标段的老化程度与所述源段的老化程度一致；

将所述源段中的有效块的数据搬移所述目标段的空闲块中。
如权利要求11所述的终端，其特征在于，所述源段是所述文件系统中老化程度大于或等于第一阈值、且有效块占比最小的段。
如权利要求12所述的终端，其特征在于，当所述存储器存储的一个或多个计算机程序被所述处理器执行时，还使得所述终端执行：

遍历所述文件系统中的段，确定出第一备选集合，所述第一备选集合中的段的老化程度大于或等于所述第一阈值；

从所述第一备选集合中确定出有效块占比最小的段作为所述源段。
如权利要求13所述的终端，其特征在于，当所述存储器存储的一个或多个计算机程序被所述处理器执行时，还使得所述终端执行：

当所述第一备选集合中的段的个数小于或者等于第二阈值时，从所述第一备选集合中确定出有效块占比最小的段作为所述源段；或者

当所述第一备选集合中的段的个数大于所述第二阈值时，将老化程度最小的至少一个段从所述第一备选集合中移除，直至所述第一备选集合中的段的个数小于或者等于所述第二阈值，然后从所述第一备选集合中确定出有效块占比最小的段作为所述源段。
如权利要求11至14任一项所述的终端，其特征在于，当所述存储器存储的一个或多个计算机程序被所述处理器执行时，还使得所述终端执行：

所述目标段的老化程度与所述源段的老化程度一致，包括：所述目标段的老化程度大于或等于所述第一阈值，且所述目标段的老化程度在设定的取值区间内；所述设定的取值区间是根据所述源段的老化程度生成的。
如权利要求15所述的终端，其特征在于，所述目标段是老化程度大于或等于所述第一阈值、且老化程度在所述设定的取值区间内的段中有效块占比最大的段。
如权利要求16所述的终端，其特征在于，当所述存储器存储的一个或多个计算机程序被所述处理器执行时，还使得所述终端执行：

遍历所述文件系统中的段，确定出第二备选集合，所述第二备选集合中的段的老化程度大于或等于所述第一阈值；

从所述第二备选集合中确定出第三备选集合，所述第三备选集合中的段的老化程度的值在所述设定取值区间内；

从所述第三备选集合中选择出有效块占比最大的段作为所述目标段。
如权利要求15至17任一项所述的终端，其特征在于，其中，所述设定取值区间的中心值是所述源段的老化程度。
如权利要求11至18任一项所述的终端，其特征在于，当所述存储器存储的一个或多个计算机程序被所述处理器执行时，还使得所述终端执行：

当所述文件系统中空闲段的个数低于到第三阈值时，根据段的老化程度和段的有效块占比，从文件系统中确定出源段；或者

周期性的根据段的老化程度和段的有效块占比，从所述文件系统中确定出源段。
如权利要求11至19任一项所述的终端，其特征在于，所述文件系统为日志结构化文件系统LFS。
一种计算机存储介质，其特征在于，所述计算机可读存储介质包括计算机程序，当计算机程序在终端上运行时，使得所述终端执行如权利要求1至10任一所述的方法。