WO2015081742A1

WO2015081742A1 - 写数据的方法及装置

Info

Publication number: WO2015081742A1
Application number: PCT/CN2014/086340
Authority: WO
Inventors: 董浩; 姚建业
Original assignee: 华为技术有限公司
Priority date: 2013-12-04
Filing date: 2014-09-12
Publication date: 2015-06-11
Also published as: CN103645995B; CN103645995A

Abstract

一种写数据的方法及装置，包括：确定数据块中第一子数据块集合的个数，第一子数据块集合中的每个子数据块存储的数据均为脏数据；当第一子数据块集合的个数超过阈值时，确定第二子数据块集合，第二子数据块集合是第一个子数据块存储的数据和最后一个子数据块存储的数据均为脏数据的连续子数据块的集合；当第二子数据块集合的个数不超过阈值时，为数据块内的各个第二子数据块集合分别生成第一写数据请求，将第一写数据请求发送存储器；当第二子数据块集合的个数超过阈值时，为数据块生成一个第二写数据请求，将第二写数据请求发送存储器。根据提供的写数据的方法及装置在写入时无需从磁盘上读取数据到缓存，减少对RAID的读写压力。

Description

写数据的方法及装置

本申请要求于2013年12月4日提交中国专利局、申请号为201310649068.8、发明名称为“写数据的方法及装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明涉及存储领域，尤其涉及一种写数据的方法及装置。

背景技术

高速缓存(英文：cache)和廉价冗余磁盘阵列(英文：Redundant Array of Inexpensive Drivers，缩写：RAID)是存储系统中的两个重要模块。其中，cache作为存储系统的性能加速器，能很好的屏蔽阵列时延，使主机输入输出(英文：Input and Output，缩写：IO)更友好的访问硬盘。RAID的原理是通过将多个相对便宜的硬盘组合起来，成为一个硬盘阵列组，使性能达到甚至超过一个价格昂贵、容量巨大的硬盘，并且配合数据分散排列的设计，提升数据的安全性。根据选择的版本不同，RAID与单颗硬盘相比，不仅能够增大存储容量，还能够增强数据集成度以及数据的容错能力。另外，磁盘阵列对于电脑来说，看起来就像一个单独的硬盘或逻辑存储单元。

存储系统接收主机写IO后，会先写入cache再下发给RAID。以RAID5为例，RAID包括多个分条(英文：stripe)，本发明实施例中描述的分条，是指并行写入构建RAID的各个存储器上的数据块的集合，每个分条包括多个分条单元，其中，每个分条单元的大小相同，且同一个分条上的分条单元位于各个存储器中的偏移位置相同。分条上的分条单元也称为条带(英文：strip)，条带是一个盘区上的连续地址块。在磁盘阵列中，控制器通常采用条带将虚拟磁盘的块地址(英文：block addresses)映射到成员盘的块地址。RAID通过条带化提升存储系统的可靠性。

若cache下发给RAID的数据IO的大小与RAID中一个分条的大小相同，此时所下发的数据IO能够与对应的分条对齐；相反，若cache下发给RAID的数据的大小与RAID中一个分条的大小不同，则不能分条对齐，此时将需要：先将旧分条单元和旧校验值从磁盘上读取到缓存，然后基于新分条单元、旧分条单元与旧校验值计算出新的校验值，再将新分条单元与新的校验值写入磁盘。由于需要先从磁盘上读取数据到缓存，这显然将放大对磁盘的读写压力，导致存储系统的读写性能严重下降。

发明内容

技术问题

有鉴于此，本发明要解决的技术问题是，因cache下发RAID的IO不能分条对齐，在执行写入时需要先从磁盘上读取数据到缓存，导致存储系统读写性能下降的问题。

解决方案

为了解决上述技术问题，根据本发明一实施例，在第一方面提供一种写数据的方法，所述方法应用于存储设备中，所述存储设备包括缓存和存储器，所述缓存包含多个数据块，每个数据块包含多个子数据块，所述方法包括：

确定所述数据块中包含的第一子数据块集合的个数，所述第一子数据块集合中的每个子数据块存储的数据均为脏数据；

当所述第一子数据块集合的个数超过预定阈值时，确定第二子数据块集合，所述第二子数据块集合是第一个子数据块存储的数据和最后一个子数据块存储的数据均为脏数据的连续子数据块的集合；

当所述第二子数据块集合的个数不超过预定阈值时，为所述数据块内的各个第二子数据块集合分别生成第一写数据请求，并将每个第一写数据请求发送给所述存储器；

当所述第二子数据块集合的个数超过预定阈值时，为所述数据块生成一个第二写数据请求，并将所述第二写数据请求发送给所述存储器。

在一种可能的实现方式中，在所述为所述数据块生成一个第二写数据请求之前，包括：

生成读数据请求，所述读数据请求用于读取所述存储器中与所述数据块对应的分条内的所有数据；

从所述数据块对应的分条内的所有数据中提取与所述数据块中空的子数据块对应的数据；

将所述对应的数据写入所述空的子数据块内。

在一种可能的实现方式中，还包括：

获取对所述分条进行数据读取的第一平均时间；

获取对所述分条内的一个分条单元进行数据读取的第二平均时间；

根据所述第一平均时间与所述第二平均时间，计算所述预定阈值。

在一种可能的实现方式中，根据所述第一平均时间与所述第二平均时间，计算所述预定阈值包括：

计算所述第一平均时间除以所述第二平均时间的商；

将所得到的商与预设的时延系数相乘，所述预定阈值等于所述相乘获得的乘积。

为了解决上述技术问题，根据本发明又一实施例，在第二方面提供一种写数据的装置，所述装置应用于存储设备中，所述存储设备包括缓存和存储器，所述缓存包含多个数据块，每个数据块包含多个子数据块，所述装置包括：

第一确定模块，用于确定所述数据块中包含的第一子数据块集合的个数，所述第一子数据块集合中的每个子数据块存储的数据均为脏数据；

第一判断模块，与所述第一确定模块连接，用于判断所述第一子数据块集合的个数是否超过预定阈值；

第二确定模块，与所述第一判断模块连接，用于当所述第一子数据块集合的个数超过预定阈值时，确定第二子数据块集合，所述第二子数据块集合是第一个子数据块存储的数据和最后一个子数据块存储的数据均为脏数据的连续子数据块的集合；

第二判断模块，与所述第二确定模块连接，用于判断所述第二子数据块集合的个数是否超过预定阈值；

写入模块，与所述第二判断模块连接，用于

在一种可能的实现方式中，所述写入模块被配置为：

将所述对应的数据写入所述空的子数据块内。

在一种可能的实现方式中，所述写数据的装置还包括：

计算模块，与所述第一判断模块及所述第二判断模块连接，用于获取对所述分条进行数据读取的第一平均时间；获取对所述分条内的一个分条单元进行数据读取的第二平均时间；根据所述第一平均时间与所述第二平均时间，计算所述预定阈值。

在一种可能的实现方式中，所述计算模块被配置为：

计算所述第一平均时间除以所述第二平均时间的商；

有益效果

通过当所述第二子数据块集合的个数超过预定阈值时，为所述数据块生成一个第二写数据请求，并将所述第二写数据请求发送给所述存储器，根据本发明实施例的一种写数据的方法及装置在执行写入时不需要先从磁盘上读取数据到缓存，从而减少了对RAID的读写压力；通过当所述第二子数据块集合的个数不超过预定阈值时，为所述数据块内的各个第二子数据块集合分别生成第一写数据请求，并将每个第一写数据请求发送给所述存储器，根据本发明实施例的一种写数据的方法及装置能够减少cache下发的写IO个数，从而减少了对RAID的读写压力。

根据下面参考附图对示例性实施例的详细说明，本发明的其它特征及方面将变得清楚。

附图说明

包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本发明的示例性实施例、特征和方面，并且用于解释本发明的原理。

图1示出根据本发明一实施例的写数据的方法的流程图；

图2示出本发明实施例一个chunk的示意图；

图3示出根据本发明另一实施例的写数据的方法的流程图；

图4a-图4b示出本发明实施例中另一chunk的示意图；

图5示出本发明实施例中又一chunk的示意图；

图6示出计算预定阈值的方法的流程图；

图7示出IO大小与阈值关系的示意图；

图8示出根据本发明一实施例的写数据的装置的结构示意图；

图9示出根据本发明一实施例的写数据的装置的结构框图。

具体实施方式

以下将参考附图详细说明本发明的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面，但是除非特别指出，不必按比例绘制附图。

在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。

另外，为了更好的说明本发明，在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解，没有某些具体细节，本发明同样可以实施。在一些实例中，对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述，以便于凸显本发明的主旨。

图1示出根据本发明一实施例的写数据的方法的流程图。该写数据的方法，应用于存储设备中，所述存储设备包括控制器和存储器(例如，磁盘)，其中，控制器包括处理器和缓存(又称cache)。在本发明实施例中磁盘可以以RAID的方式来进行组织，为了描述方便，可以将存储器称为RAID。cache包含多个数据块(又称chunk)，每个chunk包含多个子数据块，执行下述步骤的可以是控制器中的处理器。如图1所示，该方法主要包括：

步骤S101、确定cache的一个chunk中包含的第一子数据块集合的个数，所述第一子数据块集合中的每个子数据块存储的数据均为脏数据。

一般来说，cache中以逻辑单元号(英文：logic unit number，缩写： LUN)为标识来组织所缓存的数据。这使得，在cache内查找待写入RAID中的脏数据时，通常以逻辑区块地址(英文：logical block address,缩写：LBA)为键值找到哈希(英文：hash)表的chunk。每个LUN用hash算法组织查找表，hash是一种数据组织方式，每个hash节点指向一个chunk；chunk是cache内最小操作单元，当将chunk写入RAID时，为达到分条对齐即cache下发给RAID的数据IO的大小与RAID中一个分条的大小相同的目的，chunk大小应与RAID中对应分条的大小相同，因此本发明实施例取chunk大小与分条大小相同。

图2示出本发明实施例一个chunk的示意图，该chunk包括15个子数据块，其中第一子数据块集合的个数为4，即图2中左起第2-3个子数据块为一个第一子数据块集合，第9-10个子数据块为一个第一子数据块集合，第12个子数据块为一个第一子数据块集合，第14-15个子数据块为一个第一子数据块集合。

步骤S102、当所述第一子数据块集合的个数超过预定阈值时，确定第二子数据块集合，所述第二子数据块集合是第一个子数据块存储的数据和最后一个子数据块存储的数据均为脏数据的连续子数据块的集合；

图2所示chunk中的第二子数据块集合个数为2，即左起第2-3个子数据块为一个第二子数据块集合，第9-15个子数据块为一个第二子数据块集合。

步骤S103、当所述第二子数据块集合的个数不超过预定阈值时，为所述数据块内的各个第二子数据块集合分别生成第一写数据请求，并将每个第一写数据请求发送给所述存储器。

步骤S104、当所述第二子数据块集合的个数超过预定阈值时，为所述数据块生成一个第二写数据请求，并将所述第二写数据请求发送给所述存储器。

通过当所述第二子数据块集合的个数超过预定阈值时，为所述数据块生成一个第二写数据请求，并将所述第二写数据请求发送给所述存储器，根据本发明实施例的一种写数据的方法及装置在执行写入时不需要先从磁盘上读取数据到缓存，从而减少了对RAID的读写压力。通过当所述第二子数据块集合的个数不超过预定阈值时，为所述数据块内的各个第二子数据块集合分别生成第一写数据请求，并将每个第一写数据请求发送给所述存储器，根据本发明实施例的一种写数据的方法及装置能够减少cache下发的写IO个数，从而减少了对RAID的读写压力。

图3示出根据本发明另一实施例的写数据的方法的流程图。图3中标号与图1相同的步骤具有相同的功能，为简明起见，省略对这些步骤的详细说明。如图3所示，与图1不同的是：

在步骤S101之后，执行步骤S301、判断所述第一子数据块集合的个数是否超过预定阈值L？

是则执行步骤S102；否则执行步骤S306。

以阈值L为3.79为例，则图2所示的chunk中第一子数据块集合的个数超过预定阈值。执行步骤S102，确定图2中的第二子数据块集合个数为2。

步骤S302、判断所述第二子数据块集合的个数是否超过预定阈值L？

是则执行步骤S104；否则执行步骤S103。

仍以图2中所示chunk及阈值L为3.79为例，第二子数据块集合个数为2，小于阈值，因此执行步骤S103，为chunk内的每个第二子数据块集合分别生成第一写数据请求，并将每个第一写数据请求发送给所述存储器，以将每个第二子数据块集合作为一个IO分别写入RAID，即发送2个第一写数据请求给存储器，将2个第二子数据块集合作为2个数据IO下发给RAID。

根据本发明实施例的一种写数据的方法能够减少cache下发的写IO个数，从而减少了对RAID的读写压力。

进一步地，图4a示出本发明实施例中另一chunk的示意图，以图4a所示 chunk为例，遍历chunk，发现chunk内脏数据很多，且中间没有干净数据混合，执行步骤S101-S302，其中第一子数据块集合的个数为7大于阈值，第二子数据块集合的个数为7大于阈值，因此执行步骤S104。

在一种可能的实施方式中，在步骤S104为所述数据块生成一个第二写数据请求之前，还包括：

步骤S303、生成读数据请求，所述读数据请求用于读取所述存储器中与所述数据块对应的分条内的所有数据；

步骤S304、从所述数据块对应的分条内的所有数据中提取与所述数据块中空的子数据块对应的数据；

步骤S305、将所述对应的数据写入所述空的子数据块内。

图4b示出将对应的数据写入空的子数据块之后的chunk示意图。在步骤S104中，以该chunk作为一个整体，生成一个第二写数据请求，并将该第二写数据请求发送给所述存储器，即将整个chunk作为一个数据IO,下发给RAID，chunk的大小与对应分条的大小相同，RAID接收到分条对齐的数据，只需要计算校验数据后就可以直接执行写入，不需要先从磁盘上读取数据到缓存。

通过当所述第二子数据块集合的个数超过预定阈值时，为所述数据块生成一个第二写数据请求，并将所述第二写数据请求发送给所述存储器，根据本发明实施例的一种写数据的方法在执行写入时不需要先从磁盘上读取数据到缓存，从而减少了对RAID的读写压力。

步骤S306、在第一子数据块集合的个数不超过所述预定阈值的情况下，对各个第一子数据块集合分别生成第三写数据请求，并将每个第三写数据请求发送给所述存储器。

图5示出本发明实施例中另一chunk的示意图，以图5所示chunk为例，遍历chunk计算出其要下发给RAID的第一子数据块集合的个数为2小于阈值L，因此对chunk的第一子数据块集合分别生成第三写数据请求，并将该第三写数据请求发给所述RAID。此时没有必要将干净数据和脏数据一起进行写数据的操作，也不需要提取对应数据来写入空的子数据块，再进行写操作，只需要对各个第一子数据块集合分别生成第三写数据请求，并将每个第三写数据请求发送给所述存储器。需要说明的是，在本发明实施例中，干净数据是指已经写入RAID，并且仍然在缓存中保存的数据；脏数据是指尚未写入RAID，但仍然在缓存中保存的数据。

图6示出计算预定阈值的方法的流程图。上述实施例中所述的预定阈值，其计算方法如图6所示，包括：

步骤S401、获取对所述分条进行数据读取的第一平均时间；

步骤S402、获取对所述分条内的一个分条单元进行数据读取的第二平均时间；

步骤S403、根据所述第一平均时间与所述第二平均时间，计算所述预定阈值。

计算所述第一平均时间除以所述第二平均时间的商；将所得到的商与预设的时延系数相乘，所述预定阈值等于所述相乘获得的乘积。

具体可以按如下公式计算所述预定阈值：

L＝Tm/Tk*M，

其中，L表示预定阈值，Tm表示对一个分条进行数据读取的第一平均时间，Tk表示对分条内的一个分条单元进行数据读取的第二平均时间，M表示时延系数。在一种具体的实施方式中，时延系数M可以为1.5。

在相同的RAID上，读取不同大小的分条单元所需要的第二平均时间是不同的，其对应关系如表1所示：

表1

以分条大小为1M为例，进行数据读取的第一平均时间(Tm)为42.8毫秒，Tk取值如表1所示，再考虑多个IO在盘上的并发处理因此其系数为M＝1.5，当chunk大小为1M，数据块大小为4k时，L＝3.79，图7为IO大小与阈值关系的示意图。系数M是一个经验值，是在具体的测试中总结出来的，若系数取值过高则阈值较高，那么以本发明实施例的方式执行数据写入的概率就会较低，写性能较差；若系数过低则阈值过低，则盘上的并发IO增多，其原因在于，针对一个IO其覆盖的分条单元可能是有限的，因此并不是该分条内所有分条单元都有IO，若以分条对齐的方式进行数据写入，该分条对应所有分条单元都有IO，因此造成盘上的并发IO增多。通过多次调整得出在M＝1.5条件下性能是较优的。本发明实施例通过所述阈值的设定，在考虑磁盘的并发处理能力的基础上，实现减少RAID读写压力的技术效果。

图8示出根据本发明一实施例的写数据的装置的结构示意图。所述装置10应用于存储设备中，所述存储设备包括缓存和存储器，所述缓存包含多个数据块，每个数据块包含多个子数据块，如图8所示，该装置10主要包括：第一确定模块110、第一判断模块120、第二确定模块130、第二判断模块140、写入模块150。

第一确定模块110，用于确定所述数据块中包含的第一子数据块集合的个数，所述第一子数据块集合中的每个子数据块存储的数据均为脏数据；

第一判断模块120，与所述第一确定模块110连接，用于判断所述第一子数据块集合的个数是否超过预定阈值；

第二确定模块130，与所述第一判断模块120连接，用于当所述第一子数据块集合的个数超过预定阈值时，确定第二子数据块集合，所述第二子数据块集合是第一个子数据块存储的数据和最后一个子数据块存储的数据均为脏数据的连续子数据块的集合；

第二判断模块140，与所述第二确定模块130连接，用于判断所述第二子数据块集合的个数是否超过预定阈值；

写入模块150，与所述第二判断模块140连接，用于当所述第二子数据块集合的个数不超过预定阈值时，为所述数据块内的各个第二子数据块集合分别生成第一写数据请求，并将每个第一写数据请求发送给所述存储器；以及当所述第二子数据块集合的个数超过预定阈值时，为所述数据块生成一个第二写数据请求，并将所述第二写数据请求发送给所述存储器。

在一种可能的实施方式中，写入模块150被配置为：生成读数据请求，所述读数据请求用于读取所述存储器中与所述数据块对应的分条内的所有数据；从所述数据块对应的分条内的所有数据中提取与所述数据块中空的子数据块对应的数据；将所述对应的数据写入所述空的子数据块内。

在一种可能的实施方式中，该装置10还包括计算模块160，该计算模块160与所述第一判断模块120及所述第二判断模块140连接，用于获取对所述分条进行数据读取的第一平均时间；获取对所述分条内的一个分条单元进行数据读取的第二平均时间；根据所述第一平均时间与所述第二平均时间，计算所述预定阈值。

在一种可能的实施方式中，计算模块160被配置为：计算所述第一平均时间除以所述第二平均时间的商；将所得到的商与预设的时延系数相乘，所述预定阈值等于所述相乘获得的乘积。

通过当所述第二子数据块集合的个数超过预定阈值时，为所述数据块生成一个第二写数据请求，并将所述第二写数据请求发送给所述存储器，根据本发明实施例的一种写数据的装置在执行写入时不需要先从磁盘上读取数据到缓存，从而减少了对RAID的读写压力；通过当所述第二子数据块集合的个数不超过预定阈值时，为所述数据块内的各个第二子数据块集合分别生成第一写数据请求，并将每个第一写数据请求发送给所述存储器，根据本发明实施例的一种写数据的装置能够减少cache下发的写IO个数，从而减少了对RAID的读写压力。

图9示出了本发明的另一个实施例的一种写数据的装置的结构框图。所述写数据的装置1100可以是具备计算能力的主机服务器、个人计算机PC、或者可携带的便携式计算机或终端等。本发明具体实施例并不对计算节点的具体实现做限定。

所述写数据的装置1100包括处理器(processor)1110、通信接口(Communications Interface)1120、存储器(memory)1130和总线1140。其中，处理器1110、通信接口1120、以及存储器1130通过总线1140完成相互间的通信。

通信接口1120用于与网络设备通信，其中网络设备包括例如虚拟机管理中心、共享存储等。

处理器1110用于执行程序。处理器1110可能是一个中央处理器CPU，或者是专用集成电路ASIC(Application Specific Integrated Circuit)，或者是被配置成实施本发明实施例的一个或多个集成电路。

存储器1130用于存放文件。存储器1130可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。存储器1130也可以是存储器阵列。存储器1130还可能被分块，并且所述块可按一定的规则组合成虚拟卷。

在一种可能的实施方式中，上述程序可为包括计算机操作指令的程序代码。该程序具体可用于：

在一种可能的实现方式中，在所述为所述数据块生成一个第二写数据请求之前，该程序还用于：

将所述对应的数据写入所述空的子数据块内。

在一种可能的实现方式中，该程序还用于：

获取对所述分条进行数据读取的第一平均时间；

计算所述第一平均时间除以所述第二平均时间的商；

本领域普通技术人员可以意识到，本文所描述的实施例中的各示例性单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件形式来实现，取决于技术方案的特定应用和设计约束条件。专业技术人员可以针对特定的应用选择不同的方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

如果以计算机软件的形式来实现所述功能并作为独立的产品销售或使用时，则在一定程度上可认为本发明的技术方案的全部或部分(例如对现有技术做出贡献的部分)是以计算机软件产品的形式体现的。该计算机软件产品通常存储在计算机可读取的非易失性存储介质中，包括若干指令用以使得计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各实施例方法的全部或部分步骤。而前述的存储介质包括U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

Claims

一种写数据的方法，所述方法应用于存储设备中，所述存储设备包括缓存和存储器，所述缓存包含多个数据块，每个数据块包含多个子数据块，其特征在于，所述方法包括：

确定所述数据块中包含的第一子数据块集合的个数，所述第一子数据块集合中的每个子数据块存储的数据均为脏数据；

当所述第一子数据块集合的个数超过预定阈值时，确定第二子数据块集合，所述第二子数据块集合是第一个子数据块存储的数据和最后一个子数据块存储的数据均为脏数据的连续子数据块的集合；

当所述第二子数据块集合的个数不超过预定阈值时，为所述数据块内的各个第二子数据块集合分别生成第一写数据请求，并将每个第一写数据请求发送给所述存储器；

当所述第二子数据块集合的个数超过预定阈值时，为所述数据块生成一个第二写数据请求，并将所述第二写数据请求发送给所述存储器。
根据权利要求1所述的写数据的方法，其特征在于，在所述为所述数据块生成一个第二写数据请求之前，还包括：

生成读数据请求，所述读数据请求用于读取所述存储器中与所述数据块对应的分条内的所有数据；

从所述数据块对应的分条内的所有数据中提取与所述数据块中空的子数据块对应的数据；

将所述对应的数据写入所述空的子数据块内。
根据权利要求2所述的写数据的方法，其特征在于，还包括：

获取对所述分条进行数据读取的第一平均时间；

获取对所述分条内的一个分条单元进行数据读取的第二平均时间；

根据所述第一平均时间与所述第二平均时间，计算所述预定阈值。
根据权利要求3所述的写数据的方法，其特征在于，根据所述第一平均时间与所述第二平均时间，计算所述预定阈值包括：

计算所述第一平均时间除以所述第二平均时间的商；

将所得到的商与预设的时延系数相乘，所述预定阈值等于所述相乘获得的乘积。
一种写数据的装置，所述装置应用于存储设备中，所述存储设备包括缓存和存储器，所述缓存包含多个数据块，每个数据块包含多个子数据块，其特征在于，所述装置包括：

第一确定模块，用于确定所述数据块中包含的第一子数据块集合的个数，所述第一子数据块集合中的每个子数据块存储的数据均为脏数据；

第一判断模块，与所述第一确定模块连接，用于判断所述第一子数据块集合的个数是否超过预定阈值；

第二确定模块，与所述第一判断模块连接，用于当所述第一子数据块集合的个数超过预定阈值时，确定第二子数据块集合，所述第二子数据块集合是第一个子数据块存储的数据和最后一个子数据块存储的数据均为脏数据的连续子数据块的集合；

第二判断模块，与所述第二确定模块连接，用于判断所述第二子数据块集合的个数是否超过预定阈值；

写入模块，与所述第二判断模块连接，用于

当所述第二子数据块集合的个数不超过预定阈值时，为所述数据块内的各个第二子数据块集合分别生成第一写数据请求，并将每个第一写数据请求发送给所述存储器；

当所述第二子数据块集合的个数超过预定阈值时，为所述数据块生成一个第二写数据请求，并将所述第二写数据请求发送给所述存储器。
根据权利要求5所述的写数据的装置，其特征在于，所述写入模块被配置为：

生成读数据请求，所述读数据请求用于读取所述存储器中与所述数据块对应的分条内的所有数据；

从所述数据块对应的分条内的所有数据中提取与所述数据块中空的子数据块对应的数据；

将所述对应的数据写入所述空的子数据块内。
根据权利要求6所述的写数据的装置，其特征在于，还包括：

计算模块，与所述第一判断模块及所述第二判断模块连接，用于获取对所述分条进行数据读取的第一平均时间；获取对所述分条内的一个分条单元进行数据读取的第二平均时间；根据所述第一平均时间与所述第二平均时间，计算所述预定阈值。
根据权利要求7所述的写数据的装置，其特征在于，所述计算模块被配置为：

计算所述第一平均时间除以所述第二平均时间的商；

将所得到的商与预设的时延系数相乘，所述预定阈值等于所述相乘获得的乘积。