WO2015074392A1

WO2015074392A1 - 一种存储单元的数据处理方法、设备及系统

Info

Publication number: WO2015074392A1
Application number: PCT/CN2014/078079
Authority: WO
Inventors: 陈钟平
Original assignee: 华为技术有限公司
Priority date: 2013-11-22
Filing date: 2014-05-22
Publication date: 2015-05-28
Also published as: EP3054626A4; US10049024B2; CN103647804A; CN103647804B; US20160266988A1; EP3054626A1; EP3054626B1

Abstract

本发明提供了一种存储单元的数据处理方法、设备及系统。该方法包括如下步骤：第一服务器针对至少一个用于存储数据的存储单元，记录发生可修复故障但修复失败的存储单元的信息（S101）；所述第一服务器在每次接收到读取数据的请求时，査询记录的存储单元的信息对应的存储单元中是否存储有所述数据中的部分或全部数据；如果是，向发送所述请求的请求方返回读取所述数据失败的消息；否则，在存储有所述数据的存储单元中读取所述数据，并反馈给发送所述请求的请求方（S102）。采用本发明，可以避免对存储单元进行重复的数据读取操作，提供存储单元的数据处理机制合理性，节省系统资源。

Description

一种存储单元的数据处理方法、设备及系统

本申请要求于 2013 年 11 月 22 日提交中国专利局、申请号为 201310600884.X, 发明名称为" 一种存储单元的数据处理方法、设备及系统" 的中国专利申请的优先权，其全部内容通过引用结合在本申请中。技术领域本发明涉及电子计算机技术领域，尤其涉及一种存储单元的数据处理方法、设备及系统。

背景技术

现有存储系统常使用磁盘驱动器 (Hard Disk Drive, HDD)和固态硬盘 (Solid State Disk, SDD)作为存储介质。此类存储介质可能出现的故障中包括一些可修复故障，例如校验错误 (ECC uncorrectable errors, UNC) ,扇区标识出错 (sector ID not found, IDNF) ,可修复故障通常可以通过重新写入新的数据进行修复。

对于数据存在备份的分布式存储系统，备份数据会分布在不同的服务器。如果主用服务器发生 UNC、 IDNF等可修复故障，主用服务器请求存储有故障区域的备份数据的备用服务器发送备份数据，将接收的备份数据覆盖到故障区域，完成故障修复；同样，如果备用服务器发生 UNC、 IDNF 等可修复故障，备用服务器向相应的主用服务器发送请求，根据接收的来自主用服务器的备份数据完成故障修复。而当主、备用服务器的同一备份数据均发生故障时，故障区域则无法完成修复。

在无法完成修复的情况下，主用服务器或者备用服务器可能再次接收到读取故障区域数据的请求，并再次调度操作系统 (Operate System, OS)输入输出 (Input Output, 10)通道访问硬盘故障区域，进而重新启动故障修复过程，然后返回故障修复失败。反复的 10调度和修复过程会浪费掉大量的系统资源。发明内容

本发明实施例提供了一种存储单元的数据处理方法、设备及系统，用以解决主、备用服务器的同一备份数据均发生故障时，反复的 10调度和修复过程浪费系统资源的问题。

本发明实施例提供的具体技术方案如下：

第一方面，一种存储单元的数据处理方法，该方法包括：

第一服务器针对至少一个用于存储数据的存储单元，记录发生可修复故障但修复失败的存储单元的信息；

所述第一服务器在每次接收到读取数据的请求时，查询记录的存储单元的信息对应的存储单元中是否存储有所述数据中的部分或全部数据；如果是，向发送所述请求的请求方返回读取所述数据失败的消息；否则，在存储有所述数据的存储单元中读取所述数据，并反馈给发送所述请求的请求方。

结合第一方面，在第一种可能的实现方式中，所述第一服务器记录发生可修复故障但修复失败的存储单元的信息，包括：

所述第一服务器向第二服务器发送消息，用以请求所述第二服务器读取所述第一服务器内发生可修复故障的存储单元中存储的数据的备份数据；

当所述第一服务器接收到所述第二服务器在读取所述备份数据失败时返回的消息后，确定所述发生可修复故障的存储单元修复失败；

所述第一服务器记录所述发生可修复故障的存储单元的信息。

结合第一方面的第一种可能的实现方式，在第二种可能的实现方式中，所述第一服务器通过下述方式确定发生可修复故障的存储单元：所述第一服务器接收读取数据的请求；

所述第一服务器通过操作系统输入输出 OS 10通道访问请求读取的数据所在的存储单元；

所述第一服务器根据所述 OS 10上报的消息，确定所述请求读取的数据所在的存储单元中发生可修复故障的存储单元。

结合第一方面的第二种可能的实现方式，在第三种可能的实现方式中，所述 OS 10通道上报的消息，包括：

所述发生可修复故障的存储单元对应的位图 bitmap ,以及所述可修复故障的错误码。

结合第一方面，在第四种可能的实现方式中，所述第一服务器记录发生可修复故障但修复失败的存储单元的信息，包括：

所述第一服务器将内存的坏分区表 BST中对应于所述发生可修复故障但修复失败的存储单元的比特 bit位设置为 1。

结合第一方面的第四种可能的实现方式，在第五种可能的实现方式中，该方法还包括：

所述第一服务器将内存的 BST存储至硬盘。

结合第一方面和第一方面的第一种可能的实现方式至第五种可能的实现方式中任意一种，在第六种可能的实现方式中，所述可修复故障，包括：校验错误，和 /或扇区标志出错。

结合第一方面，在第七种可能的实现方式中，该方法还包括：所述第一服务器在每次接收到写入数据的请求时，确定将被写入数据的存储单元的信息；

当所述第一服务器确定记录的存储单元的信息中包括所述将被写入数据的存储单元的信息时，删除记录的所述将被写入数据的存储单元的信息；向所述将被写入数据的存储单元写入数据。

结合第一方面，在第八种可能的实现方式中，该方法还包括：当所述第一服务器确定向任一服务器发送数据时，查询记录的存储单元的信息对应的存储单元中是否存储有待发送数据中的部分或全部数据；如果是，所述第一服务器向接收方服务器发送指示消息，指示所述待发送数据中的部分或全部数据所存储在的存储单元发生可修复故障但修复失败；

否则，所述第一服务器向接收方服务器发送所述待发送数据。

结合第一方面，在第九种可能的实现方式中，该方法还包括：当所述第一服务器确定将要接收任一服务器发送的数据时，若接收到发送方服务器指示的部分或全部数据所存储在的发送方服务器的存储单元发生可修复故障但修复失败的消息，则确定用于存储所述部分或全部数据的存储单元，在本地记录用于存储所述部分或全部数据的存储单元的信息。

第二方面，一种服务器设备，该设备包括：

记录单元，用于针对至少一个用于存储数据的存储单元，记录发生可修复故障但修复失败的存储单元的信息；

读请求处理单元，用于在每次接收到读取数据的请求时，查询记录的存储单元的信息对应的存储单元中是否存储有所述数据中的部分或全部数据；如果是，向发送所述请求的请求方返回读取所述数据失败的消息；否则，在存储有所述数据的存储单元中读取所述数据，并反馈给发送所述请求的请求方。

结合第二方面，在第一种可能的实现方式中，所述记录单元，包括：故障确定单元，用于确定本地发生可修复故障的存储单元；

消息发送单元，用于向其它服务器发送消息，用以请求所述其它服务器读取所述发生可修复故障的存储单元中存储的数据的备份数据，

消息处理单元，用于接收到所述其它服务器在读取所述备份数据失败时返回的消息后，确定所述发生可修复故障的存储单元修复失败；

信息记录单元，用于记录所述发生可修复故障的存储单元的信息。结合第二方面的第一种可能的实现方式，在第二种可能的实现方式中，所述故障确定单元具体用于：

接收读取数据的请求；

通过 OS 10通道访问请求读取的数据所在的存储单元；

根据所述 OS 10上报的消息，确定所述请求读取的数据所在的存储单元中发生可修复故障的存储单元。

结合第二方面的第二种可能的实现方式，在第三种可能的实现方式中，所述故障确定单元接收的 OS 10通道上报的消息，包括：

结合第二方面，在第四种可能的实现方式中，所述记录单元用于记录发生可修复故障但修复失败的存储单元的信息时，具体用于：

将内存的坏分区表 BST中对应于所述发生可修复故障但修复失败的存储单元的比特 bit位设置为 1。

结合第二方面的第四种可能的实现方式，在第五种可能的实现方式中，该设备还包括：

BST存储单元，用于将内存的 BST存储至硬盘。

结合第二方面和第二方面的第一种可能的实现方式至第五种可能的实现方式中任意一种，在第六种可能的实现方式中，所述记录单元中记录的存储单元的信息对应的存储单元发生的可修复故障，包括：

校验错误，和 /或扇区标志出错。

结合第二方面，在第七种可能的实现方式中，该设备还包括：写请求处理单元，用于在每次接收到写入数据的请求时，确定将被写入数据的存储单元的信息；当确定记录的存储单元的信息中包括所述将被写入数据的存储单元的信息时，删除记录的所述将被写入数据的存储单元的信息；向所述将被写入数据的存储单元写入数据。结合第二方面，在第八种可能的实现方式中，该设备还包括：指示单元，用于当确定向任一服务器发送数据时，查询记录的存储单元的信息对应的存储单元中是否存储有待发送数据中的部分或全部数据；如果是，向接收方服务器发送指示消息，指示所述待发送数据中的部分或全部数据所存储在的存储单元发生可修复故障但修复失败；否则，向接收方服务器发送所述待发送数据。

结合第二方面，在第九种可能的实现方式中，该设备还包括：指示接收单元，用于当确定将要接收任一服务器发送的数据时，若接收到发送方服务器指示的部分或全部数据所存储在的发送方服务器的存储单元发生可修复故障但修复失败的消息，则确定用于存储所述部分或全部数据的存储单元，在本地记录所述用于存储所述部分或全部数据的存储单元的信息。

第三方面，一种服务器设备，该设备包括：

处理器，用于针对至少一个用于存储数据的存储单元，记录发生可修复故障但修复失败的存储单元的信息；在每次接收到读取数据的请求时，查询记录的存储单元的信息对应的存储单元中是否存储有所述数据中的部分或全部数据；如果是，向发送所述请求的请求方返回读取所述数据失败的消息；否则，在存储有所述数据的存储单元中读取所述数据，并反馈给发送所述请求的请求方。

结合第三方面，在第一种可能的实现方式中，该设备还包括传输模块；所述处理器用于记录发生可修复故障但修复失败的存储单元的信息时，具体用于：

确定本地发生可修复故障的存储单元；

向其它服务器发送消息，用以请求所述其它服务器读取所述发生可修复故障的存储单元中存储的数据的备份数据；

当接收到所述其它服务器在读取所述备份数据失败时返回的消息后，确定所述发生可修复故障的存储单元修复失败；

记录所述发生可修复故障的存储单元的信息。

结合第三方面的第一种可能的实现方式，在第二种可能的实现方式中，所述处理器用于确定本地发生可修复故障的存储单元时，具体用于：

接收读取数据的请求；

通过操作系统输入输出 OS 10通道访问请求读取的数据所在的存储单元；

结合第三方面的第二种可能的实现方式，在第三种可能的实现方式中，所述处理器接收的 OS 10通道上报的消息，包括：

结合第三方面，在第四种可能的实现方式中，该设备还包括内存；所述处理器用于记录发生可修复故障但修复失败的存储单元的信息时，具体用于：

结合第三方面的第四种可能的实现方式，在第五种可能的实现方式中，该设备还包括硬盘；

所述处理器还用于将内存的 BST存储至硬盘。

结合第三方面和第三方面第一种可能的实现方式至第五种可能的实现方式中任意一种，在第六种可能的实现方式中，所述处理器记录的存储单元的信息对应的存储单元发生的可修复故障，包括：

校验错误，和 /或扇区标志出错。

结合第三方面，在第七种可能的实现方式中，所述处理器还用于在每次接收到写入数据的请求时，确定将被写入数据的存储单元的信息；当确定记录的存储单元的信息中包括所述将被写入数据的存储单元的信息时，删除记录的所述将被写入数据的存储单元的信息；向所述将被写入数据的存储单元写入数据。

结合第三方面，在第八种可能的实现方式中，所述处理器还用于当确定向任一服务器发送数据时，查询记录的存储单元的信息对应的存储单元中是否存储有待发送数据中的部分或全部数据；如果是，向接收方服务器发送指示消息，指示所述待发送数据中的部分或全部数据所存储在的存储单元发生可修复故障但修复失败；否则，向接收方服务器发送所述待发送数据。

结合第三方面，在第九种可能的实现方式中，所述处理器还用于当确定将要接收任一服务器发送的数据时，若接收到发送方服务器指示的部分或全部数据所存储在的发送方服务器的存储单元发生可修复故障但修复失败的消息，则确定用于存储所述部分或全部数据的存储单元，在本地记录所述用于存储所述部分或全部数据的存储单元的信息。

第四方面，一种分布式存储系统，至少包括：

第一服务器，用于针对至少一个用于存储数据的存储单元，记录发生可修复故障但修复失败的存储单元的信息；在每次接收到读取数据的请求时，查询记录的存储单元的信息对应的存储单元中是否存储有所述数据中的部分或全部数据；如果是，向发送所述请求的请求方返回读取所述数据失败的消息；否则，在存储有所述数据的存储单元中读取所述数据，并反馈给发送所述请求的请求方。

结合第四方面，在第一种可能的实现方式中，所述系统中，对于每一第一服务器，存在与该第一服务器对应的第二服务器；

所述第一服务器用于记录发生可修复故障但修复失败的存储单元的信息时，具体用于：向所述第二服务器发送消息，用以请求所述第二服务器读取所述第一服务器内发生可修复故障的存储单元中存储的数据的备份数据；

当接收到所述第二服务器在读取所述备份数据失败时返回的消息后，确定所述发生可修复故障的存储单元修复失败；

记录所述发生可修复故障的存储单元的信息。

结合第四方面或第四方面的第一种可能的实现方式，在第二种可能的实现方式中，所述第一服务器记录的存储单元的信息对应的存储单元发生的可修复故障，包括：

校验错误，和 /或扇区标志出错。

结合第四方面，在第三种可能的实现方式中，所述第一服务器还用于：当确定向任一服务器发送数据时，查询记录的存储单元的信息对应的存储单元中是否存储有待发送数据中的部分或全部数据；如果是，向接收方服务器发送指示消息，指示所述待发送数据中的部分或全部数据所存储在的存储单元发生可修复故障但修复失败；否则，向接收方服务器发送所述待发送数据。

结合第四方面，在第四种可能的实现方式中，所述第一服务器还用于：当确定将要接收任一服务器发送的数据时，若接收到发送方服务器指示的部分或全部数据所存储在的发送方服务器的存储单元发生可修复故障但修复失败的消息，则确定用于存储所述部分或全部数据的存储单元，在本地记录用于存储所述部分或全部数据的存储单元的信息。

本发明实施例，第一服务器针对至少一个用于存储数据的存储单元，记录发生可修复故障但修复失败的存储单元的信息；第一服务器在每次接收到读取数据的请求时，查询记录的存储单元的信息对应的存储单元中是否存储有所述数据中的部分或全部数据；如果是，向发送所述请求的请求方返回读取所述数据失败的消息；否则，在存储有所述数据的存储单元中读取所述数据，并反馈给发送所述请求的请求方。通过记录发生可修复故障但修复失败的存储单元，并在每次读取数据之前查询记录的存储单元的信息，避免了对发生可修复故障的存储单元进行重复的没有效果的修复，使得存储单元的数据读取机制更加合理，节省了系统资源。附图说明

图 1是本发明实施例提供的存储单元的数据处理方法的流程示意图；图 2是本发明一具体实施例提供的存储单元的故障处理方法的流程示意图；

图 3是本发明另一具体实施例提供的存储单元的故障处理方法的流程示意图；

图 4是本发明另一具体实施例提供的存储单元的数据迁移方法的流程示意图；

图 5是本发明实施例提供的服务器设备的结构示意图；

图 6是本发明实施例提供的服务器设备的另一结构示意图；图 7是本发明实施例提供的服务器设备的另一结构示意图；图 8是本发明实施例提供的分布式存储系统的结构示意图。具体实施方式

本发明实施例提供了一种存储单元的数据处理方法、设备及系统，用以避免对发生可修复故障的存储单元进行重复的没有效果的修复，节省系统资源。

参见图 1 ,本发明实施例提供的存储单元的数据处理方法包括：

S101、第一服务器针对至少一个用于存储数据的存储单元，记录发生可修复故障但修复失败的存储单元的信息。

第一服务器在 OS 10通道上报存储单元发生可修复故障之后，尝试获取存储在其它服务器的备份数据，用以修复故障，若该修复过程失败，则记录此类存储单元的信息。

所述可修复故障，包括： IDNF ,和 /或 UNC。 S102、所述第一服务器在每次接收到读取数据的请求时，查询记录的存储单元的信息对应的存储单元中是否存储有所述数据中的部分或全部数据；如果是，向发送所述请求的请求方返回读取所述数据失败的消息；否则，在存储有所述数据的存储单元中读取所述数据，并反馈给发送所述请求的请求方。

读取数据的请求来自用户，或者来自本地后台程序，或者来自分布式存储系统中的其它计算机。

在调用系统资源访问存储介质之前，先查询存储单元是否有发生可修复故障但修复失败的记录，这样，能够避免对存储单元进行重复修复，节约了系统资源。

较佳的， S101中，第一服务器记录发生可修复故障但修复失败的存储单元的信息，包括：第一服务器向第二服务器发送消息，用以请求第二服务器读取第一服务器内发生可修复故障的存储单元中存储的数据的备份数据；当第一服务器接收到第二服务器在读取所述备份数据失败时返回的消息后，确定所述发生可修复故障的存储单元修复失败；第一服务器记录所述发生可修复故障的存储单元的信息。

较佳的，第一服务器通过下述方式确定发生可修复故障的存储单元：第一服务器接收读取数据的请求；第一服务器通过操作系统输入输出 OS 10 通道访问请求读取的数据所在的存储单元；第一服务器根据所述 OS 10上报的消息，确定所述请求读取的数据所在的存储单元中发生可修复故障的存储单元。现有技术中，通过 OS 10通道访问发生任何故障的存储单元时 OS 10通道均上报输入输出错误 (Error Input Output, EIO) ,用户层无法得知存储单元发生的是否为可修复故障，不利于用户层进行合理的故障处理。因此，本发明实施例中，定义 OS 10通道能够上报存储单元故障的具体类型，这样，使得用户层能够根据 OS 10通道上报的消息，确定发生可修复故障的存储单元，然后针对发生可修复故障的存储单元向其它服务器发送消息，以请求传输备份数据进行故障修复。而针对根据 OS 10通道上报的消息确定的发生硬件损坏等不可修复故障的存储单元，用户层不作修复处理。

较佳的， OS 10通道的上报方式进行如下改进：在 OS 10通道上报的消息中，指示发生故障的存储单元对应的位图 bitmap ,以及故障的错误码。 bitmap 用于确定存储单元的位置，错误码用于确定具体的故障类型， UNC 和 IDNF均有各自对应的错误码。

较佳的，记录发生可修复故障但修复失败的存储单元的信息，包括：第一服务器将内存的坏分区表 BST中对应于所述发生可修复故障但修复失败的存储单元的比特 bit位设置为 1。具体地，可以使用 UINT32(Unsigned INTeger 32, 32位无符号整型)数据的一个 bit标记一个存储单元，对于 HDD , 存储单元为扇区， 1M 存储空间对应的 2048(=64x32)个扇区使用 64 个 UINT32的值即可表示，各个 bit初始为 0 ,若某一扇区发生可修复故障并修复失败，将该扇区对应的 bit置为 1。

较佳的，当满足一定的触发条件时，第一服务器将内存的 BST存储至硬盘。例如，在固定的时间点将 BST存储至硬盘，或者，当 BST有更新时，将 BST同步至硬盘。计算机每次在内存掉电之后，从硬盘中读取 BST ,这样，能够避免 BST的记录丟失。

较佳的，本实施例还提供向存储单元写入数据的方法，具体包括：第一服务器在每次接收到写入数据的请求时，确定将被写入数据的存储单元；所述第一服务器查询记录的存储单元的信息对应的存储单元中是否包括所述将被写入数据的存储单元；如果是，所述第一服务器删除对所述将被写入数据的存储单元的信息的记录，向所述将被写入数据的存储单元写入数据；否则，所述第一服务器向所述将被写入数据的存储单元写入数据。

这样，能够正常读取新写入的数据。当分布式存储系统内增、減服务器时，服务器之间需要进行再平衡

(rebalance)过程，通过转移存储的数据来平衡各服务器负荷。在转移数据的过程中，对于已被记录的发生可修复故障但修复失败的存储单元中的数据，发送方服务器应当指示出来，接收方服务器也应当对本地相应的存储单元进行记录，以避免错误数据的传输和读取，保障数据的一致性。

具体的，当第一服务器确定向任一服务器发送数据时，查询记录的存储单元的信息对应的存储单元中是否存储有待发送数据中的部分或全部数据；如果是，第一服务器向接收方服务器发送指示消息，指示所述待发送数据中的部分或全部数据所存储在的存储单元发生可修复故障但修复失败；否则，第一服务器向接收方服务器发送所述待发送数据。

当第一服务器确定将要接收任一服务器发送的数据时，若接收到发送方服务器指示的部分或全部数据所存储在的发送方服务器的存储单元发生可修复故障但修复失败的消息，则在本地记录与所述部分或全部数据对应的存储单元的信息。例如，不接收已被发送方服务器 BST记录的存储单元中的无效数据，仅在本地为无效数据保留同样大小的存储空间，并在本地 BST记录这些存储空间。

下面结合实际应用场景，对本发明实施例提供的方法进行详细说明。场景一、服务器 A、 B、 C中均存有一份数据 M , m是 M中的一段数据，在服务器 A中完全占用一个扇区， A为主用服务器， B和 C为备用服务器，服务器 A中维护有一张 BST。如图 2所示，服务器 A的存储单元故障处理包括以下流程：

5201、服务器 A接收到读操作请求，调用 OS 10读取数据 M；

5202、服务器 A的 OS 10返回数据 m所在扇区发生 UNC或 IDNF；

5203、服务器 A向服务器 B发送读修复请求；服务器 B读取数据 m , 服务器 B的 OS 10的返回 UNC或 IDNF；

5204、服务器 A接收到服务器 B返回的消息，确定读修复失败； 5205、服务器 A向服务器 C发送读修复请求；服务器 C读取数据 m , 服务器 C的 OS 10的返回 UNC或 IDNF；

5206、服务器 A接收到服务器 C返回的消息，确定读修复失败；

5207、服务器 A在 BST中标记 m所在扇区。

当服务器 A再次接收到读取数据 M的请求时，先查询 BST ,发现数据 m已被 BST标记，返回读取数据 M失败；当服务器 A接收到写入数据的请求时，先查询 BST ,发现 m所在扇区已被 BST标记，则撤销 BST中对 m所在扇区的标记，然后向 m所在扇区写入数据。

场景二、服务器 A、 B、 C中均存有一份数据 M , m是 M中的一段数据，在服务器 A中完全占用一个扇区， C为主用服务器， A和 B为备用服务器，服务器 A中维护有一张 BST。如图 3所示，服务器 A的存储单元故障处理包括以下流程：

5301、服务器 A进行磁盘后台扫描，调用 OS 10读取数据 M；

5302、服务器 A的 OS 10返回数据 m所在扇区发生 UNC或 IDNF；

5303、服务器 A向服务器 C发送读修复请求；服务器 C读取数据 m , 服务器 C的 OS 10的返回 UNC或 IDNF；

5304、服务器 C向服务器 B发送读修复请求；服务器 B读取数据 m , 服务器 B的 OS 10的返回 UNC或 IDNF；

5305、服务器 C接收到服务器 B返回的消息，确定读修复失败；

5306、服务器 A接收到服务器 C返回的消息，确定读修复失败；

5307、服务器 A在 BST中标记数据 m所在扇区。

当服务器 A再次进行磁盘后台扫描等读取数据的操作时，先查询 BST , 发现数据 m已被 BST标记，返回读取数据 M失败；当服务器 A接收到写入数据的请求时，先查询 BST ,发现 m所在扇区已被 BST标记，则撤销 BST中对 m所在扇区的标记，然后向 m所在扇区写入数据。

场景三、服务器 A、 B、 C中均存有一份数据 M , m是 M中的一段数据，在 A中完全占用一个扇区，m所在扇区已被 A的 BST标记，此时加入服务器 D ,用于分担服务器 A、 B、 C的存储负荷。如图 4所示，分布式存储系统的 rebalance包括以下流程：

5401、服务器 A确定将数据 M迁移至服务器 D；

5402、服务器 A在传输数据 M时，不传输数据 m ,同时指示服务器 D 数据 m所在扇区已被 BST标记；

5403、服务器 D接收数据 M ,保留数据 m占用的存储空间，同时在 BST中标记 m所在扇区。

当服务器 D读取数据 M时，先查询 BST ,发现数据 m已被 BST标记，返回读取数据 M失败；当服务器 D接收到写入数据的请求时，先查询 BST , 发现 m所在扇区已被 BST标记，则撤销 BST中对 m所在扇区的标记，然后向 m所在扇区写入数据。

参见图 5 ,本发明实施例提供的服务器设备，包括：

记录单元 51 ,用于针对至少一个用于存储数据的存储单元，记录发生可修复故障但修复失败的存储单元的信息；

读请求处理单元 52 ,用于在每次接收到读取数据的请求时，查询记录的存储单元的信息对应的存储单元中是否存储有所述数据中的部分或全部数据；如果是，向发送所述请求的请求方返回读取所述数据失败的消息；否则，在存储有所述数据的存储单元中读取所述数据，并反馈给发送所述请求的请求方。

较佳的，参见图 6 ,所述记录单元 51 ,包括：

故障确定单元 511 ,用于确定本地发生可修复故障的存储单元；消息发送单元 512 ,用于向其它服务器发送消息，用以请求所述其它服务器读取所述发生可修复故障的存储单元中存储的数据的备份数据；

消息处理单元 513 ,用于当接收到所述其它服务器在读取所述备份数据失败时返回的消息后，确定所述发生可修复故障的存储单元修复失败；信息记录单元 514 ,用于记录所述发生可修复故障的存储单元的信息。较佳的，所述故障确定单元 511具体用于：

接收读取数据的请求；

通过 OS 10通道访问请求读取的数据所在的存储单元；

较佳的，所述故障确定单元 511接收的 OS 10通道上报的消息，包括：所述发生可修复故障的存储单元对应的位图 bitmap ,以及所述可修复故障的错误码。

较佳的，所述记录单元 51用于记录发生可修复故障但修复失败的存储单元的信息时，具体用于：

较佳的，该设备还包括：

BST存储单元，用于将内存的 BST存储至硬盘。

较佳的，所述记录单元 51记录的存储单元的信息对应的存储单元发生的可修复故障，包括：

校验错误，和 /或扇区标志出错。

较佳的，该设备还包括：

写请求处理单元，用于在每次接收到写入数据的请求时，确定将被写入数据的存储单元；查询记录的存储单元的信息对应的存储单元中是否包括所述将被写入数据的存储单元；如果是，删除对所述将被写入数据的存储单元的信息的记录，向所述将被写入数据的存储单元写入数据；否则，向所述将被写入数据的存储单元写入数据。

较佳的，该设备还包括：

指示单元，用于当确定向任一服务器发送数据时，查询记录的存储单元的信息对应的存储单元中是否存储有待发送数据中的部分或全部数据；如果是，向接收方服务器发送指示消息，指示所述待发送数据中的部分或全部数据所存储在的存储单元发生可修复故障但修复失败；否则，向接收方服务器发送所述待发送数据。

较佳的，该设备还包括：

指示接收单元，用于当确定将要接收任一服务器发送的数据时，若接收到发送方服务器指示的部分或全部数据所存储在的发送方服务器的存储单元发生可修复故障但修复失败的消息，则在本地记录与所述部分或全部数据对应的存储单元的信息。

需要说明的是，该实施例的服务器设备是为实现上述步骤 S101 - S102 的，上述的对方法的解释和限定同样适用于本实施例的服务器设备。

参见图 7 ,本发明实施例提供的服务器设备，包括：

处理器 71 ,用于针对至少一个用于存储数据的存储单元，记录发生可修复故障但修复失败的存储单元的信息；在每次接收到读取数据的请求时，查询记录的存储单元的信息对应的存储单元中是否存储有所述数据中的部分或全部数据；如果是，向发送所述请求的请求方返回读取所述数据失败的消息；否则，在存储有所述数据的存储单元中读取所述数据，并反馈给发送所述请求的请求方。

较佳的，所述设备还包括传输模块 72；

所述处理器用于记录发生可修复故障但修复失败的存储单元的信息时，具体用于：

确定本地发生可修复故障的存储单元；

通过所述传输模块 72向其它服务器发送消息，用以请求所述其它服务器读取所述发生可修复故障的存储单元中存储的数据的备份数据；

通过所述传输模块 72接收所述其它服务器返回的消息；

记录所述发生可修复故障的存储单元的信息。

较佳的，所述处理器 71用于确定本地发生可修复故障的存储单元时，具体用于：

接收读取数据的请求；

较佳的，所述处理器 71接收的 OS 10通道上报的消息，包括：所述发生可修复故障的存储单元对应的位图 bitmap ,以及所述可修复故障的错误码。

较佳的，该设备还包括内存 73；

将内存 73的坏分区表 BST中对应于所述发生可修复故障但修复失败的存储单元的比特 bit位设置为 1。

较佳的，该设备还包括硬盘 74；

所述处理器 71还用于将内存 73的 BST存储至硬盘 74。

较佳的，所述处理器 71记录的存储单元的信息对应的存储单元发生的可修复故障，包括：

校验错误，和 /或扇区标志出错。

较佳的，所述处理器 71还用于在每次接收到写入数据的请求时，确定将被写入数据的存储单元；查询记录的存储单元的信息对应的存储单元中是否包括所述将被写入数据的存储单元；如果是，删除对所述将被写入数据的存储单元的信息的记录，向所述将被写入数据的存储单元写入数据；否则，向所述将被写入数据的存储单元写入数据。

较佳的，所述处理器 71还用于当确定向任一服务器发送数据时，查询记录的存储单元的信息对应的存储单元中是否存储有待发送数据中的部分或全部数据；如果是，向接收方服务器发送指示消息，指示所述待发送数据中的部分或全部数据所存储在的存储单元发生可修复故障但修复失败；否则，向接收方服务器发送所述待发送数据。

较佳的，所述处理器 71还用于当确定将要接收任一服务器发送的数据时，若接收到发送方服务器指示的部分或全部数据所存储在的发送方服务器的存储单元发生可修复故障但修复失败的消息，则在本地记录与所述部分或全部数据对应的存储单元的信息。

参见图 8 ,本发明实施例提供的一种分布式存储系统包括：

第一服务器 81 ,用于针对至少一个用于存储数据的存储单元，记录发生可修复故障但修复失败的存储单元的信息；在每次接收到读取数据的请求时，查询记录的存储单元的信息对应的存储单元中是否存储有所述数据中的部分或全部数据；如果是，向发送所述请求的请求方返回读取所述数据失败的消息；否则，在存储有所述数据的存储单元中读取所述数据，并反馈给发送所述请求的请求方。

较佳的，所述系统中，对于每一第一服务器，存在与该第一服务器对应的第二服务器 82；

第一服务器 81用于记录发生可修复故障但修复失败的存储单元的信息时，具体用于：

向第二服务器 82发送消息，用以请求第二服务器 82读取第一服务器 81内发生可修复故障的存储单元中存储的数据的备份数据；

当接收到第二服务器 82在读取所述备份数据失败时返回的消息后，确定所述发生可修复故障的存储单元修复失败；

记录所述发生可修复故障的存储单元的信息。较佳的，第一服务器 81记录的存储单元的信息对应的存储单元发生的可修复故障，包括：校验错误，和 /或扇区标志出错。

较佳的，第一服务器 81还用于：

当确定向任一服务器发送数据时，查询记录的存储单元的信息对应的存储单元中是否存储有待发送数据中的部分或全部数据；如果是，向接收方服务器发送指示消息，指示所述待发送数据中的部分或全部数据所存储在的存储单元发生可修复故障但修复失败；否则，向接收方服务器发送所述待发送数据。

较佳的，第一服务器 81还用于：

当确定将要接收任一服务器发送的数据时，若接收到发送方服务器指示的部分或全部数据所存储在的发送方服务器的存储单元发生可修复故障但修复失败的消息，则在本地记录与所述部分或全部数据对应的存储单元白勺 in磨、o

综上所述，本发明实施例提供了一种存储单元的数据处理方法、设备及系统，改进了存储单元的数据读、写、传输机制，避免了对存储单元数据的重复修复，节省了系统资源，以及，避免了发生故障的存储单元的数据被其它设备使用。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质（包括但不限于磁盘存储器和光学存储器等）上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备（系统 λ 和计算机程序产品的流程图和 /或方框图来描述的。应理解可由计算机程序指令实现流程图和 /或方框图中的每一流程和 /或方框、以及流程图和 /或方框图中的流程和 /或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和 /或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和 /或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和 /或方框图一个方框或多个方框中指定的功能的步骤。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在

Claims

权利要求

1、一种存储单元的数据处理方法，其特征在于，该方法包括：第一服务器针对至少一个用于存储数据的存储单元，记录发生可修复故障但修复失败的存储单元的信息；

所述第一服务器在接收到读取数据的请求时，查询记录的存储单元的信息对应的存储单元中是否存储有所述数据中的部分或全部数据；

如果是，向发送所述请求的请求方返回读取所述数据失败的消息；否则，在存储有所述数据的存储单元中读取所述数据，并反馈给发送所述请求的请求方。

2、如权利要求 1所述的方法，其特征在于，所述第一服务器记录发生可修复故障但修复失败的存储单元的信息，包括：

3、如权利要求 2所述的方法，其特征在于，所述第一服务器通过下述方式确定发生可修复故障的存储单元：

所述第一服务器接收读取数据的请求；

4、如权利要求 3所述的方法，其特征在于，所述 OS 10通道上报的消息，包括：所述发生可修复故障的存储单元对应的位图 bitmap ,以及所述可修复故障的错误码。

5、如权利要求 1所述的方法，其特征在于，所述第一服务器记录发生可修复故障但修复失败的存储单元的信息，包括：

6、如权利要求 5所述的方法，其特征在于，该方法还包括：

所述第一服务器将内存的 BST存储至硬盘。

7、如权利要求 1-6任一权项所述的方法，其特征在于，所述可修复故障，包括：

校验错误，和 /或扇区标志出错。

8、如权利要求 1所述的方法，其特征在于，该方法还包括：

所述第一服务器在每次接收到写入数据的请求时，确定将被写入数据的存储单元的信息；

9、如权利要求 1所述的方法，其特征在于，该方法还包括：

当所述第一服务器确定向任一服务器发送数据时，查询记录的存储单元的信息对应的存储单元中是否存储有待发送数据中的部分或全部数据；如果是，所述第一服务器向接收方服务器发送指示消息，指示所述待发送数据中的部分或全部数据所存储在的存储单元发生可修复故障但修复失败；

10、如权利要求 1所述的方法，其特征在于，该方法还包括：当所述第一服务器确定将要接收任一服务器发送的数据时，若接收到发送方服务器指示的部分或全部数据所存储在的发送方服务器的存储单元发生可修复故障但修复失败的消息，则确定用于存储所述部分或全部数据的存储单元，在本地记录用于存储所述部分或全部数据的存储单元的信息。

11、一种服务器设备，其特征在于，该设备包括：

12、如权利要求 11所述的设备，其特征在于，所述记录单元，包括：故障确定单元，用于确定本地发生可修复故障的存储单元；

消息发送单元，用于向其它服务器发送消息，用以请求所述其它服务器读取所述发生可修复故障的存储单元中存储的数据的备份数据；

消息处理单元，用于当接收到所述其它服务器在读取所述备份数据失败时返回的消息后，确定所述发生可修复故障的存储单元修复失败；

信息记录单元，用于记录所述发生可修复故障的存储单元的信息。

13、如权利要求 12所述的设备，其特征在于，所述故障确定单元具体用于：

接收读取数据的请求；

14、如权利要求 13所述的设备，其特征在于，所述故障确定单元接收的 OS 10通道上报的消息，包括：

15、如权利要求 11所述的设备，其特征在于，所述记录单元用于记录发生可修复故障但修复失败的存储单元的信息时，具体用于：

16、如权利要求 15所述的设备，其特征在于，该设备还包括： BST存储单元，用于将内存的 BST存储至硬盘。

17、如权利要求 11-16任一权项所述的设备，其特征在于，所述记录单元记录的存储单元的信息对应的存储单元发生的可修复故障，包括：

校验错误，和 /或扇区标志出错。

18、如权利要求 11所述的设备，其特征在于，该设备还包括：写请求处理单元，用于在每次接收到写入数据的请求时，确定将被写入数据的存储单元的信息；当确定记录的存储单元的信息中包括所述将被写入数据的存储单元的信息时，删除记录的所述将被写入数据的存储单元的信息；向所述将被写入数据的存储单元写入数据。

19、如权利要求 11所述的设备，其特征在于，该设备还包括：指示单元，用于当确定向任一服务器发送数据时，查询记录的存储单元的信息对应的存储单元中是否存储有待发送数据中的部分或全部数据；如果是，向接收方服务器发送指示消息，指示所述待发送数据中的部分或全部数据所存储在的存储单元发生可修复故障但修复失败；否则，向接收方服务器发送所述待发送数据。

20、如权利要求 11所述的设备，其特征在于，该设备还包括：指示接收单元，用于当确定将要接收任一服务器发送的数据时，若接收到发送方服务器指示的部分或全部数据所存储在的发送方服务器的存储单元发生可修复故障但修复失败的消息，则确定用于存储所述部分或全部数据的存储单元，在本地记录所述用于存储所述部分或全部数据的存储单元的信息。

21、一种分布式存储系统，其特征在于，至少包括：

22、如权利要求 21所述的系统，其特征在于，所述系统中，对于每一第一服务器，存在与该第一服务器对应的第二服务器；

所述第一服务器用于记录发生可修复故障但修复失败的存储单元的信息时，具体用于：

向所述第二服务器发送消息，用以请求所述第二服务器读取所述第一服务器内发生可修复故障的存储单元中存储的数据的备份数据；

记录所述发生可修复故障的存储单元的信息。

23、如权利要求 21或 22所述的系统，其特征在于，所述第一服务器记录的存储单元的信息对应的存储单元发生的可修复故障，包括：

校验错误，和 /或扇区标志出错。

24、如权利要求 21所述的系统，其特征在于，所述第一服务器还用于：当确定向任一服务器发送数据时，查询记录的存储单元的信息对应的存储单元中是否存储有待发送数据中的部分或全部数据；如果是，向接收方服务器发送指示消息，指示所述待发送数据中的部分或全部数据所存储在的存储单元发生可修复故障但修复失败；否则，向接收方服务器发送所述待发送数据。

25、如权利要求 21所述的系统，其特征在于，所述第一服务器还用于：当确定将要接收任一服务器发送的数据时，若接收到发送方服务器指示的部分或全部数据所存储在的发送方服务器的存储单元发生可修复故障但修复失败的消息，则确定用于存储所述部分或全部数据的存储单元，在本地记录用于存储所述部分或全部数据的存储单元的信息。