WO2023246240A1

WO2023246240A1 - 一种数据重构方法及装置

Info

Publication number: WO2023246240A1
Application number: PCT/CN2023/087558
Authority: WO
Inventors: 蒲贵友
Original assignee: 华为技术有限公司
Priority date: 2022-06-20
Filing date: 2023-04-11
Publication date: 2023-12-28
Also published as: CN117270758A

Abstract

本发明提供一种数据重构方法，包括获取数据保护组中损坏的块的副本；基于损坏的块的副本恢复数据保护组中损坏的块；其中，数据保护组中的块使用纠删码EC算法或独立磁盘冗余阵列RAID保护。本发明提供的数据重构方法，通过副本对数据保护组中损坏的坏进行重构(例如垃圾回收操作残留的垃圾数据)，节省了计算资源，提高了数据重构的效率。

Description

一种数据重构方法及装置

技术领域

本发明涉及数据存储技术领域，尤其涉及一种数据重构方法及装置。

背景技术

独立冗余磁盘阵列(redundant array of independent disks，RAID)是存储领域里边广泛使用的提升存储介质可靠性能力的基础技术，既被广泛用于存储阵列，也被用于固态硬盘(solid state drive，SSD)内，属于存储的基础技术之一。

RAID的基础原理为，通过使用额外的校验块存放，在数据块发生故障时，利用未损坏的数据块和校验块，通过RAID算法计算出损坏列的数据块，从而实现损坏的数据块的修复，并将恢复出来的数据块写入空闲的存储空间。如图1所示，数据块D₀,D₁…D_n,对应的校验块为P。数据块D₀,D₁…D_n和校验块P构成一个RAID数据保护组。当数据块,D₁损坏，可以通过RAID算法根据D₀,…D_n和校验块P计算出D₁，并将计算出来的D₁存储到热备存储空间。

基于RAID的基本原理，数据块的数量为N，校验块的数量为M，要重构一个损坏的数据块，至少需要从RAID中读取N个块，才能计算出损坏的数据块。

现在存储阵列中RAID对应的数据块的数量达到20，甚至已经超过100。而SSD盘内的RAID对应的数据块的数量也通常达到60，甚至超过128。

现有技术，使用RAID恢复损坏的数据块，需要涉及大量的数据计算，从而消耗了大量的计算资源，同时数据恢复效率低。

发明内容

本发明的实施例提供一种数据重构方法及装置，可以降低数据保护组(例如RAID组)中数据重构所读取和处理的数据规模，节省了计算资源，提高了数据重构的效率。

第一方面，本发明实施例提供了一种数据重构方法，包括获取数据保护组中损坏的块的副本；基于损坏的块的副本恢复数据保护组中损坏的块；其中，数据保护组中的块使用纠删码(Erasure Coding,EC)算法或独立磁盘冗余阵列RAID保护。

本发明实施例提供的数据重构方法，通过副本对数据保护组中损坏的块进行重构，相比于现有的数据保护组(例如背景技术中提及的RAID保护)中损坏的块的重构要读取N倍的数据，本发明实施例通过副本重构只需读取1倍数据量处理，节省了计算资源，提高了数据重构的效率。

在一个可能的实现中，上述提及的损坏的块为垃圾回收(garbage collection，GC)操作搬移有效数据生成的块；所述损坏的块的副本为所述垃圾回收操作完成有效数据搬移后，将搬移前所述损坏的块所在的存储位置存储的块标记为无效的块。

也就是说，利用GC操作产生的无效数据(也可称之为垃圾数据)，即将搬移前损坏的块所在的存储位置存储的块作为副本，对损坏的块进行数据重构。而大多数存储系统多采用追加写的方式写入数据，在采用追加写的存储系统中均会存在GC以实现空间整理，存储系统中会存在大量因GC操作而残留存在的垃圾数据，因此，可以将GC产生的垃圾数据作为损坏的块的副本对数据保护组中损坏的块进行数据重建。

为了支持垃圾回收GC的有效运行，存储系统会在存储数据的同时，存放反向描述信息，可以利用该反向描述信息实现对副本的获取。例如获取损坏的块的反向描述信息，该反向描述信息包括损坏块的逻辑区块地址(logical block address，LBA)信息；读取数据保护组中未损坏的块的反向描述信息，得到数据保护组中各个数据块对应的逻辑区块地址信息；基于逻辑区块地址信息，将损坏的块与未损坏的块进行匹配；将匹配成功的数据块作为损坏的块的副本。

在一个可能的实现中，反向描述信息还包括数据块的校验信息，该校验信息用于校验数据块的正确性；损坏的块与未损坏的块的匹配结果还与校验信息相关。例如，当损坏的块的逻辑区块地址和校验信息与未损坏的块的逻辑区块地址和校验信息都相同的情况下，才能确定两个数据块匹配成功，进而确定未损坏的块可以作为损坏的块的副本，以保证数据块的正确性。

副本的来源可以有多种，可选的，副本可以是GC操作残留的垃圾数据、还有可能是预取等产生的数据，例如存储系统缓存数据、系统分级存储搬移带来的副本。例如，预取或缓存是将数据按照一定规则预先读取出来，放在某些高速缓存上产生的副本，而分级存储也类似，会根据数据冷热进行数据存放在不同的速度介质上，此时删除也会不及时，进而有副本的存在。

在另一个可能的实现中，本发明实施例提供的数据重构方法还包括：获取存储系统中各个块损坏的概率；将垃圾回收操作配置为，将执行垃圾操作的有效数据块搬移至发生故障的概率最高或发生故障的概率大于预设阈值的存储地址中。也就是说，调整GC算法，将GC搬移的数据写入更易损坏的存储地址中，这样当块损坏时，可以有大量的GC残留的副本用于重构，节省了计算资源，提高了数据重构的效率。

在另一个可能的实现中，本发明实施例提供的数据重构方法还包括：当损坏的块不存在副本时，则根据传统的RAID重构方法，对损坏的块进行重构。

在一个示例中，数据保护组中的块为同一块硬盘中的块，也就是说，数据保护组在同一硬盘中实现，例如，SSD盘内采用EC或RAID保护实现对数据的保护。

在另一个示例中，数据保护组中的块为存储系统中的块。换言之，数据保护组不限于在同一硬盘中实现，例如，存储系统，例如存储阵列或分布式存储系统，采用EC或RAID保护实现对数据的保护。

在一个示例中，本发明实施例提供的数据重构方法可以应用于SSD，并且SSD内应用了RAID或EC技术在SSD内部提供数据保护组，数据保护组中的块分布在SSD不同通道(Channel)或不同闪存颗粒(DIE)上的物理块(Block)上。

第二方面，本发明实施例还提供一种数据重构装置，包括获取模块和重构模块，其中获取模块用于获取数据保护组中损坏的块的副本；重构模块用于基于损坏的块的副本恢复数据保护组中损坏的块；其中，数据保护组中的块使用纠删码EC算法或独立磁盘冗余阵列RAID保护。

在另一个可能的实现中，上述提及的损坏的块为垃圾回收(garbage collection，GC)操作搬移有效数据生成的块；所述损坏的块的副本为所述垃圾回收操作完成有效数据搬移后，将搬移前所述损坏的块所在的存储位置存储的块标记为无效的块。

在另一个可能的实现中，损坏的块的副本为损坏的块在缓存中的副本或损坏的块在分级存储操作产生的块。

在另一个可能的实现中，数据保护组中的块为同一块硬盘中的块。

在另一个可能的实现中，数据保护组中的块为存储系统中的块。

在另一个可能的实现中，存储系统采用追加写的方式写入数据。

在另一个可能的实现中，本发明实施例提供的数据重构装置还包括校验模块，该校验模块用于对损坏的块的副本进行校验。

在另一个可能的实现中，获取模块具体用于：获取损坏的块的反向描述信息；反向描述信息包含损坏的块的逻辑地址；根据逻辑地址确定损坏的块的副本。

第三方面，本发明提供了一种数据处理设备，包括接口和处理器，所述接口与处理器通信连接，所述处理器用于实现本发明第一方面提供的方法。

第四方面，本发明提供了一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行本发明第一方面提供的方法。

第五方面，本发明提供了一种计算机程序或计算机程序产品，所述计算机程序或计算机程序产品包括指令，当所述指令被执行时，实现本发明第一方面提供的方法。

附图说明

图1传统RAID重构的方法的示意图；

图2示出了一种存储系统的结构示意图；

图3示出了一种SSD的结构示意图；

图4示出了SSD中一种数据存放示意图；

图5为本发明实施例一种数据重构示意图；

图6为本发明实施例提供的数据重构装置的结构示意图；

图7为本发明实施例提供的一种数据处理设备的结构示意图。

具体实施方式

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

为了实现存储数据的可靠性，存储系统通常会使用RAID或纠删码(Erasure Coding,EC)技术对数据进行保护，例如，在数据存储时，按照RAID或EC算法对数据进行分块，将每个数据块存储到不同的存储介质块上，并对这些数据块计算得到校验块，从而对这些数据块进行有效保护，数据块和校验块组成一个RAID组或EC组，统称为数据保护组，数据块和校验块统称为块。这样可以保证部分存储介质块出现故障或其他原因导致数据块损坏时，基于RAID或EC算法可以通过数据保护组中未损坏的块进行运算得到损坏的块。

针对此问题，本发明实施例提供一种数据重构方法，尤其可以应用于存储系统或硬盘，本发明实施例中的数据保护组可以基于RAID技术，例如RAID5、RAID6等。本发明实施例的数据保护组还可以基于EC技术。本发明实施例以数据保护组为RAID组为例，应用于存储系统为例进行说明。本发明实施例中的存储系统可以是存储阵列，也可以是分布式存储，本发明实施例对此不作限定。本发明实施例中，当一个数据保护组，即一个RAID组中数据块损坏时，不按照传统的RAID重构的方式，利用RAID组中其他未损坏的块计算出损坏的数据块。而是利于存储系统中存在的损坏的数据块的副本，读取该副本实现数据重构，降低了RAID重构所读取和处理的数据规模，节省了计算资源，提高了重构效率。

图2示出了一种存储系统的结构示意图。如图2所示，该RAID存储系统包括处理器和接口。接口可以是物理接口卡，处理器与接口通信。处理器可以是中央处理器(Central Processing Unit,CPU)，或者其他硬件处理能力的器件，例如RAID卡、数据处理单元(Data Processing Unit,DPU)等。存储系统中包含一个或多个RAID组，每个RAID组中包含多个块，例如N个数据块以及N个数据块的M个校验块。

当RAID组中有损坏的块时，例如数据块A发生损坏，存储系统获取数据块A的副本。在本发明实施例中，数据块A的副本可以是存储系统进行垃圾回收操作时，将数据块A作为有效数据搬移到新的存储位置，垃圾回收操作完成数据块A搬移后，将搬移前数据块A所在的存储位置存储的数据块A标记为无效，即数据块A搬移前的块。由于垃圾回收操作中，数据被标记为无效数据后，并不是立即进行擦除或覆盖，所以数据块A搬移前对应的块作为数据块A的副本。本发明另一实现方式中，数据块A的副本还可以为缓存中数据块A。本发明另一实施方式中，数据块A的副本还可以为数据块A在分级存储操作产生的块，例如数据块A从第一性能存储层迁移到第二性能存储层后，数据块A发生损坏，则在第一性能存储层的数据块A在没有被删除前，作为数据块A的副本。

本发明实施例提及的RAID组还可以在硬盘中实现，例如SSD中，下面介绍RAID组在SSD中实现时，RAID组中有块损坏时，对损坏的块进行重构的具体实现。

图3示出了一种SSD的结构示意图。如图3所示，SSD中包括控制器和多个物理块，多个物理块例如图3中的物理块1、物理块2、物理块3…物理块N。控制器与多个物理块通信连接，控制多个物理块的数据读写等操作。控制器采用RAID技术将多个物理块组成RAID组，即数据保护组，每个RAID组包括多个块，例如N个数据块以及N个数据块对应的M个校验块。

当RAID组中有损坏的块时，例如数据块A发生损坏，SSD获取数据块A的副本。在本发明实施例中，数据块A的副本可以是SSD进行垃圾回收操作时，将数据块A作为有效数据搬移到新的存储位置，垃圾回收操作完成数据块A搬移后，将搬移前存储位置存储的数据块A标记为无效的块，即数据块A搬移前的块。由于垃圾回收操作中，数据被标记为无效后，并不是立即进行擦除，所以数据块A搬移前对应的块作为数据块A的副本。本发明另一实现方式中，数据块A的副本还可以为缓存中数据块A，可以是SSD缓存中的块，还可以是存储系统中其他位置缓存的数据块A。本发明另一实施方式中，数据块A的副本还可以为数据块A在分级存储操作产生的块，例如数据块A从第一性能存储层迁移到第二性能存储层后，数据块A发生损坏，则在第一性能存储层的数据块A在没有被删除前，作为数据块A的副本。

针对不同来源的副本，可以通过不同的方法获取。例如，针对缓存或分级存储来源的副本，可以通过损坏的块的元数据，然后根据该元数据的信息获取损坏的块的副本。数据块的元数据中记载有数据块的物理地址信息以及数据块的缓存/分级存储地址信息，控制器根据数据块的缓存/分级存储地址信息读取数据块的副本。

针对垃圾回收产生的副本，可以通过获取损坏的块的反向描述信息的方式来获取损坏的块的副本。

SSD内部由于采用追加写方式写入数据，需要进行垃圾回收操作以对数据进行整理。而SSD内部一般具有约15％左右的超配空间，同时SSD一般不会完全写满，大部分写入数据约在80％左右。所以在SSD盘内具有大量以未擦除的垃圾形式存在于盘内的数据。同时SSD盘内一般写入放大在3左右，主要由盘内垃圾回收引起，这也反应了较多的数据副本的存证。因此，可以利用垃圾回收产生的垃圾数据块作为损坏的块的副本，来进行损坏的块的重构。

需要说明的是，本发明实施例将SSD执行垃圾回收操作，将物理块中的有效数据块搬移到新的存储位置后，残留在物理块中未擦除的数据块称之为垃圾数据块。当SSD执行垃圾回收操作搬移的有效数据块出现损坏时，垃圾操作产生的垃圾数据块可以作为损坏的有效数据块的副本。

同时，SSD盘为了有效支撑自身的垃圾回收运行，在存储数据时，会存放反向描述信息，来支撑自己对数据搬移以及正确性的判断。如图3所示，通常这些反向描述信息固定存放于 SSD物理块的尾部。反向描述信息包括物理块中各个数据块的反向映射信息和校验信息，利用这些信息，则可以对垃圾数据块是否和某块数据对应，以及数据是否正确做出判断，从而保证数据的正确性。例如，反向映射信息包括数据物理地址和逻辑块地址(Logical Block Address,LBA)的映射，通过反向映射信息，可以识别存储在物理地址上的数据对应的LBA。这些反向描述是另一种形式存在的盘上元数据，通常SSD的元数据占比＜存储数据容量的1％，整体占比较少。

图4示出了SSD盘中一种数据存放示意图。如图4所示，SSD盘中包括多个物理块，例如物理块1、物理块2、物理块3、物理块4和物理块5，多个物理块组成RAID组，其中物理块1、物理块2、物理块3、物理块4中存储数据块，物理块5中存储校验块。例如，在垃圾回收操作过程中，物理块6中的数据块A被搬移到物理块3中，SSD将物理块6中的数据块A标记为无效。在垃圾回收操作中，被标记为无效的数据块不会被立刻擦除，因此物理块6中的数据块存在一个在物理块3中的数据块副本。

图5为利用被标记为无效的数据块进行数据重构的示意图。在图5中，当物理块3中的数据块A损坏，利用物理块6中的数据块A恢复物理块3中的数据块A。如图5所示，当物理块3中的数据块A损坏时，获取物理块6中被标记为无效的数据块A作为物理块3中存储的数据块A的副本，基于该副本对物理块3中的损坏的块进行重构，从而避免使用RAID算法进行重构计算，节省了计算资源，提高了数据重构效率。

具体的，在物理块中存储的数据块发生故障，可以获取数据块的反向描述信息。如果反向描述信息丢失，因为反向描述信息的数据量小，可以使用RAID算法对反向描述信息进行恢复，从而根据反向描述信息确定损坏的数据块的LBA。

读取其他物理块的反向描述信息，得到其他物理块中存储的各个数据块的LBA，并与损坏的数据块对应的LBA进行匹配，当两个数据块的LBA相同时，确定两个数据块匹配，记录匹配成功的数据块的位置，包括匹配成功的损坏的数据块的位置以及未损坏的数据块的位置，根据该位置信息读取得到损坏的数据块的副本。

在另一个示例中，反向描述信息还包括物理块中存储的各个数据块的校验信息，例如循环冗余校验(cyclic redundancy check，CRC)。

在该示例中，获取数据块的副本的过程包括，读取物理块中损坏的各个数据块的LBA和CRC，并将这些信息建立表格或其他组织形式，以LBA为索引进行存放，便于后续匹配比对。

读取其他物理块的反向描述信息，得到未损坏的各个数据块的LBA和CRC，并与损坏的数据块对应的索引信息进行匹配，当两个数据块的LBA和CRC都相同时，确定两个数据块匹配，记录匹配成功的数据块的位置，包括损坏的数据块的位置以及未损坏的数据块的位置，根据该位置信息读取得到损坏的数据块的副本，以及该数据块的CRC，根据该CRC校验数据块的正确性，验证通过，则将该数据块作为副本对损坏的数据块进行恢复。

为了进一步提升数据重构的效率，在另一个示例中，本发明实施例提供的数据重构方法还包括，获取各个物理块发生故障的概率；将垃圾回收操作配置为，将执行垃圾操作的数据块搬移至于发生故障的概率最高或发生故障的概率大于预设阈值的物理块中。

例如，对于SSD的故障进行分析预测，得到SSD中大概率会发生故障的物理块。比如根据自我检测、分析和报告技术(self-monitoring analysis and reporting technology，SMART)预测SSD盘内的各个介质发生故障的概率，将发生故障的概率大于预设阈值的或者发生故障的概率最大的物理块作为目标物理块，调整SSD的垃圾回收算法，将垃圾回收搬移的数据块写入该目标物理块中。如此，当SSD发生故障大概率是在该目标物理块中，当其发生故障时，需要对该物理块中的数据块进行重构时，可以有大量的垃圾回收残留的无效数据块可以作为副本，进一步提升数据重构的效率。

针对EC算法实现保护的数据保护组，对损坏的块的重构方法与RAID保护的数据保护组中的损坏的块的重构方法类似，同样是对损坏的块先获取其对应的副本，利用该副本恢复损坏的块这里不再赘述。

本发明实施例上述方法还可以应用在服务器或者云服务提供的设备，本发明实施例对此不作限定。

与前述的数据重构方法的实施例基于相同的构思，本发明实施例中还提供了一种数据重构装置600，该数据重构装置600包括用以实现上文提及的数据重构方法中的各个步骤的单元或模块。

图6为本发明实施例提供的数据重构装置的结构示意图。

如图6所示，该数据重构装置600至少包括获取模块601和重构模块602，其中获取模块601用于获取数据保护组中损坏的块的副本；重构模块602用于基于损坏的块的副本恢复数据保护组中损坏的块；其中，数据保护组中的块使用纠删码EC算法或独立磁盘冗余阵列RAID保护。

在另一个可能的实现中，上述提及的损坏的块为GC操作搬移有效数据生成的块；所述损坏的块的副本为所述垃圾回收操作完成有效数据搬移后，将搬移前损坏的块所在的存储位置存储的块标记为无效的块。

在另一个可能的实现中，本发明实施例提供的数据重构装置600还包括配置模块604，将垃圾回收操作配置为，将执行垃圾操作的数据块搬移至于发生故障的概率最高或发生故障的概率大于预设阈值的块中。也就是说，调整GC算法，将GC搬移的数据写入更易损坏的块中，这样当块损坏时，可以有大量的GC残留的副本进行重构，节省了计算资源，提高了数据重构的效率。

根据本发明实施例的数据重构装置600可对应于执行本发明实施例中描述的方法，并且数据重构装置600中的各个模块的上述和其它操作和/或功能分别为了实现上文提及的数据重构方法，具体实现可以参考上文描述，为了简洁，在此不再赘述。

其中一种实现，图6实施例提供的数据重构装置可以由图2所示的存储系统的处理器执行。另一种实现，数据重构装置可以由硬盘的控制器执行，其中，硬盘包含控制器和存储介质，控制器与存储介质通信。图2所示的存储系统可以由存储阵列，也可以是分布式存储系统，本发明实施例对此不作限定。

与前述的方法的实施例基于相同的构思，本发明实施例中还提供了一种数据处理设备，该电子设备至少包括处理器和接口，处理器执行程序，可以实现上文提及的数据重构方法。

图7为本发明实施例提供的一种数据处理设备的结构示意图。

如图7所示，所述数据处理设备700包括至少一个处理器701和接口702。其中，处理器701和接口702通信连接，可以通过总线的方式实现通信连接，该接口702用于接收其他设备发送的数据(例如上层应用发送的IO数据)；处理器701执行前述方法实施例中的方法。

应理解，在本发明实施例中，该处理器701可以是中央处理单元CPU，该处理器701还可以是其他通用处理器、数字信号处理器(digital signal processor，DSP)、专用集成电路(application specific integrated circuit，ASIC)、现场可编程门阵列(field programmable gate array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者是任何常规的处理器等。

图7所示的数据处理设备可以是硬盘、存储系统、服务器或者云服务提供的设备。其中，存储系统可以是存储阵列或服务器。

应理解，根据本发明实施例的数据设备700可以执行实现本发明实施例提及的方法，该方法实现的详细描述参见上文，为了简洁，在此不再赘述。

本发明的实施例提供了一种计算机可读存储介质，其上存储有计算机程序，当所述计算机指令在被处理器执行时，使得上文提及的方法被实现。

本发明的实施例提供了一种芯片，该芯片包括至少一个处理器和接口，所述至少一个处理器通过所述接口确定程序指令或者数据；该至少一个处理器用于执行所述程序指令，以实现上文提及的方法。

本发明的实施例提供了一种计算机程序或计算机程序产品，该计算机程序或计算机程序产品包括指令，当该指令执行时，令计算机执行上文提及的方法。

本领域普通技术人员应该还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执轨道，取决于技术方案的特定应用和设计约束条件。本领域普通技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执轨道的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

一种数据重构方法，其特征在于，所述方法包括：

获取数据保护组中损坏的块的副本；

基于所述损坏的块的副本恢复所述数据保护组中损坏的块；其中，数据保护组中的块使用纠删码EC算法或独立磁盘冗余阵列RAID保护。
根据权利要求1所述的方法，其特征在于，所述损坏的块为垃圾回收操作搬移有效数据生成的块；所述损坏的块的副本为所述垃圾回收操作完成有效数据搬移后，将搬移前所述损坏的块所在的存储位置存储的块标记为无效的块。
根据权利要求1所述的方法，其特征在于，所述损坏的块的副本为所述损坏的块在缓存中的副本或所述损坏的块在分级存储操作产生的块。
根据权利要求1至3任一所述的方法，其特征在于，所述数据保护组中的块为同一块硬盘中的块。
根据权利要求1至3任一所述的方法，其特征在于，所述数据保护组中的块为存储系统中的块。
根据权利要求5所述的方法，其特征在于，所述存储系统采用追加写的方式写入数据。
根据权利要求1至3任一所述的方法，其特征在于，所述方法还包括：对所述损坏的块的副本进行校验。
根据权利要求1至3任一所述的方法，其特征在于，获取数据保护组中损坏的块的副本，具体包括：

获取所述损坏的块的反向描述信息；所述反向描述信息包含所述损坏的块的逻辑地址；

根据所述逻辑地址确定所述损坏的块的副本。
一种数据重构装置，其特征在于，包括：

获取模块，用于获取数据保护组中损坏的块的副本；

重构模块，用于基于所述损坏的块的副本恢复所述数据保护组中损坏的块；其中，数据保护组中的块使用纠删码EC算法或独立磁盘冗余阵列RAID保护。
根据权利要求9所述的装置，其特征在于，所述损坏的块为垃圾回收操作搬移有效数据生成的块；所述损坏的块的副本为所述垃圾回收操作完成有效数据搬移后，将搬移前所述损坏的块所在的存储位置存储的块标记为无效的块。
根据权利要求9所述的装置，其特征在于，所述损坏的块的副本为所述损坏的块在缓存中的副本或所述损坏的块在分级存储操作产生的块。
根据权利要求9至11任一项所述的装置，其特征在于，所述数据保护组中的块为同一块硬盘中的块。
根据权利要求9至11任一项所述的装置，其特征在于所述数据保护组中的块为存储系统中的块。
根据权利要求13所述的装置，其特征在于，所述存储系统采用追加写的方式写入数据。
根据权利要求9至11任一项所述的装置，其特征在于，还包括：

校验模块，用于对所述损坏的块的副本进行校验。
根据权利要求9至11任一项所述的装置，其特征在于，所述获取模块具体用于：

获取所述损坏的块的反向描述信息；所述反向描述信息包含所述损坏的块的逻辑地址；

根据所述逻辑地址确定所述损坏的块的副本。
一种数据处理设备，包括接口和处理器，其特征在于，所述接口与所述处理器通信连接，所述处理器用于实现权利要求1至8任一项所述的方法。
一种计算机可读存储介质，其上存储有计算机程序，其特征在于，当所述计算机程序在计算机中执行时，令计算机执行权利要求1至8任一项所述的方法。