CN104268031B - 一种用于磁盘阵列存储系统中固态硬盘的擦除码配置方法 - Google Patents

一种用于磁盘阵列存储系统中固态硬盘的擦除码配置方法 Download PDF

Info

Publication number
CN104268031B
CN104268031B CN201410507945.2A CN201410507945A CN104268031B CN 104268031 B CN104268031 B CN 104268031B CN 201410507945 A CN201410507945 A CN 201410507945A CN 104268031 B CN104268031 B CN 104268031B
Authority
CN
China
Prior art keywords
file
data block
solid state
block
hard disc
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410507945.2A
Other languages
English (en)
Other versions
CN104268031A (zh
Inventor
郑烇
谢飞
谢贻富
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei City Cloud Data Center Co ltd
Original Assignee
ANHUI USTC-GZ INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ANHUI USTC-GZ INFORMATION TECHNOLOGY Co Ltd filed Critical ANHUI USTC-GZ INFORMATION TECHNOLOGY Co Ltd
Priority to CN201410507945.2A priority Critical patent/CN104268031B/zh
Publication of CN104268031A publication Critical patent/CN104268031A/zh
Application granted granted Critical
Publication of CN104268031B publication Critical patent/CN104268031B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Detection And Correction Of Errors (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种用于磁盘阵列存储系统中固态硬盘的擦除码配置方法,与现有技术相比解决了数据计算量大、循环次数多的缺陷。本发明包括以下步骤:初始化处理,将一定时间内的请求文件全部集中到固态硬盘的工作负载内,根据索引信息将所有文件按文件的大小进行升序排列;文件的分割与合并,根据预置的自定义阈值,将所有文件进行分割或合并,形成统一标准区块数据块;生成同位数据块,通过标准区块数据块生成同位数据块;新数据写入,将标准区块数据块和同位数据块分别写入相应的数组,并按照文件的分割与合并中重新排列的顺序写入相应的固态硬盘中。本发明减少了固态硬盘写循环操作复杂度,优化可靠性和容错性,改进了擦除码配置策略。

Description

一种用于磁盘阵列存储系统中固态硬盘的擦除码配置方法
技术领域
本发明涉及固态硬盘存储技术领域,具体来说是一种用于磁盘阵列存储系统中固态硬盘的擦除码配置方法。
背景技术
基于闪存的固态盘是一种新型的大容量存储设备,固态硬盘的损耗是影响他们可靠性的主要因素,加速固态硬盘损耗的主要因子是在闪存芯片上实施写循环的数量,而基于固态硬盘的磁盘子系统中写循环的数量则主要取决于RAIDS(Redundant Array OfIndependent Disks,独立磁盘冗余阵列)上应用的擦除码。擦除码在存储系统中用于保护数据免受磁盘错误影响,在这些代码中,n块数据被编码成m块同位数据块和n块数据块的组合,使之可以承受m块差错。这些代码通常应用在有n+2个磁盘子系统的RAIDS中,能够承受任意两个数据块或者同位数据块的并发差错。目前采用的擦除码主要有以下:Reed-Solomon、EVENODD。
1、REED SOLOMON
目前较流行常用的技术,广泛应用在通信和存储系统中。其主要优势在于,它的可扩展性能够恢复m(m>=2)块数据块或者同位数据块。然而这种代码由于伽瓦罗域算术的使用,给编码和解码操作都增加了复杂计算量。伽瓦罗域算术中使用的复杂操作,将表查找引入来减少计算强度。因此,复杂计算是RS的主要缺陷,使得它未能广泛应用于企业应用。
2、EVENODD
其定义矩阵为(p-1)*(p+2),p是质数。数据和同位数据分别存储在相应的前p列和最后2列。使用两个同位磁盘,这样能够承受两块磁盘故障。行校验和对角校验分别由数据块的行和对角经过XOR异或运算后得来。在计算主对角数据块的异或运算时引入一个S调整因数。同样,具有庞大、复杂的计算量。
如何开发出一种计算量少、循环次数低的擦除码配置方法已经成为急需解决的技术问题。
发明内容
本发明的目的是为了解决现有技术中数据计算量大、循环次数多的缺陷,提供一种用于磁盘阵列存储系统中固态硬盘的擦除码配置方法来解决上述问题。
为了实现上述目的,本发明的技术方案如下:
一种用于磁盘阵列存储系统中固态硬盘的擦除码配置方法,包括以下步骤:
初始化处理,将一定时间内的请求文件全部集中到固态硬盘的工作负载内,根据索引信息将所有文件按文件的大小进行升序排列;
文件的分割与合并,根据预置的自定义阈值,将所有文件进行分割或合并,形成统一标准区块数据块;
生成同位数据块,通过标准区块数据块生成同位数据块;
新数据写入,将标准区块数据块和同位数据块分别写入相应的数组,并按照文件的分割与合并中重新排列的顺序写入相应的固态硬盘中。
所述的文件的分割与合并包括以下步骤:
根据固态硬盘闪存所允许的最大缓冲区大小设定自定义阈值;
将所有读入工作负载并且重排索引后的文件集合设为
F={f1,f2,f3,...,fm,fm+1,..,flast};
将所有文件与自定义阈值比较大小,
将大于自定义阈值的文件分割成为标准区块数据,将等于自定义阈值的文件归为标准区块数据,并组合成组Fm
Fm={f1,f2,f3,...,fm},
将小于自定义阈值的文件、分割后小于自定义阈值的文件均合并成为标准区块数据,并组合成组Fr
Fr={fm+1,..,flast},
其中,
所述的生成同位数据块包括以下步骤:
定义同位数据块置于数据表的最后两行,生成两行同位数据行;
针对组Fm和组Fr中的标准区块数据依次计算相应的同位数据块,
设Ca,b表示第a行、第b列的符号,同位数据块Cn-2,i和Cn-1,i的计算公式如下:
其中,i=0、1、···、n-1,<x>n=x mod n。
有益效果
本发明的一种用于磁盘阵列存储系统中固态硬盘的擦除码配置方法,与现有技术相比,能够延长固态硬盘的使用寿命,减少了固态硬盘写循环操作复杂度,优化可靠性和容错性,改进了擦除码配置策略。
通过对文件的重新排序的设计,可以提高I/O效率,在一定时间范围内达到比单次单个处理文件任务更高的工作效率。通过自定义阈值的分割或合并设计,提高了缓冲区负载的利用率。通过新的同位数据块的计算方法,避免了大量不必要的计算量,减少了CPU计算工作的循环数量。
附图说明
图1为本发明的方法流程图
具体实施方式
为使对本发明的结构特征及所达成的功效有更进一步的了解与认识,用以较佳的实施例及附图配合详细的说明,说明如下:
如图1所示,本发明所述的一种用于磁盘阵列存储系统中固态硬盘的擦除码配置方法,包括以下步骤:
第一步,初始化处理,将一定时间内的请求文件全部集中到固态硬盘的工作负载内,根据索引信息将所有文件按文件的大小进行升序排列。将所有待处理文件与指令集中于固态硬盘的工作负载中,成批次进行处理,可以在一定时间范围内达到比单次单个处理文件任务更高的工作效率,按索引信息重新排序是为了后续操作建立更适应的文件列表方便记录相关文件任务信息。
其中,时间的设置根据缓冲区容量大小与文件请求传递速度大小综合考虑确定,集中的过程采用标准令牌桶入栈出栈过程。请求文件集中到工作负载中后,需要提取所有文件的索引信息,索引信息采用标准HASH算法取得文件散列值。根据索引信息将所有文件按文件的大小进行升序排列,当然按照降序排列也可以实现初始化的处理。
第二步,文件的分割与合并,根据预置的自定义阈值,将所有文件进行分割或合并,形成统一标准区块数据块。对工作负载中的文件进行自定义阈值的分块,可以减少读写操作的数量,提高I/O性能和能耗效率。现有技术中的存储系统为实现较高计算性能会消耗大量的能源,大多数读写操作的能耗都体现在对于数据和同位数据的编码与解码过程中。若存储器的工作负载中分配有很多尺寸小于缓冲区大小的小文件,小文件带的读写操作数量会显著增加,CPU编码解码的循环数量则会增加,能耗随之增多。而采用一种自定义阈值的分块设计,将工作负载中的所有文件根据一个设定阈值分组,小于阈值的小文件合并成为标准区块,大于等于阈值的文件分割成为标准区块,标准区块的大小可以契合缓冲区的大小,使之在每次读写操作的过程中放入缓冲区的负载刚好达到最优。其具体步骤如下:
(1)根据固态硬盘闪存所允许的最大缓冲区大小设定自定义阈值,缓冲区大小为硬件的固值,自定义阈值选取为固态硬盘闪存所允许的最大缓冲区大小,这样使得每次读写文件所操作的文件与缓冲区能够处理的文件恰好契合。
(2)将所有读入工作负载并且重排索引后的文件集合设为
F={f1,f2,f3,...,fm,fm+1,..,flast}。
(3)将所有文件与自定义阈值比较大小,将大于自定义阈值的文件分割成为标准区块数据,
将等于自定义阈值的文件归为标准区块数据,并组合成组Fm
Fm={f1,f2,f3,...,fm},
将小于自定义阈值的文件、分割后小于自定义阈值的文件均合并成为标准区块数据,并组合成组Fr
Fr={fm+1,..,flast}。
例如自定义阈值为10K,文件为15K,则将文件分割成10K和5K,10K则为标准区块数据,而分割出的5K,则与其他分割或小于自定义阈值的文件重新组合成10K,合并成为标准区块数据。因此,
第三步,生成同位数据块,通过标准区块数据块生成同位数据块。在此提出新的同位数据块生成方法,代替现有技术的异或计算规则,不必再对比特每个均进行异或操作,而是在整体上对于一定区段的字节进行操作,避免了大量不必要的计算量,减少了CPU计算工作的循环数量,且每一区段的字节进行同位化操作后的同位数据块具有一定特征化结果。其具体步骤如下:
(1)定义同位数据块置于数据表的最后两行,生成两行同位数据行。
(2)针对组Fm和组Fr中的标准区块数据依次计算相应的同位数据块。
设Ca,b表示第a行、第b列的符号,同位数据块Cn-2,i和Cn-1,i的计算公式如下:
其中,i=0、1、···、n-1,<x>n=x mod n。
在本发明中两行同位数据行分别单独得到,n-2行之前的元数据块的每一个数据只会分别影响两行同位数据行中各自的一个数据,因此更新元数据块中的一个元数据只会导致两行同位数据行各自的一个数据的更新,从而具有最优的擦除码计算复杂度。其中针对<x>a进行取模计算,通过取模运算在元数据块的列的方向循环处理,如公式的起始数据列数靠后,后续运算时超出列数,取模后列数转至靠前,这样循环取列数即可覆盖到所有元数据列,保证了具有最优的擦除码覆盖数据平衡度性质。
例如,当n=5时,其为5x5数据阵列,其前三行是元数据,后两行是同位数据,此时i的取值范围是0至n-1,即0到4。
n=5时,公式则变成为:
C3,i=C0,<i+2>5+C1,<i+3>5+C2,<i+4>5
C4,i=C0,<i-2>5+C1,<i-3>5+C2,<i-4>5
其中,i=0、1、2、3、4。
实际计算时i从0到4全部取到并处理为一次完整计算过程,在此以i=1为例,则:
C3,1=C0,<1+2>5+C1,<1+3>5+C2,<1+4>5
C4,1=C0,<1-2>5+C1,<1-3>5+C2,<1-4>5
<x>n进行取模操作后,为:
C3,1=C0,3+C1,4+C2,0
C4,1=C0,4+C1,3+C2,2
其中,C3,1=C0,3+C1,4+C2,0代表着第4行第1列数据是由0行3列、1行4列、2行0列的三个数据计算所得;
同理,C4,1=C0,4+C1,3+C2,2代表着第5行第1列数据是由0行4列、1行3列、2行2列的三个数据计算所得。
第四步,新数据写入,将标准区块数据块和同位数据块分别写入相应的数组,并按照文件的分割与合并中重新排列的顺序写入相应的固态硬盘中。同位数据块根据标准区块数据块计算出来后,与标准区块数据块组合在一起存入固态硬盘中,此部分可以采用现有技术的方法。定义两个数组CH[][]和PARITY[][],将新的元数据块和同位数据块分别被写入RAID存储系统中的数据固态硬盘和同位数据固态硬盘中,再分别按照重排后的顺序依次写入相应的固态硬盘中。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是本发明的原理,在不脱离本发明精神和范围的前提下本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明的范围内。本发明要求的保护范围由所附的权利要求书及其等同物界定。

Claims (1)

1.一种用于磁盘阵列存储系统中固态硬盘的擦除码配置方法,其特征在于,包括以下步骤:
11)初始化处理,将一定时间内的请求文件全部集中到固态硬盘的工作负载内,根据索引信息将所有文件按文件的大小进行升序排列;
12)文件的分割与合并,根据预置的自定义阈值,将所有文件进行分割或合并,形成统一标准区块数据块;其包括以下步骤:
121)根据固态硬盘闪存所允许的最大缓冲区大小设定自定义阈值;
122)将所有读入工作负载并且重排索引后的文件集合设为
F={f1,f2,f3,...,fm,fm+1,..,flast};
123)将所有文件与自定义阈值比较大小,
将大于自定义阈值的文件分割成为标准区块数据,将等于自定义阈值的文件归为标准区块数据,并组合成组Fm
Fm={f1,f2,f3,...,fm},
将小于自定义阈值的文件、分割后小于自定义阈值的文件均合并成为标准区块数据,并组合成组Fr
Fr={fm+1,..,flast},
其中,
13)生成同位数据块,通过标准区块数据块生成同位数据块;其包括以下步骤:
131)定义同位数据块置于数据表的最后两行,生成两行同位数据行;
132)针对组Fm和组Fr中的标准区块数据依次计算相应的同位数据块,
设Ca,b表示第a行、第b列的符号,同位数据块Cn-2,i和Cn-1,i的计算公式如下:
C n - 2 , i = &Sigma; k = 0 n - 3 C k , < i + k + 2 > n
C n - 1 , i = &Sigma; k = 0 n - 3 C k , < i - k - 2 > n ,
其中,i=0、1、···、n-1,<x>n=x mod n;
14)新数据写入,将标准区块数据块和同位数据块分别写入相应的数组,并按照文件的分割与合并中重新排列的顺序写入相应的固态硬盘中。
CN201410507945.2A 2014-09-28 2014-09-28 一种用于磁盘阵列存储系统中固态硬盘的擦除码配置方法 Active CN104268031B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410507945.2A CN104268031B (zh) 2014-09-28 2014-09-28 一种用于磁盘阵列存储系统中固态硬盘的擦除码配置方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410507945.2A CN104268031B (zh) 2014-09-28 2014-09-28 一种用于磁盘阵列存储系统中固态硬盘的擦除码配置方法

Publications (2)

Publication Number Publication Date
CN104268031A CN104268031A (zh) 2015-01-07
CN104268031B true CN104268031B (zh) 2017-07-21

Family

ID=52159554

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410507945.2A Active CN104268031B (zh) 2014-09-28 2014-09-28 一种用于磁盘阵列存储系统中固态硬盘的擦除码配置方法

Country Status (1)

Country Link
CN (1) CN104268031B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105183384B (zh) * 2015-09-10 2018-03-20 浪潮(北京)电子信息产业有限公司 一种直接纠删的实现方法及装置
CN107544760B (zh) * 2017-09-20 2020-10-02 郑州云海信息技术有限公司 一种分布式存储请求的下发方法、装置、设备及存储介质
CN108595988A (zh) * 2018-04-27 2018-09-28 成都信息工程大学 一种可同时加密并容错的硬盘
CN108924205B (zh) * 2018-06-25 2022-09-06 北京旷视科技有限公司 数据传输方法、装置、电子设备、网闸适配器
CN115421649B (zh) * 2022-08-02 2023-10-20 佳源科技股份有限公司 一种可索引、可扩展的参数文件分片存储系统及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101727293A (zh) * 2008-10-23 2010-06-09 成都市华为赛门铁克科技有限公司 一种固态硬盘ssd存储的设置方法、装置和系统
CN103631671A (zh) * 2013-11-19 2014-03-12 无锡众志和达数据计算股份有限公司 一种ssd存储器的数据保护方法及控制器
CN103793666A (zh) * 2014-01-24 2014-05-14 中经云数据存储科技(北京)有限公司 一种数据文件的保护方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9424128B2 (en) * 2011-08-12 2016-08-23 Futurewei Technologies, Inc. Method and apparatus for flexible RAID in SSD
US9417821B2 (en) * 2011-09-30 2016-08-16 Intel Corporation Presentation of direct accessed storage under a logical drive model

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101727293A (zh) * 2008-10-23 2010-06-09 成都市华为赛门铁克科技有限公司 一种固态硬盘ssd存储的设置方法、装置和系统
CN103631671A (zh) * 2013-11-19 2014-03-12 无锡众志和达数据计算股份有限公司 一种ssd存储器的数据保护方法及控制器
CN103793666A (zh) * 2014-01-24 2014-05-14 中经云数据存储科技(北京)有限公司 一种数据文件的保护方法及系统

Also Published As

Publication number Publication date
CN104268031A (zh) 2015-01-07

Similar Documents

Publication Publication Date Title
CN104268031B (zh) 一种用于磁盘阵列存储系统中固态硬盘的擦除码配置方法
US7900118B2 (en) Flash memory system and method for controlling the same
KR102572357B1 (ko) Raid-6 데이터 저장 장치와 이를 포함하는 데이터 처리 시스템
US10817372B2 (en) Systems and methods for ultra fast ECC with parity
CN106874140B (zh) 数据存储方法及装置
CN105353974B (zh) 一种适用于磁盘阵列及分布式存储系统的二容错编码方法
CN108347306B (zh) 分布式存储系统中类局部重构码编码及节点故障修复方法
US20150089328A1 (en) Flex Erasure Coding of Controllers of Primary Hard Disk Drives Controller
CN101281788A (zh) 闪存系统及其控制方法
WO2023151290A1 (zh) 一种数据编码方法、装置、设备及介质
US20120066436A1 (en) Method for performing data shaping, and associated memory device and controller thereof
CN108228382A (zh) 一种针对evenodd码单盘故障的数据恢复方法
CN108712232A (zh) 一种用于连续变量量子密钥分发系统中的多码字并行译码方法
CN104636673B (zh) 一种在大数据背景下的数据安全存储方法
CN113687975A (zh) 数据处理方法、装置、设备及存储介质
JP4988418B2 (ja) 回転する記憶媒体の複数の層にデータを読み書きする方法、プログラム及びデータ記憶装置
JP6491482B2 (ja) 複数のフラッシュ面にわたってコード語をインターリーブするための方法および/または装置
Ivanichkina et al. Mathematical methods and models of improving data storage reliability including those based on finite field theory
CN102354535A (zh) 逻辑单元复用系统
WO2012007715A2 (en) Distributed data storage and recovery
CN112000509B (zh) 一种基于向量指令的纠删码编码方法、系统及装置
Yongmei et al. Large LDPC codes for big data storage
CN113424262B (zh) 一种存储校验方法及装置
CN116501553B (zh) 数据恢复方法、装置、系统、电子设备及存储介质
CN108170554B (zh) 一种nand的数据编码方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20190212

Address after: 230088 Second and Fourth Floors of Zheng Building, Kedao, West Second Road, Yulan Avenue, Hefei High-tech Zone, Anhui Province

Patentee after: HEFEI CITY CLOUD DATA CENTER Co.,Ltd.

Address before: 230088 Zheng Building, Zhongke Dalian, 767 Yulan Avenue, Hefei High-tech Zone, Anhui Province

Patentee before: USTC-GZ INFORMATION TECHNOLOGY CO.,LTD.

EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20150107

Assignee: Anhui Xingtai Financial Leasing Co.,Ltd.

Assignor: HEFEI CITY CLOUD DATA CENTER Co.,Ltd.

Contract record no.: X2021340000013

Denomination of invention: An erasure code configuration method for SSD in RAID storage system

Granted publication date: 20170721

License type: Exclusive License

Record date: 20210609

PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: An erasure code configuration method for SSD in RAID storage system

Effective date of registration: 20210611

Granted publication date: 20170721

Pledgee: Anhui Xingtai Financial Leasing Co.,Ltd.

Pledgor: HEFEI CITY CLOUD DATA CENTER Co.,Ltd.

Registration number: Y2021980004681

PE01 Entry into force of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20230510

Granted publication date: 20170721

Pledgee: Anhui Xingtai Financial Leasing Co.,Ltd.

Pledgor: HEFEI CITY CLOUD DATA CENTER Co.,Ltd.

Registration number: Y2021980004681

EC01 Cancellation of recordation of patent licensing contract
EC01 Cancellation of recordation of patent licensing contract

Assignee: Anhui Xingtai Financial Leasing Co.,Ltd.

Assignor: HEFEI CITY CLOUD DATA CENTER Co.,Ltd.

Contract record no.: X2021340000013

Date of cancellation: 20230512

EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20150107

Assignee: Anhui Xingtai Financial Leasing Co.,Ltd.

Assignor: HEFEI CITY CLOUD DATA CENTER Co.,Ltd.

Contract record no.: X2023980035664

Denomination of invention: An Erasure Code Configuration Method for Solid State Disk in RAID Storage System

Granted publication date: 20170721

License type: Exclusive License

Record date: 20230523

PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: An Erasure Code Configuration Method for Solid State Disk in RAID Storage System

Effective date of registration: 20230526

Granted publication date: 20170721

Pledgee: Anhui Xingtai Financial Leasing Co.,Ltd.

Pledgor: HEFEI CITY CLOUD DATA CENTER Co.,Ltd.

Registration number: Y2023980041856