CN1783342A - 用于使用wmrm存储器实现可靠的worm存储器的系统和方法 - Google Patents

用于使用wmrm存储器实现可靠的worm存储器的系统和方法 Download PDF

Info

Publication number
CN1783342A
CN1783342A CN200510116085.0A CN200510116085A CN1783342A CN 1783342 A CN1783342 A CN 1783342A CN 200510116085 A CN200510116085 A CN 200510116085A CN 1783342 A CN1783342 A CN 1783342A
Authority
CN
China
Prior art keywords
state
data
write
physical block
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200510116085.0A
Other languages
English (en)
Other versions
CN1783342B (zh
Inventor
许为善
翁绍基
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN1783342A publication Critical patent/CN1783342A/zh
Application granted granted Critical
Publication of CN1783342B publication Critical patent/CN1783342B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • G06F3/064Management of blocks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1076Parity data used in redundant arrays of independent storages, e.g. in RAID systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/062Securing storage systems
    • G06F3/0623Securing storage systems in relation to content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • G06F3/0637Permissions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0673Single storage device
    • G06F3/0674Disk device
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/32Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on separate auxiliary tracks of the same or an auxiliary record carrier
    • G11B27/322Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on separate auxiliary tracks of the same or an auxiliary record carrier used signal is digitally coded
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/21Disc-shaped record carriers characterised in that the disc is of read-only, rewritable, or recordable type
    • G11B2220/211Discs having both read-only and rewritable or recordable areas containing application data; Partial ROM media

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

本发明提供了一种用于确保存储在可重写存储器上的数据不可改变的方法。所述方法包括把存储器的选定的用户可寻址块初始化为可写状态。另外,所述方法包括接受将存储在指定用户可寻址块中的数据。所述方法还包括确定所指定的块是否是可写的。所述方法还包括把所接受的数据存储至可重写存储器。此外,所述方法包括把指定块的状态设置为不可写。在一个实施例中,与每个块相关联的可写/不可写状态被编码并且存储在相应块的内容中。在另一个实施例中,确定指定块是否是可写的、把所接受的数据存储至可重写存储器并且把指定块的状态设置为不可写的步骤被集成并且是不可分割的。

Description

用于使用WMRM存储器实现 可靠的WORM存储器的系统和方法
技术领域
本发明涉及一种用于加强WMRM存储器上的WORM属性的新的存储方法和系统。
背景技术
随着关键数据被越发地以电子形式加以存储,以防干扰方式可靠地存储数据是至关重要的。此外,电子数据的不断发展的子集(例如,电子邮件、瞬时消息、药品开发记录、病历)遵守用于管理其长期保留和可利用性的规章。最近,大型公营公司的备受瞩目的责任发布已经进一步导致诸如证券交易委员会(Securities and ExchangeCommission,SEC)之类的规范主体使他们的规章变得更严。举例来说,SEC的新细则17a-4(Rule 17a-4)(2003年5月生效)规定了对电子邮件、附件、备忘录以及瞬时消息传送(messaging)连同常规电话会话的存储要求。在许多这种规章中,关键的要求在于必须把数据可靠地存储在不可擦除的、不可重写的存储器中,从而使得一旦写入数据,它就无法被改变或改写。与可以多次写入的WMRM(多写多读,Write-Many Read-Many)存储器相反,这种不可重写的存储器通常被称为WORM(一写多读,Write-Once Read-Many)存储器。
传统上,WORM存储器是通过使用光学手段在存储介质(例如,WORM光盘、CD-R、DVD-R)中引起不可逆的改变来实现的。由于市场力量以及物理和/或技术限制,WORM光存储器没有得到非常大的改进,并且在性能和/或存储密度方面不可能有非常大的改进。组织机构由此必须把他们的迅速增长的大量关键记录存储在越来越多的大量WORM光盘上。管理这么大量的盘是繁重的、耗时的、易于出错的并且是昂贵的过程。更重要的是,与数据发现请求有关的记录无法容易地被定位在这种系统中,并且无法以及时的方式来递送。
WORM光存储器的最近介绍的替代方式是WORM磁带。所述WORM磁带速度慢,并且不允许对数据的直接随机存取。而是必须顺序地附加并且读取数据。虽然一次性写入的(基准)数据有时被认为是很少读取或者从不读取,但是存在许多读取性能出现问题的情况。此外,当数据的发现请求到达时,需要数据是易于访问的,取决于应用以随机或是顺序方式进行访问。
WORM光存储器的另一替代方式是内容可寻址的存储器(CAS)。CAS通过把数据存储在由正在写入的数据唯一确定的位置处来实现一次性写入存储器的效果。然而,这种系统需要新的存储器接口,并且需要彻底改变应用程序和系统软件来谨慎地跟踪和管理写入数据的位置。
发明内容
根据本发明,提供了一种用于确保存储在可重写存储器上的数据不可改变的方法。所述方法包括把存储器的选定的用户可寻址块初始化为可写状态。另外,所述方法包括接受将存储在指定的用户可寻址块中的数据。所述方法还包括确定所指定的块是否是可写的。所述方法还包括把所接受的数据存储至可重写存储器。此外,所述方法包括把指定块的状态设置为不可写。在一个实施例中,与每个块相关联的可写/不可写状态被编码并且存储在相应块的内容中。在另一个实施例中,确定指定块是否是可写的、把所接受的数据存储至可重写存储器并且把指定块的状态设置为不可写的步骤被集成并且是不可分割的。
附图说明
图1是示出了在WMRM存储器系统上提供WORM属性的方法的流程图。
图2是示出了在WMRM存储器系统上提供WORM属性的方法的流程图,其中状态信息被编码并且被存储在数据中。
图3是示出了把状态测试和状态更新机制与数据存储操作集成以便只要成功地写入数据就无法改写它的方法的流程图。
图4A是示出了存储位置以及将在该存储位置存储的已接收数据的先前内容的合成数学函数的采样分解的图。
图4B是示出了存储位置以及将在该存储位置存储的已接收数据的先前内容的合成数学函数的采样实现方式的图。
图5A是示出了使用NAND门或者ALU运算的三输入端多数门(majority gate)的图。
图5B是示出了使用AND/OR门或者ALU运算的三输入端多数门(majority gate)的图。
图6是与三输入端多数门相关联的真值表。
图7是举例说明本发明的示例性实施例的图。
具体实施方式
将本发明主要作为用于使用WMRM存储器来实现可靠的WORM存储器的系统和方法来加以描述。在随后的描述中,为了说明的目的,提出了很多具体细节,以便提供对本发明的彻底的了解。然而,对于本领域中的普通技术人员来说显然本发明可以在没有这些具体细节的情况下来实施。
本领域技术人员将意识到的是,包括CPU、存储器、I/O、程序存储器、连接总线以及其它适当部件的诸如数据处理系统之类的设备可以被编程或者被设计成能够易于本发明的实施。这种系统往往包括适当的程序装置用于执行本发明的操作。
诸如预先记录的盘或者其它供数据处理系统使用的类似计算机程序产品的制造物可以包括存储介质和记录在其上的程序装置,用于引导数据处理系统易于实施本发明的方法。这种设备和制造物也落入本发明的精神和范围。
本发明提供了成本有效的WORM存储器,其提供了高的存储密度和良好的性能。本发明通过用于可靠地加强WMRM存储器上的WORM属性的系统和方法解决了这种需要,该系统和方法是快速的、密集的并且迅速改善的。
图1是举例说明用于在WMRM存储器系统上提供WORM属性的方法10的流程图。在块12,方法10开始。
在块14,对存储器系统的状态进行初始化。所述初始化提供对存储器系统状态的初始化,以便使存储器的每一块是可写的,或者使存储器的某些指定块是可写的。
在块16,接收要存储在存储器系统中的数据。
在块18,对存储器系统内的将要存储数据的目标地址进行识别。
在块20,就目标地址是否可写进行判断。如果不是,那么在块22返回故障。如果是,那么在块24,把所接收的数据写入目标地址。
在块26,向其写入所接收数据的目标地址的状态被更新为不可写。
在块28,返回用于确认成功写入所接收数据的消息。
在块30,方法10结束。
在一个实施例中,方法10还包括额外的步骤,借此将已更新的状态和/或数据写入读回并且对其进行验证以便确保已经成功地存储了它们。如果检测到偏差,那么系统重试相应的操作并且重新验证是否已经成功执行它们。预定次数的重试之后,所述系统返回写入故障。
限制对状态的直接访问,以便一旦有一个块处于不可写状态,那么可以防止其状态被变回到可写。通常,状态初始化只在工厂中被执行一次。其后,可以用来更新所述状态的唯一机制是在写相应块时将其改为不可写。作为选择,一个块的状态可以在某一持续时间内被锁定。在一个实施例中,所述持续时间取决于所存储数据的保留期。在下一段中,我们将描述用于可靠地保持存储块的状态并且在执行任何写操作以前检验所述状态的多种方法。应注意的是,在某些环境中,对仍未被写入的块的试图读取返回错误是合乎需要的。在这种环境中,就读操作来检查所请求的块的状态,并且如果所述状态是可写的,则返回故障。在下文中,我们将集中描述写操作。
外部不可重写
在一个实施例中,存储块的状态被保存在被存储数据之外。所述系统使用诸如列表、散列表或者位图之类的数据结构来跟踪哪些块是可写的(或者是不可写的)。为了便于说明,使用了位图,其中每一位对应于一个存储块,并且该位的值表明相应的存储块是否是可写的。
所述位图被存储在存储器系统中,通常存储在非用户可寻址部分中。为了减少状态被破坏以及WORM属性被阻止实现的可能性,所述系统保留所述位图中各位的校验和或者其它的数学函数,并且把它们安全地存储在存储器系统的非用户可寻址部分中。对位图以及校验和的所有更新被写入永久性存储器。
当初始化时,位图中的各位被设置为1,表明相应的块是可写的。为了检验存储块的状态,所述系统查看位图中相应的位。此外,它还重新计算并且验证相应的校验和是有效的。在一个实施例中,只有当相应的位是1并且相应的校验和是有效的时,所述块才是可写的。为了把存储块的状态设置为不可写,所述系统把相应的位设置为0并且更新相应的校验和。
为了改善性能,所述位图和校验和是以分布式方式存储在存储器系统中的,以便使所述位与校验和位于接近于它们的相应存储块的地方。例如,盘圆柱的最初少数扇区(块)可用于存储圆柱中其它扇区的位图和相应的校验和。如果所述盘支持稍微大于逻辑(用户可寻址的)扇区大小(例如512字节)的物理扇区大小(例如524字节),那么对应于每一逻辑扇区的位还可以被存储在与逻辑扇区的数据内容相同的物理扇区中。
在此实施例中,通过独立于数据的实际存储器的机制加强了一次性写入属性。
集成状态
在另一个实施例中,存储块的状态被编码并且保存在正被存储的数据中。因此,如果数据被成功地存储,那么所述状态用于确保数据不会被改写。
图2是举例说明用于在WMRM存储器系统上提供WORM属性的方法40的流程图,其中状态信息被编码并且存储在数据中。在块42,方法40开始。
在块44,所述存储器系统初始化存储块。所述初始化提供对存储器系统状态的初始化,以便存储器的每一块是可写的,或者存储器的某些指定块是可写的。
在块46,所述存储器系统接收将存储在目标地址的数据。
在块48,读取目标地址的当前内容。
在块50,对与目标地址当前内容相关联的状态信息进行解码。
在块52,就目标地址是否可写做出确定。如果目标地址被确定为不可写,那么在块54,响应于写入请求返回故障。如果目标地址被确定为可写,那么在块56,不可写状态信息被编码在将存储在目标地址的数据中。
在块58,将包括所编码的状态信息的数据写入目标地址。
在块60,返回用于确认已经成功地写入数据的消息。
在块62,方法40结束。
在一个特定实施例中,所述初始化(参见块40)是通过在将被初始化的存储块中存储预定的位模式来执行的,并且如果目标地址的当前内容包括预定的位模式,那么可以确定所述目标地址是可写的。
此实施例的缺点在于:预定的位模式无法以不可重写的方式被存储。解决方案在于:检测何时系统被要求存储预定的位模式并且此后把数据改变为其它的预定位模式。例如,在法律文件中,空白页不是被留下空白,而是被标记为“有意留下空白”。另一选项是仅仅让预定的位模式是可重写的。通过增大预定位模式的长度,它在数据流中被遇到的概率得以极大地降低。
例如,采用8字节预定位模式,那么在28×8=5.4×10-20中,预定位模式被遇到的概率只有1。
在另一个实施例中,所述初始化(参见块40)是通过把预定位模式存储在将被初始化的每一存储块内的预定位置来执行的,并且如果目标地址的当前内容包括处于预定位置的预定位模式,那么可以确定所述目标地址是可写的。
在又一个实施例中,由系统将存储器的每一个用户可寻址或者逻辑块映射到存储器的多个物理块上,最好均位于独立故障域中。例如,对应于逻辑块的每个物理块可以来自于独立的盘或者盘阵列。所述系统使用相应物理块的内容之间的关系来编码逻辑块的状态。此外,所存储的数据可以从任意一个相应物理块中被检索,由此极大地增加了系统的可靠性。在一个实施例中,存储器的每一逻辑块被映射到两个物理块上。
对所述系统进行初始化,以便使对应于一个逻辑块的每对物理块的内容满足特定的数学关系式f。举例来说,如果第一物理块包含位模式x,那么第二物理块往往包含x的逻辑非。当一个数据块将被写入逻辑块时,所述系统读取相应物理块的当前内容。如果所述内容满足预定的数学关系式f(例如,逻辑非),那么所述逻辑块是可写的。否则,所述逻辑块是不可写的。如果所述逻辑块是可写的,那么系统继续将数据写入两个物理块中。一般说来,数据的某些数学函数被写入两个物理块的每个中,以便两个物理块中的数据都满足不同于f的数学关系式。当逻辑块将被读取时,所述系统可以从相应物理块的任一个中读取。作为选择,为了增加可靠性,从两个物理块读取并且验证两个物理块的内容满足有效的关系式。
这种系统为存储在系统中的任何数据无法被改写提供了非常强大的保证,这是因为逻辑块的可写/不可写状态是通过存储数据的实际动作来更新的。
集成状态和测试
图3是举例说明把状态更新和状态测试机制与数据存储操作集成以便一旦成功地写入数据就无法改写它的方法70的流程图。换言之,通过方法70,写入数据的动作确保WORM属性。在块72,方法70开始。
在块74,对存储器系统的状态进行初始化。所述初始化提供对存储器系统状态的初始化,以便存储器的每一块是可写的,或者存储器的某些指定块是可写的。
在块76,所述存储器系统接收将存储的数据。
在块78,读取将要存储所接收数据的目标地址的当前内容。
在块80,对将存储的数据和目标地址的当前内容(参见块78)的数学函数进行计算。
在块82,将所计算的数学函数写入由目标地址标识的物理块。
在块84,方法70结束。
在一个实施例中,由系统将存储器的每一个用户可寻址或者逻辑块映射到存储器的多个物理块上,最好均位于独立故障域中。例如,对应于逻辑块的每个物理块可以来自于独立的盘或者盘阵列。此外,所存储的数据可以从任一相应物理块中被检索,由此极大地增加了系统的可靠性。
在一个特定实施例中,存储器的每一逻辑块被映射到两个物理块上。对所述系统进行初始化,以便使对应于一个逻辑块的每对物理块的内容满足特定的数学关系式f。举例来说,如果第一物理块包含位模式x,那么第二物理块往往包含x的逻辑非。
所述数学函数(参见块80)可以是多级函数,例如包括先前内容的函数以及所接收的数据的进退函数(further function),如图4A中举例说明的那样。所述数学函数可以依照软件(使用ALU运算)或者硬件(使用逻辑门)来实现,如图4B中的例子所示那样。
在优选的实施例中,所述数学函数是逐位多数逻辑决议(bit-wisemajority vote),它指的是所计算的值中的每一位只有当相应输入位的大部分是1(0)时才会是1(0)。对所述系统进行初始化,以便使对应于一个逻辑块的每组物理块的内容的多数逻辑决议是0。当把每个逻辑块映射到两个物理块时,这意味着系统被初始化,以便对应于一个逻辑块的每对物理块的内容满足逻辑非。
所述多数逻辑决议很容易在软件或硬件中实现,例如通过使用图5A和图5B中示出的门/ALU运算的组合,或者通过图6中示出的用于实现真值表的查找表来实现。应注意的是,典型的实现方式往往对多个位(例如32位)并行执行操作。
在一个实施例中,在把所计算的值写入两个物理块(参见块82)之后,所述系统读回物理块的内容以便验证数据已经被成功地存储。如果所述内容不同于将存储的数据,那么系统返回写入故障。否则,它确认已经成功地执行了写操作。
应注意的是,在此方法中,先前写入的数据可以利用相同的值来重写。即使重写过程被中断,所述系统也必须确保物理块的内容是有效的。已知的方法是确保块写入操作是极其基本的(atomic)。
精细粒度WORM
底层(underlying)存储器允许重写的事实意味着系统可以实际读取早已写入的块,向其添加数据,然后再次写入它。换言之,所述系统可以有效地实现以比底层存储器的最小写入单元更精细的粒度的一次性写入属性。此外,所述系统允许随机块被写入。这些属性使系统能存储数据以及元数据,这通常要求数据被写入连续的块中,所述元数据用于依照比传统光学WORM存储器更加灵活的方式来描述数据。
为了支持这种精细粒度WORM,在外部不可重写实施例中,所述系统以小于块大小的粒度来保留可写/不可写位。例如,每8字节一位。在该情况下,只有其相应位表明它是可写的,存储器的给定8字节才能够被写入。在使用预定位模式来表明可写性的实施例中,只有当其当前包含预定位模式时,存储器的单元才能够被写入。所述WORM粒度在该情况下必须至少是所述位模式的大小。用于通过使用相应物理块的内容之间的关系来保留存储块的可写/不可写状态的实施例可以被扩展,而不会为实现处于任意精细粒度的一次性写入属性带来额外成本。具体来讲,对于存储器的每一位而言,所述系统检验两个副本中的相应位,以便查看它们是否服从于表明其可以被写入的关系。在集成状态和测试实施例中,所述系统仅仅对将被写入的位执行多数逻辑决议。
例如,假定所述系统接收如下写入命令,写入(目标块地址A,数据D,偏移o,长度l)。它通过首先把对应于A的两个物理块的内容读到D[1]和D[2]中,然后确定D[1]和D[2]中的相应字节之间的关系,以此来检验逻辑块A的o(包含o在内)和o+l之间的字节的状态。如果所有l个字节都是可写的,那么系统用D来替代D[1]和D[2]中的相应字节,并且把D[1]和D[2]写回到各个物理块。否则,它返回故障。当接收到诸如读取(目标块地址A,数据D,偏移o,长度l)之类的读取命令时,所述系统返回连续的不可写字节,以及这种字节的数目,所述字节起始于A+o并且在A+o+l以前结束。
这种扩展允许应用程序重复地并且逐渐地向存储在WORM存储器上的对象附加数据。这使应用程序能有效地以不可改变的方式来记录事件,并且这是保留稳固的核查踪迹的关键,如某些规章所要求的那样。如果应用程序在存储器中保存最后的对象块,那么每当其向所述对象附加数据时,它往往更便于简单发布具有新长度的最后块的写操作。为了支持这种用途,如果在当前内容中的值与新值相同,那么当前系统往往进一步认为字节将是可写的。
举例来说,假定系统接收如下写入命令,写入(目标块地址A,数据D,长度l)。它把对应于A的两个物理块的当前内容读到D[1]和D[2]中。所述系统接下来计算D、D[1]和D[2]的前l个字节的数学函数(例如,逐位多数逻辑决议),并且把结果存回D[1]和D[2]的前l个字节中。接下来,所述系统把D[1]写回到对应于A的第一物理块,把D[2]写回到第二物理块。最后,所述系统读回两个物理块的当前内容,并且验证前l个字节和D相同。作为选择,在系统执行D[1]和D[2]的写操作以前,它察看D[1]/D[2]的前l个字节是否和D的前l个字节相同。如果不是,所述系统返回故障。
应注意的是,精细粒度WORM提供了更新块内随机粒度的能力。简单地把数据附加给一个块是一个特例,其可以被优化以便只需要少数状态位。例如,当初始化系统时,可以把预定位模式写入到每个块的开始处。所述预定位模式标记可以附加数据的位置。当把数据写入一个块时,所述系统首先寻找预定位模式的位置。然后,它把新数据添加到该位置并且把所述位模式压回。如果无法找到位模式,或者剩余空间对新数据而言不足,那么系统返回故障。
在描述精细粒度WORM的过程中,已经使用了读/写接口,用于明确指定数据的字节长度和/或偏移。显而易见的是,这种信息可以被编码为其它字段,尤其是在本发明将要使用现有块接口实现对更是如此。例如,所述字节长度可以被编码为块的最后字。于是,全部块请求必须被分解为两个请求。作为选择,可以如此来进行编码,即:只有当另一字段具有特定属性时,最后的字才包含长度。举例来说,如果块地址的最高有效位没有被使用,那么可以将其设置为1,以便表明长度位于所述块的最后字中。如果现有接口具有块计数,那么可以使用其最高有效位来表明长度位于所传送数据的最后字中。如果块计数非常大以至于它使用最高有效位,那么把请求分解为两个。
可靠性
如果存储介质是可移动的,就像大部分光学WORM介质那样,那么驱动器故障不会令数据丢失,这是因为所述介质可以被移除并且利用另一驱动器来读取。然而,对于诸如硬盘之类的不可移动的存储介质而言,盘故障意味着存储在该盘上的数据丢失。防止因盘故障而造成数据丢失的普遍方法是使用RAID。基本思想是保留所存储数据的某些冗余信息,以便当盘发生故障时,可以通过使用其它盘上的数据和/或冗余信息来重构存储在那些盘上的数据。
利用本发明,所述系统必须进一步确保保护块的可写/不可写状态以防止丢失。当把可写/不可写状态作为数据存储在底层存储器中时,通过用于底层存储器的标准RAID方案来保护它。当可写/不可写状态取决于数据副本之间的数学关系式时,RAID方案可以被增强以便更好地保护所述状态。
在一个实施例中,所述系统出自于这样的工厂,该工厂被初始化以便使所有块都是可写的。系统被密封,以便没有方法直接访问底层WMRM存储器或者直接对存储块的可写/不可写状态进行操作。
在图7中示出的示例性系统中,可以存在多个密封部件,其中每一密封部件包含一对盘,所述盘被初始化以便使得所述盘的其中一个包含另一盘的内容的逻辑非。所述密封部件按阵列形式布置,并且跨越所述部件将数据分条(stripe)。为了防止部件故障,计算纠错码并且将其存储在所述阵列中的一个或多个附加部件上。为了便于说明,在此处的论述中,我们使用具有奇偶校验(RAID-3)的位级条纹划分。显而易见的是,只要数据的所有条纹每次都被写入,当依照其它方式跨越密封部件(例如,RAID4/5)来分送数据时,并且当使用其它纠错码(例如,里德-索罗蒙码代码,Reed-Solomon Code)时,就可以采用相同的思想。
在这种方案中,数据在每一密封部件内被镜像,并且还通过RAID奇偶校验来加以保护。当存在两个盘都发生故障的两个或更多密封部件时,数据往往才会丢失。所述可写/不可写状态跨越阵列中所有部件被镜像,并且往往在所有部件遭受至少一个盘发生故障时才会丢失。这种系统因此非常可靠,并且可以容许任何三个盘发生故障,并且容许最多n个盘发生故障,其中n是密封部件的数目。
失效部件的恢复过程操作如下。首先,对于每个将要被恢复的块而言,从阵列中其它部件的每个中读取相应块。使用早先指定的接口,这往往意味着向每个其它部件发布命令读取(目标块地址A,数据D,长度l),其中A是将要被恢复的块地址。其次,检查从完全发挥功能的部件(没有盘故障的部件)的每一个返回的长度l的一致性并且由l_来表示。第三,计算每个返回数据的相应前l_字节的XOR并且由D_表示。最后,通过命令写入(目标块地址A,计算的数据D_,长度l_)把所计算的数据写入替代部件。
当一个部件中只有其中一个盘已经发生故障时,可以如下所述更加有效地执行恢复过程。首先,从部分发生故障的部件中读取将要被恢复的块中的数据。其次,通过从完全发挥功能的部件读取相应块来确定所述块的状态。最后,把数据及其状态写入替代部件。使用上述接口,这往往涉及发布如下命令:(1)到部分发生故障的部件的读取(目标块地址A,数据D_);(2)到完全发挥功能的部件的读取(目标块地址A,数据D,长度l_);以及(3)到替代部件的写入(目标块地址A,数据D_,长度l_。
应注意的是,当服务于读取请求时,相应的奇偶校验被读取并且被重新计算以便验证数据的完整性。在不需要验证的环境下,奇偶校验可以均匀地分布在阵列的所有部件当中,以便平衡每一部件上的工作量,如RAID-5中那样。
虽然以上的讨论集中于独立地描述外部不可重写性、集成状态以及集成状态和测试的各种实施例,但是应该理解的是,所述原理可依照组合形式加以应用以便实现更加稳固的对数据改写的保护措施。还应该理解的是,虽然以上的讨论集中于硬盘,但是用于加强WMRM存储器上的WORM属性的相同原理可以在WMRM存储器由其它存储器设备/系统以及存储器设备/系统的组合(例如阵列)组成时应用,所述其它存储器设备/系统诸如是MRAM以及MEMS。
此外,虽然作为此处所示出并且详细说明的用于使用WMRM存储器实现可靠的WORM存储器的特定系统和方法,完全能够实现上述的发明目的,但是应该理解的是,它是本发明当前优选的实施例,并且由此代表可通过本发明广泛构想的主题,本发明的范围完全包含本领域技术人员显而易见的其它实施例,并且本发明的范围因此仅由所附权利要求来限定,在权利要求中以单数限定的元件除非明确说明否则不意味着是“一个且仅有一个”的意思,而是指“一个或多个”。对于系统或方法而言,不需要解决本发明设法解决的每个问题,它将由当前的权利要求书来包含。此外,不管元件、部件或者方法步骤在权利要求书中是否明确讲述,但是不打算使当前公开内容中的元件、部件或者方法步骤对公众而言是专用的。此处缺少明确定义的情况下,权利要求项将会给出所有普通并且惯用的含义,这些是与本说明书和文件历史不矛盾的。

Claims (35)

1.一种用于确保存储在可重写存储器上的数据不可改变的方法,包括:
把存储器的选定的用户可寻址块初始化为可写状态;
接受将存储在指定的用户可寻址块中的数据;
确定所指定的块是否是可写的;
把所接受的数据存储至可重写存储器;并且
把指定块的状态设置为不可写。
2.如权利要求1所述的方法,其中确定指定块是否是可写的步骤包括:测试与指定块相关联的状态,并且如果指定块中的至少一个是不可写的,则返回错误。
3.如权利要求1所述的方法,其中与每一个用户可寻址块相关联的状态被编码在那个块的内容中,并且其中当在所述块中存储数据时,已编码的状态被自动地并且不可避免地改变为不可写。
4.如权利要求1所述的方法,其中把存储器的选定的用户可寻址块初始化为可写状态的步骤包括在所选择的块中存储预定位模式,并且其中确定指定块是否可写的步骤包括测试指定块的内容是否包括预定位模式。
5.如权利要求1所述的方法,其中存储器的每一个用户可寻址块被映射至可重写存储器的至少一个块,并且把存储器的选定的用户可寻址块初始化为可写状态的步骤包括把预定位模式存储到可重写存储器的相应块中,以便对于存储器的每个选定的用户可寻址块而言,可重写存储器的相应块的内容满足预定的数学关系。
6.如权利要求5所述的方法,其中确定指定块是否可写的步骤包括测试可重写存储器的相应块的内容是否满足预定的数学关系。
7.如权利要求6所述的方法,其中所述数学关系是逻辑非。
8.如权利要求6所述的方法,其中确定指定块是否可写的步骤与在所述块中存储数据的实际操作被数学集成,以便如果块的状态是可写的,那么数据只能被存储在该块中。
9.如权利要求8所述的方法,其中把所接受的数据存储至可重写存储器的步骤包括:
读取对应于指定块的可重写存储器的块的内容;
执行所读取内容和所接受数据的数学函数;以及
在对应于指定块的可重写存储器的块中存储计算结果。
10.如权利要求9所述的方法,其中所述数学函数是多数逻辑决议。
11.如权利要求1所述的方法,其中按照小于所述块的精细粒度保持所述状态,以便可以将数据附加到所述块。
12.如权利要求1所述的方法,其中如果第一可重写存储器发生故障,那么在至少第二可重写存储器上对所述块的内容和状态进行复制或者使用数学代码产生冗余。
13.如权利要求12所述的方法,其中所述数学代码包括纠错码以及奇偶校验。
14.如权利要求1所述的方法,还包括在状态已经被更新为不可写之后,确认已经成功地执行了写操作。
15.如权利要求1所述的方法,其中用户可寻址块的状态被保存在存储在用户可寻址块中的数据之外。
16.如权利要求15所述的方法,其中状态的数学函数被生成并且保留在存储器系统的非用户可寻址部分中。
17.如权利要求16所述的方法,其中所述状态以分布式方式存储在可重写存储器中,其中状态的分布规定所述状态位于与相应存储块更加接近的地方。
18.一种计算机程序产品,包括:
计算机程序存储设备;以及
存储设备上的计算机可读指令,用于使计算机执行用于确保存储在可重写存储器上的数据不可改变的方法动作,所述方法动作包括:
把存储器的选定的用户可寻址块初始化为可写状态;
接受将存储在指定的用户可寻址块中的数据;
确定所指定的块是否是可写的;
把所接受的数据存储至可重写存储器;并且
把指定块的状态设置为不可写。
19.如权利要求18所述的计算机程序产品,其中确定指定块是否是可写的方法动作包括测试与指定块相关联的状态,并且如果指定块中的至少一个是不可写的,则返回错误。
20.如权利要求18所述的计算机程序产品,其中与每一个用户可寻址块相关联的状态被编码在那个块的内容中,并且其中当在所述块中存储数据时,已编码的状态被自动地并且不可避免地改变为不可写。
21.如权利要求18所述的计算机程序产品,其中把存储器的选定的用户可寻址块初始化为可写状态的方法动作包括在所选择的块中存储预定位模式,并且其中确定指定块是否可写的方法动作包括测试指定块的内容是否包括预定位模式。
22.如权利要求18所述的计算机程序产品,其中存储器的每一个用户可寻址块被映射至可重写存储器的至少一个块,并且把存储器的选定的用户可寻址块初始化为可写状态的方法动作包括把预定位模式存储到可重写存储器的相应块中,以便对于存储器的每个选定的用户可寻址块而言,可重写存储器的相应块的内容满足预定的数学关系。
23.如权利要求22所述的计算机程序产品,其中确定指定块是否可写的方法动作包括测试可重写存储器的相应块的内容是否满足预定的数学关系。
24.如权利要求23所述的计算机程序产品,其中所述数学关系是逻辑非。
25.如权利要求23所述的计算机程序产品,其中确定指定块是否可写的方法动作与在所述块中存储数据的实际操作被数学集成,以便如果块的状态是可写的,那么数据只能被存储在该块中。
26.如权利要求25所述的计算机程序产品,其中把所接受的数据存储至可重写存储器的方法动作包括:
读取对应于指定块的可重写存储器的块的内容;
执行所读取内容和所接受数据的数学函数;以及
在对应于指定块的可重写存储器的块中存储计算结果。
27.如权利要求26所述的计算机程序产品,其中所述数学函数是多数逻辑决议。
28.如权利要求18所述的计算机程序产品,其中按照小于所述块的精细粒度保持所述状态,以便可以将数据附加到所述块。
29.如权利要求18所述的计算机程序产品,其中如果第一可重写存储器发生故障,那么在至少第二可重写存储器上对所述块的内容和状态进行复制或者使用数学代码产生冗余。
30.如权利要求29所述的计算机程序产品,其中所述数学代码包括纠错码以及奇偶校验。
31.如权利要求18所述的计算机程序产品,还包括在状态已经被更新为不可写之后,确认已经成功地执行了写操作。
32.如权利要求18所述的计算机程序产品,其中用户可寻址块的状态被保存在存储在用户可寻址块中的数据之外。
33.如权利要求32所述的计算机程序产品,其中状态的数学函数被生成并且保留在存储器系统的非用户可寻址部分中。
34.如权利要求33所述的计算机程序产品,其中所述状态以分布式方式存储在可重写存储器中,其中状态的分布规定所述状态位于与相应存储块更加接近的位置。
35.一种用于在WMRM存储器系统上采用可靠的WORM存储器服务的方法,包括:
把计算机可读代码集成到系统中以便把存储器的选定的用户可寻址块初始化为可写状态;
把计算机可读代码集成到系统中以便接受将存储在指定用户可寻址块中的数据;
把计算机可读代码集成到系统中以便确定指定块是否是可写的;
把计算机可读代码集成到系统中以便把所接受的数据存储至可重写存储器;并且
把计算机可读代码集成到系统中以便把指定块的状态设置为不可写,
借此,所述服务确保存储在WMRM存储器上的数据是不可改变的。
CN200510116085.0A 2004-10-29 2005-10-28 用于使用wmrm存储器实现可靠的worm存储器的系统和方法 Active CN1783342B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/977,160 US7493454B2 (en) 2004-10-29 2004-10-29 Method for achieving reliable worm storage using WMRM storage
US10/977,160 2004-10-29

Publications (2)

Publication Number Publication Date
CN1783342A true CN1783342A (zh) 2006-06-07
CN1783342B CN1783342B (zh) 2010-04-21

Family

ID=36263491

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200510116085.0A Active CN1783342B (zh) 2004-10-29 2005-10-28 用于使用wmrm存储器实现可靠的worm存储器的系统和方法

Country Status (3)

Country Link
US (2) US7493454B2 (zh)
CN (1) CN1783342B (zh)
TW (1) TW200627151A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015039496A1 (zh) * 2013-09-23 2015-03-26 华为技术有限公司 一种worm追加写判断方法及存储设备
CN106448732A (zh) * 2015-08-12 2017-02-22 德克萨斯仪器股份有限公司 半导体存储器单元多写避免编码装置、系统和方法
CN107273054A (zh) * 2017-06-26 2017-10-20 长沙开雅电子科技有限公司 一种新型硬盘一写多读的实现方法

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8055622B1 (en) * 2004-11-30 2011-11-08 Symantec Operating Corporation Immutable data containers in tiered storage hierarchies
US7512044B2 (en) * 2005-02-15 2009-03-31 International Business Machines Corporation System and method for enabling efficient small writes to WORM storage
US7487178B2 (en) * 2005-10-05 2009-02-03 International Business Machines Corporation System and method for providing an object to support data structures in worm storage
WO2009070430A2 (en) * 2007-11-08 2009-06-04 Suridx, Inc. Apparatus and methods for providing scalable, dynamic, individualized credential services using mobile telephones
US8572043B2 (en) * 2007-12-20 2013-10-29 International Business Machines Corporation Method and system for storage of unstructured data for electronic discovery in external data stores
CN101604250B (zh) * 2008-06-12 2014-07-16 普安科技股份有限公司 储存虚拟化系统中更新实体储存装置的控制程序的方法
US9830563B2 (en) 2008-06-27 2017-11-28 International Business Machines Corporation System and method for managing legal obligations for data
US20170262180A1 (en) * 2016-03-08 2017-09-14 Burlywood, LLC Integrated control of write-once data storage devices
CN112115521B (zh) * 2019-06-19 2023-02-07 华为技术有限公司 数据访问方法及装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US540652A (en) * 1895-06-11 Press
US5455926A (en) * 1988-04-05 1995-10-03 Data/Ware Development, Inc. Virtual addressing of optical storage media as magnetic tape equivalents
JPH0750558B2 (ja) * 1992-09-22 1995-05-31 インターナショナル・ビジネス・マシーンズ・コーポレイション 一括消去型不揮発性メモリ
US5966263A (en) * 1997-08-01 1999-10-12 International Business Machines Corporation Method and apparatus to increase head/AE select robustness for a system using multiple head servo write
US6308265B1 (en) * 1998-09-30 2001-10-23 Phoenix Technologies Ltd. Protection of boot block code while allowing write accesses to the boot block
US20020161991A1 (en) * 2001-01-17 2002-10-31 Yong-Jun Shi Method of forming collateral alliance between Windows 9X system and Windows NT 4.0 system
JP4320597B2 (ja) * 2003-01-31 2009-08-26 ソニー株式会社 記録媒体、記録再生装置、記録再生方法
KR100739675B1 (ko) * 2003-04-26 2007-07-13 삼성전자주식회사 정보 저장 매체의 결함 관리 방법, 정보 저장 매체드라이브 장치 및 그 정보 저장 매체

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015039496A1 (zh) * 2013-09-23 2015-03-26 华为技术有限公司 一种worm追加写判断方法及存储设备
CN106448732A (zh) * 2015-08-12 2017-02-22 德克萨斯仪器股份有限公司 半导体存储器单元多写避免编码装置、系统和方法
CN107273054A (zh) * 2017-06-26 2017-10-20 长沙开雅电子科技有限公司 一种新型硬盘一写多读的实现方法

Also Published As

Publication number Publication date
US20080294852A1 (en) 2008-11-27
CN1783342B (zh) 2010-04-21
TW200627151A (en) 2006-08-01
US7757050B2 (en) 2010-07-13
US20060095687A1 (en) 2006-05-04
US7493454B2 (en) 2009-02-17

Similar Documents

Publication Publication Date Title
CN1783342A (zh) 用于使用wmrm存储器实现可靠的worm存储器的系统和方法
US8069317B2 (en) Providing and utilizing high performance block storage metadata
US20180314627A1 (en) Systems and Methods for Referencing Data on a Storage Medium
US9152546B2 (en) Fault-tolerant non-volatile integrated circuit memory
US7315976B2 (en) Method for using CRC as metadata to protect against drive anomaly errors in a storage array
EP2732373B1 (en) Method and apparatus for flexible raid in ssd
US7464322B2 (en) System and method for detecting write errors in a storage device
US9130597B2 (en) Non-volatile memory error correction
US20110029728A1 (en) Methods and apparatus for reducing input/output operations in a raid storage system
JP2007012058A (ja) フラッシュ様媒体におけるトランザクションレコードを格納するファイルシステム
US20170052844A1 (en) Flash memory codeword architectures
JP2007012056A (ja) データ保全の先送りされた認証を有するファイルシステム
CN101047010A (zh) 用于最大化raid系统中受保护数据量的方法和系统
JPH08263228A (ja) アレイにデータを格納する方法および記憶アレイ・システム
JP2007012054A (ja) ファイルシステム保全の最適化されたスタートアップ認証
US20180113633A1 (en) Method and system for efficient cache buffering in a system having parity arms to enable hardware acceleration
JP2007012060A (ja) 逆階層構造を有するファイルシステム
TWI420308B (zh) 區塊管理方法、記憶體控制器與記憶體儲存裝置
US11347653B2 (en) Persistent storage device management
US20160117266A1 (en) Selective management of security data
US20200174689A1 (en) Update of raid array parity
US20130219119A1 (en) Writing new data of a first block size to a second block size using a write-write mode
US20090287882A1 (en) Raid_5 controller and accessing method with data stream distribution and aggregation operations based on the primitive data access block of storage devices
JP2005284816A (ja) ディスクアレイシステム
US10338850B2 (en) Split-page queue buffer management for solid state storage drives

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant