CN108008909A - 一种数据存储方法、装置及系统 - Google Patents

一种数据存储方法、装置及系统 Download PDF

Info

Publication number
CN108008909A
CN108008909A CN201610930966.4A CN201610930966A CN108008909A CN 108008909 A CN108008909 A CN 108008909A CN 201610930966 A CN201610930966 A CN 201610930966A CN 108008909 A CN108008909 A CN 108008909A
Authority
CN
China
Prior art keywords
storage
data block
block
band
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610930966.4A
Other languages
English (en)
Other versions
CN108008909B (zh
Inventor
陈伟
林起芊
汪渭春
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Hikvision Digital Technology Co Ltd
Original Assignee
Hangzhou Hikvision Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Hikvision Digital Technology Co Ltd filed Critical Hangzhou Hikvision Digital Technology Co Ltd
Priority to CN201610930966.4A priority Critical patent/CN108008909B/zh
Priority to PCT/CN2017/101847 priority patent/WO2018076954A1/zh
Publication of CN108008909A publication Critical patent/CN108008909A/zh
Application granted granted Critical
Publication of CN108008909B publication Critical patent/CN108008909B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1076Parity data used in redundant arrays of independent storages, e.g. in RAID systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • G06F3/064Management of blocks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0689Disk arrays, e.g. RAID, JBOD

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Retry When Errors Occur (AREA)

Abstract

本申请实施例提供了一种数据存储方法、装置及系统,涉及计算机技术领域。其中,数据存储方法应用于数据存储系统中的主存储服务器,该数据存储系统包括管理服务器和存储服务器。该方法包括:接收待存储至第一条带的第一数据块;向管理服务器请求针对第一数据块的第一存储地址,将第一数据块存储至第一存储地址;在确定第一数据块存储成功时,判断第一数据块是否为第一条带中的最后一个数据块;如果是,则根据第一条带中已存储成功的所有数据块,计算第一条带中的第一校验块;向管理服务器请求针对第一校验块的第二存储地址,将第一校验块存储至第二存储地址。应用本申请实施例,能够尽可能避免出现数据块和校验块不一致的问题。

Description

一种数据存储方法、装置及系统
技术领域
本申请涉及计算机技术领域,特别涉及一种数据存储方法、装置及系统。
背景技术
随着计算机技术的发展,需要存储的数据量呈几何级数增长。为了提高数据存储时的存储性能,目前常用的存储模式为RAID(Redundant Array of Independent Disks,独立磁盘冗余阵列)模式中的RAID5和RAID6。其中,RAID5是一种采用块交叉访问及校验信息均匀分布的模式。RAID5读写操作是以条带为基本单位的,条带被划分为多个存储单元,这些存储单元用于存储数据块和校验块。图1a为条带的一种结构示意图,其中,该条带包含n个数据块(D1、D2、…、Dn)和m个校验块(P1、P2、…、Pm),每个数据块和校验块均分布在不同的磁盘上。在分布式存储系统中,磁盘可以位于不同的服务器上。作为一个例子,当n取3,m取1时,条带对应着4个服务器,图1b所示即为该例中条带与服务器的逻辑关系示意图。其中,包括4个相互独立的服务器,每个服务器中存储有3个数据块和1个校验块,图1b中横向的3个数据块和1个校验块组成一个条带,表1为具体的各个条带的组成。这样,每个条带中的数据块和校验块均分别位于不同的服务器上。
表1
在一个条带中,校验块是根据数据块中的数据计算得到的,即数据块D1~Dn与校验块P满足以下关系:D1xor D2xor…Dn xor P=0。其中xor为异或运算符。当数据块更新时,对应的校验块也会重新计算并更新。通常,当数据块与校验块符合上述关系时,即称数据块与校验块之间存在一致性。当数据块和校验块之间存在一致性时,从其中任取个数不少于n的数据块或校验块,即能根据上述关系得到其他数据块或校验块。也就是说,当一个服务器发生故障时,该服务器上的数据可以通过其他服务器上的数据进行恢复。
现有技术中,存储数据的方法通常是满条带写入服务器中的磁盘,即根据数据块获得校验块,然后将条带中的数据块和校验块同时写入磁盘。但是,在将数据块和校验块同时写入磁盘的过程中,如果系统突然遭遇断电事故,条带数据可能没有完全写入成功。当系统重启之后,条带中的数据可能是不完整的,数据块中的有效数据和校验块中的数据可能存在不一致性。
此时,如果某个磁盘失效,则利用未失效磁盘上的数据块和校验块恢复出的数据将是错误的。这种现象也被称为Write Hole(写漏洞)现象。
发明内容
本申请实施例的目的在于提供了一种数据存储方法、装置及系统,以尽可能避免出现数据块和校验块不一致的问题。
为了达到上述目的,本申请公开了一种数据存储方法,应用于数据存储系统中的主存储服务器,其中,所述数据存储系统包括:管理服务器和存储服务器;所述存储服务器包括:主存储服务器和非主存储服务器;所述主存储服务器为所述存储服务器中的任意一个;所述方法包括:
接收待存储至第一条带的第一数据块;
向所述管理服务器发送针对所述第一数据块的存储地址获得请求,并获得所述管理服务器按照条带存储机制确定的第一存储地址,将所述第一数据块存储至所述第一存储地址;
在确定所述第一数据块存储成功时,判断所述第一数据块是否为所述第一条带中的最后一个数据块;
如果是,则根据所述第一条带中已存储成功的所有数据块,计算所述第一条带中的第一校验块;
向所述管理服务器发送针对所述第一校验块的存储地址获得请求,并获得所述管理服务器按照条带存储机制确定的第二存储地址,将所述第一校验块存储至所述第二存储地址。
可选的,在将所述第一数据块存储至所述第一存储地址之后,所述方法还包括:
当所述第一数据块未存储成功时,删除所述第一数据块的已存储数据,并返回执行所述根据所述第一条带中已存储成功的所有数据块,计算所述第一条带中的第一校验块的步骤。
可选的,在将所述第一校验块存储至所述第二存储地址之后,所述方法还包括:
判断所述第一校验块是否存储成功;
如果否,则返回执行所述根据所述第一条带中已存储成功的所有数据块,计算所述第一条带中的第一校验块的步骤。
可选的,当判断出所述第一数据块不是所述第一条带中的最后一个数据块时,所述方法还包括:
检测预设时间段内是否接收到待存储至所述第一条带的第二数据块;
如果未接收到,则根据所述第一条带中已存储成功的所有数据块,计算所述第一条带中的第二校验块;
向所述管理服务器发送针对所述第二校验块的存储地址获得请求,并获得所述管理服务器按照条带存储机制确定的第三存储地址,将所述第二校验块存储至所述第三存储地址。
可选的,所述第一条带中用于存储数据块的存储单元未存满时,在将所述第二校验块存储至所述第三存储地址之后,所述方法还包括:
接收所述第二数据块;
向所述管理服务器发送针对所述第二数据块的存储地址获得请求,并获得所述管理服务器按照条带存储机制确定的第四存储地址,将所述第二数据块存储至所述第四存储地址;
在确定所述第二数据块存储成功时,判断所述第二数据块是否为所述第一条带中的最后一个数据块;
如果是,则根据所述第一条带中已存储成功的所有数据块,计算所述第一条带中的第三校验块;
将所述第二校验块更新为所述第三校验块。
可选的,在将所述第二数据块存储至所述第四存储地址之后,所述方法还包括:
当所述第二数据块为存储所述第二校验块后接收到的第一个数据块,且所述第二数据块未存储成功时,删除所述第二数据块的已存储数据。
可选的,在将所述第二数据块存储至所述第四存储地址之后,所述方法还包括:
当所述第三数据块不是存储所述第二校验块后接收到的第一个数据块,且所述第二数据块未存储成功时,删除所述第二数据块的已存储数据,并返回执行所述根据所述第一条带中已存储成功的所有数据块,计算所述第一条带中的第三校验块的步骤。
可选的,所述第一数据块中的数据来自一个文件。
为了达到上述目的,本申请公开了一种数据存储装置,应用于数据存储系统中的主存储服务器,其中,所述数据存储系统包括:管理服务器和存储服务器;所述存储服务器包括:主存储服务器和非主存储服务器;所述主存储服务器为所述存储服务器中的任意一个;所述装置包括:
第一接收模块,用于接收待存储至第一条带的第一数据块;
第一存储模块,用于向所述管理服务器发送针对所述第一数据块的存储地址获得请求,并获得所述管理服务器按照条带存储机制确定的第一存储地址,将所述第一数据块存储至所述第一存储地址;
第一判断模块,用于在确定所述第一数据块存储成功时,判断所述第一数据块是否为所述第一条带中的最后一个数据块;
第一计算模块,用于当所述第一判断模块的判断结果为是时,根据所述第一条带中已存储成功的所有数据块,计算所述第一条带中的第一校验块;
第二存储模块,用于向所述管理服务器发送针对所述第一校验块的存储地址获得请求,并获得所述管理服务器按照条带存储机制确定的第二存储地址,将所述第一校验块存储至所述第二存储地址。
可选的,在将所述第一数据块存储至所述第一存储地址之后,所述装置还包括:
第一删除模块,用于当所述第一数据块未存储成功时,删除所述第一数据块的已存储数据,并返回执行所述第一计算模块。
可选的,在将所述第一校验块存储至所述第二存储地址之后,所述装置还包括:
第二判断模块,用于判断所述第一校验块是否存储成功,如果否,则返回执行所述第一计算模块。
可选的,在所述第一判断模块之后,所述装置还包括:
检测模块,用于当所述第一数据块不是所述第一条带中的最后一个数据块时,检测预设时间段内是否接收到待存储至所述第一条带的第二数据块;
第二计算模块,用于当所述检测模块的检测结果为否时,根据所述第一条带中已存储成功的所有数据块,计算所述第一条带中的第二校验块;
第三存储模块,用于向所述管理服务器发送针对所述第二校验块的存储地址获得请求,并获得所述管理服务器按照条带存储机制确定的第三存储地址,将所述第二校验块存储至所述第三存储地址。
可选的,所述第一条带中用于存储数据块的存储单元未存满时,所述装置还包括:
第二接收模块,用于在将所述第二校验块存储至所述第三存储地址之后,接收所述第二数据块;
第四存储模块,用于向所述管理服务器发送针对所述第二数据块的存储地址获得请求,并获得所述管理服务器按照条带存储机制确定的第四存储地址,将所述第二数据块存储至所述第四存储地址;
第三判断模块,用于在确定所述第二数据块存储成功时,判断所述第二数据块是否为所述第一条带中的最后一个数据块;
第三计算模块,用于当所述第三判断模块的判断结果为是时,根据所述第一条带中已存储成功的所有数据块,计算所述第一条带中的第三校验块;
更新模块,用于将所述第二校验块更新为所述第三校验块。
可选的,在将所述第二数据块存储至所述第四存储地址之后,所述装置还包括:
第二删除模块,用于当所述第二数据块为存储所述第二校验块后接收到的第一个数据块,且所述第二数据块未存储成功时,删除所述第二数据块的已存储数据。
可选的,在将所述第二数据块存储至所述第四存储地址之后,所述方法还包括:
第三删除模块,用于当所述第三数据块不是存储所述第二校验块后接收到的第一个数据块,且所述第二数据块未存储成功时,删除所述第二数据块的已存储数据,并返回执行所述第三计算模块。
为了达到上述目的,本申请公开了一种数据存储系统,包括:管理服务器和存储服务器;所述存储服务器包括:主存储服务器和非主存储服务器,其中,所述主存储服务器为所述存储服务器中的任意一个;
所述主存储服务器,用于接收待存储至第一条带的第一数据块,向所述管理服务器发送针对所述第一数据块的存储地址获得请求;
所述管理服务器,用于接收所述主存储服务器发送的针对所述第一数据块的存储地址获得请求,按照条带存储机制确定第一存储地址,并将所述第一存储地址发送至所述主存储服务器;
所述主存储服务器,用于接收所述管理服务器发送的所述第一存储地址,将所述第一数据块存储至所述第一存储地址;在确定所述第一数据块存储成功时,判断所述第一数据块是否为所述第一条带中的最后一个数据块,如果是,则根据所述第一条带中已存储成功的所有数据块,计算所述第一条带中的第一校验块;向所述管理服务器发送针对所述第一校验块的存储地址获得请求;
所述管理服务器,用于接收所述主存储服务器发送的针对所述第一校验块的存储地址获得请求,按照条带存储机制确定第二存储地址,并将所述第二存储地址发送至所述主存储服务器;
所述主存储服务器,用于接收所述管理服务器发送的所述第二存储地址,并将所述第一校验块存储至所述第二存储地址。
可选的,所述管理服务器,还用于当检测到所述第一数据块未存储成功,且当检测到所述主存储服务器发生异常时,删除所述第一数据块的已存储数据,从所述非主存储服务器中选择新的主存储服务器,将所述主存储服务器切换为所述新的主存储服务器,并向所述主存储服务器发送针对所述第一校验块的计算指令,其中,所述计算指令携带所述第一条带中已存储成功的所有数据块的存储地址;
所述主存储服务器,用于接收所述管理服务器发送的所述计算指令,并根据所述计算指令中携带的存储地址,获得数据块,根据所获得的数据块,计算所述第一条带中的第一校验块。
由上述技术方案可见,本申请实施例中,作为执行主体的主存储服务器在接收到待存储至第一条带的第一数据块时,向管理服务器请求第一数据块的第一存储地址,在获得第一存储地址后将第一数据块存储至第一存储地址。在确定第一数据块存储成功时,判断该第一数据块是否为第一条带中的最后一个数据块,如果是,则根据第一条带中已存储成功的所有数据块,计算第一条带中的第一校验块。然后,向管理服务器请求第一校验块的第二存储地址,在获得第二存储地址后将第一校验块存储至第二存储地址。
也就是说,本申请实施例中,先存储数据块,在条带中的所有数据块均存储成功时,根据条带中存储成功的数据块计算校验块,再存储校验块。而现有技术中,而现有技术中,先根据数据块计算出校验块,在条带中的数据块和校验块均具备的情况下,将数据块和校验块同时进行存储。如果存储过程中遭遇断电事故,数据块和校验块均有可能出现存储不成功的情况,这时将导致数据块和校验块不一致,出现Write Hole问题。应用本申请实施例的方案,在第一条带中的数据块均存储成功的情况下,再计算并存储校验块,即便存储过程中遭遇断电事故,也能够尽可能避免出现数据块和校验块不一致的问题。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a为条带的一种结构示意图;
图1b为条带与服务器的逻辑关系的一种示意图;
图2为本申请实施例提供的一种实施方式中的数据存储系统的结构示意图;
图3为本申请实施例提供的数据存储方法的一种流程示意图;
图4为本申请实施例提供的数据存储方法的另一种流程示意图;
图5a为已存储数据后的条带的一种结构示意图;
图5b为已存储数据后的条带的另一种结构示意图;
图5c为已存储数据后的条带的再一种结构示意图;
图6为本申请实施例提供的数据存储装置的一种结构示意图;
图7为本申请实施例提供的数据存储装置的另一种结构示意图;
图8为本申请实施例提供的数据存储系统的一种结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整的描述。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供了一种数据存储方法、装置及系统,能够尽可能避免出现数据块和校验块不一致的问题。本申请可以应用于数据存储系统中的主存储服务器。该数据存储系统可以包括管理服务器和存储服务器。存储服务器又可以包括主存储服务器和非主存储服务器,主存储服务器可以为存储服务器中的任意一个。
图2为本申请实施例的一种实施方式中的数据存储系统的结构示意图。这种数据存储系统也可以称为分布式存储系统。该系统可以包括管理服务器21、存储服务器22和客户端23。其中,管理服务器21(Master Data Services,MDS)又称为元数据服务器,用于组织、管理存储服务器22中的存储空间信息。存储服务器22,又称为对象服务器、存储节点等,可以接收客户端23下发的待存储的数据以及向自身和其他存储服务器下发存储任务,承担部分计算任务等。客户端23,用于向存储服务器下发待存储数据。
下面通过具体实施例,对本申请进行详细说明。
图3为本申请实施例提供的数据存储方法的一种流程示意图,应用于数据存储系统中的主存储服务器,其中,数据存储系统包括:管理服务器和存储服务器。存储服务器包括:主存储服务器和非主存储服务器。主存储服务器为存储服务器中的任意一个。具体的,该方法包括如下步骤:
步骤S301:接收待存储至第一条带的第一数据块。其中,第一数据块的数量为一个。
主存储服务器接收的第一数据块,可以是第一条带的第一个数据块,也可以是第一条带的最后一个数据块。
当第一数据块为第一条带的第一个数据块时,作为执行主体的主存储服务器并不知道第一条带是哪个条带。这时,主存储服务器可以向管理服务器发送条带获得请求,管理服务器接收到主存储服务器发送的条带获得请求后,按照条带分配机制确定第一条带,并将第一条带发送至主存储服务器,主存储服务器接收并记录第一条带。管理服务器确定第一条带,可以包括确定第一条带的标识。
其中,上述条带分配机制,可以理解为条带分配规则,其可以采用现有技术中的条带分配规则,本实施例对此不再细述。另外,该条带获得请求中可以携带所要获取的条带的格式,该格式可以包括条带中用于存储数据块的存储单元的第一数量、用于存储校验块的存储单元的第二数量。
例如,作为执行主体的主存储服务器所要获取的条带中包括4个存储数据块的存储单元和1个存储校验块的存储单元。
当第一数据块不为第一条带的第一个数据块时,作为执行主体的主存储服务器已经确定第一条带是哪个条带了。具体的,当第一数据块不为第一条带的第一个数据块时,主存储服务器可以根据保存的第一条带的标记,确定第一数据块对应的第一条带。其中,第一条带的标记可以是当第一数据块为第一条带的第一个数据块时主存储服务器接收管理服务器确定的第一条带后保存的。
需要说明的是,当客户端将待存储的文件发送至主存储服务器时,主存储服务器可以根据自身存储的条带中每个用于存储数据块的存储单元的大小,对文件数据进行划分,一一获得多个数据块。
例如,待存储的文件A的大小为1.6MB,条带中每个用于存储数据块的存储单元的大小为1MB,那么主存储服务器可以将该文件A划分成2个数据块,一个是1MB,一个是0.6MB。步骤S301中接收到的第一数据块,可以是第一个数据块,也可以是第二个数据块。
步骤S302:向管理服务器发送针对第一数据块的存储地址获得请求,并获得管理服务器按照条带存储机制确定的第一存储地址,将第一数据块存储至所述第一存储地址。
其中,条带存储机制,也可以理解为条带存储规则,其中包括条带中各个数据块和各个校验块的存储地址分配规则。本实施例中的条带存储机制可以采用现有技术中的存储机制,本实施例不再对其细述。
具体的,当第一数据块为第一条带中的第一个数据块时,作为执行主体的主存储服务器,可以同时向管理服务器发送针对第一数据块的条带获得请求和针对第一数据块的存储地址获得请求,也可以先后向管理服务器发送针对第一数据块的条带获得请求和针对第一数据块的存储地址获得请求。
管理服务器确定的用于存储第一数据块的第一存储地址,可以包括:用于存储第一数据块的第一存储服务器以及其中的磁盘。第一存储服务器可以为数据存储系统中所有存储服务器中的任意一个,包括主存储服务器自身。也就是说,第一存储地址可以位于主存储服务器自身,也可以位于该数据存储系统中的其他存储服务器上。
当第一存储地址位于主存储服务器自身时,将第一数据块存储至第一存储地址,可以包括:主存储服务器直接将第一数据块存储至第一存储地址。
当第一存储地址位于该数据存储系统中的其他存储服务器上时,将第一数据块存储至第一存储地址,可以包括:主存储服务器将第一数据块发送至所述其他存储服务器,以使其他存储服务器将第一数据块存储至第一存储地址。
步骤S303:在确定第一数据块存储成功时,判断第一数据块是否为第一条带中的最后一个数据块,如果是,则执行步骤S304。
具体的,本步骤可以包括:判断第一数据块是否已存储成功,如果是,则判断第一数据块是否为第一条带中的最后一个数据块。
在判断第一数据块是否已存储成功时,为了提高判断结果的准确性,主存储服务器在将待存储的文件分割成数据块时,可以按照一个数据块对应同一个文件的方式来划分。也就是说,第一数据中的数据来自一个文件。当一个文件的大小小于条带中用于存储数据的存储单元的大小时,这个文件被当作一个数据块来存储,而不再将其他文件的数据填充在该数据块中。这样,可以避免下述情况:当一个数据块的数据来自至少两个文件时,如果一个文件的数据存储成功,另一个文件的数据存储失败,最终可能无法确定该数据块是否存储成功。
判断第一数据块是否已存储成功,可以包括以下实施方式:
当第一存储地址位于主存储服务器自身时,主存储服务器可以直接判断第一数据块是否已存储成功。
当第一存储地址位于该数据存储系统中的其他存储服务器上时,主存储服务器可以检测预设时间段内是否接收到其他存储服务器发送的第一数据块存储成功的确认信息,如果接收到,则确定第一数据块已存储成功。
判断第一数据块是否为第一条带中的最后一个数据块,可以包括:主存储服务器根据自身记录的第一条带中已存储的数据块的数量以及第一条带中用于存储数据块的存储单元的总数量,判断第一数据块是否为第一条带中的最后一个数据块。
当判断出第一数据块不为第一条带中的最后一个数据块时,当第一数据块已存储成功时,主存储服务器可以继续接收待存储至第一条带的下一个第一数据块,向管理服务器发送针对该下一个第一数据块的存储地址获得请求,并获得管理服务器按照条带存储机制确定的下一个第一存储地址,将该下一个第一数据块存储至该下一个第一存储地址。直到将第一条带中用于存储数据块的存储单元存满数据,然后再执行步骤S304。
也就是说,第一条带中的每个数据块是顺序存储的,并且,在第一个数据块存储成功之后,才继续存储第二个数据块,直至第一条带中的最后一个数据块存储成功,才计算并存储校验块。
可以理解的是,对于按照本实施例的方式存储的数据块,当第一条带中的最后一个数据块存储成功时,说明该第一条带中的所有数据块均存储成功。
步骤S304:根据第一条带中已存储成功的所有数据块,计算第一条带中的第一校验块。
具体的,由于通常情况下条带中的各个数据块存储在不同的存储服务器上,因此,根据第一条带中已存储成功的所有数据块,计算第一条带中的第一校验块,可以包括以下实施方式:
当主存储服务器缓存第一条带中已存储成功的所有数据块时,主存储服务器获得自身缓存的第一条带中已存储成功的所有数据块,并根据获得的数据块,计算第一条带中的第一校验块。
当主存储服务器不缓存第一条带中已存储成功的所有数据块时,主存储服务器分别向各个第一存储服务器发送第一条带数据块的获得请求,其中,第一存储服务器为存储第一条带数据块的服务器。主存储服务器获得各个第一存储服务器发送的第一条带中的数据块,并根据获得的数据块,计算第一条带中的第一校验块。
需要说明的是,根据数据块计算校验块的方法可以采用现有技术中对应的方法,其具体过程此处不再细述。
步骤S305:向管理服务器发送针对第一校验块的存储地址获得请求,并获得管理服务器按照条带存储机制确定的第二存储地址,将第一校验块存储至第二存储地址。
需要说明的是,步骤S305与步骤S302基本类似,因此步骤S305可以参照步骤S302中的相关内容,其具体过程不再细述。
由上述内容可知,本实施例中,作为执行主体的主存储服务器在接收到待存储至第一条带的第一数据块时,向管理服务器请求第一数据块的第一存储地址,在获得第一存储地址后将第一数据块存储至第一存储地址。在确定第一数据块存储成功时,判断该第一数据块是否为第一条带中的最后一个数据块,如果是,则根据第一条带中已存储成功的所有数据块,计算第一条带中的第一校验块。然后,向管理服务器请求第一校验块的第二存储地址,在获得第二存储地址后将第一校验块存储至第二存储地址。
也就是说,本申请实施例中,先存储数据块,在条带中的所有数据块均存储成功时,根据条带中存储成功的数据块计算校验块,再存储校验块。而现有技术中,而现有技术中,先根据数据块计算出校验块,在条带中的数据块和校验块均具备的情况下,将数据块和校验块同时进行存储。如果存储过程中遭遇断电事故,数据块和校验块均有可能出现存储不成功的情况,这时将导致数据块和校验块不一致,出现Write Hole问题。应用本申请实施例的方案,在第一条带中的数据块均存储成功的情况下,再计算并存储校验块,即便存储过程中遭遇断电事故,也能够尽可能避免出现数据块和校验块不一致的问题。
作为一种具体的实施方式,在图3所示实施例中,为了进一步保证数据块和校验块的一致性,在步骤S302之后,即在将第一数据块存储至第一存储地址之后,当第一数据块未存储成功时,所述方法还可以包括:
删除第一数据块的已存储数据,并返回执行步骤S304,即返回执行根据第一条带中已存储成功的所有数据块,计算第一条带中的第一校验块的步骤。
需要说明的是,第一数据块未存储成功,可能是第一数据块的数据只存储了一部分,另一部分没有存储成功;也可能是第一数据块的全部数据均已存储,但是其中部分数据发生错误。
具体的,当第一数据块未存储成功时,删除第一数据块的已存储数据,可以包括如下实施方式:
当第一存储地址位于主存储服务器自身时,即第一数据块存储于主存储服务器自身时,主存储服务器可以直接删除第一数据块的已存储数据。
当第一存储地址位于该数据存储系统中的其他存储服务器上时,即第一数据块存储于第一存储服务器时,主存储服务器可以向第一存储服务器发送删除第一数据块的删除指令,第一存储服务器在接收到主存储服务器发送的删除指令之后删除第一数据块的已存储数据。其中,第一存储服务器为存储第一数据块的服务器。
当然,删除第一数据块的已存储数据的步骤,也可以由主存储服务器来执行。即,主存储服务器可以判断预设时间段内是否接收到第一存储服务器发送的第一数据块存储成功的确认信息,如果未接收到,则确定第一数据块未存储成功,向第一存储服务器发送删除第一数据块的删除指令,第一存储服务器在接收到管理服务器发送的删除指令之后删除第一数据块的已存储数据。其中,第一存储服务器为存储第一数据块的服务器。在这种实施方式中,第一存储服务器可以是主存储服务器,也可以是非主存储服务器。
需要说明的是,当第一数据块为第一条带中的第一个数据块时,删除第一数据块的已存储数据之后,该第一条带中不存在已存储成功的数据块,也就不需要执行计算第一校验块的步骤。当第一数据块不为第一条带中的第一个数据块时,删除第一数据块的已存储数据之后,该第一条带中存在已存储成功的数据块,可以继续执行计算第一校验块的步骤。
可见,在这种实施方式中,当第一条带中的某个数据块未存储成功时,删除该数据块的已存储数据,根据第一条带中已存储成功的所有数据块计算校验块,并存储校验块。这样,能够避免未存储成功的数据块污染该条带,进一步保证条带中数据块与校验块之间的一致性。
作为一种具体的实施方式,在图3所示实施例中,为了进一步保证数据块和校验块的一致性,在步骤S305之后,即在将第一校验块存储至第二存储地址之后,所述方法还可以包括:
判断第一校验块是否存储成功,如果否,则返回执行步骤S304。
具体的,判断第一校验块是否存储成功,可以包括以下实施方式:
当第二存储地址位于主存储服务器自身时,主存储服务器可以直接判断第一校验块是否已存储成功。
当第二存储地址位于该数据存储系统中的其他存储服务器上时,主存储服务器可以检测预设时间段内是否接收到其他存储服务器发送的第一校验块存储成功的确认信息,如果接收到,则确定第一校验块已存储成功。
当第一校验块未存储成功时,主存储服务器重新根据第一条带中已存储成功的所有数据块,计算第一条带中的第一校验块;重新向管理服务器发送针对第一校验块的存储地址获得请求,并重新获得管理服务器按照条带存储机制确定的第二存储地址,将第一校验块存储至第二存储地址。
需要说明的是,第一校验块未存储成功,可能是由于存储第一校验块的存储服务器发生异常,因此需要重新获取第一校验块的存储地址。
当然,当判断出第一校验块未存储成功时,还可以删除第一校验块的已存储数据,以节省存储空间。
在本申请的另一实施例中,在图3所示实施例的基础上,当第一条带中用于存储数据块的存储单元未存满时,如果长时间接收不到其他文件数据,则为了保证数据的安全性,这种情况下仍然要计算并存储校验块。因此,在步骤S303的判断结果为否时,所述方法还可以包括如图4所示的步骤:
步骤S306:当第一数据块不是第一条带中的最后一个数据块时,检测预设时间段内是否接收到待存储至第一条带的第二数据块,如果未接收到,则执行步骤S307。
需要说明的是,如果主存储服务器在预设时间段内未接收到待存储至第一条带的第二数据块,为了避免第一条带长期处于可写入状态,无法计算校验块,可以在第一条带未存满时,计算并存储校验块。这样,管理服务器在检测到校验块存储成功时,可以将第一条带的状态暂时设置为不可写入。
步骤S307:根据第一条带中已存储成功的所有数据块,计算第一条带中的第二校验块。
步骤S308:向所述管理服务器发送针对第二校验块的存储地址获得请求,并获得管理服务器按照条带存储机制确定的第三存储地址,将第二校验块存储至第三存储地址。
需要指出的是,图4所示实施例中的步骤S307和S308分别与图3所示实施例中的步骤S304和S305类似,因此,可以参照图3所示实施例中的相关描述。
可见,在本实施例中,当第一条带中用于存储数据块的存储单元未存满时,如果预设时间段内主存储服务器没有接收到待存储至第一条带的新的数据块,则直接计算并存储校验块,从而可以避免条带长时间处于可写入状态,进一步保证条带中已存储数据的安全性。
作为一种具体的实施方式,在图4所示实施例中,第一条带中用于存储数据块的存储单元未存满时,在将第二校验块存储至第三存储地址之后,如果接收到了第二数据块,还可以将第二数据块再存储至第一条带。因此,所述方法还可以包括:
步骤1:接收所述第二数据块。
步骤2:向管理服务器发送针对第二数据块的存储地址获得请求,并获得管理服务器按照条带存储机制确定的第四存储地址,将第二数据块存储至第四存储地址。
步骤3:在确定第二数据块存储成功时,判断第二数据块是否为第一条带中的最后一个数据块,如果是,则执行步骤4。
步骤4:根据第一条带中已存储成功的所有数据块,计算第一条带中的第三校验块。
步骤5:将第二校验块更新为第三校验块。
下面以一个具体的实例来详细说明上述过程。
在图5a所示条带A中,包括4个用于存储数据块的存储单元和1个用于存储校验块的存储单元。已知该条带A中存储了数据块D1、数据块D2以及校验块P。当接收到待存储至该条带A中的数据块D3时,向管理服务器发送数据块D3的存储地址获得请求,并获得管理服务器按照条带存储机制确定的存储地址,将数据块D3存储至该存储地址。
在确定数据块D3存储成功时,判断数据块D3不为条带A中的最后一个数据块,继续针对接收的待存储至条带A的数据块D4,向管理服务器发送数据块D4的存储地址获得请求,并获得管理服务器按照条带存储机制确定的存储地址,将数据块D4存储至该存储地址。
在确定数据块D4存储成功时,判断出数据块D4为条带A中的最后一个数据块,此时,根据条带A中已存储成功的数据块D1~D4,计算条带A中的校验块P′,并将校验块P更新为P′。此时条带A变为图5b所示的形式,其中包含数据块D1~D4以及校验块P′。
可见,在本实施方式中,在条带中用于存储数据块的存储单元未存满的情况下,当校验块已被存储之后,主存储服务器再次接收到待存储至该条带的数据块时,存储这些数据块,当该条带中用于存储数据块的存储单元存满时,并且最后一个数据块也存储成功时,重新根据该条带中的数据块计算并更新校验块。
作为一种具体的实施方式,在图4所示实施例中,为了进一步保证数据块和校验块的一致性,在上述步骤2之后,即在将第二数据块存储至第四存储地址之后,所述方法还可以包括:
当第二数据块为存储第二校验块后接收到的第一个数据块,且第二数据块未存储成功时,删除第二数据块的已存储数据。
仍然以图5a和图5b所示的条带为例来说明。图5a所示的条带A中已经存储了数据块D1和D2以及校验块P,当接收到数据块D3时,数据块D3是存储校验块P之后接收到的待存储至条带A的第一个数据块,如果数据块D3在存储过程中发生异常,未存储成功,则直接删除D3的已存储数据即可,从而可以保证条带A中数据块和校验块的一致性。即直接删除数据块D3之后,条带A恢复成了图5a的形式,回退到了未写入数据块D3时的版本。
作为一种具体的实施方式,在图4所示实施例中,为了进一步保证数据块和校验块的一致性,在上述步骤2之后,在将第二数据块存储至第四存储地址之后,所述方法还可以包括:
当第三数据块不是存储第二校验块后接收到的第一个数据块,且第二数据块未存储成功时,删除第二数据块的已存储数据,并返回执行根据所述第一条带中已存储成功的所有数据块,计算所述第一条带中的第三校验块的步骤,即返回执行步骤4。
仍然以图5a和图5b所示的条带为例来说明。图5a所示的条带A中已经存储了数据块D1和D2以及校验块P,当接收到数据块D3时,可以判断出数据块D3是存储校验块P之后接收到的待存储至条带A的第一个数据块。当数据块D3存储成功时,继续存储数据块D4,数据块D4不是存储校验块P之后接收到的待存储至条带A的第一个数据块。当数据块D4未存储成功时,主存储服务器在删除数据块D4的同时,还要根据条带A中已存储成功的D1、D2和D3计算校验块P〞,将校验块P更新为校验块P〞。这时,条带A变成了图5c所示的形式,其中包含数据块D1、D2、D3和校验块P〞。
在该实施方式中,存储成功的数据块D3已经改变了条带A中的数据块与校验块的一致性,因此,应重新计算并更新校验块,以保证数据块与校验块的一致性。
作为一种具体的实施方式,在图4所示实施例中,为了进一步保证数据块和校验块的一致性,所述方法还可以包括:
判断第三校验块是否更新成功,如果否,则返回执行根据第一条带中已存储成功的所有数据块,计算第一条带中的第三校验块的步骤,即返回执行步骤4。
仍然以图5a和图5b所示的条带为例来说明。图5a所示的条带A中已经存储了数据块D1和D2以及校验块P,图5b所示的条带A中又添加了数据块D3和D4,并且将校验块P更新为了校验块P′。当检测到更新过程中发生了异常,P′未更新成功时,则可以重新根据数据块D1~D4计算校验块P0,将校验块P′更新为P0,以保证校验块更新成功。
图6为本申请实施例提供的数据存储装置的一种结构示意图,与图3所示方法实施例相对应,应用于数据存储系统中的主存储服务器,其中,数据存储系统包括:管理服务器和存储服务器;所述存储服务器包括:主存储服务器和非主存储服务器;所述主存储服务器为所述存储服务器中的任意一个。
具体的,所述装置包括:
第一接收模块601,用于接收待存储至第一条带的第一数据块;
第一存储模块602,用于向所述管理服务器发送针对所述第一数据块的存储地址获得请求,并获得所述管理服务器按照条带存储机制确定的第一存储地址,将所述第一数据块存储至所述第一存储地址;
第一判断模块603,用于在确定所述第一数据块存储成功时,判断所述第一数据块是否为所述第一条带中的最后一个数据块;
第一计算模块604,用于当所述第一判断模块603的判断结果为是时,根据所述第一条带中已存储成功的所有数据块,计算所述第一条带中的第一校验块;
第二存储模块605,用于向所述管理服务器发送针对所述第一校验块的存储地址获得请求,并获得所述管理服务器按照条带存储机制确定的第二存储地址,将所述第一校验块存储至所述第二存储地址。
作为一种具体的实施方式,在图6所示实施例中,在将所述第一数据块存储至所述第一存储地址之后,所述装置还可以包括:
第一删除模块(图中未示出),用于当所述第一数据块未存储成功时,删除所述第一数据块的已存储数据,并返回执行所述第一计算模块604。
作为一种具体的实施方式,在图6所示实施例中,在将所述第一校验块存储至所述第二存储地址之后,所述装置还可以包括:
第二判断模块(图中未示出),用于判断所述第一校验块是否存储成功,如果否,则返回执行所述第一计算模块604。
在本申请的另一实施方式中,在图6所示实施例中,在所述第一判断模块603之后,所述装置还可以包括以下模块,这些模块可以如图7所示,图7所示实施例与与图4所示方法实施例相对应。
检测模块606,用于当所述第一数据块不是所述第一条带中的最后一个数据块时,检测预设时间段内是否接收到待存储至所述第一条带的第二数据块;
第二计算模块607,用于当所述检测模块的检测结果为否时,根据所述第一条带中已存储成功的所有数据块,计算所述第一条带中的第二校验块;
第三存储模块608,用于向所述管理服务器发送针对所述第二校验块的存储地址获得请求,并获得所述管理服务器按照条带存储机制确定的第三存储地址,将所述第二校验块存储至所述第三存储地址。
作为一种具体的实施方式,在图7所示实施例中,所述第一条带中用于存储数据块的存储单元未存满时,所述装置还可以包括:
第二接收模块(图中未示出),用于在将所述第二校验块存储至所述第三存储地址之后,接收所述第二数据块;
第四存储模块(图中未示出),用于向所述管理服务器发送针对所述第二数据块的存储地址获得请求,并获得所述管理服务器按照条带存储机制确定的第四存储地址,将所述第二数据块存储至所述第四存储地址;
第三判断模块(图中未示出),用于在确定所述第二数据块存储成功时,判断所述第二数据块是否为所述第一条带中的最后一个数据块;
第三计算模块(图中未示出),用于当所述第三判断模块的判断结果为是时,根据所述第一条带中已存储成功的所有数据块,计算所述第一条带中的第三校验块;
更新模块(图中未示出),用于将所述第二校验块更新为所述第三校验块。
作为一种具体的实施方式,在图7所示实施例中,在将所述第二数据块存储至所述第四存储地址之后,所述装置还可以包括:
第二删除模块(图中未示出),用于当所述第二数据块为存储所述第二校验块后接收到的第一个数据块,且所述第二数据块未存储成功时,删除所述第二数据块的已存储数据。
作为一种具体的实施方式,在图7所示实施例中,在将所述第二数据块存储至所述第四存储地址之后,所述装置还可以包括:
第三删除模块(图中未示出),用于当所述第三数据块不是存储所述第二校验块后接收到的第一个数据块,且所述第二数据块未存储成功时,删除所述第二数据块的已存储数据,并返回执行所述第三计算模块。
图8为本申请实施例提供的数据存储系统的一种结构示意图,该系统包括:管理服务器81和存储服务器82;所述存储服务器82包括:主存储服务器821和非主存储服务器822,其中,所述主存储服务器为所述存储服务器中的任意一个;
所述主存储服务器821,用于接收待存储至第一条带的第一数据块,向所述管理服务器81发送针对所述第一数据块的存储地址获得请求;
所述管理服务器81,用于接收所述主存储服务器821发送的针对所述第一数据块的存储地址获得请求,按照条带存储机制确定第一存储地址,并将所述第一存储地址发送至所述主存储服务器821;
所述主存储服务器821,用于接收所述管理服务器81发送的所述第一存储地址,将所述第一数据块存储至所述第一存储地址;在确定所述第一数据块存储成功时,判断所述第一数据块是否为所述第一条带中的最后一个数据块,如果是,则根据所述第一条带中已存储成功的所有数据块,计算所述第一条带中的第一校验块;向所述管理服务器81发送针对所述第一校验块的存储地址获得请求;
所述管理服务器81,用于接收所述主存储服务器821发送的针对所述第一校验块的存储地址获得请求,按照条带存储机制确定第二存储地址,并将所述第二存储地址发送至所述主存储服务器821;
所述主存储服务器821,用于接收所述管理服务器81发送的所述第二存储地址,并将所述第一校验块存储至所述第二存储地址。
作为一种具体的实施方式,在图8所示实施例中,所述管理服务器81,还用于当检测到所述第一数据块未存储成功,且当检测到所述主存储服务器821发生异常时,删除所述第一数据块的已存储数据,从所述非主存储服务器822中选择新的主存储服务器,将所述主存储服务器切换为所述新的主存储服务器,并向所述主存储服务器发送针对所述第一校验块的计算指令,其中,所述计算指令携带所述第一条带中已存储成功的所有数据块的存储地址;
所述主存储服务器,用于接收所述管理服务器81发送的所述计算指令,并根据所述计算指令中携带的存储地址,获得数据块,根据所获得的数据块,计算所述第一条带中的第一校验块。
可以理解的是,第一数据块未存储成功可能是由多种原因造成的,可以是存储该第一数据块的存储服务器发生了异常,也可以是主存储服务器发生了异常。当管理服务器检测到主存储服务器发生了异常时,可以从存储服务器中重新选择新的存储服务器作为主存储服务器。
由于上述装置实施例和系统实施例是基于方法实施例得到的,与该方法具有相同的技术效果,因此装置实施例和系统实施例的技术效果在此不再赘述。
对于装置实施例和系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本领域普通技术人员可以理解,上述实施方式中的全部或部分步骤是能够通过程序指令相关的硬件来完成的,所述的程序可以存储于计算机可读取存储介质中。这里所称存储介质,是指ROM/RAM、磁碟、光盘等。
以上所述仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本申请的保护范围内。

Claims (17)

1.一种数据存储方法,其特征在于,应用于数据存储系统中的主存储服务器,其中,所述数据存储系统包括:管理服务器和存储服务器;所述存储服务器包括:主存储服务器和非主存储服务器;所述主存储服务器为所述存储服务器中的任意一个;所述方法包括:
接收待存储至第一条带的第一数据块;
向所述管理服务器发送针对所述第一数据块的存储地址获得请求,并获得所述管理服务器按照条带存储机制确定的第一存储地址,将所述第一数据块存储至所述第一存储地址;
在确定所述第一数据块存储成功时,判断所述第一数据块是否为所述第一条带中的最后一个数据块;
如果是,则根据所述第一条带中已存储成功的所有数据块,计算所述第一条带中的第一校验块;
向所述管理服务器发送针对所述第一校验块的存储地址获得请求,并获得所述管理服务器按照条带存储机制确定的第二存储地址,将所述第一校验块存储至所述第二存储地址。
2.根据权利要求1所述的方法,其特征在于,在将所述第一数据块存储至所述第一存储地址之后,所述方法还包括:
当所述第一数据块未存储成功时,删除所述第一数据块的已存储数据,并返回执行所述根据所述第一条带中已存储成功的所有数据块,计算所述第一条带中的第一校验块的步骤。
3.根据权利要求2所述的方法,其特征在于,在将所述第一校验块存储至所述第二存储地址之后,所述方法还包括:
判断所述第一校验块是否存储成功;
如果否,则返回执行所述根据所述第一条带中已存储成功的所有数据块,计算所述第一条带中的第一校验块的步骤。
4.根据权利要求2所述的方法,其特征在于,当判断出所述第一数据块不是所述第一条带中的最后一个数据块时,所述方法还包括:
检测预设时间段内是否接收到待存储至所述第一条带的第二数据块;
如果未接收到,则根据所述第一条带中已存储成功的所有数据块,计算所述第一条带中的第二校验块;
向所述管理服务器发送针对所述第二校验块的存储地址获得请求,并获得所述管理服务器按照条带存储机制确定的第三存储地址,将所述第二校验块存储至所述第三存储地址。
5.根据权利要求4所述的方法,其特征在于,所述第一条带中用于存储数据块的存储单元未存满时,在将所述第二校验块存储至所述第三存储地址之后,所述方法还包括:
接收所述第二数据块;
向所述管理服务器发送针对所述第二数据块的存储地址获得请求,并获得所述管理服务器按照条带存储机制确定的第四存储地址,将所述第二数据块存储至所述第四存储地址;
在确定所述第二数据块存储成功时,判断所述第二数据块是否为所述第一条带中的最后一个数据块;
如果是,则根据所述第一条带中已存储成功的所有数据块,计算所述第一条带中的第三校验块;
将所述第二校验块更新为所述第三校验块。
6.根据权利要求5所述的方法,其特征在于,在将所述第二数据块存储至所述第四存储地址之后,所述方法还包括:
当所述第二数据块为存储所述第二校验块后接收到的第一个数据块,且所述第二数据块未存储成功时,删除所述第二数据块的已存储数据。
7.根据权利要求5所述的方法,其特征在于,在将所述第二数据块存储至所述第四存储地址之后,所述方法还包括:
当所述第三数据块不是存储所述第二校验块后接收到的第一个数据块,且所述第二数据块未存储成功时,删除所述第二数据块的已存储数据,并返回执行所述根据所述第一条带中已存储成功的所有数据块,计算所述第一条带中的第三校验块的步骤。
8.根据权利要求1~7任一项所述的方法,其特征在于,所述第一数据块中的数据来自一个文件。
9.一种数据存储装置,其特征在于,应用于数据存储系统中的主存储服务器,其中,所述数据存储系统包括:管理服务器和存储服务器;所述存储服务器包括:主存储服务器和非主存储服务器;所述主存储服务器为所述存储服务器中的任意一个;所述装置包括:
第一接收模块,用于接收待存储至第一条带的第一数据块;
第一存储模块,用于向所述管理服务器发送针对所述第一数据块的存储地址获得请求,并获得所述管理服务器按照条带存储机制确定的第一存储地址,将所述第一数据块存储至所述第一存储地址;
第一判断模块,用于在确定所述第一数据块存储成功时,判断所述第一数据块是否为所述第一条带中的最后一个数据块;
第一计算模块,用于当所述第一判断模块的判断结果为是时,根据所述第一条带中已存储成功的所有数据块,计算所述第一条带中的第一校验块;
第二存储模块,用于向所述管理服务器发送针对所述第一校验块的存储地址获得请求,并获得所述管理服务器按照条带存储机制确定的第二存储地址,将所述第一校验块存储至所述第二存储地址。
10.根据权利要求9所述的装置,其特征在于,在将所述第一数据块存储至所述第一存储地址之后,所述装置还包括:
第一删除模块,用于当所述第一数据块未存储成功时,删除所述第一数据块的已存储数据,并返回执行所述第一计算模块。
11.根据权利要求10所述的装置,其特征在于,在将所述第一校验块存储至所述第二存储地址之后,所述装置还包括:
第二判断模块,用于判断所述第一校验块是否存储成功,如果否,则返回执行所述第一计算模块。
12.根据权利要求10所述的装置,其特征在于,在所述第一判断模块之后,所述装置还包括:
检测模块,用于当所述第一数据块不是所述第一条带中的最后一个数据块时,检测预设时间段内是否接收到待存储至所述第一条带的第二数据块;
第二计算模块,用于当所述检测模块的检测结果为否时,根据所述第一条带中已存储成功的所有数据块,计算所述第一条带中的第二校验块;
第三存储模块,用于向所述管理服务器发送针对所述第二校验块的存储地址获得请求,并获得所述管理服务器按照条带存储机制确定的第三存储地址,将所述第二校验块存储至所述第三存储地址。
13.根据权利要求12所述的装置,其特征在于,所述第一条带中用于存储数据块的存储单元未存满时,所述装置还包括:
第二接收模块,用于在将所述第二校验块存储至所述第三存储地址之后,接收所述第二数据块;
第四存储模块,用于向所述管理服务器发送针对所述第二数据块的存储地址获得请求,并获得所述管理服务器按照条带存储机制确定的第四存储地址,将所述第二数据块存储至所述第四存储地址;
第三判断模块,用于在确定所述第二数据块存储成功时,判断所述第二数据块是否为所述第一条带中的最后一个数据块;
第三计算模块,用于当所述第三判断模块的判断结果为是时,根据所述第一条带中已存储成功的所有数据块,计算所述第一条带中的第三校验块;
更新模块,用于将所述第二校验块更新为所述第三校验块。
14.根据权利要求13所述的装置,其特征在于,在将所述第二数据块存储至所述第四存储地址之后,所述装置还包括:
第二删除模块,用于当所述第二数据块为存储所述第二校验块后接收到的第一个数据块,且所述第二数据块未存储成功时,删除所述第二数据块的已存储数据。
15.根据权利要求13所述的装置,其特征在于,在将所述第二数据块存储至所述第四存储地址之后,所述装置还包括:
第三删除模块,用于当所述第三数据块不是存储所述第二校验块后接收到的第一个数据块,且所述第二数据块未存储成功时,删除所述第二数据块的已存储数据,并返回执行所述第三计算模块。
16.一种数据存储系统,其特征在于,包括:管理服务器和存储服务器;所述存储服务器包括:主存储服务器和非主存储服务器,其中,所述主存储服务器为所述存储服务器中的任意一个;
所述主存储服务器,用于接收待存储至第一条带的第一数据块,向所述管理服务器发送针对所述第一数据块的存储地址获得请求;
所述管理服务器,用于接收所述主存储服务器发送的针对所述第一数据块的存储地址获得请求,按照条带存储机制确定第一存储地址,并将所述第一存储地址发送至所述主存储服务器;
所述主存储服务器,用于接收所述管理服务器发送的所述第一存储地址,将所述第一数据块存储至所述第一存储地址;在确定所述第一数据块存储成功时,判断所述第一数据块是否为所述第一条带中的最后一个数据块,如果是,则根据所述第一条带中已存储成功的所有数据块,计算所述第一条带中的第一校验块;向所述管理服务器发送针对所述第一校验块的存储地址获得请求;
所述管理服务器,用于接收所述主存储服务器发送的针对所述第一校验块的存储地址获得请求,按照条带存储机制确定第二存储地址,并将所述第二存储地址发送至所述主存储服务器;
所述主存储服务器,用于接收所述管理服务器发送的所述第二存储地址,并将所述第一校验块存储至所述第二存储地址。
17.根据权利要求16所述的系统,其特征在于,
所述管理服务器,还用于当检测到所述第一数据块未存储成功,且当检测到所述主存储服务器发生异常时,删除所述第一数据块的已存储数据,从所述非主存储服务器中选择新的主存储服务器,将所述主存储服务器切换为所述新的主存储服务器,并向所述主存储服务器发送针对所述第一校验块的计算指令,其中,所述计算指令携带所述第一条带中已存储成功的所有数据块的存储地址;
所述主存储服务器,用于接收所述管理服务器发送的所述计算指令,并根据所述计算指令中携带的存储地址,获得数据块,根据所获得的数据块,计算所述第一条带中的第一校验块。
CN201610930966.4A 2016-10-31 2016-10-31 一种数据存储方法、装置及系统 Active CN108008909B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201610930966.4A CN108008909B (zh) 2016-10-31 2016-10-31 一种数据存储方法、装置及系统
PCT/CN2017/101847 WO2018076954A1 (zh) 2016-10-31 2017-09-15 一种数据存储方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610930966.4A CN108008909B (zh) 2016-10-31 2016-10-31 一种数据存储方法、装置及系统

Publications (2)

Publication Number Publication Date
CN108008909A true CN108008909A (zh) 2018-05-08
CN108008909B CN108008909B (zh) 2019-11-22

Family

ID=62024307

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610930966.4A Active CN108008909B (zh) 2016-10-31 2016-10-31 一种数据存储方法、装置及系统

Country Status (2)

Country Link
CN (1) CN108008909B (zh)
WO (1) WO2018076954A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110471615A (zh) * 2018-05-10 2019-11-19 杭州宏杉科技股份有限公司 一种数据写入方法及装置
CN111399780A (zh) * 2020-03-19 2020-07-10 支付宝(杭州)信息技术有限公司 一种数据的写入方法、装置以及设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110314218A1 (en) * 2010-06-22 2011-12-22 Lsi Corporation Parity-based raid system configured to protect against data corruption caused by the occurrence of write holes
CN103729150A (zh) * 2014-01-14 2014-04-16 浪潮电子信息产业股份有限公司 一种在存储阵列中处理Write Hole的方法
CN105404469A (zh) * 2015-10-22 2016-03-16 浙江宇视科技有限公司 一种视频数据的存储方法和系统
CN105930097A (zh) * 2015-05-20 2016-09-07 德州学院 一种消除局部并行中小写操作的分布校验式磁盘阵列
CN106027638A (zh) * 2016-05-18 2016-10-12 华中科技大学 一种基于混合编码的hadoop数据分发方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8392813B2 (en) * 2009-12-22 2013-03-05 Intel Corporation Redundant file system
CN102750195A (zh) * 2012-06-07 2012-10-24 浪潮电子信息产业股份有限公司 一种集群文件系统数据容错的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110314218A1 (en) * 2010-06-22 2011-12-22 Lsi Corporation Parity-based raid system configured to protect against data corruption caused by the occurrence of write holes
CN103729150A (zh) * 2014-01-14 2014-04-16 浪潮电子信息产业股份有限公司 一种在存储阵列中处理Write Hole的方法
CN105930097A (zh) * 2015-05-20 2016-09-07 德州学院 一种消除局部并行中小写操作的分布校验式磁盘阵列
CN105404469A (zh) * 2015-10-22 2016-03-16 浙江宇视科技有限公司 一种视频数据的存储方法和系统
CN106027638A (zh) * 2016-05-18 2016-10-12 华中科技大学 一种基于混合编码的hadoop数据分发方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110471615A (zh) * 2018-05-10 2019-11-19 杭州宏杉科技股份有限公司 一种数据写入方法及装置
CN110471615B (zh) * 2018-05-10 2022-08-02 杭州宏杉科技股份有限公司 一种数据写入方法及装置
CN111399780A (zh) * 2020-03-19 2020-07-10 支付宝(杭州)信息技术有限公司 一种数据的写入方法、装置以及设备
CN113835637A (zh) * 2020-03-19 2021-12-24 北京奥星贝斯科技有限公司 一种数据的写入方法、装置以及设备

Also Published As

Publication number Publication date
CN108008909B (zh) 2019-11-22
WO2018076954A1 (zh) 2018-05-03

Similar Documents

Publication Publication Date Title
CN106557703B (zh) 安全性检测
US8892941B2 (en) Recovering a volume table and data sets from a corrupted volume
US9372743B1 (en) System and method for storage management
CN107145432B (zh) 一种建立模型数据库的方法以及客户端
CN106325773B (zh) 一种存储系统数据的一致性保障方法、系统及缓存装置
US10261705B2 (en) Efficient data consistency verification for flash storage
CN109308238A (zh) 一种存储系统磁盘阵列坏盘调节的方法、装置及设备
KR101574451B1 (ko) 트랜잭션 메모리 시스템 내구성 부여
US7958432B2 (en) Verification of non volatile storage storing preserved unneeded data
CN108875061A (zh) 一种分布式文件系统的一致性测试方法及相关装置
US7047390B2 (en) Method, system, and program for managing a relationship between one target volume and one source volume
CN107329708A (zh) 一种分布式存储系统实现缓存数据的方法及系统
CN107391307A (zh) 存储区域网络存储设备快照功能的测试方法及装置
CN107590019A (zh) 一种数据存储的方法和装置
CN108073486A (zh) 一种硬盘故障的预测方法和装置
US9087092B2 (en) Logging updates to monitored data sets in a storage
CN108008909B (zh) 一种数据存储方法、装置及系统
US8843781B1 (en) Managing drive error information in data storage systems
CN114924923A (zh) 一种硬盘写入点正确性验证方法、系统、设备及介质
US7047378B2 (en) Method, system, and program for managing information on relationships between target volumes and source volumes when performing adding, withdrawing, and disaster recovery operations for the relationships
CN110187834A (zh) 重删副本的数据处理方法、装置、电子设备
CN104318960B (zh) 一种硬盘坏道的修复方法及装置
US20060107012A1 (en) Synchronizing logical systems
CN104205097A (zh) 一种去重方法装置与系统
US20140181445A1 (en) Systems and methods for processing instructions while repairing and providing access to a copied volume of data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant