CN102317923B - 存储系统 - Google Patents

存储系统 Download PDF

Info

Publication number
CN102317923B
CN102317923B CN200980156976.5A CN200980156976A CN102317923B CN 102317923 B CN102317923 B CN 102317923B CN 200980156976 A CN200980156976 A CN 200980156976A CN 102317923 B CN102317923 B CN 102317923B
Authority
CN
China
Prior art keywords
data
copy
source file
file system
storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN200980156976.5A
Other languages
English (en)
Other versions
CN102317923A (zh
Inventor
广永龙治
长根悟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
NEC Solution Innovators Ltd
Original Assignee
NEC Corp
NEC Solution Innovators Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, NEC Solution Innovators Ltd filed Critical NEC Corp
Publication of CN102317923A publication Critical patent/CN102317923A/zh
Application granted granted Critical
Publication of CN102317923B publication Critical patent/CN102317923B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/065Replication mechanisms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • G06F3/0617Improving the reliability of storage systems in relation to availability
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种存储系统,包括:拷贝装置,用于将包括存储数据以及用于参考存储数据并且对于存储数据而言唯一的关键数据从用于在其中存储拷贝源文件系统的拷贝源存储系统拷贝到拷贝目的地存储系统中,并且形成拷贝目的地文件系统;以及更新数据指定装置,用于将拷贝源文件系统中的关键数据与拷贝目的地文件系统中的关键数据进行比较,并且将存储在拷贝源文件系统中的、拷贝源文件系统中的关键数据所参考的、在拷贝目的地文件系统中未找到的存储数据指定为更新数据。拷贝装置将存储在拷贝源文件系统中的更新数据拷贝到拷贝目的地文件系统。

Description

存储系统
技术领域
本发明涉及一种存储系统,并且具体地涉及一种将数据分发并存储到多个存储设备中的存储系统。 
背景技术
近年来,随着计算机已经发展和变得流行,各种类型的信息被放入数字数据中。作为用于存储这种数字数据的设备,存在诸如磁带和磁盘之类的存储设备。由于要存储的数据已经日益增加并且其数量已经变得巨大,因此需要高容量存储系统。另外,需要保持可靠性,同时又降低用于存储设备的成本。此外,要求以后能够容易地获取数据。因此,期望有这种存储系统,其能够自动地实现其存储容量和性能的提高,其不需要存储的复本从而减少了用于存储的成本,并且其具有高冗余度。 
在这种情况下,近年来,如专利文献1所示,已经开发了内容地址存储系统。这种内容地址存储系统将数据分发并存储到多个存储设备中,并且基于根据数据的内容而指定的唯一内容地址来指定存储数据的存储位置。具体而言,内容地址存储系统将预定数据分割为多个片段,向其添加作为冗余数据的片段,并且将这些片段相应存储到多个存储设备中。 
此后,通过指定内容地址,可以获取数据,即存储在由内容地址指定的存储位置上的片段,并且从这些片段恢复分割之前的预定数据。 
进一步,生成内容地址以便根据数据的内容而唯一。因此,在复制的数据的情况下,有可能参考同一存储位置上的数据来获得具有同一内容的数据。于是,不一定要单独存储所复制的数据,并且 有可能省略复制的记录和减小数据容量。 
另一方面,虽然具有如上所述的高冗余度,内容地址存储系统还需要已存储数据的副本。在此情况下,内容地址存储系统执行获取拷贝源的文件系统并将该文件系统拷贝到变为拷贝目的地的文件系统的处理。然后,在一旦已经执行拷贝处理的情况下,内容地址存储系统将拷贝源文件系统与拷贝目的地文件系统进行比较并在拷贝源文件系统中指定更新文件,从而能够减少拷贝处理所需的时间。 
[专利文献1]日本未审专利申请公开第JP-A 2005-235171号 
然而,在要拷贝的文件系统中存储了极大量的文件的情况下,需要耗费很多的处理和时间来执行如下处理,即指定在先前的拷贝处理之后被更新的更新文件。例如,在通过分别获取和比较存储在拷贝源文件系统和拷贝目的地文件系统中的相应文件的更新时间信息来指定更新文件的情况下,有必要获取所有文件的更新时间信息。这导致如下问题,即用于拷贝处理的时间和系统负载增加,并且系统性能降低。 
发明内容
由此,本发明的目的是提供一种能够控制数据拷贝处理所需的时间和负载并抑制系统性能的降低的存储系统。 
为了实现该目的,本发明实施例的复制系统包括:拷贝源存储系统,被配置为存储拷贝源文件系统,该拷贝源文件系统包括存储数据和关键数据,该关键数据参考存储数据并根据其所参考的数据而唯一;以及拷贝目的地存储系统,被配置为变为存储在拷贝源存储系统中的拷贝源文件系统的拷贝目的地, 
复制系统还包括:拷贝处理装置,被配置为将存储在拷贝源存储系统中的拷贝源文件系统拷贝到拷贝目的地存储系统中,并且在拷贝目的地存储系统中形成拷贝目的地文件系统;以及更新数据指定装置,配置为将拷贝源文件系统内的关键数据与拷贝目的地文件系统内的关键数据进行比较,并且将拷贝源文件系统内的关键数据 所参考的拷贝源文件系统内的存储数据指定为更新数据,该存储数据在拷贝目的地文件系统中不存在,并且 
拷贝处理装置被配置为将存储在拷贝源文件系统内的更新数据拷贝到拷贝目的地文件系统中。 
进一步,本发明另一实施例的复制设备包括:拷贝处理装置,被配置为将存储在存储拷贝源文件系统的拷贝源存储系统中的拷贝源文件系统拷贝到拷贝目的地存储系统中,并且在拷贝目的地存储系统中形成拷贝目的地文件系统,其中该拷贝源文件系统包括存储数据和关键数据,该关键数据参考存储数据并根据其所参考的数据而唯一;以及更新数据指定装置,被配置为将拷贝源文件系统内的关键数据与拷贝目的地文件系统内的关键数据进行比较,并且将拷贝源文件系统内的关键数据所参考的拷贝源文件系统内的存储数据指定为更新数据,该存储数据在拷贝目的地文件系统中不存在,并且 
拷贝处理装置被配置为将存储在拷贝源文件系统内的更新数据拷贝到拷贝目的地文件系统中。 
进一步,本发明另一实施例的计算机程序包括指令,该指令用于使得信息处理设备实现:拷贝处理装置,被配置为将存储在存储拷贝源文件系统的拷贝源存储系统中的拷贝源文件系统拷贝到拷贝目的地存储系统中,并且在拷贝目的地存储系统中形成拷贝目的地文件系统,其中该拷贝源文件系统包括存储数据和关键数据,该关键数据参考存储数据并根据其所参考的数据而唯一;以及更新数据指定装置,被配置为将拷贝文件系统内的关键数据与拷贝的地文件系统内的关键数据进行比较,并且将拷贝源文件系统内的关键数据所参考的拷贝源文件系统内的存储数据指定为更新数据,该存储数据在拷贝目的地文件系统中不存在,并且 
拷贝处理装置被配置为将存储在拷贝源文件系统内的更新数据拷贝到拷贝目的地文件系统中。 
进一步,本发明另一实施例的复制方法包括:将存储在存储拷 贝源文件系统的拷贝源存储系统中的拷贝文件系统拷贝到拷贝目的地存储系统中,并且在拷贝目的地存储系统中形成拷贝目的地文件系统,其中该拷贝源文件系统包括存储数据和关键数据,该关键数据参考存储数据并根据其所参考的数据而唯一;将拷贝源文件系统内的关键数据与拷贝目的地文件系统内的关键数据进行比较,并且将拷贝源文件系统内的关键数据所参考的拷贝源文件系统内的存储数据指定为更新数据,该存储数据在拷贝目的地文件系统中不存在;以及将存储在拷贝源文件系统内的更新数据拷贝到拷贝目的地文件系统中。 
利用上述配置,本发明能够实现控制数据拷贝处理所需的时间和负载并抑制系统性能降低的存储系统。 
附图说明
图1是示出包括本发明第一示例性实施例的存储系统的整个系统的配置的框图; 
图2是示出本发明第一示例性实施例的存储系统的示意性配置的框图; 
图3是用于说明在图2中公开的存储系统中的数据存储处理的方面的说明性视图; 
图4是用于说明在图2中公开的存储系统中的数据存储处理的方面的说明性视图; 
图5是示出将数据存储到在图2中公开的存储系统中的存储设备中的方面的视图; 
图6是示出在图2中公开的存储系统的配置的功能框图; 
图7是示出在图2中公开的存储系统的配置的功能框图; 
图8是示出在图2中公开的存储系统的操作的流程图; 
图9是示出在图2中公开的存储系统的操作的流程图; 
图10是示出在图2中公开的存储系统中的数据处理的方面的视图; 
图11是示出在图2中公开的存储系统中的数据处理的方面的视图; 
图12是示出在图2中公开的存储系统中的数据处理的方面的视图; 
图13是示出在图2中公开的存储系统中的数据处理的方面的视图; 
图14是示出在图2中公开的存储系统中的数据处理的方面的视图;并且 
图15是示出本发明第二示例性实施例的存储系统的配置的功能框图。 
具体实施方式
<第一示例性实施例> 
将参考图1到图14描述本发明的第一示例性实施例。图1是示出整个系统的配置的框图。图2是示出存储系统的示意性配置的框图。图3和图4是示出将数据存储到存储系统中的方面的视图。图5是示出要存储的元数据的示例的视图。图6和图7是示出用于执行存储系统的复制的配置的视图。图8和图9是各自示出存储系统的操作的流程图。图10到图14是示出在存储系统中的数据处理的方面的视图。 
这一示例性实施例示出了在稍后描述的第二示例性实施例中所公开的存储系统的具体示例。下面,将描述通过连接多个服务器计算机来配置存储系统的情况。然而,本发明的存储系统不限于由多个计算机配置,并且可以由一个计算机配置。 
如图1所示,本发明的存储系统配备有经由网络N连接的主存储系统10和副本存储系统20。主存储系统10经由网络N连接到控制备份过程的备份系统11。备份系统11获得存储在经由网络N连接的备份目标设备12中的备份目标文件,并且请求主存储系统10存储。因而,主存储系统10具有存储请求作为备份而存储的备份目标文件的功能。 
进一步,本发明的存储系统具有如上所述地将主存储系统10(拷贝源存储系统)中已存储数据拷贝到副本存储系统20(拷贝目的地存储系统)中,从而配置复制系统的功能。主存储系统10和副本存储系统20具有几乎相同的配置,并且其中已存储数据几乎一样。 
如图2所示,通过连接多个服务器计算机来配置这一示例性实施例的主存储系统10。由于副本存储系统20采用与主存储系统10相同的配置,因此将省略其详细描述。 
具体而言,主存储系统10配备有加速器节点10A和存储节点10B,加速器节点10A充当控制存储系统10的存储和再现操作的服务器计算机,存储节点10B充当配备有存储数据的存储设备的服务器计算机。加速器节点10A的数目和存储节点10B的数目不限于图2中示出的那些,并且可以通过连接更多节点10A和更多节点10B来配置主存储系统。 
加速器节点10A配备有通过安装加速器节点程序而构造的文件系统单元(现在示出)。该文件系统单元具有如下功能,即管理从备份系统11获得的备份目标文件,实际存储数据的数据存储位置,等等,以便后期可获取。将省略对加速器节点10A的更详细的配置的描述。 
存储节点10B配备有存储节点控制单元(未示出)和图5中示出的主文件系统12。存储节点控制单元通过将存储节点程序安装到存储节点10B中来实现。 
主文件系统12形成于存储设备中,并且正如后文描述的那样,配备有存储元数据的元数据单元50以及存储对文件进行配置的分割数据的数据单元90。 
将参考图3到图5描述上述主存储系统10中的基本数据存储处理、数据获取处理以及存储数据结构。 
首先,在接受备份目标数据A的输入(如图4中的箭头Y1所示)后,存储系统将备份目标数据A分割为具有预定容量(例如64KB) 的块数据D(如图3所示并且如图4中的箭头Y2所示)。然后,基于块数据D的数据内容,存储系统计算代表数据内容的唯一哈希值H(内容标识信息)(箭头Y3)。例如,通过使用预设的哈希函数,存储系统基于块数据D的数据内容计算哈希值H,该处理例如由加速器节点10A执行。 
进一步,主存储系统10通过使用备份目标数据A的块数据D的哈希值H来检查块数据D是否已经被存储在存储设备中。具体而言,在将哈希值H和代表存储位置的内容地址CA相关的状况下,在MFI(主片段索引)文件中注册已经存储的块数据D。因此,在存储之前所计算的块数据D的哈希值H存在于MFI文件中的情况下,主存储系统可以确定已经存储了具有相同内容的块数据D(图4中的箭头Y4)。在此情况下,主存储系统从MFI文件获得与在MFI文件内的、和存储之前的块数据D的哈希值H相一致的哈希值H相关的内容地址CA。然后,主存储系统返回该内容地址CA作为需要存储的块数据D的内容地址CA。因此,通过使用该内容地址CA而参考的已经存储的数据被用作需要存储的块数据D,并且变得不必存储需要存储的块数据D。 
进一步,主存储系统10压缩如上所述被认为尚未被存储的块数据D,并且将该数据分割为具有预定容量的多个片段数据(如图4中的箭头Y5所示)。例如,如图3中的参考符号D1到D9所示,主存储系统将数据分割为九个片段数据(分割数据41)。另外,存储系统生成冗余数据,使得即使通过分割而获得的某些片段数据丢失也能够恢复原始块数据,并且将冗余数据添加到通过分割获得的片段数据41。例如,如图3中的参考符号D10到D12所示,存储系统添加三个片段数据(冗余数据42)。因而,存储系统生成数据集40,该数据集40包括十二个片段数据,这十二个片段数据包括九个分割数据41和三个冗余数据。 
进一步,主存储系统10分别将组成如上所述地生成的数据集的片段数据分布并存储到形成在存储设备中形成的存储区域。例如, 在如图3所示地生成十二个片段数据D1到D12的情况下,分别将片段数据D1到D12存储到分别在十二个存储设备中形成的存储数据文件中(参见图4中的箭头Y6)。 
进一步,主存储系统10生成并管理内容地址CA,该内容地址CA代表如上所述地存储在存储设备中的片段数据D1到D12的存储位置,即,要根据片段数据D1到D12恢复的块数据D的存储位置。具体而言,主存储系统10通过将基于所存储的块数据D的内容而计算的哈希值H的一部分(短哈希;例如哈希值H的前8个字节)与代表逻辑存储位置的信息进行组合来生成内容地址CA。然后,将该内容地址CA返回给主存储系统10内的文件系统,即返回给加速器节点10A(图4中的箭头Y7)。加速器节点10A将诸如备份目标数据的文件名称之类的标识信息与内容地址CA相关并且在文件系统中进行管理。 
在这一示例性实施例中,具体地,代表当前时间的当前时间信息被包括在内容地址CA中。由此,设置参考所存储的片段数据(存储数据)的内容地址CA(关键数据)以便使其唯一。 
进一步,主存储系统10将块数据D的内容地址CA与块数据D的哈希值H相关,并且存储节点10B各自在MFI文件中进行管理(图4中的箭头Y8)。由此,内容地址CA与指定文件、哈希值H等的信息相关,并且被存储到加速器节点10A和存储节点10B的存储设备中。 
另外,主存储系统10如上所述地执行对获取所存储的备份目标数据的控制。例如,当存储系统10接受指定了特定文件的获取请求时,主存储系统10首先基于文件系统指定如下内容地址CA,该内容地址CA由作为对应于与获取请求有关的文件的哈希值的一部分的短哈希以及逻辑位置的信息组成。然后,主存储系统检查是否在MFI文件中注册了内容地址CA。在未注册内容地址CA的情况下,不存储所请求的数据,从而使错误响应被返回。 
另一方面,在与获取请求有关的内容地址CA已被注册的情况 下,主存储系统指定由内容地址CA指定的存储位置并获取各自存储在所指定的存储位置中的片段数据作为请求获取的数据。然后,主存储系统从响应于获取请求而获取的相应片段数据恢复块数据D。另外,存储位置管理单元25连接多个已恢复的块数据D以恢复为数据组,如文件A,并且返回给控制获取的加速器节点10A。 
然后,如图5所示,将代表上述存储数据的存储位置的内容地址CA(关键数据)以层级结构存储到元数据单元50中作为元数据。具体而言,元数据单元50具有根节点60、索引节点70以及叶节点80,它们存储参考存储在数据单元90中的数据的元数据以及参考其他元数据的元数据。存储在根节点60、索引节点70以及叶节点80中的相应元数据是新生成的或已更新的并且由存储节点控制单元在存储数据时或在任何时候存储。 
另外,参考图5,将详细描述存储在数据单元90中的已存储数据以及存储在根节点60、索引节点70以及叶节点80中并代表已存储数据的存储位置的相应元数据(内容地址(关键数据))(其经受由存储节点控制单元进行的存储处理)。 
首先,存储在数据单元90中的已存储数据91、92和93是通过分割在存储系统中存储的作为存储目标的文件而获得的分割数据。 
存储在叶节点80中的元数据81和82是代表已存储数据91、92等的存储位置的数据。具体而言,如图所示,存储在叶节点80中的元数据81具有地址部分81b和偏移部分81a,该地址部分81b存储内容地址(CA),该内容地址是代表已存储数据91等的存储位置的地址信息,该偏移部分81a存储代表在已存储数据91等的分割之前在文件内的相对位置的“文件中的位置”信息(文件偏移)。 
存储在地址部分81b中的CA(内容地址)参考存储在数据单元90中的已存储数据91等,并且对于已存储数据91的存储位置而言是唯一数据。例如,内容地址CA是这样生成的数据,它包括基于将要被参考的已存储数据的数据内容而生成的哈希值的部分以及代表物理位置信息的信息。特别地,在这一示例性实施例中,当参考 的已存储数据91已更新时,将当前时间信息包括在涉及已存储数据的内容地址CA中。因此,内容地址CA变为根据所参考的数据的更加唯一的信息。另外,存储在偏移部分81a中的文件偏移是如下数据,该数据代表在分割对应的CA所参考的已存储数据91等之前在文件内的“文件中的相对位置”。 
接下来,将描述存储在索引节点70中的元数据71和72。存储在索引节点70中的元数据71是如下数据,该数据代表存储在叶节点80中的元数据81等的存储位置。具体而言,如图所示,存储在索引节点70中的元数据71具有地址部分71b和偏移部分71a,该地址部分71b存储内容地址(CA),其中内容地址是代表存储在叶节点80中的元数据81等的存储位置的地址信息,偏移部分71a存储代表在分割已存储数据之前在文件内的相对位置的“文件中的位置”信息(文件偏移)。将偏移部分和地址部分存储为彼此对应。 
存储在地址部分71b中的内容地址CA对于所参考的叶节点80内的元数据81的存储位置而言是唯一数据。例如,内容地址CA是如下数据,该数据生变为包括基于所参考的元数据81的数据内容而生成的哈希值的一部分以及代表物理位置信息的信息。 
接下来,将描述存储在根节点60中的元数据61、62和63。存储在根节点60中的元数据61位于上述元数据顶部,并且是代表存储在索引节点70中的元数据71的存储位置的数据。具体而言,如图5所示,存储在根节点60中的元数据61具有地址部分61b和偏移部分61a,该地址部分61b存储内容地址(CA),该内容地址是代表存储在索引节点70中的元数据71等的存储位置的地址信息,该偏移部分61a存储代表在位于CA的参考目的地处的已存储数据的分割之前在文件内的相对位置的“文件中的位置”信息(文件偏移)。将偏移部分和地址部分存储为彼此对应。 
存储在地址部分61b中的内容地址CA对于所参考的索引节点70内的元数据71的存储位置而言是唯一数据。例如,内容地址CA是如下数据,该数据生变为包括基于要参考的元数据71的数据内容 而生成的哈希值的一部分以及代表物理位置信息的信息。 
进一步,存储在关键部分中的文件偏移是如下数据,该数据代表位于对应的内容地址CA的参考目的地处的已存储数据的“文件中的相对位置”。换而言之,文件偏移代表在已存储数据91等的分割之前在文件中的顺序,该数据91通过由在叶节点80内的元数据81,82等的参考来最终指定,该叶节点80由在内容地址CA所参考的索引节点70内的元数据所参考。 
用参考标号61表示的元数据是对应于文件A的元数据。换而言之,通过使用经由遵循元数据61所参考的所有元数据(索引节点70和叶节点80内的元数据71、81等等)来参考的已存储数据,可以在分割之前配置文件A。 
由此,在存储文件时,存储节点控制单元分割文件并将分割数据存储到数据单元90中。然后,如图5所示,存储节点控制单元分层级地生成或更新参考已存储数据的相应元数据。此时,存储节点控制单元生成元数据的内容地址(CA)以便参考位于较低层级中的其他现有的元数据或已存储数据,从而能够抑制元数据和已存储数据的重复存储。 
特别地,在这一示例性实施例中,如上所述,当所参考的已存储数据91已更新时,将当前时间信息包括到参考该已存储数据的叶节点80内的内容地址CA中。由此,内容地址CA变为对于所参考的数据而言更加唯一的信息。然后,基于作为唯一信息的内容地址CA,还更新参考包括作为唯一信息的内容地址CA的元数据的较高层级(索引节点、根节点)的内容地址CA以便包括该唯一信息。例如,由稍后描述的唯一键生成单元139(唯一信息生成装置)生成这一示例性实施例中的内容地址CA以便使其为唯一。 
然而,内容地址CA并不必然限于包括当前时间信息。如上所述,内容地址CA可以包括参考目的地的数据的哈希值的一部分。如此一来,还有可能将内容地址CA用作参考特定数据的唯一关键数据。 
进一步,在获取文件时,存储节点控制单元遵循相应元数据的 参考目的地以获取被参考的已存储数据91等,并且生成并获取文件。例如,在如图5所示地存储数据的情况下获取文件A时,存储节点控制单元遵循参考文件A的根节点60内的元数据61、由元数据61所参考的索引节点70内的元数据以及在叶节点80内的元数据,并且获取最终参考的多个已存储数据。然后,存储节点控制单元按照由相应元数据内的文件偏移所代表的顺序再现文件。 
接下来,将参考图6到图8描述用于执行存储系统的复制的配置和操作。 
首先,在这一示例性实施例的主存储系统10和配置存储系统的副本存储系统20中,如图6所示,加速器节点10A和20A分别配备有具有执行复制的功能的复制器11和21。这些复制器11和21彼此协作地执行将存储在主存储系统10中的主文件系统12拷贝到副本存储系统20中的处理。 
将参考图7描述存储系统的用于执行复制的特定功能。将在假定图7中示出的配置在加速器节点10A内用于配置主存储系统10的情况下描述这些功能。然而,该配置可以被安装在存储系统内的任何计算机中。 
如图7所示,存储系统配备有输入设备101、拷贝单元102以及文件系统访问单元103。另外,存储系统包括由文件系统访问单元103创建的拷贝源文件系统200,以及拷贝目的地文件系统300。 
拷贝源文件系统200(拷贝源FS 13)通过在复制时在主存储系统10中拷贝主文件系统(主FS)12来生成。以类似的方式,拷贝目的地文件系统300(拷贝目的地FS 23)通过在复制时在副本存储系统20中拷贝副本文件系统(副本FS)22来生成。因而,在实际复制时,使用拷贝源文件系统和拷贝目的地文件系统的拷贝。然而,为了便于描述,下面将在假定主文件系统12是拷贝源文件系统200并且副本文件系统22是拷贝目的地文件系统300的情况下进行描述。 
如图7所示,拷贝单元102配备有更新文件指定单元121和拷 贝处理单元122。另外,文件系统访问单元103配备有文件更新单元130、文件属性信息更新单元131、文件属性信息获取单元132、文件数据写出单元133、文件数据获取单元134、文件管理区域获取单元135、文件管理区域更新单元136、数据块写出单元137、数据块获取单元138以及唯一键生成单元139。 
拷贝单元102和文件系统访问单元103通过将程序安装到加速器节点10A的算术设备中来实现。该程序例如以在存储在诸如CD-ROM之类的存储介质中的状态下被提供给加速器节点10A。或者,可以将程序存储在网络上的另一服务器计算机的存储设备中并且经由网络将其从另一计算机提供到加速器节点10A。 
接下来,将参考图8的数据结构视图以及图9和图10的流程图来描述具有上述配置的存储系统的操作。首先,将描述当存储在主存储系统10中的主文件系统12内的数据(即拷贝源文件系统200内的数据)被更新时的操作。具体而言,将描述当存储在拷贝源文件系统200中的文件属性部分262所参考的数据(存储数据)被更新时的操作。 
首先,当文件系统访问单元103接受更新文件的请求(步骤S1)时,文件更新单元130接收文件编号并更新文件数据。然后,文件更新单元130将文件编号和更新文件数据传递给文件数据写出单元133,由此写出更新文件数据(步骤S2)。 
继而,在写出更新文件数据之后,文件更新单元130将文件编号传递给文件属性信息获取单元132,并且搜索文件属性部分关键信息252。在搜索文件属性部分关键信息252之后,文件更新单元130将文件属性部分关键信息252传递给数据块获取单元138,从而获取文件属性部分262。 
接着,文件更新单元130将代表当前时间的当前时间信息设置为存储在所获取的文件属性部分262中的文件更新时间信息(步骤S3)。因此,参考更新文件数据的文件属性部分262变为对于更新文件数据而言唯一的数据(关键数据)。换而言之,在此情况下, 文件更新单元130用作唯一信息生成装置,该唯一信息生成装置配置为将对于更新文件数据而言唯一的数据(关键数据)包括到参考更新文件数据的文件属性部分262中。 
然后,文件更新单元130将文件编号和文件属性部分262传递给文件属性信息更新单元131。在接受后,文件属性信息更新单元131将文件属性部分262传递给数据块写出单元137。然后,数据块写出单元137写出文件属性部分262(步骤S4)。 
随后,数据块写出单元137获得由唯一键生成单元139生成并且对于文件属性部分262而言唯一的文件属性部分关键信息,并且返回给文件属性信息更新单元131。换而言之,当所参考的文件属性部分262改变时,唯一键生成单元139(唯一信息生成装置)生成参考文件属性部分262的唯一文件属性部分关键信息(关键数据)(步骤S5)。然后,文件属性信息更新单元131将从数据块写出单元137返回的文件属性部分关键信息存储到对应于文件管理块241中的文件编号的文件属性部分关键信息252中(步骤S6)。 
接下来,根据文件管理块241中的文件属性部分关键信息252的改变,通过使用唯一键生成单元139来生成文件管理块241的唯一键(关键数据)(步骤S7)。然后,将由唯一键生成单元139生成的文件管理块241的唯一键存储到文件管理信息部分221中的文件管理块关键信息231中(步骤S8)。 
随后,根据文件管理块关键信息231的改变,通过使用唯一键生成单元139来生成文件管理信息部分221的新的唯一键(关键数据)(步骤S9)。然后,将所生成的文件管理信息部分221的唯一键存储到文件管理信息部分关键信息211中(步骤S10)。 
对于诸如当前时间信息和唯一键之类的参考目的地的数据而言唯一的数据是参考更新文件数据或其他元数据的内容地址,或者包括在内容地址中的数据。 
例如,将考虑图11A中示出的改变之前的文件系统以及图11B中示出的改变之后的文件系统。假定图11B的参考符号D1所表示 的“数据”相对于图11A的文件系统而言已更新。参考数据(D1)的唯一内容地址CA*(C1)的值已改变。根据这一点,包括内容地址CA*(C1)的元数据M1的内容也已改变,并且因此,对于元数据M1而言唯一并且参考元数据M1的内容地址CA*(C2)的值已改变。 
由于包括内容地址CA*(C2)的元数据M2也已改变,因此对于元数据M2而言唯一并且参考元数据M2的内容地址CA*(C3)的值被改变。由于包括内容地址CA*(C3)的元数据M3也已改变,因此对于元数据M3而言唯一并且参考元数据M3的内容地址CA*(C4)的值被改变。由于包括内容地址CA*(C4)的元数据M4也已改变,因此对于元数据M4而言唯一并且参考元数据M4的内容地址CA*(C5)的值被改变。然后,包括内容地址(C5)的元数据M5的内容也被改变。 
由此,当存储在存储系统中的数据被更新时,如图11B的箭头Y100所示相继地改变内容地址。换而言之,以从参考位于较低层级中的更新数据的内容地址到位于较高层级中的参考包括内容地址的元数据的内容地址的顺序,改变内容地址的顺序。 
接下来,将描述主存储系统10和副本存储系统20中的复制,即对拷贝源文件系统200进行拷贝的处理。此前假定将拷贝源文件系统200从主存储系统10复制到副本文件系统20并且将作为与拷贝源文件系统200相同的文件系统的拷贝源文件系统存储在副本存储系统20中。 
在之后的拷贝处理中,首先,更新文件指定单元121(更新数据指定装置)指定在先前的拷贝处理之后更新的文件。之后,拷贝处理单元122(拷贝处理装置)拷贝已经指定的更新文件以及元数据。下面,将参考图10进行具体描述。 
首先,在接受从输入设备101输入的拷贝请求(步骤S21)后,拷贝单元102将指定拷贝源文件系统200和拷贝目的地文件系统300的信息传递给更新文件指定单元121。 
随后,更新文件指定单元121致使文件系统存取单元103的文 件管理区域获取单元135获取拷贝源文件系统200的文件系统管理区域201以及拷贝目的地文件系统300的文件系统管理区域301。接着,更新文件指定单元121将文件系统管理区域201的文件管理信息部分关键信息211与文件系统管理区域301的文件管理信息部分关键信息311进行比较(步骤S22)。 
此时,在两个文件管理信息部分关键信息彼此一致(在步骤S23处为“是”)的情况下,确定没有更新文件,并且更新文件指定单元121结束处理。 
另一方面,在两个文件管理信息部分关键信息不一致(在步骤S23处为“否”)的情况下,其意味着存在更新文件,更新文件指定单元121指定该更新文件。具体而言,更新文件指定单元121将文件管理信息部分关键信息211传递给数据块获取单元138,并且获取文件管理信息部分关键信息211所参考的文件管理信息部分221。然后,比较文件管理信息部分221的文件管理块关键信息和拷贝目的地文件系统300内的文件管理信息部分321的文件管理块关键信息(步骤S24)。之后,基于比较结果,指定不同的文件管理块关键信息22。在此假定文件管理块关键信息231和文件管理块关键信息331有所不同。 
随后,比较分别由不同的文件管理块关键信息231和331所参考的文件管理块241内的文件属性部分关键信息251到253与文件管理块341内的文件属性部分关键信息351到353(步骤S25)。具体而言,将文件管理块关键信息231传递给数据块获取单元138,并且获取文件管理块241。另一方面,将文件管理块关键信息331传递给数据块获取单元138,并且获取文件管理块341。比较包括在所获取的文件管理块241中的文件属性部分关键信息和包括在所获取的文件管理块341中的文件属性部分关键信息,由此指定不同的文件属性部分关键信息(步骤S26)。在此假定文件属性部分关键信息252和文件属性部分关键信息352有所不同。然后,将由文件属性部分关键信息252表示作为不同信息的文件指定为更新文件(步骤 S27)。 
之后,拷贝单元102从更新文件指定单元121接收更新文件信息并将该更新文件信息传递给拷贝处理单元122,从而执行拷贝处理。此时,拷贝单元102将已经指定的更新文件、参考更新文件的元数据以及参考上述元数据的较高层级的元数据拷贝到拷贝目的地文件系统300中。由此,有可能仅将从拷贝目的地文件系统300中的数据更新的拷贝源文件系统200中的数据拷贝到副本存储系统20中。 
接下来,将参考图12到图14描述上述拷贝处理的示例。在附图中示出的相应示例中,在左侧示出拷贝目的地文件系统300,在右侧示出拷贝源文件系统200。也就是说,附图各自示出了拷贝源文件系统200中的数据已经从拷贝目的地文件系统300更新的状况。在这些附图中,假定存储目标数据存储在“Inode”所表示的部分中。 
起初,在图12的示例中,假定已经更新了存储在用参考符号D11所表示的“Inode”中的数据。首先,当比较位于最高层级的根节点中的元数据中所包括的内容地址CA时,拷贝源文件系统200内的用参考符号C13所表示的内容地址CA*不同于拷贝目的地文件系统300内的内容地址CA(参见参考标号(1))。换而言之,拷贝源文件系统200内的用参考符号C13所表示的内容地址CA*不存在于拷贝目的地文件系统300中。因此,检查参考符号C13所表示的内容地址CA*所参考的较低层级的索引节点中的元数据。 
随后,当比较位于索引节点中的内容地址CA时,拷贝源文件系统200内的用参考符号C12所表示的内容地址CA*不同于拷贝目的地文件系统300内的内容地址CA(参见参考标号(2))。换而言之,参考符号C12所表示的内容地址CA*不存在于拷贝目的地文件系统300中。因此,检查参考符号C12所表示的内容地址CA*所参考的较低层级的叶节点中的元数据。 
随后,当比较位于叶节点中的内容地址CA时,拷贝源文件系统200内的用参考符号C11所表示的内容地址CA*不同于拷贝目的地 文件系统300内的内容地址CA(参见参考标号(3))。换而言之,参考符号C11所表示的内容地址CA*不存在于拷贝目的地文件系统300中。因此,将用参考符号C11表示的内容地址CA*所参考的参考标号D11所表示的Inode中已存储数据指定为更新数据。 
之后,将拷贝源文件系统200内的指定为更新数据的数据以及已被遵循的元数据拷贝到拷贝目的地文件系统300中。 
因而,在本发明中,通过从最高层级开始分别将拷贝源文件系统内的元数据与拷贝目的地文件系统内的元数据进行比较并且遵循不同的内容地址,可以指定已经更新的数据。因此,不需要比较相应文件系统内的所有数据,并且可以通过比较参考存储数据的元数据来容易且快速地指定更新数据。因此,可以控制数据拷贝处理所需的时间和负载,并且可以抑制系统性能的降低。 
接下来,在图13的示例中,假定已经更新了存储在用参考符号D21所表示的“Inode”中的数据,并且已经提高了元数据的层级。首先,当比较位于最高层级的根节点中的元数据中所包括的内容地址CA时,在拷贝源文件系统200内的用参考符号C23和C24所表示的内容地址CA*不同于在拷贝目的地文件系统300内的内容地址CA(参见参考标号(11))。换而言之,在拷贝源文件系统200内的用参考符号C23和C24所表示的内容地址CA*不存在于拷贝目的地文件系统300中。因此,检查参考符号C23和C24所表示的内容地址CA*所参考的较低层级的索引节点中的元数据。 
随后,当比较位于索引节点中的内容地址CA时,拷贝源文件系统200内的用参考符号C22所表示的内容地址CA*不同于拷贝目的地文件系统300内的内容地址CA(参见参考标号(12))。换而言之,由参考符号C22所表示的内容地址CA*不存在于拷贝目的地文件系统300中。因此,检查参考符号C22所表示的内容地址CA*所参考的较低层级的叶节点中的元数据。 
接着,当比较位于叶节点中的内容地址CA时,在拷贝源文件系统200内的用参考符号C21所表示的内容地址CA*不同于在拷贝目 的地文件系统300内的内容地址CA(参见参考标号(13))。换而言之,参考符号C21所表示的内容地址CA*不存在于拷贝目的地文件系统300中。因此,将用参考符号C21所表示的内容地址CA*所参考的用参考标号D21所表示的Inode中已存储数据指定为更新数据。 
之后,将拷贝源文件系统200内的指定为更新数据的数据以及已经遵循的元数据拷贝到拷贝目的地文件系统300中。 
接下来,在图14的示例中,假定已经更新了存储在用参考符号D31和D32所表示的“Inode”中的数据。首先,当比较位于最高层级的根节点中的元数据中所包括的内容地址CA时,在拷贝源文件系统200内的用参考符号C34所表示的内容地址CA*不同于在拷贝目的地文件系统300内的内容地址CA(参见参考标号(21))。换而言之,参考符号C34所表示的内容地址CA*不存在于)拷贝目的地文件系统300中。因此,检查参考符号C34所表示的内容地址CA*所参考的较低层级的索引节点中的元数据。 
随后,当比较位于索引节点中的内容地址CA时,在拷贝源文件系统200内的用参考符号C33所表示的内容地址CA*不同于在拷贝目的地文件系统300内的内容地址CA(参见参考标号(22))。换而言之,参考符号C33所表示的内容地址CA*不存在于拷贝目的地文件系统300中。因此,检查参考符号C33所表示的内容地址CA*所参考的较低层级的叶节点中的元数据。 
接着,当比较位于叶节点中的内容地址CA时,在拷贝源文件系统200内的用参考符号C31和C32所表示的内容地址CA*不同于在拷贝目的地文件系统300内的内容地址CA(参见参考标号(23))。换而言之,参考符号C31和C32所表示的内容地址CA*不存在于拷贝目的地文件系统300中。因此,将用参考符号C31和C32所表示的内容地址CA*所参考的用参考符号D31和D32所表示的Inode中已存储数据指定为更新数据。 
之后,将拷贝源文件系统200内的指定为更新数据的数据以及 已经遵循的元数据拷贝到拷贝目的地文件系统300中。此时,将已经指定的更新文件、包括了参考更新文件的内容地址的元数据以及参考上述元数据的较高层级的元数据拷贝到拷贝目的地文件系统300中。换而言之,仅将拷贝源文件系统200内的已经改变的数据拷贝到拷贝目的地文件系统300中。 
<第二示例性实施例> 
接下来,将参考图15描述本发明的第二示例性实施例。图15是示出这一示例性实施例的存储系统的配置的功能框图。在这一示例性实施例中,将示意性地描述该存储系统。 
如图15所示,这一示例性实施例的存储系统包括:拷贝源存储系统1,配置为存储拷贝源文件系统2,该拷贝源文件系统2包括存储数据和关键数据,该关键数据参考存储数据并根据其所参考的数据而唯一;以及拷贝目的地存储系统3,配置为变为存储在拷贝源存储系统中的拷贝源文件系统的拷贝目的地。 
然后,该存储系统还包括:拷贝处理装置5,配置为将存储在拷贝源存储系统1中的拷贝源文件系统2拷贝到拷贝目的地存储系统3中,并且在拷贝目的地存储系统3中形成拷贝目的地文件系统4;以及更新数据指定装置6,配置为将拷贝源文件系统2内的关键数据与拷贝目的地文件系统4内的关键数据进行比较,并且将拷贝源文件系统2内的关键数据所参考的拷贝源文件系统2内的存储数据指定为更新数据,该存储数据在拷贝目的地文件系统4中不存在。 
另外,复制处理装置5配置为将存储在复制源文件系统2内的更新数据复制到复制目的地文件系统4中。 
在图15中,拷贝处理装置5和更新数据指定装置6分开地安装在复制设备7中,但也可以安装在拷贝源存储系统1和/或拷贝的地存储系统3中。 
根据如上所述地配置的存储系统,拷贝源存储系统存储存储数据以及参考存储数据的关键数据,其形成拷贝源文件系统。通过将这一拷贝源文件系统拷贝到拷贝目的地存储系统中,在拷贝目的地 存储系统内形成具有相同内容的拷贝文件系统。之后,当更新数据存储在拷贝源文件系统内时,生成或更新参考这一更新数据的关键数据以便包括对于更新数据而言唯一的信息。 
然后,在此之后,在将拷贝源文件系统拷贝到拷贝目的地存储系统中时,执行仅更新拷贝源文件系统中所更新的差异的处理。具体而言,首先,将拷贝源文件系统内的关键数据与拷贝目的地文件系统内的关键数据进行比较。在相应关键数据一致的情况下,确定没有更新数据,并且停止拷贝处理。另一方面,在关键数据不同的情况下,将拷贝源文件系统中的不同关键数据所参考的存储数据指定为更新数据。之后,拷贝所指定的更新数据。 
由此,根据本发明,不需要比较拷贝源文件系统和拷贝目的地文件系统的所有存储数据,并且可以通过比较参考存储数据的关键数据来指定已经更新的存储数据。因此,可以控制数据拷贝处理所需的时间和负载,并且可以抑制系统性能的降低。 
进一步,在上述复制系统中,存在参考存储数据的数据以及参考包括一个或多个其他关键数据的元数据的数据作为关键数据,并且关键数据形成层级结构。然后,更新数据指定装置被配置为,在不存在于拷贝目的地文件系统中的、拷贝源文件系统内的关键数据参考作为关键数据的比较结果的元数据的情况下,将包括在元数据中的、作为比较目标的关键数据与拷贝目的地文件系统内的关键数据进行比较。 
进一步,在上述复制系统中,更新数据指定装置被配置为比较关键数据并遵循并不存在于拷贝目的地文件系统中,而在拷贝源文件系统内的关键数据的参考目的地,从而指定更新数据。 
进一步,在上述复制系统中,更新数据指定装置被配置为按照从较高层级到较低层级的位置顺序来比较关键数据并遵循关键数据的参考目的地。 
由此,在其中包括参考存储数据的关键数据的元数据被其他关键数据所参考的层级结构的情况下,可以通过遵循并不存在于拷贝 目的地文件系统中,而在拷贝源文件系统内的关键数据来快速地指定更新数据。 
进一步,在上述复制系统中,拷贝处理装置被配置为将存储在拷贝源文件系统中并由更新数据指定装置指定的更新数据以及被更新数据指定装置认为不存在于拷贝目的地文件系统内的关键数据拷贝到拷贝目的地文件系统中。 
进一步,在上述复制系统中,拷贝处理装置被配置为将存储在拷贝源文件系统中并由更新数据指定装置指定的更新数据、被更新数据指定装置认为不存在于拷贝目的地文件系统内的关键数据以及包括关键数据的元数据拷贝到拷贝目的地文件系统中。 
另外,在上述复制系统中包括唯一信息生成装置,被配置为根据关键数据所参考的数据而生成唯一信息并将信息包括到关键数据中。 
然后,在上述复制系统中,唯一信息生成装置配置为,当关键数据所参考的数据由于将更新数据存储到拷贝源文件系统中而改变时,根据该数据生成唯一信息并将该信息包括到参考该数据的关键数据中。 
进一步,本发明的另一示例性实施例是上述复制设备,包括:拷贝处理装置,被配置为将存储在存储了拷贝源文件系统的拷贝源存储系统中的拷贝源文件系统拷贝到拷贝目的地存储系统中,并且在拷贝目的地存储系统中形成拷贝目的地文件系统,其中拷贝源文件系统包括存储数据和关键数据,该关键数据参考存储数据并根据其所参考的数据而唯一;以及更新数据指定装置,被配置为将拷贝源文件系统内的关键数据与拷贝目的地文件系统内的关键数据进行比较,并且将拷贝源文件系统内的关键数据所参考的拷贝源文件系统内的存储数据指定为更新数据,该存储数据在拷贝目的地文件系统中不存在,以及 
拷贝处理装置被配置为将存储在拷贝源文件系统内的更新数据拷贝到拷贝目的地文件系统中。 
进一步,在上述复制设备中:作为关键数据,存在参考存储数据的数据以及参考包括一个或多个其他关键数据的元数据的数据,并且关键数据形成层级结构;并且更新数据指定装置被配置为,在不存在于拷贝目的地文件系统中的、拷贝源文件系统内的关键数据参考作为关键数据的比较结果的元数据的情况下,将包括在元数据中的、作为比较目标的关键数据与拷贝目的地文件系统内的关键数据进行比较。 
进一步,可以通过将计算机程序安装到信息处理设备中来实现上述复制系统或复制设备。具体而言,本发明另一示例性实施例的计算机程序包括指令,该指令用于使得信息处理设备实现:拷贝处理装置,被配置为将存储在存储了拷贝源文件系统的拷贝源存储系统中的拷贝源文件系统拷贝到拷贝目的地存储系统中,并且在拷贝目的地存储系统中形成拷贝的地文件系统,其中该拷贝源文件系统包括存储数据和关键数据,该关键数据参考存储数据并根据其所参考的数据而唯一;以及更新数据指定装置,被配置为将拷贝源文件系统内的关键数据与拷贝的地文件系统内的关键数据进行比较,并且将拷贝源文件系统内的关键数据所参考的拷贝源文件系统内的存储数据指定为更新数据,该存储数据在拷贝目的地文件系统中不存在。 
然后,拷贝处理装置被配置为将存储在拷贝源文件系统内的更新数据拷贝到拷贝目的地文件系统中。 
进一步,在上述计算机程序中,在存在有参考存储数据的数据以及参考包括了一个或多个其他关键数据的元数据的数据以作为关键数据,并且关键数据形成层级结构的情况下,更新数据指定装置配被置为,在不存在于拷贝目的地文件系统中的、拷贝源文件系统内的关键数据参考作为关键数据的比较结果的元数据情况下,将包括在元数据中的、作为比较目标的关键数据与复制目的地文件系统内的关键数据进行比较。 
进一步,通过上述复制系统的操作来执行的本发明另一示例性 实施例的复制方法包括:将存储在存储了拷贝源文件系统的拷贝源存储系统中的拷贝源文件系统拷贝到拷贝目的地存储系统中,并且在拷贝目的地存储系统中形成拷贝的地文件系统,其中该拷贝源文件系统包括存储数据和关键数据,该关键数据参考存储数据并根据其所参考的数据而唯一;将拷贝源文件系统内的关键数据与拷贝目的地文件系统内的关键数据进行比较,并且将拷贝源文件系统内的关键数据所参考的拷贝源文件系统内的存储数据指定为更新数据,该存储数据在拷贝目的地文件系统中不存在;以及将存储在拷贝源文件系统内的更新数据拷贝到拷贝目的地文件系统中。 
进一步,在上述复制方法中,在存在有参考存储数据的数据以及参考包括一个或多个其他关键数据的元数据的数据以作为关键数据,并且关键数据形成层级结构的情况下,更新数据指定装置被配置为,在不存在于拷贝目的地文件系统中的、拷贝源文件系统内的关键数据参考作为关键数据的比较结果的元数据的情况下,将包括在元数据中的、作为比较目标的关键数据与拷贝目的地文件系统内的关键数据进行比较。 
具有上述配置的复制设备、计算机程序和复制方法的发明具有与上述复制系统类似的动作,因此能够实现上述的本发明目的。 
虽然已经参考上述相应示例性实施例而描述了本发明,但本发明不限于上述示例性实施例。在本发明的范围内,可以用本领域技术人员能够理解的各种方式来变更本发明的配置和细节。 
本发明基于并要求2009年2月25日提交的日本专利申请第2009-041894号的优先权权益,其公开的内容通过引用的方式整体并入于此。 
工业实用性 
本发明可以用于通过连接多个存储系统而配置的、并且配置为执行存储系统之间的复制的系统,并且具有工业实用性。 
参考标号的描述 
1 拷贝源存储系统 
2 拷贝源文件系统 
3 拷贝目的地存储系统 
4 拷贝目的地文件系统 
5 拷贝处理装置 
6 更新数据指定单元 
7 复制设备 
10 主存储系统 
10A 加速器系统 
10B 存储节点 
11 主复制器 
12 主文件系统 
13 拷贝源文件系统 
20 副本存储系统 
21 副本复制器 
22 副本文件系统 
23 拷贝目的地文件系统 
31 备份系统 
32 备份目标设备 
101 输入设备 
102 拷贝单元 
103 文件系统访问单元 
121 更新文件指定单元 
122 拷贝处理单元 
130 文件更新单元 
131 文件属性信息更新单元 
132 文件属性信息获取代理 
133 文件数据写出单元 
134 文件数据获取单元 
135 文件管理区域获取单元 
136 文件管理区域更新单元 
137 数据块写出单元 
138 数据块获取单元 
139 唯一键生成单元 
201,301 文件系统管理区域 
211,311 文件管理信息部分关键信息 
221,321 文件管理块关键信息 
231,232,331,332 文件管理块关键信息 
241,242,341,342 文件管理块 
251,252,253,351,352,361 文件属性部分关键信息 
261,263,361,362,363 文件属性部分 
200 拷贝源文件系统 
300 拷贝源文件系统 

Claims (9)

1.一种复制系统,包括:
拷贝源存储系统,被配置为存储拷贝源文件系统,所述拷贝源文件系统包括存储数据和关键数据,所述关键数据参考所述存储数据并根据由其参考的数据而唯一;以及
拷贝目的地存储系统,被配置为变为存储在所述拷贝源存储系统中的所述拷贝源文件系统的拷贝目的地,
所述复制系统还包括:
拷贝处理单元,被配置为将存储在所述拷贝源存储系统中的所述拷贝源文件系统拷贝到所述拷贝目的地存储系统中,并且在所述拷贝目的地存储系统中形成拷贝目的地文件系统;以及
更新数据指定单元,被配置为将所述拷贝源文件系统内的所述关键数据与所述拷贝目的地文件系统内的所述关键数据进行比较,并且将所述拷贝源文件系统内的所述关键数据所参考的所述拷贝源文件系统内的所述存储数据指定为更新数据,所述存储数据不存在于所述拷贝目的地文件系统中,
其中所述拷贝处理单元被配置为将存储在所述拷贝源文件系统内的所述更新数据复制到所述拷贝目的地文件系统中,
其中:
作为所述关键数据,存在有参考所述存储数据的数据以及参考包括一个或多个其他关键数据的元数据的数据,并且所述关键数据形成层级结构;以及
所述更新数据指定单元被配置为,在不存在于拷贝目的地文件系统中、拷贝源文件系统内的关键数据参考作为关键数据的比较结果的元数据的情况下,将包括在所述元数据中的、作为比较目标的所述关键数据与所述拷贝目的地文件系统内的所述关键数据进行比较。
2.根据权利要求1所述的复制系统,其中所述更新数据指定单元被配置为比较所述关键数据并且遵循不存在于拷贝目的地文件系统中、拷贝源文件系统内的关键数据的参考目的地,从而指定所述更新数据。
3.根据权利要求2所述的复制系统,其中所述更新数据指定单元被配置为按照从较高层级到较低层级的位置顺序来比较所述关键数据并遵循所述关键数据的参考目的地。
4.根据权利要求1所述的复制系统,其中所述拷贝处理单元被配置为将存储在所述拷贝源文件系统中并由所述更新数据指定单元指定的更新数据以及被所述更新数据指定单元认为不存在于所述拷贝目的地文件系统内的所述关键数据拷贝到所述拷贝目的地文件系统中。
5.根据权利要求1所述的复制系统,其中所述拷贝处理单元被配置为将存储在所述拷贝源文件系统中并由所述更新数据指定单元指定的更新数据、被所述更新数据指定单元认为不存在于所述拷贝目的地文件系统内的所述关键数据以及包括所述关键数据的所述元数据拷贝到所述拷贝目的地文件系统中。
6.根据权利要求1所述的复制系统,包括唯一信息生成单元,被配置为根据所述关键数据所参考的数据而生成唯一信息,以及将所述信息包括到所述关键数据中。
7.根据权利要求6所述的复制系统,其中所述唯一信息生成单元被配置为,当所述关键数据所参考的数据由于将所述更新数据存储到所述拷贝源文件系统中而改变时,根据所述数据而生成唯一信息并且将所述信息包括到参考所述数据的所述关键数据中。
8.一种复制设备,包括:
拷贝处理单元,被配置为将存储在存储有拷贝源文件系统的拷贝存储系统中的所述拷贝源文件系统拷贝到拷贝目的地存储系统中,并且在所述拷贝目的地存储系统中形成拷贝目的地文件系统,其中所述拷贝源文件系统包括存储数据和关键数据,所述关键数据参考所述存储数据并且根据其所参考的数据而唯一;以及
更新数据指定单元,被配置为将所述拷贝源文件系统内的所述关键数据与所述拷贝目的地文件系统内的所述关键数据进行比较,并且将所述拷贝源文件系统内的所述关键数据所参考的所述拷贝源文件系统内的所述存储数据指定为更新数据,所述存储数据不存在于所述拷贝目的地文件系统中,
其中所述拷贝处理单元被配置为将存储在所述拷贝源文件系统内的所述更新数据拷贝到所述拷贝目的地文件系统中,
作为所述关键数据,存在参考所述存储数据的数据以及参考包括一个或多个其他关键数据的元数据的数据,并且所述关键数据形成层级结构;以及
所述更新数据指定单元被配置为,在并不存在于拷贝目的地文件系统中而是在拷贝源文件系统内的关键数据参考作为关键数据的比较结果的元数据的情况下,将包括在所述元数据中的、作为比较目标的所述关键数据与所述拷贝目的地文件系统内的所述关键数据进行比较。
9.一种复制方法,包括:
将存储在存储拷贝源文件系统的拷贝源存储系统中的所述拷贝源文件系统拷贝到拷贝目的地存储系统中,并且在所述拷贝目的地存储系统中形成拷贝目的地文件系统,其中所述拷贝源文件系统包括存储数据和关键数据,所述关键数据参考所述存储数据并根据其所参考的数据而唯一;
将所述拷贝源文件系统内的所述关键数据与所述拷贝目的地文件系统内的所述关键数据进行比较,并且将所述拷贝源文件系统内的所述关键数据所参考的所述拷贝源文件系统内的所述存储数据指定为更新数据,所述存储数据在所述拷贝目的地文件系统中不存在;以及
将存储在所述拷贝源文件系统内的所述更新数据拷贝到所述拷贝目的地文件系统中,
其中:
在存在有参考所述存储数据的数据以及参考包括一个或多个其他关键数据的元数据的数据作为所述关键数据,并且所述关键数据形成层级结构的情况下,
在指定所述更新数据同时不存在于拷贝目的地文件系统中的、拷贝源文件系统内的关键数据参考作为关键数据的比较结果的元数据时,将包括在所述元数据中的、作为比较目标的所述关键数据与所述拷贝目的地文件系统内的所述关键数据进行比较。
CN200980156976.5A 2009-02-25 2009-09-03 存储系统 Expired - Fee Related CN102317923B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2009041894A JP5339432B2 (ja) 2009-02-25 2009-02-25 ストレージシステム
JP2009-041894 2009-02-25
PCT/JP2009/004337 WO2010097849A1 (ja) 2009-02-25 2009-09-03 ストレージシステム

Publications (2)

Publication Number Publication Date
CN102317923A CN102317923A (zh) 2012-01-11
CN102317923B true CN102317923B (zh) 2015-02-25

Family

ID=42665077

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200980156976.5A Expired - Fee Related CN102317923B (zh) 2009-02-25 2009-09-03 存储系统

Country Status (5)

Country Link
US (1) US8972343B2 (zh)
EP (1) EP2402862A4 (zh)
JP (1) JP5339432B2 (zh)
CN (1) CN102317923B (zh)
WO (1) WO2010097849A1 (zh)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5391705B2 (ja) * 2009-01-27 2014-01-15 日本電気株式会社 ストレージシステム
JP5413948B2 (ja) * 2009-01-27 2014-02-12 日本電気株式会社 ストレージシステム
JP5407430B2 (ja) * 2009-03-04 2014-02-05 日本電気株式会社 ストレージシステム
JP5500257B2 (ja) * 2010-09-30 2014-05-21 日本電気株式会社 ストレージシステム
JP5822452B2 (ja) * 2010-10-22 2015-11-24 株式会社インテック ストレージサービス提供装置、システム、サービス提供方法、及びサービス提供プログラム
US9910904B2 (en) 2011-08-30 2018-03-06 International Business Machines Corporation Replication of data objects from a source server to a target server
WO2014089760A1 (zh) * 2012-12-11 2014-06-19 华为技术有限公司 一种数据压缩方法及装置
CN103699585B (zh) * 2013-12-06 2017-04-19 华为技术有限公司 文件的元数据存储以及文件恢复的方法、装置和系统
US9501393B2 (en) * 2014-01-27 2016-11-22 Western Digital Technologies, Inc. Data storage system garbage collection based on at least one attribute
US11016941B2 (en) 2014-02-28 2021-05-25 Red Hat, Inc. Delayed asynchronous file replication in a distributed file system
US10025808B2 (en) 2014-03-19 2018-07-17 Red Hat, Inc. Compacting change logs using file content location identifiers
US9965505B2 (en) 2014-03-19 2018-05-08 Red Hat, Inc. Identifying files in change logs using file content location identifiers
US9986029B2 (en) * 2014-03-19 2018-05-29 Red Hat, Inc. File replication using file content location identifiers
US9218407B1 (en) 2014-06-25 2015-12-22 Pure Storage, Inc. Replication and intermediate read-write state for mediums
CN104156284A (zh) * 2014-08-27 2014-11-19 小米科技有限责任公司 文件备份方法和装置
CN104360953B (zh) * 2014-10-16 2018-01-23 华为技术有限公司 数据拷贝方法及装置
US10725708B2 (en) 2015-07-31 2020-07-28 International Business Machines Corporation Replication of versions of an object from a source storage to a target storage
US10482062B1 (en) * 2016-03-30 2019-11-19 Amazon Technologies, Inc. Independent evictions from datastore accelerator fleet nodes
US10938571B2 (en) * 2016-10-26 2021-03-02 Acronis International Gmbh System and method for verification of data transferred among several data storages
US11100086B2 (en) 2018-09-25 2021-08-24 Wandisco, Inc. Methods, devices and systems for real-time checking of data consistency in a distributed heterogenous storage system
US11449548B2 (en) 2019-11-27 2022-09-20 Elasticsearch B.V. Systems and methods for enriching documents for indexing
US11409755B2 (en) 2020-12-30 2022-08-09 Elasticsearch B.V. Asynchronous search of electronic assets via a distributed search engine

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1662905A (zh) * 2002-06-07 2005-08-31 网络装置公司 多路并行现用文件系统
CN101361048A (zh) * 2006-02-03 2009-02-04 国际商业机器公司 在信息生命周期管理环境中将文件恢复到其适当的存储级

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6061692A (en) * 1997-11-04 2000-05-09 Microsoft Corporation System and method for administering a meta database as an integral component of an information server
US6529917B1 (en) * 2000-08-14 2003-03-04 Divine Technology Ventures System and method of synchronizing replicated data
US7136867B1 (en) * 2002-04-08 2006-11-14 Oracle International Corporation Metadata format for hierarchical data storage on a raw storage device
US7444389B2 (en) 2003-12-09 2008-10-28 Emc Corporation Methods and apparatus for generating a content address to indicate data units written to a storage system proximate in time
JP2006301820A (ja) * 2005-04-19 2006-11-02 Hitachi Ltd ストレージシステム及びストレージシステムのデータ移行方法
US7418529B2 (en) * 2006-05-12 2008-08-26 Apple Inc. Method and apparatus for communicating with an embedded controller which includes a reference to metadata objects within a computing device
JP4715774B2 (ja) * 2007-03-02 2011-07-06 日本電気株式会社 レプリケーション方法、レプリケーションシステム、ストレージ装置、プログラム
JP4550869B2 (ja) * 2007-07-12 2010-09-22 株式会社東芝 データ同期システム及びデータ同期プログラム
JP2009041894A (ja) 2007-08-07 2009-02-26 Yoshihiro Tatemoto 回転式先導鋼管引抜きによる地中熱交換方法
US8572036B2 (en) * 2008-12-18 2013-10-29 Datalight, Incorporated Method and apparatus for fault-tolerant memory management
US8065323B2 (en) * 2009-02-23 2011-11-22 Oracle International Corporation Offline validation of data in a database system for foreign key constraints

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1662905A (zh) * 2002-06-07 2005-08-31 网络装置公司 多路并行现用文件系统
CN101361048A (zh) * 2006-02-03 2009-02-04 国际商业机器公司 在信息生命周期管理环境中将文件恢复到其适当的存储级

Also Published As

Publication number Publication date
JP5339432B2 (ja) 2013-11-13
US20110313971A1 (en) 2011-12-22
EP2402862A1 (en) 2012-01-04
EP2402862A4 (en) 2012-07-18
CN102317923A (zh) 2012-01-11
WO2010097849A1 (ja) 2010-09-02
US8972343B2 (en) 2015-03-03
JP2010198276A (ja) 2010-09-09

Similar Documents

Publication Publication Date Title
CN102317923B (zh) 存储系统
KR102240557B1 (ko) 데이터 저장 방법, 장치 및 시스템
JP5254611B2 (ja) 固定内容分散データ記憶のためのメタデータ管理
JP5637552B2 (ja) ストレージシステム
CN102938784A (zh) 应用于分布式存储系统中的数据存储方法和系统
JP5413948B2 (ja) ストレージシステム
US20120191675A1 (en) Device and method for eliminating file duplication in a distributed storage system
JP2019519025A (ja) 分散システムにおける範囲の分割および移動
CN106605217B (zh) 用于将应用从一个站点移动到另一站点的方法和系统
CN102282545B (zh) 存储系统
CN110162429A (zh) 系统修复方法、服务器及存储介质
CN102792281B (zh) 存储设备
CN112231291A (zh) 一种云端文件多分支版本管理的方法和装置
US20060129521A1 (en) System and method for restoring a file directory structure
CN102792259B (zh) 排除重复存储的存储装置
JP6269120B2 (ja) ストレージシステム
JP2012208650A (ja) ストレージ装置
CN105183531A (zh) 分布式开发平台及其计算方法
JP2005316624A (ja) データベース再編成プログラム、データベース再編成方法、及びデータベース再編成装置
JP3766079B2 (ja) ディスクアレイ装置およびプログラム
JP6201340B2 (ja) レプリケーションシステム
CN114968671B (zh) 克隆卷的实现方法及装置
JP5725546B2 (ja) ストレージシステム
CN112486932A (zh) 一种数据并发写入方法及分布式数据并发写入系统
JP2021105964A (ja) 情報処理方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
C53 Correction of patent of invention or patent application
CB02 Change of applicant information

Address after: Tokyo, Japan

Applicant after: NEC Corp.

Co-applicant after: NEC Software Tohoku, Ltd.

Address before: Tokyo, Japan

Applicant before: NEC Corp.

Co-applicant before: NEC SOFTWARE TOHOKU, LTD.

SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: JAPAN ELECTRICAL SCHEME INNOVATION CORPORATION

Free format text: FORMER OWNER: NEC SOFTWARE NORTHEAST CORPORATION

Effective date: 20141031

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20141031

Address after: Tokyo, Japan

Applicant after: NEC Corp.

Applicant after: NEC SOLUTION INNOVATORS, Ltd.

Address before: Tokyo, Japan

Applicant before: NEC Corp.

Applicant before: NEC Software Tohoku, Ltd.

C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150225

CF01 Termination of patent right due to non-payment of annual fee