CN101689135A - 使用联合储存库增加文件存储规模 - Google Patents

使用联合储存库增加文件存储规模 Download PDF

Info

Publication number
CN101689135A
CN101689135A CN200880021160A CN200880021160A CN101689135A CN 101689135 A CN101689135 A CN 101689135A CN 200880021160 A CN200880021160 A CN 200880021160A CN 200880021160 A CN200880021160 A CN 200880021160A CN 101689135 A CN101689135 A CN 101689135A
Authority
CN
China
Prior art keywords
sub
content
storage vault
storage
vault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200880021160A
Other languages
English (en)
Inventor
S·J·克罗克特
J·D·范
D·G·弗莱森哈恩
A·D·哈梅茨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN101689135A publication Critical patent/CN101689135A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/08Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/163Interprocessor communication
    • G06F15/17Interprocessor communication using an input/output type connection, e.g. channel, I/O port
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

使用联合储存库的存储管理系统将内容指向分层结构中的子储存库。用于管理存储的服务维持活动和历史的储存库列表,并且基于包括子储存库结构、存储策略等文件计划来执行对存储内容的路由。达到其容量的储存库被引退到历史状态,其中它们可用于查询目的,而不再用于存储。在添加新的储存库或引退旧的储存库时更新文件计划。文件计划发生变化,以及当子储存库查询服务时使诸如内容类型、搜索项、工作流等其它信息对子储存库可用。

Description

使用联合储存库增加文件存储规模
背景技术
许多公司和组织都有需要在定义的时间段内存储和维持的大电子内容集。随着时间的经过,这些内容集有增长的趋势,并且最终达到的大小对于单个储存库来说往往过大然而,组织需要以统一的方式来管理这些内容,尽管内容本身被划分在若干物理存储上。
管理这样的电子内容会提出额外的挑战,因为与内容相关联的策略也需要随时间而被修改。例如,在其业务的第一年,公司可能有2千万个详细说明研究和试验的文件,每一个都必须保留十年,并且其储存库可能被限制在总共2千万个文件。无法对现有储存库的物理大小进行扩展,并且由于其记录必须被保留许多年,公司可能以需要单独管理的若干杂乱的储存库而告终。这加大了管理公司记录的挑战,尤其是在适用于跨储存库内容的策略必须被修改的情况下。
发明内容
提供本概述是为了以简化的形式介绍将在以下详细描述中进一步描述的一些概念。该概述并非旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于帮助确定所要求保护的主题的范围。
各实施例针对使用联合储存库的内容存储管理。存储管理服务可管理子储存库,添加新的子储存库或引退那些达到其容量的子储存库,维持用于通过可用的和历史的子储存库信息来路由最新内容的文档计划。
通过阅读以下详细描述并查阅相关联的附图,这些和其它特征和优点将是显而易见的。可以理解,前述一般描述和以下详细描述均仅是说明性的,且不限制所要求保护的各方面。
附图说明
图1是示出了通过协调多个子储存库的存储管理服务来管理内容存储的概念图;
图2示出了管理多个存储储存库的示例存储管理服务的细节;
图3是其中可以实现各实施例的示例联网环境;
图4是其中可以实现各实施例的示例计算操作环境的框图;以及
图5示出了根据各实施例的示例内容存储过程的逻辑流程图。
具体实施方式
如上简要描述的,使用由存储管理服务所管理的联合储存库可增加并优化文件存储规模。在以下详细描述中,参考了构成其一部分并作为说明示出了各具体实施例或示例的附图。可组合这些方面,可利用其它方面并且可以做出结构上的改变而不背离本发明的范围。由此,以下详细描述并不旨在限制,本发明的范围由所附权利要求及其等效方案所定义。
虽然在结合在个人计算机上的操作系统上运行的应用程序执行的程序模块的一般上下文环境中描述了各实施例,但是本领域的技术人员会认识到各方面也可以结合其它程序模块实现。
一般而言,程序模块包括执行特定任务或实现特定的抽象数据类型的例程、程序、组件、数据结构和其它类型的结构。而且,如本领域的技术人员理解的,各实施例可以用其它计算机系统配置来实施,包括手持式设备、多处理器系统、基于微处理器或可编程消费者电子产品、小型机、大型机等等。各实施例还能在其中任务由通过通信网络链接的远程处理设备来执行的分布式计算环境中实现。在分布式计算环境中,程序模块可以位于本地和远程存储器存储设备中。
各实施例可被实现为计算机过程(方法)、计算系统、或者如计算机程序产品或计算机可读介质等制品。计算机程序产品可以是计算机系统可读并编码了用于执行计算机进程的指令的计算机程序的计算机存储介质。计算机程序产品还可以是计算系统可读并编码了用于执行计算机进程的指令的计算机程序的载波上的传播信号。
参考图1,示出了通过协调多个子储存库的存储管理服务来管理内容存储的概念图。根据各实施例,可存储在系统中的内容可包括任何形式的数据,诸如文本数据、文件、视频流、音频流、图像等等。该内容还可包括指向存储于另一系统中的数据的指针。
在根据各实施例的系统中,存储管理服务104可从诸如用户、网络节点、输入设备等许多来源接收内容102。存储管理服务104维持子储存库(例如,子储存库1、2等)的分层结构,确保诸如内容类型、字段类型、搜索项、用户角色等信息在系统范围内是已知的。此外,存储管理服务104维持活动的(当前可用于存储内容)和引退的(不再接受用于存储的内容,但对于诸如搜索的其它操作可用)子储存库的列表,以及维持用于将接收的内容路由到适用的用于存储的子储存库的文件计划。由此,存储管理服务104不仅管理存储的内容,而且还管理存储储存库的特性。
诸如保持策略等策略可被用于管理子储存库中的内容存储连同文件计划,其中可以将适用于其中所存储内容的策略通知受影响的子储存库。
子储存库可包括一个或多个虚拟或物理数据存储,其可由执行存储管理服务104的服务器或由本地服务器单独或分组管理。例如,子储存库1(106)可以是由还执行存储管理服务104的中心服务器管理的单个数据存储。另一方面,子储存库2(108)可包括由单独的数据库服务器管理的一组数据存储。旨在用于子储存库2的存储的任何通信可被引向其数据库服务器。
根据一实施例,一示例场景可以如下:一公司有五个活动项目,并且通过用五个“联合”储存库、其中每个可以支持2千万个记录来创建分布式企业储存库而开始。每个项目被分配给一个单独的储存库。当第六个项目开始时,第六储存库可通过中央管理工具被添加到文件计划,并且用于该项目的文件可被存储在新的储存库中。出乎意料地,新项目可能需要预期的10倍的内容,并且仅仅短时间段之后,其分配的储存库就可能是接近满的。在这种情况下,新的储存库可被添加到系统中,并且关于新项目的新的传入内容可以被路由到该新的储存库。用于新项目的原始储存库可以被“引退”(即,新内容不再放置在那里)。内容可继续存储在组织上而没有障碍。
根据各实施例的对内容存储系统的修改不限于基于内容大小的存储需要。将新分区添加到系统的其它理由可以包括基于组织和管理的分区需要。例如,项目可与高度敏感的内容相关联,其可被存储在不同的(具有适当属性)储存库中。
使用联合储存库的存储管理系统的组件可以在分布式网络上、在单独的服务器中、在客户机设备中等被执行。此外,在此描述的组件仅出于说明目的,并不构成对各实施例的限制。使用联合储存库的存储管理系统可以各种次序使用更少或附加的组件来实现。单独组件可以是单独的应用程序,或是单个应用程序的一部分。此外,系统或其组件可单独地或共同地包括诸如web服务、图形用户界面(GUI)等用户界面。
图2示出了管理多个存储储存库的示例存储管理服务的细节。对于待正确配置并且反映出在存储管理服务204的中心指定的分层结构、策略、以及诸如内容类型、字段类型、搜索项、用户角色等信息的子储存库,可以在每个孩子与中心之间建立一个通信信道。根据某些实施例,该通信信道可被自动配置。
存储管理服务204可以是在一个或多个服务器上执行的应用程序或者是受管理的服务。根据一实施例,存储管理服务204可包括子储存库列表232,该子储存库列表232包括活动和存档子储存库的列表和分层结构信息、用于根据可基于策略、分层结构、内容类型、相关内容等的文件计划将接收到的内容路由到适当子储存库的文件计划模块。存储管理服务204可进一步包括搜索协调模块236,用于协调对存储在子储存库中内容的搜索与结果,以及保持请求模块238,用于向改变受影响内容的保持策略的子储存库发出对特定内容的保持请求。
存储储存库220可包括由数据存储服务器单独或分组管理的多个站点集合(SC)。SC 222-X可包括用于存储内容的一个或多个物理和/或虚线数据存储。从中心传送到其孩子的项目的示例可包括但不限于以下:
·内容类型-当在全局级创建新的内容类型时,可能期望中心的所有孩子都认识它。内容类型还可以包括元数据模式。
·策略-组织可能需要,例如,在预定时间段之后销毁关于特定项目的所有内容。中心可向所有受影响的孩子指示该全局策略。
·文件计划-当总体文件计划的分层结构被修改时,受影响的孩子也可更新其文件夹结构。
·其它-一般而言,在全局级可被定义并涉及在其上存储内容的储存库的任何项。其它项的示例包括字段类型、工作流、用户角色、项设置、内容重复使用模板等。
文件计划可在单独的储存库上指定特定内容应存储的位置,而不受限于本地储存库中的位置。当内容被提交到记录中心,随后其可在本地被路由或是被路由到单独的储存库。可在中心处指定文件计划的总体分层结构。当在文件计划中指定了需要存在于子储存库中的文件夹结构时,该结构在子储存库中自动被创建。为了在给定时间为总体记录中心添加更多容量,可创建一个新的储存库并且使其与记录中心联合。随后可修改文件计划以将内容路由到新的储存库。如上所述,当联合储存库达到其容量时,可添加新的储存库以及改变部分文件计划的路由来指向新的储存库。文件计划先前指向的储存库可作为对等内容的历史或存档存储来管理。
“保持”是在一组记录必须被保留一不定时间量(例如,出于法律目的)的时候。当发生保持关于特定主题或实体的所有文档的需求时,可以向所有联合储存库发出共同命令来保持适当的内容。
在一示例操作中,多个储存库(“孩子”)被创建成具有分层结构。这一储存库可以是一站点对象。创建记录中心用于所有内容的管理。记录中心包括与存储管理服务(“服务”)相关联的“中心”,但它也包括孩子。当对“中心”作出(例如,策略、文件夹分层结构、内容类型、工作流、或字段类型)改变,这种情况会向“服务”报告。
当被查询时,“服务”可报告自给定时间以来在“中心”上发生的变化,并且提供任何所需的已更新对象。每个孩子可被配置成周期性地查询“服务”以接收具体与自身有关的更新。应当注意,当特定改变与给定的孩子相关时,也可以与整组的孩子相关。在另一实施例中,“服务”也可提供对受影响的孩子的改变而无需查询。
可在中心创建具有分层结构并用于路由提交给记录中心的文件的文件计划。文件计划中的某些节点可以被指定为孩子中的根节点。节点中的元数据可指示与其相关联的孩子的身份。对应于每个根节点的孩子的身份和/或统一资源定位符(URL)可被记录在所有当前或历史孩子的非减列表中。
如果文件计划被更新以包含根节点下的文件夹分层结构,则可向“服务”报告该分层结构和其相关联的根节点。如果当查询“服务”时,孩子获知根节点下的文件夹分层结构已改变,则依孩子自己来创建新的分层结构或修改根节点下的现有分层结构。当文档被提交给记录中心并且文件计划将该文档路由到根节点时,文档可以被存储在相关联的孩子中的根节点处。当文档被提交给记录中心并且文件计划将该文档路由到根节点下的文件夹时,文档可以被存储在对应于文件计划中特定文件夹的相关联的孩子中的文件夹处。
一旦建立了中心,就可以创建孩子并将其配置成向“服务”查询更新。同样,根节点可在文件计划中被配置成指向先前未被用于存储的孩子。当孩子接近或到达其存储容量时,可创建新的孩子并且重新配置文件计划,使得将新内容指向旧的孩子的根节点现在则将它们指向新的孩子。根据又一实施例,出于参考目的(而不是为了路由新的内容),指向旧的孩子的历史指针可保留在根节点。
旧的孩子可被标记为历史的或存档的,使得没有附加内容存储在那里,并且旧的孩子可继续周期性地查询“服务”。此外,文件计划可在任何时刻被更新来改变如何路由内容,无论内容被路由到根节点或根节点下的文件夹。
根据又一实施例,如果存档的内容被删除,旧的孩子可再次变为活动的,并且该孩子再次变为可用于存储。在这一情况下,可更新文件计划来反映旧的孩子的重新激活。
“保持”在用户指示关于特定主题或用户的所有内容要被保留不定时间量时发生。当在中心处采取该动作时,中心可向孩子列表(或孩子的子组)中的每个孩子发出保持请求。每个孩子对本地文件夹分层结构执行搜索,并且标记与标签相匹配的内容,该标签指示它们与保持相关联。随后,每个孩子可创建与保持相关联的所有内容的列表,并将该列表报告回中心。中心可收集来自每个孩子的保持报告,并且将它们组合成单个列表用于发出的保持请求。
根据又一实施例,当在中心改变内容类型或将节点添加到文件计划时,中心可确定文件计划中的哪些根节点受到变化的影响。作为其对“服务”周期性查询的一部分,每个孩子最终可询问是否发生过对中心的改变。如果对内容类型的改变影响到孩子,可下载新的或已更新的内容类型,并且将其应用在其本地文件夹分层结构中合适的层级。可实现同一进程用于先前所列的被传送项的任何改变。
图3是其中可以实现各实施例的示例联网环境。使用联合储存库的存储管理可以在单个计算设备上本地实现,或在以分布式方式配置在多个物理和虚拟的客户机和服务器上的一个或多个计算设备中实现。它还可以在非群集系统或利用通过一个或多个网络(例如,网络350)通信的多个节点的群集系统中实现。
这种系统可以包括服务器、客户机、因特网服务提供者、以及通信介质的任何拓扑结构。同样,系统可具有静态或动态拓扑结构,其中系统的分层结构中服务器和客户机的角色以及它们的相互关系可由管理员来静态地定义或基于设备可用性、负载平衡等来动态地定义。术语“客户机”可以表示客户机应用程序或客户机设备。尽管实现使用联合储存库的存储管理的联网系统可以涉及更多组件,但相关组件仍然结合此图来讨论。
根据各实施例的内容存储管理系统可从诸如客户机设备341-343等多个来源接收内容。存储管理系统的部分或全部可在服务器452上实现,并且可由任何一个客户机设备(或应用程序)访问。与系统(联合储存库)相关联的数据存储可包括单独的数据存储(例如,356、358)或由数据服务器354管理的数据存储群集(355)。
网络350可以包括诸如企业网络等安全网络、诸如无线开放网络等非安全网络、或因特网。网络350提供此处描述的节点之间的通信。作为示例而非局限,网络350可以包括诸如有线网络或直接线连接等有线介质,以及诸如声学、RF、红外线和其它无线介质等无线介质。
可以利用计算设备、应用程序、数据源、数据分布系统的许多其它配置来实现使用联合存储的内容存储管理。此外,图3中所讨论的联网环境仅用于说明目的。各实施例不限于示例应用程序、模块、或过程。
图4及相关联的讨论旨在提供对适于在其中实现各实施例的计算环境的简要概括描述。参考图4,示出了诸如计算设备400等示例计算操作环境的框图。在基本配置中,计算设备400可以是服务器或客户机。计算设备400通常可包括至少一个处理单元402和系统存储器404。计算设备400还可包括协作执行程序的多个处理单元。取决于计算设备的确切配置和类型,系统存储器404可以是易失性的(诸如RAM)、非易失性的(诸如ROM、闪存等)或是两者的某种组合。系统存储器404通常包括适于控制联网的个人计算机的运作的操作系统405,诸如来自华盛顿州雷德蒙市的微软公司的
Figure A20088002116000131
操作系统。系统存储器404还可包括诸如程序模块406、存储管理服务422、储存库列表423、文件计划模块424、搜索协调模块425和保持请求模块426等一个或多个软件应用程序。
存储管理服务422可以是向用户提供内容存储和搜索服务的应用程序或受管理的服务。存储管理服务422可与附加组件相关联,而不仅是被示作用于与联合储存库系统中存储内容相关联的附加功能的组件。先前已描述过储存库列表423、文件计划模块424、搜索协调模块425和保持请求模块426的功能和操作。该基本配置在图4中由虚线408内的组件示出。
计算设备400可具有附加的特征或功能。例如,计算设备400还可包括附加的数据存储设备(可移动和/或不可移动),诸如例如磁盘、光盘或磁带。这些附加的存储在图4中由可移动存储409和不可移动存储410示出。计算机存储介质可包括以用于存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。系统存储器404、可移动存储409和不可移动存储410都是计算机存储介质的示例。计算机存储介质包括,但不限于,RAM、ROM、EEPROM、闪存或其它存储器技术、CD-ROM、数字多功能盘(DVD)或其它光盘存储、磁带盒、磁带、磁盘存储或其它磁性存储设备、或能用于存储所需信息且可以由计算设备400访问的任何其它介质。任何这样的计算机存储介质都可以是设备400的一部分。计算设备400还可具有诸如键盘、鼠标、笔、语音输入设备、触摸输入设备等输入设备412。还可包括诸如显示器、扬声器、打印机等输出设备414。这些设备在本领域中公知且无需在此处详细讨论。
计算设备400还可以包含允许该设备诸如在分布式计算环境中,例如在内联网或互联网中通过无线网络与其它计算设备418通信的通信连接416。其它计算设备418可包括服务器。通信连接416是通信介质的一个示例。通信介质通常由诸如载波或其它传送机制等已调制数据信号中的计算机可读指令、数据结构、程序模块或其它数据来体现,并包括任何信息传递介质。术语“已调制数据信号”指的是其一个或多个特征以在信号中编码信息的方式被设定或更改的信号。作为示例而非限制,通信介质包括有线介质,诸如有线网络或直接线连接,以及无线介质,诸如声学、RF、红外线和其它无线介质。如此处所使用的术语计算机可读介质包括存储介质和通信介质两者。
所要求保护的主题还包括操作的各方法。这些方法可以用任何数量的方式,包括本文中所描述的结构来实现。一种此类方式是通过本文中描述的类型的设备的机器操作。
另一可任选方式是结合一个或多个人类操作者执行该方法的各个操作中的某一些来执行该方法的一个或多个操作。这些人类操作者无需彼此同在一处,但是其每一个可以仅与执行程序的一部分的机器同在一处。
图5示出了根据各实施例的示例内容存储过程的逻辑流程图。过程500可作为存储关联系统的一部分来实现。
过程500开始于操作502,其中新内容由服务接收用于存储。处理从操作502行进至操作504。在操作504,如前所述,基于文件计划确定目标子储存库。处理从操作504继续至判定操作506。
在判定操作506,作出目标子储存库是否达到其存储容量(或预定限制)的判定。如果子储存库没有达到其容量,在后续操作508新的内容被存储在该子储存库。如果子储存库已达到其容量,过程继续至操作510。
在操作510,新的子储存库被添加到联合储存库的分层结构系统。可创建或修改新的子储存库的文件夹结构来匹配文件计划所规定的以及子储存库提供的信息诸如内容类型等。处理从操作510继续至操作512。
在操作512,新的内容存储在新添加的子储存库。处理从操作512继续至操作514,其中满容量的子储存库被引退(即,被指定为存档或历史,并且不再适合于存储附加的内容)。处理从操作514继续至操作516。
在操作516,通过新的子储存库结构连同由服务维持的子储存库列表一起来更新文件计划。可通过用于跨子储存库导航的新信息来后续更新其它子储存库。在操作516之后,处理移动至调用过程以进行进一步动作。
包括在过程500内的各操作仅出于说明目的。使用联合储存库提供内容存储管理可以使用此处所述的各原理通过具有更少或更多步骤的相似过程、以及不同的操作次序来实现。具体地,结合图3描述的多个可任选操作在上述过程中未列出。那些或其它操作也可以任何次序被添加到过程500。
以上说明、示例和数据提供了对各实施例成分的制造和使用的全面描述。尽管用对结构特征和/或方法动作专用的语言描述了本主题,但可以理解,所附权利要求书中定义的主题不必限于上述具体特征或动作。相反,上述具体特征和动作是作为实现权利要求和各实施例的示例形式而公开的。

Claims (20)

1.一种使用联合储存库管理内容(102)存储的方法,所述方法包括:
生成分层结构存储系统,其中内容(102)和分层结构信息根据文件计划从存储系统的父储存库中的中央中心节点被散布到从属节点(220);
当在中央中心节点(204)执行包括以下集合中的至少一个改变时:内容提交(502)、文件计划的修改、策略定义的改变、以及新的从属节点的添加,将与所述改变相关联的信息传送到子储存库;
如果所述传送的信息的一部分具有全局影响,则将该部分信息传送到所有从属节点,其中存储系统内每个子储存库包括至少一个从属节点。
2.如权利要求1所述的方法,其特征在于,进一步包括:
当接收到新内容提交(502)用于存储时,向目标从属节点传送与以下集合中的至少一个相关联的信息:与所述新内容相关联的内容类型、保持策略、属性、工作流、用户信息、内容起点信息、和多个查询项。
3.如权利要求2所述的方法,其特征在于,至少一部分子储存库(106、108)包括向每个子储存库(106、108)的从属节点(“根节点”)报告的文件夹结构,并且其中响应于文件计划的修改来更新所述文件夹结构。
4.如权利要求2所述的方法,其特征在于,进一步包括:
根据所述文件计划将新内容的相关部分存储在单独子储存库和多个子储存库(106、108)中的一种,其中所述新内容包括以下各项之一:活动内容、要存档的内容、以及活动内容与要存档的内容的组合。
5.如权利要求2所述的方法,其特征在于,进一步包括:
响应于新的子储存库添加(510)到所述存储系统,根据所述新的子储存库中的文件计划来创建文件夹结构,并且将与新内容相关联的信息传递到所述新的子储存库。
6.如权利要求5所述的方法,其特征在于,进一步包括:
修改(516)所述文件计划以将适用的新内容路由到新的子储存库。
7.如权利要求2所述的方法,其特征在于,进一步包括:
响应于子储存库达到其容量,通过修改文件计划内的内容路由来引退(514)所述子储存库,并将引退的子储存库指定为存档。
8.如权利要求1所述的方法,其特征在于,进一步包括:
响应于以下各项之一来修改用于存储在至少一个子储存库的内容的保持策略:管理者输入、预定义期间期满、以及分层结构中的改变。
9.如权利要求8所述的方法,其特征在于,所述修改是以下各项之一:指定要移除的内容、指定要移至另一位置的内容、以及指定要无限期保留的内容。
10.一种使用联合储存库管理内容存储的系统,所述系统包括:
在与记录中心相关联的至少一个服务器中执行的内容管理服务(204),其中所述内容管理服务包括:
与记录中心相关联的子储存库(232)的分层结构化列表;以及
文件计划模块(234),其被配置成:
维持与以下至少一项相关联的内容信息:与存储在子储存库中的内容相关联的内容类型、保持策略、属性、工作流、用户信息、和多个查询项;
根据预定义文件计划将新内容路由到适用的子储存库(222-X);
响应于以下各项之一更新(516)文件计划:添加新的子储存库和引退达到其容量的子储存库;以及
响应于修改将文件夹结构和内容信息分散到所述子储存库(222-X)。
11.如权利要求10所述的系统,其特征在于,所述内容管理服务(204)还包括用于启用子储存库(222-X)以查询内容管理服务(204)并且接收更新的文件夹结构和内容信息的查询协调模块。
12.如权利要求10所述的系统,其特征在于,所述内容管理服务(204)还包括用于通过修改文件计划中其保持策略在至少一个子储存库中保持选择的内容的保持请求模块(238)。
13.如权利要求10所述的系统,其特征在于,每个子储存库包括以下集合中的至少一个:物理数据存储和虚拟数据存储,其中每个子储存库由内容管理服务服务器和本地数据库服务器中的一个来管理。
14.如权利要求10所述的系统,其特征在于,每个子储存库的文件夹结构包括一个与所述子储存库相关联的根节点,并且其中与所述子储存库相关联的标识符作为元数据被维持在根节点。
15.如权利要求14所述的系统,其特征在于,其中内容管理服务被配置成使用元数据维持所述标识符和用于子储存库(232)的分层结构化列表中每个子储存库的统一资源定位符中的至少一个。
16.如权利要求15所述的系统,其特征在于,所述子储存库(232)的分层结构化列表还包括每个子储存库的指定,以指示所述子储存库是否是当前和存档中的一个,存档指定向文件计划模块指示没有新内容要被路由到存档指定的子储存库。
17.一种具有在其上编码的指令用于使用联合储存库来管理内容存储的计算机可读存储介质,所述指令包括:
在中央内容管理中心(204)维持与以下集合中的至少一项相关联的内容信息:与存储在子储存库中的内容相关联的内容类型、保持策略、属性、工作流、用户信息、内容起点信息、和多个查询项;
当接收到用于存储的新内容时,根据预定义文件计划将所述新内容路由到子储存库(222-X)中适用的从属节点,其中根据文件计划所述新内容的相关部分存储在以下之一:单独子储存库和多个子储存库;
响应于以下之一更新所述文件计划:添加(510)新的子储存库和引退(514)达到其容量的子储存库;以及
响应于修改将更新的文件夹结构和内容信息分散(516)到所述子储存库。
18.如权利要求17所述的计算机可读存储介质,其特征在于,将更新的文件夹结构和内容信息分散到所述子储存库包括:
确定哪些从属节点受到更新的影响;以及
当子储存库(222-X)查询中央内容管理中心(204)时,使更新的文件夹结构和内容信息对子储存库(222-X)可用。
19.如权利要求17所述的计算机可读存储介质,其特征在于,所述指令还包括:
响应于来自用户的保持命令,向每个子储存库发出对选择的内容的保持请求;
从具有受影响的内容的子储存库接收保持报告,其中所述保持报告包括每个子储存库中已被指定无限期保留的存储内容列表;以及
将保持报告组合成单个系统范围内的保持报告。
20.如权利要求17所述的计算机可读存储介质,其特征在于,所述指令还包括:
启用对与所述中央内容管理中心(204)相关联的所有子储存库中存储内容执行的搜索;以及
启用要被指定为中央内容管理中心(204)的子储存库中的一个。
CN200880021160A 2007-06-20 2008-05-31 使用联合储存库增加文件存储规模 Pending CN101689135A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/765,747 US20080320011A1 (en) 2007-06-20 2007-06-20 Increasing file storage scale using federated repositories
US11/765,747 2007-06-20
PCT/US2008/065447 WO2008157006A1 (en) 2007-06-20 2008-05-31 Increasing file storage scale using federated repositories

Publications (1)

Publication Number Publication Date
CN101689135A true CN101689135A (zh) 2010-03-31

Family

ID=40137586

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200880021160A Pending CN101689135A (zh) 2007-06-20 2008-05-31 使用联合储存库增加文件存储规模

Country Status (6)

Country Link
US (1) US20080320011A1 (zh)
EP (1) EP2181392A4 (zh)
JP (1) JP2010530588A (zh)
KR (1) KR20100017851A (zh)
CN (1) CN101689135A (zh)
WO (1) WO2008157006A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103370711A (zh) * 2011-03-03 2013-10-23 惠普发展公司,有限责任合伙企业 记录管理系统
CN106796542A (zh) * 2014-08-13 2017-05-31 Netapp股份有限公司 合并存储操作
CN107408239A (zh) * 2015-03-09 2017-11-28 微软技术许可有限责任公司 通过多个邮箱在通信应用中进行海量数据管理的架构
US11240188B2 (en) 2015-03-09 2022-02-01 Microsoft Technology Licensing, Llc Large data management in communication applications through multiple mailboxes

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009134772A2 (en) * 2008-04-29 2009-11-05 Maxiscale, Inc Peer-to-peer redundant file server system and methods
US9047294B2 (en) 2012-06-11 2015-06-02 Oracle International Corporation Model for generating custom file plans towards management of content as records
US9386353B2 (en) * 2013-01-25 2016-07-05 Huawei Technologies Co., Ltd. Child node, parent node, and caching method and system for multi-layer video network
US10521397B2 (en) * 2016-12-28 2019-12-31 Hyland Switzerland Sarl System and methods of proactively searching and continuously monitoring content from a plurality of data sources

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7043472B2 (en) * 2000-06-05 2006-05-09 International Business Machines Corporation File system with access and retrieval of XML documents
EP1197876A3 (en) * 2000-10-13 2003-04-16 Miosoft Corporation Persistent data storage techniques
US7454446B2 (en) * 2001-08-31 2008-11-18 Rocket Software, Inc. Techniques for storing data based upon storage policies
US7559059B2 (en) * 2001-09-21 2009-07-07 Bea Systems, Inc. Method and apparatus for smart directories for application deployment
US20030069946A1 (en) * 2001-10-05 2003-04-10 Adc Telecommunications, Inc. Central directory server
US20030158865A1 (en) * 2001-12-28 2003-08-21 Frank Renkes Managing multiple data stores
US7096328B2 (en) * 2002-01-25 2006-08-22 University Of Southern California Pseudorandom data storage
SE524679C2 (sv) * 2002-02-15 2004-09-14 Ericsson Telefon Ab L M System för broadcast/multicast-utsändning av datainformation emot en lokal del av ett trådlöst nät
US20040030731A1 (en) * 2002-04-03 2004-02-12 Liviu Iftode System and method for accessing files in a network
US20060089954A1 (en) * 2002-05-13 2006-04-27 Anschutz Thomas A Scalable common access back-up architecture
US20040205581A1 (en) * 2002-07-15 2004-10-14 Gava Fabio M. Hierarchical storage
US7349921B2 (en) * 2002-09-27 2008-03-25 Walgreen Co. Information distribution system
US7293286B2 (en) * 2003-02-20 2007-11-06 Bea Systems, Inc. Federated management of content repositories
DE602004023496D1 (de) * 2003-04-25 2009-11-19 Apple Inc Ein gesichertes netzwerkbasiertes inhaltverteilungsverfahren und -system
US7203711B2 (en) * 2003-05-22 2007-04-10 Einstein's Elephant, Inc. Systems and methods for distributed content storage and management
US7860255B2 (en) * 2003-12-17 2010-12-28 Panasonic Corporation Content distribution server, key assignment method, content output apparatus, and key issuing center
US7162504B2 (en) * 2004-04-13 2007-01-09 Bea Systems, Inc. System and method for providing content services to a repository
US8108430B2 (en) * 2004-04-30 2012-01-31 Microsoft Corporation Carousel control for metadata navigation and assignment
US20060230044A1 (en) * 2005-04-06 2006-10-12 Tom Utiger Records management federation
KR100722148B1 (ko) * 2005-06-15 2007-05-28 주식회사 안철수연구소 네트워크 상에서 파일 분배 방법 및 그 시스템
US7752205B2 (en) * 2005-09-26 2010-07-06 Bea Systems, Inc. Method and system for interacting with a virtual content repository
US7720813B2 (en) * 2005-10-21 2010-05-18 International Business Machines Corporation Apparatus, system, and method for the autonomic virtualization of a data storage server
US7831793B2 (en) * 2006-03-01 2010-11-09 Quantum Corporation Data storage system including unique block pool manager and applications in tiered storage

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103370711A (zh) * 2011-03-03 2013-10-23 惠普发展公司,有限责任合伙企业 记录管理系统
CN106796542A (zh) * 2014-08-13 2017-05-31 Netapp股份有限公司 合并存储操作
CN107408239A (zh) * 2015-03-09 2017-11-28 微软技术许可有限责任公司 通过多个邮箱在通信应用中进行海量数据管理的架构
US11240188B2 (en) 2015-03-09 2022-02-01 Microsoft Technology Licensing, Llc Large data management in communication applications through multiple mailboxes

Also Published As

Publication number Publication date
EP2181392A4 (en) 2011-07-13
JP2010530588A (ja) 2010-09-09
EP2181392A1 (en) 2010-05-05
WO2008157006A1 (en) 2008-12-24
KR20100017851A (ko) 2010-02-16
US20080320011A1 (en) 2008-12-25

Similar Documents

Publication Publication Date Title
RU2337398C2 (ru) Способ и устройство для синхронизации того, как данные сохраняются в различных хранилищах данных
EP2943859B1 (en) System, method, and computer-readable medium for managing edge devices
Watson Databases and the Grid
CN101689135A (zh) 使用联合储存库增加文件存储规模
US7738503B2 (en) Multi-way, peer-to-peer synchronization
CN101385017B (zh) 部分项改变跟踪和同步
CN101681344B (zh) 用于带同步的双向数据修改的方法和系统
CN103649945B (zh) 最近使用的文档列表的自动同步
US20060123010A1 (en) System and method for managing data in a distributed computer system
AU2014213556B2 (en) Employing user-context in connection with backup or restore of data
US20050160088A1 (en) System and method for metadata-based distribution of content
CN102804202B (zh) 内容网格搜索
CN101796752A (zh) 无限企业平台
JP2010529554A5 (zh)
US7735115B2 (en) System which enforces policy for virtual private organization and method thereof
JP2006012146A (ja) 影響分析のためのシステムおよび方法
WO2005099381A9 (en) Expression and time-based data creation and creator-controlled organization
GB2399663A (en) Synchronising content between two sources using profiles
CN1689298B (zh) 用于自主计算的合成服务
EP1645978A1 (en) Organization of static and dynamic data sets
CN102257499B (zh) 管理持久文档集合的技术
JP7106000B2 (ja) 追跡識別子を用いたオブジェクト管理方法、装置、コンピュータプログラムおよびその記録媒体
CN104699477A (zh) 基于近场通信的数据传送
US20060080288A1 (en) Interaction of static and dynamic data sets
US20220335106A1 (en) Cloud-native content management system

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20100331