CN101334791A - 用于执行智能内容索引的技术 - Google Patents

用于执行智能内容索引的技术 Download PDF

Info

Publication number
CN101334791A
CN101334791A CNA2008101102308A CN200810110230A CN101334791A CN 101334791 A CN101334791 A CN 101334791A CN A2008101102308 A CNA2008101102308 A CN A2008101102308A CN 200810110230 A CN200810110230 A CN 200810110230A CN 101334791 A CN101334791 A CN 101334791A
Authority
CN
China
Prior art keywords
data
client
index
search engine
described client
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2008101102308A
Other languages
English (en)
Other versions
CN101334791B (zh
Inventor
Y-P·察瓦尔
T·科克伦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NortonLifeLock Inc
Original Assignee
Symantec Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Symantec Corp filed Critical Symantec Corp
Publication of CN101334791A publication Critical patent/CN101334791A/zh
Application granted granted Critical
Publication of CN101334791B publication Critical patent/CN101334791B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1464Management of the backup or restore process for networked environments

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Communication Control (AREA)

Abstract

用于执行智能内容索引的技术,本文公开了用于智能内容索引的技术。在一个特定的示例性实施例中,所述技术可实现为用于执行智能内容索引的方法,其包括通过一个或多于一个与客户端相关联的过程来将所述客户端的初始完整数据集编索引以创建客户端数据的索引,检测所述客户端数据中的变化,以及修改所述索引以反映所述客户端数据中的所述变化。

Description

用于执行智能内容索引的技术
技术领域
【0001】本发明一般地涉及数据存储系统,并且,更具体地,涉及用于执行智能内容索引的技术。
背景技术
【0002】典型的企业计算环境由数百到数千个客户端机器组成。客户端机器可包括桌上型计算机、膝上型计算机、服务器和其它计算设备。由于这样大量的客户端机器,所以海量的数据需要被保护。此外,存在可能要求长时间的数据维护的新的一致性管理(complianceregulation)。这导致由共享的保护服务器所保护和管理的历史数据的指数级增长。为了提供基于数据内容来定位历史数据的能力,常常利用内容索引技术。
【0003】传统地,通过备份数据到共享的保护服务器上并且在该共享的保护服务器上扫描备份数据来创建中心内容索引来完成内容索引。然而,内容索引是处理器和存储器非常密集的操作。必须为接收到的每个客户端的每个备份映像实行该操作。此外,备份数据的索引的存储空间是相当大的。
【0004】由前文所述,可以理解可能存在和将备份数据编索引的当前方法关联的重要问题和缺点。
发明内容
【0005】用于智能内容索引的技术被公开。在一个特定的示例性实施例中,所述技术可以被实现为用于执行智能内容索引的方法,其包括通过一个或多于一个与客户端相关联的过程来将客户端的初始完整数据集编索引以创建客户端数据的索引,检测该客户端数据中的变化,以及修改索引以反映该客户端数据中的变化。
【0006】在另一个特定的示例性实施例中,该技术可被用于执行智能内容索引的系统实现,该系统包括与客户端相关联的索引引擎,该索引引擎被配置为将客户端的初始完整数据集编索引以产生该客户端数据的索引,检测该客户端数据中的变化,以及修改索引以反映该客户端数据中的变化。
【0007】本公开现在将参照在附图中示出的示例性实施例被更详细地描述。尽管在下面本公开参照示例性实施例来描述,但应理解本公开不限于此。可以理解本文教导内容的本领域普通技术人员会认识到在此处描述的本公开范围内的附加实施方式、修改以及实施例,以及在其它领域的用途,以及本公开可能因为与其相关而具有重要效用。
附图说明
【0008】为了促进对本公开的更全面的理解,现在参考附图,其中同样的单元用同样的数字指示。这些附图不应被解释为对本公开的限制,而是仅为了示例。
【0009】图1示出根据本公开的实施例的智能内容索引的系统。
【0010】图2示出根据本公开的替代性实施例的智能内容索引的系统。
【0011】图3示出根据本公开的另一个替代性实施例的智能内容索引的系统。
【0012】图4示出根据本公开的实施例的智能内容索引的方法。
【0013】图5示出根据本公开的替代性实施例的智能内容索引的方法。
【0014】图6示出根据本公开的另一个替代性实施例的智能内容索引的方法。
【0015】图7示出根据本公开的另一个替代性实施例的智能内容索引的方法。
具体实施方式
【0016】参考图1,示出根据本公开的实施例的智能内容索引系统100。客户端110可代表含有索引引擎115和备份代理125且运行地连接到网络120的计算设备。备份代理125可含有改变事件记录器135。在一个或多于一个实施例中,备份代理125可以是单独的计算设备。备份服务器140可能运行地连接到网络120并且可能管理网络120上的一个或多于一个客户端的备份操作。备份服务器140可以利用存储器145来进行备份存储。存储器145可以是存储区域网、冗余存取独立磁盘阵列、磁带驱动器、磁盘驱动器或其它存储设备。
【0017】客户端110可能使用索引引擎115来对实时数据(live data)编索引。实时数据可代表客户端110的当前数据。在一些实施例中,索引引擎115可被包含在和客户端110分开的机器中,例如索引服务器。索引引擎115可以创建可含有来自客户端110的要被备份的数据的初始索引。然后索引引擎115可为在客户端110的数据中检测到的一个或多于一个改变增加索引。客户端110可能含有一个或多于一个索引。
【0018】备份映像可由备份代理125发送到备份服务器140。该备份映像可含有可对应于客户端110的数据的一个或多于一个索引。备份服务器140可在存储器145上存储含有该备份数据的一个或多于一个映像。
【0019】改变事件记录器135可检测在客户端110的客户端数据的改变并且可将改变记录到日志文件或其它存储器中。索引引擎115可在初始的完整索引独立于备份策略被产生之后将数据中的增量改变编索引。例如,即使客户端备份策略要求完整备份,索引引擎115也可能仅将客户端的数据中的变化编索引。索引引擎115可仅将客户端数据的增量的变化编索引且通过维护单个索引或单个索引的多个拷贝来完成,并且可能因此维护该客户端110的数据的整个索引。被包含在客户端110上的索引可含有历史数据。例如,客户端110上的索引可含有关于可能已经在先前被删除了的文件的元数据。在一个或多于一个实施例中,索引引擎115可将备份映像数据编索引并且可使用改变的记录来产生一个或多于一个索引。这些一个或多于一个索引可通过修改所述一个或多于一个索引来仅表示自从先前的备份映像数据被编索引之后客户端的实时数据中的变化而被维护。
【0020】索引引擎115可降低索引的存储量大小和增加索引的效率。索引引擎115不是每次接收到映像就将整个备份映像编索引,而是可生成代表客户端的实时数据或当前数据以及历史条目的单个索引。它可通过检测客户端的添加、更新或删除其数据的请求并通过仅记录对数据的最终改变来完成。因此,索引引擎115可清楚地区分数据中的增量或改变并可避免将整个客户端数据集编索引。通过创建初始的完整索引和在每次客户端数据的变化发生时增加该索引,索引引擎115可维护数据变化的时序记录。结果产生的索引可含有关于文件的元数据,该元数据可能对于搜索请求是有用的并且可使得已经不在客户端的实时数据中的文件能够在客户端的备份数据中被找到。具有将实时数据编索引的能力和在客户端机器上被定位的能力的索引引擎115可显著地降低集中式备份服务器上的负载。
【0021】参考图2,示出根据本公开的替代性实施例的智能内容索引的系统200。客户端210可代表运行地连接到网络215的客户端,其从该智能内容索引系统200内部寻找数据。客户端210可含有搜索引擎225和数据检索模块230,并且可连接到网络215。在一些实施例中,搜索引擎225和/或数据检索模块230可位于和客户端210分开的机器上。在一个或多于一个实施例中,搜索引擎225和/或数据检索模块230可位于索引服务器上。客户端210可使用搜索引擎225发送查询。搜索引擎225可搜索一个或多于一个索引且可定位与搜索请求对应的数据。搜索引擎225可返回结果给客户端210。客户端210可从数据检索模块230处请求由一个或多于一个搜索结果指示的数据。数据检索模块230可从本地机器(即客户端210的存储器)检索数据。数据检索模块230也可以向备份服务器235发送请求,请求来自一个或多于一个备份的数据。数据检索模块230可接收来自可能在存储器240上的一个或多于一个备份的数据。数据检索模块230可返回该被请求的数据到客户端210。
【0022】参考图3,示出根据本公开的另一个替代性实施例的智能内容索引系统300。在一个或多于一个实施例中,智能内容索引系统300允许对一个或多于一个客户端的一个或多于一个索引的分布式搜索。例如,客户端325可利用搜索引擎330发送搜索请求。搜索引擎330可代表联合搜索引擎且可发送请求到客户端310、315、320上含有的搜索引擎。搜索引擎330也可搜索本地索引,本地索引可将客户端325的数据编索引。数据可从搜索客户端310、315和325的索引的搜索引擎被接收。然而,搜索引擎330可检测到没有接收到来自客户端320的数据。例如,对客户端320的搜索请求可能由于客户端320可能当机、离线或由于其它原因不可访问而超时。然后,搜索引擎330可发送对来自于存储器345的映像的查询到备份服务器340,该来自存储器345的映像可代表客户端320的最近的备份。备份服务器340可解析出客户端320最近的已知映像的位置。解析过程可利用判断备份时间,备份是否被存档、移动、复制过,或者其它因素。备份服务器340可从存储器345获取该备份映像并且可加载客户端320的合适备份映像。备份服务器340可在该备份服务器上开始搜索引擎过程,其可为被请求的数据搜索被包含在该备份映像中的索引。搜索引擎330可接收对客户端310、315和325的搜索结果。搜索引擎330也可接收来自备份服务器340的客户端320的搜索结果。数据检索模块335可检索可能随后被客户端325请求的数据。数据检索模块335可从一个或多于一个客户端检索实时数据且可从一个或多于一个备份检索数据。客户端310、315、320、325、备份服务器340和存储器345可运行地连接到网络350。
【0023】参考图4,示出根据本公开的实施例的智能内容索引的方法400。方法400可在框410开始。在框415,该方法可检测在客户端的数据的一个或多于一个变化。在框420,该方法可判断是否存在客户端的初始完整索引。如果不存在,该方法可在框425继续,在其中该客户端的初始完整索引可被生成。在其它实施例中,索引过程一开始,该过程就可生成初始完整索引。客户端的初始完整索引可由索引引擎生成,索引引擎可将在该客户端上的实时数据编索引。在一些实施例中,该索引引擎可将客户端的备份映像编索引。该方法在框440结束。如果在框420中该方法判断客户端的初始完整索引存在,该方法就可从框420前进到框430。在框430,该方法可更新或修改一个或多于一个已经存在的索引以表示自从最近的索引更新或修改之后,在客户端的实时数据中发生的一个或多于一个变化。在框440,该方法可结束。
【0024】参考图5,示出根据本公开的替代性实施例的智能内容索引方法500。方法500可在框510处开始。在框520,该方法可检测任何为备份存储的映像是否已过期。例如,备份映像可被政策、法律或手续要求而被存储一段时间。存储超过这个时间段的映像可被该方法在框520检测到。在框530,过期的映像可被删除。在框540,指向被删除的存储映像的一个或多于一个索引可被删减和/或更新。这可移除一个或多于一个指向被删除的映像的索引记录。在框550,该方法可结束。该方法500可降低存储的备份映像和存储的索引的大小。此外,该方法500可增加使用映像的索引的效率和准确度。
【0025】参考图6,示出根据本公开的另一个替代性实施例的智能内容索引方法600。方法600可在框610开始。在框615,搜索请求可在搜索引擎被接收。在框620,可针对要被搜索的客户端的索引处理该搜索请求。在框625,搜索结果可被返回到搜索客户端。在框630,对被搜索结果指明的数据的请求可从搜索客户端被接收。在框635,数据的位置可被解析出。在一些实施例中,对数据的位置的解析可使用从该索引获取的元数据,该元数据可提供文件名、文件大小、一个或多于一个时间戳、文件位置和其它属性。在框640,该方法可判断数据是否需要来自备份。如果数据需要来自备份,该方法可在框645继续。在框645,该数据可从备份检索。如果在框640,判断不需要备份数据,该方法可在框650继续。在框650,该方法可检索或取回被搜索的一个或多于一个客户端的实时数据。在框655,数据可被返回到搜索客户端。在框660,该方法可结束。
【0026】参考图7,示出根据本公开的另一个实施例的智能内容索引方法700。方法700可在框710开始。在框715,搜索请求可在搜索引擎被接收,该搜索引擎能够联合或分发搜索到一个或多于一个附加的搜索引擎。所述一个或多于一个搜索引擎可被置于一个或多于一个客户端上且可搜索与所述一个或多于一个的相应客户端的数据相关联的索引。所述一个或多于一个搜索引擎可被置于索引服务器或备份服务器上且可搜索客户端的备份映像。在框720,联合搜索引擎可发送搜索请求到一个或多于一个搜索引擎。在框725,该方法可判断来自一个或多于一个搜索引擎的结果是否已被收到。如果一个或多于一个搜索引擎没有返回结果,该方法可在框730继续。如果一个或多于一个搜索引擎已返回结果,该方法可在框740继续。在框730,为与没有返回结果的搜索引擎相关联的一个或多于一个客户端定位备份映像。在框735,该备份映像的索引可被搜索。备份映像的索引可被备份服务器或其它设备搜索,该其它设备装载与所需客户端对应的被检索备份映像且针对被装载的映像运行搜索过程。在框740,来自一个或多于一个搜索引擎的搜索结果可被联合搜索引擎合并。在框745,搜索结果可被返回客户端。在框780,该方法可结束。
【0027】在这里应该注意上面描述的根据本公开的智能内容索引一般在某种程度上涉及到处理输入数据和生成输出数据。这种输入数据处理和输出数据生成可在硬件或软件中被实现。例如,可在智能内容索引系统或类似或相关的电路中使用特定的电子元件用于实施与上述的根据本公开的智能内容索引相关联的功能。替代地,根据存储的指令运行的一个或多于一个处理器可实现与根据上述的本公开的智能内容索引相关联的功能。如果是这样的话,下面的情形落在本公开的范围内:这样的指令可被存储在一个或多于一个处理器可读的载体(例如磁盘或者其它存储器介质)中,或者通过一个或多于一个信号传输到一个或多于一个处理器。
【0028】本公开并不限于这里阐述的特定实施例的范围。实际上,根据前面的描述和附图,除了本文描述的,本公开的其它各种实施例和对本公开的改变对本领域的普通技术人员是显而易见的。这样,这种其它实施例和改变都在本公开的范围之内。进一步,尽管本公开在这里是在特定环境中为特定目的的特定实施的背景中介绍的,但本领域的普通技术人员应明白其用途不限于此并且本公开可在任意多个环境中为任何数量的目的进行有益地实施。据此,下面阐述的权利要求应考虑到此处阐述的本公开的全部范围和精神来解释。

Claims (20)

1.一种用于执行智能内容索引的方法,其包括:
通过一个或多于一个与客户端相关联的过程,将所述客户端的初始完整数据集编索引,以创建所述客户端数据的索引;
检测所述客户端数据的变化;以及
修改所述索引以反映所述客户端数据的所述变化。
2.根据权利要求1所述的方法,其中所述一个或多于一个过程包括在所述客户端上运行的索引引擎。
3.根据权利要求1所述的方法,其中所述一个或多于一个过程包括在与所述客户端分开的机器上运行的索引引擎。
4.根据权利要求1所述的方法,其进一步包括:
存储所述索引和可能的具有一个或多于一个备份映像的一个或多于一个其它索引。
5.根据权利要求1所述的方法,其中所述客户端数据是所述客户端的实时数据而且编索引在实时客户端数据上被执行。
6.根据权利要求1所述的方法,其中编索引在所述客户端的一个或多于一个备份映像上被执行。
7.根据权利要求1所述的方法,其进一步包括:
检测备份映像的到期;
删除所述备份映像;以及
更新所述索引以移除指向所述备份映像的记录。
8.根据权利要求1所述的方法,其进一步包括:
在搜索引擎接收来自所述客户端的搜索请求;
针对所述索引处理所述搜索请求;以及
返回一个或多于一个搜索结果到所述客户端。
9.根据权利要求8所述的方法,其进一步包括:
接收来自客户端的对与所述搜索结果相关联的数据的请求;
解析所述数据的位置;
从所述位置取回所述数据;以及
返回所述数据到所述客户端。
10.根据权利要求9所述的方法,其中解析所述数据位置包括判断是从所述客户端取回实时数据还是从所述客户端的备份映像取回数据。
11.根据权利要求9所述的方法,其中解析所述数据位置包括判断所述客户端的备份映像上的所述数据的位置。
12.根据权利要求1所述的方法,其进一步包括:
在联合搜索引擎接收来自所述客户端的搜索请求;
发送所述搜索请求到一个或多于一个搜索引擎;
由所述一个或多于一个搜索引擎针对可能包含所述索引的一个或多于一个数据索引处理所述搜索请求;
判断一个或多于一个搜索引擎是否已无法响应所述搜索请求;
为所述一个或多于一个无响应的搜索引擎定位备份映像;
搜索所述一个或多于一个无响应的搜索引擎的所述备份映像的索引;以及
返回一个或多于一个搜索结果到所述客户端。
13.根据权利要求12所述的方法,其进一步包括:
接收来自于所述客户端的对与所述搜索结果相关联的数据的请求;
解析所述数据的位置;
从所述位置取回所述数据;以及
返回所述数据到所述客户端。
14.根据权利要求13所述的方法,其中取回所述数据包括以下之一:
当所述数据被存储在所述客户端上或另一个客户端上时,从所述位置取回实时数据;以及
当所述数据没有被存储在所述客户端上或另一个客户端上时,从所述位置取回备份数据。
15.至少一个信号,其被包含在用于传输计算机程序指令的至少一个载波中,所述指令被设置为被至少一个处理器可读,用以指示所述至少一个处理器实行计算机处理,以执行根据权利要求1所述的方法。
16.至少一个处理器可读的用于存储计算机程序指令的载体,所述指令被设置为被至少一个处理器可读,用以指示所述至少一个处理器来实行计算机处理,以执行根据权利要求1所述的方法。
17.一种用于执行智能内容索引的系统,其包括:
与客户端相关联的索引引擎,其被配置为:
将所述客户端的初始完整数据集编索引以创建所述客户端数据的索引;
检测所述客户端数据中的变化;以及
修改所述索引以反映所述客户端数据中的所述变化。
18.根据权利要求17所述的系统,其中所述索引引擎驻存在所述客户端上。
19.根据权利要求17所述的系统,其中编索引在所述客户端的实时数据上被执行。
20.根据权利要求17所述的系统,其进一步包括:
联合搜索引擎,其被配置为:
从所述客户端接收搜索请求;
发送所述搜索请求到一个或多于一个搜索引擎;
判断所述一个或多于一个搜索引擎是否已无法响应所述搜索请求;
为一个或多于一个无响应的搜索引擎定位备份映像;
搜索所述一个或多于一个无响应的搜索引擎的所述备份映像的索引;以及
返回一个或多于一个搜索结果到所述客户端。
CN200810110230.8A 2007-06-29 2008-06-18 用于执行智能内容索引的技术 Active CN101334791B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/771,507 US10133820B2 (en) 2007-06-29 2007-06-29 Techniques for performing intelligent content indexing
US11/771,507 2007-06-29

Publications (2)

Publication Number Publication Date
CN101334791A true CN101334791A (zh) 2008-12-31
CN101334791B CN101334791B (zh) 2014-04-09

Family

ID=39865162

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200810110230.8A Active CN101334791B (zh) 2007-06-29 2008-06-18 用于执行智能内容索引的技术

Country Status (3)

Country Link
US (1) US10133820B2 (zh)
EP (1) EP2009561A3 (zh)
CN (1) CN101334791B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105659234A (zh) * 2013-10-23 2016-06-08 微软技术许可有限责任公司 普适搜索架构
CN105760236A (zh) * 2016-05-13 2016-07-13 中国工商银行股份有限公司 一种分布式计算机集群下的数据采集方法及系统
CN107025144A (zh) * 2015-10-21 2017-08-08 罗伯特·博世有限公司 用于写入以及读取数据集的方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8091118B2 (en) * 2007-12-21 2012-01-03 At & T Intellectual Property I, Lp Method and system to optimize efficiency when managing lists of untrusted network sites
US8762340B2 (en) * 2010-05-14 2014-06-24 Salesforce.Com, Inc. Methods and systems for backing up a search index in a multi-tenant database environment
CN103942698A (zh) * 2014-04-22 2014-07-23 北京联时空网络通信设备有限公司 一种产品信息对比方法及装置
US10924502B2 (en) * 2016-12-29 2021-02-16 Noblis, Inc. Network security using inflated files for anomaly detection

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000026827A1 (en) * 1998-11-03 2000-05-11 British Telecommunications Public Limited Company Apparatus for processing communications
US6615224B1 (en) * 1999-02-23 2003-09-02 Lewis B. Davis High-performance UNIX file undelete
EP1217542A1 (en) 2000-12-21 2002-06-26 Motorola, Inc. Communication system, communication unit and method for personalising communication services
EP1217543A1 (en) 2000-12-22 2002-06-26 Hewlett-Packard Company, A Delaware Corporation Process and apparatus for automatically indexing documents of a set of computers of a network
US7478096B2 (en) * 2003-02-26 2009-01-13 Burnside Acquisition, Llc History preservation in a computer storage system
JP2005141319A (ja) 2003-11-04 2005-06-02 Mitsubishi Electric Corp 異常行動検出装置
WO2005069783A2 (en) 2004-01-09 2005-08-04 T.W. Storage, Inc. Methods and apparatus for searching backup data based on content and attributes
US7330997B1 (en) * 2004-06-03 2008-02-12 Gary Odom Selective reciprocal backup
US7587398B1 (en) * 2004-06-30 2009-09-08 Google Inc. System and method of accessing a document efficiently through multi-tier web caching
US7490079B2 (en) 2005-04-14 2009-02-10 Microsoft Corporation Client side indexing of offline address book files
US9026512B2 (en) * 2005-08-18 2015-05-05 Emc Corporation Data object search and retrieval
AU2006299819B2 (en) * 2005-10-12 2011-02-10 Carbonite Gmbh Method and system for data backup
JP4825504B2 (ja) 2005-12-05 2011-11-30 株式会社東芝 データ登録・検索システムおよびデータ登録・検索方法
US8271452B2 (en) * 2006-06-12 2012-09-18 Rainstor Limited Method, system, and database archive for enhancing database archiving
US8726242B2 (en) * 2006-07-27 2014-05-13 Commvault Systems, Inc. Systems and methods for continuous data replication
US8135685B2 (en) * 2006-09-18 2012-03-13 Emc Corporation Information classification
US9141627B2 (en) 2006-09-26 2015-09-22 Sony Corporation Providing a user access to data files distributed in a plurality of different types of user devices

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105659234A (zh) * 2013-10-23 2016-06-08 微软技术许可有限责任公司 普适搜索架构
US10949408B2 (en) 2013-10-23 2021-03-16 Microsoft Technology Licensing, Llc Pervasive search architecture
US11507552B2 (en) 2013-10-23 2022-11-22 Microsoft Technology Licensing, Llc Pervasive search architecture
CN107025144A (zh) * 2015-10-21 2017-08-08 罗伯特·博世有限公司 用于写入以及读取数据集的方法
CN107025144B (zh) * 2015-10-21 2022-04-05 罗伯特·博世有限公司 用于写入以及读取数据集的方法
CN105760236A (zh) * 2016-05-13 2016-07-13 中国工商银行股份有限公司 一种分布式计算机集群下的数据采集方法及系统

Also Published As

Publication number Publication date
EP2009561A2 (en) 2008-12-31
EP2009561A3 (en) 2009-01-14
US20090006535A1 (en) 2009-01-01
US10133820B2 (en) 2018-11-20
CN101334791B (zh) 2014-04-09

Similar Documents

Publication Publication Date Title
CN101334791B (zh) 用于执行智能内容索引的技术
US8682859B2 (en) Transferring records between tables using a change transaction log
CN100377112C (zh) 磁盘驱动器、其控制方法以及磁盘伪造的探测方法
US7434219B2 (en) Storage of application specific profiles correlating to document versions
US6772177B2 (en) System and method for parallelizing file archival and retrieval
US20070185879A1 (en) Systems and methods for archiving and retrieving digital assets
US8280907B2 (en) System and method for managing access to data in a database
CN104301360A (zh) 一种日志数据记录的方法、日志服务器及系统
US9594794B2 (en) Restoring records using a change transaction log
US7526469B2 (en) Method and system of database management with shared area
CN101137981A (zh) 用于管理文件系统中的内容存储的方法和装置
US7376681B1 (en) Methods and apparatus for accessing information in a hierarchical file system
CN101201724B (zh) 数据存储装置以及重布置数据的方法
US7366836B1 (en) Software system for providing storage system functionality
US20040044642A1 (en) Apparatus, method and program for managing database logs
US9081784B2 (en) Delta indexing method for hierarchy file storage
US9418154B2 (en) Push-model based index updating
US9594784B2 (en) Push-model based index deletion
US7194486B2 (en) Method and system for data processing with data replication for the same
US7720823B1 (en) Repairing links in deactivated files
US20080276125A1 (en) Data Processing Method
US20070118574A1 (en) Reorganizing data with update activity
EP2064633B1 (en) System, method and computer program product for managing data
US20060015680A1 (en) Apparatus and method for data storage, and computer product
US11556515B2 (en) Artificially-intelligent, continuously-updating, centralized-database-identifier repository system

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant