CN100573471C - 搜索重复数据的系统和方法 - Google Patents

搜索重复数据的系统和方法 Download PDF

Info

Publication number
CN100573471C
CN100573471C CNB038022842A CN03802284A CN100573471C CN 100573471 C CN100573471 C CN 100573471C CN B038022842 A CNB038022842 A CN B038022842A CN 03802284 A CN03802284 A CN 03802284A CN 100573471 C CN100573471 C CN 100573471C
Authority
CN
China
Prior art keywords
data segment
identifier
relevant
data
produce
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB038022842A
Other languages
English (en)
Other versions
CN1751295A (zh
Inventor
马克·A·舒尔茨
林书
迈克尔·G·凯利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
InterDigital CE Patent Holdings SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of CN1751295A publication Critical patent/CN1751295A/zh
Application granted granted Critical
Publication of CN100573471C publication Critical patent/CN100573471C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/41Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99951File or database maintenance
    • Y10S707/99952Coherency, e.g. same view to multiple users
    • Y10S707/99953Recoverability

Abstract

本发明涉及一种搜索重复数据的方法(200)和系统(100)。所述方法(200)包括步骤:使用唯一标识符函数从第一数据段的至少一部分中产生至少一个标识符(212);使用唯一标识符函数从第二数据段的至少一部分中产生至少一个标识符(216);以及将与第一数据段相关的至少一个标识符和与第二数据段相关的至少一个标识符进行比较,以便确定第一数据段是否基本上等于第二数据段(220)。

Description

搜索重复数据的系统和方法
技术领域
本发明的结构通常涉及记录系统,尤其涉及多媒体记录系统,用于将数字编码的信号记录到诸如硬盘驱动器和可记录光盘的盘介质上。
背景技术
目前,可以将多种形式的数据记录到许多不同类型的存储介质。例如,许多消费者将电视节目或音乐记录到光盘介质或硬盘驱动器(HDD)。随着技术的改进,光盘介质和HDD的存储容量已经明显增加。事实上,一些HDD能够存储多于50千兆字节的数据。同样的,消费者可以在这种类型的存储介质上记录大量的节目或歌曲。
当将数据记录到可记录存储介质时,该可记录存储介质装置通常允许用户输入用于识别所记录的内容的标题。当用户希望定位已记录数据的特定块以确定用户先前所记录的那些数据时,这些标题是有用的。然而,值得注意的是,这一搜索处理可能费力、效率较低并且易于出错,因为存储介质可以包含几百甚至上千个标题。如果存储介质是大型HDD或者如果某些数据段的标题被给定缺省标题,则这一问题可能尤为尖锐。
甚至认为通过搜索标题能够相对容易地定位存储介质上的数据段,特定标题对于不同的数据段可能是相同的。例如,如果歌曲被记录在存储介质上并根据歌名给定标题,则后来可以记录第二首歌曲,该第二首歌曲具有与第一首歌曲相同的名字。这种冲突是可能发生的,例如,如果两位独立的艺术家记录相同歌曲的不同版本。当记录第二首歌曲时,用户可能检查先前记录的歌曲的标题,并可能错误地认为已经记录了该第二首歌曲。因此,需要一种搜索重复数据的系统和方法,而不增加系统成本或复杂性,并且还减少当搜索和考虑删除重复数据时出错的可能性。
发明内容
本发明涉及一种搜索重复数据的方法。所述方法包括步骤:使用唯一标识符函数从第一数据段的至少一部分中产生至少一个标识符;使用唯一标识符函数从第二数据段的至少一部分中产生至少一个标识符;和将与第一数据段相关的至少一个标识符和与第二数据段相关的至少一个标识符进行比较,以便确定第一数据段是否基本上等于第二数据段,其中比较步骤发生在对所述数据段的重复作出任何判定之前。
在一种结构中,所述从第一数据段的至少一部分中产生至少一个标识符的步骤包括步骤:当第一数据段被记录到存储介质时或者在第一数据段被记录到存储介质之后,使用唯一标识符函数从第一数据段的至少一部分中产生至少一个标识符。另外,所述从第二数据段的至少一部分中产生至少一个标识符的步骤包括步骤:当第二数据段被记录到存储介质时,使用唯一标识符函数从第二数据段的至少一部分中产生至少一个标识符。而且,当第二数据段被记录到不同的存储介质时,可能发生从第二数据段的至少一部分中产生至少一个标识符的步骤。
在一方面,第一数据段和第二数据段可以是多媒体数据段。所述方法还可以包括步骤:在表中存储与第一数据段相关的至少一个标识符;和在所述比较步骤之前,从所述表中检索与第一数据段相关的至少一个标识符。另外,所述方法可以包括步骤:当与第一数据段相关的至少一个标识符匹配于与第二数据段相关的至少一个标识符时,给出第一数据段基本上等于第二数据段的提示。
在另一种结构中,第一数据段的至少一部分和第二数据段的至少一部分的大小可以基于时间度量(temporal measurement)或位度量。第一数据段的至少一部分可以与第二数据段的至少一部分时间对应或者逐位对应。在另一方面,与第一数据段相关的至少一个标识符和与第二数据段相关的至少一个标识符可以是散列值,并且唯一标识符函数可以是散列函数,其中当第一数据段与第二数据段相等时,与第一数据段相关的散列值将等于与第二数据段相关的散列值。
而且,所述比较步骤包括步骤:将与第一数据段相关的多个标识符和与第二数据段相关的多个标识符进行比较,以便确定第一数据段是否基本上等于第二数据段。而且,所述比较步骤包括步骤:将与第一组数据段相关的多个标识符和与第二组数据段相关的多个标识符进行比较,以便确定第一组数据段是否基本上等于第二组数据段。
本发明也涉及一种用于搜索重复数据的系统。所述系统包括:控制器,用于从存储介质读取数据,以及将数据写入存储介质;和处理器,其中所述处理器被编程来使用唯一标识符函数从第一数据段的至少一部分中产生至少一个标识符;使用唯一标识符函数从第二数据段的至少一部分中产生至少一个标识符;和将与第一数据段相关的至少一个标识符和与第二数据段相关的至少一个标识符进行比较,以便确定第一数据段是否基本上等于第二数据段,其中比较步骤发生在对所述数据段的重复作出任何判定之前。所述系统也包括用于实现如上所述方法的合适的软件和电路。
附图说明
图1是根据此处本发明结构的能够搜索重复数据的系统的方框图。
图2是图解说明根据本发明结构的用于搜索重复数据的操作的流程图。
具体实施方式
在图1中以方框图形式示出了根据本发明结构的系统100,该系统100执行各种先进的操作特征。然而,本发明不限于图1所图解的特定系统,因为可以用能够接收数字编码信号的任意其他系统来实现本发明。另外,系统100不限于从任何特定类型的存储介质读取数据或将数据写入其中,因为能够存储数字编码数据的任意存储介质可以与系统100使用。
系统100可包括控制器110,用于从存储介质112读取数据和将数据写入其中。控制器也可以从不同的存储介质或存储器120读取数据和将数据写入其中。系统100也可以包括微处理器114、表或存储器116、以及显示器118。也可以提供控制和数据接口,用以控制控制器110和显示器118的操作和检索表116中存储的信息。在存储器中可以提供合适的软件和固件用以由微处理器114执行的常规操作。而且,根据本发明的结构,可以为微处理器114提供程序的例行程序。另外,在微处理器114中可以使用任何其他合适的软件或电路。
在操作中,控制器110可以将第一数据段写入存储介质112。在一种结构中,当将第一数据段记录到存储介质112时,微处理器114能够使用唯一标识符函数从第一数据段的至少一部分中产生至少一个标识符。一旦微处理器114从第一数据段的至少一部分中产生至少一个标识符,微处理器114能够将该至少一个标识符发送至表116。在另一种结构中,在已经将第一数据段记录到存储介质112之后,任何时间可以产生与第一数据段相关的至少一个标识符。
微控制器114也可以使用唯一标识符函数从第二数据段的至少一个对应部分中产生至少一个标识符。当第二数据段被记录到存储介质112时,或者当第二数据段被记录在存储器120中时,微处理器114可以产生与第二数据段相关的至少一个标识符。应当理解,存储器120可以是用于存储数字编码数据的任意适当形式的存储器。
一旦产生,微处理器114就能够从表116中检索与第一数据段相关的至少一个标识符。然后微处理器114可以将与第一数据段相关的至少一个标识符和与第二数据段相关的至少一个标识符进行比较,以便确定第一数据段是否基本上等于第二数据段。如果与第一数据段相关的至少一个标识符匹配于与第二数据段相关的至少一个标识符,则第一数据段基本上相等,即使不完全相等第二数据段。随后微处理器114能够通过显示器118给用户提示两个数据段相等。下面将更详细地描述本发明的整个操作。
重复数据的搜索
图2图解说明了用于论证搜索重复或相同数据的操作的流程图200。在步骤210,该处理开始。如在步骤212所示,使用唯一标识符函数可以从第一数据段的至少一部分中产生至少一个标识符。当第一数据段被记录到存储介质时,可以产生该标识符。相反,在第一数据段被记录到存储介质之后的任何时刻可以产生标识符。
第一数据段可以是包括基于文本的数据、音频、视频或者它们的任意组合的任何适当类型的数据,或者任何其他适当形式的数据。第一数据段也可以是加密或未加密的数据段。而且,可以从第一数据段的任一部分中产生标识符,该任一部分包括第一数据段的不相邻或不连续部分。而且,从第一数据段中包含的数据的任一部分中可以产生多于一个标识符。从其中产生标识符的数据的部分的大小可以基于时间度量或者位度量。
例如,如果第一数据段是一首歌,可以从这一整首歌中产生标识符,从而至少一部分包括整个第一数据段。再例如,这首歌可以被划分成两个分离的部分:开始部分和结束部分。如果这首歌的这两部分的大小都基于时间度量,则开始部分可以包括这首歌的头30秒,结束部分可以包括这首歌的最后30秒。根据本发明的结构,可以组合这首歌的这两部分,并且从这种组合中可以产生至少一个标识符。因此,可以使用每个数据段的一个或多个标识符来比较与另一数据段相关的对应数量的标识符。
继续示例,可以从这首歌的两部分中产生标识符,从而从相同的歌曲中产生两个独立的标识符。可选地,可以从开始和结束部分之间的时间度量中产生标识符。而且,如果数据的至少一部分的大小基于位度量,则例如可以从这首歌的第一1Mb数据中产生标识符。然而,应当注意,本发明不限于上述示例,因为从任何适当类型数据的第一段(包括当至少一部分包括整个第一数据段)的任意数量的部分中可以产生任意数量的标识符。
返回参考流程图200,最好在表中存储与第一数据段相关的至少一个标识符,如在步骤214所示。在步骤216,使用唯一标识符函数可以从第二数据段的至少一部分中产生至少一个标识符。与第二数据段相关的至少一个标识符的产生可以根据关于第一数据段讨论的处理(请参阅步骤212论述)。然而,为了增加精确度,产生至少一个标识符的第二数据段的一(多个)部分可以对应于第一数据段的至少一部分。这种对应可以是基于时间的或者是基于逐位的。
例如,如果第一数据段是一首歌并且从该整首歌中产生与该第一数据段相关的至少一个标识符(该至少一部分包括整个第一数据段),随后最大化精确度,从这整首歌中可以产生与第二数据段相关的至少一个标识符(假设第二数据段实际上是一首歌)。再例如,如果第一数据段的至少一部分包括第一1Mb数据并且从该部分中产生与第一数据段相关的至少一个标识符,则最好从第二数据段中的第一1Mb的数据中产生与第二数据段相关的至少一个标识符。
在一种结构中,当第二数据段被记录到与第一数据段记录到的相同存储介质时,可以产生与第二数据段有关的至少一个标识符。相反,当第二数据段被记录到不同的存储介质时,可以产生与第二数据段相关的至少一个标识符。
在步骤218,一旦从第二数据段产生一个或多个适当的标识符,就从存储器中,最好是从表中检索与第一数据段相关的至少一个标识符。在步骤220,可以将与第一数据段相关的至少一个标识符和与第二数据段相关的至少一个标识符进行比较,以便确定第一数据段是否基本上等于第二数据段。如果标识符相同,则第一数据段实际上总是等于第二数据段。在判定块222,当与第一数据段相关的至少一个标识符匹配于与第二数据段相关的至少一个标识符时,则可以给用户呈现第一数据段基本上等于第二数据段的提示,如在步骤224所示。而且,在步骤226,用户可以选择地或者自动地删除为了比较步骤而被记录到存储介质的第二数据段的任意部分。该处理在步骤228结束。
在一种结构中,至少一个标识符可以是散列值。此外,唯一标识符函数可以是散列函数。当第一数据段和第二数据段相等或基本上相等时,与第一数据段相关的散列值可以等于与第二数据段相关的散列值。可用来实现本发明的几个散列函数的一个示例是异或函数。然而,应当理解,本发明不限于这种特殊散列函数,因为可以使用任何其他合适的散列函数。
虽然结合这里所公开的实施例描述了本发明,但是应当理解,上面的描述旨在举例说明而不用于限定由权利要求所定义的本发明的范围。

Claims (20)

1.一种搜索重复数据的方法,包括下列步骤:
使用唯一标识符函数从第一数据段的至少一部分中产生至少一个标识符;
当将第二数据段存储到存储介质中时,使用所述唯一标识符函数从所述第二数据段的至少一部分中产生至少一个标识符;和
将与所述第一数据段相关的至少一个标识符和与所述第二数据段相关的至少一个标识符进行比较,以便确定所述第一数据段是否等于所述第二数据段,
其中所述比较步骤发生在对所述数据段的重复作出任何判定之前。
2.根据权利要求1所述的方法,其中从第一数据段的至少一部分中产生至少一个标识符的步骤包括步骤:当所述第一数据段被记录到存储介质时,使用所述唯一标识符函数从第一数据段的至少一部分中产生至少一个标识符。
3.根据权利要求2所述的方法,其中从所述第二数据段的至少一部分中产生至少一个标识符的步骤包括步骤:当所述第二数据段被记录到不同的存储介质时,使用所述唯一标识符函数从第二数据段的至少一部分中产生至少一个标识符。
4.根据权利要求1所述的方法,其中所述从第一数据段的至少一部分中产生至少一个标识符的步骤发生在所述第一数据段被记录到存储介质之后。
5.根据权利要求1所述的方法,其中所述第一数据段和所述第二数据段是多媒体数据段。
6.根据权利要求1所述的方法,还包括步骤:
在表中存储与所述第一数据段相关的至少一个标识符;和
在所述比较步骤之前,从所述表中检索与所述第一数据段相关的至少一个标识符。
7.根据权利要求1所述的方法,还包括步骤:当与所述第一数据段相关的至少一个标识符匹配于与所述第二数据段相关的至少一个标识符时,给出所述第一数据段基本上等于所述第二数据段的提示。
8.根据权利要求1所述的方法,其中所述第一数据段的至少一部分和所述第二数据段的至少一部分的大小是基于时间度量的,其中所述第一数据段的至少一部分与所述第二数据段的至少一部分时间对应。
9.根据权利要求1所述的方法,其中所述第一数据段的至少一部分和所述第二数据段的至少一部分的大小是基于位度量的,其中所述第一数据段的至少一部分与所述第二数据段的至少一部分逐位对应。
10.根据权利要求1所述的方法,其中与所述第一数据段相关的至少一个标识符和与所述第二数据段相关的至少一个标识符是散列值,并且所述唯一标识符函数是散列函数,其中当所述第一数据段与所述第二数据段相等时,与所述第一数据段相关的散列值将等于与所述第二数据段相关的散列值。
11.根据权利要求1所述的方法,其中所述比较步骤包括步骤:将与所述第一数据段相关的多个标识符和与所述第二数据段相关的多个标识符进行比较,以便确定所述第一数据段是否基本上等于所述第二数据段。
12.根据权利要求1所述的方法,其中所述比较步骤包括步骤:将与第一组数据段相关的多个标识符和与第二组数据段相关的多个标识符进行比较,以便确定所述第一组数据段是否基本上等于所述第二组数据段。
13.一种用于搜索重复数据的系统,包括:
控制器,用于从存储介质读取数据,以及将数据写入存储介质;和
连接到所述控制器的处理器,其中所述处理器被编程来:
使用唯一标识符函数从第一数据段的至少一部分中产生至少一个标识符;
当将第二数据段存储到存储介质中时,使用所述唯一标识符函数从所述第二数据段的至少一部分中产生至少一个标识符;和
将与所述第一数据段相关的至少一个标识符和与所述第二数据段相关的至少一个标识符进行比较,以便确定所述第一数据段是否等于所述第二数据段,
其中所述处理器在对所述数据段的重复作出任何判定之前比较所述标识符。
14.根据权利要求13所述的系统,其中所述处理器还被编程来当所述第一数据段被记录到所述存储介质时,使用所述唯一标识符函数从所述第一数据段的至少一部分中产生至少一个标识符。
15.根据权利要求14所述的系统,其中所述处理器还被编程来当所述第二数据段被记录到不同的存储介质时,使用所述唯一标识符函数从所述第二数据段的至少一部分中产生至少一个标识符。
16.根据权利要求13所述的系统,其中所述处理器还被编程来在所述第一数据段被记录到所述存储介质后,使用所述唯一标识符函数从所述第一数据段的至少一部分中产生至少一个标识符。
17.根据权利要求13所述的系统,其中所述第一数据段和所述第二数据段是多媒体数据段。
18.根据权利要求13所述的系统,还包括一个表,其中所述处理器还被编程来:
在所述表中存储与所述第一数据段相关的至少一个标识符;和
在所述比较之前,从所述表中检索与所述第一数据段相关的至少一个标识符。
19.根据权利要求13所述的系统,其中所述处理器还被编程来当与所述第一数据段相关的至少一个标识符匹配于与所述第二数据段相关的至少一个标识符时,给出所述第一数据段基本上等于所述第二数据段的指示。
20.根据权利要求13所述的系统,其中与所述第一数据段相关的至少一个标识符和与所述第二数据段相关的至少一个标识符是散列值,并且所述唯一标识符函数是散列函数,其中所述处理器确定与所述第一数据段相关的散列值是否等于与所述第二数据段相关的散列值,表示所述第一数据段与所述第二数据段基本相等。
CNB038022842A 2002-01-17 2003-01-15 搜索重复数据的系统和方法 Expired - Fee Related CN100573471C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/051,999 US6795903B2 (en) 2002-01-17 2002-01-17 System and method for searching for duplicate data
US10/051,999 2002-01-17

Publications (2)

Publication Number Publication Date
CN1751295A CN1751295A (zh) 2006-03-22
CN100573471C true CN100573471C (zh) 2009-12-23

Family

ID=21974742

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB038022842A Expired - Fee Related CN100573471C (zh) 2002-01-17 2003-01-15 搜索重复数据的系统和方法

Country Status (9)

Country Link
US (1) US6795903B2 (zh)
EP (1) EP1466251A4 (zh)
JP (2) JP4350521B2 (zh)
KR (1) KR100959306B1 (zh)
CN (1) CN100573471C (zh)
MX (1) MXPA04006924A (zh)
MY (1) MY132104A (zh)
TW (1) TWI221993B (zh)
WO (1) WO2003062996A1 (zh)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6795903B2 (en) * 2002-01-17 2004-09-21 Thomas Licensing S.A. System and method for searching for duplicate data
US9535624B1 (en) * 2004-09-13 2017-01-03 EMC IP Holding Company LLC Duplicate management
US8165221B2 (en) * 2006-04-28 2012-04-24 Netapp, Inc. System and method for sampling based elimination of duplicate data
US8752199B2 (en) * 2006-11-10 2014-06-10 Sony Computer Entertainment Inc. Hybrid media distribution with enhanced security
US8739304B2 (en) * 2006-11-10 2014-05-27 Sony Computer Entertainment Inc. Providing content using hybrid media distribution scheme with enhanced security
EP2102750B1 (en) 2006-12-04 2014-11-05 Commvault Systems, Inc. System and method for creating copies of data, such as archive copies
US7840537B2 (en) 2006-12-22 2010-11-23 Commvault Systems, Inc. System and method for storing redundant information
US8117729B2 (en) * 2007-02-27 2012-02-21 West Paul E Methods of deploying a portable floating hot tub
KR100905218B1 (ko) * 2007-04-09 2009-07-01 삼성전자주식회사 애드혹 네트워크에서 콘텐츠 중복 검출 방법
US8767541B2 (en) * 2008-02-14 2014-07-01 Qualcomm Incorporated Scheduling policy-based traffic management
US8737314B2 (en) 2008-02-14 2014-05-27 Qualcomm Incorporated Traffic management for multi-hop wireless communication
US8964651B2 (en) * 2008-02-14 2015-02-24 Qualcomm Incorporated Traffic management employing interference management messages
US9098495B2 (en) 2008-06-24 2015-08-04 Commvault Systems, Inc. Application-aware and remote single instance data management
US8166263B2 (en) 2008-07-03 2012-04-24 Commvault Systems, Inc. Continuous data protection over intermittent connections, such as continuous data backup for laptops or wireless devices
EP2329378A4 (en) 2008-09-26 2015-11-25 Commvault Systems Inc SYSTEMS AND METHODS FOR MANAGING SINGLE-INSTANCE DATA
US9015181B2 (en) 2008-09-26 2015-04-21 Commvault Systems, Inc. Systems and methods for managing single instancing data
US8412677B2 (en) 2008-11-26 2013-04-02 Commvault Systems, Inc. Systems and methods for byte-level or quasi byte-level single instancing
US8401996B2 (en) 2009-03-30 2013-03-19 Commvault Systems, Inc. Storing a variable number of instances of data objects
US8578120B2 (en) 2009-05-22 2013-11-05 Commvault Systems, Inc. Block-level single instancing
US20110055471A1 (en) * 2009-08-28 2011-03-03 Jonathan Thatcher Apparatus, system, and method for improved data deduplication
US8935492B2 (en) 2010-09-30 2015-01-13 Commvault Systems, Inc. Archiving data objects using secondary copies
US9246882B2 (en) * 2011-08-30 2016-01-26 Nokia Technologies Oy Method and apparatus for providing a structured and partially regenerable identifier
US9020890B2 (en) 2012-03-30 2015-04-28 Commvault Systems, Inc. Smart archiving and data previewing for mobile devices
US8762353B2 (en) 2012-06-13 2014-06-24 Caringo, Inc. Elimination of duplicate objects in storage clusters
US9104560B2 (en) 2012-06-13 2015-08-11 Caringo, Inc. Two level addressing in storage clusters
US8799746B2 (en) 2012-06-13 2014-08-05 Caringo, Inc. Erasure coding and replication in storage clusters
US9633022B2 (en) 2012-12-28 2017-04-25 Commvault Systems, Inc. Backup and restoration for a deduplicated file system
US10324897B2 (en) 2014-01-27 2019-06-18 Commvault Systems, Inc. Techniques for serving archived electronic mail
CN104820851A (zh) * 2015-05-04 2015-08-05 柳州市瑞日信息科技有限公司 生成产品序列号的装置
US10324914B2 (en) 2015-05-20 2019-06-18 Commvalut Systems, Inc. Handling user queries against production and archive storage systems, such as for enterprise customers having large and/or numerous files
US10203953B2 (en) * 2017-02-24 2019-02-12 Microsoft Technology Licensing, Llc Identification of duplicate function implementations
US10700711B1 (en) 2017-11-03 2020-06-30 Caringo Inc. Multi-part upload and editing of erasure-coded objects

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5202982A (en) * 1990-03-27 1993-04-13 Sun Microsystems, Inc. Method and apparatus for the naming of database component files to avoid duplication of files
JP3036099B2 (ja) * 1991-01-30 2000-04-24 日本電気株式会社 データ管理方法
EP0826181A4 (en) * 1995-04-11 2005-02-09 Kinetech Inc IDENTIFYING DATA IN A DATA PROCESSING SYSTEM
JP2686064B2 (ja) * 1996-05-28 1997-12-08 株式会社東芝 データ情報検索装置
US6763523B1 (en) * 1998-04-03 2004-07-13 Avid Technology, Inc. Intelligent transfer of multimedia data files from an editing system to a playback device
US6292880B1 (en) 1998-04-15 2001-09-18 Inktomi Corporation Alias-free content-indexed object cache
US6477544B1 (en) * 1999-07-16 2002-11-05 Microsoft Corporation Single instance store for file systems
US6389433B1 (en) * 1999-07-16 2002-05-14 Microsoft Corporation Method and system for automatically merging files into a single instance store
JP2000331090A (ja) * 1999-12-22 2000-11-30 Oricon Direct Digital:Kk 音楽配信用の選曲支援システム及び選曲配信方法
KR100860821B1 (ko) * 2000-02-18 2008-09-30 이엠씨 코포레이션 공통부분 요소분화 시스템에 사용하기 위한 컴퓨팅 시스템, 식별자 설정 방법 및 컴퓨터 판독가능 프로그램을 구비한 기록 매체
US6704730B2 (en) * 2000-02-18 2004-03-09 Avamar Technologies, Inc. Hash file system and method for use in a commonality factoring system
AU2001288469A1 (en) * 2000-08-28 2002-03-13 Emotion, Inc. Method and apparatus for digital media management, retrieval, and collaboration
US6795903B2 (en) * 2002-01-17 2004-09-21 Thomas Licensing S.A. System and method for searching for duplicate data

Also Published As

Publication number Publication date
MY132104A (en) 2007-09-28
JP2005516324A (ja) 2005-06-02
KR100959306B1 (ko) 2010-05-26
US20030135700A1 (en) 2003-07-17
WO2003062996A1 (en) 2003-07-31
EP1466251A4 (en) 2007-04-25
EP1466251A1 (en) 2004-10-13
JP2009187654A (ja) 2009-08-20
KR20040076885A (ko) 2004-09-03
JP5065317B2 (ja) 2012-10-31
US6795903B2 (en) 2004-09-21
TW200302421A (en) 2003-08-01
CN1751295A (zh) 2006-03-22
MXPA04006924A (es) 2004-12-06
JP4350521B2 (ja) 2009-10-21
TWI221993B (en) 2004-10-11

Similar Documents

Publication Publication Date Title
CN100573471C (zh) 搜索重复数据的系统和方法
US6983289B2 (en) Automatic identification of DVD title using internet technologies and fuzzy matching techniques
MXPA04002233A (es) Extension de formato de archivo m3u para soportar una interfaz de usuario y tareas de navegacion en un reproductor digital de audio.
US20080162435A1 (en) Retrieving Content Items For A Playlist Based On Universal Content Id
EP2036092B1 (en) Method of navigating items at a media player
WO2000051128A1 (en) Method of sorting and playing audio data recorded in digital recording media
US7856443B2 (en) Automatic identification of DVD title using internet technologies and fuzzy matching techniques
KR20070027640A (ko) 데이터 운반 매체를 위한 식별 데이터 블럭을 생성하는방법 및 디바이스
CN1830034B (zh) 内容信息的快速重构方法
US20070091736A1 (en) System and method for storing and managing digital content
WO2003054861A2 (en) Digital audio player enabling auto-adaptation to the environment
CN104731834B (zh) 一种文件顺序播放方法及装置
US20070078847A1 (en) System and method for generating a play-list
CN101051502B (zh) 复原光盘中已毁损的光盘内容表的方法
JP2009252268A (ja) メモリ内データ更新管理システム
JP2008083770A (ja) オーディオ装置
JP2005085301A (ja) 記録再生装置、曲データの複製方法及び曲データの複製プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: I Si Eli Murli Nor, France

Patentee after: THOMSON LICENSING

Address before: French Boulogne

Patentee before: THOMSON LICENSING

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20190517

Address after: Paris France

Patentee after: Interactive digital CE patent holding Co.

Address before: I Si Eli Murli Nor, France

Patentee before: THOMSON LICENSING

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20091223

Termination date: 20200115