CN100442279C - 注释数字对象 - Google Patents

注释数字对象 Download PDF

Info

Publication number
CN100442279C
CN100442279C CNB2004800228718A CN200480022871A CN100442279C CN 100442279 C CN100442279 C CN 100442279C CN B2004800228718 A CNB2004800228718 A CN B2004800228718A CN 200480022871 A CN200480022871 A CN 200480022871A CN 100442279 C CN100442279 C CN 100442279C
Authority
CN
China
Prior art keywords
annotation
data object
data
relation
digital
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2004800228718A
Other languages
English (en)
Other versions
CN1833241A (zh
Inventor
J·阿尔博诺斯
L·费根鲍姆
S·马丁
L·麦卡洛
E·托雷斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN1833241A publication Critical patent/CN1833241A/zh
Application granted granted Critical
Publication of CN100442279C publication Critical patent/CN100442279C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually

Abstract

在为数据对象创建独立注释文件的系统中,为数据对象产生数字指纹。这允许了具有相关联注释的数据对象的跨异质系统关系。数字指纹以及数字指纹和注释位置之间的第一关系以及数字指纹和数据对象拷贝位置之间的第二关系一道被保存在注释存储库中。数字指纹可以由具有数据对象拷贝的任何系统产生。注释或数据对象可以通过搜索到数字指纹及其关系而被发现。

Description

注释数字对象
技术领域
本发明涉及计算机数据处理。更具体地说,本发明涉及管理和注释数字数据对象。
背景技术
注释系统是其中存储了关于对象或对象的多个部分的描述性信息,而不会修改对象自身。存在其中注释被存储在目标对象自身的数据流中的注释系统。这种系统有很多缺点。在优选的注释系统中,注释独立于目标数据源而被存储。这在管理数据源及其关联的注释方面提供了很大的灵活性。独立的注释存储系统是本发明的主题,并且这里将被简称为“注释存储库”。注释系统在生命科学和生物工程学中有很大需求,但是其不仅仅限于上述领域。
注释存储库(通常是数据库)含有对注释的描述性信息。索引方案被用来将每个注释映射到目标对象或目标对象内的位置。我们将作为注释的潜在目标的对象(数据字节的集合)称作“数据源”。注释系统具有的客户端组件可以包括从独立注释程序到集成了第三方供应商软件的注释插件。
数字指纹在1996年4月9日PC Magazine的“Digital Signature:HowThey Work”中进行了描述。数字指纹是给定字节集的可计算标识符。数字指纹的理想属性包括简明性(便于存储和传输)、唯一性(避免具有相同指纹的不同字节集)、确定性(对于相同字节集应该总是计算出相同的指纹)、以及计算方便性(有利于大量指纹的快速计算)。数字指纹的一个常用示例是MD5哈希算法,其对给定的字节集合计算128字节的数字指纹。
在注释不能被利用该注释所针对的数据源而进行工作的用户获得时,该注释被称为“丢失的”。在数据源不能被曾经由外部过程(例如注释搜索或注释浏览器)检索该数据源上的注释的用户所恢复时,该数据源被称为“丢失的”。
在示例性现有技术注释系统(图4)中,下述过程被用来创建、存储和检索注释:第一,用户401从位置405“L”检索并打开402目标数据源“DS”。“L”的示例包括网络位置(例如,因特网URL“intranet.server.com/files/my spreadsheet.xls”)、本地路径(例如,“c:\data\article20a.pdf”)或内容管理标识符(例如,“MyCMS:Store:98a021”)。用户随后通过输入包括“A”的信息来创建注释403“A”。注释存储库407记录“A”和“L”之间的关系404。如果用户创建另一注释,则来自“L”的数据源上的“A2”以及随后的“A2”和“L”之间的关系也将被记录在注释存储库中。从而在注释存储库中,存在注释和数据源位置之间的多对一关系。
参考现有技术图5,当用户501稍后打开来自位置“L”405的503“DS”时,查询注释存储库406以找到与“L”相关联的所有注释。在上述情形中,“A”和“A2”505都将被返回504,并且用户能够利用注释及其目标数据源进行工作。
参考现有技术图6,用户601可以使用外部机制(例如注释搜索603或浏览器接口)来访问“A”或“A2”。在这种情况下,查询注释存储库605以找到可以发现目标数据源的位置。因为“A”(或“A2”)与“L1”有关,所以“L1”被返回给用户,并且用户再一次能够利用注释及其目标数据源进行工作。
传统的注释系统(现有技术图4-6中示出的示例)具有许多缺点。例如,参考现有技术图7,考虑从“L”之外的位置访问“DS”的情形。(例如,这可能在第二用户将“DS”作为电子邮件附件发送到用户706的情况下发生)这样我们就有了用户706从新位置“L2”访问“DS”的情形。当查询704注释存储库705以找到与“L2”有关的所有注释时,不返回任何内容,并且注释“A”和“A2”丢失。
第二个有缺陷的示例(现有技术图8)涉及下述情形:用户804通过外部搜索805或浏览器机制访问注释“A”,并且试图定位目标数据源“DS”。如前所述,注释存储库返回位置“L”,但是,如果在“L”处不再存在“DS”(例如,如果在文章被移动802到内容管理系统803之前该文章的本地拷贝被作了注释),则“DS”将丢失。
发明内容
根据第一方面,本发明提供了一种用于注释数据对象的方法,该方法包括下述步骤:创建所述数据对象的第一数字指纹值,所述数据对象被存储在第一位置;创建第一注释对象;创建将所述第一数字指纹值与所述第一位置相关的第一关系;创建将所述第一数字指纹值与所述第一注释对象相关的第二关系;在注释存储库中保存所述第一关系或所述第二关系中的任何一个;在第二位置处定位数据对象;创建将所述第一数字指纹与所述第二位置相关的第三关系;以及在注释存储库中保存所述第三关系。
优选地,所述第一数字指纹值是从对象的数字数据、对象的一个或多个部分的数字数据、与其它数字数据相结合的对象的数字数据或对象位置的数字数据中的任何一个中创建的。更为优选地,所述数字指纹值是使用校验和算法、循环冗余校验、哈希算法、SHA-256安全哈希算法、SHA-1安全哈希算法或MD5消息摘要算法中的任何一个创建的。再更为优选地,该方法还包括下述步骤:创建第二注释对象;创建将所述第一数字指纹与所述第二注释对象相关的第三关系;以及在注释存储库中保存所述第三关系。再更为优选地,该方法还包括下述步骤:在第二位置处定位数据对象;创建将所述第一数字指纹与所述第二注释对象相关的第四关系;以及在注释存储库中保存所述第四关系。
优选地,该方法还包括下述步骤:获得用于数据对象的第一数字指纹值;发现第一注释对象或数据对象中的任何一个;以及检索第一注释对象或数据对象的任何一个。更为优选地,所述发现步骤还包括下述步骤:查询注释存储库以找到含有所述第一数字指纹值和所述第一数字指纹与注释对象或数据对象位置中的任何一个之间的关系的条目。再更为优选地,所述获得步骤还包括下述步骤中的任何一个:计算数据对象的第一数字指纹值;或者查询注释存储库以找到第二注释对象和与第二注释对象相关联的第一数字指纹。
优选地,该方法还包括下述步骤:在第三位置检索所述第一数字指纹值、所述第一注释对象以及与所述第一数字指纹相关的第一位置的第一身份,所述第一位置包括数据对象的位置;从所述第一位置检索数据对象;以及将所述第一注释对象与所检索的数据对象相关。在优选实施例中,所述检索步骤还包括下述步骤:确定数据对象不在第一位置处;搜索数据库以找到具有所述第一数字指纹的数据对象;以及从数据库中的第四位置处检索数据对象。
优选地,该方法还包括根据预定计划重复上述步骤的步骤。更为优选地,该方法还包括在第三位置处记录所述第一数字指纹值与从数据库检索的数据对象的第四位置之间的第一关系的步骤。更为优选地,该方法包括下述步骤:将数据对象的第一数字指纹值与另一数据对象的第五位置相关联;以及使用第一数据对象的第一数字指纹值将所述数据对象与所述另一数据对象相关联。
根据第二方面,本发明提供了一种注释数据对象的系统,该系统包括:值创建器,用于创建存储在第一位置处的数据对象的第一数字指纹值;对象创建器,用于创建第一注释对象;第一创建器,用于创建将所述第一数字指纹值与所述第一位置相关的第一关系;第二创建器,用于创建将所述第一数字指纹值与所述第一注释对象相关的第二关系;保存器,用于在注释存储库中存储所述第一关系或所述第二关系中的任何一个;对象定位器,用于在第二位置处定位数据对象;第三创建器,用于创建将所述第一数字指纹与所述第二位置相关的第三关系;以及第二保存器,用于在注释存储库中保存所述第三关系。
根据第三方面,本发明提供了一种包括程序代码工具的计算机程序,当所述程序在计算机上运行时,所述程序代码工具适于执行上述方法的所有步骤。
本发明提供了一种系统,利用该系统为数据源产生数字指纹(“DF”)。“DF”与数据源相关,并且还与与数据源相关的任何注释对象相关。数据源的数字指纹对于创建该数字指纹的数据源来说是唯一的。因此,对“DF”的搜索与对该“DF”表示的数据源的搜索的功能相同。现在,注释与其数据源的关系独立于数据源的位置。在优选实施例中,数据源或其注释的每个拷贝与单个数字指纹值相关。
因此,本发明的一个优点是使用数字指纹来标识注释系统内的目标数据源。
本发明的另一优点是提供了数字指纹和可发现目标数据源的(一个或多个)位置之间的一对多关系。
本发明的又一优点是提供了一种按需搜索过程,该搜索过程利用给定的数字指纹来定位丢失的数据源。
本发明的再一优点是提供了一种连续搜索来定位和数字化采集在注释系统控制之外的文档的指纹。
本发明的其它实施例和方面在这里被详细描述,并且被视为所要求保护的发明的一部分。为了更好地理解本发明及其优点和特征,请参考说明书和附图。
附图说明
现在将仅通过示例并参考如以下附图中所图示的本发明优选实施例来描述本发明,在附图中:
图1是示出了计算机系统的组件的示图;
图2是示出了计算机系统网络的示图;
图3是注释数据库的示图;
图4的现有技术图示了创建注释的过程;
图5的现有技术图示了检索用于数据源的注释的过程;
图6的现有技术图示了检索用于给定注释的数据源的过程;
图7的现有技术图示了丢失的注释;
图8的现有技术图示了注释系统中丢失的数据源;
图9图示了使用数字指纹创建注释的过程;
图10图示了用于将数字指纹与新数据源位置相关联的注释系统插件(plug-in);
图11图示了在给定数据源时经由数字指纹检索注释的过程;
图12图示了在给定来自新位置的数据源时经由数字指纹另外检索丢失的注释的过程;
图13图示了在注释系统意识到数据源已被移动到新位置时经由数字指纹另外恢复丢失的数据源的过程;
图14图示了经由以数字指纹作为线索的搜索来恢复丢失的数据源的过程;
图15图示了一种连续搜索过程以扩展注释存储库的指纹到位置的关系;以及
图16图示了本发明的系统的组件。
具体实施方式
图1图示了可以实施本发明的代表性工作站或服务器硬件系统。图1的系统100具有包括可选外围设备的代表性计算机系统101,例如个人计算机、工作站或服务器。工作站101包括一个或多个处理器106和用来根据公知技术进行连接以及使能处理器106和系统101的其它组件之间的通信的总线。该总线将处理器106连接到存储器105和长期存储装置107,长期存储装置107例如可以包括硬盘驱动器、磁盘驱动器或磁带驱动器。系统101还可能包括用户接口适配器,其将微处理器106经由总线连接到一个或多个接口设备,例如键盘104、鼠标103、打印机/扫描仪110、和/或其它接口设备,其它接口设备可以是任何用户接口设备,例如触摸感应屏、数字化录入板等。总线还将显示设备102(例如LCD屏幕或监视器)经由显示适配器连接到微处理器106。
系统101可以利用能够与网络109通信的网络适配器而与其它计算机或计算机网络通信。示例性网络适配器是通信信道、令牌环、以太网或调制解调器。可选地,工作站101可以使用无线接口(例如CDPD(蜂窝数字分组数据)卡)进行通信。工作站101可以和局域网(LAN)或广域网(WAN)中的象这样的其它计算机相关联,或者工作站101可以是具有另一计算机的客户/服务器部署中的客户机等。所有这些配置以及适当的通信硬件和软件在本领域中是公知的。
图2图示了可以实施本发明的数据处理网络200。数据处理网络200可以包括多个分立的网络,例如无线网络和有线网络,每个网络可以包括多个分立的工作站101。此外,如本领域技术人员将理解的,可以包括一个或多个LAN,其中LAN可以包括耦合到主处理机的多个智能工作站。
仍然参考图2,网络还可以包括大型计算机或服务器,例如网关计算机(客户服务器206)或应用服务器(可以访问数据仓库的远程服务器208)。网关计算机206充当每个网络207的进入点。在将一种网络协议连接到另一种网络协议时需要网关。网关206可优选地利用通信链路耦合到另一网络(例如因特网207)。网关206还可以使用通信链路直接耦合到一个或多个工作站101。
系统101的处理器106典型地从长期存储介质107(例如CD-ROM驱动器或硬盘驱动器)访问实现本发明的软件编程代码。软件编程代码可以被实现在用于数据处理系统的多种公知介质中的任何一种上,例如磁盘、硬盘驱动器、或CD-ROM。所述代码可以被分布在这些介质上,也可以分布给用户,经由网络从一个计算机系统的存储器或存储装置到其它计算机系统,以由其它这样的系统的用户使用。
可选地,程序代码111可以实现于存储器105中,并且由处理器106使用处理器总线来访问。这样的编程代码包括控制各种计算机组件的功能和交互的操作系统以及一个或多个应用程序。程序代码通常从密集存储介质107被页式传输到高速存储器105,在高速存储器105处,程序代码可以被处理器106处理。在存储器中、在物理介质上实现软件程序代码以及/或者经由网络分发软件代码的技术与方法都是众所周知的,这里将不再讨论。
在优选实施例中,本发明被实现为一个或多个计算机软件程序111。本发明的软件实现可以在用户的工作站上运行,作为在请求时被调用的一个或多个模块或应用111(也被称为代码子例程、或面向对象编程中的“对象”)。可选地,软件可以在网络中的服务器上运行,或者可以在能够执行实现了本发明的程序代码的任何设备中运行。在不背离这里所公开的创造性概念的条件下,实现本发明的逻辑可以被集成到应用程序的代码中,或者所述逻辑可以被实现为由该应用调用的一个或多个独立的实用模块。应用111可以在Web环境中执行,其中Web服务器响应于来自通过因特网连接的客户机的请求而提供服务。在另一实施例中,该应用可以在企业内联网或外联网中、或在任何其它网络环境中执行。环境配置包括客户机/服务器网络、对等网络(其中客户机通过执行客户机功能和服务器功能两者而直接交互)以及多层环境。这些环境和配置在本领域中是众所周知的。
已转让给IBM的美国专利号6,519,603“Method and system fororganizing an annotation structure and for querying data andannotations”提出了一种用于以下述方式捕获关于数据库资料的注释的系统与方法,其中所述方式允许查询具有关于数据库资料和注释两者的谓词(predicate)或条件。
本发明引入了目标数据源的数字指纹以改善传统的注释系统。参考图3,优选实施例中的注释系统延及多个计算机系统301、305,并且通过网络304(例如因特网)进行通信。位置1处的第一系统300具有本地数据源1 302和本地注释存储库1 303。位置2处的第二系统350具有本地数据源2 306和本地注释存储库2 307。通过利用本发明所讲授的对数据源完成数字指纹,数据源的注释数据跨越系统而被相关。
数字指纹算法包括将数据文件编码为小字符串的方法。小字符串优选地对数据文件来说是唯一的,然而算法所要求的唯一性等级是系统要求。数字指纹可以通过使用校验和算法、循环冗余校验、哈希算法、SHA-256安全哈希算法、SHA-1安全哈希算法或MD5消息摘要算法中的任何一个来创建。这些算法中的每一个具有不同的唯一性等级,并且需要执行不同等级的编程开销。对用于产生数字指纹的算法的使用是与本发明相一致的,并且在实施中可能需要添加校验以确保数字指纹对象是所需要的对象。验证对象的方法在本领域中是公知的,并且还将取决于使用它们的系统。
根据本发明,当用户从位置“L”检索数据源“DS”进行注释时,注释系统产生用于该数据源的数字指纹“DF”。在系统的一个实施例中,“DF”是通过计算包括“DS”的字节的MD5哈希而产生的。在系统的可选实施例中,可能仅仅“DS”的相关部分对指纹有贡献。例如,与“DS”的主要内容无关的时间戳可以被排除在数字指纹之外。
在另一示例中,DS可以被压缩为GIF文件或被加密为加密文件,实施例可以基于压缩文件创建指纹,或者解压缩(或解密)文件来创建指纹。在再一实施例中,应用可以将其它数据与数据源文件一道进行哈希运算,以创建个性化的数字指纹。例如,医院可以将代表该医院的串与正在进行数字化采指纹的文件串一道添加到数字采指纹事件中。这将增加安全级别同时分离由于其它原因可能会被复制的文件。
参考图9,当用户901使用对象创建器程序创建904注释“A”910时,注释系统现在记录905由第二创建器程序创建的“DF”和“A”910之间的关系,以及“DF”913和“L”912之间的关系。如果由第三创建器程序创建关于相同位置处的“DS”的第二注释“A2”911,则“A2”911和“DF”之间的关系(由第四创建器程序创建)被注释存储库907利用保存器程序来记录(利用第二保存器程序)。(“DF”和“L”之间的关系保持不变。该关系是由第一创建器程序创建的。)因此,在注释910-911和数据源数字指纹913之间存在多对一关系。
在系统的一个实施例中,注释系统的客户组件监视数据移动以确定数据源何时移动到新位置。例如(图10),注释应用插件1005观察用户1001,所述用户1001已经检索1002数据源、并且正在文档读取器应用(例如来自Adobe的Acrobat Reader)中浏览它、调用“另存为...”命令将具有指纹“DF”的数据源从位置“L1”拷贝1003到位置“L2”。该插件将此情形报告给注释存储库1007,注释存储库1007随后记录1004“DF”和“L2”之间的关系。因此,数字指纹和位置之间的关系变成一对多。
在系统的一个实施例(图11)中,用户1101稍后打开来自位置“L”1106的“DS”1102,并且系统使用值创建器程序计算指纹“DF”1103。它查询注释存储库1107以找到与“DF”相关联的所有注释,并且存储库1107使用指纹来定位和返回“A”和“A2”。用户现在可以利用注释和目标数据源两者来工作,如同传统注释系统中那样。
在系统的另一实施例(图12)中,第二用户发送“DS”到另一用户1201(例如,利用电子邮件附件),另一用户1201随后从新位置1206“L2”打开它。系统再次计算指纹“DF”1203,并且基于该指纹查询1205注释存储库1207。存储库使用多对一的注释到指纹的关系,并且返回注释“A”和“A2”。用户现在可以利用注释和目标数据源两者工作,而不必顾及“DS”是从“L2”访问而注释是从“L1”创建的事实。因此,利用根据本发明的数字指纹,消除了传统注释系统的缺点,本发明允许以其它方式恢复丢失的注释。
在系统的一个实施例(图13A-图13B)中,第二用户1301从位置L1检索1302文件F1,将其保存1301为位置L2处的F2,并且从L1删除F1。注释用户1304经由外部搜索1310或浏览器机制检索注释“A”,并且想要定位注释的目标数据源。查询1311注释存储库以找到与注释“A”相关的数字指纹“DF”,然后检查一对多关系以找到可以发现具有指纹“DF”的数据源的位置列表L1、L2。检查这些地址中的每个以找到具有指纹“DF”数据源的存在;如果发现这样的数据源,则用户现在可以利用注释及其目标数据源两者进行工作。
在另一实施例(图14A-14C)中,数据源不再存在于与“DF”相关的、记录在注释存储库中的任何位置处。(例如,“DS”可能已经经由注释系统外部的机制被移动802到档案文件服务器803。)对注释系统配置可能数据源位置的有限全域。这些位置可以包括从中可获得目录列表的网络文件服务器的根(root)、可以经由超链接遍历的内联网web服务器的根、或内容管理系统(其是内容管理系统本身中的数据源位置的有限全域)。
在系统的一个实施例中,可以按需调用搜索过程以恢复丢失的具有指纹“DF”的数据源。用户1401通过注释搜索接口1410启动搜索。查询1411注释存储库1412以找到与注释对象“A”相关联的数字指纹“DF”。系统使用数字指纹来检索1413具有数字指纹的数据源的可能位置“L”。如果没有发现数据源,则搜索所配置的可能数据源位置的全域以找到具有指纹“DF”的数据源。如果搜索全域内不管何处存在数据源,则数字指纹的确定性、可计算的性质将保证它将被发现,然后用户将能够利用注释及其目标数据源两者来工作。此外,“DF”和发现了数据源的位置之间的关系可以被记录在注释存储库中。数字指纹由按需搜索系统1420使用以搜索所配置的全域(因特网文件服务器1421和内容管理系统1423)。如果发现了1426文件,则位置和数字指纹被记录在注释存储库1412中。
在系统的可选实施例(图15)中,搜索过程可以有规律定期运行,不断扩展数字指纹到位置的一对多关系。在这种情况下,当经由外部搜索或浏览器机制检索注释时,即使是被移动到注释系统认识之外的数据源也不会丢失。因此,数字指纹的添加连同一对多的指纹到位置关系和按需或连续搜索过程消除了传统注释系统的第二个缺点:我们的发明允许以其它方式恢复丢失的目标数据源。
“按需”搜索过程开始1501,并且根据预定计划在本地注释系统之外的预定数据存储库1502上执行搜索。优选地,为所发现的数据存储库创建临时数字指纹。如果1505临时数字指纹DF2匹配于1503本地注释存储库1504的数字指纹DF:L1,则与所发现的数据存储库相关联的位置L2被添加到本地注释存储库1504的DF:L1,得到关系DF:L1;L2。根据预定计划评价1507一个搜索延续标准,并且如果满足该标准,则搜索继续,否则,搜索结束1508。一个示例性延续标准是在预定时间段(背景模式)内连续执行搜索,而另一标准将比针对其它数据库更为频繁地针对某些数据库,另一标准将提醒用户:搜索正在以某种时段进行,请求用户允许继续或终止。
在一个实施例中,比较步骤1503创建用于远程文件1502的数字指纹,并且搜索本地注释存储库1504以找到匹配。如果1505在注释存储库中发现了相同的指纹(DF=DF2),则远程文件的位置L2被添加到注释存储库1504作为DF:L1;L2。
参考图16,用于注释数据对象的系统的优选实施例包括:值创建器程序1603,用于创建数据对象1609的第一数字指纹值(DF),数据对象被存储1602在第一位置L1处;对象创建器程序1605,用于创建第一注释对象A;第一创建器程序1606,用于创建将第一数字指纹值“DF”与第一位置“L1”相关的第一关系DF:L1;第二创建器程序1607,用于创建将第一数字指纹值“DF”与第一注释对象“A”相关的第二关系DF:A;以及保存器程序1611,用于在注释存储库中保存第一关系DF:L1或第二关系DF:A中的任何一个。
在一种变化形式中,值创建器程序1603从对象的数据、对象的一个或多个部分的数字数据、与其它数字数据相结合的对象的数字数据或对象位置的数字数据中的任何一个来创建第一数字指纹值。
在另一变化形式中,值创建器程序1603使用校验和算法、循环冗余校验、哈希算法、国家标准与技术研究院(NIST,隶属美国商务部)的SHA-256安全哈希算法、(NIST)SHA-1安全哈希算法或麻省理工学院(MIT)的MD5消息摘要算法中的任何一个来创建数字指纹值。
在另一变化形式中,第三创建器程序1605创建第二注释对象“A2”904;第四创建器程序1607创建第三关系,第三关系将第一数字指纹与第二注释对象相关联DF:A2;以及第二保存器1611在注释存储库1610中保存第三关系。
在另一变化形式中,对象定位器程序1602在第二位置L2处定位数据对象;第五创建器程序1606创建将第一数字指纹与第二位置相关联的第四关系DF:L2;以及第三保存器程序1611在注释存储库1610中保存第四关系。
在另一实施例中,经注释的数据对象是使用下述程序访问的,所述程序包括:获得器程序1603,用于获得用于数据对象的第一数字指纹值DF;发现器程序1612,用于发现与第一数字指纹值有关系DF:A的第一注释对象或与第一数字指纹值有关系DF:L1的数据对象中的任何一个;以及检索器程序1613,用于检索第一注释对象A或数据对象(L1)中的任何一个。
在一种变化形式中,查询器1615查询注释存储库1610,以找到含有第一数字指纹值DF与第一数字指纹与注释对象DF:A或数据对象位置DF:L1中任何一个之间的第一关系的条目。
在另一变化形式中,获得器程序1603还包括计算器程序或第二查询器程序1615中的一个,计算器程序用于计算数据对象(L1)的第一数字指纹值DF,第二查询器程序1615用于查询注释存储库1610以找到第二注释对象A2以及与第二注释对象DF:A2相关联的第一数字指纹DF。
在另一实施例中,第一检索器程序1613在第一位置1609处检索第一数据对象(L1)的第一数字指纹值DF、与第一数字指纹值相关的第一注释对象DF:A、以及与第一数字指纹相关的第二位置1608的第一身份,所述第二位置包括数据对象的位置L2;第二检索器程序1602从第二位置1608检索数据对象(L2);以及相关器程序1614将第一注释对象A与所检索的数据对象(L)相关为A:(L)。
在一种变化形式中,第二检索器1602还包括:确定器程序1615,用于确定数据对象不在第二位置;搜索器程序1615,用于搜索第二数据库1608以找到具有第一数字指纹的数据对象;以及第三检索器程序1613,用于从第二数据库1608的第三位置检索数据对象。
在另一变化形式中,系统包括重复器程序1616,用于根据预定计划重复所述系统的操作。所述计划包括时间段、系统活动监视器、用户GUI提示或程序控制中的任何一个。
在另一变化形式中,系统包括记录器程序1611,用于在第一位置1610处将第一数字指纹值DF与从第二数据库1608检索的数据对象的第三位置L2之间的第一关系记录为DF:L2。
本发明可以被包括在例如具有计算机可使用介质的制品(例如,一个或多个计算机程序产品)中。介质中例如包含了用于提供并辅助本发明的能力的计算机可读程序代码工具。所述制品可以被包括为计算机系统的一部分或者可以被单独出售。
此外,可以提供至少一种可由机器读取的程序存储设备,该程序存储设备有形地含有可由机器执行以实现本发明的能力的至少一个指令程序。
这里描述的流程图仅仅是示例。在不背离本发明的精神的条件下,这里描述的这些示图或步骤(或操作)可以有许多变化形式。例如,步骤可以用不同的顺序执行,或者步骤可以被添加、删除或修改。所有这些变化形式都被视为所要求保护的发明的一部分。
尽管这里详细描述并说明了优选实施例,但是对本领域技术人员来说很明显可以作出多种修改、添加和替换等等,并因此这些被视为落入如所附权利要求定义的本发明的范围内。

Claims (23)

1.一种注释数据对象的方法,所述方法包括下述步骤:创建所述数据对象的第一数字指纹值,所述数据对象被存储在第一位置;创建第一注释对象;创建将第一数字指纹值与第一位置相关的第一关系;创建将第一数字指纹值与第一注释对象相关的第二关系;在注释存储库中保存第一关系或第二关系中的任何一个;在第二位置处定位数据对象;创建将第一数字指纹与第二位置相关的第三关系;以及在注释存储库中保存第三关系。
2.如权利要求1所述的方法,其中第一数字指纹值是从对象的数字数据、对象的一个或多个部分的数字数据、与其它数字数据相结合的对象的数字数据或对象位置的数字数据中的任何一个创建的。
3.如权利要求1或2所述的方法,其中数字指纹值是使用校验和算法、循环冗余校验、哈希算法、SHA-256安全哈希算法、SHA-1安全哈希算法或MD5消息摘要算法中的任何一个创建的。
4.如权利要求1或2所述的方法,还包括下述步骤:创建第二注释对象;创建将第一数字指纹与第二注释对象相关的第四关系;以及在注释存储库中保存第四关系。
5.如权利要求1所述的方法,还包括下述步骤:获得用于数据对象的第一数字指纹值;发现第一注释对象或者所述数据对象中的任何一个;以及获取第一注释对象或所述数据对象中的任何一个。
6.如权利要求5所述的方法,其中所述发现步骤还包括下述步骤:查询注释存储库以找到含有第一数字指纹值和第一数字指纹与注释对象或数据对象位置中的任何一个之间的关系的条目。
7.如权利要求5或6所述的方法,其中所述获得步骤还包括下述步骤中的任何一个步骤:计算数据对象的第一数字指纹值;或者查询注释存储库以找到第二注释对象和与第二注释对象相关联的第一数字指纹。
8.如权利要求1所述的方法,还包括下述步骤:在第三位置处获取第一数字指纹值、第一注释对象以及与第一数字指纹相关的第一位置的第一身份,所述第一位置包括数据对象的位置;从第二位置获取数据对象;以及将第一注释对象与所获取的数据对象相关。
9.如权利要求8所述的方法,其中所述获取步骤还包括下述步骤:确定所述数据对象不在第一位置处;搜索数据库以找到具有第一数字指纹的数据对象;以及从数据库中的第四位置处获取所述数据对象。
10.如权利要求9所述的方法,还包括根据预定计划重复权利要求9的步骤的步骤。
11.如权利要求8至10中任何一个所述的方法,还包括在第三位置处记录第一数字指纹值与从数据库获取的数据对象的第四位置之间的第一关系的步骤。
12.如权利要求9或10所述的方法,还包括下述步骤:将数据对象的第一数字指纹值与另一数据对象的第五位置相关联;以及使用第一数据对象的第一数字指纹值将所述数据对象与所述另一数据对象相关联。
13.一种注释数据对象的系统,所述系统包括:值创建器,用于创建存储在第一位置处的数据对象的第一数字指纹值;对象创建器,用于创建第一注释对象;第一创建器,用于创建将第一数字指纹值与第一位置相关的第一关系;第二创建器,用于创建将第一数字指纹值与第一注释对象相关的第二关系;保存器,用于在注释存储库中存储第一关系或第二关系中的任何一个;对象定位器,用于在第二位置处定位数据对象;第三创建器,用于创建将第一数字指纹与第二位置相关的第三关系;以及第二保存器,用于在注释存储库中保存第三关系。
14.如权利要求13所述的系统,其中所述值创建器从对象的数字数据、对象的一个或多个部分的数字数据、与其它数字数据相结合的对象的数字数据或对象位置的数字数据中的任何一个来创建第一数字指纹值。
15.如权利要求13或14所述的系统,其中所述值创建器使用校验和算法、循环冗余校验、哈希算法、SHA-256安全哈希算法、SHA-1安全哈希算法或MD5消息摘要算法中的任何一个来创建数字指纹值。
16.如权利要求13或14所述的系统,还包括:第四创建器,用于创建第二注释对象;第五创建器,用于创建将第一数字指纹与第二注释对象相关联的第四关系;以及第三保存器,用于在注释存储库中保存第四关系。
17.如权利要求13所述的系统,还包括:获得器,用于获得用于数据对象的第一数字指纹值;发现器,用于发现第一注释对象或所述数据对象中的任何一个;以及获取器,用于获取第一注释对象或所述数据对象中的任何一个。
18.如权利要求17所述的系统,其中发现器还包括查询器,用于查询注释存储库,以找到含有第一数字指纹值以及第一数字指纹与注释对象或数据对象位置中的任何一个之间的关系的条目。
19.如权利要求17或18所述的系统,其中所述获得器还包括计算器或第二查询器中的任何一个,计算器用于计算数据对象的第一数字指纹值,第二查询器用于查询注释存储库,以找到第二注释对象以及与第二注释对象相关联的第一数字指纹。
20.如权利要求13所述的系统,还包括:第一获取器,用于在第三位置处获取第一数字指纹值、第一注释对象以及与第一数字指纹相关的第一位置的第一身份,所述第一位置包括数据对象的位置;第二获取器,用于从第一位置获取数据对象;以及相关器,用于将第一注释对象与所获取的数据对象相关。
21.如权利要求20所述的系统,其中第二获取器还包括:确定器,用于确定数据对象不在第一位置处;搜索器,用于搜索数据库以找到具有第一数字指纹的数据对象;以及第三获取器,用于从数据库的第四位置获取数据对象。
22.如权利要求21所述的系统,还包括重复器,用于根据预定计划重复权利要求21的系统的操作。
23.如权利要求20至22中任何一个所述的系统,还包括记录器,用于在第三位置处记录第一数字指纹值与从数据库获取的数据对象的第四位置之间的第一关系。
CNB2004800228718A 2003-06-20 2004-06-15 注释数字对象 Expired - Fee Related CN100442279C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/600,316 2003-06-20
US10/600,316 US7305557B2 (en) 2003-06-20 2003-06-20 Management and recovery of data object annotations using digital fingerprinting

Publications (2)

Publication Number Publication Date
CN1833241A CN1833241A (zh) 2006-09-13
CN100442279C true CN100442279C (zh) 2008-12-10

Family

ID=33517720

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004800228718A Expired - Fee Related CN100442279C (zh) 2003-06-20 2004-06-15 注释数字对象

Country Status (3)

Country Link
US (2) US7305557B2 (zh)
CN (1) CN100442279C (zh)
WO (1) WO2004114149A2 (zh)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6834308B1 (en) * 2000-02-17 2004-12-21 Audible Magic Corporation Method and apparatus for identifying media content presented on a media playing device
WO2002082271A1 (en) 2001-04-05 2002-10-17 Audible Magic Corporation Copyright detection and protection system and method
US8972481B2 (en) 2001-07-20 2015-03-03 Audible Magic, Inc. Playlist generation method and apparatus
US7478096B2 (en) * 2003-02-26 2009-01-13 Burnside Acquisition, Llc History preservation in a computer storage system
US20050086234A1 (en) * 2003-10-15 2005-04-21 Sierra Wireless, Inc., A Canadian Corporation Incremental search of keyword strings
US7519900B2 (en) * 2003-10-24 2009-04-14 Microsoft Corporation System and method for processing digital annotations
US7689578B2 (en) * 2004-01-15 2010-03-30 International Business Machines Corporation Dealing with annotation versioning through multiple versioning policies and management thereof
US20080065681A1 (en) * 2004-10-21 2008-03-13 Koninklijke Philips Electronics, N.V. Method of Annotating Timeline Files
GB0510878D0 (en) * 2005-05-27 2005-07-06 Qinetiq Ltd Digital evidence bag
US8165221B2 (en) * 2006-04-28 2012-04-24 Netapp, Inc. System and method for sampling based elimination of duplicate data
US8412682B2 (en) * 2006-06-29 2013-04-02 Netapp, Inc. System and method for retrieving and using block fingerprints for data deduplication
US8762345B2 (en) * 2007-05-31 2014-06-24 Netapp, Inc. System and method for accelerating anchor point detection
US8006314B2 (en) 2007-07-27 2011-08-23 Audible Magic Corporation System for identifying content of digital data
US8291308B2 (en) * 2007-12-28 2012-10-16 International Business Machines Corporation Annotating collaborative information structures
US9176943B2 (en) 2008-05-12 2015-11-03 Adobe Systems Incorporated Comment presentation in electronic documents
US9418054B2 (en) 2008-05-12 2016-08-16 Adobe Systems Incorporated Document comment management
US8996621B2 (en) * 2008-05-12 2015-03-31 Adobe Systems Incorporated Asynchronous comment updates
US7949633B1 (en) 2008-05-12 2011-05-24 Adobe Systems Incorporated Shared edit access of electronic content
US7945595B1 (en) 2008-05-12 2011-05-17 Adobe Systems Incorporated System and method for generating an item list in electronic content
US8190990B2 (en) * 2008-06-27 2012-05-29 Google Inc. Annotating webpage content
CN101882216B (zh) * 2009-05-08 2012-11-21 成都市华为赛门铁克科技有限公司 构建数据指纹的方法、装置及电子设备
US8799754B2 (en) * 2009-12-07 2014-08-05 At&T Intellectual Property I, L.P. Verification of data stream computations using third-party-supplied annotations
US9836482B2 (en) * 2009-12-29 2017-12-05 Google Inc. Query categorization based on image results
US8930325B2 (en) * 2012-02-15 2015-01-06 International Business Machines Corporation Generating and utilizing a data fingerprint to enable analysis of previously available data
US20150074397A1 (en) * 2012-03-13 2015-03-12 Cognilore Inc. Method of distributing digital publications incorporating user generated and encrypted content with unique fingerprints
US9081778B2 (en) * 2012-09-25 2015-07-14 Audible Magic Corporation Using digital fingerprints to associate data with a work
CN110061968A (zh) * 2019-03-15 2019-07-26 广东工程职业技术学院 一种基于区块链的文件加解密方法、系统及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5978791A (en) * 1995-04-11 1999-11-02 Kinetech, Inc. Data processing system using substantially unique identifiers to identify data items, whereby identical data items have the same identifiers
CN1343337A (zh) * 1999-03-05 2002-04-03 佳能株式会社 数据库注释和获取
US6505160B1 (en) * 1995-07-27 2003-01-07 Digimarc Corporation Connected audio and other media objects
US6519603B1 (en) * 1999-10-28 2003-02-11 International Business Machine Corporation Method and system for organizing an annotation structure and for querying data and annotations
US20030061490A1 (en) * 2001-09-26 2003-03-27 Abajian Aram Christian Method for identifying copyright infringement violations by fingerprint detection
WO2003042867A2 (en) * 2001-11-16 2003-05-22 Koninklijke Philips Electronics N.V. Fingerprint database updating method, client and server

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6011847A (en) * 1995-06-01 2000-01-04 Follendore, Iii; Roy D. Cryptographic access and labeling system
US5787175A (en) * 1995-10-23 1998-07-28 Novell, Inc. Method and apparatus for collaborative document control
US6546405B2 (en) * 1997-10-23 2003-04-08 Microsoft Corporation Annotating temporally-dimensioned multimedia content
US6173287B1 (en) * 1998-03-11 2001-01-09 Digital Equipment Corporation Technique for ranking multimedia annotations of interest
US6289362B1 (en) * 1998-09-01 2001-09-11 Aidministrator Nederland B.V. System and method for generating, transferring and using an annotated universal address
US6618733B1 (en) * 2000-04-11 2003-09-09 Revelink Inc. View navigation for creation, update and querying of data objects and textual annotations of relations between data objects
AU2003207856A1 (en) * 2002-02-04 2003-09-02 Cataphora, Inc A method and apparatus to visually present discussions for data mining purposes
US7257774B2 (en) * 2002-07-30 2007-08-14 Fuji Xerox Co., Ltd. Systems and methods for filtering and/or viewing collaborative indexes of recorded media

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5978791A (en) * 1995-04-11 1999-11-02 Kinetech, Inc. Data processing system using substantially unique identifiers to identify data items, whereby identical data items have the same identifiers
US6505160B1 (en) * 1995-07-27 2003-01-07 Digimarc Corporation Connected audio and other media objects
CN1343337A (zh) * 1999-03-05 2002-04-03 佳能株式会社 数据库注释和获取
US6519603B1 (en) * 1999-10-28 2003-02-11 International Business Machine Corporation Method and system for organizing an annotation structure and for querying data and annotations
US20030061490A1 (en) * 2001-09-26 2003-03-27 Abajian Aram Christian Method for identifying copyright infringement violations by fingerprint detection
WO2003042867A2 (en) * 2001-11-16 2003-05-22 Koninklijke Philips Electronics N.V. Fingerprint database updating method, client and server

Also Published As

Publication number Publication date
US20040260929A1 (en) 2004-12-23
CN1833241A (zh) 2006-09-13
WO2004114149A2 (en) 2004-12-29
US7305557B2 (en) 2007-12-04
US7870392B2 (en) 2011-01-11
WO2004114149A3 (en) 2005-04-07
US20070271248A1 (en) 2007-11-22

Similar Documents

Publication Publication Date Title
CN100442279C (zh) 注释数字对象
US11561931B2 (en) Information source agent systems and methods for distributed data storage and management using content signatures
US10769106B2 (en) System and method for identifying and mitigating redundancies in stored data
US7308463B2 (en) Providing requested file mapping information for a file on a storage device
US8280851B2 (en) Applying a policy criteria to files in a backup image
US6665689B2 (en) Backup and restore for heterogeneous file server environment
US8412685B2 (en) Method and system for managing data
US8417746B1 (en) File system management with enhanced searchability
JP5509596B2 (ja) データ管理装置
US8386521B2 (en) System for backing up and restoring data
US8341117B2 (en) Method, system, and program for personal data management using content-based replication
US8156092B2 (en) Document de-duplication and modification detection
US8024306B2 (en) Hash-based access to resources in a data processing network
US20120131001A1 (en) Methods and computer program products for generating search results using file identicality
JP2006012146A (ja) 影響分析のためのシステムおよび方法
KR20060095448A (ko) 데이터베이스 내부에 표현된 파일 시스템
US20100318534A1 (en) Intelligent retrieval of digital assets
CN114238214A (zh) 一种智能化财务档案存储管理系统及系统
CN116991811A (zh) 一种分布式协同去重方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20081210

Termination date: 20120615