CN101743512B - 具有标识多媒体内容的签名指针的搜索树的渐进式构造 - Google Patents

具有标识多媒体内容的签名指针的搜索树的渐进式构造 Download PDF

Info

Publication number
CN101743512B
CN101743512B CN2008800220076A CN200880022007A CN101743512B CN 101743512 B CN101743512 B CN 101743512B CN 2008800220076 A CN2008800220076 A CN 2008800220076A CN 200880022007 A CN200880022007 A CN 200880022007A CN 101743512 B CN101743512 B CN 101743512B
Authority
CN
China
Prior art keywords
reference signature
node
signature
old
collection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2008800220076A
Other languages
English (en)
Other versions
CN101743512A (zh
Inventor
蒋文宇
大卫·内尔·莱思罗普
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Publication of CN101743512A publication Critical patent/CN101743512A/zh
Application granted granted Critical
Publication of CN101743512B publication Critical patent/CN101743512B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/71Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/61Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

系统使用具有表示根据视频内容片段及音频内容片段导出的签名的节点的搜索树结构来标识内容并重新建立已经彼此解除关联的视频内容与音频内容之间的正确校准。可以通过用签名指针替代存储的签名集合来减少记录表示树结构的数据所需的存储量。可以通过构造并使用部分树结构来提高在树结构中搜索的效率。

Description

具有标识多媒体内容的签名指针的搜索树的渐进式构造
技术领域
本发明总体上涉及可以用于组织和搜索标识表示旨在供人感知的刺激的信号的内容的大签名集合的处理及数据结构。两种示例类型的信号是视频信号及音频信号。在本公开中,术语“视频信号”及“视频内容”是指表示旨在供视觉感知的图像的信号及内容,并且术语“音频信号”及“音频内容”是指表示旨在供听觉感知的声音的信号及内容。
背景技术
试图标识视频信号内容或音频信号内容的应用(包括试图检测由视频信号及音频信号传送的盗版内容的应用或者试图将已解除关联的视频信号及音频信号再同步的应用)通常依赖于检查信号内容以导出表示并标识该内容的签名集合的处理。对于许多这些应用,重要的是即使在信号的内容已被无意地或有意地修改的情况下也获得那些信号的可靠标识,使得观察者仍然能够识别出经修改的内容与原始内容基本相同。如果所感知到的原始信号的内容与经修改的信号的内容之间的差异小,则优选的是,标识处理可以根据彼此非常相似的原始信号及经修改的信号导出签名集合。在由Regunathan Radhakrishnan等人于2006年11月30日提交的题为“Extracting Features of Video and Audio Signal Content to Provide aReliable Identification of the Signals”的美国临时专利申请第60/872,090号以及由Regunathan Radhakrishnan等人于2007年5月17日提交的题为“Deriving Video Signatures That Are Insensitive to PictureModification and Frame-Rate Conversion”的美国临时专利申请第60/930,905号中公开了可以用于导出视频信号及音频信号的签名集合的一些处理,通过引用将它们的内容合并在此。
试图标识某些测试信号内容的应用通常获得表示参考内容库的大量参考签名集合,将参考签名集合布置为某种类型的数据结构,根据测试信号内容导出测试签名集合,然后搜索所述数据结构以确定是否存在与测试签名集合相匹配的参考签名集合。如果存在可接受程度的匹配,则测试信号内容与对应的参考内容可能共享公共源。如果参考内容是原始内容,则认为测试信号内容是该参考内容的副本。
对于许多视频应用及音频应用,上文提到的库包含大量参考内容,并且所述数据结构包括非常大量的签名集合。需要非常大量的存储来记录实现所述数据结构所需的所有签名集合,并且需要大量处理资源来搜索所述数据结构。
发明内容
本发明的目的是减少实现并搜索表示参考内容(诸如,图像、声音或其它旨在供人感知的刺激)的参考签名集合的结构所需的存储资源及处理资源。还一个目的是使得便于标识在参考内容内与匹配测试内容相对应的位置。
根据本发明的一个方面,通过使选择窗沿参考签名序列前进并修改有根树结构以反映基于该选择窗内的参考签名组的参考签名集合的改变成员,来将测试内容的测试签名集合与参考内容的参考签名集合相比较以标识所述测试内容。通过获得表示测试内容的测试签名集合并搜索有根树结构以确定在该树中是否存在与参考签名集合相对应并且提供的与测试签名集合的相似水平超过阈值的叶节点,来检查测试内容的标识。
根据本发明的另一方面,通过沿参考签名序列移动选择窗并基于该选择窗内的参考签名构造表示参考签名集合的集的有根树结构、记录表示该有根树结构的数据结构、并且记录表示所述选择窗在所述参考签名序列内的位置并指向所述数据结构的位置索引,来构造用于在标识测试内容时使用的树结构。重复该处理以针对多个选择窗位置构造多个有根树结构并记录表示多个有根树结构及选择窗位置的数据结构及位置索引。
根据本发明的又一方面,介质记录表示有根树结构的数据,所述有根树结构包括分别与表示签名序列的数据元素串中的数据元素子串相关联的多个单层次节点及一个或更多个多层次节点。每个单层次节点与具有固定长度的数据元素子串相关联。每个多层次节点与长度等于所述固定长度的两倍或更多倍的整数的数据元素子串相关联。单层次节点或多层次节点中的一些节点是与表示构成签名集合的所有签名的数据元素子串相关联的叶节点。指针与多层次节点相关联,并指向在表示与所述多层次节点相关联的签名的数据元素串内的位置。
通过参照后续讨论及附图可以更好地理解本发明及其优选实施例的各个特征,在附图中的几幅图中,相似的附图标记表示相似的元件。后续讨论的内容及附图仅作为示例阐述,而不应将其理解为表示对本发明范围的限制。
附图说明
图1是可以用于生成视频签名及音频签名的系统的示意框图。
图2是签名序列及签名集合的示意图。
图3是管理用于标识视频内容或音频内容的签名数据库的系统的示意框图。
图4是捕捉参考签名以及用于同步视频/音频内容流的校准信息的系统的示意框图。
图5是可以用于恢复视频/音频内容流之间的同步的系统的部分的示意框图。
图6及图7是有根树结构的示意图。
图8是具有压缩节点的有根树结构的示意图。
图9是具有压缩节点及签名指针的有根树结构的示意图。
图10A是签名序列及签名集合的示意图。
图10B是图10A中所示的签名集合的搜索树的示意图。
图10C是与图10B中所示的搜索树相对应的具有压缩节点的搜索树的示意图。
图11A是签名序列及签名集合的示意图。
图11B是图11A中所示的签名集合的搜索树的示意图。
图11C是与图11B中所示的搜索树相对应的具有压缩节点的搜索树的示意图。
图12A是签名序列及签名集合的示意图。
图12B是图12A中所示的签名集合的搜索树的示意图。
图12C是与图12B中所示的搜索树相对应的具有压缩节点的搜索树的示意图。
图13是可以用于实现本发明的各个方面的装置的示意框图。
具体实施方式
A.引言
图1是可以包含本发明的各个方面的示例性系统300的示意框图。系统300检查视频/音频信号的片段3a至3d的内容以产生该信号的可靠标识。在该示例中,所述标识由生成标识视频内容的视频签名(SV)集合199a至199d的视频签名生成器100以及生成标识音频内容的音频签名(SA)集合299a至299d的音频签名生成器200提供。
仅作为示例示出生成视频内容及音频内容的视频签名及音频签名的诸如系统300的系统。可以将本发明的各方面合并到生成信号的签名的其它系统中,所述信号传送表示一种或更多种类型的旨在供人感知的刺激(例如,视觉图像、声音或触觉感受)的内容。在本公开的其余部分中,更具体地论及表示视觉及听觉刺激的内容。
1.签名及签名集合
可以使用多种处理来生成签名。尽管签名生成处理的选择可能对系统的性能有显著的实际后果,但是原则上不存在对本发明而言关键的特定处理。例如,上文引用的专利申请中所描述的处理可以用于生成视频签名及音频签名。
在针对视频内容及音频内容的很多应用中,视频签名及音频签名是根据从表示运动图像及声音的间隔的内容片段导出的信息生成的。在图1中所示的示例中,视频内容及音频内容的各个签名与视频/音频信号的各个片段相对应。片段与签名之间的该特定对应仅作为示例提出。其它布置是可行的。例如,可以针对表示约33毫秒的视频内容的NTSC视频信号帧生成视频签名,并且可以针对表示约10毫秒的音频内容的音频信号采样块生成音频签名。作为另一示例,可以针对一系列的NTSC视频信号帧生成视频签名,并且可以针对一系列的音频信号采样块生成音频签名。
在相关技术中有时称作“指纹”并且在这里称作签名集合的连续签名集合旨在标识内容的间隔。可以通过使用如上文引用的专利申请中所讨论的那些签名生成处理的签名生成处理,在内容的改变几乎没有感知效果或没有感知效果的情况下生成不显著改变的签名,来提高标识的可靠性。
可以在如图3中所示的标识系统的标识系统中使用可靠的标识以确定在参考内容库中是否已经存在特定信号的内容,并且可以在如图5中所示的同步系统的同步系统中使用可靠的标识以测量并校正关联的音频内容与视频内容之间的时间校准误差。通过生成要标识的内容间隔的一个或更多个签名集合,然后将这些签名集合与表示已知内容的集的签名集合相比较,来进行标识。如果要标识的内容间隔的签名集合与已知内容间隔的签名集合相同或非常相似,则这两个内容间隔可能共享公共源并且这两个间隔接近校准(in close alignment)。
为了易于讨论,本文中将要标识的内容及其关联的签名及签名集合分别称作测试内容、测试签名及测试签名集合,并且本文中将已知内容及其相关的签名及签名集合分别称作参考内容、参考签名及参考签名集合。
2.签名集合的分辨率
测试内容与参考内容之间的接近校准对于提供测试签名集合与参考签名集合之间的有意义的比较是重要的。所述比较的粒度或分辨率受限于生成签名集合的处理的分辨率或步长。例如,如果每个音频签名表示10毫秒的音频内容,则可以通过生成步长等于一个签名的一系列签名集合来实现分辨率为10毫秒的签名集合的集。图2中例示了一个示例。在该示例中,签名序列5包括各自表示10毫秒的内容的12个签名S1、S2、...、S12。一系列签名集合SSI、SS2、...、SS4各自包括与90毫秒的内容相对应的9个相邻的签名。每个签名集合的范围由标记每个签名集合在签名序列5内的起始及终止的窄线来示出。
在许多应用中,例如,生成表示长得多的内容间隔(诸如,2秒)的签名集合。该系列的签名集合的时间分辨率或粒度受控于相继的签名集合的起始点之间的间隔或偏移,这在所例示的示例中是一个签名的长度。优选的是,使用诸如上文引用的专利申请中所公开的那些技术的技术生成签名集合的签名,使得测试签名与参考签名之间的最接近匹配与测试内容与参考内容之间的最小校准误差相对应。
3.匹配签名集合
许多应用实现搜索与测试签名集合相似但不相同的参考签名集合的处理。共享公共源的测试内容及参考内容的签名集合通常由于两个原因中的任一原因或两个原因而不同。第一个原因是:测试内容与参考内容可能不同;一个可能是另一个的修改版本。第二个原因是:即使测试内容与参考内容相同,但是用于生成签名的内容片段可能未精确校准。由于这些原因中的任一个或两个,使用不同的内容片段生成测试签名及参考签名;因此,即使测试内容及参考内容共享公共源,所生成的测试内容及参考内容的签名及签名集合通常不同。如果两个不同信号的内容彼此相同,或者彼此不同但是表示同一原始内容的不同版本,则将这两个信号的内容称作“共享公共源”。
如果不同的签名集合之间的某一相似度测量超过阈值,则可以认为这两个签名集合匹配。可以使用的一个相似度测量是两个集合之间的汉明(Hamming)距离的倒数。两个二进制数据项之间的汉明距离等于这两个项中彼此不同的对应位的数量。例如,如果X1=0101102且X2=1100112,则两个值中的第一位、第四位及第六位不同,从而X1与X2之间的汉明距离等于3。X1与X2之间的汉明距离等于零指示这两个项是相同的。如果签名集合由签名序列组成并且每个签名由分别的位串表示,则签名集合本身可以由其组成签名的一连串的位串表示。两个签名集合之间的汉明距离是它们的两个分别的位串之间的不同位的数量。
在一些实现中,上述标识系统及同步系统试图通过找到与测试签名集合的汉明距离最小的参考签名集合来找到提供与测试签名集合的最佳匹配的参考签名集合。然而,无论使用何种相似度测量,由于在最佳匹配搜索中必须检查非常大量的签名集合,因此该处理一般较繁琐。
4.数据结构
应当使用签名集合及其组成签名的某一类型的数据结构以便于搜索。可以使用的一种类型的数据结构公知为有根树结构。
有根树结构由以分级层次布置并且通过分支或链接相互连接的元素或节点组成。树的一个层次中的节点通过链接而连接到该树中的下一较低层次处的一个或更多个节点中的每一个节点。将不具有任何低于其的节点的节点称作叶节点。将不具有任何高于其的节点的节点称作根节点。链接定义根节点与每个叶节点之间的唯一路径。本文中将沿由一系列链接定义的路径的处理称作遍历那些链接。
有根树结构可以用于通过将某一搜索准则与每个链接相关联来方便搜索处理。许多布置是可行的。图6中示出了有根树结构的一个示例。树的节点由圆圈表示,并且节点之间的链接由连接圆圈的线表示。该特定树是对称的并具有16个叶节点。针对每个链接的搜索准则由附连在该链接的低端处的节点中出现的符号表示。
图6中所示的树可以用于搜索表示两个2位数的连串序列的叶节点。开始于根节点N0处,搜索处理将搜索值x的前两位与针对直接在根节点下的链接的准则相比较。例如,针对到节点N1的链接的2比特搜索准则为00。搜索处理确定满足哪个链接准则,然后遍历到下一节点的该链接。对树的更低层次继续该处理,直到达到叶节点。例如,如果搜索值x等于0101,则搜索处理开始于根节点N0处,并且确定针对到节点N2的链接的准则01与搜索值的前两位相匹配。该处理遍历到该节点的链接,随后确定针对到节点N22的链接的准则01与搜索值的下两位相匹配。因为节点N22是叶节点,所以搜索处理遍历到该节点的链接并终止。
树结构不必对称,并且它们不必“完整”或被节点填满。例如,图7中所示的树与图6中所示的树相对应,但省略了一些节点及链接。被省略的节点及链接用虚线示出。如果搜索值x不严格地对应于叶节点中的一个,则搜索处理可以报告不存在匹配叶节点,或者可以标识提供与搜索值的最接近匹配的叶节点。例如,如果搜索值x等于0000,则搜索处理开始于根节点N0,并且确定针对到节点N1的链接的准则00是对搜索值的前两位的精确匹配。搜索处理遍历到节点N1的链接,随后确定针对节点N13的准则10对于搜索值的下两位而言是比针对节点N14的准则11更接近的匹配。因为节点N13是叶节点,所以搜索处理遍历到该节点的链接并终止。由叶节点N13表示的位串0010不与搜索值x=0000严格地匹配,但是它与该搜索值的汉明距离等于1,该汉明距离小于针对该特定树中任一其它叶节点的汉明距离。如果将汉明距离的倒数用作相似度测量,则与叶节点N13相关的位串提供对搜索值x的最接近匹配。
树结构中的每个叶节点与沿从根节点到该叶节点遍历的路径所遇到的一系列链接准则相对应。特定系列的链接准则通常对应于一个签名集合;然而,同一系列的准则可以对应于多于一个签名序列。于是,叶节点可以对应于多于一个签名集合。位于沿从根节点到叶节点的路径的中间节点中的每个中间节点表示构成与该叶节点相对应的一个或更多个签名集合中的签名的数据元素串中的一个或更多个数据元素。例如,如果签名集合由二进制值数据元素串或位串表示,则每个中间节点表示一个或更多个位。从节点传下的链接表示可以由这些位表示的不同值。
在许多应用中,每个签名包括几个字节的二进制数据,并且每个签名集合包括一系列几百个签名。对于这些应用,树结构的简便实现将每个中间节点与签名集合的数据元素串中的八个位或一个字节的二进制数据相关联。一个字节的二进制数据可以表示从零至255的值;因此,每个中间节点可以具有多达256个后代节点。树中的层次的数量等于表示每个签名集合所需的数据的字节数。
下文讨论用于存储、构造及使用树结构的技术。
B.搜索树
1.存储
本发明的各个方面可以用于减少记录表示有根树结构的数据所需的存储量。
在很多针对视频内容及音频内容的应用中,树结构可能具有数千个层次并且包括数百万个节点。例如,Miller等人的“Audio Fingerprinting:Nearest Neighbor Search in High Dimensional Binary Spaces”(2002 IEEEWorkshop on Multimedia Signal Processing,2002年12月,182-185页)中所讨论的系统使用8192位或1024字节长的签名集合。具有所有可能的节点及分支的完整树具有28192=2561024≈102466个叶节点。完整树中的节点的总数也在102466量级。存储表示这种树的数据所需的存储量是非常巨大的。所幸的是,典型的多媒体应用并不需要完整树。
数千小时多媒体内容的表示可能需要10亿个在Miller的论文中所描述的签名集合,这比上述完整树中的叶节点的数量少得多。结果,用于多媒体应用的有根树结构可以是非常稀疏的,尤其是在接近叶节点的较低层次中。尽管如此,10亿(109)是很大的数,并且需要相当多的存储容量来记录表示这么多签名集合的树结构。可以使用下文描述的技术来减少记录用于许多多媒体应用的树结构所需的存储量。
a)虚拟表示
这里讨论的示例假定树中的中间节点表示8位的签名数据。紧接根节点下的树的第一层次可以具有多达(28)1=256个节点。紧接第一层次下的第二层次可以具有多达(28)2=65,536个节点。紧接第二层次下的第三层次可以具有多达(28)3=16,777,216个节点。如果树表示10亿个签名集合,则在每个第三层次节点下有平均约60个叶节点。很有可能存在所有第三层次节点。几乎肯定存在所有第一层次节点及第二层次节点。换言之,很可能需要完整树结构来表示第一层次、第二层次及第三层次中的节点。
可以使用一维数组来提供完整树结构的有效表示。该数组的每个元素对应于节点。可以根据期望对数组中的元素进行排序,但是一个方便的实现反映从左到右、从顶到底排序节点。
可选择地,这些顶部层次可以按虚拟方式而不是由记录在存储器中的数据来表示。这些顶部层次中的特定节点的256个链接中的每个链接可以由搜索处理在遍历从一个层次到下一层次的链接时以编程方式(programmatically)表示。例如,该技术可以用于第一层次及第二层次中的节点,并且第三层次中的节点可以由(28)3≈1.6×107个元素的一维数组表示,其中每个元素表示一个第三层次节点。如果希望,可以仅针对特定树结构中实际存在的那些节点分配数组元素,并且节点的存在或不存在可以由具有与每个节点相关联的分别的标记的一位标记集合指示。
下面的源代码程序例示搜索处理可以使用节点的虚拟表示的一种方式。该程序片段包括C++编程语言的句法特征,但其并不旨在成为完整的或实际的实现。仅为了说明原理而示出它。源代码的每个语句之前的数字为后续讨论提供方便的参考。
1  //---------------------------------------------------------------------------------------------------------------------------------
2  //在第一次调用时level设定成1,curNode设定成NULL
3  int traversal(Node*curNode,byte*searchValue,int level,int dist_sofar,byte*traversed_data)
4  {
5  int i,n;
6  if(level<=3){
7       for(n=0;n<256;n++){
8            virt_node[n].byte_val=n;//virt_node[n]是具有2个数据域的256个元素的数组
9            virt_node[n].dist_thisbyte=Hamming_distance(searchValue[level],(byte)n);
10  }
11  call sort(virt_node[n],virt_node[n].dist_thisbyte);
12  for(n=0;n<256;n++){
13       int dist_new=virt_node[n].dist_thisbyte+dist_sofar;
14       if(dist_new is promising){
15                traversed_data[level]=virt_node[n].byte_val;
16                Node*node_next=NULL;
17                if(level==3){
18                     int idx=0;
19                     for(i=1;i<=3;i++)
20                          idx=(idx<<8)+traversed_data[i];
21                     node_next=&(NodeArray[idx]);
22                     if(node_next->type==nonexistent)
23                          continue;   //跳至for循环的下一迭代
24                }
25                traversal(node_next,searchValue,level+1,dist_new,traversed_data);
26          }//if-dist_new结束
27     }//for-n循环结束
28  }else{//level>3
29         //遍历使用存储节点的树
30  }
31  //------------------------------------------------------------------------------------------------------------------------------
例程traversal是递归调用子例程,该子例程实现与上文引用的Miller的论文中所描述的搜索处理相似的搜索处理,其中虚拟表示每个节点具有256个链接的树的第一层次及第二层次中的节点。第3行中的语句定义该子例程的入口点。输入参数包括指针curNode、记录要通过搜索查找的测试签名集合中的签名的元素的数组searchValue、指定正在被搜索的树的当前层次的值level、指定在搜索到当前节点为止所遇到的总汉明距离的值dist_sofar、以及记录树中沿到当前节点的路径所遍历的节点的元素的数组traversed_data。指针curNode通常指向树结构中正在被搜索的当前节点,但是其值不用于树中节点被虚拟表示的前两个层次。在该示例中,针对树的前两个层次,该指针被设定为空值。
第6行中的if语句确定搜索当前是否处在第一层次、第二层次或第三次层中。如果为否,则执行继续第29行中的语句,该语句表示诸如Miller的论文中所描述的搜索处理的搜索处理。如果搜索当前处在第一层次、第二层次或第三层次中,则执行继续以第7行中的语句开始的for循环。
第7行至第10行中的for循环将提供从当前虚拟节点传下的256个节点的虚拟表示的元素的数组virt_node初始化。元素virt_node[n].byte_val记录后代虚拟节点的搜索准则。元素virt_node[n].dist_thisbyte记录这些后代虚拟节点与搜索值之间的汉明距离。
第11行中的语句将数组virt_node的元素按汉明距离的升序排序,以使得后续对最小汉明距离的搜索先检查更有希望的节点。
第12行至第27行中的for循环检查256个虚拟节点中的每个虚拟节点,以确定哪些节点是良好的搜索候选。该检查开始于第13行中的语句,该语句将值dist_new设定为等于沿到当前虚拟节点virt_node[n]的搜索路径所累计的总汉明距离。
第14行中的if语句确定指示沿到当前虚拟节点的路径的搜索的该距离是否有希望。这可以通过将该距离与阈值相比较来完成,如Miller的论文中所描述的那样。如果距离太大(这指示到当前虚拟节点的搜索没有希望),则执行在第27行中继续,这使在第12行中开始的for循环对下一虚拟节点迭代。如果汉明距离dist_new指示到当前虚拟节点的搜索有希望,则执行在第15行中继续,通过更新数组traversed_data来反映搜索正沿到当前虚拟节点的链接前进。将指针node_next初始化为空值。
第17行中的if语句确定搜索当前是否处在第三层次中。如果为否,则当前层次是第一层次或第二层次,并且执行继续第25行中的语句,该语句递归调用traversal子例程以继续下一层次处的搜索。如果搜索当前处在第三层次中,则执行继续第18行至第23行中的语句。第19行至第20行中的for循环将traversed_data的前三个元素中所记录的数据的字节串连成24位串,该24位串作为整数值记录在变量idx中。该值用作数组NodeArray的索引,数组NodeArray的元素记录在树结构中的第三层次处的每个节点的数据。通常,数据结构在第一层次、第二层次及第三层次中是完整的;因此,第22行中的if语句通常确定索引节点存在,并且搜索继续第25行中的递归子例程调用。然而,如果第三层次节点不存在,则执行继续第23行中的语句,这使在第12行中开始的for循环用下一虚拟节点进行迭代。
对第25行中的子例程traversal的每次递归调用最终返回到第27行中的for循环的底部,这使for循环检查当前层次处的下一虚拟节点。当已检查全部256个节点时,该子例程以第30行中的语句终止。
b)压缩节点
在许多应用中,有根树结构在接近叶节点的较低层次中是非常稀疏的。通常在沿特定路径的两个或更多个相邻层次中存在仅具有一个后代的节点。记录仅具有一个后代的一系列节点所需的存储量可以通过存储表示这些节点的复合或压缩表示的数据(而并非通过存储表示每个单独节点的数据)来减少。例如,不需要针对每个节点存储以记录不存在的后代链接。一系列节点可以由压缩结构表示,该压缩结构标识该压缩结构中的第一层次节点或最顶部层次节点、由该压缩结构表示的节点或层次的数量、以及当遍历这些节点之间的唯一链接时所遇到的系列值或链接准则。
参照图7,节点N3仅具有一个后代节点。节点N3及其后代节点N34可以由压缩结构表示,将该压缩结构示意性地例示为图8中所示的树结构中的节点X3。在压缩节点X3中所示的符号“10.11”表示当遍历沿通过节点N3及N34的路径的链接时所遇到的系列链接准则10-11。
c)签名指针
针对许多应用的树结构表示很大数量的签名集合。在上文引用的Miller的论文中所描述的音频内容的示例性实现中,每个签名集合包括1024字节的数据。如果应用记录具有10亿(109)个叶节点的树结构以及每个叶节点的签名集合,则需要超过1千兆字节(1012字节)的存储来记录构成所述签名集合的数据。
构成树结构的每个叶节点的签名集合的数据由沿到该叶节点的路径所遇到的链接准则序列隐含地表示。如果树结构不包括压缩节点,或者如果压缩节点包括如上所述的链接准则,则不需要额外的数据来记录签名集合本身,但是在很多应用中由于在构成签名集合的数据中存在大量重复而浪费相当多的存储。该重复归因于不同签名集合由交叠的一系列签名组成的事实。
如上所述,签名集合可能由数百个签名组成,并且步长或者不同签名集合的起始之间的偏移可能等于一个签名的持续时间。如果每个签名集合由200个签名组成并且相邻集合之间的偏移为一个签名,则每个签名的数据包含在200个签名集合内。单独地记录每个签名集合的数据所需的存储量可能比记录整个组成签名序列的数据所需的存储量大200倍。
可以通过用指向在表示从其获得所有签名集合的签名的数据元素串内的位置的签名指针替代每个压缩节点的系列链接准则,来减少树的存储要求。在许多应用中,使用签名指针可以将记录树数据结构所需的存储量减少90%。
图9中示意性地例示一示例。在该示例中,二进制值数据元素串或位串构成由图中所示的树结构表示的签名序列5。可以根据需要而使用基本上任何类型的数据元素,包括位、字节或半字节。图中所示的序列中的第一个签名由数据元素字串00表示。压缩节点X3与由数据元素1011表示的签名集合相对应。该节点具有指向签名序列5内表示与该节点相关联的一系列签名中的第一个签名的位置的签名指针6。由于压缩节点X3表示包括叶节点在内的树的所有层次,因此与该节点相关联的一系列签名是完整签名集合。
图中所示的压缩节点以叶节点终止。这并非必须。压缩节点可以针对树结构的任何部分而存在。图12C中例示了不包括叶节点的压缩节点的示例。
如果需要,可以将签名指针与不包括在压缩节点中的每个叶节点相关联。该关联可以简化用于遍历树结构的处理的复杂度。可以这样做的一种方式是将未以其它方式包括在压缩节点中的所有叶节点定义在表示仅一个节点的压缩节点中。
2.位置信息
使用签名集合测量并校正关联的音频内容与视频内容之间的时间校准误差的同步系统需要建立视频内容及音频内容内与每个视频签名集合及音频签名集合相对应的位置的信息。可以按可能期望的任何方式提供该位置信息。这里描述两种方式。
a)位置域
提供签名集合的位置信息的一种方式在生成组成签名时标识由该签名集合表示的内容的位置,并将与该签名集合所对应的叶节点相关联的该位置记录在存储器中。例如,可以将位置信息表达为按照嵌入在内容中的时间码的形式或按照相对于该内容的起始的呈现时间的形式的时间,或者可以将其表达为诸如相对于该内容的起始的帧数、块数或字节数的位置。
b)通过签名指针的位置
提供签名集合的位置信息的另一种方式根据与该签名集合所对应的叶节点相关联的签名指针导出由该签名集合表示的内容的位置。与叶节点相关联的签名指针指向关联的签名集合在签名序列内的位置。该位置直接关系到根据其导出签名集合中的签名的内容片段的相对位置。在一个实现中,签名指针指向签名集合中第一个签名的位置。图9中示意性地例示该实现的示例。
参照图9,签名序列5中的每个签名是根据内容片段序列3内的分别的视频内容片段或音频内容片段导出的。内容片段与签名之间的对应由连接相邻的签名及相邻的内容片段之间的边界的线示出。签名集合内在粗线内示出且被签名指针6指向的两个签名是根据内容片段C4及C5导出的。内容片段序列3内的内容片段C4的相对位置可以根据签名序列5内被签名指针6指向的位置导出。
如果签名序列内的每个签名由相同数量的数据元素表示并且所述签名是根据起始于相互偏移固定间隔的位置处的内容片段导出的,则可以将总内容内的内容片段的相对位置表达为签名序列内对应签名的相对位置的线性函数。如果每个签名由M个数据元素表示并且相邻的签名是根据相互偏移间隔T的内容片段导出的,则可以将与签名相对应的内容片段的位置L表达为:
L = T M p - - - ( 1 )
其中,p=签名中第一个数据元素的位置。
例如,如果每个签名包括M=60字节的数据并且表示T=10毫秒的内容,则距签名序列的起始的位置p=510,000字节指示在该内容中的对应位置L等于
Figure G2008800220076D00142
如果每个签名中数据元素的数量M以字节表达并且位置p以位表达,则可以将式1中的表达式重写为:
L = T M · p 8 - - - ( 2 )
还可以使用签名位置导出与开始于树结构中的中间层次处的压缩节点相对应的内容的位置。例如,如果树中的每个节点与一个字节或8位的签名数据相对应,每个签名包括根据相互偏移间隔T的内容片段导出的M字节数据,并且位位置p指向对应签名的位置,则可以将与压缩节点中的第一个节点相对应的内容的位置表达为:
L = T M · ( p 8 - v ) - - - ( 3 )
其中,v=由压缩节点表示的第一个节点的层次。
在有根树结构的一个实现中,每个压缩节点具有指向与在压缩节点中表示的第一个节点相对应的签名的位置p的签名指针,并且每个叶节点具有指向与该叶节点相对应的签名集合中的第一个签名的位置p的签名指针。另选的是,叶节点可以具有指向与该叶节点相对应的签名集合中的最后一个签名的位置p的签名指针。如果需要,包括叶节点的压缩节点可以具有两个指针;一个指针指向与在压缩节点中表示的第一个节点相对应的签名的位置,并且另一个指针指向与该叶节点相对应的签名集合中的第一个或最后一个签名的位置。
C.应用
上文讨论的有根树结构可以在多种应用中使用,包括以下章节中所讨论的那些应用。
1.内容标识
标识内容的应用的一些示例包括检测未经授权的副本的应用以及确认指定内容的广播或接收的应用。
点对点服务器的网络可以便于内容的发布,但是它们还会增加检测版权内容的未经授权副本或盗版副本的困难,这是因为许多内容副本可以存在于多个点对点服务器中。设备可以通过生成可从网络得到的所有内容的签名并对照参考签名数据库检查这些签名,来自动地确定在网络中是否存在任何未经授权的副本。
与广播网络订有合同以发布指定内容的实体可以通过根据由广播接收机接收到的信号生成签名并将这些签名与指定内容的参考签名相比较来确认合同的条款得到满足。
为广播网络提供评级的实体可以通过根据所接收到的信号生成签名并将这些签名与参考签名相比较来标识由接收机接收到的内容。
图3是可以用于实现如上所述的多种应用的系统的示意框图。如果需要,可以实现针对单一类型内容(例如,仅音频内容或仅视频内容)的相似系统。参照图中所示的系统,视频签名生成器100及音频签名生成器200根据从路径31接收到的参考视频/音频内容流生成参考视频签名及参考音频签名。将所生成的参考视频签名布置在集合中并记录在视频签名数据库(VSIG DB)180中,并且将所生成的参考音频签名布置在集合中并记录在音频签名数据库(ASIG DB)280中。可以将参考签名集合与能够便于实现应用的其它信息(例如,标识内容拥有者、内容许可条款、内容的标题或内容的文字描述的数据)一起记录。视频搜索引擎185搜索表示存储在视频签名数据库180中的参考视频签名集合的有根树结构。音频搜索引擎285搜索表示存储在音频签名数据库280中的参考音频签名集合的有根树结构。这些有根树结构中的任一个或两个可以在它们使用之前构造并记录在存储器中,或者它们可以在它们使用时构造。
可以对照由存储在视频及音频数据库中的签名集合表示的参考内容检查任何指定的测试视频内容或测试音频内容的标识。可以通过使视频签名生成器101根据从路径33接收到的测试视频内容生成测试视频签名集合并将该测试视频签名集合传送到视频搜索引擎185来检查测试视频内容的标识。视频搜索引擎185试图在视频签名数据库180中查找与测试视频签名集合精确匹配或近似匹配的参考视频签名集合。可以通过使音频签名生成器201根据从路径33接收到的测试音频内容生成测试音频签名集合并将该测试音频签名集合传送到音频搜索引擎285来检查测试音频内容的标识。音频搜索引擎285试图在音频签名数据库280中查找与测试音频签名集合精确匹配或近似匹配的参考音频签名集合。
在一个实现中,搜索引擎计算测试签名集合与存储在数据库中的参考签名集合之间的汉明距离,并搜索与测试视频签名集合最接近的参考签名集合。如果测试签名集合与参考签名集合之间的距离小于某一阈值,则认为与该测试签名集合相关联的测试内容是与该参考签名集合相关联的参考内容的精确副本或修改副本。经验结果表明,使用表示约两秒内容的签名集合对于多种视频及音频内容可以获得很好的结果。
在优选的实现中,视频签名数据库180中的所有视频签名集合作为连串的视频签名序列存储在一个数据元素串中,并且音频签名数据库280中的所有音频签名集合作为连串的音频签名序列存储在另一数据元素串中。签名可以表示多个内容项,例如,多个运动画面、运动画面中的多个场景、多首歌曲、或多个商业及政治广告。如果签名序列表示多于一个内容项,则构造标识每个内容项的起始位置的内容表。该内容表可以用于确定签名指针指向哪个内容项。
例如,假设内容标识系统具有记录有表示10,000首歌曲的1.5亿个音频签名的音频签名数据库280。该数据库将所有音频签名的序列记录在数据元素串中。使用上文讨论的技术在搜索之前或在搜索时构造表示整个签名序列的树结构。树结构中的每个压缩节点及每个叶节点具有指向分别的签名在数据元素串内的位置的签名指针。还构造具有10,000个条目的内容表。该内容表中的每个条目与分别的歌曲相对应,并将指向表示该歌曲中的第一个内容片段的音频签名的位置的内容指针包括到数据元素串中。当系统试图标识某一测试内容时,其对树结构进行搜索,以确定是否存在具有与测试签名集合相匹配的对应参考签名集合的叶节点。如果找到匹配,则将与该叶节点相关联的签名指针与内容表中的内容指针相比较,以确定哪首歌曲与测试内容相匹配。具有小于或等于该签名指针的最大内容指针的条目与通过搜索标识的歌曲相对应。如果内容表中的项是按位置顺序排序的,则二进制搜索技术可以用于将签名指针与内容指针相比较。
如果匹配叶节点与多于一个签名集合相关联,则需要一个或更多个额外的搜索来标识与测试内容相对应的歌曲。这可以按多种方式完成。一种方式对其它测试签名集合进行额外的独立搜索,直到找到仅具有一个签名集合的匹配叶节点。第二种方式进行一系列搜索,基于每个索记录作为候选的那些歌曲的指示,并继续额外的搜索,直到从满足多个搜索的候选中标识一首歌曲。第三种方式与第二种方式相似,但是针对后续搜索构造仅表示由先前搜索标识的候选歌曲的签名集合的更小的树。
2.内容同步
视频内容流及音频内容流在它们被记录或被创建时通常彼此同步,但是在后续处理过程中同步可能会丧失。例如,在电视广播系统中,同步的视频内容流及音频内容流通常在它们被合成到一起来传输之前被分到两个不同的路径中进行信号处理。这两个路径中不同的处理延迟可能导致同步丧失。可以人工地将所述流再同步,但这很繁琐且易出错。上述具有位置信息的有根树结构可以用在自动地恢复同步的系统中。例如,在广播系统中,可以在系统中的任意点处恢复同步,包括在即将广播前在发射机处或者在即将收听前在接收机处。
在优选的实现中,在已知视频/音频流同步时根据视频内容流及音频内容流生成签名。还捕捉指定成为这些签名的基础的视频内容与音频内容之间的时间校准的校准信息。将视频签名及音频签名以及校准信息提供给负责恢复这两个流之间的同步的“再同步设备”。所述再同步设备接收到在视频内容流及音频内容流已经彼此丧失同步之后的这些流,与当前校准信息一起生成新签名,将新生成的签名及当前校准信息与原始签名及校准信息相关,并调整当前校准,直到实现正确的同步。下文更详细地描述完成该过程的一种方式。
a)概述
图4是根据同步的视频流及音频流生成视频签名集合及音频签名集合以及校准信息的示例性捕捉设备350的示意框图。本文中将同步的视频内容及音频内容以及同步的视频内容流及音频内容流称作参考内容及参考流。本文中将从参考流获得的签名集合及校准信息分别称作参考签名集合及参考校准信息。从视频签名生成器100获得视频签名集合,并将其沿路径190传送供再同步设备后续使用。通过音频签名生成器200获得音频签名集合,并将其沿路径290传送供再同步设备后续使用。上文引用的专利申请中描述了可以用于生成视频签名集合及音频签名集合的技术。
捕捉设备350还捕捉可以按多种方式表示的校准信息。例如,校准信息可以通过将特定视频签名集合的起始与音频签名集合的起始相关联来隐含,其中这两个签名集合是根据基本上同时开始的视频内容帧序列及音频内容片段序列生成的。在上下文中,如果观察者难以辨别哪个内容在另一内容之前,则认为视频内容与音频内容的起始时间基本相同。作为另一示例,可以利用与视频签名集合及音频签名集合相关联并指定成为视频内容及音频内容的基础的相对定时的时间戳或时间偏移表示校准信息。如果提供明确的校准信息,则将其沿路径390传送供再同步设备后续使用。校准信息的特定类型并不关键。
图5是可以用于恢复视频内容流与音频内容流之间的同步的示例性再同步设备400的部分的示意框图。再同步设备400包括视频签名生成器100及音频签名生成器200。视频签名生成器100根据从路径33接收到的测试视频内容流生成测试视频签名集合。音频签名生成器200根据从路径33接收到的测试音频内容流生成测试音频签名集合。这些流的内容可能已被修改,并且可能未正确地彼此同步。视频签名生成器100获得标识用于生成测试视频签名集合的测试视频内容的位置的测试视频位置信息,并且其将该测试视频位置信息与各自分别的测试视频签名集合相关联。音频签名生成器200获得标识用于生成测试音频签名集合的测试音频内容的位置的测试音频位置信息,并且其将该测试音频位置信息与各自分别的测试音频签名集合相关联。
内容延迟计算器410搜索具有表示参考视频签名集合的叶节点的有根树结构,以确定这些参考签名集合中的任一参考签名集合是否与测试视频签名集合精确匹配或近似匹配。如果找到匹配,则从与匹配参考视频签名集合的叶节点相关联的位置信息获得关联的参考视频内容的参考视频位置。根据参考视频位置与测试视频签名集合的测试视频位置之间的差异计算测试视频内容与参考视频内容之间的相对视频定时差。将该相对视频定时差传送给相对延迟计算器430。
内容延迟计算器420搜索具有表示参考音频签名集合的叶节点的有根树结构,以确定这些参考签名集合的中任一参考签名集合是否与测试音频签名集合精确匹配或近似匹配。优选的是,如下文所解释的,使用包括仅表示与一个或更多个选定内容间隔相对应的那些签名集合的节点的部分树结构。如果找到匹配,则从与匹配参考音频签名集合的叶节点相关联的位置信息获得关联的参考音频内容的参考音频位置。根据参考音频位置与测试音频签名集合的测试音频位置之间的差异计算测试音频内容与参考音频内容之间的相对音频定时差。将该相对音频定时差传送给相对延迟计算器430。
相对延迟计算器430使用这些相对定时差来计算调整测试视频流及测试音频流中的任一个或两个以实现正确的同步所需的延迟量。从路径390接收到参考内容的任何明确的校准信息,并将其用在延迟计算中。将表示该延迟的信息沿路径490传送供其它设备使用以实现该延迟。例如,假设相对视频定时差指示参考视频内容领先对应的测试视频内容4秒并且相对音频定时差指示参考音频内容领先对应的测试音频内容5秒。相对延迟计算器430可以计算出,为了实现正确的同步,测试视频流的延迟量等于1秒。
b)部分搜索树
测试内容与参考内容之间的相对定时差通常比整个参考内容的持续时间少得多。对于大多数实现,相对延迟不超过几秒钟;因此,针对匹配参考签名集合的搜索通常能够限于表示针对测试签名集合指定的几秒的测试位置内的参考内容的少数参考签名集合。结果,可以通过使用具有仅表示该少数参考签名集合的节点及链接的部分有根树结构来提高上述同步应用的效率。
可以利用与参考签名序列的选定间隔或窗内的签名相对应的节点构造适合于在上述同步系统中使用的部分树结构。整个参考签名序列可以包括任意期望持续时间的内容的签名,例如,一首或更多首歌曲的音频签名,或者一个或更多个运动画面的全部或部分的音频签名或视频签名。
部分树结构可以在它们使用之前构造并作为预建树的集合存储。这种方法减少使用树结构时所需的处理量,但是需要额外的存储来记录表示预建树结构的数据。另选的是,部分树结构可以在其使用时构造。这种另选方法在使用树结构时需要更多的处理,但是将记录表示树结构的数据所需的存储量最小化。下面讨论每种方法。
树的每个中间节点可以与签名集合中的一个或更多个签名相对应,或者仅与签名集合的一系列签名中的一个或更多个签名中的一些数据元素相对应。然而,为了易于讨论及例示,下面的示例假定树结构的每个中间节点与一个签名相对应。为了例示简便,所示出和例示的示例也示出仅具有少数层次且每个层次仅有少数节点的树。
(1)预建树结构
在针对少数参考内容间隔重复地搜索签名集合的应用中,预建部分树结构集合可能是有吸引力的。这种情况可能存在于以下应用中:仅对照少数参考内容片段检查许多测试内容流的标识的应用,或者使用仅根据少数参考视频/音频内容片段的校准信息对测试视频/音频内容的同步进行许多校正的应用。
可以用于构造预建部分树结构集合的一种方法选择多个参考签名间隔,对每个间隔构造树结构,记录表示每个树结构的数据,并构造可以用于指向每个树结构的数据的索引或其它查询机制。例如,索引可以包括关联的参考内容的标识以及每个分别的签名间隔在该参考内容内的对应位置。以上公开的技术可以用于获得并记录所需的位置信息。在使用时,通过索引访问参考内容及位置的特定选择的树结构。
(2)渐进式树结构
预建部分树结构的使用在需要针对许多不同参考内容间隔搜索签名集合的应用中通常不具吸引力。这种情况可能存在于以下应用中:必须对照许多参考内容片段检查测试内容的标识的应用,或者使用根据许多参考视频/音频内容片段的校准信息对测试视频/音频内容的同步进行校正的应用。
可以用于在部分树结构使用时建立该部分树结构的一种方法通过使选择窗沿参考签名序列前进并更新树结构中的节点及链接以仅表示完全包含在所述选择窗内的那些参考签名集合,来以渐进的方式构造树结构。这里将选择窗内的签名称作选定签名。在任一点处由所述树结构表示的参考签名集合仅为其组成签名全部在选定签名组内的那些参考签名集合。
在一个示例性实现中,每个签名表示10毫秒的内容,每个签名集合包括200个签名,并且相邻签名集合起始于相互偏移一个签名的位置处。选择窗为500个签名长,并以分别为一个签名长的一系列步前进。在该特定实现中,选择窗的每个位置的树结构包括表示301个签名集合的节点及链接。当使选择窗前进一个签名时,将选定签名组中最旧的签名从该组中去除,并将新签名添加到该组。通过将所有与该最旧签名相对应的节点以及与包括该最旧签名的签名集合相对应的链接去除,并且通过添加表示新签名的节点以及表示包括该新签名的签名集合的链接,来修改树结构。
图10A至图12C中示出了类似实现的简单示例。在该示例中,签名S1至S12包括具有下列值的数据元素:
S1=1    S4=4    S7=7    S10=7
S2=2    S5=5    S8=8    S11=11
S3=1    S6=1    S9=1    S12=12
一些签名被赋予相同的值,因此可以示出压缩节点。
参照图10A,选择窗W定义包括签名S1至S7的选定签名组。这些签名组成一组签名集合SS1至SS5。每个签名集合包括三个签名。图10B中所示的树结构包括表示这五个签名集合的节点及链接。针对每个链接的搜索准则由出现在该链接的较低端处的节点中的数字表示。例如,针对根节点N0与节点N1之间的链接的搜索准则为1,如由出现在节点N1中的数字示出的。针对节点N1与节点N11之间的链接的搜索准则为2,并且针对节点N11与节点N111之间的链接的搜索准则为1。
针对沿从根节点至叶节点的路径的链接的搜索准则表示构成该叶节点的签名集合的签名值序列。例如,叶节点N111表示签名集合SS1,签名集合SS1的组成签名值1-2-1与沿从根节点至该叶节点的路径所遇到的链接准则序列相对应。
叶节点N121表示签名集合SS2,签名集合SS2的组成签名S3、S4及S5的值分别为1、4、5。针对从根节点N0至节点N1的链接的搜索准则等于1;因此,该节点位于沿到表示签名集合SS1及SS2的叶节点N111及N121的路径。其它叶节点N211、N311及N411分别表示签名集合SS3、SS4及SS5。
该示例中的每个叶节点终止其中一个或更多个中间节点仅具有一个后代的路径。这些中间节点可以由压缩节点表示,如上文所解释的。这在图10C中示出。压缩节点X11表示节点N11及N111。压缩节点X2表示节点N2、N21及N211。压缩节点X3表示节点N3、N31及N311。压缩节点X4表示节点N4、N41及N411。针对由压缩节点表示的节点的链接准则由出现在该压缩节点中的符号示出。例如,出现在节点X2中的符号“2.1.4”表示沿从根节点N0至叶节点N211的路径所遇到的系列链接准则2-1-4。
图10C中示出的树结构表示包括由图10A中示出的选择窗W选定的签名组的签名集合。
如图11A所示,在使选择窗W前进一个签名之后,选择窗定义包括签名S2至S8的选定签名组。将签名S1从选定签名组中去除并添加签名S8。经修改的选定签名组构成不同的签名集合SS2至SS6的集。通过修改图10B或图10C中示出的树结构来以渐进方式构造表示新的签名集合的集的树结构。这可以通过去除所有表示签名S1的单独节点并添加表示签名S8的节点来完成。如果树包含压缩节点,则必须修改所有包括签名S1的表示的压缩节点。结果在图11B中示出。图11C中示出具有压缩节点的对应树。对于该特定示例,仅需要修改图11B中的节点N1下的节点。这对应于如图11C中所示的节点N1下的压缩节点的修改。参照图11C,压缩节点“4.5”替代前面的压缩节点“2.1”,并且添加新压缩节点“7.8”。
图12A至图12C中所示的图示出在使选择窗W前进以包括签名S6至S12之后存在的情况。图12B中所例示的树结构示出共享两个中间节点之间的公共路径的两个叶节点N111及N112。图12C中示出了对应的压缩节点X1。与图中所示的其它压缩节点不同的是,该压缩节点不包括叶节点。
这些图示出当使选择窗沿签名序列前进时以渐进方式建立并修改的树结构。如果使用压缩节点,则可能需要修改一个或更多个压缩节点以反映由树表示的签名集合的改变。如果从选定签名组中去除签名将节点的后代的数量减少到仅一个,则修改现有的压缩节点以包括该节点或者创建新压缩节点以表示该节点。修改后,如果两个或更多个压缩节点位于沿同一路径并且彼此相邻,则可以将那些压缩节点合并成单个压缩节点。如果对选定签名组添加签名将节点的后代的数量增加到多于一个,则修改现有的压缩节点以排除该节点,或者删除现有的压缩节点并单独地表示组成节点。修改压缩节点的最终结果可以是沿同一路径的被一个或更多个独立节点相互分隔的两个或更多个压缩节点。
树结构的渐进式构造的一种方法包括:
(1)使选择窗沿参考签名序列前进以定义选择参考签名组;
(2)标识参考签名序列中作为使选择窗前进的结果而新落在选择窗内的新参考签名;
(3)将新参考签名添加到选择参考签名组;
(4)对参考签名集合的集添加新参考签名集合,该新参考签名集合包括选择参考签名组中以该新参考签名结尾的一系列参考签名;
(5)对树结构添加包括新叶节点的一个或更多个新节点及一个或更多个新链接,其中新叶节点与新参考签名集合相对应,并且所述一个或更多个新链接将树结构中的其它节点连接到所述一个或更多个新节点;
(6)标识参考签名序列中作为使选择窗前进的结果而新落在选择窗外的旧参考签名;
(7)将旧参考签名从选择参考签名组中去除;
(8)从参考签名集合的集中去除旧参考签名集合,该旧参考签名集合包括以旧参考签名起始的一系列参考签名;以及
(9)从树结构中去除包括旧叶节点的一个或更多个旧节点及一个或更多个旧链接,其中旧叶节点与旧参考签名集合相对应,并且所述一个或更多个旧链接将树结构中的其它节点连接到所述一个或更多个旧节点。
树的渐进式构造的另选方法是可行的。例如,可以使选择窗前进表示两个或更多个签名的量、超过签名集合的长度的量、或超过选择窗的长度的量。如果需要,可以改变该量。
D.实现
可以以多种方式实现包括本发明的各个方面的设备,包括由计算机或包括连接到与在通用计算机中存在的那些部件相似的部件的更专用的部件(例如,数字信号处理器(DSP)电路)的一些其它设备执行的软件。图13是可以用于实现本发明的方面的设备70的示意框图。处理器72提供计算资源。RAM 73是处理器72用于处理的系统随机存取存储器(RAM)。ROM 74表示用于存储操作设备70所需的程序并可能用于执行本发明的各个方面的某种形式的永久存储(例如,只读存储器(ROM))。I/O控制75表示通过通信信道76、77接收并发送信号的接口电路。在所示的实施例中,所有主要的系统部件连接到可以表示多于一个物理总线或逻辑总线的总线71;然而,总线架构不是实现本发明所要求的。
在由通用计算机系统实现的实施例中,可以包括用于连接到诸如键盘或鼠标及显示器的设备、以及用于控制具有诸如磁带或磁盘、或光学介质的存储介质的存储设备78的附加部件。存储介质可以用于记录用于操作系统、应用程序的指令程序,还可以包括实现本发明的各个方面的程序。
可以利用以包括离散逻辑部件、集成电路、一个或更多个ASIC及/或程序控制处理器的多种方式实现的部件,来进行实践本发明的各个方面所需的功能。实现这些部件的方式对本发明并不重要。
本发明的软件实现可以利用多种机器可读介质(例如,包括从超声频率至紫外频率的频谱上的调制通信路径或基带)来传送,或者通过使用基本上任何记录技术(包括磁带、磁卡或磁盘、光卡或光盘、以及包括纸的介质上的可检测标记)传送信息的存储介质来传送。

Claims (18)

1.一种用于标识表示视觉或听觉刺激的测试内容的方法,所述方法包括:
(a)使选择窗沿参考签名序列前进等于一个或更多个参考签名的间隔,其中,所述参考签名表示参考内容片段序列,所述参考内容表示视觉或听觉刺激,其中,所述选择窗内的参考签名构成选择参考签名组;
(b)修改有根树结构中的节点及连接所述节点的链接,以反映参考签名集的集合中的参考签名集的改变成员关系,其中,所述参考签名集的集合中的每个参考签名集包括所述选择参考签名组内的一系列参考签名,所述有根树结构中的节点与所述一系列参考签名中的参考签名相关联,并且所述节点中的一些节点是均与相应的参考签名集相对应的叶节点,并且其中通过包括以下步骤的处理修改所述节点及链接:
标识所述参考签名序列中作为使所述选择窗前进的结果而新落
在所述选择窗内的新参考签名;
将所述新参考签名添加到所述选择参考签名组;
对所述参考签名集的集合添加新参考签名集,其中,所述新参考签名集包括所述选择参考签名组中以所述新参考签名结尾的一系列参考签名;
对所述有根树结构添加包括新叶节点的一个或更多个新节点以及一个或更多个新链接,其中,所述新叶节点与所述新参考签名集相对应,并且所述一个或更多个新链接将所述有根树结构中的其它节点连接到所述一个或更多个新节点;
标识所述参考签名序列中作为使所述选择窗前进的结果而新落在所述选择窗外的旧参考签名;
将所述旧参考签名从所述选择参考签名组中去除;
从所述参考签名集的集合中去除旧参考签名集,其中,所述旧参考签名集包括以所述旧参考签名开始的一系列参考签名;以及
从所述有根树结构中去除包括旧叶节点的一个或更多个旧节点以及一个或更多个旧链接,其中,所述旧叶节点与所述旧参考签名集相对应,并且所述一个或更多个旧链接将所述有根树结构中的其它节点连接到所述一个或更多个旧节点;
(c)获得包括表示所述测试内容的一系列片段的一系列测试签名的测试签名集;
(d)遍历有根树结构中的连接所述节点的所述链接,以确定所述有根树结构中是否存在匹配叶节点,所述匹配叶节点与参考签名集相对应并且提供超过阈值的与所述测试签名集的相似水平;以及
(e)生成指示所述有根树结构中是否存在匹配节点的匹配状态信号。
2.根据权利要求1所述的方法,包括:获得与所述匹配叶节点相关联的、标识在所述参考内容片段序列内的对应位置的参考位置信息。
3.根据权利要求2所述的方法,其中,所述参考位置信息指定在所述参考签名序列中的对应位置。
4.根据权利要求3所述的方法,其中,在所述参考签名序列中的所述对应位置是指定签名在构成由所述匹配叶节点表示的参考签名集的一系列签名中的位置。
5.根据权利要求2到4中任一个所述的方法,包括:
获得与所述测试签名集相关联的、标识在测试内容片段序列内的对应位置的测试位置信息;
导出由所述参考位置信息标识的位置与所述测试位置信息标识的位置之间的偏移;以及
生成表示所述偏移的信号。
6.一种用于构造在标识表示视觉或听觉刺激的内容时使用的树结构的方法,所述方法包括:
(a)在表示参考内容片段序列的参考签名序列内的位置处建立选择窗,所述参考内容表示视觉或听觉刺激,其中,所述选择窗内的参考签名构成表示所述参考内容的部分的选择参考签名组;
(b)构造包括根、多个节点及连接所述节点的多个链接的有根树结构,以反映参考签名集的集合中的参考签名集的成员关系,其中,所述参考签名集的集合中的每一个参考签名集包括所述选择参考签名组内的一系列参考签名,所述有根树结构中的所述节点与所述一系列参考签名中的参考签名相关联,并且所述节点中的一些节点是均与相应的参考签名集相对应的叶节点;
(c)记录表示所述有根树结构中的所述根、所述节点以及所述链接的数据结构;
(d)记录表示所述选择窗在所述参考签名序列内的位置并指向所述数据结构的位置索引;以及
(e)重复步骤(a)到(d),以针对所述参考内容的不同部分的多个选择窗位置构造多个有根树结构,并记录表示所述多个有根树结构及所述多个选择窗位置的相应的数据结构及位置索引,其中:
对步骤(a)的重复通过使所述选择窗沿所述参考签名序列前进小于所述选择窗的长度的间隔来建立多个选择窗位置,使得相邻位置的选择窗彼此交叠;并且
对步骤(b)的重复包括:
标识所述参考签名序列中作为使所述选择窗前进的结果而新落在所述选择窗内的新参考签名;
将所述新参考签名添加到所述选择参考签名组;
对所述参考签名集的集合添加新参考签名集,其中,所述新参考签名集包括所述选择参考签名组中以所述新参考签名结尾的一系列参考签名;
对所述有根树结构添加包括新叶节点的一个或更多个新节点以及一个或更多个新链接,其中,所述新叶节点与所述新参考签名集相对应,并且所述一个或更多个新链接将所述有根树结构中的其它节点连接到所述一个或更多个新节点;
标识所述参考签名序列中作为使所述选择窗前进的结果而新落在所述选择窗外的旧参考签名;
将所述旧参考签名从所述选择参考签名组中去除;
从所述参考签名集的集合中去除旧参考签名集,其中,所述旧参考签名集包括以所述旧参考签名开始的一系列参考签名;以及
从所述有根树结构中去除包括旧叶节点的一个或更多个旧节点以及一个或更多个旧链接,其中,所述旧叶节点与所述旧参考签名集相对应,并且所述一个或更多个旧链接将所述有根树结构中的其它节点连接到所述一个或更多个旧节点。
7.根据权利要求6所述的方法,包括:记录每一个叶节点的标识在所述参考内容片段序列内的对应位置的参考位置信息。
8.根据权利要求7所述的方法,其中,所述参考位置信息指定在所述参考签名序列中的对应位置。
9.根据权利要求8所述的方法,其中,在所述参考签名序列中的所述对应位置是指定签名在构成由相应叶节点表示的参考签名集的一系列签名中的位置。
10.一种用于标识表示视觉或听觉刺激的测试内容的设备,所述设备包括:
用于使选择窗沿参考签名序列前进等于一个或更多个参考签名的间隔的装置,其中,所述参考签名表示参考内容片段序列,所述参考内容表示视觉或听觉刺激,其中,所述选择窗内的参考签名构成选择参考签名组;用于修改有根树结构中的节点及连接所述节点的链接的装置,用于反映参考签名集的集合中的参考签名集的改变成员关系,其中,所述参考签名集的集合中的每个参考签名集包括所述选择参考签名组内的一系列参考签名,所述有根树结构中的节点与所述一系列参考签名中的参考签名相关联,并且所述节点中的一些节点是均与相应的参考签名集相对应的叶节点,并且其中通过包括以下步骤的处理修改所述节点及链接:
标识所述参考签名序列中作为使所述选择窗前进的结果而新落在所述选择窗内的新参考签名;
将所述新参考签名添加到所述选择参考签名组;
对所述参考签名集的集合添加新参考签名集,其中,所述新参考签名集包括所述选择参考签名组中以所述新参考签名结尾的一系列参考签名;
对所述有根树结构添加包括新叶节点的一个或更多个新节点以及一个或更多个新链接,其中,所述新叶节点与所述新参考签名集相对应,并且所述一个或更多个新链接将所述有根树结构中的其它节点连接到所述一个或更多个新节点;
标识所述参考签名序列中作为使所述选择窗前进的结果而新落在所述选择窗外的旧参考签名;
将所述旧参考签名从所述选择参考签名组中去除;
从所述参考签名集的集合中去除旧参考签名集,其中,所述旧参考签名集包括以所述旧参考签名开始的一系列参考签名;以及
从所述有根树结构中去除包括旧叶节点的一个或更多个旧节点以及一个或更多个旧链接,其中,所述旧叶节点与所述旧参考签名集相对应,并且所述一个或更多个旧链接将所述有根树结构中的其它节点连接到所述一个或更多个旧节点;
用于获得包括表示所述测试内容的一系列片段的一系列测试签名的测试签名集的装置;
用于遍历有根树结构中的连接所述节点的所述链接的装置,用于确定所述有根树结构中是否存在匹配叶节点,所述匹配叶节点与参考签名集相对应并且提供超过阈值的与所述测试签名集的相似水平;以及
用于生成匹配状态信号的装置,所述匹配状态信号指示所述有根树结构中是否存在匹配节点。
11.根据权利要求10所述的设备,其包括:用于获得与所述匹配叶节点相关联的、标识在所述参考内容片段序列内的对应位置的参考位置信息的装置。
12.根据权利要求11所述的设备,其中,所述参考位置信息指定在所述参考签名序列中的对应位置。
13.根据权利要求12所述的设备,其中,在所述参考签名序列中的所述对应位置是指定签名在构成由所述匹配叶节点表示的参考签名集的一系列签名中的位置。
14.根据权利要求11到13中任一个所述的设备,其包括:
用于获得与所述测试签名集相关联的、标识在测试内容片段序列内的对应位置的测试位置信息的装置;
用于导出由所述参考位置信息标识的位置与所述测试位置信息标识的位置之间的偏移的装置;以及
用于生成表示所述偏移的信号的装置。
15.一种用于构造在标识表示视觉或听觉刺激的内容时使用的树结构的设备,所述设备包括:
用于在表示参考内容片段序列的参考签名序列内的位置处建立选择窗的装置,所述参考内容表示视觉或听觉刺激,其中,所述选择窗内的参考签名构成表示所述参考内容的部分的选择参考签名组;
用于构造包括根、多个节点及连接所述节点的多个链接的有根树结构的装置,用于反映参考签名集的集合中的参考签名集的成员关系,其中,所述参考签名集的集合中的每一个参考签名集包括所述选择参考签名组内的一系列参考签名,所述有根树结构中的所述节点与所述一系列参考签名中的参考签名相关联,并且所述节点中的一些节点是均与相应的参考签名集相对应的叶节点;
用于记录表示所述有根树结构中的所述根、所述节点以及所述链接的数据结构的装置;
用于记录表示所述选择窗在所述参考签名序列内的位置并指向所述数据结构的位置索引的装置;以及
用于重复前述装置的操作的装置,针对所述参考内容的不同部分的多个选择窗位置构造多个有根树结构,并记录表示所述多个有根树结构及所述多个选择窗位置的相应的数据结构及位置索引,其中:
对所述用于建立选择窗的装置的操作的重复通过使所述选择窗沿所述参考签名序列前进小于所述选择窗的长度的间隔来建立多个选择窗位置,使得相邻位置的选择窗彼此交叠;并且
对所述用于构造有根树结构的装置的操作的重复包括:
标识所述参考签名序列中作为使所述选择窗前进的结果而新落在所述选择窗内的新参考签名;
将所述新参考签名添加到所述选择参考签名组;
对所述参考签名集的集合添加新参考签名集,其中,所述新参考签名集包括所述选择参考签名组中以所述新参考签名结尾的一系列参考签名;
对所述有根树结构添加包括新叶节点的一个或更多个新节点以及一个或更多个新链接,其中,所述新叶节点与所述新参考签名集相对应,并且所述一个或更多个新链接将所述有根树结构中的其它节点连接到所述一个或更多个新节点;
标识所述参考签名序列中作为使所述选择窗前进的结果而新落在所述选择窗外的旧参考签名;
将所述旧参考签名从所述选择参考签名组中去除;
从所述参考签名集的集合中去除旧参考签名集,其中,所述旧参考签名集包括以所述旧参考签名开始的一系列参考签名;以及
从所述有根树结构中去除包括旧叶节点的一个或更多个旧节点以及一个或更多个旧链接,其中,所述旧叶节点与所述旧参考签名集相对应,并且所述一个或更多个旧链接将所述有根树结构中的其它节点连接到所述一个或更多个旧节点。
16.根据权利要求15所述的设备,其包括:用于记录每一个叶节点的标识在所述参考内容片段序列内的对应位置的参考位置信息的装置。
17.根据权利要求16所述的设备,其中,所述参考位置信息指定在所述参考签名序列中的对应位置。
18.根据权利要求17所述的设备,其中,在所述参考签名序列中的所述对应位置是指定签名在构成由相应叶节点表示的参考签名集的一系列签名中的位置。
CN2008800220076A 2007-06-27 2008-06-20 具有标识多媒体内容的签名指针的搜索树的渐进式构造 Expired - Fee Related CN101743512B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US93732007P 2007-06-27 2007-06-27
US60/937,320 2007-06-27
PCT/US2008/007686 WO2009005602A2 (en) 2007-06-27 2008-06-20 Incremental construction of search tree with signature pointers for identification of multimedia content

Publications (2)

Publication Number Publication Date
CN101743512A CN101743512A (zh) 2010-06-16
CN101743512B true CN101743512B (zh) 2012-09-05

Family

ID=40226712

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008800220076A Expired - Fee Related CN101743512B (zh) 2007-06-27 2008-06-20 具有标识多媒体内容的签名指针的搜索树的渐进式构造

Country Status (5)

Country Link
US (1) US8312051B2 (zh)
EP (1) EP2171615A2 (zh)
JP (1) JP5241832B2 (zh)
CN (1) CN101743512B (zh)
WO (1) WO2009005602A2 (zh)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9009199B2 (en) * 2006-06-06 2015-04-14 Haskolinn I Reykjavik Data mining using an index tree created by recursive projection of data points on random lines
US8458737B2 (en) 2007-05-02 2013-06-04 The Nielsen Company (Us), Llc Methods and apparatus for generating signatures
US8600531B2 (en) * 2008-03-05 2013-12-03 The Nielsen Company (Us), Llc Methods and apparatus for generating signatures
US8571255B2 (en) 2009-01-07 2013-10-29 Dolby Laboratories Licensing Corporation Scalable media fingerprint extraction
US20110066944A1 (en) 2009-09-14 2011-03-17 Barton James M Multifunction Multimedia Device
US8549398B2 (en) 2009-09-17 2013-10-01 International Business Machines Corporation Method and system for handling non-presence of elements or attributes in semi-structured data
KR101777347B1 (ko) * 2009-11-13 2017-09-11 삼성전자주식회사 부분화에 기초한 적응적인 스트리밍 방법 및 장치
US8682145B2 (en) 2009-12-04 2014-03-25 Tivo Inc. Recording system based on multimedia content fingerprints
US8463797B2 (en) * 2010-07-20 2013-06-11 Barracuda Networks Inc. Method for measuring similarity of diverse binary objects comprising bit patterns
KR101110202B1 (ko) * 2010-08-02 2012-02-16 (주)엔써즈 동영상 데이터들의 상호 관계에 기초한 데이터베이스 형성 방법 및 데이터베이스 형성 시스템
US9113202B1 (en) * 2011-09-21 2015-08-18 Google Inc. Inverted client-side fingerprinting and matching
FR2983600B1 (fr) * 2011-12-01 2014-02-07 Airbus Operations Sas Procede et systeme de surveillance d'une interface graphique dans un cockpit d'aeronef
HUE041294T2 (hu) * 2011-12-16 2019-05-28 Poseida Therapeutics Inc TRPC4 modulátorok a fájdalom kezelésére vagy megelõzésére
US9202255B2 (en) * 2012-04-18 2015-12-01 Dolby Laboratories Licensing Corporation Identifying multimedia objects based on multimedia fingerprint
JP5696132B2 (ja) * 2012-12-25 2015-04-08 日本電信電話株式会社 部分的木構造に応じた適応型再構成装置及び方法及びプログラム
US9871606B1 (en) 2013-05-13 2018-01-16 Twitter, Inc. Identification of concurrently broadcast time-based media
US9336227B2 (en) * 2013-10-07 2016-05-10 Sap Se Selective synchronization in a hierarchical folder structure
US9323865B2 (en) * 2013-12-24 2016-04-26 TCL Research America Inc. Content alignment method and system
US10303800B2 (en) * 2014-03-04 2019-05-28 Interactive Intelligence Group, Inc. System and method for optimization of audio fingerprint search
KR102244135B1 (ko) * 2014-09-05 2021-04-23 삼성전자주식회사 모듈로 스케줄링 방법 및 장치
US9516377B1 (en) * 2015-06-12 2016-12-06 Sorenson Media, Inc. Detecting channel change in automatic content recognition fingerprint matching
GB2547249B (en) * 2016-02-12 2019-09-11 Advanced Risc Mach Ltd An apparatus and method for generating signed bounded pointers
US10909173B2 (en) * 2016-12-09 2021-02-02 The Nielsen Company (Us), Llc Scalable architectures for reference signature matching and updating
US10970193B2 (en) 2018-05-23 2021-04-06 Dropbox, Inc. Debugging a client synchronization service
US10747643B2 (en) * 2018-05-23 2020-08-18 Dropbox, Inc. System for debugging a client synchronization service
US11648621B2 (en) 2018-11-02 2023-05-16 Illinois Tool Works Inc. Systems and methods to design part weld processes using media libraries
IL295561A (en) * 2020-02-27 2022-10-01 Ssimwave Inc Real-time latency measurement of video streams
CN112347272B (zh) * 2020-09-18 2023-03-10 国家计算机网络与信息安全管理中心 一种基于音视频动态特征的流式匹配方法和装置
CN113704539A (zh) * 2021-09-09 2021-11-26 北京跳悦智能科技有限公司 一种视频序列存储与搜索方法及系统、计算机设备
US11683561B2 (en) * 2021-10-29 2023-06-20 The Nielsen Company (Us), Llc Methods and apparatus to create candidate reference signatures from signature fragments
CN116662645A (zh) * 2023-04-28 2023-08-29 青岛尘元科技信息有限公司 视频事件溯源分析方法和系统、存储介质及电子设备

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3467415B2 (ja) * 1998-12-01 2003-11-17 日本電信電話株式会社 音楽検索装置,音楽検索方法および音楽検索プログラムを記録した記録媒体
JP3597735B2 (ja) 1999-10-12 2004-12-08 日本電信電話株式会社 音楽検索装置,音楽検索方法および音楽検索プログラムを記録した記録媒体
FR2824159B1 (fr) * 2001-04-30 2003-07-25 France Telecom Indexation dans une description de document multimedia
DE60302651T2 (de) * 2002-02-06 2006-08-10 Koninklijke Philips Electronics N.V. Schnelles hash-basiertes metadatenretrieval für multimediaobjekte
US9009199B2 (en) * 2006-06-06 2015-04-14 Haskolinn I Reykjavik Data mining using an index tree created by recursive projection of data points on random lines
US7823094B2 (en) * 2007-01-09 2010-10-26 International Business Machines Corporation Pseudo-string based pattern recognition in L3GO designs
US8245209B2 (en) * 2007-05-29 2012-08-14 International Business Machines Corporation Detecting dangling pointers and memory leaks within software

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Matthew L.Miller et al.Audio Fingerprinting:Nearest Neighbor Search in High Dimensional Binary Spaces.《Journal of VLSI Signal Processing》.2005,第41卷(第3期),第285-291页. *

Also Published As

Publication number Publication date
JP2010533322A (ja) 2010-10-21
EP2171615A2 (en) 2010-04-07
CN101743512A (zh) 2010-06-16
JP5241832B2 (ja) 2013-07-17
US20110022638A1 (en) 2011-01-27
WO2009005602A2 (en) 2009-01-08
US8312051B2 (en) 2012-11-13
WO2009005602A3 (en) 2009-05-22

Similar Documents

Publication Publication Date Title
CN101743512B (zh) 具有标识多媒体内容的签名指针的搜索树的渐进式构造
CN101821734B (zh) 时基媒体之间的匹配的检测和分类
Wei et al. Frame fusion for video copy detection
CN101887457B (zh) 基于内容的复制图像检测方法
CN100499824C (zh) 防止非字节对齐和/或位移位位置起始码仿效的方法和系统
CN102831214B (zh) 时间序列搜索引擎
CN109690529A (zh) 按事件将文档编译到时间线中
US20120114167A1 (en) Repeat clip identification in video data
CN101299217B (zh) 一种地图信息处理的方法、装置和系统
CN104102639B (zh) 基于文本分类的推广触发方法和装置
JP5845764B2 (ja) 情報処理装置及び情報処理プログラム
CN107748745B (zh) 一种企业名称关键字提取方法
MXPA02012251A (es) Metodo y aparato para administracion de compilacion de datos y conocimiento.
CN102314875A (zh) 一种音频文件的识别方法和装置
CN103294667A (zh) 通过水印进行同源图片追踪的方法及系统
CN103902697A (zh) 组合搜索方法、客户端和服务器
CN110222231B (zh) 一种视频片段的热度预测方法
CN106156164A (zh) 资源信息处理方法和装置
CN107911448A (zh) 一种内容推送方法及装置
CN107566906A (zh) 一种视频评论处理方法及装置
CN109885722A (zh) 基于自然语言处理的音乐推荐方法、装置、及计算机设备
CN102428464B (zh) 标记网络媒体设备上的搜寻内容项
CN101427572A (zh) 用于在mpeg视频流中构建完整图像所需的帧的动态确定的方法和装置
CN103955480A (zh) 一种用于确定用户所对应的目标对象信息的方法与设备
CN101655853A (zh) 建立模型的装置和方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120905

Termination date: 20170620