CN101896906B - 基于时间片段的提取和视频指纹的健壮性匹配 - Google Patents

基于时间片段的提取和视频指纹的健壮性匹配 Download PDF

Info

Publication number
CN101896906B
CN101896906B CN200880120751XA CN200880120751A CN101896906B CN 101896906 B CN101896906 B CN 101896906B CN 200880120751X A CN200880120751X A CN 200880120751XA CN 200880120751 A CN200880120751 A CN 200880120751A CN 101896906 B CN101896906 B CN 101896906B
Authority
CN
China
Prior art keywords
fragment
video
time
content
event
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200880120751XA
Other languages
English (en)
Other versions
CN101896906A (zh
Inventor
J·W·常
A·I·耐特塞夫
J·R·史密斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oriental concept Limited
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN101896906A publication Critical patent/CN101896906A/zh
Application granted granted Critical
Publication of CN101896906B publication Critical patent/CN101896906B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/48Matching video sequences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/35Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users
    • H04H60/37Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for identifying segments of broadcast information, e.g. scenes or extracting programme ID
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/56Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54
    • H04H60/59Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54 of video
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H2201/00Aspects of broadcast communication
    • H04H2201/90Aspects of broadcast communication characterised by the use of signatures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Television Signal Processing For Recording (AREA)
  • Storage Device Security (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种针对基于时间、事件的视频指纹法的计算机实现的方法、装置、和计算机程序产品代码。在一个实施例中,检测视频内容中的事件。所述视频内容包括多个视频帧。事件代表视频内容中的离散兴趣点。使用所述事件生成基于时间、事件的片段的集合。每个基于时间、事件的片段是覆盖事件集合的视频内容的片段。使用与每个基于时间、事件的片段相关的帧集合的基于内容的特征的时间跟踪,从每个基于时间、事件的片段导出时间序列信号。根据每个基于时间、事件的片段的时间序列信号提取基于时间片段的指纹,以形成与所述视频内容相关的基于时间片段的指纹的集合。

Description

基于时间片段的提取和视频指纹的健壮性匹配
技术领域
概括地说,本发明涉及数据处理系统,具体地,涉及用于处理视频的方法和装置。更具体地,本发明涉及这样一种计算机实现的方法、装置、和计算机可用程序代码,用于为了近似复制品视频的识别和视频盗版的检测而进行基于片段的时间视频指纹的提取和健壮性匹配。
背景技术
随着在线数字内容的增加,越来越多的人们持续访问在线媒体,因此识别拥有版权的内容的需求不断增加。例如,拥有版权的音频和视频内容的所有者关注于识别和去除在社会网络和内容共享站点上其拥有版权的内容的未授权副本。社会网络和内容共享站点允许用户张贴例如音乐、照片、和视频的内容,用于网站的其他用户浏览。社会网络和内容共享站点包括但不限于
Figure GPA00001159347300011
这些社会网络和内容共享站点的用户频繁地利用盗版的电影、图像、和/或电视(TV)节目。
拥有版权的音频和视频内容的所有者关注于识别他们内容的授权的出现,以确保针对拥有版权的内容的每次出现都适当地补偿版权的所有者。例如,所有者可希望确保针对每次在无线电设备上播放特定歌曲时适当地支付报酬。
另一方面,广告主关注于监视他们的广告在例如电视、无线电设备、和/或因特网上的出现,以确保广告内容被广播适当次数。这些应用通常共享以下需求:用以从未知媒体、在线视频、无线电、和/或电视中识别已知拥有版权的数字媒体(例如音频和/或视频)的副本或近似复制品。
用于识别和保护拥有版权的内容的目前可用方案包括水印法(watermarking)和指纹法(fingerprinting)。水印法将可见的或不见的水印插入视频内容,由此识别内容的合法拥有者。水印法技术被设计为,使得水印被自动地传送至视频的任意精确副本以及传送至基于原始内容的水印部分创建的任意衍生内容。任意这样的副本或衍生作品(无论授权的或未授权的)可通过扫描嵌入在复制的或衍生视频内容中的水印的存在来识别。
然而,即使将水印设计为在不破坏视频内容自身的情况下难以去除,但是水印可能被挫败和去除。如果成功去除了水印,则视频内容变为永久解除锁定,并且经由水印将不再能够监视和/或检测未授权的复制品或衍生物。
由于水印的问题,另一方案(称为基于内容的指纹法和内容匹配法)近来获得了发展,因为基于内容的指纹法不依赖于在视频内容中任何水印的存在。通过这个方案,内容的整个部分被看作“伪水印”,并且被概括成表征内容的唯一音频-视觉方面的一个或多个唯一指纹。为了识别内容的两个部分是否为彼此的副本或衍生物,将内容的两个部分的基于内容的指纹相比较。如果基于内容的指纹足够相似,则说明内容的两个部分是副本、近似复制品、或衍生物。
基于内容的视频指纹法包括基于音频的指纹方法,这唯一地表征视频中的音轨或语音。基于内容的指纹法还基于从视频中对关键帧的提取,以及使用他们的视觉特征来创建基于视觉关键帧的指纹。然后,使用这些基于帧的指纹的集来描述每个视频。实质上,基于帧的视频特征可以是全局的或局部的。换句话说,可以从整个帧或从帧的一个或多个区域来提取基于帧的视频特征。
基于内容的指纹法通常需要对于许多共同编辑操作和图像/视频处理转换不变的相似指纹。共同编辑操作包括但不限于,剪切、接合、和/或重新排序。图像/视频处理转换包括但不限于,剪辑、缩放、纵横比改变、视频重新捕获或重新压缩、全局照明改变、色彩空间转变、褪色、数据损坏和加入噪音。
对于在视频副本中观察到的虚假视频转换的情况,目前可用的基于内容的指纹法方案具有不同程度的成功,除了健壮的基于帧的指纹法技术之外,主要是由于指纹的成功匹配需要复杂的帧排列的事实。基于帧的指纹法技术对于大多数转换不变。
在存在帧排列问题和丢失或不正确取样的帧时,基于内容的指纹法变得不精确和不可靠。充分改变帧的视频出现的任意图像处理转换也可能挫败基于帧的匹配方案。换句话说,目前的基于内容的指纹法典型地不能够检测视频取样经过了编辑操作的副本和衍生视频内容。
发明内容
所示实施例提供了一种针对基于时间、事件的视频指纹法的计算机实现的方法、装置、和计算机程序产品代码。在一个实施例中,检测视频内容中的事件。所述视频内容包括多个视频帧。事件代表视频内容中的离散兴趣点。使用所述事件生成基于时间、事件的片段的集合。每个基于时间、事件的片段是覆盖事件集合的视频内容的片段。使用与每个基于时间、事件的片段相关的帧集合的基于内容的特征的时间跟踪,从每个基于时间、事件的片段导出时间序列信号。根据每个基于时间、事件的片段的时间序列信号提取基于时间片段的指纹,以形成与所述视频内容相关的基于时间片段的指纹的集合。
附图说明
在所附权利要求中阐述了本发明的认为是新颖性特征的特性。然而,当结合附图阅读时,通过参照示例性实施例的以下具体实施方式,本发明自身及其具体实施方式将被最佳地理解,其中:
图1是可实现示例性实施例的数据处理系统的网络的图形表示;
图2是根据本发明示例性实施例的数据处理系统的视图;
图3是示出根据示例性实施例的针对测试视频生成基于片段的时间指纹以及与指纹的参考数据库相匹配的框图;
图4是示出根据示例性实施例的针对拥有版权的内容生成基于时间片段的指纹的参考数据库的框图;
图5是示出根据示例性实施例的基于片段的时间指纹生成器的框图;
图6是示出根据示例性实施例的指纹提取处理的视图;
图7是根据示例性实施例的指纹匹配引擎的框图;
图8是示出根据示例性实施例的匹配处理的框图;
图9是示出根据示例性实施例的提取基于片段的时间指纹的处理的流程图;以及
图10是示出根据示例性实施例的使用基于时间片段的指纹确定测试片段是否匹配于参考视频的处理的流程图。
具体实施方式
现在参照附图,具体地参照图1-2,提供了可实现本发明实施例的数据处理环境的示例性示图。可以理解,图1-2仅是示例性的,并没有确定或暗示对于可实现本发明各个方面和实施例的环境的限制。在不脱离本发明的精神和范围的情况下,可以对于所述的环境进行许多修改。
图1示出在其中可实现示例性实施例的数据处理系统的网络的图形表示。网络数据处理系统100是在其中可实现示例性实施例的计算机网络。网络数据处理系统100包含网络102,其是用于在网络数据处理系统100中连接在一起的各个设备和计算机之间提供通信链路的介质。网络102可包括连接,例如电线、无线通信链路、或光缆。
在所示实例中,服务器104和服务器106与存储单元108一起连接至网络102。此外,客户端110、112和114连接至网络102。客户端110、112和114可以是例如个人计算机或网络计算机。在所示实例中,服务器104向客户端110、112和114提供数据,例如引导文件、操作系统图像和应用。在这个实例中,客户端110、112和114是服务器104的客户端。网络数据处理系统100可包括没有示出的附加服务器、客户端和其它设备。
在所示实例中,网络数据处理系统100是具有网络102的互联网,所述网络102代表使用传输控制协议/互联网协议(TCP/IP)的协议族彼此通信的在世界范围内的网络和网关的集合。在互联网的中心是主节点或主机之间的高速数据通信线路的骨干,包括路由数据和消息的成千上万个商业、政府、教育和其它计算机系统。当然,网络数据处理系统100也可以作为多个不同类型的网络(例如内联网、局域网(LAN)或广域网(WAN))实现。图1仅用作实例,并非是不同示例性实施例的架构限制。
现在转到图2,示出在其中可实现示例性实施例的数据处理系统的框图。数据处理系统200是计算机(例如图1中的服务器104或客户端110)的实例,其中可设置有用于示例性实施例的实现处理的计算机可用程序代码或指令。在这个示例性实例中,数据处理系统200包括通信组织202,其提供在处理器单元204、存储器206、持久存储设备208、通信单元210、输入/输出(I/O)单元212和显示器214之间的通信。
处理器单元204用于执行可加载到存储器206中的软件的指令。根据特定实施方式,处理器单元204可以是一个或多个处理器的集合,或可以是多处理器核。此外,处理器单元204可以使用一个或多个异构处理器系统实现,在所述系统中在一个芯片上存在主处理器和辅助处理器。作为另一示例性实例,处理器单元204可以是包含相同类型的多个处理器的对称多处理器系统。
在这些实例中,存储器206可以是例如随机访问存储器或任意其它适合的易失性或非易失性存储设备。根据特定实施方式,持久存储设备208可采用不同类型。例如,持久存储设备208可包含一个或多个组件或设备。例如,持久存储设备208可以是硬件驱动器、闪存、可重写光盘、可重写磁带、或上述的某些组合。由持久存储设备208使用的介质也可以是可拆卸的。例如,对于持久存储设备208可使用可拆卸硬盘驱动器。
在这些实例中,通信单元210提供与其它数据处理系统或设备的通信。在这些实例中,通信单元210是网络接口卡。通信单元210可通过使用物理和无线通信链路中的一个或两者提供通信。
输入/输出单元212允许与连接至数据处理系统200的其它设备输入和输出数据。例如,输入/输出单元212可通过键盘和鼠标提供用户输入的连接。此外,输入/输出单元212可向打印机发送输出。显示器214提供向用户显示信息的机构。
用于操作系统和应用或程序的指令位于持久存储设备208上。可将这些指令加载到存储器206中,用于由处理器单元204执行。可使用位于存储器(例如存储器206)中的计算机执行指令通过处理器单元204执行不同实施例的处理。这些指令称为可通过处理器单元204中的处理器读取和执行的程序代码、计算机可用程序代码、或计算机可读程序代码。可以在不同的物理或有形计算机可读介质(例如存储器206或持久存储设备208)上实现在不同实施例中的程序代码。
程序代码216以函数形式位于计算机可读介质218上,并且可加载或传送到数据处理系统200,用于由处理器单元204执行。在这些实例中,程序代码216和计算机可读介质218形成计算机程序产品220。在一个实例中,计算机可读介质218可以是有形形式,例如插入或位于驱动器或其它设备(作为持久存储设备208的一部分)中用于向存储设备(例如作为持久存储设备208的一部分的硬盘驱动器)传送的光盘或磁盘。在有形形式中,计算机可读介质218也可以采用永久存储器的形式(例如与数据处理系统200连接的硬盘驱动器或闪存)。计算机可读介质218的有形形式还称为计算机可记录存储介质。在某些实例中,计算机可读介质218可能不是可拆卸的。
可选地,可通过与通信单元210的通信链路和/或通过与输入/输出单元212的连接从计算机可读介质218向数据处理系统200传送程序代码216。在示例性实例中,通信链路和/或连接可以是物理的或无线的。计算机可读介质也可以采用非有形介质的形式,例如包含程序代码的通信链路或无线传输。
对于数据处理系统200所示的不同组件不意味着对于可实现不同实施例的方式的架构限制。不同的示例性实施例可以在包括除了对于数据处理系统200所示的实例之外的或代替那些实例的数据处理系统中实现。根据所示的示例性实例,在图2中所示的其它组件可以改变。
作为一个实例,数据处理系统200中的存储设备是可存储数据的任意硬件装置。存储器206、持久存储设备208和计算机可读介质218是有形形式的存储设备的实例。
在另一实例中,可使用总线系统实现通信组织202,并且可包括一个或多个总线(例如系统总线或输入/输出总线)。当然,可使用在与总线系统连接的不同组件或设备之间提供数据传输的任意适合类型架构来实现总线系统。此外,通信单元可包括用于发送和接收数据的一个或多个设备(例如调制解调器或网络适配器)。此外,存储器可以是例如存储器206或高速缓存,例如在通信组织202中的接口和存储器控制集线器中。
随着因特网上内容共享的扩散,逐渐需要改进作为拥有版权的素材的副本或衍生物的视频内容的识别,以及需要改进视频盗版的检测。目前,可在视频内容中插入水印,以便于副本和衍生物的识别。尽管将水印设计为在不破坏视频内容自身的情况下难以去除,但是能够从视频内容挫败和去除水印。当成功去除水印时,视频内容变为永久解除锁定,并且经由水印将不再能够监视和/或检测未授权的复制品或衍生物。
在另一方案中,使用基于视觉、内容的指纹法来识别拥有版权的内容。然而,在存在帧排列问题以及丢失或不正确取样的帧时,目前的基于视觉、内容的指纹法变得不精确和不可靠。此外,充分改变帧的视觉出现的任意图像处理转换也可能挫败现有技术的基于视觉、内容的指纹法和基于帧的匹配方法。
此外,示例性实施例认识到,因为基于音频的指纹法不能够识别具有相同视觉但修改了音轨的视频复制品(例如具有不同声轨的电影),所以现有技术的基于音频内容的指纹法并不胜任。考虑到传统方法和结构的先前和其他示例性问题、缺陷、和不足,为了健壮的视频盗版检测的目的,示例性实施例提供了一种方法和装置,用于基于时间片段(temporalsegment)的视频指纹的提取,以及基于测试视频的时间片段的指纹与基于参考时间片段的视频指纹的匹配。
在一个实施例中,该处理检测视频内容中的事件。视频内容包括多个视频帧。视频帧可选地伴随有相应音轨。视频内容可以是测试视频,其被测试以确定视频内容是否为已知拥有版权的视频的副本或衍生物。视频内容还可以是已知的、拥有版权的视频内容。
事件代表视频内容中的离散兴趣点。事件可以是音频状态的明显改变、视觉内容的改变、或视频的语义内容的改变。例如,事件可以是视频中的人或物的出现、场景改变、或说话者改变。
根据视频中的事件的自动检测生成基于时间、事件的片段的集合。所述集合包括一个或多个基于时间、事件的片段的集合。每个基于时间、事件的片段贯穿一个或多个事件的集合。
根据与每个基于时间、事件的片段中的帧排序序列相关的基于内容的特征的时间跟踪(temporal tracking)从每个片段导出时间序列信号。基于内容的特征是音频特征或视觉特征。基于内容的特征可完全包括视觉特征、完全包括音频特征、或音频特征和视觉特征的组合。提取概括和近似每个基于时间、事件的片段的时间序列信号的片段指纹,以形成与视频内容相关的基于时间片段的指纹的集合。
使用基于时间片段的指纹的集合来确定第一视频剪辑的一部分是否为与第二视频剪辑相同的原始内容的副本或衍生物。该处理将针对第一视频剪辑的基于时间片段的指纹与针对第二视频剪辑生成的基于时间片段的指纹相比较。基于在与第一视频剪辑相关的基于时间片段的指纹以及与第二视频剪辑相关的基于时间片段的指纹之间的相似性测量来识别匹配的基于事件的片段,以形成匹配片段。
收集在第一视频剪辑以及第二视频剪辑之间的所有匹配片段,以形成匹配片段的集合。匹配片段的集合可包括基于事件的片段的一个匹配对,或片段的两个或更多个匹配对。从匹配片段的集合选择生成良好线性拟合的匹配片段的子集。
在生成良好线性拟合的匹配片段的子集中,基于所选的匹配片段的不重叠期间识别针对第一视频剪辑以及第二视频剪辑的总视频匹配分数。使用总视频匹配分数做出关于第一视频剪辑是否为第二视频剪辑的近似复制品的确定。
图3是示出根据示例性实施例的针对测试视频生成基于片段的时间指纹以及与指纹的参考数据库相匹配的框图。计算机300在任意通用计算设备中实现,包括但不限于,图1中的服务器106或客户端110、和图2中的数据处理系统200。
基于时间片段的指纹生成器302是针对视频内容生成基于时间片段的指纹的软件组件。视频内容可以是测试视频304或已知拥有版权的内容。基于时间片段的指纹生成器302将基于内容的特征与测试视频304的唯一时间签名相组合,以生成基于时间片段的指纹。
在该实例中,测试视频304是根据已知拥有版权的内容正在被测试的视频内容,以确定测试视频304是否为拥有版权的内容的副本或从拥有版权的内容导出。测试视频304包括多个视频帧。视频帧还可选地伴随有音轨。换句话说,测试视频304可以仅是视频,或音频和视频的组合。
测试视频源306是正在被测试或与已知拥有版权的内容相比较的视频内容的源,以确定测试视频304是否为拥有版权的内容的副本或衍生物。测试视频源306可以是视频内容的在线源或离线源。例如,测试视频源306可包括但不限于,电视节目、网站上的商业视频和/或音频内容、或任意其他源。网站的实例包括但不限于
Figure GPA00001159347300091
基于时间片段的指纹生成器302检测测试视频304中的事件,形成在事件边界排列的片段,针对每个片段提取基于内容的描述符的时间轨迹(temporal trace),以及针对测试视频304生成基于测试视频的时间片段的指纹312。在该实施例中,将基于测试视频的时间片段的指纹312形成为概括每个视频片段的视觉和/或音频特征的时间轨迹的数字有序序列。在不变的事件边界排列片段减少了由于视频内容的编辑或更改可能发生的任意帧排列问题。基于时间片段的指纹生成器302生成针对测试视频304的基于测试视频的时间片段的指纹以及针对拥有版权的视频内容的基于拥有版权的内容的时间片段的指纹316。在该实例中,将基于拥有版权的内容的时间片段的指纹316永久地存储在数据存储器310中,而基于测试视频的时间片段的指纹312被即时生成,并仅用于匹配和视频副本识别目的而无需存留。然而,基于测试视频的时间片段的指纹也可被生成和存储在数据存储器310中,用于在离线匹配处理中与基于拥有版权的内容的时间片段的指纹316匹配,而不是在线地生成基于测试视频的时间片段的指纹312。
数据存储器310是用于存储数据的设备。数据存储器310可实现为硬盘驱动器、闪速存储器、主存储器、只读存储器(ROM)、随机存取存储器(RAM)、非易失性随机存取存储器(NVRAM)、或任意其他类型的数据存储设备。数据存储器310可以在一个数据存储设备或多个数据存储设备中实现。在该实例中,数据存储器310可以是耦合至计算机300的本地数据存储设备。然而,在另一实施例中,数据存储器310可远程位于计算机300处,或数据存储器310可实现为一个或多个本地数据存储器设备和一个或多个远程数据存储器设备。
数据存储器310存储针对拥有版权的内容所生成的基于拥有版权的内容的时间片段的指纹316。拥有版权的内容可以是作为已知拥有版权的内容的任意音频和/或视频内容。拥有版权的内容可以存储在具有一个或多个已知拥有版权的视频剪辑的库或数据库中。数据存储器310也存储基于拥有版权的内容的时间片段的指纹316。
基于时间片段的指纹生成器302针对已知拥有版权的内容生成基于拥有版权的内容的时间片段的指纹316。基于拥有版权的内容的时间片段的指纹316包括一个或多个基于时间片段的指纹。基于拥有版权的内容的时间片段的指纹316通过基于时间片段的指纹生成器302在线地或离线地生成。换句话说,计算机300可用于在存在网络连接时或不存在网络连接时生成基于拥有版权的内容的时间片段的指纹316。然后,基于时间片段的指纹生成器302针对测试视频304生成基于测试视频的时间片段的指纹312。然后,指纹匹配引擎320将基于时间片段的指纹312与基于拥有版权的内容的时间片段的指纹316相比较。
指纹匹配引擎320是用于执行基于时间片段的指纹匹配处理的软件组件。指纹匹配引擎320将基于测试视频的时间片段的指纹312与基于拥有版权的内容的时间片段的指纹316相比较。结果318指示测试视频304是否为拥有版权的内容的副本或衍生物。拥有版权的内容的副本或衍生物可称作拥有版权的内容的近似复制品。在一个实施例中,为了基于内容的视频盗版检测或防护的目的,使用近似复制品的检测。
因此,基于时间片段的指纹生成器302针对与测试视频304相关的多个帧中的每个帧提取基于帧的、基于内容的特征。测试视频可包括与视频帧相应的音频内容。基于内容的特征可以是视觉特征和/或音频特征。基于时间片段的指纹生成器302根据基于内容的特征的明显改变检测在与测试视频304相关的视频内容中的事件。然后,基于时间片段的指纹生成器302生成贯穿一个或多个事件的重叠片段,以形成基于时间事件的片段的集合。
然后,基于时间片段的指纹生成器302根据与每个基于时间、事件的片段相关的基于内容的特征的时间跟踪从每个基于时间、事件的片段导出时间序列信号。基于时间片段的指纹生成器302根据每个片段的时间序列信号提取基于片段的指纹,以形成基于测试视频的时间片段的指纹312。
指纹匹配引擎320从测试视频304接收测试片段。指纹匹配引擎320将基于拥有版权的内容的时间片段的指纹316中的一个或多个基于时间片段的指纹与基于测试视频的时间片段的指纹312相比较。指纹匹配引擎320根据相似性测量来识别匹配片段。指纹匹配引擎320找到生成最佳线性拟合的匹配参考片段的子集。
在这个上下文中,线性拟合指的是对于匹配片段的时间布局和相对时间距离一致的匹配片段的集合。换句话说,在视频对中的匹配片段的时间位置之间必须存在线性关系,从而如果在一个视频的时间X处的片段匹配于在第二视频中的时间Y处的片段,则Y=aX+b,其中a和b是常实数。如果每对匹配片段具有相同的线性关系(其中针对所有匹配的片段对,常数a和b相同,或几乎相同),则成对的匹配片段的集合生成线性拟合。匹配片段的线性拟合的质量取决于具有相同线性关系的匹配片段对的数目以及线性关系的参数a和b。
指纹匹配引擎320基于最佳线性拟合生成视频匹配分数。在该实例中,如果视频匹配分数超过阈值分数,则指纹匹配引擎320生成将测试片段识别为从参考视频潜在复制或导出的结果318。如果视频匹配分数低于阈值,则指纹匹配引擎320生成将测试片段识别为不匹配参考视频的结果318。
在一个实施例中,拥有版权的内容的内容所有者针对拥有版权的视频提取基于时间片段的指纹,以生成基于拥有版权的内容的时间片段的指纹316。这些指纹是基于细粒度的时间内容的指纹,其被设计为对于大范围的失真具有健壮性。然后,使用基于时间片段的指纹来检测视频盗版,和防止拥有版权的内容被未授权使用。
在另一实例中,视频共享站点可利用基于时间片段的指纹生成器302针对视频共享站点上张贴的视频生成基于视频内容的指纹。视频共享站点可使用指纹匹配引擎320检测由视频共享站点的用户提取的盗版和拥有版权的视频的未授权使用。在该实例中,测试视频304是由站点的用户张贴在视频共享站点上的视频。根据基于拥有版权的内容的时间片段的指纹316的基准数据库来匹配基于测试视频的时间片段的指纹312。这个匹配也是基于细粒度的时间内容的处理,其被设计为对于大范围的失真具有健壮性。检测共享视频是否为描述符数据库中拥有版权的视频之一的盗版副本。
图4是示出根据示例性实施例的针对拥有版权的内容生成基于时间片段的指纹的参考数据库的框图。基于时间片段的指纹生成器302针对拥有版权的内容404生成基于拥有版权的内容的时间片段的指纹316,其方式相同于图3中基于时间片段的指纹生成器302针对测试视频304生成基于测试视频的时间片段的指纹312。
数据存储器310存储拥有版权的内容404。拥有版权的内容404可使用作为已知拥有版权的内容的任意音频和/或视频内容来实现。在该实例中,拥有版权的内容404是具有一个或多个已知拥有版权的视频剪辑的库或数据库。基于拥有版权的内容的时间片段的指纹316包含针对已知拥有版权的视频内容(例如拥有版权的内容404)的基于时间片段的指纹。
基于时间片段的指纹生成器302针对拥有版权的内容404在线地或离线地生成基于拥有版权的内容的时间片段的指纹316。换句话说,基于时间片段的指纹生成器302可用于在存在网络连接时或不存在网络连接时生成基于拥有版权的内容的时间片段的指纹316。然后,基于时间片段的指纹生成器302针对如图3所示的测试视频304生成基于测试视频的时间片段的指纹312。然后,指纹匹配引擎320将如图3所示的基于时间片段的指纹312与基于拥有版权的内容的时间片段的指纹316相比较。
图5是示出根据示例性实施例的基于片段的时间指纹生成器的框图。基于时间片段的指纹生成器302接收与测试视频或已知拥有版权的内容相关的视频帧501。基于帧的特征502是与基于时间片段的指纹生成器302相关的软件组件,其提取针对每个帧的基于内容的特征503。基于内容的特征503可以仅是视觉特征、仅是音频特征、或视觉和音频特征的组合。
事件检测504是根据基于内容的特征503的明显改变检测事件的软件组件。事件检测504根据期间限制来创建贯穿多个事件的重叠片段。片段通过事件边界505来定义。换句话说,事件检测504根据视频剪辑的音频-视觉内容的状态的明显改变来检测和提取视频帧501中的事件。例如,事件可标记视频拍摄或场景转换、说话者改变,或者可简单地取决于整个帧或音频强度改变。换句话说,事件检测504可检测使用视频拍摄检测、场景改变、说话者改变、音频改变、和帧强度改变的事件。事件检测504也可使用音频特征、视觉特征、和多模特征来检测事件。
然后,基于时间片段的指纹生成器302使用事件以形成基于时间、事件的片段,其可贯穿多个事件,可被分离或重叠,以及可覆盖整个视频或仅视频子集。基于时间、事件的片段也可与一个或多个其他的基于时间、事件的片段重叠。在匹配中,基于时间、事件的片段的子集生成贯穿多个帧中的帧子集的线性拟合。匹配的基于时间、事件的片段可通过间隙来分离。
片段提取506针对每个片段创建特征的时间序列,以形成片段时间序列507。片段提取506使得每个基于时间、事件的片段与从每个基于时间、事件的片段提取的基于内容的特征的时间轨迹相关联。例如,一个基于视觉内容的特征是与帧像素中的红、绿、和蓝颜色值的总和相应的总帧强度。时间序列信号可取决于总帧强度的时间跟踪、基于帧区域的强度序列的跟踪、基于栅格的强度序列的跟踪、和/或邻近帧差异的跟踪。
因此,针对每个片段构成基于帧的描述符的时间序列,以形成片段时间序列507。描述符可以与总帧强度一样简单,或者可以是基于颜色、纹理、边缘、和形状特征的更复杂特征。
然后,基于片段的特征508针对每个时间片段提取基于片段的时间指纹,以形成基于时间片段的指纹509。基于片段的特征508通过从与每个片段相关的描述符的时间序列提取基于固定维度(fixed-dimensionality)的时间片段的指纹来进行这个操作。固定维度的指纹可通过将可变长度时间序列还原成固定维度特征向量的各种方法来提取,包括但不限于,均匀取样、向量量化、逐段线性近似、离散余弦变换(DCT)、离散小波变换(DWT)、和离散傅立叶变换(DFT)。
现在转到图6,示出根据示例性实施例的指纹提取处理的视图。视图600是通过基于时间片段的指纹生成器(例如图3中的基于时间片段的指纹生成器302)实现的指纹提取处理的视图。
视频601可以是测试视频或已知拥有版权的内容。基于帧的特征602是用于从视频601提取特征的软件,例如图5中的基于帧的特征502。基于帧的特征602将视频601处理成帧,以及对于视频的每个帧提取红/绿/蓝值的总和,得到时间序列信号。事件检测604根据阈值和信号的衍生物的零交点来检测这个信号中的事件。片段提取606根据片段上的最小和最大期间限制创建贯穿事件到事件的重叠片段。在该实例中,基于片段的特征608以64个均匀间隔的时间点针对每个片段对信号进行子取样,得到针对片段集合的视频的指纹以及他们相应的64个维度向量。然而,基于片段的特征608能够以任意数目个时间点针对每个片段对信号进行子取样,或生成固定维度向量。
将红/绿/蓝的总和用作基于帧的特征提供了对于许多差异(包括但不限于,围绕视频的黑带、纵横比的差异、叠加在视频上的收尾语或固定文本、视频的纯变亮和变暗、增益不改变地太快时的AGC、颜色空间转换、分辨率和DC偏移的差异)的不变性或健壮性。
基于改变的事件检测的使用对于空间和时间差异两者提供了不变性。即使检测视频可被编辑,以及可以具有不同的时间标度,事件检测604应发现测试信号在相似的时间点改变。
贯穿多个事件的重叠片段的使用也对于空间和时间差异两者提供了不变性。即使测试视频可被降级,以及可以具有不同的时间标度,片段提取606应基于类似的短改变序列发现贯穿多个事件的重叠片段。
图7是根据示例性实施例的指纹匹配引擎的框图。指纹匹配引擎314接收针对测试片段704的基于时间片段的指纹。指纹搜索和比较705是用于识别与比较中利用的测试视频匹配的参考片段的软件组件,以确定测试视频是否为识别的参考片段的副本或衍生物。
针对每个测试片段,指纹搜索和比较705发现匹配的参考片段。参考片段706是已知拥有版权的视频内容的片段。针对参考片段706中的每个参考片段,指纹搜索和比较705收集所有匹配片段708。换句话说,将测试片段704与描述符数据库中的参考片段706相比较,并且使用精确或近似最近的相邻搜索来找到最近的匹配参考片段,以形成匹配片段708。
线性拟合分析710找到生成最佳线性拟合的匹配片段的子集,以形成过滤的匹配片段712。换句话说,线性拟合分析710分析测试片段704的对于每个参考视频的线性拟合。针对每个参考视频,线性拟合分析710过滤掉具有最长期间线性拟合的测试片段的子集和匹配的参考片段,以形成过滤的匹配片段712。
线性拟合分析710的使用向空间和时间差异两者提供了不变性。即使测试视频可被编辑,但是线性拟合需要片段被按时间排列,但不必相连。
针对每个测试视频,匹配视频计分714根据具有最佳线性拟合的参考视频计算总匹配分数,以形成匹配分数716。匹配视频计分714使用过滤的匹配片段712依据描述符数据库来计算最佳匹配分数716。最佳匹配分数716用于检测测试视频是否为拥有版权的视频。
阈值分数比较引擎718将匹配分数716与阈值分数相比较,以确定测试视频是否为拥有版权的内容的副本或衍生物。例如,如果匹配分数716等于或大于阈值分数,则阈值分数比较引擎718将测试视频识别为参考片段706中拥有版权的内容的副本或衍生物。
现在参照图8,示出根据示例性实施例的匹配处理的框图。比较800是匹配处理的图示。指纹匹配引擎(例如图3中的指纹匹配引擎314)权衡所提取的基于时间片段的指纹以比较和匹配视频剪辑802和804。视频剪辑802是来自拥有版权的内容的库(例如图3中的拥有版权的内容314)的参考视频。视频剪辑804是未知测试视频,例如图3中的测试视频304。
可使用相似指纹来识别在未知测试视频804和已知参考视频802之间的匹配片段。随后,可使用来自每个候选参考视频的匹配片段的集合和组合期间,对于测试视频804和候选参考视频802之间的总匹配质量计分。然后,可将计分足够高的任意候选参考视频声明为未知测试视频的近似复制品,然后将测试视频804标记为拥有版权的内容的衍生物。
图9是示出根据示例性实施例的提取基于片段的时间指纹的处理的流程图。图9中的处理通过用于生成基于时间片段的指纹的软件来实现,例如图3中的基于时间片段的指纹生成器302。
该处理通过针对视频内容中的每个帧提取基于内容的特征来开始(步骤902)。视频内容可以是测试视频或已知拥有版权的视频内容。视频内容可以仅是视频,仅是音频,或音频和视频的组合。基于内容的特征是视觉特征、音频特征、或视觉和音频特征的组合。
该处理根据基于内容的特征的明显改变检测视频内容中的事件(步骤904)。然后,该处理根据期间限制生成贯穿一个或多个事件的重叠片段,以形成基于时间事件的片段的集合(步骤906)。基于时间、事件的片段的集合是两个或更多个基于事件的片段的集合。
该处理根据与基于时间、事件的片段的集合中的每个基于时间、事件的片段相关的基于内容的特征的时间跟踪从每个基于时间、事件的片段导出时间序列信号(步骤908)。然后,该处理针对每个片段提取基于片段的时间指纹,以形成针对视频内容的基于时间片段的视频指纹(步骤910),随后该处理终止。换句话说,图9中的处理针对给定视频剪辑生成一个或多个基于时间片段的指纹。图9中的处理可执行任意数目的次数,以生成针对测试视频剪辑和/或针对已知拥有版权的内容的多个基于时间片段的指纹。
图10是示出根据示例性实施例的使用基于时间片段的指纹确定测试片段是否匹配于参考视频的处理的流程图。图10中的处理通过匹配基于时间片段的指纹的软件(例如图3中的指纹匹配引擎320)来实现。
该处理通过从测试视频内容选择测试片段来开始(步骤1002)。该处理将参考视频的基于时间片段的指纹与测试片段的基于时间片段的指纹相比较(步骤1004)。该处理基于相似性测量来识别匹配片段(步骤1006)。该处理找到生成最佳线性拟合的匹配参考片段的子集(步骤1008)。
然后,该处理根据最佳线性拟合生成视频匹配分数(步骤1010)。该处理做出关于测试视频的匹配分数是否超过阈值的确定(步骤1012)。如果分数超过阈值,则处理将测试片段识别为从参考视频潜在导出(步骤1014),随后该处理终止。
返回步骤1012,如果分数没有超过阈值,则该处理将测试片段识别为不匹配于参考视频(步骤1016),随后该处理终止。换句话说,如果匹配分数太低,则该处理不将测试视频识别为与参考视频相关的拥有版权的内容的副本或衍生物。
示例性实施例提供了一种针对基于时间、事件的视频指纹法的计算机实现的方法、装置、和计算机程序产品代码。在一个实施例中,检测视频内容中的事件。所述视频内容包括多个视频帧。事件代表视频内容中的离散兴趣点。使用所述事件生成基于时间、事件的片段的集合。每个基于时间、事件的片段是覆盖一个或多个事件的视频内容的片段。根据与每个基于时间、事件的片段相关的帧的基于内容的特征的时间跟踪,从每个片段导出时间序列信号。根据每个基于时间、事件的片段的时间序列信号导出片段指纹,以形成与所述视频内容相关的基于时间片段的指纹的集合。
将针对测试视频剪辑的基于时间片段的指纹与针对每个参考视频的基于时间片段的指纹相比较。找到所有匹配的对。使用生成良好线性拟合的匹配对的子集,对候选参考视频的匹配进行计分。
基于时间、片段的指纹可用于基于内容的视频盗版检测或视频盗版防护目的。通过该处理生成的基于时间片段的指纹也可用于基于内容的搜索、概念检测、内容归类、概括、过滤、路由、或目标式广告。对于例如剪切、插入、和接合的编辑操作来说,基于片段的时间指纹法更加有健壮性。换句话说,基于片段的时间指纹法能够更加精确和可靠地检测副本和衍生物,即使在视频内容经过编辑操作以及对于拥有版权的视频内容的更改时。
因此,实施例通过将基于内容的特征与视频的唯一时间签名组合来提高对于编辑和图像处理转换的健壮性。通过检测视频中的重要事件、形成在事件边界处排列的片段并且为每个片段提取基于内容的描述符的事件轨迹来增加健壮性。在不变的事件边界处排列片段减少了上述帧排列问题。允许片段贯穿可变数目个事件,以及彼此重叠,这提供了一定程度的冗余性,导致对于编辑操作的健壮性增加。将时间轨迹签名并入指纹中减少了指纹的依赖性,因此增加了对于图像处理转换的健壮性。
本发明可采用完全硬件实施例、完全软件实施例或包含硬件和软件元素的实施例的形式。在优选实施例中,在包括但不限于固件、驻留软件、微码等的硬件和软件中实现本发明。
此外,本发明可采用从计算机可用或计算机可读介质可访问的计算机程序产品的形式,所述计算机可用或计算机可读介质提供用于计算机或任意指令执行系统或与其连接的程序代码。为了这里说明的目的,计算机可用或计算机可读介质可以是可包含、存储、通信、传播或传输用于指令执行系统、装置或设备或与其连接的程序的任意有形装置。
介质可以是电子、磁、光、电磁、红外或半导体系统(或装置或设备)或传播介质。计算机可读介质的实例包括:半导体或固态存储器、磁带、可卸计算机磁盘、随机存取存储器(RAM)、只读存储器(ROM)、硬盘和光盘。光盘的当前实例包括压缩盘-只读存储器(CD-ROM)、压缩盘-读/写(CD-R/W)和DVD。
适用于存储和/或执行程序代码的数据处理系统包括直接或通过系统总线间接与存储器元件耦合的至少一个处理器。存储器元件可包括在程序代码的实际执行期间采用的本地存储器、海量存储装置、以及提供至少一些程序代码的临时存储以减少在执行期间必须从海量存储装置提取代码的次数的高速缓存。
输入/输出或I/O设备(包括但不限于键盘、显示器、定点设备等)可直接或通过中间I/O控制器耦合至系统。
网络适配器也可耦合至系统,以使得数据处理系统能够通过中间专用网络或公共网络耦合至其他数据处理系统或远程打印机或存储设备。调制解调器、电缆调制解调器和以太网卡仅是网络适配器的几个当前可用类型。
为了说明和描述的目的提出本发明实施例的以上描述,并且其不是穷尽的,以及并没有将本发明限制在所公开的特定形式。对于本领域普通技术人员,许多变形和改变是清楚的。选择和描述实施例以最佳地解释发明原理、实际应用,以及使得本领域普通技术人员能够通过适用于特定用途的具有各种修改的各种实施例理解本发明。

Claims (22)

1.一种针对基于时间、事件的视频指纹法的计算机实现的方法,所述计算机实现的方法包括:
检测视频内容中的事件,其中所述视频内容包括多个视频帧,以及其中事件代表视频内容中的离散兴趣点;
使用所述事件生成基于时间、事件的片段的集合,其中每个基于时间、事件的片段是覆盖事件集合的视频内容的片段,并且是贯穿多个帧中的帧集合,以及其中所述帧集合仅覆盖视频内容的子集;
使用与所述基于时间、事件的片段的集合中的每个基于时间、事件的片段相关的帧集合的基于内容的特征的时间跟踪,从所述每个基于时间、事件的片段导出时间序列信号;以及
根据所述每个基于时间、事件的片段的时间序列信号提取片段指纹,以形成与所述视频内容相关的基于时间片段的指纹的集合。
2.如权利要求1所述的计算机实现的方法,其中使用基于时间片段的指纹的集合来确定第一视频剪辑的一部分是否与第二视频剪辑从相同的原始内容导出,所述计算机实现的方法还包括:
将针对所述第一视频剪辑的基于时间片段的指纹与针对所述第二视频剪辑生成的基于时间片段的指纹相比较;
根据在与所述第一视频剪辑相关的基于时间片段的指纹以及与所述第二视频剪辑相关的基于时间片段的指纹之间的相似性测量来识别匹配的基于事件的片段,以形成匹配片段;
收集在所述第一视频剪辑以及所述第二视频剪辑之间的所有匹配片段,以形成匹配片段的集合;
选择匹配片段的子集,其中匹配片段的子集包括对于与所述第二视频剪辑相关的匹配片段生成良好线性拟合的与所述第一视频剪辑相关的匹配片段;
根据所选的匹配片段识别针对所述第一视频剪辑和所述第二视频剪辑 的总视频匹配分数;以及
使用所述总视频匹配分数来确定所述第一视频剪辑是否为所述第二视频剪辑的近似复制品。
3.如权利要求2所述的计算机实现的方法,还包括:
将所述总视频匹配分数与阈值分数相比较;以及
响应于所述总视频匹配分数超过阈值分数,将所述第一视频剪辑识别为所述第二视频剪辑的近似复制品。
4.如权利要求1所述的计算机实现的方法,其中将所述基于时间片段的指纹用于基于内容的搜索、概念检测、内容归类、概括、过滤、路由、或目标式广告中的至少一个。
5.如权利要求1所述的计算机实现的方法,其中所述基于内容的特征包括音频特征和视觉特征中的至少一个,以及其中根据以下内容中的至少一个来检测每个事件:视频拍摄检测,场景改变,说话者改变,音频改变,帧强度改变,或根据颜色、纹理、形状、边缘、或动作的低级的基于内容的描述符的改变。
6.如权利要求1所述的计算机实现的方法,其中与所述视频内容相关的第一基于时间、事件的片段重叠于与所述视频内容相关的第二基于时间、事件的片段。
7.如权利要求1所述的计算机实现的方法,其中所述时间序列信号基于以下内容之一:总帧强度的时间跟踪、基于帧区域的强度序列的跟踪、基于栅格的强度序列的跟踪、和邻近帧差异的跟踪。
8.如权利要求1所述的计算机实现的方法,其中基于以下内容中的至少一个从片段时间序列提取所述基于时间片段的指纹:均匀取样、逐段线性近似、离散余弦变换(DCT)、离散小波变换(DWT)、和离散傅立叶变换(DFT)。
9.如权利要求1所述的计算机实现的方法,其中基于时间片段的指纹包括固定维度特征向量。
10.如权利要求1所述的计算机实现的方法,其中事件描述以下内容 中至少一个的状态的明显改变:视频的音频内容、视频的视觉内容、和视频的语义内容。
11.一种针对基于时间、事件的视频指纹法的计算机实现的系统,所述计算机实现的系统包括: 
用于检测视频内容中的事件的装置,其中所述视频内容包括多个视频帧,以及其中事件代表视频内容中的离散兴趣点; 
用于使用所述事件生成基于时间、事件的片段的集合的装置,其中每个基于时间、事件的片段是覆盖事件集合的视频内容的片段,并且是贯穿多个帧中的帧集合,以及其中所述帧集合仅覆盖视频内容的子集; 
用于使用与所述基于时间、事件的片段的集合中的每个基于时间、事件的片段相关的帧集合的基于内容的特征的时间跟踪,从所述每个基于时间、事件的片段导出时间序列信号的装置;以及 
用于根据所述每个基于时间、事件的片段的时间序列信号提取片段指纹,以形成与所述视频内容相关的基于时间片段的指纹的集合的装置。 
12.如权利要求11所述的计算机实现的系统,其中使用基于时间片段的指纹的集合来确定第一视频剪辑的一部分是否与第二视频剪辑从相同的原始内容导出,所述计算机实现的系统还包括: 
用于将针对所述第一视频剪辑的基于时间片段的指纹与针对所述第二视频剪辑生成的基于时间片段的指纹相比较的装置; 
用于根据在与所述第一视频剪辑相关的基于时间片段的指纹以及与所述第二视频剪辑相关的基于时间片段的指纹之间的相似性测量来识别匹配的基于事件的片段,以形成匹配片段的装置; 
用于收集在所述第一视频剪辑以及所述第二视频剪辑之间的所有匹配片段,以形成匹配片段的集合的装置; 
用于选择匹配片段的子集的装置,其中匹配片段的子集包括对于与所述第二视频剪辑相关的匹配片段生成良好线性拟合的与所述第一视频剪辑相关的匹配片段; 
用于根据所选的匹配片段识别针对所述第一视频剪辑和所述第二视频 剪辑的总视频匹配分数的装置;以及
用于使用所述总视频匹配分数来确定所述第一视频剪辑是否为所述第二视频剪辑的近似复制品的装置。
13.如权利要求12所述的计算机实现的系统,还包括:
用于将所述总视频匹配分数与阈值分数相比较的装置;以及
用于响应于所述总视频匹配分数超过阈值分数,将所述第一视频剪辑识别为所述第二视频剪辑的近似复制品的装置。
14.如权利要求11所述的计算机实现的系统,其中将所述基于时间片段的指纹用于基于内容的搜索、概念检测、内容归类、概括、过滤、路由、或目标式广告中的至少一个。
15.如权利要求11所述的计算机实现的系统,其中所述基于内容的特征包括音频特征和视觉特征中的至少一个,以及其中根据以下内容中的至少一个来检测每个事件:视频拍摄检测,场景改变,说话者改变,音频改变,帧强度改变,或根据颜色、纹理、形状、边缘、或动作的低级的基于内容的描述符的改变。
16.如权利要求11所述的计算机实现的系统,其中与所述视频内容相关的第一基于时间、事件的片段重叠于与所述视频内容相关的第二基于时间、事件的片段。
17.如权利要求11所述的计算机实现的系统,其中所述时间序列信号基于以下内容之一:总帧强度的时间跟踪、基于帧区域的强度序列的跟踪、基于栅格的强度序列的跟踪、和邻近帧差异的跟踪。
18.如权利要求11所述的计算机实现的系统,其中基于以下内容中的至少一个从片段时间序列提取所述基于时间片段的指纹:均匀取样、逐段线性近似、离散余弦变换(DCT)、离散小波变换(DWT)、和离散傅立叶变换(DFT)。
19.如权利要求11所述的计算机实现的系统,其中基于时间片段的指纹包括固定维度特征向量。
20.如权利要求11所述的计算机实现的系统,其中事件描述以下内 容中至少一个的状态的明显改变:视频的音频内容、视频的视觉内容、和视频的语义内容。
21.一种自动检测视频盗版的计算机实现的方法,所述计算机实现的方法包括:
将针对第一视频剪辑的基于时间片段的指纹与针对第二视频剪辑生成的基于时间片段的指纹相比较;
根据在与所述第一视频剪辑相关的基于时间片段的指纹以及与所述第二视频剪辑相关的基于时间片段的指纹之间的相似性测量来识别匹配的基于事件的片段,以形成匹配片段;
收集在所述第一视频剪辑以及所述第二视频剪辑之间的所有匹配片段,以形成匹配片段的集合;
选择匹配片段的子集,其中匹配片段的子集包括生成良好线性拟合的与所述第一视频剪辑相关的匹配片段以及与所述第二视频剪辑相关的匹配片段;
根据匹配片段的子集中所选的匹配片段识别针对所述第一视频剪辑和所述第二视频剪辑的总视频匹配分数;以及
使用所述总视频匹配分数来确定所述第一视频剪辑是否为所述第二视频剪辑的近似复制品。
22.如权利要求21所述的计算机实现的方法,还包括:
将所述总视频匹配分数与阈值分数相比较;以及
响应于所述总视频匹配分数超过阈值分数,将所述第一视频剪辑识别为所述第二视频剪辑的近似复制品。 
CN200880120751XA 2007-12-17 2008-11-24 基于时间片段的提取和视频指纹的健壮性匹配 Active CN101896906B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/958,298 US9177209B2 (en) 2007-12-17 2007-12-17 Temporal segment based extraction and robust matching of video fingerprints
US11/958,298 2007-12-17
PCT/CN2008/073166 WO2009076823A1 (en) 2007-12-17 2008-11-24 Temporal segment based extraction and robust matching of video fingerprints

Publications (2)

Publication Number Publication Date
CN101896906A CN101896906A (zh) 2010-11-24
CN101896906B true CN101896906B (zh) 2013-03-06

Family

ID=40753365

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200880120751XA Active CN101896906B (zh) 2007-12-17 2008-11-24 基于时间片段的提取和视频指纹的健壮性匹配

Country Status (6)

Country Link
US (1) US9177209B2 (zh)
EP (1) EP2240871A4 (zh)
JP (1) JP5404644B2 (zh)
KR (1) KR101171536B1 (zh)
CN (1) CN101896906B (zh)
WO (1) WO2009076823A1 (zh)

Families Citing this family (118)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9583141B2 (en) 2005-07-01 2017-02-28 Invention Science Fund I, Llc Implementing audio substitution options in media works
US8203609B2 (en) * 2007-01-31 2012-06-19 The Invention Science Fund I, Llc Anonymization pursuant to a broadcasted policy
US9230601B2 (en) 2005-07-01 2016-01-05 Invention Science Fund I, Llc Media markup system for content alteration in derivative works
US7860342B2 (en) 2005-07-01 2010-12-28 The Invention Science Fund I, Llc Modifying restricted images
US9092928B2 (en) 2005-07-01 2015-07-28 The Invention Science Fund I, Llc Implementing group content substitution in media works
US20080028422A1 (en) * 2005-07-01 2008-01-31 Searete Llc, A Limited Liability Corporation Of The State Of Delaware Implementation of media content alteration
US8126938B2 (en) * 2005-07-01 2012-02-28 The Invention Science Fund I, Llc Group content substitution in media works
US9065979B2 (en) 2005-07-01 2015-06-23 The Invention Science Fund I, Llc Promotional placement in media works
US9426387B2 (en) 2005-07-01 2016-08-23 Invention Science Fund I, Llc Image anonymization
US8732087B2 (en) 2005-07-01 2014-05-20 The Invention Science Fund I, Llc Authorization for media content alteration
US7646006B2 (en) 2006-03-30 2010-01-12 International Business Machines Corporation Three-terminal cascade switch for controlling static power consumption in integrated circuits
US9215512B2 (en) 2007-04-27 2015-12-15 Invention Science Fund I, Llc Implementation of media content alteration
US8452043B2 (en) 2007-08-27 2013-05-28 Yuvad Technologies Co., Ltd. System for identifying motion video content
CN102084358A (zh) * 2008-02-05 2011-06-01 杜比实验室特许公司 将信息与媒体内容关联
WO2009140820A1 (en) * 2008-05-21 2009-11-26 Yuvad Technologies Co., Ltd. A system for extracting a finger print data from video/audio signals
WO2009140819A1 (en) * 2008-05-21 2009-11-26 Yuvad Technologies Co., Ltd. A system for facilitating the search of video content
US8370382B2 (en) 2008-05-21 2013-02-05 Ji Zhang Method for facilitating the search of video content
US8577077B2 (en) * 2008-05-22 2013-11-05 Yuvad Technologies Co., Ltd. System for identifying motion video/audio content
US8548192B2 (en) * 2008-05-22 2013-10-01 Yuvad Technologies Co., Ltd. Method for extracting a fingerprint data from video/audio signals
WO2009143667A1 (en) * 2008-05-26 2009-12-03 Yuvad Technologies Co., Ltd. A system for automatically monitoring viewing activities of television signals
US8347408B2 (en) * 2008-06-30 2013-01-01 Cisco Technology, Inc. Matching of unknown video content to protected video content
US20090327334A1 (en) * 2008-06-30 2009-12-31 Rodriguez Arturo A Generating Measures of Video Sequences to Detect Unauthorized Use
US8259177B2 (en) * 2008-06-30 2012-09-04 Cisco Technology, Inc. Video fingerprint systems and methods
KR100986223B1 (ko) * 2008-08-07 2010-10-08 한국전자통신연구원 불법 동영상 데이터 검색 장치 및 방법
US8498487B2 (en) * 2008-08-20 2013-07-30 Sri International Content-based matching of videos using local spatio-temporal fingerprints
US8433175B2 (en) * 2008-10-28 2013-04-30 Yahoo! Inc. Video comparing using fingerprint representations
US20100191689A1 (en) * 2009-01-27 2010-07-29 Google Inc. Video content analysis for automatic demographics recognition of users and videos
US8934545B2 (en) * 2009-02-13 2015-01-13 Yahoo! Inc. Extraction of video fingerprints and identification of multimedia using video fingerprinting
DE112009005002T5 (de) * 2009-06-26 2012-10-25 Intel Corp. Techniken zum Erkennen von Videokopien
JP5676184B2 (ja) * 2009-09-14 2015-02-25 トムソン ライセンシングThomson Licensing 画像系列を時間的に位置合わせする方法及びレジストレーション装置
US8831760B2 (en) 2009-10-01 2014-09-09 (CRIM) Centre de Recherche Informatique de Montreal Content based audio copy detection
US8671109B2 (en) * 2009-10-01 2014-03-11 Crim (Centre De Recherche Informatique De Montreal) Content-based video copy detection
US9264785B2 (en) * 2010-04-01 2016-02-16 Sony Computer Entertainment Inc. Media fingerprinting for content determination and retrieval
US8560583B2 (en) 2010-04-01 2013-10-15 Sony Computer Entertainment Inc. Media fingerprinting for social networking
JP2011254240A (ja) * 2010-06-01 2011-12-15 Sony Corp 画像処理装置、画像処理方法およびプログラム
US20120002884A1 (en) * 2010-06-30 2012-01-05 Alcatel-Lucent Usa Inc. Method and apparatus for managing video content
US9814977B2 (en) 2010-07-13 2017-11-14 Sony Interactive Entertainment Inc. Supplemental video content on a mobile device
US9143699B2 (en) 2010-07-13 2015-09-22 Sony Computer Entertainment Inc. Overlay non-video content on a mobile device
US9832441B2 (en) 2010-07-13 2017-11-28 Sony Interactive Entertainment Inc. Supplemental content on a mobile device
US9159165B2 (en) 2010-07-13 2015-10-13 Sony Computer Entertainment Inc. Position-dependent gaming, 3-D controller, and handheld as a remote
US8730354B2 (en) 2010-07-13 2014-05-20 Sony Computer Entertainment Inc Overlay video content on a mobile device
EP2437498A1 (en) 2010-09-30 2012-04-04 British Telecommunications Public Limited Company Digital video fingerprinting
US8798400B2 (en) 2010-10-21 2014-08-05 International Business Machines Corporation Using near-duplicate video frames to analyze, classify, track, and visualize evolution and fitness of videos
US9552442B2 (en) 2010-10-21 2017-01-24 International Business Machines Corporation Visual meme tracking for social media analysis
JP5649425B2 (ja) * 2010-12-06 2015-01-07 株式会社東芝 映像検索装置
US8923607B1 (en) * 2010-12-08 2014-12-30 Google Inc. Learning sports highlights using event detection
JP5685324B2 (ja) * 2011-01-07 2015-03-18 アルカテル−ルーセント 映像を比較する方法および装置
US8786785B2 (en) * 2011-04-05 2014-07-22 Microsoft Corporation Video signature
JP5423740B2 (ja) * 2011-08-23 2014-02-19 日本電気株式会社 映像提供装置、映像利用装置、映像提供システム、映像提供方法、および、コンピュータ・プログラム
US9113202B1 (en) * 2011-09-21 2015-08-18 Google Inc. Inverted client-side fingerprinting and matching
US9286641B2 (en) * 2011-10-19 2016-03-15 Facebook, Inc. Automatic photo capture based on social components and identity recognition
CN103093761B (zh) * 2011-11-01 2017-02-01 深圳市世纪光速信息技术有限公司 音频指纹检索方法及装置
CN102419816B (zh) * 2011-11-18 2013-03-13 山东大学 用于相同内容视频检索的视频指纹方法
US9846696B2 (en) 2012-02-29 2017-12-19 Telefonaktiebolaget Lm Ericsson (Publ) Apparatus and methods for indexing multimedia content
CN102833622A (zh) * 2012-09-19 2012-12-19 北京国双科技有限公司 视频文件播放次数的探测方法和装置
US20140214402A1 (en) * 2013-01-25 2014-07-31 Cisco Technology, Inc. Implementation of unsupervised topic segmentation in a data communications environment
US9299009B1 (en) * 2013-05-13 2016-03-29 A9.Com, Inc. Utilizing color descriptors to determine color content of images
US10445367B2 (en) 2013-05-14 2019-10-15 Telefonaktiebolaget Lm Ericsson (Publ) Search engine for textual content and non-textual content
KR101456926B1 (ko) * 2013-06-14 2014-10-31 (주)엔써즈 핑거프린트에 기반한 광고 검출 시스템 및 방법
KR101463864B1 (ko) * 2013-08-07 2014-11-21 (주)엔써즈 직접 반응 광고 검출 및 분류 시스템 및 방법
US10311038B2 (en) 2013-08-29 2019-06-04 Telefonaktiebolaget Lm Ericsson (Publ) Methods, computer program, computer program product and indexing systems for indexing or updating index
WO2015030646A1 (en) 2013-08-29 2015-03-05 Telefonaktiebolaget L M Ericsson (Publ) Method, content owner device, computer program, and computer program product for distributing content items to authorized users
CN104639498B (zh) * 2013-11-06 2017-12-29 阿里巴巴集团控股有限公司 一种指纹匹配的方法、装置及系统
CN103686238B (zh) * 2013-12-02 2017-10-27 北京国双科技有限公司 视频播放检测方法和装置
US9619854B1 (en) * 2014-01-21 2017-04-11 Google Inc. Fingerprint matching for recommending media content within a viewing session
TWI505113B (zh) * 2014-03-18 2015-10-21 Vivotek Inc 監視系統及其影像搜尋方法
EP3149652A1 (en) * 2014-05-27 2017-04-05 Telefonaktiebolaget LM Ericsson (publ) Fingerprinting and matching of content of a multi-media file
US9930375B2 (en) * 2014-06-16 2018-03-27 Nexidia Inc. Media asset management
US10127783B2 (en) 2014-07-07 2018-11-13 Google Llc Method and device for processing motion events
US9213903B1 (en) 2014-07-07 2015-12-15 Google Inc. Method and system for cluster-based video monitoring and event categorization
US9501915B1 (en) 2014-07-07 2016-11-22 Google Inc. Systems and methods for analyzing a video stream
US9449229B1 (en) 2014-07-07 2016-09-20 Google Inc. Systems and methods for categorizing motion event candidates
US9170707B1 (en) 2014-09-30 2015-10-27 Google Inc. Method and system for generating a smart time-lapse video clip
US10140827B2 (en) 2014-07-07 2018-11-27 Google Llc Method and system for processing motion event notifications
US9544621B2 (en) 2014-09-17 2017-01-10 Google Inc. Identification of captured videos
USD782495S1 (en) 2014-10-07 2017-03-28 Google Inc. Display screen or portion thereof with graphical user interface
US9805099B2 (en) * 2014-10-30 2017-10-31 The Johns Hopkins University Apparatus and method for efficient identification of code similarity
KR102217191B1 (ko) * 2014-11-05 2021-02-18 삼성전자주식회사 단말 장치 및 그 정보 제공 방법
US10521672B2 (en) * 2014-12-31 2019-12-31 Opentv, Inc. Identifying and categorizing contextual data for media
US9858337B2 (en) 2014-12-31 2018-01-02 Opentv, Inc. Management, categorization, contextualizing and sharing of metadata-based content for media
US9361011B1 (en) 2015-06-14 2016-06-07 Google Inc. Methods and systems for presenting multiple live video feeds in a user interface
FR3037760A1 (fr) * 2015-06-18 2016-12-23 Orange Procede et dispositif de substitution d'une partie d'une sequence video
WO2017075493A1 (en) 2015-10-28 2017-05-04 Ustudio, Inc. Video frame difference engine
US10063917B2 (en) * 2016-03-16 2018-08-28 Sorenson Media Inc. Fingerprint layouts for content fingerprinting
US20170270625A1 (en) * 2016-03-21 2017-09-21 Facebook, Inc. Systems and methods for identifying matching content
US10832216B2 (en) * 2016-04-20 2020-11-10 Disney Enterprises, Inc. System and method for facilitating clearance of online content for distribution platforms
US10506237B1 (en) 2016-05-27 2019-12-10 Google Llc Methods and devices for dynamic adaptation of encoding bitrate for video streaming
US9996769B2 (en) * 2016-06-08 2018-06-12 International Business Machines Corporation Detecting usage of copyrighted video content using object recognition
US10515292B2 (en) * 2016-06-15 2019-12-24 Massachusetts Institute Of Technology Joint acoustic and visual processing
US20170371963A1 (en) * 2016-06-27 2017-12-28 Facebook, Inc. Systems and methods for identifying matching content
US10380429B2 (en) 2016-07-11 2019-08-13 Google Llc Methods and systems for person detection in a video feed
US9972060B2 (en) * 2016-09-08 2018-05-15 Google Llc Detecting multiple parts of a screen to fingerprint to detect abusive uploading videos
US10699128B2 (en) * 2016-09-21 2020-06-30 Cisco Technology, Inc. Method and system for comparing content
GB2558868A (en) * 2016-09-29 2018-07-25 British Broadcasting Corp Video search system & method
US10445565B2 (en) * 2016-12-06 2019-10-15 General Electric Company Crowd analytics via one shot learning
US10659509B2 (en) 2016-12-06 2020-05-19 Google Llc Detecting similar live streams ingested ahead of the reference content
WO2018152214A1 (en) * 2017-02-14 2018-08-23 The Trustees Of The University Of Pennsylvania Event-based feature tracking
US9936230B1 (en) 2017-05-10 2018-04-03 Google Llc Methods, systems, and media for transforming fingerprints to detect unauthorized media content items
GB2562515A (en) * 2017-05-17 2018-11-21 Snell Advanced Media Ltd Generation of audio or video hash
US11783010B2 (en) 2017-05-30 2023-10-10 Google Llc Systems and methods of person recognition in video streams
US10366279B2 (en) 2017-08-29 2019-07-30 Bank Of America Corporation System for execution of multiple events based on image data extraction and evaluation
US10664688B2 (en) 2017-09-20 2020-05-26 Google Llc Systems and methods of detecting and responding to a visitor to a smart home environment
US10922551B2 (en) * 2017-10-06 2021-02-16 The Nielsen Company (Us), Llc Scene frame matching for automatic content recognition
AU2019239454B2 (en) * 2018-03-22 2021-12-16 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Method and system for retrieving video temporal segments
CN110826365B (zh) 2018-08-09 2023-06-23 阿里巴巴集团控股有限公司 一种视频指纹生成方法和装置
CN109167934B (zh) * 2018-09-03 2020-12-22 咪咕视讯科技有限公司 一种视频处理方法、装置及计算机可读存储介质
CN110009659B (zh) * 2019-04-12 2021-04-16 武汉大学 基于多目标运动跟踪的人物视频片段提取方法
CN110768964B (zh) * 2019-09-30 2022-01-04 深圳市奥拓电子股份有限公司 视频图像的编码处理方法、系统及存储介质
KR102423636B1 (ko) * 2019-11-04 2022-08-18 주식회사 베리굿즈 콘텐츠의 저작권 관리 방법
US11328095B2 (en) 2020-01-07 2022-05-10 Attestiv Inc. Peceptual video fingerprinting
CN111447411A (zh) * 2020-03-26 2020-07-24 杭州水行舟网络科技有限公司 一种云播网络教学管理系统
US11244169B2 (en) 2020-06-15 2022-02-08 Bank Of America Corporation System for executing multiple events based on video data extraction and evaluation
KR102268981B1 (ko) * 2020-11-30 2021-06-25 주식회사 비욘드테크 360도 영상에서의 특징값을 이용한 원본 영상 검출 장치 및 그 방법
US11687627B2 (en) * 2021-08-03 2023-06-27 International Business Machines Corporation Media transit management in cyberspace
CN115883873A (zh) * 2021-09-28 2023-03-31 山东云缦智能科技有限公司 一种基于视频基因的视频对比方法
US11683561B2 (en) * 2021-10-29 2023-06-20 The Nielsen Company (Us), Llc Methods and apparatus to create candidate reference signatures from signature fragments
KR20230072684A (ko) 2021-11-18 2023-05-25 서강대학교산학협력단 비디오 세그먼트 핑거프린트 생성 방법 및 이를 이용한 강건한 비디오 복사 검출 시스템
CN117333790B (zh) * 2023-04-23 2024-09-17 青岛尘元科技信息有限公司 视频事件的相似性判断方法、装置和电子设备

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4230990C1 (en) * 1979-03-16 2002-04-09 John G Lert Jr Broadcast program identification method and system
US4677466A (en) * 1985-07-29 1987-06-30 A. C. Nielsen Company Broadcast program identification method and apparatus
US5953439A (en) * 1994-11-04 1999-09-14 Ishihara; Ken Apparatus for and method of extracting time series image information
JP3358692B2 (ja) * 1995-08-02 2002-12-24 日本電信電話株式会社 映像ブロック分類方法及び装置
JP3378773B2 (ja) * 1997-06-25 2003-02-17 日本電信電話株式会社 ショット切換検出方法およびショット切換検出プログラムを記録した記録媒体
US7194752B1 (en) * 1999-10-19 2007-03-20 Iceberg Industries, Llc Method and apparatus for automatically recognizing input audio and/or video streams
JP2002245051A (ja) * 2001-02-15 2002-08-30 Nippon Telegr & Teleph Corp <Ntt> 動画像検索装置及び方法、その方法をコンピュータに実行させるためのプログラム並びにそのプログラムを記録した記録媒体
US7020304B2 (en) * 2002-01-22 2006-03-28 Digimarc Corporation Digital watermarking and fingerprinting including synchronization, layering, version control, and compressed embedding
JP3960151B2 (ja) * 2002-07-09 2007-08-15 ソニー株式会社 類似時系列検出方法及び装置、並びにプログラム
US20030191764A1 (en) * 2002-08-06 2003-10-09 Isaac Richards System and method for acoustic fingerpringting
US7375731B2 (en) * 2002-11-01 2008-05-20 Mitsubishi Electric Research Laboratories, Inc. Video mining using unsupervised clustering of video content
US7809154B2 (en) * 2003-03-07 2010-10-05 Technology, Patents & Licensing, Inc. Video entity recognition in compressed digital video streams
CA2530288C (en) * 2003-06-23 2013-08-27 Sumit Malik Fingerprinting of data
JP4359085B2 (ja) * 2003-06-30 2009-11-04 日本放送協会 コンテンツ特徴量抽出装置
GB2404296A (en) * 2003-07-23 2005-01-26 Sony Uk Ltd Data content identification using watermarks as distinct codes
US7336841B2 (en) * 2004-03-25 2008-02-26 Intel Corporation Fingerprinting digital video for rights management in networks
DE102004036154B3 (de) * 2004-07-26 2005-12-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur robusten Klassifizierung von Audiosignalen sowie Verfahren zu Einrichtung und Betrieb einer Audiosignal-Datenbank sowie Computer-Programm
US8600113B2 (en) * 2004-11-12 2013-12-03 The University Court Of The University Of St. Andrews System, method and computer program product for video fingerprinting
US7516074B2 (en) * 2005-09-01 2009-04-07 Auditude, Inc. Extraction and matching of characteristic fingerprints from audio signals
JP2007200249A (ja) * 2006-01-30 2007-08-09 Nippon Telegr & Teleph Corp <Ntt> 映像検索方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体
US8009861B2 (en) * 2006-04-28 2011-08-30 Vobile, Inc. Method and system for fingerprinting digital video object based on multiresolution, multirate spatial and temporal signatures
US7912894B2 (en) * 2007-05-15 2011-03-22 Adams Phillip M Computerized, copy-detection and discrimination apparatus and method
US8229227B2 (en) * 2007-06-18 2012-07-24 Zeitera, Llc Methods and apparatus for providing a scalable identification of digital video sequences
US8238669B2 (en) * 2007-08-22 2012-08-07 Google Inc. Detection and classification of matches between time-based media

Also Published As

Publication number Publication date
WO2009076823A1 (en) 2009-06-25
KR101171536B1 (ko) 2012-08-07
KR20100105578A (ko) 2010-09-29
JP5404644B2 (ja) 2014-02-05
US20090154806A1 (en) 2009-06-18
JP2011507081A (ja) 2011-03-03
EP2240871A4 (en) 2014-04-09
CN101896906A (zh) 2010-11-24
US9177209B2 (en) 2015-11-03
EP2240871A1 (en) 2010-10-20

Similar Documents

Publication Publication Date Title
CN101896906B (zh) 基于时间片段的提取和视频指纹的健壮性匹配
US11902711B2 (en) Systems and methods for generating bookmark video fingerprints
US9135674B1 (en) Endpoint based video fingerprinting
GB2464123A (en) Event-based temporal video fingerprinting
US20130177252A1 (en) Detecting Video Copies
Awad et al. Content-based video copy detection benchmarking at TRECVID
US20130006951A1 (en) Video dna (vdna) method and system for multi-dimensional content matching
KR20050010824A (ko) 워터마크를 추출하는 방법
Selvaraj et al. Inter‐frame forgery detection and localisation in videos using earth mover's distance metric
Allouche et al. Video fingerprinting: Past, present, and future
Min et al. Towards using semantic features for near-duplicate video detection
Esmaeili et al. Fast matching for video/audio fingerprinting algorithms
Covell et al. Detecting ads in video streams using acoustic and visual cues
Tan Multimodal network with cross-modal attention for audio-visual event localization
Shen et al. Automatic video archaeology: tracing your online videos
Döhring et al. Mining tv broadcasts 24/7 for recurring video sequences
Mathur et al. Multimodal misinformation analysis
Chen et al. A simplified approach to rushes summarization
Roopalakshmi et al. Efficient video copy detection using simple and effective extraction of color features
Whiten et al. VIVA-uOttawa/CBSA at TRECVID 2012: Interactive Surveillance Event Detection.
Varsharani et al. Survey on Web Scale Based Near Duplicate Video Retrieval
Guil et al. Computational intelligence in multimedia processing
Younessian et al. Scene signatures for unconstrained news video stories
Ulges et al. Automatic image and video understanding for investigations of child sexual abuse
Boato et al. Towards Multimedia Opinion Mining.

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: ORIENTAL CONCEPT CO., LTD.

Free format text: FORMER OWNER: INTERNATIONAL BUSINESS MACHINES CORPORATION

Effective date: 20140829

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; TO: HONG KONG, CHINA

TR01 Transfer of patent right

Effective date of registration: 20140829

Address after: 29, Tai Koo Plaza, 1 Queen's Road East, three Wan Chai, Hongkong, China

Patentee after: Oriental concept Limited

Address before: American New York

Patentee before: International Business Machines Corp.