CN112753226A - 用于识别和解译嵌入式信息卡内容的机器学习 - Google Patents

用于识别和解译嵌入式信息卡内容的机器学习 Download PDF

Info

Publication number
CN112753226A
CN112753226A CN201980044176.8A CN201980044176A CN112753226A CN 112753226 A CN112753226 A CN 112753226A CN 201980044176 A CN201980044176 A CN 201980044176A CN 112753226 A CN112753226 A CN 112753226A
Authority
CN
China
Prior art keywords
video stream
text
character
metadata
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201980044176.8A
Other languages
English (en)
Other versions
CN112753226B (zh
Inventor
M·斯托扬契奇
W·帕卡德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Stez Ltd
Original Assignee
Thuuz Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thuuz Inc filed Critical Thuuz Inc
Priority to CN202311699448.2A priority Critical patent/CN117880585A/zh
Publication of CN112753226A publication Critical patent/CN112753226A/zh
Application granted granted Critical
Publication of CN112753226B publication Critical patent/CN112753226B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/8549Creating video summaries, e.g. movie trailer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/908Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • G06V20/42Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items of sport video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/48Matching video sequences
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/635Overlay text, e.g. embedded captions in a TV program
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • G06V40/23Recognition of whole body movements, e.g. for sport training
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/23418Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234336Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by media transcoding, e.g. video is transformed into a slideshow of still pictures or audio is converted into text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/251Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/458Scheduling content for creating a personalised stream, e.g. by combining a locally stored advertisement with an incoming stream; Updating operations, e.g. for OS modules ; time-related management operations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8126Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts
    • H04N21/8133Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts specifically related to the content, e.g. biography of the actors in a movie, detailed information about an article seen in a video program
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20112Image segmentation details
    • G06T2207/20132Image cropping
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/44Event detection

Abstract

从嵌入在视频流中的卡图像中提取所述视频流的精彩片段的元数据。所述精彩片段可以是一个或多个用户特别感兴趣的视频流的片段,例如体育事件的广播。标识并处理嵌入在所述视频流的视频帧中的卡图像以提取文本。可以通过应用利用嵌入在体育运动电视节目内容中的卡图像提取的一组字符训练的机器学习模型来识别文本字符。可以预处理字符向量的训练集以最大化所述训练集成员之间的度量距离。可以解译所述文本以获得所述元数据。所述元数据可以与所述视频流的所述部分相关联地存储。所述元数据可以提供关于所述精彩片段的信息,并且可以与所述精彩片段的回放同时呈现。

Description

用于识别和解译嵌入式信息卡内容的机器学习
申请人:
Thuuz,公司
发明人
Mihailo Stojancic
Warren Packard
相关申请的交叉引用
本申请要求于2018年5月18日提交的题为“用于识别和解译嵌入式信息卡内容的机器学习(Machine Learning for Recognizing and Interpreting EmbeddedInformation Card Content)”(代理人案卷号THU010-PROV)的第62/673,412号美国临时申请的权益,所述美国临时申请以全文引用的方式并入本文中。
本申请要求于2019年5月14日提交的题为“用于识别和解译嵌入式信息卡内容的机器学习(Machine Learning for Recognizing and Interpreting EmbeddedInformation Card Content)”(代理人案卷号THU010)的第16/411,710号美国实用申请,所述美国实用申请以全文引用的方式并入本文中。
本申请要求于2018年5月18日提交的题为“用于实现体育运动精彩片段生成的视频处理(Video Processing for Enabling Sports Highlights Generation)”(代理人案卷号THU009-PROV)的第62/673,411号美国临时申请,所述美国临时申请以全文引用的方式并入本文中。
本申请要求于2019年5月14日提交的题为“用于实现体育运动精彩片段生成的视频处理(Video Processing for Enabling Sports Highlights Generation)”(代理人案卷号THU009)的第16/411,704号美国实用申请,所述美国实用申请以全文引用的方式并入本文中。
本申请要求于2018年5月18日提交的题为“用于嵌入式信息卡定位和内容提取的视频处理(Video Processing for Embedded Information Card Localization andContent Extraction)”(代理人案卷号THU012-PROV)的第62/673,413号美国临时申请的权益,所述美国临时申请以全文引用的方式并入本文中。
本申请要求于2019年5月14日提交的题为“用于嵌入式信息卡定位和内容提取的视频处理(Video Processing for Embedded Information Card Localization andContent Extraction)”(代理人案号THU012)的第16/411,713号美国实用申请,所述美国实用申请以全文引用的方式并入本文中。
本申请要求于2018年6月5日提交的题为“用于在体育赛事电视节目中检测人群噪声的出现的音频处理(Audio Processing for Detecting Occurrences of Crowd Noisein Sporting Event Television Programming)”(代理人案卷号THU007-PROV)的第62/680,955号美国临时申请的权益,所述美国临时申请以全文引用的方式并入本文中。
本申请要求于2018年7月30日提交的题为“用于从电视信号提取可变长度不相交区段的音频处理(Audio Processing for Extraction of Variable Length DisjointSegments from Television Signal)”(代理人案卷号THU006-PROV)的第62/712,041号美国临时申请的权益,所述美国临时申请以全文引用的方式并入本文中。
本申请要求于2018年10月16日提交的题为“用于检测以短时能量突发为特征的响亮声音的出现的音频处理(Audio Processing for Detecting Occurrences of LoudSound Characterized by Short-Time Energy Bursts)”(代理人案卷号THU016-PROV)的第62/746,454号美国临时申请的权益,所述美国临时申请以全文引用的方式并入本文中。
本申请涉及于2012年8月31日提交的题为“生成现场表演的兴奋水平(GeneratingExcitement Levels for Live Performances)”的第13/601,915号美国实用申请并于2015年6月16日作为第9,060,210号美国专利发布,所述美国实用申请以全文引用的方式并入本文中。
本申请涉及于2012年8月31日提交并于2014年9月23日作为第8,842,007号美国专利发布的题为“生成现场表演的提醒(Generating Alerts for Live Performances)”的第13/601,927号美国实用申请,所述美国实用申请以全文引用的方式并入本文中。
本申请涉及2012年8月31日提交的并于2013年11月26日作为第8,595,763号美国专利颁发的第13/601,933号美国实用申请“生成用于现场表演的前导广告(GeneratingTeasers for Live Performances)”,所述美国实用申请以全文引用的方式并入本文中。
本申请涉及2014年10月9日提交的题为“生成描绘事件的定制精彩片段序列(Generating a Customized Highlight Sequence Depicting an Event)”(代理人案卷号THU001)的第14/510,481号美国实用申请的优先权,所述美国实用申请以全文引用的方式并入本文中。
本申请涉及2015年5月12日提交的题为“生成描绘多个事件的定制精彩片段序列(Generating a Customized Highlight Sequence Depicting Multiple Events)”(代理人案卷号THU002)的第14/710,438号美国实用申请,所述美国实用申请以全文引用的方式并入本文中。
本申请涉及2015年10月7日提交的题为“具有叙述成分的精彩片段展现的定制产生(Customized Generation of Highlight Show with Narrative Component)”(代理人案卷号THU004)的第14/877,691号美国实用申请,所述美国实用申请以全文引用的方式并入本文中。
本申请涉及2016年9月14日提交的题为“用于与定制精彩片段展现交互的用户界面(User Interface for Interaction with Customized Highlight Shows)”(代理人案卷号THU005)的第15/264,928号美国实用申请,所述美国实用申请以全文引用的方式并入本文中。
技术领域
本文档涉及用于在递送多媒体内容的电视装置或视频服务器上标识多媒体内容和相关联的信息,并使嵌入式软件应用程序能够利用多媒体内容来提供与所递送的多媒体内容同步的内容和服务的技术。各种实施例涉及用于提供自动化视频和音频分析的方法和系统,所述自动化视频和音频分析用于标识和提取体育运动电视视频内容中基于事件的重要视频片段,标识视频精彩片段并将元数据与此类精彩片段关联以进行比赛前、比赛中和比赛后审查。
背景技术
长期以来,已经设想例如交互式广告的增强型电视应用程序以及具有比赛前、比赛中和比赛后交互式应用程序的增强型节目指南。正在要求原先为广播电视而设计的现有电缆系统支持许多新应用程序和服务,包括交互式电视服务和增强型(交互式)节目指南。
用于实现增强型电视应用程序的一些框架已经标准化。示例包括OpenCableTM增强型电视应用程序消息传递规范以及Tru2way规范,它们指的是通过有线视频网络递送的交互式数字电缆服务,并包括例如交互式节目指南、交互式广告、比赛等的特征。此外,有线电视运营商“OCAP”程序还提供交互式服务,例如电子商务购物、在线银行、电子节目指南和数字视频录制。这些努力已实现了第一代视频同步应用程序,并与编程者/广播公司递送的视频内容同步,并为电视节目提供了额外的数据和交互性。
视频/音频内容分析技术和功能强大的移动装置的最新发展为开发与实况电视节目事件同步地运行的复杂应用程序开辟了一系列新的可能性。在计算机视觉和视频处理方面的这些新技术和进步,以及现代处理器计算能力的提高,使得能够实时生成伴有元数据的复杂的节目内容精彩片段。
发明内容
呈现了用于体育事件电视节目内容的自动实时处理的方法和系统,以用于嵌入式信息卡定位以及嵌入式文本串的识别和解译。在至少一个实施例中,基于从嵌入在体育事件电视节目内容中的多个信息卡(卡图像)提取的字符的训练集来生成机器学习的字符分类模型。处理所提取的字符图像以在多维向量空间中生成多维字符向量的标准化训练集。接着对此训练集执行主成分分析(principal component analysis;PCA),以便导出跨越训练集的向量空间的正交基向量。
在至少一个实施例中,通过从正交基中选择有限数量的代表性正交向量来减小训练集向量空间的维数。通过利用机器学习算法结构,针对出现在嵌入式信息卡中的此特定组的所投射的字母数字字符生成分类模型,所述机器学习算法结构可以是已知的机器学习算法,例如多类支持向量机(multi-class support vector machine;SVM)或卷积神经网络(convolutional neural network;CNN)算法。
在至少一个实施例中,体育事件电视节目内容被实时处理以提取查询(来自信息卡中的字符串的嵌入式字符),并利用从嵌入式字符串中提取的个别字符图像来建立查询基础架构。在另一实施例中,将个别查询图像归一化以生成用于每个查询字符的查询向量;随后,将这些查询向量投射到跨越训练向量空间的正交基上以生成所投射的查询向量。在又一实施例中,通过将先前习得的字符分类模型应用于每个所投射的查询向量来识别(预测)所投射的查询向量。最后,通过含义提取来解译预测查询字符(形成预测字符串)。在至少一个实施例中,基于各种电视节目卡图像类型中的已知字符串位置以及基于字符串中个别字符的位置的知识来执行含义提取。在至少一个实施例中,所提取的信息自动地附加到与体育事件视频精彩片段相关联的体育事件元数据。
在至少一个实施例中,一种用于从视频流提取元数据的方法包括:存储视频流的至少一部分;标识嵌入在视频流的所述部分的一个或多个视频帧中的一个或多个卡图像;以及随后处理所述一个或多个信息卡图像以提取文本。在又一实施例中,从信息卡图像中提取的文本被解译为生成和存储与视频流的部分相关联的元数据。
在至少一个实施例中,视频流可为体育赛事的广播。视频流的部分可以是被视为一个或多个用户特别感兴趣的精彩片段。元数据可描述精彩片段。
在至少一个实施例中,方法可进一步包括:在标识一个或多个卡图像、处理所述一个或多个卡图像以及解译文本中的至少一项期间,为用户播放视频流。
在至少一个实施例中,方法可进一步包括:为用户播放精彩片段,并在所述精彩片段的回放期间将元数据呈现给用户。元数据可以提供与从中已经获得元数据的卡图像的精彩片段和时间线有关的实时信息。
在至少一个实施例中,提取文本可以包括:标识一个或多个卡图像内的一个或多个字符串;并记录对应于所述一个或多个字符串中的每个字符的一个或多个卡图像的卡图像的字符图像的位置和/或大小。
在至少一个实施例中,提取文本可进一步包括:通过对检测到的字符边界进行多重比较,消除一个或多个字符串的字符的字符边界,并清除看起来过于接近彼此的字符边界。
在至少一个实施例中,提取文本可进一步包括:通过在低强度像素计数与高强度像素计数之间建立对比率来对一个或多个字符串的字符执行图像验证。
在至少一个实施例中,解译文本可以包括:基于文本生成查询;生成n维查询特征向量;将n维查询特征向量投射到训练集正交基上;将所投射的n维查询特征向量应用于分类模型以产生预测查询,并从预测查询中提取文本的含义。
在至少一个实施例中,方法可进一步包括:生成训练集特征向量,以及使用训练集特征向量来导出训练集正交基。
在至少一个实施例中,方法可进一步包括:生成训练集特征向量,以及使用训练集特征向量和导出的训练集正交基向量来生成分类模型。
在至少一个实施例中,解译文本可进一步包括使用选自由以下组成的群组在的至少两个选择:文本内的一个或多个字符串的串长度、文本内的字符边界和/或字符的位置,以及文本内的字符边界和/或字符的水平位置。
在至少一个实施例中,存储与视频流的部分相关联的元数据可以包括存储与查询相关联的一个或多个视频帧的视频帧号。
在至少一个实施例中,解译文本可以包括:确定文本的一个或多个字符串的字符的字段位置;确定字符的字母数字值;以及使用字段位置和字母数字值以循序地解译一个或多个字符串。
在至少一个实施例中,解译文本可进一步包括:获得关于卡图像中的每一个的一个或多个卡字段的位置信息和其它信息,以及使用位置信息和其它信息来补偿一个或多个字符串的可能遗漏的前字符。
在至少一个实施例中,关于自动视频精彩片段生成描述了用于生成字符识别和分类模型的方法。方法包括:提取并存储将生成自动精彩片段元数据的视频流的至少一部分;标识嵌入在视频流的所述部分的一个或多个视频帧中的一个或多个信息卡图像;以及对所述一个或多个信息卡图像进行处理以提取多个字符图像。方法进一步包括:生成与多个字符图像相关联的训练特征向量;处理所述训练特征向量;使用所述训练特征向量中的至少一些来训练字符识别和分类模型;以及随后存储经处理的训练集和分类模型。可以通过增加训练特征向量的相互度量距离和/或通过减小含有训练特征向量的整体向量空间的维数来以增加训练特征向量的唯一性的方式来处理训练特征向量。
在至少一个实施例中,方法可进一步包括:在生成训练特征向量之前,将字符图像归一化到标准大小和/或标准照明。
在至少一个实施例中,生成训练特征向量可以包括将从字符图像提取的一组n个像素格式化为n维向量。
在至少一个实施例中,方法可进一步包括对训练特征向量执行主成分分析。使用至少一些训练特征向量来训练分类模型可以包括:选择训练特征正交基向量的子集,以及使用正交基向量的子集来训练字符识别和分类模型。
在至少一个实施例中,正交基向量可以跨越整体训练特征向量空间。减小整体训练特征向量空间的维数可以包括选择足够准确地表示所述训练特征向量空间的有限数量的正交基向量。减小整体向量空间的维数可以包括:仅选择与从正交基向量的矩阵导出的最大奇异值的集合相对应的正交基向量。存储分类模型可以包括存储有限数量的正交基向量,以供后续在分类模型生成和/或查询处理中使用。生成分类模型可以包括将有限数量的训练集正交基向量与从由SVM和CNN组成的群组中选出的机器学习算法结合使用。
在至少一个实施例中,方法可进一步包括:处理一个或多个信息卡图像以提取文本;解译所述文本以获得元数据;以及存储与视频流的部分相关联的元数据。方法进一步包括为用户播放视频流的部分,并在所述视频流的所述部分的回放期间将元数据呈现给用户。视频流可以是体育事件的广播。视频流的部分可包括被视为一个或多个用户特别感兴趣的精彩片段。元数据可描述精彩片段。
在至少一个实施例中,提取文本可包括将文本的文本串提取为查询。
在至少一个实施例中,提取文本可包括提取以下各项中的至少一个:体育事件的当前时间、体育事件的当前阶段、与体育事件有关的比赛时钟,以及与体育事件有关的比赛得分。
本文中描述进一步细节和变化。
附图说明
附图连同描述一起说明若干实施例。所属领域的技术人员将认识到在附图中说明的特定实施例仅是示例性的,且并不旨在限制范围。
图1A是描绘根据客户端/服务器实施例的硬件架构的框图,其中事件内容是经由网络连接的内容提供商提供。
图1B是描绘根据另一客户端/服务器实施例的硬件架构的框图,其中事件内容存储在基于客户端的存储装置处。
图1C是描绘根据独立实施例的硬件架构的框图。
图1D是描绘根据一个实施例的系统架构的概观的框图。
图2是描绘根据一个实施例的可并入到卡图像、用户数据、精彩片段数据和分类模型中的数据结构的示例的示意性框图。
图3是来自视频流的视频帧的示例的屏幕截图,其展示了可在体育事件电视节目内容中找到的帧内嵌入式信息卡图像。
图4是描绘根据一个实施例的实时接收和处理用于帧内信息卡定位以及内容提取和显现的电视节目内容的整体应用过程的流程图。
图5是描绘根据一个实施例的用于字符串限界框提取的检测到的和提取的信息卡图像的内部处理的流程图。
图6是描绘根据一个实施例的用于处理文本框以进行最终有界字符图像验证和相关联的位置参数提取的方法的流程图。
图7是描绘根据一个实施例的用于从嵌入式信息卡文本图像生成查询的方法的流程图。
图8是描绘根据一个实施例的基于机器学习的分类模型针对提取的查询字符串生成预测字母数字字符的方法流程图。
图9是描绘根据一个实施例的用于预测查询字母数字字符串解译的方法的流程图。
图10是描绘根据一个实施例的基于多类SVM分类器或CNN分类器预处理训练集向量和后续分类模型生成的流程图。
图11是描绘根据一个实施例的读取和解译信息卡中的文本字段以及利用帧内实时信息更新视频精彩片段元数据的整体过程的流程图。
具体实施方式
定义
呈现以下定义仅用于解释性的目的,且并不旨在限制范围。
·事件:出于本文中的论述的目的,术语“事件”指游戏、会话、比赛、系列节目、表演、节目、音乐会等,或其部分(例如动作、时期、四分之一、二分之一、一局、场景、章节等)。事件可以是体育事件、娱乐事件、事件中的参与者的较大群体内的单个个体或个体子集的特定表演等。非体育事件的示例包括电视节目、突发新闻、社会政治事件、自然灾害、电影、演出、广播节目、播客、有声读物、在线内容、音乐表演等。事件可以具有任何长度。出于说明性目的,本文中常常在体育事件的方面描述技术;然而,所属领域的技术人员将认识到,也可在其它背景下使用所述技术,所属背景包括用于任何视听、视觉、基于图形的、交互式、非交互式或基于文本的内容的精彩片段展现。因此,描述内容中的术语“体育事件”和任何其它体育特定术语的使用旨在说明一个可能的实施例,但并不旨在将所描述技术的范围限制于所述一个实施例。确切地,此类术语应被视为在适于技术时扩展到任何合适非体育背景。为易于描述,术语“事件”也用于是指事件的报道或表示,例如事件的视听记录,或包括事件的报道、描述或描绘的任何其它内容项目。
·精彩片段:事件的摘录或部分,或被认为是一个或多个用户特别感兴趣的与事件相关联的内容的摘录或部分。精彩片段可以具有任何长度。一般来说,本文中所描述的技术提供了用于针对任何合适事件标识和呈现一组定制精彩片段(其可以基于用户的特定特性和/或偏好被选择)的机制。“精彩片段”还可以用于是指精彩片段的报道或表示,例如精彩片段的视听记录,或包括精彩片段的报道、描述或描绘的任何其它内容项目。精彩片段无需限于事件自身的描绘,但可包括与事件相关联的其它内容。举例来说,对于体育事件,精彩片段可以包括比赛中音频/视频,以及例如比赛前、比赛中和比赛后采访、分析、解说等的其它内容。此类内容可以从线性电视被记录(例如作为描绘事件自身的视频流的部分),或从任何数量的其它来源检索。可以提供不同类型的精彩片段,包括例如发生的事(比赛中的表现)、字符串、控制权和序列,其全部定义于下文中。精彩片段无需具有固定持续时间,而是可以并入有开始偏移量和/或结束偏移量,如下文所描述。
·内容轮廓标:指示精彩片段的开始或结束的一个或多个视频帧。
·发生的事:事件期间发生的某事。示例包括:进球、比赛中的表现、进攻机会、命中、救球、射门、进篮、抢断、捕捉或尝试捕捉、侥幸逃脱、对抗、比赛的开始或结束、四分之一、二分之一、时段、或一局、投球、罚分、受伤、娱乐事件中的戏剧性事情、歌曲、独奏等。发生的事也可以是异常的,例如电力中断、球迷不受规矩的意外事件等。可以将此类发生的事的检测用作确定是否将视频流的特定部分指定为精彩片段的基础。为易于命名,在本文中也将发生称作“比赛中的表现”,但此类用法不应被认作限制范围。发生的事可以具有任何长度,并且发生的事的表示可以具有变化的长度。举例来说,如上文所提及,发生的事的延长表示可包括描绘恰在发生的事之前和恰在发生的事之后的时间段的连续镜头,而短暂表示可仅包括发生的事自身。也可以提供任何中间表示。在至少一个实施例中,发生的事的表示的持续时间的选择可以取决于用户偏好、可用时间、所确定的发生的事的兴奋水平、发生的事的重要性和/或任何其它因素。
·偏移量:精彩片段长度被调整的量。在至少一个实施例中,可以提供开始偏移量和/或结束偏移量,以用于分别调整精彩片段的开始时间和/或结束时间。举例来说,如果精彩片段描绘进球,则可以将精彩片段延长(经由结束偏移量)几秒以便包括在进球之后的庆祝和/或球迷反应。偏移量可以被配置成例如基于可用于精彩片段的时间量、精彩片段的重要性和/或兴奋水平和/或任何其它合适因素而自动地或手动地变化。
·字符串:在某种程度上彼此联系或相关的一系列发生的事。发生的事可以发生于一个控制权(下文所定义)内,或可以跨越多个控制权。发生的事可以发生于一个序列(下文所定义)内,或可以跨越多个序列。发生的事可以由于彼此的某种主题性或叙述性连接或者因为一者导致另一者、或者出于任何其它原因而联系或相关。字符串的一个示例是导致进球或进篮的一组传球。这不应与“文本串”混淆,“文本串”具有计算机编程领域中通常赋予的含义。
·控制权:事件的任何时间分隔部分。控制权的开始时间/结束时间的分界可以取决于事件类型。对于一个团队可以处于进攻而另一团队处于防守(例如篮球或足球)的某些体育事件,控制权可以被定义为一个团队有球的时间段。在例如曲棍球或英式足球等体育运动中,其中球块或球控制权更为易变,控制权可以视为扩展到一个团队具有对球块或球的实质控制而忽略另一团队的瞬时接触(例如被阻挡的射门或救球)的时间段。对于棒球,控制权被定义为半局。对于足球,控制权可以包括同一团队有球的数个序列。对于其它类型的体育事件以及非体育事件,术语“控制权”可能稍微用词不当,但在本文中仍用于说明性目的。非体育背景下的示例可包括章节、场景、动作等。举例来说,在音乐演唱会的背景下,控制权可能等同于演奏单首歌曲。控制权可以包括任何数量的发生的事。
·序列:事件的包括动作的一个连续时间段的时间分隔部分。举例来说,在体育事件中,序列可以在动作开始(例如开球、跳球等)时开始,且可以在哨子吹响以表示动作中止时结束。在例如棒球或足球等的体育运动中,序列可以等效于为发生的事的形式的比赛中的表现。序列可以包括任何数目的控制权,或可为控制权的一部分。
·精彩片段展现:被布置成呈现给用户的一组精彩片段。精彩片段展现可以被线性地呈现(例如视频流),或以允许用户选择查看哪一精彩片段以及查看次序(例如通过在链接或缩略图上点击)的方式被呈现。精彩片段展现的呈现可为非交互式或交互式,例如允许用户暂停、快退、跳过、快进、传达偏好或厌恶等。精彩片段展现可以例如为浓缩的比赛。精彩片段展现可以包括来自单个事件或多个事件的任何数目的邻接或非邻接精彩片段,且可以甚至包括来自不同类型的事件的精彩片段(例如,不同体育运动,和/或来自体育和非体育事件的精彩片段的组合)。
·用户/观看者:术语“用户”或“查看者”可互换地是指观看、收听或以其它方式经历事件、事件的一个或多个精彩片段或精彩片段展现的个体、群组或其他实体。术语“用户”或“观看者”还可以是指可以在某个未来时间观看、收听或以其它方式经历事件、事件的一个或多个精彩片段或精彩片段展现的个体、群组或其他实体。术语“观看者”可以用于描述性目的,但事件无需具有视频分量,使得“观看者”可以代替地是内容的收听者或任何其他消费者。
·叙述:以特定次序连接一组精彩片段区段的一个连贯的故事。
·兴奋水平:事件或精彩片段被预期为对于特定用户或一般来说为用户的兴奋或感兴趣程度的度量。也可以相对于特定发生的事或运动员确定兴奋水平。上文所引用的相关申请中论述了用于测量或评估兴奋水平的各种技术。如所论述,兴奋水平可以取决于事件内的发生的事,以及例如事件的总体背景或重要性等其它因素(季后赛、角旗暗示、争夺等)。在至少一个实施例中,兴奋水平可以与事件内的每个发生的事、字符串、控制权或序列相关联。举例来说,可以基于发生于控制权内的发生的事而确定所述控制权的兴奋水平。对于不同用户(例如一个团队的球迷对中立的球迷)可以不同地测得兴奋水平,并且其可以取决于每个用户的个人特性。
·元数据:与其它数据有关并与其它数据相关联地存储的数据。主要数据可以是例如体育节目或精彩片段的媒体。
·卡图像:视频帧中的图像,其可提供关于视频中描绘的任何内容(例如事件、事件的描绘或其一部分)的数据。示例性卡图像含有比赛得分、比赛时钟和/或体育事件的其它统计数据。卡图像可能会临时出现或在视频流的整个持续时间中出现;临时出现的那些卡图像可能特别与它们出现在视频流中的部分有关。
·字符图像:被认为与单个字符有关的图像的一部分。字符图像可包括字符周围的区域。举例来说,字符图像可包括围绕字符的大致矩形的限界框。
·字符:可以是单词、数字或单词或数字的表示的一部分的符号。字符可以包括字母、数字和特殊字符,并且可呈任何语言。
·字符串:一组字符,这些字符以表明它们与一条信息有关的方式组合在一起,例如,在体育事件中比赛的团队的名称。英语语言字符串通常会水平排列,并从左到右读取。然而,字符串在英语和其它语言中的排列方式可能有所不同。
概观
根据各种实施例,提供了用于自动地创建与体育事件的电视节目的精彩片段相关联的基于时间的元数据的方法和系统。可相对于体育事件的电视广播或者在体育事件的电视广播之后经由视频服务器从备份装置流式传输体育事件视频内容的同时,同步提取精彩片段和相关联的帧内的基于时间的信息。
在至少一个实施例中,软件应用程序与电视节目内容的回放和/或接收同步地操作,以提供与内容精彩片段相关联的信息元数据。此类软件可在例如电视装置自身上或在相关联的机顶盒(set-top box;STB)上运行,或在具有接收和随后流式传输节目内容的能力的视频服务器上运行,或在配备有接收包括实况节目的视频馈送的能力的移动装置上运行。在至少一个实施例中,精彩片段和相关联的元数据应用程序与电视节目内容呈现同步地操作。
交互式电视应用程序可以在主电视显示器上或在例如平板电脑、笔记本电脑或智能手机的辅助显示器上向观看电视节目的用户及时地、相关地呈现精彩片段的电视节目内容。生成和/或实时存储表示电视广播内容精彩片段的一组视频剪辑以及含有基于时间的元数据的数据库,所述基于时间的元数据更详细地描述了由精彩片段视频剪辑呈现的事件。
伴随视频剪辑的元数据可以是任何信息,例如文本信息、一组图像和/或任何类型的视听数据。与比赛中和比赛后视频内容精彩片段相关联的一种类型的元数据携载关于通过读取嵌入在节目内容的视频帧中的一个或多个的信息卡(“卡图像”)而直接从实况节目内容中提取的体育比赛参数的实时信息。在至少一个实施例中,所描述的系统和方法实现此类型的自动元数据生成,因此将卡图像内容与所分析的数字视频流的视频精彩片段相关联。
在各种实施例中,描述自动化过程,包括:接收数字视频流;分析数字视频流的一个或多个视频帧以用于卡图像的存在和提取;定位卡图像内的文本框;以及识别和解译驻留在文本框内的字符串。
本文中呈现的自动化元数据生成视频系统可以接收实况广播视频流或经由计算机服务器流式传输的数字视频,并且可以使用计算机视觉和机器学习技术实时地处理视频流以从嵌入式信息卡提取元数据。
在至少一个实施例中,标识与所提取的信息卡文本框相关联的字符串,并且记录字符串中的每个字符的图像的位置和大小。随后,识别来自信息卡的各种字段的文本字符中的任何数量的字符,并且解译具有所识别的字符的文本串,从而提供与体育事件电视节目有关的实时信息,例如比赛的当前时间和阶段、比赛得分、比赛中的表现信息等。
在另一实施例中,从嵌入式字符串提取个别字符图像,且随后用于生成归一化的查询向量。随后将这些归一化的查询向量投射到跨越训练向量空间的正交基上,所述训练向量先前经汇编且用于训练机器学习分类器,例如多类支持向量机(multi-class supportvector machine;SVM)分类器(例如,C.BURGES,“用于模式识别的支持向量机的教程(ATutorial on Support Vector Machines for Pattern Recognition)”,克吕维尔科学出版社(Kluwer Academic Publishers),1998)。所投射的查询随后用于生成查询预测作为由示例性SVM训练机制产生的预先训练好的分类模型的输出。应注意,分类模型不限于基于SVM的模型。还可使用其它技术产生分类模型,例如卷积神经网络(convolutional neuralnetwork;CNN),且所述分类模型具有适合于本文中呈现的训练数据集的CNN算法机制(例如,在Y.LeCun等人的“有效的神经网络反向传播(Efficient NN Back Propagation)”,斯普林格出版社,1998)中的众多变化。
在又一实施例中,查询字符预测通过针对先前开发的机器学习分类模型应用所投射的查询字符向量而生成。在此步骤中,根据先前建立的分类标记生成预测字符串,且将预测字母数字字符串传递到识别和解译过程。查询识别和解译过程应用先前的知识和对驻留于众多信息卡字段中的字符的位置理解。进一步解译定位于特定字符群组中的每个预测字母数字字符的含义,且将所导出的信息附加到由视频精彩片段生成应用程序处理的视频精彩片段元数据。
在又一实施例中,考虑生成字符分类模型,其中所述模型是基于从嵌入在体育事件电视节目内容中的任何数量的信息卡提取的字符的训练集。检测到字符限界框,且从众多信息卡提取字符。随后将这些字符图像归一化到标准化大小和照明,以形成与来自嵌入式信息卡中呈现的一组字母数字字符的每个特定字符相关联的描述符。以此方式,每个所提取的字符图像表示含有向量的训练集的多维向量空间中的n维向量。表示所述组字符图像的n维训练向量经进一步处理以增加唯一性和相互度量距离,以及减小训练向量的整体向量空间的维数。
在至少一个实施例中,主成分分析(例如G.Golub和F.Loan,“矩阵计算(MatrixComputations)”,约翰霍普金斯大学出版社,巴尔的摩,1989)在训练向量集上执行。因此,根据训练集设计向量的正交基,使得所述正交基向量跨越训练集向量空间。另外,通过选择有限数量的正交基向量来减小训练集向量空间的维数,使得仅保留与由基向量的训练集矩阵的奇异值分解生成的最大奇异值的集合相关联的最重要的正交向量。随后,保存所选择的训练集基向量以便后续使用针对数据集的可用的算法结构中的一个或多个(例如多类基于SVM的分类器或基于CNN的分类器)来生成分类模型。
系统架构
根据各种实施例,系统可以实施于任何电子装置或一组电子装置上,所述电子装置经装备以接收、存储和呈现信息。此类电子装置可能是例如台式计算机、膝上型计算机、电视、智能手机、平板电脑、音乐播放器、音频装置、公用信息机(kiosk)、机顶盒(set-topbox;STB)、游戏系统、可穿戴式装置、消费者电子装置等。
虽然本文中结合特定类型的计算装置中的实施方案描述了系统,但所属领域的技术人员将认识到,本文中所描述的技术可以在其它背景下实施,且实际上在能够接收和/或处理用户输入并将输出呈现给用户的任何合适装置中实施。因此,以下描述旨在借助于示例说明各种实施例,而不是限制范围。
现在参看图1A,展示了描绘根据客户端/服务器实施例的用于从嵌入在事件的视频流中的卡图像自动地提取元数据的系统100的硬件架构的框图。例如视频流的事件内容可经由网络连接的内容提供商124来提供。此类客户端/服务器实施例的示例是基于网络的实施方案,其中一个或多个客户端装置106中的每一个运行浏览器或应用程序,所述浏览器或应用程序提供用于经由通信网络104与来自包括数据提供商服务器122和/或内容提供商服务器124的各种服务器102、114、116的内容交互的用户界面。响应于来自客户端装置106的请求而传输内容和/或数据可以使用任何已知协议和语言进行,例如超文本标记语言(Hypertext Markup Language;HTML)、Java、Objective C、Python、JavaScript等。
客户端装置106可以是任何电子装置,例如台式计算机、膝上型计算机、电视、智能手机、平板电脑、音乐播放器、音频装置、公用信息机、机顶盒、游戏系统、可穿戴式装置、消费者电子装置等。在至少一个实施例中,客户端装置106具有所属领域的技术人员众所周知的数个硬件组件。输入装置151可以是从用户150接收输入的任何组件,包括例如手持式遥控器、键盘、鼠标、触笔、触敏屏(触摸屏)、触摸垫、姿势感受器、轨迹球、加速度计、五路开关、麦克风等。可以经由任何合适模式提供输入,包括例如以下各项中的一个或多个:指向、轻触、打字、拖动、做姿势、倾斜、摇动和/或语音。显示屏幕152可以是以图形方式显示信息、视频、内容等的任何组件,包括事件、精彩片段等的描绘。此类输出还可以包括例如视听内容、数据可视化、导览元素、图形元素、请求用于内容选择的信息和/或参数的查询等。在每次仅呈现期望输出中的一些的至少一个实施例中,例如滚动机制的动态控制可经由输入装置151而可用于选择当前显示哪些信息,和/或更改信息被显示的方式。
处理器157可以是用于根据众所周知的技术在软件的指导下对数据执行操作的常规微处理器。存储器156可以是具有所属领域中已知的结构和架构的随机存取存储器,其供处理器157在运行软件以执行本文中所描述的操作的过程中使用。客户端装置106还可以包括本地存储装置(未展示),其可为硬盘驱动器、快闪驱动器、光学或磁性存储装置、基于网络(基于云)的存储装置等。
任何合适类型的通信网络104,例如因特网、电视网络、有线电视网络、蜂窝网络等,可以用作用于根据任何合适协议和技术在客户端装置106和各种服务器102、114、116和/或内容提供商124和/或数据提供商122之间传输数据的机制。除了因特网之外,其它示例还包括蜂窝电话网络、EDGE、3G、4G、长期演进(long term evolution;LTE)、会话起始协议(Session Initiation Protocol;SIP)、短消息点对点协议(Short Message Peer-to-Peer protocol;SMPP)、SS7、Wi-Fi、蓝牙、ZigBee、超文本传输协议(Hypertext TransferProtocol;HTTP)、安全超文本传输协议(Secure Hypertext Transfer Protocol;SHTTP)、传输控制协议/因特网协议(Transmission Control Protocol/Internet Protocol;TCP/IP)等,及/或其任何组合。在至少一个实施例中,客户端装置106经由通信网络104传输对数据和/或内容的请求,并从服务器102、114、116接收含有所请求的数据和/或内容的响应。
在至少一个实施例中,图1A的系统结合体育事件而操作;然而,本文中的教示还适用于非体育事件,并且应了解,本文中所描述的技术不限于对体育事件的应用。举例来说,本文中所描述的技术可以用于结合电视节目、电影、新闻事件、游戏节目、政治性动作、商业节目、戏剧和/或其它片段式内容而操作,或可以用于一个以上的此类事件。
在至少一个实施例中,系统100通过分析广播事件的视频流来标识所述事件的精彩片段。此分析可以实时进行。在至少一个实施例中,系统100包括经由通信网络104联接到一个或多个客户端装置106的一个或多个网络服务器102。通信网络104可以是公共网络、专用网络,或公共网络和专用网络的组合,例如因特网。通信网络104可以是LAN、WAN、有线、无线和/或以上的组合。在至少一个实施例中,客户端装置106能够经由有线或无线连接而连接到通信网络104。在至少一个实施例中,客户端装置还可以包括能够接收和记录事件的记录装置,例如DVR、PVR或其它媒体记录装置。此类记录装置可以是客户端装置106的部分,或可以在外部;在其它实施例中,此类记录装置可以被省略。虽然图1A展示一个客户端装置106,但系统100可以用任何数量的单个类型或多个类型的客户端装置106进行实施。
网络服务器102可以包括一个或多个物理计算装置和/或软件,其可以从客户端装置106接收请求并以数据对那些请求做出响应,以及发送出未经请求的提醒和其它消息。网络服务器102可以采用针对容错性和可缩放性的各种策略,例如负载平衡、高速缓冲存储和聚类。在至少一个实施例中,网络服务器102可以包括如所属领域中已知的高速缓冲存储技术以用于存储与事件相关的客户端请求和信息。
网络服务器102可以维持或以其它方式指定一个或多个应用程序服务器114以对从客户端装置106接收的请求做出响应。在至少一个实施例中,应用程序服务器114提供对业务逻辑的访问以供客户端装置106中的客户端应用程序使用。应用程序服务器114可以与网络服务器102共同定位、共同拥有或共同管理。应用程序服务器114也可以远离网络服务器102。在至少一个实施例中,应用程序服务器114与一个或多个分析服务器116和一个或多个数据服务器118交互以执行所公开技术的一个或多个操作。
一个或多个存储装置153可以通过存储与系统100的操作有关的数据来充当“数据存储区”。此数据可以包括例如但不限于与嵌入在呈现例如体育事件的事件的视频流中的卡图像相关的卡数据154、与一个或多个用户150相关的用户数据155、与事件的一个或多个精彩片段相关的精彩片段数据164,及/或可用于从卡数据154预测和/或提取文本的分类模型165。
卡数据154可以包括与嵌入在视频流中的卡图像有关的任何信息,例如卡图像自身、其子集(例如字符图像)、从卡图像提取的文本(例如字符和字符串)以及可有助于文本和/或含义提取的任何前述内容的属性。用户数据155可以包括描述一个或多个用户150的任何信息,包括例如人口统计数据、购买行为、视频流查看行为、兴趣、偏好等。精彩片段数据164可以包括精彩片段、精彩片段标识符、时间指示符、类别、兴奋水平,以及与精彩片段有关的其它数据。分类模型165可以包括机器训练的分类模型、查询、查询特征向量、训练集正交基、预测查询、所提取的文本含义和/或有助于从卡数据154提取文本和/或含义的其它信息。随后将详细描述卡数据154、用户数据155、精彩片段数据164和分类模型165。
值得注意的是,系统100的许多组件可以是或可以包括计算装置。此类计算装置可以各自具有与客户端装置106的架构类似的架构,如上文所展示和描述。因此,通信网络104、网络服务器102、应用程序服务器114、分析服务器116、数据提供商122、内容提供商124、数据服务器118和存储装置153中的任一个可以包括一个或多个计算装置,所述计算装置中的每一个可以任选地具有输入装置151、显示屏幕152、存储器156和/或处理器157,如上文结合客户端装置106所描述。
在系统100的示例性操作中,客户端装置106的一个或多个用户150观看呈视频流的形式的来自内容提供商124的内容。视频流可以展示例如体育事件的事件。视频流可以是可以容易地用已知计算机视觉技术处理的数字视频流。
在显示视频流时,系统100的一个或多个组件(例如客户端装置106、网络服务器102、应用程序服务器114和/或分析服务器116)可以分析视频流、标识视频流内的精彩片段,及/或从视频流,例如从所述视频流的嵌入式卡图像和/或其它方面提取元数据。可以响应于接收到对标识视频流的精彩片段和/或元数据的请求而进行此分析。替代地,在另一实施例中,可以在用户150没有做出特定请求的情况下标识精彩片段。在又一实施例中,可在不显示视频流的情况下进行视频流的分析。
在至少一个实施例中,用户150可经由客户端装置106处的输入装置151指定用于分析视频流的某些参数(例如,要包括什么事件/比赛/团队、用户150有多少时间可用于观看精彩片段、需要什么元数据,及/或任何其它参数)。还可以从存储装置,例如从存储在一个或多个存储装置153中的用户数据155提取用户偏好,以便定制对视频流的分析,而不必要求用户150指定偏好。在至少一个实施例中,可以基于观测到的用户150的行为和动作来确定用户偏好,例如,通过观测网站访问模式、电视观看模式、音乐收听模式、在线购买、先前精彩片段标识参数、由用户150实际上观看的精彩片段和/或元数据等。
另外或替代地,可以从由用户150明确地提供的先前存储的偏好检索用户偏好。此类用户偏好可以指示用户150感兴趣的是哪些团队、体育运动、运动员和/或事件类型,及/或它们可以指示用户150感兴趣的将是哪种类型的元数据或与精彩片段相关的其它信息。因此,此类偏好可以用于导引对视频流的分析以标识精彩片段和/或提取精彩片段的元数据。
可以包括如上文所描述的一个或多个计算装置的分析服务器116可以分析与来自数据提供商122的一个或多个事件相关的体育比赛现场解说统计数据的实况和/或所录制的馈送。数据提供商122的示例可以包括但不限于例如STATSTM、Perform(购自英国伦敦的Opta Sports)以及瑞士圣加仑州的SportRadar的实时体育运动信息的提供商。在至少一个实施例中,分析服务器116针对事件生成不同组兴奋水平;此类兴奋水平可接着根据本文中所描述的技术而结合由系统100标识的精彩片段被存储。
应用程序服务器114可以分析视频流以标识精彩片段和/或提取元数据。另外或替代地,此类分析可以由客户端装置106执行。所标识的精彩片段和/或所提取的元数据可以特定于用户150;在此情况下,在客户端装置106中标识与特定用户150有关的精彩片段可能是有利的。如上文所描述,客户端装置106可以接收、保留和/或检索适用的用户偏好以用于精彩片段标识和/或元数据提取。另外或替代地,精彩片段生成和/或元数据提取可以在全局范围内执行(即,使用适用于一般用户群体的客观标准,而不考虑特定用户150的偏好)。在此情况下,在应用程序服务器114中标识精彩片段和/或提取元数据可能是有利的。
有助于精彩片段标识和/或元数据提取的内容可以来自任何合适来源,包括来自内容提供商124,所述内容提供商可以包括例如YouTube、MLB.com等网站;体育运动数据提供商;电视台;基于客户端或服务器的DVR;及/或类似者。替代地,内容可以来自例如DVR的本地来源或与客户端装置106相关联(或内置于客户端装置中)的其它记录装置。在至少一个实施例中,应用程序服务器114生成定制的具有精彩片段和元数据的精彩片段展示,用户150可以下载、流式传输内容,或点播内容或以某一其它方式来使用所述精彩片段展示。
如上文所提及,在与特定用户150相关联的特定客户端装置106处执行特定于用户的精彩片段标识和/或元数据提取可能是有利的。此实施例可以避免对不必要地经由通信网络104传输视频内容或其它高带宽内容的需求,特别是如果此类内容在客户端装置106处已经可用的情况下。
举例来说,现在参看图1B,展示了根据实施例的系统160的示例,其中卡数据154、精彩片段数据164和分类模型165中的至少一些存储在基于客户端的存储装置158处,所述基于客户端的存储装置可以是客户端装置106可用的任何形式的本地存储装置。示例可以是记录事件的DVR,例如用于完整体育事件的视频内容。替代地,基于客户端的存储装置158可以是用于数字形式的数据的任何磁性、光学或电子存储装置;示例包括快闪存储器、磁性硬盘驱动器、CD-ROM、DVD-ROM或与客户端装置106集成的其它装置或以通信方式与客户端装置106联接的其它装置。基于由(一个或多个)应用程序服务器114提供的信息,客户端装置106可从存储在基于客户端的存储装置158处的卡数据154提取元数据,并且将所述元数据存储为精彩片段数据164,而不必从内容提供商124或其它远程来源检索其它内容。此布置可节省带宽,且可有效地利用可能已经可用于客户端装置106的现有硬件。
返回到图1A,在至少一个实施例中,应用程序服务器114可以根据个别用户偏好和/或其它参数来针对不同用户150标识不同的精彩片段和/或提取不同元数据。可以经由例如客户端装置106处的显示屏幕152的任何合适输出装置将所标识的精彩片段和/或提取的元数据呈现给用户150。视需要,可以标识多个精彩片段,并将其与相关联的元数据一起编译为精彩片段展示。可以经由菜单来访问此类精彩片段展示,及/或将其拼接成“精彩片段集锦”或一组精彩片段,所述“精彩片段集锦”或一组精彩片段根据预定序列为用户150播放。在至少一个实施例中,用户150可以经由输入装置151控制相关联的元数据的精彩片段回放和/或递送,例如以:
·选择要显示的特定精彩片段和/或元数据;
·暂停、快退、快进;
·向前跳到下一精彩片段;
·返回到精彩片段展现内的前一精彩片段的开始;及/或
·执行其它动作。
在上文所引用的相关美国专利申请中提供了关于此类功能性的额外细节。
在至少一个实施例中,提供了一个或多个数据服务器118。数据服务器118可以响应于来自服务器102、114、116中的任一个的对数据的请求,例如以获得或提供卡数据154、用户数据155、精彩片段数据164和/或分类模型165。在至少一个实施例中,此类信息可以存储在可以由数据服务器118访问的任何合适存储装置153处,并且可以来自任何合适来源,例如来自客户端装置106自身、内容提供商124、数据提供商122等。
现在参看图1C,展示了根据替代实施例的系统180,其中在单独环境中实施系统180。与图1B所示的实施例一样,卡数据154、用户数据155、精彩片段数据164和分类模型165中的至少一些可存储在例如DVR等基于客户端的存储装置158处。替代地,基于客户端的存储装置158可以是快闪存储器或硬盘驱动器,或与客户端装置106集成的其它装置或与以通信方式与客户端装置106联接的其它装置。
用户数据155可以包括用户150的偏好和兴趣。基于此用户数据155,系统180可以提取卡数据154内的元数据以便以本文中所描述的方式呈现给用户150。另外或替代地,可以基于不基于特定于用户150的信息的客观标准来提取元数据。
现在参看图1D,展示了根据替代实施例的具有架构的系统190的概观。在图1D中,系统190包括广播服务,例如内容提供商124;呈客户端装置106形式的内容接收器,例如具有STB的电视;能够摄取和流式传输电视节目内容的视频服务器,例如分析服务器116;及/或能够接收和处理电视节目内容的其它客户端装置106,例如移动装置和手提式计算机,全部经由例如通信网络104等网络进行连接。例如DVR的基于客户端的存储装置158可以连接到客户端装置106和/或其它组件中的任一个,并且可以存储视频流、精彩片段、精彩片段标识符和/或元数据,以有助于经由客户端装置106中的任一个标识和呈现精彩片段和/或所提取的元数据。
图1A、图1B、图1C和图1D中描绘的特定硬件架构仅是示例性的。所属领域的技术人员将认识到可以使用其它架构实施本文中所描述的技术。其中描绘的许多组件是任选的,且可以省略、与其它组件合并和/或用其它组件替换。
在至少一个实施例中,系统可以被实施为以任何合适计算机编程语言编写的软件,无论是在独立还是客户端/服务器架构中。替代地,其可以硬件实施和/或嵌入。
数据结构
图2是描绘根据一个实施例的可并入到卡数据154、用户数据155、精彩片段数据164和分类模型165中的数据结构的示例的示意性框图。
如所展示,卡数据154可以包括嵌入在一个或多个视频流中的多个卡图像中的每一个的记录。卡图像中的每一个可以含有一个或多个字符串200。字符串200中的每一个可以具有用于n个字符的记录。每个此类记录可以具有字符图像202、经处理的字符图像203、字符边界204、大小205、位置206、对比率207和/或解译208。字符串200中的每一个可以进一步具有指示字符串200的长度(例如,在字符、像素或类似者中)的串长度209。
字符图像202可以是含有单个字符的卡图像的特定部分。经处理的字符图像203可以是在应用例如针对大小、亮度等的归一化的一个或多个处理步骤之后的字符图像202。
字符边界204可以指示字符图像202、经处理的字符图像203和/或字符图像202和经处理的字符图像203中表示的字符的边界。
大小205可以是字符图像202、经处理的字符图像203和/或字符图像202和经处理的字符图像203中表示的字符的例如以像素计的大小。
位置206可以是字符图像202、经处理的字符图像203和/或在卡图像内的字符图像202和经处理的字符图像203中表示的字符的位置。在一些示例中,位置206可以指示呈二维形式的位置(例如,字符图像202、经处理的字符图像203和/或字符图像202和经处理的字符图像203中表示的字符的拐点或中心的x坐标和y坐标)。
对比率207可以是字符图像202、经处理的字符图像203和/或字符图像202和经处理的字符图像203中表示的字符的对比度的指示符。在一些示例中,对比率207可以是一个或多个最亮像素的亮度值与在字符图像202、经处理的字符图像203和/或字符图像202和经处理的字符图像203中表示的字符内的一个或多个最暗像素的亮度值的比率。
解译208可以是特定字符,例如,a、b、c、1、2、3、#、&等,所述特定字符被认为在已经执行一些分析以解译字符串200之后在字符图像202中表示。
图2中阐述的卡数据154的结构仅是示例性的;在一些实施例中,与嵌入在视频流中的卡图像相关的数据可以不同地组织。举例来说,在其它实施例中,每个字符串不必分解为个别字符图像。相反,字符串可以作为整体解译,并且可以存储用于解译字符串的数据以用于整个字符串。此外,在替代实施例中,上文中未特定地描述的数据可以并入到卡数据154中。图2的用户数据155、精彩片段数据164和分类模型165的结构同样仅是示例性的;所属领域的技术人员可以设想许多替代方案。
如进一步所示,用户数据155可以包括与用户150有关的记录,所述记录中的每一个可以包括特定用户150的人口统计数据212、偏好214、观看历史记录216和购买历史记录218。
人口统计数据212可以包括任何类型的人口统计数据,包括但不限于年龄、性别、位置、国籍、宗教信仰、教育程度等。
偏好214可以包括用户150考虑到他或她的偏好做出的选择。偏好214可直接涉及精彩片段和元数据的收集和/或观看,或者本质上可以更普遍。在任一情况下,偏好214可以用于促进将精彩片段和元数据标识和/或呈现给用户150。
观看历史216可以列出由用户150所检索和/或观看的电视节目、视频流、精彩片段、网页、搜索查询、体育事件和/或其它内容。
购买历史记录218可以列出由用户150所购买或请求的产品或服务。
如进一步所示,精彩片段数据164可以包括j个精彩片段220的记录,所述记录中的每一个可以包括针对特定精彩片段220的视频流222、标识符和/或元数据224。
视频流222可以包括描绘精彩片段220的视频,所述视频可以从一个或多个事件的一个或多个视频流中获得(例如,通过剪切视频流以仅包括与精彩片段220有关的视频流222)。标识符223可以包括时间代码和/或其它标记,其指示精彩片段220驻留于从中获得其的事件的视频流内的位置。
在一些实施例中,精彩片段220中的每一个的记录可含有视频流222和标识符223中的仅一个。可以通过为用户150播放视频流222来执行精彩片段回放,或通过使用标识符223针对从中获得精彩片段220的事件仅播放视频流的有精彩片段的部分来执行精彩片段回放。
元数据224可以包括关于精彩片段220的信息,例如事件日期、季节和从中获得精彩片段220的事件或视频流中涉及的群组或个人,例如团队、运动员、教练、压阵队员、广播员和球迷等。除了其它信息之外,每个精彩片段220的元数据224可以包括时间225、阶段226、时钟227、得分228和/或帧号229。
时间225可以是在从中获得精彩片段220的视频流222内或在与精彩片段220有关的视频流222内的时间,在所述时间,元数据可用。在一些示例中,时间225可以是视频流222内与精彩片段220有关的回放时间,在所述时间,显示含有元数据224的卡图像。
阶段226可以是与精彩片段220有关的事件的阶段。更确切地说,阶段226可以是体育事件的阶段,在所述阶段,显示含有元数据224的卡图像。举例来说,阶段226可以是“第三局”、“第二局”、“下半场”等。
时钟227可以是与精彩片段220有关的比赛时钟。更确切地说,时钟227可以是显示含有元数据224的卡图像时的比赛时钟的状态。举例来说,对于在比赛时钟上显示有十五分四十七秒的所显示卡图像,时钟227可以是“15:47”。
得分228可以是与精彩片段220有关的比赛得分。更确切地说,得分228可以是在显示含有元数据224的卡图像时的得分。举例来说,得分228可以是“45-38”、“7-0”、“30-love”等。
帧号229可以是从中获取精彩片段220的视频流中的视频帧的编号,也可以是与精彩片段220有关的视频流222,所述视频流最直接地与精彩片段220有关。更确切地说,帧号229可以显示含有元数据224的卡图像时的此类视频帧的编号。
如进一步所示,分类模型165可以包括有助于提取和解译字符串200的各种信息。这反过来可以使得能够自动生成精彩片段220的元数据224。确切地说,分类模型165可以包括查询230、查询特征向量232、正交基234、预测查询236和/或文本含义238。
本文中更详细地阐述查询230、查询特征向量232、正交基234和预测查询236的操作。文本含义238可以是以可易于复制到元数据224中的方式显现的字符串200的解译。
图2中阐述的数据结构仅是示例性的。所属领域的技术人员将认识到,在精彩片段标识和/或元数据提取的执行中,可以省略或用其它数据替换图2的一些数据。另外或替代地,图2中未展示的数据可以用于执行精彩片段标识和/或元数据提取。
卡图像
现在参看图3,展示了来自视频流的视频帧300的示例的屏幕截图,所述视频流具有呈卡图像形式的嵌入式信息,如在体育事件电视节目中可能频繁出现的那样。图3描绘了在视频帧300的右下侧的卡图像310以及沿着视频帧300的底部延伸的第二卡图像320。卡图像310、卡图像320可含有嵌入式信息,例如比赛阶段、当前时钟和当前得分。
在至少一个实施例中,对卡图像310、卡图像320中的信息进行定位和处理,以自动识别和解译卡图像310、卡图像320中的嵌入式文本。接着可将所解译的文本汇编成描述体育比赛在体育事件时间线内的特定时间点处的状态的文本元数据。
值得注意的是,卡图像310可与当前正在展示的体育事件有关,而第二卡图像320可含有用于不同体育事件的信息。在一些实施例中,仅处理含有被认为与当前正在播放的体育事件有关的信息的卡图像以生成元数据。因此,在不限制范围的情况下,以下示例性描述假定仅卡图像310将被处理。然而,在替代实施例中,可能需要在给定视频帧300中处理多个卡图像,甚至包括与其它体育事件有关的卡图像。
如图3所示,卡图像310可以提供若干不同类型的元数据224,包括团队名称330、得分340、先前的团队表现350、当前比赛阶段360、比赛时钟370、播放状态380和/或其它信息390。这些中的每一个可以从卡图像310内提取并被解译以提供对应于含有视频帧300的精彩片段220,并且更确切地说,对应于其中显示卡图像310的视频帧300的元数据224。
元数据提取
图4是描绘根据一个实施例的由在例如客户端装置106和/或分析服务器116中的一个上运行的应用程序执行的方法400的流程图,所述应用程序接收视频流222并执行视频帧300的实时处理以用于从例如310的卡图像提取元数据。图1A的系统100将被称为执行方法400以及随后的那些方法的系统;然而,替代系统,包括但不限于图1B的系统160、图1C的系统180和/或图1D的系统190,可以代替图1A的系统100使用。
图4的方法400更详细地描绘了上文所概述的过程。可以接收并解码例如对应于先前已标识的精彩片段220的视频流222的视频流。在步骤410中,可以接收视频流222的一个或多个视频帧300,将其调整为标准大小,并对其进行解码。在步骤420中,可以处理视频帧300以检测并(在适用的情况下)从视频帧300提取一个或多个卡图像,例如图3的卡图像310。根据查询430,如果在视频帧300中未发现有效卡图像310,则方法400可以返回到步骤410以对不同视频帧300进行解码和分析。
如果已发现有效卡图像310,则在步骤440中,可进一步处理视频帧300以定位、提取并处理检测到的卡图像310,且提取并处理嵌入在卡图像310中的文本框和/或字符串。根据查询450,如果在卡图像310中未发现有效字符串200,则方法400可以返回到步骤410以处理新视频帧300。
如果在卡图像310中发现有效字符串200,则方法400可以前进到步骤460,其中识别和解译所提取的字符串200,并基于对卡图像310的信息的解译生成对应的元数据224。在各种实施例中,针对文本解译可用的选择是基于确定在视频帧300中检测到的卡图像310的卡图像的类型,及/或基于对在视频帧300中检测到的卡图像310适用的特定类型的卡图像内存在的检测到的字段的提前知识。
如先前所指示,存在于电视节目内容中的卡图像中的嵌入式文本的检测、定位和解译可以完全在本地发生于TV上、STB上或移动装置上。替代地,其可以在具有广播视频获取和流式传输能力的远程视频服务器上远程地发生。替代地,可以使用本地处理和远程处理的任何组合。
信息卡字符串处理:定位和提取
“极值区域”(Extremal Region;ER)是图像区域,其外边界像素具有严格高于区域自身的值(例如,L.Neumann、J.Matas,“实时场景文本定位与识别(Real-Time Scene TextLocalization and Recognition)”,第5届IEEE计算机视觉与模式识别会议,普罗维登斯,RI,2012年6月)。用于图像中的ER检测的众所周知的方法中的一个使用所谓的最大稳定ER检测器或称MSER检测器。额外检测方法允许测试更宽范围的ER,同时维持相对低的计算复杂度。当测试中包括更宽范围的ER时,可以引入基于与字符区域相关的某些特征的顺序分类器。此分类器可以被预先训练以生成字符存在的概率,其产生字符的多个可能检测到的边界(即,字符边界204)。当在ER分类的第一阶段时,估计字符存在的概率;当在第二阶段时,选择具有局部最大概率的ER。可以通过使用一些计算上更昂贵的特征来进一步改进分类。此外,在至少一个实施例中,应用重复穷尽搜索以检测字符的组合并将ER分组到字组中。此类方法还允许将区域边缘包括在ER的考虑因素中,以用于改进字符检测。最终结果是所选择的具有表示字符边界204的最高概率的ER。
由于上文所描述的字符检测器生成用于相同字符的若干区域,因此下一步骤是消除检测到的区域的歧义。在至少一个实施例中,此消歧涉及对检测到的字符边界204进行多重比较,且随后清除字符边界204,所述字符边界可呈看起来过于接近彼此的字符-限界框的形式。结果,在某一周边内接受仅一个字符-限界框,因此允许表示卡图像310的适当文本字段的字符串200的正确形成。
图5是描绘用于更详细地执行上文所概述的过程的方法500的流程图。选择视频帧300以用于处理,或选择选项以依次地处理每个视频帧300。在步骤510中,提取视频帧300中的卡图像310(如果检测到任何卡图像),并将其调整为标准化大小。接下来,在步骤520中,由一连串的滤波器来预处理经调整大小的卡图像,包括例如:对比度增加、用于降噪的双边和中值滤波、伽马校正,及/或照明补偿。
在步骤530中,创建具有2级分类器的ER滤波器,且在步骤540中,将此级联分类器应用于卡图像310的每个图像通道。检测字符群组,并提取一组或多组字框以用于进一步处理。在步骤550中,对具有个别字符边界204的字符串200进行分析以用于字符边界消歧。最后,生成干净的字符串200,其中在字符的位置206的周边中的每一个内仅接受一个字符。
图6是描绘用于验证字符边界204的进一步处理的方法600的流程图。在步骤610中,方法600可以开始于提取字符串200、去除重复字符,以及最后处理并接受字符串200。如所描绘,可进一步处理消歧字符串内的每个字符以用于字符图像验证。
因此,在步骤620中,可在每个字符图像202(或经处理的字符图像203)的低强度区域和高强度区域中获得像素计数比率,以用于与低强度像素计数与高强度像素计数之间的预定义对比率进行比较。在步骤620中,对每个字符图像202或经处理的字符图像203、高强度级像素和低强度级像素进行分组并计数。
接下来,在步骤630中,计算这两个计数的比率且使其经受阈值处理,使得仅保留具有足够高对比率的字符图像202或经处理的字符图像203。随后,在步骤640中,记录和保存用于经验证的字符的位置限界框坐标(即,位置206)以用于解译字符串200。
在替代实施例中,上文中所描述的字符-限界框验证可以先于字符边界消歧,或其可以与用于最终字符验证的字符边界消歧组合使用。
用于查询提取和识别的信息卡处理
在至少一个实施例中,执行自动化过程,包括以下步骤:接收数字视频流,例如与精彩片段220有关的视频流222;针对卡图像310的存在分析数字视频流的一个或多个视频帧300;提取卡图像310;针对卡图像310内的字符串200的字符定位字符边界204;以及提取驻留于文本框内的文本以产生字符的查询串。
图7是描绘根据一个实施例的生成信息卡查询的方法700的流程图。在步骤710中,从经解码的视频帧300提取卡图像310。在步骤720中,如上文所描述,处理卡图像310以标识并提取字符串200。在步骤730中,从卡图像310提取字符图像202,并生成归一化的查询图像(例如,查询230)。在步骤740中,用归一化的查询字符图像(查询特征向量232)填充查询基础架构。
在另一实施例中,通过首先将查询特征向量投射到先前开发的训练集正交基(例如,正交基234)上,且接着将所得的经投射查询特征向量应用到机器学习分类模型(例如分类模型165)来生成查询预测。可以根据先前建立的分类标记生成一连串预测字母数字字符,且此预测字母数字字符串可以被传递到解译过程,以最终提取文本含义238。
图8是描绘含有用于查询识别的处理步骤的方法800的流程图,所述步骤通向查询字母数字字符串生成和查询解译和理解。在步骤810中,加载跨越训练集向量空间的正交基234的正交基向量。在步骤820中,可以将归一化的查询投射到正交基234上。在步骤830中,可以加载如先前开发的分类模型165。分类模型165可以应用于所投射的查询。最后,在步骤840中,可以生成一连串预测字母数字字符,且随后用于解译和含义提取以产生文本含义238。
查询解译和含义提取
在至少一个实施例中,标识驻留于卡图像310内的一个或多个字符串200。后续步骤可以包括在所标识的字符串200中定位每个字符图像202、确定每个字符图像的大小,并提取每个字符图像。将检测到并提取出的字符图像202转换成查询特征向量232,并将其投射到训练集正交基234上。随后,对照分类模型165应用所投射的查询,以产生一连串预测字母数字字符。
在至少一个实施例中,将预测查询字母数字字符投送到应用驻留于众多卡图像310中的字符的先前知识和位置理解的解译过程。接下来,针对定位在特定字符串200中的每个预测字母数字字符导出含义,并将所提取的信息附加到与精彩片段220相关联地存储的元数据224。
图9是更详细地描绘根据一个实施例的用于预测查询串解译的方法900的流程图。方法900涉及组合对字符串长度、字符框的位置和水平距离以及用于含义提取的字母数字读取的考虑因素。
方法900开始于步骤910,其中针对字符串200的每个经处理的查询中的字符计数连同字符串200内的字符的大小205和位置206一起被加载。还可使与要处理的所提取查询230相关联的视频帧号和/或时间可用于与绝对时间相关的参考。在步骤920中,可以在分析中考虑串长度209、字符的大小205和/或字符的位置206。
接下来,在步骤930中,系统100可以继续通过字符串200,且可通过应用对字符的字段位置的知识以及对字符的字母数字值的知识来解译字符串200。在步骤930中,对特定卡图像310的知识和理解还可用于补偿可能遗漏的前字符。最后,在步骤940中,记录所导出的含义(例如,在文本含义238中),并形成对应元数据224,从而提供与当前体育事件电视节目和与经处理的嵌入式卡图像310相关联的当前时间线相关的实时信息。
机器学习分类模型的生成及其在识别从嵌入式信息卡提取的查询字符中的应用
在至少一个实施例中,使用卷积神经网络执行分类模型生成。一般来说,神经网络通过应用于字符向量的训练集的监督学习过程并利用已知的(所希望的)分类结果来开发其信息分类能力。在训练过程期间,神经网络算法结构调整其权重和偏差以执行准确分类。再训练过程期间用于学习神经网络的内部权重和偏差的已知架构的一个示例是反向传播神经网络架构或前馈反向传播神经网络架构。当向此类网络呈现一组训练数据时,反向传播算法计算实际输出与所希望的输出之间的差,并反馈误差以校正负责误差生成的内部网络权重和偏差。在分类/推断阶段,首先向神经网络结构加载预习得的模型参数、权重和偏差,且接着通过网络向前馈送查询,从而在网络输出处产生表示查询预测的一个或多个所标识的标记。
在用于分类模型生成的另一示例性系统中,使用多级SVM。此类SVM分类系统在根本上不同于例如神经网络学习系统的类似的方法,所述神经网络学习系统很大程度上依赖于试探法来构建各种网络架构,且利用并不总是以全局最小值结束的训练过程。相比之下,SVM在数学上非常成熟,且利用一致地找到全局最小值的训练过程。另外,对于SVM,存在训练过程和分类目标的相对简单且清晰的几何解译,这改进了对分类模型生成的过程的直观洞察。SVM可以有效地用于分类并非线性可分离的数据集,并且可以延伸到多标记分类任务。用于分类并非线性可分离的数据集的SVM的特征在于核函数的选择,这有助于将数据集投射到高维向量空间上,其中原始数据集变为线性可分离的。然而,核函数的选择非常重要,且包括一定程度的试探法和数据依赖性。
在至少一个实施例中,字符分类模型生成是基于从嵌入在体育事件电视节目内容中的一个或多个示例性卡图像310提取的一组训练字符。检测字符边界204,并从众多卡图像310提取字符。此类字符边界204含有小字符图像202,其可随后归一化到标准大小和照明以提供经处理的字符图像203。针对字符图像202和/或经处理的字符图像203形成特征向量(或查询特征向量232),且接着使这些特征向量与来自嵌入式卡图像310中呈现的一组字符图像的每个特定字符相关联。
在字符图像特征形成的结构方法中,字符特征向量或查询特征向量232与从经预处理的字符图像202提取的一组n个像素相关联。将这些n个像素格式化为表示训练向量的n维特征向量空间中的单个点的n维向量。特征选择的主要目标是在特征空间中构建正确地分离不同类别的字符图像202的决策边界。因此,在至少一个实施例中,进一步处理表示训练向量的一组所提取的字符图像202的集合以增加训练向量的唯一性和相互度量距离,以及减小训练向量的整体向量空间的维数。
根据以上考虑因素,在另一实施例中,对训练向量集合执行主成分分析(principal component analysis;PCA)。因此,从训练集导出正交基234的正交基向量,使得所述正交基向量跨越训练集向量空间。另外,通过选择有限数量的正交基向量来减小训练向量空间的维数,使得仅保留与(由训练向量的矩阵的单一值分解生成的)最大奇异值的集合相关联的最重要的正交向量。保存所选择的训练集基向量以便后续使用针对数据集的可用的算法结构中的一个或多个(例如SVM分类器或CNN分类器)来生成分类模型。
在各种实施例中,本文中所描述的系统和方法提供用于从嵌入在卡图像310中的字符串200提取个别字符图像202且用于随后利用字符图像202来生成查询特征向量232的技术。在下一处理步骤中,将这些查询特征向量投射到跨越训练向量空间的正交基234上以生成所投射的查询。随后应用所投射的查询以生成查询预测或经预测的查询236,作为由示例性SVM(或CNN)分类器产生的经预训练的分类模型的输出。这些预测查询236形成一连串预测字符,其随后经解译以生成文本含义238,且最后用于生成精彩片段220的元数据224,所述元数据富含直接从卡图像310读取的实时信息。
图10是更详细地描绘分类模型生成的方法1000的流程图。在至少一个实施例中,方法1000开始于步骤1010,其中从众多示例性卡图像类型提取一组示范性字符图像202的训练集。将字符图像202归一化到标准大小和照明以形成经处理的字符图像203。导出特征向量,并生成经标记的训练集。在至少一个实施例中,在步骤1020中,通过计算跨越训练向量空间的正交基234对训练集执行PCA分析。在步骤1030中,选择正交训练向量的子集。可以在步骤1040中保存所选择的训练集基向量以用于查询处理。在步骤1050中,可以利用正交训练向量的子集来训练分类模型165。在步骤1060中,可以保存分类模型和正交基向量以用于未来预测查询236的生成。
图11是描绘读取和解译卡图像310中的文本字段且使用帧内实时信息更新用于精彩片段220的元数据224的整体方法1100的流程图。在步骤1110中,从存在于卡图像310中的字符的字符边界204中选择要处理的字段。在步骤1120中,从行字段提取一组字符,且如上文所描述识别和解译文本串。最后,在步骤1130中,对经解码视频帧边界执行的卡图像读取嵌入在为精彩片段220生成的元数据224中。
已经关于可能的实施例以特定细节描述了本发明系统和方法。所属领域的技术人员应了解,可以在其它实施例中实践所述系统和方法。首先,组件的特定命名、术语的大写、属性、数据结构或任何其它编程或结构方面不是强制的或重要的,且所述机制和/或特征可以具有不同的名称、格式或协议。此外,所述系统可以经由硬件与软件的组合或完全以硬件元件或完全以软件元件进行实施。此外,本文中所描述的各种系统组件之间的功能性的特定划分仅是示例性的,且不是强制的;由单个系统组件执行的功能可以实际上由多个组件执行,且由多个组件执行的功能可以实际上由单个组件执行。
在本说明书中提到的“一个实施例”或“一实施例”是指与实施例结合描述的特定特征、结构或特性包括在至少一个实施例中。短语“在一个实施例中”或“在至少一个实施例中”在说明书中各种地方的出现不一定全部参考同一实施例。
各种实施例可以包括用于单独或以任何组合执行上述技术的任何数目的系统和/或方法。另一实施例包括计算机程序产品,其包含非暂时性计算机可读存储介质和经编码于介质上的计算机程序代码,用于致使计算装置或其它电子装置中的处理器执行上述技术。
上文的一些部分是在对计算装置的存储器内的数据位的操作的算法和符号表示方面来呈现。这些算法描述和表示是数据处理领域的技术人员用以将其工作的主旨最有效地传达给所属领域的其它技术人员的方法。算法此处且大体上构想为产生所希望的结果的步骤(指令)的自一致序列。步骤是要求对物理量进行物理操控的那些步骤。通常但不一定,这些量采取能够被存储、传送、组合、比较和另外操纵的电、磁或光学信号的形式。主要出于常用的原因,将这些信号称为位、值、元件、符号、字符、术语、编号等有时是便利的。此外,在不失一般性的情况下将需要对物理量的物理操纵的步骤的某些布置称为模块或代码装置有时也是便利的。
然而,应牢记,所有这些和类似术语应与适当物理量相关联,且仅是应用于这些量的方便标签。除非从以下论述显而易见确切地陈述是其它情况,否则应了解贯穿所述描述,利用例如“处理”或“计算”或“运算”或“显示”或“确定”或类似术语的论述都是指计算机系统或相似电子计算模块和/或装置的动作和过程,所述动作和过程操纵且变换计算机系统存储器或寄存器或其它此类信息存储装置、发射或显示装置内的表示为物理(电子)量的数据。
某些方面包括本文中所描述的呈算法形式的过程步骤和指令。应注意,所述过程步骤和指令可以软件、固件和/或硬件实施,且当以软件实施时可以经下载以驻留于不同平台上,且从不同平台操作以供各种操作系统使用。
本文档还涉及用于执行本文中的操作的设备。此设备可以出于所希望的目的而专门构建,或其可以包含通过存储在计算装置中的计算机程序选择性激活或重新配置的通用计算装置。此计算机程序可以存储在计算机可读存储介质中,例如但不限于包括软盘的任何类型的磁盘、光盘、CD-ROM、DVD-ROM、磁光盘、只读存储器(read-only memories;ROM)、随机存取存储器(random access memories;RAM)、EPROM、EEPROM、快闪存储器、固态驱动器、磁卡或光卡、专用集成电路(application specific integrated circuit;ASIC),或适合于存储电子指令且各自联接到计算机系统总线的任何类型的介质。所述程序及其相关联的数据也可以在例如服务器上远程地托管和运行。此外,本文中所提到的计算装置可以包括单个处理器或可以是采用多处理器设计以用于增加计算能力的架构。
本文中所呈现的算法和显示自身不与任何特定计算装置、虚拟化系统或其它设备相关。各种通用系统也可以与根据本文中的教示的程序一起使用,或其可以证明为便于构建用以执行所需方法步骤的更专用设备。用于多种这些系统的所希望的结构将从本文中所提供的描述中变得显而易见。另外,不参考任何特定编程语言描述所述系统和方法。应了解,可以使用多种编程语言来实施本文所描述的教示,并且提供上文对特定语言的任何参考以公开实现和最佳模式。
因此,各种实施例包括用于控制计算机系统、计算装置或其它电子装置的软件、硬件和/或其它元件,或者其任何组合或多个组合。此类电子装置可以包括例如处理器、输入装置(例如,键盘、鼠标、触摸垫、轨迹垫、操纵杆、轨迹球、麦克风和/或其任何组合)、输出装置(例如,屏幕、扬声器和/或其任何组合)、存储器、长期存储装置(例如,磁性存储装置、光学存储装置等),及/或网络连接性。此电子装置可以为便携式或非便携式的。可以用于实施所描述系统和方法的电子装置的示例包括:台式计算机、膝上型计算机、电视、智能手机、平板电脑、音乐播放器、音频装置、公用信息机、机顶盒、游戏系统、可穿戴式装置、消费者电子装置、服务器计算机等。电子装置可以使用任何操作系统,例如且不限于:Linux;购自华盛顿雷德蒙德市的微软公司的Microsoft Windows;购自加利福尼亚库比蒂诺市的苹果公司的Mac OS X;购自加利福尼亚库比蒂诺市的苹果公司的iOS;购自加利福尼亚山景城的谷歌公司的Android;和/或适合于在所述装置上使用的任何其它操作系统。
虽然本文中已经描述有限数目的实施例,但得益于以上描述的所属领域的技术人员应了解,可以设计其它实施例。另外,应注意,已主要为便于阅读和指导性目的而选择在说明书中使用的语言,且可能并不是为了划定或限制本发明主题而选择。因此,本公开希望说明范围但不限制范围。

Claims (48)

1.一种用于从视频流中提取元数据的方法,所述方法包含:
在处理器处,接收所述视频流的至少一部分;
在所述处理器处,标识嵌入在所述视频流的所述部分的一个或多个视频帧中的一个或多个卡图像;
在所述处理器处,处理所述一个或多个卡图像以提取文本;
在所述处理器处,解译所述文本以获得元数据;以及
在数据存储区处,存储与所述视频流的所述部分相关联的所述元数据。
2.根据权利要求1所述的方法,其进一步包含:
在所述数据存储区处,存储所述视频流的所接收的部分。
3.根据权利要求1所述的方法,其中:
所述视频流包含体育事件的电视广播;
所述视频流的所述部分包含被视为一个或多个用户特别感兴趣的精彩片段;并且
所述元数据描述所述精彩片段。
4.根据权利要求3所述的方法,其进一步包含:在输出装置处,与标识所述一个或多个卡图像、处理所述一个或多个卡图像以及解译所述文本中的至少一项同时输出所述视频流。
5.根据权利要求3所述的方法,其进一步包含:
在输出装置处,输出所述精彩片段;以及
与输出所述精彩片段同时输出所述元数据;
其中,所述元数据包含选自由以下组成的群组中的至少一个:
与所述精彩片段相关的实时信息;以及
已从中获得所述元数据的所述卡图像的时间线。
6.根据权利要求1所述的方法,其中提取所述文本包含:
在所述一个或多个卡图像中标识一个或多个字符串;以及
记录与所述一个或多个字符串的每个字符相对应的所述一个或多个卡图像的卡图像的字符图像的位置和/或大小。
7.根据权利要求6所述的方法,其中提取所述文本进一步包含:
通过对检测到的字符边界执行多重比较来消除所述一个或多个字符串的字符的字符边界;以及
清除任何看起来过于接近彼此的字符边界。
8.根据权利要求6所述的方法,其中,提取所述文本进一步包含:通过在低强度像素计数与高强度像素计数之间建立对比率来对所述一个或多个字符串的字符执行图像验证。
9.根据权利要求1所述的方法,其中,解译所述文本包含:
基于所述文本生成查询;
生成多个n维查询特征向量;
将所述n维查询特征向量投射到训练集正交基上;
将所投射的所述n维查询特征向量应用于分类模型,以产生至少一个预测查询;以及
从所述至少一个预测查询中提取所述文本的含义。
10.根据权利要求9所述的方法,其进一步包含:
生成多个训练集特征向量;以及
使用所述训练集特征向量以导出所述训练集正交基。
11.根据权利要求9所述的方法,其进一步包含:
生成多个训练集特征向量;以及
使用所述训练集特征向量以生成所述分类模型。
12.根据权利要求9所述的方法,其中,解译所述文本进一步包含使用来自由以下组成的群组中的至少两个选择:
在所述文本内的一个或多个字符串的串长度;
在所述文本内的字符边界和/或字符的位置;以及
在所述文本内的字符边界和/或字符的水平位置。
13.根据权利要求9所述的方法,其中存储与所述视频流的所述部分相关联的所述元数据包含:存储与查询相关联的所述一个或多个视频帧的视频帧号。
14.根据权利要求1所述的方法,其中,解译所述文本包含:
确定所述文本的一个或多个字符串的字符的字段位置;
确定所述字符的字母数字值;以及
使用所述字段位置和字母数字值以循序地解译所述一个或多个字符串。
15.根据权利要求14所述的方法,其中,解译所述文本进一步包含:
获得关于所述卡图像中的每一个的一个或多个卡字段的位置信息和其它信息;以及
使用所述位置信息和其它信息来补偿所述一个或多个字符串的一个或多个可能遗漏的前字符。
16.一种用于生成用于从视频流中提取元数据的分类模型的方法,所述方法包含:
在处理器处,接收所述视频流的至少一部分;
在所述处理器处,标识嵌入在所述视频流的所述部分的一个或多个视频帧中的一个或多个卡图像;
在所述处理器处,在每一卡图像都含有字符的情况下,处理所述一个或多个卡图像以提取多个字符图像;
在所述处理器处,生成与所述字符图像相关联的训练特征向量;
在所述处理器处,以下述方式处理所述训练特征向量:
增加所述训练特征向量的唯一性;
增加所述训练特征向量的相互数值距离;及/或
减小含有所述训练特征向量的整体向量空间的维数;
在所述处理器处,使用所述训练特征向量中的至少一些来训练分类模型;以及
在数据存储区中,存储所述分类模型。
17.根据权利要求16所述的方法,其进一步包含:
在所述数据存储区处,存储所述视频流的所接收的部分。
18.根据权利要求16所述的方法,其进一步包含:在所述处理器处,在生成所述训练特征向量之前,将所述字符图像归一化到标准大小和/或标准照明。
19.根据权利要求16所述的方法,其中,生成所述训练特征向量包含:将从所述字符图像提取的一组n个像素格式化为n维向量。
20.根据权利要求16所述的方法,其进一步包含:在所述处理器处,对所述训练特征向量执行主成分分析;
其中使用所述训练特征向量中的至少一些来训练所述分类模型包含:
选择作为正交基向量的所述训练特征向量的子集;以及
使用所述正交基向量来训练所述分类模型。
21.根据权利要求20所述的方法,其中:
所述正交基向量跨越所述整体向量空间;
减小所述整体向量空间的所述维数包含选择有限数量的所述正交基向量;
减小所述整体向量空间的所述维数进一步包含仅选择与从所述正交基向量的矩阵导出的最大奇异值的集合相对应的正交基向量;
存储所述分类模型包含存储有限数量的所述正交基向量,以供后续在分类模型生成和/或查询处理中使用;及/或
生成所述分类模型包含将有限数量的所述正交基向量与从由SVM和CNN组成的群组中选出的机器学习算法结合使用。
22.根据权利要求16所述的方法,其进一步包含:
在所述处理器处,处理所述一个或多个卡图像以提取文本;
在所述处理器处,解译所述文本以获得元数据;
在所述数据存储区处,存储与所述视频流的所述部分相关联的所述元数据;
在输出装置处,输出所述视频流的所述部分;以及
在所述输出装置处,与输出所述视频流的所述部分同时输出所述元数据;
其中:
所述视频流包含体育事件的广播;
所述视频流的所述部分包含被视为一个或多个用户特别感兴趣的精彩片段;并且
所述元数据描述所述精彩片段。
23.根据权利要求22所述的方法,其中,提取所述文本包含将所述文本的文本串提取为查询。
24.根据权利要求22所述的方法,其中,提取所述文本包含提取以下各项中的至少一个:
所述体育事件内的当前时间;
所述体育事件的当前时间;
与所述体育事件有关的比赛时钟;以及
与所述体育事件有关的比赛得分。
25.一种从视频流中提取元数据的非暂时性计算机可读介质,所述非暂时性计算机可读介质包含存储在其上的指令,所述指令在由处理器执行时执行以下步骤:
接收所述视频流的至少一部分;
标识嵌入在所述视频流的所述部分的一个或多个视频帧中的一个或多个卡图像;
处理所述一个或多个卡图像以提取文本;
解译所述文本以获得元数据;以及
致使数据存储区存储与所述视频流的所述部分相关联的所述元数据。
26.根据权利要求25所述的非暂时性计算机可读介质,其中:
所述视频流包含体育事件的电视广播;
所述视频流的所述部分包含被视为一个或多个用户特别感兴趣的精彩片段;并且
所述元数据描述所述精彩片段。
27.根据权利要求26所述的非暂时性计算机可读介质,所述非暂时性计算机可读介质进一步包含存储于其上的指令,所述指令在由处理器执行时致使输出装置与标识所述一个或多个卡图像、处理所述一个或多个卡图像及解译所述文本中的至少一项同时输出所述视频流。
28.根据权利要求26所述的非暂时性计算机可读介质,所述非暂时性计算机可读介质进一步包含存储在其上的指令,所述指令在由处理器执行时执行以下步骤:
致使输出装置输出所述精彩片段;以及
与输出所述精彩片段同时输出所述元数据;
其中,所述元数据包含选自由以下组成的群组中的至少一个:
与所述精彩片段相关的实时信息;以及
已从中获得所述元数据的所述卡图像的时间线。
29.根据权利要求25所述的非暂时性计算机可读介质,其中,提取所述文本包含:
在所述一个或多个卡图像中标识一个或多个字符串;以及
记录与所述一个或多个字符串的每个字符相对应的所述一个或多个卡图像的卡图像的字符图像的位置和/或大小。
30.根据权利要求25所述的非暂时性计算机可读介质,其中,解译所述文本包含:
基于所述文本生成查询;
生成多个n维查询特征向量;
将所述n维查询特征向量投射到训练集正交基上;
将所投射的所述n维查询特征向量应用于分类模型,以产生至少一个预测查询;以及
从所述至少一个预测查询中提取所述文本的含义。
31.根据权利要求30所述的非暂时性计算机可读介质,所述非暂时性计算机可读介质进一步包含存储在其上的指令,所述指令在由处理器执行时执行以下步骤:
生成多个训练集特征向量;以及
使用所述训练集特征向量来导出所述训练集正交基和/或生成所述分类模型。
32.根据权利要求25所述的非暂时性计算机可读介质,其中,解译所述文本包含:
确定所述文本的一个或多个字符串的字符的字段位置;
确定所述字符的字母数字值;以及
使用所述字段位置和字母数字值以循序地解译所述一个或多个字符串。
33.一种用于生成用于从视频流中提取元数据的分类模型的非暂时性计算机可读介质,所述非暂时性计算机可读介质包含存储在其上的指令,所述指令在由处理器执行时执行以下步骤:
接收所述视频流的至少一部分;
标识嵌入在所述视频流的所述部分的一个或多个视频帧中的一个或多个卡图像;
在每一卡图像都含有字符的情况下,处理所述一个或多个卡图像以提取多个字符图像;
生成与所述字符图像相关联的训练特征向量;
以下述方式处理所述训练特征向量:
增加所述训练特征向量的唯一性;
增加所述训练特征向量的相互数值距离;及/或
减小含有所述训练特征向量的整体向量空间的维数;
使用所述训练特征向量中的至少一些来训练分类模型;以及
致使数据存储区存储所述分类模型。
34.根据权利要求33所述的非暂时性计算机可读介质,所述非暂时性计算机可读介质进一步包含存储于其上的指令,所述指令在由处理器执行时对所述训练特征向量执行主成分分析;
其中使用所述训练特征向量中的至少一些来训练所述分类模型包含:
选择作为正交基向量的所述训练特征向量的子集;以及
使用所述正交基向量来训练所述分类模型。
35.根据权利要求34所述的非暂时性计算机可读介质,其中:
所述正交基向量跨越所述整体向量空间;
减小所述整体向量空间的所述维数包含选择有限数量的所述正交基向量;
减小所述整体向量空间的所述维数进一步包含仅选择与从所述正交基向量的矩阵导出的最大奇异值的集合相对应的正交基向量;
存储所述分类模型包含存储有限数量的所述正交基向量,以供后续在分类模型生成和/或查询处理中使用;及/或
生成所述分类模型包含将有限数量的所述正交基向量与从由SVM和CNN组成的群组中选出的机器学习算法结合使用。
36.根据权利要求33所述的非暂时性计算机可读介质,所述非暂时性计算机可读介质进一步包含存储在其上的指令,所述指令在由处理器执行时执行以下步骤:
处理所述一个或多个卡图像以提取文本;
解译所述文本以获得元数据;
致使所述数据存储区存储与所述视频流的所述部分相关联的所述元数据;
致使输出装置输出所述视频流的所述部分;以及
致使所述输出装置与输出所述视频流的所述部分同时输出所述元数据;
其中:
所述视频流包含体育事件的广播;
所述视频流的所述部分包含被视为一个或多个用户特别感兴趣的精彩片段;并且
所述元数据描述所述精彩片段。
37.一种用于从视频流中提取元数据的系统,所述系统包含:
处理器,其被配置成:
接收所述视频流的至少一部分;
标识嵌入在所述视频流的所述部分的一个或多个视频帧中的一个或多个卡图像;
处理所述一个或多个卡图像以提取文本;以及
解译所述文本以获得元数据;以及
数据存储区,其被配置成存储与所述视频流的所述部分相关联的所述元数据。
38.根据权利要求37所述的系统,其中:
所述视频流包含体育事件的电视广播;
所述视频流的所述部分包含被视为一个或多个用户特别感兴趣的精彩片段;并且
所述元数据描述所述精彩片段。
39.根据权利要求38所述的系统,其进一步包含输出装置,所述输出装置被配置成与标识所述一个或多个卡图像、处理所述一个或多个卡图像及解译所述文本中的至少一项同时输出所述视频流。
40.根据权利要求38所述的系统,其进一步包含:输出装置,其被配置成输出所述精彩片段;
其中:
所述处理器被进一步配置成与输出所述精彩片段的同时输出所述元数据;并且
所述元数据包含选自由以下组成的群组中的至少一个:
与所述精彩片段相关的实时信息;以及
已从中获得所述元数据的所述卡图像的时间线。
41.根据权利要求37所述的系统,其中,所述处理器被进一步配置成通过以下操作来提取所述文本:
在所述一个或多个卡图像中标识一个或多个字符串;以及
记录与所述一个或多个字符串的每个字符相对应的所述一个或多个卡图像的卡图像的字符图像的位置和/或大小。
42.根据权利要求37所述的系统,其中,所述处理器被进一步配置成通过以下操作来解译所述文本:
基于所述文本生成查询;
生成多个n维查询特征向量;
将所述n维查询特征向量投射到训练集正交基上;
将所投射的所述n维查询特征向量应用于分类模型,以产生至少一个预测查询;以及
从所述至少一个预测查询中提取所述文本的含义。
43.根据权利要求42所述的系统,其中所述处理器被进一步配置成:
生成多个训练集特征向量;以及
使用所述训练集特征向量来导出所述训练集正交基和/或生成所述分类模型。
44.根据权利要求37所述的系统,其中,所述处理器被进一步配置成通过以下操作来解译所述文本:
确定所述文本的一个或多个字符串的字符的字段位置;
确定所述字符的字母数字值;以及
使用所述字段位置和字母数字值以循序地解译所述一个或多个字符串。
45.一种用于生成用于从视频流中提取元数据的分类模型的系统,所述系统包含:
处理器,其被配置成:
接收所述视频流的至少一部分;
标识嵌入在所述视频流的所述部分的一个或多个视频帧中的一个或多个卡图像;
在每一卡图像都含有字符的情况下,处理所述一个或多个卡图像以提取多个字符图像;
生成与所述字符图像相关联的训练特征向量;
以下述方式处理所述训练特征向量:
增加所述训练特征向量的唯一性;
增加所述训练特征向量的相互数值距离;及/或
减小含有所述训练特征向量的整体向量空间的维数;以及
使用所述训练特征向量中的至少一些来训练分类模型;以及
数据存储区,其被配置成存储所述分类模型。
46.根据权利要求45所述的系统,其中所述处理器被进一步配置成:
对所述训练特征向量执行主成分分析;以及
使用所述训练特征向量中的至少一些通过以下操作来训练所述分类模型:
选择作为正交基向量的所述训练特征向量的子集;以及
使用所述正交基向量来训练所述分类模型。
47.根据权利要求46所述的系统,其中:
所述正交基向量跨越所述整体向量空间;以及
所述处理器被进一步配置成通过选择有限数量的所述正交基向量来减小所述整体向量空间的所述维数;
所述处理器被进一步配置成通过仅选择与从所述正交基向量的矩阵导出的最大奇异值的集合相对应的正交基向量来减小所述整体向量空间的所述维数;
所述数据存储区被进一步配置成通过存储有限数量的所述正交基向量来存储所述分类模型,以供后续在分类模型生成和/或查询处理中使用;及/或
所述处理器被进一步配置成通过将有限数量的所述正交基向量与从由SVM和CNN组成的群组中选出的机器学习算法结合使用来生成所述分类模型。
48.根据权利要求45所述的系统,其中:
所述处理器被进一步配置成:
处理所述一个或多个卡图像以提取文本;以及
解译所述文本以获得元数据;
所述数据存储区被进一步配置成存储与所述视频流的所述部分相关联的所述元数据;
所述系统进一步包含输出装置,所述输出装置被配置成:
输出所述视频流的所述部分;以及
与输出所述视频流的所述部分同时输出所述元数据;
所述视频流包含体育事件的广播;
所述视频流的所述部分包含被视为一个或多个用户特别感兴趣的精彩片段;并且
所述元数据描述所述精彩片段。
CN201980044176.8A 2018-05-18 2019-05-15 用于从视频流中提取元数据的方法、介质和系统 Active CN112753226B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311699448.2A CN117880585A (zh) 2018-05-18 2019-05-15 用于从视频流中提取元数据的方法、介质和系统

Applications Claiming Priority (19)

Application Number Priority Date Filing Date Title
US201862673411P 2018-05-18 2018-05-18
US201862673412P 2018-05-18 2018-05-18
US201862673413P 2018-05-18 2018-05-18
US62/673,413 2018-05-18
US62/673,412 2018-05-18
US62/673,411 2018-05-18
US201862680955P 2018-06-05 2018-06-05
US62/680,955 2018-06-05
US201862712041P 2018-07-30 2018-07-30
US62/712,041 2018-07-30
US201862746454P 2018-10-16 2018-10-16
US62/746,454 2018-10-16
US16/411,710 US11373404B2 (en) 2018-05-18 2019-05-14 Machine learning for recognizing and interpreting embedded information card content
US16/411,713 2019-05-14
US16/411,710 2019-05-14
US16/411,713 US11138438B2 (en) 2018-05-18 2019-05-14 Video processing for embedded information card localization and content extraction
US16/411,704 2019-05-14
US16/411,704 US11594028B2 (en) 2018-05-18 2019-05-14 Video processing for enabling sports highlights generation
PCT/US2019/032481 WO2019222397A1 (en) 2018-05-18 2019-05-15 Machine learning for recognizing and interpreting embedded information card content

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202311699448.2A Division CN117880585A (zh) 2018-05-18 2019-05-15 用于从视频流中提取元数据的方法、介质和系统

Publications (2)

Publication Number Publication Date
CN112753226A true CN112753226A (zh) 2021-05-04
CN112753226B CN112753226B (zh) 2024-01-02

Family

ID=68533221

Family Applications (3)

Application Number Title Priority Date Filing Date
CN201980044176.8A Active CN112753226B (zh) 2018-05-18 2019-05-15 用于从视频流中提取元数据的方法、介质和系统
CN201980042463.5A Active CN112753225B (zh) 2018-05-18 2019-05-15 用于嵌入信息卡定位和内容提取的视频处理
CN202311699448.2A Pending CN117880585A (zh) 2018-05-18 2019-05-15 用于从视频流中提取元数据的方法、介质和系统

Family Applications After (2)

Application Number Title Priority Date Filing Date
CN201980042463.5A Active CN112753225B (zh) 2018-05-18 2019-05-15 用于嵌入信息卡定位和内容提取的视频处理
CN202311699448.2A Pending CN117880585A (zh) 2018-05-18 2019-05-15 用于从视频流中提取元数据的方法、介质和系统

Country Status (7)

Country Link
US (7) US11373404B2 (zh)
EP (2) EP3811627A4 (zh)
JP (1) JP2021525031A (zh)
CN (3) CN112753226B (zh)
AU (3) AU2019269599B2 (zh)
CA (2) CA3100787A1 (zh)
WO (2) WO2019222397A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113095325A (zh) * 2021-05-11 2021-07-09 浙江华是科技股份有限公司 一种船舶识别方法、装置及计算机可读存储介质

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11373404B2 (en) 2018-05-18 2022-06-28 Stats Llc Machine learning for recognizing and interpreting embedded information card content
US11805283B2 (en) * 2019-01-25 2023-10-31 Gracenote, Inc. Methods and systems for extracting sport-related information from digital video frames
US10997424B2 (en) 2019-01-25 2021-05-04 Gracenote, Inc. Methods and systems for sport data extraction
US11036995B2 (en) 2019-01-25 2021-06-15 Gracenote, Inc. Methods and systems for scoreboard region detection
US11087161B2 (en) 2019-01-25 2021-08-10 Gracenote, Inc. Methods and systems for determining accuracy of sport-related information extracted from digital video frames
US11010627B2 (en) 2019-01-25 2021-05-18 Gracenote, Inc. Methods and systems for scoreboard text region detection
US10909174B1 (en) * 2019-02-04 2021-02-02 Amazon Technologies, Inc. State detection of live feed
US11151191B2 (en) * 2019-04-09 2021-10-19 International Business Machines Corporation Video content segmentation and search
CN114788293B (zh) 2019-06-11 2023-07-14 唯众挚美影视技术公司 用于制作包括电影的多媒体数字内容的系统、方法和介质
WO2021022499A1 (en) * 2019-08-07 2021-02-11 WeMovie Technologies Adaptive marketing in cloud-based content production
US10776613B1 (en) * 2019-09-13 2020-09-15 Royal Caribbean Cruises Ltd. Facial recognition system and methods for identity credentialing and personalized services
WO2021068105A1 (en) 2019-10-08 2021-04-15 WeMovie Technologies Pre-production systems for making movies, tv shows and multimedia contents
US11837262B2 (en) * 2019-11-29 2023-12-05 Naver Corporation Electronic device for tagging event in sports play video and operating method thereof
CN111265881B (zh) * 2020-01-21 2021-06-22 腾讯科技(深圳)有限公司 一种模型训练方法、内容生成方法以及相关装置
CN111665955B (zh) * 2020-04-17 2023-06-27 北京百度网讯科技有限公司 候选字符串的处理方法、装置、电子设备及存储介质
US11170593B1 (en) 2020-05-05 2021-11-09 Royal Caribbean Cruises Ltd. Multifunction smart door device
KR20210136564A (ko) * 2020-05-08 2021-11-17 주식회사 엔씨소프트 스포츠 경기 요약 영상 생성 장치 및 스포츠 경기 요약 영상 생성 방법
WO2021225608A1 (en) 2020-05-08 2021-11-11 WeMovie Technologies Fully automated post-production editing for movies, tv shows and multimedia contents
US11523161B2 (en) * 2020-05-15 2022-12-06 Fast Dog, LLC Exciting moment pre-cognizant notification for live events
CN111686450B (zh) * 2020-06-12 2021-09-28 腾讯科技(深圳)有限公司 游戏的剧本生成及运行方法、装置、电子设备和存储介质
CN111814642A (zh) * 2020-06-30 2020-10-23 北京玩在一起科技有限公司 一种电竞赛事数据的识别方法及系统
CN111726682B (zh) * 2020-06-30 2022-08-16 北京百度网讯科技有限公司 视频片段生成方法、装置、设备和计算机存储介质
US11070888B1 (en) 2020-08-27 2021-07-20 WeMovie Technologies Content structure aware multimedia streaming service for movies, TV shows and multimedia contents
US11412315B2 (en) * 2020-10-12 2022-08-09 Ryan Niro System and methods for viewable highlight playbacks
US11166086B1 (en) * 2020-10-28 2021-11-02 WeMovie Technologies Automated post-production editing for user-generated multimedia contents
US11812121B2 (en) * 2020-10-28 2023-11-07 WeMovie Technologies Automated post-production editing for user-generated multimedia contents
CN112328348A (zh) * 2020-11-05 2021-02-05 深圳壹账通智能科技有限公司 应用程序多语言支持方法、装置、计算机设备及存储介质
US11875133B2 (en) * 2021-02-02 2024-01-16 Rovi Guides, Inc. Methods and systems for providing subtitles
US11330154B1 (en) 2021-07-23 2022-05-10 WeMovie Technologies Automated coordination in multimedia content production
US11907310B2 (en) * 2021-09-27 2024-02-20 The Yes Platform, Inc. Data correlation system and method
US11321639B1 (en) 2021-12-13 2022-05-03 WeMovie Technologies Automated evaluation of acting performance using cloud services

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004312208A (ja) * 2003-04-04 2004-11-04 Nippon Hoso Kyokai <Nhk> 映像提示装置、映像提示方法及び映像提示プログラム
US20080030942A1 (en) * 2006-08-03 2008-02-07 Elizalde Luis E Folding Electronic Device
US20090082110A1 (en) * 2007-09-21 2009-03-26 Verizon Data Services Inc. Highlight management for fantasy gaming
US8018491B2 (en) * 2001-08-20 2011-09-13 Sharp Laboratories Of America, Inc. Summarization of football video content
US20110292244A1 (en) * 2010-05-25 2011-12-01 Deever Aaron T Storing a video summary as metadata
CN102427507A (zh) * 2011-09-30 2012-04-25 北京航空航天大学 一种基于事件模型的足球视频集锦自动合成方法
US8452778B1 (en) * 2009-11-19 2013-05-28 Google Inc. Training of adapted classifiers for video categorization
US20140219563A1 (en) * 2013-02-01 2014-08-07 Xerox Corporation Label-embedding for text recognition
US8923607B1 (en) * 2010-12-08 2014-12-30 Google Inc. Learning sports highlights using event detection
US8966513B2 (en) * 2011-06-29 2015-02-24 Avaya Inc. System and method for processing media highlights
US20150319510A1 (en) * 2014-04-30 2015-11-05 General Instrument Corporation Interactive viewing experiences by detecting on-screen text
US20160210532A1 (en) * 2015-01-21 2016-07-21 Xerox Corporation Method and system to perform text-to-image queries with wildcards
US9443158B1 (en) * 2014-06-22 2016-09-13 Kristopher Haskins Method for computer vision to recognize objects marked for identification with a bigram of glyphs, and devices utilizing the method for practical purposes
US20170069159A1 (en) * 2015-09-04 2017-03-09 Musigma Business Solutions Pvt. Ltd. Analytics system and method
US20170289617A1 (en) * 2016-04-01 2017-10-05 Yahoo! Inc. Computerized system and method for automatically detecting and rendering highlights from streaming videos
US9805268B2 (en) * 2014-07-14 2017-10-31 Carnegie Mellon University System and method for processing a video stream to extract highlights
US20180020243A1 (en) * 2016-07-13 2018-01-18 Yahoo Holdings, Inc. Computerized system and method for automatic highlight detection from live streaming media and rendering within a specialized media player

Family Cites Families (430)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5034516B1 (zh) 1970-08-25 1975-11-08
US20010013123A1 (en) 1991-11-25 2001-08-09 Freeman Michael J. Customized program creation by splicing server based video, audio, or graphical segments
JP3698273B2 (ja) 1995-07-20 2005-09-21 ソニー株式会社 電子番組ガイド伝送装置および方法、電子番組ガイド受信装置および方法、並びに電子番組ガイド送受信システムおよび方法
AU720866B2 (en) 1996-03-15 2000-06-15 Rovi Guides, Inc. Combination of VCR index and EPG
US20030093790A1 (en) 2000-03-28 2003-05-15 Logan James D. Audio and video program recording, editing and playback systems using metadata
US6177931B1 (en) 1996-12-19 2001-01-23 Index Systems, Inc. Systems and methods for displaying and recording control interface with television programs, video, advertising information and program scheduling information
US5850218A (en) 1997-02-19 1998-12-15 Time Warner Entertainment Company L.P. Inter-active program guide with default selection control
JPH10322622A (ja) 1997-05-16 1998-12-04 Sanyo Electric Co Ltd デジタルテレビ放送受信機
US6195458B1 (en) 1997-07-29 2001-02-27 Eastman Kodak Company Method for content-based temporal segmentation of video
CN1867068A (zh) 1998-07-14 2006-11-22 联合视频制品公司 交互式电视节目导视系统及其方法
JP3396639B2 (ja) 1998-09-30 2003-04-14 株式会社東芝 階層記憶装置及び階層記憶制御方法
US7260823B2 (en) 2001-01-11 2007-08-21 Prime Research Alliance E., Inc. Profiling and identification of television viewers
US6185527B1 (en) 1999-01-19 2001-02-06 International Business Machines Corporation System and method for automatic audio content analysis for word spotting, indexing, classification and retrieval
US6557042B1 (en) 1999-03-19 2003-04-29 Microsoft Corporation Multimedia summary generation employing user feedback
US7992163B1 (en) 1999-06-11 2011-08-02 Jerding Dean F Video-on-demand navigational system
JP3738631B2 (ja) * 1999-09-27 2006-01-25 三菱電機株式会社 画像検索システムおよび画像検索方法
US20010026609A1 (en) 1999-12-30 2001-10-04 Lee Weinstein Method and apparatus facilitating the placing, receiving, and billing of telephone calls
US6681396B1 (en) 2000-02-11 2004-01-20 International Business Machines Corporation Automated detection/resumption of interrupted television programs
JP3566896B2 (ja) 2000-03-03 2004-09-15 株式会社リコー スポーツ映像ダイジェスト作成装置、スポーツ映像ダイジェスト作成方法およびスポーツ映像ダイジェスト作成処理をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
CA2407005C (en) 2000-05-23 2013-02-26 United Video Properties, Inc. Interactive television application with watch lists
US7548565B2 (en) * 2000-07-24 2009-06-16 Vmark, Inc. Method and apparatus for fast metadata generation, delivery and access for live broadcast program
GB0022370D0 (en) 2000-09-13 2000-10-25 Pace Micro Tech Plc Improvements to televisionn system
JP4516682B2 (ja) 2000-10-06 2010-08-04 富士通株式会社 映像記録再生装置
US7509662B2 (en) 2000-10-19 2009-03-24 Jlb Ventures, Llc Method and apparatus for generation of a preferred broadcasted programs list
US7337462B2 (en) 2000-11-16 2008-02-26 Meevee, Inc. System and method for providing timing data for programming events
WO2002043377A1 (en) 2000-11-21 2002-05-30 Universal Electronics Inc. Media return system
WO2002045321A2 (en) 2000-11-29 2002-06-06 Unilogic, Inc. A collaborative, fault-tolerant, scaleable, flexible, interactive real-time display and processing method and apparatus
US7174512B2 (en) 2000-12-01 2007-02-06 Thomson Licensing S.A. Portal for a communications system
CA2916209C (en) 2001-02-21 2021-06-29 Rovi Guides, Inc. Systems and methods for interactive program guides with personal video recordng features
US20020157101A1 (en) 2001-03-02 2002-10-24 Schrader Joseph A. System for creating and delivering enhanced television services
JP2002259720A (ja) 2001-03-02 2002-09-13 Internatl Business Mach Corp <Ibm> コンテンツ要約システム、映像要約システム、ユーザ端末、要約映像生成方法、要約映像受信方法、およびプログラム
US6856757B2 (en) 2001-03-22 2005-02-15 Koninklijke Philips Electronics N.V. Apparatus and method for detecting sports highlights in a video program
US7904814B2 (en) 2001-04-19 2011-03-08 Sharp Laboratories Of America, Inc. System for presenting audio-video content
US20020178444A1 (en) 2001-05-22 2002-11-28 Koninklijke Philips Electronics N.V. Background commercial end detector and notifier
US20050005308A1 (en) 2002-01-29 2005-01-06 Gotuit Video, Inc. Methods and apparatus for recording and replaying sports broadcasts
US7272657B2 (en) 2001-07-30 2007-09-18 Digeo, Inc. System and method for displaying video streams ranked by user-specified criteria
US6901603B2 (en) 2001-07-10 2005-05-31 General Instrument Corportion Methods and apparatus for advanced recording options on a personal versatile recorder
JP2003032654A (ja) 2001-07-16 2003-01-31 Jisedai Joho Hoso System Kenkyusho:Kk 番組関連コンテンツ生成・提示方法および番組関連コンテンツ生成・提示装置
US7574474B2 (en) 2001-09-14 2009-08-11 Xerox Corporation System and method for sharing and controlling multiple audio and video streams
US20030066077A1 (en) 2001-10-03 2003-04-03 Koninklijke Philips Electronics N.V. Method and system for viewing multiple programs in the same time slot
US7929808B2 (en) 2001-10-30 2011-04-19 Hewlett-Packard Development Company, L.P. Systems and methods for generating digital images having image meta-data combined with the image data
US8702504B1 (en) 2001-11-05 2014-04-22 Rovi Technologies Corporation Fantasy sports contest highlight segments systems and methods
US7012653B1 (en) 2001-11-30 2006-03-14 Bellsouth Intellectual Property Corporation Program restart and commercial ending notification method and system
US7194563B2 (en) 2001-12-05 2007-03-20 Scientific-Atlanta, Inc. Disk driver cluster management of time shift buffer with file allocation table structure
WO2003051031A2 (en) 2001-12-06 2003-06-19 The Trustees Of Columbia University In The City Of New York Method and apparatus for planarization of a material by growing and removing a sacrificial film
US7386217B2 (en) 2001-12-14 2008-06-10 Hewlett-Packard Development Company, L.P. Indexing video by detecting speech and music in audio
US7027460B2 (en) 2001-12-21 2006-04-11 Intel Corporation Method and system for customized television viewing using a peer-to-peer network
US20030126606A1 (en) 2001-12-27 2003-07-03 Koninklijke Philips Esectronics N.V. Hierarchical decision fusion of recommender scores
US20030126605A1 (en) 2001-12-28 2003-07-03 Betz Steve Craig Method for displaying EPG video-clip previews on demand
US7334251B2 (en) 2002-02-11 2008-02-19 Scientific-Atlanta, Inc. Management of television advertising
US20030172376A1 (en) 2002-03-11 2003-09-11 Microsoft Corporation User controlled targeted advertisement placement for receiver modules
US20030188317A1 (en) 2002-03-28 2003-10-02 Liew William J. Advertisement system and methods for video-on-demand services
US7197715B1 (en) 2002-03-29 2007-03-27 Digeo, Inc. System and method to provide customized graphical user interfaces via an interactive video casting network
JP3799288B2 (ja) 2002-04-05 2006-07-19 キヤノン株式会社 受信装置
US7073189B2 (en) 2002-05-03 2006-07-04 Time Warner Interactive Video Group, Inc. Program guide and reservation system for network based digital information and entertainment storage and delivery system
US8832754B2 (en) 2002-05-03 2014-09-09 Tvworks, Llc System and method for providing synchronized events to a television application
US8872979B2 (en) * 2002-05-21 2014-10-28 Avaya Inc. Combined-media scene tracking for audio-video summarization
US7849487B1 (en) 2002-05-31 2010-12-07 Microsoft Corporation Review speed adjustment marker
US20040003403A1 (en) 2002-06-19 2004-01-01 Marsh David J. Methods and systems for reducing information in electronic program guide and program recommendation systems
JP2005531971A (ja) * 2002-07-01 2005-10-20 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ビデオ信号処理システム
JP2004072540A (ja) 2002-08-07 2004-03-04 Ricoh Co Ltd パーソナルダイジェスト配信システム、パーソナルダイジェスト作成方法およびその方法をコンピュータに実行させるためのプログラム
US7483624B2 (en) 2002-08-30 2009-01-27 Hewlett-Packard Development Company, L.P. System and method for indexing a video sequence
KR20040025073A (ko) 2002-09-18 2004-03-24 주식회사 알티캐스트 디지털 방송상에서 스케쥴 정보를 간이 채널 이미지와병기하여 텔레비젼 화면에 표시하는 방법
US8050281B2 (en) 2003-01-31 2011-11-01 Qwest Communications International Inc. Alert gateway, systems and methods
JP2004260297A (ja) 2003-02-24 2004-09-16 Ricoh Co Ltd パーソナルダイジェスト配信装置、その配信方法、その配信プログラム、およびパーソナルダイジェスト配信システム
US20040167767A1 (en) 2003-02-25 2004-08-26 Ziyou Xiong Method and system for extracting sports highlights from audio signals
US20040181807A1 (en) 2003-03-11 2004-09-16 Theiste Christopher H. System and method for scheduling digital cinema content
US20050166230A1 (en) 2003-03-18 2005-07-28 Gaydou Danny R. Systems and methods for providing transport control
EP1469476A1 (en) 2003-04-16 2004-10-20 Accenture Global Services GmbH Controlled multi-media program review
EP1616401A4 (en) 2003-04-21 2012-01-04 Rgb Networks Inc TIME-MULTIPROUGH MULTIPROGRAM ENCRYPTION SYSTEM
US20070033616A1 (en) 2003-05-30 2007-02-08 Srinivas Gutta Ascertaining show priority for recording of tv shows depending upon their viewed status
US7392477B2 (en) 2003-07-18 2008-06-24 Microsoft Corporation Resolving metadata matched to media content
US20050044570A1 (en) 2003-08-20 2005-02-24 Thomas Poslinski Caching data from multiple channels simultaneously
WO2005029836A2 (en) 2003-09-12 2005-03-31 Opentv, Inc. Method and system for controlling recording and playback of interactive applications
US20050071881A1 (en) 2003-09-30 2005-03-31 Deshpande Sachin G. Systems and methods for playlist creation and playback
JP4047264B2 (ja) * 2003-09-30 2008-02-13 株式会社東芝 動画像処理装置、動画像処理方法および動画像処理プログラム
US20050071865A1 (en) 2003-09-30 2005-03-31 Martins Fernando C. M. Annotating meta-data with user responses to digital content
US20050097451A1 (en) 2003-11-03 2005-05-05 Cormack Christopher J. Annotating media content with user-specified information
DE60318451T2 (de) 2003-11-12 2008-12-11 Sony Deutschland Gmbh Automatische Zusammenfassung für eine Vorschlagsmaschine von Fernsehprogrammen beruhend auf Verbraucherpräferenzen
US8104065B2 (en) 2003-11-13 2012-01-24 Arris Group, Inc. System to provide markers to affect rendering and navigation of content on demand
US7519322B2 (en) 2003-12-04 2009-04-14 International Business Machines Corporation Tracking locally broadcast electronic works
US8196168B1 (en) 2003-12-10 2012-06-05 Time Warner, Inc. Method and apparatus for exchanging preferences for replaying a program on a personal video recorder
US20050138659A1 (en) 2003-12-17 2005-06-23 Gilles Boccon-Gibod Personal video recorders with automated buffering
US20050149965A1 (en) 2003-12-31 2005-07-07 Raja Neogi Selective media storage based on user profiles and preferences
US7613313B2 (en) 2004-01-09 2009-11-03 Hewlett-Packard Development Company, L.P. System and method for control of audio field based on position of user
KR100831531B1 (ko) 2004-01-14 2008-05-22 미쓰비시덴키 가부시키가이샤 기록 장치, 기록 방법, 기록 매체, 요약 재생 장치, 요약 재생 방법, 멀티미디어 요약 시스템 및 멀티미디어 요약 방법
US20050154987A1 (en) 2004-01-14 2005-07-14 Isao Otsuka System and method for recording and reproducing multimedia
US7493341B2 (en) 2004-01-16 2009-02-17 Hillcrest Laboratories, Inc. Metadata brokering server and methods
WO2005076594A1 (en) 2004-02-06 2005-08-18 Agency For Science, Technology And Research Automatic video event detection and indexing
US8238721B2 (en) 2004-02-27 2012-08-07 Hollinbeck Mgmt. Gmbh, Llc Scene changing in video playback devices including device-generated transitions
US7594245B2 (en) 2004-03-04 2009-09-22 Sharp Laboratories Of America, Inc. Networked video devices
EP1728386A4 (en) 2004-03-09 2009-03-04 Thomson Licensing SYSTEM AND METHOD FOR CUSTOMIZING PROGRAMMING RECALLS
US7882436B2 (en) 2004-03-10 2011-02-01 Trevor Burke Technology Limited Distribution of video data
US20080320523A1 (en) 2004-04-15 2008-12-25 Ronald Alan Morris Content-progress indicator for an EPG
US8079052B2 (en) 2004-04-23 2011-12-13 Concurrent Computer Corporation Methods, apparatuses, and systems for presenting advertisement content within trick files
US8024753B1 (en) 2004-04-28 2011-09-20 Echostar Satellite, Llc Method and apparatus for parental control
WO2005109904A2 (en) 2004-04-30 2005-11-17 Vulcan, Inc. Maintaining a graphical user interface state that is based on a selected type of content
JP4305269B2 (ja) 2004-04-30 2009-07-29 ソニー株式会社 信号処理装置及び方法
JP2006019770A (ja) 2004-05-31 2006-01-19 Toshiba Corp 放送受信装置及び放送受信方法、音声再生装置及び音声再生方法
JP2008502983A (ja) 2004-06-17 2008-01-31 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 性格属性を使うパーソナル化したサマリー
US7290698B2 (en) 2004-08-25 2007-11-06 Sony Corporation Progress bar with multiple portions
US7774811B2 (en) 2004-08-26 2010-08-10 Sony Corporation Method and system for use in displaying multimedia content and status
EP1800479A4 (en) 2004-10-15 2010-07-21 Opentv Inc ACCELERATION OF CHANNEL CHANGES
US20080097949A1 (en) 2004-11-30 2008-04-24 Koninklijke Philips Electronics, N.V. Apparatus and Method for Estimating User Interest Degree of a Program
US20090228911A1 (en) 2004-12-07 2009-09-10 Koninklijke Philips Electronics, N.V. Tv control arbiter applications
US7633887B2 (en) 2005-01-21 2009-12-15 Panwar Shivendra S On demand peer-to-peer video streaming with multiple description coding
JP2006211311A (ja) 2005-01-28 2006-08-10 Victor Co Of Japan Ltd ダイジェスト映像生成装置
JP4484730B2 (ja) 2005-03-01 2010-06-16 三菱電機株式会社 デジタル放送受信装置
US20060218573A1 (en) 2005-03-04 2006-09-28 Stexar Corp. Television program highlight tagging
FR2883441A1 (fr) 2005-03-17 2006-09-22 Thomson Licensing Sa Procede de selection de parties d'une emission audiovisuelle et dispositif mettant en oeuvre le procede
WO2006104968A2 (en) 2005-03-28 2006-10-05 The Directv Group, Inc. Interactive mosaic channel video stream with barker channel and guide
US7400364B2 (en) 2005-04-26 2008-07-15 International Business Machines Corporation Sub-program avoidance redirection for broadcast receivers
JP4299843B2 (ja) 2005-04-27 2009-07-22 パナソニック株式会社 映像要約装置、端末装置、映像要約システムおよび映像要約方法
US7562304B2 (en) 2005-05-03 2009-07-14 Mcafee, Inc. Indicating website reputations during website manipulation of user information
US7742111B2 (en) 2005-05-06 2010-06-22 Mavs Lab. Inc. Highlight detecting circuit and related method for audio feature-based highlight segment detection
KR20060128295A (ko) 2005-06-10 2006-12-14 엘지전자 주식회사 타 방송 채널 확인 방법
US7623677B2 (en) * 2005-06-17 2009-11-24 Fuji Xerox Co., Ltd. Methods and interfaces for visualizing activity across video frames in an action keyframe
US7532253B1 (en) 2005-07-26 2009-05-12 Pixelworks, Inc. Television channel change picture-in-picture circuit and method
US20070041706A1 (en) * 2005-08-09 2007-02-22 Sony Corporation Systems and methods for generating multimedia highlight content
US7382933B2 (en) * 2005-08-24 2008-06-03 International Business Machines Corporation System and method for semantic video segmentation based on joint audiovisual and text analysis
US8424041B2 (en) 2005-09-07 2013-04-16 Sony Corporation Method and system for downloading content to a content downloader
JP4618503B2 (ja) 2005-09-09 2011-01-26 ソニー株式会社 情報処理装置および方法、並びにプログラム
KR100755692B1 (ko) 2005-09-30 2007-09-05 삼성전자주식회사 컨텐츠 다운로드 시스템 및 방법
US7646962B1 (en) 2005-09-30 2010-01-12 Guideworks, Llc System and methods for recording and playing back programs having desirable recording attributes
US20070083901A1 (en) 2005-10-12 2007-04-12 Bond Madison E System and method for customized program scheduling
WO2007047410A2 (en) 2005-10-14 2007-04-26 United Video Properties, Inc. Systems and methods for recording multiple programs simultaneously with a single tuner
JP2007115293A (ja) 2005-10-17 2007-05-10 Toshiba Corp 情報記憶媒体、プログラム、情報再生方法、情報再生装置、データ転送方法、及びデータ処理方法
NO327155B1 (no) 2005-10-19 2009-05-04 Fast Search & Transfer Asa Fremgangsmåte for å vise videodata innenfor resultatpresentasjoner i systemer for aksessering og søking av informasjon
KR100650407B1 (ko) 2005-11-15 2006-11-29 삼성전자주식회사 멀티 모달 기반의 고속 비디오 요약 생성 방법 및 그 장치
US7930419B2 (en) 2005-12-04 2011-04-19 Turner Broadcasting System, Inc. System and method for delivering video and audio content over a network
US20070212023A1 (en) 2005-12-13 2007-09-13 Honeywell International Inc. Video filtering system
WO2007076072A2 (en) 2005-12-22 2007-07-05 Catalog.Com, Inc. Social network-enabled interactive media player
CN100442307C (zh) * 2005-12-27 2008-12-10 中国科学院计算技术研究所 球门检测方法
US20070154163A1 (en) 2005-12-29 2007-07-05 United Video Properties, Inc. Systems and methods for creating aggregations of episodes of series programming in order
US7831112B2 (en) 2005-12-29 2010-11-09 Mavs Lab, Inc. Sports video retrieval method
US20070154169A1 (en) 2005-12-29 2007-07-05 United Video Properties, Inc. Systems and methods for accessing media program options based on program segment interest
US9015736B2 (en) 2005-12-29 2015-04-21 Rovi Guides, Inc. Systems and methods for episode tracking in an interactive media environment
CN101371273A (zh) * 2005-12-30 2009-02-18 意大利电信股份公司 视频序列的分割
EP1969560B1 (en) * 2005-12-30 2017-04-05 Telecom Italia S.p.A. Edge-controlled morphological closing in segmentation of video sequences
US20070157285A1 (en) 2006-01-03 2007-07-05 The Navvo Group Llc Distribution of multimedia content
US20070157235A1 (en) 2006-01-04 2007-07-05 Lucent Technologies Inc. Method and apparatus for reverting to a preferred program at the end of a commercial interruption
US7558809B2 (en) 2006-01-06 2009-07-07 Mitsubishi Electric Research Laboratories, Inc. Task specific audio classification for identifying video highlights
WO2007080345A1 (fr) 2006-01-09 2007-07-19 Thomson Licensing Procede et systeme de distribution de contenu multimedia
JP2007201759A (ja) 2006-01-26 2007-08-09 Sony Corp 情報処理装置および方法、並びにプログラム
US8332889B2 (en) 2006-02-10 2012-12-11 Cox Communications, Inc. Generating a personalized video mosaic in a cable services network
WO2007098067A1 (en) 2006-02-17 2007-08-30 The Directv Group, Inc. Dynamic viewership rating system
US20070199040A1 (en) 2006-02-23 2007-08-23 Lawrence Kates Multi-channel parallel digital video recorder
KR100764175B1 (ko) 2006-02-27 2007-10-08 삼성전자주식회사 맞춤형 방송 서비스를 위한 동영상의 중요 자막을 검출하는장치 및 방법
US7962942B1 (en) 2006-02-28 2011-06-14 Rovi Guides, Inc. Systems and methods for enhanced trick-play functions
US20070239856A1 (en) 2006-03-24 2007-10-11 Abadir Essam E Capturing broadcast sources to create recordings and rich navigations on mobile media devices
US8316394B2 (en) 2006-03-24 2012-11-20 United Video Properties, Inc. Interactive media guidance application with intelligent navigation and display features
US8793579B2 (en) 2006-04-20 2014-07-29 Google Inc. Graphical user interfaces for supporting collaborative generation of life stories
US8682654B2 (en) 2006-04-25 2014-03-25 Cyberlink Corp. Systems and methods for classifying sports video
US20070288951A1 (en) 2006-04-28 2007-12-13 First Data Corporation Incentives for viewing advertisements
JP4770590B2 (ja) * 2006-05-26 2011-09-14 ソニー株式会社 アウトラインの作成装置および作成方法、並びに画像処理装置
KR100757231B1 (ko) 2006-06-08 2007-09-10 삼성전자주식회사 Dmb 휴대단말기에 있어 복수의 채널 동시 다중화면시청 방법 및 장치
CN101110759A (zh) 2006-07-20 2008-01-23 朗迅科技公司 用于因特网协议电视网络的对等文件下载系统
US20080066106A1 (en) 2006-07-31 2008-03-13 Guideworks, Llc Systems and methods for providing media guidance planners
US8090358B2 (en) 2006-08-16 2012-01-03 At&T Intellectual Property I, L.P. Methods and computer-readable media for location-based targeted advertising
US8949895B2 (en) 2006-08-18 2015-02-03 The Directv Group, Inc. Mosaic channel video stream with personalized interactive services
JP2010502116A (ja) 2006-08-18 2010-01-21 ソニー株式会社 推奨エンジンによる選択的メディアコンテンツアクセスのシステム及び方法
US20080133327A1 (en) 2006-09-14 2008-06-05 Shah Ullah Methods and systems for securing content played on mobile devices
US20080086743A1 (en) 2006-10-06 2008-04-10 Infovalue Computing, Inc. Enhanced personal video recorder
US8296808B2 (en) 2006-10-23 2012-10-23 Sony Corporation Metadata from image recognition
US20080115166A1 (en) 2006-10-26 2008-05-15 Kulvir Singh Bhogal Digital video recorder processing system
EP1919216A1 (en) 2006-10-30 2008-05-07 British Telecommunications Public Limited Company Personalised media presentation
US20080155602A1 (en) 2006-12-21 2008-06-26 Jean-Luc Collet Method and system for preferred content identification
US20080152300A1 (en) 2006-12-22 2008-06-26 Guideworks, Llc Systems and methods for inserting advertisements during commercial skip
JP2008167019A (ja) 2006-12-27 2008-07-17 Toshiba Corp 録画再生装置
JP4945236B2 (ja) 2006-12-27 2012-06-06 株式会社東芝 映像コンテンツ表示装置、映像コンテンツ表示方法及びそのプログラム
US20080163059A1 (en) 2006-12-28 2008-07-03 Guideworks, Llc Systems and methods for creating custom video mosaic pages with local content
US20080168503A1 (en) 2007-01-08 2008-07-10 General Instrument Corporation System and Method for Selecting and Viewing Broadcast Content Based on Syndication Streams
JP5010292B2 (ja) * 2007-01-18 2012-08-29 株式会社東芝 映像属性情報出力装置、映像要約装置、プログラムおよび映像属性情報出力方法
US20080178219A1 (en) 2007-01-23 2008-07-24 At&T Knowledge Ventures, Lp System and method for providing video content
JP5034516B2 (ja) 2007-01-26 2012-09-26 富士通モバイルコミュニケーションズ株式会社 ハイライトシーン検出装置
US8429683B2 (en) 2007-03-23 2013-04-23 Verizon Patent And Licensing Inc. Program viewing history
US9237308B2 (en) 2007-03-30 2016-01-12 Verizon Patent And Licensing Inc. Method and system for providing a transition between linear content and non-linear content
US8769559B2 (en) 2007-03-30 2014-07-01 Verizon Patent And Licensing Inc. Systems and methods for using incentives to increase advertising effectiveness
JP2010527051A (ja) * 2007-03-30 2010-08-05 グーグル・インコーポレーテッド モバイル装置のための文書処理
US20100031162A1 (en) 2007-04-13 2010-02-04 Wiser Philip R Viewer interface for a content delivery system
JP4029915B2 (ja) 2007-04-18 2008-01-09 ソニー株式会社 通信システム
US20080270038A1 (en) 2007-04-24 2008-10-30 Hadi Partovi System, apparatus and method for determining compatibility between members of a social network
US20080271078A1 (en) 2007-04-30 2008-10-30 Google Inc. Momentary Electronic Program Guide
WO2008150893A1 (en) 2007-05-31 2008-12-11 Friendlyfavor, Inc. Method for enabling the exchange of online favors
US8457768B2 (en) 2007-06-04 2013-06-04 International Business Machines Corporation Crowd noise analysis
US20080307485A1 (en) 2007-06-05 2008-12-11 Microsoft Corporation Automatic extension of recording using in-band and out-of-band data sources
US8099315B2 (en) 2007-06-05 2012-01-17 At&T Intellectual Property I, L.P. Interest profiles for audio and/or video streams
US20090025027A1 (en) 2007-07-20 2009-01-22 Michael Craner Systems & methods for allocating bandwidth in switched digital video systems based on interest
US8275764B2 (en) 2007-08-24 2012-09-25 Google Inc. Recommending media programs based on media program popularity
US7983442B2 (en) * 2007-08-29 2011-07-19 Cyberlink Corp. Method and apparatus for determining highlight segments of sport video
US8750688B2 (en) 2007-09-21 2014-06-10 Echostar Technologies L.L.C. Systems and methods for selectively recording at least part of a program based on an occurrence of a video or audio characteristic in the program
JP5286732B2 (ja) 2007-10-01 2013-09-11 ソニー株式会社 情報処理装置および方法、プログラム、並びに記録媒体
US8646683B2 (en) 2007-10-31 2014-02-11 Koplar Interactive Systems International L.L.C. Method and system for device notification
US20090144777A1 (en) 2007-11-29 2009-06-04 Mobitv, Inc. Real-time most watched guide ordering and generation
US20110023077A1 (en) 2007-12-12 2011-01-27 Colin Simon Method, system and apparatus to enable convergent television accessibility on digital television panels with encryption capabilities
US9445159B2 (en) 2007-12-17 2016-09-13 Echostar Technologies L.L.C. Extended recording time apparatus, systems, and methods
US8385536B2 (en) 2008-01-09 2013-02-26 Verizon Patent And Licensing Inc. Automatic telephone number favorites list
US8312486B1 (en) 2008-01-30 2012-11-13 Cinsay, Inc. Interactive product placement system and method therefor
US8522271B2 (en) 2008-02-14 2013-08-27 Qualcomm Incorporated Methods and apparatuses for sharing user profiles
WO2012047672A1 (en) 2010-09-27 2012-04-12 Hulu Llc Method and apparatus for providing user control of advertising breaks associated with a media program
US8997150B2 (en) 2008-03-10 2015-03-31 Hulu, LLC Method and apparatus for permitting user interruption of an advertisement and the substitution of alternate advertisement version
US7822753B2 (en) 2008-03-11 2010-10-26 Cyberlink Corp. Method for displaying search results in a browser interface
JP5243070B2 (ja) 2008-03-14 2013-07-24 ソニー株式会社 情報提供装置、受信端末、情報提供システム、情報提供方法、およびプログラム
WO2009115101A1 (en) 2008-03-20 2009-09-24 Institut für Rundfunktechnik GmbH A method of adapting video images to small screen sizes
US20090249412A1 (en) 2008-03-25 2009-10-01 International Business Machines Corporation Managing acquisition of fee based videos
US7543322B1 (en) 2008-05-06 2009-06-02 International Business Machines Corporation Method for enhanced event specific features on personal video recorders
US8689103B2 (en) * 2008-05-09 2014-04-01 Apple Inc. Automated digital media presentations
EP2124451A3 (en) 2008-05-23 2014-03-26 Sony Corporation Content server, information processing apparatus, network device, content distribution method, information processing method, and content distribution system
US8447643B2 (en) 2008-06-02 2013-05-21 Melvin L. Barnes, Jr. System and method for collecting and distributing reviews and ratings
KR101474735B1 (ko) 2008-06-30 2014-12-30 삼성전자주식회사 방송수신장치 및 그의 구동방법
US8209713B1 (en) 2008-07-11 2012-06-26 The Directv Group, Inc. Television advertisement monitoring system
JP4636135B2 (ja) * 2008-08-04 2011-02-23 ソニー株式会社 画像処理装置、撮像装置、画像処理方法およびプログラム
US8867622B2 (en) 2008-08-14 2014-10-21 Broadcom Corporation Method and system for priority-based digital multi-stream decoding
US8320674B2 (en) 2008-09-03 2012-11-27 Sony Corporation Text localization for image and video OCR
US8578426B2 (en) 2008-09-10 2013-11-05 Qualcomm Incorporated Method and system for selecting media content for broadcast based on viewer preference indications
US20100071007A1 (en) 2008-09-12 2010-03-18 Echostar Global B.V. Method and Apparatus for Control of a Set-Top Box/Digital Video Recorder Using a Mobile Device
US8769682B2 (en) 2008-09-18 2014-07-01 Alcatel Lucent Mechanism for identifying malicious content, DoS attacks, and illegal IPTV services
US8635645B2 (en) 2008-09-30 2014-01-21 Qualcomm Incorporated Apparatus and methods of providing and receiving venue level transmissions and services
US20100086277A1 (en) 2008-10-03 2010-04-08 Guideworks, Llc Systems and methods for deleting viewed portions of recorded programs
US8818803B2 (en) 2008-10-27 2014-08-26 Frank Elmo Weber Character-based automated text summarization
US8875183B2 (en) 2008-10-31 2014-10-28 International Business Machines Corporation Intelligent TV mosaic for IPTV
US20100125864A1 (en) 2008-11-17 2010-05-20 Duke University Mobile remote control of a shared media resource
US9141859B2 (en) 2008-11-17 2015-09-22 Liveclips Llc Method and system for segmenting and transmitting on-demand live-action video in real-time
US8427356B1 (en) 2008-11-28 2013-04-23 Uei Cayman Inc. Automatic determination and retrieval of a favorite channel
US8453185B2 (en) 2008-12-08 2013-05-28 Echostar Global B.V. Data transmission from a set-top box
US20100153983A1 (en) 2008-12-15 2010-06-17 Earl Warren Philmon Automated presence for set top boxes
US8351691B2 (en) * 2008-12-18 2013-01-08 Canon Kabushiki Kaisha Object extraction in colour compound documents
US7975285B2 (en) 2008-12-26 2011-07-05 Kabushiki Kaisha Toshiba Broadcast receiver and output control method thereof
US20110252451A1 (en) 2009-02-05 2011-10-13 Shlomo Turgeman Personal tv gateway stb/router
US9137474B2 (en) 2009-02-26 2015-09-15 At&T Intellectual Property I, L.P. Intelligent remote control
US9215423B2 (en) 2009-03-30 2015-12-15 Time Warner Cable Enterprises Llc Recommendation engine apparatus and methods
US11076189B2 (en) 2009-03-30 2021-07-27 Time Warner Cable Enterprises Llc Personal media channel apparatus and methods
US8769589B2 (en) 2009-03-31 2014-07-01 At&T Intellectual Property I, L.P. System and method to create a media content summary based on viewer annotations
US20100262986A1 (en) 2009-04-08 2010-10-14 Verizon Patent And Licensing Inc. Viewing history
US20100269144A1 (en) 2009-04-17 2010-10-21 Tandberg Television, Inc. Systems and methods for incorporating user generated content within a vod environment
CN101650722B (zh) 2009-06-01 2011-10-26 南京理工大学 基于音视频融合的足球视频精彩事件检测方法
US20100319019A1 (en) 2009-06-12 2010-12-16 Frank Zazza Directing Interactive Content
US8437617B2 (en) 2009-06-17 2013-05-07 Echostar Technologies L.L.C. Method and apparatus for modifying the presentation of content
JP5424737B2 (ja) * 2009-06-23 2014-02-26 三菱電機株式会社 画像再生装置
US8458742B2 (en) 2009-06-30 2013-06-04 Echostar Technologies L.L.C. Apparatus systems and methods for securely sharing content with a plurality of receiving devices
KR20110006362A (ko) 2009-07-14 2011-01-20 엘지전자 주식회사 이동 단말기 및 이것의 방송 제어 방법
US20110016492A1 (en) 2009-07-16 2011-01-20 Gemstar Development Corporation Systems and methods for forwarding media asset events
US8406431B2 (en) 2009-07-23 2013-03-26 Sling Media Pvt. Ltd. Adaptive gain control for digital audio samples in a media stream
KR101706802B1 (ko) 2009-08-07 2017-02-27 톰슨 라이센싱 인터넷 사이트와 상호작용하기 위한 시스템 및 방법
US8364021B2 (en) 2009-08-26 2013-01-29 Echostar Technologies L.L.C. Systems and methods for managing stored programs
US8875167B2 (en) 2009-09-21 2014-10-28 Mobitv, Inc. Implicit mechanism for determining user response to media
US20130191857A1 (en) 2009-10-02 2013-07-25 R. Edward Guinn Method and System for a Vote Based Media System
US8671089B2 (en) 2009-10-06 2014-03-11 Brightedge Technologies, Inc. Correlating web page visits and conversions with external references
US20110109801A1 (en) 2009-11-12 2011-05-12 Thomas Christopher L Method and System for Television Channel Control
KR20110062982A (ko) * 2009-12-04 2011-06-10 삼성전자주식회사 실시간 방송 컨텐츠의 방송 요약 정보 생성 방법 및 장치와, 그 제공방법 및 방송 수신 장치
EP2514198A4 (en) 2009-12-16 2013-07-03 Thomson Licensing SYSTEM AND METHOD FOR THE PROTECTION OF ADVERTISING INFORMATION MESSAGES
US20110161242A1 (en) 2009-12-28 2011-06-30 Rovi Technologies Corporation Systems and methods for searching and browsing media in an interactive media guidance application
US20110173337A1 (en) 2010-01-13 2011-07-14 Oto Technologies, Llc Proactive pre-provisioning for a content sharing session
US10455275B2 (en) 2010-02-16 2019-10-22 Comcast Cable Communications, Llc Disposition of video alerts and integration of a mobile device into a local service domain
EP2618562B1 (en) 2010-02-19 2017-11-15 EchoStar Technologies L.L.C. System for searching for online versions of broadcast items
WO2011102416A1 (ja) * 2010-02-19 2011-08-25 株式会社 東芝 移動物体追跡システムおよび移動物体追跡方法
JP2013520871A (ja) 2010-02-19 2013-06-06 トムソン ライセンシング セットトップボックスにおける自動クリップ生成
US8535131B2 (en) 2010-02-27 2013-09-17 Thuuz, LLC Method and system for an online performance service with recommendation module
US8437620B2 (en) 2010-03-05 2013-05-07 Intel Corporation System, method, and computer program product for custom stream generation
US20110231887A1 (en) 2010-03-10 2011-09-22 West R Michael Peters Methods and systems for audio-video clip sharing for internet-delivered television programming
US8140570B2 (en) 2010-03-11 2012-03-20 Apple Inc. Automatic discovery of metadata
GB2479343A (en) 2010-03-26 2011-10-12 British Broadcasting Corp EPG showing a list of additional episodes in the same TV series when a TV programme is selected
US8855470B2 (en) 2010-04-06 2014-10-07 Time Warner Cable Enterprises Llc Use of multiple embedded messages in program signal streams
WO2011127140A1 (en) 2010-04-06 2011-10-13 Statsheet, Inc. Systems for dynamically generating and presenting narrative content
US8688434B1 (en) 2010-05-13 2014-04-01 Narrative Science Inc. System and method for using data to automatically generate a narrative story
US9912721B2 (en) 2010-05-14 2018-03-06 Highlight Broadcast Network, Llc Systems and methods for providing event-related video sharing services
US9564148B2 (en) 2010-05-18 2017-02-07 Sprint Communications Company L.P. Isolation and modification of audio streams of a mixed signal in a wireless communication device
US8995685B2 (en) 2010-05-28 2015-03-31 Echostar Technologies L.L.C. Apparatus, systems and methods for limiting output volume of a media presentation device
JP4880100B2 (ja) 2010-06-01 2012-02-22 パナソニック株式会社 コンテンツ処理装置、テレビジョン受像機、及びコンテンツ処理方法
US9213986B1 (en) 2010-06-29 2015-12-15 Brian K. Buchheit Modified media conforming to user-established levels of media censorship
FR2962290A1 (fr) 2010-06-30 2012-01-06 Alcatel Lucent Procede d'affichage de contenus audiovisuels adaptes et serveur correspondant
JP2012029019A (ja) 2010-07-23 2012-02-09 Hitachi Consumer Electronics Co Ltd コンテンツ再生装置
JP5669471B2 (ja) 2010-07-26 2015-02-12 株式会社アイ・オー・データ機器 端末装置およびプログラム
WO2012023920A2 (en) 2010-08-19 2012-02-23 Thomson Licensing Personalization of information content by monitoring network traffic
US8677428B2 (en) 2010-08-20 2014-03-18 Disney Enterprises, Inc. System and method for rule based dynamic server side streaming manifest files
US20120052941A1 (en) 2010-08-28 2012-03-01 Mo Cheuong K Method and system for multiple player, location, and operator gaming via interactive digital signage
JP2012060385A (ja) 2010-09-08 2012-03-22 Fujitsu Ltd 継承通信管理装置及び継承通信管理方法
WO2012036656A1 (en) 2010-09-17 2012-03-22 Thomson Licensing Method and system for determining identity/presence of a mobile device user for control and interaction in content distribution
WO2012042097A1 (en) 2010-09-30 2012-04-05 Nokia Corporation Method, apparatus and computer program product for summarizing multimedia content
CN103270768B (zh) 2010-10-25 2017-04-05 三星电子株式会社 用于基于社交网络共享tv广播内容的方法和服务器,以及用于接收基于社交网络共享tv广播内容的服务的方法和装置
US8875276B2 (en) 2011-09-02 2014-10-28 Iota Computing, Inc. Ultra-low power single-chip firewall security device, system and method
US8548303B2 (en) 2010-11-03 2013-10-01 Cisco Technology, Inc. Reconciling digital content at a digital media device
GB2486257B (en) 2010-12-09 2015-05-27 Samsung Electronics Co Ltd Multimedia system and method of recommending multimedia content
JP5989004B2 (ja) * 2011-01-04 2016-09-07 タタ・コンサルタンシー・サーヴィシズ・リミテッド ロゴ認証
US9137585B2 (en) 2011-01-13 2015-09-15 BlackArrow, INC Method and apparatus for inserting advertisements in content
US8689258B2 (en) 2011-02-18 2014-04-01 Echostar Technologies L.L.C. Apparatus, systems and methods for accessing an initial portion of a media content event
US8990690B2 (en) 2011-02-18 2015-03-24 Futurewei Technologies, Inc. Methods and apparatus for media navigation
WO2012117278A2 (en) 2011-02-28 2012-09-07 Telefonaktiebolaget Lm Ericsson (Publ) Electronically communicating media recommendations responsive to preferences for an electronic terminal
US9357154B2 (en) 2011-03-11 2016-05-31 Echostar Technologies L.L.C. Apparatus, systems and methods for accessing missed media content
US8606090B2 (en) 2011-03-17 2013-12-10 Sony Corporation Sport program chaptering
US20120260295A1 (en) 2011-04-05 2012-10-11 Planetmac, Llc Wireless Audio Dissemination System
US8973068B2 (en) 2011-04-08 2015-03-03 Verizon Patent And Licensing Inc. Video on demand delivery optimization over combined satellite and wireless broadband networks
US20120263439A1 (en) 2011-04-13 2012-10-18 David King Lassman Method and apparatus for creating a composite video from multiple sources
US20120278834A1 (en) 2011-04-27 2012-11-01 Echostar Technologies L.L.C. Apparatus, systems, and methods for discerning user action with regard to commercials
US20120278837A1 (en) 2011-04-29 2012-11-01 Sling Media Inc. Presenting related content during a placeshifting session
US20120284745A1 (en) 2011-05-06 2012-11-08 Echostar Technologies L.L.C. Apparatus, systems and methods for improving commercial presentation
CN102883662B (zh) * 2011-05-11 2015-04-08 株式会社东芝 医疗图像处理设备以及其方法
EP2525569A1 (en) 2011-05-20 2012-11-21 Eldon Technology Limited Enhanced programme preview content
US20120324491A1 (en) 2011-06-17 2012-12-20 Microsoft Corporation Video highlight identification based on environmental sensing
US8639706B1 (en) 2011-07-01 2014-01-28 Google Inc. Shared metadata for media files
CN102254160B (zh) * 2011-07-12 2013-06-12 央视国际网络有限公司 视频比分的检测识别方法及装置
WO2013016626A1 (en) 2011-07-27 2013-01-31 Thomson Licensing Variable real time buffer and apparatus
KR20140051994A (ko) 2011-07-28 2014-05-02 톰슨 라이센싱 오디오 교정 시스템 및 방법
CN102263907B (zh) * 2011-08-04 2013-09-18 央视国际网络有限公司 比赛视频的播放控制方法及其片段信息的生成方法和装置
AU2011205223C1 (en) 2011-08-09 2013-03-28 Microsoft Technology Licensing, Llc Physical interaction with virtual objects for DRM
US8627349B2 (en) 2011-08-23 2014-01-07 Echostar Technologies L.L.C. User interface
US10217117B2 (en) 2011-09-15 2019-02-26 Stephan HEATH System and method for social networking interactions using online consumer browsing behavior, buying patterns, advertisements and affiliate advertising, for promotions, online coupons, mobile services, products, goods and services, entertainment and auctions, with geospatial mapping technology
US20130074109A1 (en) 2011-09-20 2013-03-21 Sidebar, Inc. Television listing user interface based on trending
US9930311B2 (en) 2011-10-20 2018-03-27 Geun Sik Jo System and method for annotating a video with advertising information
US9077947B2 (en) 2011-11-09 2015-07-07 Microsoft Technology Licensing, Llc Presenting linear and nonlinear content via DVR
US9215507B2 (en) 2011-11-21 2015-12-15 Verizon Patent And Licensing Inc. Volume customization
US8812499B2 (en) 2011-11-30 2014-08-19 Nokia Corporation Method and apparatus for providing context-based obfuscation of media
US9967621B2 (en) 2011-12-15 2018-05-08 Rovi Technologies Corporation Dynamic personalized program content
GB201122276D0 (en) 2011-12-23 2012-02-01 Mubi Uk Ltd Method and apparatus for accessing media
JP2013157962A (ja) 2012-01-31 2013-08-15 Toshiba Corp 電子機器、外部機器、電子機器の制御方法、電子機器の制御プログラム
US9438487B2 (en) 2012-02-23 2016-09-06 Ericsson Ab Bandwith policy management in a self-corrected content delivery network
JP2013175854A (ja) 2012-02-24 2013-09-05 Sharp Corp 録画再生装置および録画再生システム
US20130226983A1 (en) 2012-02-29 2013-08-29 Jeffrey Martin Beining Collaborative Video Highlights
JP5510484B2 (ja) 2012-03-21 2014-06-04 カシオ計算機株式会社 動画撮影装置、ダイジェスト再生設定装置、ダイジェスト再生設定方法、及び、プログラム
US9137578B2 (en) 2012-03-27 2015-09-15 Roku, Inc. Method and apparatus for sharing content
US9467723B2 (en) 2012-04-04 2016-10-11 Time Warner Cable Enterprises Llc Apparatus and methods for automated highlight reel creation in a content delivery network
US20130268955A1 (en) 2012-04-06 2013-10-10 Microsoft Corporation Highlighting or augmenting a media program
US20130283162A1 (en) 2012-04-23 2013-10-24 Sony Mobile Communications Ab System and method for dynamic content modification based on user reactions
WO2013166456A2 (en) 2012-05-04 2013-11-07 Mocap Analytics, Inc. Methods, systems and software programs for enhanced sports analytics and applications
CA2775700C (en) 2012-05-04 2013-07-23 Microsoft Corporation Determining a future portion of a currently presented media program
US9767259B2 (en) 2012-05-07 2017-09-19 Google Inc. Detection of unauthorized content in live multiuser composite streams
US20130326575A1 (en) 2012-05-30 2013-12-05 Disney Enterprise, Inc. Social Media Driven Generation of a Highlight Clip from a Media Content Stream
US9965129B2 (en) 2012-06-01 2018-05-08 Excalibur Ip, Llc Personalized content from indexed archives
US9792285B2 (en) 2012-06-01 2017-10-17 Excalibur Ip, Llc Creating a content index using data on user actions
US8990418B1 (en) 2012-06-01 2015-03-24 Google Inc. Providing data feeds for video programs
US9094708B2 (en) 2012-06-08 2015-07-28 Rovi Guides, Inc. Methods and systems for prioritizing listings based on real-time data
US9648379B2 (en) 2012-06-11 2017-05-09 At&T Intellectual Property I, L.P. Complimentary content based recording of media content
AU2013206449A1 (en) 2012-06-20 2014-01-16 Visa International Service Association Multi-channel remote payment apparatuses, methods and systems
US8995823B2 (en) 2012-07-17 2015-03-31 HighlightCam, Inc. Method and system for content relevance score determination
WO2014018365A2 (en) 2012-07-26 2014-01-30 Jvl Ventures, Llc Systems, methods, and computer program products for receiving a feed message
US20140028917A1 (en) 2012-07-30 2014-01-30 General Instrument Corporation Displaying multimedia
US9699485B2 (en) 2012-08-31 2017-07-04 Facebook, Inc. Sharing television and video programming through social networking
US9237386B2 (en) 2012-08-31 2016-01-12 Google Inc. Aiding discovery of program content by providing deeplinks into most interesting moments via social media
US8595763B1 (en) 2012-08-31 2013-11-26 Thuuz, Inc. Generating teasers for live performances
US9060210B2 (en) 2012-08-31 2015-06-16 Thuuz, Inc. Generating excitement levels for live performances
US8842007B2 (en) 2012-08-31 2014-09-23 Thuuz, Inc. Generating alerts for live performances
US20140074866A1 (en) 2012-09-10 2014-03-13 Cisco Technology, Inc. System and method for enhancing metadata in a video processing environment
US10091552B2 (en) 2012-09-19 2018-10-02 Rovi Guides, Inc. Methods and systems for selecting optimized viewing portions
US9092415B2 (en) 2012-09-25 2015-07-28 Rovi Guides, Inc. Systems and methods for automatic program recommendations based on user interactions
US20140111542A1 (en) * 2012-10-20 2014-04-24 James Yoong-Siang Wan Platform for recognising text using mobile devices with a built-in device video camera and automatically retrieving associated content based on the recognised text
US20140123160A1 (en) 2012-10-24 2014-05-01 Bart P.E. van Coppenolle Video presentation interface with enhanced navigation features
WO2014072742A1 (en) 2012-11-09 2014-05-15 Camelot Strategic Solutions Limited Improvements relating to audio visual interfaces
US20140139555A1 (en) 2012-11-21 2014-05-22 ChatFish Ltd Method of adding expression to text messages
US9762944B2 (en) 2012-11-28 2017-09-12 Rovi Guides, Inc. Systems and methods for presenting content simultaneously in different forms based on parental control settings
US9720558B2 (en) 2012-11-30 2017-08-01 Verizon and Redbox Digital Entertainment Services, LLC Systems and methods for providing a personalized media service user interface
US9300939B2 (en) 2012-11-30 2016-03-29 Verizon Patent And Licensing Inc. Methods and systems for resolving conflicts in a multi-tuner digital video recording system
US8774596B2 (en) 2012-12-10 2014-07-08 Futurewei Technologies, Inc. Context driven video prioritization and bookmarking
US9451202B2 (en) 2012-12-27 2016-09-20 Echostar Technologies L.L.C. Content-based highlight recording of television programming
US9363028B2 (en) 2013-01-25 2016-06-07 Time Warner Cable Enterprises Llc Apparatus and methods for catalog data distribution
JP2014157460A (ja) 2013-02-15 2014-08-28 Sharp Corp コンテンツ発見支援装置、コンテンツ表示システム及びプログラム
JP2014187687A (ja) 2013-02-21 2014-10-02 Mitsubishi Electric Corp 動画像のハイライトシーン抽出装置及び方法
US9204186B2 (en) 2013-03-13 2015-12-01 Comcast Cable Communications, Llc Buffering content
US9621960B2 (en) 2013-03-13 2017-04-11 Echostar Technologies L.L.C. Majority rule selection of media content
US10880609B2 (en) 2013-03-14 2020-12-29 Comcast Cable Communications, Llc Content event messaging
US9602875B2 (en) 2013-03-15 2017-03-21 Echostar Uk Holdings Limited Broadcast content resume reminder
US9258614B2 (en) 2013-03-15 2016-02-09 Time Warner Cable Enterprises Llc System and method for resolving scheduling conflicts in multi-tuner devices and systems
US10142700B2 (en) 2013-03-15 2018-11-27 DISH Technologies L.L.C. Television service provided social networking service
US9253533B1 (en) 2013-03-22 2016-02-02 Amazon Technologies, Inc. Scene identification
US9407971B2 (en) 2013-03-27 2016-08-02 Adobe Systems Incorporated Presentation of summary content for primary content
US10068614B2 (en) 2013-04-26 2018-09-04 Microsoft Technology Licensing, Llc Video service with automated video timeline curation
US10080054B2 (en) 2013-04-26 2018-09-18 Texas Instruments Incorporated Automatic time extension of program recording
US20140325556A1 (en) 2013-04-26 2014-10-30 Microsoft Corporation Alerts and web content over linear tv broadcast
US8973038B2 (en) 2013-05-03 2015-03-03 Echostar Technologies L.L.C. Missed content access guide
US20140333841A1 (en) 2013-05-10 2014-11-13 Randy Steck Modular and scalable digital multimedia mixer
US20140351045A1 (en) 2013-05-23 2014-11-27 LNO (Official.fm) SA System and Method for Pairing Media Content with Branded Content
US9715902B2 (en) 2013-06-06 2017-07-25 Amazon Technologies, Inc. Audio-based annotation of video
US9930404B2 (en) 2013-06-17 2018-03-27 Echostar Technologies L.L.C. Event-based media playback
US9378772B2 (en) 2013-06-27 2016-06-28 Rovi Guides, Inc. Systems and methods for visualizing storage availability of a DVR
US9848249B2 (en) 2013-07-15 2017-12-19 Echostar Technologies L.L.C. Location based targeted advertising
US11134304B2 (en) 2013-07-31 2021-09-28 Time Warner Cable Enterprises Llc Methods and apparatus that facilitate channel switching during commercial breaks and/or other program segments
US10362351B2 (en) 2013-08-19 2019-07-23 Tivo Solutions, Inc. Dynamic tuner allocation
US9066156B2 (en) 2013-08-20 2015-06-23 Echostar Technologies L.L.C. Television receiver enhancement features
US9247136B2 (en) * 2013-08-21 2016-01-26 Xerox Corporation Automatic mobile photo capture using video analysis
WO2015038749A1 (en) * 2013-09-13 2015-03-19 Arris Enterprises, Inc. Content based video content segmentation
US9436705B2 (en) 2013-09-17 2016-09-06 Google Technology Holdings LLC Grading images and video clips
US9113200B2 (en) 2013-09-30 2015-08-18 Verizon Patent And Licensing Inc. Live channel switching and return during commercial breaks
KR20150043111A (ko) * 2013-10-14 2015-04-22 삼성전자주식회사 컨텐츠 요약 서버, 컨텐츠 제공 시스템 및 이의 컨텐츠 요약 방법
US20150110462A1 (en) 2013-10-21 2015-04-23 Sling Media, Inc. Dynamic media viewing
US10297287B2 (en) 2013-10-21 2019-05-21 Thuuz, Inc. Dynamic media recording
US9642008B2 (en) 2013-10-25 2017-05-02 Lookout, Inc. System and method for creating and assigning a policy for a mobile communications device based on personal data
US10867635B2 (en) * 2013-11-11 2020-12-15 Vimeo, Inc. Method and system for generation of a variant video production from an edited video production
US9578377B1 (en) 2013-12-03 2017-02-21 Venuenext, Inc. Displaying a graphical game play feed based on automatically detecting bounds of plays or drives using game related data sources
JP5875637B2 (ja) * 2013-12-19 2016-03-02 キヤノン株式会社 画像処理装置、画像処理方法
US9420333B2 (en) 2013-12-23 2016-08-16 Echostar Technologies L.L.C. Mosaic focus control
US9860477B2 (en) 2013-12-23 2018-01-02 Echostar Technologies L.L.C. Customized video mosaic
US20150189377A1 (en) 2013-12-27 2015-07-02 United Video Properties, Inc. Methods and systems for adjusting user input interaction types based on the level of engagement of a user
JP6307892B2 (ja) * 2014-01-20 2018-04-11 富士通株式会社 抽出プログラム、方法、及び装置、並びに野球映像メタ情報作成装置、方法、及びプログラム
DE102014201802A1 (de) 2014-01-31 2015-08-20 Bilfinger Mce Gmbh Schutzzaun
US9779775B2 (en) 2014-02-24 2017-10-03 Lyve Minds, Inc. Automatic generation of compilation videos from an original video based on metadata associated with the original video
US9380342B2 (en) 2014-02-28 2016-06-28 Rovi Guides, Inc. Systems and methods for control of media access based on crowd-sourced access control data and user-attributes
US9641791B2 (en) 2014-03-03 2017-05-02 Microsoft Technology Licensing, Llc Bandwidth aware digital video recording (DVR) scheduling
KR102217186B1 (ko) 2014-04-11 2021-02-19 삼성전자주식회사 요약 컨텐츠 서비스를 위한 방송 수신 장치 및 방법
US9583149B2 (en) 2014-04-23 2017-02-28 Daniel Stieglitz Automated video logging methods and systems
US9959744B2 (en) 2014-04-25 2018-05-01 Motorola Solutions, Inc. Method and system for providing alerts for radio communications
US20150334461A1 (en) 2014-05-14 2015-11-19 Looq System Inc. Methods and systems for dynamically recommending favorite channels or programs
US9288551B2 (en) 2014-06-05 2016-03-15 Echostar Technologies L.L.C. Systems and methods for viewer-incentivized targeted commercials
KR102208624B1 (ko) * 2014-07-08 2021-01-28 삼성전자 주식회사 전자 장치 및 이의 컨텐츠 제공 방법
US20160014482A1 (en) * 2014-07-14 2016-01-14 The Board Of Trustees Of The Leland Stanford Junior University Systems and Methods for Generating Video Summary Sequences From One or More Video Segments
US9681196B2 (en) 2014-08-27 2017-06-13 Echostar Technologies L.L.C. Television receiver-based network traffic control
US9936248B2 (en) 2014-08-27 2018-04-03 Echostar Technologies L.L.C. Media content output control
US9628861B2 (en) 2014-08-27 2017-04-18 Echostar Uk Holdings Limited Source-linked electronic programming guide
JP6394184B2 (ja) * 2014-08-27 2018-09-26 富士通株式会社 判定プログラム、方法、及び装置
US9681176B2 (en) 2014-08-27 2017-06-13 Echostar Technologies L.L.C. Provisioning preferred media content
WO2016033545A1 (en) 2014-08-29 2016-03-03 Sling Media Inc. Systems and processes for delivering digital video content based upon excitement data
US20160073172A1 (en) 2014-09-05 2016-03-10 Echostar Uk Holdings Limited Broadcast event notifications
US9565474B2 (en) 2014-09-23 2017-02-07 Echostar Technologies L.L.C. Media content crowdsource
US10433030B2 (en) 2014-10-09 2019-10-01 Thuuz, Inc. Generating a customized highlight sequence depicting multiple events
US10419830B2 (en) 2014-10-09 2019-09-17 Thuuz, Inc. Generating a customized highlight sequence depicting an event
US10536758B2 (en) 2014-10-09 2020-01-14 Thuuz, Inc. Customized generation of highlight show with narrative component
US20170228600A1 (en) * 2014-11-14 2017-08-10 Clipmine, Inc. Analysis of video game videos for information extraction, content labeling, smart video editing/creation and highlights generation
US10432296B2 (en) 2014-12-31 2019-10-01 DISH Technologies L.L.C. Inter-residence computing resource sharing
US9800938B2 (en) 2015-01-07 2017-10-24 Echostar Technologies L.L.C. Distraction bookmarks for live and recorded video
US10129608B2 (en) 2015-02-24 2018-11-13 Zepp Labs, Inc. Detect sports video highlights based on voice recognition
US10965965B2 (en) * 2015-03-06 2021-03-30 Arris Enterprises Llc Detecting of graphical objects to identify video demarcations
US9740952B2 (en) * 2015-06-16 2017-08-22 Telefonaktiebolaget Lm Ericsson (Publ) Methods and systems for real time automated caption rendering testing
US20170054982A1 (en) * 2015-08-19 2017-02-23 Hitachi, Ltd. Real time video stream processing systems and methods thereof
US10580140B2 (en) * 2016-05-23 2020-03-03 Intel Corporation Method and system of real-time image segmentation for image processing
TWI604221B (zh) * 2016-05-27 2017-11-01 致伸科技股份有限公司 影像景深測量方法以及應用該方法的影像擷取裝置
US10056116B2 (en) 2016-10-18 2018-08-21 Thuuz, Inc. Data processing system for automatically generating excitement levels with improved response times using prospective data
US10466777B2 (en) * 2016-12-07 2019-11-05 LogMeln, Inc. Private real-time communication between meeting attendees during a meeting using one or more augmented reality headsets
US10410060B2 (en) * 2017-12-14 2019-09-10 Google Llc Generating synthesis videos
US10417500B2 (en) * 2017-12-28 2019-09-17 Disney Enterprises, Inc. System and method for automatic generation of sports media highlights
US10939182B2 (en) * 2018-01-31 2021-03-02 WowYow, Inc. Methods and apparatus for media search, characterization, and augmented reality provision
US10595101B2 (en) * 2018-03-15 2020-03-17 International Business Machines Corporation Auto-curation and personalization of sports highlights
US11373404B2 (en) 2018-05-18 2022-06-28 Stats Llc Machine learning for recognizing and interpreting embedded information card content

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8018491B2 (en) * 2001-08-20 2011-09-13 Sharp Laboratories Of America, Inc. Summarization of football video content
JP2004312208A (ja) * 2003-04-04 2004-11-04 Nippon Hoso Kyokai <Nhk> 映像提示装置、映像提示方法及び映像提示プログラム
US20080030942A1 (en) * 2006-08-03 2008-02-07 Elizalde Luis E Folding Electronic Device
US20090082110A1 (en) * 2007-09-21 2009-03-26 Verizon Data Services Inc. Highlight management for fantasy gaming
US8452778B1 (en) * 2009-11-19 2013-05-28 Google Inc. Training of adapted classifiers for video categorization
US20110292244A1 (en) * 2010-05-25 2011-12-01 Deever Aaron T Storing a video summary as metadata
US8923607B1 (en) * 2010-12-08 2014-12-30 Google Inc. Learning sports highlights using event detection
US8966513B2 (en) * 2011-06-29 2015-02-24 Avaya Inc. System and method for processing media highlights
CN102427507A (zh) * 2011-09-30 2012-04-25 北京航空航天大学 一种基于事件模型的足球视频集锦自动合成方法
US20140219563A1 (en) * 2013-02-01 2014-08-07 Xerox Corporation Label-embedding for text recognition
US20150319510A1 (en) * 2014-04-30 2015-11-05 General Instrument Corporation Interactive viewing experiences by detecting on-screen text
US9443158B1 (en) * 2014-06-22 2016-09-13 Kristopher Haskins Method for computer vision to recognize objects marked for identification with a bigram of glyphs, and devices utilizing the method for practical purposes
US9805268B2 (en) * 2014-07-14 2017-10-31 Carnegie Mellon University System and method for processing a video stream to extract highlights
US20160210532A1 (en) * 2015-01-21 2016-07-21 Xerox Corporation Method and system to perform text-to-image queries with wildcards
US20170069159A1 (en) * 2015-09-04 2017-03-09 Musigma Business Solutions Pvt. Ltd. Analytics system and method
US20170289617A1 (en) * 2016-04-01 2017-10-05 Yahoo! Inc. Computerized system and method for automatically detecting and rendering highlights from streaming videos
US20180020243A1 (en) * 2016-07-13 2018-01-18 Yahoo Holdings, Inc. Computerized system and method for automatic highlight detection from live streaming media and rendering within a specialized media player

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
卜庆凯;胡爱群;: "一种面向用户的体育视频精彩内容提取方法", 模式识别与人工智能, no. 06 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113095325A (zh) * 2021-05-11 2021-07-09 浙江华是科技股份有限公司 一种船舶识别方法、装置及计算机可读存储介质

Also Published As

Publication number Publication date
WO2019222409A1 (en) 2019-11-21
US20190356948A1 (en) 2019-11-21
US20230230377A1 (en) 2023-07-20
EP3811628A4 (en) 2022-05-25
US11138438B2 (en) 2021-10-05
US20190354763A1 (en) 2019-11-21
CN112753225A (zh) 2021-05-04
JP2021525031A (ja) 2021-09-16
AU2019269599A1 (en) 2020-12-24
AU2019268359A1 (en) 2021-01-07
US20230222797A1 (en) 2023-07-13
US20220027631A1 (en) 2022-01-27
EP3811628A1 (en) 2021-04-28
CN117880585A (zh) 2024-04-12
CA3100788A1 (en) 2019-11-21
WO2019222397A1 (en) 2019-11-21
CA3100787A1 (en) 2019-11-21
EP3811627A4 (en) 2022-05-25
AU2024202313A1 (en) 2024-05-02
CN112753226B (zh) 2024-01-02
US20190354764A1 (en) 2019-11-21
US11373404B2 (en) 2022-06-28
US11615621B2 (en) 2023-03-28
US20220327829A1 (en) 2022-10-13
JP2021524686A (ja) 2021-09-13
US11594028B2 (en) 2023-02-28
AU2019269599B2 (en) 2024-03-07
EP3811627A1 (en) 2021-04-28
CN112753225B (zh) 2024-04-16

Similar Documents

Publication Publication Date Title
CN112753226B (zh) 用于从视频流中提取元数据的方法、介质和系统
US11025985B2 (en) Audio processing for detecting occurrences of crowd noise in sporting event television programming
US20190373322A1 (en) Interactive Video Content Delivery
US11922968B2 (en) Audio processing for detecting occurrences of loud sound characterized by brief audio bursts
CN113170228B (zh) 用于从视听内容中提取可变长度不相交片段的音频处理
JP7485866B2 (ja) 埋め込まれた情報カードコンテンツを認識および解釈するための機械学習
JP2024067037A (ja) 埋め込まれた情報カードコンテンツを認識および解釈するための機械学習
JP7485864B2 (ja) スポーツイベントテレビジョン番組において群衆ノイズの発生を検出するためのオーディオ処理

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20211123

Address after: Delaware

Applicant after: STEZ Ltd.

Address before: California, USA

Applicant before: THUUZ, Inc.

GR01 Patent grant
GR01 Patent grant