CN100364008C - 使用音频特征检测视频节目中的精彩部分的系统和方法 - Google Patents
使用音频特征检测视频节目中的精彩部分的系统和方法 Download PDFInfo
- Publication number
- CN100364008C CN100364008C CNB018053882A CN01805388A CN100364008C CN 100364008 C CN100364008 C CN 100364008C CN B018053882 A CNB018053882 A CN B018053882A CN 01805388 A CN01805388 A CN 01805388A CN 100364008 C CN100364008 C CN 100364008C
- Authority
- CN
- China
- Prior art keywords
- key word
- program
- video
- audio signal
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7834—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using audio features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7844—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/102—Programmed access in sequence to addressed parts of tracks of operating record carriers
- G11B27/105—Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B2220/00—Record carriers by type
- G11B2220/20—Disc-shaped record carriers
- G11B2220/21—Disc-shaped record carriers characterised in that the disc is of read-only, rewritable, or recordable type
- G11B2220/215—Recordable discs
- G11B2220/216—Rewritable discs
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B2220/00—Record carriers by type
- G11B2220/20—Disc-shaped record carriers
- G11B2220/25—Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
- G11B2220/2537—Optical discs
- G11B2220/2562—DVDs [digital versatile discs]; Digital video discs; MMCDs; HDCDs
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/78—Television signal recording using magnetic recording
- H04N5/781—Television signal recording using magnetic recording on disks or drums
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/78—Television signal recording using magnetic recording
- H04N5/782—Television signal recording using magnetic recording on tape
- H04N5/783—Adaptations for reproducing at a rate different from the recording rate
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N9/804—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
- H04N9/8042—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Library & Information Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Television Signal Processing For Recording (AREA)
- Studio Circuits (AREA)
Abstract
这里公开了一种用于检测视频节目中的精彩节目的装置。该装置包括:1)一个关键字检测电路用于在视频节目的音频轨迹上检测选定的关键字的位置;以及2)一个音频信号能量电平检测电路,用于检测接近选定的关键字的检测位置的音频轨迹的音频信号能量电平并将音频信号能量电平与预定的门限相比较。音频信号能量电平检测电路,响应于音频信号能量电平超过预定的门限的判断,将选定的关键字的检测位置定义为节目精彩部分。
Description
技术领域
本发明通常直接涉及一种视频回放设备,并且尤其涉及一种检测和回放视频节目例如体育节目中的精彩部分的系统。
背景技术
在市场上有很多种种类的视频回放设备。很多人都拥有或者熟悉视频盒式记录器(VCR),也被称为视频磁带记录器(VTR)。最近,在市场上已经出现了使用计算机磁硬盘而不使用盒式磁带来存储视频节目的视频记录器。例如,回放TVTM记录器以及TiVOTM记录器使用例如MPEG-2压缩将电视节目数字的纪录在硬盘驱动器上。此外,一些视频回放设备也在可读/写数字通用盘(DVD)而不是在磁盘上进行纪录。
事实上每一个能够放映视频节目的系统都具有一个快进模式和一个回放模式,允许观众能够在纪录的视频节目中有选择的进行扫描。这些模式是非常节省时间的。很多人使用快进(FF)以及回放(REW)观看节目中有趣的部分(即,精彩部分)并且跳过包括广告在内的节目中的无趣的部分。在一个典型的情况下,球迷会使用快进模式在一个非常短的时间内对足球比赛进行浏览,并且停止快进模式以正常的速度来观看有趣的比赛(例如进球或者长传)。
但是,这种节目观看方法仍然需要大量的人机交互并且实际上是很偶然的。观众必须持续的监视在快进模式中的屏幕从而检测有趣的事件。观众经常在意识到有趣的内容发生以前浏览过了有趣事件(例如一个进球)的大部分,如果不是全部。观众必须轻轻的回放并且以正常的速度重放有趣的事件。
已经有一些技术被引入从而自动的进行在视频节目中有选择的观看精彩部分(或者有趣的事件)的处理,只是受成功度的限制。这些现有技术的系统已经使用了搜索与视频节目相关的字库的基于关键词的方法,使用了寻找声音分类的(即,语音,音乐,静音)的基于声音内容的方法,以及视频处理方法,该方法根据,例如场景的变换自动的分列一个视频节目。不幸的是,尽管对于人们而言,选择视频精彩部分是一项简单的工作,但是自动的在视频节目中检测真正有趣的事件被证明为总是一件倾向于错误的过程,这需要大量的计算能量。
因此,在本技术中需要一种改进的系统和方法,能够在视频节目中检测有趣的事件。尤其是,需要一种能够记录视频节目并且在纪录的视频节目中识别有趣的事件的视频回放设备。更为尤其的是需要一种能够在纪录的视频节目中识别精彩部分并且响应于随后观众的要求有选择的回放精彩部分的视频回放设备。
发明内容
为了弥补上面所述的现有技术的不足,本发明的一个首要目的是提供一种在视频回放设备中使用的能够回放纪录在视频回放设备的存储介质上的视频节目的,一种用于检测视频节目中的精彩节目的装置。根据本发明的一个优选实施例,该装置包括:1)一个关键字检测电路,能够在视频节目的音频轨迹上检测选定的关键字的位置;以及2)一个音频信号能量电平检测电路,能够判断接近选定关键字的检测位置的音频轨迹的音频信号能量电平并将音频信号能量电平与预定的门限值相比较。
根据本发明的一个实施例,音频信号能量电平检测电路,响应于音频信号能量电平超出预定门限值的判断,将选定的关键字的检测位置识别为节目精彩部分。
根据本发明的另一个实施例,关键字检测电路包括一个封闭字幕检测器,能够捕捉视频节目中封闭字幕文本以及一个处理器用于检测捕捉的封闭字幕文本中的关键字。
根据本发明的另一个实施例,处理器通过比较捕捉的封闭字幕文本与多个存储在与处理器相关联的存储器中的关键字来检测捕捉的封闭字幕中的关键字。
根据本发明的另一个实施例,关键字检测电路包括一个音频处理器,能够执行语音识别应用程序,该程序能够将在音频轨迹中检测到的语音字转换成文本字,并且其中的音频处理器进一步能够检测转换的文本字中的关键字。
根据本发明的另一个实施例,音频处理器通过比较转换的文本字与多个存储在与处理器相关联的存储器中的关键字检测转换的文本字中的关键字。
根据本发明的另一个实施例,音频信号能量电平检测电路通过在接近选定的关键字的检测位置上在一个窗口中判断平均音频信号能量电平来判断音频轨迹的音频信号能量电平。
根据本发明的另一个实施例,音频信号能量电平检测电路通过判断在选定的关键字的检测位置之前的节目精彩部分的开始点以及判断在选定的关键字的检测位置之后的节目精彩部分的终止点来将选定的关键字的检测位置识别为节目精彩部分。
本发明的另一个主要目的是提供一种在视频节目中检测节目精彩部分的装置,它不需要使用关键字检测电路。在本发明的一个实施例中,该装置包括1)一个音频信号能量检测电路,能够检测音频轨迹中N个连续的段落的音频信号能量电平并且比较音频信号能量电平与一个预定的门限值。音频信号能量电平检测电路,响应于音频信号能量电平超出预定门限值的判断,将N个连续的段落识别为节目精彩部分。在一个典型的实施例中,节目精彩部分是通过对平均音频信号能量电平超出预定的门限值的N个连续的段落的判断而识别出来的。
前面已经广泛的概述了本发明的特征和技术优势从而使得本领域的技术人员能够更好的理解后面的详细描述。本发明的附加的特征和优点将在以后进行描述从而形成本发明的权利要求的主题。本领域的技术人员可以知道他们可以使用公开的概念和特定的实施例作为基础从而改变或者设计其它的结构用于执行本发明的同样目的。本领域的技术人员也可以以其广播形式在不背离本发明的精神和范围内实现同等的结构。
在进行详细描述以前,最好是解释一下在本专利文件中使用的特定的词语和短语的含义:单词“include”和“comprising”,以及它们的变形,表示非限制性的包括;单词“or”,是包含的,意思是和/或;短语“associated with”和“associated therewith”以及它们的变形,表示包括,被包括,被包含于其中,包含,被包含,与之相连,与之相耦合,与之相连,合作,插入,并列,接近,围绕,有,有特性,或者类似的意思;以及单词“controller”表示任何设备,系统或者其中能够至少控制一个操作的部分,这样的设备能够以硬件,软件硬件相结合,软件来实现,或者至少其中的两种相结合来实现。应当注意与任何特定的控制器相联的功能可以集中或者分散的实现,通过本地或者远程。尤其是,一个控制器可以包括一个或者多个数据处理器,并且相联的输入/输出设备,存储器,执行一个或多个应用程序和/或操作系统程序。对于每一个特定的词语和短语的定义是提供于整个专利文件当中的,本领域的技术人员应当明白在许多,如果不是多数情况下,这样定义的词语和短语的特征使用中,这样的定义也应用于现有技术。
附图说明
为了更加完整的理解本发明以及本发明的优点,下面的描述将结合随后的附图一起作为参考,其中同样的数字表示同样的对象,其中:
附图1示出了根据本发明的一个实施例的典型的视频回放设备和电视机;
附图2示出了根据本发明的一个实施例的更为详细的典型的视频回放设备;
附图3示出了根据本发明的一个实施例中的存储在典型的视频回放设备上的硬盘驱动器上的典型的视频节目;以及
附图4示出了根据本发明的一个实施例的典型视频回放设备的操作流程图。
具体实施方式
在本专利文件中,下面描述的附图1-4,以及用于描述本发明的原则的各种实施例仅是以示例的方式进行描述,这些不应被用于限制本发明的范围。本领域的技术人员将会明白本发明的原则可以通过任何合适配置的视频回放设备来实现。
附图1描绘了根据本发明的一个实施例的典型视频回放设备150以及电视机105。视频回放设备150从诸如有线电视服务提供商(CableCo.),本地天线,互联网,或者DVD或VHS磁带播放器的外部源接收输入的电视信号,并向电视机105传送一个观众选定的频道。在纪录模式中,视频回放设备150可以解调输入的射频(RF)电视信号,产生一个基带电视信号,这个基带信号将被记录或存储在视频回放设备150内的或与之相连的存储介质中。在播放模式中,视频回放设备150从存储介质读取用户选择的存储的基带视频信号(即,节目),并将其传送给电视机105。
例如,如果视频回放设备150是一个视频盒式记录器(VCR),也被称为视频磁带记录器(VTR),视频回放设备150则将输入的电视信号存储在磁式盒带上并从磁式盒带中重新获得存储的电视信号。如果视频回放设备150为一个基于盘驱动的设备,例如一个回放电视记录器或者一个TiVOTM记录器,视频回放设备150将输入的电视信号存储在计算机磁式硬盘上,而不是磁式盒带上,并且从硬盘上重新得到存储的电视信号。在另一个实施例中,视频回放设备150可以存储并从本地读/写(R/W)数字通用盘或读写(R-W)CD-ROM中重新获得信号。这样,本地存储介质可以是固定的(即,硬盘驱动器)或可移动的(即,DVD,CD-ROM)。
视频回放设备150包括红外传感器(IR)160,它接收用户从远程控制设备发出的命令(例如,增大频道,减小频道,声音增大,声音减小,记录,播放,快进(FF),回放(REW)以及类似的)。电视机105是一个传统的电视,包括屏幕110,红外传感器(IR)115,以及一个或多个手动控制120(以虚线所包围的)。IR传感器115也接收来自用户的远程控制设备发出的命令(例如,声音增加,声音减小,电源开/关)。
应当注意,视频回放设备150并不限于从特定类型的源中接收特定类型的输入电视信号。如上所述,外部源可以是一个有线服务提供商,一个传统的RF广播天线,一个蝶形卫星,一个互联网连接,或者其他诸如DVD播放器或者VHS磁带播放器的本地存储设备。在一些实施例中,视频回放设备150甚至可能不能纪录,但是限于能够回放从可移动的DVD或CD-ROM得到的电视信号。这样,输入的信号可以是一个数字信号,一个模拟信号,或者互联网协议包(IP)。但是,为了简化并清楚的解释本发明的原则,下文的描述将直接涉及视频回放设备150从有线服务商接收输入电视信号(模拟的和/或数字的)的实施例。但是,本领域的技术人员将明白本发明的原则也适用于无线广播电视信号,本地存储系统,包含MPEG数据的IP包输入流,以及类似的系统。
附图2描绘了更为详细的根据本发明的一个实施例的典型视频回放设备150。视频回放设备150包括IR传感器160,视频处理器210,MPEG2编码器220,硬盘驱动器230,MPEG2解码/NTSC编码器240,以及视频记录控制器(VR)250。视频回放设备150进一步包括封闭字幕检测器(CC)260,音频处理器270,以及存储器280。VR控制器250指挥视频回放设备150的整个操作,包括观看模式,记录模式,播放模式,快进(FF)模式,回放模式(REW),以及其他。根据本发明的原则,视频回放设备150也提供一种扫描模式,该模式能够回放从视频节目中选定的精彩部分,下文将详细描述。
在观看模式中,VR控制器250使来自于有线服务提供商的输入电视信号解调制以及被视频处理器210所处理,然后被传送到电视机105,而不存储或从硬盘驱动器230中重新获得信号。视频处理器210包括射频(RF)前端电路,用于从有线服务提供商接收输入的电视信号,将其调谐到用户选定的频道,并且将选定的RF信号转换到适于在电视105上显示的基带电视信号(例如超级视频信号)。视频处理器210也能够在播放模式中从MPEG2解码器/NTSC编码器240接收传统的NTSC电视信号并将基带电视信号传送到电视机105。
在纪录模式中,VR控制器250使输入的电视信号存储在硬盘驱动器230上。在VR控制器250的控制下,MPEG2编码器220接收有线服务商提供的输入电视信号并转换接收的RF信号为MPEG格式并将其存储在硬盘驱动器230上。在播放模式中,VR控制器250指挥硬盘驱动器230使存储的电视信号(即,节目)流向MPEG2解码器/NTSC编码器240,240将来自于硬盘驱动器230的MPEG2数据转换成例如被传送到电视机105的超级视频信号(S-Video)。应当注意对于MPEG2编码器220和MPEG2解码器/NTSC编码器240选择MPEG2标准只是一种示例。在本发明的替代实施例中,MPEG编码器和解码器可以遵照一个或者多个MPEG1,MPEG2,MPEG4和MPEG7标准。
为了申请和随后的权利要求的目的,硬盘驱动器230被定义为包括任何大型的既可读又可写的存储设备,包括传统的磁盘驱动器以及用于读写数字通用盘(DVD-RW)的光盘驱动器,可擦写CD-ROMs,VCR磁带和类似的设备。实际上,硬盘驱动器230并不需要固定于永久性嵌入到视频回放设备150中的传统的概念。而且,硬盘驱动器230包括任何大型的存储设备能够为了存储纪录的视频节目而应用于视频回放设备150。这样,硬盘驱动器230可以包括一个附加的外部设备或者可移动的盘驱动设备(嵌入或者外部附加),例如容纳读写DVDs或者只读CD-ROMs的自动唱片点唱设备。而且,在本发明的一个优化实施例中,硬盘驱动器230可以包括视频回放设备150可以通过网络连接(例如,互联网协议(IP)连接)访问和控制的外部大型存储设备,包括,例如,在用户的家中个人电脑(PC)上的盘驱动器,或者在用户的互联网服务提供商(ISP)的服务器上的盘驱动器。
在播放模式中,VR控制器250可以通过IR传感器160接收来自于用户的扫描命令。在扫描模式中,视频回放设备150能够仅回放从存储在硬盘驱动器230上的视频节目(例如运动节目)中抽取的精彩部分。为了实现上述功能,视频回放设备150可以在视频节目正在被记录在硬盘驱动器230上的时候(或者在其已被记录以后)对该视频节目进行分析,并且使用基于文本的搜索和选择音频特征的组合来自动的检测和标记视频节目中的精彩部分。在接下来的扫描模式中,视频回放设备检测标记的存储视频节目的精彩部分并且仅抽取标记的精彩部分用于在电视105上播放。
在本发明的一个典型的实施例中,存储器280可以包括一个随机访问存储器(RAM),用于存储语音识别程序282和关键字(KW)库284。语音识别程序282包括由音频处理器270执行的程序指令,其用于在视频节目的音频轨迹上检测语音字并将检测到的语音字转换为文本字。音频处理器270然后比较文本字与选定的存储在关键字库284中的关键字。当一场比赛开始的时候,音频处理器270在硬盘驱动器230上存储一个与存储的视频节目相应部分相关的关键字识别符。就运动节目而言,关键字包括诸如进球,套袋,截取,漏接,射门得分,本垒打,跑分,三垒打,盗垒,三分,连续进攻,快攻,暂停,得分,救球,集中攻势,三击手退场,以及类似的词语和短语。
在本发明的一个替代实施例中,音频处理器270可以使用从封闭字幕(CC)检测器260获得的文本识别视频节目中的关键字。封闭字幕检测器260接收MPEG2解码器/NTSC编码器240的输出视频流,并检测NTSC输出信号中的CC文本。CC文本通常被插入在视频信号的垂直消隐期间的第21行的末尾。CC检测器260使用与CC数据的每一行相关的时标识别与CC文本相应的视频节目的段。CC检测器260将CC文本的每一行以及时标传输给音频处理器270。音频处理器270然后比较CC文本字与选定的存储在关键字库284(KW)中的关键字。当一场比赛开始的时候,音频处理器270将与由时标识别的存储视频节目的相应的段相关的关键字识别符存储在硬盘驱动器230上。
在实际的运动广播中,许多关键字是用在主持人之间的日常谈话中的,而不是用在可能发生精彩事件的过程中。这就导致出现了大量的“false positive”,其中音频处理器270会将关键字标识符附加给不与精彩部分相对应的存储的视频节目的段落中。为了减少“falsepositive”的数量,音频处理器270也要分析存储的视频节目的音频轨迹,从而识别在存储的视频节目中与标识的关键字的发生相对应的高的音频能量(例如,喧闹声)的期间。
音频轨迹信息已被有效的用于识别,分类以及将视频流分割成具有特定语义特征的段落中。它已被用于基于演讲人的新闻节目的段落以及通过语音识别发现关键字。音频数据也可被有效的应用于内容索引中,因为与视频处理相比,它需要非常少的处理能量和存储空间。
音频处理器270首先执行音频轨迹信息的文本搜索。该步骤通常得到一长列的候选名单(即,包含特定关键字的节目段落)。如上所述,许多这些段落并不表示一个实际的精彩部分,因为评论员经常使用这些词参考先前的游戏或比赛。音频处理器270然后使用来自于每一个检测关键字周围的段落附近的音频信号特性来判断是真正的精彩部分还是“false positive”。
在本发明的一个典型实施例中,音频处理器270在一秒钟长的段落中处理音频轨迹信息。音频处理器270计算音频刺激电平,X(A),作为每一段落的平均绝对幅度。如果A是一个音频信号,刺激电平,X(A)=AVG(ABS)(A)),其中ABS是绝对值函数。接下来,音频处理器270使用一个滑动窗口,例如,five(5)segments(等于5秒钟),来计算平均长度,因为在多数情况下真正有趣的事件(即,精彩部分)通常会持续至少5秒钟。然后,平均刺激电平高于特定门限值的5秒钟段落的组合被合并形成一个精彩序列,并作为精彩部分在硬盘驱动器230上被标识(标记)。在一个典型实施例中,音频处理器270可以使用整个节目(即,对于一个运动节目一般为2-3小时)中最大值的一半作为门限值。在另一个替代实施例中,音频处理器270可以使用节目的延长部分的最大值的一半作为门限值,例如,视频节目块的10或15分钟。
本发明可被用于与非运动节目的结合中,例如从一个脱口秀节目中抽取精彩部分(即,笑话)。为了检测笑话或者其他的精彩部分,音频处理器270可以使用一个基于音频运算法则的变量大致从一个脱口秀中找到最好的“笑话”。例如,音频处理器270可以使用一个标准的刺激电平,NX(A),来检测记录在一个演播室环境中的低电平的笑声效果,其中NX(A)=AVG(ABS(A)/MAX(ABS(A))并且其中ABS是一个绝对值函数。音频处理器270再次为每一个一秒钟长度的非重叠窗口计算该值,并找出最大值作为候选。在一个第二通道中,音频处理器270可以消除在节目段落开始或结束时的孤立的峰值以及发生在广告期间的峰值。
附图3示出了根据本发明的一个实施例存储在硬盘驱动器230上的典型的视频节目300。在视频节目300中的典型的精彩部分已被音频处理器270所识别并标记,用于由视频回放设备150在扫描模式中顺序回放。视频节目300包括多个连续的一秒钟的段落,S0到Sn。两个典型的关键字的位置KW1和KW2已被表示出来。KW1大致发生在视频节目300的4分16秒(即,256秒),在段落S256和S257交界的地方。KW2大致发生在视频节目300的15分18秒,在段落S918和S919交界的地方。
音频处理器270的判断结果是在KW1和KW2周围的音频能量电平超过了预定的门限电平,如上所述,音频处理器270将段落S252和S261识别为精彩部分(标记为精彩部分1)并将段落S914和S923识别为精彩部分(标记为精彩部分2)。在扫描模式中,视频回放设备150直接跳到(或快进)精彩部分1(而不是以段落S0开始)并以正常的速度播放精彩部分1(即,S252-S261)。在精彩部分1播放以后,视频回放设备150跳过(或快进)精彩部分1与精彩部分2之间的段落S262-S913,并以正常的速度播放精彩部分2(即,S914-S923)。
在典型的视频节目300中,精彩部分1和2的长度(即,10秒钟)仅是一个示例。在替代实施例中,音频处理器270可以识别与关键字有关的长于或者短于典型的10秒钟的精彩部分作为精彩部分。例如,音频处理器270可以识别精彩部分为20秒,30秒,或者用户定义的长度。此外,关键字也不需要位于精彩部分的中点。例如,音频处理器270可以识别一个30秒的精彩部分,在高信号能量电平的期间中前面进行了20秒,在关键字发生以后再进行10秒。
最后,由音频处理器270识别的精彩部分的长度不需要与环绕关键字的高音频信号能量电平的周期长度相一致。在上面的描述中,音频处理器270在平均音频刺激电平超过预定的门限电平的期间寻找一个与关键字的发生相符合的5秒的窗口。但是,一旦音频处理器270检测到了这样的一个5秒钟的窗口并且判断出发生了一个精彩部分,音频处理器270可以定义一个精彩部分,前面发生了20秒,在关键字以后继续进行10秒。以这种方式,视频回放设备150可以回放一个相对低的音频刺激直至精彩事件的发生这样的一个期间。
附图3描绘了流程图400,它示出了根据本发明的一个实施例典型的视频回放设备150的操作流程。当视频回放设备150在硬盘驱动器230上记录视频节目的时候产生和观看视频精彩部分的步骤就开始了(处理步骤405)。视频回放设备150可以在编程的时间记录视频节目,或者与观众通过远程控制手动的记录命令相响应。接下来,音频处理器270在纪录的视频节目的音频轨迹上检测关键字。关键字可以通过比较由语音识别程序282检测的词与存储在关键字库284中的词进行,或者通过比较从封闭字幕检测器260接收的文本与存储在关键字库284中的词来进行。音频处理器270可以检测视频节目记录期间的关键词(即,实时的),或者检测视频节目记录以后的关键词(即,延时的)(处理步骤410)。
在每一个关键字发生的位置,音频处理器270比较位于每一个关键字周围的可变尺寸的窗口中的音频信号的能量与预定的门限值,如前所述(处理步骤415)。如果窗口中的音频信号能量电平超过了门限值,音频处理器270将关键字的位置识别为视频节目关键部分(处理步骤420)。为了将关键字的位置识别为精彩部分,音频处理器270可以在视频节目的每一个精彩部分的始点和终点插入可测的标记(符号)。如果已纪录的视频节目被存储在硬盘上,音频处理器将通过将每一个精彩部分的起点地址和终点地址存储在一个与视频节目相关的数据文件中的方式来识别每一个精彩部分的位置。如上所述,对于检测到的关键字的位置而言精彩部分的长度和位置是可变的。在一个优选实施例中,精彩部分的长度和位置可以由用户通过由VR控制器控制的电视105的图形用户接口而改变。最后,在扫描模式中,视频回放设备150仅从硬盘驱动器230中得到视频节目精彩部分用于在电视105上回放(处理步骤425)。
尽管本发明已经作为较为详尽的描述,但是本领域的技术人员应该明白它们可以以广播的形式再不被例本发明的精神和范围内作各种变形、置换和改造。
Claims (14)
1.一种装置,使用于视频回放设备(150)中,该视频回放设备(150)能够回放存储在所述视频回放设备(150)中的存储介质(230)中的视频节目,并且用于在所述的视频节目中检测节目精彩部分,该装置包括:
一个关键字检测电路(260,270,280),能够在所述视频节目的音频轨迹上检测选定关键字的位置;以及
一个音频信号能量电平检测电路(270),能够确定在所述选定关键字的所述检测位置的接近位置处所述音频轨迹的音频信号能量电平,并将所述音频信号能量电平与预定门限值相比较;
其中,所述音频信号能量电平检测电路,响应于所述音频信号能量电平超出所述预定门限值的判断,将所述选定关键字的所述检测位置识别为节目精彩部分。
2.一种如权利要求1所述的装置,其中所述关键字检测电路(260,270,280)包括一个封闭字幕检测器(260),能够捕捉所述视频节目中的封闭字幕文本以及一个处理器(270)用于检测所述捕捉的封闭字幕文本中的关键字。
3.一种如权利要求2所述的装置,其中所述处理器(270)通过比较所述捕捉的封闭字幕文本与多个存储在与所述处理器相关联的存储器中的关键字来检测所述捕捉的封闭字幕中的所述关键字。
4.一种如权利要求1所述的装置,其中所述关键字检测电路(260,270,280)包括一个音频处理器(270),能够执行语音识别应用程序,该程序能够将在所述音频轨迹中检测到的语音字转换成文本字,并且其中所述音频处理器(270)进一步能够检测所述转换的文本字中的关键字。
5.一种如权利要求4所述的装置,其中所述音频处理器(270)通过比较所述的转换的文本字与多个存储在与所述处理器(270)相关联的存储器中的关键字检测所述转换的文本字中的所述关键字。
6.一种如权利要求1所述的装置,其中所述音频信号能量电平检测电路(270)通过在接近所述选定的关键字的所述检测位置的一个窗口中确定平均音频信号能量电平来确定所述音频轨迹的所述音频信号能量电平。
7.一种如权利要求1所述的装置,其中所述音频信号能量电平检测电路(270)通过确定在所述选定的关键字的所述检测位置之前的所述节目精彩部分的开始点以及确定在所述选定的关键字的所述检测位置之后的所述节目精彩部分的终止点来将所述选定的关键字的所述检测位置识别为节目精彩部分。
8.一种视频设备(150),包括:
一个存储设备(230),其上能够存储多个视频节目;
一个视频记录电路(220),能够接受输入的视频节目并且在所述的存储设备上存储所述的输入视频节目;以及
进一步包括权利要求1所述的装置的所述视频回放设备。
9.一种方法,应用于一种视频回放设备(150)中,该视频回放设备(150)能够回放纪录在所述的视频回放设备(150)上的存储介质中的视频节目,并且用于在所述视频节目中检测节目精彩部分,该方法包括步骤:
在视频节目的所述音频轨迹上检测选定的关键字的位置;
确定在选定的关键字的检测位置的接近位置处音频轨迹上的音频信号能量电平;
比较音频信号能量电平与预定的门限值;
确定是否音频信号能量电平超过了预定的门限值;以及
响应于音频信号能量电平超出预定的门限值的确定,将选定的关键字的选定位置识别为节目精彩部分。
10.如权利要求9所述的方法,其中检测关键字的位置包括子步骤:
捕捉视频节目中的封闭字幕文本;以及
在捕捉的封闭字幕文本中检测关键字。
11.如权利要求10所述的方法,其中在捕捉的封闭字幕文本中检测关键字的步骤包括比较捕捉的封闭字幕文本与多个存储在与视频回放设备(150)相连的关键字库的关键字的子步骤。
12.如权利要求11所述的方法,其中检测关键字的位置的步骤包括子步骤:
执行语音识别应用程序,将在音频轨迹中检测的语音字转换成文本字;以及
在转换的文本字中检测关键字。
13.如权利要求12所述的方法,其中在转换的文本字中检测关键字的步骤包括比较转换的文本字与多个存储在与视频回放设备(150)的关键字库中的关键字的子步骤。
14.如权利要求9所述的方法,其中确定音频信号能量电平的步骤包括在接近选定关键字的检测位置的窗口中确定平均音频信号能量电平的子步骤。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/699,605 US6973256B1 (en) | 2000-10-30 | 2000-10-30 | System and method for detecting highlights in a video program using audio properties |
US09/699,605 | 2000-10-30 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1404609A CN1404609A (zh) | 2003-03-19 |
CN100364008C true CN100364008C (zh) | 2008-01-23 |
Family
ID=24810056
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB018053882A Expired - Fee Related CN100364008C (zh) | 2000-10-30 | 2001-10-16 | 使用音频特征检测视频节目中的精彩部分的系统和方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US6973256B1 (zh) |
EP (1) | EP1332497A2 (zh) |
JP (1) | JP2004513547A (zh) |
KR (1) | KR100833807B1 (zh) |
CN (1) | CN100364008C (zh) |
WO (1) | WO2002037498A2 (zh) |
Families Citing this family (67)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7558472B2 (en) | 2000-08-22 | 2009-07-07 | Tivo Inc. | Multimedia signal processing system |
US6233389B1 (en) | 1998-07-30 | 2001-05-15 | Tivo, Inc. | Multimedia time warping system |
WO2001022729A1 (en) | 1999-09-20 | 2001-03-29 | Tivo, Inc. | Closed caption tagging system |
US7266287B2 (en) * | 2001-12-14 | 2007-09-04 | Hewlett-Packard Development Company, L.P. | Using background audio change detection for segmenting video |
US7386217B2 (en) * | 2001-12-14 | 2008-06-10 | Hewlett-Packard Development Company, L.P. | Indexing video by detecting speech and music in audio |
FR2842014B1 (fr) * | 2002-07-08 | 2006-05-05 | Lyon Ecole Centrale | Procede et appareil pour affecter une classe sonore a un signal sonore |
US7483624B2 (en) * | 2002-08-30 | 2009-01-27 | Hewlett-Packard Development Company, L.P. | System and method for indexing a video sequence |
US7783486B2 (en) * | 2002-11-22 | 2010-08-24 | Roy Jonathan Rosser | Response generator for mimicking human-computer natural language conversation |
US20040167767A1 (en) * | 2003-02-25 | 2004-08-26 | Ziyou Xiong | Method and system for extracting sports highlights from audio signals |
US8959567B1 (en) * | 2003-08-15 | 2015-02-17 | Verizon Patent And Licensing Inc. | Identification and recording of program sub-segments |
GB2429597B (en) * | 2004-02-06 | 2009-09-23 | Agency Science Tech & Res | Automatic video event detection and indexing |
US7505671B2 (en) * | 2004-02-25 | 2009-03-17 | Casio Computer Co., Ltd. | Recording/reproduction apparatus, system and program which reproduces a section of a recorded program based on a keyword relating to the section and a reproduction speed corresponding to the keyword |
DK2408202T3 (en) | 2004-11-19 | 2017-08-28 | Tivo Solutions Inc | Method and device for secure transfer and playback of multimedia content |
US9210368B2 (en) * | 2004-12-28 | 2015-12-08 | Google Technology Holdings LLC | Digital video recorder for automatically recording an upcoming program that is being advertised |
CN100426847C (zh) * | 2005-08-02 | 2008-10-15 | 智辉研发股份有限公司 | 以语音特征为基础的精采片段检测电路及其相关方法 |
JP4683281B2 (ja) * | 2005-08-23 | 2011-05-18 | ソニー株式会社 | 再生システム、再生装置、再生方法、情報処理装置、情報処理方法、およびプログラム |
US7584428B2 (en) * | 2006-02-09 | 2009-09-01 | Mavs Lab. Inc. | Apparatus and method for detecting highlights of media stream |
JP4662208B2 (ja) * | 2006-03-30 | 2011-03-30 | 株式会社デンソー | 移動体用放送受信装置 |
TW200742431A (en) * | 2006-04-21 | 2007-11-01 | Benq Corp | Playback apparatus, playback method and computer-readable medium |
CN101536503B (zh) * | 2006-06-15 | 2012-09-26 | 尼尔森(美国)有限公司 | 利用隐藏字幕信息来计量内容曝光的方法和装置 |
US7661121B2 (en) * | 2006-06-22 | 2010-02-09 | Tivo, Inc. | In-band data recognition and synchronization system |
US7873982B2 (en) | 2006-06-22 | 2011-01-18 | Tivo Inc. | Method and apparatus for creating and viewing customized multimedia segments |
US8542802B2 (en) * | 2007-02-15 | 2013-09-24 | Global Tel*Link Corporation | System and method for three-way call detection |
US8457768B2 (en) * | 2007-06-04 | 2013-06-04 | International Business Machines Corporation | Crowd noise analysis |
JP2009027430A (ja) * | 2007-07-19 | 2009-02-05 | Canon Inc | 動画再生装置 |
KR101370904B1 (ko) * | 2007-08-17 | 2014-03-10 | 엘지전자 주식회사 | 영상물의 녹화 방법 및 그 방법을 채용한 방송 수신기 |
US8659657B2 (en) * | 2008-01-25 | 2014-02-25 | International Business Machines Corporation | System and method for pattern based thresholding applied to video surveillance monitoring |
US8805689B2 (en) | 2008-04-11 | 2014-08-12 | The Nielsen Company (Us), Llc | Methods and apparatus to generate and use content-aware watermarks |
US8707342B2 (en) * | 2008-06-19 | 2014-04-22 | Microsoft Corporation | Referencing data in triggers from applications |
US20090320064A1 (en) * | 2008-06-19 | 2009-12-24 | Microsoft Corporation | Triggers for Media Content Firing Other Triggers |
US20090320061A1 (en) * | 2008-06-19 | 2009-12-24 | Microsoft Corporation | Advertising Based on Keywords in Media Content |
JP2010011038A (ja) * | 2008-06-26 | 2010-01-14 | Sony Corp | 情報処理装置、情報処理方法およびコンピュータプログラム |
JP5528008B2 (ja) * | 2008-07-17 | 2014-06-25 | キヤノン株式会社 | 再生装置及び再生方法 |
KR101628237B1 (ko) | 2009-01-21 | 2016-06-22 | 삼성전자주식회사 | 하이라이트 영상 구성 방법 및 장치 |
US20110066437A1 (en) * | 2009-01-26 | 2011-03-17 | Robert Luff | Methods and apparatus to monitor media exposure using content-aware watermarks |
US20100194988A1 (en) * | 2009-02-05 | 2010-08-05 | Texas Instruments Incorporated | Method and Apparatus for Enhancing Highlight Detection |
EP2413592B1 (en) * | 2009-03-25 | 2016-08-31 | Fujitsu Limited | Playback control program, playback control method, and playback device |
US8438596B2 (en) | 2009-04-08 | 2013-05-07 | Tivo Inc. | Automatic contact information transmission system |
US8886528B2 (en) * | 2009-06-04 | 2014-11-11 | Panasonic Corporation | Audio signal processing device and method |
CN102073635B (zh) * | 2009-10-30 | 2015-08-26 | 索尼株式会社 | 节目端点时间检测装置和方法以及节目信息检索系统 |
CN102073636A (zh) * | 2009-10-30 | 2011-05-25 | 索尼株式会社 | 节目高潮检索方法和系统 |
TW201122863A (en) * | 2009-12-31 | 2011-07-01 | Hon Hai Prec Ind Co Ltd | Video search device, search system, and search method |
KR101086810B1 (ko) | 2010-02-02 | 2011-11-25 | 인하대학교 산학협력단 | 자막이 입혀진 동영상을 검출하기 위한 장치 및 방법 |
US8606090B2 (en) | 2011-03-17 | 2013-12-10 | Sony Corporation | Sport program chaptering |
CN102724598A (zh) * | 2011-12-05 | 2012-10-10 | 新奥特(北京)视频技术有限公司 | 一种拆分新闻条目的方法 |
KR20130071873A (ko) * | 2011-12-21 | 2013-07-01 | 삼성전자주식회사 | 컨텐츠재생장치 및 그 제어방법 |
KR20150021258A (ko) * | 2013-08-20 | 2015-03-02 | 삼성전자주식회사 | 디스플레이장치 및 그 제어방법 |
US9693030B2 (en) | 2013-09-09 | 2017-06-27 | Arris Enterprises Llc | Generating alerts based upon detector outputs |
WO2015038749A1 (en) | 2013-09-13 | 2015-03-19 | Arris Enterprises, Inc. | Content based video content segmentation |
US9924148B2 (en) * | 2014-02-13 | 2018-03-20 | Echostar Technologies L.L.C. | Highlight program |
CN105407382A (zh) * | 2014-09-15 | 2016-03-16 | 扬智科技股份有限公司 | 车辆间的无线通信方法、多媒体快播方法与缓存方法 |
KR101994291B1 (ko) * | 2014-10-14 | 2019-06-28 | 한화테크윈 주식회사 | 통합써머리를 제공하는 영상재생장치 및 방법 |
KR102306538B1 (ko) * | 2015-01-20 | 2021-09-29 | 삼성전자주식회사 | 콘텐트 편집 장치 및 방법 |
US9824279B2 (en) * | 2015-03-24 | 2017-11-21 | Facebook, Inc. | Systems and methods for providing playback of selected video segments |
CN105047203B (zh) * | 2015-05-25 | 2019-09-10 | 广州酷狗计算机科技有限公司 | 一种音频处理方法、装置及终端 |
CN105120195B (zh) * | 2015-09-18 | 2019-04-26 | 谷鸿林 | 内容录制、再现系统和方法 |
US10575036B2 (en) | 2016-03-02 | 2020-02-25 | Google Llc | Providing an indication of highlights in a video content item |
CN106571137A (zh) * | 2016-10-28 | 2017-04-19 | 努比亚技术有限公司 | 一种终端语音打点控制装置及其方法 |
CN106603381B (zh) * | 2016-11-24 | 2020-06-02 | 北京小米移动软件有限公司 | 处理聊天信息的方法及装置 |
CN107154264A (zh) * | 2017-05-18 | 2017-09-12 | 北京大生在线科技有限公司 | 在线教学精彩片段提取的方法 |
CN108093124B (zh) * | 2017-11-15 | 2021-01-08 | 维沃移动通信有限公司 | 一种音频定位方法、装置及移动终端 |
CN108521612B (zh) * | 2018-04-25 | 2021-02-09 | 腾讯科技(深圳)有限公司 | 视频摘要的生成方法、装置、服务器及存储介质 |
KR102153201B1 (ko) | 2018-12-19 | 2020-09-07 | 서울과학기술대학교 산학협력단 | 채팅 데이터와 오디오 데이터를 이용한 하이라이트 영상 생성 장치 |
KR102153211B1 (ko) | 2019-01-11 | 2020-09-07 | 서울과학기술대학교 산학협력단 | 채팅 데이터와 오디오 데이터를 이용한 하이라이트 영상 생성 장치 및 방법 |
US11308273B2 (en) * | 2019-05-14 | 2022-04-19 | International Business Machines Corporation | Prescan device activation prevention |
CN111131844A (zh) * | 2019-12-02 | 2020-05-08 | 钛马信息网络技术有限公司 | 一种行车记录仪的资源共享方法及系统 |
CN114822512B (zh) * | 2022-06-29 | 2022-09-02 | 腾讯科技(深圳)有限公司 | 音频数据的处理方法、装置、电子设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09284707A (ja) * | 1996-04-12 | 1997-10-31 | Sony Corp | 記録装置 |
US5859662A (en) * | 1993-08-06 | 1999-01-12 | International Business Machines Corporation | Apparatus and method for selectively viewing video information |
EP1026887A2 (en) * | 1999-02-01 | 2000-08-09 | Sharp Kabushiki Kaisha | Audiovisual information management system |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5136655A (en) | 1990-03-26 | 1992-08-04 | Hewlett-Pacard Company | Method and apparatus for indexing and retrieving audio-video data |
US5664227A (en) | 1994-10-14 | 1997-09-02 | Carnegie Mellon University | System and method for skimming digital audio/video data |
US5794249A (en) | 1995-12-21 | 1998-08-11 | Hewlett-Packard Company | Audio/video retrieval system that uses keyword indexing of digital recordings to display a list of the recorded text files, keywords and time stamps associated with the system |
KR100206804B1 (ko) * | 1996-08-29 | 1999-07-01 | 구자홍 | 하일라이트 부분 자동 선택 녹화 방법 |
US5828809A (en) | 1996-10-01 | 1998-10-27 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus for extracting indexing information from digital video data |
EP1450275A3 (en) | 1996-10-31 | 2007-08-08 | Sensormatic Electronics Corporation | Intelligent video information management system |
GB9705999D0 (en) * | 1997-03-22 | 1997-05-07 | Philips Electronics Nv | Video signal analysis and storage |
JPH1155613A (ja) | 1997-07-30 | 1999-02-26 | Hitachi Ltd | 記録および/または再生装置およびこれに用いられる記録媒体 |
JP3096280B2 (ja) | 1997-11-10 | 2000-10-10 | 日本電信電話株式会社 | 電子映像文書作成利用方法及びプログラム格納媒体 |
US6163510A (en) * | 1998-06-30 | 2000-12-19 | International Business Machines Corporation | Multimedia search and indexing system and method of operation using audio cues with signal thresholds |
US6771875B1 (en) | 1998-09-03 | 2004-08-03 | Ricoh Company Ltd. | Recording medium with video index information recorded therein video information management method which uses the video index information recording medium with audio index information recorded therein audio information management method which uses the audio index information and a video retrieval system |
JP2000250944A (ja) * | 1998-12-28 | 2000-09-14 | Toshiba Corp | 情報提供方法、情報提供装置、情報受信装置、並びに情報記述方法 |
US6332120B1 (en) * | 1999-04-20 | 2001-12-18 | Solana Technology Development Corporation | Broadcast speech recognition system for keyword monitoring |
-
2000
- 2000-10-30 US US09/699,605 patent/US6973256B1/en not_active Expired - Fee Related
-
2001
- 2001-10-16 WO PCT/EP2001/011975 patent/WO2002037498A2/en active Application Filing
- 2001-10-16 EP EP01993002A patent/EP1332497A2/en not_active Withdrawn
- 2001-10-16 JP JP2002540156A patent/JP2004513547A/ja not_active Ceased
- 2001-10-16 CN CNB018053882A patent/CN100364008C/zh not_active Expired - Fee Related
- 2001-10-16 KR KR1020027008464A patent/KR100833807B1/ko not_active IP Right Cessation
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5859662A (en) * | 1993-08-06 | 1999-01-12 | International Business Machines Corporation | Apparatus and method for selectively viewing video information |
JPH09284707A (ja) * | 1996-04-12 | 1997-10-31 | Sony Corp | 記録装置 |
EP1026887A2 (en) * | 1999-02-01 | 2000-08-09 | Sharp Kabushiki Kaisha | Audiovisual information management system |
Non-Patent Citations (1)
Title |
---|
IEEE EXPERT. KANADE T,73-76,IEEE INC.. 1996 * |
Also Published As
Publication number | Publication date |
---|---|
WO2002037498A2 (en) | 2002-05-10 |
EP1332497A2 (en) | 2003-08-06 |
KR100833807B1 (ko) | 2008-05-30 |
US6973256B1 (en) | 2005-12-06 |
KR20020067581A (ko) | 2002-08-22 |
CN1404609A (zh) | 2003-03-19 |
JP2004513547A (ja) | 2004-04-30 |
WO2002037498A3 (en) | 2002-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100364008C (zh) | 使用音频特征检测视频节目中的精彩部分的系统和方法 | |
Kokaram et al. | Browsing sports video: trends in sports-related indexing and retrieval work | |
JP4317127B2 (ja) | 音楽ビデオを索引化して要約するシステム及び方法 | |
Leonardi et al. | Semantic indexing of soccer audio-visual sequences: a multimodal approach based on controlled Markov chains | |
US7046911B2 (en) | System and method for reduced playback of recorded video based on video segment priority | |
KR100833806B1 (ko) | 미리 설정된 기록 시간 간격에 앞서 또는 미리 설정된 기록 시간 간격을 넘어 프로그램들을 기록하기 위한 방법들 및 장치 | |
CN1836287B (zh) | 视频摘要提取 | |
JP4767216B2 (ja) | ダイジェスト生成装置、方法及びプログラム | |
US7483624B2 (en) | System and method for indexing a video sequence | |
US20040268398A1 (en) | Controlled multi-media program review | |
Kijak et al. | HMM based structuring of tennis videos using visual and audio cues | |
US20070047913A1 (en) | Playback system, apparatus, and method, information processing apparatus and method, and program therefor | |
WO2007046171A1 (ja) | 記録再生装置 | |
KR20060102639A (ko) | 동영상 재생 시스템 및 방법 | |
CN102034520B (zh) | 电子装置及内容再现方法 | |
US7848612B2 (en) | Pausing media playback at appropriate intervals | |
JP2003264771A (ja) | 信号記録再生装置、信号記録再生方法、並びに信号記録再生プログラムを記録している媒体 | |
JPH08130701A (ja) | 動画像データ処理方法及び処理装置 | |
WO2003065715A1 (fr) | Appareil, systeme et procede d'enregistrement/lecture de donnees audio/video, support enregistre par eux, appareil de reproduction de donnees audio/video, et structure de donnees | |
JP2011223205A (ja) | 放送記録装置およびそのプログラム | |
JP2005348077A (ja) | 記録再生装置、及び再生装置。 | |
CN1993754B (zh) | 与存储介质一起使用的再现设备和方法 | |
Wan et al. | AUTOMATIC SPORTS CONTENT ANALYSIS–STATE-OF-ART AND RECENT RESULTS | |
JP2002133837A (ja) | 録画シーン検索方法および記録再生装置 | |
KR20050068688A (ko) | 요약 재생을 위한 비디오 비트스트림의 기록 및 재생방법과 이를 구현하기 위한 프로그램이 기록된 기록 매체 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20080123 Termination date: 20091116 |