CN100365622C - 对压缩的视频进行分段的方法 - Google Patents
对压缩的视频进行分段的方法 Download PDFInfo
- Publication number
- CN100365622C CN100365622C CNB038020491A CN03802049A CN100365622C CN 100365622 C CN100365622 C CN 100365622C CN B038020491 A CNB038020491 A CN B038020491A CN 03802049 A CN03802049 A CN 03802049A CN 100365622 C CN100365622 C CN 100365622C
- Authority
- CN
- China
- Prior art keywords
- video
- section
- compression
- classification
- described method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/738—Presentation of query results
- G06F16/739—Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/49—Segmenting video sequences, i.e. computational techniques such as parsing or cutting the sequence, low-level clustering or determining units such as shots or scenes
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Television Signal Processing For Recording (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Image Analysis (AREA)
Abstract
通过从压缩视频中抽取音频和视觉特征对压缩的视频进行分段的方法。根据K方式群集把音频特征群集到一个类别集合中,然后根据该类别集合把压缩视频划分为第一段。然后利用该视觉特征,以便通过使用运动分析来把每个第一段划分为第二段。可以提供第二段的摘要来帮助浏览压缩视频。
Description
技术领域
本发明一般涉及浏览视频,更具体说涉及使用视觉和音频特征浏览视频。
背景技术
视频上可用的娱乐、信息和新闻的数量迅速增加。因此,需要一种有效的视频浏览技术。一般说,视频包含三个可以用于浏览的“轨道(track)”,即视觉的、音频的和文本的(字幕(close-caption))。
大多数视频具有故事或主题结构,它们以视觉轨道的形式被反映。视觉轨道的基本单元是一个捕捉连续动作的镜头或场景。因此,许多视频浏览器期望将视频首先分为故事或者主题段。场景变换检测(也称为时间分段)表明一组镜头何时开始和结束。场景检测可以使用压缩域中的DCT系数来进行。然后可以从这些段中选择帧以形成视频的摘要,这些摘要然后可以被迅速浏览,并且用作整个视频的索引。然而,视频摘要不提供关于被摘要的内容的任何信息。
另一种技术使用一些代表帧来组织视频的视觉内容。然而,迄今为止,有意义的帧选择处理需要人工干预。
另一种技术使用基于语言的模型,它把输入的视频的音频轨道与新闻广播所期望的语法元素相匹配,并使用视频剪辑片断的期望内容的一个先验模型来分析视频。然而,基于语言的模型需要语音识别,众所周知,语音识别很慢而容易产生错误。
在现有技术中,曾经使用字幕信息、嵌入的字幕和通过语音识别得到的文本通过它们自身或它们之间的组合来检测主题,参见Hanjalic等人所著“Dancers:Delft advanced news retrievalsystem”(Dancers:Delft先进新闻检索系统),IS&T/SPIEElectronic Imaging 2001:Storage and retrieval for MediaDatabase(用于媒体数据库的存储和检索),2001,和Jasinschi等人所著“Integra ted multimedia processing for topic segmen tationand classification” (主题分段和分类用的综合多媒体处理),ICIP-2001,第363-369页,2001。在这些方法中,使用上述数据源中的一些或者全部从视频中抽取文本,然后使用各种推断来处理该文本以抽取主题。
曾经使用颜色、运动、结构和音频特征进行新闻节目主持人检测。例如,一种技术使用音频轨道以便区分开发言者,以及使用视觉轨道定位面孔。区分开发言者首先就要把音频段分类为语音和非语音类别。然后使用语音段来训练每个发言者的高斯混合模型,参见Wang等人所著“Multimedia Content Analysis”(多媒体内容分析),IEEESignal Processing Magazine,2000年11月。
在现有技术中基于运动的视频浏览也是公知的,参见US专利申请Sn. 09/945,009 “Video Summarization Using Descriptors ofMotion Activity”(利用动作活动的描述符的视频概括),它在2001年4月由Divakaran等人提交,现结合在此作为参考。该系统是高效的,因为它依赖在压缩域中的简单计算。这样,可以使用该系统来迅速产生视频的视觉摘要。然而,为了使用新闻视频进行浏览,该方法需要一个主题列表。如果该主题列表不能得到,则该视频有可能以与内容的语义学不一致的方式分段。
本发明的特殊兴趣在于使用声音识别以供视频浏览之用。例如,在视频中,可能希望识别最经常出现的发言人、主要角色、或新闻“节目主持人”。如果这能对例如新闻广播的视频进行的话,则将能定位由该新闻视频覆盖的每一主题或“故事”的开始。这样,就有可能只重放一个新闻节目主持人开始讲话的一小部分而迅速浏览该视频。
因为新闻视频通常以主题的方式以段的形式安排,新闻节目主持人在每一段的开始介绍每一主题,因此现有技术的新闻视频浏览操作曾经强调新闻节目主持人检测和主题检测。这样,通过知道主题边界,用户可以从一个主题到另一个主题快速浏览新闻视频,直到找到希望的主题,然后可以全部观看该希望的主题。
因此,仍然希望在视频浏览期间使用音频轨道。然而,如上所述,语音识别耗时且易出错误。与主要是处理识别说出的词的特定问题的语音识别不同,声音识别要处理更一般性的问题即表征和识别音频信号,例如,动物声音、不同音乐流派、乐器;诸如树叶的沙沙声、玻璃碎裂或者火焰的爆裂声等自然声音;诸如狗吠的动物声音,以及人的声音—成人、儿童、男人、女人。声音识别不关心解释内容,而关心表征化其内容。
一种声音识别系统由Casey描述,参见“MPEG-7 SoundRecognition Tools”(MPEG-7声音识别工具),IEEE Transactionon Circuits and Systems for Video Technology,Vol.11,No.6,2001年6月,和在2001年11月20日颁发给Casey的美国专利No.6,321,200,“Method for extracting features from a mixture ofsignals”(从信号的混合中提取特点的方法)。Casey使用音频信号的减少的秩谱(rank spectra)和最小熵优先(mi mimum-entropypriors)。作为一个优点,Casey方法允许人们用易于分析和检测的音频描述符来注释MPEG-7视频,参见“MPEG-7 Context,Ob jectivesand Technical Roadmap”(MPEG-7范围、目标和技术路线图)中的“Multimedia Content Description Interface” (多媒体内容描述接口),ISO/IEC N2861,1999年7月。注意,Casey的方法包括把声音分类成一个类目以及产生一个相应的特征矢量这两者。
发明内容
一种通过从压缩的视频抽取音频和视觉特征而对压缩的视频进行分段的方法。根据K方式(K-means)群集而在一个类别的集合中群集音频特征,然后根据该类别的集合把压缩的视频划分为第一段。
然后利用该视觉特征,以便通过使用运动分析把每个第一段划分为第二段。然后可以提供第二段的摘要以帮助浏览压缩的视频。
附图说明
图1是根据本发明的视频分段、摘要、和浏览系统的框图。
具体实施方式
系统概观
如图1所示,本发明取压缩的视频101作为输入。对该视频执行音频特征抽取、分类、和分段110,以产生根据音频特征而分段的视频102。然后对段103执行组镜头检测、运动特征抽取、和视觉分段120,以提供视频101的第二级分段104。可以对这些分段104做摘要130以产生视频101的摘要105。然后可以使用摘要105来高效地浏览140视频101。
音频特征分段
在步骤110期间,处理压缩视频101以抽取音频特征。将这些音频特征分类,并根据音频特征的不同类别把该视频分段。该处理110使用MPEG-7音频描述符以识别例如非语音和语音段。然后可以进一步把该语音段处理为男人语音段和女人语音段。语音段也可以与从状态转变的直方图得到的语音特征矢量Fs关联起来。
因为在一个特定的新闻节目中男女主要角色成员相当少,例如,在3到6的范围中的某个数值,而通常小于10,所以可以单独对每一男人段和女人段应用K方式群集。该群集过程只分配K个最大的群集给角色成员。
这允许人们根据主题在第一级上对压缩视频101分段,这样可以在浏览140视频时跳过不感兴趣的段。
注意,通过对音频特征矢量使用群集步骤,我们能够在由MPEG-7音频描述符生成所产生的类别内产生子类别。换句话说,因为我们的方法保持音频特征矢量和类别这两者,因此通过结合分析由MPEG-7提取所产生的分离的类别,它既允许进一步再分类也允许产生新类别。注意,这在现有技术中是不可能的(在现有技术中,使用把段分类到预定的类别集合中的固定分类器)。
视觉特征分段
然后把基于运动的分段120应用于每一主题(即分段103),以便进行基于视觉特征的第二级分段。然后,根据主要角色识别就可以产生摘要105,并且把主题段与每一语义学段的基于运动的摘要这二者相结合,就允许快速而高效地浏览视频140。应该理解,视频的内容可以是新闻、监视、娱乐等等,然而功效可能变化。
虽然以优选实施例为例说明了本发明,但是应该理解,可以在本发明的精神和范围内进行各种改编和修改。因此,所附权利要求的目的是覆盖所有落入本发明的精神和范围之内的这种变化和修改。
Claims (10)
1.一种用于对压缩的视频进行分段的方法,包括:
直接从压缩的视频中抽取音频特征;
把音频特征群集到类别的集合中;
根据该类别的集合把压缩的视频划分为第一段;
从压缩的视频中抽取视觉特征;和
根据该视觉特征把每个第一段划分为第二段。
2.权利要求1所述的方法,其中,该群集是K方式群集。
3.权利要求1所述的方法,其中,该类别是与压缩的视频中的主要角色成员关联的。
4.权利要求1所述的方法,其中,音频特征是从压缩的视频中抽取的MPEG-7描述符,该MPEG-7描述符被群集成类别,以便根据该类别的集合把压缩的视频划分成第一段。
5.权利要求1所述的方法,其中所述群集包括:
使用音频特征识别语音段和非语音段;和
只群集该语音段。
6.权利要求3所述的方法,其中所述群集包括:
使用音频特征识别语音段和非语音段;
识别语音段中的男人语音段和女人语音段;和
分别群集男人段和女人段以识别主要角色成员。
7.权利要求1所述的方法,其中,类别数目小于10。
8.权利要求1所述的方法,进一步包括:
对该视觉特征执行运动分析以便执行所述把第一段划分为第二段。
9.权利要求1所述的方法,进一步包括:
保持音频特征以便对类别进行再分类和进一步划分第一段。
10.一种用于对压缩的视频进行分段的方法,包括:
直接从压缩的视频中抽取MPEG-7描述符;
把该MPEG-7描述符群集到类别的集合中;
根据该类别的集合把压缩的视频划分为第一段;
从压缩的视频抽取视觉特征;和
根据该视觉特征把每个第一段划分为第二段。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/192,064 US7349477B2 (en) | 2002-07-10 | 2002-07-10 | Audio-assisted video segmentation and summarization |
US10/192,064 | 2002-07-10 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1613074A CN1613074A (zh) | 2005-05-04 |
CN100365622C true CN100365622C (zh) | 2008-01-30 |
Family
ID=30114266
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB038020491A Expired - Fee Related CN100365622C (zh) | 2002-07-10 | 2003-06-23 | 对压缩的视频进行分段的方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7349477B2 (zh) |
EP (1) | EP1520238A2 (zh) |
JP (1) | JP2005532763A (zh) |
CN (1) | CN100365622C (zh) |
WO (1) | WO2004008458A2 (zh) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100831531B1 (ko) * | 2004-01-14 | 2008-05-22 | 미쓰비시덴키 가부시키가이샤 | 기록 장치, 기록 방법, 기록 매체, 요약 재생 장치, 요약 재생 방법, 멀티미디어 요약 시스템 및 멀티미디어 요약 방법 |
US20050154987A1 (en) * | 2004-01-14 | 2005-07-14 | Isao Otsuka | System and method for recording and reproducing multimedia |
KR100681017B1 (ko) * | 2005-02-15 | 2007-02-09 | 엘지전자 주식회사 | 동영상의 요약 제공이 가능한 이동통신 단말기 및 이를 이용한 요약 제공 방법 |
US7305128B2 (en) * | 2005-05-27 | 2007-12-04 | Mavs Lab, Inc. | Anchor person detection for television news segmentation based on audiovisual features |
US8316301B2 (en) * | 2005-08-04 | 2012-11-20 | Samsung Electronics Co., Ltd. | Apparatus, medium, and method segmenting video sequences based on topic |
GB2430101A (en) * | 2005-09-09 | 2007-03-14 | Mitsubishi Electric Inf Tech | Applying metadata for video navigation |
US7577639B2 (en) * | 2005-12-12 | 2009-08-18 | At&T Intellectual Property I, L.P. | Method for analyzing, deconstructing, reconstructing, and repurposing rhetorical content |
WO2007127695A2 (en) | 2006-04-25 | 2007-11-08 | Elmo Weber Frank | Prefernce based automatic media summarization |
US7720281B2 (en) * | 2006-07-31 | 2010-05-18 | Mavs Lab, Inc. | Visual characteristics-based news anchorperson segment detection method |
US9443147B2 (en) * | 2010-04-26 | 2016-09-13 | Microsoft Technology Licensing, Llc | Enriching online videos by content detection, searching, and information aggregation |
US8971651B2 (en) | 2010-11-08 | 2015-03-03 | Sony Corporation | Videolens media engine |
CN102170528B (zh) * | 2011-03-25 | 2012-09-05 | 天脉聚源(北京)传媒科技有限公司 | 一种新闻节目的分段方法 |
US8938393B2 (en) | 2011-06-28 | 2015-01-20 | Sony Corporation | Extended videolens media engine for audio recognition |
JP6413653B2 (ja) * | 2014-11-04 | 2018-10-31 | ソニー株式会社 | 情報処理装置、情報処理方法及びプログラム |
US10404806B2 (en) | 2015-09-01 | 2019-09-03 | Yen4Ken, Inc. | Methods and systems for segmenting multimedia content |
US10296533B2 (en) | 2016-07-07 | 2019-05-21 | Yen4Ken, Inc. | Method and system for generation of a table of content by processing multimedia content |
JP6683231B2 (ja) * | 2018-10-04 | 2020-04-15 | ソニー株式会社 | 情報処理装置および情報処理方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1222283A (zh) * | 1996-04-19 | 1999-07-07 | 诺基亚流动电话有限公司 | 利用基于运动的分段和归并的视频编码器和解码器 |
CN1337828A (zh) * | 2000-07-06 | 2002-02-27 | 三菱电机株式会社 | 从多媒体内容的低级特征中抽取高级特征 |
US6404925B1 (en) * | 1999-03-11 | 2002-06-11 | Fuji Xerox Co., Ltd. | Methods and apparatuses for segmenting an audio-visual recording using image similarity searching and audio speaker recognition |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5953485A (en) * | 1992-02-07 | 1999-09-14 | Abecassis; Max | Method and system for maintaining audio during video control |
US5664227A (en) * | 1994-10-14 | 1997-09-02 | Carnegie Mellon University | System and method for skimming digital audio/video data |
US6052629A (en) * | 1997-07-18 | 2000-04-18 | Gilbarco Inc. | Internet capable browser dispenser architecture |
AUPP340798A0 (en) * | 1998-05-07 | 1998-05-28 | Canon Kabushiki Kaisha | Automated video interpretation system |
US6714909B1 (en) * | 1998-08-13 | 2004-03-30 | At&T Corp. | System and method for automated multimedia content indexing and retrieval |
US6833865B1 (en) * | 1998-09-01 | 2004-12-21 | Virage, Inc. | Embedded metadata engines in digital capture devices |
JP2000285243A (ja) * | 1999-01-29 | 2000-10-13 | Sony Corp | 信号処理方法及び映像音声処理装置 |
US6744922B1 (en) * | 1999-01-29 | 2004-06-01 | Sony Corporation | Signal processing method and video/voice processing device |
US6748356B1 (en) * | 2000-06-07 | 2004-06-08 | International Business Machines Corporation | Methods and apparatus for identifying unknown speakers using a hierarchical tree structure |
JP4683253B2 (ja) * | 2000-07-14 | 2011-05-18 | ソニー株式会社 | Av信号処理装置および方法、プログラム、並びに記録媒体 |
US20040125877A1 (en) * | 2000-07-17 | 2004-07-01 | Shin-Fu Chang | Method and system for indexing and content-based adaptive streaming of digital video content |
US6956904B2 (en) * | 2002-01-15 | 2005-10-18 | Mitsubishi Electric Research Laboratories, Inc. | Summarizing videos using motion activity descriptors correlated with audio features |
US7373336B2 (en) * | 2002-06-10 | 2008-05-13 | Koninklijke Philips Electronics N.V. | Content augmentation based on personal profiles |
US7337115B2 (en) * | 2002-07-03 | 2008-02-26 | Verizon Corporate Services Group Inc. | Systems and methods for providing acoustic classification |
-
2002
- 2002-07-10 US US10/192,064 patent/US7349477B2/en not_active Expired - Fee Related
-
2003
- 2003-06-23 WO PCT/JP2003/007927 patent/WO2004008458A2/en active Application Filing
- 2003-06-23 CN CNB038020491A patent/CN100365622C/zh not_active Expired - Fee Related
- 2003-06-23 EP EP03733548A patent/EP1520238A2/en not_active Withdrawn
- 2003-06-23 JP JP2004521137A patent/JP2005532763A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1222283A (zh) * | 1996-04-19 | 1999-07-07 | 诺基亚流动电话有限公司 | 利用基于运动的分段和归并的视频编码器和解码器 |
US6404925B1 (en) * | 1999-03-11 | 2002-06-11 | Fuji Xerox Co., Ltd. | Methods and apparatuses for segmenting an audio-visual recording using image similarity searching and audio speaker recognition |
CN1337828A (zh) * | 2000-07-06 | 2002-02-27 | 三菱电机株式会社 | 从多媒体内容的低级特征中抽取高级特征 |
Non-Patent Citations (7)
Title |
---|
Audio Content Analysis for Online AudiovisualDataSegmentation and Classification. Tong Zhang, C.-C. Jay Kuo.IEEE TRANSACTIONS ON SPEECH AND AUDIO PROCESSING,,Vol.9 No.4. 2001 * |
Joint Audio-video Processing of MPEG Encoded Sequences. Giuseppe Boccignone,MassimoDeSanto,GennaroPercannella.Multimedia Computing and Systems, 1999. IEEE International Conference,,Vol.Volume 2 . 1999 * |
SEGMENTATION WITH THE ASSISTANCE OF AUDIOCONTENTANALYSIS. HAO JIANG,TONG LIN,HONG-JIANG ZHANGVIDEO.MULTIMEDIA AND EXPO 2000。1ICME 2000,2000 IEEE INTERNATIONAL CONFERENCE ON NEW YORK,Vol.3 . 2000 * |
SEGMENTATION WITH THE ASSISTANCE OFAUDIOCONTENTANALYSIS. HAO JIANG ,TONG LIN ,HON-JIANG ZHANG VIDEO.MULTIMEDIA AND EXPO,2000 ICME 2000,20000 IEEEINTERNATIONAL CONFERENCE ON NEW YORK,Vol.3 . 2000 * |
SEGMENTATION WITH THE ASSISTANCE OFAUDIOCONTENTANALYSIS. HAO JIANG TONG LIN HON-JIANG ZHANG VIDEO.MULTIMEDIA AND EXPO 2000。ICME 2000。2000 IEEE INTERNATIONAL CONFERENCE ON NEW YORK,Vol.3 . 2000 * |
SEGMENTATON WITH THE ASSISTANCE OF AUDIOCONTENTANALYSIS. HAO JIANG ,TONG LIN ,HON-JIANG ZHANGVIDEO.MULTIMEDIA AND EXPO 2000。ICME 2000。2000 IEEE INTERNATIONAL CONFERENCE ON NWE YORK,Vol.3 . 2000 * |
Video segmentation with the assistance of audiocontent analysis. Hao Jiang, Tong Lin, Hong-Jiang Zhang.Multimedia and Expo, 2000. ICME 2000. 2000 IEEE International Conference,,Vol.Volume 3 . 2000 * |
Also Published As
Publication number | Publication date |
---|---|
JP2005532763A (ja) | 2005-10-27 |
US20040008789A1 (en) | 2004-01-15 |
WO2004008458A2 (en) | 2004-01-22 |
EP1520238A2 (en) | 2005-04-06 |
WO2004008458A3 (en) | 2004-07-08 |
US7349477B2 (en) | 2008-03-25 |
CN1613074A (zh) | 2005-05-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100365622C (zh) | 对压缩的视频进行分段的方法 | |
US5664227A (en) | System and method for skimming digital audio/video data | |
Huang et al. | Automated generation of news content hierarchy by integrating audio, video, and text information | |
Smith et al. | Video skimming for quick browsing based on audio and image characterization | |
US8750681B2 (en) | Electronic apparatus, content recommendation method, and program therefor | |
EP1692629B1 (en) | System & method for integrative analysis of intrinsic and extrinsic audio-visual data | |
Li et al. | Video content analysis using multimodal information: For movie content extraction, indexing and representation | |
JP2004229283A (ja) | ニュースビデオにおいてニュース司会者の遷移を識別する方法 | |
Gauch et al. | Real time video scene detection and classification | |
EP2122623B1 (en) | Analysing video material | |
Sandhu et al. | Summarizing Videos by Key frame extraction using SSIM and other Visual Features | |
Rouvier et al. | Audio-based video genre identification | |
Wachman et al. | Tools for browsing a TV situation comedy based on content specific attributes | |
Haloi et al. | Unsupervised story segmentation and indexing of broadcast news video | |
Darji et al. | A review of video classification techniques | |
Smith et al. | Multimodal video characterization and summarization | |
Khollam et al. | A Survey on Content Based Lecture Video Retrieval Using Speech and Video Text information | |
Dumont et al. | A local temporal context-based approach for TV news story segmentation | |
McDonald | Discrete language models for video retrieval | |
Papageorgiou et al. | Multimedia Indexing and Retrieval Using Natural Language, Speech and Image Processing Methods | |
Sugano et al. | Shot classification and scene segmentation based on MPEG compressed movie analysis | |
Benini et al. | Video shot clustering and summarization through dendrograms | |
Chivadshetti et al. | Content Based Video Retrieval Using Integrated Feature Extraction | |
Liu et al. | Automated Generation of News Content Hierarchy by Intetrating Audio, Video, and Text Information | |
Jun-qing et al. | Content-based hierarchical analysis of news video using audio and visual information |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20080130 Termination date: 20150623 |
|
EXPY | Termination of patent right or utility model |