JP2007124636A - 複数のフレームを含むビデオの要約を生成するための方法およびシステム - Google Patents
複数のフレームを含むビデオの要約を生成するための方法およびシステム Download PDFInfo
- Publication number
- JP2007124636A JP2007124636A JP2006268244A JP2006268244A JP2007124636A JP 2007124636 A JP2007124636 A JP 2007124636A JP 2006268244 A JP2006268244 A JP 2006268244A JP 2006268244 A JP2006268244 A JP 2006268244A JP 2007124636 A JP2007124636 A JP 2007124636A
- Authority
- JP
- Japan
- Prior art keywords
- video
- face
- frame
- frames
- clustering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/215—Motion-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/738—Presentation of query results
- G06F16/739—Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/74—Browsing; Visualisation therefor
- G06F16/745—Browsing; Visualisation therefor the internal structure of a single video sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7837—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content
- G06F16/784—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content the detected or recognised objects being people
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
- G11B27/034—Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Library & Information Science (AREA)
- Human Computer Interaction (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Television Signal Processing For Recording (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
【解決手段】方法は、ビデオの要約を生成する。ビデオの複数のフレームにおいて、顔が検出される。各フレームにおいて検出される顔の数に従って、フレームが分類され、該分類に従って、ビデオがセグメントに区分されて、ビデオの要約が生成される。ただ1つの顔が検出されたものとして分類されるそれぞれのフレームに対して、顔の1つまたは複数の特徴が判定される。ラベルを付されたクラスタを生成するために、この特徴に従って、フレームがラベルを付され該ラベルを付されたクラスタに従って、セグメントがサブセグメントに区分される。
【選択図】図1
Description
図1は、本発明によるビデオ101を要約するためのシステムおよび方法100を示す。そのビデオの複数のフレームにおいて顔が検出されて(110)、フレーム毎に顔の数が求められる(111)。フレーム毎に検出された顔の数111によって、フレームが分類され(120)、その分類121に従って、ビデオ101がセグメント131〜133に区分されて(200)、ビデオ101の要約134が生成される。それらのセグメントは、1つの顔131、2つの顔132、および3つ以上の顔133を有するフレームを含むことができる。
好ましい実施の形態では、高い精度および速い速度を提供するViola−Jones顔検出器が用いられる。2002年7月22日に出願され、参照によりその全体が本明細書に援用される、Viola他による米国特許出願第10/200、464号「画像中の物体を検出するシステムおよび方法(System and Method for Detecting Objects in Images)」を参照願いたい。Viola−Jones検出器は、用いられるパラメータファイルを変更することによって、他の物体を検出することもできる。したがって、同じ検出エンジンを用いて、いくつかの種類の物体を検出することができ、それを用いて、ビデオ101をセグメント化することができる。
最初に、検出された顔の数に基づいて、各ビデオフレームを、またはオプションでは、選択される時間分解能に応じてそれよりも大きなフレーム単位を、「1つの顔」、「2つの顔」および「3つ以上の顔」のクラスに分類する。ニュースビデオ、並びにトークショーおよびインタビューのような他のほとんど変化しないシーンのトークビデオでは、セグメントの大部分が1つの顔を有する。
場合によっては、1つのクラスタの境界にあるただ1つのシーンが複数のクラスタに入り、断片が生じることもある。これをそのままセグメント化すると、セグメントの大部分が非常に短く、結果として再生がぎくしゃくするために、ブラウジングするのに適していない。次のセグメントまたはサブセグメントにスキップすることは、数秒またはそれより短い時間だけ、ただ再生を早送りするだけであろう。
ユーザは、各セグメントまたはサブセグメントを個別の要約として見ることができる。本発明人のニュースビデオによる実験では、通常、クラスタのうちの1つが、総合司会者のセグメントに対応することがわかった。さらに、別のタイプのセグメントに続く総合司会者のセグメントは、ニュースの導入部を示す。したがって、総合司会者に対応するクラスタにおいて、ユーザは、大抵の場合に局外からの映像によってもたらされる詳細な事柄を見ることなく、ニュースの導入部を通して要約全体を見ることができるか、またはユーザはいつでも、次のニュースの始まりである次のセグメントにスキップすることができる。
Claims (14)
- 複数のフレームを含むビデオの要約を生成するための方法であって、
前記ビデオの前記複数のフレームの中の顔を検出することと、
各フレームにおいて検出される顔の数に従って前記フレームを分類することと、
前記ビデオの要約を生成するために、前記分類に従って前記ビデオをセグメントに区分することと
を含む複数のフレームを含むビデオの要約を生成するための方法。 - 前記セグメント化することは、
ただ1つの顔が検出されたものとして分類されるそれぞれのフレームに対して、該顔の1つまたは複数の特徴を判定することと、
前記特徴に従って前記フレームにラベルを付すことと、
ラベルを付されたクラスタを生成するために、前記ラベルに従って前記フレームをクラスタリングすることと、
前記ラベルを付されたクラスタに従って、ただ1つの顔を含むフレームとして分類されるフレームを有する前記セグメントをサブセグメントに区分することと
をさらに含む請求項1に記載の方法。 - 前記ビデオは、圧縮されたビデオである請求項1に記載の方法。
- 前記検出することは、前記圧縮されたビデオのIフレームにおいて実行される請求項3に記載の方法。
- 前記特徴は、顔のサイズを含む請求項2に記載の方法。
- 前記特徴は、顔の位置を含む請求項2に記載の方法。
- 前記特徴は、顔のカラーヒストグラムを含む請求項2に記載の方法。
- 前記クラスタリングすることは、k平均クラスタリングである請求項2に記載の方法。
- 前記クラスタリングすることは、ガウス混合モデルを用いて実行される請求項2に記載の方法。
- 時間的コヒーレンスを用いて顔検出誤りを訂正することをさらに含む請求項2に記載の方法。
- 閾値長よりも短いサブセグメントを除去することをさらに含む請求項2に記載の方法。
- 前記閾値長は1〜3秒の範囲にある請求項11に記載の方法。
- 複数のフレームを含むビデオの要約を生成するためのシステムであって、
前記ビデオの前記複数のフレームにおいて顔を検出するための手段と、
各フレームにおいて検出される顔の数に従って前記フレームを分類するための手段と、
前記ビデオの要約を生成するために、前記分類に従って前記ビデオをセグメントに区分するための手段と
を備える複数のフレームを含むビデオの要約を生成するためのシステム。 - ただ1つの顔が検出されたものとして分類されるそれぞれのフレームに対して、該顔の1つまたは複数の特徴を判定するための手段と、
前記特徴に従って前記フレームにラベルを付すための手段と、
ラベルを付されたクラスタを生成するために、前記ラベルに従って前記フレームをクラスタリングするための手段と、
前記ラベルを付されたクラスタに従って、ただ1つの顔を含むフレームとして分類されるフレームを有する前記セグメントをサブセグメントに区分するための手段と
をさらに備える請求項13に記載のシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/258,590 US7555149B2 (en) | 2005-10-25 | 2005-10-25 | Method and system for segmenting videos using face detection |
US11/258,590 | 2005-10-25 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007124636A true JP2007124636A (ja) | 2007-05-17 |
JP5031312B2 JP5031312B2 (ja) | 2012-09-19 |
Family
ID=37984933
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006268244A Expired - Fee Related JP5031312B2 (ja) | 2005-10-25 | 2006-09-29 | 複数のフレームを含むビデオの要約を生成するための方法およびシステム |
Country Status (2)
Country | Link |
---|---|
US (1) | US7555149B2 (ja) |
JP (1) | JP5031312B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010531561A (ja) * | 2007-06-15 | 2010-09-24 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | マルチメディアファイルのサマリを自動的に生成する方法及び装置 |
JP2018515006A (ja) * | 2015-05-14 | 2018-06-07 | グーグル エルエルシー | ビデオストリームのエンティティベースの時間的セグメント化 |
CN111432138A (zh) * | 2020-03-16 | 2020-07-17 | Oppo广东移动通信有限公司 | 视频拼接方法及装置、计算机可读介质和电子设备 |
Families Citing this family (67)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7565030B2 (en) | 2003-06-26 | 2009-07-21 | Fotonation Vision Limited | Detecting orientation of digital images using face detection information |
US8155397B2 (en) | 2007-09-26 | 2012-04-10 | DigitalOptics Corporation Europe Limited | Face tracking in a camera processor |
US8682097B2 (en) | 2006-02-14 | 2014-03-25 | DigitalOptics Corporation Europe Limited | Digital image enhancement with reference images |
US9692964B2 (en) | 2003-06-26 | 2017-06-27 | Fotonation Limited | Modification of post-viewing parameters for digital images using image region or feature information |
US9129381B2 (en) | 2003-06-26 | 2015-09-08 | Fotonation Limited | Modification of post-viewing parameters for digital images using image region or feature information |
US7471846B2 (en) | 2003-06-26 | 2008-12-30 | Fotonation Vision Limited | Perfecting the effect of flash within an image acquisition devices using face detection |
US8593542B2 (en) | 2005-12-27 | 2013-11-26 | DigitalOptics Corporation Europe Limited | Foreground/background separation using reference images |
US8896725B2 (en) | 2007-06-21 | 2014-11-25 | Fotonation Limited | Image capture device with contemporaneous reference image capture mechanism |
US7440593B1 (en) * | 2003-06-26 | 2008-10-21 | Fotonation Vision Limited | Method of improving orientation and color balance of digital images using face detection information |
US7792970B2 (en) | 2005-06-17 | 2010-09-07 | Fotonation Vision Limited | Method for establishing a paired connection between media devices |
US7844076B2 (en) | 2003-06-26 | 2010-11-30 | Fotonation Vision Limited | Digital image processing using face detection and skin tone information |
US8989453B2 (en) | 2003-06-26 | 2015-03-24 | Fotonation Limited | Digital image processing using face detection information |
US7269292B2 (en) | 2003-06-26 | 2007-09-11 | Fotonation Vision Limited | Digital image adjustable compression and resolution using face detection information |
US8494286B2 (en) | 2008-02-05 | 2013-07-23 | DigitalOptics Corporation Europe Limited | Face detection in mid-shot digital images |
US8363951B2 (en) * | 2007-03-05 | 2013-01-29 | DigitalOptics Corporation Europe Limited | Face recognition training method and apparatus |
US7620218B2 (en) | 2006-08-11 | 2009-11-17 | Fotonation Ireland Limited | Real-time face tracking with reference images |
US8948468B2 (en) | 2003-06-26 | 2015-02-03 | Fotonation Limited | Modification of viewing parameters for digital images using face detection information |
US7574016B2 (en) | 2003-06-26 | 2009-08-11 | Fotonation Vision Limited | Digital image processing using face detection information |
US7792335B2 (en) * | 2006-02-24 | 2010-09-07 | Fotonation Vision Limited | Method and apparatus for selective disqualification of digital images |
US8498452B2 (en) | 2003-06-26 | 2013-07-30 | DigitalOptics Corporation Europe Limited | Digital image processing using face detection information |
US8330831B2 (en) | 2003-08-05 | 2012-12-11 | DigitalOptics Corporation Europe Limited | Method of gathering visual meta data using a reference image |
US8189927B2 (en) | 2007-03-05 | 2012-05-29 | DigitalOptics Corporation Europe Limited | Face categorization and annotation of a mobile phone contact list |
US8553949B2 (en) * | 2004-01-22 | 2013-10-08 | DigitalOptics Corporation Europe Limited | Classification and organization of consumer digital images using workflow, and face detection and recognition |
US7564994B1 (en) | 2004-01-22 | 2009-07-21 | Fotonation Vision Limited | Classification system for consumer digital images using automatic workflow and face detection and recognition |
US8320641B2 (en) | 2004-10-28 | 2012-11-27 | DigitalOptics Corporation Europe Limited | Method and apparatus for red-eye detection using preview or other reference images |
US8488023B2 (en) * | 2009-05-20 | 2013-07-16 | DigitalOptics Corporation Europe Limited | Identifying facial expressions in acquired digital images |
US7315631B1 (en) | 2006-08-11 | 2008-01-01 | Fotonation Vision Limited | Real-time face tracking in a digital image acquisition device |
US8503800B2 (en) | 2007-03-05 | 2013-08-06 | DigitalOptics Corporation Europe Limited | Illumination detection using classifier chains |
US7715597B2 (en) * | 2004-12-29 | 2010-05-11 | Fotonation Ireland Limited | Method and component for image recognition |
US7697752B2 (en) * | 2005-12-20 | 2010-04-13 | General Instrument Corporation | Method and apparatus for performing object detection |
US7804983B2 (en) * | 2006-02-24 | 2010-09-28 | Fotonation Vision Limited | Digital image acquisition control and correction method and apparatus |
US8392183B2 (en) | 2006-04-25 | 2013-03-05 | Frank Elmo Weber | Character-based automated media summarization |
DE602007012246D1 (de) | 2006-06-12 | 2011-03-10 | Tessera Tech Ireland Ltd | Fortschritte bei der erweiterung der aam-techniken aus grauskalen- zu farbbildern |
US7720281B2 (en) * | 2006-07-31 | 2010-05-18 | Mavs Lab, Inc. | Visual characteristics-based news anchorperson segment detection method |
WO2008015586A2 (en) * | 2006-08-02 | 2008-02-07 | Fotonation Vision Limited | Face recognition with combined pca-based datasets |
US7403643B2 (en) | 2006-08-11 | 2008-07-22 | Fotonation Vision Limited | Real-time face tracking in a digital image acquisition device |
US7916897B2 (en) | 2006-08-11 | 2011-03-29 | Tessera Technologies Ireland Limited | Face tracking for controlling imaging parameters |
KR100804678B1 (ko) * | 2007-01-04 | 2008-02-20 | 삼성전자주식회사 | 비디오 인물별 신 분류 방법 및 그 시스템 |
US8055067B2 (en) | 2007-01-18 | 2011-11-08 | DigitalOptics Corporation Europe Limited | Color segmentation |
EP1959449A1 (en) * | 2007-02-13 | 2008-08-20 | British Telecommunications Public Limited Company | Analysing video material |
EP2115662B1 (en) | 2007-02-28 | 2010-06-23 | Fotonation Vision Limited | Separating directional lighting variability in statistical face modelling based on texture space decomposition |
JP4970557B2 (ja) | 2007-03-05 | 2012-07-11 | デジタルオプティックス・コーポレイション・ヨーロッパ・リミテッド | デジタル画像取込装置における顔検索及び検出 |
US7916971B2 (en) * | 2007-05-24 | 2011-03-29 | Tessera Technologies Ireland Limited | Image processing method and apparatus |
JP4424396B2 (ja) * | 2007-09-03 | 2010-03-03 | ソニー株式会社 | データ処理装置および方法、並びにデータ処理プログラムおよびデータ処理プログラムが記録された記録媒体 |
US8750578B2 (en) | 2008-01-29 | 2014-06-10 | DigitalOptics Corporation Europe Limited | Detecting facial expressions in digital images |
US7855737B2 (en) * | 2008-03-26 | 2010-12-21 | Fotonation Ireland Limited | Method of making a digital camera image of a scene including the camera user |
EP2277141A2 (en) | 2008-07-30 | 2011-01-26 | Tessera Technologies Ireland Limited | Automatic face and skin beautification using face detection |
WO2010063463A2 (en) * | 2008-12-05 | 2010-06-10 | Fotonation Ireland Limited | Face recognition using face tracker classifier data |
US8379917B2 (en) | 2009-10-02 | 2013-02-19 | DigitalOptics Corporation Europe Limited | Face recognition performance using additional image features |
US8726161B2 (en) * | 2010-10-19 | 2014-05-13 | Apple Inc. | Visual presentation composition |
US8588534B2 (en) | 2011-05-06 | 2013-11-19 | Microsoft Corporation | Staged element classification |
WO2013063736A1 (en) | 2011-10-31 | 2013-05-10 | Hewlett-Packard Development Company, L.P. | Temporal face sequences |
JP6026007B2 (ja) * | 2012-12-20 | 2016-11-16 | インテル・コーポレーション | ビデオモーション推定モジュールを用いた加速対象検出フィルタ |
US9190061B1 (en) * | 2013-03-15 | 2015-11-17 | Google Inc. | Visual speech detection using facial landmarks |
CN104252616B (zh) * | 2013-06-28 | 2018-01-23 | 广州华多网络科技有限公司 | 人脸标注方法、装置及设备 |
KR20150024650A (ko) * | 2013-08-27 | 2015-03-09 | 삼성전자주식회사 | 전자 장치에서 사운드를 시각적으로 제공하기 위한 방법 및 장치 |
US11158344B1 (en) * | 2015-09-30 | 2021-10-26 | Amazon Technologies, Inc. | Video ingestion and clip creation |
US10230866B1 (en) | 2015-09-30 | 2019-03-12 | Amazon Technologies, Inc. | Video ingestion and clip creation |
US11205103B2 (en) | 2016-12-09 | 2021-12-21 | The Research Foundation for the State University | Semisupervised autoencoder for sentiment analysis |
CN107277557B (zh) * | 2017-06-16 | 2019-12-03 | 深圳市茁壮网络股份有限公司 | 一种视频分割方法及系统 |
KR102585777B1 (ko) | 2018-05-29 | 2023-10-10 | 삼성전자주식회사 | 전자 장치 및 그 제어방법 |
CN109005451B (zh) * | 2018-06-29 | 2021-07-30 | 杭州星犀科技有限公司 | 基于深度学习的视频拆条方法 |
US11386562B2 (en) | 2018-12-28 | 2022-07-12 | Cyberlink Corp. | Systems and methods for foreground and background processing of content in a live video |
CN110139158B (zh) * | 2019-06-21 | 2021-04-02 | 上海摩象网络科技有限公司 | 视频以及子视频的生成方法、装置、电子设备 |
CN110287949B (zh) * | 2019-07-30 | 2021-04-06 | 腾讯音乐娱乐科技(深圳)有限公司 | 视频片段提取方法、装置、设备及存储介质 |
CN111464865B (zh) * | 2020-06-18 | 2020-11-17 | 北京美摄网络科技有限公司 | 一种视频生成方法、装置、电子设备及计算机可读存储介质 |
CN112069357B (zh) * | 2020-07-29 | 2024-03-01 | 北京奇艺世纪科技有限公司 | 视频资源处理方法、装置、电子设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10178619A (ja) * | 1996-12-19 | 1998-06-30 | Nikon Corp | 画像再生装置および電子カメラ |
WO2004090752A1 (en) * | 2003-04-14 | 2004-10-21 | Koninklijke Philips Electronics N.V. | Method and apparatus for summarizing a music video using content analysis |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5802361A (en) * | 1994-09-30 | 1998-09-01 | Apple Computer, Inc. | Method and system for searching graphic images and videos |
JP3823333B2 (ja) * | 1995-02-21 | 2006-09-20 | 株式会社日立製作所 | 動画像の変化点検出方法、動画像の変化点検出装置、動画像の変化点検出システム |
US5832115A (en) * | 1997-01-02 | 1998-11-03 | Lucent Technologies Inc. | Ternary image templates for improved semantic compression |
JPH11146325A (ja) * | 1997-11-10 | 1999-05-28 | Hitachi Ltd | 映像検索方法および装置並びに映像情報作成方法およびその処理プログラムを格納した記憶媒体 |
GB2333590A (en) * | 1998-01-23 | 1999-07-28 | Sharp Kk | Detecting a face-like region |
US6292575B1 (en) * | 1998-07-20 | 2001-09-18 | Lau Technologies | Real-time facial recognition and verification system |
US6847680B2 (en) * | 2001-12-17 | 2005-01-25 | Mitsubishi Electric Research Laboratories, Inc. | Method for detecting talking heads in a compressed video |
US7167519B2 (en) * | 2001-12-20 | 2007-01-23 | Siemens Corporate Research, Inc. | Real-time video object generation for smart cameras |
US7165029B2 (en) * | 2002-05-09 | 2007-01-16 | Intel Corporation | Coupled hidden Markov model for audiovisual speech recognition |
US7027054B1 (en) * | 2002-08-14 | 2006-04-11 | Avaworks, Incorporated | Do-it-yourself photo realistic talking head creation system and method |
-
2005
- 2005-10-25 US US11/258,590 patent/US7555149B2/en not_active Expired - Fee Related
-
2006
- 2006-09-29 JP JP2006268244A patent/JP5031312B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10178619A (ja) * | 1996-12-19 | 1998-06-30 | Nikon Corp | 画像再生装置および電子カメラ |
WO2004090752A1 (en) * | 2003-04-14 | 2004-10-21 | Koninklijke Philips Electronics N.V. | Method and apparatus for summarizing a music video using content analysis |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010531561A (ja) * | 2007-06-15 | 2010-09-24 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | マルチメディアファイルのサマリを自動的に生成する方法及び装置 |
JP2018515006A (ja) * | 2015-05-14 | 2018-06-07 | グーグル エルエルシー | ビデオストリームのエンティティベースの時間的セグメント化 |
CN111432138A (zh) * | 2020-03-16 | 2020-07-17 | Oppo广东移动通信有限公司 | 视频拼接方法及装置、计算机可读介质和电子设备 |
CN111432138B (zh) * | 2020-03-16 | 2022-04-26 | Oppo广东移动通信有限公司 | 视频拼接方法及装置、计算机可读介质和电子设备 |
Also Published As
Publication number | Publication date |
---|---|
US20070091203A1 (en) | 2007-04-26 |
US7555149B2 (en) | 2009-06-30 |
JP5031312B2 (ja) | 2012-09-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5031312B2 (ja) | 複数のフレームを含むビデオの要約を生成するための方法およびシステム | |
Brunelli et al. | A survey on the automatic indexing of video data | |
Li et al. | An overview of video abstraction techniques | |
Aigrain et al. | Medium knowledge-based macro-segmentation of video into sequences | |
US7796860B2 (en) | Method and system for playing back videos at speeds adapted to content | |
Hanjalic | Content-based analysis of digital video | |
US8311277B2 (en) | Method and system for video indexing and video synopsis | |
KR100411342B1 (ko) | 비디오 텍스트 합성 키프레임 생성방법 | |
KR100687732B1 (ko) | 내용 기반 멀티 모달 특징값을 이용한 유해 동영상 차단방법 및 그 장치 | |
Srinivasan et al. | " What is in that video anyway?": In Search of Better Browsing | |
US20040041831A1 (en) | System and method for indexing a video sequence | |
WO2006126391A1 (ja) | コンテンツ処理装置及びコンテンツ処理方法、並びにコンピュータ・プログラム | |
KR100374040B1 (ko) | 비디오 텍스트 합성 키 프레임 추출방법 | |
Zhang | Content-based video browsing and retrieval | |
CN112567416A (zh) | 用于处理数字视频的设备及方法 | |
KR101195613B1 (ko) | 동영상의 주제별 분할장치 및 방법 | |
Jiang et al. | Advances in video summarization and skimming | |
WO2006092765A2 (en) | Method of video indexing | |
Liu | A hidden markov model approach to the structure of documentaries | |
KR20050033075A (ko) | 비디오 이미지들의 시퀀스에서 콘텐트 속성을 검출하는 유닛 및 방법 | |
JPH11265396A (ja) | 音楽映像分類方法、装置および音楽映像分類プログラムを記録した記録媒体 | |
Kolekar et al. | Semantic indexing of news video sequences: a multimodal hierarchical approach based on hidden markov model | |
JP4930364B2 (ja) | 映像文字検出方法、装置、およびプログラム | |
Lew et al. | Video indexing and understanding | |
Sugano et al. | Generic summarization technology for consumer video |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090709 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120207 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120326 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120626 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120627 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150706 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |