JP2000516435A - 可視索引付けシステムのための重要情景検出及びフレームフィルタリング - Google Patents

可視索引付けシステムのための重要情景検出及びフレームフィルタリング

Info

Publication number
JP2000516435A
JP2000516435A JP10542103A JP54210398A JP2000516435A JP 2000516435 A JP2000516435 A JP 2000516435A JP 10542103 A JP10542103 A JP 10542103A JP 54210398 A JP54210398 A JP 54210398A JP 2000516435 A JP2000516435 A JP 2000516435A
Authority
JP
Japan
Prior art keywords
frame
block
counter
macroblock
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10542103A
Other languages
English (en)
Other versions
JP4256940B2 (ja
Inventor
ネベンカ ディミトローバ
トーマス マギー
ジャン エレンバース
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Philips Electronics NV filed Critical Philips Electronics NV
Publication of JP2000516435A publication Critical patent/JP2000516435A/ja
Application granted granted Critical
Publication of JP4256940B2 publication Critical patent/JP4256940B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/458Scheduling content for creating a personalised stream, e.g. by combining a locally stored advertisement with an incoming stream; Updating operations, e.g. for OS modules ; time-related management operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/71Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7847Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
    • G06F16/785Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content using colour or luminescence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7847Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
    • G06F16/7864Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content using domain-transform features, e.g. DCT or wavelet transform coefficients
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/179Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/87Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/812Monomedia components thereof involving advertisement data

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Signal Processing (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Software Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Signal Processing For Recording (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 本発明のビデオ索引付けシステムは、源ビデオの内容を解析し、選択された画像を用いて可視内容テーブルを発生する。重要情景を検出するシステムは、DCT係数及びマクロブロックに基づいて、或る情景から他の情景へのビデオカット及び静止情景を検出する。キーフレームフィルタリング処理は、例えば単色フレーム又は同一の対象物を主要な焦点又は主要な焦点の1つとして有するようなフレーム等の余り望ましくないフレームをフィルタ除去する。コマーシャルも検出され、コマーシャルのフレームは除去される。

Description

【発明の詳細な説明】 可視索引付けシステムのための重要情景検出及びフレームフィルタリング 技術分野 本発明は、源ビデオ(source video)の重要情景(significant scene)を検 出し、検出された各重要情景を表すキーフレームを選択するような装置に関する 。更に、本発明は上記の選択されたキーフレームをフィルタし、残存するキーフ レームに基づいて可視索引(visual index)又は可視内容テーブル(visual tab le of contents)を生成する。 背景技術 使用者は、後で又は繰り返し視聴するため、しばしばテープ上にホームビデオ を記録し、又はテレビジョン番組、映画、コンサート、スポーツ競技等を記録す る。ビデオは、しばしば、多様な内容を含み、或いは非常に長大なものである。 しかしながら、使用者は、何が記録テープ上にあるかを書き印さないことがあり 、テープ上に何を記録したか又はテープ上の何処に特別な場面、映画、出来事等 を記録したかを思い出すことができない場合がある。このように、使用者は何が テープ上にあるかを思い出すため、座って全テープを見なければならないことが ある。 ビデオ内容解析は、記録された題材の内容を示す情報を取り出す自動的又は準 自動的な方法を使用する。ビデオ内容索引付け及び解析は、当該ビデオの可視行 列から構造及び意味を取り出す。通常、TV番組又はホームビデオからはビデオ クリップ(video clip)が取り出される。 1995年のマルチメディアツール及びアプリケーションの第89〜111頁 に公表された“圧縮されたデータを用いたビデオ解析及び検索”にHongjiangZha ng、Chien Yong Low及びStephen W.Smoliarにより記載されたシステムにおいて は、2つのビデオフレームの間の対応するブロックが比較され、全てのブロック の間の差が、ブロック形式を区別することなく全ビデオフレームにわたって 合計される。このZhangのシステムは、しかしながら、幾つかのブロックが色又 は輝度に差があると、食い違った結果を生じることがある。本システムは、この ような食い違った結果を防止することを目指す。 発明の開示 以前に記録された又は記録中のビデオ源のための可視索引を生成し、重要なキ ーフレーム(keyframes)を選択するのに利用可能であって且つ正確に選択し、 それでいて使用者に対して利用可能な情報量を提供するようなシステムが望まれ る。 更に、本発明は、ニュース、続き物、気象、スポーツ又は全ての形式の家庭記 録ビデオのような有益な及び/又は娯楽の番組を含む源ビデオ用の可視内容抽出 を扱うようなリアルタイムまでのビデオ解析システムを提供する。 更に、本発明は、源ビデオ内容の内容を限定された計算資源を用いてリアルタ イムでまでも解析すると共に、選択された画像を用いて可視テーブルを生成する 。 更に、本発明は、使用者が上記可視内容テーブル又は可視索引を用いてテープ 、ファイル、ディスク、DVD又は他の記憶手段上の特別な点にアクセスするこ とも可能にする。 更に、本発明は、可視索引中に一層適した可視画像を用意するための新たなビ デオカット(video cut)検出、静止情景検出及びキーフレームフィルタリング を行う装置を提供する。 本発明は、DCT係数を用いた計算及び種々の敷居値に対する比較に基づいて 、源ビデオの重要情景を検出し、キーフレームを選択することができる。 更に、本発明は、ブロック記号(block signature)、画像の領域、フレーム 記号及び2つの画像のフレーム記号を比較する比較器を用いて、ビデオ源からの フレームをフィルタすることができる。 加えて、本発明は可視索引からコマーシャルに属するキーフレームのフィルタ リング除去を可能にする。 図面の簡単な説明 本発明、本発明の作用効果及び本発明の使用により得られる特別な目的の一層 明快な理解のためには、添付図面及び本発明の好ましい実施例を説明した記載を 参照されたい。添付図面において、 第1図は、ビデオ保管処理(video archival process)を示す。 第2A図及び第2B図は、可視索引の生成に使用される装置のブロック図。 第3図は、フレーム、マクロブロック(macroblock)及び数個のブロックを示 す。 第4図は、ブロックの数個のDCT係数を示す。 第5図は、DCT係数を伴うマクロブロック及び数個のブロックを示す。 第6A図及び第6B図はキーフレームフィルタリングの手順を示す。 第7図は、マクロブロック及びそのブロック記号に対する関係を示す。 第8図は、ビデオ検索処理を示す。 発明を実施するための最良の形態 可視索引は既存のテープ(又は、ファイル、DVD、ディスク等)に作成する ことができ、又は新たなテープ上に記録を行っている際に作成することもできる 。可視索引の作成を可能にするために、両テープは当該テープ上の選択された領 域(本例においては、使用の容易さから開始部)に所定の部分を必要とする。本 例の場合は、30秒間の“空白(ブランク)”テープ又は重ね書き可能なテープ が望ましい。ファイルの場合は、上記の可視索引用の選択された領域は当該ファ イル内の何れかの位置を占めることができ、システムにより自動的に確保される か又は使用者により手動で選択することができる。 該可視索引は、可視画像、オーディオ、テキスト又はこれらの何れかの組み合 わせを含むことができる。本例の場合は、可視画像及びテキストが設けられる。 可視索引を作成し使用するために、ビデオ内容索引付け処理が実行される。 上記ビデオ内容索引付け処理には2つのフェーズが存在する。即ち、保管(ar chival)と検索(retrieval)である。保管処理においては、ビデオ解析処理の 間にビデオ内容が解析され、可視索引が作成される。ビデオ解析処理においては 、自動的な重要情景検出(significant scene detection)及びキーフレーム選 択が行われる。重要情景検出は、情景の変化、即ち“カット”を識別する(ビデ オカット検出又は区分検出)と共に、静止情景を識別する(静止情景検出)よう な処理である。各情景に関して、キーフレームと呼ばれる特に代表的なフレーム が抽出される。キーフレームフィルタリング及び選択処理がビデオテープのよう な源ビデオの各キーフレームに適用されて、選択的に選ばれたキーフレームから 可視索引を作成する。源テープが参照されるが、明らかに源ビデオはファイル、 ディスク、DVD又は他の記憶装置からのものでよく、又は伝送源(例えば、ホ ームビデオを記録中の)から直接のものでもよい。 ビデオテープ索引付けにおいては、通常、索引は源テープに記憶される。ビデ オCD、DVD、又は他の記憶装置から、又は放送ストリームからのMPEG1 、MPEG2、MPEG4、動画JPEGファイル又は何らかの他のビデオファ イルのビデオ索引付けにおいては、索引はハードディスク又はその他の記憶媒体 に記憶することができる。 第1図には、オーディオ及び/又はビデオを含むであろうような以前に記録さ れた源ビデオを伴う源テープ用のビデオ保管処理を示している。尚、MPEGフ ァイルのような以前に待避された可視情報を伴う他の記憶装置に対しても同様の 処理がとられるであろう。この処理においては、可視索引は源ビデオに基づいて 作成される。使用者が記録をしようとしている源テープに関しては、第2の処理 が該記録と同時に可視索引を作成する。 第1図は、ビデオテープ用の第1の処理(以前に記録された源テープ用)の一 例を示している。ステップ101において、もし必要なら、源ビデオはVCRの ような再生/記録装置により巻き戻される。ステップ102において、上記源ビ デオは再生される。この源ビデオからの信号はテレビジョン、VCR又は他の処 理装置により入力される。ステップ103においては、当該処理装置内の媒体プ ロセッサ又は外部プロセッサが上記ビデオ信号を入力し、該ビデオ信号をピクセ ルデータを表すフレームにフォーマットする(フレームグラッビング)。 ステップ104において、ホストプロセッサは各フレームをブロックに分解し 、これらブロック及びそれらに関連するデータを変換してDCT(離散コサイン 変換)係数を生成し;重要情景検出及びキーフレーム選択を実行し;キーフレー ムを構築してデータ構造としてメモリ、ディスク又はその他の記憶媒体に記憶す る。 ステップ105においては、該源テープは始点まで巻き戻され、ステップ106 において該源テープは情報を記録するように設定される。ステップ107におい ては、前記データ構造が前記メモリから該源テープに伝送され、可視索引を生成 する。次いで、該テープは、この可視索引を見るように巻き戻されてもよい。 使用者が記録中にテープ上に可視索引を作成しようと欲する場合は、上記処理 は僅かに変更される。ステップ101及び102に代えて、第1図のステップ1 12に示すように、ビデオ(映画等)が記録されるにつれて、ステップ103の フレームグラッビング処理が行われる。 加えて、もし上記テープ又はファイルが一度に完全に記録されない場合は、部 分的に作成されたビデオ索引が上記テープ等に待避されるか又は後の追加のため にテープメモリに待避される。 ステップ103及び104が、第2A図及び第2B図にもっと詳細に示されて いる。ビデオはアナログの形態(連続データ)又はデジタルの形態(離散データ )の何れかで存在する。本例は、デジタル領域で動作し、従って処理にはデジタ ルの形態を用いる。このように、源ビデオ又はビデオ信号は、表示された一連の 画像が連続的な画像の流れとして現れるように十分に高いレート(本例では毎秒 30フレーム)で表示されるような一連の個別の画像又はビデオフレームである 。これらのビデオフレームは非圧縮のもの(NTSC若しくは生のビデオ)、又 はMPEG、MPEG2、MPEG4、動画JPEG等のフォーマットの圧縮さ れたデータとすることができる。 ートビデオレコーダIII内にあるようなフレームグラッビング技術を用いて、先 ずフレームに区分化される。他のフレームサイズも利用可能であるが、第3図に 示す本例では、フレーム302は1つのテレビジョン、ビデオ又は他の可視画像 を表し、352x240のピクセルを含んでいる。 フレーム302は、各々、ホストプロセッサ210(第2A図)内で、本例で は8x8ピクセルのブロック304に分解される。これらのブロック304及び 通常の放送規格(CCIR-601)を用いて、マクロブロック作成器206(第2 A図)は輝度ブロックを作成すると共に、カラー情報を平均して色ブロック (chrominance blocks)を作成する。これら輝度及び色ブロックはマクロブロッ ク308を形成する。当業者であれば4:1:1及び4:2:2等の他のフォーマットを容 易に使用することもできるが、本例では、4:2:0が使用される。4:2:0においては 、マクロブロック308は6個のブロック、即ち4つの輝度Y1、Y2、Y3、 Y4及び2つの色Cr及びCbを有し、マクロブロック内の各ブロックは8x8 ピクセルである。 該ビデオ信号は、例えば動画JPEG(Joint Photographic Experts Group) 及びMPEG(Motion Pictures Experts Group)のような圧縮規格を用いて圧 縮された画像を表すこともできる。該信号が、代わりに、MPEG信号又は他の 圧縮された信号である場合は、第2B図に示すように、このMPEG信号はフレ ーム解析器205によりフレーム又はビット流解析技術を用いてフレームに分解 される。これらフレームは、次いで、媒体プロセッサ203内のエントロピデコ ーダ214とテーブル指定器216とに送出される。エントロピデコーダ214 は、上記MPEG信号をテーブル指定216からのデータを用い、例えばハフマ ンデコーディング又は他のデコーディング技術を用いてデコードする。 デコードされた信号は次に逆量子化器(dequantizer)218に供給され、該 逆量子化器は上記のデコードされた信号をテーブル指定器216からのデータを 用いて逆量子化する。媒体プロセッサ203内で行われるように図示されている が、これらステップ(ステップ214ないし218)は、使用される装置に応じ て媒体プロセッサ203、ホストプロセッサ211又は他の外部装置の何れかで 行われてもよい。 他の例として、システムが(例えば、媒体プロセッサ内に)当該処理の異なる 段階へのアクセスを可能とするような符号化能力を有している場合は、前記DC T係数はホストプロセッサに直接供給することもできる。これらの全ての方法に おいて、処理はリアルタイムでまで実行することができる。 第1図のステップ104において、ホストプロセッサ210(例えば、インテイメディアTMチップ又は他の何れかのマルチメディアプロセッサ;コンピュータ ;9高性能化VCR、記録/再生装置若しくはテレビジョン;又は何れかの他の プロセッサ)は、重要情景検出、キーフレーム検出、並びにデータ構造の構築及 び例えばハードディスク、ファイル、テープ、DVD又は他の記憶媒体等の索引 メモリへの記憶を実行する。 重要情景検出: 自動的な重要情景検出のため、本発明は、何時ビデオの情景が変化したか又は 静止情景が発生したかを検出するよう試みる。情景は1以上の関係した画像を表 す。重要情景検出においては、2つの連続するフレームが比較され、もし、これ らフレームが大幅に相違すると判定されたら、これら2つのフレームの間で情景 変化が生じたと判定され、大幅に類似していると判定されたら、静止情景が生じ たか否かを判定する処理が実行される。 各情景からは、当該情景を表すために1以上のキーフレームが抽出される。典 型的には、現動作原理は1つの情景内の最初のビデオ(可視)フレームを使用す ることを提案する。しかしながら、多くの場合、1つの情景内の主要な題材又は 事象はカメラがズーム又はパンされた後に発生する。加えて、現原理は典型的に は幾らかの時間長の間一定のままである情景(静止情景)は検出しない。しかし ながら、該情景に費やされる時間長に基づき、これは撮影者、監督等の視点から は、重要な情景であったかもしれない。本発明はこれら問題に配慮する。 本発明の各々は、DCT(離散コサイン変換)係数の比較を利用する。先ず、 入力された各フレーム302はホストプロセッサ210において個別に処理され 、マクロブロック308を作成する。ホストプロセッサ210は、空間情報を含 む各マクロブロツク308を離散コサイン変換器220を用いて処理することに よりDCT係数を抽出し、DCT係数の6個の8x8ブロック440(第4図) を作成する。 入力されるビデオ信号がMPEGのような圧縮されたビデオフォーマットであ る場合は、DCT係数は逆量子化の後に取り出され、離散コサイン変換器により 処理される必要はない。加えて、前述したように、DCT係数は使用される装置 に応じて自動的に抽出することもできる。 DCT変換器は、ブロック440(第4図)の各々Y1、Y2、Y3、Y4、 Cr及びCbにDCT係数値を与える。この規格によれば、各ブロックの最左上 隅はDC情報(直流値)を含み、残りのDCT係数はAC情報(交流値)を含む 。これら交流値の周波数は、上記直流値の右から該直流値の丁度下のDCT係数 へと、第4図に部分的に示すようにジグザグに増加する。 本発明は幾つかの異なる重要情景検出方法を使用することができるが、これら の方法の全てが各ブロックに対してDCT係数を用いる。ホストプロセッサ21 0は、更に、重要情景プロセッサ230(第2A図)において上記マクロブロッ クの各々を、以下の方法の少なくとも1つを用いて処理する。 下記の方法においては、一層速く結果を作成するため及び効率の大幅な損失無 しに処理を制限するために、処理は上記直流値のみに制限される。しかしながら 、当業者であれば、明らかに、マクロブロックの各々に関してDCT係数の全て を処理することができる。各ブロックを介しこれらのステップを用いてループさ せることにより、DCT係数の全てを解析することができる。もっとも、これは 処理に要する時間に影響する。 方法1: ここで、 kはフレーム幅方向のマクロブロックの数で、k=1ないしフレーム幅/16 、 jはフレーム高さ方向のマクロブロックの数で、j=1ないしフレーム高さ/ 16、 iはマクロブロック内のブロックの数で、i=1ないしマクロブロック内のブ ロック数、 DCT1k,j及びDCT2k,jは、第5図に示すように、前ビデオフレーム及び 現ビデオフレームの各々の特定のマクロブロックに関するDCT係数、 ABSは絶対値関数である。 本例では、352x240ピクセルのフレームに対して、k=1ないし22、 j=1ないし15,及びi=1ないし6である。本方法及び以下の方法では、フ レームのマクロブロック幅又はフレームのマクロブロック高さは偶数整数である とする。何故なら、フレームサイズが一様に見えない場合は、フレームサイズは 処理中に合うように縮小拡大されるからである。 方法1は、マクロブロックのブロック(4つの輝度ブロック及び2つの色ブロ ック)の各々の区別をつける。この方法では、現フレームからの現マクロブロッ クにおける各輝度及び色ブロックに関する直流値が、前ビデオフレームにおける 対応するブロックに関する対応する直流値から各々減算される。各差分の別個の 和SUM[i]が、当該マクロブロック内の各輝度及び色ブロックに関して保持される 。 差分の和は次のマクロブロックに繰り越され、対応する差分に加算される(SU M[1],SUM[2],・・・,SUM[6])。現ビデオフレームのマクロブロックの各々を処 理した後、現ビデオフレームの各輝度ブロック及び各色ブロックに関して累算さ れた差分が得られる。これら6個のSUMの各々は、当該SUMが合計されたブロック の形式に特有の自身の上限及び下限敷居値と比較される。この方法はブロックの 各形式について異なる敷居値比較を可能にする。 SUM[i]が所定の敷居値(thresh1[i])、ここで本例では、 より大きいと、現ビデオフレームは更なる処理及び可視索引中での可能性のある 使用のために、フレームメモリに待避される。このフレームメモリは本発明にお けるようにテープ、ディスクであってもよく、又は本システムの外部若しくは内 部の如何なる他の記憶装置であってもよい。 SUM[i]が所定の敷居値(thresh2[i])、ここでは、より小さいと、多分静止情景であることを示すために、静止情景カウンタ(SSct r)が増加される。前ビデオフレームが一時メモリに待避される。本発明におい ては、上記一時メモリは1個のみのフレームを待避し、従って上記前フレームは 該一時メモリに現在記憶されている何れのビデオフレームも置換するであろう。 上記カウンタが所定数(本例では、例えば30)に到達すると、上記一時メモリ 内に待避された最前の(most previous)ビデオフレームが、可視索引での可能 性のある使用のためにフレームメモリに転送される。本発明においては、最終フ レームの1つ前のフレームが静止情景を多分示すために待避されるが、明らかに 、当業者であれば該方法及び以下の方法において可能性のある静止情景の第1フ レームを待避し使用することもできる。 SUM[i]が前記2つの敷居値の間である場合は、SSctrは零にリセットされ、次 の連続するフレームが比較される。 方法2: ここで、 kはフレーム幅方向のマクロブロックの数であり、k=1ないしフレー ム幅/16、 jはフレーム高さ方向のマクロブロックの数であり、j=1ないしフレ ーム高さ/16、 iはマクロブロック内のブロックの数であり、i=1ないしマクロブロ ック内のブロックの数、 DCT1k,j,i及びDCT2k,j,iは、前ビデオフレーム及び現ビデオフレームの 各々の特定のマクロブロック及びブロックのDCT係数であり、 ABSは絶対値関数である。 方法1とは対照的に、方法2はブロック形式の間の区別はつけない。代わりに 、方法2は現ビデオフレームと前ビデオフレームとのマクロブロックの間の直流 差分のランニング合計を保持する。 ブロック間の各差分が自乗され、次いで現ブロックのDCT値に対して正規化 される。即ち、現ビデオフレームからのブロックのDCT値が、前ビデオフレー ムにおける対応するブロックの対応するDCT値から減算される。次いで、この 差分は自乗され、現ビデオフレームの対応するDCT値により除算される。もし 、現ビデオフレームのDCT値が零である場合は、この比較のための和は1に設 定される。フレームのマクロブロックの各々における各ブロックのDCT値の各 々に関する差分は総和されて合計値SUMを得る。 次に、上記SUMは所定の敷居値と比較される。本例において、もし、SUMが所定 の敷居値(thresh1)、 より大きい場合は、現ビデオフレームが更なる処理及び可視索引での可能性のあ る使用のためにフレームメモリに待避される。 本例において、もし、SUMが所定の敷居値(thresh2)、 より小さい場合は、静止情景カウンタ(SSctr)が可能性のある静止情景を示す ために増加される。方法1におけるのと同様に、前ビデオフレームが、最前(mo st previous)のフレームのみを待避する一時メモリに待避される。SSctrが所定 数(本例では、例えば30)に到達すると、上記一時メモリ内に待避された最前 のビデオフレームが、可視索引での可能性のある使用のためにフレームメモリに 転送される。 もし、SUMが上記2つの敷居値の間である場合は、SSctrは零にリセットされ、 次の連続したフレームが比較される。 方法3:ここで、 kはフレーム幅方向のマクロブロックの数であり、k=1ないしフレー ム幅/16、 jはフレーム高さ方向のマクロブロックの数であり、j=1ないしフレ ーム高さ/16、 iはマクロブロック内のブロックの数であり、i=1ないしマクロブロ ック内のブロックの数、 DCT1k,j及びDCT2k,jは、前ビデオフレーム及び現ビデオフレームの各々 の特定のマクロブロックのDCT係数であり、 ABSは絶対値関数である。 方法3は方法1と同様に、マクロブロックのブロック(4つの輝度ブロック及 び2つの色ブロック)の各々の間の区別を行う。この方法においては、現ビデオ フレームからの現マクロブロックにおける各輝度及び色ブロックに関する直流値 が、前ビデオフレームにおける対応するブロックに関する対応する直流値から減 算される。しかしながら、方法2におけるのと同様に、ブロック間の各差分は自 乗され、現ブロックのDCT値に対して正規化される。即ち、現ビデオフレーム から のブロックのDCT値が前ビデオフレームにおける対応するブロックの対応する DCT値から減算される。次いで、この差分は自乗され、現ビデオフレームの対 応するDCT値により除算される。もし、現ビデオフレームのDCT値が零であ る場合は、該比較の和は1に設定される。 マクロブロックの各々における各形式のブロックのDCT値の各々に関する差 分は累算されて、当該形式のブロック用の合計値SUM[i]月が得られる。差分の別 個の和SUM[i]は、マクロブロック内の輝度及び色ブロックの各々に対して保持さ れる。これらの差分の和は、次のマクロブロックに繰り越され、対応する差分に 加算される(SUM[1],SUM[2],・・・,SUM[6])。現ビデオフレームのマクロブロ ックの各々を処理した後、現ビデオフレームの各輝度ブロック及び各色ブロック に関して累算された差分が得られる。これら6個のSUMの各々は、当該SUMが合計 されたブロックの形式に特有の自身の上限及び下限敷居値と比較される。この方 法はブロックの各形式について異なる敷居値比較を可能にする。 SUM[i]が所定の敷居値(先に定義したようなthresh1[i])より大きいと、現ビ デオフレームは更なる処理及び可視索引中での可能性のある使用のために、フレ ームメモリに待避される。 SUM[i]が所定の敷居値(先に定義したようなthresh2[i])より小さいと、可能 性のある静止情景であることを示すために、静止情景カウンタ(SSctr)が増加 される。前ビデオフレームは、本発明においては最前の(most previous)ビデ オフレームのみを待避するような一時メモリに待避される。上記SSctrが所定数 (30)に到達すると、上記一時メモリ内に待避された最前のビデオフレームが 、可視索引での可能性のある使用のためにフレームメモリに転送される。 SUM[i]が前記2つの敷居値の間である場合は、SSctrは零にリセットされ、次 の連続するフレームが比較される。 方法4: 方法1ないし3は、各々、完全なビデオフレームに対して作用し、個々の成分 として総和又は累算される全ての輝度及び色に対してDCT値に関する差分又は 差分の自乗の何れかの和をとる。方法4はマクロブロックのレベルで作用し、限 られた処理で十分な結果をもたらす。 ここで、 kはフレーム幅方向のマクロブロックの数であり、k=1ないしフレー ム幅/16、 jはフレーム高さ方向のマクロブロックの数であり、j=1ないしフレ ーム高さ/16、 iはマクロブロック内のブロックの数であり、i=1ないしマクロブロ ック内のブロックの数、 HB1k,j及びMB2k,jは、各々、前ビデオフレーム及び現ビデオフレームに 関するマクロブロック、 Mbdiffは、2つのマクロブロックの間で互いに相違するブロックの数を 決定し、この差が或る敷居値より大きい場合は第1の値を出力し、それ以 外の場合は第2の値を出力するような関数である。 詳細には、特定のマクロブロックのブロック(Y1、Y2、Y3、Y4、Cr 及びCb)の各々に関して、第1のマクロブロックの各ブロックと第2のマクロ ブロックの対応するブロックとを比較し、部分和subsum[i]を得ることにより、 部分和(subsum[1],subsum[2],・・・,subsum[6])が決定される。ここで、 subsum[i]j,k=ABS(DCT1[i]j,k-DCT2[i]j,k)である。 例えば、現フレームの第1マクロブロックのCrの直流値が前フレームの第1 マクロブロックのCrの直流値から減算され、subsum[Cr]1,1を得る。各subsum[ i]は所定の敷居値(th1)と比較される。もし、本例において、上記subsum[i]が 本例においては、 th1=0.3*subsum[i] であるような第1の所定の敷居値(th1)より大きい場合は、ブロックカウンタ (B1ctr)がインクリメントされ、一方、もし本例では、 th2=0.02*subsum[i] なる所定の第2敷居値(th2)より小さい場合は、ブロックカウンタ(B2ctr)が インクリメントされる。各subsum[i]は上記敷居値(th1及びth2)と比較される が、該敷居値は定数(又は複数の定数)であるか、固定の関数(又は複数の関数 )に基づくものであるか、又はブロックの形式に特有の関数(又は複数の関数) 若しくは定数(複数の定数)に基づくものとすることができる。 マクロブロックの6個のブロックが処理された後、上記ブロツクカウンタが解 析される。もし、本例で、ブロックカウンタB1ctrが本例では3であるような所 定の敷居値(B1th)より大きい場合は、当該マクロブロックは前ビデオフレーム の対応するマクロブロックとは異なると見なされ、マクロブロックカウンタMB1c trがインクリメントされる。この場合、前記B1ctrはリセットされ、次のマクロ ブロックが解析される。 1つのビデオフレームの全マクロブロックが処理されると、MB1ctrは所定のフ レーム敷居値と比較される。もし、本例では352x240のフレーム(又は画 像)を用いているMB1ctrが、100なる第1の所定のフレーム敷居値(f1th)よ り大きいと、現フレームがフレームメモリに待避され、MB1ctrはリセットされる 。 マクロブロック内の幾つかの数のブロックが類似しており、B2ctrが3なる所 定の敷居値(B2th)より大きいと、当該マクロブロックは同一であるとみなされ 、第2マクロブロックカウンタMB2ctrはインクリメントされる。この場合、B2ct rはリセットされ、次のマクロブロックが解析される。1つのフレームの全マク ロブロックが解析され、もし、第2マクロブロックカウンタが250なる第2の 所定のフレーム敷居値(f2th)より大きい場合は、ビデオフレームは同一である とみなされ、フレームカウンタ(Fctr)はリセットされる。MB2ctrはリセットさ れ、次のフレームが解析される。Fctrが所定の敷居値(SSthresh、本例では30 )に到達すると、静止系列が発生したと推定される。この場合、該静止系列を表 すために、前ビデオフレームがフレームメモリに待避される。この処理は、ビデ オフレームが前ビデオフレームとは相違すると判定されるか、又は新たなフレー ムが使い尽くされるまで継続する。この場合、Fctrはリセットされ、次のビデオ フレームが解析される。 この方法及び前記方法においてフレームメモリ内に待避されるフレームは、キ ーフレームであると見なされる。 方法4は、差分の正規化された自乗を用いて実施することもできる。即ち、ブ ロック間の差を単に使用するのに代えて、該差は自乗されると共に、減算された ブロック内で見いだされる値により除算される。この場合、情景カット検出は敷 居に対してより敏感ではなくなる。 以下に述べるキーフレームフィルタリングは、各フレームが重要情景検出過程 の下で処理される際に、又は全フレームが処理された後に、実施することができ る。加えて、上述した敷居値はより小さな又はより大きな検出を得るように容易 に変化させることができる。例えば、0.3においては0.02と同様に容易に他 の値に変更することができ、又は常数はより高い又はより低い効率を可能とする よう変化させることができ、例えばSSctrは異なってもよい。更に、各敷居は代 わりに常数、固定関数、又は解析されているブロックの形式若しくは位置により 可変な関数とすることもできる。 キーフレームフィルタリング: 本発明においては、フレームメモリに待避されるキーフレームの数を、繰り返 しのフレーム及び他の選ばれた形式のフレームをフィルタリング除去することに より減少させるために、キーフレームフィルタリング方法が使用される。キーフ レームフィルタリングは、ホストプロセッサ210内のキーフレームフィルタ器 240により、重要情景検出(第2A図及び第2B図)の後に実行される。重要 情景検出処理の間は、例えば記録されたビデオの時間当たり2000キーフレー ムのような膨大な数のキーフレーム(選択されたフレーム又は画像)が抽出され る可能性があり、これは使用者により扱うにはしばしば数が多過ぎる。しかしな がら、使用者の見通しからでは、重要情景検出において選択された全てのキーフ レームが当該ビデオの可視内容を伝達するのに重要又は必要であるというのでは ない。例えば、会話シーンにおいては、話し手は数回見られそうである。本発明 は、斯かる会話シーンに関しては話し手当たり1つのフレームのみの保持を可能 とする。 第6A図及び第6B図は、キーフレームフィルタリングの手順の概略である。 第6A図のステップ602ないし606に示すように、フレーム内の各ブロック に関してブロック記号(block signature)が導出される。ブロック記号700 は本例では8ビットであり、第7図に示すように、そのうちの3ビツトは直流記 号 702を表し、5ビットは交流記号704を表す。1つのブロック内の直流値以 外の全ての他のDCT係数は交流値である。 上記直流記号は、直流値を抽出し(ステップ602)、該直流値が特定の範囲 内の値(本例では、-2400ないし2400)の何処にあるかを判定する(ステップ6 04)ことにより導出される。該範囲は、第7図に示すように、所定の数の区間 に分割される。本発明においては、8つの区間が使用されている。もっとも、画 像のもっと高い又は低い細分性のために、もっと多い又は少ない区間を使用する こともできる。 各区間には、第7図に示すような予め規定されたマッピングが割り当てられる 。各直流値は上記範囲と比較され、当該直流値がある区間用のマッピングが返送 される。必要とされるビットにより表される値は、区間の数に相当する。本例で は、上記範囲は8つの区間に分割されているので、3個のビットが使用される。 かくして、第7図に示すようにブロック記号700は直流記号702を最初の3 ビットとして含み、交流記号704を残りの5ビットとして含む。 第6A図のステップ604では、当該ブロックの交流値の範囲を良好に表すた めに、第7図に示すように、直流値に最も近い5つの交流値(A1ないしA5) が抽出される。ステップ606におて、上記5つの交流値の各々が本例では20 0である敷居値(ACthresh)と比較され、もし、当該交流値が該敷居値ACthresh より大きい場合は、当該交流記号706内の対応するビットが1のような所定の 値に設定され、上記敷居値ACthresh以下の場合は、対応するビットは零に設定さ れる。 このようにしてブロック記号700が得られ、これらブロック記号を用いて、 例えば単色であるフレームのような特定の画像又はフレームを可視索引からフィ ルタリング除去することができる。 単色フレームをフィルタリング除去する素早い方法が、直流記号のみを頼りと してステップ602ないし604の間でなされる。各直流記号704が比較され 、発生する各特定の直流記号について計数が保持される(ステップ660)。即 ち、各直流記号は当該直流値が何の区間にあるかを示すから、本例では、8個の 異なる直流記号が存在する。例えば、90%のブロック、即ち1782個のブロック (0.9*330マクロブロック*6ブロック)が同一の区間にある(同一の直流記号 を有する)場合は、当該画像は単色であると見なされ(ステップ662)、当該 フレームは捨てられるか又はフレームメモリからフィルタリング除去される(ス テップ664)。他の例として、別個の計数が各形式のブロック(Cr、Cb、・・・ )に対して保持され、これら別個の各計数が対応する敷居値と比較されるよ うにしてもよい。 フレーム内の各マクロブロックの各ブロックについてブロック記号(Blk_sig )を導出した後、領域が判定される。領域は、本例では、各々が当該領域内の少 なくとも1つの他のブロックに隣接し、且つ、当該領域内の該他のブロックと同 様のブロック記号を共有するような2以上のブロックである。タイミングを減少 するのが望ましい場合は、領域を規定するのに、もっと多くのブロックが必要と なる。当該フレームの各ブロック記号が他の各ブロック記号と比較され、領域を 判定するために計数されるようにすることもできるが、本発明は、フレーム内の 領域を判定するために領域成長方法(region growing process)のような既知の 技術を使用する(ステップ608)。 上記領域成長方法の間には、各領域に対して1つの領域カウンタが領域内のブ ロック数(サイズ:size)を計数すべく保持され、16ビットにより表される。 領域を見つけるために一旦フレーム全体が解析されたら、各領域の重心又は中心 を見つけるために他の既知の方法を使用することができ、該方法は本例ではx-y 軸基準に基づくものである(ステップ610)。x座標及びy座標の両方がCX 及びCYとして各々抽出され、16ビットにより表される。この場合、各領域に は領域記号Region(Blk_sigr,sizer,CXr,Cyr)が割り当てられ、ここでrは領 域番号である。当該領域用のブロック記号は、前記領域成長方法により判定され た最も支配的なブロック記号に基づいて決定される。 特定の評価基準(本例では、増加するサイズ)に基づいて、領域が並び替えら れ、領域フィルタリングが実行される(ステップ612)。本例においては、最 大の3つの領域を除く全ての領域はフィルタ除去される。これら残りの3つの領 域は、当該フレームを表すフレーム記号に組み込まれる。フレーム記号は、本例 では、168ビットにより表され、(Region1,Region2,Region3)なる形態、 詳 細には(Blk_sigl,size1,CX1,CY1,Blk_sig2,size2,CX2,CY2,Blk_sig3,s ize3,CX3,CY3)なる形態である。 第6B図に示すように、フレーム比較手順は現フレーム(F2)と前フレーム (F1)とを、それらの各フレーム記号に基づいて比較する(ステップ616) 。本例では、各Region1が比較され、次いで各Region2が比較され、最後に各Regi on3が比較される。即ち、各領域のブロック記号が以下に従って比較される。 FDiff=ABS(size1F1−size1F2)+ABS(size2F1-size2F2)+ABS(size3F1-siz e3F2) FDiffが10未満の場合は、フレームは類似であると見なされ、更なる対象物処 理がなされる(ステップ620)。FDiffが10以上の場合は、フレームは相違 すると見なされ、該手順の下では何れのフレームもフィルタされない。 領域は、通常、物体、人、物等の“対象物”を表している。対象物処理は、領 域内に見られる対象物が前フレームにおいて同一の位置又は非常に接近した近傍 にあるかを判定する。本例では、該対象物は当該フレームの重要な焦点であるか 又はより重要な焦点の1つである。例えば、ビデオはボールで遊んでいる子供に 焦点を当てているかもしれず、その場合ボールは当該フレーム内で移動する。使 用者が、可視索引内のフレームの数を、画像内の何処に対象物があるかを気にし ない、ように制限したいと欲する場合は(ステップ622)、この時点で、F2 、即ち現フレームはフレームメモリからフィルタ除去される(ステップ624) 。 使用者が、対象物がフレーム内の何処にあるかを気にし、同一の又は非常に接 近した近傍に見られる対象物を有するようなフレームのみをフィルタしたい場合 は、幾つかの方法を使用することができる(対象物フィルタ、ステップ626) 。 第1の方法は、以下に示すように、中心を、それらのユークリッド距離を判定 することにより比較する。即ち、 Edist=SQRT[(CXIF1-CX1F2)2+(CY1F1-CY1F2)2]+SQRT[(CX2F1-CX2F22+ (CY2F1-CY2F2)2]+SQRT[(CX3F1-CX3F2)2+(CY3F1-CY3F2)2] もし、Edistが3より大きい場合は、当該対象物は移動したと推定され、フィ ルタリングは実行されない。もし、Edistが3以下である場合は、当該対象物は 略同じ位置に留まっていたと推定され、従って現フレームはフィルタ除去される 。 対象物フィルタリングの第2の方法は、フレームをマクロブロックを用いて比 較する。即ち、各マクロブロック内の各ブロックのブロック記号が比較される。 例えば、現フレーム(F2)のMB1,1(フレームの位置1,1のマクロブロック) のY1ブロックのブロック記号が、前フレーム(F1)のMB1,1のY1ブロッ クのブロック記号比較される。 先ず、上記Y1ブロックの直流記号が比較される。もし、直流記号が一致した ら、交流記号がビット毎に比較される。計数値(ACcount)が保持され、もし、 所定のビット数(本例では5ビットのうちの4つ)が一致した場合は、ブロック カウンタ(BlkCTR)がインクリメントされる。もし、直流記号が一致しない場合 、又はACcountが4未満の場合は、次のブロックが解析される。 マクロブロックの各ブロックが(本例では、4:2:0、6個のブロックを用いて )解析される。1つのマクロブロック内の全ブロックが解析されたら、ブロック カウンタがチェックされる。もし、BlkCTRが4以上であったら、これらブロック は類似であると見なされ、マクロブロックカウンタ(MBCTR)が増加される。 画像中の全マクロブロックが一旦解析されると、MBCTRがチェックされる。も し、MBCTRが本例ではフレーム内のマクロブロックの75%(247マクロブロ ック、即ち0.75*330マクロブロック)以上であると、当該フレームは類似して いると見なされ、現フレーム(F2)がフレームメモリからフィルタ除去される 。もし、MBCTRが75%未満であると、この時点ではフレームはフィルタされな い。 単色のフレームをフィルタ除去する付加的な方法は、領域サイズが判定される 場合になされる。領域サイズがフレームブロックの90%、即ち1782ブロッ ク以上であると、当該フレームは単色であると見なされ、フレームメモリからフ ィルタされる。このフィルタリングは、上述した単色フレームフィルタリング方 法よりも多くの処理を要する。 前記キーフレーム記号に基づいて、キーフレームがフィルタ除去され、使用者 により最も望まれると思われるものだけを保持する。異なる敷居値を用いること により、フィルタ除去されるキーフレームの数は増加又は減少させることができ る。 キーフレームフィルタリング処理においては、源ビデオ中のコマーシャルの存 在が、通常、判定される。本発明は、使用者が、コマーシャルからのキーフレー ムが可視索引の一部として含められるべきか、又は、それらキーフレームは除外 されるべきかを選択することを可能にする。 コマーシャルの存在は、通常、時間単位当たりのカット数が大きいことにより 示される。しかしながら、アクション映画も時間単位当たり多数のキーフレーム を伴う長いシーンを有している場合がある。より信頼性のあるコマーシャル分離 を行うために、源ビデオ内でのキーフレームの全分布が解析され、コマーシャル を伴う区画の頻度及び可能性を推定するよう試みる。 コマーシャルは、典型的には、テレビジョン番組の間に一定の間隔で、例えば 30分の連続コメディの間の5ないし10分毎に、分散されている。コマーシャ ルの持続時間は典型的には1ないし2分である。コマーシャルは、何時、分当た り多数のキーフレームが発生するかを判定することにより分離される。即ち、各 キーフレームの相対時間が他のキーフレームと比較される。 前記重要情景検出処理の間において、或るフレームがキーフレームとしてフレ ームメモリに待避される際、対応するフレーム番号が、例えばその発生の相対時 間を示す時間コード、即ちタイムスタンプに変換される。全てのキーフレームが 抽出された後、キーフレーム密度が最後の1分の間に関して計算される、ここで 、 L1=最後の分のキーフレーム密度=最後の分におけるキーフレームの 数/1800 また、キーフレーム密度が最後の5分に関しても計算される。ここで、 L5=最後の5分のキーフレーム密度=最後の5分におけるキーフレー ムの数/9000 本例では3であるような常数に関し、L1>(L2*常数)であると、コマーシ ャル中断である可能性が示される。最後に示されたコマーシャル中断の最後のキ ーフレームのタイムスタンプが5分より大きい場合は、現在のコマーシャル中断 が示され、最後の1分の全キーフレームがフレームメモリからフィルタされる。 ビデオ検索: 一旦ビデオテープ又はビデオファイルが可視索引を有すると、使用者は該可視 索引にアクセスしたいと欲するであろう。ビデオ検索処理は、上記可視索引を使 用者に対して利用可能な形態で表示する。使用者は該可視索引を介して検索(ブ ラウズ)し及びナビゲートし、源テープ又はMPEGファイル上の選択した点に 向かって高速順方向送りをする。第8図は、この検索処理を詳細に示している。 ステップ802において、源ビデオは、もし必要なら、例えばVCR又は再生 装置により可視索引の位置(本例ではテープの始点)まで巻き戻される。もし、 上記源ビデオがMPEGファイル又はディスク上にあるなら、ポインタが記憶位 置の始点を指し示し、巻き戻される必要はないであろう。同様にして、他の記憶 手段は可視索引の始点に適切に設定される。 ステップ804において、上記可視索引は上記源ビデオからVCRヘッド、コ ンピュータ又は他のハードウェア装置により読み取られ、索引メモリに待避され る。この索引メモリは如何なる形式の記憶装置であってもよい。ステップ806 においては、例えば上記VCRのプロセッサが、上記源ビデオの索引メモリから キーフレームを取り出す。また、ステップ806においては、取り出された上記 キーフレームが本例では120x80ピクセルにサイズを減少させるよう処理さ れる。もっとも、他のフレームサイズも自動的に又は使用者により手動で選択す ることができる。 次いで、上記の処理されたフレームはステップ808において前記ホストプロ セッサ210に転送される。該ホストプロセッサは、処理された上記キーフレー ムを表示メモリに書き込み、それらをコンピュータディスプレイ、テレビジョン 画面等のユーザインターフェースに表示する。 ステップ810において、源ビデオは上記ビデオ索引が一旦読み取られると停 止される。ビデオ索引付けシステム又はソフトウェアが、ステップ812におい て、キーフレームをコンピュータモニタ又はテレビジョン画面のようなディスプ レイ上に表示されるようにする。ステップ814においては、使用者が望めば、 上記可視索引は印刷される。使用者は、ステップ816に示すように、可視索引 から特別なキーフレームを選択することもできる。使用者が源ビデオを、この特 別なキーフレームで見たいと欲するなら、源テープは該源テープ上の対応する位 置まで自動的に順方向送りされ、その位置からキーフレームが取り出され、該源 テープは再生される(ステップ818)。他の例として、カウンタが表示され、 使用者に該源ビデオを通して順方向送りするのを可能にするか、又は源ビデオを 該可視索引から上記選択されたキーフレームまで再生するのを可能にする。 本発明は、前記重要情景検出処理を削除し、キーフレームフィルタリングだけ を実施するようにしてもよい。しかしながら、処理は現在広く利用可能なプロセ ッサを用いたのでは大幅に遅くなるであろう。 付加的な特徴によれば、使用者は如何なる点でもビデオテープの再生を停止し 、当該ビデオテープ用の可視索引にアクセスすることが可能となる。これには、 1つのセッションの間にビデオテープが最初に使用される時に可視索引を記憶す るメモリ又はバッファを必要とするであろう。 本発明はDCT係数を用いて示されている。しかしながら、波長係数、又は画 像の副領域に作用して該副領域に関する代表的値を与える関数のような代表的値 を代わりに使用することもできる。これは、重要情景検出及びキーフレームフィ ルタリングに使用することができる。 本発明を好ましい実施例に関して説明したが、上記に概要を述べた原理の範囲 内における変形例は当業者にとっては明らかであり、本発明は上述した好ましい 実施例に限定されることなく、これら変形例をも含むことを意図するものである と理解されたい。

Claims (1)

  1. 【特許請求の範囲】 1.源ビデオの重要な情景を検出しキーフレームを選択するシステムにおいて、 源ビデオをDCT係数のブロックを含むマクロブロック及びフレームとして 受信する受信器と、 マクロブロック内の各形式のブロックに対して: 但し、 kはフレーム幅方向のマクロブロックの数で、k=1ないしフレーム幅/ 16、 jはフレーム高さ方向のマクロブロックの数で、j=1ないしフレーム高 さ/16、 iはマクロブロック内のブロックの数で、i=1ないしマクロブロック内 のブロック数、 DCT1k,j及びDCT2k,jは、前フレーム及び現フレームの各々の特定 のマクロブロックに関するDCT係数、 ABSは絶対値関数、 に基づいて和を計算する累算器と、 第1敷居値と第2敷居値とを計算する敷居値計算器と、 各和SUM[i]を前記第1及び第2敷居値と比較し、SUM[i]が前記第1敷居値よ り大きい場合は現フレームをキーフレームとしてフレームメモリに待避し、前 記第2敷居値より小さい場合は静止情景カウンタをインクリメントすると共に 前フレームを一時メモリに待避し、それ以外の場合は前記静止情景カウンタを リセットするような第1比較器と、 前記静止情景カウンタを所定の数と比較し、前記一時メモリに待避された直 前のフレームを前記フレームメモリにキーフレームとして転送する第2比較器 と、 を有していることを特徴とする源ビデオの重要な情景を検出しキーフレームを 選択するシステム。 2.源ビデオの重要な情景を検出しキーフレームを選択するシステムにおいて、 源ビデオをDCT係数のブロックを含むマクロブロック及びフレームとして 受信する受信器と、 各マクロブロックに対して: 但し、 kはフレーム幅方向のマクロブロックの数で、k=1ないしフレーム幅/ 16、 jはフレーム高さ方向のマクロブロックの数で、j=1ないしフレーム高 さ/16、 iはマクロブロック内のブロックの数で、i=1ないしマクロブロック内 のブロック数、 DCT1k,j,i及びDCT2k,j,iは、前ビデオフレーム及び現ビデオフレ ームの各々の特定のマクロブロック及びブロックに関するDCT係数、 ABSは絶対値関数、 に基づいて和を計算する累算器と、 第1敷居値と第2敷居値とを計算する敷居値計算器と、 各和SUMを前記第1及び第2敷居値と比較し、SUMが前記第1敷居値より大 きい場合は現ビデオフレームをキーフレームとしてフレームメモリに待避し、 前記第2敷居値より小さい場合は静止情景カウンタをインクリメントすると共 に前ビデオフレームを一時メモリに待避し、それ以外の場合は前記静止情景カ ウンタをリセットするような第1比較器と、 前記静止情景カウンタを所定の数と比較し、前記一時メモリに待避された直 前のビデオフレームを前記フレームメモリにキーフレームとして転送する第2 比較器と、 を有していることを特徴とする源ビデオの重要な情景を検出しキーフレームを 選択するシステム。 3.源ビデオの重要な情景を検出しキーフレームを選択するシステムにおいて、 源ビデオをDCT係数のブロックを含むマクロブロック及びフレームとして 受信する受信器と、 マクロブロック内の各形式のブロックに対して: 但し、 kはフレーム幅方向のマクロブロックの数で、k=1ないしフレーム幅/ 16、 jはフレーム高さ方向のマクロブロックの数で、j=1ないしフレーム高 さ/16、 iはマクロブロック内のブロックの数で、i=1ないしマクロブロック内 のブロック数、 DCT1k,j及びDCT2k,jは、前フレーム及び現フレームの各々の特定 のマクロブロックに関するDCT係数、 ABSは絶対値関数、 に基づいて和を計算する累算器と、 第1敷居値と第2敷居値とを計算する敷居値計算器と、 各和SUM[i]を前記第1及び第2敷居値と比較し、SUM[i]が前記第1敷居値よ り大きい場合は現フレームをキーフレームとしてフレームメモリに待避し、前 記第2敷居値より小さい場合は静止情景カウンタをインクリメントすると共に 前フレームを一時メモリに待避し、それ以外の場合は前記静止情景カウンタを リセットするような第1比較器と、 前記静止情景カウンタを所定の数と比較し、前記一時メモリに待避された直 前のフレームを前記フレームメモリにキーフレームとして転送する第2比較器 と、 を有していることを特徴とする源ビデオの重要な情景を検出しキーフレームを 選択するシステム。 4.請求項1ないし3の何れか一項に記載のシステムにおいて、前記第1敷居値5.源ビデオの重要な情景を検出しキーフレームを選択するシステムにおいて、 源ビデオをDCT係数のブロックを含むマクロブロック及びフレームとして 受信する受信器と、 マクロブロック内の各形式のブロックに対して: 但し、 kはフレーム幅方向のマクロブロックの数で、k=1ないしフレーム幅/ 16、 jはフレーム高さ方向のマクロブロックの数で、j=1ないしフレーム高 さ/16、 iはマクロブロック内のブロックの数で、i=1ないしマクロブロック内 のブロック数、 MB1k,j及びMB2k,jは、各々、前ビデオフレーム及び現ビデオフレームに関 するマクロブロック、 Mbdiffは、2つのマクロブロックの間で互いに相違するブロックの数を決 定し、この差が或る敷居値より大きい場合は第1の値を出力し、それ以外の 場合は第2の値を出力するような関数、 に基づいて和を計算する累算器と、 を有し、前記累算器が、 各ブロックに関して部分和を計算する部分和計算器であって、部分和subsum [i]j,k=ABS(DCT1[i]j,k-DCT2[i]j,k)が成り立ち、且つ、DCT1j,k及びDCT2j,k が特定のマクロブロックに関するDCT係数であるような部分和計算器と、 各部分和を第1所定部分和敷居値と比較して、該第1所定部分和敷居値より 大きい場合に第1ブロックカウンタをインクリメントする一方、各部分和を第 2所定部分和敷居値と比較して、該第2所定部分和敷居値より小さい場合に第 2ブロックカウンタをインクリメントする部分和比較器と、 前記第1ブロックカウンタを比較して、第1所定ブロック敷居値より大きい 場合に第1マクロブロックカウンタをインクリメントすると共に、次のマクロ ブロックの解析のために前記第1ブロックカウンタをリセットする一方、前記 第2ブロックカウンタを比較して、第2所定ブロック敷居値より大きい場合に 第2マクロブロックカウンタをインクリメントすると共に、次のマクロブロッ クの解析のために前記第2ブロックカウンタをリセットするブロック比較器と 、 前記第1マクロブロックカウンタを比較して、該第1マクロブロックカウン タが第1所定フレーム敷居値より大きい場合に現フレームをフレームメモリに 待避すると共に、次のフレームの解析のために前記第1マクロブロックカウン タをリセットする一方、前記第2マクロブロックカウンタを比較して、該第2 マクロブロックカウンタが第2所定フレーム敷居値より大きい場合にフレーム カウンタをセットすると共に前記第2マクロブロックカウンタをリセットする マクロブロック比較器と、 前記フレームカウンタを所定情景敷居値と比較して、該所定情景敷居値より 大きい場合に、前フレームを前記フレームメモリにキーフレームとして待避す るフレーム比較器と、 を有していることを特徴とする源ビデオの重要な情景を検出しキーフレームを 選択するシステム。 6.ビデオ源からのフレームをフィルタするシステムにおいて、 フレームメモリ内のフレーム、及び一時メモリ内のDCT係数のブロックを 有するマクロブロックを入力する受信器と、 各ブロックに関してブロック記号を作成するブロック記号作成器と、 各フレームの領域及び各サイズを検出する領域成長器と、 各領域の中心を判定する中心判定器と、 各領域に当該領域内のブロックのブロック記号のうちの1つと、各サイズと 、中心とを割り当てる領域記号作成器と、 前記領域記号に基づいて第1フレーム用のフレーム記号を作成するフレーム 記号作成器と、 前記第1フレームを第2フレームと比較してフレーム差を決定すると共に、 該フレーム差に基づいて当該フレームを待避するか又は廃棄するフレーム比較 器と、 を有することを特徴とするビデオ源からのフレームをフィルタするシステム。 7.請求項6に記載のシステムにおいて、更に、当該フレームの主要焦点又は主 要焦点の1つと同じ対象物を有するフレームを前記フレームメモリからフィル タ除去する対象物フィルタを有していることを特徴とするシステム。 8.請求項6に記載のシステムにおいて、 各ブロックが直流値を含むDCT係数を有し、 前記ブロック記号が、各直流値があてはまる区間を表す直流記号を有してい る、 ことを特徴とするシステム。 9.請求項8に記載のシステムにおいて、更に、単色フレームを検出する単色フ ィルタであって、同一の直流記号を有するブロックの数を計数し、該数が所定 の計数より大きい場合に当該フレームをフィルタ除去するような単色フィルタ を有することを特徴とするシステム。 10.請求項6に記載のシステムにおいて、 各ブロックは直流値を含むDCT係数を有し、 前記ブロック記号は、所定数のビットが対応する交流値が所定の値以上であ るか否かを表すようなビットの交流記号を有する、 ことを特徴とするシステム。 11.請求項6に記載のシステムにおいて、前記フレーム比較器が、 前記領域を所定の評価基準に基づいて配列する領域配列器と、 領域サイズに基づいて、現フレームと前フレームとの間の差分を計算するフ レーム差分計算器と、 上記差分を所定のフレーム計数値と比較し、該所定のフレーム計数値より小 さい場合に現フレームを前記フレームメモリからフィルタする差分比較器と、 を有することを特徴とするシステム。 12.請求項10に記載のシステムにおいて、更に、当該フレームの主要焦点又 は主要焦点の1つと同一の対象物を有するフレームを前記フレームメモリから フィルタ除去する対象物フィルタを有し、該対象物フィルタが、 現フレームと前フレームとの対応するブロックの直流記号を比較し、これら 直流記号が一致するかを判定する直流比較器と、 現フレームと前フレームとの対応するブロックの交流記号を各交流記号毎に比 較し、一致する交流記号の数を交流カウントとして計数する交流比較器と、 前記直流記号が一致すると共に前記交流カウントが所定の値より大きい場合に ブロックカウンタをインクリメントし、それ以外の場合に現フレームを前記フレ ームメモリからフィルタ除去するブロックカウンタと、 マクロブロック内の全ブロックがチェックされた後に前記ブロックカウンタが 所定の値より大きい場合にマクロブロックカウンタをインクリメントするマクロ ブロックカウンタと、 前記マクロブロックカウンタを比較し、該マクロブロックカウンタが所定の値 より大きい場合に現フレームを前記フレームメモリからフィルタ除去するマクロ ブロック比較器と、 を有することを特徴とするシステム。
JP54210398A 1997-06-02 1998-05-25 可視索引付けシステムのための重要情景検出及びフレームフィルタリング Expired - Fee Related JP4256940B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US08/867,140 1997-06-02
US08/867,140 US6137544A (en) 1997-06-02 1997-06-02 Significant scene detection and frame filtering for a visual indexing system
PCT/IB1998/000795 WO1998055943A2 (en) 1997-06-02 1998-05-25 Significant scene detection and frame filtering for a visual indexing system

Publications (2)

Publication Number Publication Date
JP2000516435A true JP2000516435A (ja) 2000-12-05
JP4256940B2 JP4256940B2 (ja) 2009-04-22

Family

ID=25349192

Family Applications (1)

Application Number Title Priority Date Filing Date
JP54210398A Expired - Fee Related JP4256940B2 (ja) 1997-06-02 1998-05-25 可視索引付けシステムのための重要情景検出及びフレームフィルタリング

Country Status (5)

Country Link
US (1) US6137544A (ja)
EP (1) EP0944874B1 (ja)
JP (1) JP4256940B2 (ja)
DE (1) DE69834029T2 (ja)
WO (1) WO1998055943A2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006054872A (ja) * 2004-08-02 2006-02-23 Microsoft Corp スマートメディアコンテンツサムネイル抽出のシステムおよび方法
JP2011082958A (ja) * 2009-10-05 2011-04-21 Fuji Xerox Co Ltd ビデオ検索システムおよびそのためのコンピュータプログラム
US8098730B2 (en) 2002-11-01 2012-01-17 Microsoft Corporation Generating a motion attention model
US8180826B2 (en) 2005-10-31 2012-05-15 Microsoft Corporation Media sharing and authoring on the web
US8196032B2 (en) 2005-11-01 2012-06-05 Microsoft Corporation Template-based multimedia authoring and sharing
US9053754B2 (en) 2004-07-28 2015-06-09 Microsoft Technology Licensing, Llc Thumbnail generation and presentation for recorded TV programs

Families Citing this family (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3166971B2 (ja) * 1997-04-01 2001-05-14 日本ビクター株式会社 ディジタルデータ記録再生装置及び再生装置
KR100321839B1 (ko) * 1997-04-02 2002-03-08 포만 제프리 엘 비디오내로하이퍼링크를통합하는방법및장치
US6496228B1 (en) * 1997-06-02 2002-12-17 Koninklijke Philips Electronics N.V. Significant scene detection and frame filtering for a visual indexing system using dynamic thresholds
JPH1132294A (ja) * 1997-07-09 1999-02-02 Sony Corp 情報検索装置および方法、並びに伝送媒体
JP3409834B2 (ja) * 1997-07-10 2003-05-26 ソニー株式会社 画像処理装置および画像処理方法、並びに記録媒体
JP4021545B2 (ja) * 1998-03-12 2007-12-12 株式会社東芝 デジタル動画像処理装置およびデジタル動画像処理方法
KR100381648B1 (ko) * 1998-07-07 2003-06-18 삼성전자주식회사 광디스크 기록 재생 시스템의 직접 억세스 장치 및 방법
KR20010024872A (ko) * 1998-11-20 2001-03-26 요트.게.아. 롤페즈 비디오 테이프 색인 시스템
JP4178629B2 (ja) * 1998-11-30 2008-11-12 ソニー株式会社 情報処理装置および方法、並びに記録媒体
WO2000033570A1 (fr) * 1998-11-30 2000-06-08 Sony Corporation Procede et dispositif de fourniture d'informations
US7877774B1 (en) * 1999-04-19 2011-01-25 At&T Intellectual Property Ii, L.P. Browsing and retrieval of full broadcast-quality video
US9171545B2 (en) * 1999-04-19 2015-10-27 At&T Intellectual Property Ii, L.P. Browsing and retrieval of full broadcast-quality video
US6469749B1 (en) * 1999-10-13 2002-10-22 Koninklijke Philips Electronics N.V. Automatic signature-based spotting, learning and extracting of commercials and other video content
JP2003516053A (ja) * 1999-11-29 2003-05-07 ソニー株式会社 映像音声信号処理方法及び映像音声信号処理装置
US6766098B1 (en) * 1999-12-30 2004-07-20 Koninklijke Philip Electronics N.V. Method and apparatus for detecting fast motion scenes
JP2003519971A (ja) * 1999-12-30 2003-06-24 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ カット検出におけるフォールスポジティブを低減するための方法及び装置
US6593976B1 (en) 2000-02-14 2003-07-15 Koninklijke Philips Electronics N.V. Automatic return to input source when user-selected content reappears in input source
EP1307830A2 (en) * 2000-06-01 2003-05-07 Koninklijke Philips Electronics N.V. Content with bookmarks obtained from an audience's appreciation
US7418192B2 (en) * 2001-03-13 2008-08-26 Koninklijke Philips Electronics N.V. Dynamic key frame generation and usage
US8949878B2 (en) * 2001-03-30 2015-02-03 Funai Electric Co., Ltd. System for parental control in video programs based on multimedia content information
US7143353B2 (en) * 2001-03-30 2006-11-28 Koninklijke Philips Electronics, N.V. Streaming video bookmarks
US20020186235A1 (en) * 2001-05-25 2002-12-12 Koninklijke Philips Electronics N.V. Compact visual summaries using superhistograms and frame signatures
US6810144B2 (en) * 2001-07-20 2004-10-26 Koninklijke Philips Electronics N.V. Methods of and system for detecting a cartoon in a video data stream
US20030016604A1 (en) * 2001-07-20 2003-01-23 Hanes David H. System and method for detecting the border of recorded video data
US7089496B2 (en) * 2001-07-20 2006-08-08 Hewlett-Packard Development Company, L.P. System and method for scene detection information storage
US20040263621A1 (en) * 2001-09-14 2004-12-30 Guo Chun Biao Customer service counter/checkpoint registration system with video/image capturing, indexing, retrieving and black list matching function
KR100490395B1 (ko) * 2001-10-29 2005-05-17 삼성전자주식회사 움직임 벡터 추정 방법 및 이에 적합한 장치
US7123769B2 (en) * 2001-11-09 2006-10-17 Arcsoft, Inc. Shot boundary detection
US8261306B2 (en) * 2001-12-11 2012-09-04 Koninklijke Philips Electronics N.V. System for and method of shopping through television
US7170566B2 (en) * 2001-12-21 2007-01-30 Koninklijke Philips Electronics N.V. Family histogram based techniques for detection of commercials and other video content
US20030121058A1 (en) * 2001-12-24 2003-06-26 Nevenka Dimitrova Personal adaptive memory system
US7137062B2 (en) * 2001-12-28 2006-11-14 International Business Machines Corporation System and method for hierarchical segmentation with latent semantic indexing in scale space
US7333712B2 (en) * 2002-02-14 2008-02-19 Koninklijke Philips Electronics N.V. Visual summary for scanning forwards and backwards in video content
FR2840148B1 (fr) * 2002-05-27 2004-12-03 Cit Alcatel Procede de transmission optimise de contenus multimedia
US7457811B2 (en) 2002-06-21 2008-11-25 Pace Plc Precipitation/dissolution of stored programs and segments
US7734144B2 (en) 2002-10-30 2010-06-08 Koninklijke Philips Electronics N.V. Method and apparatus for editing source video to provide video image stabilization
US7245820B2 (en) 2002-11-04 2007-07-17 Koninklijke Philips Electronics N.V. Method and system for selecting chapter boundaries for digital video recordings
KR20040065928A (ko) * 2003-01-16 2004-07-23 삼성전자주식회사 동영상 출력기능을 갖는 프린터 및 그 제어방법
CN100520945C (zh) * 2003-03-18 2009-07-29 皇家飞利浦电子股份有限公司 记录信息的设备和方法
JP4537089B2 (ja) * 2003-04-01 2010-09-01 キヤノン株式会社 可変長復号装置及び方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体
JP2006525537A (ja) * 2003-04-14 2006-11-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ コンテンツ解析を用いて音楽ビデオを要約する方法及び装置
US20050028213A1 (en) * 2003-07-31 2005-02-03 International Business Machines Corporation System and method for user-friendly fast forward and backward preview of video
AU2003272483A1 (en) 2003-09-12 2005-04-27 Nielsen Media Research, Inc. Digital video signature apparatus and methods for use with video program identification systems
US20050228849A1 (en) * 2004-03-24 2005-10-13 Tong Zhang Intelligent key-frame extraction from a video
US8411902B2 (en) * 2004-04-07 2013-04-02 Hewlett-Packard Development Company, L.P. Providing a visual indication of the content of a video by analyzing a likely user intent
KR20070007330A (ko) * 2004-04-08 2007-01-15 코닌클리케 필립스 일렉트로닉스 엔.브이. 단색 프레임 검출 방법 및 대응 장치
US20050251835A1 (en) * 2004-05-07 2005-11-10 Microsoft Corporation Strategies for pausing and resuming the presentation of programs
KR100707189B1 (ko) * 2005-04-29 2007-04-13 삼성전자주식회사 동영상의 광고 검출 장치 및 방법과 그 장치를 제어하는컴퓨터 프로그램을 저장하는 컴퓨터로 읽을 수 있는 기록매체
KR20060116335A (ko) * 2005-05-09 2006-11-15 삼성전자주식회사 이벤트를 이용한 동영상 요약 장치 및 방법과 그 장치를제어하는 컴퓨터 프로그램을 저장하는 컴퓨터로 읽을 수있는 기록 매체
US7760956B2 (en) * 2005-05-12 2010-07-20 Hewlett-Packard Development Company, L.P. System and method for producing a page using frames of a video stream
KR100716291B1 (ko) * 2005-07-27 2007-05-09 삼성전자주식회사 영상재생장치와 그 제어방법 및 pvr
US9020326B2 (en) * 2005-08-23 2015-04-28 At&T Intellectual Property Ii, L.P. System and method for content-based navigation of live and recorded TV and video programs
US9042703B2 (en) * 2005-10-31 2015-05-26 At&T Intellectual Property Ii, L.P. System and method for content-based navigation of live and recorded TV and video programs
US20070081789A1 (en) * 2005-10-06 2007-04-12 Lockheed Martin Corporation Time shifting for video
KR100729660B1 (ko) * 2005-12-09 2007-06-18 한국전자통신연구원 장면 전환 길이를 이용한 디지털 비디오 인식 시스템 및 방법
US20070157228A1 (en) 2005-12-30 2007-07-05 Jason Bayer Advertising with video ad creatives
US7431797B2 (en) * 2006-05-03 2008-10-07 Applied Materials, Inc. Plasma reactor with a dynamically adjustable plasma source power applicator
KR100771244B1 (ko) * 2006-06-12 2007-10-29 삼성전자주식회사 동영상 데이터 처리 방법 및 장치
US20090083781A1 (en) * 2007-09-21 2009-03-26 Microsoft Corporation Intelligent Video Player
JP5286732B2 (ja) * 2007-10-01 2013-09-11 ソニー株式会社 情報処理装置および方法、プログラム、並びに記録媒体
US20090207316A1 (en) * 2008-02-19 2009-08-20 Sorenson Media, Inc. Methods for summarizing and auditing the content of digital video
US8717498B2 (en) * 2009-08-17 2014-05-06 Adobe Systems Incorporated Systems and methods for moving objects in video by generating and using keyframes
KR20110047768A (ko) * 2009-10-30 2011-05-09 삼성전자주식회사 멀티미디어 컨텐츠 재생 장치 및 방법
CN103262096B (zh) * 2010-12-09 2016-08-10 诺基亚技术有限公司 基于有限上下文从视频序列中识别关键帧
CN102799637A (zh) * 2012-06-27 2012-11-28 北京邮电大学 一种电视节目内部自动生成主要人物摘要的方法
CN103200463A (zh) * 2013-03-27 2013-07-10 天脉聚源(北京)传媒科技有限公司 一种视频摘要生成方法和装置
US9176987B1 (en) * 2014-08-26 2015-11-03 TCL Research America Inc. Automatic face annotation method and system
US9977968B2 (en) 2016-03-04 2018-05-22 Xerox Corporation System and method for relevance estimation in summarization of videos of multi-step activities
US9972360B2 (en) 2016-08-30 2018-05-15 Oath Inc. Computerized system and method for automatically generating high-quality digital content thumbnails from digital video

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5245436A (en) * 1992-02-14 1993-09-14 Intel Corporation Method and apparatus for detecting fades in digital video sequences
JP2518503B2 (ja) * 1993-03-08 1996-07-24 日本電気株式会社 画面切り替え検出方法
US5717463A (en) * 1995-07-24 1998-02-10 Motorola, Inc. Method and system for estimating motion within a video sequence
JPH09130732A (ja) * 1995-11-01 1997-05-16 Matsushita Electric Ind Co Ltd シーンチェンジ検出方法および動画像編集装置
US5724100A (en) * 1996-02-26 1998-03-03 David Sarnoff Research Center, Inc. Method and apparatus for detecting scene-cuts in a block-based video coding system
US5767923A (en) * 1996-06-07 1998-06-16 Electronic Data Systems Corporation Method and system for detecting cuts in a video signal
US5915038A (en) * 1996-08-26 1999-06-22 Philips Electronics North America Corporation Using index keys extracted from JPEG-compressed images for image retrieval

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8098730B2 (en) 2002-11-01 2012-01-17 Microsoft Corporation Generating a motion attention model
US9053754B2 (en) 2004-07-28 2015-06-09 Microsoft Technology Licensing, Llc Thumbnail generation and presentation for recorded TV programs
US9355684B2 (en) 2004-07-28 2016-05-31 Microsoft Technology Licensing, Llc Thumbnail generation and presentation for recorded TV programs
JP2006054872A (ja) * 2004-08-02 2006-02-23 Microsoft Corp スマートメディアコンテンツサムネイル抽出のシステムおよび方法
US8180826B2 (en) 2005-10-31 2012-05-15 Microsoft Corporation Media sharing and authoring on the web
US8196032B2 (en) 2005-11-01 2012-06-05 Microsoft Corporation Template-based multimedia authoring and sharing
JP2011082958A (ja) * 2009-10-05 2011-04-21 Fuji Xerox Co Ltd ビデオ検索システムおよびそのためのコンピュータプログラム

Also Published As

Publication number Publication date
US6137544A (en) 2000-10-24
EP0944874A2 (en) 1999-09-29
WO1998055943A3 (en) 1999-04-15
DE69834029D1 (de) 2006-05-18
JP4256940B2 (ja) 2009-04-22
EP0944874B1 (en) 2006-03-29
WO1998055943A2 (en) 1998-12-10
DE69834029T2 (de) 2006-11-16

Similar Documents

Publication Publication Date Title
JP4256940B2 (ja) 可視索引付けシステムのための重要情景検出及びフレームフィルタリング
JP4749518B2 (ja) 可視索引付けシステム
US6496228B1 (en) Significant scene detection and frame filtering for a visual indexing system using dynamic thresholds
JP4942883B2 (ja) 動き記述子およびカラー記述子を用いてビデオを要約化する方法
KR100915847B1 (ko) 스트리밍 비디오 북마크들
JP4667697B2 (ja) 速い動きのシーンを検出する方法及び装置
JP4559935B2 (ja) 画像記憶装置及び方法
JP3719933B2 (ja) 階層的ディジタル動画要約及び閲覧方法、並びにその装置
KR20030026529A (ko) 키프레임 기반 비디오 요약 시스템
JP2002521977A (ja) ビデオデータストリーム内に配置されたコマーシャルを位置決めする装置および方法
US6842540B1 (en) Surveillance system
WO2010125757A1 (ja) 映像音声再生装置、映像音声記録再生装置、映像音声再生方法、および映像音声記録再生方法
JP2003519971A (ja) カット検出におけるフォールスポジティブを低減するための方法及び装置
JP4893524B2 (ja) 電子機器、映像データ判定方法及びプログラム
JPH06176149A (ja) 動画像処理装置
KR20030085671A (ko) 영상파일 포맷 및 영상파일 생성 및 재생 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050524

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080527

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080826

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20081006

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081126

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20081126

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090120

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090202

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120206

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120206

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130206

Year of fee payment: 4

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130206

Year of fee payment: 4

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130206

Year of fee payment: 4

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130206

Year of fee payment: 4

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130206

Year of fee payment: 4

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130206

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140206

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees