JP4667697B2 - 速い動きのシーンを検出する方法及び装置 - Google Patents
速い動きのシーンを検出する方法及び装置 Download PDFInfo
- Publication number
- JP4667697B2 JP4667697B2 JP2001550629A JP2001550629A JP4667697B2 JP 4667697 B2 JP4667697 B2 JP 4667697B2 JP 2001550629 A JP2001550629 A JP 2001550629A JP 2001550629 A JP2001550629 A JP 2001550629A JP 4667697 B2 JP4667697 B2 JP 4667697B2
- Authority
- JP
- Japan
- Prior art keywords
- frames
- scene
- frame
- fast
- fast motion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/71—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7847—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
- G06F16/785—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content using colour or luminescence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7847—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
- G06F16/786—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content using motion, e.g. object motion or camera motion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7847—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
- G06F16/7864—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content using domain-transform features, e.g. DCT or wavelet transform coefficients
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Library & Information Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Television Signal Processing For Recording (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【発明の属する技術分野】
本発明は、一般的にソースビデオ内のシーン変化を検出し、各シーンから代表キーフレーム(representative keyframe)を選択する装置に関する。本発明は、とりわけ、検出されたシーン変化は実際にシーン変化なのか否かの判定、又は速い動きのシーンはシーン変化の誤った検出をもたらしたのか否かの判定に関する。
【0002】
【従来の技術】
ユーザは、しばしば、後で又は繰り返し見るためにテープ、ハードディスク又は他の記憶媒体にテレビ番組、映画、コンサート、スポーツ競技など又はホームビデオを記録するであろう。しばしば、ビデオは、様々なコンテンツを持つか、又は非常に長いものになるであろう。しかしながら、ユーザは、記憶媒体に何が記録されているのかを書き留めないかもしれず、何を記録したのか、又は記憶媒体のどこに特定のシーン、映画若しくはイベントが記録されているのかを覚えていないかもしれない。斯くして、ユーザは、例えば、テープに何があるのかを思い出すためにテープ全体を座って見なければならないかもしれない。
【0003】
ビデオのコンテンツの分析は、自動式の方法及び半自動式の方法を用いて記録素材(recorded material)のコンテンツを説明する情報を抽出する。ビデオのコンテンツの索引付け(indexing)及び分析は、ビデオ内の視覚的手掛かり(visual cues)から構造と意味(meaning)とを抽出する。一般に、ビデオクリップは、ビデオ内の様々シーンを映すフレームを選択することにより、TV番組、インターネット又はホームビデオから抜き取られる。
【0004】
米国特許シリアル番号第08/867,140号(出願人整理番号PHA23,252)に記載のビデオの索引付けをするシーン変化検出システムにおいては、フレームを互いに比較して、該フレーム間の大きな差を検出するビデオ索引付けシステムが記載されている。大きな差がある場合には、2つのフレームの間にシーン変化が発生しているとみなされる。一度シーン変化が発見されると、各シーンからキーフレームが選ばれ、キーフレームはビデオ索引を提供するために配置される。このシステムに伴う問題点は、カーチェイスなどの速い動きがあるシーンの間には、シーンを横断するオブジェクト(例えば自動車)が、複数の連続したフレームの間に、フレームの左側部分からフレームの右側部分まで動くかもしれないことにある。これらのフレームを互いに比較する場合に、従来技術のシステムは、実際には、全フレームが同一シーンからのものである場合に、各フレームの後のシーン変化を検出し、キーフレームとして各フレームを選択する。
【0005】
同様に、米国特許シリアル番号第09/123,444号(出願人整理番号PHA23,477)においては、時間内に検出されるシーン変化の数(「カットレート」(“cut rate”))をカウントすることによりコマーシャルを検出するコマーシャル検出システムが開示されている。典型的に、コマーシャルは高いカットレートを持ち、従って、カットレートは、ビデオからコマーシャルの所在を突き止め、削除するために用いられ得る。ある時間の間に検出されたシーン変化の数があるしきい値を上回っていると判定される場合には、コマーシャルが検出されているとみなされる。斯様なシステムに伴う問題点は、速い動きのシーンも、高いカットレートを持ち、コマーシャルとして検出され、ことによるとビデオから削除されるであろうということにある。
【0006】
【課題を解決するための手段】
従って、予め記録されたビデオソース又は記録中のビデオソースに対して、ユーザのために使用可能な量の情報を提供するとともに、有効キーフレーム(significant keyframe)の選択に使用可能であり、前記選択をより正確にする視覚的な索引を作成するシステムが望ましい。このシステムは、シーン変化を検出し、各シーンからキーフレームを選択するが、シーン変化が各フレーム後に連続して検出される場合に前記シーン変化の検出及び前記キーフレームの選択を無視する。
【0007】
本発明の目的は、ビデオの2つのフレームを比較してシーン変化を検出し、複数のフレームに対して各フレーム後に連続したシーン変化が検出される場合には、これらのシーン変化は、本当のシーン変化ではなく前記ビデオ内の早い動きのためのものであると判定することにある。
【0008】
本発明の別の目的は、連続したシーン変化の数をカウントして、各連続したフレームの後に検出されるシーン変化を持つフレームのシーケンスの長さを把握することにある。連続したシーン変化を含むこのシーケンスの最後に、前記シーケンス内の全フレームが同一の速い動きのシーンの一部であると判定し、前記シーケンスからはキーフレームを1つしか選択しないという決定をする。
【0009】
本発明の別の目的は、カットレートが高いビデオを分析してシーン変化が各フレーム後に発生しているのかどうかを判定することにより、速い動きのシーンをコマーシャルと区別することにある。
【0010】
本発明、本発明の作用による利点及び本発明の使用により達成される特定の目的のより良い理解のために、本発明の好ましい実施例が図示されている添付図面及び記載されている説明事項を参照されたい。より良い理解のために以下の図面の参照がなされる。
【0011】
【発明の実施の形態】
ビデオのコンテンツの索引付けのプロセスには、アーカイバル及び検索(retrieval)といった2つのフェーズがある。アーカイバルプロセスの間には、ビデオのコンテンツをビデオ分析プロセスの間に分析し、視覚的な索引を作成する。ビデオ分析プロセスにおいては、自動的な有効シーン(significant scene)の検出、速い動きの検出、キーフレームの選択が行われる。有効シーンの検出は、シーン変化、即ち「カット」(“cuts”)を識別し(ビデオのカットの検出又はセグメンテーションの検出)、静止シーン(static scene)を識別する(静止シーンの検出)プロセスである。検出された各シーンに対しては、キーフレームと呼ばれる特定の代表フレームが抽出される。それ故、シーン変化の適正な識別が行われることが重要であり、適正な識別が行われない場合には、単一のシーンに対して選ばれるキーフレームが多過ぎるようになるか、又は多数のシーン変化に対して選ばれるキーフレームが十分ではなくなる。速い動きの検出は、ビデオ内の、速い動きのシーンが発生する場所を識別するプロセスであり、速い動きのシーンについては以下に更に詳細に説明する。(以下の引例の大半はソーステープに対するものであるが、明らかに、ソースビデオは、ファイル、ディスク、DVD、若しくは他の記憶手段からのもの、又は伝送ソースからの直接的なもの(例えばホームビデオを記録しながらのもの)であり得る。)
【0012】
予め記録されている、音声及び/又はテキストを含み得るソースビデオを持つソーステープに対するビデオのアーカイバルプロセスが図1に示されているが、予めセーブされた、MPEGファイルなどの視覚情報を持つ他の記憶装置に対して同様のプロセスに従っても良い。このプロセスにおいては、ソースビデオに基づいて視覚的な索引を作成する。第2プロセスは、ユーザが記録しようとしているソーステープに対して、記録と同時に視覚的な索引を作成する。
【0013】
図1は、ビデオテープ(予め記録されているソーステープ)に対する第1プロセスの例を図示している。ステップ101において、必要であれば、VCRなどの再生/記録装置によりソースビデオを巻き戻す。ステップ102において、ソースビデオを再生する。ソースビデオからの信号を、テレビ、VCR又は他の処理装置により受け取る。ステップ103において、処理装置内のメディアプロセッサ又は外部プロセッサが、ビデオ信号を受け取り、該ビデオ信号をピクセルデータを表わすフレームにフォーマットする(フレーム取り込み)。
【0014】
ステップ104において、ホストプロセッサは、各フレームをブロックに分割し、前記ブロック及び該ブロックの関連データを変換してDCT(離散コサイン変換)係数を作成し、有効シーンの検出、速い動きの検出及びキーフレームの選択を行い、メモリ、ディスク又は他の記録媒体内にキーフレームをデータ構造として構築し、記憶する。ステップ105において、ソーステープを始端まで巻き戻し、ステップ106において、情報を記録するためにソーステープをセットする。ステップ107において、メモリからソーステープへデータ構造を伝達し、視覚的な索引を作成する。次いで、この視覚的な索引を見るためにテープを巻き戻しても良い。
【0015】
ユーザが記録しながらテープに視覚的な索引を作成することを望む場合には、上記のプロセスを少し変更する。ステップ101及び102の代わりに、図1のステップ112に示されているように、ビデオ(フィルムなど)を記録しながらステップ103のフレーム取り込みプロセスが行われる。
【0016】
ステップ103及び104は、図2A及び2Bにおいてより特定的に図示されている。ビデオには、アナログ(連続データ)形態又はデジタル(離散データ)形態がある。本例は、デジタルドメインで動作し、斯くして処理するのにデジタル形態を用いる。ソースビデオ又はビデオ信号は、十分な高速(この例においては30フレーム/秒)で表示される個々のイメージ又はビデオフレームの連続であり、故に、表示されるイメージのシーケンスは、連続したピクチャのストリームとして現れる。これらのビデオフレームは、非圧縮(NTSC若しくは未加工の(raw)ビデオ)のデータ又はMPEG、MPEG2、MPEG4、モーションJPEGなどといったフォーマットでの圧縮データであり得る。
【0017】
非圧縮ビデオ内の情報は、まず、Intel(登録商標)のSmart Video Recorder III(商標)にあるようなフレーム取り込み技術204を用いて、メディアプロセッサ202においてフレームにセグメント化される。他のフレームサイズも利用可能であるが、図3に示されているこの例においては、フレーム302が、1つのテレビ、ビデオ又は他の視覚のイメージを表わし、352x240ピクセルを含む。
【0018】
フレーム302は、各々、ホストプロセッサ210(図2A)においてこの例においては8x8ピクセルのブロック304に分割される。これらのブロック304及び一般的なブロードキャスト規格であるCCIR-601を用いる場合、マクロブロック作成器206(図2A)が、輝度ブロックを作成し、色情報の副標本をとって、クロミナンスブロックを作成する。輝度ブロック及びクロミナンスブロックはマクロブロック308を形成する。この例においては、4:2:0が使用されているが、4:1:1及び4:2:2などの他のフォーマットも当業者により容易に用いられ得る。4:2:0において、マクロブロック308は、6つのブロック、即ち4つの輝度Y1、Y2、Y3及びY4、並びに2つのクロミナンスCr及びCbを持ち、マクロブロック内の各ブロックは8x8ピクセルである。
【0019】
ビデオ信号はまた、モーションJPEG(Joint Photographic Experts Group)及びMPEG(Motion Pictures Experts Group)などの圧縮規格を用いている圧縮イメージも表わし得る。信号がMPEG又は他の圧縮信号である場合には、図2Bに示されているように、フレーム構文解析系(frame parser)205によりフレーム又はビットストリームの構文解析技術を用いてMPEG信号をフレームに分割する。次いで、フレームを、メディアプロセッサ203内のエントロピーデコーダ214とテーブル指定器(table specifier)216とに送る。エントロピーデコーダ214は、例えばハフマンデコード技術又は別のデコード技術を用いて、テーブル指定器216からのデータを用いてMPEG信号をデコードする。
【0020】
次に、デコードされた信号を逆量子化器218に供給し、逆量子化器218は、テーブル指定器216からのデータを用いてデコードされた信号を逆量子化する。これらのステップ(ステップ214乃至218)は、メディアプロセッサ203において行われているように示されているが、メディアプロセッサ203、ホストプロセッサ211又は使用されている装置に従属する別の外部装置のいずれかにおいて行われ得る。他の例においては、システムが処理の異なるステージにおけるアクセスを許容する(例えば、メディアプロセッサにおける)コード化機能を持つ場合に、DCT係数はホストプロセッサに直接配信され得る。これらの手法の全てにおいて、処理はリアルタイムに行われ得る。
【0021】
図1のステップ104においては、例えばIntel(登録商標)のPentium(登録商標)チップ、他のプロセッサ若しくは他のマルチプロセッサ、Philips(登録商標)のTrimedia(登録商標)チップ若しくは他の任意のマルチメディアプロセッサ、又はコンピュータ、又は拡張VCR、記録/再生装置若しくはテレビ、又は他の任意のプロセッサであり得るホストプロセッサ210が、有効シーンの検出、キーフレームの選択、並びに例えばハードディスク、ファイル、テープ、DVD又は他の記憶媒体などの索引メモリ(index memory)におけるデータ構造の構築及び記憶を行う。
【0022】
有効シーンの検出/速い動きのシーンの検出:本発明は、自動的な有効シーンの検出のために、ビデオのシーンが変化している時又は静止シーンが発生している時の検出を試みる。シーンは、1つ以上の関連イメージを表わし得る。有効シーンの検出においては、2つの連続したフレームを比較し、それらのフレームが著しく異なっていると判定される場合には、シーン変化がそれらの2つのフレームの間で発生していると判定され、著しく似通っていると判定される場合には、静止シーンが発生しているのかどうかを判定するための処理が行われる。速い動きの検出においては、連続したフレームのシーケンスの各フレームの後にシーン変化を検出している場合に、速い動きのシーンを検出している。ディレクター(director)は決して人間の眼によって知覚可能な範囲内での連続したシーン変化を持たないであろうし、それ故、これらの検出は、誤ったシーン変化の検出であるに違いないということから、この判定はなされる(本明細書と共に出願された同一発明者による、ビデオ内の誤りフレーム(false frame)を識別する米国特許シリアル番号第09/477085号(出願人整理番号PHA23937)参照)。斯様なフレームのシーケンスにおいては、このシーケンスはおそらく単一の速い動きのシーンを表わすことから、このシーケンスからはキーフレームを1つしか選ばない。
【0023】
速い動きのシーケンスの2つのフレームの間でかなりの差が検出される理由は、以下の通りである。仮に、速い動きのシーンが、図6に示されているようなカーチェイス又はオートバイのチェイスであるとする。自動車がシーンを横断するにつれて、自動車は、第1フレームの左側部分から、第2フレームの左中央部、次いで、第3フレームの中央部、第4フレームの右中央部、第5フレームの右側部分に向かって移動するかもしれない。第1フレームを第2フレームと比較する場合に、第1フレームと第2フレームとでの自動車の位置の変化がこれらの2つのフレームの間のかなりの差の検出をもたらすことから、シーン変化が検出される。同じことが、第2フレームと第3フレームとの間、第3フレームと第4フレームとの間、及び第4フレームと第5フレームとの間の比較でも当てはまる。本発明は、各フレーム後に新しいシーンを検出し、各フレームからキーフレームを選ぶ代わりに、連続したシーン変化を検出し、シーケンス内の全フレームを同一シーンからのイメージとして扱う。
【0024】
同様に、米国特許シリアル番号第09/123,444号(出願人整理番号PHA23,477)に記載のコマーシャル検出においては、ある時間枠内に検出されるシーン変化の数をしきい値と比較する。シーン変化の数が上記しきい値を上回る場合には、コマーシャルが検出されたと判定される。この分析は、コマーシャルは典型的に短時間の間に多くのシーン変化(「高いカットレート」)を持つという事実に基づいている。この結論を出すことに伴う問題点は、速い動きのシーンもまた高いカットレートを持つということにある。除去するためにコマーシャルを検出している場合には、幾つかの速い動きのシーンも該シーンの高いカットレートのために除去される可能性が高い。本発明の好ましい実施例においては、シーン変化が各フレーム後に連続して発生しているか否かを判定するために全ての高いカットレートのシーンを厳密に調べる。発生している場合には、コマーシャルは検出されていないが、代わりに速い動きのシーンが検出されている。この結論は、また、たとえコマーシャルのシーケンスであっても、ディレクターは決して人間の眼によって知覚可能な時間内の多数のシーン変化を作成しないであろうという事実に基づいている。
【0025】
本方法及び本装置は、シーン変化を検出するのにDCT(離散コサイン変換)係数の比較を用いているが、他の任意のカット検出方法、ウェーブレット、ヒストグラムなども用いることが出来る。まず、受け取ったフレーム302の各々を、ホストプロセッサ210において個々に処理して、8x8ブロック440を作成する。ホストプロセッサ210は、離散コサイン変換器220を用いてDCT係数を導き出し、マクロブロック308を作成するために、空間情報を含む各8x8ブロックを処理する。
【0026】
ビデオ信号をMPEGなどの圧縮ビデオフォーマットで受け取る場合に、DCT係数は、逆量子化後に導き出されても良く、離散コサイン変換器によって処理される必要はない。更に、上記のように、DCT係数は、用いられる装置に依存して自動的に導き出され得る。
【0027】
DCT変換器は、ブロック440(図4)の各々、即ちY1、Y2、Y3、Y4、Cr及びCbにDCT係数値を供給する。この規格によれば、各ブロックの一番上の左側のすみは、DC情報(DC値)を含み、残りのDCT係数はAC情報(AC値)を含む。図4において部分的に示されているように、AC値は、DC値の右からDC値の真下のDCT係数へジグザグ順序に頻度を増す。Y値は輝度値である。
【0028】
本発明のシーン変化の検出方法においては、より早く結果を出し、効率における著しい損失がないように処理を制限するために、処理を、2つのフレームの対応するブロックの間のDC値の変化の検出に限定する。しかしながら、明らかに、当業者は、対応するマクロブロック、ブロック、又は輝度における変化を検出するヒストグラム、ウェーブレットなどといった他の任意の方法の輝度値における差を比較し得る。この差があるしきい値を上回る場合には、シーン変化が発生しているという判定がなされる。
【0029】
シーン変化検出装置は、米国特許シリアル番号第08/867,140号(出願人整理番号PHA23252)に開示されており、参照によりここに盛り込まれる。この従来技術の発明においては、各フレームのDCT係数と隣接フレームにおける係数の各々との比較がなされる。(自動車がシーンを横断するにつれて生じる)各々の係数の間の著しい変化がある場合には、2つのフレームの間でシーン変化が発生していると判定される。ビデオの索引付けシステムにおいて、実際には全てのフレームが単一のシーンを構成している場合に、これにより、キーフレームがシーケンス内の各フレームから選ばれる。
【0030】
本発明においては、各フレーム後のシーン変化を検出するが、複数の連続したシーン変化がある場合には、これらのフレームを単一のシーンとして扱い、単一のキーフレームしか選択しない。
【0031】
図2A及び2Bは、本発明の好ましい実施例によるシステムを示している。有効シーンプロセッサ230は、シーン変化を検出する。速い動きの検出器240及びカウンタ241は、毎フレーム連続して発生するシーン変化の数をカウントする。複数のn個のフレームの各フレーム後にシーン変化が発生している場合に、速い動きの検出器240は、カウンタ241を用いて、フレーム後に発生するシーン変化を持つフレームの数、又はシーン変化の数のいずれかを把握する。次いで、速い動きの検出器240は、n個のフレームに対して、それらのフレームは全て同一シーンの一部であるから、索引のために単一のキーフレームしか選択しないことを有効シーンプロセッサ230に知らせる。
【0032】
図6は、速い動きのカーチェイスビデオシーンのフレームのシーケンスを示している。上記のように、これらのフレームにおいては、自動車がフレームの左側部分からフレームの右側部分へ移動する。本発明の好ましい実施例においては、第1フレームを第2フレームと比較する。これらのフレームの間に大きな差があることから、第1フレーム後にシーン変化を検出する。次いで、フレーム2をフレーム3と比較し、これらのフレームの間の大きな差のために、フレーム2とフレーム3との間に別のシーン変化を検出する。次いで、フレーム3をフレーム4と比較し、以下同様である。カウンタ241は、2つのフレームの間の比較がシーン変化をもたらすたびにインクリメントする。いったん比較がシーン変化は発生していないと判定すると、数nはプロセッサ230に送られ、カウンタ241は零にリセットされる。カウンタが3以上に達する場合には、3つ以上のフレームが、速い動きのシーケンスの一部であるという判定がなされる。
【0033】
本発明の別の実施例においては、本発明の方法及び装置が、ビデオの毎フレーム検出される連続したカットを持つ部分を捜すことにより、ビデオ内の速い動きのシーンを検出するために用いられる。これは、アーカイブから速い動きのシーンを捜し出すことを可能にする。
【0034】
更に、検出される高いカットレートがあることからコマーシャルが検出されていると考える場合に、本発明は、カットが毎フレーム連続して発生しているかどうかを判定するために、より厳密にカットを調べる。前記カットは、コマーシャルではなく速い動きのシーンを示す。これは、コマーシャル位置検索システム(commercial location system)を向上させる。
【0035】
本発明は、DCT係数を用いて示されているが、代わりに、イメージの副区域において演算して、該副区域の代表値を与える関数、ヒストグラム値、又はウェーブレット係数などの代表値を用いても良い。
【0036】
本発明の別の実施例は、ビデオ索引のために速い動きのシーンからキーフレームを選択するための速い動きのシーンの識別に関係する。複数の連続したカット又はシーン変化を識別する上記の方法は、速い動きのシーンを識別する方法の1つである。幾つかの他の方法が、"Motion Analysis and Image Sequence Processing" edited by M. Ibramin Sezan and Reginald Lagendijk, Kluwer Academic Publishers, Boston/Dordrecolt/London, 1993において確認される。これらの方法の幾つかは、
−フレームからフレームへのピクセルのフローを追跡するオプティカルフロー計算(optical flow computation)、
−フレームからフレームへイメージ内のエッジが移動していく場所の追跡に基づく動き評価、
−フレームからフレームへのオブジェクトのフローを追跡する剛体動きモデル(rigid body motion model)に基づく動き評価、
−フレーム内の局所の動きを追跡する、フレームからフレームへ移動するほとんど全てのものの広い評価であるアフィン動きモデル(affine motion model)を用いる動き評価、及び
−MPEGにおけるPフレーム及びBフレーム内の内部コード化ブロック(intra coded block)の数の使用を含む。
【0037】
これらの方法のいずれも、速い動きのシーンを検出する場合に、速い動きのシーンを構成する多くのフレームから1つ以上のキーフレームを選択し得る。シーンにおける動きが、速い動きであるか又は遅い動きであるかは、しきい値との比較により判定され得る。これらの方法のいずれかによって検出された動きがしきい値を上回る場合に、前記シーンは速い動きのシーンである。このしきい値は、ビデオ内の全てのシーンの比較に基づき得るし、あるいは、1999年11月4日に出願された米国特許シリアル番号第09/433,258号(出願人整理番号PHA23,808)に記載されているようなカテゴリのビデオ又は全てのビデオに適用する一般的なしきい値が選ばれ得る。本発明のこの実施例の一側面においては、フレームグループ内で検出されたカットが多数ある場合に、動き評価を用いて、フレームグループが単一のキーフレームのみが選択される必要があるような単一の速い動きのシーンであるかどうかを判定する。
【0038】
更に、本発明は、ビデオ索引付けシステムに関して記載されているが、一般に速い動きのシーンに関係しており、それ故、速い動きが誤ったシーン変化の検出をもたらすシーンを検出するための検索装置として、又は他の例としては速い動きのシーケンスから代表フレームを選び取るためのアーカイバルの方法として用いられ得る。
【0039】
本発明は、好ましい実施例に関連して記載されているが、上記の原則の範囲内の本発明の変形例は当業者にとって明らかであり、従って、本発明は前記好ましい実施例に限定されず、斯様な変形例を含むものであるということを理解されたい。
【図面の簡単な説明】
【図1】ビデオのアーカイバルプロセスを図示する。
【図2A】本発明の好ましい実施例による視覚的な索引の作成において用いられる装置のブロック図である。
【図2B】本発明の好ましい実施例による視覚的な索引の作成において用いられる装置のブロック図である。
【図3】フレーム、マクロブロック及び幾つかのブロックを図示する。
【図4】ブロックの幾つかのDCT係数を図示する。
【図5】DCT係数を持つマクロブロック及び幾つかのブロックを図示する。
【図6】速い動きのシーンを持つビデオのストリームを図示する。
Claims (14)
- フレームを持つソースビデオを受け取る受信機、
2つのフレームの間のシーン変化を検出する比較器、及び
ビデオの少なくとも3つの連続したフレームでシーン変化が検出される場合、前記少なくとも3つの連続したフレームを速い動きのシーンと決定する速い動きの検出器を有する速い動きのシーンのフレームを検出するシステム。 - 連続してシーン変化が検出されるフレームの数をカウントするカウンタを更に含む請求項1に記載のシステム。
- 複数のフレームから単一のキーフレームを抽出するキーフレーム抽出器を更に含む請求項2に記載のシステム。
- 前記比較器が、シーン変化が前記2つのフレームの間で発生しているかどうかを判定するために前記フレームのDCT係数を比較する装置を含む請求項1に記載のシステム。
- フレームを持つソースビデオを受け取るステップ、
前記フレームの間のシーン変化を検出するためにビデオの該フレームを互いと比較するステップ、及び
少なくとも3つの連続したフレームでシーン変化が検出される場合、前記少なくとも3つの連続したフレームを速い動きのシーンと決定する速い動きを検出するステップを有する速い動きのシーンのフレームを検出する方法。 - 連続してシーン変化が検出されるフレームの数をカウントするステップを更に含む請求項5に記載の方法。
- 複数のフレームから単一のキーフレームを抽出するステップを更に含む請求項6に記載の方法。
- 前記比較するステップが、前記フレームのDCT係数を比較し、著しい変化が2つのフレームのDCT係数の間で発生したかどうかを検出する請求項5に記載の方法。
- フレームを持つソースビデオを受け取る受信機、
少なくとも3つの連続したフレームでシーン変化が検出される場合、前記少なくとも3つの連続したフレームを速い動きのシーンに属するフレームのグループと決定する速い動きの検出器、及び
どのフレームのグループが前記速い動きのシーンに属しているかの指示を前記速い動きの検出器から受け取り、前記速い動きのシーンに属するフレームのグループから少なくとも1つのフレームを索引のためのキーフレームとして選択する選択器を有する索引付けシステム。 - 前記速い動きの検出器が、オプティカルフロー計算を用いる請求項9に記載の索引付けシステム。
- 前記速い動きの検出器が、アフィン動きモデルを用いる請求項9に記載の索引付けシステム。
- 前記速い動きの検出器が、エッジに基づく動き評価を用いる請求項9に記載の索引付けシステム。
- 前記速い動きの検出器が、剛体動きに基づく動き評価を用いる請求項9に記載の索引付けシステム。
- 前記速い動きの検出器が、MPEGにおけるPフレーム及びBフレーム内の内部コード化ブロックの数に基づく動き評価を用いる請求項9に記載の索引付けシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/477,084 US6766098B1 (en) | 1999-12-30 | 1999-12-30 | Method and apparatus for detecting fast motion scenes |
US09/477,084 | 1999-12-30 | ||
PCT/EP2000/012866 WO2001050339A2 (en) | 1999-12-30 | 2000-12-15 | Method and apparatus for detecting fast motion scenes |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003519946A JP2003519946A (ja) | 2003-06-24 |
JP4667697B2 true JP4667697B2 (ja) | 2011-04-13 |
Family
ID=23894474
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001550629A Expired - Fee Related JP4667697B2 (ja) | 1999-12-30 | 2000-12-15 | 速い動きのシーンを検出する方法及び装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US6766098B1 (ja) |
EP (1) | EP1252586A2 (ja) |
JP (1) | JP4667697B2 (ja) |
CN (1) | CN1312614C (ja) |
WO (1) | WO2001050339A2 (ja) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7123772B2 (en) * | 2001-03-28 | 2006-10-17 | Texas Instruments Incorporated | Image compression by differences within a strip |
EP1962511A3 (en) * | 2000-04-05 | 2010-10-27 | Sony United Kingdom Limited | Audio and/or video generation apparatus and method using a list of content items |
US6714594B2 (en) | 2001-05-14 | 2004-03-30 | Koninklijke Philips Electronics N.V. | Video content detection method and system leveraging data-compression constructs |
US6993182B2 (en) * | 2002-03-29 | 2006-01-31 | Koninklijke Philips Electronics N.V. | Method and apparatus for detecting scene changes in video using a histogram of frame differences |
JP3870123B2 (ja) * | 2002-06-11 | 2007-01-17 | キヤノン株式会社 | 画像処理装置、画像処理方法、プログラム及び記録媒体 |
US7116374B2 (en) * | 2003-08-26 | 2006-10-03 | Koplar Interactive Systems International, L.L.C. | Method and system for enhanced modulation of video signals |
KR100557858B1 (ko) * | 2003-09-27 | 2006-03-10 | 학교법인 인하학원 | 엠펙 동영상에서의 주요 정지 영상 추출 장치 및 방법 |
EP1531474A1 (en) * | 2003-11-14 | 2005-05-18 | Sony International (Europe) GmbH | Video signal playback apparatus and method |
CN100379283C (zh) * | 2004-04-29 | 2008-04-02 | 明基电通股份有限公司 | 动态判定视频数据以对其编码的方法及视频传送装置 |
US7664175B1 (en) * | 2004-06-16 | 2010-02-16 | Koplar Interactive Systems International, L.L.C. | Mark-based content modulation and detection |
WO2006109217A2 (en) * | 2005-04-14 | 2006-10-19 | Koninklijke Philips Electronics N.V. | Video apparatus having an edition function |
WO2007091182A1 (en) * | 2006-02-10 | 2007-08-16 | Koninklijke Philips Electronics N.V. | Method and apparatus for generating metadata |
KR100827229B1 (ko) * | 2006-05-17 | 2008-05-07 | 삼성전자주식회사 | 비디오 검색 장치 및 방법 |
US20080222120A1 (en) * | 2007-03-08 | 2008-09-11 | Nikolaos Georgis | System and method for video recommendation based on video frame features |
US8798133B2 (en) * | 2007-11-29 | 2014-08-05 | Koplar Interactive Systems International L.L.C. | Dual channel encoding and detection |
KR101595884B1 (ko) * | 2009-07-16 | 2016-02-22 | 한화테크윈 주식회사 | 감시 카메라, 그 제어방법 |
WO2017105391A1 (en) * | 2015-12-14 | 2017-06-22 | Arris Enterprises, Inc. | A method to encode video with close multiple scene changes |
CN105472407A (zh) * | 2015-12-15 | 2016-04-06 | 北京网博视界科技股份有限公司 | 基于连续图像特征的自动化视频索引及对齐方法 |
CN106095849A (zh) * | 2016-06-02 | 2016-11-09 | 中国联合网络通信集团有限公司 | 基于场景的音乐推送方法和音乐推送系统 |
US11399207B2 (en) * | 2018-02-02 | 2022-07-26 | Comcast Cable Communications, Llc | Image selection using motion data |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05236449A (ja) * | 1992-02-20 | 1993-09-10 | Toshiba Corp | 動画像処理装置 |
JPH05236458A (ja) * | 1992-02-20 | 1993-09-10 | Toshiba Corp | 動画像処理装置 |
JPH0837664A (ja) * | 1994-07-26 | 1996-02-06 | Toshiba Corp | 動画像符号化/復号化装置 |
JPH0974575A (ja) * | 1995-07-06 | 1997-03-18 | Hitachi Ltd | 動画像の特徴場面表示方法及び装置 |
JPH0993530A (ja) * | 1995-09-28 | 1997-04-04 | Matsushita Electric Ind Co Ltd | 映像変化点検出装置および映像変化点検出方法 |
JPH09284702A (ja) * | 1996-04-09 | 1997-10-31 | Oki Electric Ind Co Ltd | シーン変化フレーム検出方法および装置 |
JPH11252509A (ja) * | 1998-03-05 | 1999-09-17 | Kdd Corp | 動画像のカット点検出装置 |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4409615A (en) * | 1980-12-29 | 1983-10-11 | Thomson-Csf Broadcast, Inc. | Video imaging with automatically controlled radiation source |
JPH02174388A (ja) * | 1988-12-26 | 1990-07-05 | Graphics Commun Technol:Kk | 画像符号化装置 |
JP2863818B2 (ja) | 1990-08-31 | 1999-03-03 | 工業技術院長 | 動画像の変化点検出方法 |
US5719643A (en) | 1993-08-10 | 1998-02-17 | Kokusai Denshin Denwa Kabushiki Kaisha | Scene cut frame detector and scene cut frame group detector |
DE4327779C1 (de) * | 1993-08-18 | 1994-12-08 | Siemens Ag | Verfahren und Schaltungsanordnung für ein Fernsehgerät zur Verminderung des Flimmerns |
US5642294A (en) | 1993-12-17 | 1997-06-24 | Nippon Telegraph And Telephone Corporation | Method and apparatus for video cut detection |
US6055025A (en) | 1993-12-21 | 2000-04-25 | Lucent Technologies, Inc. | Method and apparatus for detecting abrupt and gradual scene changes in image sequences |
JP2914170B2 (ja) * | 1994-04-18 | 1999-06-28 | 松下電器産業株式会社 | 映像変化点検出方法 |
US5635982A (en) * | 1994-06-27 | 1997-06-03 | Zhang; Hong J. | System for automatic video segmentation and key frame extraction for video sequences having both sharp and gradual transitions |
US5508750A (en) * | 1995-02-03 | 1996-04-16 | Texas Instruments Incorporated | Encoding data converted from film format for progressive display |
US5732217A (en) * | 1995-12-01 | 1998-03-24 | Matsushita Electric Industrial Co., Ltd. | Video-on-demand system capable of performing a high-speed playback at a correct speed |
US5835163A (en) * | 1995-12-21 | 1998-11-10 | Siemens Corporate Research, Inc. | Apparatus for detecting a cut in a video |
DE69716037T2 (de) * | 1996-01-22 | 2003-07-03 | Matsushita Electric Industrial Co., Ltd. | Verfahren zur kodierung und dekodierung von digitalen bildern |
US5731835A (en) * | 1996-02-26 | 1998-03-24 | David Sarnoff Research Center, Inc. | Dynamic coding rate control in a block-based video coding system |
US5767922A (en) * | 1996-04-05 | 1998-06-16 | Cornell Research Foundation, Inc. | Apparatus and process for detecting scene breaks in a sequence of video frames |
US5751378A (en) | 1996-09-27 | 1998-05-12 | General Instrument Corporation | Scene change detector for digital video |
CA2190785A1 (en) | 1996-11-20 | 1998-05-20 | Nael Hirzalla | Method of processing a video stream |
JPH10254757A (ja) * | 1997-03-13 | 1998-09-25 | Matsushita Electric Ind Co Ltd | メディア別動画ファイル管理システム |
US6137544A (en) * | 1997-06-02 | 2000-10-24 | Philips Electronics North America Corporation | Significant scene detection and frame filtering for a visual indexing system |
JP3191922B2 (ja) * | 1997-07-10 | 2001-07-23 | 松下電器産業株式会社 | 画像復号化方法 |
GB2337146B (en) | 1998-05-08 | 2000-07-19 | Primary Image Limited | Method and apparatus for detecting motion across a surveillance area |
US6100941A (en) | 1998-07-28 | 2000-08-08 | U.S. Philips Corporation | Apparatus and method for locating a commercial disposed within a video data stream |
JP2000152191A (ja) * | 1998-11-13 | 2000-05-30 | Nec Corp | ノンインターレース画像表示処理装置及び表示処理方法 |
US6252975B1 (en) * | 1998-12-17 | 2001-06-26 | Xerox Corporation | Method and system for real time feature based motion analysis for key frame selection from a video |
EP1180307A2 (en) | 1999-12-30 | 2002-02-20 | Koninklijke Philips Electronics N.V. | Method and apparatus for reducing false positives in cut detection |
-
1999
- 1999-12-30 US US09/477,084 patent/US6766098B1/en not_active Expired - Fee Related
-
2000
- 2000-12-15 JP JP2001550629A patent/JP4667697B2/ja not_active Expired - Fee Related
- 2000-12-15 EP EP00990781A patent/EP1252586A2/en not_active Withdrawn
- 2000-12-15 WO PCT/EP2000/012866 patent/WO2001050339A2/en active Application Filing
- 2000-12-15 CN CNB008069972A patent/CN1312614C/zh not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05236449A (ja) * | 1992-02-20 | 1993-09-10 | Toshiba Corp | 動画像処理装置 |
JPH05236458A (ja) * | 1992-02-20 | 1993-09-10 | Toshiba Corp | 動画像処理装置 |
JPH0837664A (ja) * | 1994-07-26 | 1996-02-06 | Toshiba Corp | 動画像符号化/復号化装置 |
JPH0974575A (ja) * | 1995-07-06 | 1997-03-18 | Hitachi Ltd | 動画像の特徴場面表示方法及び装置 |
JPH0993530A (ja) * | 1995-09-28 | 1997-04-04 | Matsushita Electric Ind Co Ltd | 映像変化点検出装置および映像変化点検出方法 |
JPH09284702A (ja) * | 1996-04-09 | 1997-10-31 | Oki Electric Ind Co Ltd | シーン変化フレーム検出方法および装置 |
JPH11252509A (ja) * | 1998-03-05 | 1999-09-17 | Kdd Corp | 動画像のカット点検出装置 |
Also Published As
Publication number | Publication date |
---|---|
CN1516842A (zh) | 2004-07-28 |
EP1252586A2 (en) | 2002-10-30 |
JP2003519946A (ja) | 2003-06-24 |
US6766098B1 (en) | 2004-07-20 |
CN1312614C (zh) | 2007-04-25 |
WO2001050339A3 (en) | 2002-08-15 |
WO2001050339A2 (en) | 2001-07-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4667697B2 (ja) | 速い動きのシーンを検出する方法及び装置 | |
JP4256940B2 (ja) | 可視索引付けシステムのための重要情景検出及びフレームフィルタリング | |
US6496228B1 (en) | Significant scene detection and frame filtering for a visual indexing system using dynamic thresholds | |
JP4749518B2 (ja) | 可視索引付けシステム | |
JP4942883B2 (ja) | 動き記述子およびカラー記述子を用いてビデオを要約化する方法 | |
JP3719933B2 (ja) | 階層的ディジタル動画要約及び閲覧方法、並びにその装置 | |
Kobla et al. | Detection of slow-motion replay sequences for identifying sports videos | |
US7159117B2 (en) | Electronic watermark data insertion apparatus and electronic watermark data detection apparatus | |
US20030016604A1 (en) | System and method for detecting the border of recorded video data | |
KR20030026529A (ko) | 키프레임 기반 비디오 요약 시스템 | |
KR100846770B1 (ko) | 동영상 부호화 방법 및 이에 적합한 장치 | |
Nakajima | A video browsing using fast scene cut detection for an efficient networked video database access | |
WO2008001305A2 (en) | Method and system of key frame extraction | |
CN1252982C (zh) | 画面切换检测中减少错误认定的方法和装置 | |
KR100812041B1 (ko) | 개선된 장면 전환 검출 방법을 이용한 자동 인덱싱 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071214 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100610 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100716 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101214 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110112 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140121 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |