JP3554595B2 - カメラ移動誘発シーン変化を検出するための方法 - Google Patents

カメラ移動誘発シーン変化を検出するための方法 Download PDF

Info

Publication number
JP3554595B2
JP3554595B2 JP01657795A JP1657795A JP3554595B2 JP 3554595 B2 JP3554595 B2 JP 3554595B2 JP 01657795 A JP01657795 A JP 01657795A JP 1657795 A JP1657795 A JP 1657795A JP 3554595 B2 JP3554595 B2 JP 3554595B2
Authority
JP
Japan
Prior art keywords
camera
signal
scene change
induced
generating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP01657795A
Other languages
English (en)
Other versions
JPH07226877A (ja
Inventor
シャラレイ ベザッド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
AT&T Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AT&T Corp filed Critical AT&T Corp
Publication of JPH07226877A publication Critical patent/JPH07226877A/ja
Application granted granted Critical
Publication of JP3554595B2 publication Critical patent/JP3554595B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/11Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information not detectable on the record carrier
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/179Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/87Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/144Movement detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/147Scene change detection
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/60Solid state media
    • G11B2220/65Solid state media wherein solid state memory is used for storing indexing information or metadata

Description

【0001】
【産業上の利用分野】
本発明は、ビデオ番組などの映像列内のシーン変化を自動的に検出するための方法、より具体的には、パン、ティルト、ズームなどのカメラ動作に起因するショット内シーン変化を検出するための方法に係る。
【0002】
【従来の技術】
ビデオ番組は、通常、映画やビデオ産業において“ショット”と称される複数の異なるビデオセグメントの編集によって形成される。各ショットは、単一カメラの一つの継続した(中断の無い)動作間隔中に生成された一続きのフレーム列(つまり、複数の映像)から成る。例えば、動画においては、ショットは、単一のカメラによって収録を開始してから停止されるまでの間に生成されたフィルムに記録された一続きのフレームである。
生のテレビ放送においては、一つのショットは、画面上に見られる単一のカメラが大気中に放送を開始してから別のカメラによって取って代わられるまでの間の映像から構成される。
【0003】
複数のショットは、(“カット”と称される)二つの一続きのショット間の境界がはっきりと定義される急峻なモード(つまり、突き合わせ編集、或は切り替えモード)にて互いに結合することも、或は多くの他の編集モードの一つ、例えば、結果として一つのショットから次のショットへの緩やかな遷移が起こるフェード或はディゾルブなどのによって結合することもできる。使用される特定の遷移モードは、通常、監督によって、時間と場所の変化についてのヒントが得られ、視聴者が事象の進行について行けるように選択される。
【0004】
複数の異なるショット間の急峻な遷移を検出するための幾つかの自動ビデオ索引付け法が知られている。急峻な遷移と緩やかな遷移の両方を検出することができる自動ビデオ索引付け法の一例が、1993年12月21日付けで申請された、『Method and Apparatus for Detecting Abrupt and Gradual Scene Changes In Image Sequences(映像列の急峻な及び緩やかなシーン変化を検出するための方法と装置)』という名称の特許出願第08/171,136号において開示されているが、この内容を参照されたい。自動ビデオ番組索引付けの背景においては、これらの急峻な遷移は、しばしば、“シーン”と呼ばれ、検出された境界(つまり、カット)は、“シーン境界”と呼ばれる。ただし、ある一つの“シーン”は、通常、実質的に類似する情報を運ぶ密接に関連した内容のフレームの列であるものと考慮される。ビデオ番組が“静止ショット”(つまり、カメラの移動がないショット)のみから構成される場合は、各ショットは、単一のシーンを含むのみである。ただし、通常は、ビデオ番組は、静止ショットばかりでなく、“移動ショット”(つまり、カメラにパン、ティルト、ズームなどの動作が加えられるショット)も含む。従って、カメラの移動のために、一連のフレームの内容が一つのショットの期間中に大きく変化し、あるショット内に一つ以上のシーンが存在する結果となる。従って、異なるショット間の境界もシーン境界を構成するが、カメラ移動によってショット内シーン変化が生成されるために、前者のショット間シーン境界は、あるビデオ番組内において発生する後者を含めた全シーン境界の一部分であるにすぎない。
【0005】
【発明が解決しようとする課題】
従来のシーン変化検出法は、前者のショット間の境界の所で発生するシーンの変化のみを検出し、後者の個々のショット内で発生するシーンの変化を検出しないために不完全である。
【0006】
【課題を解決するための手段】
本発明においては、単一のショットを構成する視覚情報を帯びるフレームの列内のカメラ誘発シーン変化を決定(検出)するための方法が開発された。この方法の一例においては、単一のカメラショット内の複数の対のフレームの各対間のカメラ誘発移動が決定される。このカメラ誘発移動が、これら複数の各フレーム対について、少なくとも、第一の成分に分解される。この第一の成分の値が、これら複数の各フレーム対に対して総和され、第一の累積信号が形成される。この第一の累積信号がある判定基準を満たしたときにシーンの変化が示される(検出、決定される)。
【0007】
本発明の一つの具体例においては、カメラ移動が映像パン、映像ティルト、或は映像ズームのいずれか一つを表わす第一の成分に分解される。本発明の別の例においては、カメラ移動が、三つのこれら成分の全てに分解される。
本発明の別の例においては、単一のカメラショット内の複数の対のフレームの各対間のカメラ誘発移動を表わす信号が生成される。複数のこれらの信号がこれら複数のフレーム対に対して総和され、第一の累積信号が形成される。この第一の累積信号がある判定しきい値を超えたときにシーン変化が示される。
本発明のさらにもう一つの例においては、本発明の方法が、カメラショット間の急峻及び緩やかな遷移を検出するブロック比較技法などの周知の方法と共に使用される。周知の方法が、各カメラショットの開始を見つけるために使用されるが、この開始は、新しいシーンの開始と呼ばれる。次に、周知の任意の方法を使用してそのカメラショット内の一続きのフレームの間で発生する映像パン、映像ティルト、及び映像ズームが抽出される。映像パン、映像ティルト、映像ズームのカメラ動作の各々に対して、一続きのフレームの間で計算された値を使用して、2つの信号、つまり:1)新しいシーンが開始されて以来のカメラ動作の累積値を表わす連続信号;及び2)与えられた動作に対するカメラの連続した起動(を示す2進信号、が生成される。シーン変化が:1)カメラの任意の動作に対する累積値の規模が所定のしきい値を超えた場合;或は2)任意のカメラ動作(つまり、パン、ティルト、或はズーム動作)に対する一つの連続動作期間が終端したことが2進信号によって示され、しかもその時点でそれに対応する累積値が、少なくとも、もう一つの所定のしきい値と同一の規模を持つときに示される。
【0008】
【実施例】
図1は本発明によるシーン変化検出器2を示す。検出器2は、映像デジタル化器3、映像プロセッサ4、及びデジタルコンピュータ7を含む。映像プロセッサ4は、現在のフレームと前のフレームのデジタル化された映像を保持し、また、映像プロセッサ4によって生成された中間結果を格納するための映像メモリ6を含む。映像プロセッサ4はさらに映像メモリ6内に含まれる映像を処理するためのプロセッサ5を含む。本発明の別の実施例においては、デジタルコンピュータ7が映像プロセッサ4の仕事を遂行し、これによって、個別の映像プロセッサ4の必要性が排除される。上に述べたように、シーン変化検出器2は、ショット間の境界とショット内シーンの境界の両方を検出することができる。
【0009】
本発明の方法は、ビデオ番組内の個々のショットについて動作する。ただし、このようなショット内のシーンの変化を検出するためには、その前に、そのビデオ番組を周知の方法で個々のショットにセグメント化しておくことが必要である。個々のショットが区分されたら、各ショットのショット内シーン変化が図2に示されるように本発明の方法によって検出される。ここで注意すべき点は、ある一つのショット境界は、(用語の定義上)それ自身が一つのシーン変化であることである。
【0010】
図2には、本発明の一例によって遂行されるステップが示される。ある一つのショットの開始(これは一つの新たなシーンの開始でもある)において、ステップ210に示されるように、カメラ誘発シーン変化検出器が初期化される。ステップ240において、そのショット内の一続きのフレームがデジタル化され、ステップ250において、このカメラ誘発シーン変化検出方法を使用して、ショット内シーン変化が検出される。ステップ260において、ステップ250からの出力がシーン変化が存在するかチェックされる。シーン変化が検出された場合は、ステップ270において適当な動作が行なわれる。遂行される特定の動作は、シーン変化検出が使用される用途に基づいて選択される。本発明のこの方法は、任意の所望の用途と共に使用することができるが、これらの数例が後に説明される。ショット内シーン変化検出器が、次に、このプロセスを反復するために初期化される。上に説明のステップがそのショット内の全てのフレームが処理されるまで反復される。シーン変化が検出されない場合は、このプロセスが、ショット内シーン変化検出器の再初期化を行なうことなしに継続される。
【0011】
本発明のもう一つの実施例においては、図3に示されるように、ショット境界)とショット内シーン変化の検出の両方がビデオ番組について一緒に遂行される。このケースにおいては、初期化ステップ310が最初に、及び、各シーン変化の検出の後に遂行される。ステップ340においてフレームが順番にデジタル化される。デジタル化されたフレームは、最初に、ステップ350において、周知のショット境界検出方法、例えば、上に説明の方法を使用して、ショット境界が存在するかチェックされる。この結果がステップ360においてチェックされる。ショット境界(これはまたシーン境界でもある)が検出された場合は、ステップ380が遂行され、プロセスは、ステップ310から再び反復される。ショット境界が検出されない場合は、ステップ250がショット内シーン変化が存在しないか検出するために遂行される。このステップの結果がステップ370においてチェックされる。ショット内シーン変化が検出された場合は、ステップ380が遂行され、プロセスは、ステップ310から再び反復される。ショット内シーン変化が検出されない場合は、プロセスは、ステップ320から再び反復され、こうして、ショット内検出器の再初期化が回避される。プロセスは、ステップ320が最後の番組フレームに到達したことを示す場合は、ステップ330において終端する。
【0012】
以下では、ステップ250において遂行されるショット内シーン変化の検出方法について詳細に説明する。ステップ250において使用される検出基準はカメラ動作に依存するために、最初に、様々なカメラ動作の例と、それら動作を使用する目的について説明する。その後に、これらカメラ動作のフレームへの効果と、これら効果を認識するために使用される検出基準について説明される。
【0013】
カメラ動作
ビデオ番組は通常2つの異なるタイプのショットから構成される。一つのタイプのショットは、カメラが移動せず、また、レンズがズームイン或はズームアウトしない場合に得られる。このタイプのショットは、“静止ショット”と称される。もう一つのタイプのショットは、カメラが、移動した場合、ズーム動作が行なわれた場合、或は両者が同時に起こった場合に得られる。これらショットは、“移動ショット”と称される。カメラの移動とズーム動作は、集合的に、“カメラ動作”或は“カメラの動き”と称される。
【0014】
カメラ動作は、次のように分類することができる。“パン”は、カメラの左右への水平方向の(つまり、垂直軸を中心としての)回転である。“ティルト”は、カメラの上下の(つまり、水平軸を中心としての)回転である。“ドリー”は、カメラの光学軸に沿って対象に接近或は離れるカメラ移動である。“トラッキング”は、ここでは、カメラの光学軸に垂直な平面内でのカメラの移動を指すのに使用される。勿論、カメラの全ての移行運動は、ドリーとトラッキング動作の組合わせから成る。“ズーム”は、ズームレンズの焦点長を変化させることによって達成される効果であり、これは、ドリー動作によって達成される効果と極めて類似する。上の個々のカメラ動作が、カメラが経験する実際の動きの成分であると見なされる。
【0015】
カメラ動作の目的
典型的には、カメラは、明白な目的がない限り、移動されない。良く監督されたビデオ番組においては、個々のカメラ動作は明白な理由のために遂行される。例えば、パン或はティルト移動は、対象がその映像の片側から反対側に移動したとき、“その行為を追跡する”ために使用される。パン或はティルトは、二つの異なる対象間の視野の橋渡しを行なうための“関連付け”のためにも使用されるが、これは、一つの対象から別の対象にパン及び/或はティルトすることによって行なわれる。パンとティルトは、また、恐らくは、完全にズームアウトされた位置でも一つのフレーム内に入りきらない大きな対象に対する“見当識”を得るためにも使用される。つまり、カメラが複数のフレームを通じて対象全体が記録できるように移動される。“見当識”に類似するものとして、パンとティルトが“探究”のために使用される場合があるが、この動作においては、シーンの選択された細部が接近光景にて示される。関連付け、見当識、探究などのカメラ動作の例が、Stasheff E.とBretz R.による著書『The Television Program: Its Direction and Production』、4版、Hill and Wang publishers、New York、1968年出版、において示されているので参照されたい。
【0016】
トラッキングは、パンとティルト動作に非常に類似する結果を達成するために使用することができる(ただし、厳密には同一でない)。トラッキングは、360 の全視野から対象を見るために使用される。パンとティルトの回転動作によって共有されないトラッキングの一つの特性として、深さの感覚の増加がある。これは、カメラが追跡(トラック)を行なうとき、カメラに近い対象がカメラから遠い対象よりも速く移動するように見えるために起こる。
【0017】
ズーム動作は、複数の目的を果たす。ズームイン動作は、対象の接近した視野を生成し、広い視野では見ることのできない詳細を提供する。一つのショットは、ズームレンズが広角位置にある状態にて開始され、一つ或は数個の対象の小さな視野を生成し、次に、一つの特定の対象の拡大された視野を得るためにズームインされ、結果として他の対象が排除される場合もある。大きな倍率の変化を伴うゆっくりしたズーム動作は、対象の、従って、観察可能な細部の倍率の連続した増加或は減少を与え、一方において、シーン内の複数の対象の相対位置に関する追加の情報を供給する。ズームアウト動作は、対象の周囲の視野を提供するため、或はそのシーン内に他の対象を入れるために使用される。
ズームとドリー動作は両方とも、視野と倍率を変化させる。ドリー動作によって生成される倍率の程度はカメラと対象との間の距離に依存し、一方、ズーム動作によって生成される倍率の程度は、距離には独立であり、レンズの焦点長の変化のみの関数である。
【0018】
映像へのカメラ動作の効果
上に説明の個々のカメラ動作は、そのカメラによって生成されるフレームに特有の効果を与える。ここでの説明の目的に対してはカメラの移動についてのみ考察されるが、全体としての動きは、カメラの動きと対象の動きが複合されたものである。カメラの動きを抽出するために使用されるこの方法は、カメラの動きと、対象の動きを判別する能力を持つ。
カメラのパン動作は、映像に水平シフトを与える。全ての静止している対象(及び背景)は、カメラに対するそれらの位置とは無関係に、同一の量だけ移動する。映像のこの水平シフトは、以降、“映像パン”と呼ばれる。映像パンの結果として、映像の内容の一部分が左右に外れ、それぞれ、左右から新しい内容が入る。
【0019】
カメラティルト動作は、映像に垂直シフトを与える。パンの場合と同様に、全ての静止している対象は、同一の量だけ移動する。映像のこのシフトは、以降、“映像ティルト”と呼ばれる。映像ティルトの結果として、映像の一部分が上下に外れ、それぞれ、上下から新しい映像が入る。
水平線に沿ってのカメラトラッキング動作は、映像内の対象を水平にシフトさせる。ただし、カメラのパン動作とは異なり、カメラに接近した対象は、カメラから離れた対象よりも大きくシフトする。対象のシフトの変動は、対象からカメラまでの距離の変動が小さいと小さくなる。この発明の目的に対しては、水平トラッキングはカメラパンと同一に扱われ、映像へのこれらの効果は、以降、集合的に“映像パン”と呼ばれる。同様に、垂直線に沿ってのカメラのトラッキング動作は、“映像ティルト”を与える。対角線(或は曲線)に沿ってのカメラトラッキング動作は、映像パンと映像ティルトの両方を与える。
【0020】
カメラのズーム動作は、映像内の対象の倍率に変化を与える。ズームイン動作の場合は、倍率が増加する。これには、対象の映像の中央から逃げる方向の見掛けの径方向の移動が伴ない、場合によっては、存在していた幾つかの対象が映像から外れる。ズームアウト動作は、ズームイン動作のそれと反対の効果を与え、映像内に新しい対象が出現する。カメラのズーム動作或はドリー動作に起因する対象の倍率の変化は“映像ズーム”と呼ばれる。
【0021】
検出基準
カメラ移動誘発シーン変化を決定するための基準は、それらのカメラ移動の意図と、映像に対するそれらの効果に基づく。本発明の目的に対しては、カメラ移動は、それらの意図に基づいて以下に述べられるように二つの異なる範疇に分割される。
カメラ移動の第一の範疇は、最終結果のみが意味を持つカメラ動作から成る。例えば、パン及び/ティルト、或はトラッキング動作は、しばしば、対象の動きを追跡するために使用され、従って、対象が移動を中止すると、カメラも移動を中止する。このケースにおいては、カメラ移動の最終結果のみが重要である。別の例は、パン或はティルト動作が、“関連付け”に使用された場合に見られる。このケースにおいては、カメラの移動が、二つの隣接するショット間のゆるやかな遷移(例えば、ディゾルブ:画面が暗くなるのにオーバーラップして次の場面が現われる場面転換法)に類似する役割を果し、カメラ動作の終端は、新たなシーンの開始となる。さらにもう一つの例は、ズームイン動作が、そのシーン内に最初に出現した対象(例えば、ホテルの部屋のドア)の拡大された光景を得て、細部(例えば、部屋の番号)を観察できるように使用される場合に見られる。
【0022】
カメラ動作の第二の範疇は、カメラ動作の進行中に起こる映像の見える内容の変化が重要であるカメラ動作から成る。これらカメラ移動には、上に定義されたように、“見当識”或は“探究”の目的に対する大きなパンとティルト移動が含まれる。この範疇には、倍率に大きな変化が見られるゆるやかなズームイン動作も含まれる。これらのケースにおいては、隣接するフレームの内容は非常に類似するが、一方、かなり離れたフレームは、大きなパン、ティルト或はズーム動作の結果として、最初に存在した対象がカメラの視野から排除され、最初に存在しなかった新しい対象が導入されるために、内容が大きく異なることがある。このような内容の変化は、単一のショットの間に何回も発生し、一つの継続したカメラ動作の最中においてさえも数回発生することがある。
【0023】
注目すべき点は、上に説明のカメラ動作の二つの範疇が互いに排他的でないことである。つまり、フレーム内容の変化がカメラ移動の最中、並びにカメラ移動の終端において大くなるようなカメラ動作がしばしば見られる。カメラ動作の二つの範疇が説明されたが、これに基づいてあるショット内のカメラ移動誘発シーン変化を検出するための基準が以下に説明される。
第一の範疇のカメラ移動によって生成されるシーン変化は、以下のように検出される。映像パン、映像ティルト、及び映像ズームの各動作について、その期間を通じて動作が継続して能動である時間間隔(フレーム単位にて測定)が見つけられる。シーン変化は、二つの基準:つまり、1)能動間隔が終端した(つまり、カメラ移動が停止した)、及び2)現在のシーンの開始以来の累積効果が所定のしきい値に到達或はこれを超えた、という二つの基準が満たされたときに検出される。第一の基準は、カメラ動作の終端を検出する。第二の基準は、正味の効果がシーン変化を正当化するために充分な意味を持たないようなカメラ動作が起こったときに、シーン変化が生成されることを阻止するために課せられる。このような意味のない動作は、ジッタの結果として或は対象の小さな横方向の移動を補正するためにカメラが反復して左右にパンされたときになどに発生する。このようなカメラ動作の終端時には、映像パンの正味の量は小さく、従って、一つのシーン変化は生成されない。
【0024】
第二の範疇のカメラ移動によって生成されるシーン変化は以下の通りである。映像パン、映像ティルト、及び映像ズームの各動作について、現在のシーンの開始以来の与えられた動作の累積効果が所定のしきい値(これは、各動作に対して異なる可能性を持つ)に対して比較される。その動作に対する累積効果が各々の所定のしきい値に到達した或は超えたときにシーン変化が検出される。上記の第一の範疇とは異なり、このケースにおいては、動作がまだ進行中のときにシーン変化が生成されることがある。第二の範疇のカメラ動作に対して使用される所定のしきい値は、通常は、第一の範疇に対して使用されるそれよりもかなり大きくされる。第二のしきい値は、一つの大きなカメラ動作(或は複数の一連の小さな動作)の進行中に、映像に新たな内容が入るには、どれだけの量(値)の変化が要求されるかを決定する。例えば、探究或は見当識の目的のためのカメラパン動作の遂行においては、映像の幅に概ね等しい累積映像パン値が与えられたときに、結果として、映像の元の内容が外側に移動し、新しい内容が内部に移動する。この場合、映像パンのしきい値がその映像の幅と同一或は前後に選択された場合、適当な時点で新たなシーンが検出される。
【0025】
検出方法
図4はカメラ誘発シーン変化検出ステップ250内に含まれる詳細なステップの一例を示す流れ図である。最初に、ステップ400において、映像パン、映像ティルト、及び映像ズームの値が、現在のフレームと前のフレームを使用して決定される。これは、ビデオ番組の時間的に短縮してサンプリングされたバージョンを使用して行なうこともできる。これら値は、映像内の複数の時点において移動ベクトルを発見するためのブロック比較によって決定することができる。移動ベクトルの集合がさらに、対象の移動と、カメラの移動とを区別し、カメラ移動を、パン、ティルト、及びズーム成分に分解するために遂行される。これらの手続きは周知であり、例えば、Umori K.らによって、IEEE Transactions on Consu mer Electronics 、Vol.36、No.3、ページ510−519、1990年8月発行、に掲載の『Automatic Image Stabilizing System by Full−DigitalSignal Processing(全デジタル処理による自動映像安定化システム)』という標題の論文、及びAkutsu A.らによって、Proc. SPIE Conf. Visual Communications and Image Processing (VCIP’92)、Vol.1818、ページ1522−1530『Video Indexing Using Motion Vectors (移動ベクトルを使用してのビデオの索引付け)』という標題の論文に説明されている。
【0026】
Umori らの論文は、カメラ映像の安定化に係るものであり、移動の推定、対象の移動とカメラの移動の区別、及び映像パンと映像ティルトの測定のためのリアルタイムシステムを提供する。Akutsuらは、ブロック比較とハフ変換をショット検出と組合わせて使用することにより、単一ショット期間中のカメラ動作を表わす新たな映像イコンを生成してカメラ動作を推定するための方法を開示する。前述のように、カメラ移動がドリー或はトラッキング動作を伴う場合は、シーン内の異なる対象は、一続きのフレーム間で、異なる量だけ移動する。このようなケースにおいては、関心の中心は、最も支配的な対象(それが占拠する全映像に対する割合の観点から見た場合の)の移動におかれ、この支配的な対象の移動は、これらの上に述べた方法にて決定することができる。
【0027】
ステップ410において、二つのフレーム間のカメラ誘発移動が(これらが既に個別の成分として計算されてない場合は)、映像パン、映像ティルト、及び映像ズーム成分に分解される。これらの各成分について計算された値から、それぞれ、瞬間パン(IP)、瞬間ティルト(IT)、及び瞬間ズーム(IZ)と称される3つの離散時間信号が生成される。これら三組の瞬間信号を独立的に使用して、ステップ420、430、440において、追加の二つの組の信号が生成される。第一の組は、現シーンの開始時におけるその瞬間信号の値から開始してのこれら3つの瞬間信号の一つの値の総和に等しい値を持つ3つの累積信号から構成され、これら信号は、それぞれ、累積パン(CP)、累積ティルト(CT)、及び累積ズーム信号と称される。第二の組の信号は、各々がカメラ移動の3つの成分(つまり、パン、ティルト及びズーム)の一つに対応する3つの二進値信号(つまり、各々が2つの値のみを持つ信号)から構成される。これら信号は、対応する移動が使用されてない(つまり、能動でない)場合は、0に設定され、一方、移動が使用されている場合は、1に設定される。これら信号は、それぞれ、パン能動(PA)、ティルト能動(TA)、及びズーム能動(ZA)信号と称される。本発明の幾つかの例においては、PA、TA、ZA信号を生成する場合には、二つの能動の間隔内に入る短い能動でない間隔を排除し、これらの二つの能動の間隔が一つの大きな能動の間隔に併合されるように追加のステップを使用する。
【0028】
本発明の検出方法は、3つの独立したステップを含むが、これらの各々のステップは、カメラ移動の3つの成分の一つに対応する。図4において、これらステップは、映像パン410、映像ティルト430、及び映像ズームステップとして示される。パン、ティルト、及びズームに基づくシーン変化検出の副ステップは、しきい値パラメータが互いに異なることを除いて全て実質的に同一である。従って、以下においては、パンに基づく検出と関連するステップのみをより詳細に説明し、必要である場合、これと残りの二つの成分の間の差異を指摘することで充分であると考える。
【0029】
図5には図4の映像パンステップ420の詳細が示される。最初に、ステップ500において、累積パン(CP)信号の新たな値が前の値から、前の値に瞬間パン信号の新しい値を加えることによって生成される。この累積値は、この方法の開始時と、シーン変化の検出の後の両方において、つまり、ステップ210と310で初期化される。注目すべき点は、IP信号はパンの方向によって正及び負の数の両方を取ることである。従って、CP信号は、正或は負となり、その大きさは、新たなIP値がCP値に加えられたとき、増加或は減少する。
ステップ510において、IP信号を使用してパン能動(AP)信号の新しい値が生成される。この信号は、パン動作が能動でない間隔では0の値を持ち、能動の間隔においては1の値を取る。上に述べたように、接近して位置する能動の間隔を単一の間隔に併合し、これら間隔の終端を検出するために追加のステップが使用される。パン能動ステップ510の詳細については、図6に示され、後に説明される。
【0030】
ステップ520において、CP信号の大きさが所定のしきい値Tp1に比較される。CP信号の大きさがTp1に達した或はこれを超えた場合は、カメラ動作の第二の範疇に属するシーン変化が示される。このケースにおいては、PA信号の値は使用されない。CP信号のこのしきい値への到達は、現在のシーンの最中に発生する、一つの能動パン間隔、或は複数の離散した能動間隔のいずれかの結果として起こる。
カメラ動作の第二の範疇に属するシーン変化が検出されなかった場合は、この方法は、ステップ530において、能動パン間隔の終端がステップ510において示されたかチェックする。終端が検出された場合は、ステップ540においてCP信号の大きさが所定のしきい値Tp2に比較される。このしきい値に到達或は超えている場合は、カメラ動作の第一の範疇に属するシーン変化が示される。ステップ540は、無視できるような正味効果を持つ複数の能動パン間隔が一つのシーン変化として登録されることを阻止するために使用される。このような無視できるカメラ動作の例については既に説明した。
【0031】
図6はパン能動ステップの詳細を示す。IP信号の現在の値を使用して、ステップ600、610、及び620において、PA信号に対する新しい値が生成される。0でないIP信号の値(正或は負)は、パンが能動であることを示し、従って、PA信号に対して1の値が与えられ、一方、IP信号に対する値が0の場合は、0のPA値が与えれる。ノイズ或は他の要因によってIP信号がカメラが移動してないのに小さな0でない値を示すような幾つかの状況においては、ステップ600を修正して、IP信号の大きさをその小さな0でない値と比較するチェックを行ない、パン動作能動、或は非能動が決定される。
【0032】
次に、PA信号がさらに、接近して位置する能動間隔を併合し、これら間隔の終端を検出するために処理される。PA信号の新しい値がステップ630においてチェックされる。PA信号が0でない場合は、ステップ640において、PAカウンタと称されるカウンタが所定の整数値Np(1よりも大)にセットされる。このカウンタは、ステップ210と310において0にセットされる。Npの値は、二つの一続きの能動領域を併合するために埋められる能動でない領域(つまり、PA=0)の最大サイズを決定する。PA信号が0である場合は、ステップ640は遂行されない。PA カウンタが次にステップ650において1だけ減分され、ステップ660においてその結果がチェックされる。正のカウンタ値は、PA信号が現在1にセットされているか、或はこれがNp回のフレーム時間において少なくとも既に一回は1にセットされたことを示す。これは、結果として、(ステップ610においてそれが既に1にセットされてない場合は)、PA信号を1にセットし、こうして、接近して位置する複数の能動間隔を併合する。PA カウンタの負の値は、ステップ650の以前にカウンタが0であったことを示す。これは、結果として、ステップ670においてカウンタを再度0にセットさせ、ステップ695において、PA信号を0にセットさせる。ステップ660におけるカウンタに対する0の値は、カウンタがステップ660の以前に1の値を持ったことがあることを示す。これは、ステップ680における能動間隔の終端を示す。パン能動ステップ510の終了時において、PA信号に対する現在の(処理された)値が生成され、存在する場合は、一つの能動パン間隔の終端が検出される。
【0033】
図7は、各々が異なる状況を表わす、I(左側)とII(右側)によって示される二つの異なる領域内における瞬間パン信号とこれから導出された信号に対する典型的な波形の例を示す。領域Iは、一方向において発生する一つの連続したパン動作に対するIP信号700を示す。この信号に沿っての二つのポイント702において、IP信号は非常に短い時間期間だけ0になる。これらポイント702は、これらの時点において処理すべき良好のフレームが存在しないため、或は動作が非常に短い時間停止しその後再開されたために起こる。これと関連するPA信号710は、ポイント702に起因する二つの能動でない間隔を持つ。これらの能動でない間隔は、ポイント702と関連する1から0への二つの遷移712と、間隔の終端713を持つ。720を生成するためにPA信号を処理することによって、この2つの能動でない間隔が排除される。能動パン間隔の終端723は、間隔の終端713に対応し、処理に起因して713に対して僅かにシフトされる。CP信号730は、シーンの開始において0の値を持つが、IP値の総和である。能動のパン間隔の終端723において、CP信号730は、Tp2しきい値735を超える。この結果として、シーン変化が示され、検出器が再初期化され、結果として、CP信号(並びに他の累積信号、能動信号、及びカウンタ)がポイント733において0にセットされる。処理されたPA信号720は、能動パン間隔の終端に対応するポイント724を持つ。ただし、このケースにおいては、CP信号は、パン移動の方向の反転に起因する変動を持つが、Tp2しきい値より低い値730を持ち、偽の検出が回避される。
【0034】
図8は第一と第二の範疇の両方に属するシーン変化が検出されるような状況における典型的な波形の一例を示す。IP信号700は、このケースにおいては、長期間に渡って維持された一つのパン動作を示す。これは、処理されたPA信号720に反映されるが、これは、823における長い能動間隔の終端を示す。CP信号は、Tp1しきい値に、一回目は、能動期間中の833によって示されるポイントにおいて到達する。この結果として、(第二の範疇に属する)シーン変化が検出される。CP信号は、この時点において0にリセットされ、再度、IP値の累積が開始される。Tp1しきい値に、それぞれ、ポイント834と835において、二度目、三度目と到達し、結果として、さらに二つのシーン変化が検出され、結果として、CP信号が0にセットされる。最後に、能動間隔の終端823において、CP信号はTp2しきい値を超えており、結果として、ポイント836においてもう一つのシーン変化が検出されるが、これは、カメラ移動の第一の範疇に属する。
【0035】
ティルトに基づくシーン変化の検出
ティルトとパンは、それらの移動の方向の差異を除いては本質的に同一である。従って、パンに基づく検出ステップとティルトに基づくステップは、これらが互いに異なるしきい値を持つことを除いて本質的に同一である。これらステップは、互いに独立して遂行される。
【0036】
ズームに基づくシーン変化の検出
カメラのズーム(或はドリー)が映像に与える効果は、パンとティルトが与える効果とは異なる。パン或はティルトに基づくシーン変化を検出するために使用されたショット内シーン変化の二つの範疇に対して上に確立された基準は、ズームに対しても同様に適用できる。ただし、ズームの場合は、瞬間ズーム(IZ)信号と累積ズーム(CZ)信号の計算の前に追加のステップが遂行されなければならない。この区別の理由が以下に説明される。
【0037】
パンとティルトは、映像に水平方向と垂直方向の移行運動を与える。この移行運動は、二つのフレーム間で測定されたとき、これらフレーム間のパン(或はティルト)動作が一方の方向であるときは正であり、これとは反対の方向のときは負である。従って、数個のフレームを通じて遂行される同一の大きさではあるが、ただし方向の異なるパン(或はティルト)動作は、累積パン(或はティルト)信号を計算するとき互いに相殺し合い、従って、現在のシーンの開始以来の0の正味移動となる。換言すれば、パンとティルトは、加算的成分である。ただし、二つのフレーム間の映像ズームは、乗算的成分である。例えば、一つのズーム動作の期間中の3つの一続きのフレームを考える。フレーム2の倍率がフレーム1のそれの二倍であり、フレーム3の倍率がフレーム2のそれの1.25倍である場合は、フレーム3のフレーム1に対する倍率は、2に1.25を掛けたもの、つまり、2.5倍である。従って、本発明の方法は、映像ズームに対して適用される場合は、瞬間ズーム信号(IZ)の各値を現在のフレームと前のフレームの間の相対的倍率の対数に等しくセットされる。この結果として、倍率が同一に留まる場合(つまり、相対倍率が1に等しく、対数が0となる場合)、IZ信号に対する値は、0となる。倍率が増大すると(つまり、倍率係数が1よりも大きな場合は)、対数は正となり、他方、倍率が縮小する場合は、対数は負となる。従って、ズーム能動(ZA)信号と累積ズーム(CZ)信号は、上に説明のパンに基づく移動に対するのと同一の方法にて計算されるが、ただし、IZ信号を生成するために対数を計算するためのこの追加のステップが要求される。
【0038】
上の議論は、カメラ誘発移動のパン、ティルト、及びズーム成分の各々を互いに独立して扱う。ただし、これは、本発明によって規定される検出基準が、これら成分の幾つかの組合わせに対して適用されることを排除することを意味するものではない。例えば、パンとティルト成分を結合して一つの移動ベクトル生成し、この結果として得られるベクトルの大きさを本発明の検出方法において使用することもできる。
【0039】
用途
ショット境界検出法はビデオ番組に対する索引を生成するために使用することができる。これら索引はビデオ番組から個々のショットを選択的に検索するために使用することができる。本発明は、ショット内の個々のシーンに対する索引を生成することによる第二のレベルの索引付けを提供する。これら両方のレベルの索引を提供することによって、より選択性の高いビデオ情報検索システムを提供することが可能である。本発明の方法の索引付け以外の他の用途も可能であり、これらの幾つかについて以下に説明される。
【0040】
各シーン(ショット境界とショット内シーン境界の観点から定義された)からの単一のフレームを保持しながら、元のフレームの列から代表フレームの列を生成することが可能である。この代表フレームの列は、元のフレーム列の内容(例えば、ビデオ番組)が大きな変化を被ったようなフレームを含む。一続きの代表フレーム間の時間的な距離は、二つの一続きの代表フレームの間に位置する元のフレーム列内フレームの内容の変化の速度の関数である。つまり、内容が急速に変化する場合は、より多くの代表映像が保持され、一方、内容があまり速く変化しない場合は、より少ない代表映像が保持される。信号処理の視点からは、この状況は、例えばビデオ番組の、一様な間隔のサンプル(例えば、NTSCビデオの毎秒当り30のフレーム)を持つ一様にサンプリングされたソースからの、かなり少数のサンプルへの、一様でない再サンプリング(或はダウンサンプリング)であると見ることができる。この少数のサンプルは、集合的に、元のビデオ番組内に含まれる視覚情報の殆どを含む。従って、本発明の方法に従って生成されたセットの代表映像は、元のビデオ番組の濃縮版と見なすことができる。この方法にて得られたセットの静止映像は、複数の映像圧縮技術の任意の技術(例えば、JPEG)を使用して処理することにより、さらに格納及び伝送要件を低減することができる。
【0041】
一般的には、保持されるべき特定の代表映像の決定に採用される基準は、何がビデオセグメントの内容の変化を構成するか、或はどんなタイプの変化が重要であると見なされるかを決定するために使用される基準に依存する。使用される特定の基準は、代表フレームを保持するための動機によっても異なる。例えば、幾つかの用途においては、人物の顔の表情などのような微妙な細部が重要であると考えられ、このような変化の検出が、ある特定の映像技術では不可能な高度で複雑なレベルの処理を必要とする可能性はあるが、ただし、本発明の方法によって規定される基準は、ビデオ番組内の大多数のコンテキストの変化を検出するための良く定義された実際的な方法を与える。代表フレーム内に含まれる情報は、それ自体では完全なものではないかもしれないが、これらのフレームが、例えば、マルチメディアデータ内の視覚要素として使用された場合、この組合わせは豊かな情報源と成り得る。ダウンサンプリング処理の結果としての幾らかの視覚情報の潜在的な損失は、しばしば、格納及び伝送要件のかなりの低減が達成されることを前提に正当化される。
【0042】
本発明のマルチメディアビデオ番組と関連する幾つかの用途例が以下に説明される。例えば、本発明によって得られたセットの代表映像は、恐らくは、圧縮された形式にて、音響及び/或はテキスト(これらも圧縮された形式)との関連で使用され、コンピュータ或はワークステーション上に濃縮されたマルチメディア番組として格納することができる。元の番組の濃縮版は、検索して、コンピュータ上に表示することができる。代表フレームは、コンピュータ画面上に音響を伴って表示され、音響は、スピーカを通じてフレームとの適切な同期にて伝えられる。コンピュータに格納された代表フレームは、番組を所望のポイントに早送り或は巻き戻しするための索引として使用することもできる。ビデオ番組のデジタル的に格納・圧縮されたマルチメディア版は、別のワークステーションによって遠隔地から簡単にアクセスすることができる。
【0043】
生のビデオ番組の濃縮されたマルチメディア版をリアルタイムにて生成し、帯域制限された伝送ラインを使用して遠隔地に伝送することもできる。これは、遠隔ユーザが、静止映像を表示しまた音響を再生することができるビデオ電話或はコンピュータを使用して、電話回線を通じて生の放送にアクセスすることを可能にする。
ビデオ番組或はビデオセグメントの内容に基づく再サンプリングは、映像データベースやビデオデータベースにも適用することができる。映像データベースは、フレーム或は映像の集合から構成されるが、これに関して内容に基づく照会を遂行することができる。照会に応答して映像から情報を取り出すためには、通常、データベース内の映像の多数のセグメントに関して映像処理と解釈を遂行することが必要である。映像処理と解釈の動作の高い計算コストのために処理できる映像の数には制約がある。従って、ビデオ番組の集成に対して、個々のフレームの処理によってこれらの動作を遂行することは、ビデオセグメント内に含まれるフレームの数が大きいために非常に困難である。ところが、本発明の内容に基づく再サンプリング法を使用すると、個々のビデオセグメントをより少数の映像に低減することができるが、こうして濃縮された映像に対して、内容に基づく照会を行なう方法の方がより現実的であると考えられる。
【図面の簡単な説明】
【図1】本発明に従う一例としてのカメラ誘発シーン変化検出器のブロック図を示すが、ビデオ源とアプリケーションインターフェースも示される。
【図2】単一のショットに関して動作する本発明の方法の一例を図解するフローチャートである。
【図3】ショット境界検出器との関連でショット境界の所のシーン変化とショット内の位置でのシーン変化を検出するために動作する本発明の一例を図解するフローチャートである。
【図4】カメラ誘発シーン変化の検出において使用される詳細なステップの一例を図解するフローチャートである。
【図5】パンに基づくシーン変化の検出において使用される追加の詳細ステップの一例を図解するフローチャートである。
【図6】複数の接近した能動間隔から単一のパン能動信号を生成するための詳細システムを図解するフローチャートである。
【図7】映像パン信号に対する一例としての波形であるが、それぞれ、複数の接近した能動間隔を併合するための処理の前と後の関連するパン能動信号、及び一つの能動間隔の終端においてシーン変化を与える累積パン信号が示される。
【図8】一つの持続されたパン動作中の映像パン信号の一例であるが、それぞれ、複数の接近した能動間隔の前と後の関連するパン能動信号と累積パン信号が示される。4つのシーン変化の内の3つはこの一つの能動間隔の最中に発生することがわかる。
【符号の説明】
1 ビデオソース
3 映像デジタル化装置
4 映像プロセッサ
5 プロセッサ
6 映像メモリ
7 デジタルコンピュータ
8 シーン変化検出アプリケーション

Claims (21)

  1. 内容からなる視覚情報を帯びる一連のフレームにおけるシーンの変化が、2つの連続するショット間のショット境界におけるショット境界シーン変化であるか、内容の変化がカメラ誘発移動の結果と考慮できるショット内の点におけるカメラ誘発移動シーン変化であるかを決定する方法であって、この方法が、
    (a)2つの連続するショット間のショット境界に応動して、2つの連続するショット間のシーン変化を示すショット境界シーン変化指示信号を生成するステップと、
    (b)2つの連続するショットの特定のショット内のカメラ誘発移動に応動して、特定のショット内の前記視覚情報を帯びる一連のフレーム内の複数のフレーム対の各々の間のカメラ誘発移動を表す第1の信号を生成するステップと、
    (c)複数のフレーム対に対する第1の信号によって表されるカメラ誘発移動を少なくとも第1の成分信号へ分解するステップと、
    (d)フレーム対の各々に対する第1の成分信号の値を総和して第1の累積信号を形成するステップと、
    (e)第1の累積信号が所定の決定基準と合致するときには、連続するショットの特定のショット内のシーン変化を示すカメラ誘発移動シーン変化指示信号を生成する段階とからなり、
    特定のショットは、連続する時間間隔の間に単一のカメラによって生成された複数の連続フレームからなることを特徴とする方法。
  2. 内容からなる視覚情報を帯びる一連のフレームにおけるシーンの変化が、2つの連続するショット間のショット境界におけるショット境界シーン変化か、内容の変化がカメラ誘発移動の結果と考慮できるショット内におけるカメラ誘発シーン変化かを決定する方法であって、この方法が、
    (a)2つの連続するショット間のショット境界に応動して、ショット境界シーン変化指示信号を生成するステップと、
    (b)ショット境界によって規定される連続するショットの特定のショット内のカメラ誘発移動の発生に応動して、特定のショット内の前記視覚情報を帯びる一連のフレーム内の複数のフレーム対の各々の間のカメラ誘発移動を表す信号を生成するステップと、
    (c)複数のフレーム対に対する第1の信号によって表されるカメラ誘発移動を映像パン、映像ティルトおよび映像ズームの値を表す成分へ分解して、映像パン信号、映像ティルト信号および映像ズーム信号を形成するステップと、
    (d)映像パン信号、映像ティルト信号および映像ズーム信号の各々をそれぞれ総和して、累積パン信号、累積ティルト信号および累積ズーム信号を形成するするステップと、
    (e)前記累積信号の少なくとも1つが所定の決定基準と合致するときには、連続するショットの1つ内のシーン変化を示すカメラ誘発移動シーン変化指示を生成するステップとからなり、
    特定のショットは、連続する時間間隔の間に単一のカメラによって生成された複数の連続フレームからなることを特徴とする方法。
  3. 請求項1に記載の方法であって、さらに、
    (f)カメラ誘発移動の第2および第3の成分に対してステップ(c)を繰り返して第2および第3の成分信号を生成するステップからなり、第1、第2および第3の成分は、それぞれ映像パン、映像ティルトおよび映像ズームを表すものであり、さらに、
    (g)第2および第3の成分に対してステップ(d)を繰り返して第2および第3の累積信号をそれぞれ生成するステップからなり、
    ステップ(e)は、第1、第2および第3の累積信号の少なくとも1つが所定の決定基準と合致するときにはカメラ誘発移動シーン変化指示信号を生成するステップを含むことを特徴とする方法。
  4. 請求項1に記載の方法であって、さらに、
    (f)カメラ誘発移動の第1の成分に対応する第1の能動信号を少なくとも生成するステップからなり、前記第1の能動信号は第1および第2の値を有し、第1および第2の値は、それぞれカメラ誘発移動の第1の成分に対するカメラ誘発移動の不存在とカメラ誘発移動の存在とを示すものであり、
    カメラ誘発移動シーン変化指示信号を生成するステップは、第1の能動信号と第1の累積信号の各々がある決定基準と合致するときには、カメラ誘発移動シーン変化指示信号を生成するステップを含むことを特徴とする方法。
  5. 請求項に記載の方法であって、さらに、
    (g)カメラ誘発移動の第2および第3の成分に対してステップ(c)を繰り返して第2および第3の成分信号を形成するステップからなり、第1、第2および第3の成分は、それぞれ映像パン、映像ティルトおよび映像ズームを表すものであり、さらに、
    (h)第2および第3の成分に対してステップ(d)を繰り返して第2および第3の累積信号をそれぞれ形成するステップと、
    (i)ステップ(f)を繰り返してカメラ移動の第2および第3の成分のそれぞれに対応する第2および第3の能動信号を決定するステップとからなり、
    カメラ誘発移動シーン変化指示信号を生成するステップは、第1、第2および第3の能動信号の少なくとも1つと、第1、第2および第3の能動信号の少なくとも1つと同じカメラ誘発移動の成分を表す累積信号との各々が所定の決定基準と合致するときには、カメラ誘発移動シーン変化指示信号を生成するステップからなることを特徴とする方法。
  6. 請求項に記載の方法において、所定の決定基準が、累積信号の各々に対する所定のしきい値からなり、第1、第2または第3の累積信号の少なくとも1つがその対応する所定のしきい値と少なくとも同じ大きさを有するときには、前記決定基準が満たされることを特徴とする方法。
  7. 請求項に記載の方法において、カメラ誘発移動シーン変化指示信号を生成するステップはさらに、
    ある間隔の終端の後にカメラ誘発移動シーン変化指示信号を生成するステップからなり、前記ある間隔は、能動信号の少なくとも1つがその第2の値をとり、そして能動間隔の終端において少なくとも1つの能動信号と同じカメラ誘発移動の成分を表す対応する累積信号が所定のしきい値と少なくとも同じ大きさである間隔であることを特徴とする方法。
  8. 請求項2に記載の方法であって、さらに、
    (f)映像パン成分、映像ティルト成分、および映像ズーム成分の各々に対する能動信号を生成するステップからなり、前記能動信号の各々は第1および第2の値を有し、第1の値は零である大きさを有する成分を表し、そして第2の値は非零である大きさを有する成分を表すものであり、そして、
    カメラ誘発移動シーン変化指示信号を生成するステップは、能動信号の少なくとも1つと、少なくとも1つの能動信号と同じカメラ誘発移動の成分を表す累積信号との各々が所定の決定基準と合致するときには、カメラ誘発移動シーン変化指示信号を生成するステップからなることを特徴とする方法。
  9. 請求項2に記載の方法において、累積信号の少なくとも1つの大きさが所定のしきい値を越えるときには、所定の決定基準が満たされることを特徴とする方法。
  10. 請求項2に記載の方法において、所定の決定基準は累積信号の各々に対する所定のしきい値からなり、累積信号の少なくとも1つがその対応する所定のしきい値を越えるときには前記決定基準が満たされることを特徴とする方法。
  11. 請求項に記載の方法であって、カメラ誘発移動シーン変化指示信号を生成する段階がさらに、
    ある間隔の終端の後にカメラ誘発移動シーン変化指示信号を生成するステップからなり、前記ある間隔は、能動信号の少なくとも1つがその第2の値をとり、そして能動間隔の終端において少なくとも1つの能動信号と同じカメラ誘発移動の成分を表す対応する累積信号が所定のしきい値と少なくとも同じ大きさである間隔であることを特徴とする方法。
  12. 請求項2に記載の方法において、第1の信号を生成する段階が、
    (a)フレーム対の各々の間で移動推定を行うステップと、
    (b)フレーム対の各々に対するカメラ誘発移動と物体移動とを区別するステップとからなることを特徴とする方法。
  13. 請求項1に記載の方法において、カメラ誘発移動シーン変化指示信号を生成する段階がさらに、示されたシーン変化によって規定されるシーンからのフレームを維持するステップからなることを特徴とする方法。
  14. 視覚情報を帯びる一連のフレームにおいて、シーン変化が、ショット境界シーン変化かカメラ誘発移動シーン変化かを決定する方法であって、この方法が、
    (a)2つの連続するショット間のショット境界に応動して、2つの連続するショット間のシーン変化を示すショット境界シーン変化指示信号を生成するステップと、
    (b)カメラ誘発移動に応動して、視覚情報を帯びる一連のフレーム内の複数のフレーム対の各々の間のカメラ誘発移動を示す第1の信号を発生するステップと、
    (c)複数のフレーム対に対する第1の信号によって表されるカメラ誘発移動を少なくとも第1の成分信号へ分解するステップと、
    (d)フレーム対の各々に対する第1の成分信号の値を総和して第1の累積信号を形成するステップと、
    (e)第1の累積信号が所定の決定基準と合致するときには、連続するショットの1つ内のシーン変化を示すカメラ誘発移動シーン変化指示信号を生成する段階と、
    (f)視覚情報を帯びる一連のフレーム内のカメラ誘発移動シーン変化の全てが示されるまで、ステップ(b)乃至(e)を繰り返すステップからなり、第1の成分信号の値を総和して第1の累積信号を形成するステップは、直前のカメラ誘発移動シーン変化の後に決定された第1の成分信号の値のみを総和するステップを含み、さらに、
    (g)視覚情報を帯びる一連のフレーム内のショット境界シーン変化とカメラ誘導移動シーン変化の全てが指示されるまで、ステップ(a)乃至(f)を繰り返すステップからなることを特徴とする方法。
  15. 請求項14に記載の方法であってさらに、示されたシーン変化によって規定される各々のシーンからのフレームを維持するステップからなることを特徴とする方法。
  16. 請求項14に記載の方法であってさらに、示されたシーン変化によって規定される各々のシーンからのフレームの位置を含む索引を形成するステップからなることを特徴とする方法。
  17. 請求項16に記載の方法であって、維持されたフレームは、マルチメディアデータの視覚成分からなる代表フレームのセットを形成することを特徴とする方法。
  18. 請求項に記載の方法であってさらに、
    (g)カメラ誘発移動の第2および第3の成分に対してステップ(c)を繰り返して第2および第3の成分信号を形成するステップからなり、第1、第2および第3の成分はそれぞれ、映像パン、映像ティルトおよび映像ズームを表すものであり、さらに、
    (h)第1、第2および第3の成分の組み合わせに対してステップ(d)を繰り返して組み合わせ累積信号を形成するステップと、
    (i)ステップ(f)を繰り返して組み合わせ累積信号に対応する組み合わせ能動信号を生成する段階とからなり、
    カメラ誘発移動シーン変化指示信号を生成する段階は、組み合わせ能動信号と組み合わせ累積信号の各々が所定の決定基準と合致するときにはカメラ誘発移動シーン変化指示信号を生成するステップを含むことを特徴とする方法。
  19. 視覚情報を帯びる一連のフレームにおいて、シーン変化が、ショット境界シーン変化かカメラ誘発移動シーン変化かを決定する方法であって、この方法は、
    (a)2つの連続するショット間のショット境界に応動して、2つの連続するショット間のシーン変化を示すショット境界シーン変化指示信号を生成するステップと、
    (b)カメラ誘発移動に応動して、視覚情報を帯びる一連のフレーム内の複数のフレーム対の各々の間のカメラ誘発移動を表す第1の信号を生成するステップと、
    (c)複数のフレーム対に対する第1の信号によって表されるカメラ誘発移動を少なくとも第1の成分信号へ分解するステップと、
    (d)フレーム対の各々に対する第1の成分信号の値を総和して第1の累積信号を生成するするステップと、
    (e)第1の累積信号が所定の決定基準と合致するときには、連続するショットの1つ内のシーン変化を示すカメラ誘発移動シーン変化指示信号を生成するステップと、
    (f)ステップ(b)へ進む前に、視覚情報を帯びる一連のフレーム内のショット境界シーン変化の全てが示されるまで、ステップ(a)を繰り返すステップからなることを特徴とする方法。
  20. 視覚情報を帯びる一連のフレームにおいて、シーン変化が、ショット境界シーン変化かカメラ誘発移動シーン変化かを決定する方法であって、この方法が、
    (a)2つの連続するショット間のショット境界に応動して、2つの連続するショット間のシーン変化を示すショット境界シーン変化指示信号を生成するステップと、
    (b)カメラ誘発移動に応動して、視覚情報を帯びる一連のフレーム内の複数のフレーム対の各々の間のカメラ誘発移動を表す第1の信号を生成するステップと、
    (c)複数のフレーム対に対する第1の信号によって表されるカメラ誘発移動を少なくとも第1の成分信号へ分解するステップと、
    (d)フレーム対の各々に対する第1の成分信号の値を総和して第1の累積信号を形成するステップと、
    (e)第1の累積信号が所定の決定基準に合致するときには、連続するショットの1つ内のシーン変化を示すカメラ誘発移動シーン変化指示信号を生成するステップと、
    (f)視覚情報を帯びる一連のフレーム内の複数のカメラ誘発移動シーン変化が指示されるまで、ステップ(b)乃至(e)を繰り返すステップからなり、第1の成分信号の値を総和して第1の累積信号を形成する段階は、直前のカメラ誘発移動シーン変化の後に決定された第1の成分信号の値のみを総和するステップからなり、さらに、
    (g)視覚情報を帯びる一連のフレーム内の複数のショット境界シーン変化とカメラ誘発移動シーン変化が示されるまで、ステップ(a)乃至(f)を繰り返すステップからなることを特徴とする方法。
  21. 視覚情報を帯びる一連のフレームにおいて、シーン変化が、ショット境界シーン変化かカメラ誘発移動シーン変化かを決定する方法であって、この方法は、
    (a)2つの連続するショット間のショット境界に応動して、2つの連続するショット間のシーン変化を示すショット境界シーン変化指示信号を生成するステップと、
    (b)カメラ誘発移動に応動して、視覚情報を帯びる一連のフレーム内の複数のフレーム対の各々の間のカメラ誘発移動を表す第1の信号を生成するステップと、
    (c)複数のフレーム対に対する第1の信号によって表されるカメラ誘発移動を少なくとも第1の成分信号へ分解するステップと、
    (d)フレーム対の各々に対する第1の成分信号の値を総和して第1の累積信号を形成するステップと、
    (e)第1の累積信号が所定の決定基準と合致するときには、連続するショットの1つ内のシーン変化を示すカメラ誘発移動シーン変化指示信号を生成するステップと、そして、
    (f)ステップ(b)へ進む前に、視覚情報を帯びる一連のフレーム内の複数のショット境界シーン変化が示されるまで、ステップ(a)を繰り返すステップからなることを特徴とする方法。
JP01657795A 1994-02-04 1995-02-03 カメラ移動誘発シーン変化を検出するための方法 Expired - Lifetime JP3554595B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/191,234 US6211912B1 (en) 1994-02-04 1994-02-04 Method for detecting camera-motion induced scene changes
US191234 1994-02-04

Publications (2)

Publication Number Publication Date
JPH07226877A JPH07226877A (ja) 1995-08-22
JP3554595B2 true JP3554595B2 (ja) 2004-08-18

Family

ID=22704664

Family Applications (1)

Application Number Title Priority Date Filing Date
JP01657795A Expired - Lifetime JP3554595B2 (ja) 1994-02-04 1995-02-03 カメラ移動誘発シーン変化を検出するための方法

Country Status (8)

Country Link
US (1) US6211912B1 (ja)
EP (1) EP0666687B1 (ja)
JP (1) JP3554595B2 (ja)
KR (1) KR100333993B1 (ja)
CA (1) CA2135938C (ja)
DE (1) DE69513541T2 (ja)
HK (1) HK1004508A1 (ja)
SG (1) SG43690A1 (ja)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6271892B1 (en) 1994-06-02 2001-08-07 Lucent Technologies Inc. Method and apparatus for compressing a sequence of information-bearing frames having at least two media
US7298425B2 (en) * 1998-03-26 2007-11-20 Micron Technology, Inc. Method for assisting video compression in a computer system
US6987545B1 (en) * 1998-03-26 2006-01-17 Micron Technology, Inc. Apparatus for assisting video compression in a computer system
AUPP340798A0 (en) * 1998-05-07 1998-05-28 Canon Kabushiki Kaisha Automated video interpretation system
JP2000059669A (ja) * 1998-08-07 2000-02-25 Canon Inc 画像処理装置、方法及びコンピュータ読み取り可能な記憶媒体
US8528019B1 (en) * 1999-11-18 2013-09-03 Koninklijke Philips N.V. Method and apparatus for audio/data/visual information
US6539055B1 (en) * 1999-12-03 2003-03-25 Intel Corporation Scene change detector for video data
US20040189804A1 (en) * 2000-02-16 2004-09-30 Borden George R. Method of selecting targets and generating feedback in object tracking systems
US7015976B1 (en) * 2000-08-07 2006-03-21 Ati International Srl Automatic panning of digital content while zoomed
US6700601B1 (en) * 2000-08-10 2004-03-02 Jps International, Inc. Method and apparatus for video communication over a limited bandwidth medium
US7414646B2 (en) 2000-08-10 2008-08-19 Jps International, Inc. Method and apparatus for video communication over a limited bandwidth medium
JP4366023B2 (ja) * 2001-03-16 2009-11-18 インターナショナル・ビジネス・マシーンズ・コーポレーション ビデオ・イメージの部分イメージ領域抽出方法、部分イメージ領域抽出システム、部分イメージ領域抽出のためのプログラム、抽出されたビデオ・イメージの配信方法およびコンテンツ作成方法
JP4497761B2 (ja) 2001-07-18 2010-07-07 キヤノン株式会社 画像処理装置及びインデックス作成方法
KR100415313B1 (ko) * 2001-12-24 2004-01-16 한국전자통신연구원 동영상에서 상관 정합과 시스템 모델을 이용한 광류와카메라 움직임 산출 장치
US20040100560A1 (en) * 2002-11-22 2004-05-27 Stavely Donald J. Tracking digital zoom in a digital video camera
US20040100563A1 (en) 2002-11-27 2004-05-27 Sezai Sablak Video tracking system and method
JP4112968B2 (ja) 2002-12-26 2008-07-02 富士通株式会社 ビデオテキスト処理装置
US7312819B2 (en) * 2003-11-24 2007-12-25 Microsoft Corporation Robust camera motion analysis for home video
KR101017362B1 (ko) * 2004-01-08 2011-02-28 삼성전자주식회사 다이나믹 영상 재생을 위한 자동 줌 장치 및 방법
US7742077B2 (en) * 2004-02-19 2010-06-22 Robert Bosch Gmbh Image stabilization system and method for a video camera
US7382400B2 (en) * 2004-02-19 2008-06-03 Robert Bosch Gmbh Image stabilization system and method for a video camera
US9210312B2 (en) 2004-06-02 2015-12-08 Bosch Security Systems, Inc. Virtual mask for use in autotracking video camera images
US20050270372A1 (en) * 2004-06-02 2005-12-08 Henninger Paul E Iii On-screen display and privacy masking apparatus and method
US8212872B2 (en) * 2004-06-02 2012-07-03 Robert Bosch Gmbh Transformable privacy mask for video camera images
US7733369B2 (en) * 2004-09-28 2010-06-08 Objectvideo, Inc. View handling in video surveillance systems
US7504965B1 (en) 2005-08-05 2009-03-17 Elsag North America, Llc Portable covert license plate reader
JP4818031B2 (ja) * 2005-10-27 2011-11-16 キヤノン株式会社 画像処理装置及び画像処理方法
JP4210954B2 (ja) * 2006-08-22 2009-01-21 ソニー株式会社 画像処理方法、画像処理方法のプログラム、画像処理方法のプログラムを記録した記録媒体及び画像処理装置
EP2063635A4 (en) * 2006-09-12 2009-12-09 Panasonic Corp CONTENT IMAGE FORMATION DEVICE
JP2008160564A (ja) * 2006-12-25 2008-07-10 Toshiba Corp カメラ装置およびカメラ装置におけるチャプタデータ生成方法
WO2008111308A1 (ja) * 2007-03-12 2008-09-18 Panasonic Corporation コンテンツ撮影装置
US20080255840A1 (en) * 2007-04-16 2008-10-16 Microsoft Corporation Video Nametags
US8526632B2 (en) * 2007-06-28 2013-09-03 Microsoft Corporation Microphone array for a camera speakerphone
US8330787B2 (en) 2007-06-29 2012-12-11 Microsoft Corporation Capture device movement compensation for speaker indexing
US8165416B2 (en) * 2007-06-29 2012-04-24 Microsoft Corporation Automatic gain and exposure control using region of interest detection
JP5050727B2 (ja) * 2007-08-22 2012-10-17 ソニー株式会社 画像表示装置
US8667455B1 (en) * 2010-06-11 2014-03-04 Worldwide Pro Ltd. Hierarchical visualization-based analysis of integrated circuits
US8922648B2 (en) 2010-08-26 2014-12-30 Honda Motor Co., Ltd. Rotation cancellation for moving obstacle detection
US20130104083A1 (en) * 2011-10-21 2013-04-25 Digital Artforms, Inc. Systems and methods for human-computer interaction using a two handed interface
US9131143B2 (en) * 2012-07-20 2015-09-08 Blackberry Limited Dynamic region of interest adaptation and image capture device providing same
WO2015025185A1 (en) * 2013-08-21 2015-02-26 Thomson Licensing Video display with pan function controlled by viewing direction
DE102014216511A1 (de) * 2014-08-20 2016-02-25 Carl Zeiss Meditec Ag Erstellen von Kapitelstrukturen für Videodaten mit Bildern aus einem Operationsmikroskop-Objektbereich
EP3264880B1 (en) * 2015-02-26 2020-11-18 FUJI Corporation Component-mounting device
US10951859B2 (en) 2018-05-30 2021-03-16 Microsoft Technology Licensing, Llc Videoconferencing device and method

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60143330A (ja) * 1983-12-29 1985-07-29 Matsushita Electric Ind Co Ltd 撮影装置
US4823184A (en) * 1984-04-09 1989-04-18 Corporate Communications Consultants, Inc. Color correction system and method with scene-change detection
DE3415685A1 (de) * 1984-04-27 1985-11-07 Licentia Patent-Verwaltungs-Gmbh, 6000 Frankfurt Verfahren zur szenenwechselerkennung in filmen und videoaufzeichnungen sowie zur ueberwachung von objekten mittels videokameras
GB2187913B (en) * 1984-09-07 1988-02-10 British Broadcasting Corp Measurement of film unsteadiness in a video signal
JP2977829B2 (ja) * 1989-01-11 1999-11-15 株式会社東芝 動画像再生装置および動画像再生方法
JP2861249B2 (ja) * 1989-05-11 1999-02-24 日本電気株式会社 画像変化検出方法および画像変化検出装置
US5099322A (en) * 1990-02-27 1992-03-24 Texas Instruments Incorporated Scene change detection system and method
US5192964A (en) * 1991-03-04 1993-03-09 Ricoh Company, Ltd. Camera having blurring movement correction mechanism
JP2677312B2 (ja) * 1991-03-11 1997-11-17 工業技術院長 カメラワーク検出方法
JP3103897B2 (ja) * 1991-03-19 2000-10-30 ソニー株式会社 手振れ補正装置および手振れ補正方法
US6055025A (en) * 1993-12-21 2000-04-25 Lucent Technologies, Inc. Method and apparatus for detecting abrupt and gradual scene changes in image sequences

Also Published As

Publication number Publication date
JPH07226877A (ja) 1995-08-22
HK1004508A1 (en) 1998-11-27
DE69513541T2 (de) 2000-07-06
SG43690A1 (en) 1997-11-14
EP0666687A3 (en) 1996-02-07
KR100333993B1 (ko) 2002-09-05
KR950033633A (ko) 1995-12-26
CA2135938A1 (en) 1995-08-05
DE69513541D1 (de) 2000-01-05
US6211912B1 (en) 2001-04-03
EP0666687A2 (en) 1995-08-09
EP0666687B1 (en) 1999-12-01
CA2135938C (en) 2000-10-31

Similar Documents

Publication Publication Date Title
JP3554595B2 (ja) カメラ移動誘発シーン変化を検出するための方法
JP4666784B2 (ja) ビデオシーケンスのキーフレーム抽出方法及びビデオシーケンスのキーフレーム抽出装置
US7469010B2 (en) Extracting key frames from a video sequence
US7231100B2 (en) Method of and apparatus for processing zoomed sequential images
JP3719933B2 (ja) 階層的ディジタル動画要約及び閲覧方法、並びにその装置
Tavanapong et al. Shot clustering techniques for story browsing
US6268864B1 (en) Linking a video and an animation
EP0509208B1 (en) Camera work detecting method
US6278466B1 (en) Creating animation from a video
US6081278A (en) Animation object having multiple resolution format
US7734144B2 (en) Method and apparatus for editing source video to provide video image stabilization
EP1979908A2 (en) Extracting key frame candidates from video clip
WO2005101315A1 (en) Providing a visual indication of the content of a video by analyzing a likely user intent
JPH0993588A (ja) 動画像処理方法
US8363726B2 (en) Electronic apparatus, motion vector detecting method, and program therefor
KR100313713B1 (ko) 화소샘플링을이용한시각율동생성방법
Kender et al. On the structure and analysis of home videos
EP1097568A2 (en) Creating animation from a video
JP3404803B2 (ja) 動画像記録媒体、静止画像抽出装置、動画像記録装置および静止画像自動抽出方法
Kim et al. Visual rhythm and shot verification
WO1999005865A1 (en) Content-based video access
JP3558886B2 (ja) 映像処理装置
Zhou et al. Shot Weave: A shot clustering technique for story browsing for large video databases
AU762791B2 (en) Extracting key frames from a video sequence
Zhang Video content analysis and retrieval

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20031022

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040217

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040303

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20040316

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040412

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040510

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080514

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080514

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080514

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090514

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090514

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100514

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110514

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120514

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130514

Year of fee payment: 9

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term