JPH10112864A - カメラワーク算出方法及び装置 - Google Patents
カメラワーク算出方法及び装置Info
- Publication number
- JPH10112864A JPH10112864A JP26404696A JP26404696A JPH10112864A JP H10112864 A JPH10112864 A JP H10112864A JP 26404696 A JP26404696 A JP 26404696A JP 26404696 A JP26404696 A JP 26404696A JP H10112864 A JPH10112864 A JP H10112864A
- Authority
- JP
- Japan
- Prior art keywords
- motion vector
- camera work
- information
- calculated
- motion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
映像圧縮符号化データから正しいカメラワーク情報を算
出できるカメラワーク算出方法を提供する。 【解決手段】 動き予測方式を用いた圧縮符号化方式に
よって符号化された映像圧縮符号化データからカメラワ
ーク情報を判定するカメラワーク算出方法において、前
記映像圧縮符号化データの中から、少なくとも動き予測
符号化時に算出された動きベクトルを含む符号化情報を
抽出する第1のステップと、前記第1のステップにおい
て、抽出された動きベクトルの中からカメラワークある
いは動被写体とは無関係な動きベクトルをノイズとして
除去する第2のステップと、前記第2のステップにおい
て、無関係な動きベクトルが除去された動きベクトルか
らカメラワーク情報を抽出する第3のステップとを具備
する。
Description
方法及び装置に係わり、特に、カメラワークと無関係な
動きベクトルを含む映像圧縮符号化データから正しいカ
メラワーク情報を算出するためのカメラワーク算出方法
及び装置に関する。
の内容を知るためには映像を時間順に全て見ていくしか
なかった。
ば、映像を飛ばし見したり、内容を大雑把に把握するた
めに役立つ。こうした映像分割の際に、映像をカット点
と呼ばれるシーンの変わり目で分割する方法が、下記公
報(イ)に記載されている。
分割するために、カメラワーク等によって映像の内容が
変化することを利用し、カメラワーク情報等の映像の動
き情報を基に映像を分割する方法が、下記文献(ロ)に
記載されている。
ット自動分割方法」 (ロ)「時系列オプティカルフローを用いた映像単位の
提案」(画像符号化シンポジウムPCSJ91) 一方、映像は大量の画像データ列を持っており、それら
を扱いやすくするために多くの映像圧縮符号化方法が提
案されている。その中でも、動き予測を含む符号化方法
であるMPEG方式は代表的な方法である。
における各予測符号化画像データでは各画像をマクロブ
ロック(MB)と呼ばれる部分領域に分割し、領域毎に
符号化を行う。
一つはIntraとよばれる画像内符号化方式であり、
一つはMC Codedとよばれる動きベクトルを用い
た予測符号化方式であり、一つはNo MC Code
dとよばれる動きベクトルを用いない予測符号化方式で
ある。
によって行われる。
No MC Coded” else MBType=”MC Coded” ここで、varはマクロブロック(MB)の画素値の分
散、vmcは動き予測を行った場合のフレーム間の画素
値の差の分散、v0は動き予測を用いない場合のフレー
ム間の画素値の分散であり、αはバイアス値で1.25
程度の値が用いられる。これらの選択は分散が小さい方
が符号化効率が向上することからこのような選択を行っ
ている。
て画像内容が変化している場合、前記した符号化方式の
選択によって、カメラワークや動き被写体等の動き情報
を反映する動きベクトルを用いた予測符号化が行われ
る。
を図11に示す。同図(a)は、原画像の中に静止被写
体が存在し、また、カメラワークが存在しない場合、同
図(b)は、原画像の中に静止被写体が存在し、また、
カメラワーク(パン)が存在する場合、同図(c)は、
原画像の中に動被写体が存在し、また、カメラワークが
存在しない場合を示している。
ワークが存在する原画像データ列からカメラワーク情報
を抽出する場合、従来は、一度復号化を行った後に、カ
メラワーク情報を抽出しており、コストのかかる計算処
理を必要としていた。
トル情報を用いて、カメラワーク情報などの動き情報を
算出する方法が、下記文献(ハ)または(ニ)に記載さ
れている。
抽出」(信学技報 IE96-25 P.69-) (ニ)「Video Parsing Using Compressed Data」(SPI
E Vol.2182 Image and Video Processing II 1994)
(ニ)に記載されている方法では、画像データは理想的
な環境下において符号化され、算出された動きベクトル
を対象に動き情報を算出している。
ズあるいは画面のちらつきが生じる。このため、実際に
カメラで撮影されたアナログ映像信号を符号化した映像
データを対象とした場合、画面のちらつきあるいはノイ
ズ等によって、動き情報とは無関係な動きベクトル(以
下、ノイズ動きベクトルと称す。)が多数出現する。
げとなるようなノイズ動きベクトルは、明度・輝度が一
様で数ブロックに渡る広い領域が存在する場合に多数出
現する。
成分が含まれている場合、各マクロブロック(MB)内
で、様々な画素値が分布しており、位置情報による予測
の拘束によって、画面のちらつきあるいはノイズにより
あまり大きな影響はうけず、ほぼ理想的な動き予測が行
われ、動きベクトルを得ることができる。
り、広く明度や色変化の少ない一様な領域が画像内に存
在する場合、理想的には、静止状態では動きベクトル
0、領域が相対的に移動している状態では領域内部で動
きベクトル0、輪郭部分で動きを反映した動きベクトル
が観察されるはずである。
のない一様な領域であるため、現実に符号化を行うと、
少しの画面のちらつきあるいはノイズが存在するだけ
で、フレーム間差分の画素値の分散が大きくなってしま
う。
値を持つ。さらに、画面のちらつきあるいはノイズはラ
ンダムに出現するため、この影響をうけて動きベクトル
もランダムに出現する。即ち、ノイズ動きベクトルが出
現する。
いる場合、理想的には0ベクトルしか出現しないはずで
あるが、一様な領域が存在すると実際の画像では、0ベ
クトルではなくランダムなノイズ動きベクトルが出現す
る。
出するには、前記したようなノイズ動きベクトルを除去
し、当該ノイズ成分が除去された修正動きベクトルか
ら、カメラワークの有無及びどのようなカメラワーク情
報が存在するのかを検出する処理が必要となる。
な方法は、動きベクトル成分の0ベクトルが多ければ画
像が静止、少なければカメラワークが発生しているとす
る方法である。しかし、この方法では、カメラは静止し
ているが、動被写体が存在する(被写体が静止していな
い)場合、カメラワークが存在すると判定してしまう可
能性がある。
は、ノイズ動きベクトルだけでなく被写体の動き情報も
除去する必要がある。
るためになされたものであり、本発明の目的は、カメラ
ワーク算出方法及び装置において、カメラワークと無関
係な動きベクトルを含む映像圧縮符号化データから正し
いカメラワーク情報を算出することが可能となる技術を
提供することにある。
な特徴は、本明細書の記述及び添付図面によって明らか
にする。
発明のうち、代表的なものの概要を簡単に説明すれば、
下記の通りである。
って符号化された映像圧縮符号化データからカメラワー
ク情報を判定するカメラワーク算出方法において、前記
映像圧縮符号化データの中から、少なくとも動き予測符
号化時に算出された動きベクトルを含む符号化情報を抽
出する第1のステップと、前記第1のステップにおい
て、抽出された動きベクトルの中からカメラワークある
いは動被写体とは無関係な動きベクトルをノイズとして
除去する第2のステップと、前記第2のステップにおい
て、無関係な動きベクトルが除去された動きベクトルか
らカメラワーク情報を抽出する第3のステップとを具備
する。
報には、さらに予測残差符号化係数情報が含まれ、前記
第2のステップにおいて、前記予測符号化時に算出され
た動きベクトルの中の対象動きベクトルを持つ領域に含
まれる符号化情報に基づき少なくとも1つの特徴量を算
出し、当該算出された特徴量と、当該算出された特徴量
に対して与えられた所定の閾値とを比較し、その比較結
果に基づいて、対象動きベクトルが動き情報に関わる動
きベクトルであるかどうかを判定する。
動きベクトルに対し、例えば、時間方向に連続して類似
特性を示す動きベクトルの個数を加算する等の、時間方
向への数学的な演算を施し、当該演算結果が所定の閾値
を上回る場合に、カメラワークが存在すると判定する。
動きベクトルからカメラワークを算出する際に、時間方
向に連続して類似特性を示す動きベクトルを解析し、カ
メラワーク情報を抽出する。
って符号化された映像圧縮符号化データからカメラワー
クの判定の有無を行うカメラワーク算出装置において、
前記映像圧縮符号化データの中から、少なくとも動き予
測符号化時に算出された動きベクトルを含む符号化情報
を抽出する符号化情報抽出部と、前記符号化情報抽出部
で抽出された動きベクトルの中からカメラワークあるい
は動被写体とは無関係な動きベクトルをノイズとして除
去するノイズ判定部と、前記ノイズ判定部で無関係な動
きベクトルが除去された動きベクトルからカメラワーク
情報を抽出するカメラワーク算出部とを具備する。
情報には、さらに予測残差符号化係数情報が含まれ、前
記ノイズ判定部は、前記予測符号化時に算出された動き
ベクトルの中の対象動きベクトルを持つ領域に含まれる
符号化情報に基づき少なくとも1つの特徴量を算出する
特徴量算出部を備え、前記ノイズ判定部は、前記特徴量
算出部で算出された特徴量と、当該特徴量算出部で算出
された特徴量に対して与えられた所定の閾値とを比較
し、その比較結果に基づいて、対象動きベクトルが動き
情報に関わる動きベクトルであるかどうかを判定する。
きベクトルに対し、例えば、時間方向に連続して類似特
性を示す動きベクトルの個数を加算する等の、時間方向
への数学的な演算を施し、当該演算結果が所定の閾値を
上回る場合に、カメラワークが存在すると判定する。
きベクトルからカメラワークを算出する際に、時間方向
に連続して類似特性を示す動きベクトルを解析し、カメ
ラワーク情報を抽出する。
れた動きベクトルの大きさ、前記予測符号化時に算出さ
れた動きベクトルの方向、予測残差符号化係数、あるい
は、それらの値に数学的な演算を施した値の中の少なく
とも1つである。
成分の大きさ、予測残差符号化係数のAC成分の大き
さ、予測残差符号化係数のAC成分のうち0でない成分
の個数、あるいは、対象動きベクトルに隣接する動きベ
クトルのうち、対象動きベクトルと特性が著しく類似し
ている隣接動きベクトルの個数である。
動被写体とは無関係な動きベクトルを含む動きベクトル
分布から、カメラワークあるいは動被写体とは無関係な
動きベクトルを除去し、無関係な動きベクトルが除去さ
れた動きベクトルから正しいカメラワークを反映する動
きベクトルを選択するようにしたので、理想的な環境下
でなくても、正しいカメラワーク情報を算出することが
でき、これにより原画像を復号化しなくても、原画像の
内容を推測することが可能となる。
出する際に得られた符号化情報から少なくとも1つの特
徴量(例えば、予測符号化時の動きベクトルの大きさ、
方向、予測残差符号化係数のDC成分の大きさ、予測残
差符号化係数のAC成分の大きさ、予測残差符号化係数
のAC成分のうち0でない成分の個数、あるいは、対象
動きベクトルに隣接する動きベクトルのうち、対象動き
ベクトルと特性が著しく類似している隣接動きベクトル
の個数等)を算出し、当該特徴量と、当該特徴量に対応
する閾値とを比較して、カメラワークあるいは動被写体
とは無関係な動きベクトルを除去するようにしたので、
これにより、カメラワークあるいは動被写体とは無関係
な動きベクトルを正確に判定することが可能となる。
る場合は、複数フレームにわたって、カメラワークを反
映するような動きベクトルが連続して出現することに着
目し、時間的に連続して類似特性を示す動きベクトルの
数に基づいて、カメラワークの判定を行い、また、時間
方向に連続して類似特性を示す動きベクトルを解析した
解析結果に基づいて、カメラワーク情報を抽出するよう
にしたので、これにより、カメラワークを正確に判定
し、さらに、カメラワーク情報を正確に抽出することが
可能となる。
施の形態を詳細に説明する。
全図において、同一機能を有するものは同一符号を付
け、その繰り返しの説明は省略する。
るカメラワーク算出方法を説明するための図である。
入力MPEGデータ列10から動きベクトルを有するフ
レーム間予測符号化画像データ列1のみを対象とする。
これらのフレーム間予測符号化画像データ列1から、符
号化情報抽出段階2で、動きベクトル、予測残差符号化
係数(DCT係数(DC成分およびAC成分))等の各
種符号化情報3を抽出する。
情報3に基づき、ノイズ動きベクトル除去段階4で、適
切な動きベクトルを選択する処理を行う。
どのような特性を持っているのかを示す特徴量5を算出
する。この特徴量5に基づいて、対象とする注目動きベ
クトルがカメラワークを反映している動きベクトルかど
うかを判定する。判定によってカメラワークを反映した
動きベクトル7を選択し、カメラワークを反映しない動
きベクトルをノイズ動きベクトルとして除去する。
算出段階8にてカメラワークの有無及びカメラワーク情
報(カメラワークの種類、方向)を算出する。
るカメラワーク算出装置を備える映像再生装置の概略構
成を示すブロック図である。
られているように、入力MPEGデータ列20は、可変
長復号器60、逆走査部61、逆量子化部62、逆DC
T部63、加算器64および動き補償部65により、可
変長復号化、逆量子化、逆DCT化、動き補償の処理を
経て、再生(復号化)画像データ列66となる。この再
生(復号化)画像データ列66は再生表示部67でディ
スプレイ上に表示される。
入力される符号化データは動き予測符号化方式を含む圧
縮符号化情報データであればよく、MPEG1及びMP
EG2のどちらでも、またH261やそれ以外の方式で
符号化されていても構わない。また、MPEGにおける
データフォーマットはフレーム間予測符号化でも、フィ
ールド間予測符号化のどちらでもよい。さらに、動き予
測方式は順方向、双方向、逆方向のいずれでもよく、動
き予測ベクトルを有していればよい。
PEGデータ列20は、IntraMB(マクロブロッ
ク)だけで構成されるI−pictureが1フレー
ム、フレーム間順方向動き予測符号化方式を採用してい
るP−pictureが14フレームからなる15フレ
ームを一つの単位とし、これらを1つのGOP(Gro
up of Picture)として構成する「IPP
PPPPPPPPPPPPIPPPPPPPPPPPP
PP」というデータフォーマットとする。
は、始めに、ショット単位分類部21で、逆量子化部6
2から出力されるDCT係数から、連続する同一カメラ
から撮影された映像ブロックであるショット単位(S
t,St+1,St+2,…)22に分類する。
単位22に分類する手法としては、例えば、「MPEG
2映像からのカット点検出法」(新倉、谷口、阿久津、
浜田、1996年電子情報通信学会秋期情報通信ソサィ
エティ大会)に記載されているような公知の手法を用い
ることができる。
ト単位22毎に、各ショットに含まれるフレーム間予測
符号化画像データ列(Pt,Pt+1,Pt+2,…)24を
抽出する。即ち、本実施の形態のカメラワーク算出装置
では、各ショットに含まれるフレーム間予測符号化画像
データ列24のみを処理の対象とする。
トに含まれるフレーム間予測符号化画像データ列24か
ら符号化情報を抽出する。
ctureに含まれる動きベクトル集合(Pt{v1,v
2,v3,v4,…},Pt+1{v1,v2,v3,v4,
…})26と、他の各種符号化情報としてDCT係数2
7を算出する。
トル集合26、DCT係数27に基づき、各P−pic
tureに含まれる動きベクトルの特徴量29を算出す
る。
28で得られた特徴量29に基づき、動きベクトル集合
の各ベクトル{v1,v2,v3,v4,…}がカメラワー
クを反映しない動きベクトル(以下、ノイズ動きベクト
ルと称す。)かどうかを判定し、動きベクトルがノイズ
動きベクトルであると判定された場合には、その動きベ
クトルを0ベクトルとして置き換え、ノイズ動きベクト
ルでない場合には、カメラワークを反映する動きベクト
ルとする。
びノイズ判定部30については後述する。
ズ判定部30から得られた修正動きベクトル(FPt
{v1,v2,v3,v4,…})31に基づき、カメラワ
ーク情報を算出する。
ット単位(St,St+1,St+2,…)22およびカメラ
ワーク算出部32からのカメラワーク情報は、再生表示
部67に入力され、これにより、再生表示部67におい
て、再生(復号化)画像データ列66を、ショット単位
あるいはカメラワーク単位で表示することができる。
特徴量29について説明する。
るカメラにより撮影された画像列の中の1つの画像を示
す模式図であり、また、図4は、図3に示す原画像を予
測符号化した時の動きベクトルの分布を示す図である。
一様な領域に発生している動きベクトルは、パンニング
とは無関係なベクトルである。本実施の形態では、この
ようなカメラワークを反映しない動きベクトルをノイズ
として扱う。
反映しない動きベクトル(ノイズ動きベクトル)は、明
度や色が一様で変化がない無地の領域が複数のマクロブ
ロック(MB)に渡って存在するような場合に、画像内
のちらつき、信号の乱れ等によって発生する。
る広く明度や色変化の少ない一様な領域が画像内に存在
する場合、理想的には0ベクトルしか算出されないはず
だが、そうならずに大きなベクトルとなるものをノイズ
動きベクトルとして除去する。
きさが大きく、元々明度や色変化が少ない領域の符号化
であるため、動き予測残差はちらつきによる非常に小さ
な値でしかなく、そのDCT係数もほとんどが0になる
という特徴を持っている。
て、動きベクトル{vi}の大きさL{vi}及び方向D
{vi}、DCT係数のDC成分DC{vi}、DCT係
数のAC成分の中で、「0」でないDCT係数の個数N
AC{vi}、注目動きベクトルと類似度が高い隣接する
マクロブロック(MB)に含まれる動きベクトルの個数
NS{vi}を用いる。
ック(MB)に含まれる動きベクトル{vj}との類似
度は、ベクトルの大きさの比LC{vi/vj}と、角度
C{vi/vj}に基づいて算出される。
(1),(2)式で表わされる。
を意味する。
弦を示し、同一方向を向いていればC{vi/vj}は1
に近づき、角度が異なれば1よりも小さい値を示す。
と、角度C{vi/vj}とは、それぞれ予め与えられて
いる閾値と比較し、所定の条件を満たしている場合に、
動きベクトル同士は類似しているとみなす。
る動きベクトルの個数を特徴量29の1つとし、ノイズ
であるかどうかの判定を行う。
施の形態では、空間的な上下左右方向のみを対象として
いるが、より空間的に広げたり、また時間的方向に拡張
しても構わない。
の判定には、特徴量算出部28で得られる、DCT係数
のDC成分DC{vi}、DCT係数のAC成分の中で
「0」でないDCT係数の個数NAC{vi}、注目動き
ベクトルと類似度が高い隣接するマクロブロック(M
B)に含まれる動きベクトルの個数NS{vi}を特徴量
29とし、それぞれの特徴量29が、それぞれに対して
与えられる閾値を満たすかどうかに基づいて、注目動き
ベクトルがノイズ動きベクトルであるかどうかを判定す
る。
す動きベクトルの中で、カメラワークと無関係なノイズ
動きベクトルの大半を除去することができる。
ノイズ動きベクトルと判定された動きベクトルを除去し
た後の動きベクトル分布を示す図である。
想的な環境においては、動きベクトルの角度別累積和の
値は、パンニングやチルティング方向と対応した特定の
角度にピークを示す。
び図5(B)から明らかなように、それぞれノイズ動き
ベクトル除去前とノイズ動きベクトル除去後の動きベク
トルの角度別累積和を比較するとノイズ動きベクトル除
去後の方が、パンニング方向と一致するピークが観察さ
れていることが分かる。
ルの方向と角度の定義は、図6に示す通りである。ま
た、角度別累積和の算出方法は、以下の示す通りであ
る。
ル、Angle(V)は動きベクトルの方向、Leng
th(V)は動きベクトルの長さ、Hist(Angl
e)が角度別累積和の成分を示す。
閾値の組み合わせを用いたが、他にも、上述の条件を反
映するような、例えば、DCT係数のAC成分の係数の
積、和、等を特徴量として用いても良い。
除去した後の修正動きベクトルから、カメラワーク算出
部32でカメラワークの有無を判定する。
部32において、カメラワークの有無を判定する手法を
説明するためのフローチャートである。
32において、カメラワークの有無を判定する手法を、
図7を用いて詳細に説明する。
t1の修正動きベクトル成分FPt1{vi}が入力さ
れたとする。
1)、当該変数(mb)に対応するマクロブロックの修
正動きベクトル成分FPt1{vi}が0ベクトルか否
かを判断し(ステップ42)、当該修正動きベクトル成
分FPt1{vi}が0ベクトルの場合には、Zero
カウンター(Zero)のカウント値を+1する(ステ
ップ43)。
i}が0ベクトルでない場合には、当該修正動きベクト
ル成分FPt1{vi}と過去のベクトル成分SPt1
−1{vi}とを比較する(ステップ44)。
れば類似動きベクトルフラグFiを+1し(ステップ4
5)、類似していなければ類似動きベクトルフラグFi
を0にセットする(ステップ46)。
フラグの数と閾値(ThMV)を比較し(ステップ4
7)、類似動きベクトルフラグFiのフラグの数が閾値
(ThMV)よりも大きい場合、数フレームに渡って動き
ベクトルが類似していると判断し、連続類似マクロブロ
ックカウンター(Counter)を+1する(ステッ
プ48)。
内に存在する、数フレームに渡って動きベクトルが類似
しているマクロブロック(MB)数をカウントする。
クロブロック(MB)について終了したか否かを判断し
(ステップ49)、一連の処理が各フレームの全マクロ
ブロック(MB)について終了していない場合には、変
数(mb)を+1して前記ステップ42ないしステップ
48を繰り返す。
ームの全マクロブロック(MB)について終了した場合
には、まず、0ベクトルのマクロブロック(MB)数
(Zeroカウンターのカウント値)と閾値(ThZer
o)とを比較する(ステップ51)。
ロブロック(MB)数が閾値(ThZero)を上回る場合
には、画面が静止しているとし、すなわちカメラワーク
が存在しなかったものと判断する(ステップ54)。
ロブロック(MB)数が閾値(ThZero)より小さい場
合には、連続類似ベクトルを持つマクロブロック(M
B)の個数(連続類似マクロブロックカンウターの値)
に基づいて、カメラワークが存在するかどうかを判定す
る(ステップ52)。
(MB)の個数が、閾値(ThCM)を超えている場合に
は、数フレームに渡って類似した連続ベクトルが連続し
て多数出現していると判断できるため、カメラワークが
存在したと判断し(ステップ53)、カメラワーク時の
動きベクトル分布の特徴からカメラワーク情報を算出す
る(ステップ58)。
(MB)の個数が、閾値(ThCM)を下回る場合には、
連続な動きベクトルではなく、個々にバラバラな動きベ
クトルが多数存在しているだけで、カメラワークの存在
によって出現した動きベクトルと異なるとし、カメラワ
ークは存在しなかったと判断する(ステップ54)。
判断し(ステップ55)、シーンチェンジが発生してい
ない場合には、Zeroカウンター(Zero)および
連続類似マクロブロックカウンター(Counter)
をクリアし、シーンチェンジが発生するまで各フレーム
について前記処理を繰り返す。
ンジが発生したと判断した場合には、Zeroカウンタ
ー(Zero)、連続類似マクロブロックカンター(C
ounter)および類似動きベクトルフラグFiをク
リアし、新しいシーンチェンジの下で再度カメラワーク
情報の検出を行う。
する原画像の推移の一例を示す模式図であり、対象MP
EG2フォーマット「IPPPPPPPPPPPPP
P」を約270フレームに渡って処理した例を示してい
る。
いるのかを示すために、周期的に出現するI−pict
ure毎に原画像の様子を模式図によって示したもので
ある。以下、説明のため、I−picture番号で、
映像の切り替わっている様子を示す。この例では、I−
picture番号1から14のあたりまでは右から左
へ被写体をトラックしながら撮影し、それが、I−pi
cture番号15のあたりからカメラワークがなくな
り、映像が静止している原画像の様子を示している。
picture番号1から14のあたりまでは、右から
左へのパンニングによるカメラワークが発生している。
形態により、実際に検出された0ベクトルを持つマクロ
ブロック(MB)数の変化と、連続類似ベクトルを持つ
マクロブロック(MB)数の変化の一例を示す図であ
る。
移を反映して、0ベクトルを持つマクロブロック(M
B)の数、および、連続類似ベクトルを持つマクロブロ
ック(MB)の数もI−picture番号15の周辺
で、それぞれ増加及び減少している。
e番号16とI−picture番号17との間で、0
ベクトルを持つマクロブロック(MB)数が一瞬減少し
ている。これは、画像中の被写体が動くことによって生
じたものである。
トルを持つマクロブロック(MB)数には、この変化は
反映されないので、2つの処理を組み合わせることでよ
り精度の高い処理を行うことができる。
連続する連続類似ベクトルから、カメラワーク情報を抽
出する方法について説明する。
0で、ノイズと判定された大半の動きベクトルは除去さ
れており、さらに、動きベクトルは、時間方向に類似し
たベクトルが連続であるもののみを対象としているた
め、瞬間的に発生した動きベクトルは除去されている。
したがって、グローバルな動きベクトルのみが対象とし
て残されている。
ルな動きに関連する動きベクトル集合に対し、これら連
続類似ベクトルの分散を評価し、カメラワークがチルト
乃至パンなどの平行移動系のカメラワークなのか、ズー
ム乃至ドリー等の前後進移動系のカメラワークなのかを
判別する。
カメラワークに対応した方向にピークが生じる。そこ
で、動きベクトル分布のピークを検出し、そのピークに
関連した動きベクトルをカメラワークとしている。
は、前後進移動系のカメラワークとし、中心に向かって
いるか、後退しているかは、画像の縁に位置する動きベ
クトルの方向から判別を行っている。
ベクトルの分布の1例を示す。
ure番号8からI−picture番号9の間で観察
されたベクトル分布を表示している。即ち、右から左方
向へのカメラワークを有している例である。
有しており、ほとんどのベクトルがカメラの動いた向き
と対応していることがわかる。
の際には、このグラフの、ピークを取る、平均ベクトル
を算出する、あるいは、主軸分析によるベクトルの決定
等を行っても良い。
パンニングやチルティングの時の動きベクトルとしてい
る。そのベクトル値は図10中に図示してある。
カメラワークがあるかどうか、カメラワークの種類はど
うか、パンニングやチルティングの場合、グローバルな
動きベクトルまでを算出することとしているが、これ以
上の処理を行っても良い。
て動被写体の抽出などを行うこともできる。
いる閾値はあらかじめ与えられるものとしていたが、映
像や画像の内容によって適宜変化させても良く、また、
インタフェースを付加することによって人間の手によっ
てチューニングし、適宜情報を与えるとしても良い。
トルが除去されているため、従来方法で検討された理想
的な方法の適用も可能であり、カメラワーク情報の算出
については、これら従来方法を用いて検出しても良い。
算出装置によれば、圧縮された画像データ列から、カメ
ラワーク情報を抽出し、従来方法によって抽出されてい
るカット点の情報を組み合わせることによって、カット
点とカメラワーク情報という映像内容における特別な情
報を基に、圧縮された画像データ列の内容を高速、簡便
に閲覧することが可能である。また、本実施の形態のカ
メラワーク算出装置は、その仕様をソフトウェアで記述
し、汎用コンピュータにおいて実行するだけで容易に実
現することができる。
前記実施の形態に基づき具体的に説明したが、本発明
は、前記実施の形態に限定されるものではなく、その要
旨を逸脱しない範囲において種々変更可能であることは
勿論である。
的なものによって得られる効果を簡単に説明すれば、下
記のとおりである。
方法及び装置において、理想的な環境下でなくても、ア
ナログ信号の乱れやA/D変換時のノイズなどの影響を
受けることなく、正しいカメラワークの有無を判定する
ことが可能であり、これにより原画像を復号化しなくて
も、原画像の内容を推測することが可能となる。
方法及び装置において、動き情報と無関係な動きベクト
ルを正確に判定することが可能となる。
方法及び装置において、カメラワークを正確に判定し、
さらに、カメラワーク情報を正確に抽出することが可能
となる。
ータ列の内容を高速、簡便に閲覧することが可能であ
る。
ク算出方法を説明するための図である。
ク算出装置を備える映像再生装置の概略構成を示すブロ
ック図である。
り撮影された画像列の中の1つの画像を示す模式図であ
る。
クトルの分布を示す図である。
クトルと判定された動きベクトルを除去した後の動きベ
クトル分布を示す図である。
角度の定義を説明するための図である。
て、カメラワークの有無を判定する手法を説明するため
のフローチャートである。
推移の一例を示す模式図である。
実際に検出された0ベクトルを持つマクロブロック(M
B)数の変化と、連続類似ベクトルを持つマクロブロッ
ク(MB)数の変化の一例を示す図である。
例を示す図である。
画像内容が変化している場合の動きベクトルの分布の一
例を示す図である。
入力MPEGデータ列、21…ショット単位分類部、2
3…符号化情報解析部、25…符号化情報抽出部、28
…特徴量算出部、30…ノイズ判定部、32…カメラワ
ーク算出部、60…可変長復号器、61…逆走査部、6
2…逆量子化部、63…逆DCT部、64…加算器、6
5…動き補償部、66…再生(復号化)画像データ列、
67…再生表示部。
Claims (20)
- 【請求項1】 動き予測方式を用いた圧縮符号化方式に
よって符号化された映像圧縮符号化データからカメラワ
ーク情報を判定するカメラワーク算出方法において、 前記映像圧縮符号化データの中から、少なくとも動き予
測符号化時に算出された動きベクトルを含む符号化情報
を抽出する第1のステップと、 前記第1のステップにおいて、抽出された動きベクトル
の中からカメラワークあるいは動被写体とは無関係な動
きベクトルをノイズとして除去する第2のステップと、 前記第2のステップにおいて、無関係な動きベクトルが
除去された動きベクトルからカメラワーク情報を抽出す
る第3のステップとを具備することを特徴とするカメラ
ワーク算出方法。 - 【請求項2】 前記第1のステップで抽出される符号化
情報には、さらに予測残差符号化係数情報が含まれ、前
記第2のステップにおいて、前記予測符号化時に算出さ
れた動きベクトルの中の対象動きベクトルを持つ領域に
含まれる符号化情報に基づき少なくとも1つの特徴量を
算出し、当該算出された特徴量と、当該算出された特徴
量に対して与えられた所定の閾値とを比較し、その比較
結果に基づいて、対象動きベクトルが動き情報に関わる
動きベクトルであるかどうかを判定することを特徴とす
る請求項1に記載されたカメラワーク算出方法。 - 【請求項3】 前記特徴量は、前記予測符号化時に算出
された動きベクトルの大きさ、前記予測符号化時に算出
された動きベクトルの方向、予測残差符号化係数、ある
いは、それらの値に数学的な演算を施した値の中の少な
くとも1つであることを特徴とする請求項2に記載され
たカメラワーク算出方法。 - 【請求項4】 前記特徴量は、予測残差符号化係数のD
C成分の大きさであることを特徴とする請求項3に記載
されたカメラワーク算出方法。 - 【請求項5】 前記特徴量は、予測残差符号化係数のA
C成分の大きさであることを特徴とする請求項3に記載
されたカメラワーク算出方法。 - 【請求項6】 前記特徴量は、予測残差符号化係数のA
C成分のうち0でない成分の個数であることを特徴とす
る請求項3に記載されたカメラワーク算出方法。 - 【請求項7】 前記特徴量は、対象動きベクトルに隣接
する動きベクトルのうち、対象動きベクトルと特性が著
しく類似している隣接動きベクトルの個数であることを
特徴とする請求項3に記載されたカメラワーク算出方
法。 - 【請求項8】 前記第3のステップにおいて、与えられ
た動きベクトルに対し、時間方向への数学的な演算を施
し、当該演算結果が所定の閾値を上回る場合に、カメラ
ワークが存在すると判定することを特徴とする請求項1
ないし請求項7のいずれか1項に記載されたカメラワー
ク算出方法。 - 【請求項9】 前記与えられた動きベクトルに対し、時
間方向への数学的な演算は、時間方向に連続して類似特
性を示す動きベクトルの個数を加算する演算であること
を特徴とする請求項8に記載されたカメラワーク算出方
法。 - 【請求項10】 前記第3のステップにおいて、与えら
れた動きベクトルからカメラワークを算出する際に、時
間方向に連続して類似特性を示す動きベクトルを解析
し、カメラワーク情報を抽出することを特徴とする請求
項1ないし請求項9のいずれか1項に記載されたカメラ
ワーク算出方法。 - 【請求項11】 動き予測方式を用いた圧縮符号化方式
によって符号化された映像圧縮符号化データからカメラ
ワークの判定の有無を行うカメラワーク算出装置におい
て、 前記映像圧縮符号化データの中から、少なくとも動き予
測符号化時に算出された動きベクトルを含む符号化情報
を抽出する符号化情報抽出部と、 前記符号化情報抽出部で抽出された動きベクトルの中か
らカメラワークあるいは動被写体とは無関係な動きベク
トルをノイズとして除去するノイズ判定部と、 前記ノイズ判定部で無関係な動きベクトルが除去された
動きベクトルからカメラワーク情報を抽出するカメラワ
ーク算出部とを具備することを特徴とするカメラワーク
算出装置。 - 【請求項12】 前記符号化情報抽出部で抽出される符
号化情報には、さらに予測残差符号化係数情報が含ま
れ、前記ノイズ判定部は、前記予測符号化時に算出され
た動きベクトルの中の対象動きベクトルを持つ領域に含
まれる符号化情報に基づき少なくとも1つの特徴量を算
出する特徴量算出部を備え、前記ノイズ判定部は、前記
特徴量算出部で算出された特徴量と、当該特徴量算出部
で算出された特徴量に対して与えられた所定の閾値とを
比較し、その比較結果に基づいて、対象動きベクトルが
動き情報に関わる動きベクトルであるかどうかを判定す
ることを特徴とする請求項11に記載されたカメラワー
ク算出装置。 - 【請求項13】 前記特徴量算出部で算出される特徴量
は、前記予測符号化時に算出された動きベクトルの大き
さ、前記予測符号化時に算出された動きベクトルの方
向、予測残差符号化係数、あるいは、それらの値に数学
的な演算を施した値の中の少なくとも1つであることを
特徴とする請求項12に記載されたカメラワーク算出装
置。 - 【請求項14】 前記特徴量算出部で算出される特徴量
は、予測残差符号化係数のDC成分の大きさであること
を特徴とする請求項13に記載されたカメラワーク算出
装置。 - 【請求項15】 前記特徴量算出部で算出される特徴量
は、予測残差符号化係数のAC成分の大きさであること
を特徴とする請求項13に記載されたカメラワーク算出
装置。 - 【請求項16】 前記特徴量算出部で算出される特徴量
は、予測残差符号化係数のAC成分のうち0でない成分
の個数であることを特徴とする請求項13に記載された
カメラワーク算出装置。 - 【請求項17】 前記特徴量算出部で算出される特徴量
は、対象動きベクトルに隣接する動きベクトルのうち、
対象動きベクトルと特性が著しく類似している隣接動き
ベクトルの個数であることを特徴とする請求項13に記
載されたカメラワーク算出装置。 - 【請求項18】 前記カメラワーク算出部は、与えられ
た動きベクトルに対し、時間方向への数学的な演算を施
し、当該演算結果が所定の閾値を上回る場合に、カメラ
ワークが存在すると判定することを特徴とする請求項1
1ないし請求項17のいずれか1項に記載されたカメラ
ワーク算出装置。 - 【請求項19】 前記与えられた動きベクトルに対し、
時間方向への数学的な演算は、時間方向に連続して類似
特性を示す動きベクトルの個数を加算する演算であるこ
とを特徴とする請求項18に記載されたカメラワーク算
出装置。 - 【請求項20】 前記カメラワーク算出部は、与えられ
た動きベクトルからカメラワークを算出する際に、時間
方向に連続して類似特性を示す動きベクトルを解析し、
カメラワーク情報を抽出することを特徴とする請求項1
1ないし請求項19のいずれか1項に記載されたカメラ
ワーク算出装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP26404696A JP3332202B2 (ja) | 1996-10-04 | 1996-10-04 | カメラワーク算出方法及び装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP26404696A JP3332202B2 (ja) | 1996-10-04 | 1996-10-04 | カメラワーク算出方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH10112864A true JPH10112864A (ja) | 1998-04-28 |
JP3332202B2 JP3332202B2 (ja) | 2002-10-07 |
Family
ID=17397805
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP26404696A Expired - Fee Related JP3332202B2 (ja) | 1996-10-04 | 1996-10-04 | カメラワーク算出方法及び装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3332202B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005160015A (ja) * | 2003-11-07 | 2005-06-16 | Sony Corp | 画像処理装置および方法、並びにプログラム |
JP2012138905A (ja) * | 2010-12-23 | 2012-07-19 | Samsung Electronics Co Ltd | デジタルイメージ安定化装置及び方法 |
JP2017167727A (ja) * | 2016-03-15 | 2017-09-21 | Kddi株式会社 | 動画の処理装置、処理方法及びプログラム |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4743601B2 (ja) * | 2005-09-21 | 2011-08-10 | Kddi株式会社 | 動画像処理装置 |
JP5147655B2 (ja) * | 2008-11-20 | 2013-02-20 | 株式会社日立製作所 | 映像信号処理装置および映像表示装置 |
-
1996
- 1996-10-04 JP JP26404696A patent/JP3332202B2/ja not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005160015A (ja) * | 2003-11-07 | 2005-06-16 | Sony Corp | 画像処理装置および方法、並びにプログラム |
JP2012138905A (ja) * | 2010-12-23 | 2012-07-19 | Samsung Electronics Co Ltd | デジタルイメージ安定化装置及び方法 |
JP2017167727A (ja) * | 2016-03-15 | 2017-09-21 | Kddi株式会社 | 動画の処理装置、処理方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP3332202B2 (ja) | 2002-10-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3939551B2 (ja) | 動画像処理装置、その方法、及び記録媒体 | |
JP4666784B2 (ja) | ビデオシーケンスのキーフレーム抽出方法及びビデオシーケンスのキーフレーム抽出装置 | |
US5719643A (en) | Scene cut frame detector and scene cut frame group detector | |
US7054367B2 (en) | Edge detection based on variable-length codes of block coded video | |
US7469010B2 (en) | Extracting key frames from a video sequence | |
US8098729B2 (en) | Implementing B-picture scene changes | |
US8902986B2 (en) | Look-ahead system and method for pan and zoom detection in video sequences | |
EP1133191A1 (en) | Hierarchical hybrid shot change detection method for MPEG-compressed video | |
EP1389016A2 (en) | Motion estimation and block matching pattern using minimum measure of combined motion and error signal data | |
US20030026340A1 (en) | Activity descriptor for video sequences | |
JPH11252509A (ja) | 動画像のカット点検出装置 | |
US7031385B1 (en) | Method and apparatus for detecting scene change of a compressed moving-picture, and program recording medium therefor | |
JP2000224590A (ja) | ビデオシ―ケンスの特徴抽出方法 | |
KR20040006065A (ko) | 장면전환검출장치 및 그 방법 | |
JP2010500818A (ja) | 漫画アニメーション圧縮のためのシステムおよび方法 | |
JP2008505562A (ja) | Mpegビデオストリーム内の動きを検出する方法及び装置 | |
JPH10257436A (ja) | 動画像の自動階層構造化方法及びこれを用いたブラウジング方法 | |
US20110129012A1 (en) | Video Data Compression | |
JP3332202B2 (ja) | カメラワーク算出方法及び装置 | |
Smeaton et al. | An evaluation of alternative techniques for automatic detection of shot boundaries in digital video | |
JP2869398B2 (ja) | カット点検出方法及び装置 | |
JPH10112863A (ja) | 動き被写体情報抽出方法及び装置 | |
JPH03214364A (ja) | シーン変化検出方法 | |
JP3916505B2 (ja) | シーン変化検出回路 | |
JP2003061112A (ja) | カメラワーク検出装置およびカメラワーク検出方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080726 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080726 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090726 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090726 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100726 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100726 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110726 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120726 Year of fee payment: 10 |
|
LAPS | Cancellation because of no payment of annual fees |