JP2001204023A - ピクチャのインターレース又はプログレッシブキャラクタを認識するための動きベクトルヒストグラムの処理 - Google Patents
ピクチャのインターレース又はプログレッシブキャラクタを認識するための動きベクトルヒストグラムの処理Info
- Publication number
- JP2001204023A JP2001204023A JP2000368019A JP2000368019A JP2001204023A JP 2001204023 A JP2001204023 A JP 2001204023A JP 2000368019 A JP2000368019 A JP 2000368019A JP 2000368019 A JP2000368019 A JP 2000368019A JP 2001204023 A JP2001204023 A JP 2001204023A
- Authority
- JP
- Japan
- Prior art keywords
- picture
- coefficient
- current picture
- motion
- ratio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/112—Selection of coding mode or of prediction mode according to a given display mode, e.g. for interlaced or progressive display mode
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Television Systems (AREA)
Abstract
PEGスタンダード符号化ビデオシーケンスの処理方法
を提供する。 【解決手段】 本発明方法では、トップ半フレーム及び
ボトム半フレームの各マクロブロックに対して、トップ
半フレーム(MVTOPX,Y(K))及びボトム半フレ
ーム(MVBOTX,Y(K))の動きベクトルの推定に
依存して夫々のトップ動き係数(VTOPX,Y(K))
及びボトム動き係数(VBOTX,Y(K))を計算し、
該動き係数(VTOPX,Y(K),VBOTX,Y(K))
の値の分布が実質的に等しい場合に現在のピクチャをイ
ンターレースピクチャとして認識し、一方該動き係数の
値の分布が実質的に異なる場合にプログレッシブピクチ
ャとして認識する。
Description
デオピクチャを処理する技術に関するものであって、更
に詳細には、デジタルピクチャのシーケンスのプロパテ
ィ即ち特性を検知する方法に関するものである。
送信装置に関連し、送信期間中に使用される周波数帯域
の振幅に関連してテレビに対する増加する条件はビデオ
シーケンスを送信する技術を極めて重要なものとさせて
いる。
ャのフレームを、1つのフレームの各ピクセルのビデオ
成分の強度を表す数値からなるマトリクス即ち行列に分
割することを可能としており、コンピュータによってそ
のピクチャを処理することを可能としている。ピクチャ
を複数個の数からなるマトリクスとして、従ってビット
ストリームとして取り扱うことの可能性は、送信を容易
なものとし且つ表示されるイメージの品質を改善するた
めにピクチャをコーディング即ち符号化する蓋然性を提
供している。
ステムはピクチャの幾つかのプロパティ即ち特性の認識
に基づいている。このような特性の中において、特に重
要なものは、ピクチャのキャラクタがプログレッシブで
あるか又はインターレースであるかの検知及びオブジェ
クトの動きの検知である。
ャを圧縮し、使用する周波数帯域についてその送信を最
も効率的なものとさせ、且つその表示品質の点において
最も満足のいくものとさせることを可能とする。
ブ又はインターレースの内容(IPD:インターレース
プログレッシブ検知)の動き推定及び検知の幾つかの技
術が公知である。このような技術としては、例えば、本
願出願人による米国特許第5,734,420号、WO
99/20040、欧州特許出願EP−A−09173
63、EP−A−0944245、EP−A−0979
011、欧州特許EP99830545.2、EP98
830689.0において開示されている。
ピクセルのビデオ成分を表すビット値に関して動作し、
従って低コスト適用例に対して不適切なものとさせる計
算上の複雑性を必要としている。
ムは720×288=207360個のピクセルから構
成されている。各ピクセルについて動作する方法はむし
ろ厄介であるか、又は表示されたピクチャが多かれ少な
かれ認知されるような態様で品質を減少させるような簡
単化を課すものである。
ームを作成し、計算上の複雑性を減少させるためにピク
セルのグループ(マクロブロック)に関して動作する方
法は、通常、低コストの適用例に対して使用される。
プに関して動作しながら、 ※減少した計算の数で処理したピクチャをプログレッシ
ブ又はインターレースのピクチャとして認識することを
可能とし、 ※圧縮の品質及び効率を保存しながら動き推定の計算量
を減少し、又は ※動き推定期間中の同一の圧縮効率及び計算量に対し
て、表示されるピクチャの品質を向上させる、 デジタルビデオシーケンスのデータを作成する方法に対
する必要性が存在している。
した如き従来技術の欠点を解消し、動きベクトルに関し
てのみ計算を実施することを必要としMPEGスタンダ
ード符号化ビデオシーケンスと共に使用することが可能
な処理方法を提供することを目的とする。動きベクトル
を、各単一のピクセルに対して画定する代わりにマクロ
ブロックに対しても画定することが可能である場合に
は、著しく計算を簡単化させることが可能となる。
ーケンスのコーディング即ち符号化の効率を改善し且つ
コーダー即ち符号化器に入力されるピクチャのクロミナ
ンス成分に関して行われるフィルタ処理の効率を改善す
るためにピクチャの内容をプログレッシブ又はインター
レースのいずれかであるかを検知することを可能とす
る。本方法は、処理したピクチャをプログレッシブ又は
インターレースのいずれかのピクチャとして事前認識を
行うことにより動きベクトルの計算における精度を向上
させることを可能とする。
フレームに分割可能なプログレッシブ又はインターレー
スのピクチャのビデオシーケンスの符号化データのビッ
トストリームを処理する方法であって、先行するピクチ
ャのボトム半フレームに属するピクセルに関連して現在
のピクチャのトップ半フレームに属するピクセルのピク
セルのグループの動きベクトル、及び現在のピクチャの
トップ半フレームに属するピクセルに関連して現在のピ
クチャのボトム半フレームのピクセルのグループの動き
ベクトルを推定することを包含する方法を提供すること
を目的としている。
ボトム半フレームの動きベクトルの推定に依存して夫々
のトップ及びボトムの動き係数がトップ半フレーム及び
ボトム半フレームの各マクロブロックに対して計算さ
れ、現在のピクチャは、計算したトップ及びボトム動き
係数の関数としてプログレッシブ又はインターレースの
ピクチャとして認識される。動き係数の値の分布が実質
的に等しい場合にはインターレースの内容であることを
示しており、一方、対照的に、該係数の値の分布が実質
的に等しくないことはプログレッシブの内容であること
を示している。
布を表す一対の形状係数を計算し、その形状係数がある
値より大きいか又は小さい量だけ異なるかどうかに依存
して現在のピクチャをプログレッシブであるか又はイン
ターレースであるかとして認識することによって行うこ
とが可能である。
動き係数の分布の間の確率的相関を表す係数を計算し、
且つその計算した係数がある値を超えるか否かに依存し
て現在のピクチャをインターレースピクチャであるか又
はプログレッシブピクチャであるかとして認識すること
によってプログレッシブピクチャとインターレースピク
チャとの区別を行うことが可能である。
々、予め確立したトップスレッシュホールド及びボトム
スレッシュホールドと比較し、現在のピクチャのトップ
及びボトムフレームのトップスレッシュホールドよりも
動き係数が低い動きベクトルの数をカウントし、一対の
夫々の係数を発生し、現在のピクチャのトップ及びボト
ム半フレームのボトムスレッシュホールドよりも大きい
動き係数の動きベクトルの数をカウントし、第二対の夫
々の係数を発生し、現在のピクチャ及び先行するピクチ
ャと相対的な該4つの係数に依存して現在のピクチャを
プログレッシブ又はインターレースのいずれかのピクチ
ャとして認識する、ことによって認識を行う。
上述した方法に従って実施した現在のピクチャがプログ
レッシブ又はインターレースのいずれかのピクチャとし
ての認識の結果の関数として一時的重み値を計算し、現
在のピクチャと相対的な該一時的な重み値及び先行する
ピクチャと相対的な最終的重み値の関数として最終的重
み値を計算し、先行するピクチャと相対的な最終的重み
値及びその一時的な重み値に依存して現在のピクチャを
プログレッシブ又はインターレースのいずれかのピクチ
ャとして認識する、上記各ステップを有することが可能
である。
レッシブピクチャとして認識される場合にはフレーム予
測技術によって、一方現在のピクチャがインターレース
ピクチャとして認識される場合にはフィールド予測技術
によって、ビデオシーケンスのピクチャの動きベクトル
の洗練した計算を行うべく実現することが可能である。
ループに関連する動きベクトルの以前に実施した推定に
依存して、符号化のために使用したスタンダードに拘わ
らずに、デジタルビデオシーケンスのピクチャをインタ
ーレースか又はプログレッシブのいずれかのピクチャと
して認識することを可能とする。本方法は、精度の向上
及び/又は計算の複雑性の減少という観点で動きベクト
ルの計算を改善するために使用することが可能である。
半フレームのパラメータの比較を介して常に動き推定を
行うことによって、符号化すべきピクチャがインターレ
ース(飛び越し走査)又はプログレッシブ(順次走査)
であるかを検証することが可能であることを特徴として
いる。
には、動き推定が同一のフレームに属するトップフィー
ルドを参照してボトムフィールドに関して実施される場
合には、結果的に得られる動きベクトルの係数はゼロと
なる傾向がある。このことが発生する理由は、同一の時
刻にプログレッシブカメラによって2つのフィールドが
サンプルされるからであり(実際に、それらは同一のフ
レームに属している)、且つインターレースPAL(又
はNTSC)カメラの場合におけるように1秒の1/5
0(又は1/60)のインターバルにおいてサンプルさ
れるものではないからである。
異なるパリティのフィールド間のラインの垂直差のため
に、動きベクトルの垂直成分が−1と1との間で構成さ
れている蓋然性が高い。上昇した垂直の詳細(空間周波
数)を具備するゾーンが存在しない垂直の動きを推定す
ることによって推定器をだます可能性は常にある。然し
ながら、この問題によって影響を受けることのない堅牢
な動き推定器を有しているものと仮定される。
とフレームk−1の前のボトムフィールドとの間の動き
推定は、2つのフィールドが異なる時刻においてサンプ
ルされる場合には(且つ、実際に、それらが異なるフレ
ームに属している)、インターレースシーケンスにおけ
るばかりでなく究極的なプログレッシブシーケンスにお
いても効果的な動きを検知する。
に、図1はプログレッシブカメラによって取られたボー
ルの動きを示しており、且つ図2はインターレースカメ
ラによって取られた同一のシーンを示している。理解さ
れるように、図2のシーケンスにおける1つのフィール
ドから次のものにおいては動きベクトルMVは常にゼロ
とは異なるものであるが、そのことは図1のシーケンス
の動きベクトルについては成立しない。実際に、同一の
フレームk又はk+1のボトムフィールドからトップフ
ィールドへの動きベクトルMVは常にゼロであり、一方
フレームk+1に属するトップフィールドからフレーム
kに属するボトムフィールドへの動きベクトルMVは常
にゼロとは異なっている。インターレースピクチャとプ
ログレッシブピクチャとを非常に容易な態様で区別する
ための本発明の基準はこのような特異性に基づいてい
る。
てのk番目のトップ半フレームの動きベクトルをMVT
OPX,Y(K)として表し且つk番目のトップ半フレー
ムに関してk番目のボトム半フレームの動きベクトルを
MVBOTX,Y(K)で表すこととし、尚kはフレーム
番号である。このような動きベクトルMV=(Vx,
Vy)はトップ半フレーム又はボトム半フレームに夫々
属するk番目のピクチャの単一ピクセル又は複数のピク
セルからなるグループ(マクロブロック)に関連するも
のとすることが可能である。
って、粗いものであっても、動きベクトルMVTOP
X,Y(K)及びMVBOTX,Y(K)を多くの夫々の動き
係数VTOPX,Y(K)及びVBOTX,Y(K)として推
定することにより取得し且つこのような係数に依存して
現在のピクチャをプログレッシブ又はインターレースの
ピクチャとして認識することが必要である。
X,Y(K)を計算する好適な態様は、各動きベクトルM
Vに対して、その成分の絶対値の和を計算することであ
り、即ち、k番目のピクチャのトップ半フレームの動き
ベクトルMVTOPX,Y(K)を考慮することによっ
て、 VTOPX,Y(K)=|Vx|+|Vy| 且つ、k番目のピクチャのボトム半フレームの動きベク
トルMVBOTX,Y(K)を考慮することによって、 VBOTX,Y(K)=|Vx|+|Vy| を行うことである。
能なものの内の1つに過ぎず、例えば、動き係数をVx
及びVyの平方の和の平方根として計算することで充分
な場合があり又当業者にとって明らかなようなその他の
態様で充分な場合がある。
及びVBOTX,Y(K)が動きベクトルMVの成分の絶
対値の和として計算される場合について以下に説明する
が、本発明方法は異なる態様で動き係数を計算すること
によっても実現することが可能である。
フレームの動き係数の分布を検査することによってイン
ターレースピクチャとプログレッシブピクチャとを区別
することが可能である。経験的には、プログレッシブピ
クチャはトップ及びボトムの係数の分布において顕著な
差があることによって特性付けられ、一方インターレー
スピクチャはこれらの動き係数の分布がより一様なもの
であることによって特性付けられることが判明してい
る。
の場合には、プログレッシブシーケンス及びインターレ
ースシーケンスの夫々に関してトップ半フレーム(トッ
プフィールド)及びボトム半フレーム(ボトムフィール
ド)の動き係数の夫々の分布の2つの典型的なヒストグ
ラムが示されている。特に、図3においては、2つの分
布の間の差が明らかである。ボトムフィールドの係数の
分布は値1(水平軸)近くにより集中している(垂直
軸)によって特性付けられ、一方トップフィールドの係
数の分布はより大きな一様性を有しており、一方、図4
においては、これら2つのヒストグラムはほぼ同一であ
る。
し、異なる動き推定器で得られた動き係数の夫々の分布
を計算することによって、以下のことが判明している。
のフレームに属するボトムフィールドの動き係数の分布
は、ベクトルの垂直成分のために、1近くの最大値の周
りに集中している。一方、トップフィールドにおいて
は、このような最大値は明らかに一層低く、即ちボトム
フィールドにおけるよりも分散がより大きい。
プフィールド及びボトムフィールドの動き係数の分布は
実質的に同一の形状を有しており、且つこれらの分布の
分散は、動きが大きければ大きい程、一層大きい。
レームに対しても実質的に同一の顕著な形状が得られ
る。
ップ動き係数の分布がボトム動き係数のものとほぼ同一
であるという点において実質的に特性付けられ、一方プ
ログレッシブピクチャは、トップ及びボトム動き係数の
分布の間の顕著な差及びトップ動き係数の場合よりもボ
トム動き係数の最大値近くに比較的より強く集中してい
ることによって特性付けられる。
ピクチャの内容がプログレッシブであるか又はインター
レースであるかの認識を行う。
を認識するための幾つかの方法を提供している。このよ
うな方法は、トップ及びボトム動き係数の分布を表す一
対の形状係数を計算し、且つそれら2つの形状係数の間
で実質的な差異が存在するか否かを検証し、肯定の場合
にはそれら2つの分布が同一のものであるとして認識
し、そうでない場合には互いに異なるものであるとして
認識することを包含することが可能である。
を計算し、且つこのような相関係数がある値を超えるか
否かを検証し、肯定である場合には、そのピクチャがイ
ンターレースであり、そうでない場合にはプログレッシ
ブであるとして認識することが可能である。
分布の最大値に関しての偏差を形状係数として使用する
ことが可能である。プログレッシブピクチャの場合に
は、ボトムフィールドの動き係数の値がトップフィール
ドの動き係数の値よりもそれらの最大値近くにより集ま
っているので、トップフィールドに対する偏差はボトム
フィールドに対する偏差よりも一層大きい。従って、ト
ップフィールドの動き係数の偏差がボトムフィールドの
動き係数の偏差よりもあるパーセントだけ超えている場
合には、そのピクチャはプログレッシブであり、そうで
ない場合にはインターレースであるということが可能で
ある。
ブのピクチャであるとして認識するピクチャのタイプの
事前テストを実施する本発明の特に興味のある適用例は
以下に説明するものである。
静止的」と呼ばれるピクチャが存在しており、その動き
はフレームの比較的小さな部分に制限されており、典型
的な準静止的ピクチャはテレビのニュース解説者を表す
ピクチャであり、その場合には、動きは解説者の顔に実
質的に制限されており、一方そのピクチャの残りの部分
は実質的に静的のままである。
ブピクチャとインターレースピクチャとの間に存在する
差は比較的小さいものであり、従って、重大なるエラー
を導入することなしに、検査したピクチャを適宜分類す
ることが可能である。最も重要な適用例はMPEGスタ
ンダードに従って符号化したビデオシーケンスの場合で
あるので、準静止的ピクチャはプログレッシブであると
考えることが可能である。何故ならば、このような選択
はMPEG符号化にとって必要とされる計算の数を著し
く減少させることを可能とするからである。
認識は、夫々、全てのトップ及びボトム動き係数の和と
しての(図6a及び6cの場合の「準静止的」ブロック
の信号Bによって表される)トップSVTOP及びボト
ムSVBOTの夫々の2つの和係数を発生することによ
って実施される。両方の和係数SVTOP及びSVBO
Tが夫々の予め確立されている正の数T1及びT2より
も低い場合には、即ち、
静止的」ピクチャとして認識される。
扱うことの可能性から得られる著しい簡単化のために、
究極的にピクチャの内容がプログレッシブであるかイン
ターレースであるかを検知するための後のテストの前に
上述したテストを使用することが可能である。
ピクチャから区別する好適な態様は、夫々ボトムTHR
1及びトップTHR2である2つの予め確立したスレッ
シュホールドを画定し、且つトップ動き係数VTOP
X,Y(K)及びボトム動き係数VBOTX,Y(K)をこれ
らのスレッシュホールドと比較を行うものであり、それ
は以下のように表すことが可能である。
(K)を計算する1つの可能な機能的ブロック図の1例
を図5に示してある。他の3つのパラメータを計算する
アーキテクチャも同じである。
N1TOP(K)及びN1BOT(K)が分布の最大値
の表示を与え(THR1がこのような最大値よりも大き
い場合)、一方N2TOP(K)及びN2BOT(K)
がそれらの分散を与える(ヒストグラムを取囲むドーム
形状の曲線の幅)ことを理解することが可能である。
して、以下のテストの全てが検証される場合には、
として認識され、そうでない場合にはインターレースで
あるとして認識される。
用する代わりに4つのパラメータの全てを使用すること
の選択は、各フレームに対しての決定を行わねばならな
いので、不確実性を最小とするためには全ての使用可能
な情報を使用することが好適であるという事実に起因し
ている。
適用することも可能である。
である。後者の条件はピクチャをプログレッシブである
として分類するための2つの分布の間により区別可能な
差異を課している。
ルに対してではなくマクロブロックに対して確立された
動きベクトルについて動作を行う可能性である。このこ
とは計算を著しく簡単化させることを可能としており、
そのことは本発明方法を特に低コストの適用例において
適切なものとさせている。
プログレッシブであるかを検知するための本発明の手順
によって与えられる結果において、動きが区別を行うこ
とを非常に困難にさせるようなものであってビデオシー
ケンスの短い部分によって発生されるような振動を回避
するために、先行するフレームにおいて行われた決定を
考慮する簡単なヒステリシスメカニズムを導入すること
が可能である。
した方法の内の1つに従ってピクチャがプログレッシブ
であるかインターレースであるかの認識に依存して各ピ
クチャを一時的な重み値P(K)と関連付けし、1つ又
はそれ以上の先行するピクチャと相対的な最終的な重み
値D(I)及びその一時的な重み値P(K)の関数とし
て最終的な重み値D(K)を各処理したピクチャに対し
て計算し、現在のピクチャがプログレッシブであるかイ
ンターレースであるかの認識をその最終的な重み値に基
づいて行うことにより実現することが可能である。
ようにして実現することが可能であるかの1つの例を図
6aのフローチャートに示してある。
NFに対して値を割り当てることによって考慮すべき前
のピクチャの数を決定せねばならない。その後に、本シ
ステムが動きベクトルを推定するための任意の技術を適
用し且つ動き係数VTOPX, Y(K)及びVBOT
X,Y(K)を計算する。これらの係数の値から開始し
て、「準静止的」ブロックが、上述したアルゴリズムに
従って、そのピクチャが準静止的であるか否かを検証す
る。その結果が肯定である場合には、そのピクチャはプ
ログレッシブであるとして分類され、その最終的な重み
はD(K)=ωとして確立され且つ次のピクチャが処理
される。
ムは式(3)及び(5)に従ってR1(K)、R2
(K)、R3(K)、R4(K)、R5(K)、R6
(K)の比を計算する。これらの比が不等記号(4)及
び(5)を満足する場合には、図6cにおいてより詳細
に示してある(ヒステリシス)ブロックが一時的な重み
P(K)をそのピクチャと関連付ける。このような一時
的な重みは、不等記号(4)及び(5)が満足される場
合には数βに等しく、そうでない場合には数αに等し
い。
の2つのフレーム及び現在のフレームに関連している重
みの和がある数μと等しいか又はそれより大きい場合
に、即ち、 P(K)+D(K−1)+D(K−2)≧μ である場合に、「ヒステリシス」ブロックは現在のフレ
ームをプログレッシブフレームとして認識し、且つその
フレームは最終的な重みD(K)=βを取得する。反対
の場合には、現在のフレームは最終的な重みD(k)=
ωを取得し、インターレースとして分類される。
(図6a及び6bにおける「ヒステリシス」ブロックの
入力N)、現在のフレームkは一時的にインターレース
として分類され且つ一時的な重みP(K)=αを取る。
相補的な条件が検証される場合、即ち、 P(K)+D(K−1)+D(K−2)≦μ である場合に、最終的な選択はインターレースフレーム
であり、最終的な重みはD(K)=αであり、その反対
の場合は、該フレームはプログレッシブとして分類され
且つ最終的な重みD(K)=ωを取る。
β、μ、ωは0、1、1.5、0.5に等しいが、これ
らの値は同一のピクチャシーケンス期間中であっても、
必要性に依存して変化させることが可能である。
重みD(K−1)及びD(K−2)によって前のフレー
ムにおいて行われた実効的な選択及び種々の決定パラメ
ータR1(K)、R2(K)、R3(K)、R4(K)
によって与えられる表示が2つの可能な選択の内のいず
れにも優先度を与えることなしに、考慮される。
に示してある。動きベクトルの推定から開始して、現在
のピクチャが準静止的であるか否かが検証され、次いで
本発明アルゴリズム(IPD)が実行され且つ最終的に
ヒステリシス手順を実現する機能的ブロックが、そのピ
クチャがプログレッシブであるかインターレースである
かを表すフラグを発生する。
レースからプログレッシブへのスキャニングモードの急
激な変化が防止され、従って短期間持続する擾乱(ノイ
ズ)が決定に影響を与えることを回避する。
アルゴリズムを適応的に選択することによって最も洗練
された態様で運動ベクトルの計算を行うことを可能とす
る。
PEG2スタンダードによって取られる重要性に鑑み、
以下においては、MPEG2システムを参照するが、同
一の考察は異なるスタンダードに基づくシステムにおい
ても同様に適用可能である。
スタンダードにおけるように、動き推定及びその結果の
時間的予測の少なくとも2つの異なる技術が可能であ
る。
クチャをフレーム種類(16×16ピクセル)のマクロ
ブロックに分割し、且つそれらの各々に対して、先行す
るフレームにおける予測子を動き推定用の任意の方法で
見つけ出す。
ロブロックフレームをその2つの成分フィールド(16
×8ピクセル)に分割し、その内の1つは偶数半フレー
ムに関するものであり且つ別の1つは奇数半フレームに
関するものであり且つそれらの各々に対して、時間的に
先行するピクチャに属する同一のパリティのフィールド
に関する予測子が見つけられる。
予測子の全ての可能な組み合わせ、即ちフレーム、フィ
ールドトップk−1上のフィールドトップk、フィール
ドボトムk−1上のフィールドトップk、フィールドト
ップk−1上のフィールドボトムk、フィールドボトム
k−1上のフィールドボトムkについてテストすること
によって得られる。全ての場合において、予測(及び動
き推定)は前方又は後方種類のものとすることが可能で
ある。従って、各マクロブロックに対して多数のマッチ
ングエラーを計算することが必要である。
なものとなり、実際に、殆ど動きの内インターレースシ
ーケンスは何等重要なる品質を喪失することなしにプロ
グレッシブとして符号化することが可能であり、従って
フィールド予測を煩わせることを回避する。同様に、か
なりの動きを伴うインターレースシーケンスはフレーム
として予測することの利点を有するものではなく、それ
はフィールド予測推定を必要とするに過ぎない場合があ
る。
ることによって著しい計算上の簡単化を得ることが可能
である(約30%から約50%)。いつフィールドモー
ドで動作すべきか及びいつフレームモードで動作すべき
かを動き推定器に対して告知するメカニズムが必要であ
るに過ぎない。このことは、本発明のIPDアルゴリズ
ムによって与えることが可能である。唯一の条件は、動
き推定を1つ又はそれ以上のステップで連続するフィー
ルドに関して実施するということである。
って実施される第一ステップは、連続するフレームから
動きベクトルの粗目の推定を計算するために必要であ
る。「微細サーチ」ブロックによって実施される第二ス
テップは、効果的な符号化に対して必要な動きベクトル
のより細かい推定を計算するのに必要である。第1ステ
ップの終わりにおいて、第二ステップにおける微細な動
き推定を実現するために本発明のIPD手順を実施する
ことが可能である。
用の方法と関連された場合に、本発明のIPD係数なし
で動き推定器を使用する場合と比較して別の利点を提供
する。即ち、 ※マクロブロック当たりの計算されたマッチングの同一
の最大数に対して予測ピクチャのより良い品質を与え
る。何故ならば、IPD係数によって与えられる表示に
依存して予測モードを選択することによりフレームのみ
又はフィールドのみの予測子(ある最大数まで)の数を
増加させることが可能だからである。
マクロブロック当たりのマッチングの数がより少ない。
何故ならば、IPD係数によって与えられる表示に依存
してフィールド予測又はフレーム予測のいずれかが実施
され、動き推定モードに依存してマッチングの数が30
%乃至50%節約されるからである。
詳細に説明したが、本発明は、これら具体例にのみ制限
されるべきものではなく、本発明の技術的範囲を逸脱す
ることなしに種々の変形が可能であることは勿論であ
る。
ケンスの一例を示した概略図。
ケンスの一例を示した概略図。
ム(トップフィールド)及びボトム半フレーム(ボトム
フィールド)の動きベクトルの動き係数の可能な分布の
一例を示した概略図。
ム(トップフィールド)及びボトム半フレーム(ボトム
フィールド)の動きベクトルの動き係数の可能な分布の
一例を示した概略図。
ブロック図。
ト。
細を示したフローチャート。
したフローチャート。
はインターレースであるかの検知を行う構成を示した概
略図。
2ステップ動き推定器を示した概略ブロック図。
Claims (9)
- 【請求項1】 トップ半フレーム及びボトム半フレーム
に分割可能なプログレッシブ又はインターレースピクチ
ャのビデオシーケンスの符号化データのビットストリー
ムを処理する方法であって、先行するピクチャ(MVT
OPX,Y(K))のボトム半フレームに属するピクセル
に関連して現在のピクチャの前記トップ半フレームに属
するピクセルのグループの動きベクトル、及び現在のピ
クチャ(MVBOTX,Y(K))のトップ半フレームに
属するピクセルに関連して現在のピクチャの前記ボトム
半フレームのピクセルのグループの動きベクトルを推定
することを包含するビットストリームの処理方法におい
て、 前記トップ半フレーム及びボトム半フレームの各マクロ
ブロックに対してトップ半フレーム(MVTOP
X,Y(K))及びボトム半フレーム(MVBOT
X,Y(K))の動きベクトルの推定に依存して夫々のト
ップ動き係数(VTOPX,Y(K))及びボトム動き係
数(VBOTX,Y(K))を計算し、前記動き係数(V
TOPX,Y(K),VBOTX,Y(K))の値の分布が実
質的に等しいことにより前記現在のピクチャをインター
レースピクチャとして認識し、又は前記動き係数(VT
OPX,Y(K),VBOTX,Y(K))の値の分布が実質
的に等しくないことにより前記現在のピクチャをプログ
レッシブピクチャとして認識する、ことを特徴とする方
法。 - 【請求項2】 請求項1において、前記認識が、以下の
動作、即ち、 前記トップ動き係数(VTOPX,Y(K))及びボトム
動き係数(VBOTX,Y(K))を、夫々、予め確立し
たトップスレッシュホールド(THR1)及びボトムス
レッシュホールド(THR2)と比較し、 一対の第一(N1TOP(K))及び第二(N1BOT
(K))係数を発生する前記現在のピクチャの前記トッ
プ半フレーム(MVTOPX,Y(K))及びボトム半フ
レーム(VBOTX,Y(K))のその動き係数が前記ト
ップスレッシュホールド(THR1)よりも低い動きベ
クトルの数をカウントし、 第二対の第三(N2TOP(K))及び第四(N2BO
T(K))係数を発生する前記現在のピクチャの前記ト
ップ半フレーム(MVTOPX,Y(K))及びボトム半
フレーム(VTOPX,Y(K))のその動き係数が前記
ボトムスレッシュホールド(THR2)よりも大きな動
きベクトルの数をカウントし、 現在のピクチャ及び先行するピクチャと相対的な前記第
一(N1TOP(K))、第二(N1BOT(K))、
第三(N2TOP(K))、第四(N2BOT(K))
係数に依存して前記現在のピクチャをプログレッシブピ
クチャ又はインターレースピクチャとして認識する、こ
とを特徴とする方法。 - 【請求項3】 請求項1において、前記トップ及びボト
ム動き係数の計算した値を使用して予備的なテストを実
施し、前記予備的なテストが、 現在のピクチャのトップ半フレームに属するマクロブロ
ックの動き係数を加算してトップ和係数(SVTOP
(K))を発生し、 現在のピクチャのボトム半フレームに属するマクロブロ
ックの動き係数を加算してボトム和係数(SVBOT
(K))を発生し、 前記トップ和係数(SVTOP(K))及びボトム和係
数(SVBOT(K))が夫々の予め確立した第一(T
1)及び第二(T2)の正の数よりも低い場合に現在の
ピクチャをプログレッシブピクチャとして画定し、そう
でない場合には請求項2の動作シーケンスで進行する、
ことを特徴とする方法。 - 【請求項4】 請求項1において、前記認識が、 前記トップ及びボトム動き係数の分布を夫々表す一対の
第一及び第二形状係数を計算し、 前記形状係数が、夫々、ある値より大きいか又は小さい
量だけ異なるか否かにより現在のピクチャをプログレッ
シブピクチャとして又はインターレースピクチャとして
認識する、ことによって実施することを特徴とする方
法。 - 【請求項5】 請求項1において、前記認識が、 前記トップ及びボトム動き係数の分布の間の確率的相関
を表す係数を計算し、 前記計算した係数がある値を超えるか否かによって現在
のピクチャをインターレースピクチャとして又はプログ
レッシブピクチャとして認識する、ことによって実施す
ることを特徴とする方法。 - 【請求項6】 請求項2又は3において、 現在のピクチャ(N1TOP(K))に関する前記第一
係数と先行するピクチャ(N1BOT(K−1))に関
する前記第二係数との間の第一比(R1(K))を計算
し、 現在のピクチャ(N1BOT(K))に関する前記第二
係数と現在のピクチャ(N1TOP(K))に関する前
記第一係数との間の第二比(R2(K))を計算し、 現在のピクチャ(N3TOP(K))に関する前記第三
係数と先行するピクチャ(N2BOT(K−1))に関
する前記第四係数との間の第三比(R3(K))を計算
し、 現在のピクチャ(N2BOT(K))に関する前記第四
係数と現在のピクチャ(N2TOP(K))に関する前
記第三係数との間の第四比(R4(K))を計算し、 前記第一比(R1(K))、第二比(R2(K))、第
三比(R3(K))、第四比(R4(K))を夫々の予
め確立した第三の正の数(γ)、第四の正の数(δ)、
第五の正の数(ε)、第六の正の数(η)と比較し、前
記第一比(R1(K))及び第四比(R4(K))が夫
々前記第三の数(γ)及び第六の数(η)よりも低く、
且つ、同時的に前記第二比(R2(K))及び第三比
(R3(K))が夫々第四の数(δ)及び第五の数
(ε)よりも大きい場合に、現在のピクチャをプログレ
ッシブピクチャとして認識する、ことを有していること
を特徴とする方法。 - 【請求項7】 請求項6において、 前記第二比(R2(K))及び第一比(R1(K))を
それらの間で割算して第五比(R5(K))を発生し、 前記第三比(R3(K))及び第四比(R4(K))を
それらの間で割算して第六比(R6(K))を発生し、 請求項6の方法の条件が満足される場合であって且つ、
同時的に、前記第五比(R5(K))及び第六比(R6
(K))が予め確立した第七の数(θ)及び第八の数
(ι)よりも大きい場合に現在のピクチャをプログレッ
シブピクチャとして認識する、ことを特徴とする方法。 - 【請求項8】 請求項1乃至7の内のいずれか1項にお
いて、 各作成したピクチャに対して、先行する請求項の方法の
内の1つに従って実施したプログレッシブ又はインター
レースピクチャとして現在のピクチャの認識結果の関数
として一時的な重み値(P(K))を計算し、 各作成したピクチャに対して、先行するピクチャ(D
(I))に関する最終的な重み値の及び現在のピクチャ
(P(K))に関する前記一時的な重み値の関数として
最終的な重み値(D(K))を計算し、 現在のピクチャ(P(K))に関する前記一時的な重み
値及び先行するピクチャ(D(I))に関する前記最終
的な重み値に依存して現在のピクチャをプログレッシブ
又はインターレースのピクチャとして認識する、ことを
特徴とする方法。 - 【請求項9】 請求項1において、現在のピクチャがプ
ログレッシブピクチャとして認識される場合にはフレー
ム予測技術によって、一方現在のピクチャがインターレ
ースピクチャとして認識される場合にはフィールド予測
技術によって現在動きベクトルを計算することによりビ
デオシーケンスのピクチャの動きベクトルの計算を行う
ことを特徴とする方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP99830751A EP1107609A1 (en) | 1999-12-02 | 1999-12-02 | Method of processing motion vectors histograms to detect interleaved or progressive picture structures |
EP99830751.6 | 1999-12-02 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001204023A true JP2001204023A (ja) | 2001-07-27 |
JP3676670B2 JP3676670B2 (ja) | 2005-07-27 |
Family
ID=8243701
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000368019A Expired - Fee Related JP3676670B2 (ja) | 1999-12-02 | 2000-12-04 | ピクチャのインターレース又はプログレッシブキャラクタを認識するための動きベクトルヒストグラムの処理 |
Country Status (3)
Country | Link |
---|---|
US (1) | US6904173B2 (ja) |
EP (1) | EP1107609A1 (ja) |
JP (1) | JP3676670B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009217425A (ja) * | 2008-03-10 | 2009-09-24 | Sony Corp | 情報処理装置および方法、並びにプログラム |
KR100982509B1 (ko) | 2003-06-03 | 2010-09-15 | 삼성전자주식회사 | 필름 모드 검출방법 및 장치 |
JP2014147072A (ja) * | 2006-04-07 | 2014-08-14 | Microsoft Corp | 動き予測検索範囲及び拡張動きベクトルの範囲の動的選択 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60184616A (ja) * | 1984-03-02 | 1985-09-20 | Kawasaki Steel Corp | 撹拌用ガスとして一酸化炭素ガスを用いる転炉製鋼法 |
US6959042B1 (en) * | 2001-10-01 | 2005-10-25 | Cisco Technology, Inc. | Methods and apparatus for measuring compressed video signals and applications to statistical remultiplexing |
US8004563B2 (en) | 2002-07-05 | 2011-08-23 | Agent Vi | Method and system for effectively performing event detection using feature streams of image sequences |
US7154555B2 (en) * | 2003-01-10 | 2006-12-26 | Realnetworks, Inc. | Automatic deinterlacing and inverse telecine |
EP1592249B1 (en) * | 2004-04-30 | 2007-06-13 | Matsushita Electric Industrial Co., Ltd. | Reverse film mode extrapolation |
US9172973B2 (en) * | 2005-04-01 | 2015-10-27 | Broadcom Corporation | Method and system for motion estimation in a video encoder |
JP4961850B2 (ja) * | 2006-06-15 | 2012-06-27 | ソニー株式会社 | 動き検出方法、動き検出方法のプログラム、動き検出方法のプログラムを記録した記録媒体及び動き検出装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69227185T2 (de) * | 1991-12-27 | 1999-04-01 | Sony Corp | Bilddatenkodier/dekodierverfahren und -vorrichtung |
US5461420A (en) * | 1992-09-18 | 1995-10-24 | Sony Corporation | Apparatus for coding and decoding a digital video signal derived from a motion picture film source |
US5878166A (en) * | 1995-12-26 | 1999-03-02 | C-Cube Microsystems | Field frame macroblock encoding decision |
US6115070A (en) * | 1997-06-12 | 2000-09-05 | International Business Machines Corporation | System and method for DCT domain inverse motion compensation using shared information |
EP0921497B1 (en) * | 1997-12-02 | 2004-03-24 | Daewoo Electronics Corporation | Interlaced binary shape coding apparatus |
US6501799B1 (en) * | 1998-08-04 | 2002-12-31 | Lsi Logic Corporation | Dual-prime motion estimation engine |
US6584154B1 (en) * | 1998-11-26 | 2003-06-24 | Oki Electric Industry Co., Ltd. | Moving-picture coding and decoding method and apparatus with reduced computational cost |
-
1999
- 1999-12-02 EP EP99830751A patent/EP1107609A1/en not_active Withdrawn
-
2000
- 2000-12-01 US US09/728,506 patent/US6904173B2/en not_active Expired - Lifetime
- 2000-12-04 JP JP2000368019A patent/JP3676670B2/ja not_active Expired - Fee Related
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100982509B1 (ko) | 2003-06-03 | 2010-09-15 | 삼성전자주식회사 | 필름 모드 검출방법 및 장치 |
JP2014147072A (ja) * | 2006-04-07 | 2014-08-14 | Microsoft Corp | 動き予測検索範囲及び拡張動きベクトルの範囲の動的選択 |
JP2009217425A (ja) * | 2008-03-10 | 2009-09-24 | Sony Corp | 情報処理装置および方法、並びにプログラム |
JP4513035B2 (ja) * | 2008-03-10 | 2010-07-28 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム |
US8340350B2 (en) | 2008-03-10 | 2012-12-25 | Sony Corporation | Information processing device and method, and program |
Also Published As
Publication number | Publication date |
---|---|
US20010002921A1 (en) | 2001-06-07 |
US6904173B2 (en) | 2005-06-07 |
EP1107609A1 (en) | 2001-06-13 |
JP3676670B2 (ja) | 2005-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Huang et al. | A multistage motion vector processing method for motion-compensated frame interpolation | |
JP4198206B2 (ja) | 動き依存予測を使用したビデオ情報の圧縮方法と装置 | |
EP1246131B1 (en) | Method and apparatus for the reduction of artifact in decompressed images using post-filtering | |
US8494056B2 (en) | Method and system for efficient video transcoding | |
US6175593B1 (en) | Method for estimating motion vector in moving picture | |
US8279923B2 (en) | Video coding method and video coding apparatus | |
EP1506525B1 (en) | System for and method of sharpness enhancement for coded digital video | |
KR100929608B1 (ko) | 고속 전역탐색 블록정합 알고리즘을 이용한 동영상 움직임추정 방법 및 장치 | |
JPH09154143A (ja) | ビデオデータ圧縮方式 | |
US6748114B1 (en) | Moving picture encoding method and moving picture encoding apparatus | |
JP2000165884A (ja) | フィ―ルド/フレ―ムに対する決定ステップ及び運動ベクトルdctを有するビデオピクチャ圧縮及びコ―ディング | |
US6996180B2 (en) | Fast half-pixel motion estimation using steepest descent | |
JP3676670B2 (ja) | ピクチャのインターレース又はプログレッシブキャラクタを認識するための動きベクトルヒストグラムの処理 | |
US7409093B2 (en) | Method and apparatus for encoding video signals | |
Tourapis et al. | An advanced zonal block based algorithm for motion estimation | |
US8472523B2 (en) | Method and apparatus for detecting high level white noise in a sequence of video frames | |
WO2006134525A1 (en) | Coding and decoding method and device for improving video error concealment | |
KR100987581B1 (ko) | 고속 움직임 추정을 위한 부분 블록정합 방법 | |
JP2868445B2 (ja) | 動画像圧縮方法および装置 | |
US20050163219A1 (en) | Method for motion vector de-interlacing | |
JPH11355781A (ja) | 動画像符号化装置 | |
Liu et al. | Real-time MPEG video encoder with embedded scene change detection and telecine inverse | |
Lee et al. | Distributed video codec with spatiotemporal side information | |
US20070127565A1 (en) | Video encoding method and device | |
KR20030082794A (ko) | 비디오 부호화기의 장면전환 검출 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20040113 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20040116 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040414 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050208 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050307 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050405 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050428 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |