JP2001204023A

JP2001204023A - ピクチャのインターレース又はプログレッシブキャラクタを認識するための動きベクトルヒストグラムの処理

Info

Publication number: JP2001204023A
Application number: JP2000368019A
Authority: JP
Inventors: Daniele Bagni; バーニダニエレ; Luca Battistelli; バッティステッリルカ
Original assignee: STMicroelectronics SRL
Current assignee: STMicroelectronics SRL
Priority date: 1999-12-02
Filing date: 2000-12-04
Publication date: 2001-07-27
Anticipated expiration: 2020-12-04
Also published as: US20010002921A1; US6904173B2; EP1107609A1; JP3676670B2

Abstract

(57)【要約】【課題】計算を簡単化させ低コスト適用例に適したＭ
ＰＥＧスタンダード符号化ビデオシーケンスの処理方法
を提供する。【解決手段】本発明方法では、トップ半フレーム及び
ボトム半フレームの各マクロブロックに対して、トップ
半フレーム（ＭＶＴＯＰ_X,Y（Ｋ））及びボトム半フレ
ーム（ＭＶＢＯＴ_X,Y（Ｋ））の動きベクトルの推定に
依存して夫々のトップ動き係数（ＶＴＯＰ_X,Y（Ｋ））
及びボトム動き係数（ＶＢＯＴ_X,Y（Ｋ））を計算し、
該動き係数（ＶＴＯＰ_X,Y（Ｋ），ＶＢＯＴ_X,Y（Ｋ））
の値の分布が実質的に等しい場合に現在のピクチャをイ
ンターレースピクチャとして認識し、一方該動き係数の
値の分布が実質的に異なる場合にプログレッシブピクチ
ャとして認識する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、大略、デジタルビ
デオピクチャを処理する技術に関するものであって、更
に詳細には、デジタルピクチャのシーケンスのプロパテ
ィ即ち特性を検知する方法に関するものである。

【０００２】

【従来の技術】表示されるイメージ（画像）の品質及び
送信装置に関連し、送信期間中に使用される周波数帯域
の振幅に関連してテレビに対する増加する条件はビデオ
シーケンスを送信する技術を極めて重要なものとさせて
いる。

【０００３】デジタル送受信システムの使用は、ピクチ
ャのフレームを、１つのフレームの各ピクセルのビデオ
成分の強度を表す数値からなるマトリクス即ち行列に分
割することを可能としており、コンピュータによってそ
のピクチャを処理することを可能としている。ピクチャ
を複数個の数からなるマトリクスとして、従ってビット
ストリームとして取り扱うことの可能性は、送信を容易
なものとし且つ表示されるイメージの品質を改善するた
めにピクチャをコーディング即ち符号化する蓋然性を提
供している。

【０００４】ビデオデジタルシーケンスを符号化するシ
ステムはピクチャの幾つかのプロパティ即ち特性の認識
に基づいている。このような特性の中において、特に重
要なものは、ピクチャのキャラクタがプログレッシブで
あるか又はインターレースであるかの検知及びオブジェ
クトの動きの検知である。

【０００５】これらの特性が既知であると、そのピクチ
ャを圧縮し、使用する周波数帯域についてその送信を最
も効率的なものとさせ、且つその表示品質の点において
最も満足のいくものとさせることを可能とする。

【０００６】デジタルビデオシーケンスのプログレッシ
ブ又はインターレースの内容（ＩＰＤ：インターレース
プログレッシブ検知）の動き推定及び検知の幾つかの技
術が公知である。このような技術としては、例えば、本
願出願人による米国特許第５，７３４，４２０号、ＷＯ
９９／２００４０、欧州特許出願ＥＰ−Ａ−０９１７３
６３、ＥＰ−Ａ−０９４４２４５、ＥＰ−Ａ−０９７９
０１１、欧州特許ＥＰ９９８３０５４５．２、ＥＰ９８
８３０６８９．０において開示されている。

【０００７】上述した文献に開示されている方法は単一
ピクセルのビデオ成分を表すビット値に関して動作し、
従って低コスト適用例に対して不適切なものとさせる計
算上の複雑性を必要としている。

【０００８】実際に、ＰＡＬスタンダードに従うフレー
ムは７２０×２８８＝２０７３６０個のピクセルから構
成されている。各ピクセルについて動作する方法はむし
ろ厄介であるか、又は表示されたピクチャが多かれ少な
かれ認知されるような態様で品質を減少させるような簡
単化を課すものである。

【０００９】ビデオデジタルシーケンスのビットストリ
ームを作成し、計算上の複雑性を減少させるためにピク
セルのグループ（マクロブロック）に関して動作する方
法は、通常、低コストの適用例に対して使用される。

【００１０】より詳細に説明すると、ピクセルのグルー
プに関して動作しながら、 ※減少した計算の数で処理したピクチャをプログレッシ
ブ又はインターレースのピクチャとして認識することを
可能とし、 ※圧縮の品質及び効率を保存しながら動き推定の計算量
を減少し、又は ※動き推定期間中の同一の圧縮効率及び計算量に対し
て、表示されるピクチャの品質を向上させる、デジタルビデオシーケンスのデータを作成する方法に対
する必要性が存在している。

【００１１】

【発明が解決しようとする課題】本発明によれば、上述
した如き従来技術の欠点を解消し、動きベクトルに関し
てのみ計算を実施することを必要としＭＰＥＧスタンダ
ード符号化ビデオシーケンスと共に使用することが可能
な処理方法を提供することを目的とする。動きベクトル
を、各単一のピクセルに対して画定する代わりにマクロ
ブロックに対しても画定することが可能である場合に
は、著しく計算を簡単化させることが可能となる。

【００１２】

【課題を解決するための手段】本発明方法は、ビデオシ
ーケンスのコーディング即ち符号化の効率を改善し且つ
コーダー即ち符号化器に入力されるピクチャのクロミナ
ンス成分に関して行われるフィルタ処理の効率を改善す
るためにピクチャの内容をプログレッシブ又はインター
レースのいずれかであるかを検知することを可能とす
る。本方法は、処理したピクチャをプログレッシブ又は
インターレースのいずれかのピクチャとして事前認識を
行うことにより動きベクトルの計算における精度を向上
させることを可能とする。

【００１３】本発明は、トップ半フレーム及びボトム半
フレームに分割可能なプログレッシブ又はインターレー
スのピクチャのビデオシーケンスの符号化データのビッ
トストリームを処理する方法であって、先行するピクチ
ャのボトム半フレームに属するピクセルに関連して現在
のピクチャのトップ半フレームに属するピクセルのピク
セルのグループの動きベクトル、及び現在のピクチャの
トップ半フレームに属するピクセルに関連して現在のピ
クチャのボトム半フレームのピクセルのグループの動き
ベクトルを推定することを包含する方法を提供すること
を目的としている。

【００１４】このような推定から開始して、トップ及び
ボトム半フレームの動きベクトルの推定に依存して夫々
のトップ及びボトムの動き係数がトップ半フレーム及び
ボトム半フレームの各マクロブロックに対して計算さ
れ、現在のピクチャは、計算したトップ及びボトム動き
係数の関数としてプログレッシブ又はインターレースの
ピクチャとして認識される。動き係数の値の分布が実質
的に等しい場合にはインターレースの内容であることを
示しており、一方、対照的に、該係数の値の分布が実質
的に等しくないことはプログレッシブの内容であること
を示している。

【００１５】該認識は、トップ及びボトム動き係数の分
布を表す一対の形状係数を計算し、その形状係数がある
値より大きいか又は小さい量だけ異なるかどうかに依存
して現在のピクチャをプログレッシブであるか又はイン
ターレースであるかとして認識することによって行うこ
とが可能である。

【００１６】別の実施形態によれば、トップ及びボトム
動き係数の分布の間の確率的相関を表す係数を計算し、
且つその計算した係数がある値を超えるか否かに依存し
て現在のピクチャをインターレースピクチャであるか又
はプログレッシブピクチャであるかとして認識すること
によってプログレッシブピクチャとインターレースピク
チャとの区別を行うことが可能である。

【００１７】好適には、トップ及びボトム係数を、夫
々、予め確立したトップスレッシュホールド及びボトム
スレッシュホールドと比較し、現在のピクチャのトップ
及びボトムフレームのトップスレッシュホールドよりも
動き係数が低い動きベクトルの数をカウントし、一対の
夫々の係数を発生し、現在のピクチャのトップ及びボト
ム半フレームのボトムスレッシュホールドよりも大きい
動き係数の動きベクトルの数をカウントし、第二対の夫
々の係数を発生し、現在のピクチャ及び先行するピクチ
ャと相対的な該４つの係数に依存して現在のピクチャを
プログレッシブ又はインターレースのいずれかのピクチ
ャとして認識する、ことによって認識を行う。

【００１８】本発明方法は、又、各ピクチャに対して、
上述した方法に従って実施した現在のピクチャがプログ
レッシブ又はインターレースのいずれかのピクチャとし
ての認識の結果の関数として一時的重み値を計算し、現
在のピクチャと相対的な該一時的な重み値及び先行する
ピクチャと相対的な最終的重み値の関数として最終的重
み値を計算し、先行するピクチャと相対的な最終的重み
値及びその一時的な重み値に依存して現在のピクチャを
プログレッシブ又はインターレースのいずれかのピクチ
ャとして認識する、上記各ステップを有することが可能
である。

【００１９】これらの方法は、現在のピクチャがプログ
レッシブピクチャとして認識される場合にはフレーム予
測技術によって、一方現在のピクチャがインターレース
ピクチャとして認識される場合にはフィールド予測技術
によって、ビデオシーケンスのピクチャの動きベクトル
の洗練した計算を行うべく実現することが可能である。

【００２０】

【発明の実施の形態】本発明方法は、専らピクセルのグ
ループに関連する動きベクトルの以前に実施した推定に
依存して、符号化のために使用したスタンダードに拘わ
らずに、デジタルビデオシーケンスのピクチャをインタ
ーレースか又はプログレッシブのいずれかのピクチャと
して認識することを可能とする。本方法は、精度の向上
及び／又は計算の複雑性の減少という観点で動きベクト
ルの計算を改善するために使用することが可能である。

【００２１】本発明の基本的なアプローチは、連続する
半フレームのパラメータの比較を介して常に動き推定を
行うことによって、符号化すべきピクチャがインターレ
ース（飛び越し走査）又はプログレッシブ（順次走査）
であるかを検証することが可能であることを特徴として
いる。

【００２２】実際に、プログレッシブシーケンスの場合
には、動き推定が同一のフレームに属するトップフィー
ルドを参照してボトムフィールドに関して実施される場
合には、結果的に得られる動きベクトルの係数はゼロと
なる傾向がある。このことが発生する理由は、同一の時
刻にプログレッシブカメラによって２つのフィールドが
サンプルされるからであり（実際に、それらは同一のフ
レームに属している）、且つインターレースＰＡＬ（又
はＮＴＳＣ）カメラの場合におけるように１秒の１／５
０（又は１／６０）のインターバルにおいてサンプルさ
れるものではないからである。

【００２３】更に、正方向成分が実質的にゼロであるが
異なるパリティのフィールド間のラインの垂直差のため
に、動きベクトルの垂直成分が−１と１との間で構成さ
れている蓋然性が高い。上昇した垂直の詳細（空間周波
数）を具備するゾーンが存在しない垂直の動きを推定す
ることによって推定器をだます可能性は常にある。然し
ながら、この問題によって影響を受けることのない堅牢
な動き推定器を有しているものと仮定される。

【００２４】対照的に、フレームｋのトップフィールド
とフレームｋ−１の前のボトムフィールドとの間の動き
推定は、２つのフィールドが異なる時刻においてサンプ
ルされる場合には（且つ、実際に、それらが異なるフレ
ームに属している）、インターレースシーケンスにおけ
るばかりでなく究極的なプログレッシブシーケンスにお
いても効果的な動きを検知する。

【００２５】図１及び２はこの概念を例示しており、特
に、図１はプログレッシブカメラによって取られたボー
ルの動きを示しており、且つ図２はインターレースカメ
ラによって取られた同一のシーンを示している。理解さ
れるように、図２のシーケンスにおける１つのフィール
ドから次のものにおいては動きベクトルＭＶは常にゼロ
とは異なるものであるが、そのことは図１のシーケンス
の動きベクトルについては成立しない。実際に、同一の
フレームｋ又はｋ＋１のボトムフィールドからトップフ
ィールドへの動きベクトルＭＶは常にゼロであり、一方
フレームｋ＋１に属するトップフィールドからフレーム
ｋに属するボトムフィールドへの動きベクトルＭＶは常
にゼロとは異なっている。インターレースピクチャとプ
ログレッシブピクチャとを非常に容易な態様で区別する
ための本発明の基準はこのような特異性に基づいてい
る。

【００２６】（ｋ−１）番目のボトム半フレームに関し
てのｋ番目のトップ半フレームの動きベクトルをＭＶＴ
ＯＰ_X,Y（Ｋ）として表し且つｋ番目のトップ半フレー
ムに関してｋ番目のボトム半フレームの動きベクトルを
ＭＶＢＯＴ_X,Y（Ｋ）で表すこととし、尚ｋはフレーム
番号である。このような動きベクトルＭＶ＝（Ｖ_x，
Ｖ_y）はトップ半フレーム又はボトム半フレームに夫々
属するｋ番目のピクチャの単一ピクセル又は複数のピク
セルからなるグループ（マクロブロック）に関連するも
のとすることが可能である。

【００２７】本発明方法を実現するためには、推定によ
って、粗いものであっても、動きベクトルＭＶＴＯＰ
_X,Y（Ｋ）及びＭＶＢＯＴ_X,Y（Ｋ）を多くの夫々の動き
係数ＶＴＯＰ_X,Y（Ｋ）及びＶＢＯＴ_X,Y（Ｋ）として推
定することにより取得し且つこのような係数に依存して
現在のピクチャをプログレッシブ又はインターレースの
ピクチャとして認識することが必要である。

【００２８】動き係数ＶＴＯＰ_X,Y（Ｋ）及びＶＢＯＴ
_X,Y（Ｋ）を計算する好適な態様は、各動きベクトルＭ
Ｖに対して、その成分の絶対値の和を計算することであ
り、即ち、ｋ番目のピクチャのトップ半フレームの動き
ベクトルＭＶＴＯＰ_X,Y（Ｋ）を考慮することによっ
て、ＶＴＯＰ_X,Y（Ｋ）＝｜Ｖ_x｜＋｜Ｖ_y｜且つ、ｋ番目のピクチャのボトム半フレームの動きベク
トルＭＶＢＯＴ_X,Y（Ｋ）を考慮することによって、ＶＢＯＴ_X,Y（Ｋ）＝｜Ｖ_x｜＋｜Ｖ_y｜を行うことである。

【００２９】動き係数を計算する上の態様は幾つかの可
能なものの内の１つに過ぎず、例えば、動き係数をＶ_x
及びＶ_yの平方の和の平方根として計算することで充分
な場合があり又当業者にとって明らかなようなその他の
態様で充分な場合がある。

【００３０】１例として、動き係数ＶＴＯＰ_X,Y（Ｋ）
及びＶＢＯＴ_X,Y（Ｋ）が動きベクトルＭＶの成分の絶
対値の和として計算される場合について以下に説明する
が、本発明方法は異なる態様で動き係数を計算すること
によっても実現することが可能である。

【００３１】そのトップ半フレームの及びそのボトム半
フレームの動き係数の分布を検査することによってイン
ターレースピクチャとプログレッシブピクチャとを区別
することが可能である。経験的には、プログレッシブピ
クチャはトップ及びボトムの係数の分布において顕著な
差があることによって特性付けられ、一方インターレー
スピクチャはこれらの動き係数の分布がより一様なもの
であることによって特性付けられることが判明してい
る。

【００３２】この概念は図３及び４に示されており、そ
の場合には、プログレッシブシーケンス及びインターレ
ースシーケンスの夫々に関してトップ半フレーム（トッ
プフィールド）及びボトム半フレーム（ボトムフィール
ド）の動き係数の夫々の分布の２つの典型的なヒストグ
ラムが示されている。特に、図３においては、２つの分
布の間の差が明らかである。ボトムフィールドの係数の
分布は値１（水平軸）近くにより集中している（垂直
軸）によって特性付けられ、一方トップフィールドの係
数の分布はより大きな一様性を有しており、一方、図４
においては、これら２つのヒストグラムはほぼ同一であ
る。

【００３３】多くの異なるビデオシーケンスをテスト
し、異なる動き推定器で得られた動き係数の夫々の分布
を計算することによって、以下のことが判明している。

【００３４】※動画サブシーケンス（フィルムモード）
のフレームに属するボトムフィールドの動き係数の分布
は、ベクトルの垂直成分のために、１近くの最大値の周
りに集中している。一方、トップフィールドにおいて
は、このような最大値は明らかに一層低く、即ちボトム
フィールドにおけるよりも分散がより大きい。

【００３５】※インターレースシーケンスに属するトッ
プフィールド及びボトムフィールドの動き係数の分布は
実質的に同一の形状を有しており、且つこれらの分布の
分散は、動きが大きければ大きい程、一層大きい。

【００３６】シーケンス全体に対しての他に、単一のフ
レームに対しても実質的に同一の顕著な形状が得られ
る。

【００３７】実質的に、インターレースピクチャは、ト
ップ動き係数の分布がボトム動き係数のものとほぼ同一
であるという点において実質的に特性付けられ、一方プ
ログレッシブピクチャは、トップ及びボトム動き係数の
分布の間の顕著な差及びトップ動き係数の場合よりもボ
トム動き係数の最大値近くに比較的より強く集中してい
ることによって特性付けられる。

【００３８】上述した特性の内の１つの検知を使用して
ピクチャの内容がプログレッシブであるか又はインター
レースであるかの認識を行う。

【００３９】確率変数理論は、上述した特性の内の１つ
を認識するための幾つかの方法を提供している。このよ
うな方法は、トップ及びボトム動き係数の分布を表す一
対の形状係数を計算し、且つそれら２つの形状係数の間
で実質的な差異が存在するか否かを検証し、肯定の場合
にはそれら２つの分布が同一のものであるとして認識
し、そうでない場合には互いに異なるものであるとして
認識することを包含することが可能である。

【００４０】一方、これら２つの分布の相関を表す係数
を計算し、且つこのような相関係数がある値を超えるか
否かを検証し、肯定である場合には、そのピクチャがイ
ンターレースであり、そうでない場合にはプログレッシ
ブであるとして認識することが可能である。

【００４１】更に別の方法は、動き係数のこれら２つの
分布の最大値に関しての偏差を形状係数として使用する
ことが可能である。プログレッシブピクチャの場合に
は、ボトムフィールドの動き係数の値がトップフィール
ドの動き係数の値よりもそれらの最大値近くにより集ま
っているので、トップフィールドに対する偏差はボトム
フィールドに対する偏差よりも一層大きい。従って、ト
ップフィールドの動き係数の偏差がボトムフィールドの
動き係数の偏差よりもあるパーセントだけ超えている場
合には、そのピクチャはプログレッシブであり、そうで
ない場合にはインターレースであるということが可能で
ある。

【００４２】動き係数によってピクチャがプログレッシ
ブのピクチャであるとして認識するピクチャのタイプの
事前テストを実施する本発明の特に興味のある適用例は
以下に説明するものである。

【００４３】ビデオシーケンスにおいては、時折、「準
静止的」と呼ばれるピクチャが存在しており、その動き
はフレームの比較的小さな部分に制限されており、典型
的な準静止的ピクチャはテレビのニュース解説者を表す
ピクチャであり、その場合には、動きは解説者の顔に実
質的に制限されており、一方そのピクチャの残りの部分
は実質的に静的のままである。

【００４４】このような場合においては、プログレッシ
ブピクチャとインターレースピクチャとの間に存在する
差は比較的小さいものであり、従って、重大なるエラー
を導入することなしに、検査したピクチャを適宜分類す
ることが可能である。最も重要な適用例はＭＰＥＧスタ
ンダードに従って符号化したビデオシーケンスの場合で
あるので、準静止的ピクチャはプログレッシブであると
考えることが可能である。何故ならば、このような選択
はＭＰＥＧ符号化にとって必要とされる計算の数を著し
く減少させることを可能とするからである。

【００４５】「準静止的」ピクチャとしてのピクチャの
認識は、夫々、全てのトップ及びボトム動き係数の和と
しての（図６ａ及び６ｃの場合の「準静止的」ブロック
の信号Ｂによって表される）トップＳＶＴＯＰ及びボト
ムＳＶＢＯＴの夫々の２つの和係数を発生することによ
って実施される。両方の和係数ＳＶＴＯＰ及びＳＶＢＯ
Ｔが夫々の予め確立されている正の数Ｔ１及びＴ２より
も低い場合には、即ち、

【数１】

【００４６】である場合には、検査したピクチャは「準
静止的」ピクチャとして認識される。

【００４７】ピクチャを「準静止的」ピクチャとして取
扱うことの可能性から得られる著しい簡単化のために、
究極的にピクチャの内容がプログレッシブであるかイン
ターレースであるかを検知するための後のテストの前に
上述したテストを使用することが可能である。

【００４８】プログレッシブピクチャをインターレース
ピクチャから区別する好適な態様は、夫々ボトムＴＨＲ
１及びトップＴＨＲ２である２つの予め確立したスレッ
シュホールドを画定し、且つトップ動き係数ＶＴＯＰ
_X,Y（Ｋ）及びボトム動き係数ＶＢＯＴ_X,Y（Ｋ）をこれ
らのスレッシュホールドと比較を行うものであり、それ
は以下のように表すことが可能である。

【００４９】

【数２】

【００５０】トップフィールドのパラメータＮ１ＴＯＰ
（Ｋ）を計算する１つの可能な機能的ブロック図の１例
を図５に示してある。他の３つのパラメータを計算する
アーキテクチャも同じである。

【００５１】図３及び４のヒストグラムを参照すると、
Ｎ１ＴＯＰ（Ｋ）及びＮ１ＢＯＴ（Ｋ）が分布の最大値
の表示を与え（ＴＨＲ１がこのような最大値よりも大き
い場合）、一方Ｎ２ＴＯＰ（Ｋ）及びＮ２ＢＯＴ（Ｋ）
がそれらの分散を与える（ヒストグラムを取囲むドーム
形状の曲線の幅）ことを理解することが可能である。

【００５２】以下の比を定義する。

【００５３】

【数３】

【００５４】γ、δ、ε、ηを４つの予め確立した数と
して、以下のテストの全てが検証される場合には、

【数４】

【００５５】ｋ番目のフレームはプログレッシブである
として認識され、そうでない場合にはインターレースで
あるとして認識される。

【００５６】例えばＲ２（Ｋ）及びＲ４（Ｋ）のみを使
用する代わりに４つのパラメータの全てを使用すること
の選択は、各フレームに対しての決定を行わねばならな
いので、不確実性を最小とするためには全ての使用可能
な情報を使用することが好適であるという事実に起因し
ている。

【００５７】エラーを防止するためには、以下の条件を
適用することも可能である。

【００５８】

【数５】

【００５９】尚、θ及びιは２つの予め確立した正の数
である。後者の条件はピクチャをプログレッシブである
として分類するための２つの分布の間により区別可能な
差異を課している。

【００６０】上述した手順の利点は、専ら単一のピクセ
ルに対してではなくマクロブロックに対して確立された
動きベクトルについて動作を行う可能性である。このこ
とは計算を著しく簡単化させることを可能としており、
そのことは本発明方法を特に低コストの適用例において
適切なものとさせている。

【００６１】ピクチャの内容がインターレースであるか
プログレッシブであるかを検知するための本発明の手順
によって与えられる結果において、動きが区別を行うこ
とを非常に困難にさせるようなものであってビデオシー
ケンスの短い部分によって発生されるような振動を回避
するために、先行するフレームにおいて行われた決定を
考慮する簡単なヒステリシスメカニズムを導入すること
が可能である。

【００６２】ヒステリシスメカニズムは、本発明の上述
した方法の内の１つに従ってピクチャがプログレッシブ
であるかインターレースであるかの認識に依存して各ピ
クチャを一時的な重み値Ｐ（Ｋ）と関連付けし、１つ又
はそれ以上の先行するピクチャと相対的な最終的な重み
値Ｄ（Ｉ）及びその一時的な重み値Ｐ（Ｋ）の関数とし
て最終的な重み値Ｄ（Ｋ）を各処理したピクチャに対し
て計算し、現在のピクチャがプログレッシブであるかイ
ンターレースであるかの認識をその最終的な重み値に基
づいて行うことにより実現することが可能である。

【００６３】このようなヒステリシスメカニズムをどの
ようにして実現することが可能であるかの１つの例を図
６ａのフローチャートに示してある。

【００６４】最初に、例えばＮＦ＝３としてパラメータ
ＮＦに対して値を割り当てることによって考慮すべき前
のピクチャの数を決定せねばならない。その後に、本シ
ステムが動きベクトルを推定するための任意の技術を適
用し且つ動き係数ＶＴＯＰ_X, _Y（Ｋ）及びＶＢＯＴ
_X,Y（Ｋ）を計算する。これらの係数の値から開始し
て、「準静止的」ブロックが、上述したアルゴリズムに
従って、そのピクチャが準静止的であるか否かを検証す
る。その結果が肯定である場合には、そのピクチャはプ
ログレッシブであるとして分類され、その最終的な重み
はＤ（Ｋ）＝ωとして確立され且つ次のピクチャが処理
される。

【００６５】その結果が否定である場合には、本システ
ムは式（３）及び（５）に従ってＲ１（Ｋ）、Ｒ２
（Ｋ）、Ｒ３（Ｋ）、Ｒ４（Ｋ）、Ｒ５（Ｋ）、Ｒ６
（Ｋ）の比を計算する。これらの比が不等記号（４）及
び（５）を満足する場合には、図６ｃにおいてより詳細
に示してある（ヒステリシス）ブロックが一時的な重み
Ｐ（Ｋ）をそのピクチャと関連付ける。このような一時
的な重みは、不等記号（４）及び（５）が満足される場
合には数βに等しく、そうでない場合には数αに等し
い。

【００６６】該一時的重みが既知である場合には、最後
の２つのフレーム及び現在のフレームに関連している重
みの和がある数μと等しいか又はそれより大きい場合
に、即ち、Ｐ（Ｋ）＋Ｄ（Ｋ−１）＋Ｄ（Ｋ−２）≧μ である場合に、「ヒステリシス」ブロックは現在のフレ
ームをプログレッシブフレームとして認識し、且つその
フレームは最終的な重みＤ（Ｋ）＝βを取得する。反対
の場合には、現在のフレームは最終的な重みＤ（ｋ）＝
ωを取得し、インターレースとして分類される。

【００６７】式（４）及び（５）が検証されない場合
（図６ａ及び６ｂにおける「ヒステリシス」ブロックの
入力Ｎ）、現在のフレームｋは一時的にインターレース
として分類され且つ一時的な重みＰ（Ｋ）＝αを取る。
相補的な条件が検証される場合、即ち、Ｐ（Ｋ）＋Ｄ（Ｋ−１）＋Ｄ（Ｋ−２）≦μ である場合に、最終的な選択はインターレースフレーム
であり、最終的な重みはＤ（Ｋ）＝αであり、その反対
の場合は、該フレームはプログレッシブとして分類され
且つ最終的な重みＤ（Ｋ）＝ωを取る。

【００６８】本発明の好適実施例によれば、重みα、
β、μ、ωは０、１、１．５、０．５に等しいが、これ
らの値は同一のピクチャシーケンス期間中であっても、
必要性に依存して変化させることが可能である。

【００６９】このようなヒステリシス手順の場合には、
重みＤ（Ｋ−１）及びＤ（Ｋ−２）によって前のフレー
ムにおいて行われた実効的な選択及び種々の決定パラメ
ータＲ１（Ｋ）、Ｒ２（Ｋ）、Ｒ３（Ｋ）、Ｒ４（Ｋ）
によって与えられる表示が２つの可能な選択の内のいず
れにも優先度を与えることなしに、考慮される。

【００７０】本発明方法の１実施例のブロック図を図７
に示してある。動きベクトルの推定から開始して、現在
のピクチャが準静止的であるか否かが検証され、次いで
本発明アルゴリズム（ＩＰＤ）が実行され且つ最終的に
ヒステリシス手順を実現する機能的ブロックが、そのピ
クチャがプログレッシブであるかインターレースである
かを表すフラグを発生する。

【００７１】該ヒステリシス手順を使用して、インター
レースからプログレッシブへのスキャニングモードの急
激な変化が防止され、従って短期間持続する擾乱（ノイ
ズ）が決定に影響を与えることを回避する。

【００７２】本発明方法は、最低数の計算とさせる計算
アルゴリズムを適応的に選択することによって最も洗練
された態様で運動ベクトルの計算を行うことを可能とす
る。

【００７３】デジタルピクチャのシーケンスを取扱うＭ
ＰＥＧ２スタンダードによって取られる重要性に鑑み、
以下においては、ＭＰＥＧ２システムを参照するが、同
一の考察は異なるスタンダードに基づくシステムにおい
ても同様に適用可能である。

【００７４】ＭＥＰＧ２スタンダードにおいては、他の
スタンダードにおけるように、動き推定及びその結果の
時間的予測の少なくとも２つの異なる技術が可能であ
る。

【００７５】※フレーム予測、この場合には、現在のピ
クチャをフレーム種類（１６×１６ピクセル）のマクロ
ブロックに分割し、且つそれらの各々に対して、先行す
るフレームにおける予測子を動き推定用の任意の方法で
見つけ出す。

【００７６】※フィールド予測、この場合には、各マク
ロブロックフレームをその２つの成分フィールド（１６
×８ピクセル）に分割し、その内の１つは偶数半フレー
ムに関するものであり且つ別の１つは奇数半フレームに
関するものであり且つそれらの各々に対して、時間的に
先行するピクチャに属する同一のパリティのフィールド
に関する予測子が見つけられる。

【００７７】最良の符号化は、１つのマクロブロックの
予測子の全ての可能な組み合わせ、即ちフレーム、フィ
ールドトップｋ−１上のフィールドトップｋ、フィール
ドボトムｋ−１上のフィールドトップｋ、フィールドト
ップｋ−１上のフィールドボトムｋ、フィールドボトム
ｋ−１上のフィールドボトムｋについてテストすること
によって得られる。全ての場合において、予測（及び動
き推定）は前方又は後方種類のものとすることが可能で
ある。従って、各マクロブロックに対して多数のマッチ
ングエラーを計算することが必要である。

【００７８】このことは低コスト適用例の場合には厄介
なものとなり、実際に、殆ど動きの内インターレースシ
ーケンスは何等重要なる品質を喪失することなしにプロ
グレッシブとして符号化することが可能であり、従って
フィールド予測を煩わせることを回避する。同様に、か
なりの動きを伴うインターレースシーケンスはフレーム
として予測することの利点を有するものではなく、それ
はフィールド予測推定を必要とするに過ぎない場合があ
る。

【００７９】フィールド又はフレーム推定のみを実施す
ることによって著しい計算上の簡単化を得ることが可能
である（約３０％から約５０％）。いつフィールドモー
ドで動作すべきか及びいつフレームモードで動作すべき
かを動き推定器に対して告知するメカニズムが必要であ
るに過ぎない。このことは、本発明のＩＰＤアルゴリズ
ムによって与えることが可能である。唯一の条件は、動
き推定を１つ又はそれ以上のステップで連続するフィー
ルドに関して実施するということである。

【００８０】図８に示した「粗目サーチ」ブロックによ
って実施される第一ステップは、連続するフレームから
動きベクトルの粗目の推定を計算するために必要であ
る。「微細サーチ」ブロックによって実施される第二ス
テップは、効果的な符号化に対して必要な動きベクトル
のより細かい推定を計算するのに必要である。第１ステ
ップの終わりにおいて、第二ステップにおける微細な動
き推定を実現するために本発明のＩＰＤ手順を実施する
ことが可能である。

【００８１】最後に、本発明のＩＰＤ方法は、動き推定
用の方法と関連された場合に、本発明のＩＰＤ係数なし
で動き推定器を使用する場合と比較して別の利点を提供
する。即ち、 ※マクロブロック当たりの計算されたマッチングの同一
の最大数に対して予測ピクチャのより良い品質を与え
る。何故ならば、ＩＰＤ係数によって与えられる表示に
依存して予測モードを選択することによりフレームのみ
又はフィールドのみの予測子（ある最大数まで）の数を
増加させることが可能だからである。

【００８２】※予測されたピクチャの同一の品質に対し
マクロブロック当たりのマッチングの数がより少ない。
何故ならば、ＩＰＤ係数によって与えられる表示に依存
してフィールド予測又はフレーム予測のいずれかが実施
され、動き推定モードに依存してマッチングの数が３０
％乃至５０％節約されるからである。

【００８３】以上、本発明の具体的実施の態様について
詳細に説明したが、本発明は、これら具体例にのみ制限
されるべきものではなく、本発明の技術的範囲を逸脱す
ることなしに種々の変形が可能であることは勿論であ
る。

【図面の簡単な説明】

【図１】プログレッシブカメラで撮られたビデオシー
ケンスの一例を示した概略図。

【図２】インターレースカメラで撮られたビデオシー
ケンスの一例を示した概略図。

【図３】プログレッシブシーケンスのトップ半フレー
ム（トップフィールド）及びボトム半フレーム（ボトム
フィールド）の動きベクトルの動き係数の可能な分布の
一例を示した概略図。

【図４】インターレースシーケンスのトップ半フレー
ム（トップフィールド）及びボトム半フレーム（ボトム
フィールド）の動きベクトルの動き係数の可能な分布の
一例を示した概略図。

【図５】比較係数を計算するアルゴリズムを実行する
ブロック図。

【図６ａ】本発明のＩＰＤ手順を示したフローチャー
ト。

【図６ｂ】図６の「ヒステリシス」機能ブロックの詳
細を示したフローチャート。

【図６ｃ】図６ａの「準静止的」機能的ブロックを示
したフローチャート。

【図７】ピクチャの内容がプログレッシブであるか又
はインターレースであるかの検知を行う構成を示した概
略図。

【図８】本発明のＩＰＤステップを使用する一般的な
２ステップ動き推定器を示した概略ブロック図。

───────────────────────────────────────────────────── フロントページの続き (72)発明者ルカバッティステッリイタリア国， 30027 サンドーナディピアーベ，ビアモンテピアーナ４

Claims

【特許請求の範囲】

【請求項１】トップ半フレーム及びボトム半フレーム
に分割可能なプログレッシブ又はインターレースピクチ
ャのビデオシーケンスの符号化データのビットストリー
ムを処理する方法であって、先行するピクチャ（ＭＶＴ
ＯＰ_X,Y（Ｋ））のボトム半フレームに属するピクセル
に関連して現在のピクチャの前記トップ半フレームに属
するピクセルのグループの動きベクトル、及び現在のピ
クチャ（ＭＶＢＯＴ_X,Y（Ｋ））のトップ半フレームに
属するピクセルに関連して現在のピクチャの前記ボトム
半フレームのピクセルのグループの動きベクトルを推定
することを包含するビットストリームの処理方法におい
て、前記トップ半フレーム及びボトム半フレームの各マクロ
ブロックに対してトップ半フレーム（ＭＶＴＯＰ
_X,Y（Ｋ））及びボトム半フレーム（ＭＶＢＯＴ
_X,Y（Ｋ））の動きベクトルの推定に依存して夫々のト
ップ動き係数（ＶＴＯＰ_X,Y（Ｋ））及びボトム動き係
数（ＶＢＯＴ_X,Y（Ｋ））を計算し、前記動き係数（Ｖ
ＴＯＰ_X,Y（Ｋ），ＶＢＯＴ_X,Y（Ｋ））の値の分布が実
質的に等しいことにより前記現在のピクチャをインター
レースピクチャとして認識し、又は前記動き係数（ＶＴ
ＯＰ_X,Y（Ｋ），ＶＢＯＴ_X,Y（Ｋ））の値の分布が実質
的に等しくないことにより前記現在のピクチャをプログ
レッシブピクチャとして認識する、ことを特徴とする方
法。
【請求項２】請求項１において、前記認識が、以下の
動作、即ち、前記トップ動き係数（ＶＴＯＰ_X,Y（Ｋ））及びボトム
動き係数（ＶＢＯＴ_X,Y（Ｋ））を、夫々、予め確立し
たトップスレッシュホールド（ＴＨＲ１）及びボトムス
レッシュホールド（ＴＨＲ２）と比較し、一対の第一（Ｎ１ＴＯＰ（Ｋ））及び第二（Ｎ１ＢＯＴ
（Ｋ））係数を発生する前記現在のピクチャの前記トッ
プ半フレーム（ＭＶＴＯＰ_X,Y（Ｋ））及びボトム半フ
レーム（ＶＢＯＴ_X,Y（Ｋ））のその動き係数が前記ト
ップスレッシュホールド（ＴＨＲ１）よりも低い動きベ
クトルの数をカウントし、第二対の第三（Ｎ２ＴＯＰ（Ｋ））及び第四（Ｎ２ＢＯ
Ｔ（Ｋ））係数を発生する前記現在のピクチャの前記ト
ップ半フレーム（ＭＶＴＯＰ_X,Y（Ｋ））及びボトム半
フレーム（ＶＴＯＰ_X,Y（Ｋ））のその動き係数が前記
ボトムスレッシュホールド（ＴＨＲ２）よりも大きな動
きベクトルの数をカウントし、現在のピクチャ及び先行するピクチャと相対的な前記第
一（Ｎ１ＴＯＰ（Ｋ））、第二（Ｎ１ＢＯＴ（Ｋ））、
第三（Ｎ２ＴＯＰ（Ｋ））、第四（Ｎ２ＢＯＴ（Ｋ））
係数に依存して前記現在のピクチャをプログレッシブピ
クチャ又はインターレースピクチャとして認識する、こ
とを特徴とする方法。
【請求項３】請求項１において、前記トップ及びボト
ム動き係数の計算した値を使用して予備的なテストを実
施し、前記予備的なテストが、現在のピクチャのトップ半フレームに属するマクロブロ
ックの動き係数を加算してトップ和係数（ＳＶＴＯＰ
（Ｋ））を発生し、現在のピクチャのボトム半フレームに属するマクロブロ
ックの動き係数を加算してボトム和係数（ＳＶＢＯＴ
（Ｋ））を発生し、前記トップ和係数（ＳＶＴＯＰ（Ｋ））及びボトム和係
数（ＳＶＢＯＴ（Ｋ））が夫々の予め確立した第一（Ｔ
１）及び第二（Ｔ２）の正の数よりも低い場合に現在の
ピクチャをプログレッシブピクチャとして画定し、そう
でない場合には請求項２の動作シーケンスで進行する、
ことを特徴とする方法。
【請求項４】請求項１において、前記認識が、前記トップ及びボトム動き係数の分布を夫々表す一対の
第一及び第二形状係数を計算し、前記形状係数が、夫々、ある値より大きいか又は小さい
量だけ異なるか否かにより現在のピクチャをプログレッ
シブピクチャとして又はインターレースピクチャとして
認識する、ことによって実施することを特徴とする方
法。
【請求項５】請求項１において、前記認識が、前記トップ及びボトム動き係数の分布の間の確率的相関
を表す係数を計算し、前記計算した係数がある値を超えるか否かによって現在
のピクチャをインターレースピクチャとして又はプログ
レッシブピクチャとして認識する、ことによって実施す
ることを特徴とする方法。
【請求項６】請求項２又は３において、現在のピクチャ（Ｎ１ＴＯＰ（Ｋ））に関する前記第一
係数と先行するピクチャ（Ｎ１ＢＯＴ（Ｋ−１））に関
する前記第二係数との間の第一比（Ｒ１（Ｋ））を計算
し、現在のピクチャ（Ｎ１ＢＯＴ（Ｋ））に関する前記第二
係数と現在のピクチャ（Ｎ１ＴＯＰ（Ｋ））に関する前
記第一係数との間の第二比（Ｒ２（Ｋ））を計算し、現在のピクチャ（Ｎ３ＴＯＰ（Ｋ））に関する前記第三
係数と先行するピクチャ（Ｎ２ＢＯＴ（Ｋ−１））に関
する前記第四係数との間の第三比（Ｒ３（Ｋ））を計算
し、現在のピクチャ（Ｎ２ＢＯＴ（Ｋ））に関する前記第四
係数と現在のピクチャ（Ｎ２ＴＯＰ（Ｋ））に関する前
記第三係数との間の第四比（Ｒ４（Ｋ））を計算し、前記第一比（Ｒ１（Ｋ））、第二比（Ｒ２（Ｋ））、第
三比（Ｒ３（Ｋ））、第四比（Ｒ４（Ｋ））を夫々の予
め確立した第三の正の数（γ）、第四の正の数（δ）、
第五の正の数（ε）、第六の正の数（η）と比較し、前
記第一比（Ｒ１（Ｋ））及び第四比（Ｒ４（Ｋ））が夫
々前記第三の数（γ）及び第六の数（η）よりも低く、
且つ、同時的に前記第二比（Ｒ２（Ｋ））及び第三比
（Ｒ３（Ｋ））が夫々第四の数（δ）及び第五の数
（ε）よりも大きい場合に、現在のピクチャをプログレ
ッシブピクチャとして認識する、ことを有していること
を特徴とする方法。
【請求項７】請求項６において、前記第二比（Ｒ２（Ｋ））及び第一比（Ｒ１（Ｋ））を
それらの間で割算して第五比（Ｒ５（Ｋ））を発生し、前記第三比（Ｒ３（Ｋ））及び第四比（Ｒ４（Ｋ））を
それらの間で割算して第六比（Ｒ６（Ｋ））を発生し、請求項６の方法の条件が満足される場合であって且つ、
同時的に、前記第五比（Ｒ５（Ｋ））及び第六比（Ｒ６
（Ｋ））が予め確立した第七の数（θ）及び第八の数
（ι）よりも大きい場合に現在のピクチャをプログレッ
シブピクチャとして認識する、ことを特徴とする方法。
【請求項８】請求項１乃至７の内のいずれか１項にお
いて、各作成したピクチャに対して、先行する請求項の方法の
内の１つに従って実施したプログレッシブ又はインター
レースピクチャとして現在のピクチャの認識結果の関数
として一時的な重み値（Ｐ（Ｋ））を計算し、各作成したピクチャに対して、先行するピクチャ（Ｄ
（Ｉ））に関する最終的な重み値の及び現在のピクチャ
（Ｐ（Ｋ））に関する前記一時的な重み値の関数として
最終的な重み値（Ｄ（Ｋ））を計算し、現在のピクチャ（Ｐ（Ｋ））に関する前記一時的な重み
値及び先行するピクチャ（Ｄ（Ｉ））に関する前記最終
的な重み値に依存して現在のピクチャをプログレッシブ
又はインターレースのピクチャとして認識する、ことを
特徴とする方法。
【請求項９】請求項１において、現在のピクチャがプ
ログレッシブピクチャとして認識される場合にはフレー
ム予測技術によって、一方現在のピクチャがインターレ
ースピクチャとして認識される場合にはフィールド予測
技術によって現在動きベクトルを計算することによりビ
デオシーケンスのピクチャの動きベクトルの計算を行う
ことを特徴とする方法。