JPH09261661A

JPH09261661A - ２つの基準ピクチャから双方向コード化ピクチャを形成するための方法

Info

Publication number: JPH09261661A
Application number: JP9029047A
Authority: JP
Inventors: Ronald Steven Svec; ロナルド・スティーヴン・スヴィック; Everett George Vail; エヴェレット・ジョージ・ヴェイル・ザ＝サード
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1996-02-16
Filing date: 1997-02-13
Publication date: 1997-10-03
Also published as: DE19702728A1; KR970064262A; TW366647B; KR100240620B1

Abstract

(57)【要約】【課題】２つの基準ピクチャから双方向コード化ピク
チャを形成する方法を提供することにある。【解決手段】この方法は、各基準ピクチャのメモリ取
出しを行い、その全ピクセル境界で最善一致マクロブロ
ックを検出し、全ピクセル境界マクロブロックを補間し
て双方向マクロブロックを形成し、それから半ピクセル
基準ピクチャ・データを計算することから始まる。サイ
ズ、形状、向きの点で最善一致マクロブロックが対称的
になるように、最善一致マクロブロックから過剰ピクセ
ルが除去される。これは、過剰ピクセルを示すようにエ
ッジ検出器を設定することによって達成することができ
る。過剰ピクセルは、最善一致マクロブロックをサイ
ズ、形状、または向きの点で互いに異なるものにするピ
クセルに対応する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、ディジタル視覚画
像の圧縮に関し、より具体的には、時間圧縮、すなわ
ち、ＭＰＥＧ２規格によるピクチャ間の冗長性の低減に
関する。動きベクトルの使用により、ピクチャ間の冗長
性が低減されるか、または解消される。本発明によれ
ば、対称的な過去および今後の最善一致マクロブロック
から双方向予測ピクチャ用の半ペル動きベクトルが生成
される。対称的とは、マクロブロックが、同じサイズ、
形状、向きであることを意味する。

【０００２】

【従来の技術】この１０年間、世界中に及ぶ電子通信シ
ステムの出現により、情報の送受信を可能にする方法が
強化されてきた。特に、リアルタイム・ビデオおよびオ
ーディオ・システムの諸機能は、近年、非常に改善され
てきた。ビデオオンデマンドやテレビ会議などのサービ
スを加入者に提供するため、膨大な量のネットワーク帯
域幅が必要になっている。事実、ネットワーク帯域幅が
このようなシステムの有効性を阻害する主な原因になっ
ている場合が多い。

【０００３】ネットワークによって課せられた制約を克
服するため、圧縮システムが現れた。このようなシステ
ムは、ピクチャ・シーケンス内の冗長性を除去すること
によって、伝送しなければならないビデオおよびオーデ
ィオ・データの量を削減するものである。受信端では、
ピクチャ・シーケンスが圧縮解除され、リアルタイムで
表示することもできる。

【０００４】新たなビデオ圧縮規格の一例は、Moving P
icture Experts Group（「ＭＰＥＧ」）規格である。こ
のＭＰＥＧ規格では、所与の１つのピクチャ内と、複数
のピクチャ間の両方について、ビデオ圧縮が定義されて
いる。１つのピクチャ内のビデオ圧縮は、離散余弦変
換、量子化、可変長コーディング、ハフマン・コーディ
ングによってディジタル画像を時間ドメインから周波数
ドメインに変換することにより行われる。複数のピクチ
ャ間のビデオ圧縮は、動き推定と呼ばれるプロセスによ
り行われるが、そのプロセスでは、動きベクトルを使用
して、あるピクチャから別のピクチャへの１組の画素
（ペル）の変換を記述する。

【０００５】動き推定は、現行ピクチャから１６×１６
のマクロブロックのデータを取り、それを基準ピクチャ
の探索ウィンドウ、すなわち、双方向予測のための両方
の基準ピクチャの探索ウィンドウ内のすべての１６×１
６のマクロブロックと比較することによって行われる。
探索ウィンドウの中心は、現行の１６×１６のマクロブ
ロックの位置周辺に位置する。この比較は、現行マクロ
ブロックと基準マクロブロックの累算絶対ペル差を取
り、最善一致マクロブロックとして最も低い予測差に関
連する基準マクロブロックを選択することによって行わ
れる。

【０００６】ＭＰＥＧ２規格では、過去および今後の基
準ピクチャの双方向補間を使用して、ピクチャ符号化の
ための動き推定を計算することができる。事実、これ
は、最も高度のデータ圧縮を備えているので、最も効率
のよい形式の動き推定である。この推定は、全ペル値を
使って行うか、または半ペル値を使って行うことができ
る。半ペル値は、全ペル値同士の補間によって形成され
る。１６×１６のマクロブロックについて可能なすべて
の半ペル値を形成するためには、マクロブロックの両側
に余分な全ペル値が１つずつある、全ペル値からなる１
８×１８の領域が必要である。

【０００７】半ペル動き推定に関して発生する問題の１
つは、基準データの最善一致全ペル位置が全ペル探索ウ
ィンドウのエッジなどの１つのエッジ上にあるときに、
マクロブロックのその側にある余分な全ペル値を半ペル
値の形成に利用できないことである。

【０００８】この問題は、一方の基準ピクチャからの最
善一致全ペル・データがそのピクチャの１つのエッジ上
にあり、もう一方のピクチャからのデータが同じエッジ
上にないときに双方向半ペル動き推定で発生する。この
場合、半ペル計算プロセッサには、現行マクロブロック
の原点に関する寸法、形状、または向きが異なる２組の
基準データが与えられるはずである。このため、双方向
半ペル値を形成するためにデータの埋込み、位置合せ、
スキップを行うには、基準データに関する個別の読取り
制御が必要になるはずである。

【０００９】

【発明が解決しようとする課題】本発明の主な目的は、
非対称探索ウィンドウに対称性を取り入れることにあ
る。これは、双方向に補間したピクチャを形成する際に
使用する最善一致マクロブロックが同数のピクセルと、
同じ形状と、同じ向きを備えるようにするためである。

【００１０】

【課題を解決するための手段】本発明の方法および装置
により、上記の目的は、２つの基準ピクチャから双方向
コード化ピクチャを形成することによって達成される。
この方法は、各基準ピクチャのメモリ取出しを行い、探
索ウィンドウの全ピクセル境界で最善一致マクロブロッ
クを検出することから始まる。サイズ、形状、向きの点
で最善一致マクロブロックが対称的になるように、最善
一致マクロブロックから過剰ピクセルが除去される。こ
れは、過剰ピクセルを示すようにエッジ検出器を設定す
ることによって達成することができる。過剰ピクセル
は、最善一致マクロブロックをサイズ、形状、または向
きの点で互いに異なるものにするピクセルに対応する。

【００１１】したがって、本発明によれば、過去および
今後両方のピクチャからの対称的な基準データを半ペル
計算回路に必ず与えることが可能になる。すなわち、こ
のデータは、現行マクロブロック位置に対して同じ寸法
と同じ向きを備えている。より正確には、２つのマクロ
ブロックが同じ寸法を備えていない場合、大きい方のマ
クロブロックは小さい方のマクロブロックのサイズまで
縮小される。

【００１２】本明細書に添付した図面を参照すれば、本
発明をより明確に理解できるだろう。

【００１３】

【発明の実施の形態】ここに記載する本発明は、Ｂすな
わち双方向に補間したピクチャのための半ペル動き推定
の完了された方法に関するものであり、Ｂピクチャの半
ペル動き推定方法に関してAgnes NgaiおよびRonald S.
Svecにより１９９５年３月２７に出願され、本出願人に
譲渡された関連米国特許出願第０８／４１１１００号に
記載された方法の改良である。

【００１４】本発明は、ＭＰＥＧおよびＨＤＴＶ適合エ
ンコーダと、符号化プロセスとに関する。このエンコー
ダが実行する符号化機能は、データ入力と、動き推定
と、マクロブロック・モード生成と、データ再構築と、
エントロピ・コーディングと、データ出力とを含む。動
き推定および補償は時間圧縮機能である。これは、計算
要件が高い反復機能であり、逆離散余弦変換、逆量子
化、動き補償など、集中的な再構築処理を含む。

【００１５】より具体的には、本発明は、動き推定、補
償、予測に関し、さらに具体的には、動きベクトルの計
算に関する。動き補償では、現行ピクチャをブロック、
たとえば、マクロブロックに分割し、次に事前に伝送し
たピクチャ内を探索して同様の内容の近隣ブロックを探
すことにより、時間的冗長性を活用する。実際には、現
行ブロック・ペルと基準ピクチャから抽出した予測ブロ
ック・ペルとの差だけが伝送用に圧縮され、その後、伝
送される。

【００１６】動き補償および予測の最も単純な方法は、
「Ｉ」ピクチャ内のすべてのピクセルの輝度とクロミナ
ンス、すなわち、強度と色を記録し、次に後続ピクチャ
内のすべての特定のピクセルの輝度とクロミナンス、す
なわち、強度と色の変化を記録することである。しか
し、これは、伝送媒体帯域幅、メモリ、プロセッサ容
量、処理時間の点で不経済である。というのは、物体は
ピクチャ間で移動する、すなわち、ピクセル内容は１つ
のピクチャ内の１つの位置から後続ピクチャ内の別の位
置に移動するからである。より進んだ考え方としては、
直前または後続のピクチャを使用して、たとえば、動き
ベクトルによって１ブロック分のピクセルが後続または
直前のピクチャ（複数も可）内のどこに入るかを予測
し、その結果を「予測ピクチャ」または「Ｐ」ピクチャ
として書き込む方法がある。より具体的には、これは、
ｉ番目のピクチャの複数のピクセルまたはそのピクセル
のマクロブロックがｉ−１番目またはｉ＋１番目のピク
チャ内のどこに入るかという最善推定または予測を含
む。さらにもう１つのステップは、後続ピクチャと直前
ピクチャの両方を使用して、１ブロック分のピクセルが
中間ピクチャまたは「Ｂ」ピクチャ内のどこに入るかを
予測することである。

【００１７】ピクチャ符号化順序およびピクチャ伝送順
序は必ずしもピクチャ表示順序と一致しないことに留意
されたい。これについては図２に示す。Ｉ−Ｐ−Ｂシス
テムの場合、入力ピクチャ伝送順序は符号化順序とは異
なるので、入力ピクチャは符号化に使用するまで一時的
に格納する必要がある。したがって、この入力を使用す
るまでバッファがそれを格納する。

【００１８】例示のため、ＭＰＥＧ適合符号化の汎用流
れ図を図１に示す。この流れ図では、ｉ番目のピクチャ
とｉ＋１番目のピクチャの画像を処理して、動きベクト
ルを生成する。動きベクトルにより、１マクロブロック
分のピクセルが直前または後続ピクチャ内のどこに入る
かを予測する。完全画像の代わりに動きベクトルを使用
することは、ＭＰＥＧおよびＨＤＴＶ規格の時間圧縮の
重要な態様の１つである。図１に示すように、生成した
動きベクトルは、ｉ番目のピクチャからｉ＋１番目のピ
クチャへのマクロブロックのピクセルの変換に使用す
る。

【００１９】図１に示すように、符号化プロセスでは、
ｉ番目のピクチャとｉ＋１番目のピクチャの画像をエン
コーダ１１で処理し、たとえば、ｉ＋１番目のピクチャ
と後続ピクチャを符号化し伝送する際の形式である動き
ベクトルを生成する。後続ピクチャの入力画像１１１
は、エンコーダの動き推定ユニット４３に移行する。動
きベクトル１１３は動き推定ユニット４３の出力として
形成される。これらのベクトルは、動き補償ユニット４
１が使用し、このユニットによる出力のために、「基
準」データというマクロブロック・データを直前または
今後のピクチャから取り出す。動き補償ユニット４１の
一方の出力と、動き推定ユニット４３からの出力との差
が計算され、離散余弦変換器２１の入力に移行する。離
散余弦変換器２１の出力は量子化器２３で量子化され
る。量子化器２３の出力は２つの出力、１２１と１３１
に分割され、一方の出力１２１は伝送前にさらに圧縮し
処理するためにラン・レングス・エンコーダなどのダウ
ンストリーム要素２５に移行し、もう一方の出力１３１
はフレーム・メモリ４２に格納するために符号化したマ
クロブロック分のピクセルの再構築が行われる。例示の
ために図示したエンコーダでは、この第２の出力１３１
は逆量子化２９と逆離散余弦変換３１が行われ、差マク
ロブロックの損失バージョンを返す。このデータは、動
き補償ユニット４１の出力と加算され、元のピクチャの
損失バージョンをフレーム・メモリ４２に返す。

【００２０】図２に示すように、ピクチャには３種類の
タイプがある。「イントラ・ピクチャ」すなわち「Ｉ」
ピクチャは、全面的に符号化し伝送されるもので、動き
ベクトルを定義する必要はない。このような「Ｉ」ピク
チャは、動きベクトルの発生源として機能する。次に、
「予測ピクチャ」すなわち「Ｐ」ピクチャは、直前ピク
チャからの動きベクトルによって形成されるもので、他
のピクチャのための動きベクトルの発生源として機能す
ることができる。最後に、「双方向ピクチャ」すなわち
「Ｂ」ピクチャは、他の２つのピクチャ、すなわち、一
方は過去のピクチャでもう一方は今後のピクチャからの
動きベクトルによって形成されるもので、動きベクトル
の発生源として機能することはできない。動きベクトル
は「Ｉ」ピクチャおよび「Ｐ」ピクチャから生成され、
「Ｐ」ピクチャおよび「Ｂ」ピクチャを形成するために
使用する。

【００２１】図３に示す、動き推定を実行する方法は、
ｉ番目のピクチャのマクロブロック２１１から次のピク
チャの領域全体にわたって探索し、最善一致マクロブロ
ック２１３を検出する方法である。このようにしてマク
ロブロックを変換すると、図４に示すように、ｉ＋１番
目のピクチャ用のマクロブロックのパターンが得られ
る。このため、ｉ番目のピクチャは、たとえば、動きベ
クトルと差データにより、わずかに変化してｉ＋１番目
のピクチャを生成する。符号化されるのは、動きベクト
ルと差データであって、ｉ＋１番目のピクチャそのもの
ではない。動きベクトルはピクチャごとの画像の位置を
変換し、差データはクロミナンス、輝度、彩度の変化、
すなわち、色と明るさの変化を伝える。

【００２２】図３に戻ると、ｉ番目のピクチャ内でｉ＋
１番目のピクチャと同じ位置から始めることにより一致
を探す。探索ウィンドウはｉ番目のピクチャに作成され
る。この探索ウィンドウ内で最善一致を探索する。検出
後、マクロブロック用の最善一致動きベクトルがコード
化される。最善一致マクロブロックのコーディングは、
動きベクトル、すなわち、次のピクチャで変位している
最善一致であるｙ方向のピクセル数とｘ方向のピクセル
数とを含む。また、現行マクロブロックと最善一致基準
マクロブロックとのクロミナンスと輝度の差である、
「予測エラー」とも呼ばれる差データも符号化される。

【００２３】ＭＰＥＧ規格で定義されるように、ビデオ
画像は３通りのピクチャ・タイプ、すなわち、Ｉ、Ｐ、
Ｂのいずれかとして圧縮することができる。Ｉピクチャ
は、そのピクチャ自体の内部の空間的冗長性を除去する
ことによって圧縮される。Ｐピクチャは、前に符号化
（圧縮）した１つのピクチャに関する時間的冗長性を除
去することによって圧縮される。Ｂピクチャも、時間的
冗長性を除去することによって圧縮されるが、前に符号
化した２つのピクチャに関して行われる。Ｂピクチャ
は、両方の基準ピクチャの補間によって圧縮することが
できる。これにより、Ｂピクチャは、３通りのピクチャ
・タイプのうちで最高の圧縮を達成することができる。

【００２４】Ｂピクチャ内の双方向補間は以下のように
定義される。基準ピクチャＩからのピクセルをｘとし、
基準ピクチャＰからのピクセルをｙとする。

【００２５】双方向に補間した基準ピクセルは以下のよ
うになる。（ｘ＋ｙ）／２式中、／は丸めを伴う除算である。

【００２６】ピクセルは、０〜２５５の範囲の８ビット
幅の正の整数として定義される。したがって、丸めると
いうことは、剰余の最上位ビットが１である場合に商の
最下位ビットに１が加算されることを意味する。除算の
結果として商だけが保管され、剰余は破棄される。これ
は、右シフトの次に増分を行うものとしてハードウェア
で容易に実現される。

【００２７】動画の符号化では、除去できるように時間
的冗長性を識別する必要がある。これは、動き推定とい
うプロセスで実行される。比較回路を使用して、探索ウ
ィンドウ内の現行ピクチャに関する最も近い一致を検出
する。したがって、Ｂピクチャの最も近い一致を検出す
るには３回の動き推定が必要になるはずである。すなわ
ち、２つの基準ピクチャのそれぞれによる動き推定が１
回ずつと、補間した基準による動き推定が１回である。

【００２８】ＭＰＥＧ規格により、マクロブロックにつ
いて動き推定が行われる。ビデオ画像は、マクロブロッ
クという１６×１６ピクセルの単位に分割される。この
ため、最も近い一致のマクロブロックのサイズも１６×
１６ピクセルでなければならない。識別した最も近い一
致（１６×１６）のマクロブロック周辺に可能な半ピク
セルをすべて形成するには、１８×１８のピクセル域が
必要である。動き推定で使用する半ピクセルのタイプに
ついては後述する。

【００２９】Ｂピクチャの動き推定はメモリ取出しを伴
う。１つのピクチャ（７２０×４８０ピクセル）は、３
４６Ｋバイトの輝度データを必要とし、通常、圧縮を実
行するプロセッサの外部にあるメモリに格納される。

【００３０】先行技術で使用する方法の１つは、外部メ
モリから基準ピクチャを１つ取りだし、それを使って動
き推定を実行する方法である。次に、第１の基準ピクチ
ャと同じように、第２の基準ピクチャが取り出され、動
き推定が行われる。次に、第１および第２の基準ピクチ
ャから最も近い一致の基準データ（１８×１８ピクセル
・ブロック）も取り出され、補間したピクチャについて
動き推定が行われる。

【００３１】前述の本出願人に譲渡された関連米国特許
出願第０８／４１１１００号に記載された方法は、各基
準ピクチャを１回だけ取り出す方法である。各基準ピク
チャからの最も近い一致の基準データはオンチップ・バ
ッファに保管される。その後、このバッファ済みデータ
を使って補間動き推定が行われる。このため、必要なメ
モリ帯域幅が低減される。

【００３２】このような３回の全ペル境界探索から最も
近い一致を識別後、半ピクセル基準データを計算し、も
う一度動き推定を行って、半ペル境界で最も近い一致の
基準データを検出しなければならない。３回の全ペル探
索のうちの１回、すなわち、最善一致探索だけが半ペル
探索のために続行される。半ピクセル基準データの計算
に使用する半ペル補間には、水平半ピクセル、垂直半ピ
クセル、完全半ピクセルという３種類のタイプがある。

【００３３】基準ピクチャ内の４つの隣接ピクセルを以
下のようにａ、ｂ、ｃ、ｄとする。ａｂｃｄ水平半ピクセルは以下のように形成される。（ａ＋ｂ）／２（ｃ＋ｄ）／２式中、／は丸めを伴う除算である。垂直半ピクセルは以
下のように形成される。（ａ＋ｃ）／２（ｂ＋ｄ）／２式中、／は丸めを伴う除算である。完全半ピクセルは以
下のように形成される。（ａ＋ｂ＋ｃ＋ｄ）／４式中、／は丸めを伴う除算である。

【００３４】まず、各基準ピクチャ用のバッファ済みデ
ータから半ピクセルを形成しなければならない。次に、
これらの結果からＢピクチャ用の補間済み半ピクセルを
形成し、動き推定を完了することができる。丸めを行う
ので、補間済み結果を正しく生成するために動作の順序
を維持しなければならない。先行技術では、これには、
各基準ピクチャごとに１組ずつ、Ｂピクチャ用として２
組の１８×１８×８ビット・バッファを必要とする。

【００３５】このバッファ要件は、単一の１８×１８×
１１ビット・バッファに低減することができる。このバ
ッファは、対応するＩおよびＰピクチャ・ピクセルの６
つの最上位ビットを加算することによって形成した、各
ピクセルごとの７ビットの部分合計を保持する。バッフ
ァ内の各ワードの残りの４ビットは、対応するＩおよび
Ｐピクセルの２つの最下位ビットから構成される。

【００３６】前述のように、Ｂピクチャの半ペル動き推
定には、各基準ピクチャでの半ペル補間に続いて２つの
基準ピクチャに及ぶこれらの半ペル結果の補間が必要で
ある。

【００３７】Ｉフレームに関して以下のピクチャが使用
される。基準Ｉピクチャ内のピクセルを以下のように示
す。 I₀₀(x) I₀₁(x) I₁₀(x) I₁₁(x) ただし、ｘは各ピクセルのビット位置を示し、１〜８の
範囲の整数である。

【００３８】水平半ペル用の式は以下の通りである。 I_HH= (I₀₀(1) I₀₀(2) ... I₀₀(7) I₀₀(8) +I₀₁(1) I₀₁
(2) ... I₀₁(7) I₀₁(8)) / 2 ピクセル対の２つの最下位ビットのみを考慮すると、以
下のようになる。

【００３９】ただし、２で除算を行うので、I_SOx(8)は
この半ペル計算用の「丸め」の項になることに留意され
たい。この点を考慮すると、Ｉピクチャ用の水平半ペル
式は以下のように変更することができる。 I₀₀(1) I₀₀(2) I₀₀(3) I₀₀(4) I₀₀(5) I₀₀(6) '0' I₀₁(1) I₀₁(2) I₀₁(3) I₀₁(4) I₀₁(5) I₀₁(6) '0' I_COx(6) I_SOx(7) + I_SOx(8) ------------------------------------------------------------- I_HH

【００４０】同様の演繹により、Ｉピクチャ用の垂直半
ペル式は以下のように書くことができる。 I₀₀(1) I₀₀(2) I₀₀(3) I₀₀(4) I₀₀(5) I₀₀(6) '0' I₁₀(1) I₁₀(2) I₁₀(3) I₁₀(4) I₁₀(5) I₁₀(6) '0' I_COx(6) I_SOx(7) + I_SOx(8) ------------------------------------------------------------- I_VH 式中、I_Cx0(6)、I_Sx0(7)、I_Sx0(8)は以下のように求め
られる。

【００４１】この場合も、２で除算を行うので、I
_Sx0(8)はこの計算用の「丸め」の項になることに留意さ
れたい。

【００４２】同様の演繹により、完全半ペル式は以下の
ように書くことができる。 I₀₀(1) I₀₀(2) I₀₀(3) I₀₀(4) I₀₀(5) I₀₀(6) I₀₁(1) I₀₁(2) I₀₁(3) I₀₁(4) I₀₁(5) I₀₁(6) I₁₀(1) I₁₀(2) I₁₀(3) I₁₀(4) I₁₀(5) I₁₀(6) I₁₁(1) I₁₁(2) I₁₁(3) I₁₁(4) I₁₁(5) I₁₁(6) I_C(5) I_C(6) + I_S(7) ------------------------------------------------------------- I_FH 式中、I_C(5)、I_C(6)、I_S(7)は以下の式から求められ
る。

【００４３】ただし、この計算では、４で除算するので
「丸め」の項はI_S(7)になり、I_S(8)は破棄されることに
留意されたい。

【００４４】Ｐピクチャ用の半ピクセル計算も同様に処
理することができる。基準Ｐピクチャ内のピクセルを以
下のように示す。 P₀₀(x) P₀₁(x) P₁₀(x) P₁₁(x) ただし、ｘは各ピクセルのビット位置を示し、１〜８の
範囲の整数である。

【００４５】Ｉピクチャと同じ方法により、Ｐピクチャ
内の水平半補間の式は以下のように書くことができる。 P₀₀(1) P₀₀(2) P₀₀(3) P₀₀(4) P₀₀(5) P₀₀(6) '0' P₀₁(1) P₀₁(2) P₀₁(3) P₀₁(4) P₀₁(5) P₀₁(6) '0' P_COx(6) P_SOx(7) + P_SOx(8) ------------------------------------------------------------- P_HH 式中、P_COx(6)、P_SOx(7)、P_SOx(8)は以下のように求め
られる。

【００４６】Ｐピクチャ内の垂直半補間の式は以下のよ
うに書くことができる。 P₀₀(1) P₀₀(2) P₀₀(3) P₀₀(4) P₀₀(5) P₀₀(6) '0' P₁₀(1) P₁₀(2) P₁₀(3) P₁₀(4) P₁₀(5) P₁₀(6) '0' P_Cx0(6) P_Sx0(7) + P_Sx0(8) ------------------------------------------------------------- P_VH 式中、P_Cx0(6)、P_Sx0(7)、P_Sx0(8)は以下のように求め
られる。

【００４７】最後に、Ｐピクチャ内の完全半ペル補間の
式は以下のように書くことができる。 P₀₀(1) P₀₀(2) P₀₀(3) P₀₀(4) P₀₀(5) P₀₀(6) P₀₁(1) P₀₁(2) P₀₁(3) P₀₁(4) P₀₁(5) P₀₁(6) P₁₀(1) P₁₀(2) P₁₀(3) P₁₀(4) P₁₀(5) P₁₀(6) P₁₁(1) P₁₁(2) P₁₁(3) P₁₁(4) P₁₁(5) P₁₁(6) P_C(5) P_C(6) + P_S(7) ------------------------------------------------------------- P_FH 式中、P_C(5)、P_C(6)、P_S(7)は以下の式から求められ
る。

【００４８】Ｂピクチャ内の双方向に補間した水平半ピ
クセルは、ＩおよびＰ基準ピクチャからの水平半ピクセ
ルの補間によって形成される。したがって、I_HHの式とP
_HHの式を双方向補間の式と結合することができる。これ
により、補間済み水平半ピクセル用の以下の式が得られ
る。 I₀₀(1) I₀₀(2) I₀₀(3) I₀₀(4) I₀₀(5) I₀₀(6) I₀₁(1) I₀₁(2) I₀₁(3) I₀₁(4) I₀₁(5) I₀₁(6) P₀₀(1) P₀₀(2) P₀₀(3) P₀₀(4) P₀₀(5) P₀₀(6) P₀₁(1) P₀₁(2) P₀₁(3) P₀₁(4) P₀₁(5) P₀₁(6) IP_COx(4) IP_COx(5) IP_COx(6) + IP_SOx(7) -------------------------------------------------------- HH 式中、IP_COx(4)、IP_COx(5)、IP_COx(6)、IP_SOx(7)は以下
のように形成される。 I_COx(6) I_SOx(7) I_SOx(8) P_COx(6) P_SOx(7) + P_SOx(8) ------------------------------------------------------------- IP_COx(4)、IP_COx(5)、IP_COx(6)、IP_SOx(7) また、I_COx(6)、I_SOx(7)、I_SOx(8)、P_COx(6)、P
_SOx(7)、P_SOx(8)は、それぞれＩピクチャおよびＰピク
チャ用の水平半ペル式で前に定義された通りである。

【００４９】HH式は、以下のように再構成することがで
きる。 IP₀₀(0) IP₀₀(1) IP₀₀(2) IP₀₀(3) IP₀₀(4) IP₀₀(5) IP₀₀(6) IP₀₁(0) IP₀₁(1) IP₀₁(2) IP₀₁(3) IP₀₁(4) IP₀₁(5) IP₀₁(6) IP_COx(4) IP_COx(5) IP_COx(6) + IP_SOx(7) ------------------------------------------------------------------ HH 式中、IP₀₀nはI₀₀(n)とP₀₀(n)から形成された部分合計
を示し、IP₀₁nはI₀₁(n)とP₀₁(n)から形成された部分合
計を示し、「ｎ」はピクセル・バイト内のビット位置を
示し、０〜６の範囲内に入っている。

【００５０】また、以下の点に留意されたい。IP₀₀(0)
はI₀₀(1:6)+P₀₀(1:6)からの繰り上がりである。IP₀₁(0)
はI₀₁(1:6)+P₀₁(1:6)からの繰り上がりである。

【００５１】したがって、補間済み水平半ピクセルの結
果は、ＩおよびＰ基準ピクチャからの各ピクセルの２つ
の最下位ビットとあいまって、ＩおよびＰ基準ピクチャ
からの部分合計（IP₀₀(n)とIP₀₁(n)）によって計算する
ことができる。

【００５２】VH式およびFH式についても同じ再構成を行
うことができる。したがって、VHは以下のようになる。 IP₀₀(0) IP₀₀(1) IP₀₀(2) IP₀₀(3) IP₀₀(4) IP₀₀(5) IP₀₀(6) IP₁₀(0) IP₁₀(1) IP₁₀(2) IP₁₀(3) IP₁₀(4) IP₁₀(5) IP₁₀(6) IP_Cx0(4) IP_Cx0(5) IP_Cx0(6) + IP_Sx0(7) ------------------------------------------------------------------ VH 式中、IP₀₀(n)はI₀₀(n)とP₀₀(n)から形成された部分合
計を示し、IP₀₁(n)はI₁₀(n)とP₁₀(n)から形成された部
分合計を示し、「ｎ」はピクセル・バイト内のビット位
置を示し、０〜６の範囲内に入っている。

【００５３】また、以下の点に留意されたい。IP₀₀(0)
はI₀₀(1:6)+P₀₀(1:6)からの繰り上がりである。IP₀₁(0)
はI₁₀(1:6)+P₁₀(1:6)からの繰り上がりである。また、I
P_Cx0(4)、IP_Cx0(5)、IP_Cx0(6)、IP_Sx0(7)は以下のよう
に形成される。 I_Cx0(6) I_Sx0(7) I_Sx0(8) P_Cx0(6) P_Sx0(7) + P_Sx0(8) ------------------------------------------------------------- IP_Cx0(4) IP_Cx0(5) IP_Cx0(6) IP_Sx0(7) 式中、I_Cx0(6)、I_Sx0(7)、I_Sx0(8)、P_Cx0(6)、P
_Sx0(7)、P_Sx0(8)は、前に定義された通りである。

【００５４】同様の演繹により、FH式は以下のようにな
る。 IP₀₀(0) IP₀₀(1) IP₀₀(2) IP₀₀(3) IP₀₀(4) IP₀₀(5) IP₀₁(0) IP₀₁(1) IP₀₁(2) IP₀₁(3) IP₀₁(4) IP₀₁(5) IP₁₀(0) IP₁₀(1) IP₁₀(2) IP₁₀(3) IP₁₀(4) IP₁₀(5) IP₁₁(0) IP₁₁(1) IP₁₁(2) IP₁₁(3) IP₁₁(4) IP₁₁(5) IP_C(3) IP_C(4) IP_C(5) + IP_C(6) ------------------------------------------------------------------ FH 式中、IP₀₀(n)はI₀₀(n)とP₀₀(n)から形成された部分合
計を示し、IP₀₁(n)はI₀₁(n)とP₀₁(n)から形成された部
分合計を示し、IP₁₀(n)はI₁₀(n)とP₁₀(n)から形成され
た部分合計を示し、IP₁₁(n)はI₁₁(n)とP₁₁(n)から形成
された部分合計を示し、ｎはピクセル・バイト内のビッ
ト位置を示し、０〜６の範囲内に入っている。

【００５５】IP₀₀(0)はI₀₀(1:6)+P₀₀(1:6)からの繰り上
がりである。IP₀₁(0)はI₀₁(1:6)+P₀ ₁(1:6)からの繰り上
がりである。IP₀₁(0)はI₁₀(1:6)+P₀₁(1:6)からの繰り上
がりである。IP₁₁(0)はI₁₁(1:6)+P₁₁(1:6)からの繰り上
がりである。

【００５６】上記の式のIP_C(3)、IP_C(4)、IP_C(5)、IP
_C(6)は以下の式によって形成される。式中、I_C(5)、I_C(6)、I_S(7)、P_C(5)、P_C(6)、P_S(7)は前
に定義された通りである。

【００５７】また、この場合は、各部分合計（IP
₀₀(6)、IP₀₁(6)、IP₁₀(6)、IP₁₁(6)）の最下位ビットを
上記の式に反映しなければならないことに留意された
い。

【００５８】上記の式は、まず２つの基準ピクチャの対
応するバイト位置のピクセルを補間し、次にこのような
補間済みピクセルから半ピクセル値を計算することによ
って、Ｂピクチャの動き推定に必要な半ピクセルを形成
できることを明白に示している。

【００５９】また、上記の式は、通常必要な２つの１８
×１８の完全なピクセル・ブロックではなく「縮小」セ
ットのデータから、Ｂピクチャの動き推定に必要な半ピ
クセルを形成できることも明白に示している。この縮小
セットのデータは、各ピクセルの２つの最下位ビットと
ともに、ＩおよびＰピクチャ内の対応するピクセルの６
つの上位ビットから形成された７ビットの部分合計の１
８×１８×１１のアレイから構成される。この方法を使
用すると、必要なバッファ域での３１％の改善のため
に、オンチップ・バッファ空間を５１８４ビット（２×
１８×１８×１８）から３５６４ビット（１８×１８×
１１）まで縮小することができる。

【００６０】本発明の方法および装置は、特に「Ｂ」ま
たは双方向予測ピクチャに関し、過去のピクチャと今後
のピクチャの両方からの対称的な基準データを半ペル計
算プロセッサに絶えず供給するようなものである。すな
わち、両方の基準ピクチャ内のデータは現行マクロブロ
ック位置に対して同じ寸法と同じ向きを備えている。よ
り正確には、２つのマクロブロックが同じ寸法を備えて
いない場合、本発明の方法および装置は、大きい方の探
索ウィンドウを小さい方の探索ウィンドウのサイズまで
縮小する。過去、今後、または双方向のいずれかのピク
チャについて単一のマクロブロックのみになるので、半
ペル計算プロセッサは単純化される。

【００６１】エッジ検出回路を使用して、全ペル最善一
致基準マクロブロックが１つのピクチャまたは探索ウィ
ンドウのエッジ上にある場合を検出する。マクロブロッ
クの各側、すなわち、上、下、左、右のそれぞれについ
てエッジ・インジケータが１つずつ存在する。各ピクチ
ャごとに活動状態のエッジ・インジケータを多くても２
つ設けることは可能であるが、最善一致双方向マクロブ
ロックでは、４つのエッジ・インジケータがすべて活動
状態になる可能性がある。

【００６２】各基準ピクチャには、ピクチャごとに最善
一致基準マクロブロックが位置するときに設定される独
自の独立したセットのエッジ・インジケータが存在す
る。たとえば、最善一致基準マクロブロックが基準探索
ウィンドウの右上隅で検出された場合、上と右のエッジ
・インジケータが活動状態になるはずである。この場
合、全ペル探索処理回路は、基準マクロブロックより上
と基準マクロブロックの右側にあるペルに使用可能な基
準データを備えていないので、それより上および右側の
半ペル値を計算できないはずである。

【００６３】過去および今後両方の基準探索ウィンドウ
の全ペル探索が完了すると、各ピクチャからの最善一致
基準データがプロセッサに送られ、そこで半ペル双方向
値が計算される。このとき、両方の基準ピクチャ探索か
らのエッジ・インジケータを使用して対称的な探索ウィ
ンドウを形成する。

【００６４】エッジ・インジケータが２つの基準ピクチ
ャのうちの一方についてオンになっている場合、エッジ
・インジケータがオフになっているピクチャがそのエッ
ジに関連する基準データを備えており、もう一方のピク
チャは備えていないという条件が存在する。すなわち、
一方のマクロブロックは完全な１８×１８ピクセルを備
え、もう一方は備えていない。この場合、インジケータ
がオフになっているピクチャがデータを備えていても、
過剰データは除去され、送られない。すなわち、エッジ
・インジケータに関連する余分な基準データは、そのエ
ッジ・インジケータが両方のピクチャのすべてのマクロ
ブロックについてオフになっている場合のみ送られる。
一方のピクチャだけに存在する余分なピクセル・データ
を除去することにより、必ず両方のピクチャについて対
称的な探索ウィンドウが形成される。

【００６５】図６は、すべての基準データが使用可能に
なっているわけではないときに半ペル値を計算するため
に必要な基準データを示す。図７は、対称的な過去／今
後のデータを備えた双方向エッジ条件によって半ペル値
を計算するのに必要な基準データを示す。

【００６６】所与の好ましい実施例および具体例に関連
して本発明を説明してきたが、それにより本発明の範囲
を制限するものではなく、本明細書の特許請求の範囲に
よってのみ制限するものとする。

【００６７】まとめとして、本発明の構成に関して以下
の事項を開示する。

【００６８】（１）２つの基準ピクチャから双方向コー
ド化ピクチャを形成する方法において、各基準ピクチャ
のメモリ取出しを行うことと、その全ピクセル境界で最
善一致マクロブロックを検出することと、全ピクセル境
界マクロブロックを補間して双方向マクロブロックを形
成することと、それから半ピクセル基準ピクチャ・デー
タを計算することを含み、サイズ、形状、向きの点で最
善一致マクロブロックが対称的になるように、最善一致
マクロブロックから過剰ピクセルを除去することを特徴
とする方法。（２）過剰ピクセルを示すようにエッジ検出器を設定す
ることを含むことを特徴とする、上記（１）に記載の方
法。（３）過剰ピクセルが、最善一致マクロブロックをサイ
ズ、形状、または向きの点で互いに異なるものにするピ
クセルに対応することを特徴とする、上記（１）に記載
の方法。

【図面の簡単な説明】

【図１】離散余弦変換器２１と、量子化器２３と、可変
長コーダ２５と、逆量子化器２９と、逆離散余弦変換器
３１と、動き補償４１と、フレーム・メモリ４２と、動
き推定４３とを含む、汎用ＭＰＥＧ２適合エンコーダ１
１の流れ図である。データ経路は、ｉ番目のピクチャ入
力１１１と、差データ１１２と、動きベクトル１１３
と、ピクチャ出力１２１と、動き推定および補償のため
のフィードバック・ピクチャ１３１と、動き補償済みピ
クチャ１０１とを含む。この図では、ｉ番目のピクチャ
はフレーム・メモリまたはフレーム・ストア４２内に存
在し、ｉ＋１番目のピクチャは動き推定によって符号化
されると想定している。

【図２】Ｉ、Ｐ、Ｂの各ピクチャと、それらの表示順序
および伝送順序の例と、順方向および逆方向の動き予測
とを示す図である。

【図３】現行フレームまたはピクチャ内の動き推定ブロ
ックから後続または直前フレームまたはピクチャ内の最
善一致ブロックまでの探索を示す図である。

【図４】基準ピクチャ内のその位置から現行ピクチャへ
の動きベクトルによるブロックの動きと、動きベクトル
使用後に調整した基準ピクチャのブロックとを示す図で
ある。

【図５】半ペル値のすべてを計算するのに必要な基準デ
ータを示す図である。

【図６】基準データのすべてが使用可能になっているわ
けではないときに半ペル値の計算を可能にするのに必要
な基準データを示す図である。

【図７】対称的な過去／今後のデータにより双方向エッ
ジ条件を備えた半ペル値を計算するのに必要な基準デー
タを示す図である。

【図８】対称的な過去／今後のデータにより双方向エッ
ジ条件を備えた半ペル値を計算するのに必要な基準デー
タを示す図である。

【符号の説明】

１１汎用ＭＰＥＧ２適合エンコーダ２１離散余弦変換器２３量子化器２５可変長コーダ２９逆量子化器３１逆離散余弦変換器４１動き補償ユニット４２フレーム・メモリ４３動き推定ユニット１０１動き補償済みピクチャ１１１ｉ番目のピクチャ入力１１２差データ１１３動きベクトル１２１ピクチャ出力１３１フィードバック・ピクチャ

───────────────────────────────────────────────────── フロントページの続き (72)発明者エヴェレット・ジョージ・ヴェイル・ザ= サードアメリカ合衆国13901 ニューヨーク州ビンガムトンエレン・ストリート４

Claims

【特許請求の範囲】

【請求項１】２つの基準ピクチャから双方向コード化ピ
クチャを形成する方法において、各基準ピクチャのメモ
リ取出しを行うことと、その全ピクセル境界で最善一致
マクロブロックを検出することと、全ピクセル境界マク
ロブロックを補間して双方向マクロブロックを形成する
ことと、それから半ピクセル基準ピクチャ・データを計
算することを含み、サイズ、形状、向きの点で最善一致
マクロブロックが対称的になるように、最善一致マクロ
ブロックから過剰ピクセルを除去することを特徴とする
方法。
【請求項２】過剰ピクセルを示すようにエッジ検出器を
設定することを含むことを特徴とする、請求項１に記載
の方法。
【請求項３】過剰ピクセルが、最善一致マクロブロック
をサイズ、形状、または向きの点で互いに異なるものに
するピクセルに対応することを特徴とする、請求項１に
記載の方法。