JP2004537223A

JP2004537223A - Ｂフレームへの逆離散コサイン変換の計算を減少したことによる、複雑さを低減したビデオ復号化

Info

Publication number: JP2004537223A
Application number: JP2003516223A
Authority: JP
Inventors: ラン，ツェ−ホア; ジョォン，ジュヌ; チェン，インウェイ
Original assignee: Koninklijke Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 2001-07-24
Filing date: 2002-06-26
Publication date: 2004-12-09
Also published as: CN1533676A; KR20040018501A; EP1417840A1; US20030021482A1; US7079692B2; WO2003010971A1; CN1271860C

Abstract

本発明は、縮小Ｂフレームのデコードを教示する。本発明によれば、Ｂフレームにおける変換係数の数が減少され、縮小Ｂフレームがつくられる。また、この縮小Ｂフレームについて、逆走査及び逆量子化が実行される。さらに、この縮小Ｂフレームに逆変換が実行される。本発明の実施の形態では、この縮小Ｂフレームは、Ｂフレームに関連するブロックを識別し、該識別されたブロックの予め決定された領域に含まれる変換係数を選択することでつくられる。

Description

【０００１】
［技術分野］
本発明は、一般にビデオ圧縮に関し、より詳細には、Ｂフレームにおける変換係数の数を減少して、復号化にかかる計算の複雑さを低減する復号化に関する。
［背景技術］
離散コサイン変換（ＤＣＴ）を取り入れたビデオ圧縮は、ＭＰＥＧ−１，ＭＰＥＧ−２、ＭＰＥＧ−４及びＨ．２６２のような多くの国際標準で採用されている技術である。これらのスキームのうち、ＭＰＥＧ−２は、ＤＶＤ、衛星ＤＴＶ放送、及びデジタルテレビ向けの米国ＡＴＳＣ規格において最も広く利用されている。
【０００２】
図１には、ＭＰＥＧビデオデコーダの例が示されている。ＭＰＥＧビデオデコーダは、ＭＰＥＧベースの消費者向けビデオ製品の重要な部分である。かかる製品では、１つの設計の狙いは、動画品質を維持しつつ、デコーダの複雑さを最小にすることである。この狙いを達成するために、適応的なスキームが利用されて、Ｂフレームへの逆離散コサイン変換（ＩＤＣＴ）の計算を完全に実行するか、或いは該計算を完全に省略する。
【０００３】
上記の適応的なスキームは、簡単なＤＣ係数の検査に基づいている。ＤＣＴブロックのＤＣ係数が閾値よりも大きい場合、完全なＩＤＣＴが計算される。さもなければ、ＩＤＣＴの計算が省略され、計算の節約が提供される。しかし、この方法の問題は、簡単な閾値を用いた検査では、検査のまばらさを常に正確に判断することはできないことである。したがって、復号化されたビデオ出力の品質は、常に良好ではなく、メディアプロセッサでのＤＣ係数の検査で要求される計算では、かなりのＣＰＵサイクルが要求される場合がある。
［発明の開示］
本発明は、縮小されたＢフレーム（reduced B-frame）の復号化を教示するものである。本発明によれば、Ｂフレームにおける変換係数の数が減少されて、該縮小Ｂフレームが生成される。また、逆走査及び逆量子化が該縮小Ｂフレームに対して実行される。さらに、逆変換が該縮小Ｂフレームに実行される。
【０００４】
本発明の１つの実施の形態では、この縮小Ｂフレームは、Ｂフレームに関連するブロックを識別し、該識別されたブロックの予め決定された領域に含まれる変換係数を選択することで生成される。また、１つの実施の形態では、逆走査は、逆ジグザグ走査であり、逆変換は、逆離散コサイン変換である。
［発明の実施の形態］
本発明は、縮小されたＢフレームの復号化を教示する。本発明によれば、Ｂフレームにおける変換係数の数が減少されて、復号化に関する計算の複雑さが低減される。復号化されたＢフレームは、他のタイプのフレームのアンカーとして利用されないため、Ｂフレームにおける誤差は他のフレームに伝播することはない。言い換えれば、Ｉフレーム又はＰフレームは、Ｂフレームに依存しないため、Ｂフレームにおける誤差は、ビデオ系列における他のフレームに広がることはない。
【０００５】
上記の点を考慮して、本発明は、Ｉフレーム及びＰフレームを不変のままとしつつ、Ｂフレームにける変換係数の数を減少する。Ｂフレームにおける変換係数の数を減少することは、かかるフレームの品質を低下する場合がある。しかし、他のフレームの品質が維持され、縮小Ｂフレームにより生じる誤差は、他のフレームに伝播することはない。したがって、出力ビデオの品質が維持されるように、予測ドリフトが最小とされる。
【０００６】
さらに、本発明は、Ｂフレームにおける変換係数の数を減少するものであるため、復号化に関する全体的な計算の複雑さが低減される。これは、多くの応用において望ましいことである。たとえば、デコーダがメディアプロセッサチップで実現される場合、計算の複雑さを低減することにより、ＣＰＵ時間を節約することができる。さらに、デコーダがＡＳＩＣのような特定用途のハードウェアで実現される場合、計算の複雑さを低減することにより、電力を節約することができる。
【０００７】
図２には、本発明によるデコーダに関する１例が示されている。理解できるように、このデコーダは、可変長デコーダ（ＶＬＤ）２、改良された逆走査及び逆量子化（ＩＳＩＱ）部１４及び逆離散コサイン変換（ＩＤＣＴ）部６から構成される第一経路と、ＶＬＤ２、動き補償（ＭＣ）部１０及びフレーム蓄積部１２から構成される第二経路とを含んでいる。また、このデコーダには加算器８も含まれており、第一の経路の出力と第二の経路の出力とを結合して、出力ビデオを生成する。
【０００８】
図２のデコーダは、改良ＩＳＩＱ部１４を除いて、図１におけるデコーダと同様に動作する。動作の間、ＶＬＤ２は、到来するビットストリームを復号化して、ＤＣＴ係数を生成する。ＩフレームとＰフレームについて、改良ＩＳＩＱ部１４は、かかるフレームに含まれるＤＣＴ係数に対して、逆ジグザグ走査及び逆量子化を単に実行する。
【０００９】
しかし、本発明によれば、改良ＩＳＩＱ部１４は、かかるフレームに含まれるＤＣＴ係数に対する逆走査及び逆量子化を実行する前に、ＢフレームにおけるＤＣＴ係数の数を減少する。ＤＣＴ係数の数が減少されるため、Ｂフレームに対する逆走査及び逆量子化を実行するために必要とされる計算量が低減される。したがって、復号化に関する全体の計算の複雑さが低減される。
【００１０】
本実施の形態では、改良ＩＳＩＱ部１４は、Ｂフレームに関連するＤＣＴブロックをはじめに識別することで、ＢフレームにおけるＤＣＴ係数の数を低減する。ＤＣＴタイプの圧縮では、それぞれのフレームは、符号化される前に、画素ブロックに通常分割される。図３には、例として８×８ブロックが示されている。
【００１１】
Ｂフレームに関連するＤＣＴブロックを識別するために、改良ＩＳＩＱ部１４は、ＶＬＤ２から受けたヘッダ情報ＨＩを調べる。ＭＰＥＧ−１，ＭＰＥＧ−２，ＭＰＥＧ−４及びＨ．２６２のような標準では、符号化される前に、どのタイプのフレームからＤＣＴブロックが発生しているかを示すヘッダフィールドを含むために、互換性のあるビットストリームを全て要求している。したがって、動作の間、ＶＬＤ２は、到来するビットストリームを復号化してヘッダ情報ＨＩを生成する。ヘッダ情報ＨＩにより、改良ＩＳＩＱ部１４は、Ｂフレームに関連するＤＣＴブロックを識別することができる。
【００１２】
Ｂフレームに関連するＤＣＴブロックを識別した後、次いで、改良ＩＳＩＱ部１４は、これらのブロックの予め決定された領域に含まれているＤＣＴ係数を選択する。図４Ａ及び図４Ｂには、かかる予め決定された領域に関する例が示されている。図４Ａからわかるように、予め決定された領域は２×８領域であり、図４Ｂからわかるように、予め決定された領域は１×８領域である。したがって、本発明によれば、改良されたＩＳＩＱ部１４は、これらの例の陰影を付けた領域で表される予め決定された領域内の係数のみを選択する。この予め決定された領域以外の係数は利用されない。
【００１３】
しかし、図４Ａ及び図４Ｂに示される領域は、例示であることが意図されている。本発明は、様々な形状及び大きさを有する予め決定された他の領域を意図している。
【００１４】
先に説明されたように、改良ＩＳＩＱ部１４は、Ｉフレーム及びＰフレームに対する処理と同様に、縮小Ｂフレームに含まれるＤＣＴ係数に対する逆走査及び逆量子化を実行する。次いで、ＩＤＣＴ部６は、改良ＩＳＩＱ部１４から受けたフレームに対して逆離散コサイン変換を実行する。
【００１５】
先に説明したように、ＢフレームにおけるＤＣＴ係数の数は、ブロックの予め決定された領域内の係数を選択することのみにより減少される。逆離散コサイン変換は、より少ない数の係数に対して実行されるため、より少ない複雑さによる方法がＩＤＣＴ部６により実現される。
【００１６】
多くの画像符号化標準では、２次元ＤＣＴ／ＩＤＣＴ演算が使用される。２次元ＩＤＣＴは、１次元ＩＤＣＴから列に関して、次いで行に関して計算される。したがって、８×８ＩＤＣＴについて、結果的な８×８ブロックのうちの８つの列に関して１次元ＩＤＣＴが実行され、次いで、８つの行に関して１次元ＩＤＣＴが実行される。
【００１７】
しかし、先に説明したように、本発明は、縮小Ｂフレームを利用するものであり、この縮小Ｂフレームは、たとえば、８×１ブロック又は８×２ブロックを含む場合がある。したがって、たとえば、ＩＤＣＴ部６は、８×１ＩＤＣＴ又は８×２ＩＤＣＴを実行するために構成されている。８×１ＩＤＣＴについて、１次元のＩＤＣＴが最初の列に関して実行され、他の７つの列はゼロに設定される。さらに、列に関する１次元のＩＤＣＴの後に、１次元のＩＤＣＴが８つの行に関して実行される。
【００１８】
８×２のＩＤＣＴについて、８×１のＩＤＣＴについて先に説明したように、１次元のＩＤＣＴが同様のやり方で適用される。１次元のＩＤＣＴは、以下のように表現される。
s(x)＝sum{u=0,…,7}C(u)/2＊S(u)cos[(2x＋1)u*π/16] （１）
ここで、u=0についてC(u)/√2であり、u＞0についてC(u)=1である。x=0,…,7である。S(u)は１次元のＤＣＴ係数を表す。
【００１９】
先に説明したように、ＩＤＣＴ部６は、Ｂフレームにおける減少された数の係数に対してＩＤＣＴを実行する。したがって、ＩＤＣＴを実行するために必要とされる計算量も低減されるはずであり、これにより、復号化処理に関する全体的な計算の複雑さが更に低減される。たとえば、８×１又は８×２のＩＤＣＴについて、全体の計算量の少なくとも８分の３が低減される。
【００２０】
図５には、縮小Ｂフレームの復号化が実現されるシステム１６の１例が示されている。例を通して、システム１６は、テレビ、セットトップボックス、デスクトップ、ラップトップ又はパームトップコンピュータ、パーソナルデジタルアシスタント（ＰＤＡ）、ビデオカセットレコーダ（ＶＣＲ）のようなビデオ／イメージ記憶装置、デジタルビデオレコーダ（ＤＶＲ）、ＴｉＶＯ装置等、これらの装置又は他の装置の一部、或いはこれらの装置と他の装置との組み合わせを表している。システム１６は、１つ以上のビデオ／イメージソース１８、１つ以上の入力／出力装置２６、プロセッサ２０、メモリ２２及び表示装置２８を含んでいる。
【００２１】
ビデオ／イメージソース１８は、たとえば、テレビ受信機、ＶＣＲ又は他のビデオ／イメージ記憶装置を表している。ビデオ／イメージソース１８は、インターネット、ワイドエリアネットワーク、メトロポリタンエリアネットワーク、ローカルエリアネットワーク、地上波放送システム、ケーブルネットワーク、衛星ネットワーク、無線ネットワーク、又は電話ネットワーク、これらネットワーク又は他のネットワークの一部或いはこれらのネットワークと他のネットワークとの組み合わせを通して、１つ又は複数のサーバからのビデオを受信するための１つ以上のネットワークコネクションを代替的に表している。
【００２２】
入力／出力装置２６、プロセッサ２０及びメモリ２２は、伝送媒体２４を通して通信する。この伝送媒体２４は、たとえば、バス、通信ネットワーク、１つ以上の回路の内部接続、回路カード又は他の装置、これらの伝送媒体又は他の伝送媒体の一部又はこれらの伝送媒体と他の伝送媒体との組み合わせを表している。ビデオ／イメージソース１８からの入力ビデオデータは、メモリ２２に記憶された１つ以上のソフトウェアプログラムに従って処理され、プロセッサ２０により実行されて、表示装置２８に供給される出力ビデオ／イメージを生成する。
【００２３】
１つの実施の形態では、図２の縮小Ｂフレームの復号化は、システムにより実行されるコンピュータ読み取り可能なコードにより実現される。このコードは、メモリ２２に記憶されているか、或いはＣＤ−ＲＯＭ又はフロプティカルディスクのような記憶媒体から読み出し／ダウンロードされる。他の実施の形態では、本発明を実現するためのソフトウェア命令の代わりに、又は該命令と共にハードウェア回路が利用される場合がある。
【００２４】
本発明は特定の例に関して上述されたが、本発明は本明細書で開示される例に限定して解釈されるべきではないことを理解すべきである。たとえば、本発明は、ＭＰＥＧ−２の骨組みを利用して説明したが、本明細書で説明される概念及び方法論はＤＣＴ概念の予測スキームに応用することもでき、より一般的な意味では、異なる相互依存性を有するピクチャタイプが許容されるフレームベースのビデオ圧縮スキームに応用することができる。したがって、本発明は、特許請求の範囲の精神及び範囲に含まれる本発明の様々な構成及び変形をカバーすることが意図されている。
【図面の簡単な説明】
【００２５】
【図１】ＭＰＥＧデコーダのブロック図である。
【図２】本発明によるデコーダのブロック図である。
【図３】８×８ブロックの例を示す図である。
【図４Ａ】本発明による、ブロックで選択された予め決定された領域の例を例示する図である。
【図４Ｂ】本発明による、ブロックで選択された予め決定された領域の例を例示する図である。
【図５】本発明によるシステムの１例に関するブロック図である。

Claims

Ｂフレームにおける多数の変換係数を減少して、縮小されたＢフレームを生成するステップと、
該縮小されたＢフレームを逆走査するステップと、
該縮小されたＢフレームに逆量子化を実行するステップと、
該縮小されたＢフレームに逆変換を実行するステップと、
を有するビデオを復号化する方法。
該縮小されたＢフレームは、
該Ｂフレームと関連するブロックを識別するステップと、
該Ｂフレームに関連する該ブロックの予め決定された領域に含まれる変換係数を選択するステップにより生成される、
請求項１記載の方法。
該逆走査は逆ジグザグスキャンである、
請求項１記載の方法。
該逆変換は逆離散コサイン変換である、
請求項１記載の方法。
Ｂフレームにおける多数の変換係数を減少して、縮小されたＢフレームを生成するためのコードと、
該縮小されたＢフレームを逆走査するためのコードと、
該縮小されたＢフレームに逆量子化を実行するためのコードと、
該縮小されたＢフレームに逆変換を実行するためのコードと、
を有するビデオを復号化するためのコードを含む記録媒体。
該縮小されたＢフレームを生成するためのコードは、
該Ｂフレームに関連するブロックを識別するためのコードと、
該Ｂフレームに関連する該ブロックの予め決定された領域に含まれる変換係数を選択するためのコードを有する、
請求項５記載の記録媒体。
該逆走査は逆ジグザグスキャンである、
請求項５記載の記録媒体。
該逆変換は逆離散コサイン変換である、
請求項５記載の記録媒体。
Ｂフレームにおける多数の変換係数を減少して、縮小されたＢフレームを生成するための手段と、
該縮小されたＢフレームを逆走査するための手段と、
該縮小されたＢフレームに逆量子化を実行するための手段と、
該縮小されたＢフレームに逆変換を実行するための手段と、
を有するビデオを復号化するための装置。
該縮小されたＢフレームを生成するための前記手段は、
該Ｂフレームに関連するブロックを識別するための手段と、
該Ｂフレームに関連する該ブロックの予め決定された領域に含まれる変換係数を選択するための手段を有する、
請求項９記載の装置。
該逆走査は逆ジグザグスキャンである、
請求項９記載の装置。
該逆変換は逆離散コサイン変換である、
請求項９記載の装置。
Ｂフレームにおける多数の変換係数を減少して縮小されたＢフレームを生成し、該縮小されたＢフレームを逆走査し、該縮小されたＢフレームに逆量子化を実行するための逆走査及び逆量子化部と、
該縮小されたＢフレームに逆変換を実行するための逆変換部と、
を有するビデオを復号化するための装置。
該縮小されたＢフレームは、
該Ｂフレームに関連するブロックを識別し、
該Ｂフレームに関連する該ブロックの予め決定された領域に含まれる変換係数を選択することで生成される、
請求項１３記載の装置。
該逆走査は逆ジグザグスキャンである、
請求項１３記載の装置。
該逆変換は逆離散コサイン変換である、
請求項１３記載の装置。