JP2004134916A - 動画像符号化装置および動画像復号化装置 - Google Patents

動画像符号化装置および動画像復号化装置 Download PDF

Info

Publication number
JP2004134916A
JP2004134916A JP2002295640A JP2002295640A JP2004134916A JP 2004134916 A JP2004134916 A JP 2004134916A JP 2002295640 A JP2002295640 A JP 2002295640A JP 2002295640 A JP2002295640 A JP 2002295640A JP 2004134916 A JP2004134916 A JP 2004134916A
Authority
JP
Japan
Prior art keywords
unit
base layer
resolution
image
moving picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002295640A
Other languages
English (en)
Inventor
Yoshimasa Honda
本田 義雅
Tsutomu Uenoyama
上野山 努
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2002295640A priority Critical patent/JP2004134916A/ja
Publication of JP2004134916A publication Critical patent/JP2004134916A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】MPEG−4 FGSにおいて、細かい空間スケーラビリティを実現すること。
【解決手段】量子化マトリクス算出部120は、低解像度表示に必要な周波数情報(低周波成分)のみを基本レイヤとして符号化するために、低周波成分以外が最大値(255)となるように量子化マトリクスの値を制御する。一方、周波数重み付けマトリクス算出部138は、解像度を向上させる際に必要な周波数情報(解像度に合わせた周波数成分)を段階的に符号化するために、低周波成分から段階的に値が小さくなるように周波数重み付けマトリクスの値を制御する。そして、レイヤ分割部142は、周波数重み付けマトリクスの値に応じて、表示解像度毎にデータが分かれるように拡張レイヤのデータ分割位置を制御する。
【選択図】   図1

Description

【0001】
【発明の属する技術分野】
本発明は、動画像符号化装置および動画像復号化装置に関する。
【0002】
【従来の技術】
近年のネットワークの多様化に伴い、複数の帯域に見合った品質の映像を伝送できる映像データが必要とされており、これに対応するために、階層構造を持ち複数帯域に対応できる(つまり、伝送帯域に合わせて映像品質を変更できる)階層符号化方式が規格化されている。
【0003】
このような階層符号化方式の中でも、とりわけ帯域選択に関して自由度が高い方式であるMPEG−4 FGS(Fine Granularity Scalability)は、粒度の高いスケーラビリティ(Scalability)を実現する映像符号化方式として現在標準化されている。MPEG−4 FGSにより符号化された映像データは、単体で復号化が可能な動画像ストリームである一の基本レイヤ(Base Layer)と、基本レイヤの復号化動画像品質を向上させるための動画像ストリームである、少なくとも一以上の拡張レイヤ(Enhancement Layer)とで構成される。基本レイヤは低帯域で低画質の映像データであり、これに拡張レイヤを帯域に応じて足し合わせることにより自由度の高い高画質化が可能である。つまり、MPEG−4 FGSは、1ストリームで複数帯域に適用可能で、自由度が高く(フレーム毎の帯域変動に対応でき、かつ、細かい帯域制御も可能)、無数の伝送帯域に合わせて滑らかに映像品質(画質、動き)を変えることができるという特徴を有している。
【0004】
このようなMPEG−4 FGSにより実現可能なスケーラビリティには、伝送帯域の向上に合わせてフレームレートが向上する時間スケーラビリティ(Temporal Scalability)と、伝送帯域の向上に合わせて画質が向上するSNR(Signal to Noise Ratio:信号対雑音比)スケーラビリティ(SNR Scalability)との2種類がある(例えば、非特許文献1参照)。
【0005】
【非特許文献1】
ISO/IEC 14496−2 Amendment 4, ISO/IEC JTC/SC29 WG11 N3904 (18th January 2001), ”AMENDMENT 4:Streaming Video Profile”
【0006】
【発明が解決しようとする課題】
しかしながら、現在標準化されているMPEG−4 FGSにおいては、空間解像度を向上する空間スケーラビリティ(Spatial Scalability)が存在しないため、伝送帯域の向上に合わせて空間解像度を向上することができない。すなわち、ビットレートが上がっても映像の解像度を高くすることができない。そのため、MPEG−4 FGSにおいて空間スケーラビリティを実現すること、しかも、帯域変動への柔軟な対応を可能にすべく、細かい空間スケーラビリティを実現することが今日強く望まれている。
【0007】
本発明は、かかる点に鑑みてなされたものであり、たとえば、MPEG−4 FGSにおいて、細かい空間スケーラビリティを実現することができる動画像符号化装置および動画像復号化装置を提供することを目的とする。
【0008】
【課題を解決するための手段】
(1)本発明の動画像符号化装置は、動画像を一の基本レイヤと少なくとも一の拡張レイヤとに分割して符号化する動画像符号化装置であって、低解像度表示に必要な情報のみを基本レイヤに符号化する基本レイヤ符号化手段と、高解像度表示に必要な情報を段階的に拡張レイヤに符号化する拡張レイヤ符号化手段と、を有する構成を採る。
【0009】
この構成によれば、基本レイヤのみを用いて低解像度映像を表示することができ、また、基本レイヤに加える拡張レイヤの数を増やして行くほど高解像度での表示を行うことができ、たとえば、MPEG−4 FGSにおいて、細かい空間スケーラビリティを実現することができる。
【0010】
(2)本発明の動画像符号化装置は、上記の構成において、前記基本レイヤ符号化手段は、基本レイヤにおける低解像度表示用の低周波成分以外の成分が最大値を有する量子化マトリクスを算出する量子化マトリクス算出手段を有し、算出された量子化マトリクスを用いて基本レイヤの符号化を行う、構成を採る。
【0011】
この構成によれば、低解像度表示に必要な情報のみを基本レイヤで符号化することができる。
【0012】
(3)本発明の動画像符号化装置は、上記の構成において、前記量子化マトリクス算出手段は、要求された表示解像度に応じて量子化マトリクスを変更する構成を採る。
【0013】
この構成によれば、たとえば、ユーザの要求に対応して基本レイヤの解像度を変更することができる。
【0014】
(4)本発明の動画像符号化装置は、上記の構成において、前記基本レイヤ符号化手段は、入力画像と時間的に1つ前の参照画像とを用いて動き予測を行い、動きベクトルを算出する動き予測手段を有し、前記動き予測手段は、入力画像および参照画像を基本レイヤにおける表示解像度に縮小し、縮小された入力画像および参照画像を用いて動き予測を行う、構成を採る。
【0015】
この構成によれば、動き予測の際に動き探索処理量を削減することができ、予測誤差を低減することができる。
【0016】
(5)本発明の動画像符号化装置は、上記の構成において、前記基本レイヤ符号化手段は、高解像度の画像を入力画像として用いる構成を採る。
【0017】
この構成によれば、拡張レイヤにおいて高解像度化を実現することができる。
【0018】
(6)本発明の動画像符号化装置は、上記の構成において、前記拡張レイヤ符号化手段は、低周波成分から高周波成分に向かって段階的に値が小さくなる周波数重み付けマトリクスを算出する周波数重み付けマトリクス算出手段と、算出された周波数重み付けマトリクスを用いて上位方向へビットシフトを行うビットシフト手段とを有し、周波数重み付けマトリクスを用いたビットシフト処理結果を用いて拡張レイヤの符号化を行う、構成を採る。
【0019】
この構成によれば、高解像度化に必要な情報ほど上位のビット平面に配置することができる。
【0020】
(7)本発明の動画像符号化装置は、上記の構成において、前記拡張レイヤ符号化手段は、算出された周波数重み付けマトリクスを用いて、ビットシフト後のビット平面に対するレイヤ分割を行うレイヤ分割手段、をさらに有する構成を採る。
【0021】
この構成によれば、高解像度化に必要な情報を別レイヤに分割することができる。
【0022】
(8)本発明の動画像符号化装置は、上記の構成において、前記周波数重み付けマトリクス算出手段は、要求された表示解像度に応じて周波数重み付けマトリクスを変更する構成を採る。
【0023】
この構成によれば、たとえば、ユーザの要求に対応して解像度を変更することができる。
【0024】
(9)本発明の動画像復号化装置は、上記(2)記載の動画像符号化装置によって符号化された動画像を復号化する動画像復号化装置であって、基本レイヤを受信する基本レイヤ受信手段と、受信された基本レイヤの量子化マトリクスの形状に応じて表示解像度を変換する解像度変換手段と、を有する構成を採る。
【0025】
この構成によれば、基本レイヤの受信時に適切な表示解像度で画像を表示することができる。
【0026】
(10)本発明の動画像復号化装置は、上記の構成において、前記解像度変換手段は、量子化マトリクスにおいて非最大値の成分が(1/A)×(1/A)個の場合、縮小率をAに設定する、構成を採る。
【0027】
この構成によれば、基本レイヤの受信時に適切な表示解像度を自動的に判別することができる。
【0028】
(11)本発明の動画像復号化装置は、上記(7)記載の動画像符号化装置によって符号化された動画像を復号化する動画像復号化装置であって、帯域に応じて拡張レイヤを受信する拡張レイヤ受信手段と、受信された拡張レイヤの数および周波数重み付けマトリクスの形状に応じて表示解像度を変換する解像度変換手段と、を有する構成を採る。
【0029】
この構成によれば、基本レイヤに加えて拡張レイヤを受信した場合に適切な表示解像度で画像を表示することができる。
【0030】
(12)本発明の動画像復号化装置は、上記の構成において、前記解像度変換手段は、受信された拡張レイヤに含まれる成分が周波数重み付けマトリクスにおいて(1/B)×(1/B)個の場合、縮小率をBに設定する、構成を採る。
【0031】
この構成によれば、基本レイヤに加えて拡張レイヤを受信した場合に適切な表示解像度を自動的に判別することができる。
【0032】
【発明の実施の形態】
本発明の骨子は、動画像符号化装置としての映像符号化装置(エンコーダ)において、量子化マトリクスを制御して、低解像度表示に必要な情報のみ基本レイヤ符号化し、また、周波数重み付けマトリクスを制御して、高解像度化に必要な成分を段階的に拡張レイヤ符号化することである。
【0033】
一方、動画像復号化装置としての映像復号化装置(デコーダ)において、受信基本レイヤを量子化マトリクス形状に応じて解像度変換して、低解像度高画質表示を行い、また、受信拡張レイヤを周波数重み付けマトリクス形状/受信レイヤ数に応じて縮小率を調整して、高解像度高画質表示を行うことである。
【0034】
これにより、伝送帯域/端末の特性に応じて解像度を滑らかに向上することができる(適切な解像度の算出)。たとえば、端末の表示面積/帯域が大きい場合は、高解像度の映像を表示し、端末の表示面積/帯域が小さい場合は、低解像度の映像を表示することができる。また、基本レイヤの解像度を変更することができる。
【0035】
以下、本発明の実施の形態について、図面を参照して詳細に説明する。
【0036】
図1は、本発明の一実施の形態に係る映像符号化装置(エンコーダ)の構成を示すブロック図である。
【0037】
図1に示す映像符号化装置100は、基本レイヤを生成する基本レイヤエンコーダ110と、拡張レイヤを生成する拡張レイヤエンコーダ130とを有する。
【0038】
基本レイヤエンコーダ110は、画像入力部112、動き予測・差分抽出部114、DCT(Discrete Cosine Transform:離散コサイン変換)部116、量子化部118、量子化マトリクス算出部120、可変長符号化部122、逆量子化部124、逆DCT部126、および動き補償部128を有する。
【0039】
拡張レイヤエンコーダ130は、差分抽出部132、DCT部134、ビットシフト部136、周波数重み付けマトリクス算出部138、ビット平面VLC部140、およびレイヤ分割部142を有する。
【0040】
以下、上記各部の機能について順に説明する。
【0041】
画像入力部112は、映像信号(原画像)を1画面毎に入力し、入力した映像信号を1画面毎に動き予測・差分抽出部114および差分抽出部132に出力する。
【0042】
動き予測・差分抽出部114は、画像入力部112から入力した原画像と動き補償部128から入力した時間的に1つ前の復号化画像である参照画像とにおいて、16×16画素のマクロブロック毎に相関の高い領域を探索して、原画像から最も相関の高い領域への動きベクトルを算出し(動き予測処理)、相関の高い領域から参照画像を減算することによって差分画像を抽出し(差分抽出処理)、抽出した差分画像をDCT部116に出力する。動き予測の結果得られた動きベクトルは、可変長符号化部122および動き補償部128に出力される。ただし、符号化の始まりでは、1フレーム前の復号化画像は存在しないので、動き予測は行わない。
【0043】
DCT部116は、動き予測・差分抽出部114から入力した画像に対して、8×8画素のブロック単位で離散コサイン変換(DCT)を行い、得られたDCT係数を量子化部118に出力する。図2は、入力画像とブロック内のDCT係数との関係の一例を示す図である。
【0044】
量子化部118は、DCT部116から入力したDCT係数に対して、ブロック単位で各DCT係数を量子化マトリクスに示される量子化値で割り算し、余りを切り捨て、商を量子化後のDCT係数として可変長符号化部122および逆量子化部124に出力する。量子化マトリクスは、量子化マトリクス算出部120によって提供される。
【0045】
図3は、量子化処理の一例を示す概念図であって、図3(A)は標準的な量子化マトリクスの一例を示し、図3(B)はDCT係数の一例を示し、図3(C)は量子化後のDCT係数の一例を示している。ここで、量子化マトリクスは、8×8個の量子化値を持つマトリクスであり(図3(A)参照)、マトリクス内の各値は8×8個のDCT係数(図3(B)参照)を量子化する際に用いられる。DCT係数の量子化は、量子化マトリクスの対応する座標の量子化値を用いて行われる。たとえば、量子化マトリクス内の座標を(x,y)、DCT係数をcoef(x,y)、量子化マトリクスの値をmatrix(x,y)とすると、量子化後のDCT係数qcoef(x,y)は、次の(式1)
qcoef(x,y)=coef(x,y)/matrix(x,y)      …(式1)
で表される。
【0046】
量子化マトリクス算出部120は、基本レイヤにおける表示解像度と入力画像の解像度との比率A(=表示解像度/入力解像度)を求め、低周波成分である左上から(8*A)×(8*A)の正方領域の量子化値をQとし、それ以外の量子化値が「255」(最大値)である、本発明に特有の独自の量子化マトリクスを算出する。Qの値は伝送帯域に応じて決定される。算出された量子化マトリクスは、量子化部118および可変長符号化部122に出力される。
【0047】
図4は、本実施の形態に対応する独自の量子化マトリクス算出処理の一例を示す概念図であって、図4(A)は算出された量子化マトリクスの一例を示し、図4(B)は入力画像の解像度を示し、図4(C)は基本レイヤの表示解像度を示している。図4(A)に示す量子化マトリクスの算出に当たっては、入力画像の幅をX_in(図4(B)参照)、基本レイヤの表示幅をX_Baseoutとして(図4(C)参照)、基本レイヤの縮小率Aを、次の(式2)
A=X_Baseout/X_in      …(式2)
によって求め、左上から(8*A)×(8*A)個の量子化値をQとし、それ以外の量子化値を「255」(最大値)とする(図4(A)参照)。たとえば、一例として、X_in=800、X_Baseout=100の場合、上記(式2)により、A=100/800=1/8となるので、(8/8)×(8/8)=1×1個の領域をQとする。
【0048】
可変長符号化部122は、量子化部118から入力した量子化後のDCT係数と、量子化マトリクス算出部120から入力した量子化マトリクスと、動き予測・差分抽出部114から入力した動きベクトルとを可変長符号化した後に多重化し、基本レイヤストリームとして外部に出力する。
【0049】
逆量子化部124は、量子化部118から入力した量子化後のDCT係数に対して、量子化部118における量子化の際に用いられた量子化マトリクスに示される量子化値により掛け算を行って(逆量子化)、逆量子化後のDCT係数を算出する。算出されたDCT係数は、逆DCT部126に出力される。
【0050】
逆DCT部126は、逆量子化部124から入力したDCT係数に対して、逆DCTを施し、復号化差分画像を生成する。生成された復号化差分画像は、動き補償部128に出力される。
【0051】
動き補償部128は、動き予測・差分抽出部114から入力した動きベクトルを用いて、内部メモリに記憶されている参照フレームから参照領域を算出し、この参照領域と逆DCT部126から入力した復号化差分画像とを加算処理して、現在の復号化画像を算出する。算出された現在の復号化画像は、動き予測・差分抽出部114および差分抽出部132に出力される。
【0052】
差分抽出部132は、画像入力部112から入力した原画像と動き補償部128から入力した基本レイヤの復号化画像とを差分処理して差分画像を生成し、生成した差分画像をDCT部134に出力する。
【0053】
DCT部134は、差分抽出部132から入力した差分画像に対して、8×8画素のブロック単位で離散コサイン変換(DCT)を行い、得られたDCT係数をビットシフト部136に出力する。
【0054】
ビットシフト部136は、DCT部134から入力したDCT係数に対して、各係数を2進数で表し、周波数重み付けマトリクスに示されるシフト値で上位ビット方向へのビットシフトを行う。ビットシフト後のDCT係数は、ビット平面VLC部140に出力される。なお、周波数重み付けマトリクスは、周波数重み付けマトリクス算出部138によって提供される。
【0055】
図5および図6は、ビットシフト処理の一例を示す概念図であって、図5(A)は周波数重み付けマトリクスの一例を示し、図5(B)は2進数で表記されたDCT係数1の一例を示し、図6(C)はビットシフト前のビット平面の概念図を示し、図6(D)はビットシフト後のビット平面の概念図を示している。図6(C)の概念図は、DCT係数1〜3に含まれる全DCT係数に対して、縦軸をビット平面とし、横軸をDCT係数の位置として並べて図示したものである。また、図6(D)の概念図は、周波数重み付けマトリクスに示されたシフト値に基づいてDCT係数毎に上位方向へビットシフトを行った後のDCT係数を示す図である。
【0056】
周波数重み付けマトリクス算出部138は、DCT係数に対するシフト値を示す周波数重み付けマトリクスを算出する。周波数重み付けマトリクスは、低周波成分の正方領域が最も値が高く、右下の高周波成分に領域を拡大するにつれて段階的にシフト値を下げることを特徴としている。周波数重み付けマトリクスの一例は、図5(A)に示すとおりである。算出された周波数重み付けマトリクスは、ビットシフト部136、ビット平面VLC部140、およびレイヤ分割部142に出力される。
【0057】
ビット平面VLC部140は、ビットシフト部136から入力したビットシフト後のDCT係数に対してビット平面毎に可変長符号化(VLC:Variable Length Coding)を行うとともに、周波数重み付けマトリクス算出部138から入力した周波数重み付けマトリクスを可変長符号化する。可変長符号化された両データは、レイヤ分割部142に出力される。
【0058】
図7は、ビット平面VLC処理の一例を示す概念図であって、図6(D)に示すビットシフト後のビット平面概念図に対応している。ただし、図7において、第1ビット平面は、画面内の全DCT係数をビット平面順に並べた際に、最上位ビット(MSB:Most Significant Bit)の位置に存在するビットを集めた平面であり、第2ビット平面は、MSBの次の上位ビット位置に存在するビットを集めた平面であり、第3ビット平面は、第2ビット平面の次の上位ビット位置に存在するビットを集めた平面であり、第Nビット平面は、最下位ビット(LSB:Least Significant Bit)の位置に存在するビットを集めた平面である。
【0059】
図8は、拡張レイヤビットストリームの構成図である。図8に示す拡張レイヤビットストリームは、各ビット平面を可変長符号化して生成したビットストリームを、第1ビット平面(bp1)、第2ビット平面(bp2)、…、第Nビット平面(bpN)の順に格納した構成となっている。
【0060】
ビット平面VLC部140では、まず、全画像中で第1ビット平面に存在するビット列に対して可変長符号化を行い、生成したビットストリームを拡張レイヤの先頭位置に配置する(bp1)。次に、第2ビット平面に対して可変長符号化を行い、第1ビット平面のビットストリームに続く位置に配置する(bp2)。そして、第3ビット平面以降のビット平面に対して同様の処理を繰り返し、最後に、第Nビット平面に対して可変長符号化を行い、ビットストリームの最後の位置に配置する(bpN)。また、ビットシフトにより発生した下位ビットはすべて「0」として扱うものとする。このように、大きい値でビットシフトされたDCT係数ほど上位のビット平面にて可変長符号化され、拡張レイヤとなる動画像ストリーム内では先頭に近い場所に格納されることになる。
【0061】
レイヤ分割部142は、ビット平面VLC部140から入力した拡張レイヤのビットストリームに対して、周波数重み付けマトリクス算出部138で算出された周波数重み付けマトリクスに示されるシフト値毎に周波数領域が分かれるようにビット平面を区切ってレイヤ分割を行う。たとえば、図7および図8において、第1ビット平面、第2ビット平面、…、第Nビット平面の各ストリームは、それぞれ、拡張レイヤ1(bp1)、拡張レイヤ2(bp2)、…、拡張レイヤN(bpN)のようにレイヤ分割される。レイヤ分割された複数の拡張レイヤのストリームは、外部に出力される。
【0062】
図9は、本発明の一実施の形態に係る映像復号化装置(デコーダ)の構成を示すブロック図である。
【0063】
図9に示す映像復号化装置200は、基本レイヤを復号化する基本レイヤデコーダ210と、拡張レイヤを復号化する拡張レイヤデコーダ230とを有する。
【0064】
基本レイヤデコーダ210は、基本レイヤストリーム入力部212、可変長復号化部214、逆量子化部216、逆DCT部218、動き補償部220、および第1の縮小率算出部222を有する。
【0065】
拡張レイヤデコーダ230は、拡張レイヤストリーム入力部232、レイヤ合成部234、ビット平面VLD部236、ビットシフト部238、逆DCT部240、画像加算部242、第2の縮小率算出部244、および解像度変換部246を有する。
【0066】
以下、上記各部の機能について順に説明する。
【0067】
基本レイヤストリーム入力部212は、1画面単位で基本レイヤストリームを入力し、入力した基本レイヤストリームを可変長復号化部214に出力する。
【0068】
可変長復号化部214は、基本レイヤストリーム入力部212から入力した基本レイヤストリームを可変長復号化して、基本レイヤストリームに含まれていた量子化マトリクス、動きベクトル、および量子化後のDCT係数を求める。得られた量子化マトリクスは、逆量子化部216および第1の縮小率算出部222に出力され、動きベクトルは、動き補償部220に出力され、量子化後のDCT係数は、逆量子化部216に出力される。
【0069】
逆量子化部216は、可変長復号化部214から入力した量子化後のDCT係数に対して、その量子化の際に用いられた量子化マトリクスに示される量子化値により掛け算を行って(逆量子化)、逆量子化後のDCT係数を算出する。算出されたDCT係数は、逆DCT部218に出力される。
【0070】
逆DCT部218は、逆量子化部216から入力したDCT係数に対して、逆DCTを施し、復号化差分画像を生成する。生成された復号化差分画像は、動き補償部220に出力される。
【0071】
動き補償部220は、逆DCT部218から入力した復号化差分画像と、時間的に1つ前の復号化画像とに対して加算処理を行って、基本レイヤの復号化画像を生成する。具体的には、可変長復号化部214から入力した動きベクトルを用いて、内部メモリに記憶されている参照フレームから参照領域を算出し、この参照領域と逆DCT部218から入力した復号化差分画像とを加算処理して、現在の基本レイヤ復号化画像を算出する。算出された現在の基本レイヤ復号化画像は、画像加算部242に出力される。
【0072】
第1の縮小率算出部222は、可変長復号化部214から入力した量子化マトリクスの形状から縮小率Aを算出する。具体的には、量子化マトリクスにおいて、値が「255」でない個数が全体の(1/A)×(1/A)の場合は、縮小率をAとする。算出された縮小率Aは、解像度変換部246に出力される。
【0073】
図10は、縮小率Aの算出方法の一例を示す概念図であって(図4参照)、図10(A)は量子化マトリクスの一例を示し、図10(B)は入力画像の解像度を示し、図10(C)は基本レイヤの表示解像度を示している。ここでは、値が「255」でない横幅をx、量子化マトリクスの横幅をMAXとして、基本レイヤの縮小率Aを、次の(式3)
A=x/MAX   …(式3)
によって求める。たとえば、一例として、x=1、MAX=8の場合、上記(式3)により、A=1/8となるので、基本レイヤの縮小率を1/8とする。
【0074】
拡張レイヤストリーム入力部232は、1画面毎に複数の拡張レイヤストリームを入力し、入力した複数の拡張レイヤストリームをレイヤ合成部234に出力するとともに、受信したレイヤ数を第2の縮小率算出部244に出力する。
【0075】
レイヤ合成部234は、拡張レイヤストリーム入力部232から入力した複数の拡張レイヤストリームを1つに合成して、ビット平面VLD部236に出力する。
【0076】
ビット平面VLD部236は、レイヤ合成部234から入力した拡張レイヤストリームに対して、可変長復号化(VLD:Variable Length Decoding)を行って周波数重み付けマトリクスを生成し、生成した周波数重み付けマトリクスをビットシフト部238および第2の縮小率算出部244に出力するとともに、ビット平面毎に可変長復号化(VLD)を行ってDCT係数を生成し、生成したDCT係数をビットシフト部238に出力する。
【0077】
ビットシフト部238は、ビット平面VLD部236から入力したDCT係数のおのおのに対して、周波数重み付けマトリクスに示されるシフト値で下位ビット方向へのビットシフトを行う。ビットシフト後のDCT係数は、逆DCT部240に出力される。
【0078】
逆DCT部240は、ビットシフト部238から入力したDCT係数に対して逆DCTを行って、拡張レイヤの復号化画像を生成する。生成された拡張レイヤ復号化画像は、画像加算部242に出力される。
【0079】
画像加算部242は、基本レイヤデコーダ210内の動き補償部220から入力した基本レイヤの復号化画像と、逆DCT部240から入力した拡張レイヤの復号化画像とを画素毎に加算処理して、復号化画像を生成し、生成した復号化画像を解像度変換部246に出力する。ただし、拡張レイヤの復号化画像が入力されない場合は、基本レイヤの復号化画像をそのまま出力する。
【0080】
第2の縮小率算出部244は、ビット平面VLD部236から入力した周波数重み付けマトリクスの形状および拡張レイヤストリーム入力部232から入力した受信レイヤ数を用いて、復号化画像の縮小率Bを算出し、算出した縮小率Bを解像度変換部246に出力する。具体的には、周波数重み付けマトリクスにおいて、同一値を持つ領域を左上から順に受信レイヤの数だけ拡大して行き、領域に含まれる個数が全体の(1/B)×(1/B)の場合は、縮小率をBとする。
【0081】
図11は、縮小率Bの算出方法の一例を示す概念図である。ここでは、総受信レイヤに含まれるマトリクス値の横幅をx、量子化マトリクスの横幅をMAXとして、拡張レイヤの縮小率Bを、次の(式4)
B=x/MAX   …(式4)
によって求める。たとえば、一例として、受信レイヤ数=3、MAX=8の場合、x=4であり、上記(式4)により、B=4/8=1/2となるので、拡張レイヤの縮小率を1/2とする。
【0082】
解像度変換部246は、縮小率算出部222、244によって算出された縮小率を用いて、画像加算部242から入力した復号化画像を縮小して、適切な解像度の映像を取得し、外部に出力する。具体的には、たとえば、第2の縮小率算出部244から縮小率Bを入力した場合は、優先的に縮小率Bを用いて、復号化画像の縮小処理を行う。これに対し、第2の縮小率算出部244から縮小率Bを入力しない場合は、第1の縮小率算出部222から入力した縮小率Aを用いて、復号化画像の縮小処理を行う。このとき、画像の縮小に関して、たとえば、縮小率Aで縮小する場合において(1/A)×(1/A)個の画素を1画素として置き換える方法としては、周辺(1/A)×(1/A)画素値の平均値で置き換える方法や、単純に(1/A)×(1/A)画素の左上の画素値で置き換える方法など、いずれの方法も使用可能である。
【0083】
図12は、解像度変換処理の一例を示す概念図である。図12に示すように、拡張レイヤの受信数に応じて、縮小率を変えることにより、高精細な映像を適切な解像度で表示することが可能である。たとえば、基本レイヤのみ受信した場合は(拡張レイヤ受信数=0)、高解像度・低画質の基本レイヤ(BL)復号化画像を、量子化マトリクスから算出される縮小率Aで解像度変換することにより、低解像度・高画質の縮小復号化画像を得ることができる。また、基本レイヤと拡張レイヤ1を受信した場合は(拡張レイヤ受信数=1)、高解像度・中画質の復号化画像を、周波数重み付けマトリクスと受信レイヤ数から算出される縮小率Bで解像度変換することにより、中解像度・高画質の縮小復号化画像を得ることができる。そして、基本レイヤとすべての拡張レイヤ1〜Nを受信した場合は(拡張レイヤ受信数=N)、高解像度・高画質の復号化画像を縮小しないでそのまま表示することにより、高解像度・高画質の復号化画像を得ることができる。
【0084】
要するに、本実施の形態の特徴は、映像符号化装置100において、図1に示すように、低解像度表示に必要な周波数情報(低周波成分)のみを基本レイヤとして符号化するために、低周波成分以外が最大値(255)となるように量子化マトリクスの値を制御する量子化マトリクス算出部120と、解像度を向上させる際に必要な周波数情報(解像度に合わせた周波数成分)を段階的に符号化するために、低周波成分から段階的に値が小さくなるように周波数重み付けマトリクスの値を制御する周波数重み付けマトリクス算出部138と、周波数重み付けマトリクスの値に応じて、表示解像度毎にデータが分かれるように拡張レイヤのデータ分割位置を制御するレイヤ分割部142とを有することである。
【0085】
また、映像復号化装置200において、図9に示すように、量子化マトリクスの値を用いて、値が「255」でない周波数成分の割合から、適切な解像度を求め、縮小率Aを算出する第1の縮小率算出部222と、受信した拡張レイヤの数と周波数重み付けマトリクスにより有効周波数成分の割合を算出し、適切な解像度を求め、縮小率Bを算出する第2の縮小率算出部244と、算出された縮小率A、Bを用いて復号化画像を縮小し、適切な解像度の映像を得る解像度変換部246とを有することである。
【0086】
これにより、伝送帯域に合わせて受信する拡張レイヤの数を増やし、拡張レイヤの数が増えるにつれ、復号化画像の空間解像度を向上することが可能となる。
【0087】
次いで、図1に示す構成を有する映像符号化装置100の動作について、つまり、映像符号化装置100における映像信号に対する処理の手順について、図13に示すフローチャートを用いて説明する。なお、図13に示すフローチャートは、映像符号化装置100の図示しない記憶装置(例えば、ROMやフラッシュメモリなど)に制御プログラムとして記憶されており、同じく図示しないCPUによって実行される。
【0088】
まず、ステップS1000では、映像信号(原画像)を入力する画像入力処理を行う。具体的には、画像入力部112で、入力した映像信号から同期信号を検出して、映像信号を構成する原画像を1画面毎に動き予測・差分抽出部114および拡張レイヤエンコーダ130内の差分抽出部132に出力する。
【0089】
そして、ステップS1100では、映像信号を基本レイヤとして符号化/復号化する基本レイヤ符号化復号化処理を行う。ここでは、画像入力部112から入力した原画像に対して、動き予測・差分抽出処理、DCT処理、量子化処理、および可変長符号化処理を行って基本レイヤストリームを生成し、生成した基本レイヤストリームを外部に出力するとともに、量子化後のDCT係数に対して、逆量子化処理、逆DCT処理、および動き補償処理を行って復号化画像を生成し、生成した復号化画像を拡張レイヤエンコーダ130内の差分抽出部132に出力する。
【0090】
図14は、図13に示す基本レイヤ符号化復号化処理の内容を示すフローチャートである。
【0091】
まず、ステップS1110では、動き予測・差分抽出部114で、上述したように、画像入力部112から入力した原画像および動き補償部128から入力した時間的に1つ前の参照画像(復号化画像)を用いて、動きベクトルを算出するとともに、差分画像を抽出する。抽出された差分画像は、DCT部116に出力され、算出された動きベクトルは、可変長符号化部122および動き補償部128に出力される。ただし、符号化の始まりでは、1フレーム前の復号化画像は存在しないので、動き予測は行わない。
【0092】
そして、ステップS1120では、量子化マトリクス算出部120で、上述したように、基本レイヤにおける表示解像度と入力画像の解像度との比率A(=表示解像度/入力解像度)を求め、低周波成分である左上から(8*A)×(8*A)の正方領域の量子化値をQとし、それ以外の量子化値が255(最大値)である、本発明に特有の独自の量子化マトリクスを算出する(図4参照)。Qの値は伝送帯域に応じて決定される。算出された量子化マトリクスは、量子化部118および可変長符号化部122に出力される。
【0093】
そして、ステップS1130では、DCT部116で、上述したように、動き予測・差分抽出部114から入力した画像に対して、8×8画素のブロック単位で離散コサイン変換(DCT)を行い、得られたDCT係数を量子化部118に出力する。
【0094】
なお、ステップS1120とステップS1130の処理は、順番が逆であってもよく、また、並列に処理されてもよい。
【0095】
そして、ステップS1140では、量子化部118で、上述したように、DCT部116から入力したDCT係数に対して、ブロック単位で各DCT係数をステップS1120で算出した量子化マトリクスに示される量子化値で量子化を行い(図3参照)、量子化後のDCT係数を可変長符号化部122および逆量子化部124に出力する。
【0096】
そして、ステップS1150では、可変長符号化部122で、上述したように、量子化部118から入力した量子化後のDCT係数と、量子化マトリクス算出部120から入力した量子化マトリクスと、動き予測・差分抽出部114から入力した動きベクトルとを可変長符号化した後に多重化して、基本レイヤストリームを生成する。生成された基本レイヤストリームは、外部に出力される。
【0097】
一方、ステップS1160では、逆量子化部124で、上述したように、量子化部118から入力した量子化後のDCT係数に対して、ステップS1140における量子化処理の際に用いた量子化マトリクスに示される量子化値で逆量子化を行い、逆量子化後のDCT係数を算出する。算出されたDCT係数は、逆DCT部126に出力される。
【0098】
そして、ステップS1170では、逆DCT部126で、上述したように、逆量子化部124から入力したDCT係数に対して、逆DCTを施して、復号化差分画像を生成する。生成された復号化差分画像は、動き補償部128に出力される。
【0099】
そして、ステップS1180では、動き補償部128で、上述したように、動き予測・差分抽出部114から入力した動きベクトルを用いて、内部メモリに記憶されている参照フレームから参照領域を算出し、この参照領域と逆DCT部126から入力した復号化差分画像とを加算処理して、現在の復号化画像を算出し、算出した復号化画像を差分抽出部132に出力した後、図13のフローチャートにリターンする。なお、算出された復号化画像は、動き予測・差分抽出部114にも出力される。
【0100】
そして、ステップS1200では、拡張レイヤの符号化処理を行う。ここでは、画像入力部112から入力した原画像と動き補償部128から入力した基本レイヤ符号化復号化の復号化画像とに対して、差分抽出処理、DCT処理、ビットシフト処理、ビット平面VLC処理、およびレイヤ分割処理を行って複数の拡張レイヤストリームを生成し、生成した複数の拡張レイヤストリームを外部に出力する。
【0101】
図15は、図13に示す拡張レイヤ符号化処理の内容を示すフローチャートである。
【0102】
まず、ステップS1210では、差分抽出部132で、上述したように、画像入力部112から入力した原画像と動き補償部128から入力した基本レイヤの復号化画像とを差分処理して差分画像を生成し、生成した差分画像をDCT部134に出力する。
【0103】
そして、ステップS1220では、周波数重み付けマトリクス算出部138で、上述したように、DCT係数に対するシフト値を示す周波数重み付けマトリクスを算出する(図5(A)参照)。周波数重み付けマトリクスは、低周波成分の正方領域が最も値が高く、右下の高周波成分に領域を拡大するにつれて段階的にシフト値が下がっている。算出された周波数重み付けマトリクスは、ビットシフト部136、ビット平面VLC部140、およびレイヤ分割部142に出力される。
【0104】
そして、ステップS1230では、DCT部134で、上述したように、差分抽出部132から入力した差分画像に対して、8×8画素のブロック単位で離散コサイン変換(DCT)を行い、得られたDCT係数をビットシフト部136に出力する。
【0105】
なお、ステップS1220とステップS1230の処理は、順番が逆であってもよく、また、並列に処理されてもよい。
【0106】
そして、ステップS1240では、ビットシフト部136で、上述したように、DCT部134から入力したDCT係数に対して、各係数を2進数で表し、ステップS1220で算出した周波数重み付けマトリクスに示されるシフト値で上位ビット方向へのビットシフトを行う(図5および図6参照)。ビットシフト後のDCT係数は、ビット平面VLC部140に出力される。
【0107】
そして、ステップS1250では、ビット平面VLC部140で、上述したように、ビットシフト部136から入力したビットシフト後のDCT係数に対してビット平面毎に可変長符号化(VLC)を行うとともに(図7参照)、周波数重み付けマトリクス算出部138から入力した周波数重み付けマトリクスを可変長符号化し、可変長符号化した両データをレイヤ分割部142に出力する。なお、各ビット平面を可変長符号化して生成された拡張レイヤビットストリームは、図8に示す構成を有している。
【0108】
そして、ステップS1260では、レイヤ分割部142で、上述したように、ビット平面VLC部140から入力した拡張レイヤビットストリームに対して、ステップS1220で算出した周波数重み付けマトリクスに示されるシフト値毎に周波数領域が分かれるようにビット平面を区切ってレイヤ分割を行い(図7および図8参照)、レイヤ分割した複数の拡張レイヤストリームを外部に出力した後、図13のフローチャートにリターンする。
【0109】
そして、ステップS1300では、終了判定処理を行う。具体的には、画像入力部112において映像信号の入力が停止したか否かを判断する。この判断の結果として画像入力部112において映像信号の入力が停止した場合は(S1300:YES)、符号化終了と判定して、一連の符号化処理を終了するが、画像入力部112において映像信号の入力が停止していない場合は(S1300:NO)、ステップS1000に戻る。すなわち、画像入力部112において映像信号の入力が停止するまでステップS1000〜ステップS1200の一連の処理を繰り返す。
【0110】
このように、本実施の形態では、基本レイヤの符号化方法として、入力した原画像のサイズを最大解像度として符号化するとともに、たとえば図16(A)に示すような独自の量子化マトリクスを使用して、(1/A)×(1/A)のDCT係数のみを符号化することを特徴とする。ここで、Aは縮小率(=表示解像度/入力解像度)であり、図16(A)は図4(A)に対応する概略図である。
【0111】
また、拡張レイヤの符号化方法として、たとえば図16(B)に示すような、左上の低周波成分から右下の高周波成分に向かって順に段階的に値を下げた周波数重み付けマトリクスを使用して、ビットシフトを行うことを特徴とする。このビットシフトにより、たとえば、図17(C)に示すビット平面は、図17(D)に示すビット平面に変更される。また、拡張レイヤの分割に際して、図17(D)に示すように、上記周波数重み付けマトリクスの値による分割を行い、同一の重み付け値(シフト値)を持つビット平面が同一のレイヤとなるようにすることを特徴とする。ここで、図16(B)、図17(C)、図17(D)は、それぞれ、図5(A)、図6(C)、図6(D)に対応する概略図である(ただし、図中の数値は異なる)。
【0112】
次いで、図9に示す構成を有する映像復号化装置200の動作について、つまり、映像復号化装置200におけるビットストリームに対する処理の手順について、図18に示すフローチャートを用いて説明する。なお、図18に示すフローチャートは、映像復号化装置200の図示しない記憶装置(例えば、ROMやフラッシュメモリなど)に制御プログラムとして記憶されており、同じく図示しないCPUによって実行される。
【0113】
まず、ステップS2000では、画像毎にストリームを入力するストリーム入力処理を行う。なお、この処理を通じて拡張レイヤの有無がわかる。
【0114】
そして、ステップS2100では、基本レイヤを復号化する基本レイヤ復号化処理を行う。ここでは、基本レイヤストリームを入力した後、可変長復号化処理、逆量子化処理、逆DCT処理、および動き補償処理を行って基本レイヤ復号化画像を生成するとともに、量子化マトリクスの形状に応じて縮小率Aの算出処理を行う。
【0115】
図19は、図18に示す基本レイヤ復号化処理の内容を示すフローチャートである。
【0116】
まず、ステップS2110では、基本レイヤストリーム入力部212で、上述したように、1画面単位で基本レイヤストリームを入力し、入力した基本レイヤストリームを可変長復号化部214に出力する。
【0117】
そして、ステップS2120では、可変長復号化部214で、上述したように、基本レイヤストリーム入力部212から入力した基本レイヤストリームを可変長復号化して、基本レイヤストリームに含まれていた量子化マトリクス、動きベクトル、および量子化後のDCT係数を求める。得られた量子化マトリクスは、逆量子化部216および第1の縮小率算出部222に出力され、動きベクトルは、動き補償部220に出力され、量子化後のDCT係数は、逆量子化部216に出力される。
【0118】
そして、ステップS2130では、第1の縮小率算出部222で、上述したように、可変長復号化部214から入力した量子化マトリクスの形状から縮小率Aを算出する(図10参照)。具体的には、量子化マトリクスにおいて、値が「255」でない個数が全体の(1/A)×(1/A)の場合は、縮小率をAとする。算出された縮小率Aは、拡張レイヤデコーダ230内の解像度変換部246に出力される。
【0119】
一方、ステップS2140では、逆量子化部216で、上述したように、可変長復号化部214から入力した量子化後のDCT係数に対して、その量子化の際に用いられた量子化マトリクスに示される量子化値で逆量子化を行って、逆量子化後のDCT係数を算出する。算出されたDCT係数は、逆DCT部218に出力される。
【0120】
そして、ステップS2150では、逆DCT部218で、上述したように、逆量子化部216から入力したDCT係数に対して、逆DCTを施し、復号化差分画像を生成し、生成した復号化差分画像を動き補償部220に出力する。
【0121】
そして、ステップS2160では、動き補償部220で、上述したように、逆DCT部218から入力した復号化差分画像と、時間的に1つ前の復号化画像とに対して加算処理を行って、基本レイヤの復号化画像を生成し、生成した基本レイヤ復号化画像を拡張レイヤデコーダ230内の画像加算部242に出力した後、図18のフローチャートにリターンする。
【0122】
そして、ステップS2200では、ステップS2000のストリーム入力処理の結果に基づいて、拡張レイヤがあるか否かを判断する。この判断の結果として拡張レイヤがある場合は(S2200:YES)、ステップS2300に進み、拡張レイヤがない場合、つまり、基本レイヤのみの場合は(S2200:NO)、ただちにステップS2400に進む。
【0123】
ステップS2300では、拡張レイヤを復号化する拡張レイヤ復号化処理を行う。ここでは、複数の拡張レイヤストリームを入力した後、レイヤ合成処理、ビット平面VLD処理、ビットシフト処理、逆DCT処理、および画像加算処理を行って復号化画像を生成するとともに、周波数重み付けマトリクスの形状と受信レイヤ数に応じて縮小率Bの算出処理を行う。
【0124】
図20は、図18に示す拡張レイヤ復号化処理の内容を示すフローチャートである。
【0125】
まず、ステップS2310では、拡張レイヤストリーム入力部232で、上述したように、1画面毎に複数の拡張レイヤストリームを入力し、入力した複数の拡張レイヤストリームをレイヤ合成部234に出力するとともに、受信したレイヤ数を第2の縮小率算出部244に出力する。
【0126】
そして、ステップS2320では、レイヤ合成部234で、上述したように、拡張レイヤストリーム入力部232から入力した複数の拡張レイヤストリームを1つに合成して、ビット平面VLD部236に出力する。
【0127】
そして、ステップS2330では、ビット平面VLD部236で、上述したように、レイヤ合成部234から入力した拡張レイヤストリームに対して、可変長復号化(VLD)を行って周波数重み付けマトリクスを生成し、生成した周波数重み付けマトリクスをビットシフト部238および第2の縮小率算出部244に出力するとともに、ビット平面毎に可変長復号化(VLD)を行ってDCT係数を生成し、生成したDCT係数をビットシフト部238に出力する。
【0128】
そして、ステップS2340では、第2の縮小率算出部244で、上述したように、ビット平面VLD部236から入力した周波数重み付けマトリクスの形状および拡張レイヤストリーム入力部232から入力した受信レイヤ数を用いて、復号化画像の縮小率Bを算出する(図11参照)。具体的には、周波数重み付けマトリクスにおいて、同一値を持つ領域を左上から順に受信レイヤの数だけ拡大して行き、領域に含まれる個数が全体の(1/B)×(1/B)の場合は、縮小率をBとする。算出された縮小率Bは、解像度変換部246に出力される。
【0129】
一方、ステップS2350では、ビットシフト部238で、上述したように、ビット平面VLD部236から入力したDCT係数のおのおのに対して、周波数重み付けマトリクスに示されるシフト値で下位ビット方向へのビットシフトを行う。ビットシフト後のDCT係数は、逆DCT部240に出力される。
【0130】
そして、ステップS2360では、逆DCT部240で、上述したように、ビットシフト部238から入力したDCT係数に対して逆DCTを行って、拡張レイヤの復号化画像を生成する。生成された拡張レイヤ復号化画像は、画像加算部242に出力される。
【0131】
そして、ステップS2370では、画像加算部242で、上述したように、基本レイヤデコーダ210内の動き補償部220から入力した基本レイヤの復号化画像と、逆DCT部240から入力した拡張レイヤの復号化画像とを画素毎に加算処理して、復号化画像を生成し、生成した復号化画像を解像度変換部246に出力した後、図18のフローチャートにリターンする。ただし、拡張レイヤの復号化画像が入力されない場合は、基本レイヤの復号化画像をそのまま出力する。
【0132】
そして、ステップS2400では、解像度変換部246で、解像度変換処理を行う。具体的には、上述したように、縮小率算出部222、244によって算出された縮小率A、Bを用いて、画像加算部242から入力した復号化画像を縮小して、適切な解像度の映像を取得し、外部に出力する。
【0133】
図21は、図18に示す解像度変換処理の内容を示すフローチャートである。
【0134】
まず、ステップS2410では、縮小率算出部244からの入力信号(縮小率B)の有無に基づいて、拡張レイヤがあるか否かを判断する。この判断の結果として拡張レイヤがある場合は(S2410:YES)、ステップS2420に進み、拡張レイヤがない場合は(S2410:NO)、ステップS2430に進む。
【0135】
ステップS2420では、拡張レイヤがある場合であるため、第2の縮小率算出部244から入力した縮小率Bを用いて、画像加算部242から入力した復号化画像に対する解像度変換処理(縮小処理)を行った後、図18のフローチャートにリターンする。
【0136】
一方、ステップS2430では、拡張レイヤがない場合、つまり、基本レイヤのみの場合であるため、第1の縮小率算出部222から入力した縮小率Aを用いて、画像加算部242から入力した復号化画像(この場合は、基本レイヤの復号化画像)に対する解像度変換処理(縮小処理)を行った後、図18のフローチャートにリターンする。
【0137】
そして、ステップS2500では、終了判定処理を行う。具体的には、たとえば、基本レイヤストリーム入力部212において基本レイヤストリームの入力が停止したか否かを判断する。この判断の結果として基本レイヤストリーム入力部212において基本レイヤストリームの入力が停止した場合は(S2500:YES)、復号化終了と判定して、一連の復号化処理を終了するが、基本レイヤストリーム入力部212において基本レイヤストリームの入力が停止していない場合は(S2500:NO)、ステップS2000に戻る。すなわち、基本レイヤストリーム入力部212において基本レイヤストリームの入力が停止するまでステップS2000〜ステップS2400の一連の処理を繰り返す。
【0138】
このように、本実施の形態では、復号化方法として、図12に示すように、拡張レイヤの受信数に応じて、縮小率を変えることにより、高精細な映像を適切な解像度で表示することができる。
【0139】
図22は、本実施の形態を適用したMPEG−4 FGSによる映像ストリーミングシステムの一例を示す構成図である。
【0140】
映像サーバ300は、基本レイヤと複数(N個)の拡張レイヤとで構成される映像ストリームをネットワークに伝送して各種の端末400、500、600に送る。たとえば、端末400は、高帯域の端末(たとえば、高品位のパソコンやデジタルテレビなど)であり、端末500は、中帯域の端末(たとえば、中品位のパソコンなど)であり、端末600は、低帯域の端末(たとえば、携帯電話やPDAなど)である。高帯域の端末400は、高帯域のLAN450に接続され、中帯域の端末500は、中帯域のインターネット550に接続され、低帯域の端末600は、低帯域のモバイル網650に接続されている。
【0141】
このとき、高帯域のLAN450、中帯域のインターネット550、および低帯域のモバイル網650にそれぞれ接続された各端末400、500、600は、各自の受信帯域に合わせて、受信するストリームを選択し、帯域に応じた品質の映像を受信することができる。たとえば、高帯域の端末400は、基本レイヤとすべての拡張レイヤ1〜Nを受信して、高品質の映像を得ることができる。また、中帯域の端末500は、基本レイヤと2つの拡張レイヤ1〜2を受信して、中品質の映像を得ることができる。また、低帯域の端末600は、基本レイヤと1つの拡張レイヤ1を受信して、低品質の映像を得ることができる。
【0142】
以下では、さらに、本実施の形態の適用例およびバリエーションについて説明する。
【0143】
まず、本実施の形態によれば、端末能力に応じた空間スケーラビリティを実現することができる。具体的には、各受信端末の表示面積に応じて受信拡張レイヤ数を変えることにより、それぞれ適切な解像度を得ることができる。たとえば、一般に表示面積が比較的小さい携帯電話は、基本レイヤのみを受信して低解像度の表示を行い、一般に表示面積が比較的大きいパソコンは、基本レイヤに加えて複数の拡張レイヤを受信して高解像度の表示を行うことができる。
【0144】
また、本実施の形態によれば、帯域変動に応じた空間スケーラビリティを実現することができる。具体的には、帯域変動に合わせて可能な限りの拡張レイヤを受信することにより、解像度を向上することができる。たとえば、ビットレートが低いときは、基本レイヤのみを受信して低解像度の表示を行い、ビットレートが高いときは、基本レイヤに加えて複数の拡張レイヤを受信して高解像度の表示を行うことができる。
【0145】
また、本実施の形態によれば、ユーザの嗜好に応じた空間スケーラビリティを実現することができる。具体的には、ユーザの好みに応じて受信拡張レイヤ数を選択することにより、好みの解像度で映像再生を行うことができる。受信拡張レイヤ数の選択方法としては、たとえば、レイヤ分割情報を用いて選択したり、また、まず拡張レイヤを受信してビット平面情報を得てから選択したりすることができる。
【0146】
また、本実施の形態の追加機能として、解像度の要求を行ってインタラクティブ性を持たせることができる。具体的には、受信端末から要求された基本レイヤ解像度に合わせて、たとえば、ユーザの要求やフィードバック情報(端末情報)などに応じて、サーバは、量子化マトリクスの形状を制御することにより、基本レイヤの解像度を変更することができる。この結果、サーバは、必要な拡張レイヤのみを送ることができ、帯域を節約することができる。
【0147】
また、本実施の形態の追加機能として、基本レイヤの動き予測を1/Aの解像度で行い、予測誤差を低減することにより、符号化効率の向上と処理量の低減を図ることができる。
【0148】
図23は、この追加機能を有する映像符号化装置における動き予測・差分抽出部の動作の一例を示すフローチャートである。なお、この映像符号化装置の構成および動作は、動き予測・差分抽出部を除いて図1に示す映像符号化装置100と同様であるため、その説明を省略する。ここでは、基本レイヤの縮小率Aを用いて、動き予測を縮小率Aで縮小した画像同士で行うことにより、処理量の低減と予測誤差の低減を図っている。
【0149】
まず、ステップS3000では、原画像の縮小処理を行う。具体的には、入力した原画像を基本レイヤの縮小率Aで縮小して、縮小原画像を生成する。
【0150】
そして、ステップS3100では、参照画像の縮小処理を行う。具体的には、時間的に1つ前の基本レイヤ復号化画像を基本レイヤの縮小率Aで縮小して、縮小参照画像を生成する。
【0151】
そして、ステップS3200では、動き予測処理を行う。具体的には、マクロブロックを基本レイヤの縮小率Aで縮小して、縮小マクロブロックを算出した後、ステップS3000で生成した縮小原画像とステップS3100で生成した縮小参照画像において、縮小マクロブロック毎に相関の高い領域を探索し、原画像から最も相関の高い領域への動きベクトルを算出する。
【0152】
そして、ステップS3300では、差分抽出処理を行う。具体的には、ステップS3200で縮小画像から算出した動きベクトルに対して縮小率Aの逆数(1/A)で掛け算を行い、マクロブロック単位で原画像と相関の高い領域の参照画像を減算することによって差分画像を抽出し、抽出した差分画像をDCT部116に出力する。動き予測の結果得られた動きベクトルは、可変長符号化部122および動き補償部128に出力される。ただし、上述したように、符号化の始まりでは、1フレーム前の復号化画像は存在しないので、動き予測は行わない。
【0153】
ここで、上記の動き予測・差分抽出処理を概念的に示すと、図24に示すとおりである。
【0154】
なお、本実施の形態では、本発明をMPEG−4 FGS方式に適用した場合について説明したが、本発明の適用対象となる映像符号化方式は、MPEG−4FGS方式に限定されるわけではなく、ビット平面符号化を用いる方式であれば、他の階層符号化方式であってもよい。
【0155】
【発明の効果】
以上説明したように、本発明によれば、たとえば、MPEG−4 FGSのような階層符号化方式において、細かい空間スケーラビリティを実現することができる。
【図面の簡単な説明】
【図1】本発明の一実施の形態に係る映像符号化装置の構成を示すブロック図
【図2】入力画像とブロック内のDCT係数との関係の一例を示す図
【図3】量子化処理の一例を示す概念図
【図4】本実施の形態に対応する独自の量子化マトリクス算出処理の一例を示す概念図
【図5】ビットシフト処理の一例を示す概念図
【図6】同じくビットシフト処理の一例を示す概念図
【図7】ビット平面VLC処理の一例を示す概念図
【図8】拡張レイヤビットストリームの構成図
【図9】本発明の一実施の形態に係る映像復号化装置の構成を示すブロック図
【図10】縮小率Aの算出方法の一例を示す概念図
【図11】縮小率Bの算出方法の一例を示す概念図
【図12】解像度変換処理の一例を示す概念図
【図13】本実施の形態に対応する映像符号化装置の動作を示すフローチャート
【図14】図13に示す基本レイヤ符号化復号化処理の内容を示すフローチャート
【図15】図13に示す拡張レイヤ符号化処理の内容を示すフローチャート
【図16】本実施の形態の特徴を説明するための概念図
【図17】同じく本実施の形態の特徴を説明するための概念図
【図18】本実施の形態に対応する映像復号化装置の動作を示すフローチャート
【図19】図18に示す基本レイヤ復号化処理の内容を示すフローチャート
【図20】図18に示す拡張レイヤ復号化処理の内容を示すフローチャート
【図21】図18に示す解像度変換処理の内容を示すフローチャート
【図22】本実施の形態を適用したMPEG−4 FGSによる映像ストリーミングシステムの一例を示す構成図
【図23】本実施の形態に対応する映像符号化装置において符号化効率の向上を図るための動き予測・差分抽出部の動作の一例を示すフローチャート
【図24】図23に示す動き予測・差分抽出処理の概念図
【符号の説明】
100 映像符号化装置
110 基本レイヤエンコーダ
112 画像入力部
114 動き予測・差分抽出部
116、134 DCT部
118 量子化部
120 量子化マトリクス算出部
122 可変長符号化部
124、216 逆量子化部
126、218、240 逆DCT部
128、220 動き補償部
130 拡張レイヤエンコーダ
132 差分抽出部
136、238 ビットシフト部
138 周波数重み付けマトリクス算出部
140 ビット平面VLC部
142 レイヤ分割部
200 映像復号化装置
210 基本レイヤデコーダ
212 基本レイヤストリーム入力部
214 可変長復号化部
222、244 縮小率算出部
230 拡張レイヤデコーダ
232 拡張ストリーム入力部
234 レイヤ合成部
236 ビット平面VLD部
242 画像加算部
246 解像度変換部

Claims (12)

  1. 動画像を一の基本レイヤと少なくとも一の拡張レイヤとに分割して符号化する動画像符号化装置であって、
    低解像度表示に必要な情報のみを基本レイヤに符号化する基本レイヤ符号化手段と、
    高解像度表示に必要な情報を段階的に拡張レイヤに符号化する拡張レイヤ符号化手段と、
    を有することを特徴とする動画像符号化装置。
  2. 前記基本レイヤ符号化手段は、
    基本レイヤにおける低解像度表示用の低周波成分以外の成分が最大値を有する量子化マトリクスを算出する量子化マトリクス算出手段を有し、
    算出された量子化マトリクスを用いて基本レイヤの符号化を行う、
    ことを特徴とする請求項1記載の動画像符号化装置。
  3. 前記量子化マトリクス算出手段は、要求された表示解像度に応じて量子化マトリクスを変更することを特徴とする請求項2記載の動画像符号化装置。
  4. 前記基本レイヤ符号化手段は、
    入力画像と時間的に1つ前の参照画像とを用いて動き予測を行い、動きベクトルを算出する動き予測手段を有し、
    前記動き予測手段は、
    入力画像および参照画像を基本レイヤにおける表示解像度に縮小し、縮小された入力画像および参照画像を用いて動き予測を行う、
    ことを特徴とする請求項1記載の動画像符号化装置。
  5. 前記基本レイヤ符号化手段は、高解像度の画像を入力画像として用いることを特徴とする請求項1記載の動画像符号化装置。
  6. 前記拡張レイヤ符号化手段は、
    低周波成分から高周波成分に向かって段階的に値が小さくなる周波数重み付けマトリクスを算出する周波数重み付けマトリクス算出手段と、
    算出された周波数重み付けマトリクスを用いて上位方向へビットシフトを行うビットシフト手段とを有し、
    周波数重み付けマトリクスを用いたビットシフト処理結果を用いて拡張レイヤの符号化を行う、
    ことを特徴とする請求項1記載の動画像符号化装置。
  7. 前記拡張レイヤ符号化手段は、
    算出された周波数重み付けマトリクスを用いて、ビットシフト後のビット平面に対するレイヤ分割を行うレイヤ分割手段、
    をさらに有することを特徴とする請求項6記載の動画像符号化装置。
  8. 前記周波数重み付けマトリクス算出手段は、要求された表示解像度に応じて周波数重み付けマトリクスを変更することを特徴とする請求項6記載の動画像符号化装置。
  9. 請求項2記載の動画像符号化装置によって符号化された動画像を復号化する動画像復号化装置であって、
    基本レイヤを受信する基本レイヤ受信手段と、
    受信された基本レイヤの量子化マトリクスの形状に応じて表示解像度を変換する解像度変換手段と、
    を有することを特徴とする動画像復号化装置。
  10. 前記解像度変換手段は、
    量子化マトリクスにおいて非最大値の成分が(1/A)×(1/A)個の場合、縮小率をAに設定する、
    ことを特徴とする請求項9記載の動画像復号化装置。
  11. 請求項7記載の動画像符号化装置によって符号化された動画像を復号化する動画像復号化装置であって、
    帯域に応じて拡張レイヤを受信する拡張レイヤ受信手段と、
    受信された拡張レイヤの数および周波数重み付けマトリクスの形状に応じて表示解像度を変換する解像度変換手段と、
    を有することを特徴とする動画像復号化装置。
  12. 前記解像度変換手段は、
    受信された拡張レイヤに含まれる成分が周波数重み付けマトリクスにおいて(1/B)×(1/B)個の場合、縮小率をBに設定する、
    ことを特徴とする請求項11記載の動画像復号化装置。
JP2002295640A 2002-10-09 2002-10-09 動画像符号化装置および動画像復号化装置 Pending JP2004134916A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002295640A JP2004134916A (ja) 2002-10-09 2002-10-09 動画像符号化装置および動画像復号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002295640A JP2004134916A (ja) 2002-10-09 2002-10-09 動画像符号化装置および動画像復号化装置

Publications (1)

Publication Number Publication Date
JP2004134916A true JP2004134916A (ja) 2004-04-30

Family

ID=32285821

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002295640A Pending JP2004134916A (ja) 2002-10-09 2002-10-09 動画像符号化装置および動画像復号化装置

Country Status (1)

Country Link
JP (1) JP2004134916A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013538511A (ja) * 2010-08-26 2013-10-10 フリースケール セミコンダクター インコーポレイテッド ビデオ処理システムおよびビデオデータの並列処理のための方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013538511A (ja) * 2010-08-26 2013-10-10 フリースケール セミコンダクター インコーポレイテッド ビデオ処理システムおよびビデオデータの並列処理のための方法

Similar Documents

Publication Publication Date Title
JP6291172B2 (ja) 多階層ビデオコーディングのためのレート制御方法、これを用いるビデオエンコード装置及びビデオ信号処理システム
KR100954816B1 (ko) 비디오 및 비디오 신호를 코딩하는 방법, 비디오를 코딩하기 위한 장치 및 컴퓨터 판독 가능한 기록 매체, 및 베이스 층 데이터-스트림과 강화층 데이터-스트림을 디코딩하기 위한 방법, 장치 및 컴퓨터 판독 가능한 기록 매체
JP5619688B2 (ja) 二層符号化及び単層復号化による階層的ビデオ符号化
US7082164B2 (en) Multimedia compression system with additive temporal layers
US8442122B2 (en) Complexity scalable video transcoder and encoder
US8085847B2 (en) Method for compressing/decompressing motion vectors of unsynchronized picture and apparatus using the same
JP4981927B2 (ja) Svccgs拡張層コーディングに関するcavlc拡張
US20070025442A1 (en) Coding method for coding moving images
US20050074177A1 (en) Video coding method
TW201320751A (zh) 利用轉換操作之影音編碼及解碼方法
WO2006001777A1 (en) Scalable video coding with grid motion estimation and compensation
JP2005513928A (ja) ファイン・グレイン映像符号化に関する計算量スケーラビリティ(fgs)
US6999511B1 (en) Dynamically switching quant matrix tables within an MPEG-2 encoder
JP2007507927A (ja) アドバンスドデータパーティショニングと効率的な空間−時間−snrスケーラビリティビデオコーディング及びストリーミングのためのファイン・グラニュラリティ・スケーラビリティとを結合したシステム及び方法
KR100714695B1 (ko) 픽쳐 드롭 및 합성을 통하여 레이트 컨트롤을 수행하는비디오 코딩 방법, 그 방법을 이용한 비디오 인코더, 및트랜스코더
KR20060063619A (ko) 영상 신호의 인코딩 및 디코딩 방법
US20030156637A1 (en) Memory-bandwidth efficient FGS encoder
JP2007266750A (ja) 符号化方法
JP2004134916A (ja) 動画像符号化装置および動画像復号化装置
US8548045B2 (en) Method and apparatus for video encoding
KR20020087810A (ko) 미세입자 스케일러블 코딩의 적응적 선택 강화 적용 방법
WO2006046334A1 (ja) 映像符号化装置、映像復号化装置、映像符号化方法及び映像復号化方法
JP2004056616A (ja) 符号化信号復号装置、符号化信号復号方法および符号化信号復号プログラム
Eeckhaut et al. A hardware-friendly wavelet entropy codec for scalable video
JP2007235299A (ja) 画像符号化方法