JP2007235299A - 画像符号化方法 - Google Patents
画像符号化方法 Download PDFInfo
- Publication number
- JP2007235299A JP2007235299A JP2006051686A JP2006051686A JP2007235299A JP 2007235299 A JP2007235299 A JP 2007235299A JP 2006051686 A JP2006051686 A JP 2006051686A JP 2006051686 A JP2006051686 A JP 2006051686A JP 2007235299 A JP2007235299 A JP 2007235299A
- Authority
- JP
- Japan
- Prior art keywords
- image
- dynamic range
- bits
- unit
- resolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
【課題】スケーラブル符号化において、符号化前のデータのデータ量を削減する。
【解決手段】動画像を構成するピクチャに空間スケーラビリティを持たせて符号化するスケーラブル符号化において、基本解像度成分と、基本解像度成分との差分で表されるより高い解像度の成分についてそれぞれダイナミックレンジを計算する。ダイナミックレンジの大きさに応じて、それぞれの解像度成分を構成する画素に割り当てるビット数を変更する。変更されたビット数の情報は、動画像の符号化データに含められる。
【選択図】図1
【解決手段】動画像を構成するピクチャに空間スケーラビリティを持たせて符号化するスケーラブル符号化において、基本解像度成分と、基本解像度成分との差分で表されるより高い解像度の成分についてそれぞれダイナミックレンジを計算する。ダイナミックレンジの大きさに応じて、それぞれの解像度成分を構成する画素に割り当てるビット数を変更する。変更されたビット数の情報は、動画像の符号化データに含められる。
【選択図】図1
Description
本発明は、動画像を符号化する画像符号化方法に関する。
ブロードバンドネットワークが急速に発展しており、高品質な動画像を利用したサービスに期待が集まっている。また、DVDなど大容量の記録媒体が利用されており、高画質の画像を楽しむユーザ層が広がっている。動画像を通信回線で伝送したり、記録媒体に蓄積するために不可欠な技術として圧縮符号化がある。動画像圧縮符号化技術の国際標準として、MPEG4の規格やH.264/AVC規格がある。また、1つのストリームで、符号量に応じて、異なる画質(例えば高画質と低画質)、異なる解像度(例えば高解像度と低解像度)、異なるフレームレート(例えば高フレームレートと低フレームレート)の画像の圧縮および伸長を実現することのできる、H.264/AVCの拡張として規格化が進められているSVC(Scalable Video Coding)のような次世代画像圧縮技術がある。
次世代画像圧縮技術であるSVCでは、動画像を複数の異なる解像度、フレームレート、画質で再生することができるように、空間スケーラビリティ、時間スケーラビリティ、SNRスケーラビリティなどの各種スケーラビリティを持たせて動画像を符号化する。これらのスケーラビリティを任意に組み合わせて符号化することも可能であり、SVCのスケーラビリティ機能は柔軟性に富んでいる。
また、デジタル画像信号の高能率符号化処理の1つとして、ADRC(Adaptive Dynamic Range Coding)が知られている。特許文献1には、この処理を利用する技術として、符号化処理の対象となる画像データを領域分割したブロック単位でのダイナミックレンジに応じて、量子化ビット数の切換を行うものが開示されている。
特開2003−259368号公報
SVCにおいては、空間スケール、時間スケールまたはSNRスケールの異なる複数の成分をフレーム毎に含めた符号化データが作成される。このとき、基本となるスケールを持つ基本画像と、基本画像との差分を取った差分画像が生成されるが、一般的に差分画像の方が基本画像よりもダイナミックレンジが小さくなる。しかしながら、それぞれの画像で一画素に割り当てられるビット数は同一であるため、差分画像の方が基本画像よりも相対的に多くの符号化データ量を消費しているという問題がある。
本発明はこうした状況に鑑みてなされたもので、その目的は、動画像を圧縮して符号化するときに、符号量を削減する符号化技術を提供することにある。
本発明のある態様は、画像符号化方法動画像を構成するピクチャにスケーラビリティを持たせて符号化する符号化方法において、1つのピクチャから生成されたスケールの異なる基本画像と差分画像のそれぞれについて、画像内に含まれる画素レベルのダイナミックレンジを計算し、基本画像または差分画像内の画素に割り当てられる、ダイナミックレンジの大きさに応じて異なるビット数に関する情報を、動画像の符号化データに含める。
「ピクチャ」は符号化の単位であり、その概念にはフレーム、フィールド、VOP(Video Object Plane)などを含む。
また、「スケール」とは、例えば空間解像度、フレームレートおよび画質レベルなどの動画像の再生品質のことであり、スケーラビリティを持たせて符号化することは、スケールを異ならせて動画像を符号化し、複数の再生品質レベルの符号化データを生成すること(「スケーラブル符号」という)を含む。このようにしてスケーラブル符号化された動画像は、任意の再生品質レベルを選択して復号する(スケーラブル復号という)ことができるというスケーラビリティを持つ。空間解像度を異ならせて符号化された動画像は、空間スケーラビリティを有し、フレームレートを異ならせて符号化された動画像は、時間スケーラビリティを有し、画質レベルを異ならせて符号化された動画像は、SNRスケーラビリティを有する。
「ダイナミックレンジ」とは、画素レベルの最大値と最小値の差分であることが適しているが、最大値近辺の値もしくは最小値近辺の値の差分であってもよく、最大値および最小値がダイナミックレンジの中に含まれなくてもよい。
例えば、ダイナミックレンジが比較的小さい画像においては、画素に割り当てるビット数の最大値を小さくしても、再生品質の低下に与える影響は少ないと考えられる。そこで、この態様によれば、再生品質の低下を抑えつつ、対象画像の特性に応じた効率的な符号化処理を行うことができ、符号化データの圧縮率が向上する。
この場合、ダイナミックレンジの比較的小さい画像において画素に割り当てるビット数を少なくし、これによって削減されたビット数を、ダイナミックレンジの比較的大きい画像の画素に割り当ててもよい。ダイナミックレンジの小さい画像で余分となったビット数をダイナミックレンジの大きい画像に割り当てることで、この画像を高品質化することができる。
時間的に連続する所定数のピクチャについて、前記基本画像または前記差分画像のダイナミックレンジを比較し、比較的大きいダイナミックレンジのピクチャにおいては画素に割り当てるビット数を多くし、比較的小さいダイナミックレンジのピクチャにおいては画素に割り当てるビット数を少なくしてもよい。
「時間的に連続する所定数のピクチャ」は、例えばGOP(Group of pictures)であるが、他のものでもよい。
こうすると、時間軸において基本画像または差分画像のダイナミックレンジが変動する場合に、所定数のピクチャの範囲内であるピクチャについて余分なピット数を他のピクチャに分配することで、ダイナミックレンジの比較的小さいピクチャにおける再生品質の低下を抑制しつつ、ビット数を多く割り当てられたダイナミックレンジの比較的大きいピクチャを高品質化することができる。
動画像を構成するピクチャに空間スケーラビリティを持たせて符号化する符号化方法において、基本解像度成分と、基本解像度成分との差分で表される基本解像度成分とは異なる解像度の成分についてそれぞれダイナミックレンジを計算し、それぞれの解像度成分を構成する画素に割り当てるビット数をダイナミックレンジの大きさに応じて変更してもよい。「基本解像度成分とは異なる解像度の成分」は、基本解像度成分よりも高い解像度の成分でも低い解像度の成分でもよい。これによると、各解像度成分の特性に応じて効率的な符号化処理を行うことができ、符号化データの圧縮率が向上する。
動画像を構成するピクチャからフレームレートの異なる複数の階層を求めることで時間スケーラビリティを持たせて符号化する符号化方法において、各階層の画像についてそれぞれダイナミックレンジを計算し、ダイナミックレンジの大きさに応じて各階層の画像を構成する画素に割り当てるビット数を変更してもよい。これによると、各階層の画像の特性に応じて効率的な符号化処理を行うことができ、符号化データの圧縮率が向上する。
なお、以上の構成要素の任意の組み合わせ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。
本発明によれば、スケールの異なる基本画像と差分画像それぞれのダイナミックレンジの大きさに応じて画素当たりのビット数を変更することで、符号化データのデータ量を低減することができる。
(実施の形態1)
図1は、実施の形態1に係る符号化装置100の構成図である。これらの構成は、ハードウエア的には、任意のコンピュータのCPU、メモリ、その他のLSIで実現でき、ソフトウエア的にはメモリにロードされた画像符号化機能のあるプログラムなどによって実現されるが、ここではそれらの連携によって実現される機能ブロックを描いている。したがって、これらの機能ブロックがハードウエアのみ、ソフトウエアのみ、またはそれらの組み合わせによっていろいろな形で実現できることは、当業者には理解されるところである。
図1は、実施の形態1に係る符号化装置100の構成図である。これらの構成は、ハードウエア的には、任意のコンピュータのCPU、メモリ、その他のLSIで実現でき、ソフトウエア的にはメモリにロードされた画像符号化機能のあるプログラムなどによって実現されるが、ここではそれらの連携によって実現される機能ブロックを描いている。したがって、これらの機能ブロックがハードウエアのみ、ソフトウエアのみ、またはそれらの組み合わせによっていろいろな形で実現できることは、当業者には理解されるところである。
本実施の形態の符号化装置100は、次世代画像圧縮技術であるSVC(Scalable Video Coding)に準拠して、動画像に空間(spatial)スケーラビリティ、時間(temporal)スケーラビリティ、およびSNR(signal to noise ratio)スケーラビリティの少なくとも1つを持たせて符号化する「スケーラブル符号化」を行う。
動画像の符号化には、国際標準化機関であるISO(International Organization for Standardization)/IEC(International Electrotechnical Commission)によって標準化されたMPEG(Moving Picture Experts Group)シリーズの規格(MPEG−1、MPEG−2およびMPEG−4)、電気通信に関する国際標準機関であるITU−T(International Telecommunication Union-Telecommunication Standardization Sector)によって標準化されたH.26xシリーズの規格(H.261およびH.263)、もしくは両方の標準化機関によって合同で標準化された動画像圧縮符号化標準規格であるH.262およびH.264/AVC(両機関における正式勧告名はそれぞれMPEG-4 Part 10: Advanced Video CodingとH.264)に準拠する技術が用いられる。
なお、実施の形態では、動画像の符号化の単位としてフレームを例に挙げて説明するが、符号化の単位はフィールドであってもよい。また、符号化の単位はMPEG−4におけるVOPであってもよい。
符号化装置100は、フレーム単位で動画像の入力を受け取り、動画像をスケーラブル符号化し、動画像の符号化ストリームを出力する。入力された動画フレームはフレームメモリに格納され、符号化に係る各処理部によって読み書きされる。
符号化装置100は、空間スケーラビリティを持たせて動画像を符号化するために高解像度拡張レイヤ処理ブロック110、中解像度拡張レイヤ処理ブロック120と基本レイヤ処理ブロック130を有する。基本レイヤ処理ブロック130において低解像度で動画像を圧縮符号化し、拡張レイヤ処理ブロック110、120においてそれぞれ中解像度、高解像度で動画像を圧縮符号化する。これにより、階層毎に空間解像度の異なる動画像の符号化データが生成される。
また、符号化装置100は、時間スケーラビリティを持たせて動画像を符号化するために、MCTF(Motion Compensated Temporal Filtering、動き補償時間方向フィルタ)技術を用いる。MCTF技術は、時間軸方向のサブバンド分割に動き補償を組み合わせたものであり、階層的な動き補償を行う。これにより、階層毎にフレームレートが異なる動画像の符号化データが生成される。
本実施形態では、異なる空間解像度を有する画像について、符号化の前にダイナミックレンジを計算し、そのダイナミックレンジの大小に応じて、画像に含まれる画素毎に割り当てるビット数を変更する。これによって、符号化ストリームの符号量を削減し、圧縮率を向上することができる
以下、各機能ブロックの説明をする。
画像分割部10は、入力されたフレームの領域を分割し、分割された各領域の画像データを画像縮小部12に与える。画像縮小部12は、分割された各領域の画像データを、低解像度に相当する大きさと、中解像度画像に相当する大きさに縮小する。そして、低解像度に変換された各領域の画像データを基本レイヤ処理ブロック130に、中解像度に変換された各領域の画像データを中解像度拡張レイヤ処理ブロック120に与える。
画像分割部10は、入力されたフレームの領域を分割し、分割された各領域の画像データを画像縮小部12に与える。画像縮小部12は、分割された各領域の画像データを、低解像度に相当する大きさと、中解像度画像に相当する大きさに縮小する。そして、低解像度に変換された各領域の画像データを基本レイヤ処理ブロック130に、中解像度に変換された各領域の画像データを中解像度拡張レイヤ処理ブロック120に与える。
基本レイヤ処理ブロック130は、画像縮小部12により低解像度に変換された各領域の画像データを圧縮符号化して多重化部18に出力する。中解像度拡張レイヤ処理ブロック120は、画像縮小部12により中解像度に変換された各領域の画像データを圧縮符号化して多重化部18に出力する。
また、空間スケーラブル符号化を実行するために、画像分割部10は、入力画像の画像データを解像度を落とすことなく、高解像度拡張レイヤ処理ブロック110に与える。高解像度拡張レイヤ処理ブロック110は、高解像度の画像データを圧縮符号化して多重化部18に出力する。
基本レイヤ処理ブロック130の各構成を説明する。MCTF部20cは、MCTF技術にしたがった動き補償時間フィルタリングを実施する。MCTF部20cは、動画像フレームから動きベクトルを求め、動きベクトルを用いて時間フィルタリングを実施する。時間フィルタリングは、ハール(Haar)ウェーブレット変換を用いて実施され、この結果、各階層に高域フレームと低域フレームとを含むフレームレートの異なる複数の階層に分解される。分解された高域フレームと低域フレームは階層毎にメモリに保持され、動きベクトルも階層毎にメモリに保持される。
MCTF部20cにおける処理が終了すると、すべての階層の高域フレームと最下位階層の低域フレームは、予測部24cに送られ、すべての階層の動きベクトルは、動き符号化部22cに送られる。
予測部24cは、画像フレームのフレーム内予測を行い、フレーム内予測誤差画像をダイナミックレンジ計算部34cに与える。ダイナミックレンジ計算部34cは、フレーム内予測誤差画像のダイナミックレンジを計算する。
ここで、ダイナミックレンジとは、画像に含まれる複数の画素の持つ画素値の最大値と最小値の差分によって規定される。ここでいう画素値とは、例えば8ビットの輝度レベルやRGB等の色信号レベルである。計算されたダイナミックレンジの値は、ビット数指定部38cに与えられ、フレーム内予測誤差画像は割り当てビット数変更部36cに与えられる。
ビット数指定部38cは、ダイナミックレンジの大きさにしたがって、画像内の画素に割り当てるビット数を変更する。ダイナミックレンジとビット数との対応関係は、テーブル40cに予め格納されている。また、ビット数指定部38cは、画素当たりのビット数の情報を多重化部18に与える。
一般に、ダイナミックレンジの小さい画像では、上位ビット成分を落としても画質に与える影響は小さいと考えられる。そこで、ビット数指定部38cはダイナミックレンジが所定の閾値以下の場合には、画素値の上位ビットを落とすように割り当てビット数変更部36cに指示する。これによって、符号化前の画像データ量が小さくなる。一例では、ダイナミックレンジが所定の閾値以下の場合は、8ビットの輝度レベルを6ビットにする。
ここで、上位ビットを落とすには以下の方法が考えられる。
方法1.各画素値から、ビット数変更の対象となる画像の中での最小値を減じた上で、上位ビットを落とす。
方法2.各画素値から、ビット数変更の対象となる画像の中での中間値を減じた上で、上位ビットを落とす。
方法3.特別の処理をせず単に上位ビットを落とす。
ビット数指定部38cは、上記のうちいずれの方法を用いて画素値の上位ビットを落とすかについても割り当てビット数変更部36cに指示することが好ましい。低解像度画像については、割り当てビット数変更部36cは、上記のうち方法1または方法2を用いることが好ましい。後述する中解像度拡張レイヤ処理ブロック120または高解像度拡張レイヤ処理ブロック110においては、割り当てビット数変更部36b、36aは、中解像度画像または高解像度画像について上記のうち方法3を用いることが好ましい。
方法1.各画素値から、ビット数変更の対象となる画像の中での最小値を減じた上で、上位ビットを落とす。
方法2.各画素値から、ビット数変更の対象となる画像の中での中間値を減じた上で、上位ビットを落とす。
方法3.特別の処理をせず単に上位ビットを落とす。
ビット数指定部38cは、上記のうちいずれの方法を用いて画素値の上位ビットを落とすかについても割り当てビット数変更部36cに指示することが好ましい。低解像度画像については、割り当てビット数変更部36cは、上記のうち方法1または方法2を用いることが好ましい。後述する中解像度拡張レイヤ処理ブロック120または高解像度拡張レイヤ処理ブロック110においては、割り当てビット数変更部36b、36aは、中解像度画像または高解像度画像について上記のうち方法3を用いることが好ましい。
予め準備された複数のビット数変更方法の中から選択する場合、ビット数指定部38cは、画素当たりのビット数とともに、用いた方法に関する情報を多重化部18に与える。上記1または2の方法を用いる場合、ビット数指定部38cは、最小値または中間値の情報も多重化部18に与える。
割り当てビット数変更部36cは、フレーム内予測誤差画像の各画素のビット数を、ビット数指定部38cから指令されたビット数に変換した画像を作成し、この画像をDCT/量子化部28cに与える。
DCT/量子化部28cは、割り当てビット数変更部36cから供給された、最大ビット数が変換された画像を離散コサイン変換(DCT)する。さらに、得られたDCT係数を量子化し、可変長符号化部30cに与える。
可変長符号化部30cは、DCT/量子化部28cから差分画像の量子化されたDCT係数を受け取り、DCT係数を可変長符号化し、多重化部18に与える。
動き符号化部22cは、MCTF部20cから与えられた動きベクトル情報を符号化し、多重化部18に与える。
入力画像の空間スケーラブル符号化を行うために、基本レイヤ処理ブロック130の動き符号化部22cおよび予測部24cは、それぞれ基本レイヤにおける各フレームの動きベクトルとフレーム内予測誤差画像を中解像度拡張レイヤ処理ブロック120の動き符号化部22bおよび内挿処理部32bに与える。
次に、中解像度拡張レイヤ処理ブロック120の各構成を説明する。中解像度拡張レイヤ処理ブロック120は、画像縮小部12から中解像度に縮小された画像データを受け取り、符号化する。
中解像度拡張レイヤ処理ブロック120のMCTF部20bは、基本レイヤ処理ブロック130のMCTF部20cと同じ動き補償時間フィルタリングを中解像度の画像データに施し、動きベクトル情報を動き符号化部22bに、符号化データを予測部24bに与える。なお、フレームレートを固定にするなどのため時間スケーラビリティを持たせる必要が無い場合、中解像度拡張レイヤ処理ブロック120にMCTF部20bを備える必要はない。
中解像度拡張レイヤ処理ブロック120の動き符号化部22bは、基本レイヤ処理ブロック130の動き符号化部22bから基本レイヤの低解像度画像の動きベクトルの情報を受け取る。中解像度拡張レイヤ処理ブロック120の動き符号化部22bは、拡張レイヤの中解像度画像の動きベクトル情報と基本レイヤの低解像度画像の動きベクトル情報との間で差分符号化を行い、階層間で差分符号化された動きベクトル情報を多重化部18に与える。
基本レイヤと拡張レイヤ間で動きベクトル情報を差分符号化する際、基本レイヤにおける動きベクトルを拡張レイヤの解像度に合うように拡大する。例えば、基本レイヤの低解像度画像の高さおよび幅がそれぞれ、拡張レイヤの中解像度画像の高さおよび幅の1/2である場合、基本レイヤの低解像度画像について得られた動きベクトルを高さ方向、幅方向にそれぞれ2倍する。中解像度拡張レイヤ処理ブロック120の動き符号化部22bは、このようにして中解像度拡張レイヤの解像度に合わせて拡大された基本レイヤの動きベクトルと、中解像度拡張レイヤの動きベクトルとの間で差分を取って符号化する。このように階層間で動きベクトル情報を差分符号化することにより、中解像度拡張レイヤの動きベクトル情報をそのまま符号化するよりは、動きベクトル情報の符号量を減らすことができる。
内挿処理部32bは、基本レイヤ処理ブロック130の予測部24cから基本レイヤの予測誤差画像を受け取り、中解像度拡張レイヤの解像度に合わせるために画素を内挿する処理を行う。内挿処理部32bは、内挿処理が施された基本レイヤの予測誤差画像を中解像度拡張レイヤ処理ブロック120の予測部24bに与える。
中解像度拡張レイヤ処理ブロック120の予測部24bは、MCTF部20bから与えられた画像フレームをフレーム内予測符号化する。さらに、予測部24bは、中解像度拡張レイヤの予測誤差画像と、中解像度拡張レイヤの解像度に合うように内挿された基本レイヤの予測誤差画像との間で差分符号化を行う。階層間で予測誤差画像の差分符号化を行うことにより、符号量を減らすことができる。
中解像度拡張レイヤ処理ブロック120のダイナミックレンジ計算部34b、割り当てビット数変更部36b、ビット数指定部38b、テーブル40b、DCT/量子化部28b、および可変長符号化部30bによる処理は、基本レイヤ処理ブロック130のダイナミックレンジ計算部34c、割り当てビット数変更部36c、ビット数指定部38c、テーブル40c、DCT/量子化部28c、および可変長符号化部30cによる処理と同じであり、拡張レイヤにおいて予測誤差画像が圧縮符号化され、多重化部18に渡される。
入力画像の空間スケーラブル符号化を行うために、中解像度拡張レイヤ処理ブロック120の動き符号化部22bおよび予測部24bは、それぞれ中解像度拡張レイヤにおける各フレームの動きベクトルとフレーム内予測誤差画像を高解像度拡張レイヤ処理ブロック110の動き符号化部22aおよび内挿処理部32aに与える。
次に、高解像度拡張レイヤ処理ブロック110は、画像縮小部12によって縮小されていない高解像度画像の画像データを画像分割部10から受け取り、符号化する。高解像度拡張レイヤ処理ブロック110の各構成は、基本的に中解像度拡張レイヤ処理ブロック120と同様である。
多重化部18は、基本レイヤ処理ブロック130から与えられる基本レイヤにおける低解像度成分の符号化データと、中解像度拡張レイヤ処理ブロック120から与えられる中解像度成分の符号化データと、高解像度拡張レイヤ処理ブロック110から与えられる高解像度成分の符号化データとを1つにまとめた符号化ストリームを生成して出力する。各レイヤの符号化データには、画像データと動きベクトル情報が含まれるほか、各レイヤのビット数指定部38で決定された、画素当たりのビット数およびビット数変更方法の情報も含まれる。また、画像内での画素値の最小値または中間値を用いて画素値を変更した場合は、最小値または中間値の情報も符号化データに含められる。
なお、画像分割部10でフレームから分割された領域毎に、画素当たりのビット数を変更することも可能である。この場合、画素当たりのビット数の情報は、それぞれの領域に関するパラメータの中に格納してもよい。
なお、画像分割部10でフレームから分割された領域毎に、画素当たりのビット数を変更することも可能である。この場合、画素当たりのビット数の情報は、それぞれの領域に関するパラメータの中に格納してもよい。
本実施形態では、画素当たりの割り当てビット数の変更は入力されたフレーム毎に行われるため、画素の割り当てビット数の情報はフレーム毎に持たせる必要がある。但し、すべての入力画像で画素に割り当てるビット数を統一する場合は、先頭のフレームのみにこの情報を持たせてもよい。
上記では、基本レイヤ処理ブロック130、中解像度拡張レイヤ処理ブロック120、高解像度拡張レイヤ処理ブロック110とを別々に設け、それぞれ基本レイヤの低解像度画像、拡張レイヤの中解像度画像、高解像度画像を符号化する構成を説明した。しかしながら、すべてのレイヤの処理ブロックで共通する構成要素は共有してもよい。例えば、基本レイヤ処理ブロック130の構成だけを設け、基本レイヤ処理ブロック130において基本レイヤの符号化を行い、基本レイヤにおける予測誤差画像と動きベクトル情報をメモリに保持する。次に、メモリに保持された基本レイヤの予測誤差画像と動きベクトル情報とを利用して、中解像度拡張レイヤおよび高解像度拡張レイヤの符号化処理を基本レイヤ処理ブロック130において実行する。このように基本レイヤにおける符号化処理の構成を拡張レイヤに流用すれば、符号化装置100の回路規模を小さくすることができる。
上記の説明では、空間スケーラビリティの階層が3つである場合を説明したが、階層が2つでも、またはそれ以上の空間スケーラビリティの階層を持たせてもよい。階層を4以上とする場合は、最下位のレイヤに対しては基本レイヤ処理ブロックを設け、それ以外のレイヤに対してはレイヤ毎に拡張レイヤ処理ブロックの構成を設け、下位層に行くほど低解像度の画像を符号化するようにし、下位層から上位層へ予測誤差画像と動きベクトル情報を送り、各レイヤで差分符号化を行うように構成する。あるいは、基本レイヤ処理ブロックだけを設けて、基本レイヤ処理ブロックをレイヤ毎に繰り返し利用することにより各レイヤの符号化を逐次的に行うように構成してもよい。
図2は、符号化データのデータ構造を説明する図である。符号化データは、低解像度、中解像度、高解像度の3つのレイヤの符号化データを持つ。画素当たりのビット数、ビット数を変更する際に用いた方法、およびこれに付随する画素値の最小値または中間値の情報は、低解像度、中解像度、高解像度の各レイヤの符号化データのヘッダ部にそれぞれ格納される。復号装置は、各レイヤのヘッダ部に格納された情報を参照して、各画像の復号を実行する。低解像度の符号化データのみを用いて復号すると、低解像度の画像が再生される。低解像度の符号化データと中解像度の符号化データを用いて復号すると、中解像度の画像が再生される。低解像度の符号化データ、中解像度の符号化データ、高解像度の符号化データのすべてを用いて復号すると、高解像度の画像が再生される。
図3は、実施の形態1における符号化方法を説明するフローチャートである。まず、それぞれのレイヤにおいて、低解像度、中解像度、または高解像度の画像を受け取る(S10)。続いて、MCTF処理、フレーム内予測符号化処理を行った後(S12)、ダイナミックレンジ計算部34において、画像内に含まれる画素値のダイナミックレンジを計算する(S14)。ビット数指定部38は、ダイナミックレンジの大きさにしたがって、画像内に含まれる画素に割り当てるビット数を決定し、割り当てビット数変更部36に指令する(S16)。画素当たりのビット数、ビット変更に用いた方法などに関する情報は、多重化部18に送られる。割り当てビット数変更部36は、フレーム内予測画像の各画素値のビット数が割り当てビット数になるように、各画素の上位ビットを落とした画像を作成する(S18)。このビット数の情報は符号化ストリームに含められ、復号の際に利用される。作成された画像は、DCT、量子化、可変長符号化を経て、低解像度成分、中解像度成分、高解像度成分の符号が符号化ストリームに多重化される(S20)。
以上説明したように、本実施形態によれば、空間スケーラブル符号化データを作成する際、符号化の前に各解像度成分のダイナミックレンジを計算し、ダイナミックレンジの大きさに応じて画素に割り当てるビット数を変更するようにした。本実施形態のような空間スケーラブル符号化では、中解像度成分および高解像度成分は低解像度成分との差分として表されているため、低解像度成分のダイナミックレンジと比較して、中解像度成分および高解像度成分のダイナミックレンジは低くなる。ダイナミックレンジの低い画像では、画像内に含まれる画素の上位ビットを落としても画質に与える影響は小さいと考えられる。これによって、中解像度成分および高解像度成分に割り当てるビット数を全体として少なくすることができ、結果として符号化データの圧縮率を向上することができる。
特に、中解像度成分および高解像度成分は、低解像度成分との差分で表されているため、0を中心として正負方向に分散した画素値を持つことが多い。したがって、割り当てビット数変更部において単純に上位ビットを落とす方法(上述した方法3)により、データ量を大きく削減できることが期待できる。
特に、中解像度成分および高解像度成分は、低解像度成分との差分で表されているため、0を中心として正負方向に分散した画素値を持つことが多い。したがって、割り当てビット数変更部において単純に上位ビットを落とす方法(上述した方法3)により、データ量を大きく削減できることが期待できる。
上述の実施形態では、ダイナミックレンジが所定の閾値以下であったとき、画素に割り当てるビット数の上限を定めることによって、全体のビット数を削減することを述べたが、ダイナミックレンジが閾値より大きいとき、画素に割り当てるビット数を増やすようにしてもよい。こうすることによって、より多くのビット数が割り当てられた画像については高画質となることが期待される。また、1フレーム内で、例えば中解像度成分について削減されたビット数を高解像度成分の画素に割り当てるようにしてもよい。こうすれば、フレーム全体のデータ量を同程度にしつつ、高解像度成分については画質をさらに高めることができる。
上述の実施形態では、フレーム内予測を実行した後の画像についてダイナミックレンジを計算しているが、フレーム内予測前の画像についてダイナミックレンジを計算し、画素に割り当てるビット数を変更するようにしてもよい。
また、時間的に連続するフレームを観察したとき、例えば同じ低解像度成分のみを比較しても、それぞれダイナミックレンジの大きさは異なると考えられる。図4は、1GOP内の各フレームの低解像度成分のダイナミックレンジの変動の一例を示す。このような場合、図中に点線で示すようなダイナミックレンジの閾値を設定しておき、ダイナミックレンジがこの閾値を越えるフレームについては、画素に割り当てるビット数を増加し、この閾値以下のフレームについては、画素に割り当てるビット数を少なくしてもよい。こうすることによって、ダイナミックレンジの小さいフレームについてはデータ量を削減しつつ、ダイナミックレンジの大きいフレームについては画質の向上が期待できる。
(実施の形態2)
実施の形態1では、空間スケーラビリティを持たせた画像の符号化において、ダイナミックレンジを利用して画像に割り当てるビット数を変更することを述べたが、時間スケーラビリティを持たせた画像の符号化においても同様の処理をすることができる。具体的には、上述したMCTF処理において生成される各階層の高域フレームと低域フレームについてダイナミックレンジを計算する。
実施の形態1では、空間スケーラビリティを持たせた画像の符号化において、ダイナミックレンジを利用して画像に割り当てるビット数を変更することを述べたが、時間スケーラビリティを持たせた画像の符号化においても同様の処理をすることができる。具体的には、上述したMCTF処理において生成される各階層の高域フレームと低域フレームについてダイナミックレンジを計算する。
図5は、図1で述べたMCTF部20の詳細な構成を示すブロック図である。MCTF実行部42は、画像保持部46に格納されているフレームから動きベクトルを求め、動きベクトルを用いて時間フィルタリングを実施する。この結果、各階層に高域フレームHと低域フレームLとを含むフレームレートの異なる複数の階層に分解される。分解された高域フレームと低域フレームは、階層毎に画像保持部46の専用の領域に格納され、動きベクトルも階層毎に動きベクトル保持部44の専用の領域に格納される。
図6は、GOPが8フレームで構成される場合に、各階層で出力される画像と動きベクトルを示す図である。図6では、階層nの高域フレームをHn、低域フレームをLn、動きベクトルをMVnと表記しており、この例では8フレームが3つの階層に分解される。いる。高域フレームHはフレーム間の差分であるから、符号化時のデータ量は低下する。また、図6をみれば分かるように、一回の時間フィルタリング処理を経る毎に低域フレームL数は1/2に減少するが、低域フレームLは上位階層のフレーム間の平均値であるから、画質および解像度は低下していないフレーム列が得られる。そして、最下位階層の1つの低域フレームとより上位の各階層内の高域フレームおよびベクトル情報を符号化することにより、フレームレートの異なる動画像を1つのビットストリームで送信することができる。
図5に戻り、MCTF実行部42における処理が終了すると、画像保持部46内のすべての階層の高域フレームと最下位階層の低域フレームがダイナミックレンジ計算部48に送られる。ダイナミックレンジ計算部48は、高域フレームと低域フレームのそれぞれについて、画像に含まれる複数の画素の持つ画素値の最大値と最小値の差分であるダイナミックレンジを計算し、その値をビット数指定部52に送る。
ビット数指定部52は、ダイナミックレンジの大きさにしたがって、高域フレームまたは低域フレームに含まれる画素に割り当てるビット数を調節する。ダイナミックレンジとビット数との対応関係は、テーブル54に予め格納されている。
実施の形態1と同様に、ビット数指定部52は、上記の方法1〜3のうちいずれの方法を用いて画素値の上位ビットを落とすかについても割り当てビット数変更部50に指示することが好ましい。低域フレームについては、割り当てビット数変更部50は、上記のうち方法1または方法2を用いることが好ましい。
ビット数指定部52は、画素当たりのビット数の情報を多重化部18に与える。予め準備された複数のビット数変更方法の中から選択する場合、ビット数指定部52は、画素当たりのビット数とともに、用いた方法に関する情報を多重化部18に与える。上記1または2の方法を用いる場合、ビット数指定部52は、最小値または中間値の情報も多重化部18に与える。
実施の形態1と同様に、ビット数指定部52は、上記の方法1〜3のうちいずれの方法を用いて画素値の上位ビットを落とすかについても割り当てビット数変更部50に指示することが好ましい。低域フレームについては、割り当てビット数変更部50は、上記のうち方法1または方法2を用いることが好ましい。
ビット数指定部52は、画素当たりのビット数の情報を多重化部18に与える。予め準備された複数のビット数変更方法の中から選択する場合、ビット数指定部52は、画素当たりのビット数とともに、用いた方法に関する情報を多重化部18に与える。上記1または2の方法を用いる場合、ビット数指定部52は、最小値または中間値の情報も多重化部18に与える。
割り当てビット数変更部50は、高域フレームまたは低域フレームの各画素のビット数を、ビット数指定部52から指令されたビット数に変換した画像を作成し、この画像を各レイヤのDCT/量子化部28cに与える。以降の処理は、実施の形態1で述べたのと同様である。
符号化ストリームを受け取った復号装置は、下位の階層から順に復号処理を実行する。下位階層のみを復号すれば低フレームレートの動画像が得られ、上位の階層まで復号するほど、フレームレートが増加した動画像が得られる。このように、MCTF技術にしたがった時間フィルタリングによって、時間的スケーラビリティを実現することができる。実施の形態1と同様に、復号装置は、各階層の符号化データのヘッダ部分に格納されている、画素に割り当てられたビット数、ビット数を変更する際に用いた方法、およびこれに付随する画素値の最小値または中間値の情報を参照して、各画像の復号を実行する。
なお、画像分割部10でフレームから分割された領域毎に、画素当たりのビット数を変更して符号化が実施された場合、復号装置は、それぞれの領域に関するパラメータの中に格納されている画素当たりのビット数の情報を参照して、各領域の復号を実行する。
なお、画像分割部10でフレームから分割された領域毎に、画素当たりのビット数を変更して符号化が実施された場合、復号装置は、それぞれの領域に関するパラメータの中に格納されている画素当たりのビット数の情報を参照して、各領域の復号を実行する。
図7は、実施の形態2における符号化方法を説明するフローチャートである。まず、それぞれのレイヤにおいてMCTF処理を実行し、フレームレートの異なる各階層の画像を格納する(S30)。ダイナミックレンジ計算部48は、高域フレームまたは低域フレームに含まれる画素値のダイナミックレンジを計算する(S32)。ビット数指定部52は、ダイナミックレンジの大きさにしたがって、それぞれのフレーム内に含まれる画素に割り当てるビット数を決定し、割り当てビット数変更部50に指令する(S34)。画素当たりのビット数、ビット変更に用いた方法などに関する情報は、多重化部18に送られる。割り当てビット数変更部50は、高域フレームまたは低域フレームに含まれる画素値のビット数が割り当てビット数になるように、各画素の上位ビットを落とした画像を作成する(S36)。このビット数の情報は符号化ストリームに含められ、復号の際に利用される。作成された画像は、DCT、量子化、可変長符号化を経て、各階層の画像の符号が符号化ストリームに多重化される(S36)。
以上説明したように、本実施形態によれば、時間スケーラブル符号化データを作成する際、符号化の前にフレームレートの異なる各階層の画像についてダイナミックレンジを計算し、ダイナミックレンジの大きさに応じて画素に割り当てるビット数を変更するようにした。時間スケーラブル符号化では、高域フレームでは低域フレームと比べてダイナミックレンジが低くなり、画像内に含まれる画素の上位ビットを落としても画質に与える影響は小さいと考えられる。これによって、各階層の画像に割り当てる全体としてのビット数を少なくすることができ、結果として符号化データの圧縮率を向上することができる。
特に、高域フレームは低域フレームとの差分で表されているため、0を中心として正負方向に分散した画素値を持つことが多い。したがって、割り当てビット数変更部において単純に上位ビットを落とす方法(上述した方法3)により、データ量を大きく削減できることが期待できる。
特に、高域フレームは低域フレームとの差分で表されているため、0を中心として正負方向に分散した画素値を持つことが多い。したがって、割り当てビット数変更部において単純に上位ビットを落とす方法(上述した方法3)により、データ量を大きく削減できることが期待できる。
以上、本発明を実施の形態をもとに説明した。実施の形態は例示であり、それらの各構成要素や各処理プロセスの組み合わせにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。
本発明は、階層毎に画質の異なるSNRスケーラビリティを持たせた符号化データを作成する際にも適用可能である。具体的には、低画質データと中画質データの差分である第1の差分データ、および中画質データと高画質データの差分である第2の差分データについて、それぞれダイナミックレンジを計算する。ダイナミックレンジの大きさに応じて、画素に割り当てるビット数を変更したのち、DCT、量子化、可変長符号化を実行する。画質を異ならせた符号化は、量子化の際に、異なる量子化テーブルを用いて、適用される量子化ステップを小さくしたり、量子化により切り捨てる下位ビット数を減らすなどして実現できる。
上述では、空間スケーラビリティ、時間スケーラビリティ、およびSNRスケーラビリティのそれぞれについて、基本画像と差分画像のダイナミックレンジに応じて画素に割り当てるビット数を変えることを述べたが、これらは任意に組み合わせることができる。
10 画像分割部、 12 画像縮小部、 18 多重化部、 20 MCTF部、 22 動き符号化部、 24 予測部、 28 DCT/量子化部、 30 可変長符号化部、 32 内挿処理部、 34 ダイナミックレンジ計算部、 36 割り当てビット数変更部、 38 ビット数指定部、 100 符号化装置、 110 高解像度拡張レイヤ処理ブロック、 120 中解像度拡張レイヤ処理ブロック、 130 基本レイヤ処理ブロック。
Claims (5)
- 動画像を構成するピクチャにスケーラビリティを持たせて符号化する符号化方法において、1つのピクチャから生成されたスケールの異なる基本画像と差分画像のそれぞれについて、画像内に含まれる画素レベルのダイナミックレンジを計算し、基本画像または差分画像内の画素に割り当てられる、ダイナミックレンジの大きさに応じて異なるビット数に関する情報を、動画像の符号化データに含めることを特徴とする符号化方法。
- ダイナミックレンジの比較的小さい画像において画素に割り当てるビット数を少なくし、これによって削減されたビット数を、ダイナミックレンジの比較的大きい画像の画素に割り当てることを特徴とする請求項1に記載の符号化方法。
- 時間的に連続する所定数のピクチャについて、前記基本画像または前記差分画像のダイナミックレンジを比較し、比較的大きいダイナミックレンジのピクチャにおいては画素に割り当てるビット数を多くし、比較的小さいダイナミックレンジのピクチャにおいては画素に割り当てるビット数を少なくすることを特徴とする請求項1に記載の符号化方法。
- 動画像を構成するピクチャに空間スケーラビリティを持たせて符号化する符号化方法において、基本解像度成分と、基本解像度成分との差分で表される基本解像度成分とは異なる解像度の成分についてそれぞれダイナミックレンジを計算し、それぞれの解像度成分を構成する画素に割り当てるビット数をダイナミックレンジの大きさに応じて変更することを特徴とする符号化方法。
- 動画像を構成するピクチャからフレームレートの異なる複数の階層を求めることで時間スケーラビリティを持たせて符号化する符号化方法において、
各階層の画像についてそれぞれダイナミックレンジを計算し、ダイナミックレンジの大きさに応じて各階層の画像を構成する画素に割り当てるビット数を変更することを特徴とする符号化方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006051686A JP2007235299A (ja) | 2006-02-28 | 2006-02-28 | 画像符号化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006051686A JP2007235299A (ja) | 2006-02-28 | 2006-02-28 | 画像符号化方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007235299A true JP2007235299A (ja) | 2007-09-13 |
Family
ID=38555477
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006051686A Pending JP2007235299A (ja) | 2006-02-28 | 2006-02-28 | 画像符号化方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007235299A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009130931A (ja) * | 2007-11-19 | 2009-06-11 | Samsung Electronics Co Ltd | 映像の解像度の調整を通じて動画を効率的に符号化/復号化する方法及び装置 |
JP2014120998A (ja) * | 2012-12-18 | 2014-06-30 | Nippon Hoso Kyokai <Nhk> | 符号化装置およびそのプログラム、復号装置およびそのプログラム、ならびに、映像処理システム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06121295A (ja) * | 1992-10-05 | 1994-04-28 | Sony Corp | 高能率符号化装置 |
JPH07107467A (ja) * | 1993-09-30 | 1995-04-21 | Sony Corp | 画像符号化装置 |
JP2004336254A (ja) * | 2003-05-02 | 2004-11-25 | Sony Corp | 画像符号化装置及び方法 |
-
2006
- 2006-02-28 JP JP2006051686A patent/JP2007235299A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06121295A (ja) * | 1992-10-05 | 1994-04-28 | Sony Corp | 高能率符号化装置 |
JPH07107467A (ja) * | 1993-09-30 | 1995-04-21 | Sony Corp | 画像符号化装置 |
JP2004336254A (ja) * | 2003-05-02 | 2004-11-25 | Sony Corp | 画像符号化装置及び方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009130931A (ja) * | 2007-11-19 | 2009-06-11 | Samsung Electronics Co Ltd | 映像の解像度の調整を通じて動画を効率的に符号化/復号化する方法及び装置 |
JP2014120998A (ja) * | 2012-12-18 | 2014-06-30 | Nippon Hoso Kyokai <Nhk> | 符号化装置およびそのプログラム、復号装置およびそのプログラム、ならびに、映像処理システム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7899115B2 (en) | Method for scalably encoding and decoding video signal | |
Puri et al. | Video coding using the H. 264/MPEG-4 AVC compression standard | |
US8532187B2 (en) | Method and apparatus for scalably encoding/decoding video signal | |
US8085847B2 (en) | Method for compressing/decompressing motion vectors of unsynchronized picture and apparatus using the same | |
US20070009039A1 (en) | Video encoding and decoding methods and apparatuses | |
RU2313190C2 (ru) | Способ и устройство для генерации масштабируемого кодированного видеосигнала из немасштабируемого кодированного видеосигнала | |
US8396311B2 (en) | Image encoding apparatus, image encoding method, and image encoding program | |
US20110310959A1 (en) | Method and apparatus for predecoding and decoding bitstream including base layer | |
US20060209961A1 (en) | Video encoding/decoding method and apparatus using motion prediction between temporal levels | |
JP2007174568A (ja) | 符号化方法 | |
JP2004520770A (ja) | Fgsエンハンスメント層に対しアクティビティをベースとする周波数重み付けをする方法及びシステム | |
US20160127728A1 (en) | Video compression apparatus, video playback apparatus and video delivery system | |
KR20060063614A (ko) | 영상 신호의 스케일러블 인코딩 및 디코딩 방법 | |
KR20070092179A (ko) | 스무딩 예측을 이용한 다계층 기반의 비디오 인코딩 방법,디코딩 방법, 비디오 인코더 및 비디오 디코더 | |
KR20060135992A (ko) | 다계층 기반의 가중 예측을 이용한 비디오 코딩 방법 및장치 | |
US20140247890A1 (en) | Encoding device, encoding method, decoding device, and decoding method | |
JP2007081720A (ja) | 符号化方法 | |
JP2007266749A (ja) | 符号化方法 | |
JP2007235314A (ja) | 符号化方法 | |
KR100714695B1 (ko) | 픽쳐 드롭 및 합성을 통하여 레이트 컨트롤을 수행하는비디오 코딩 방법, 그 방법을 이용한 비디오 인코더, 및트랜스코더 | |
JP2007174569A (ja) | 符号化方法 | |
KR100878824B1 (ko) | 스케일러블 비디오 신호 인코딩 및 디코딩 방법 | |
JP4660408B2 (ja) | 符号化方法 | |
KR20060063619A (ko) | 영상 신호의 인코딩 및 디코딩 방법 | |
JP2007266750A (ja) | 符号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090210 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101013 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101019 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110301 |