JP4100317B2 - 画像符号化装置およびその量子化制御方法 - Google Patents

画像符号化装置およびその量子化制御方法 Download PDF

Info

Publication number
JP4100317B2
JP4100317B2 JP2003339142A JP2003339142A JP4100317B2 JP 4100317 B2 JP4100317 B2 JP 4100317B2 JP 2003339142 A JP2003339142 A JP 2003339142A JP 2003339142 A JP2003339142 A JP 2003339142A JP 4100317 B2 JP4100317 B2 JP 4100317B2
Authority
JP
Japan
Prior art keywords
quantization information
quantization
information
block
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003339142A
Other languages
English (en)
Other versions
JP2005109778A (ja
Inventor
潤 粟野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2003339142A priority Critical patent/JP4100317B2/ja
Priority to US10/955,794 priority patent/US7606436B2/en
Publication of JP2005109778A publication Critical patent/JP2005109778A/ja
Application granted granted Critical
Publication of JP4100317B2 publication Critical patent/JP4100317B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は画像を複数ブロックに分割して符号化処理を行う画像符号化装置に係り、特にブロックごとの量子化情報を決定する量子化制御方法に関する。
MPEG(Moving Picture Experts Group)符号化方式における符号化制御方法はTM5(Test Model5)に示されたものが広く知られており、MPEG符号化装置やプログラムを構成する際のベースになるものとして一般に利用されている。周知のように、MPEG方式では、画像を直交変換の一種である離散コサイン変換(DCT)によりDCT係数に変換し、変換されたDCT係数を量子化スケール(以下、「Qスケール」という。)で除算して丸めることにより量子化し、量子化されたDCT係数を可変長符号化(VLC)により順次符号を割り当ててビットストリームを構成する。こうして得られた画像情報の符号化ストリームは、動きベクトルやQスケールなどの各種情報を含むヘッダ情報と共に、目標ビットレートに従ったレートで出力される。
DCT係数を量子化するために用いられるQスケールは、通常、量子化制御部により制御される。量子化制御は、1)発生符合量の目標符号量への追従、および、2)画質劣化の抑制、という2つの目的で行なわれる。発生符合量の目標符号量への追従は、実際の発生符号量と目標符号量との誤差に基づき、この誤差を縮小するように基本Qスケールを算出することで達成される。画質劣化の抑制は、基本Qスケールに対して、画像の複雑さを示す係数を用いてモジュレーションを行うことで達成される。このモジュレーションは、絵柄が複雑な箇所では劣化が目立ち難く、逆に平坦な箇所では劣化は目立ち易いという人間の視覚特性を利用したものである。たとえば特開2001−025008号公報には、画像の複雑度および目標符号量に応じて量子化制御を行う可変レート動画像符号化装置が開示されている。
Test Model 5,Draft Revision 2 特開2001−025008号公報(明細書段落0026〜0028、図1参照)
上述したように、MPEGにより符号化されたストリームには、画像情報以外に各種フラグ、Qスケールおよび動きベクトルといったヘッダ情報が含まれるが、このヘッダ情報は量子化により圧縮することができない。このことは、符号化する画像の解像度やピクチャレートに見合った十分なビットレートで符号化する場合には、ヘッダ情報以外の画像情報にも十分な符号量を割り当てることができるために問題とはならない。
しかしながら、目標ビットレートが低くなるに従い全符号量に占めるヘッダ情報の割合が大きくなり、画像情報に十分な符号量を割り当てることができなくなる。Qスケールや動きベクトル情報はマクロブロック(MB)毎に設定されるため、MB数が多い高解像度の画像ほど画像情報に十分な符号量を割り当てることができなくなり、画質劣化が顕著になる。地上デジタル放送では、解像度が1920×1080や1440×1080のHDTV(High Definition Television)を12Mpbsから16Mbpsのビットレートで符号化するが、この符号化条件でまさに前記画質劣化の問題が生じる。
そこで、本発明は、高解像度の画像を低ビットレートで符号化する際の画質劣化を抑制することができる画像符号化装置およびその量子化制御方法を提供することを目的とする。
MPEGでは、符号化しようとしているマクロブロック(MB)のQスケールが直前に符号化されたMBのQスケールと等しい値である場合には、現MBのQスケールを示す5ビットのQSC(Quantizer Scale Code)をストリーム中から省略できる(ISO/IEC標準番号13818−2(1996)の6.3.16項「quaitser_scale_code」、6.3.17.1項「macroblock_quant」および6.2.5項を参照)。
本発明は、このような符号化方式の特徴を利用することで、上記課題を解決しようとするものである。すなわち、本発明によれば、画像を複数のブロックに分解して符号化処理を行う画像符号化装置において、ブロックごとに量子化情報に従って量子化を行う量子化手段と、少なくとも前記符号化処理により発生する発生符号量に基づいて、ブロックごとに第1量子化情報を生成する量子化情報生成手段と、直前のブロックの量子化情報と現在処理中のブロックの第1量子化情報との差が、設定された範囲内であれば前記直前のブロックの量子化情報を前記第2量子化情報として選択し、前記設定された範囲以上であれば前記第1量子化情報を前記第2量子化情報として選択することで前記第1量子化情報を前記設定された範囲内で丸めて前記第2量子化情報を生成する丸め制御手段と、を有し、前記第2量子化情報を前記量子化情報として使用することを特徴とする。
本発明の第1実施例として、前記丸め制御手段は、直前のブロックの量子化情報を格納する格納手段と、前記直前のブロックの量子化情報と現在処理中のブロックの第1量子化情報との差が前記設定された範囲内であれば前記直前のブロックの量子化情報を前記第2量子化情報として選択し、前記差が前記設定された範囲以上であれば前記第1量子化情報を前記第2量子化情報として選択する選択手段と、を有することを特徴とする。
本発明の第2実施例として、前記丸め制御手段は、すでに符号化された画像のブロックに関する第1量子化情報の値の度数分布を格納する度数分布格納手段と、前記第1量子化情報の値の取り得る範囲を複数の設定された範囲に分割し、前記度数分布に従って、前記現在処理中のブロックの第1量子化情報が属する範囲の代表値に基づいて前記第2量子化情報を生成する代表値生成手段と、を有することを特徴とする。
本発明の他の側面によれば、複数のブロックに分解された画像をブロックごとに符号化処理を行う画像符号化装置における量子化制御方法において、a)少なくとも前記符号化処理により発生する発生符号量に基づいて、ブロックごとに第1量子化情報を生成するステップと、b)前記第1量子化情報をある設定された範囲内で丸めることで前記第1量子化情報より少ない数の第2量子化情報を生成するステップと、c)前記第2量子化情報を用いてブロックごとに量子化処理を行うステップと、を有し、前記ステップb)は、直前のブロックの量子化情報を格納するステップと、前記直前のブロックの量子化情報と現在処理中のブロックの第1量子化情報との差を生成するステップと、前記差が前記設定された範囲内であれば前記直前のブロックの量子化情報を前記第2量子化情報として選択するステップと、前記差が前記設定された範囲以上であれば前記第1量子化情報を前記第2量子化情報として選択するステップと、を有することを特徴とする。
本発明によれば、第1量子化情報に対して一定条件下で丸め処理を行い、第1量子化情報の取りうる値の数を減少させた第2量子化情報を生成するために、直前に符号化されたブロックの量子化情報と等しくなる確率が高くなり、このために符号化ストリームから量子化情報が省略される確率も高くなる。したがって、量子化情報が省略された分だけ画像情報に割り当てる符号量を大きくすることができ、高解像度の画像を低ビットレートで符号化する場合でも良好な画質を得ることができる。たとえば、HDTVなどのように高解像度の画像を低ビットレートで符号化する際でも従来方式に比べて良好な画質を維持できる。しかも、この効果はブロック数が多いほどより顕著となる。HDTVは解像度が1920×1080あるいは1440×1080 の画像が使われ、それぞれのブロック数は8160個、6120個と非常に多いため、本発明の効果は非常に大きくなる。
図1は本発明の一実施形態による画像符号化装置の回路構成を示すブロック図である。本実施形態による画像符号化装置は、符号化部10、量子化制御部20および画像解析部30を有する。符号化部10は、入力映像のDCT変換、量子化および可変長符号化を行い、符号化された画像情報とヘッダ情報とからなるストリームとして出力する。量子化制御部20は、符号化部10から入力した発生符号量と画像解析部30から入力した画像の複雑さなどを表す特徴量とを用いて、後述するように符号化部10のQスケールを制御する。
符号化部10において、並べ替え部101は入力映像をピクチャタイプに従って符号化順に並び替え、差分器102を介してDCT変換部103へ出力する。DCT変換部103は、差分器102からの画像あるいは差分画像をDCT係数に変換して量子化部104へ出力する。量子化部104は量子化制御部20からのQスケールmqcjによってDCT係数を除算することで量子化を行い、量子化DCT係数は可変長符号化器111によって可変長符号化される。周知のように、可変長符号化器111では、量子化DCT係数に対して、出現頻度の高くなるほど短い符号が順次割り当てられる可変長符号化が行なわれ、その結果得られたストリームがストリーム蓄積部112へ出力される。
量子化部104で得られた量子化DCT係数は、IピクチャおよびPピクチャに限り、逆量子化部105へも出力され、量子化部104と同じQスケールmqcjによって逆量子化される。逆量子化により復元されたDCT係数は逆DCT変換部106によって元の画像あるいは差分画像に変換され、加算器107、動き補償用画像メモリ108、動き予測補償部109および差分器102により動き予測処理および動き補償処理が行われる。なお、ピクチャタイプはピクチャタイプ決定部110により並べ替え部101および動き予測補償部109に与えられる。
ストリーム蓄積部112は、可変長符号化器111から出力されたストリームを蓄積し、目標ビットレートに従ったレートで出力する。上述したように、入力されたストリームには画像情報の他にも差分画像を生成する際に得られた動きベクトルや、量子化に使ったQスケールなどの各種符号化情報を有するヘッダ情報も含まれる。ストリーム蓄積部112は、入力された符号量をカウントして得られた発生符号量およびストリームの蓄積量を量子化制御部20へ出力する。
量子化制御部20は、ストリーム蓄積部112から入力された発生符号量やストリームの蓄積量と、画像解析部30から入力した画像の特徴量とに基づいてQスケールを決定し、量子化部104へ出力する。量子化制御部20は、誤差算出部201、基本Qスケール算出部202、調整部203、および、Qスケール丸め制御部204から構成される。
(誤差算出部)
誤差算出部201は、ストリーム蓄積部112から入力した発生符号量とストリームの蓄積量とをもとに、たとえば次式(1)を用いて目標符号量と実際の発生符号量との誤差djを計算する。
ここで、d0は、現符号化画像と同一ピクチャタイプの直前の画像を符号化し終えた時点でのdjの値であり、ピクチャタイプ毎に別々の値が保持される。Bjは、現画像の符号化開始時点からj番目のマクロブロックMBを符号化した時点までの実際の発生符号量である。MB_numは入力画像の解像度により決まるマクロブロックの合計数である。Tは、現画像の符号化難易度やピクチャタイプおよび目標ビットレート等の符号化条件により決定される現画像での目標符号量であり、Iピクチャのときは式(2)、Pピクチャのときは式(3)、Bピクチャのときは式(4)によりそれぞれ求めることができる。
ここで、Kp、Kbは、画質劣化抑制のためにピクチャタイプ毎の符号量割り当て量に偏りを持たせるパラメタであり、たとえばIピクチャ、Pピクチャへの符号量割り当て量をBピクチャより大きくするように、Kp=1.0、Kb=1.4に設定することができる。また、符号化難易度が高く画像間相関の小さな画像である場合には、Kp=1.2、Kb=1.2としてPピクチャとBピクチャとの符号量割り当て量の差をなくすように適応的に変化させることもできる。さらに、その他の値を固定的あるいは適応的に用いても良い。
Np、Nbはそれぞれ現GOP(Group of Pictures)内で符号化されていないPピクチャおよびBピクチャの数を示す。bit_rateは目標ビットレートを示し、picture_rateは1秒あたりの画像表示枚数であるピクチャレートを示す。
Rは、現画像を符号化する時点で現画像が属するGOPで使用可能な残りの符号量であり、GOPの先頭画像を符号化する前に、
R = bit_rate*N / picture_rate
によりリセットされ、その後画像を符号化する毎に画像毎の実発生符号量を引いていくことで更新される。ここで、NはGOPを構成する画像数を示す。
Xi、Xp、Xbは、それぞれIピクチャ、Pピクチャ、Bピクチャでの符号化難易度を示し、次式により求めることができる。
Xi = SiQi
Xp = SpQp
Xb = SbQb
ここで、Si、Sp、Sbは、それぞれ直前のIピクチャ、Pピクチャ、Bピクチャを符号化した結果発生した符合量を示し、Qi、Qp、Qbはそれらの画像を符号化した際にMB毎に割り当てられたQスケールの平均値を示す。なお、式(2)〜(4)におけるmax(a,b)は、aおよびbのうち大きな方を選択することを示す。
また、式(1)を用いた目標符号量と実際の発生符号量との誤差djの計算において、符号化開始からd0の値を順次更新して行くとストリーム蓄積部112のストリーム蓄積量との誤差が拡大して行くので、これを回避するため、GOP分の画像処理後などのタイミングで、ストリーム蓄積部112からのストリーム蓄積量によりd0をリセットしても良い。また、ストリーム蓄積部112から入力したストリーム蓄積量がストリーム蓄積部112の最大蓄積量に近づいた場合、符号量誤差djの値がより大きくなるように補正しても良い。例えば、ストリーム蓄積部112でのストリーム蓄積量が前蓄積量の80%以上となった場合、誤差djを2倍あるいはそれ以上の倍率で大きくする。
(基本Qスケール算出部)
基本Qスケール算出部202は、誤差算出部201から実際の発生符号量と目標符号量との誤差djを入力すると、例えば次式(5)により発生符号量を目標符号量へと制御するための基本Qスケール(baseQj)を算出し、調整部203へ出力する。
ここで、rは誤差への反応速度を決定するパラメタであり、例えば
r = 2*bit_rate/picture_rate
によって計算される。
(調整部)
調整部203は、基本Qスケール(baseQj)に対して、たとえば次式(6)により画質の劣化抑制のためのモジュレーションを行い、モジュレーションされたQスケールmqjをQスケール丸め制御部204へ出力する。
ここで、N_actj は画像解析部30から入力した画像の特徴量actjを用いて算出したモジュレーション量である。ここでは、画像の特徴量として画像の空間周波数を表わすアクティビティを使うことを想定しており、この場合、N_actj は次式(7)により算出することができる。
ここで、actjは、現画像内のj番目となるMBのアクティビティであり、average_actは、画像内でのactjの平均値である。また、nは、モジュレーション幅を決定するパラメタであり、モジュレーション幅は1/n倍〜n倍である。nは、例えばTM5の場合では固定的にn=2であるが、基本QスケールbaseQが大きく、かつ画像内のアクティビティ分布や符号化難易度分布の偏りが大きい場合などには、それらの度合いによりnを2〜12までの範囲で変化させてメリハリの利いたモジュレーションを行なうことでより良好な画質とすることができる。もちろんnは、変化させる条件や範囲をここで挙げた範囲以外としても構わない。
なお、画像解析部30は並べ替え部101から入力した画像を解析し、上述した絵柄の複雑さを表わすアクティビティーを生成する。それ以外にも視覚的に敏感な赤色の強度など視覚的な画質改善に関係する情報を単独であるいは組み合わせて生成してもよい。
(Qスケール丸め制御部)
Qスケール丸め制御部204は、調整部203によりモジュレーションされたQスケールmqjに対して一定条件下で丸め処理を行い、Qスケールmqjの取りうる値の数を減少させたQスケールmqcjを生成する。すなわち、後述するように、一定条件の下で直前に符号化されたMBのQスケールと等しくなるようにQスケールの選択処理あるいは代表値置き換え処理を行う。こうして丸め処理されたQスケールmqcjに従って量子化処理を行うと、上述したようにストリームからQSCが省略される確率が高くなる。したがって、QSCが省略された分だけ画像情報に割り当てる符号量を大きくすることができ、高解像度の画像を低ビットレートで符号化する場合でも良好な画質を得ることができる。以下、Qスケール丸め制御部204についてより詳細に説明する。
図2は本発明の第1実施例による画像符号化装置の回路構成を示すブロック図である。本実施例におけるQスケール丸め制御部204は、Qスケール選択部210およびメモリ211からなる。Qスケール選択部210は、調整部203から入力した現MBのモジュレーション後のQスケールmqjとメモリ211から読み出した直前に選択されたmqc(j−1)とを比較する。
それらの差diff_mq = mqj - mqc(j-1) の絶対値が所定しきい値未満ならば、現MBのmqjの値を直前のmqc(j−1)と同じ値に変更し、現MBのQスケールmqcjとして量子化部104へ出力するとともに、メモリ211に格納する。すなわち、現MBと直前のMBとの間でQスケールの差が所定しきい値より小さい場合には、直前のQスケールを用い、これにより現MBのQスケールを示すQSCはストリームから省略することができる。一方、前記diff_mqの絶対値が所定しきい値以上である場合、あるいは現MBが画面の左端である場合は、現MBのmqjの値をそのまま量子化部104へ出力すると共に、メモリ211へ格納する。
図3は本発明の第1実施例におけるQスケール丸め制御を示すフローチャートである。ここでは、現在の処理対象であるj番目のMBについて、調整部203からQスケールmqjが出力され、メモリ211には直前に符号化されたMBのQスケールmqc(j−1)が格納されているものとする。
まず、Qスケール選択部210は、Qスケールmqjとmqc(j−1)との差分diff_mqを求める(ステップS301)。次に、差分diff_mqを判定するためのしきい値Up_THおよびDown_THを、それぞれUp_TH=mqj*pu、Down_TH=mqj*pdとして決定する(ステップS302)。
ここでは、差分diff_mqの正負に応じてしきい値Up_THおよびDown_THを別々に設定し、mqjの大きさに従って適応的に変化させる。mqjに応じて変化させることで、画質を維持しつつ効果的にQスケール情報量を削減でき、本発明の目的を達成する上で好適となる。また、HDTVを符号化する際には、puおよびpdは、それぞれ、pu=0.40、pd=0.20とすることで最も良好な結果を得られたが、条件に応じてそれぞれ別の値としても構わない。また、puとpdを同じ値としても良い。さらに、しきい値Up_THおよびDown_THを求める際には、mqc(j−1)を使って、Up_TH=mqc(j−1)*pu、Down_TH=mq(j−1)*pdとしても良い。ただし、mqjを使ったほうが、Qスケールが小さくなる方向に変化しやすいので、絵柄が複雑な箇所から平坦となる境界での画質が有利となる。
しきい値Up_THおよびDown_THを適応的に変化させる際には、mqjの値を用いるほかにも、ピクチャタイプ、符号化難易度などといった指標を用いてもよいし、それらを併用してもよい。あるいは、しきい値Up_THおよびDown_THを固定的なしきい値としてもよく、この場合、両者を同じ値としても、また違う値としても構わない。
次に、diff_mqが正の値かどうかを判定し(ステップS303)、diff_mq>0の場合は(ステップS303のYES)、diff_mqの絶対値を前記Up_THと比較する(ステップS304)。diff_mqの絶対値がUp_TH未満であれば(ステップS304のYES)、メモリ211に格納された直前MBのmqc(j−1)をQスケールmqcjとし(ステップS305)、量子化部104へ出力してメモリ211に改めて格納する(ステップS309)。diff_mqの絶対値がUp_TH以上であれば(ステップS304のNO)、現MBのmqjをQスケールmqcjとし(ステップS306)、量子化部104へ出力してメモリ211に改めて格納する(ステップS309)。
他方、diff_mq≦0の場合は(ステップS303のNO)、diff_mqの絶対値を前記Down_THと比較する(ステップS307)。diff_mqの絶対値がDown_TH未満であれば(ステップS307のYES)、メモリ211に格納された直前MBのmqc(j−1)をQスケールmqcjとし(ステップS305)、量子化部104へ出力してメモリ211に改めて格納する(ステップS309)。diff_mqの絶対値がDown_TH以上であれば(ステップS307のNO)、現MBのmqjをQスケールmqcjとし(ステップS308)、量子化部104へ出力してメモリ211に改めて格納する(ステップS309)。
このようにしてj番目のMBについてQスケールが決定されると、(j+1)番目のMBについて同様の処理が行われ、その際、メモリ211に新たに格納されたQスケールmqcjがdiff_mqの判定に使用される。
なお、しきい値を固定値とした場合には、Qスケールのとり得る範囲全てに適合するしきい値とするのは難しい。ただし、MPEGでの符号化制御のフラグの一つであるQ_Scale_Typeが1、つまり非線形量子化の場合に限るが、mqjおよびmqc(j−1)をそれぞれQSCに変換した後の差を比較するのであれば、固定値としてもQスケールに応じて変化させた場合と類似した効果を得ることができる。すなわち、非線形量子化の場合には、QSCが大きいほどQSCの各コードに割り当てられるQスケールの範囲が広くなるために、QSCでの差が固定でも、Qスケールが大きいほど変化が抑制されQスケールの範囲が広くなるためである。具体的には、QSCでの差が1のときのQスケールでの差はその大きさによって1〜8まで変化する。この場合は、Up_TH=2、Down_TH=1などのように固定値としても、Qスケールのとり得る範囲の全てにおいて、ある程度良好な結果が得られる。
上述したように、本発明の第1実施例によれば、現MBと直前のMBのQスケールとの差が所定のしきい値以内である場合には、現MBのQスケールを直前のMBのQスケールと同じ値とし、QSCをストリーム中から省略できる。したがって、画像情報に割り当てられる符号量を大きくすることができ、高解像度の画像を低ビットレートで符号化する場合でも良好な画質を得ることができる。
図4は本発明の第2実施例による画像符号化装置の回路構成を示すブロック図である。本実施例におけるQスケール丸め制御部204は、QSC変換部220、MB度数統計部221、度数分布メモリ222、代表値算出部223、置換部224およびQスケール変換部225からなる。
QSC変換部220は、調整部203から入力したQスケールmqjを5ビットのコードであるQSCに変換し、MB度数統計部221、代表値算出部223および置換部224へ出力する。MB度数統計部221は、ピクチャタイプ毎にMBのQSCに関する度数統計処理を行い、1画像分の度数分布データを度数分布メモリ222に格納する。代表値算出部223は、度数分布メモリ222から同じピクチャタイプの前回の度数分布データを読み出し、所定のQSC範囲の複数領域に分割し、各領域でQSCの代表値QSCnを決定する。置換部224は、現MBのQSC(mqj)を代表値QSCnで置き換えてQスケール変換部225へ出力する。Qスケール変換部225は、代表値QSCnをQスケールmqcjに変換して量子化部104へ出力する。
図5(A)は1画像分のMB度数分布データの一例を示すグラフであり、(B)は複数領域に分割された度数分布の各領域における代表値の一例を示す図であり、(C)は各領域のQSC範囲および領域幅の一例を示す表である。
図5(A)に示すように、MB度数統計部221は、QSC変換部220から順次入力されるQSC(mqj)をQSCが取りうる値0〜31ごとにカウントし(実際にはQSCは0にはならないが便宜上含める)、1画像分のMBのQSC分布をピクチャタイプ(I/P/B)毎に求め度数分布メモリ222に格納する
代表値算出部223は、度数分布メモリ222に格納されている現画像と同一ピクチャタイプの過去の画像に関するQSC度数分布データ(MB_num[QSC])を読み出し、図5(B)に示すように、所定のQSC範囲となる複数領域に分割する。そして、各領域毎にQSC値とその度数とを用いて、次式(8)により加重平均を求め、これを各領域でのQSC代表値とする。
ここで、QSCnは領域n(n=1,2,・・・8)でのQSC代表値であり、QSC_LnおよびQSC_Hnは、それぞれ領域nのQSCの下端値および上端値を示す。
例えば、QSCを4毎に領域分割した場合は、図5(B)に示すように、全8領域#1〜#8となり、各領域について図5(C)の表に示すようなQSCの上端値および下端値となる。このとき、式(8)により図5(B)に示すような8つのQSC代表値QSC1〜QSC8が算出される。
なお、領域内のQSC度数が全て0の場合、QSCn=(QSC_Hn+QSC_Ln)/2として、中間値となるQSCを代表値とするが、当該領域に属するQSCが偶数の場合、つまり中間値を求める計算で少数桁が出る場合には切り上げた値を代表値とする。代表値を求め方としては、度数を使わずに各領域の上端値および下端値の中心値に固定する方法も考えられる。ただし、この方法ではMB度数統計部221や式(8)の加重平均処理が不要となり処理が軽減するものの、画質的には不利となる。
また、上述した加重平均によりQSC代表値を求める例では、QSCの代表値を求める各領域を等範囲で分割したが、度数が多い箇所は領域を狭くし、度数が少ない箇所は領域を広くしても良い。この場合は、QSCの情報削減効果は落ちるものの、より絵柄に沿ったQSCが割り当てられることになり、HDTV画像を14M〜16Mのレートで符号化する場合など、低ビットレートながらも比較的余裕のあるビットレートに適用する場合にはより好適な方法となる。この分割領域の範囲を度数に依存させる方法は、代表値を領域の中心値に固定する例にも適用できるが、この場合は度数を利用するためMB度数統計部221が必要となる。
置換部224は、代表値算出部223から入力した各領域の上端値、下端値およびQSC代表値により、QSC(mqj)が属する領域を判定し、QSC(mqj)を当該領域のQSC代表値に置き換えてQスケール変換部225へ出力する。なお、本実施例のQスケール丸め制御部204ではQSCを用いて処理を行なっているが、Qスケールのままで同様の処理を行うことも可能である。ただし、この場合、MB度数統計部221で各領域での代表値とするQスケールは、QSCに変換した後に同一の値とならないQスケールを選ぶようにした方が良い。
図6は本発明の第2実施例におけるQスケール丸め制御を示すフローチャートである。まず、変数jを0に初期化した後(ステップS401)、j番目のMBのqスケールmqjを調整部203から入力し(ステップS402)、QSC変換する(ステップS403)。続いて、現在の処理対象画像と同一ピクチャタイプとなる直前の画像のQSC度数分布データMB_num[QSC]を度数分布メモリ222から読み出し、式(8)を用いて、分割した領域毎の代表値QSCnを算出する(ステップS404)。
続いて、当該処理対象の画像についてMB単位での処理を実行する(ステップS405〜S412)。まず、現MBのQSCが属する領域を判定する(ステップS405)。ここで、領域を図5(B)のようにQSCの値の幅を4ずつの固定幅で分割するとした場合は、QSCを4で割り1を加えれば、そのまま図5(C)に示す領域番号となり、簡単に現MBのQSCが属する領域を判定できる。
次に、ステップS404で予め求めておいた領域毎の代表値QSCnを用いて、現MBのQSCをそれが属する領域nでのQSCの代表値QSCnに置き換える(ステップS406)。置き換えられた代表値QSCnがQスケール変換され、Qスケールmqcjとして量子化部104へ出力される(ステップS407)。
続いて、現画像のQSCの度数分布情報を作成するため、現MBのQSCの出現度数をインクリメント(+1)し(ステップS408)、現MBが現画像での最後のMBであるか否かを判定する(ステップS409)。現MBが最後のMBでない場合には(ステップS409のNO)、変数jをインクリメントし(ステップS410)、j番目のMBのQスケールmqjを調整部203から入力し(ステップS411)、それをQSC変換した後(ステップS412)、ステップS405へ戻る。ステップS405〜S412は、現MBが最後のMBとなるまで繰り返される。
現MBが最後のMBになると(ステップS409のYES)、次の同一ピクチャタイプとなる画像の処理に用いるため、現画像についてのQSCの度数分布データをピクチャタイプ毎に度数分布メモリ222に格納して(ステップS413)、処理を終了する。
本発明の第2実施例によれば、MB度数統計部221により求めたQSCの度数分布を用いて、代表値算出部223が実際に使用するQSCとして幾つかの代表値を決定しておき、置換部224により代表値以外のQSCをそれが属する領域の代表値へと置換する。これによって、割り当てられるQSCの数がQSC代表値の数にまで減少し、同じQSCが連続することで、ストリームから省略される確率が高くなる。その結果、画像情報へ割り当てられる符号量が大きくなり、高解像度の画像を低ビットレートで符号化する場合でも、良好な画質を得ることができる。
なお、上記第1実施例および第2実施例は、図2および図4に示す機能ブロックをハードウエアにより実現することもできるが、図3および図6に示すような量子化制御を含む符号化プログラムを十分な処理能力を持つCPU上で動作させることで同様に実現することもできる。あるいは、図3および図6に示すような量子化制御部20のみソフトウェアに実装し、その他はハードウェアに実装するなど、ハードウェアとソフトウェアとを共に用いた構成で実現することも可能である。
なお、本発明は、高解像度であるHDTVを低ビットレートで符号化する地上デジタル放送向け符号化装置をはじめとした動画配信用符号化装置または符号化プログラムなどMPEGの技術を用いているもの全てに広く適用可能である。また、MPEGのみならず、同じ値のQスケールあるいはQSCが連続した場合ストリームからそれらの情報を省略できる特徴を持つ、たとえばH.264など、他の符号化方式を利用した装置またはプログラムにも適用することができる。
本発明の一実施形態による画像符号化装置の回路構成を示すブロック図である。 本発明の第1実施例による画像符号化装置の回路構成を示すブロック図である。 本発明の第1実施例におけるQスケール丸め制御を示すフローチャートである。 本発明の第2実施例による画像符号化装置の回路構成を示すブロック図である。 (A)は1画像分のMB度数分布データの一例を示すグラフであり、(B)は複数領域に分割された度数分布の各領域における代表値の一例を示す図であり、(C)は各領域のQSC範囲および領域幅の一例を示す表である。 本発明の第2実施例におけるQスケール丸め制御を示すフローチャートである。
符号の説明
10 符号化部
20 量子化制御部
30 画像解析部
201 誤差算出部
202 基本Qスケール算出部
203 調整部
204 Qスケール丸め制御部
210 Qスケール選択部
211 メモリ
220 QSC変換部
221 MB度数統計部
222 度数分布メモリ
223 代表値算出部
224 置換部
225 Qスケール変換部

Claims (12)

  1. 画像を複数のブロックに分解して符号化処理を行う画像符号化装置において、
    ブロックごとに量子化情報に従って量子化を行う量子化手段と、
    少なくとも前記符号化処理により発生する発生符号量に基づいて、ブロックごとに第1量子化情報を生成する量子化情報生成手段と、
    直前のブロックの量子化情報と現在処理中のブロックの第1量子化情報との差が、設定された範囲内であれば前記直前のブロックの量子化情報を前記第2量子化情報として選択し、前記設定された範囲以上であれば前記第1量子化情報を前記第2量子化情報として選択することで前記第1量子化情報を前記設定された範囲内で丸めて前記第2量子化情報を生成する丸め制御手段と、
    を有し、前記第2量子化情報を前記量子化情報として使用することを特徴とする画像符号化装置。
  2. 前記設定された範囲は前記第1量子化情報に依存して変化することを特徴とする請求項に記載の画像符号化装置。
  3. 前記設定された範囲は、前記現在処理中のブロックの第1量子化情報が前記直前のブロックの量子化情報より大きい場合と小さい場合とで異なることを特徴とする請求項またはに記載の画像符号化装置。
  4. 画像を複数のブロックに分解して符号化処理を行う画像符号化装置において、
    ブロックごとに量子化情報に従って量子化を行う量子化手段と、
    少なくとも前記符号化処理により発生する発生符号量に基づいて、ブロックごとに第1量子化情報を生成する量子化情報生成手段と、
    前記第1量子化情報をある設定された範囲内で丸めることで前記第1量子化情報より少ない数の第2量子化情報を生成する丸め制御手段と、
    を有し、前記丸め制御手段は、
    すでに符号化された画像のブロックに関する第1量子化情報の値の度数分布を格納する度数分布格納手段と、
    前記第1量子化情報の値の取り得る範囲を複数の設定された範囲に分割し、前記度数分布に従って、前記現在処理中のブロックの第1量子化情報が属する範囲の代表値に基づいて前記第2量子化情報を生成する代表値生成手段と、
    を有し、前記第2量子化情報を前記量子化情報として使用することを特徴とする画像符号化装置。
  5. 前記代表値は、前記複数の設定された範囲の各々における第1量子化情報の値と前記度数分布との加重平均により決定されることを特徴とする請求項に記載の画像符号化装置。
  6. 前記代表値は、前記複数の設定された範囲の各々における上端値、下端値および中心値のいずれかに固定されていることを特徴とする請求項に記載の画像符号化装置。
  7. 前記複数の設定された範囲の各々の幅は前記度数分布の度数に応じて設定されることを特徴とする請求項からのいずれかに記載の画像符号化装置。
  8. 前記度数分布は前記第1量子化情報のQSC(Quantizer Scale Code)の度数分布であり、前記代表値生成手段は前記代表値をQSCとして生成することを特徴とする請求項に記載の画像符号化装置。
  9. 複数のブロックに分解された画像をブロックごとに符号化処理を行う画像符号化装置における量子化制御方法において、
    a)少なくとも前記符号化処理により発生する発生符号量に基づいて、ブロックごとに第1量子化情報を生成するステップと、
    b)前記第1量子化情報をある設定された範囲内で丸めることで前記第1量子化情報より少ない数の第2量子化情報を生成するステップと、
    c)前記第2量子化情報を用いてブロックごとに量子化処理を行うステップと、
    を有し、
    前記ステップb)は、
    直前のブロックの量子化情報を格納するステップと、
    前記直前のブロックの量子化情報と現在処理中のブロックの第1量子化情報との差を生成するステップと、
    前記差が前記設定された範囲内であれば前記直前のブロックの量子化情報を前記第2量子化情報として選択するステップと、
    前記差が前記設定された範囲以上であれば前記第1量子化情報を前記第2量子化情報として選択するステップと、
    を有することを特徴とする量子化制御方法。
  10. 複数のブロックに分解された画像をブロックごとに符号化処理を行う画像符号化装置における量子化制御方法において、
    a)少なくとも前記符号化処理により発生する発生符号量に基づいて、ブロックごとに第1量子化情報を生成するステップと、
    b)前記第1量子化情報をある設定された範囲内で丸めることで前記第1量子化情報より少ない数の第2量子化情報を生成するステップと、
    c)前記第2量子化情報を用いてブロックごとに量子化処理を行うステップと、
    を有し、
    前記ステップb)は、
    すでに符号化された画像のブロックに関する第1量子化情報の値の度数分布を生成するステップと、
    前記第1量子化情報の値の取り得る範囲を複数の設定された範囲に分割するステップと、
    前記度数分布に従って、前記現在処理中のブロックの第1量子化情報が属する前記設定された範囲の代表値を前記第2量子化情報として生成するステップと、
    を有することを特徴とする量子化制御方法。
  11. コンピュータに、複数のブロックに分解された画像をブロックごとに符号化処理を行わせるプログラムにおいて、
    a)少なくとも前記符号化処理により発生する発生符号量に基づいて、ブロックごとに第1量子化情報を生成するステップと、
    b)前記第1量子化情報をある設定された範囲内で丸めることで前記第1量子化情報より少ない数の第2量子化情報を生成するステップと、
    c)前記第2量子化情報を用いてブロックごとに量子化処理を行うステップと、
    前記ステップb)は、
    直前のブロックの量子化情報を格納するステップと、
    前記直前のブロックの量子化情報と現在処理中のブロックの第1量子化情報との差を生成するステップと、
    前記差が前記設定された範囲内であれば前記直前のブロックの量子化情報を前記第2量子化情報として選択するステップと、
    前記差が前記設定された範囲以上であれば前記第1量子化情報を前記第2量子化情報として選択するステップと、
    を有することを特徴とするプログラム。
  12. コンピュータに、複数のブロックに分解された画像をブロックごとに符号化処理を行わせるプログラムにおいて、
    a)少なくとも前記符号化処理により発生する発生符号量に基づいて、ブロックごとに第1量子化情報を生成するステップと、
    b)前記第1量子化情報をある設定された範囲内で丸めることで前記第1量子化情報より少ない数の第2量子化情報を生成するステップと、
    c)前記第2量子化情報を用いてブロックごとに量子化処理を行うステップと、
    前記ステップb)は、
    すでに符号化された画像のブロックに関する第1量子化情報の値の度数分布を生成するステップと、
    前記第1量子化情報の値の取り得る範囲を複数の設定された範囲に分割するステップと、
    前記度数分布に従って、前記現在処理中のブロックの第1量子化情報が属する前記設定された範囲の代表値を前記第2量子化情報として生成するステップと、
    を有することを特徴とするプログラム。
JP2003339142A 2003-09-30 2003-09-30 画像符号化装置およびその量子化制御方法 Expired - Fee Related JP4100317B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2003339142A JP4100317B2 (ja) 2003-09-30 2003-09-30 画像符号化装置およびその量子化制御方法
US10/955,794 US7606436B2 (en) 2003-09-30 2004-09-30 Image encoding apparatus and quantization control method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003339142A JP4100317B2 (ja) 2003-09-30 2003-09-30 画像符号化装置およびその量子化制御方法

Publications (2)

Publication Number Publication Date
JP2005109778A JP2005109778A (ja) 2005-04-21
JP4100317B2 true JP4100317B2 (ja) 2008-06-11

Family

ID=34373341

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003339142A Expired - Fee Related JP4100317B2 (ja) 2003-09-30 2003-09-30 画像符号化装置およびその量子化制御方法

Country Status (2)

Country Link
US (1) US7606436B2 (ja)
JP (1) JP4100317B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4579237B2 (ja) * 2004-04-22 2010-11-10 三菱電機株式会社 画像符号化装置及び画像復号装置
US8116577B2 (en) * 2005-03-07 2012-02-14 Sony Corporation Encoding method, encoding device, encoding process program, and recording medium on which encoding process program is recorded
US7936677B2 (en) * 2007-03-22 2011-05-03 Sharp Laboratories Of America, Inc. Selection of an audio visual stream by sampling
US8542730B2 (en) * 2008-02-22 2013-09-24 Qualcomm, Incorporated Fast macroblock delta QP decision
JP2010278730A (ja) * 2009-05-28 2010-12-09 Mitsubishi Electric Corp 動画像符号化装置及び動画像符号化方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3187852B2 (ja) 1991-02-08 2001-07-16 ソニー株式会社 高能率符号化方法
US5629780A (en) * 1994-12-19 1997-05-13 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Image data compression having minimum perceptual error
US6496607B1 (en) * 1998-06-26 2002-12-17 Sarnoff Corporation Method and apparatus for region-based allocation of processing resources and control of input image formation
JP4364350B2 (ja) 1999-07-06 2009-11-18 富士通株式会社 可変レート動画像符号化装置
EP1377065A4 (en) 2001-03-30 2006-07-05 Sony Corp IMAGE SIGNAL QUANTIFICATION DEVICE AND ITS METHOD

Also Published As

Publication number Publication date
US7606436B2 (en) 2009-10-20
JP2005109778A (ja) 2005-04-21
US20050069215A1 (en) 2005-03-31

Similar Documents

Publication Publication Date Title
KR100505699B1 (ko) 실시간 가변 비트율 제어로 화질을 개선시키는 비디오인코더의 인코딩율 제어기, 이를 구비한 비디오 데이터전송 시스템 및 그 방법
KR100604702B1 (ko) 이미지 시퀀스를 인코딩하는 장치 및 이미지 신호를 양자화하기 위해서 양자화 스케일을 생성하는 방법
KR100559924B1 (ko) 코딩 시스템의 매크로 블록 기반 비율을 제어하기 위한장치 및 방법
US5790196A (en) Adaptive video coding method
US20050169547A1 (en) Encoding apparatus and method
JP5524072B2 (ja) 動画像符号化装置
US7388995B2 (en) Quantization matrix adjusting method for avoiding underflow of data
EP1067798A2 (en) Apparatus, method and computer program product for transcoding a coded moving picture sequence
US11356672B2 (en) System and method for controlling video coding at frame level
KR19990076563A (ko) 동화상 부호화 방식
US11134250B2 (en) System and method for controlling video coding within image frame
KR20030065588A (ko) 비트 버짓을 이용하여 비디오 인코딩 속도의 제어를실행하는 방법
US6535643B1 (en) Method for recovering compressed motion picture for eliminating blocking artifacts and ring effects and apparatus therefor
US6389073B1 (en) Coding control method, coding control apparatus and storage medium containing coding control program
JP2516082B2 (ja) デ―タ圧縮装置
JP4100317B2 (ja) 画像符号化装置およびその量子化制御方法
EP1720356A1 (en) A frequency selective video compression
JPH07203430A (ja) 画像符号化装置
JP3151173B2 (ja) 画像圧縮符号化装置及び方法
JP3211778B2 (ja) 改良された適応性のあるビデオ符号化方法
CN112866696A (zh) 4k、8k、16k超高清视频编码优化控制方法和装置
JP2022070176A (ja) 符号化装置及びプログラム
JPH07184195A (ja) 画像符号化装置
KR20040067239A (ko) 양자화 수행시에 사용되는 비트의 할당방법 및 장치
JPH05153549A (ja) 高能率符号化を用いた記録装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051115

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071106

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071120

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080226

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080310

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110328

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4100317

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110328

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120328

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120328

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130328

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130328

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140328

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees