JP2005175621A - 動画像符号化装置及び動画像符号化方法 - Google Patents

動画像符号化装置及び動画像符号化方法 Download PDF

Info

Publication number
JP2005175621A
JP2005175621A JP2003409357A JP2003409357A JP2005175621A JP 2005175621 A JP2005175621 A JP 2005175621A JP 2003409357 A JP2003409357 A JP 2003409357A JP 2003409357 A JP2003409357 A JP 2003409357A JP 2005175621 A JP2005175621 A JP 2005175621A
Authority
JP
Japan
Prior art keywords
encoding
block distortion
filter coefficient
moving picture
filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003409357A
Other languages
English (en)
Other versions
JP2005175621A5 (ja
JP4343667B2 (ja
Inventor
Katsumi Otsuka
克己 大塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2003409357A priority Critical patent/JP4343667B2/ja
Priority to US11/003,461 priority patent/US20050123038A1/en
Publication of JP2005175621A publication Critical patent/JP2005175621A/ja
Publication of JP2005175621A5 publication Critical patent/JP2005175621A5/ja
Application granted granted Critical
Publication of JP4343667B2 publication Critical patent/JP4343667B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】 画質の劣化具合や人間の視覚特性を考慮した動画像符号化技術を提供する。
【解決手段】 動画像を量子化して符号化する符号化ユニットと、符号化されたデータを局所的に復号する復号ユニットを有する動画像符号化装置は、符号化の条件に応じて可変に設定することが可能なフィルタ係数に従い、入力される動画像に対して空間フィルタ処理を施すプリフィルタと、プリフィルタから出力される動画像と、復号ユニットから出力される復号画像とに基づき動画像のブロック歪み度を算出する算出ユニットと、算出されたブロック歪み度と、符号化ユニットにより符号化された動画像に対する符号量とに従い、フィルタ係数及び符号化ユニットにおける量子化を制御するための量子化スケールのうち少なくとも一方の設定を変更するためのパラメータを決定する決定ユニットとを備える。
【選択図】 図1

Description

本発明は、動画像を入力して、符号化データを出力するための動画像符号化装置および動画像符号化方法に関するもので、特に、低ビットレートにおいても良好な画質を得ることを可能にする画像符号化装置および画像符号化方法等に関する。
近年のデジタル信号処理技術の飛躍的な進歩により、従来ならば困難であった蓄積メディアへの動画像の記録や伝送路を介した動画像の伝送が行われている。この場合に、動画像を構成する各々のフレームは圧縮処理が施されデータ量が大幅に削減されている。この圧縮処理として代表的な手法が、例えば、MPEG(Moving Picture Experts Group)方式として知られている。このMPEG方式に準拠して画像の圧縮、符号化を行う場合、その符号量は、画像自体の特性である空間周波数特性やシーン及び量子化スケール値に応じて大きく異なる場合が多い。このような符号化特性を有する符号化装置を実現する上で良好な画質の復号画像を得ることができるようにするための重要な技術が符号量制御である。
この符号量制御アルゴリズムの1つとして、TM5(Test Model 5)(非特許文献1を参照)が知られている。このTM5による符号量制御アルゴリズムは、以下に概説する3つのステップから構成され、GOP(Group of Picture)毎にビット・レートが一定になるように符号量が制御される。
[STEP1: Target bit allocation]
STEP1の処理では、符号化を行う次のピクチャの目標符号量を設定する。ここで、STEP1の処理においては、現在のGOPにおいて許容される符号量Rgopが以下の(1)式により演算される(以下の各式において、「*」は乗算を意味するものとする。)。
Rgop = (ni+np+nb)*(bits_rate/picture_rate) ・・・(1)
ここで、ni,np,nbはそれぞれI、P、Bピクチャの現GOPにおける残りのピクチャ数であり、bits_rateは目標ビット・レート、picture_rateはピクチャ・レートを表す。更に、I、P、Bピクチャ毎に符号化結果からピクチャの複雑度を以下の(2)式で求めている。
Xi = Ri*Qi
Xp = Rp*Qp ・・・(2)
Xb = Rb*Qb
ここで、Ri、Rp及びRbはそれぞれI、P、Bピクチャを符号化した結果得られる符号量であり、Qi、Qp及びQbはそれぞれI、P、Bピクチャ内のすべてのマクロ・ブロックにおけるQスケールの参照値である。式(1)及び式(2)から、I、P、Bピクチャそれぞれについての目標符号量Ti、Tp及びTbは、以下の(3)式で求めることができる。
Ti= max{(Rgop/(1+ ((Np*Xp)/(Xi*Kp)) + ((Nb*Xb)/(Xi*Kb)))) , (bit_rate/(8*picture_rate))}
Tp=max{(Rgop/(Np+ (Nb*Kp*Xb)/(Kb*Xp))) , (bit_rate/(8*picture_rate))}
Tb=max{(Rgop/(Nb+ (Np*Kb*Xp)/(Kp*Xb))) , (bit_rate/(8*picture_rate))}
・・・(3)
ただし、Np及びNbは現GOP内のそれぞれP及びBピクチャの残りの枚数、また定数Kp=1.0及びKb=1.4である。
[STEP2: Rate control]
STEP2では、I、P及びBピクチャ毎に3つの仮想バッファを使用し、式(3)で求めた目標符号量と発生符号量との差分を管理する。仮想バッファのデータ蓄積量をフィードバックし、そのデータ蓄積量に基づいて実際の発生符号量が目標符号量に近づくように、次にエンコードするマクロ・ブロックについて、Qスケールの参照値が設定される。例えば、現在のピクチャタイプがPピクチャの場合には、目標符号量と発生符号量との差分は、次の(4)式に従う演算処理により求めることができる。
dp,j = dp,0 + Bp,j-1 −((Tp*(j-1))/MB_cnt) ・・・(4)
ここで、添字jはピクチャ内のマクロ・ブロックの番号であり、dp,0は仮想バッファの初期フルネスを示し、Bp,jはj番目のマクロ・ブロックまでの総符号量、MB_cntはピクチャ内のマクロ・ブロック数を示す。式((4)の関係をグラフに示すと、例示的に図2のようになる。図2において、横軸は、ピクチャ内のマクロ・ブロック数(MB_cnt)であり、縦軸はpピクチャの目標符号量である。図中のDp,jは(4)式で求められる差分値である。
次にdp,j(以後、「dj」と記載する。)を用いて、j番目のマクロ・ブロックにおけるQスケールの参照値を求めると、(5)式のようになる。
Qj = (dj*31) / r ・・・(5)
ここで、r = 2*bits_rate/picture_rate ・・・(6)
である。
[STEP3:Adaptive Quantization]
STEP3の処理では、視覚特性、即ち、復号画像の画質が良好になるように、エンコード対象のマクロ・ブロックの空間アクティビチィに基づいて、量子化スケールを最終的に決定する処理を実行する。
ACTj = 1+ min(vblk1, vblk2,……,vblk8) ・・・(7)
(7)式中において、vblk1〜vblk4はフレーム構造のマクロ・ブロックにおける8x8のサブ・ブロックにおける空間アクティビチィを示し、vblk5〜vblk8はフィールド構造のマクロ・ブロックにおける8x8サブ・ブロックの空間アクティビチィを示す。ここで、空間アクティビチィの演算は次の(8)、(9)式により求めることが可能である。
vblk = Σ(Pi−Pbar)2 ・・・(8)
Pbar = (1/64 )* ΣPi ・・・(9)
ここで、Piはi番目のマクロ・ブロックのにおける画素値であり、式(8)、(9)中のΣはi=1〜64の演算である。次に(7)式で求めたACTjを以下の(10)式によって正規化を行う。
N_ACTj = (2*ACTj +AVG_ACT)/ (ACTj + AVG_ACT) ・・・(10)
ここで、AVG_ACTは以前に符号化したピクチャにおけるACTjの参照値であり、最終的に量子化スケール(Qスケール値)MQUANTjは以下の(11)式により求められる。
MQUANTj = Qj * N_ACTj ・・・(11)
以上のTM5のアルゴリズムによれば、STEP1の処理によりIピクチャに対して多くの符号量を割り当ており、更にピクチャ内においては視覚的に劣化の目立ちやすい平坦部(空間アクティビティが低い)に符号量が多く配分されるようになる。
また、 TM5の課題に対する技術である、特許文献1においては、図3に示すような、ローパスフィルタ(LPF)の遮断周波数のバランス点を求めるために、バランス関数なるものを定義して、量子化歪と画像鮮鋭度劣化との整合を取ることで、TM5における課題の解決を試みている。これは、量子化歪を抑制するために符号化装置に入力される各ピクチャの空間周波数をLPFにより低減することで実現している。図3の2本の曲線は以下の2つの関数F1及びF2に相当する。
F1(動き量,フィルタ係数, 量子化スケール,符号量)
F2(フィルタ係数,量子化スケール)
関数F1及びF2の交差点をバランス点として、符号量と画質の整合が最も優れている量子化スケールとLPFのフィルタ係数として設定する。
また、特許文献2には、動画像符号化方法として、フィルタ係数を変更する際に、急激な変化を回避する技術が開示されている。
Test Model 5(Test Model Editing Commitee: "Test Model 5", ISO/IEC JTC/SC29/WG11/N0400(Apr.1993)) 特許2894137号公報、「動画像符号化におけるプリフィルタ制御方法及び装置」 特開2002-247576号公報
しかしながら、上述のTM5のアルゴリズムにおいては次のような課題がある。すなわち、最終的なMQUANTjを得るための判断情報として、(4)式における目標符号量と符号量との差分(乖離)以外、式(5)における前ピクチャの符号化結果のQスケール参照値(Qj)と、STEP3の処理における空間アクティビティ(ACTj )のみを使用しており、画質の定量的な劣化具合や人間の視覚特性が、TM5における符号量制御では十分考慮されておらず、符号化状況に応じ人間の視覚特性に合致した符号量制御を行なうという点では困難であった。
また、TM5のアルゴリズムに対する課題を補う特許文献1における技術においても、上記の関数F1において引数である「動き量」を算出するために大規模な回路が必要となること、更には、直前のピクチャの情報のみを使用しているため、シーンチェンジ等の場合にはフィルタの特性が急激に変化してしまい、画質のボケが目立つという課題がある。
動画像符号化方法として、フィルタ係数を変更する際に、急激な変化を回避している解決するための方法を開示する特許文献2によれば、まず符号化難易度Yを以下のとおりI、P及びBピクチャ毎に関数F(12)式を使用して求めている。
Y= F(累積符号量,平均Qスケール) ・・・(12)
次にI、P及びBそれぞれについて求めた符号化難易度Yi、Yp及びYbからフィルタ係数パラメータZを(13)式により求める((13)式)。
Z= (Yi + Yp + Yb)/(bits_rate) ・・・(13)
式(13)により得られたZの値に応じて、図4に示すように予め設定してあるフィルタ係数S0、S1及びS3から選択する。すなわち、各フィルタ係数に対応するZの値に幅をもたせることによって急激なフィルタ係数の変化を回避している。
しかしながら、特許文献2による方法は、単純に累積符号量と平均Qスケールだけの情報から予測しているにすぎないので、依然として画質の劣化具合や人間の視覚特性が考慮されているとは言い難い。
上記課題を鑑みて、本発明は、画質の劣化具合や人間の視覚特性を考慮した動画像符号化装置及び動画像符号化方法を提供することを目的とする。上記課題を解決し、その目的を達成する本発明にかかる動画像符号化装置等は主として以下の構成を有することを特徴とする。
すなわち、動画像を量子化して符号化する符号化手段と、当該符号化されたデータを局所的に復号する復号手段を有する動画像符号化装置は、
符号化の条件に応じて可変に設定することが可能なフィルタ係数に従い、入力される動画像に対して空間フィルタ処理を施すプリフィルタと、
前記プリフィルタから出力される動画像と、前記復号手段から出力される復号画像とに基づき動画像のブロック歪み度を算出する算出手段と、
前記算出されたブロック歪み度と、前記符号化された動画像に対する符号量とに従い、前記フィルタ係数及び前記符号化手段における量子化を制御するための量子化スケールのうち少なくとも一方の設定を変更するためのパラメータを決定する決定手段とを備えることを特徴とする。
本発明によれば、プリフィルタを用いて符号量を制御するに当たり、直前までのブロック毎に求められたブロック歪み度のレベルに基づき、フィルタ係数及び量子化スケールのうち、少なくとも一方の設定を変えることで、人間の視覚特性を反映した歪みのない高画質な復号画像を得られるためのフィルタ制御、符号量制御を実現することが可能になる。
以下、本発明の動画像符号化装置及び方法の好適な実施形態を添付図面を参照しつつ説明する。
[第1実施形態]
図1は、本発明にかかる動画像符号化方法を実現する装置の構成を示す動画像符号化装置200のブロック図であり、上述のTM5アルゴリズムを実行することが可能なMPEG符号化ユニット100を利用する構成になっている。MPEG符号化ユニット100は、具体的には、MPEG-1、MPEG-2、MPEG-3或いはMPEG-4規格に対応するものであり、特定の符号化規格に限定するものではない。すなわち、入力画像を量子化する構成(量子化器としてQTZ104に相当する構成)を含む符号化規格であれば本発明にかかる動画像符号化技術を適用することが可能である。
動画像符号化装置200は、更に、ブロック歪み度算出ユニット109と、符号化パラメータ決定ユニット110を備えており、ブロック歪み度算出ユニット109により求められた画像の歪み度に基づいて、符号化パラメータ決定ユニット110は、マクロ・ブロック(MB)毎、または、ピクチャ毎、若しくは、一つのピクチャ内で複数回、量子化スケールMQUANTを決定するための計算を行なう。以下、図1のブロック図と、図5のフローチャートを参照して、動画像符号化処理の流れを具体的に説明する。
<全体の動作フローの説明>
図5は、図1の符号化パラメータ決定ユニットにおける処理を説明するフローチャートである。まず、ステップS501において、上述のTM5アルゴリズムのSTEP1を利用するために、量子化スケール(Qスケール値)であるMQUANT及びフィルタ係数値(C_LPF)の初期値を設定する。
次に、処理をステップS502に進め、(3)式に従ってピクチャタイプ(I、P、Bピクチャ)それぞれについての目標符号量Ti、Tp及びTbを算出する。本ステップの目標符号量の算出において、符号化を行なう次のピクチャの目標符号量が設定される。図12は、符号化対象ピクチャを例示する図であり、各ピクチャタイプ(I、P、Bピクチャ)の画像をここでは、それぞれ、Xi、Xp、Xbとして表している。現GOPを構成するP2ピクチャが次に符号化を行なう対象になるとすると、このピクチャに対する目標符号量が算出される。
次に、処理をステップS503に進め、動画像符号化装置200にマクロ・ブロック(図1中のMB)を入力し、空間フィルタ処理を実施する。ここで、プリフィルタ101の実現方法としては、例えば、図6に示すような3x3正方マトリクスの空間フィルタを使用することが可能である。この場合のC_LPFの値と3x3正方マトリクスのフィルタ係数との関係を図7に示す。C_LPF=0の場合は、フィルタの動作がOFFとなり、入力画像(MB)=出力画像となる。また、図7のフィルタ係数の例では、C_LPFの値が大きい程、遮断周波数が低くなるように設定されている。プリフィルタの特性を与えるフィルタ係数を変えることにより、入力されるマクロ・ブロックに対する空間フィルタリング処理を所定の撮影モードに合うように制御することが可能になる。例えば、符号化パラメータ決定ユニット110は、求められたブロック歪み度、目標符号量と現在までの累積符号量の乖離から、ブロック歪みが発生すると判断した時は、プリフィルタの特性の通過帯域を現在よりも低周波領域に設定する。
ここで、入力される符号化前のマクロブロック(MB)は、後に説明するブロック歪み算出のために、空間フィルタ処理がなされた後、ブロック歪み度算出ユニット109に入力される。ブロック歪み度算出ユニット109における処理は、後に詳述する。
ステップS504において、先のステップS501で初期値として設定された量子化スケール(MQUANT)の値を用いてMPEG符号化ユニット100が、離散コサイン変換(103)されたマクロ・ブロックを、量子化(104)して可変長符号化データ(105)を生成する。尚、MPEG符号化ユニット100については、MPEG符号化方式の規格に準拠した処理で実現することが可能であるので、動き予測(102)及び動き補償(108)に関するユニットを含め、ここでは各ユニットに関する具体的な説明は省略する。
次に、処理をステップS505に進め、ステップS504の処理により生成された符号化データを局所復号化ユニット111に入力して、IQTZ106、IDCT107により逆変換処理を行なって復号データを生成する。尚、局所復号化ユニット111については、MPEG符号化方式の規格に準拠した処理で実現することが可能であるので、ここでは各ユニットに関する具体的な説明は省略する。
図13は、ブロック歪み度算出ユニット109の構成を示すブロック図でありる。ステップS506において、ブロック歪み度算出ユニット109により、符号化前のマクロ・ブロック(ステップS503で、空間フィルタ処理後のマクロ・ブロックがブロック歪み度算出ユニット109の符号化前データ格納部109aに格納されている。)と、復号化データ入力部109bを介して入力した局所復号化ユニット111で復号されたマクロ・ブロックとを比較して、ブロック歪み度演算ユニット109cは、MPEG処理により生じた画像の歪みを評価するパラメータとして、ブロック歪み度を演算する。ブロック歪み度の計算方法としては、例えば、次の2つの方法を用いることができる。
<方法1>
方法1は、符号化前及び復号化後の2つの画像に対するPSNR(Peak Signal to Noise Ratio)を求める方法であり、MPEG符号化ユニット100への入力画像の輝度成分をPj、局所復号化ユニット111の出力画像の輝度成分をRjとすれば、PNSRは以下の(14)式により求めることができる。
SUM = Σ(Pj - Rj)2 (j = 0 〜255)
PSNR = 20×log10(255/sqrt(SUM/256)) ・・・(14)
(14)式により求まるPSNRを評価することで、入力画像と出力画像の歪み度を相対的に求めることができる。
<方法2>
方法2は、符号化前及び復号化後の2つの画像に関し、それぞれを8x8のブロックとし、この8x8のブロックの境界の各画素について、(15)式による差分和の計算を実行する。図8はマクロ・ブロック(図8(b))と、これを構成する8×8の画素ブロックの境界画素(ハッチングを付して示す(図8(a))を例示的に示す図であり、マクロ・ブロックを構成する4つの8×8のブロックの境界画素各々について、MPEG符号化ユニット100への入力画像の輝度成分(P0j、P1j、P2j、P3j)と、局所復号化ユニット111の出力画像の輝度成分(R0j、R1j、R2j、R3j)、として両者の差分和(BN)は(15)式により求めることができる。
BN=Σ(P0j−R0j)+Σ(P1j−R1j)+Σ(P2j−R2j)+Σ(P3j−R3j)
・・・(15)
(jは、図8の網掛けされた境界画素番号をとる)
ブロック歪み度演算ユニット109cは、上述の方法1または方法2による方法によりブロック歪み度を演算することができる。
説明を図5のフローチャートに戻し、ステップS507において、(15)式により求めたブロック歪み度(BN)とMPEG符号化ユニット100におけるVLC(可変長符号化器)105から出力される符号量から、次のマクロ・ブロックに使用すべきフィルタ係数値(C_LPF)及びQスケール値(MQUANT)の値を決定する。この決定処理は、動画像符号化装置200の符号化パラメータ決定ユニット110により実行され、この具体的な処理は、図9〜図11を用いて後に詳述する。
以上のステップS502〜S507までの処理をピクチャ内のすべてのマクロ・ブロックに対して繰り返し行うことによって(S508、S509)、符号量の制御を実現することができる。また、上述の処理の繰り返しは、 マクロ・ブロック(MB)毎、または、ピクチャ毎、若しくは、一つのピクチャ内で複数回行なうように設定するようにしてもよい。
<符号化パラメータ決定手段の動作説明>
次に、図5におけるステップS507に関し、図9のフローチャートを用いて処理の流れを具体的に説明する。ステップS507を実行する符号化パラメータ決定ユニット110は、図14に示すように符号化パラメータ算出部110aと、フィルタ係数決定部110b、量子化スケール決定部110cを有しており、符号化パラメータ算出部110aは、ブロック歪み度の演算結果、符号量、目標ビットレートを入力値として、動画像符号化に用いる符号化パラメータを算出する。そして、この算出結果に基づいて、フィルタ係数決定部110b及び量子化スケール決定部110cは、それぞれ、プリフィルタ101に設定するフィルタ係数(C_LPF)、量子化器(QTZ)104に設定する量子化スケール(Qスケール)MQUANTを決定する。
図9のステップS901において、符号化パラメータ算出部110aは、ブロック歪み度の値(BN)に基づき、図10で示すように3つの領域に対応するAREA変数(0〜2)を取得する。ここで、ブロック歪み度(BN)の値は(15)(式)から1画素を8ビットで表現する場合には0〜28560までの値を取る。図10における、C_BN0、C_BN1は、歪み度(BN)を3つのAREAに分割するための設定値であり、これらの設定値と演算により求められた歪み度(BN)との大小関係を以下に示すように比較して、歪み度(BN)がどのAREAに対応するのかを、符号化パラメータ算出部110aは求める(S1〜S6)。
IF(BN < C_BN0) THEN (S1)
AREA =0 (S2)
ELSE IF(BN < C_BN1) THEN (S3)
AREA =1 (S4)
ELSE (S5)
AREA =2 ただし(C_BN1≧C_BN0) (S6)
このとき、AREAを分割する基準値C_BN0、C_BN1は入力画像を本発明の実施形態にかかる動画像符号化装置200に入力する前に予め設定しておくものとする。次に求められた各AREAに応じて、符号化パラメータ算出部110aは、以下の処理を実行する。
ステップS902において、AREA=0の場合(S902−Yes)、処理をステップS906に進める。このとき、フィルタ係数決定部110b及び量子化スケール決定部110cは、直前のマクロ・ブロックのブロック歪み度BNの値が小さいことからプリフィルタによる空間フィルタ処理及びTM5のアルゴリズムのSTEP2で求める量子化スケールの参照値Qj((6)式を参照)の値をそのまま使用して量子化スケールMQUANTとする。
ステップS903において、AREA=1の場合(S903−Yes)、処理をステップS904に進め、AREA1をパラメータC_BN2(図10(b)を参照)により更に2つの領域に分割する。符号化パラメータ算出部110aは、ブロック歪みが視覚的に目立つ程度に発生するか否かを次の方法で予測する(S7〜S14)。
IF(BN < C_BN2) THEN (S7)
WARN_BN = 0 (S8)
ELSE (S9)
IF(WRAN_BN_COUNT > C_BN_COUNT) THEN (S10)
WARN_BN = 1 (S11)
ELSE (S12)
WARN_BN = 0 (S13)
(C_BN1≧C_BN2≧C_BN0) (S14)
ここで、AREA=1を更に2つの領域に分割するパラメータC_BN2はパラメータC_BN0及びC_BN1と同様に予め設定するものとする。また、WARN_BNは、ブロック歪み度が大きく警告状態にあることを特定するためのパラメータであり、図9のステップS905において、符号化パラメータ算出部110aは、このパラメータの値を判定する。
WARN_BN=0である場合(S905−No)には、AREA=0の場合と同様の処理を行い(S906)、WARN_BN=1の場合には、AREA=0と同様の処理を行うか否かの判断を行う。
ここでは、過去におけるマクロ・ブロックに対する水平方向の1走査分におけるBNの値がC_BN2の値より大きかった回数を「WARN_BN_COUNT」として、予め設定した定数C_BN_COUNTより大きいか否かで判定を行う。WARN_BN=0の場合(S905−No)、は処理をステップS906に進め、WARN_BN=1の場合(S905−Yes)には、ブロック歪み度が大きく、警告状態にあるとしてプリフィルタ101のフィルタ係数を変更するように係数の設定を行なう(S907)。ステップS907では、ブロック歪み度を小さくするようにフィルタ係数(C_LPF)の値を変更するための処理を行ない、量子化スケール(MQUANT)は、ステップS906と同様に、量子化スケールの参照値Qjの値をそのまま使用して量子化スケールMQUANTとする。
フィルタ係数決定部110bは、フィルタ係数(C_LPF)を求める関数GET_F(BN)と図11(a)に示すデータテーブルにより、ブロック歪み度(BN)とパラメータC_BNi(i=2〜5)との関係を求め、対応するフィルタ係数(C_LPF)を特定する。ここで、特定されたフィルタ係数(C_LPF)がプリフィルタ101に設定される(S907)。
尚、ブロック歪み度(BN)≦C_BN2の場合は、ステップS906の処理と同様となり、この場合はフィルタ係数C_LPF=0となる。
また、C_BN1<ブロック歪み度(BN)の場合は、後に説明するステップS908におけるAREA2の処理と同様となる。
このようにブロック歪み度が警告すべき状態であるか否かを判定することで、視覚的に目立つブロック歪みの発生を予め回避することが可能となる。
一方、ステップS903の処理でAREA=2にブロック歪み度(BN)が該当する場合(S903−No)、処理をステップS908に進める。このAREAはブロック歪み度(BN)が大きい領域であるので、ここでは、空間フィルタ処理を変更するためのフィルタ係数の設定に加えて、量子化スケール(MQUANT)の変更を行なう。フィルタ係数の設定は、ステップS907における処理と同様に、フィルタ係数決定部110bが図11(b)のようなデータテーブルを用いて、対応するブロック歪み度(BN)に応じたフィルタ係数値(C_LPF)=Ci(i=1〜4)を特定し、プリフィルタ101に設定する。ここで設定されるフィルタ係数は、算出されたブロック歪み度のレベルが大きくなるにつれて、低周波領域の通過帯域の特性を実現するように設定される。
また、量子化スケール決定部110cは、TM5のアルゴリズムのSTEP2で求めた量子化スケールの参照値Qjに対して、更に、図11(b)に示すような定数ADD_Qi(i=1〜4)をブロック歪み度(BN)に応じて特定する。ここで特定された定数ADD_Qiが量子化スケールの参照値Qjに加算され、量子化器(QTZ)104に設定される。ここで量子化スケールの参照値Qjは、TM5のアルゴリズムにおけるSTEP2において(4)式及び(5)式により与えられ、目標符号量(目標ビットレート)とMPEG符号化装置100におけるVLC105より出力される符号量に基づいて演算されるものである。この参照値Qjにブロック歪み度の値のレベルに応じた値(ADD_Qi(i=1〜4))が加算されることにより量子化スケールが変更され、次のピクチャに対する符号量制御にブロック歪の情報が反映される。
尚、図11(a),(b)におけるパラメータC_BN3〜C_BN8は、AREAを分割するためのパラメータC_BN0及びC_BN1と同様に予め設定するものとする。このようにしてブロック歪み度が大きい領域にある場合、フィルタ係数と量子化スケールとを変更して、視覚的に目立つブロック歪みの発生を予め効果的に回避することが可能になる。
以上説明したように、本実施形態によれば、プリフィルタを用いて符号量を制御するに当たり、直前までのブロック毎に求められたブロック歪み度のレベルに基づき、フィルタ係数及び量子化スケールのうち、少なくとも一方の設定を変えることで、人間の視覚特性を反映した歪みのない高画質な復号画像を得られるためのフィルタ制御、符号量制御を実現することが可能になる。
[その他の実施形態]
また、本発明の目的は前述したように、実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体をシステムあるいは装置に提供し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行することによっても達成されることは言うまでもない。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
プログラムコードを供給するための記憶媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、CD-ROM、CD-R、磁気テープ、不揮発性のメモリカード、ROMなどを用いることができる。
また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれていることは言うまでもない。
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書きこまれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含むことは言うまでもない。
本発明にかかる動画像符号化方法を実現する装置の構成を示す動画像符号化装置200のブロック図である。 符号量制御アルゴリズム(TM5)のSTEP2を説明する図である。 特許文献1において示されるバランス関数を説明する図である。 従来技術におけるフィルタ係数を決定するための処理を説明する図である。 本発明の実施形態にかかる動画像符号化処理の流れを説明するフローチャートである。 3x3正方マトリクスの空間フィルタを例示する図である。 フィルタ係数(C_LPF)の値と3x3正方マトリクスのフィルタ係数との関係を示す図である。 マクロ・ブロックと、これを構成する8×8の画素ブロックの境界画素を例示的に示す図である。 本発明の実施形態にかかる符号化パラメータの決定処理を説明するフローチャートである。 ブロック歪み度BNを分類する3つの領域(AREA)を説明する図である。 ブロック歪み度(BN)に対応した、フィルタ係数(C_LPF)および量子化スケール値(Q)に加算するための定数(ADD_Q)の関係を示すデーテーブルの構成を例示する図である。 符号化対象ピクチャを例示する図である。 ブロック歪み度算出ユニット109の構成を示すブロック図である。 符号化パラメータ決定ユニット110の構成を示すブロック図である。

Claims (10)

  1. 動画像を量子化して符号化する符号化手段と、当該符号化されたデータを局所的に復号する復号手段を有する動画像符号化装置において、
    符号化の条件に応じて可変に設定することが可能なフィルタ係数に従い、入力される前記動画像に対して空間フィルタ処理を施すプリフィルタと、
    前記プリフィルタから出力される前記動画像と、前記復号手段から出力される復号画像とに基づき当該動画像のブロック歪み度を算出する算出手段と、
    前記算出されたブロック歪み度と、前記符号化手段により符号化された動画像に対する符号量とに従い、前記フィルタ係数及び当該符号化手段における量子化を制御するための量子化スケールのうち少なくとも一方の設定を変更するためのパラメータを決定する決定手段と、
    を備えることを特徴とする動画像符号化装置。
  2. 前記決定手段は、前記算出されたブロック歪み度に応じて、
    前記プリフィルタを動作させないように前記フィルタ係数を決定することを特徴とする請求項1に記載の動画像符号化装置。
  3. 前記決定手段は、前記算出されたブロック歪み度のレベルに応じて、前記プリフィルタを低周波領域の通過帯域の特性を与えるように前記フィルタ係数を決定することを特徴とする請求項1に記載の動画像符号化装置。
  4. 前記決定手段は、前記算出されたブロック歪み度のレベルに応じて、前記プリフィルタを低周波領域の通過帯域の特性を与えるように前記フィルタ係数を決定し、更に、前記歪み度のレベルに応じて前記量子化スケールの値を変更するための値を決定することを特徴とする請求項1に記載の動画像符号化装置。
  5. 動画像を量子化して符号化する符号化手段と、当該符号化されたデータを局所的に復号する復号手段を有する動画像符号化装置において実行する動画像符号化方法であって、
    符号化の条件に応じて可変に設定することが可能なフィルタ係数に従い、入力される前記動画像に対して空間フィルタ処理を実行するフィルタ処理工程と、
    前記空間フィルタ処理がされた前記動画像と、前記復号手段から出力される復号画像とに基づき当該動画像のブロック歪み度を算出する算出工程と、
    前記算出されたブロック歪み度と、前記符号化手段により符号化された動画像に対する符号量とに従い、前記フィルタ係数及び前記符号化手段における量子化を制御するための量子化スケールのうち少なくとも一方の設定を変更するためのパラメータを決定する決定工程と、
    を備えることを特徴とする動画像符号化方法。
  6. 前記決定工程は、前記算出されたブロック歪み度に応じて、前記フィルタ処理工程における前記空間フィルタ処理を実行させないように前記フィルタ係数を決定することを特徴とする請求項5に記載の動画像符号化方法。
  7. 前記決定工程は、前記算出されたブロック歪み度のレベルに応じて、前記プリフィルタを低周波領域の通過帯域の特性を与えるように前記フィルタ係数を決定することを特徴とする請求項5に記載の動画像符号化方法。
  8. 前記決定工程は、前記算出されたブロック歪み度のレベルに応じて、前記プリフィルタを低周波領域の通過帯域の特性を与えるように前記フィルタ係数を決定し、更に、前記歪み度のレベルに応じて前記量子化スケールの値を変更するための値を決定することを特徴とする請求項5に記載の動画像符号化方法。
  9. 請求項5乃至請求項8のいずれか1項に記載の動画像符号化方法をコンピュータによって実行させることを特徴とするプログラム。
  10. 請求項5乃至請求項8のいずれか1項に記載の動画像符号化方法をコンピュータによって実行させるためのプログラムを格納することを特徴とする記憶媒体。
JP2003409357A 2003-12-08 2003-12-08 画像符号化装置及び画像符号化方法 Expired - Fee Related JP4343667B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2003409357A JP4343667B2 (ja) 2003-12-08 2003-12-08 画像符号化装置及び画像符号化方法
US11/003,461 US20050123038A1 (en) 2003-12-08 2004-12-06 Moving image encoding apparatus and moving image encoding method, program, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003409357A JP4343667B2 (ja) 2003-12-08 2003-12-08 画像符号化装置及び画像符号化方法

Publications (3)

Publication Number Publication Date
JP2005175621A true JP2005175621A (ja) 2005-06-30
JP2005175621A5 JP2005175621A5 (ja) 2007-02-08
JP4343667B2 JP4343667B2 (ja) 2009-10-14

Family

ID=34730767

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003409357A Expired - Fee Related JP4343667B2 (ja) 2003-12-08 2003-12-08 画像符号化装置及び画像符号化方法

Country Status (1)

Country Link
JP (1) JP4343667B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007300557A (ja) * 2006-05-02 2007-11-15 Canon Inc 画像符号化装置及び画像符号化方法
JP2009094644A (ja) * 2007-10-04 2009-04-30 Canon Inc 動画像符号化装置及びその制御方法
JP4999865B2 (ja) * 2006-12-28 2012-08-15 日本電信電話株式会社 映像処理方法および装置、映像処理プログラム並びにプログラムを記録した記憶媒体
WO2014171198A1 (ja) * 2013-04-19 2014-10-23 リコーイメージング株式会社 撮影装置及び撮影制御システム
JP2018046407A (ja) * 2016-09-14 2018-03-22 日本放送協会 レート制御装置、映像復号装置、及び、プログラム
JP2022534572A (ja) * 2019-05-30 2022-08-02 エーティーアイ・テクノロジーズ・ユーエルシー 映像圧縮のための前処理

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007300557A (ja) * 2006-05-02 2007-11-15 Canon Inc 画像符号化装置及び画像符号化方法
JP4999865B2 (ja) * 2006-12-28 2012-08-15 日本電信電話株式会社 映像処理方法および装置、映像処理プログラム並びにプログラムを記録した記憶媒体
US8467460B2 (en) 2006-12-28 2013-06-18 Nippon Telegraph And Telephone Corporation Video processing method and apparatus, video processing program, and storage medium which stores the program
JP2009094644A (ja) * 2007-10-04 2009-04-30 Canon Inc 動画像符号化装置及びその制御方法
WO2014171198A1 (ja) * 2013-04-19 2014-10-23 リコーイメージング株式会社 撮影装置及び撮影制御システム
JP2018046407A (ja) * 2016-09-14 2018-03-22 日本放送協会 レート制御装置、映像復号装置、及び、プログラム
JP2022534572A (ja) * 2019-05-30 2022-08-02 エーティーアイ・テクノロジーズ・ユーエルシー 映像圧縮のための前処理
JP7504132B2 (ja) 2019-05-30 2024-06-21 エーティーアイ・テクノロジーズ・ユーエルシー 映像圧縮のための前処理

Also Published As

Publication number Publication date
JP4343667B2 (ja) 2009-10-14

Similar Documents

Publication Publication Date Title
JP6335365B2 (ja) 復号装置
JP4455487B2 (ja) 復号化装置及び復号化方法及びプログラム
JP5215951B2 (ja) 符号化装置及びその制御方法、コンピュータプログラム
JPWO2006098226A1 (ja) 符号化装置および符号化装置を備えた動画像記録システム
US7965768B2 (en) Video signal encoding apparatus and computer readable medium with quantization control
JP5078837B2 (ja) 符号化装置、符号化装置の制御方法及びコンピュータプログラム
JPH09200758A (ja) 画像符号化装置
JP4343667B2 (ja) 画像符号化装置及び画像符号化方法
JP5111128B2 (ja) 符号化装置、符号化装置の制御方法及びコンピュータプログラム
EP1602232A2 (en) Method and apparatus for perceptual model based video compression
JP6946979B2 (ja) 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム
JP2007053620A (ja) 画像処理装置および画像処理方法
JP4942208B2 (ja) 符号化装置
JP2003069997A (ja) 動画像符号化装置
JP4857243B2 (ja) 画像符号化装置及びその制御方法、コンピュータプログラム
JP5006763B2 (ja) 画像符号化装置及びその制御方法、コンピュータプログラム
JP2009017127A (ja) 符号化装置および符号化方法
KR20150096353A (ko) 이미지 인코딩 시스템, 디코딩 시스템 및 그 제공방법
JPWO2020008858A1 (ja) 動画像符号化装置、動画像符号化方法、プログラム
JPH10108197A (ja) 画像符号化装置、画像符号化制御方法および画像符号化制御用プログラムを記録した媒体
JP2007300557A (ja) 画像符号化装置及び画像符号化方法
JP6985899B2 (ja) 画像符号化装置及びその制御方法並びにプログラム
JPH11331850A (ja) 動画像符号化方式
JPH10285589A (ja) 画像符号化装置および方法、ならびに画像符号化制御用プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2007081744A (ja) 動画像符号化装置及び動画像符号化方法

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061208

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061208

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080814

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080825

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081023

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090525

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090609

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090703

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090709

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120717

Year of fee payment: 3

R150 Certificate of patent (=grant) or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees