JP4820800B2 - 画像符号化方法、画像符号化装置、及び画像符号化プログラム - Google Patents

画像符号化方法、画像符号化装置、及び画像符号化プログラム Download PDF

Info

Publication number
JP4820800B2
JP4820800B2 JP2007282077A JP2007282077A JP4820800B2 JP 4820800 B2 JP4820800 B2 JP 4820800B2 JP 2007282077 A JP2007282077 A JP 2007282077A JP 2007282077 A JP2007282077 A JP 2007282077A JP 4820800 B2 JP4820800 B2 JP 4820800B2
Authority
JP
Japan
Prior art keywords
frequency component
image
spatial frequency
block
mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007282077A
Other languages
English (en)
Other versions
JP2009111733A (ja
Inventor
幸浩 坂東
和也 早瀬
誠之 高村
一人 上倉
由幸 八島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2007282077A priority Critical patent/JP4820800B2/ja
Publication of JP2009111733A publication Critical patent/JP2009111733A/ja
Application granted granted Critical
Publication of JP4820800B2 publication Critical patent/JP4820800B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、画像符号化方法、画像符号化装置、及び画像符号化プログラムに関する。
[二乗誤差規範のコスト関数を用いる符号化方式]
H.264では、イントラ予測及び可変形状動き補償の導入に伴い、従来の標準化方式と比べて、予測モードの種類が増加している。このため、一定の主観画質を保持しつつ、符号量を削減するには、適切な予測モードを選択する必要がある。H.264の参照ソフトウェアJMでは、次式(1)に示すR−Dコストを最小化する予測モードを選択している(非特許文献1参照)。
Figure 0004820800
ここで、Sは原信号、qは量子化パラメータ、mは予測モードを表す番号であり、Sm,qはSに対してモードmを用いて予測し、qを用いて量子化した場合の復号信号である。また、λはモード選択に用いるラグランジェの未定乗数である。さらに、D(S,(^)Sm,q)は次式(2)に示す二乗誤差和である。
Figure 0004820800
ここで、S、S、Sは原信号のY,U,V成分であり、S m,q、S m,q、S m,qは復号信号のY,U,V成分である。
H.264における復号信号の算出手順を以下に説明する。なお、説明に用いる記号を図10にまとめる。H.264の符号化処理では、モード番号mの予測を用いた場合の予測誤差信号R(=S−Pm)に対して、変換行列Φを用いた直交変換が次式(3)のように施される。
Figure 0004820800
Φは変換行列Φに対する転置行列を表す。なお、変換行列Φは次式(4)で表される整数要素の直交行列である。
Figure 0004820800
次に、行列Φが非正規行列であるため、次式(5)に従って行列の正規化に相当する処理を行う。
Figure 0004820800
これは、数式(3)においてΦの代わりに次式(6)のφを用いることに相当する。
Figure 0004820800
さらに、Cに対して、量子化パラメータqを用いた量子化が次式(7)の通り施される。なお、参照ソフトウェアJMでは、正規化は、量子化の中に組み込まれている。
Figure 0004820800
一方、H.264の復号処理では、Vに対して、次式(8)のように逆量子化を施し、変換係数の復号値を得る。
Figure 0004820800
次に、(^)Cに対して、次式(9)のように、逆変換を施し、予測誤差の復号信号を得る。
Figure 0004820800
最後に、次式(10)により、符号化対象画像の復号信号を得る。
Figure 0004820800
[主観画質を考慮した歪み量への重み付け]
前述した通り、参照ソフトウェアJMで用いられている主観画質の尺度は、二乗誤差である。しかしながら、この二乗誤差は、必ずしも、主観的な画質劣化を反映した歪み量ではない。例えば、高周波数成分の変化は、低周波成分の変化に比べて、視覚的には、検知されにくい。しかしながら、こうした視覚特性を利用していない符号化器(例えば、参照ソフトウェアJM)には、符号量の効率的な削減に関して、改良の余地が残る。
そこで、時空間周波数成分に対して視覚感度に差があることを利用する検討がなされている。直交変換係数に対して、視覚感度に応じて空間周波数成分毎に歪み量の重み付けを行うことで、主観画質に対応した歪み量を定義する。さらに、時間方向の視覚感度も考慮して、上述した重み付けされた歪み量に対して、変移量に応じてさらに重み付けを行う。こうして、時空間の視覚感度に基づいて重み付けされた歪み量を、符号化パラメータ選択のコスト関数において用いる。
次に、量子化誤差信号に対する視覚感度に基づく重み付けについて説明する。量子化誤差信号に対する視覚感度に基づく重み付けとしは、例えば、次式(11)で表わされるR−Dコストがある。
Figure 0004820800
ここで、Cはモード番号mを用いた場合の予測残差信号Rに対する変換係数であり、Cm,qはCを量子化パラメータqで量子化・逆量子化して得られる係数の復号値である。このR−Dコストの計算に用いる歪み量として、次式(12)に示す重み付け歪み量を用いる。
Figure 0004820800
ここで、Cγ(i) [k,l](γ=Y,U,V)は、Cの要素であり、マクロブロック(Y成分の場合、16×16[画素]、U,V成分の場合、8×8[画素])内のサブブロック(N×N[画素])のうち、ラスター走査においてi番目に走査されるサブブロックに含まれる変換係数である。また、(^)Cγ(i) [k,l](γ=Y,U,V)は、Cm,qの要素であり、マクロブロック(Y成分の場合、16×16[画素]),U,V成分の場合、8×8[画素])内のサブブロック(N×N[画素])のうち、ラスター走査においてi番目に走査されるサブブロックに含まれる復号変換係数である。
さらに、Wγ k,l(γ=Y,U,V)は、1以下に設定される重み係数であり、以下では、感度係数と呼ぶ。感度係数の算出については、[感度係数の算出]にて詳述する。上記数式(12)において、Wγ k,lを小さな値に設定することは、量子化歪みD(C,Cm,q)を小さく見積もることに相当する。
なお、直交変換の正規性より、Wγ k,l=1(k,l;γ=Y,U,V)とすれば、上述した重み付け歪み量は、二乗誤差和と等価となる。Wγ k,l(γ=Y,U,V)は、空間周波数及び時間周波数が高いほど、小さな値をとる。なお、直交変換の正規性より、Wγ k,l=1(k,l;γ=Y,U,V)とすれば、上述した重み付け歪み量は、二乗誤差和と等価となる。
K.P.Lim and G.Sullivan and T.Wiegand, Text Description of Joint Model Reference Encoding Methods and Decoding Concealment Methods. Joint Video Team (JVT) of ISO/IEC MPEG and ITU-T VCEG, JVT-R95, Jan., 2006. http://ftp3.itu.ch/av-arch/jvt-site/2006-01-Bangkok/JVT-R095.zip
上述したコスト感度関数に基づく歪み量への重み付けを行う方法では、マクロブロック単位に感度関数による重み付けを行うため、重み付け後の歪み量にブロック境界における不連続性(ブロック歪み)が反映されない。動き補償によるフレーム間予測と直交変換を組み合わせたブロックベースの符号化方式(例えば、H.264)では、ブロック歪みは、特徴的な符号化歪みである。このため、ブロック歪みが考慮されていない場合、得られた重み付き歪み量が主観画質を正しく反映できないケースが発生する。
符号化歪み尺度においてブロック歪みが反映されなかった原因について説明する。従来技術では、各マクロブロックのDCT係数に対して、コントラスト感度関数に基づき重み付けを行っていた。このため、各マクロブロック内の波形に対するコントラスト感度は反映していたが、隣接ブロック間の不連続性については、考慮されていなかった。図11に示す1次元信号を例に取ると、各ブロック(ブロックk−1、ブロックk、ブロックk+1)のDCT係数に対して重み付けを行うブロックに閉じた処理では、ブロック間の不連続性(ブロックk −1とブロックkの間の不連続性、あるいは、ブロックkとブロックk+1の間の不連続性)を知り得ない。
すなわち、上述した従来技術では、画素単位でしか画質を考慮していなかった。このため、画素単位の主観画質しか担保できておらず、ブロック歪みが発生し、復号画像の画質を大きく劣化させるという問題があった。
本発明は、このような事情を考慮してなされたものであり、その目的は、動き補償によるフレーム間予測と直交変換を組み合わせたブロックベースの符号化方式において、ブロック歪みによる復号画像の画像劣化を防止することができ、かつ、符号量を削減することができる画像符号化方法、画像符号化装置、及び画像符号化プログラムを提供することにある。
上述した課題を解決するために、本発明は、画像信号、あるいは、フレーム内予測及びフレーム間予測により得られた予測誤差信号に対して、変換符号化、量子化による情報圧縮を行う画像符号化方法において、歪み量、符号量、未定乗数からなるラグランジェのコスト関数に基づいて、動画像符号化における動き補償ブロックサイズ、インター予測モード、量子化パラメータ、静止画像符号化における量子化パラメータ、イントラ予測モード等の符号化パラメータを決定する際、ブロック内の空間周波数成分、及び隣接ブロック間の不連続性に関する空間周波数成分を計測するステップと、さらに、ブロック内の時間周波数成分、及び隣接ブロック間の不連続性に関する時間周波数成分を推定するステップと、前記空間周波数成分及び前記時間周波数成分の成分毎に、視覚感度関数に基づいて、重要度を算出するステップと、前記重要度に基づいて、周波数毎に重み付けされた二乗誤差として得られる歪み量を用いて符号量との加重和としてコスト関数を設定するステップと、前記コスト関数を最小化するモードを選択するステップと、を含むことを特徴とする画像符号化方法である。
本発明は、上記の発明において、ブロック内の空間周波数成分を計測する際、符号化に用いる直交変換の基底画像に対して、水平・垂直方向のサンプル数が各々、2倍になるように、零値を加えた修正基底画像を生成するステップと、前記修正基底画像に対して、離散フーリエ変換係数を計算することで、ブロック内の空間周波数成分及び隣接ブロック間の不連続性に関する空間周波数成分を算出するステップとを更に含むことを特徴とする。
また、上述した課題を解決するために、本発明は、画像信号、あるいは、フレーム内予測及びフレーム間予測により得られた予測誤差信号に対して、変換符号化、量子化による情報圧縮を行う画像符号化装置において、歪み量、符号量、未定乗数からなるラグランジェのコスト関数に基づいて、動画像符号化における動き補償ブロックサイズ、インター予測モード、量子化パラメータ、静止画像符号化における量子化パラメータ、イントラ予測モード等の符号化パラメータを決定する際、ブロック内の空間周波数成分、及び隣接ブロック間の不連続性に関する空間周波数成分を計測する空間周波数成分計測手段と、さらに、ブロック内の時間周波数成分、及び隣接ブロック間の不連続性に関する時間周波数成分を推定する時間周波数成分推定手段と、前記空間周波数成分及び前記時間周波数成分の成分毎に、視覚感度関数に基づいて、重要度を算出する重要度算出手段と、前記重要度に基づいて、周波数毎に重み付けされた二乗誤差として得られる歪み量を用いて符号量との加重和としてコスト関数を設定するコスト関数設定手段と、前記コスト関数を最小化するモードを選択するモード選択手段と、を備えることを特徴とする画像符号化装置である。
本発明は、上記の発明において、前記空間周波数計測手段は、ブロック内の空間周波数成分を測定する際、符号化に用いる直交変換の基底画像に対して、水平・垂直方向のサンプル数が各々、2倍になるように、零値を加えた修正基底画像を生成する修正基底画像生成手段と、前記修正基底画像に対して、離散フーリエ変換係数を計算することで、ブロック内の空間周波数成分及び隣接ブロック間の不連続性に関する空間周波数成分を算出する空間周波数成分算出手段とを備えることを特徴とする。
また、上述した課題を解決するために、本発明は、画像信号、あるいは、フレーム内予測及びフレーム間予測により得られた予測誤差信号に対して、変換符号化、量子化による情報圧縮を行う画像符号化装置を制御するコンピュータに、歪み量、符号量、未定乗数からなるラグランジェのコスト関数に基づいて、動画像符号化における動き補償ブロックサイズ、インター予測モード、量子化パラメータ、静止画像符号化における量子化パラメータ、イントラ予測モード等の符号化パラメータを決定する際、ブロック内の空間周波数成分、及び隣接ブロック間の不連続性に関する空間周波数成分を計測するステップと、さらに、ブロック内の時間周波数成分、及び隣接ブロック間の不連続性に関する時間周波数成分を推定するステップと、前記空間周波数成分及び前記時間周波数成分の成分毎に、視覚感度関数に基づいて、重要度を算出するステップと、前記重要度に基づいて、周波数毎に重み付けされた二乗誤差として得られる歪み量を用いて符号量との加重和としてコスト関数を設定するステップと、前記コスト関数を最小化するモードを選択するステップと、を実行させることを特徴とする画像符号化プログラムである。
この発明によれば、ブロック内の空間周波数成分、及び隣接ブロック間の不連続性に関する空間周波数成分を計測し、さらに、ブロック内の時間周波数成分、及び隣接ブロック間の不連続性に関する時間周波数成分を推定し、空間周波数成分及び時間周波数成分の成分毎に、視覚感度関数に基づいて、重要度を算出し、該重要度に基づいて、周波数毎に重み付けされた二乗誤差として得られる歪み量を用いて符号量との加重和としてコスト関数を設定し、該コスト関数を最小化するモードを選択する。したがって、動き補償によるフレーム間予測と直交変換を組み合わせたブロックベースの符号化方式において、ブロック歪みによる復号画像の画像劣化を防止することができ、かつ、符号量を削減することができるという利点が得られる。
また、本発明によれば、ブロック内の空間周波数成分を計測する際、符号化に用いる直交変換の基底画像に対して、水平・垂直方向のサンプル数が各々、2倍になるように、零値を加えた修正基底画像を生成し、該修正基底画像に対して、離散フーリエ変換係数を計算することで、ブロック内及び隣接ブロック間の不連続性に関する空間周波数成分を算出する。したがって、動き補償によるフレーム間予測と直交変換を組み合わせたブロックベースの符号化方式において、ブロック歪みによる復号画像の画像劣化を防止することができ、かつ、符号量を削減することができるという利点が得られる。
以下、本発明の一実施形態を、図面を参照して説明する。
A.本発明の原理
本発明の原理について説明する。本発明では、ブロック歪みを考慮した歪み尺度を導入し、符号化パラメータの設定に用いるコスト関数において、ブロック歪みを考慮した符号化パラメータを設定する。具体的には、同歪み尺度の計算時に、隣接ブロックとの不連続性に対しても、周波数分析を行い、隣接ブロックとの不連続性を歪み尺度の計算時に反映させる。そこで、ブロック内の波形とあわせて、隣接ブロック間の不連続性も考慮した周波数分析を行い、コントラスト感度関数に基づき歪み量に対する重み付けを行う。
[感度係数の算出]
上述した重み付けの係数の算出において、入力となるのは、変換行列と変移量である。なお、以下では、縦幅Hの画像を視距離rHにおいて観測する場合を考える。rを視距離パラメータと呼ぶ。
変換行列Φ(N×N行列)の第k列ベクトル(N次元ベクトル)をφとすると、同行列に対する基底画像は、次式より得られる。なお、H.264の場合、Nとして取りうる値は4または8のいずれかである。
Figure 0004820800
ここで、φ はφの転置ベクトルである。各基底画像fk,l(x,y)(0≦x,y≦N−1)に対して、ゼロ埋めにより、サイズを2倍に拡大する。ゼロ埋めの方法としては、例えば、次式(14)、(15)のような方法がある。
ゼロパディング方法1:
Figure 0004820800
ゼロパディング方法2:
Figure 0004820800
ゼロ埋めの結果得られる(〜)fk,l(x,y)を修正基底画像と呼ぶ。例えば、N=4の場合には、図9(a)、(b)に示すように、網掛け部の4×4画素に、基底画像が配置され、それ以外の位置に、零値がパディングされる(ゼロ埋め)。図9(a)が上記セロパディング方法1であり、図9(b)が上記セロパディング方法2である。修正基底画像に対して、次式(16)に示す離散フーリエ変換を施し、フーリエ係数を得る。なお、以下では、N=2とおく。
Figure 0004820800
ここで、jは虚数単位である。
上記数式(16)によるフーリエ係数を次式(17)に示す。
Figure 0004820800
さらに、数式(17)に対して、次式(18)に示す重み付けを行う。
Figure 0004820800
以下、数式(18)の右辺の第1項の(^)Fk,l(u,v)について説明する。ここで、g(η,w)は、視覚感度関数として知られる関数であり、次式(19)のような関数形で表される。
Figure 0004820800
ここで、a,b,c,dは、視覚感度関数の関数形を定めるパラメータ(以後、モデルパラメータと呼ぶ)であり、例えば、次式(20)で示すような値が用いられる。
Figure 0004820800
また、式(19)において、ηは、次式(21)で示す値とする。
Figure 0004820800
θ(r,H)は、縦幅Hの画像を視距離rHにおいて観測する場合の一画素あたりの角度であり、次式(22)により与えられる。
Figure 0004820800
ωは単位時間当たりの角度の変化量[degrees/sec]であり、以下のように設定される。このマクロブロックの変移量が(d,d)と推定され、縦幅Hの画像を視距離rHにおいて観測する場合、単位時間当たりの角度の変化量は、次式(23)により与えられる。
Figure 0004820800
ここで、fは、フレームレートである。k,l基底に対する感度係数を次式(24)で示す電力比として定義する。
Figure 0004820800
なお、W k,l(ω),W k,l(ω)についても同様に求めることができる。このとき、輝度成分と色差成分とでモデルパラメータを変更することも可能である。
B.第1実施形態
図1は、本発明の第1実施形態によるモード選択装置の構成を示すブロック図である。図において、変移量記憶部300は、推定変移量を記憶する。初期モード設定部301は、初期モードを設定する。モード記憶部302は、初期設定されたモードを記憶するとともに、適宜、後述するモード設定部316により設定されたモードを記憶(更新)する。
符号量算出部303は、入力される符号化対象フレーム信号、参照フレーム信号及び量子化パラメータに基づいて、符号量を算出する。符号量記憶部304は、算出された符号量を記憶する。重み付き歪み量算出部305は、モード記憶部302に記憶されているモードに従って、変移量記憶部300に記憶されている変移量から重み付き歪み量を算出する。重み付き歪み量記憶部306は、算出された重み付き歪み量を記憶する。未定乗数算出部307は、入力される符号化対象フレーム信号、参照フレーム信号及び量子化パラメータに基づいて、未定乗数を算出する。未定乗数記憶部308は、算出された未定乗数を記憶する。
コスト算出部(コスト関数設定手段)309は、符号量記憶部304に記憶されている符号量と、重み付き歪み量記憶部306に記憶されている重み付き歪み量と、未定乗数記憶部308に記憶されている未定乗数とに基づいて、コストを算出する。コスト記憶部310は、算出されたコストを記憶する。最小コスト判定部(モード選択手段)311は、コスト記憶部310に記憶されているコストから、最小コストを判定する。最小コスト記憶部312は、最小コスト判定部311により判定された最小コストを記憶する。
最適モード更新部313は、最小コスト判定部311により、算出したコストがレジスタに格納されているコストの最小値より小さいと判定された場合に、その時点でモード記憶部302に記憶されているモードを最適モード記憶部314に格納する。最適モード記憶部314は、算出したコストがレジスタに格納されているコストの最小値より小さいと判定された時点のモードを最適モードとして記憶する。
最終モード判定部315は、全てのモードについて処理を終えたか否か、すなわち最終モードであるか否かを判定し、最終モードでない場合には、最小コスト判定311の判定結果をモード設定部(モード選択手段)316に供給し、最終モードである場合には、最小コスト判定311の判定結果を最適モード出力部316に供給する。最適モード出力部316は、最終モード判定部315から最小コスト判定311の判定結果が供給されると、すなわち、全てのモードについて処理を終えると、最適モード記憶部314に記憶されている最適モードを出力する。
図2は、上述した重み付き歪み量算出部305の構成を示すブロック図である。図において、変換係数正規化部401は、入力される変換係数を正規化する。正規化変換係数記憶部402は、正規化された変換係数を記憶する。変換係数復号部403は、入力される変換係数を復号する。復号変換係数記憶部404は、復号された変換係数を記憶する。変移量記憶部408は、入力される変換量を記憶する。
感度係数算出部(空間周波数成分計測手段、時間周波数成分推定手段、重要度算出手段、空間周波数成分算出手段)409は、変移量記憶部408に記憶されている変移量から感度係数を算出する。感度係数記憶部410は、算出された感度係数を記憶する。感度係数乗算部407は、歪み量記憶部406から歪み量を読み出し、感度係数記憶部410から読み出した感度係数を乗算する。歪み量記憶部411は、感度係数が乗算された歪み量を記憶する。歪み量和算出部412は、歪み量記憶部411から読み出した歪み量を加算し、重み付き歪み量として出力する。
図3は、上述した感度係数算出部409の構成を示すブロック図である。図において、変換係数記憶部601は、入力される変換係数を記憶する。変換行列サイズ記憶部602は、入力される変換行列サイズを記憶する。基底画像算出部603は、変換係数記憶部601から読み出した変換係数と、変換行列サイズ記憶部602から読み出した変換行列サイズとに従って、基底画像を算出する。基底画像記憶部604は、算出された基底画像を記憶する。
修正基底画像算出部(修正基底画像生成手段)605は、基底画像記憶部604から読み出した基底画像を、変換行列サイズ記憶部602から読み出した変換行列サイズに従って、修正基底画像を算出する。修正基底画像記憶部606は、修正された基底画像を記憶する。コントラスト感度関数記憶部607は、入力されるコントラスト感度関数を記憶する。乗算部608は、修正基底画像記憶部606から読み出した修正された基底画像と、コントラスト感度関数記憶部607から読み出したコントラスト感度関数とを乗算する。加算部609は、乗算された値を加算し、感度係数として出力する。
図4は、本実施形態による、符号化モード選択処理の動作を説明するためのフローチャートである。まず、初期モード設定部301で、モードの初期値を設定する(ステップS101)。具体的には、最小コスト、最適モードを格納するレジスタを初期化する。次に、変移量記憶部300に変移量を格納する(ステップS102)。次に、符号量算出部303で、符号量を算出し(ステップS103)、重み付き歪み量算出部305で、重み付き歪み量を算出する(ステップS104)。なお、重み付き歪み量の算出の詳細については後述する。
次に、未定乗数算出部で、未定乗数を算出し(ステップS105)、コスト算出部309で、符号量、重み付き歪み量、及び未定乗数により、コストを算出する(ステップS106)。次に、最小コスト判定部311で、算出したコストが最小コスト記憶部312(レジスタ)に格納されているコストの最小値より小さいか否かを判定し(ステップS107)、最小値より小さくない場合には、モードを変更し(ステップS111)、ステップS103に戻り、変更されたモードで、符号量、重み付き符号量、未定乗数、コストの算出を行う。
一方、算出したコストがレジスタに格納されているコストの最小値より小さい場合には、算出されたコストを格納し(ステップS108)、その時点のモードを格納する(ステップS109)。次に、全てのモードについて処理を終えたか否かを判定し(ステップS110)、終えていない場合には、モードを変更し(ステップS111)、ステップS103に戻り、変更されたモードで、上述した処理を繰り返す。一方、全てのモードについて処理を終えた場合には、当該処理を終了する。
図5は、上記ステップS104の重み付き歪み量の算出手順を示すフローチャートである。まず、変換係数正規化部401で、入力される変換係数を正規化し(ステップS201)、変換係数復号部403で、入力される変換係数を復号する(ステップS202)。次に、変換量を読み込み(ステップS203)、感度係数算出部409で感度係数を算出し、感度係数を設定する(ステップS204)。次に、カウンタi、レジスタS(歪み量記憶部411)を0に初期化し(ステップS205)、歪み量算出部405で、変換係数の第i成分の符号化歪みを算出する(ステップS206)。
次に、感度係数乗算部407で、変換係数の第i成分の符号化歪みに感度係数を乗じ(ステップS207)、歪み量和算出部412で、感度係数を乗じた符号化歪み(歪み量)をレジスタS(歪み量記憶部411)に加算する(ステップS208)。次に、変換係数の全成分について処理が終了したか否かを判定し(ステップS209)、全て終了していない場合には、カウンタiに1加算し(ステップS210)、ステップS206に戻り、次の成分について上述した処理を繰り返す。以下、全成分について終了するまでカウンタiに1を加算して上述した処理を繰り返す。そして、変換係数の全成分について処理が終了すると、当該処理を終了する。
図6は、上記ステップS204の感度係数の設定手順を示すフローチャートである。まず、変換行列(DCT)のサイズ(N×Nとする)を読み込み(ステップS501)、カウンタiを0に初期化する(ステップS502)。次に、基底画像算出部603で、変換行列(DCT)における、第i番目の基底画像を算出し(ステップS503)、修正基底画像算出部605で、前述した数式(21)に従って、ゼロ埋めにより、該基底画像に対して2倍のサイズの画像(2N×2Nの画像:修正基底画像)を生成する(ステップS504)。
次に、修正基底画像に対して、周波数分析(DFT)を行い、修正基底画像内の周波数成分の分布を算出する(ステップS505)。次に、コントラスト感度関数(CSF)を読み込み(ステップS506)、カウンタk、レジスタW[i]を0に初期化する(ステップS507)。次に、乗算部608で、前述した数式(22)に従って、修正基底画像の周波数成分の第k成分に対してコントラスト感度関数の対応する値を乗じ(ステップS508)、加算部609で、該乗算の結果得られた値を、レジスタW[i]に加算する(ステップS509)。
次に、修正基底画像の全周波数成分について処理が終了したか否かを判定し(ステップS510)、全周波数成分について終了していない場合には、カウンタkに1加算し(ステップS511)、ステップS508に戻り、上述した処理を繰り返す。一方、全周波数成分について処理が終了した場合には、全ての基底画像について処理が終了したか否かを判定し(ステップS512)、全ての基底画像について終了していない場合には、カウンタiに1加算し(ステップS513)、ステップS503に戻り、上述した処理を繰り返す。そして、全ての基底画像について処理が終了すると、当該処理を終了する。
C.第2実施形態
次に、本発明の第2実施形態について説明する。上述した第1実施形態では、モード選択による例であったが、本第2実施形態では、量子化パラメータを選択するようになっている。
図7は、本第2実施形態による量子化パラメータ選択装置の構成を示すブロックである。図において、変移量記憶部800は、推定変移量を記憶する。初期量子化パラメータ設定部801は、初期量子化パラメータを設定する。量子化パラメータ記憶部802は、初期設定された量子化パラメータを記憶するとともに、適宜、後述する量子化パラメータ設定部816により設定された量子化パラメータを記憶(更新)する。
符号量算出部803は、入力される符号化対象フレーム信号、参照フレーム信号及び量子化パラメータに基づいて、符号量を算出する。符号量記憶部804は、算出された符号量を記憶する。重み付き歪み量算出部805は、量子化パラメータ記憶部802に記憶されている量子化パラメータに従って、変移量記憶部800に記憶されている変移量の下限値から重み付き歪み量を算出する。重み付き歪み量記憶部806は、算出された重み付き歪み量を記憶する。未定乗数算出部807は、入力される符号化対象フレーム信号、参照フレーム信号及び量子化パラメータに基づいて、未定乗数を算出する。未定乗数記憶部808は、算出された未定乗数を記憶する。
コスト算出部809は、符号量記憶部804に記憶されている符号量と、重み付き歪み量記憶部806に記憶されている重み付き歪み量と、未定乗数記憶部808に記憶されている未定乗数とに基づいて、コストを算出する。コスト記憶部810は、算出されたコストを記憶する。最小コスト判定部811は、コスト記憶部810に記憶されているコストから、最小コストを判定する。最小コスト記憶部812は、最小コスト判定部811により判定された最小コストを記憶する。
最適量子化パラメータ更新部813は、最小コスト判定部811により、算出したコストがレジスタに格納されているコストの最小値より小さいと判定された場合に、その時点で量子化パラメータ記憶部802に記憶されている量子化パラメータを最適量子化パラメータ記憶部814に格納する。最適量子化パラメータ記憶部814は、算出したコストがレジスタに格納されているコストの最小値より小さいと判定された時点の量子化パラメータを最適量子化パラメータとして記憶する。
最終量子化パラメータ判定部815は、全ての量子化パラメータについて処理を終えたか否か、すなわち最終量子化パラメータであるか否かを判定し、最終量子化パラメータでない場合には、最小コスト判定811の判定結果を量子化パラメータ設定部816に供給し、最終量子化パラメータである場合には、最小コスト判定811の判定結果を最適量子化パラメータ出力部816に供給する。最適量子化パラメータ出力部816は、最終量子化パラメータ判定部815から最小コスト判定811の判定結果が供給されると、すなわち、全ての量子化パラメータについて処理を終えると、最適量子化パラメータ記憶部814に記憶されている最適量子化パラメータを出力する。
図8は、本第2実施形態による、量子化パラメータ選択処理の動作を説明するためのフローチャートである。まず、初期量子化パラメータ設定部801で、量子化パラメータの初期値を設定する(ステップS700)。具体的には、最小コスト、最適量子化パラメータを格納するレジスタを初期化する。次に、変移量記憶部800に変移量を格納する(ステップS701)。次に、符号量算出部803で、符号量を算出し(ステップS703)、重み付き歪み量算出部805で、重み付き歪み量を算出する(ステップS704)。なお、重み付き歪み量の算出の詳細については前述した第1実施形態と同様である。
次に、未定乗数算出部807で、未定乗数を算出し(ステップS705)、コスト算出部809で、符号量、重み付き歪み量、及び未定乗数により、コストを算出する(ステップS706)。次に、最小コスト判定部811で、算出したコストが最小コスト記憶部812(レジスタ)に格納されているコストの最小値より小さいか否かを判定し(ステップS707)、最小値より小さくない場合には、量子化パラメータを変更し(ステップS711)、ステップS703に戻り、変更された量子化パラメータで、符号量、重み付き符号量、未定乗数、コストの算出を行う。
一方、算出したコストがレジスタに格納されているコストの最小値より小さい場合には、算出されたコストを最小コスト格納部812に格納し(ステップS108)、その時点の量子化パラメータを格納する(ステップS709)。次に、全ての量子化パラメータについて処理を終えたか否かを判定し(ステップS710)、終えていない場合には、量子化パラメータを変更し(ステップS711)、ステップS703に戻り、変更された量子化パラメータで、上述した処理を繰り返す。一方、全ての量子化パラメータについて処理を終えた場合には、当該処理を終了する。
上述した第1、第2実施形態によれば、ブロック歪みを考慮した歪み尺度を導入し、符号化パラメータの設定に用いるコスト関数において、同歪み尺度の計算時に、隣接ブロックとの不連続性に対しても、周波数分析を行い、隣接ブロックとの不連続性を歪み尺度の計算時に反映させるべく、コントラスト感度関数に基づき歪み量に対する重み付けを行うようにしたので、ブロック歪みの発生を防止し、復号画像の画像劣化を防止することができるという利点が得られる。
本発明の第1実施形態によるモード選択装置の構成を示すブロック図である。 本第1実施形態による重み付き歪み量算出部305の構成を示すブロック図である。 本第1実施形態による感度係数算出部409の構成を示すブロック図である。 本実施形態による、符号化モード選択処理の動作を説明するためのフローチャートである。 本第1実施形態による重み付き歪み量の算出手順を示すフローチャートである。 本第1実施形態による感度係数の設定手順を示すフローチャートである。 本発明の第2実施形態による量子化パラメータ選択装置の構成を示すブロックである。 本第2実施形態による、量子化パラメータ選択処理の動作を説明するためのフローチャートである。 ゼロパディング方法を説明するための概念図である。 本明細書で説明に用いる記号の例を示す表図である。 従来技術の課題を説明するための概念図である。
符号の説明
300 変移量記憶部
301 初期モード設定部
302 モード記憶部
303 符号量算出部
304 符号量記憶部
305 重み付き歪み量算出部
306 重み付き歪み量記憶部
307 未定乗数算出部
308 未定乗数記憶部
309 コスト算出部
310 コスト記憶部
311 最小コスト判定部
312 最小コスト記憶部
313 最適モード更新部
314 最適モード記憶部
315 最終モード判定部
316 最適モード出力部
401 変換係数正規化部
402 正規化変換係数記憶部
403 変換係数復号部
404 復号変換係数記憶部
407 感度係数乗算部
408 変移量記憶部
409 感度係数算出部
410 感度係数記憶部
411 歪み量記憶部
412 歪み量和算出部
601 変換係数記憶部
602 変換行列サイズ記憶部
603 基底画像算出部
604 基底画像記憶部
605 修正基底画像算出部
606 修正基底画像記憶部
607 コントラスト感度関数記憶部
608 乗算部
609 加算部

Claims (5)

  1. 画像信号、あるいは、フレーム内予測及びフレーム間予測により得られた予測誤差信号に対して、変換符号化、量子化による情報圧縮を行う画像符号化方法において、
    歪み量、符号量、未定乗数からなるラグランジェのコスト関数に基づいて、動画像符号化における動き補償ブロックサイズ、インター予測モード、量子化パラメータ、静止画像符号化における量子化パラメータ、イントラ予測モード等の符号化パラメータを決定する際、ブロック内の空間周波数成分、及び隣接ブロック間の不連続性に関する空間周波数成分を計測するステップと、
    さらに、ブロック内の時間周波数成分、及び隣接ブロック間の不連続性に関する時間周波数成分を推定するステップと、
    前記空間周波数成分及び前記時間周波数成分の成分毎に、視覚感度関数に基づいて、重要度を算出するステップと、
    前記重要度に基づいて、周波数毎に重み付けされた二乗誤差として得られる歪み量を用いて符号量との加重和としてコスト関数を設定するステップと、
    前記コスト関数を最小化するモードを選択するステップと、
    を含むことを特徴とする画像符号化方法。
  2. ブロック内の空間周波数成分を計測する際、符号化に用いる直交変換の基底画像に対して、水平・垂直方向のサンプル数が各々、2倍になるように、零値を加えた修正基底画像を生成するステップと、
    前記修正基底画像に対して、離散フーリエ変換係数を計算することで、ブロック内の空間周波数成分及び隣接ブロック間の不連続性に関する空間周波数成分を算出するステップと
    を更に含むことを特徴とする請求項1に記載の画像符号化方法。
  3. 画像信号、あるいは、フレーム内予測及びフレーム間予測により得られた予測誤差信号に対して、変換符号化、量子化による情報圧縮を行う画像符号化装置において、
    歪み量、符号量、未定乗数からなるラグランジェのコスト関数に基づいて、動画像符号化における動き補償ブロックサイズ、インター予測モード、量子化パラメータ、静止画像符号化における量子化パラメータ、イントラ予測モード等の符号化パラメータを決定する際、ブロック内の空間周波数成分、及び隣接ブロック間の不連続性に関する空間周波数成分を計測する空間周波数成分計測手段と、
    さらに、ブロック内の時間周波数成分、及び隣接ブロック間の不連続性に関する時間周波数成分を推定する時間周波数成分推定手段と、
    前記空間周波数成分及び前記時間周波数成分の成分毎に、視覚感度関数に基づいて、重要度を算出する重要度算出手段と、
    前記重要度に基づいて、周波数毎に重み付けされた二乗誤差として得られる歪み量を用いて符号量との加重和としてコスト関数を設定するコスト関数設定手段と、
    前記コスト関数を最小化するモードを選択するモード選択手段と、
    を備えることを特徴とする画像符号化装置。
  4. 前記空間周波数計測手段は、
    ブロック内の空間周波数成分を測定する際、符号化に用いる直交変換の基底画像に対して、水平・垂直方向のサンプル数が各々、2倍になるように、零値を加えた修正基底画像を生成する修正基底画像生成手段と、
    前記修正基底画像に対して、離散フーリエ変換係数を計算することで、ブロック内の空間周波数成分及び隣接ブロック間の不連続性に関する空間周波数成分を算出する空間周波数成分算出手段と
    を備えることを特徴とする請求項3に記載の画像符号化装置。
  5. 画像信号、あるいは、フレーム内予測及びフレーム間予測により得られた予測誤差信号に対して、変換符号化、量子化による情報圧縮を行う画像符号化装置を制御するコンピュータに、
    歪み量、符号量、未定乗数からなるラグランジェのコスト関数に基づいて、動画像符号化における動き補償ブロックサイズ、インター予測モード、量子化パラメータ、静止画像符号化における量子化パラメータ、イントラ予測モード等の符号化パラメータを決定する際、ブロック内の空間周波数成分、及び隣接ブロック間の不連続性に関する空間周波数成分を計測するステップと、
    さらに、ブロック内の時間周波数成分、及び隣接ブロック間の不連続性に関する時間周波数成分を推定するステップと、
    前記空間周波数成分及び前記時間周波数成分の成分毎に、視覚感度関数に基づいて、重要度を算出するステップと、
    前記重要度に基づいて、周波数毎に重み付けされた二乗誤差として得られる歪み量を用いて符号量との加重和としてコスト関数を設定するステップと、
    前記コスト関数を最小化するモードを選択するステップと、
    を実行させることを特徴とする画像符号化プログラム。
JP2007282077A 2007-10-30 2007-10-30 画像符号化方法、画像符号化装置、及び画像符号化プログラム Expired - Fee Related JP4820800B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007282077A JP4820800B2 (ja) 2007-10-30 2007-10-30 画像符号化方法、画像符号化装置、及び画像符号化プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007282077A JP4820800B2 (ja) 2007-10-30 2007-10-30 画像符号化方法、画像符号化装置、及び画像符号化プログラム

Publications (2)

Publication Number Publication Date
JP2009111733A JP2009111733A (ja) 2009-05-21
JP4820800B2 true JP4820800B2 (ja) 2011-11-24

Family

ID=40779743

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007282077A Expired - Fee Related JP4820800B2 (ja) 2007-10-30 2007-10-30 画像符号化方法、画像符号化装置、及び画像符号化プログラム

Country Status (1)

Country Link
JP (1) JP4820800B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110068792A (ko) * 2009-12-16 2011-06-22 한국전자통신연구원 적응적 영상 부호화 장치 및 방법

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01227590A (ja) * 1988-03-07 1989-09-11 Victor Co Of Japan Ltd デジタル画像データの圧縮伸長方式
JP3193458B2 (ja) * 1992-06-19 2001-07-30 日本放送協会 画像符号化方法および装置
JPH06209467A (ja) * 1993-01-08 1994-07-26 Mitsubishi Electric Corp 画像符号化・復号化装置
JP3025415B2 (ja) * 1995-01-20 2000-03-27 ケイディディ株式会社 ディジタル圧縮・再生画像の画質評価装置
JPH0993132A (ja) * 1995-09-27 1997-04-04 Toshiba Corp 符号化・復号化装置及び方法
FR2753330B1 (fr) * 1996-09-06 1998-11-27 Thomson Multimedia Sa Procede de quantification pour codage video
JP2006140758A (ja) * 2004-11-12 2006-06-01 Toshiba Corp 動画像符号化方法、動画像符号化装置および動画像符号化プログラム
JP4490353B2 (ja) * 2005-09-05 2010-06-23 日本電信電話株式会社 量子化歪み推定方法,量子化歪み推定装置,量子化歪み推定プログラムおよびその記録媒体

Also Published As

Publication number Publication date
JP2009111733A (ja) 2009-05-21

Similar Documents

Publication Publication Date Title
US8588301B2 (en) Image coding apparatus, control method therefor and computer program
JP5321426B2 (ja) 画像符号化装置、画像復号化装置、画像符号化方法、及び画像復号化方法
US9049457B2 (en) Pixel prediction for video coding
WO2011013253A1 (ja) 幾何変換動き補償予測を用いる予測信号生成装置、動画像符号化装置及び動画像復号化装置
JP5310614B2 (ja) 動画像符号化装置、動画像符号化方法及び動画像復号装置ならびに動画像復号方法
JP5203379B2 (ja) ビデオ圧縮用の空間規約誘導時間予測
WO2009084340A1 (ja) 動画像符号化装置、および、動画像復号装置
KR20200002036A (ko) 비디오 코딩에서 모션 보상 예측을 위한 광흐름 추정
JP5326828B2 (ja) 動画像符号化装置及び動画像符号化方法
JP4786612B2 (ja) 動画像符号化装置の予測動きベクトル生成装置
JP6837110B2 (ja) 動画像復号方法
KR100727988B1 (ko) 변환 영역에서의 dc 계수 예측 방법 및 장치
JP4709074B2 (ja) 動画像符号化方法,装置,そのプログラムおよびそのプログラムを記録した記録媒体
JP4709179B2 (ja) 符号化パラメータ選択方法,符号化パラメータ選択装置,符号化パラメータ選択プログラムおよびその記録媒体
KR101359500B1 (ko) 양자화/역 양자화 장치 및 방법과 그를 이용한 영상부호화/복호화 장치
JP4820800B2 (ja) 画像符号化方法、画像符号化装置、及び画像符号化プログラム
JP4681011B2 (ja) 動画像符号化方法、動画像符号化装置、動画像符号化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4130617B2 (ja) 動画像符号化方法および動画像符号化装置
JP4253276B2 (ja) 画像符号化方法
JPH066610A (ja) 画像符号化方法
JP2011244334A (ja) 動画像符号化装置、動画像符号化方法及びプログラム
JP4819856B2 (ja) 動画像符号化方法、動画像符号化装置、動画像符号化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4222274B2 (ja) 符号化モード選択装置及び符号化モード選択プログラム
JP4375143B2 (ja) 動画像符号化装置
JP4819855B2 (ja) 動画像量子化方法、動画像量子化装置、動画像量子化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100127

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110201

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110401

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110823

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110905

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140909

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4820800

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140909

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees