JP2005217499A - 画像処理装置、画像処理プログラムおよび画像処理方法 - Google Patents
画像処理装置、画像処理プログラムおよび画像処理方法 Download PDFInfo
- Publication number
- JP2005217499A JP2005217499A JP2004018399A JP2004018399A JP2005217499A JP 2005217499 A JP2005217499 A JP 2005217499A JP 2004018399 A JP2004018399 A JP 2004018399A JP 2004018399 A JP2004018399 A JP 2004018399A JP 2005217499 A JP2005217499 A JP 2005217499A
- Authority
- JP
- Japan
- Prior art keywords
- frame
- image processing
- quantization parameter
- quantization
- code amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Abstract
【課題】 画質改善効果の高い動画像の符号化処理をより効率的に行うこと。
【解決手段】 画像処理装置1においては、先行する所定フレームにおけるスキップマクロブロックの数に応じて、Iフレームに割り当てられる符号量(Qref)が決定される。したがって、より重要度が高いIフレームの符号量を増加させることによって、そのIフレームの高画質化を図ることができ、その結果、Iフレームを参照する後続のPフレームの画質を向上させることが可能となる。さらに、量子化雑音の分散に応じて、量子化パラメータQが適宜補正される。したがって、動画像の符号化状態に応じて適切な量子化パラメータQを設定することができ、符号量の削減を図りつつ、画質の劣化を抑制することが可能となる。このように、本発明によれば、画質改善効果の高い動画像の符号化処理をより効率的に行うことが可能となる。
【選択図】 図4
【解決手段】 画像処理装置1においては、先行する所定フレームにおけるスキップマクロブロックの数に応じて、Iフレームに割り当てられる符号量(Qref)が決定される。したがって、より重要度が高いIフレームの符号量を増加させることによって、そのIフレームの高画質化を図ることができ、その結果、Iフレームを参照する後続のPフレームの画質を向上させることが可能となる。さらに、量子化雑音の分散に応じて、量子化パラメータQが適宜補正される。したがって、動画像の符号化状態に応じて適切な量子化パラメータQを設定することができ、符号量の削減を図りつつ、画質の劣化を抑制することが可能となる。このように、本発明によれば、画質改善効果の高い動画像の符号化処理をより効率的に行うことが可能となる。
【選択図】 図4
Description
本発明は、動画像の符号化処理を行う画像処理装置、画像処理プログラムおよび画像処理方法に関する。
従来、動画像の符号化においては、MPEG(Moving Picture Experts Group)に基づく符号化処理が行われている。
特に、MPEG4に基づく符号化方式では、幅広いビットレートに対応可能であると共に、テレビ電話、マルチメディアを取り扱うことが可能な移動通信機器、ビル監視システム等、種々のアプリケーションに利用されることが想定されている。
このようなMPEG4におけるプロファイル(profile)としては、HDTV(High Definition Television)等を対象とするメインプロファイル、携帯情報端末等を対象とするコアプロファイル、携帯電話等を対象とするシンプルプロファイルが規定されている。
ところで、MPEG規格においては、離散コサイン変換(DCT:Discrete Cosine Transform)および動き補償(MC:Motion Compensation)を用いて動画像の符号化を行うが、符号化時における各種パラメータ(ビットレート、GOP(GroupOf Picture)構造、動きベクトルの探索範囲等)は、自由に設定可能である。
一方、MPEG規格における符号化処理は、不可逆圧縮方式であることから画質の劣化を免れず、特に、低ビットレートの場合には、その影響が顕著に表れる。
そこで、MPEG規格の範囲内において画質の改善を行う方法が種々提案されており、主として、動き推定・動き補償に関する改善方法と、符号量制御による改善方法とが挙げられる。
ここで、MPEG規格における符号量制御は、符号化によって発生するビット量(符合量)を目標とするビット量に抑えるための量子化の度合の制御であるということができ、TM5(“MPEG2 Test Model 5”,Rev.2 ISO/IEC JTC/SC29WG11,April 1993)に、その方法が規定されている。
具体的には、TM5における符号量制御として、ステップ1〜3の3段階が規定されている。
ステップ1においては、符号化対象となるGOP内の各ピクチャ(フレーム)に割り当てるビット数が概算される。即ち、GOP内の各ピクチャのタイプ(I、P、Bフレーム)に応じた画面の複雑さXI,XP,XBを、既に符号化された各タイプのピクチャの発生符号量RI,RP,RBおよび平均量子化パラメータQ’I,Q’P,Q’Bを用いて、以下の式によって定義する。
XI=Q’I×RI,XP=Q’P×RP,XB=RB×Q’B (1)
また、ステップ1においては、(1)式におけるXI,XP,XBを用いて、符号化する各タイプのピクチャに割り当て可能なビット数を、以下の式によって算出する。
XI=Q’I×RI,XP=Q’P×RP,XB=RB×Q’B (1)
また、ステップ1においては、(1)式におけるXI,XP,XBを用いて、符号化する各タイプのピクチャに割り当て可能なビット数を、以下の式によって算出する。
ただし、“N”は、符号化されていないピクチャ数、“R”は、GOPの残りのビット数、KP=1.0、KB=1.4である。
ステップ2においては、各ピクチャに割り当てられたビット数に応じた容量の仮想バッファd(m)を設定し、符号量が仮想バッファ内に収まるように、以下の式に従って、マクロブロックを順次符号化する。
ただし、“d(0)”は、仮想バッファの初期状態、“B(m)”は、各マクロブロックにおける第mブロックまでの全発生ビット数(“m”は正の整数)、“T”は、現在のピクチャに割り当て可能なビット数、“M”は、現在のピクチャに含まれる全マクロブロック数である。
(3)式における右辺の第2項は、実際に発生した符号量であるのに対し、右辺の第3項は、マクロブロックを符号化する度に平均的に発生すると考えられる符号量の予測値である。そのため、(3)式は、実際に発生した符号量と仮想バッファの容量d(m)との関係を示す式となる。
そして、ステップ2においては、実際に発生した符号量B(m)と仮想バッファの容量d(m)とを比較しながら、次に処理されるマクロブロックに対する量子化パラメータの参照値Qrefを、以下の式に従って決定する。
(3)〜(5)式によれば、実際に発生した符号量B(m)と(3)式における右辺第3項(T・(m−1)/M)との差が大きいほど、量子化パラメータの参照値Qrefが大きくなることがわかる。
ステップ3においては、ステップ2において決定された量子化パラメータの参照値Qrefを、視覚特性に基づいて、以下の式に従って更新する。
(7)式および(8)式によれば、Nact(m)は、画像の平坦な部分(高周波成分が少ない領域)で小さくなり、信号の変化が大きい部分(高周波成分が多い領域)で大きくなることがわかる。そのため、(6)式は、視覚的に歪みが目立つ部分(画像の平坦な部分)で量子化パラメータQが量子化パラメータの参照値Qrefより小さくなり、視覚的に歪みが目立たない部分(信号の変化が大きい部分)では、量子化パラメータQが量子化パラメータの参照値Qrefより大きくなるように作用する。
さらに、ステップ3においては、直前に符号化されたマクロブロックの量子化パラメータQ(m−1)と、現在符号化されているマクロブロックの量子化パラメータQ(m)との差分を符号化する。
なお、MPEG4においては、量子化パラメータQ(m)とQ(m−1)との差分が±2以下となるように定められている。
ここで、上述のようなTM5に基づく符号量制御に関する改善方法として、甲藤二郎、大田睦、“MPEG圧縮効率の理論解析とその符号量制御への応用”、信学技報 IE-95-10、April 1995 電子情報通信学会、あるいは、水野修、鹿喰善明、野尻祐司、大塚吉道、田中豊、“ピクチャ別レート歪み特性に基づいた符号量配分手法の検討”、信学論(D-II)、vol.J82-D-II、no.8、pp.1239-1251、Aug.1999 電子情報通信学会が提案されている。
これらの提案は、Iフレームに対して配分する符号量を、Pフレーム、Bフレームよりも多くすることによって、画質の改善を図るものである。
以下、図6を参照し、符号化性能を決める一つの指標であるレート歪み特性を用いてIフレームに対して符号量を多く配分することの妥当性を明らかにする。
レート歪み特性とは、量子化対象信号の分散σS 2と符号化によって生じた量子化誤差信号(歪み信号)の分散σn 2の比と、符号化対象信号の持つエントロピー(符号量)R間の関係を示すものである。一般的に、相関のないランダムな信号(例えば白色ガウス性信号)においては、次式(9)において、レート歪み特性が常に−6[dB]の関係となることが知られている(図6参照)。
σn 2=ε2・γ22−2・R・σS 2 (9)
ただし、“σn 2”は、量子化誤差(歪み)信号の分散、“σS 2”は、量子化対象信号の分散、“R”は、符号量である。
σn 2=ε2・γ22−2・R・σS 2 (9)
ただし、“σn 2”は、量子化誤差(歪み)信号の分散、“σS 2”は、量子化対象信号の分散、“R”は、符号量である。
一方で、相関の強い画像信号を符号化した場合、歪み信号成分が少なくなることから図6の−6[dB]の特性から大きく乖離する。Iフレームの符号化では、画像信号そのものを符号化することから−6[dB]の特性から大きく乖離する。
それに対して、Pフレームはフレーム間符号化を多く含むことからIフレームと異なる歪み特性を持つ。具体的にはPフレームのレート歪み特性は図6中に示す通り、Iフレームの場合と、相関のないランダムな信号である−6[dB]の場合の中間の特性を持つ。
このことは、IフレームとPフレームに同等の符号量を割り当てた場合、Pフレームの方が多く歪みを生じることを意味する。これらのことより、Pフレームに比べIフレームに対してより多くの符号量を配分することで画質の改善を図ることが可能であると言える。
また、図示しないが、Bフレームに関しても同様の結果が得られる。
甲藤二郎、大田睦、"MPEG圧縮効率の理論解析とその符号量制御への応用"、信学技報 IE-95-10、April 1995 電子情報通信学会 水野修、鹿喰善明、野尻祐司、大塚吉道、田中豊、"ピクチャ別レート歪み特性に基づいた符号量配分手法の検討"、信学論(D-II)、vol.J82-D-II、no.8、pp.1239-1251、Aug.1999 電子情報通信学会
甲藤二郎、大田睦、"MPEG圧縮効率の理論解析とその符号量制御への応用"、信学技報 IE-95-10、April 1995 電子情報通信学会 水野修、鹿喰善明、野尻祐司、大塚吉道、田中豊、"ピクチャ別レート歪み特性に基づいた符号量配分手法の検討"、信学論(D-II)、vol.J82-D-II、no.8、pp.1239-1251、Aug.1999 電子情報通信学会
しかしながら、上述した従来の技術においては、符号化処理において符号量の制御を行うために、多大な演算を行う必要があった。
即ち、TM5においては、発生符号量と量子化パラメータとの積を用いた符号量配分が行われ、上記非特許文献1においては、実験的解析を行い、その結果からパラメータKp,Kbが変化されるものである。また、上記非特許文献2においては、実時間処理を考慮して、直前のフレームまでの符号化対象信号の分散値を算出して符号量配分が行われる。
このように、従来の技術における符号量制御においては、演算量が増大してしまうという問題があった。
また、上述の符号量制御は、TM5におけるステップ1に関する処理であるが、ステップ2,3においては、TM5に規定された視覚特性の反映、即ち、マクロブロック内の正規化信号の分散値に基づく量子化パラメータの制御のみが行われ、さらなる画質改善の試みがなされていなかった。
このように、従来の技術においては、より効率的に画質改善効果の高い動画像の符号化処理を行う余地が残されていた。
本発明の課題は、画質改善効果の高い動画像の符号化処理をより効率的に行うことである。
以上の課題を解決するため、本発明は、
連続する複数フレームによって構成された動画像の符号化処理を行う画像処理装置であって、先行する所定フレーム(例えば、前GOPあるいは先行する数フレーム)の符号化処理において、フレーム間の相関性に基づいて符号化処理が省略された度合(例えば、スキップマクロブロックの数等)に応じて、後続するフレームの符号化処理における符号量の割り当てを行う符合量割り当て手段(例えば、図4の符号量制御部110)を含むことを特徴としている。
連続する複数フレームによって構成された動画像の符号化処理を行う画像処理装置であって、先行する所定フレーム(例えば、前GOPあるいは先行する数フレーム)の符号化処理において、フレーム間の相関性に基づいて符号化処理が省略された度合(例えば、スキップマクロブロックの数等)に応じて、後続するフレームの符号化処理における符号量の割り当てを行う符合量割り当て手段(例えば、図4の符号量制御部110)を含むことを特徴としている。
また、前記動画像には、フレーム内符号化フレーム(例えば、MPEGにおけるIフレーム)およびフレーム間符号化フレーム(例えば、MPEGにおけるPフレーム)が含まれ、前記符号量割り当て手段は、先行する所定数のフレーム間符号化フレームにおいて符号化処理が省略されたブロックあるいはマクロブロックの数に応じて、後続するフレーム内符号化フレームに割り当てる符号量を決定することを特徴としている。
また、前記符号量割り当て手段は、先行する所定数のフレーム間符号化フレームにおけるスキップマクロブロックの数に応じて、後続するフレーム内符号化フレームの量子化パラメータの基準値(例えば、図4の量子化パラメータの参照値Qref)を決定することを特徴としている。
また、本発明は、
連続する複数フレームによって構成された動画像の符号化処理を行うための画像処理プログラムであって、先行する所定フレームの符号化処理において、フレーム間の相関性に基づいて符号化処理が省略された度合に応じて、後続するフレームの符号化処理における符号量の割り当てを行う符合量割り当て機能をコンピュータに実現させることを特徴としている。
連続する複数フレームによって構成された動画像の符号化処理を行うための画像処理プログラムであって、先行する所定フレームの符号化処理において、フレーム間の相関性に基づいて符号化処理が省略された度合に応じて、後続するフレームの符号化処理における符号量の割り当てを行う符合量割り当て機能をコンピュータに実現させることを特徴としている。
また、本発明は、
連続する複数フレームによって構成された動画像の符号化処理を行うための画像処理方法であって、先行する所定フレームの符号化処理において、フレーム間の相関性に基づいて符号化処理が省略された度合に応じて、後続するフレームの符号化処理における符号量の割り当てを行う符合量割り当てステップを含むことを特徴としている。
連続する複数フレームによって構成された動画像の符号化処理を行うための画像処理方法であって、先行する所定フレームの符号化処理において、フレーム間の相関性に基づいて符号化処理が省略された度合に応じて、後続するフレームの符号化処理における符号量の割り当てを行う符合量割り当てステップを含むことを特徴としている。
上記発明によれば、先行する所定のフレームにおけるスキップマクロブロックの数等、符号化処理が省略された度合に応じて、後続するフレーム(Iフレーム等)に割り当てられる符号量(例えば、量子化パラメータの参照値Qref)が決定される。
したがって、より重要度が高いフレームの符号量を増加させることによって、そのフレームの高画質化を図ることができ、その結果、該フレームを参照する後続のフレームの画質を向上させることが可能となる。
また、本発明は、
連続する複数フレームによって構成された動画像の符号化処理を行う画像処理装置であって、前記動画像の符号化処理における量子化雑音の発生量に基づいて、該量子化における量子化パラメータを補正する量子化パラメータ制御手段を含むことを特徴としている。
連続する複数フレームによって構成された動画像の符号化処理を行う画像処理装置であって、前記動画像の符号化処理における量子化雑音の発生量に基づいて、該量子化における量子化パラメータを補正する量子化パラメータ制御手段を含むことを特徴としている。
また、前記量子化パラメータ制御手段は、前記符号化処理において発生した量子化雑音の分散に基づいて、前記量子化パラメータの補正量を決定することを特徴としている。
また、本発明は、
連続する複数フレームによって構成された動画像の符号化処理を行うための画像処理プログラムであって、前記動画像の符号化処理における量子化雑音の発生量に基づいて、該量子化における量子化パラメータを補正する量子化パラメータ制御機能をコンピュータに実現させることを特徴としている。
連続する複数フレームによって構成された動画像の符号化処理を行うための画像処理プログラムであって、前記動画像の符号化処理における量子化雑音の発生量に基づいて、該量子化における量子化パラメータを補正する量子化パラメータ制御機能をコンピュータに実現させることを特徴としている。
また、本発明は、
連続する複数フレームによって構成された動画像の符号化処理を行うための画像処理方法であって、前記動画像の符号化処理における量子化雑音の発生量に基づいて、該量子化における量子化パラメータを補正する量子化パラメータ制御ステップを含むことを特徴としている。
連続する複数フレームによって構成された動画像の符号化処理を行うための画像処理方法であって、前記動画像の符号化処理における量子化雑音の発生量に基づいて、該量子化における量子化パラメータを補正する量子化パラメータ制御ステップを含むことを特徴としている。
上記発明によれば、量子化雑音の分散等によって示される量子化雑音の発生量に応じて、符号化処理における量子化パラメータが適宜補正される。
したがって、動画像の符号化状態に応じて適切な量子化パラメータを設定することができ、符号量の削減を図りつつ、画質の劣化を抑制することが可能となる。
このように、本発明によれば、画質改善効果の高い動画像の符号化処理をより効率的に行うことが可能となる。
以下、図を参照して本発明に係る画像処理装置の実施の形態を説明する。
初めに、本発明における動画像符号化方法の基本的な考え方について説明する。
本発明においては、MPEGのTM5に基づく符号量制御において、Iピクチャに対する符号量割り当て(ステップ1)およびマクロブロック単位の量子化パラメータ制御(ステップ2,3)それぞれにおける処理の改善を図るものである。
即ち、ステップ1に対する改善方法として、所定フレームにおけるスキップマクロブロック数に応じた符号量配分を行い、ステップ2,3に対する改善方法として、雑音の発生量に応じた量子化パラメータを設定する。
なお、以下の説明においては、シンプルプロファイルの場合を例に挙げて説明することとする。
初めに、TM5におけるステップ1の改善について説明する。
まず、TM5に基づいて、(2)式に示すTI,TPを算出する。ここでは、シンプルプロファイルを例とするため、Bフレームに関する情報は存在せず、以下のように表される。
さらに、本発明においては、Iフレームのターゲットビット量(目標とする符号量)を次式に従って更新する。
TI’=TI+α・NskipMB (11)
ただし、“NskipMB”は、前GOPの各フレームにおいてスキップされたマクロブロックの数の平均、“α”は、所定の定数である。ただし、前GOPの一部のフレームを対象としてスキップされたマクロブロックの数を計数し、その平均値を“NskipMB”とすることとしても良い。
TI’=TI+α・NskipMB (11)
ただし、“NskipMB”は、前GOPの各フレームにおいてスキップされたマクロブロックの数の平均、“α”は、所定の定数である。ただし、前GOPの一部のフレームを対象としてスキップされたマクロブロックの数を計数し、その平均値を“NskipMB”とすることとしても良い。
ここで、前GOPにおいてスキップされたマクロブロックの数を反映させるのは、次のような理由によるものである。
即ち、前後のフレーム間において動きベクトルが“0”(相関が“1”)の場合にマクロブロックの処理がスキップされる。このような傾向が強い場合、参照元となるフレームであるIフレームの符号量を増加させ、高画質化することにより、後続のPフレーム全体にその効果を及ぼすことができることとなる。
つまり、スキップマクロブロックの数が多い場合、参照フレームであるIフレームの重要度が高いものであるため、Iフレームに符号量をより多く割り当てて歪みを小さくすることにより、予測誤差における量子化誤差を削減することが可能となる。
このような処理を行うためには、スキップマクロブロックの数を計数していれば良いため、低演算量でIフレームへの符号量配分を適切なものとすることが可能である。
次に、TM5におけるステップ2,3の改善について説明する。
TM5においては、上述のように、人間の視覚特性を考慮した画質改善、即ち、符号対象信号の分散に基づいて量子化パラメータの制御を行っている。具体的には、信号変化の小さい領域(画像の平坦な部分)では、ブロック歪みが目立つことから、量子化パラメータをより小さく設定し、信号変化の大きい領域(画像の平坦でない部分)では、ブロック歪みが目立ちにくいことから、量子化パラメータをより大きく設定している。
本発明においては、TM5に規定された処理に加え、雑音の発生を抑制することにより、さらなる画質改善を図るものである。
即ち、雑音の発生量が多い場合、PSNR(Peak Signal to Noise Ratio)が低下することとなるが、量子化パラメータをより小さくすることで、これを回避する。反対に、雑音の発生量が少ない場合、符号量を低下させることができる可能性を持つことから、量子化パラメータを大きくする。
このように、本発明においては、量子化雑音の分散によって量子化パラメータを制御し、具体的には、次式に従って量子化パラメータの制御を行う。
ただし、σx 2(m)は、符号化対象信号の第m番目のマクロブロックをQref(m)を用いてDCT、量子化、逆量子化、IDCTした後の信号の分散である。また、σn 2(m)は、符号化対象信号の第i番目のマクロブロックをQref(m)を用いてDCT、量子化、逆量子化、IDCTした後の信号と符号化対象信号との差分信号の分散(雑音分散)である。
(13)式および(14)式において、信号変化を多く伴うマクロブロックの場合、σx 2(m)が大きくなり、雑音が多く重畳したマクロブロックの場合、σn 2(m)が大きくなる。
したがって、(12)〜(14)式において、雑音が多く重畳したマクロブロックについては、量子化パラメータQ(m)が小さくなり、雑音を抑圧するように作用する。また、信号変化を多く伴うマクロブロックについては、量子化パラメータQ(m)が量子化パラメータの参照値Qrefとほぼ等しくなり、雑音の抑制が行われない。
次に、本発明の効果について検討する。
図1は、(11)式における定数αと画質改善効果との関係を示す図である。
図1においては、画質改善効果を示す評価関数として、IPSNR(Improved PSNR)を用いており、その定義は、IPNSR=(本発明を適用した場合のPSNR)−(MPEGのみによる場合のPSNR)である。
また、ここでは、MPEG4 simple profile,CIF(Common Intermediate Format),15[fps],192〜384[Kbps]Iフレーム:Pフレーム=1:14の場合の例を示している。
図1において、種々のサンプル動画像について、α=100の場合には、概して本発明による効果が良好に表れている。また、α=1000を超えると、動画像によっては、著しく画質が劣化している。これは、Iフレームに割り当てる符号量が過大となり、Pフレームに割り当てる符号量が不足することに起因していると考えられる。
つまり、定数αの増加に伴い画質が劣化している動画像は、動きが大きい動画像であり、Iフレームのみならず、Pフレームにも動きベクトルのための一定量の符号を割り当てる必要があるものである。
このように、本発明(TM5のステップ1に対する改善)における画質改善効果は、動画像の動き量と関連性を有していると言える。
また、図2は、TM5に対する本発明の改善方法の画質改善効果を示す図である。
なお、図2においては、TM5のステップ1に対する改善のみ、TM5のステップ2,3に対する改善のみ、TM5のステップ1およびステップ2,3に対する改善それぞれの場合における画質改善効果を示している。
図2に示すように、種々のサンプル動画像に対し、本発明のTM5のステップ1に対する改善およびTM5のステップ2,3に対する改善それぞれが画質改善効果を示しており、TM5のステップ1に対する改善およびステップ2,3に対する改善両方を施した場合、最も高い改善効果を示している。
図3は、本発明を適用した場合およびMPEGのみによる場合の処理結果の画像を示す図であり、図3(a)は、MPEGのみによる場合のIフレーム、図3(b)は、MPEGのみによる場合の直後のPフレーム、図3(c)は、本発明を適用した場合のIフレーム、図3(d)は、本発明を適用した場合の直後のPフレームを示す図である。
図3によれば、本発明を適用した場合においては、Iフレームに割り当てられる符号量が多く、画質が向上しており、さらに、それに引き続くPフレームの画質も連動して向上していることがわかる。
このように高い画質改善効果を奏しながら、本発明のTM5のステップ1に対する改善方法は、スキップマクロブロックの計数という低演算量の処理を行えば良く、また、本発明のTM5のステップ2,3に対する改善方法は、GOPの符号化処理中に、符号化処理時の画質の状態に応じて適応的に符号量の制御を行うことが可能である。
続いて、上述の符号化処理を行う画像処理装置について説明する。
まず、構成を説明する。
図4は、本発明に係る画像処理装置1の機能構成を示す図である。
図4において、画像処理装置1は、動き補償/動き検出用フレームメモリ10と、減算器20と、DCT部30と、量子化部40と、逆量子化部50と、逆DCT部60と、加算器70と、量子化パラメータ制御部80と、ハフマン符号化部90と、バッファ100と、符号量制御部110とを含んで構成される。なお、画像処理装置1は、MPEGに基づく符号化処理を行うものであり、ブロックあるいはマクロブロック単位を基本とする符号化処理を行う。
動き補償/動き検出用フレームメモリ10は、加算器70から入力されるデータ、即ち、画像処理装置1において符号化されたフレームのデータの復号画像(以下、「再構成画像」と言う。)を記憶し、記憶したデータを参照して、動き検出および動き補償処理を行う。また、動き補償/動き検出用フレームメモリ10は、記憶している再構成画像を、先行するフレームのデータとして、減算器20あるいは加算器70に出力する。
減算器20は、画像処理装置1に新たに入力された画像のデータs(i,j)と、動き補償/動き検出用フレームメモリ10から入力された再構成画像との差分を算出し、DCT部30に出力する。
DCT部30は、減算器20から入力される差分(フレーム間符号化の場合)あるいは画像処理装置1に入力された画像のデータs(i,j)(フレーム内符号化の場合)を空間領域から周波数領域に変換し、量子化部40に出力する。
量子化部40は、量子化パラメータ制御部80から入力される量子化パラメータQに応じて、DCT部30から入力される周波数領域のデータを離散値に変換する。この量子化パラメータQは、符号量制御部110から入力される量子化パラメータの参照値Qrefが、量子化パラメータ制御部80によって適宜更新されたものである。そして、量子化部40は、変換した離散値を逆量子化部50およびハフマン符号化部90に出力する。
また、量子化部40は、符号量制御部110から入力された量子化パラメータQrefを量子化パラメータ制御部80に出力する。
逆量子化部50は、量子化部40から入力された離散値を逆量子化し、連続的な値に変換する。そして、逆量子化部50は、変換した連続値を逆DCT部60に出力する。
逆DCT部60は、逆量子化部50から入力された連続値(周波数領域のデータ)を空間領域のデータx(i,j)に変換し、加算器70および量子化パラメータ制御部80に出力する。
加算器70は、逆DCT部60から入力された空間領域のデータx(i,j)を動き補償/動き検出用フレームメモリ10から入力されたフレームのデータと加算し、再構成画像を生成する。
量子化パラメータ制御部80は、TM5に対する本発明のステップ2,3の改善を実行する部分であり、逆DCT部60から入力された空間領域のデータx(i,j)と、画像処理装置1に入力された画像のデータs(i,j)と、量子化部40から入力された量子化パラメータの参照値Qrefとに基づいて、(12)〜(14)式に基づく演算を行う。そして、量子化パラメータ制御部80は、演算の結果決定した量子化パラメータQを量子化部40に設定する。
図5は、量子化パラメータ制御部80の内部構成を示すブロック図である。
図5において、量子化パラメータ制御部80は、減算器81と、σn 2算出器82と、σ2算出器83と、K値算出器84と、乗算器85とを含んで構成される。
減算器81は、画像処理装置1に入力された画像のデータs(i,j)と、逆量子化後の空間領域のデータx(i,j)との差分を算出し、算出した差分をσn 2算出器82に出力する。
σn 2算出器82は、減算器81から入力された差分の分散(雑音分散)を算出し、算出した雑音分散をσ2算出器83およびK値算出器84に出力する。
σ2算出器83は、σn 2算出器82から入力された雑音分散および逆量子化後の空間領域のデータx(i,j)に基づいて、(14)式に従う演算を行い、演算結果である量子化雑音の分散をK値算出器84に出力する。
K値算出器84は、σn 2算出器82から入力された雑音分散と、σ2算出器83から入力された量子化雑音の分散とに基づいて、(13)式に従う演算を行い、演算結果であるK値(量子化パラメータの参照値Qrefに対する補正値)を乗算器85に出力する。
乗算器85は、量子化部40から入力された量子化パラメータの参照値Qrefと、K値算出器84から入力されたK値とを乗算し(即ち、(12)式に従う演算を行い)、乗算結果である量子化パラメータQを量子化部40に出力する。
図4に戻り、ハフマン符号化部90は、量子化部40から入力される量子化後の周波数領域のデータおよび動き補償/動き検出用フレームメモリ10から入力される動きベクトルをハフマン符号化し、符号化結果をバッファ100に出力する。
バッファ100は、ハフマン符号化部90の符号化結果を一時的に記憶し、画像処理装置1の符号化結果として出力すると共に、符号量制御部110に出力する。
符号量制御部110は、TM5に対する本発明のステップ1の改善を実行する部分であり、画像処理装置1に入力された先行する所定フレームにおけるスキップマクロブロックを計数し、画像処理装置1に新たに入力されたGOPにおけるIフレームの量子化パラメータの参照値Qrefを、(10)式および(11)式に基づいて算出する。そして、符号量制御部110は、算出した量子化パラメータの参照値Qrefを量子化部40に出力する。
次に、動作を説明する。
画像処理装置1は、符号化対象である動画像におけるスキップマクロブロックを、符号量制御部110によって常時計数している。
そして、符号化対象となる画像データが入力されると、まず、それに含まれるIフレームに割り当てる符号量を符号量制御部110が決定し、決定した符合量に対応する量子化パラメータの参照値Qrefが設定される。
すると、DCT部30、量子化部40およびハフマン符号化部90によって動画像の符号化が行われる。また、量子化部40の処理結果は、逆量子化部50および逆DCT部60によって復号化され、加算器70において、動き補償/動き検出用フレームメモリ10に記憶されたフレームと加算されて再構成画像とされる。
さらに、このような処理の実行中、量子化パラメータ制御部80が、逆DCT部60の出力と入力された画像データとによって、量子化パラメータの参照値Qrefを補正し、上述の改善方法に基づく適切な量子化パラメータQを設定する。
以上のように、本実施の形態に係る画像処理装置1においては、先行する所定フレームにおけるスキップマクロブロックの数に応じて、Iフレームに割り当てられる符号量(量子化パラメータの参照値Qref)が決定される。
したがって、より重要度が高いIフレームの符号量を増加させることによって、そのIフレームの高画質化を図ることができ、その結果、Iフレームを参照する後続のPフレームの画質を向上させることが可能となる。
また、このような処理を行うためには、スキップマクロブロックの計数を行えば良いため、低演算量であるにも関わらず、高い画質改善効果を得ることが可能である。
さらに、本実施の形態に係る画像処理装置1においては、量子化雑音の分散に応じて、量子化パラメータQが適宜補正される。
したがって、動画像の符号化状態に応じて適切な量子化パラメータQを設定することができ、符号量の削減を図りつつ、画質の劣化を抑制することが可能となる。
このように、本発明によれば、画質改善効果の高い動画像の符号化処理をより効率的に行うことが可能となる。
1 画像処理装置、10 動き補償/動き検出用フレームメモリ、20 減算器、30 DCT部、40 量子化部、50 逆量子化部、60 逆DCT部、70 加算器、80 量子化パラメータ制御部、81 減算器、82 σn 2算出器、83 σ2算出器、84 K値算出器、85 乗算器、90 ハフマン符号化部、100 バッファ、110 符号量制御部
Claims (9)
- 連続する複数フレームによって構成された動画像の符号化処理を行う画像処理装置であって、
先行する所定フレームの符号化処理において、フレーム間の相関性に基づいて符号化処理が省略された度合に応じて、後続するフレームの符号化処理における符号量の割り当てを行う符合量割り当て手段を含むことを特徴とする画像処理装置。 - 前記動画像には、フレーム内符号化フレームおよびフレーム間符号化フレームが含まれ、
前記符号量割り当て手段は、先行する所定数のフレーム間符号化フレームにおいて符号化処理が省略されたブロックあるいはマクロブロックの数に応じて、後続するフレーム内符号化フレームに割り当てる符号量を決定することを特徴とする請求項1記載の画像処理装置。 - 前記符号量割り当て手段は、先行する所定数のフレーム間符号化フレームにおけるスキップマクロブロックの数に応じて、後続するフレーム内符号化フレームの量子化パラメータの基準値を決定することを特徴とする請求項1または2記載の画像処理装置。
- 連続する複数フレームによって構成された動画像の符号化処理を行う画像処理装置であって、
前記動画像の符号化処理における量子化雑音の発生量に基づいて、該量子化における量子化パラメータを補正する量子化パラメータ制御手段を含むことを特徴とする画像処理装置。 - 前記量子化パラメータ制御手段は、前記符号化処理において発生した量子化雑音の分散に基づいて、前記量子化パラメータの補正量を決定することを特徴とする請求項4記載の画像処理装置。
- 連続する複数フレームによって構成された動画像の符号化処理を行うための画像処理プログラムであって、
先行する所定フレームの符号化処理において、フレーム間の相関性に基づいて符号化処理が省略された度合に応じて、後続するフレームの符号化処理における符号量の割り当てを行う符合量割り当て機能をコンピュータに実現させることを特徴とする画像処理プログラム。 - 連続する複数フレームによって構成された動画像の符号化処理を行うための画像処理プログラムであって、
前記動画像の符号化処理における量子化雑音の発生量に基づいて、該量子化における量子化パラメータを補正する量子化パラメータ制御機能をコンピュータに実現させることを特徴とする画像処理プログラム。 - 連続する複数フレームによって構成された動画像の符号化処理を行うための画像処理方法であって、
先行する所定フレームの符号化処理において、フレーム間の相関性に基づいて符号化処理が省略された度合に応じて、後続するフレームの符号化処理における符号量の割り当てを行う符合量割り当てステップを含むことを特徴とする画像処理方法。 - 連続する複数フレームによって構成された動画像の符号化処理を行うための画像処理方法であって、
前記動画像の符号化処理における量子化雑音の発生量に基づいて、該量子化における量子化パラメータを補正する量子化パラメータ制御ステップを含むことを特徴とする画像処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004018399A JP2005217499A (ja) | 2004-01-27 | 2004-01-27 | 画像処理装置、画像処理プログラムおよび画像処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004018399A JP2005217499A (ja) | 2004-01-27 | 2004-01-27 | 画像処理装置、画像処理プログラムおよび画像処理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005217499A true JP2005217499A (ja) | 2005-08-11 |
Family
ID=34902932
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004018399A Withdrawn JP2005217499A (ja) | 2004-01-27 | 2004-01-27 | 画像処理装置、画像処理プログラムおよび画像処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005217499A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007074050A (ja) * | 2005-09-05 | 2007-03-22 | Sony Corp | 符号化装置、符号化方法、符号化方法のプログラム及び符号化方法のプログラムを記録した記録媒体 |
JP2007134758A (ja) * | 2005-11-08 | 2007-05-31 | Nippon Hoso Kyokai <Nhk> | ビデオストリーミング用ビデオデータ圧縮装置 |
-
2004
- 2004-01-27 JP JP2004018399A patent/JP2005217499A/ja not_active Withdrawn
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007074050A (ja) * | 2005-09-05 | 2007-03-22 | Sony Corp | 符号化装置、符号化方法、符号化方法のプログラム及び符号化方法のプログラムを記録した記録媒体 |
JP4650173B2 (ja) * | 2005-09-05 | 2011-03-16 | ソニー株式会社 | 符号化装置、符号化方法、符号化方法のプログラム及び符号化方法のプログラムを記録した記録媒体 |
US8107529B2 (en) | 2005-09-05 | 2012-01-31 | Sony Corporation | Coding device, coding method, program of coding method, and recording medium recorded with program of coding method |
JP2007134758A (ja) * | 2005-11-08 | 2007-05-31 | Nippon Hoso Kyokai <Nhk> | ビデオストリーミング用ビデオデータ圧縮装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10321138B2 (en) | Adaptive video processing of an interactive environment | |
KR100970315B1 (ko) | 트랜스코더 및 부호화 화상 변환 방법 | |
US7653129B2 (en) | Method and apparatus for providing intra coding frame bit budget | |
MX2007011084A (es) | Clasificacion de contenido para procesamiento multimedia. | |
US11356672B2 (en) | System and method for controlling video coding at frame level | |
US20070081589A1 (en) | Adaptive quantization controller and methods thereof | |
US11190775B2 (en) | System and method for reducing video coding fluctuation | |
US20100098162A1 (en) | System and Method for Bit-Allocation in Video Coding | |
KR20140110008A (ko) | 객체 검출 정보에 따른 인코딩 | |
US11134250B2 (en) | System and method for controlling video coding within image frame | |
CN101523915B (zh) | 使用min-max方法的用于视频编码的两遍速率控制技术 | |
WO2005062625A1 (ja) | 動画像を符号化する方法及び装置 | |
JP2007221201A (ja) | 動画像符号化装置及び動画像符号化プログラム | |
JPWO2012121211A1 (ja) | 量子化制御装置及び方法、及び量子化制御プログラム | |
JP2019193182A (ja) | 符号化装置、符号化方法、及び符号化プログラム | |
JP2019102861A (ja) | 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム | |
JP4942208B2 (ja) | 符号化装置 | |
US20130077674A1 (en) | Method and apparatus for encoding moving picture | |
JP2005217499A (ja) | 画像処理装置、画像処理プログラムおよび画像処理方法 | |
RU2587412C2 (ru) | Управление скоростью передачи видео на основе гистограммы коэффициентов преобразования | |
EP1921866A2 (en) | Content classification for multimedia processing | |
KR101307469B1 (ko) | 비디오 인코더, 비디오 디코더, 비디오 인코딩 방법 및 비디오 디코딩 방법 | |
JP2022070176A (ja) | 符号化装置及びプログラム | |
JPH11196423A (ja) | 画像処理装置および方法、並びに提供媒体 | |
CN117880511A (zh) | 基于视频缓冲区校验的码率控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20070403 |