JP2011223068A - 符号化装置、復号装置及びプログラム - Google Patents

符号化装置、復号装置及びプログラム Download PDF

Info

Publication number
JP2011223068A
JP2011223068A JP2010086549A JP2010086549A JP2011223068A JP 2011223068 A JP2011223068 A JP 2011223068A JP 2010086549 A JP2010086549 A JP 2010086549A JP 2010086549 A JP2010086549 A JP 2010086549A JP 2011223068 A JP2011223068 A JP 2011223068A
Authority
JP
Japan
Prior art keywords
orthogonal transform
orthogonal
encoding
quantization
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010086549A
Other languages
English (en)
Other versions
JP5377395B2 (ja
JP2011223068A5 (ja
Inventor
Atsuro Ichigaya
敦郎 市ヶ谷
Shinichi Sakaida
慎一 境田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK filed Critical Nippon Hoso Kyokai NHK
Priority to JP2010086549A priority Critical patent/JP5377395B2/ja
Publication of JP2011223068A publication Critical patent/JP2011223068A/ja
Publication of JP2011223068A5 publication Critical patent/JP2011223068A5/ja
Application granted granted Critical
Publication of JP5377395B2 publication Critical patent/JP5377395B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】フレーム画像を小領域に分割した符号化対象ブロックに対して予測画像を生成し、該符号化対象ブロックと前記予測画像の差分信号を符号化する符号化装置、復号装置及びプログラムを提供する。
【解決手段】本発明の符号化装置(10)は、前記差分信号に対して第1の直交変換処理を施して符号化するか、又は前記差分信号に対して前記第1の直交変換処理に対してn次の基底同士が直交関係にある第2の直交変換処理を施して符号化するかを切り替える切替スイッチと、前記フレーム画像に対して符号化を行う場合のコスト計算を行って、より少ない符号量となるよう前記差分信号ごとに前記切替手段の切り替えを制御するコスト算出部とを備える直交変換部(13)と、前記第1の直交変換処理及び/又は前記第2の直交変換処理によって得られる直交変換係数に対して量子化処理を施す量子化部(14)とを備え、量子化部(14)は、前記第1の直交変換処理及び前記第2の直交変換処理に対して共通の正規化係数マトリクスを用いて量子化する。
【選択図】図1

Description

本発明は、画像符号化技術に関し、特に、非可逆な符号化方式による画像処理装置、符号化装置、復号装置及びプログラムに関する。
フレーム画像の画素値を直交変換によって直交変換係数で表し、この直交変換係数に対して必要に応じて量子化及びエントロピー符号化を施すことによって、少ない信号表現で品質を損なわずに、或いは最小限の品質の低下によって信号を伝送する画像符号化技術が知られている。特に、映像符号化の分野などで利用される技術である。
代表的な直交変換としては、DFT(離散フーリエ変換)、DCT(離散コサイン変換)、DWT(離散ウェーブレット変換)が知られている。特に、小領域にフレーム画像を分割して直交変換を施すブロックベースの映像符号化では、DCTが最も広く用いられている。
広く用いられている映像符号化としてMPEGが知られている。MPEG−2やMPEG−4AVC/H.264は、フレーム画像を小領域に分割し、例えば8×8画素ブロックごとに直交変換を施し、各直交変換係数を量子化し、エントロピー符号化を施す。このような符号化では、フレーム画像の画像信号と直交変換の特性からDCTが広く用いられている。
従来からの動画像用の符号化装置(例としてMPEG−4AVC/H.264)の構成例を図17に示す。
[符号化装置]
一般的に動画像の符号化では動き補償予測、直交変換、量子化、エントロピー符号化によって画像を符号化する。動き補償予測や画面内予測を用いる符号化方式の場合、復号された画像を予測に用いるため符号化装置内に復号装置を内包している。
従来からの符号化装置100は、ブロック化部101と、減算部102と、整数精度変換部105(直交変換部103及び量子化部104からなる)と、整数精度逆変換部108(逆量子化部106及び逆直交変換部107からなる)と、加算部109と、デブロッキングフィルタ120と、メモリ121と、フレーム内予測部122と、動き補償予測部123と、切替スイッチ124と、スキャニング部125と、エントロピー符号化部126とを備える。
ブロック化部101は、フレーム画像を入力してバッファ(図示せず)に保持し、このバッファから16×16画素のマクロブロックに分割し、このマクロブロックを8×8画素に分割するとともに、更に4×4画素に分割して予め定めた順で減算部102及び動き補償予測部123に送出する。尚、マクロブロックの分割は、8×8画素及び4×4画素に分割した小領域の画素ブロック単位で処理する例を代表的に説明し、以下、符号化対象ブロックと称する。
フレーム間予測の場合、動き補償予測部123は、ブロック化部101から供給される符号化対象ブロックに対して、メモリ121から取得する参照画像を用いて動きベクトル検出を行い、得られた動きベクトルを用いて動き補償を行い、その結果得られた予測画像を、切替スイッチ124を介して減算部102及び加算部109に出力する。動きベクトルの情報は、エントロピー符号化部126に送出される。
フレーム内予測の場合、フレーム内予測部122は、メモリ121から取得する参照画像を用いて外挿補間を行って、その結果得られた予測画像を、切替スイッチ124を介して減算部102及び加算部109に出力する。
以下、フレーム間予測及びフレーム内予測のいずれも同様の処理が施されるため、フレーム間予測の場合を説明する。以下、代表的に、4×4ブロックの符号化について説明するが、8×8ブロックや16×16ブロックによる符号化も同様である。
減算部102は、ブロック化部101からの符号化対象ブロックと、動き補償予測部123からの予測画像との差分信号を生成して直交変換部103に送出する。
直交変換部103は、減算部102から供給される4×4ブロックの差分信号に対して直交変換(整数精度DCT)を施し、量子化部104に送出する。
量子化部104は、直交変換部103から供給される4×4ブロックの差分信号の直交変換係数に対応する配列で量子化を行うための正規化係数マトリクス(量子化演算に用いるMF:Multiplication Factorのマトリクス)を用いて、4×4ブロックの差分信号の直交変換係数に対して量子化処理を行い、得られた量子化ブロックを、スキャニング部125を経てエントロピー符号化部126へ送出するとともに、逆量子化部106に送出する。
スキャニング部125は、直交変換(整数精度DCT)に対応する予め定めたスキャニングオーダーで量子化ブロックの読出しを行い、エントロピー符号化部126へ送出する。
エントロピー符号化部126は、量子化部104から供給される量子化ブロックについてエントロピー符号化処理(適応的な可変長符号化処理や算術符号化処理を選択可能)を施しビットストリームを生成するとともに、動き補償予測部123から供給される動きベクトルの情報もエントロピー符号化処理を施して出力する。
逆量子化部106は、量子化部104から供給される量子化ブロックについて逆量子化処理を行って逆直交変換部107に出力する。
逆直交変換部107は、逆量子化部106から供給される直交変換係数に対して逆直交変換(整数精度IDCT)を施し、加算部109に出力する。
加算部109では、逆直交変換部107から得られる逆直交変換した信号と、動き補償予測部123を経て得られる予測画像とを加算処理して復号画像を生成し、ブロック歪みを抑制するデブロッキングフィルタ120を介してメモリ121に格納する。メモリ121に格納された画像は、フレーム間予測における参照画像、フレーム内予測における参照画像として用いられる。
尚、切替スイッチ124は、画面内予測と画面間予測の切り替えに用いられる。
ところで、MPEG−4AVC/H.264では、直交変換部103及び量子化部104、並びに逆量子化部106及び逆直交変換部107は、それぞれ一括処理されるため、本説明では、それぞれ整数精度変換部105及び整数精度逆変換部108として図示している。
これは、直交変換と量子化を一括処理する際に、正規化係数が用いられるためである。即ち、直交変換行列で4×4ブロックの差分信号を周波数係数列に変換した値に対して正規化係数を乗じると本来の直交変換係数列となるが、この正規化係数に対応させた量子化パラメータqPを予め規定しておき、量子化ステップの対数と量子化パラメータqPが比例関係(量子化係数qPが6増えると量子化ステップが2倍)となるように、予め正規化係数マトリクスの要素位置ごとの値(後述するα,β,γごとの値)を量子化係数として規定しておく。
逆直交変換と逆量子化も同様な逆処理で一括処理される。
次に、従来からの対応する復号装置(例としてMPEG−4AVC/H.264)の構成例を図18に示す。上記と同様、フレーム間予測及びフレーム内予測のいずれも同様の処理が施されるため、フレーム間予測の場合を説明する。
[復号装置]
従来からの復号装置300は、エントロピー復号部301と、スキャニング部302と、整数精度逆変換部305(逆量子化部303及び逆直交変換部304からなる)と、加算部306と、デブロッキングフィルタ307と、メモリ308と、フレーム内予測部309と、動き補償予測部310と、切替スイッチ311と、並べ替え部312とを備える。以下、代表的に、4×4ブロックの符号化について説明するが、8×8ブロックや16×16ブロックによる符号化も同様である。
エントロピー復号部301は、符号化されたビットストリームを入力して、エントロピー復号処理(符号化装置側で指定される適応的な可変長復号処理や算術符号化の復号処理)を施し、符号化装置側で指定されるスキャニングオーダーで量子化ブロックを読み出し、逆量子化部303に送出するとともに、動きベクトルの情報を復号して動き補償予測部310に送出する。
逆量子化部303は、エントロピー復号部301から供給される量子化ブロックの量子化信号に対して逆量子化処理を施して4×4ブロックの差分信号の直交変換係数を取得し、逆直交変換部304に送出する。
逆直交変換部304は、逆量子化部303から供給される4×4ブロックの差分信号の直交変換係数に対して、逆直交変換(整数精度IDCT)を施し、得られる当該4×4ブロックの差分信号を加算部306に送出する。
動き補償予測部310は、メモリ310から得られる参照画像とエントロピー復号部301から得られる動きベクトルとを用いて予測画像を生成し、切替スイッチ311を介して加算部306に出力する。
加算部306は、逆直交変換部304から得られる当該差分信号と、動き補償予測部310から供給される予測画像とを加算して4×4画素ブロックの画像信号を復元し、復元した画像信号を、ブロック歪みを抑制するデブロッキングフィルタ307を介して並べ替え部312に送出するとともに、メモリ308に格納する。
並べ替え部312は、復元した画像信号を表示信号として並べ替えを行う。
整数精度逆変換部305の逆直交変換と逆量子化は、符号化装置側と同様な逆処理で一括処理される。
このように、MPEG−4AVC/H.264では、動き補償予測又は画面内予測の予測信号と、ブロック分割された画像信号との差分信号に対して、整数精度DCTの直交変換(整数精度IDCTの逆直交変換)が採用されている。
画像信号を周波数領域で表現すると、一般的に低域にエネルギーが集中することが知られており、DCTを使用することで低周波領域にエネルギーを集中させることができ、例えば8×8画素に対応する符号化対象ブロックでDCTを施した場合、64個の直交変換係数の信号を形成することができるが、高周波成分の信号が0又は0に近い数値になりやすい。そこで、映像符号化では、このように0と分かっている直交変換係数の信号をわざわざ伝送する必要がないため、高周波成分以外の直交変換係数の信号だけを伝送することで伝送信号の圧縮を実現する。
しかしながら、例えば吹雪や水しぶき、或いは極端に複雑なテクスチャなどの画像信号は、高周波成分の信号を多く含み、DCTを用いて周波数領域の信号に変換してもエネルギー集中が十分ではなく、符号化効率が低下する場合があり、復号した際の画像信号の劣化につながることもあることが知られている。
このために、DCTベースの符号化方式では符号化が困難な画像信号を効率的に符号化する技術が望まれている。
一方、高周波成分の信号に対し良好なエネルギー集中度を示す直交変換としてDST(離散コサイン変換)が知られている。DCTとDSTは、DCTの変換核がコサイン(cos)で構成されるのに対して、DSTの変換核がサイン(sin)である点だけが相違する。だたし、DCTは、cos(0)が直流成分を表すことができるのに対し、DSTはsin(0)が常に0となるために、直流成分を単独の直交変換係数として表すことができないという性質がある。このため、DCTは、直流成分を多く持つ画像信号に対してエネルギー集中度が高くなり、且つ1つの直交変換係数で直流成分を表すことができるが、DSTは、直流成分を多く持つ画像信号に対してエネルギー分散を生じ、複数の直交変換係数で直流成分を表すことになる。
このような性質の違いから、一般的に低周波成分を多く含む画像信号の符号化では、DCTが使用され、DSTが使用されることは極めて稀である。
ところで、このDCTとDSTの性質の違いを利用して、フレーム画像を小領域のブロックに分割し、このブロックをDCTとDSTの双方で直交変換を施し、ブロック内の画素間相関の強さを、DCTとDSTの各係数の0ランレングスの長さで比較して、いずれが適切な直交変換であるかを判別して、量子化するための直交変換係数を決定する技術が開示されている(例えば、特許文献1参照)。
特開平5−22715号公報
前述した特許文献1の技術では、符号化対象ブロック内の画素間相関の強さを、DCTとDSTとの係数で、単純な0ランレングスの長さで比較し、差分信号を符号化するものではなく、符号化対象ブロックの画素値に対して直交変換を施して得られる直交変換係数を量子化して符号化する技術である。
しかしながら、DCTとDSTの各係数で、単純な0ランレングスの長さで比較するよりも、確実に符号化時の影響を反映させたブロック内の画素間相関の強さに応じた最適な切り替えとしては改善の余地がある。
また、上述したように、映像符号化では、動き補償予測技術や画面内予測技術などの発展により現在の符号化方式において実際に直交変換処理の対象となる信号は、これらの差分信号である。例えば、MPEGでは、この差分信号に対してDCTの直交変換を行うことが多い。特に、MPEG−4AVC/H.264では、動き補償予測又は画面内予測の予測信号と、ブロック分割された画像信号との差分信号(差分信号)に対して、整数精度DCTの直交変換が採用されている。
この整数精度DCTは、後述する変換行列を2次元の画素ブロックに対して水平(この変換行列に入力して直交変換を実行)、垂直(この変換行列を転置した行列に入力して直交変換を実行)に1回ずつ適用することで2次元の直交変換係数を求める。この整数精度DCTの直交変換は、符号化/復号時の演算精度の違いによる演算誤差(量子化誤差)を極力抑えるべく、正規化係数を用いて量子化演算と一括して処理される。尚、正規化係数は、整数精度直交変換の前後で信号のエネルギーの大きさ(直交変換係数の2乗の総和)が変化しないように補正する係数である。
そこで、現行の符号化技術におけるMPEG−4AVC/H.264に対して、前述した特許文献1の技術を適用した場合、例えば、図19に示すような構成が考えられる。
即ち、図19は、図16に示す符号装置100における直交変換部103において、入力される4×4ブロックの差分信号に対して整数精度DCTを施すDCT1031a及び整数精度DSTを施すDST1031bと、DCT1031aとDST1031bの各係数に対して、単純な0ランレングスの長さで比較して量子化するための直交変換係数を決定する0ランレングス比較部1032と、決定された直交変換係数を量子化するべく切り替えを行う切替スイッチ1033とを構成した場合を想定した図である。
上記の差分信号に対してDCTを施した結果は、画素ブロックに直接的にDCTを施した場合よりも、直流成分のエネルギーが減少し、全体的なエネルギー集中度が減少する。一方で、上記の差分信号に対してDSTを施した結果は、画素ブロックに直接的にDSTを施した場合よりも、全体的なエネルギー集中度が増大する。
従って、上記の差分信号に対してDCTとDSTの双方で直交変換を施し、DCTとDSTの各係数の0ランレングスの長さで単純に比較するやり方では、高域に存在する“はずれ値”があるとその影響を受けてしまい必ずしも安定した符号化効率が得られないので、より符号化効率を確実に高める技法が望まれる。
また、MPEG−4AVC/H.264では、演算負担を軽減させることを意図して、整数精度DCTと量子化を一括処理するように規定されており、単にDCTとDSTの双方で直交変換を施すように構成することは現在における映像符号化の趣旨にも反することになりかねず、DCTとDSTの双方で直交変換を施すとしても如何にして演算負担を軽減させるかが問題となる。
本発明の目的は、上述のような問題に鑑みて、演算負担をさほど増大させることなく、最適な直交変換係数を判断して符号化する符号化装置、この符号化した信号を復号する復号装置及びプログラムを提供することにある。
本発明では、DCTとDSTの性質の違いをより的確に利用して符号化効率を高める。1つの例では、DCTとDSTのエネルギーの総和で比較して、視覚感度の高い信号成分のエネルギーの集中度が高いほうを選択することにより、任意の画像に対して適応した符号化を符号量も鑑みて選択することができ、結果として従来技術よりも符号量も少なく画質もよくなる。
即ち、本発明による符号化装置は、フレーム画像を小領域に分割した符号化対象ブロックに対して予測画像を生成し、該符号化対象ブロックと前記予測画像の差分信号を符号化する符号化装置であって、前記差分信号に対して第1の直交変換処理を施して符号化するか、又は前記差分信号に対して前記第1の直交変換処理に対してn次の基底同士が直交関係にある第2の直交変換処理を施して符号化するかを切り替える切替手段と、前記フレーム画像に対して符号化を行う場合のコスト計算を行って、より少ない符号量となるよう前記差分信号ごとに前記切替手段の切り替えを制御するコスト算出手段と、前記第1の直交変換処理及び/又は前記第2の直交変換処理によって得られる直交変換係数に対して量子化処理を施す量子化手段とを備え、前記量子化手段は、前記第1の直交変換処理及び前記第2の直交変換処理に対して共通の正規化係数マトリクスを用いて量子化する手段を有することを特徴とする。
即ち、本発明による符号化装置は、前記量子化手段は、前記正規化係数マトリクスの読み出し順を切替えることにより前記切替手段の切り替えによらず、当該共通の正規化係数マトリクスを用いて量子化する手段を有することを特徴とする。
また、本発明による符号化装置において、前記量子化手段による量子化後の伝送すべき係数を1次元配列に変換する際のスキャニングオーダーを前記第1の直交変換処理及び前記第2の直交変換処理の切り替えに応じて切り替えるスキャニング手段を有し、前記第1の直交変換処理及び前記第2の直交変換処理における互いの変換行列が、前記第1の直交変換処理及び前記第2の直交変換処理の切り替えに応じて切り替えられるスキャニングオーダーに対応して当該共通の正規化係数マトリクスを用いて量子化することができる直交関係で規定されていることを特徴とする。
また、本発明による符号化装置において、前記コスト算出手段は、前記符号化対象ブロックに対して異なる画素ブロックサイズごとの差分信号についてそれぞれコスト計算を行って、最も少ない符号量となる画素ブロックサイズ及び直交変換処理の組み合わせを決定し、前記符号化対象ブロックの差分信号に対する前記切替手段の切り替えを制御する手段を有することを特徴とする。
また、本発明による符号化装置において、前記第1の直交変換処理は、前記第2の直交変換処理よりも少ない係数で直流成分を表現する基底に基づいており、前記切替手段は、前記第1の直交変換処理及び前記第2の直交変換処理の前後に切替スイッチを有し、前記コスト算出手段は、前記差分信号の分散値をアクティビティの値として算出して分散値が所定の閾値より大きい場合にのみ前記第2の直交変換処理を選択するか、又は前記差分信号内の隣接画素間の相関係数をアクティビティの値として算出して相関係数が所定の閾値より小さい場合にのみ前記第2の直交変換処理を選択するよう前記切替スイッチを制御する比較手段を有することを特徴とする。
また、本発明による符号化装置において、前記第1の直交変換処理は、前記第2の直交変換処理よりも少ない係数で直流成分を表現する基底に基づいており、前記切替手段は、前記第1の直交変換処理及び前記第2の直交変換処理の後段に切替スイッチを有し、前記コスト算出手段は、前記第1の直交変換処理によるマクロブロックの直交変換係数のエネルギー分布を算出してエネルギー集中度を算出する第1マクロブロックエネルギー集中度算出手段と、前記第2の直交変換処理によるマクロブロックの直交変換係数のエネルギー分布を算出してエネルギー集中度を算出する第2マクロブロックエネルギー集中度算出手段と、各々で算出したエネルギー集中度を比較して、エネルギー集中度の高いほうの前記第1の直交変換処理又は前記第2の直交変換処理のいずれかを選択するよう前記切替スイッチを制御する手段とを有することを特徴とする。
また、本発明による符号化装置において、前記第1の直交変換処理は、前記第2の直交変換処理よりも少ない係数で直流成分を表現する基底に基づいており、前記切替手段は、前記第1の直交変換処理の後段処理としての量子化及びエントロピー符号化処理を施す第1信号系統と、前記第2の直交変換処理の後段処理としての量子化及びエントロピー符号化処理を施す第2信号系統の後段に切替スイッチを有し、前記コスト算出手段は、前記第1信号系統の符号化値の歪み量を算出する第1歪み量算出手段と、前記第2信号系統の符号化値の歪み量を算出する第2歪み量算出手段と、各々で算出した歪み量について、レート歪み最適化法に基づくコスト値を比較して効率の良いほうの前記第1信号系統又は前記第2信号系統のいずれかを選択するよう前記切替スイッチを制御する手段とを有することを特徴とする。
更に、本発明による復号装置は、フレーム画像を小領域に分割した符号化対象ブロックに対して予測画像を生成し、該符号化対象ブロックと前記予測画像の差分信号を符号化することによって符号化されたフレーム画像を復号する復号装置であって、本発明の符号化装置における比較手段によって生成される、前記第1の直交変換処理及び前記第2の直交変換処理のいずれを選択したかを表す制御信号を取得して、符号化された当該フレーム画像を復号する手段を有し、該手段は、符号化された当該フレーム画像における量子化信号に対して、前記第1の直交変換処理及び前記第2の直交変換処理に共通する正規化係数マトリクスを用いて逆量子化処理を施す手段を有することを特徴とする。
また、本発明による符号化装置及び復号装置は、コンピュータとして構成することができ、各符号化及び復号処理を実行するプログラムとしての特徴を有する。
本発明によれば、演算負担をさほど増大させることなく、DCTベースの符号化方式ではエネルギー集中度が十分でないような画像信号に対しても、最適な直交変換係数を判断して符号化及び復号することができる。
本発明による一実施例の符号化装置の概略図である。 本発明による一実施例の復号装置の概略図である。 本発明による一実施例のDCT及びDSTの選択を画素値レベルでアクティビティを比較して決定する方法(技法1)に対応する整数精度変換部における直交変換部の構成を示す図である。 本発明による一実施例のDCT及びDSTの双方の直交変換係数のエネルギー分布を算出して決定する方法(技法2)に対応する整数精度変換部における直交変換部の構成を示す図である。 本発明による一実施例のDCT及びDSTの双方の直交変換係数の量子化及びエントロピー符号化による符号量を算出し、その際のレート歪み最適化法に基づくコスト値を比較して効率の良いほうを選択する方法(技法3)に対応する構成を示す図である。 本発明による一実施例のDCT及びDSTの選択を画素値レベルでアクティビティを比較して決定する方法(技法1)及びDCT及びDSTの双方の直交変換係数のエネルギー分布を算出して決定する方法(技法2)の双方に適用可能な整数精度逆変換部における逆直交変換部の構成を示す図である。 本発明による一実施例のDCT及びDSTの整数精度の変換行列の例を示す図である。 本発明による一実施例の量子化部の構成を示す図である。 本発明による一実施例の逆量子化部の構成を示す図である。 本発明による一実施例の正規化係数マトリクスの例を示す図である。 本発明による一実施例の量子化係数の例を示す図である。 本発明による一実施例の正規化係数マトリクスの読み出し順を切替えの説明図である。 本発明による一実施例のDSTの変換行列の変形例を示す図である。 本発明による一実施例のDSTの変換行列の変形例を示す図である。 本発明による一実施例のDCTの場合におけるスキャニングオーダーを示す図である。 本発明による一実施例のDCTの場合におけるスキャニングオーダーを示す図である。 従来からの動画像用の符号化装置(例としてMPEG−4AVC/H.264)の構成例を示す図である。 従来からの対応する復号装置(例としてMPEG−4AVC/H.264)の構成例を示す図である。 DCTとDSTの各係数に対して、0ランレングスの長さで比較して切り替えを行う例である。
以下、本発明による一実施例の符号化装置10及び復号装置30を説明する。
本発明による符号化装置10は、フレーム画像を小領域に分割した符号化対象ブロックに対して予測画像を生成し、該符号化対象ブロックと前記予測画像の差分信号を符号化する符号化装置であり、この差分信号に対して第1の直交変換処理(例えば、DCT)を施して符号化するか、又は当該差分信号に対して第1の直交変換処理に対してn次の基底同士が直交関係にある第2の直交変換処理(例えば、DST)を施して符号化するかを切り替える切替スイッチと、フレーム画像に対して符号化を行う場合のコスト計算を行って、より少ない符号量となるよう前記差分信号ごとに切替スイッチの切り替えを制御するコスト算出部とを備える。第1の直交変換処理(例えば、DCT)は、第2の直交変換処理(例えば、DST)よりも少ない係数で直流成分を表現する基底に基づいており、例えば、このDCT及びDSTの選択基準の方法例として、DCT及びDSTの双方の直交変換係数のエネルギー分布を算出して決定する方法(技法1)、画素値レベルでアクティビティを比較して決定する方法(技法2)、及び、DCT及びDSTの双方の直交変換係数の量子化及びエントロピー符号化による符号量を算出し、その際のレート歪み最適化法に基づくコスト値を比較して効率の良いほうを選択する方法(技法3)がある。いずれの場合も、最適な直交変換係数を判断して符号化することができる。
尚、レート歪み最適化法に基づくコスト算出は、例えば、
http://www.tom.comm.waseda.ac.jp/~tsukuba/source/avm20050609.pdf
を参照されたい。
符号化装置10では、各符号化した伝送信号に、DCTによる直交変換であるかDSTによる直交変換であるかを識別可能な直交変換種別を表す制御信号(例えば、1ビット)を生成する。この制御信号は、選択した直交変換係数列のヘッダ情報として付加して後段の処理へと伝送するやり方と、制御信号を付加情報として別途伝送するやり方とがある。
選択した直交変換係数列のヘッダ情報として付加して後段の処理へと伝送するやり方の場合、局部復号時や復号装置30では、この制御信号に従って続いて伝送される直交変換係数を、当該制御信号によって示される直交変換種別に応じてIDCT又はIDSTの直交変換処理を切替える。
制御信号を付加情報として別途伝送するやり方では、この制御信号に応じて処理対象の直交変換係数に対応して適応的に処理する。
以下の説明では、制御信号を付加情報として別途伝送するやり方で説明することで、選択した直交変換係数列のヘッダ情報として付加して後段の処理へと伝送するやり方も容易に理解されるようになる。
図1は、本発明による一実施例の符号化装置10の概略図である。前述した図16に示す従来からの符号化装置100と同様な構成要素には同一の参照番号を付しており、これらの説明は省略する。
本実施例の符号化装置10は、従来の符号化装置100に対して、DCT及びDSTの選択を画素値レベルでアクティビティを比較して決定する方法(技法1)及びDCT及びDSTの双方の直交変換係数のエネルギー分布を算出して決定する方法(技法2)を適するべく、整数精度変換部105(直交変換部103及び量子化部104)の代わりに、直交変換種別の選択のための制御信号を扱う整数精度変換部15(直交変換部13及び量子化部14)が設けられ、整数精度逆変換部108(逆量子化部106及び逆直交変換部107)の代わりに、直交変換種別の選択のための制御信号を扱う整数精度逆変換部18(逆量子化部16及び逆直交変換部17)が設けられている点で相違する。
また、図2は、本発明による一実施例の復号装置30の概略図である。前述した図18に示す従来からの復号装置300と同様な構成要素には同一の参照番号を付しており、これらの説明は省略する。
本実施例の復号装置30は、従来の復号装置300に対して、画素値レベルでアクティビティを比較して決定する方法(技法1)及びDCT及びDSTの双方の直交変換係数のエネルギー分布を算出して決定する方法(技法2)を適するべく、整数精度逆変換部305(逆量子化部303及び逆直交変換部304)の代わりに、直交変換種別の選択のための制御信号を扱う整数精度逆変換部35(逆量子化部33及び逆直交変換部34)が設けられている点で相違する。
図3は、DCT及びDSTの選択を画素値レベルでアクティビティを比較して決定する方法(技法1)に対応する整数精度変換部15における直交変換部13の構成を示しており、図4は、DCT及びDSTの双方の直交変換係数のエネルギー分布を算出して決定する方法(技法2)に対応する整数精度変換部15における直交変換部13の構成を示している。
また、図6は、DCT及びDSTの選択を画素値レベルでアクティビティを比較して決定する方法(技法1)及びDCT及びDSTの双方の直交変換係数のエネルギー分布を算出して決定する方法(技法2)の双方に適用可能な整数精度逆変換部18における逆直交変換部17を示している。
更に、図8は、DCT及びDSTの選択を画素値レベルでアクティビティを比較して決定する方法(技法1)及びDCT及びDSTの双方の直交変換係数のエネルギー分布を算出して決定する方法(技法2)の双方に適用可能な整数精度変換部15における量子化部14の構成を示している。
更に、図9は、DCT及びDSTの選択を画素値レベルでアクティビティを比較して決定する方法(技法1)及びDCT及びDSTの双方の直交変換係数のエネルギー分布を算出して決定する方法(技法2)の双方に適用可能な整数精度逆変換部35における逆量子化部33の構成を示している。
尚、復号装置30における整数精度逆変換部35(逆量子化部33及び逆直交変換部34)は、整数精度逆変換部18(逆量子化部16及び逆直交変換部17)と同様に動作する。
以下、具体的にそれぞれのDCT及びDSTの選択を画素値レベルでアクティビティを比較して決定する方法(技法1)及びDCT及びDSTの双方の直交変換係数のエネルギー分布を算出して決定する方法(技法2)について順に説明する。
[技法1]
図3(A)を参照するに、DCT及びDSTの選択を画素値レベルでアクティビティを比較して決定する方法(技法1)に対応する直交変換部13は、バッファ131と、切替スイッチ132a及び132bと、DCT133a及びDST133bと、コスト算出部134とを備える。
DCT133a及びDST133bの処理は、図7に示すような整数精度の変換行列が用いられる。図7は、本発明による一実施例のDCT及びDSTの整数精度の変換行列の例を示している。
MPEG−4AVC/H.264では、動き補償予測又は画面内予測の予測画像の信号と、ブロック分割された符号化対象ブロックの画像信号との差分信号に対して、整数精度DCTの直交変換が採用されている。
整数精度DCTの変換行列の基底と、整数精度DSTの変換行列の基底は、それぞれn次の基底同士が直交関係にあることが重要である。例えば、整数精度DCTの変換行列では、0次(1行目)が[1 1 1 1]、1次(2行目)が[2 1 −1 −2]、2次(3行目)が[1 −1 −1 1]、3次(4行目)が[1 −2 2 −1]であり、整数精度DSTの変換行列では、1次(1行目)が[1 2 2 1]、2次(2行目)が[1 1 −1 −1]、3次(3行目)が[2 −1 −1 2]、4次(4行目)が[1 −1 1 −1]であるから、整数精度DCTの変換行列の1次の[2 1 −1 −2]と、整数精度DSTの変換行列の1次の[1 2 2 1]が直交関係にある。
また、MPEG−4AVC/H.264では、4×4直交変換のほかに、8×8直交変換を用いることもできるが、この場合も同様に、整数精度DCTと整数精度DSTを定義する。MPEG−4AVC/H.264以外の直交変換を用いる場合も、同様に基底ごとに互いに直交関係にある2種類の直交変換の変換行列を規定することができる。
本実施例では、基底ごとに互いに直交関係にある2種類の直交変換として、DCT(整数精度DCT)及びDST(整数精度DST)を併用するものとして説明するが、基底ごとに互いに直交関係にある2種類の直交変換であれば、同様の効果を得ることができる。
図3(A)に示す(技法1)における直交変換部13は、減算部102から供給される差分信号をバッファ131に保持して、コスト算出部134によって、バッファ131から処理対象の差分信号を取り出し、そのアクティビティの値からDCT133a及びDST133bのいずれかを選択するよう制御信号を発生させ、切替スイッチ132a及び132bで切り替えを行うように構成される。
図3(B)に示すように、コスト算出部134は、バッファ131から処理対象の差分信号を取り出し、アクティビティの値を算出するアクティビティ算出部1341と、このアクティビティの値と予め定めた閾値と比較してDCT133a及びDST133bのいずれかを選択するよう制御信号を発生する比較部1342とを備える。
コスト算出部134は、例えば入力信号(差分信号)の分散値をアクティビティの値として算出して分散値が所定の閾値より大きい場合にのみDSTを選択するか、又は隣接画素間の相関係数をアクティビティの値として算出して相関係数が所定の閾値より小さい場合にのみDSTを選択するように構成される。
これにより、簡便な方法として、入力信号(差分信号)を直交変換前に分析していずれの直交変換を用いるかを決定することができ、アクティビティ算出よりも処理コストが大きいDCT133a及びDST133bの並列処理が不要となり、処理コストの低減を図ることができる。
図8は、本発明による一実施例の量子化部の構成を示す図である。図8を参照するに、整数精度変換部15における量子化部14は、正規化係数マトリクス記憶部1411と、マトリクス読出制御部1412と、量子化ステップ算出部1413と、量子化演算部1414とを備える。量子化部14の各構成は、MPEG−4AVC/H.264で採用されている処理構成とほぼ同様であるが、DCT133a及びDST133bの各々用の正規化係数マトリクスを正規化係数マトリクス記憶部1411に記憶しておき、マトリクス読出制御部1412が、直交変換部13からの直交変換種別の選択のための制御信号に従って各直交変換に対応する正規化係数マトリクスを読み出すように構成している点で相違する。尚、この制御信号は、ヘッダ情報として付加される場合には、入力される処理対象の信号から抽出する。
量子化ステップ算出部1413は、逆量子化でも共通に用いる予め定めた量子化パラメータqPに従う量子化係数を正規化係数マトリクスから読み出して量子化ステップを算出し、量子化演算部1414が、入力される直交変換係数の信号を、算出した量子化ステップで除算して量子化ブロックの量子化信号を生成して外部に送出する。
正規化係数マトリクスの例、及び量子化係数の例を、それぞれ図10及び図11に示す。この場合の量子化ステップは、量子化パラメータqPを6で除算した剰余(0〜5の値)で定まる要素位置ごとの値(α,β,γごとの値)に対して当該除算した商でビット左シフトさせて得られる値に相当する(MPEG−4AVC/H.264の方式と同様)。
このように、(技法1)によれば、処理コストを低減させつつ、最適な直交変換係数を判断して符号化することができる。
尚、符号化装置10の局部復号の整数精度逆変換部18(逆量子化部16及び逆直交変換部17)の動作は、図6及び図9に示すように簡単な構成で処理コストを増大させることなく実現することができる。
図9は、本発明による一実施例の逆量子化部の構成を示す図である。図9を参照するに、整数精度逆変換部18における逆量子化部16は、正規化係数マトリクス記憶部1611と、マトリクス読出制御部1612と、量子化ステップ算出部1613と、逆量子化演算部1614とを備える。逆量子化部18の各構成は、MPEG−4AVC/H.264で採用されている処理構成とほぼ同様であるが、DCT133a及びDST133bの各々用の正規化係数マトリクスを正規化係数マトリクス記憶部1611に記憶しておき、マトリクス読出制御部1612が、直交変換部13からの直交変換種別の選択のための制御信号に従って各直交変換に対応する正規化係数マトリクスを読み出すように構成している点で相違する。尚、この制御信号は、ヘッダ情報として付加される場合には、入力される処理対象の信号から抽出する。
量子化ステップ算出部1613は、量子化でも共通に用いる予め定めた量子化パラメータqPに従う量子化係数を正規化係数マトリクスから読み出して量子化ステップを算出し、量子化演算部1614が、入力される量子化ブロックの量子化信号を、算出した量子化ステップで乗算して直交変換係数の信号を生成して外部に送出する。
図6に示す逆直交変換部17は、直交変換部13からの制御信号に従って、逆量子化部16から供給される対応する逆直交変換のIDCT171a又はIDST171bのいずれかを選択する切替スイッチ172a及び172bで切り替えを行って、適応的に差分信号を復元する。
整数精度逆変換部18(逆量子化部16及び逆直交変換部17)の動作は、復号装置30における整数精度逆変換部35(逆量子化部33及び逆直交変換部34)の動作も同様である。
従って、(技法1)によれば、処理コストを低減させつつ、最適な直交変換係数を判断して符号化することができる。
次に、DCT及びDSTの双方の直交変換係数のエネルギー分布を算出して決定する方法(技法2)について説明する。
[技法2]
図4(A)を参照するに、DCT及びDSTの双方の直交変換係数のエネルギー分布を算出して決定する方法(技法2)に対応する直交変換部13は、DCT133a及びDST133bと、バッファ134a,134bと、切替スイッチ135と、コスト算出部136とを備える。
図4(A)に示す(技法3)における直交変換部13は、減算部102から供給される差分信号をDCT133a及びDST133bにてそれぞれ直交変換を施し、それぞれバッファ134a,134bに格納するとともに、コスト算出部136によって、DCT133a及びDST133bの双方の直交変換係数のエネルギー分布からDCT133a及びDST133bのいずれかを選択するよう制御信号を発生させ、切替スイッチ135でそれぞれのバッファ134a,134bからの読出しを制御して切替を行うように構成される。
図4(B)に示すように、コスト算出部136は、DCT133aのマクロブロックにおける直交変換係数のエネルギー分布を算出してエネルギー集中度を算出するマクロブロックエネルギー集中度算出部1361と、DST133bのマクロブロックにおける直交変換係数のエネルギー分布を算出してエネルギー集中度を算出するマクロブロックエネルギー集中度算出部1362と、マクロブロックエネルギー集中度算出部1361,1362の各々で算出したエネルギー集中度を比較して、エネルギー集中度の高いほうのDCT133a及びDST133bのいずれかを選択するよう制御信号を発生する比較部1363とを備える。
尚、整数精度変換部15における量子化部14の構成は前述の図8の説明と同様であり、符号化装置10の局部復号の整数精度逆変換部18(逆量子化部16及び逆直交変換部17)の動作や復号装置30における整数精度逆変換部35(逆量子化部33及び逆直交変換部34)の動作も、前述の図6及び図9の説明と同様である。
これにより、(技法2)によれば、(技法1)と比較してDCT133a及びDST133bの並列処理が必要ではあるが、実際に処理した直交変換係数の値からそのエネルギー集中度を比較するため、(技法1)と比較して符号化効率が改善する。
尚、(技法2)の変形例として、DCT及びDSTの選択を画素値レベルでアクティビティを比較して決定する代わりに、DCT133a及び量子化部からなる信号系統と、DST133b及び量子化部からなる信号系統の出力からマクロブロックにおけるエネルギー分布を算出してエネルギー集中度を算出してエネルギー集中度の高いほうの信号系統を選択するよう制御信号を発生するよう整数精度変換部15を構成することもできる(図示せず)。
上述した(技法1)及び(技法2)では、従来からのMPEG−4AVC/H.264の方式の符号化装置300に対して、整数精度変換部15及び整数精度逆変換部18,35を組み替えるのみで、最適な直交変換係数を判断して符号化することができる。一方で、更に符号化効率を向上させたい場合に、DCT及びDSTの双方の直交変換係数の量子化及びエントロピー符号化による符号量を算出し、その際のレート歪み最適化法に基づくコスト値を比較して効率の良いほうを選択する方法(技法3)があり、以下、説明する。
図5は、DCT及びDSTの双方の直交変換係数の量子化及びエントロピー符号化による符号量を算出し、その際のレート歪み最適化法に基づくコスト値を比較して効率の良いほうを選択する方法(技法3)に対応する構成を示している。図5(A)に示すように、DCT及びDSTの双方の直交変換係数の量子化及びエントロピー符号化による符号量を算出するよう構成されたコスト算出処理ユニット19は、DCT133a及びDST133bと、量子化部137a,137bと、エントロピー符号化部138a,138bと、バッファ139a,139bと、切替スイッチ140と、コスト算出部141とを備える。
コスト算出処理ユニット19は、減算部102から供給される差分信号をDCT133a及びDST133bにてそれぞれ直交変換を施し、さらに量子化部137a,137bによって、それぞれの直交変換ごとに量子化を施し、さらにエントロピー符号化部138a,138bによってそれぞれの量子化ブロックの量子化信号ごとにエントロピー符号化を施し、各符号化したビットストリーム信号(符号化値)をそれぞれバッファ139a,139bに格納するとともに、コスト算出部141によって、DCT133a及びDST133bの双方の信号系統における符号量からDCT133a及びDST133bの信号系統のいずれかを選択するよう制御信号を発生させ、切替スイッチ135でそれぞれのバッファ139a,139bからの読出しを制御して切り替えを行うように構成される。
図5(B)に示すように、コスト算出部141は、DCT係数に基づく符号化値から歪み量を算出する歪み量算出部1421と、DST係数に基づく符号化値から歪み量を算出する歪み量算出部1422と、レート歪み最適化法に基づくコスト値を比較して効率の良いほうを選択する比較部1423とを備える。
これにより、(技法3)によれば、(技法1)及び(技法2)と比較してDCT133a及びDST133bからの各信号系統の並列処理が必要ではあるが、実際に処理した直交変換係数の値からその符号化コストと品質の効率によって比較するため、(技法1)及び(技法2)と比較して符号化効率が改善する。
尚、当業者であれば、コスト算出処理ユニット19を、前述した符号化装置10(又は復号装置30)に適用可能であることは上記の説明から理解される。
上記の説明では、4×4ブロックの符号化処理についてコスト計算して最適な直交変換(又は直交変換の信号系統)を選択する例について説明したが、MPEG−4AVC/H.264の方式では、8×8ブロックの符号化処理もサポートされている。従って、本実施例の符号化装置10において、4×4ブロックと8×8ブロックの双方の符号化処理についてコスト計算して最適な直交変換(又は直交変換の信号系統)を選択するように構成することもできる。
最も好適なコスト算出において、符号化対象ブロックに対して異なる画素ブロックサイズごとの差分信号についてそれぞれコスト計算を行って、最も少ない符号量となる画素ブロックサイズ及び直交変換処理の組み合わせを決定し、符号化対象ブロックの差分信号に対する最適な直交変換(又は直交変換の信号系統)を選択するように切り替えを制御することである。つまり、4×4ブロックと8×8ブロックの双方の符号化処理についてコスト計算することは、前述したいずれの例でも適用可能である。
例えば、ブロック化部101によって、16×16画素マクロブロックから、8×8画素(8×8ブロック)に分割し、さらに、4×4画素(4×4ブロック)に再分割する例を考える。この場合、8×8ブロックで、直交変換(又は直交変換の信号系統)のコスト計算を行うとともに、4×4ブロックで、直交変換(又は直交変換の信号系統)のコスト計算を行う。続いて、例えばレート歪み最適化法に基づいて算出した全てのコスト値から最小のものを選択し、符号化ビットストリームを最終決定する。
上記の例では、DCTベースの符号化方式ではエネルギー集中度が十分でないような画像信号に対しても、ブロック内の画素間相関の強さに適切に応じた直交変換係数を判断して符号化する符号化装置10、この符号化した信号を復号する復号装置30が実現される。ただし、MPEG−4AVC/H.264では、演算負担を軽減させることを意図して、整数精度DCTと量子化を一括処理するように規定されており、単にDCTとDSTの双方で直交変換を施すように構成することは現在における映像符号化の趣旨にも反することになりかねない。そこで、DCTとDSTの双方で直交変換を施すとしても如何にして演算負担を軽減させるかについて以下説明する。
通常、MPEG−4AVC/H.264の方式のままでDCTとDSTを併用すると、正規化係数マトリクス(量子化演算に用いるMF:Multiplication Factorのマトリクス)として、各直交変換に固有の量子化係数からなるものを用意する必要があり、DCTとDSTでは個別の正規化係数マトリクスを用いることになる。このような正規化係数マトリクスは符号化装置及び復号装置でメモリに保持し続ける必要があり、2種類の直交変換を採用する場合、量子化のためのメモリ量が2倍になるという問題が生じる。
しかしながら、図10から明らかなように、整数精度DCTと整数精度DSTでは、正規化係数マトリクスの配置が、右下方向に(1,1)ずらした関係にあり、各々の係数値が一致する。
そこで、マトリクス読出制御部1412,1612(図8及び図9)によって、DCTの正規化係数マトリクスのみを正規化係数マトリクス記憶部1411,1611(図8及び図9)に格納しておき、マトリクス読出制御部1412,1612(図8及び図9)によって、DCTとDSTで正規化係数マトリクスの読み出し順を切替えることで、DCTとDSTで同一の正規化係数マトリクスからそれぞれの量子化係数の値を用いることができるようになり、メモリ量の増大の問題を解決することができる(図12参照)。
更に、別の方法として、正規化係数マトリクスの読み出し順を切替える代わりに、マトリクス読出制御部1412,1612(図8及び図9)によって、DCTの正規化係数マトリクスのみを正規化係数マトリクス記憶部1411,1611(図8及び図9)に格納しておき、DSTの変換行列を図13及び図14に示すごとく変形し、DCT及びDSTにおける互いの変換行列が、DCT及びDSTの切り替えに応じて切り替えられるスキャニングオーダーに対応して当該共通の正規化係数マトリクスを用いて量子化することができる直交関係で規定する。これにより、スキャニング部125によって当該直交変換の切り替えを表す制御信号に従って、量子化後の伝送すべき係数を1次元配列に変換する際のスキャニングオーダーをDCT(図15)とDST(図16)で切替えることで、DCTとDSTで同一の正規化係数マトリクスからそれぞれの量子化係数の値を用いることができるようになり、メモリ量の増大の問題を解決することができる。
即ち、DSTの変換行列を変形して直交変換を施し、DCTと同一の正規化係数マトリクスを用いると、DSTの最低次数が(0,0)の位置でなく、(1,1)に配置されるため、量子化後の伝送すべき係数を1次元配列に変換する際のスキャニングオーダーを(1,1)から開始するようにする。
符号化装置10における局部復号時や、復号装置30における逆量子化を行う場合も同様に、DCT及びDSTのいずれを選択したかを表す制御信号を取得して、符号化された当該フレーム画像を復号する際に、符号化された当該フレーム画像における量子化信号に対して、DCT及びDSTに共通する正規化係数マトリクスを用いて逆量子化処理を施すように構成する。
また、MPEG−4AVC/H.264では、画面内予測時に、例えば4×4ブロック(輝度信号)及び2×2ブロック(色差信号)のDCTの直交変換係数の直流成分に対しては、1つの直流成分の画素ブロックを構成してアダマール変換を実行することで空間周波数分解能を改善する技術があるが、本発明に係るDSTの最低次数の成分に対して同様にアダマール変換を実行するよう構成することもできる。
これにより、演算負担をさほど増大させることなく、DCTベースの符号化方式ではエネルギー集中度が十分でないような画像信号に対しても、ブロック内の画素間相関の強さに適切に応じた直交変換係数を判断して符号化する符号化装置、及び、この符号化した信号を復号する復号装置を実現することができる。
更に、本発明の一態様として、符号化装置10及び復号装置30をコンピュータとして構成させることができる。コンピュータに、前述した符号化装置10及び復号装置30の各構成要素を実現させるためのプログラムは、コンピュータの内部又は外部に備えられる記憶部に記憶される。そのような記憶部は、外付けハードディスクなどの外部記憶装置、或いはROM又はRAMなどの内部記憶装置で実現することができる。コンピュータに備えられる制御部は、中央演算処理装置(CPU)などの制御で実現することができる。即ち、CPUが、各構成要素の機能を実現するための処理内容が記述されたプログラムを、適宜、記憶部から読み込んで、各構成要素の機能をコンピュータ上で実現させることができる。ここで、各構成要素の機能をハードウェアの一部で実現しても良い。
また、この処理内容を記述したプログラムを、例えばDVD又はCD−ROMなどの可搬型記録媒体の販売、譲渡、貸与等により流通させることができるほか、そのようなプログラムを、例えばネットワーク上にあるサーバの記憶部に記憶しておき、ネットワークを介してサーバから他のコンピュータにそのプログラムを転送することにより、流通させることができる。
また、そのようなプログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラム又はサーバから転送されたプログラムを、一旦、自己の記憶部に記憶することができる。また、このプログラムの別の実施態様として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、更に、このコンピュータにサーバからプログラムが転送される度に、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。
以上、具体例を挙げて本発明の実施例を詳細に説明したが、本発明の特許請求の範囲から逸脱しない限りにおいて、あらゆる変形や変更が可能であることは当業者に明らかである。特に、正規化部における正規化処理は、教師信号による修正処理における信号間の相関をとるためのレベル調整を行うものであればよい。
本発明によれば、DCTベースの符号化方式ではエネルギー集中度が十分でないような画像信号に対しても、最適な直交変換係数を判断して符号化することが可能となるので、映像符号化技術に有用である。
10 符号化装置
13 直交変換部
14 量子化部
15 整数精度変換部
16 逆量子化部
17 逆直交変換部
18 整数精度逆変換部
19 コスト算出処理ユニット
30 復号装置
33 逆量子化部
34 逆直交変換部
35 整数精度逆変換部
100 符号化装置
101 ブロック化部
102 減算部
103 直交変換部
104 量子化部
105 整数精度変換部
106 逆量子化部
107 逆直交変換部
108 整数精度逆変換部
109 加算部
120 デブロッキングフィルタ
121 メモリ
122 フレーム内予測部
123 動き補償予測部
124 切替スイッチ
125 スキャニング部
126 エントロピー符号化部
131 バッファ
134 コスト算出部
134a,134b バッファ
135 切替スイッチ
136 コスト算出部
137a,137b 量子化部
138a,138b エントロピー符号化部
139a,139b バッファ
140 切替スイッチ
141 コスト算出部
171a 整数精度IDCT
171b 整数精度IDST
172a,172b 切替スイッチ
300 復号装置
301 エントロピー復号部
302 スキャニング部
303 逆量子化部
304 逆直交変換部
305 整数精度逆変換部
306 加算部
307 デブロッキングフィルタ
308 メモリ
309 フレーム内予測部
310 動き補償予測部
311 切替スイッチ
312 並べ替え部
1031a 整数精度DCT
1031b 整数精度DST
1032 0ランレングス比較部
1033 切替スイッチ
1341 アクティビティ算出部
1361,1362 マクロブロックエネルギー集中度算出部
1363 比較部
1411 正規化係数マトリクス記憶部
1412 マトリクス読出制御部
1413 量子化ステップ算出部
1414 量子化演算部
1421,1422 歪み量算出部
1423 比較部
1611 正規化係数マトリクス記憶部
1612 マトリクス読出制御部
1613 量子化ステップ算出部
1614 逆量子化演算部

Claims (10)

  1. フレーム画像を小領域に分割した符号化対象ブロックに対して予測画像を生成し、該符号化対象ブロックと前記予測画像の差分信号を符号化する符号化装置であって、
    前記差分信号に対して第1の直交変換処理を施して符号化するか、又は前記差分信号に対して前記第1の直交変換処理に対してn次の基底同士が直交関係にある第2の直交変換処理を施して符号化するかを切り替える切替手段と、
    前記フレーム画像に対して符号化を行う場合のコスト計算を行って、より少ない符号量となるよう前記差分信号ごとに前記切替手段の切り替えを制御するコスト算出手段と、
    前記第1の直交変換処理及び/又は前記第2の直交変換処理によって得られる直交変換係数に対して量子化処理を施す量子化手段とを備え、
    前記量子化手段は、前記第1の直交変換処理及び前記第2の直交変換処理に対して共通の正規化係数マトリクスを用いて量子化する手段を有することを特徴とする符号化装置。
  2. 前記量子化手段は、前記正規化係数マトリクスの読み出し順を切替えることにより前記切替手段の切り替えによらず、当該共通の正規化係数マトリクスを用いて量子化する手段を有することを特徴とする、請求項1に記載の符号化装置。
  3. 前記量子化手段による量子化後の伝送すべき係数を1次元配列に変換する際のスキャニングオーダーを前記第1の直交変換処理及び前記第2の直交変換処理の切り替えに応じて切り替えるスキャニング手段を有し、
    前記第1の直交変換処理及び前記第2の直交変換処理における互いの変換行列が、前記第1の直交変換処理及び前記第2の直交変換処理の切り替えに応じて切り替えられるスキャニングオーダーに対応して当該共通の正規化係数マトリクスを用いて量子化することができる直交関係で規定されていることを特徴とする、請求項1に記載の符号化装置。
  4. 前記コスト算出手段は、前記符号化対象ブロックに対して異なる画素ブロックサイズごとの差分信号についてそれぞれコスト計算を行って、最も少ない符号量となる画素ブロックサイズ及び直交変換処理の組み合わせを決定し、前記符号化対象ブロックの差分信号に対する前記切替手段の切り替えを制御する手段を有することを特徴とする、請求項1〜3のいずれか一項に記載の符号化装置。
  5. 前記第1の直交変換処理は、前記第2の直交変換処理よりも少ない係数で直流成分を表現する基底に基づいており、
    前記切替手段は、前記第1の直交変換処理及び前記第2の直交変換処理の前後に切替スイッチを有し、
    前記コスト算出手段は、前記差分信号の分散値をアクティビティの値として算出して分散値が所定の閾値より大きい場合にのみ前記第2の直交変換処理を選択するか、又は前記差分信号内の隣接画素間の相関係数をアクティビティの値として算出して相関係数が所定の閾値より小さい場合にのみ前記第2の直交変換処理を選択するよう前記切替スイッチを制御する比較手段を有することを特徴とする、請求項1〜4のいずれか一項に記載の符号化装置。
  6. 前記第1の直交変換処理は、前記第2の直交変換処理よりも少ない係数で直流成分を表現する基底に基づいており、
    前記切替手段は、前記第1の直交変換処理及び前記第2の直交変換処理の後段に切替スイッチを有し、
    前記コスト算出手段は、
    前記第1の直交変換処理によるマクロブロックの直交変換係数のエネルギー分布を算出してエネルギー集中度を算出する第1マクロブロックエネルギー集中度算出手段と、
    前記第2の直交変換処理によるマクロブロックの直交変換係数のエネルギー分布を算出してエネルギー集中度を算出する第2マクロブロックエネルギー集中度算出手段と、
    各々で算出したエネルギー集中度を比較して、エネルギー集中度の高いほうの前記第1の直交変換処理又は前記第2の直交変換処理のいずれかを選択するよう前記切替スイッチを制御する手段とを有することを特徴とする、請求項1〜4のいずれか一項に記載の符号化装置。
  7. 前記第1の直交変換処理は、前記第2の直交変換処理よりも少ない係数で直流成分を表現する基底に基づいており、
    前記切替手段は、前記第1の直交変換処理の後段処理としての量子化及びエントロピー符号化処理を施す第1信号系統と、前記第2の直交変換処理の後段処理としての量子化及びエントロピー符号化処理を施す第2信号系統の後段に切替スイッチを有し、
    前記コスト算出手段は、
    前記第1信号系統の符号化値の歪み量を算出する第1歪み量算出手段と、
    前記第2信号系統の符号化値の歪み量を算出する第2歪み量算出手段と、
    各々で算出した歪み量について、レート歪み最適化法に基づくコスト値を比較して効率の良いほうの前記第1信号系統又は前記第2信号系統のいずれかを選択するよう前記切替スイッチを制御する手段とを有することを特徴とする、請求項1〜4のいずれか一項に記載の符号化装置。
  8. フレーム画像を小領域に分割した符号化対象ブロックに対して予測画像を生成し、該符号化対象ブロックと前記予測画像の差分信号を符号化することによって符号化されたフレーム画像を復号する復号装置であって、
    前記請求項1〜7のいずれか一項に記載の符号化装置における比較手段によって生成される、前記第1の直交変換処理及び前記第2の直交変換処理のいずれを選択したかを表す制御信号を取得して、符号化された当該フレーム画像を復号する手段を有し、
    該手段は、符号化された当該フレーム画像における量子化信号に対して、前記第1の直交変換処理及び前記第2の直交変換処理に共通する正規化係数マトリクスを用いて逆量子化処理を施す手段を有することを特徴とする復号装置。
  9. フレーム画像を小領域に分割した符号化対象ブロックに対して予測画像を生成し、該符号化対象ブロックと前記予測画像の差分信号を符号化する符号化装置として構成するコンピュータに、
    前記差分信号に対して第1の直交変換処理を施して符号化するか、又は前記差分信号に対して前記第1の直交変換処理に対してn次の基底同士が直交関係にある第2の直交変換処理を施して符号化するかを切り替えるステップと、
    前記フレーム画像に対して符号化を行う場合のコスト計算を行って、より少ない符号量となるよう前記差分信号ごとに当該切り替えを制御するステップと、
    前記第1の直交変換処理及び/又は前記第2の直交変換処理によって得られる直交変換係数に対して量子化処理を施すステップと、を実行させるためのプログラムであって、
    該ステップは、前記第1の直交変換処理及び前記第2の直交変換処理に対して共通の正規化係数マトリクスを用いて量子化するステップを含むことを特徴とするプログラム。
  10. フレーム画像を小領域に分割した符号化対象ブロックに対して予測画像を生成し、該符号化対象ブロックと前記予測画像の差分信号を符号化することによって符号化されたフレーム画像を復号する復号装置として構成するコンピュータに、
    前記請求項1〜7のいずれか一項に記載の符号化装置における比較手段によって生成される、前記第1の直交変換処理及び前記第2の直交変換処理のいずれを選択したかを表す制御信号を取得するステップと、
    該制御信号に基づいて、前記符号化装置によって符号化された当該フレーム画像を復号するステップと、を実行させるためのプログラムであって、
    該ステップは、符号化された当該フレーム画像における量子化信号に対して、前記第1の直交変換処理及び前記第2の直交変換処理に共通する正規化係数マトリクスを用いて逆量子化処理を施すステップを含むことを特徴とするプログラム。
JP2010086549A 2010-04-02 2010-04-02 符号化装置、復号装置及びプログラム Active JP5377395B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010086549A JP5377395B2 (ja) 2010-04-02 2010-04-02 符号化装置、復号装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010086549A JP5377395B2 (ja) 2010-04-02 2010-04-02 符号化装置、復号装置及びプログラム

Publications (3)

Publication Number Publication Date
JP2011223068A true JP2011223068A (ja) 2011-11-04
JP2011223068A5 JP2011223068A5 (ja) 2013-05-23
JP5377395B2 JP5377395B2 (ja) 2013-12-25

Family

ID=45039531

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010086549A Active JP5377395B2 (ja) 2010-04-02 2010-04-02 符号化装置、復号装置及びプログラム

Country Status (1)

Country Link
JP (1) JP5377395B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014120367A1 (en) * 2013-01-30 2014-08-07 Intel Corporation Content adaptive parametric transforms for coding for next generation video
JP2014220624A (ja) * 2013-05-07 2014-11-20 日本放送協会 画像処理装置、符号化装置、及びプログラム
JP2015156647A (ja) * 2010-12-29 2015-08-27 クゥアルコム・インコーポレイテッドQualcomm Incorporated マッピングされた変換と走査モードとを使用するビデオコード化
JP2015530040A (ja) * 2012-08-21 2015-10-08 クゥアルコム・インコーポレイテッドQualcomm Incorporated スケーラブルビデオコード化における代替変換
US9661338B2 (en) 2010-07-09 2017-05-23 Qualcomm Incorporated Coding syntax elements for adaptive scans of transform coefficients for video coding
JP2019216459A (ja) * 2012-04-16 2019-12-19 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュートElectronics And Telecommunications Research Institute 符号化方法及び復号化方法、並びにそれを利用する装置
JP2020108155A (ja) * 2012-07-02 2020-07-09 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュートElectronics And Telecommunications Research Institute 映像符号化方法及び装置、並びに映像復号化方法及び装置
CN116886913A (zh) * 2023-08-03 2023-10-13 镕铭微电子(济南)有限公司 率失真优化量化方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02200082A (ja) * 1989-01-30 1990-08-08 Hitachi Ltd 画像符号化装置
JPH0522715A (ja) * 1991-07-12 1993-01-29 Sony Corp 画像符号化装置
JPH10285595A (ja) * 1997-04-08 1998-10-23 Matsushita Joho Syst Kk 画像データ送受信装置
JPH1155678A (ja) * 1997-07-31 1999-02-26 Victor Co Of Japan Ltd ブロック間内挿予測符号化装置、復号化装置、符号化方法及び復号化方法
JP2009188514A (ja) * 2008-02-04 2009-08-20 Nippon Hoso Kyokai <Nhk> 画像符号化装置、画像復号装置及び画像処理プログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02200082A (ja) * 1989-01-30 1990-08-08 Hitachi Ltd 画像符号化装置
JPH0522715A (ja) * 1991-07-12 1993-01-29 Sony Corp 画像符号化装置
JPH10285595A (ja) * 1997-04-08 1998-10-23 Matsushita Joho Syst Kk 画像データ送受信装置
JPH1155678A (ja) * 1997-07-31 1999-02-26 Victor Co Of Japan Ltd ブロック間内挿予測符号化装置、復号化装置、符号化方法及び復号化方法
JP2009188514A (ja) * 2008-02-04 2009-08-20 Nippon Hoso Kyokai <Nhk> 画像符号化装置、画像復号装置及び画像処理プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN6013027229; KENNETH ROSE,ARIE HEIMAN,ITS' HAK DINSTEIN: 'DCT/DST alternate-transform image coding' IEEE TRANSACTIONS ON COMMUNICATIONS Vol.38,issue.1, 199001, P.94-101, IEEE communications society *

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10390044B2 (en) 2010-07-09 2019-08-20 Qualcomm Incorporated Signaling selected directional transform for video coding
US9661338B2 (en) 2010-07-09 2017-05-23 Qualcomm Incorporated Coding syntax elements for adaptive scans of transform coefficients for video coding
US11601678B2 (en) 2010-12-29 2023-03-07 Qualcomm Incorporated Video coding using mapped transforms and scanning modes
US10992958B2 (en) 2010-12-29 2021-04-27 Qualcomm Incorporated Video coding using mapped transforms and scanning modes
JP2015156647A (ja) * 2010-12-29 2015-08-27 クゥアルコム・インコーポレイテッドQualcomm Incorporated マッピングされた変換と走査モードとを使用するビデオコード化
US11838548B2 (en) 2010-12-29 2023-12-05 Qualcomm Incorporated Video coding using mapped transforms and scanning modes
US11652989B2 (en) 2012-04-16 2023-05-16 Electronics And Telecommunications Research Institute Encoding method and decoding method, and device using same
US11616951B2 (en) 2012-04-16 2023-03-28 Electronics And Telecommunications Research Institute Encoding method and decoding method, and device using same
JP7234427B2 (ja) 2012-04-16 2023-03-07 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート 符号化方法及び復号化方法、並びにそれを利用する装置
US11647184B2 (en) 2012-04-16 2023-05-09 Electronics And Telecommunications Research Institute Encoding method and decoding method, and device using same
US11595643B2 (en) 2012-04-16 2023-02-28 Electronics And Telecommunications Research Institute Encoding method and decoding method, and device using same
JP2022070871A (ja) * 2012-04-16 2022-05-13 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート 符号化方法及び復号化方法、並びにそれを利用する装置
JP7053540B2 (ja) 2012-04-16 2022-04-12 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート 符号化方法及び復号化方法、並びにそれを利用する装置
JP2019216459A (ja) * 2012-04-16 2019-12-19 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュートElectronics And Telecommunications Research Institute 符号化方法及び復号化方法、並びにそれを利用する装置
US11323699B2 (en) 2012-04-16 2022-05-03 Electronics And Telecommunications Research Institute Encoding method and decoding method, and device using same
US11997263B2 (en) 2012-04-16 2024-05-28 Electronics And Telecommunications Research Institute Encoding method and decoding method, and device implementing the same
JP2020108155A (ja) * 2012-07-02 2020-07-09 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュートElectronics And Telecommunications Research Institute 映像符号化方法及び装置、並びに映像復号化方法及び装置
JP2022116271A (ja) * 2012-07-02 2022-08-09 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート 映像符号化方法及び装置、並びに映像復号化方法及び装置
JP2015530040A (ja) * 2012-08-21 2015-10-08 クゥアルコム・インコーポレイテッドQualcomm Incorporated スケーラブルビデオコード化における代替変換
US9762911B2 (en) 2013-01-30 2017-09-12 Intel Corporation Content adaptive prediction and entropy coding of motion vectors for next generation video
US9794568B2 (en) 2013-01-30 2017-10-17 Intel Corporation Content adaptive entropy coding of coded/not-coded data for next generation video
US9794569B2 (en) 2013-01-30 2017-10-17 Intel Corporation Content adaptive partitioning for prediction and coding for next generation video
US9787990B2 (en) 2013-01-30 2017-10-10 Intel Corporation Content adaptive parametric transforms for coding for next generation video
WO2014120367A1 (en) * 2013-01-30 2014-08-07 Intel Corporation Content adaptive parametric transforms for coding for next generation video
US9686551B2 (en) 2013-01-30 2017-06-20 Intel Corporation Content adaptive entropy coding of partitions data for next generation video
US9609330B2 (en) 2013-01-30 2017-03-28 Intel Corporation Content adaptive entropy coding of modes and reference types data for next generation video
US10009610B2 (en) 2013-01-30 2018-06-26 Intel Corporation Content adaptive prediction and entropy coding of motion vectors for next generation video
JP2014220624A (ja) * 2013-05-07 2014-11-20 日本放送協会 画像処理装置、符号化装置、及びプログラム
CN116886913A (zh) * 2023-08-03 2023-10-13 镕铭微电子(济南)有限公司 率失真优化量化方法、装置、电子设备及存储介质
CN116886913B (zh) * 2023-08-03 2024-03-08 镕铭微电子(济南)有限公司 率失真优化量化方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
JP5377395B2 (ja) 2013-12-25

Similar Documents

Publication Publication Date Title
JP6974516B2 (ja) 復元ブロック生成方法、予測情報符号化方法、ビットストリーム、コンピュータ可読媒体
RU2713610C1 (ru) Усовершенствованное кодирование с внутрикадровым предсказанием с использованием планарных представлений
JP5377395B2 (ja) 符号化装置、復号装置及びプログラム
JP7445799B2 (ja) 画像復号装置及び画像復号方法
KR101682149B1 (ko) 변환 및 역변환에 기초한 보간 방법 및 장치
JP2023179682A (ja) 隣接サンプル減少を伴う線形またはアフィン変換を使用するイントラ予測
DK3282705T3 (en) PROCEDURE FOR DECODING AND APPARATUS FOR ENCODING A PICTURE THROUGH INTRAPHIC PREDICTION.
JP5215951B2 (ja) 符号化装置及びその制御方法、コンピュータプログラム
US20140233646A1 (en) Methods, apparatuses, and programs for encoding and decoding picture
JP5594841B2 (ja) 画像符号化装置及び画像復号装置
KR101615643B1 (ko) 픽처들의 압축
KR20120030537A (ko) 화상 부호화 장치, 화상 복호 장치, 화상 부호화 방법 및 화상 복호 방법
JP2011188368A (ja) 符号化装置、復号装置及びプログラム
JP2011166592A (ja) 画像符号化装置及び画像復号装置
JP5302256B2 (ja) 符号化装置、復号装置及びプログラム
JP2018164299A (ja) 動画像復号化方法
JP2021027464A (ja) 予測ブロック生成装置、画像符号化装置、画像復号装置、及びプログラム
JP5174062B2 (ja) イントラ予測装置、符号化器、復号器、及びプログラム
WO2015045301A1 (ja) 映像符号化装置、映像符号化方法および映像符号化プログラム
JP5358485B2 (ja) 画像符号化装置
KR20120129629A (ko) 루프 내 전처리 필터링을 이용한 움직임 추정 및 보상 방법
JP5298082B2 (ja) 適応的に直交変換係数の走査順序を決定する符号化装置及び復号装置
WO2014076165A1 (en) Method, computer program and system for determining skip mode
KR20210089778A (ko) 비트레이트 감소를 위한 비디오 스트림 적응형 필터링

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20130201

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20130207

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20130208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130218

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130401

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130405

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20130405

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20130422

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130611

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130827

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130924

R150 Certificate of patent or registration of utility model

Ref document number: 5377395

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250