JP6102707B2 - デジタル符号化装置 - Google Patents

デジタル符号化装置 Download PDF

Info

Publication number
JP6102707B2
JP6102707B2 JP2013252038A JP2013252038A JP6102707B2 JP 6102707 B2 JP6102707 B2 JP 6102707B2 JP 2013252038 A JP2013252038 A JP 2013252038A JP 2013252038 A JP2013252038 A JP 2013252038A JP 6102707 B2 JP6102707 B2 JP 6102707B2
Authority
JP
Japan
Prior art keywords
matrix
integer
unit
correction
orthogonal transform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013252038A
Other languages
English (en)
Other versions
JP2015109585A (ja
Inventor
充人 加納
充人 加納
中村 健
健 中村
山田 恭裕
恭裕 山田
充郎 池田
充郎 池田
裕江 岩崎
裕江 岩崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Electronics Corp
Nippon Telegraph and Telephone Corp
Original Assignee
NTT Electronics Corp
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Electronics Corp, Nippon Telegraph and Telephone Corp filed Critical NTT Electronics Corp
Priority to JP2013252038A priority Critical patent/JP6102707B2/ja
Publication of JP2015109585A publication Critical patent/JP2015109585A/ja
Application granted granted Critical
Publication of JP6102707B2 publication Critical patent/JP6102707B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Complex Calculations (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、整数近似された直交変換を用いて画像・音声信号を圧縮符号化する方式において、エンコーダとデコーダの間の変換誤差を補正し、高品質な圧縮符号化を行うエンコーダを安価に実現することができるデジタル符号化装置に関する。
画像や音声で多用されるDCT(Discrete Cosine Transform)では、入力画像又は入力画像から予測画像を差し引いた予測残差画像の2次元正方ブロック(例えば8x8=64画素)の8次DCT変換を繰返して2次元DCT演算を行う。この演算の8x8DCT変換係数を量子化し、エントロピー符号化してデータ圧縮する。
予測画像方式にはさまざまな方式があり、Intra予測と呼ばれる方式では、画像内の符号化対象正方ブロックの周辺画素を参照して、予測画像を生成する。Inter予測と呼ばれる方式では、動き補償予測と呼ばれる方式が多用され、周辺画像を参照し、動き探索をして、符号化対象画像ブロックと類似のブロック画像を見つけて、その類似画像ブロックを動き補償予測画像とする(例えば、特許文献1参照)。
エンコーダでは、これらIntra予測やInter予測の予測画像を入力画像から差し引いた予測残差画像を2次元DCT変換し、各変換係数を量子化し、量子化数値群をエントロピー符号化(Huffman符号化、Golomb符号化、算術符号化などの可変長符号化)をしてビットstream(ビット列)出力する。
デコーダでは受信したビットstreamをエントロピー復号し、量子化復号して、IDCT(Inverse DCT)をして予測残差画像を算出する。そして、エンコーダと同じ処理で予測画像を算出し、これら予測画像と予測残差画像を加算して、復号出力画像を算出する。
まもなく国際標準化される予定のHEVC(High Efficiency Video Coding)では従来方式(MPEG−2ビデオ圧縮方式、H.264ビデオ圧縮方式など)よりも圧縮率を向上した方式となっている。このHEVCでは従来から圧縮符号化で多用されているDCTやDST(Discrete Sine Transform)の変換マトリクスを、実装負担軽減や互換性向上のため、整数近似マトリクスで定義している。この技術標準はデコーダ処理を規格化したもので、エンコーダはデコーダ処理の逆処理を行う。
数学定義ではDCTやDSTは直交変換である。直交変換の場合、DCT変換マトリクスの逆マトリクスはDCT変換マトリクスの転置マトリクス(マトリクスの行と列を入れ替えたマトリクス)となる。従って、1つのマトリクスを定義すれば、エンコーダとデコーダの双方の変換マトリクスを定義したことになる。
数学定義のDCT変換マトリクスは小数部だけの数値(1未満の数値)のため、実際には整数値演算にするため、各マトリクス係数を定数倍した係数を用いる場合が多い(スケーリング(Scaling)と呼ばれる)。DCT変換マトリクスやIDCT変換マトリクスは無理数や超越数の無限の桁数を持つ数値を含むため、現実的な実装のために、例えばHEVC符号化技術規格では数式定義のマトリクスの各係数値を定数倍スケーリングして8ビット整数近似のマトリクスを定義し、デコーダではその整数近似マトリクスを用いて復号処理する。
エンコーダ(DCT)とデコーダ(IDCT)のどちらか一方の直交変換マトリクスが整数近似マトリクスとなっている場合、他方の変換マトリクスは整数近似マトリクスのままでは変換誤差を生じる。HEVC技術規格では、誤差が少なくなるような工夫もあり、7ビット画素程度のデジタルビデオ画像では誤差が殆どない。しかし、8ビット画素以上のデジタルビデオでは誤差が発生する。そこで、定義された整数近似マトリクスの逆マトリクスを算出して用いることにより、エンコーダとデコーダの間のDCTとIDCTの変換誤差を無くすことができる。
しかし、単純に逆マトリクスを算出して適用するには、エンコーダの変換マトリクスが桁数の多いマトリクス係数となり、実装には大きな負担となる。例として、デコーダ用の8x8DCTの整数近似IDCTマトリクスをMとし、エンコーダ用にデコーダの逆マトリクスの転置(行と列の入替え)とスケーリング(27.5倍)したマトリクスをMTinvとして以下の数式(1)(2)に示す。但し、MTinvは小数点以下3桁までを示す。
Figure 0006102707
Figure 0006102707
MTinvは、マトリクスMの逆マトリクスを転置し(行列の入替え)、各係数に2の15乗を掛けるスケーリングと整数化をしたものである。マトリクスM自体は8x8DCTマトリクスの各係数に27.5を乗ずるスケーリングと整数化をしたものである。
数学定義のNxNの2次元DCT変換は以下の数式(3)で示される。
Yjk=2/N・Ajk・Σp=0〜N−1Σq=0〜N−1{Xpq・cos((2p+1)jπ/2N)・cos((2q+1)kπ/2N)} 数式(3)
ここで、j=0,k=0の場合にはAjk=1/2、j≠0,k=0の場合にはAjk=1/√2、j=0,k≠0の場合にはAjk=1/√2、j≠0,k≠0の場合にはAjk=1である。p、qはそれぞれ被変換データXの行(水平)と列(垂直)のIndexである。j、kはそれぞれ変換結果データYの行(水平)と列(垂直)のIndexである。
上記演算をマトリクス表現し、Y=Mdct・X・MTdctと表わす。ここで、MTdctはMdctの転置マトリクス(行と列を入替えたマトリクス)である。この時のDCT変換マトリクスMdctとMTdctは小数点以下4桁表示で以下の数式(4)(5)で示される。
Figure 0006102707
Figure 0006102707
整数近似マトリクスMは上記マトリクスを128√2倍のスケーリングと直交性改善補正の整数化丸めをしたものである。数式(1)のMと数式(4)のMdctの関係は以下のようになる。
M≒128√2・Mdct
ここで、“・”はMdctマトリクスの各係数値を128√2倍することを意味する。そして、“≒”としているのは、各係数値を128√2倍した結果を整数近似した値にしているためである。
同様に、数式(2)のMTinvと数式(5)のMTdctの関係は以下のようになる。
MTinv≒128√2・MTdct
特開2012−186544号公報
デコーダ用マトリクスMは8ビット係数であるのに対し、数式(2)に示されるように、エンコーダ用マトリクスMTinvは桁数の多い係数となる。例えば10ビットデジタル画像を誤差が無い様に補正するには4ビット程度の精度拡張が必要であるため、エンコーダ用マトリクスMTinvは12ビット以上の係数となる。
表1は、10ビット画素入力に対するHEVC符号化技術規格の8x8DCTのマトリクスをエンコーダとデコーダに適用した場合の誤差例を示したものである。誤差の単位はLSB(Least Significant ビット)である。この例では、1〜2LSBの誤差が半分程度の画素に発生している。
Figure 0006102707
このようなマトリクスのため、部分Butterfly演算は可能であるが、完全なButterfly方式による演算量の低減が困難である。従って、デコーダでは8ビット乗算器で済むのに対し、エンコーダでは12ビット以上の乗算器が多数必要となる。例えば、8x8DCT演算(8次2次元DCT)では、1次元DCT回路を共通に用いて2回繰返し演算を行なう順次演算で行う場合、部分Butterfly演算を用いても12ビット乗算器が24〜32個程度必要となる。
ここで、“Butterfly演算”とは、多数のデジタル信号処理で多用される回路規模縮小のための技術的演算構成方法である。例えば、Y1=A・X1+B・X2+A・X3+B・X4、Y2=A・X1−B・X2+A・X3−B・X4のような演算をする場合、U=(X1+X3)・AとV=(X2+X4)・Bを演算すれば、Y1=U+V、Y2=U−VとしてY1,Y2を算出できる。このようにして、特に回路規模の大きい乗算回数を少なく(この例では4回から2回に減少)して演算を行う方法を意味する。FFT(Fast Furrier Transform)の演算において、このような演算手法を図示するとButterfly(蝶々)のような図形となったため、Butterfly演算と呼ばれる。
図8は、数式(1)による8x8DCT演算の部分Butterfly構成を示す図である。2次元DCTを1次元ずつ順次処理で行う。順次入力されるXjkに対して、1次元目DCT変換結果が順次Zjkとして出力される。2次元目DCT演算は、入力にZを行列転置したものを順次入力し、出力で8x8DCT出力結果がZの箇所で算出される。この例では8x8DCTの整数近似1次元目の演算を部分Butterfly構成にしている。乗算器が4x8=32個で構成され、マトリクスをそのままの形で積和演算する場合に較べて乗算器の個数が半減される。
前段の加減算器は2つ入力のため、1個の加減算器で構成される。後段の加減算器は4つ入力のため、3個の加減算器で構成される。従って、乗算器が4x8=32個、加減算器が1x8+3x8=32個で構成される。なお、この構成は最適化したものではなく、最適化によって乗算器個数を24個に低減可能である。
最終段の各1/128スケーリングは数式(1)と数式(4)の関係から1/128√2倍してスケーリングを元に戻す処理の一部である。2次元では1/128√2倍を2回行うが、演算の簡素化のため、1/128倍と1/128倍と1/2倍に分けてスケーリングを元に戻す。これらは除算ではなくシフト処理で行うことができる。
実時間演算処理のためには、一般的な半導体技術(LSI回路技術)では少なくとも8画素並列処理をする必要がある。HEVC符号化技術規格では32x32DCTまで定義されているため、上記と類似の部分Butterfly演算を用いた場合、乗算器個数は256個程度必要となる。
また、8x8DCT演算をそのまま積和演算で行うと、1画素当りの乗算回数は8x2=16回、1画素当りの加算回数は7x2=14回である。従って、8x8ブロックの64画素合計では、乗算回数は1024回、加算回数は896回である。一方、部分Butterfly演算方式の場合は、前記マトリクスの第1列と第8列、第2列と第7列、第3列と第6列、第4列と第5列の係数絶対値が等しいことを利用するため、8画素当りの乗算回数は4x8x2=64回、8画素当りの加算回数は(8+3x8)x2=64回である。従って、8x8ブロックの64画素合計では、乗算回数は512回、加算回数は512回と半減できる。なお、詳細を省略するが、変則的な乗算削減方法を追加して、8画素あたりの乗算回数=24x2=48回、8x8ブロックあたりでは384回への削減が可能である。このような係数絶対値が等しい性質は数式(3)から4x4〜32x32の各DCT共通である。
しかし、HEVC画像符号化規格では、4x4DST、4x4DCT、8x8DCT、16x16DCT、32x32DCTの計5種類の整数近似変換があり、32x32DCTでは膨大な演算量となる。このため、部分Butterfly演算方式のような効率演算だけでなく、乗算器の回路規模縮小の工夫が必要である。
本発明は、上述のような課題を解決するためになされたもので、その目的は整数近似された直交変換を用いて画像・音声信号を圧縮符号化する方式において、エンコーダとデコーダの間の変換誤差を補正し、高品質な圧縮符号化を行うエンコーダを安価に実現することができるデジタル符号化装置を得るものである。
本発明に係るデジタル符号化装置は、整数近似直交変換を用いて画像又は音声のデータを直交変換する直交変換部と、前記直交変換部から出力された算出係数を量子化する量子化部と、前記量子化部により量子化された数値をエントロピー符号化により圧縮符号化する符号化部とを備え、デコーダ用の整数近似直交変換マトリクスの逆マトリクスに所定のスケーリングをしたスケーリング逆マトリクスは、前記スケーリング逆マトリクスの整数部分である整数近似主マトリクスと、前記スケーリング逆マトリクスの小数部分である小数部分補正マトリクスとに分離され、前記小数部分補正マトリクスを整数N倍して小数部分を丸め処理したマトリクスを補正整数マトリクスとし、前記直交変換部は、前記整数近似主マトリクスを用いて前記データを直交変換処理する主演算部と、前記補正整数マトリクスを用いて前記データを直交変換処理する補正演算部と、前記主演算部の処理結果と、前記補正演算部の処理結果を整数Nで除算した結果とを加算する第1の加算部とを有することを特徴とする。
本発明により、整数近似された直交変換を用いて画像・音声信号を圧縮符号化する方式において、エンコーダとデコーダの間の変換誤差を補正し、高品質な圧縮符号化を行うエンコーダを安価に実現することができる。
本発明の実施の形態1に係るデジタル符号化装置を示す図である。 本発明の実施の形態1に係る直交変換部を示す図である。 数式(9)のマトリクス演算例を示す図である。 本発明の実施の形態2に係る直交変換部を示す図である。 ΔM16(0)の部分Butterfly構成を示す図である。 ΔM16(1)の部分Butterfly構成を示す図である。 本発明の実施の形態3に係る補正演算部を示す図である。 数式(1)による8x8DCT演算の部分Butterfly構成を示す図である。
本発明の実施の形態に係るデジタル符号化装置について図面を参照して説明する。同じ又は対応する構成要素には同じ符号を付し、説明の繰り返しを省略する場合がある。
実施の形態1.
図1は、本発明の実施の形態1に係るデジタル符号化装置を示す図である。直交変換部1は、整数近似直交変換を用いて画像又は音声のデータを直交変換する。量子化部2は、直交変換部1から出力された算出係数を量子化する。符号化部3は、量子化部2により量子化された数値をエントロピー符号化により圧縮符号化する。
デコーダ用の8ビット整数近似直交変換マトリクスMT(Mを転置したマトリクス演算)の逆マトリクスに所定のスケーリング(定数倍)をしたスケーリング逆マトリクスMTinvは、スケーリング逆マトリクスMTinvの整数部分である整数近似主マトリクスMと、スケーリング逆マトリクスMTinvの小数部分である小数部分補正マトリクスΔMとに分離される(数式6)。ΔMは小さな係数値を持つ補正項のマトリクスである。
MTinv=M+ΔM (数式6)
直交変換するデータの予測残差画像ブロックをX、変換結果ブロックをY、ΔMの転置マトリクスをΔMTとすると、エンコーダの変換は数式7のように表わされる。
Y=MTinv・X・Minv
=(M+ΔM)・X・(MT+ΔMT)
=M・X・MT+ΔM・X・MT+M・X・ΔMT+ΔM・X・ΔMT (数式7)
マトリクスMTは8ビット整数係数であり、マトリクスΔM、ΔMTは1未満の小さな係数のため、例えばΔMTの各係数を16倍するスケーリングをして、小数部丸めをすれば、ΔMTも4ビット整数マトリクスの演算となる。
この小数部分補正マトリクスΔMを16倍して小数部分を丸め処理(整数化の丸め処理)したマトリクスを補正整数マトリクスΔM16とする。また、ΔM16の転置マトリクスをΔMT16とする。
図2は、本発明の実施の形態1に係る直交変換部を示す図である。1次元目演算として、主演算部4が整数近似主マトリクスMを用いてデータXを直交変換処理する(MxX=A)。補正演算部5が補正整数マトリクスΔM16を用いてデータXを直交変換処理する(ΔM16xX)。加算部6が主演算部4の処理結果と、補正演算部5の処理結果を16で除算した結果とを加算する。この加算結果をスケーリング部7が1/128スケーリングする。
2次元目演算として、主演算部8がマトリクスMTを用いてスケーリング部7の出力データを直交変換処理する(xMT)。補正演算部9が補正整数マトリクスΔMT16を用いてスケーリング部7の出力データを直交変換処理する(xΔMT16)。加算部10が主演算部8の処理結果と、補正演算部9の処理結果を16で除算した結果とを加算する。この加算結果をスケーリング部11が1/256スケーリングして変換結果ブロックYを得る。なお、16での除算は、実際には4ビット右シフト処理となり、簡易な処理となる。
前述したようにマトリクスMとMTはそれぞれ数式定義のマトリクスMdctとMTdctを128√2倍のスケーリングと丸め処理をしているので、1次元目演算の後段の1/128スケーリングと2次元目後段の1/256スケーリングによりスケーリングを元に戻す。1/128√2は除算になるため、1/128と1/256の処理として、ビットシフト処理で行うようにしている。なお、実装においては、2次元目後段のスケーリングも1/128として、求まったDCT係数の量子化処理に含めて行うことが実用的である。
この構成におけるMとΔM16は、それぞれに適切なスケーリングをした後、以下の数式(8)と数式(9)のようになる。
Figure 0006102707
Figure 0006102707
M・X・MTは従来の部分Butterfly方式の効率演算が可能である。または、マトリクスを複数のビットプレーンマトリクスに分離して、加減算器による演算も可能である。
ΔM16の整数マトリクスは16倍のスケーリングをしても小さな値で規則性のあるマトリクスとなっているため、少なくとも部分Butterfly演算が可能であり、0係数が多く、非0係数も絶対値が1〜3のマトリクスである。従って、ΔM16のマトリクス乗算はButterfly方式と類似の効率演算が可能で、小さな係数のため乗算器は不要で、加減算器による小規模回路構成が可能となる。
図3は、数式(9)のマトリクス演算例を示す図である。この補正演算構成例では、乗算器は16個で、かつ2ビット乗算のx2とx3である。8ビット加減算器が8+14=22個、4ビット乗算器が16個で構成できる。さらには、x2乗算は1ビットシフト、x3は1ビットシフト値とシフト無しの値との加算でもよい。
よって、本実施の形態により乗算器の回路規模を縮小することができる。この結果、整数近似された直交変換を用いて画像・音声信号を圧縮符号化する方式において、エンコーダとデコーダの間の変換誤差を補正し、高品質な圧縮符号化を行うエンコーダを安価に実現することができる。
実施の形態2.
前述のように補正演算は主演算の下位に付加する4ビット精度の小数点以下の成分の演算である。実際には、元データが10ビットなら、乗算結果の上位から11ビットと10ビットの間に小数点がある。
補正項は4ビット精度の付加成分のため、元データが10ビットでも、その上位4ビット程度のみを演算すればよい。10ビット画素精度の元データをXとし、元データXの上位4ビット成分をX4bとすると、X4b=X//64*64と表わされる。
ここで、X//64はXを64で切捨て除算した商である。切捨て除算をするのは、ビットシフトだけで除算をする場合を想定したものである。
例えばXjk=500とすると、Xjk4b=500//64*64=448となる。除算で丸め処理を省略しているので、Xの上位5ビットの演算とすれば、Xjk5b=500//32*32=480となり、少し精度が向上する。
本実施の形態では、このように補正演算を元データの上位桁成分だけとして、演算器の精度を小さくする。図4は、本発明の実施の形態2に係る直交変換部を示す図である。データはnビット精度で構成され、データの上位4ビットを有効ビットとし、下位(n−4)ビットを0として構成した成分を省略データとする。実施の形態1の補正演算部5の代わりに、補正演算部12が、補正整数マトリクスΔM16を用いて省略データを直交変換処理する。実施の形態1の補正演算部9の代わりに、補正演算部13が補正整数マトリクスΔMT16を用いてスケーリング部7の出力データの上位4ビットを直交変換処理する(xΔMT16)。その他の構成は実施の形態1と同様である。本実施の形態では、補正整数マトリクスΔM16と省略データX4bがそれぞれ4ビットであるので、4ビット乗算器で補正項演算を構成できる。
この場合の回路規模を1次元分の回路を2次元目でも用いるものとして概算すると、部分Butterfly方式主演算部の乗算器(8ビットx10ビット)個数は32個、部分Butterfly方式主演算部の加減算器(16ビット±16ビット)個数は32個、部分Butterfly方式補正部の乗算器(4ビットx4ビット)個数=32個x40/64は20個、部分Butterfly方式補正部の加減算器(8ビット+8ビット)個数=32個x40/64は20個である。ここで、補正マトリクスは24項が0係数で40項が非0係数のため、この比率で乗算器個数と加減算器個数が少なくできるものとしている。またスケーリングについては、前述と同様に1次元目は1/128とし、2次元目は1/256としている。
一方、単純にInverseマトリクスをそのまま12ビット精度にして演算した場合、部分Butterfly方式マトリクス演算部の乗算器(12ビットx10ビット)個数は32個、部分Butterfly方式マトリクス演算部の加減算器(16ビット±16ビット)個数は32個となる。
この実装回路の規模を概算すると、2次元DCT演算を1次元DCT回路を繰返し使用して構成した場合、表2のようになる。
Figure 0006102707
Inverseマトリクスをそのまま12ビット精度で演算する場合の実装回路規模を概算すると表3のようになる。
Figure 0006102707
乗算器と加減算器との回路規模比較について、16ビットx16ビット乗算器は、少なくとも16ビット+16ビット加算器を16個用い、それらを乗数か被乗数の一方のビット毎の加算制御を行って構成する。従って、16ビットx16ビット乗算器は少なくとも16ビット+16ビット加算器の16倍以上の回路規模となる。
実施の形態3.
補正整数マトリクスΔM16は4ビット係数程度の数値で、0係数を多数含み、規則性があるため、部分Butterfly演算が可能である。そこで、本実施の形態では、補正整数マトリクスΔM16の各要素を2進表現で表わす。このマトリクスを2進表現の正負符号付きのビット位置(桁位置)毎のk個のマトリクスに分解する。これら分解されたマトリクスの要素値を1、0、−1で表わす。第iビット目のマトリクスを第iのビットプレーンマトリクスとする(i=1,・・・,k)。
具体的には、各ビットプレーンマトリクスの演算を加減算器で構成し、それらの結果をビット桁位置に対応したビットシフトをして加算して、補正演算を行う。まず、8x8DCTの場合の補正整数マトリクスΔM16は下記の数式(10)となる。
Figure 0006102707
ΔM16は−3〜+3の係数からなり、2つだけのビットプレーンマトリクスに分解できる。ビットプレーン(0)マトリクス(LSB Plane)をΔM16(0)とすると、ΔM16(0)は下記の数式(11)となる。
Figure 0006102707
ΔMT16からそのままの形式でΔM16(0)を引いただけのビットプレーンマトリクスは下記の数式(12)となる。
Figure 0006102707
このΔM16(1a)をビットシフトすれば下記の数式(13)となる。
Figure 0006102707
ここで、ΔM16=1・ΔM16(0)+2・ΔM16(1)の関係となる。従って、補正項演算は、ΔM16xX=(ΔM16(0)xX)+2・(ΔM16(1)xX)となる。
図5は、ΔM16(0)の部分Butterfly構成を示す図である。図6は、ΔM16(1)の部分Butterfly構成を示す図である。図5のΔM16(0)の演算には、8ビット加減算器が14個で構成される。図6のΔM16(1)の演算には、8ビット加減算器が16個で構成される。
1次元DCT回路を繰返し使用して2次元DCT演算を構成した場合の実装回路規模を概算すると以下の表4になる。
Figure 0006102707
上記例では、16倍スケーリングと丸めをした補正マトリクスの係数値が0〜±3の範囲のため、ΔM16(0)とΔM16(1)の2つのビットプレーンだけで構成される。
一般的には16倍スケーリングをすると、ビットプレーンマトリクスがΔM16(0)、ΔM16(1)、ΔM16(2)、ΔM16(3)の4つのマトリクスに分解される可能性があり、その場合の補正項演算は下記の数式(14)となる。
ΔM16xX=(ΔM16(0)xX)+2・(ΔM16(1)xX)+4・(ΔM16(2)xX)+8・(ΔM16(3)xX) 数式(14)
図7は、本発明の実施の形態3に係る補正演算部を示す図である。この補正演算部は実施の形態1,2の補正演算部5,9,12,13に対応する。上記の数式(14)の関係から補正演算部の補正項演算は以下のようになる。第1〜第kの分割補正演算部14a〜14dが、第1〜第kのビットプレーンマトリクスをそれぞれ用いて直交変換処理を行う。第2の加算部15が、第1〜第kの分割補正演算部14a〜14dの演算結果について、第iの分割補正演算部による演算結果を2のi−1乗倍(i=1,・・・,k)してそれらの和を算出する。これにより、補正演算を乗算器ではなく、加減算器で簡易に構成することができる。
図7のx2、x4、x8はそれぞれ1ビット左シフト、2ビット左シフト、3ビット左シフトで実現でき、単に配線だけの構成で済み、演算は不要である。/16は、単に4ビット右シフトでもよいし、精度向上のために丸め処理をしてもよい。単に右シフトだけの場合には演算器は不要である。図7の入力データXは前述のFull精度の元データでもよいし、上位4ビットのみ有効な省略データでもよい。
2次元目のΔMTの演算も同様に下記の数式(15)となる。
XxΔMT16=(XxΔMT16(0))+2・(XxΔMT16(1))+4・(XxΔMT16(2))+8・(XxΔMT16(3)) 数式(15)
ここで、ΔMT16(0)はΔM16(0)の転置マトリクス、ΔMT16(1)はΔM16(1)の転置マトリクス、以下同様である。
これらΔM16(0)、ΔM16(1)は要素値0が多く、各位置の要素値に規則性のあるマトリクスであり、この規則性を利用して部分Butterfly演算構成により、演算量や演算器個数を低減できる。
8x8DCTの場合に適用すると、補正演算部分の回路規模は以下のようになる。2面のビットプレーンマトリクスのみからなり、64係数中非0係数は24係数と32係数であり、それぞれ規則性がある。このため、部分Butterfly演算方式で加減算器個数を半減できるものとして概算すると、8ビット±8ビットのものが28個で済む。従って、補正演算の回路規模は28x1=28となる。4ビット乗算器と加減算器を用いる構成の場合の補正演算部分の回路規模は96であったため、その1/3以下の回路規模で補正演算を行うことができる。
上記の実施の形態では、比較と評価が容易な8x8DCTの場合に本発明を適用した場合について説明した。ただし、ビデオ圧縮符号化の技術規格では4x4DST(4x4サイズ2次元Discrete Sine Transform)、4x4DCT、8x8DCT、16x16DCT、32x32DCTが用いられている。これら全てのTransformにおいて、上記の原理に基く補正整数マトリクス演算による高精度Transform演算が可能である。
同様に、これら全てのTransformの主整数近似マトリクスを複数のビットプレーンマトリクスに分解し、乗算器を用いずに加減算器を用いたマトリクス演算とし、各マトリクスの規則性を利用した部分Butterfly演算することで効率的な実装が可能である。
1 直交変換部、2 量子化部、3 符号化部、4 主演算部、5,12 補正演算部、6 加算部、14a〜14d 第1〜第kの分割補正演算部、15 加算部

Claims (3)

  1. 整数近似直交変換を用いて画像又は音声のデータを直交変換する直交変換部と、
    前記直交変換部から出力された算出係数を量子化する量子化部と、
    前記量子化部により量子化された数値をエントロピー符号化により圧縮符号化する符号化部とを備え、
    デコーダ用の整数近似直交変換マトリクスの逆マトリクスに所定のスケーリングをしたスケーリング逆マトリクスは、前記スケーリング逆マトリクスの整数部分である整数近似主マトリクスと、前記スケーリング逆マトリクスの小数部分である小数部分補正マトリクスとに分離され、
    前記小数部分補正マトリクスを整数N倍して小数部分を丸め処理したマトリクスを補正整数マトリクスとし、
    前記直交変換部は、
    前記整数近似主マトリクスを用いて前記データを直交変換処理する主演算部と、
    前記補正整数マトリクスを用いて前記データを直交変換処理する補正演算部と、
    前記主演算部の処理結果と、前記補正演算部の処理結果を整数Nで除算した結果とを加算する第1の加算部とを有することを特徴とする符号化装置。
  2. 整数近似直交変換を用いて画像又は音声のデータを直交変換する直交変換部と、
    前記直交変換部から出力された算出係数を量子化する量子化部と、
    前記量子化部により量子化された数値をエントロピー符号化により圧縮符号化する符号化部とを備え、
    デコーダ用の整数近似直交変換マトリクスの逆マトリクスに所定のスケーリングをしたスケーリング逆マトリクスは、前記スケーリング逆マトリクスの整数部分である整数近似主マトリクスと、前記スケーリング逆マトリクスの小数部分である小数部分補正マトリクスとに分離され、
    前記小数部分補正マトリクスを整数N倍して小数部分を丸め処理したマトリクスを補正整数マトリクスとし、
    前記データはnビット精度で構成され、前記データの上位mビットを有効ビットとし、下位(n−m)ビットを0として構成した成分を省略データとし、
    前記直交変換部は、
    前記整数近似主マトリクスを用いて前記データを直交変換処理する主演算部と、
    前記補正整数マトリクスを用いて前記省略データを直交変換処理する補正演算部と、
    前記主演算部の処理結果と、前記補正演算部の処理結果を整数Nで除算した結果とを加算する第1の加算部とを有することを特徴とする符号化装置。
  3. 前記補正整数マトリクスの各要素を2進表現で表わし、このマトリクスを2進表現の正負符号付きのビット位置(桁位置)毎のk個のマトリクスに分解し、これら分解されたマトリクスの要素値を1、0、−1で表わし、第iビット目のマトリクスを第iのビットプレーンマトリクスとし(i=1,・・・,k)、
    前記補正演算部は、
    前記第1〜第kのビットプレーンマトリクスをそれぞれ用いて直交変換処理を行う第1〜第kの分割補正演算部と、
    前記第1〜第kの分割補正演算部の演算結果について、前記第iの分割補正演算部による演算結果を2のi−1乗倍(i=1,・・・,k)してそれらの和を算出する第2の加算部とを有することを特徴とする請求項1又は2に記載の符号化装置。
JP2013252038A 2013-12-05 2013-12-05 デジタル符号化装置 Active JP6102707B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013252038A JP6102707B2 (ja) 2013-12-05 2013-12-05 デジタル符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013252038A JP6102707B2 (ja) 2013-12-05 2013-12-05 デジタル符号化装置

Publications (2)

Publication Number Publication Date
JP2015109585A JP2015109585A (ja) 2015-06-11
JP6102707B2 true JP6102707B2 (ja) 2017-03-29

Family

ID=53439642

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013252038A Active JP6102707B2 (ja) 2013-12-05 2013-12-05 デジタル符号化装置

Country Status (1)

Country Link
JP (1) JP6102707B2 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3046115B2 (ja) * 1991-11-29 2000-05-29 富士フイルムマイクロデバイス株式会社 離散コサイン変換器
US7242713B2 (en) * 2002-05-02 2007-07-10 Microsoft Corporation 2-D transforms for image and video coding
US8606023B2 (en) * 2006-06-26 2013-12-10 Qualcomm Incorporated Reduction of errors during computation of inverse discrete cosine transform

Also Published As

Publication number Publication date
JP2015109585A (ja) 2015-06-11

Similar Documents

Publication Publication Date Title
JP4874642B2 (ja) ロッシーおよびロスレス2dデータ圧縮のための可逆な変換
KR101028676B1 (ko) 공통 인수를 갖는 변환
JP4444940B2 (ja) 離散余弦変換の近似と量子化ならびに逆量子化と逆離散余弦変換の近似を実行する方法
CA2653693C (en) Reduction of errors during computation of inverse discrete cosine transform
JP4560033B2 (ja) ビデオまたはイメージのデータを復号化するための方法
JP5113067B2 (ja) 信号およびデータ処理のための効率的な無乗算計算
US7716265B2 (en) Data transformation apparatus and method
KR20120034582A (ko) 영상/화상을 부호화하기 위한 장치 및 방법
JP6102707B2 (ja) デジタル符号化装置
US10432937B2 (en) Adaptive precision and quantification of a wavelet transformed matrix
JP2023522886A (ja) ニューラルネットワークパラメーターの表現の改良された概念
JP4594420B2 (ja) データ変換装置及びその制御方法
CN104113763A (zh) 一种应用于图像编码的优选整数变换基
TWI228918B (en) Video predictive decoding method and apparatus
CN102413331A (zh) 图像或视频的编码方法
KR100240002B1 (ko) 영상신호의 압축과 복원을 위한 이산 코사인 변환 장치
JP5662887B2 (ja) 符号化装置、復号装置及びプログラム
JP5451171B2 (ja) データ変換処理装置およびデータ変換処理方法
WO2023136811A1 (en) Fixed-point optimizer for linear operations
Chan et al. A new quantized DCT and its implementation on multimedia processor
JP2004178482A (ja) 画像・オーディオデータ処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160302

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170117

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170131

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170213

R150 Certificate of patent or registration of utility model

Ref document number: 6102707

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350