JP2020010320A - 画像符号化装置及び画像復号装置及びそれらの制御方法及びプログラム - Google Patents

画像符号化装置及び画像復号装置及びそれらの制御方法及びプログラム Download PDF

Info

Publication number
JP2020010320A
JP2020010320A JP2019103181A JP2019103181A JP2020010320A JP 2020010320 A JP2020010320 A JP 2020010320A JP 2019103181 A JP2019103181 A JP 2019103181A JP 2019103181 A JP2019103181 A JP 2019103181A JP 2020010320 A JP2020010320 A JP 2020010320A
Authority
JP
Japan
Prior art keywords
image
quantization matrix
encoding
quantization
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019103181A
Other languages
English (en)
Inventor
真悟 志摩
Shingo Shima
真悟 志摩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of JP2020010320A publication Critical patent/JP2020010320A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】直交変換の形状に応じて設定された量子化マトリクスを符号化したときの符号量を抑制する技術を提供する。【解決手段】画像符号化装置は、符号化対象の画像を予め設定された複数種類の矩形ブロックのいずれかに分割するブロック分割部102と、複数種類の矩形ブロックそれぞれに対応する複数種類の量子化マトリクスを生成する生成部と、該生成部で生成した、それぞれの量子化マトリクスを、それぞれの形状に応じた走査順に従って符号化する量子化マトリクス符号化部113と、分割部で得た着目の矩形ブロックの画像を周波数変換し、得られた変換係数を着目の矩形ブロックの形状に応じた量子化マトリクスを用いて量子化する変換・量子化部105と、該変換・量子化部で得た量子化後の変換係数を符号化する符号化部110と、量子化マトリクス符号化部で得た符号化データと、符号化部で得た符号化データとを統合する統合符号化部111とを有する。【選択図】図1

Description

本発明は画像の符号化技術に関するものである。
動画像の圧縮記録の符号化方式として、High Efficiency Video Coding(以下、HEVCと記す)が知られている。HEVCでは符号化効率向上のため、従来のマクロブロック(16×16画素)より大きなサイズの基本ブロックが採用された。この大きなサイズの基本ブロックはCTU(Coding Tree Unit)と呼ばれ、そのサイズは最大64×64画素である。CTUはさらに予測や変換を行う単位となるサブブロックに分割される。
また、HEVCにおいては、量子化マトリクスと呼ばれる、直交変換を施した後の係数(以下、直交変換係数と記す)を、周波数成分に応じて重み付けをする処理が用いられている。人間の視覚は高周波成分に鈍感であることを利用し、高周波成分のデータを削減することで、画質を維持しながら圧縮効率を高めることが可能となっている。特許文献1では、このような量子化マトリクスを符号化する技術が開示されている。
近年、HEVCの後継としてさらに高効率な符号化方式の国際標準化を行う活動が開始された。Joint Video Experts Team(JVET)がISO/IECとITU−Tの間で設立され、Versatile Video Coding符号化方式(以下、VVCと記す)として標準化が進められている。符号化効率向上のため、従来の正方形サブブロックベースのイントラ予測・直交変換方法に加え、長方形サブブロックベースのイントラ予測・直交変換方法が検討されている。
特開2013−38758号公報
VVCにおいても、HEVCと同様に量子化マトリクスの導入が検討されている。さらにVVCでは、正方形だけでなく長方形のサブブロックおよびそれに対応した直交変換の形状が検討されているが、それぞれの直交変換係数の分布は直交変換の形状によって異なる。そのため、直交変換の形状に応じて最適な量子化マトリクスは異なり、それぞれの量子化マトリクスに適した符号化処理を行わないと、量子化マトリクス自体の符号量が不必要に増大することとなる。
したがって、本発明は上述した課題を解決するためになされたものであり、直交変換の形状に応じて設定された量子化マトリクスを符号化したときの符号量を抑制する技術を提供しようとするものである。
この課題を解決するため、例えば本発明の画像符号化装置は以下の構成を備える。すなわち、
画像を符号化する画像符号化装置であって、
符号化対象の画像を予め設定された複数種類の矩形ブロックのいずれかに分割する分割手段と、
前記複数種類の矩形ブロックそれぞれに対応する複数種類の量子化マトリクスを生成する生成手段と、
該生成手段で生成した、それぞれの量子化マトリクスを、それぞれの形状に応じた走査順に従って符号化する第1の符号化手段と、
前記分割手段で得た着目の矩形ブロックの画像を周波数変換し、得られた変換係数を前記着目の矩形ブロックの形状に応じた量子化マトリクスを用いて量子化する量子化手段と、
該量子化手段で得た量子化後の変換係数を符号化する第2の符号化手段と、
前記第1の符号化手段で得た符号化データと、前記第2の符号化手段で得た符号化データとを統合する統合手段とを有する。
本発明によれば、複数種類の量子化マトリクスに対して適応的に量子化マトリクス自体の符号量を抑制することが可能になる。
実施形態における画像符号化装置のブロック構成図。 実施形態における画像復号装置のブロック構成図。 実施形態に係る画像符号化装置における符号化処理を示すフローチャート。 実施形態に係る画像復号装置における復号処理を示すフローチャート。 実施形態における画像符号化装置、復号装置に適用可能なコンピュータのハードウェア構成図。 実施形態の画像符号化装置が生成するビットストリーム構造の例を示す図。 実施形態の画像符号化装置におけるブロック分割の例を示す図。 実施形態で用いられる量子化マトリクスの例を示す図。 実施形態における量子化マトリクスの要素の走査方法を示す図。 実施形態で生成される量子化マトリクスの差分値行列の例を示す図。 量子化マトリクスの差分値の符号化に用いられる符号化テーブルの例を示す図。
以下、添付の図面を参照して、本願発明をその好適な実施形態に基づいて詳細に説明する。なお、以下の実施形態において示す構成は一例に過ぎず、本発明は図示された構成に限定されるものではない。
図1は本実施形態の画像符号化装置のブロック構成図である。画像符号化装置は、装置全体の制御を司る制御部150を有する。この制御部150は、CPU、CPUが実行するプログラムを格納するROM、CPUのワークエリアとして利用するRAMを有する。また、画像符号化装置は、入力端子101、ブロック分割部102、量子化マトリクス保持部103、予測部104、変換・量子化部105、逆量子化・逆変換部106、画像再生部107、フレームメモリ108、インループフィルタ部109、符号化部110、統合符号化部111、出力端子112、及び、量子化マトリクス符号化部113を有する。
入力端子101は、画像データ発生源で発生した符号化対象の画像データをフレーム単位に入力する。画像データ発生源は、撮像装置、符号化対象の画像データを記憶したファイルサーバや記憶媒体等、その種類は問わない。また、出力端子112は、符号化データを出力先装置に出力するが、その出力先装置も記憶媒体、ファイルサーバ等、特に問わない。
ブロック分割部102は、入力端子101より入力した符号化対象の画像データを、複数の基本ブロックに分割し、その1つを着目基本ブロックとして後段の予測部104に順次出力する。
量子化マトリクス保持部103は、矩形ブロック(正方向、長方形を含む)であって、複数種類の量子化マトリクスを生成し、内部のメモリに保持する。量子化マトリクスの生成方法については特に限定しないが、ユーザが量子化マトリクスを入力しても良いし、入力画像の特性から算出しても、初期値として予め指定されたものを使用しても良い。本実施形態における量子化マトリクス保持部103は、図8(a)〜(c)に示される8×8画素、4×8画素、8×4画素の直交変換に対応した二次元の量子化マトリクスを生成し、保持しているものとする。
量子化マトリクスとは、直交変換を施した後の変換係数に対して、周波数成分に応じて重み付けするための成分を有するマトリクスのことを指す。なお、量子化マトリクスは、スケーリングリストと呼ばれることもある。
予測部104は、基本ブロック単位の画像データに対し、ブロック分割の種類を決定し、サブブロック単位に、フレームメモリ108を参照して、フレーム内予測であるイントラ予測やフレーム間予測であるインター予測などを行い、予測画像データを生成する。さらに、入力された画像データと前記予測画像データから予測誤差を算出し、出力する。また、予測部104は、予測に必要な情報、例えばサブブロック分割、予測モードや、予測データの所在位置を特定する情報(動きベクトル)等も予測誤差と併せて出力される。以下ではこの予測に必要な情報を予測情報と呼称する。
変換・量子化部105は、予測部104から入力した予測誤差をサブブロック単位で直交変換(周波数変換)して変換係数を得る。そして、変換・量子化部105は、得られた変換係数を、量子化マトリクス保持部103に格納されている量子化マトリクスを用いて量子化を行い、量子化後の係数を得る。
逆量子化・逆変換部106は、変換・量子化部105から出力された量子化後の係数を量子化マトリクス保持部103に格納されている量子化マトリクスを用いて逆量子化して変換係数を再生し、さらに逆直交変換して予測誤差を再生する。
画像再生部107は、予測部104から出力された予測情報に基づいて、フレームメモリ108を適宜参照して予測画像データを生成する。そして、画像再生部107は、予測画像データに、逆量子化・逆変換部106からの予測誤差を加算することで、再生画像データを生成し、フレームメモリ108に格納する。
インループフィルタ部109は、画像再生部107が再生した再生画像に対し、デブロッキングフィルタやサンプルアダプティブオフセットなどのインループフィルタ処理を行い、フィルタ処理された画像を再びフレームメモリ108に格納する。
符号化部110は、変換・量子化部105から出力された量子化係数および予測部104から出力された予測情報を符号化して、符号データを生成し、その符号化データを統合符号化部111に出力する。
量子化マトリクス符号化部113は、量子化マトリクス保持部103から出力された量子化マトリクスを符号化して、量子化マトリクス符号化データを生成し、その符号化データを統合符号化部111に出力する。
統合符号化部111は、量子化マトリクス符号化部113からの出力である量子化マトリクスの符号化データ等を格納するヘッダ符号データを生成する。さらに統合符号化部111は、ヘッダ符号データと、符号化部110から出力された符号データとを合わせて、ビットストリームを形成して、出力端子112を介して符号化データを出力する。
ここで、画像符号化装置における画像データの符号化処理をより詳しく説明する。本実施形態では動画像データをフレーム単位に入力する構成とするが、1フレーム分の静止画像データを入力する構成としても構わない。また、本実施形態では、説明を容易にするため、イントラ予測符号化の処理を説明するが、これに限定されずインター予測符号化の処理においても適用可能である。さらに本実施形態では説明のため、ブロック分割部101は、符号化対象の1フレームの画像データを、複数の、8×8画素の基本ブロックに分割するものとして説明するが、これに限定されない。
画像データの符号化に先立ち、量子化マトリクスの符号化が行われる。
量子化マトリクス保持部103は、予め生成された量子化マトリクスを保持する。具体的には、符号化されるサブブロックのサイズに応じて、量子化マトリクスが決定される。量子化マトリクスを構成する各要素の決定方法は特に限定しない。例えば、所定の初期値を用いても良いし、個別に設定しても良い。また、画像の特性に応じて生成されても構わない。
量子化マトリクス保持部103は、図8に示す量子化マトリクスを保持する。図8(a)は8×8画素サイズの直交変換に対応する量子化マトリクス800を、図8(b)は4×8画素サイズの直交変換に対応する量子化マトリクス801を、図8(c)は8×4画素サイズの直交変換に対応する量子化マトリクス802を示している。説明を簡易にするため、それぞれ8×8の64画素分または8×4もしくは4×8の32画素分の構成とし、太枠内の各正方形は量子化マトリクスを構成している各要素を表しているものとする。本実施形態では、図8(a)〜(c)に示された三種の量子化マトリクス800〜802が二次元の形状で保持されているものとするが、量子化マトリクス内の各要素はもちろんこれに限定されない。さらに、本実施形態に加えて4×4画素サイズの直交変換も用いる場合は、図8(d)に示されたような4×4画素サイズの直交変換に対応する他の量子化マトリクス803も保持することになる。また、後述の予測方法、例えばイントラ予測を用いるかインター予測を用いるかによって、あるいは符号化対象が輝度ブロックか色差ブロックかによって、同じ大きさの直交変換に対して複数の量子化マトリクスを保持することも可能である。一般的に、量子化マトリクスは人間の視覚特性に応じた量子化処理を実現するため、図8(a)〜(f)に示す量子化マトリクス800〜805の左上部分に相当する低周波部分の要素は小さく、右下部分に相当する高周波部分の要素は大きな値となる。
量子化マトリクス符号化部113は、二次元形状で格納されている量子化マトリクスを量子化マトリクス保持部106から順に読み出し、各要素を走査して差分を計算し、一次元の行列に配置し、その後で符号化する。本実施形態では、図8(a)〜(c)に示された各量子化マトリクスはそれぞれ図9(a)、(b)、(d)に示された走査方法を用い、要素ごとに走査順に直前の要素との差分を取得し、この差分が符号化されるものとする。
例えば、図8(a)に示された8×8画素の正方の量子化マトリクス800の場合、最小の周波数(直流)を示す左上隅から最大の周波数を示す右下隅に至る範囲を、図9(a)に示すように斜め方向にスキャンしていく。具体的には、量子化マトリクス符号化部113は、左上に位置する最初の要素“6”は、走査の最初であるので予め設定された初期値との差分を計算する。そして、以降の要素は、直前の要素との差を求める。つまり2つ目の要素は、最初の要素のすぐ下に位置する“9”であるので、1つ前の要素(最初の要素)との差分である“+3”が取得される。以下、量子化マトリクス符号化部113は、この差分演算を図9(a)に示す走査順に走査して求めていく。また、マトリクスの端部の要素に対しては、1行2列目の要素と3行1列目の要素との差分、1行3列目の要素と4行1列目との差分、といった具合に差分が取得される。なお、図8(d)に示された4×4画素の正方の(正方)の量子化マトリクス803に関しても、同様に図9(f)に示すような斜めスキャンを行うことによって各要素の差分が取得されることになる。
また、図8(b)で示された4×8画素分の量子化マトリクス801の場合、量子化マトリクス符号化部113は、図9(b)で示されるように垂直(上から下)にスキャンする処理を、左(低周波)から右側(高周波)に移して行う。具体的には、量子化マトリクス符号化部113は、左上に位置する最初の要素“6”は、走査の最初であるので予め設定された初期値との差分を取得する。そして、その次に、量子化マトリクス符号化部113は、すぐ下に位置する要素“9”を読み出し、1つ前の要素(最初の要素)との差分である“+3”を取得する。この処理を繰り返し行い、そして量子化マトリクス符号化部113は、1行2列目の要素“13”と8行1列目の要素“37”との差分“−24”を取得する。以下、量子化マトリクス符号化部113は、この差分演算を図9(b)に示す走査順に走査して求めていく。
同様に図8(c)で示された8×4画素分の量子化マトリクス802の場合、量子化マトリクス符号化部113は、図9(d)で示されるように、水平(左から右)にスキャンする処理を、上側(低周波)から下側(高周波)に移して行う。具体的には、量子化マトリクス符号化部113は、左上に位置する最初の要素“6”は、走査の最初であるので予め設定された初期値との差分を取得する。そして、その次に、量子化マトリクス符号化部113は、その右隣に位置する要素“9”と、1つ前の要素(最初の要素“6”)との差分である“+3”を取得する。この処理を繰り返し行い、そして量子化マトリクス符号化部113は、2行1列目の要素“13”と1行8列目の要素“37”との差分“−24”を取得する。以下、量子化マトリクス符号化部113は、この差分演算を図9(d)に示す走査順に走査して求めていく。
なお、実施形態では、量子化マトリクス符号化部113は、1つの量子化マトリクスの最初の要素の差分を求める際に参照する初期値は“8”とするが、もちろんこれに限定されず、任意の値で良い。要するに、符号化側と復号側との間で共通の値となっていれば良い。特に初期値を“0”とした場合、最初の要素がそのまま計算結果となる。
このようにして、本実施形態では、図8(a)〜(c)の量子化マトリクス800〜802はそれぞれ、図9(a)、(b)、(d)の走査方法を用い、図10(a)〜(c)に示される差分の1次元行1000〜1002が生成される。量子化マトリクス符号化部113はさらにこの差分行列を符号化して量子化マトリクス符号データを生成する。本実施形態では図11(a)に示される符号化テーブルを用いて符号化するものとするが、符号化テーブルはこれに限定されず、例えば図11(b)に示される符号化テーブルを用いても良い。このようにして生成された量子化マトリクス符号データは後段の統合符号化部111に出力される。
画像符号化処理に用いられる量子化マトリクスは、図8(a)〜(c)の例でも示しているように、一般的に左上に位置する低周波部分から右下に位置する高周波部分にかけて要素の値が増加していく傾向がある。図8(b)、(c)のような長方形の量子化マトリクスの場合は、垂直と水平方向の要素数の違いから、互いに要素の増加度合いが異なる。そのため、図8(b)のような水平方向よりも垂直方向に長い量子化マトリクス801の場合は、垂直方向の要素間の増加の度合いが緩やかなため、図9(b)のような垂直スキャンを用いて要素を走査することで、要素間の差分値が小さくなり、結果として符号量を削減することができる。同様に、図8(c)のような垂直方向よりも水平方向に長い量子化マトリクス802の場合は、水平方向の要素間の増加度合いが緩やかなため、図9(d)のような水平スキャンを用いて要素を走査することで、結果として符号量を削減することができる。
なお、上記実施形態では、量子化マトリクスを8×8、4×8、8×4画素サイズとして説明したが、整数N,Mの関係がN>Mとしたとき、N×N画素、M×N画素,N×M画素のサイズとして一般化できる。更に、これ以外のサイズを含めるようにしても構わない。
例えば、2×8画素サイズの直交変換を用いる場合には、図8(e)の量子化マトリクス804を量子化マトリクス保持部103が保持することになる。2×8画素サイズの量子化マトリクスを符号化する場合、量子化マトリクス符号化部113は、図9(g)に示す垂直スキャンを用いて量子化マトリクスの各要素の差分を取得し、符号化する。また、8x2画素サイズの直交変換を用いる場合には、図8(f)の量子化マトリクス805を量子化マトリクス保持部103が保持することになる。この8×2画素サイズの量子化マトリクスを符号化する場合、量子化マトリクス符号化部113は、図9(h)に示す水平スキャンを用いて量子化マトリクスの各要素の差分を取得し、符号化する。
図1に戻り、統合符号化部111では画像データの符号化に必要なヘッダ情報を符号化し、量子化マトリクスの符号データを統合する。この際、統合符号化部111は、量子化マトリクスのサイズの種類(例えば8×8、4×8、8×4)と、各量子化マトリクス符号化データとの対応関係を示す情報もヘッダ情報に含める。簡単には、量子化マトリクスのサイズの種類が8×8、4×8、8×4となっている場合、これと同じ順序で量子化マトリクス符号化データを格納すればよい。ただし、順序はこれに限らず4×8、8×4、8×8と小さい方から順番に量子化マトリクス符号化データを格納しても構わない。
続いて、画像データの符号化について説明する。端子101から入力された1フレーム分の画像データはブロック分割部102に供給される。ブロック分割部102は、入力された画像データを複数の基本ブロックに分割し、基本ブロック単位の画像を予測部104に出力する。本実施形態では8×8画素の基本ブロック単位の画像を出力するものとする。
予測部104は、ブロック分割部102から入力された基本ブロック単位の画像データに対し予測処理を実行する。具体的には、基本ブロックをさらに細かいサブブロックに分割するブロック分割の種類を決定し、さらにサブブロック単位で水平予測や垂直予測などのイントラ予測モードを決定する。
図7(a)乃至(f)に基本ブロックを分割して得られるブロック分割の種類の一例を示す。太枠の700乃至705は基本ブロックを表しており、説明を簡易にするため、8×8画素の構成とし、太枠内の各四角形はサブブロックを表している。図7(a)は基本ブロック700を分割せず、基本ブロック=サブブロックの例を示している。図7(b)は、従来の正方形サブブロックの一例を表しており、基本ブロック701が、4×4画素サイズの4つのサブブロックに分割されている例である。一方、図7(c)〜(f)は長方形サブブロックの一例を表している。図7(c)では基本ブロック702が4×8画素サイズの2つのサブロックに分割された例を示している。図7(d)は基本ブロック702が、8×4画素サイズの2つのサブブロックに分割された例を示している。また、図7(e)、(f)では、分割方向が異なるものの、基本ブロック704、705が1:2:1のサイズ比で、3つの長方形サブブロックに分割された例を示している。このように正方形だけではなく、長方形のサブブロックも用いて符号化処理が行われる。
上記の如く、本実施形態では、8×8画素の基本ブロックを、サブブロック分割しない(図7(a))、水平方向に沿って分割する(図7(c))、垂直方向に沿って分割する(図7(d))のいずれかが決定されるものとするが、サブブロック分割方法はこれに限定されない。図7(b)のような四分木分割や、図7(e)、(f)のような三分木分割を用いても構わない。
予測部104は、決定したイントラ予測モードおよび符号化済の画素からサブブロックの予測画像データを生成し、さらに入力された画像データと予測画像データから予測誤差を生成し、変換・量子化部105に出力する。また、予測部104は、サブブロック分割やイントラ予測モードなどの情報を予測情報として、符号化部110、画像再生部107に出力する。
変換・量子化部105は、入力された予測誤差を示す残差に対して直交変換、さらには、量子化を行い、当該残差を示す残差係数を生成する。まず、変換・量子化部105は、サブブロックのサイズに対応した直交変換処理が施し、直交変換係数を生成する。次に変換・量子化部105は、直交変換係数を量子化マトリクス保持部103に格納されている量子化マトリクスを用いて量子化し、残差係数を生成する。本実施形態では、図7(a)に対応したサブブロック700に対しては、図8(a)の量子化マトリクス800が用いられるものとする。同様にして、図7(c)のサブブロック702に対しては図8(b)に示す量子化マトリクス801、図7(d)のサブブロック703に対しては図8(c)の量子化マトリクス802が用いる。変換・量子化部105は、生成した残差係数を、符号化部110および逆量子化・逆変換部106に出力する。
逆量子化・逆変換部106は、入力された残差係数を量子化マトリクス保持部103に格納されている量子化マトリクスを用いて逆量子化して変換係数を再生する。更に、逆量子化・逆変換部106は、再生された変換係数を逆直交変換して予測誤差を再生する。なお、逆量子化・逆変換部106が逆量子化処理の際に用いる量子化マトリクスは、変換・量子化部105が用いるサブブロック分割に対応した量子化マトリクスが用いられる。逆量子化・逆変換部106は、再生された予測誤差を画像再生部107に出力する。
画像再生部107は、予測部104から入力される予測情報に基づいて、フレームメモリ108を適宜参照し、予測画像を再生する。そして、画像再生部107は、再生された予測画像と、逆量子化・逆変換部106から入力された再生された予測誤差とから、画像データを再生し、フレームメモリ108に格納する。
インループフィルタ部109は、フレームメモリ108から、画像再生部107が再生した画像を読み出し、デブロッキングフィルタなどのインループフィルタ処理を行う。そして、インループフィルタ部109は、フィルタ処理された画像を再びフレームメモリ108に格納する。
符号化部110は、ブロック単位で、変換・量子化部105で生成された残差係数、予測部104から入力された予測情報をエントロピー符号化し、符号データを生成する。エントロピー符号化の方法は特に指定しないが、ゴロム符号化、算術符号化、ハフマン符号化などを用いることができる。そして、符号化部110は生成された符号データを統合符号化部111に出力する。
統合符号化部111は、前述のヘッダの符号データとともに符号化部110から入力した符号データなどを多重化してビットストリームを形成する。最終的には、ビットストリームは端子112から外部に出力される。
図6(a)は実施形態で出力されるビットストリームの一例である。シーケンスヘッダに量子化マトリクスの符号データが含まれ、各要素の符号化結果で構成されている。ただし、符号化される位置はこれに限定されず、ピクチャヘッダ部やその他のヘッダ部に符号化される構成をとってももちろん構わない。また、1つのシーケンスの中で量子化マトリクスの変更を行う場合、量子化マトリクスを新たに符号化することで更新することも可能である。この際、全ての量子化マトリクスを書き換えても良いし、書き換える量子化マトリクスの変換ブロックサイズを指定することでその一部を変更するようにすることも可能である。
図3は、実施形態に係る画像符号化装置における符号化処理を示すフローチャートである。
まず、画像の符号化に先立ち、S301にて、制御部150は、量子化マトリクス保持部103を制御し、量子化マトリクスを生成し、保持させる。本実施形態の量子化マトリクス保持部103は、図8(a)〜(c)に示された3種類の量子化マトリクス800〜802を生成し、保持することになる。
S302にて、制御部150は、量子化マトリクス符号化部113を制御し、S301にて生成・保持された量子化マトリクスを走査して各要素の差分を算出し、差分行列を生成させる。本実施形態では、図8(a)〜(c)の量子化マトリクスはそれぞれ、図9(a)、(b)、(d)の走査方法を用い、図10(a)〜(c)に示される差分行列が生成されることになる。そして、制御部150は、量子化マトリクス符号化部113を制御し、生成された差分行列の符号化を行わせ、量子化マトリクス符号データを生成させる。
S303にて、制御部150は、統合符号化部111を制御し、生成された量子化マトリクス符号データとともに、画像データの符号化に必要なヘッダ情報を符号化し、出力させる。S304にて、制御部150は、ブロック分割部102を制御し、フレーム単位の入力画像を基本ブロック単位に分割させる。S305にて、制御部150は、予測部104を制御し、S304にて生成された基本ブロック単位の画像データに対して、予測処理を実行する。そして、予測部104によって、図7に示すような基本ブロックを分割することによって得られるブロック分割の種類に関する情報、イントラ予測モードなどの予測情報、および予測画像データが生成される。なお、ブロック分割の種類に関する情報として、図7(a)〜(f)のブロック分割の種類に関する識別子が符号化される。なお、ブロック分割の種類に関する情報として、サブブロックの形状の種類そのもの(例えば、4×8画素サイズ、8×2画素サイズなど)に関する識別子を符号化してもよい。また、予測部104は、入力された画像データと前記予測画像データから予測誤差を算出することになる。
S306にて、制御部150は、変換・量子化部105を制御し、S305で算出された予測誤差に対して直交変換させ、変換係数を生成させる。更に、制御部150は、変換・量子化部105を制御し、S301にて生成・保持された量子化マトリクスを用いて量子化を行わせ、残差係数を生成させる。本実施形態では、図7(a)に対応したブロック分割に対しては図8(a)の量子化マトリクスが用いられるものとする。同様にして、図7(c)のブロック分割に対しては図8(b)、図7(d)のブロック分割に対しては図8(c)の量子化マトリクスが用いられるものとする。
S307にて、制御部150は、逆量子化・逆変換部106を制御し、S305で生成された残差係数を、S301にて生成・保持された量子化マトリクスを用いて逆量子化を行い、変換係数を再生させる。また、逆量子化・逆変換部106は、変換係数に対して逆直交変換し、予測誤差を再生する。
S308にて、制御部150は画像再生部107を制御し、S305で生成された予測情報に基づいて予測画像を再生させる。更に、制御部150は、画像再生部107に、再生された予測画像とS307で生成された予測誤差から画像データを再生させる。
S309にて、制御部159は、符号化部110を制御し、S305で生成された予測情報およびS306で生成された残差係数を符号化し、符号データを生成させる。このとき、符号化部110は、図7(a)〜(f)のブロック分割の種類に関する識別子を符号化する。また、制御部150は、統合符号化部111を制御し、他の符号データも含め、ビットストリームを生成させる。
S310にて、制御部150は、フレーム内の全ての基本ブロックの符号化が終了したか否かの判定を行う。終了した判定した場合、制御部150は処理をS311に進み、そうでなければ次の基本ブロックを対象の符号化を行うため、処理をS304に戻す。
S311にて、制御部150は、インループフィルタ部109を制御し、S308で再生された画像データに対し、インループフィルタ処理を行い、フィルタ処理された画像を生成し、処理を終了する。
以上の構成と動作により、特にS302において、量子化マトリクスの形状に応じた走査方法を用いて量子化マトリクスを符号化することで、量子化マトリクスの符号量を削減することができる。結果として、生成されるビットストリーム全体のデータ量を削減することになるため、圧縮効率を向上させることができる。
なお、本実施形態では、サブブロックのサイズの種類に応じて、使用される量子化マトリクスや要素の走査方法が一意に決まる構成としたが、量子化マトリクスの要素の走査方法を複数の走査方法の中から選択し、識別子をヘッダ内に符号化する構成としても構わない。例えば、図9(b)に示される走査方法を用いるかあるいは図9(d)に示される走査方法を用いるかを示す情報を、量子化マトリクス走査方法情報符号としてヘッダ部分に符号化し、図6(b)に示されるビットストリームを生成する構成としても良い。これにより、各量子化マトリクスが最適な方法で走査され、量子化マトリクスの符号量がより少ないビットストリームを生成することができる。
また、本実施形態では、図8(b)の垂直方向に長尺の量子化マトリクス801は図9(b)の垂直スキャンで、図8(c)の水平方向に長尺の量子化マトリクス802は図9(c)の水平スキャンで走査して符号化するものとした。しかし、用いられる走査方法はこれに限定されない。例えば、図8(b)の量子化マトリクス801に対しては図9(d)のような走査方法を用いても良く、水平方向よりも水平方向の要素を先に走査・符号化することで、本実施形態と同様の符号量削減効果を実現することができる。同様にして、図8(c)の量子化マトリクス802に対しては、図9(e)のような走査方法を用いても良い。
図2は、本実施形態における画像復号装置の構成を示すブロック図である。この画像復号装置は、上述の実施形態の画像符号化装置で生成された符号化データの復号するものである。
画像復号装置は、装置全体の制御を司る制御部250を有する。この制御部250は、CPU、CPUが実行するプログラムを格納するROM、CPUのワークエリアとして利用するRAMを有する。また、画像復号装置は、入力端子201、分離復号部202、復号部203、逆量子化・逆変換部204、画像再生部205、フレームメモリ206、インループフィルタ部207、出力端子208、及び、量子化マトリクス復号部209を有する。
入力端子201は、符号化されたビットストリームを入力するものであり、入力源は例えば符号化ストリームを格納した記憶媒体であるが、ネットワークから入力しても良く、その種類は問わない。
分離復号部202は、入力したビットストリームから復号処理に関する情報や係数に関する符号データに分離する。また、分離復号部202は、ビットストリームのヘッダ部に存在する符号化データを復号する。本実施形態の分離復号部202は、量子化マトリクス符号化データを分離し、後段に出力する。分離復号部202は、図1の統合符号化部111と逆の動作を行うものでもある。
量子化マトリクス復号部209は、量子化マトリクス符号を復号して量子化マトリクスを再生する。復号部203は、分離復号部202から出力された画像の符号化データを復号し、残差係数および予測情報を再生する。
逆量子化・逆変換部204は、図1の逆量子化・逆変換部106と同様、再生された量子化マトリクスを用いて残差係数に逆量子化を行って変換係数を得、さらに逆直交変換を行い、予測誤差を再生する。
画像再生部205は、入力された予測情報に基づいて、フレームメモリ206を適宜参照して予測画像データを生成する。そして、この予測画像データと逆量子化・逆変換部204で再生された予測誤差から再生画像データを生成し、フレームメモリ206に再格納する。
インループフィルタ部207は、図1のインループフィルタ部109と同様、フレームメモリ206に格納された再生画像に対し、デブロッキングフィルタなどのインループフィルタ処理を行い、フィルタ処理後の画像をフレームメモリ207に再格納する。
出力端子は、フレームメモリ206に格納されたフレーム画像を順次、外部に出力する。出力先は、表示装置とするが、他のデバイスであっても構わない。
次に上記画像復号装置における動作を、より詳しく説明する。本実施形態の画像復号装置は、実施形態の画像符号化装置で生成されたビットストリームをフレーム単位で入力する構成となっているが、1フレーム分の静止画像ビットストリームを入力する構成としても構わない。また、本実施形態では説明を容易にするため、イントラ予測復号処理のみを説明するが、これに限定されずインター予測復号処理においても適用可能である。
分離復号部202は、入力端子201を介して入力した1フレーム分のビットストリームから、復号処理に関する情報や係数に関する符号化データに分離し、ビットストリームのヘッダ部に存在する符号化データを復号する。より具体的には、分離復号部202は、量子化マトリクスの符号化データを再生する。分離復号部202は、図6(a)に示されるビットストリームのシーケンスヘッダから量子化マトリクスの符号化データを抽出し、量子化マトリクス復号部209に出力する。続いて、分離復号部202は、ピクチャデータの基本ブロック単位の符号データを再生し、復号部203に出力する。
量子化マトリクス復号部209は、まず入力された量子化マトリクス符号データを復号し、一次元の差分行列を再生する。本実施形態では、図11(a)に示される符号化テーブルを用いて復号するものとするが、符号化テーブルはこれに限定されず、本実施形態と同じものを用いる限りは他の符号化テーブルを用いても良い。さらに量子化マトリクス復号部209は、再生された一次元の差分行列を逆走査し、二次元の量子化マトリクスを再生する。ここでは本実施形態の量子化マトリクス符号化部113と同様の走査を行う。すなわち、本実施形態の量子化マトリクス復号部209は、図10(a)〜(c)に示される差分行列1000〜1002はそれぞれ、図9(a)、(b)、(d)に示される走査方法を用いて、図8(a)〜(c)に示される3種の量子化マトリクスを再生し、自身が有する内部メモリ(不図示)に保持する。
復号部203は、画像の符号化データを復号し、着目ブロックの量子化係数および予測情報を再生する。復号部203は、再生した量子化係数を逆量子化・逆変換部204に出力し、再生された予測情報を画像再生部205に出力する。
逆量子化・逆変換部204は、入力された量子化係数に対し、量子化マトリクス復号部209で再生された量子化マトリクスを用いて逆量子化を行って直交変換係数を生成する。さらに逆量子化・逆変換部204は、逆直交変換を施して予測誤差を再生する。そして、逆量子化・逆変換部204は、再生された予測情報を画像再生部205に出力する。この際、復号対象のサブブロックのサイズの種類に応じて用いられる量子化マトリクスが定まり、本実施形態では、図7(a)に対応したブロック分割に対しては図8(a)の量子化マトリクスが用いられるものとする。同様にして、図7(c)のブロック分割に対しては図8(b)、図7(d)のブロック分割に対しては図8(c)の量子化マトリクスが用いられるものとする。
画像再生部205は、復号部203から入力された予測情報に基づいて、フレームメモリ206を参照し、予測画像を再生する。そして、画像再生部205は、この予測画像に、逆量子化・逆変換部204から入力された予測誤差を加算することで、画像データを再生し、その再生した画像データをフレームメモリ206に格納する。この格納された画像データは、後続する符号化データの復号時の予測の際に参照されることになる。
インループフィルタ部207は、図1のインループフィルタ部109と同様、フレームメモリ206から再生画像を読み出し、デブロッキングフィルタなどのインループフィルタ処理を行う。そして、インループフィルタ部207は、フィルタ処理された画像を再びフレームメモリ206に格納する。フレームメモリ206に格納された再生画像は、最終的には出力端子208から外部に出力されることになる。
図4は、実施形態の画像復号装置における制御部250の復号処理を示すフローチャートである。
まず、S401にて、制御部250は、分離復号部202を制御し、ビットストリームから復号処理に関する情報や係数に関する符号化データに分離させてヘッダ部分の符号化データを復号する。この結果、分離復号部202は、量子化マトリクス符号データを再生することになる。
S402にて、制御部250は、量子化マトリクス復号部209を制御し、S401で再生された量子化マトリクス符号データを復号させる。この結果、図10(a)〜(c)で示されたような一次元の差分行列が再生される。さらに制御部250は、量子化マトリクス復号部209を制御し、再生された一次元の差分行列を走査し、二次元の量子化マトリクスを再生する。すなわち、量子化マトリクス復号部209は、図10(a)〜(c)に示される差分行列を、それぞれ、図9(a)、(b)、(d)に示される走査方法を用いて、図8(a)〜(c)に示される3種の量子化マトリクスを再生し、内部のメモリに保持する。
S403にて、制御部250は復号部203を制御し、S401で分離された画像の符号化データを復号させ、量子化係数および予測情報を再生させる。
具体的には、復号部203は、ビットストリームから分割情報を復号し、図7(a)〜(f)に示すようなブロック分割の種類に関する情報を取得する。ブロック分割の種類に関する情報として、図7(a)〜(f)のブロック分割の種類に関する識別子を取得する。なお、画像復号装置においてはこれらの識別子に対応するブロック分割の種類は既知であるとする。すなわち、制御部250は、取得した識別子に対応するブロック分割の種類が判別できるので、どの形状の種類の量子化マトリクスを使用するかを判別することができる。例えば、図7(c)に対応するブロック分割の種類に関する識別子が取得された場合、4×8画素サイズのサブブロックの量子化マトリクスを2回使用することになる。
なお、ブロック分割の種類に関する情報として、サブブロックの形状の種類そのもの(例えば、4×8画素サイズ、8×2画素サイズなど)に関する識別子がビットストリームから復号される場合、これらの識別子とそれらに対応するサブブロック形状の種類は既知であるとする。
さらに、復号部203は、取得されたブロック分割の種類に従って、用いる量子化マトリクスを決定する。例えば、図7(c)の場合、4×8画素サイズの量子化マトリクスが2回使用される。また図7(e)の場合、2×8画素サイズの量子化マトリクス、4×8画素サイズの量子化マトリクス、そして再び2×8画素サイズの量子化マトリクスが使用される。
そして、制御部250は、S404にて、逆量子化・逆変換部204を制御し、量子化係数に対して、S402で再生された量子化マトリクスを用いて逆量子化を行わせて変換係数を得、さらに逆直交変換を行わせ、予測誤差を再生させる。
S405にて、制御部250は、画像再生部205を制御し、S403で生成された予測情報や予測画像を再生させる。さらに制御部250は画像再生部205を制御して、再生された予測画像と、S404で生成された予測誤差から画像データを再生させる。
S406にて、制御部250は、フレーム内の全ての基本ブロックの復号が終了したか否かの判定を行う。全基本ブロックの復号が完了していない場合、制御部250は処理を403に戻し、次の記録ブロックの復号処理を行う。また、フレーム内の全ての基本ブロックの復号が完了した場合、制御部250は処理をS407に進める。このS407にて、制御部250は、インループフィルタ部207を制御し、S405で再生された画像データに対し、インループフィルタ処理を行わせ、フィルタ処理された画像を再度フレームメモリに格納し、本処理を終了する。
以上の構成と動作により、本実施形態で生成された、量子化マトリクスの形状に応じた走査方法を用い、量子化マトリクスの符号量を削減したビットストリームを復号することができる。
なお、本実施形態では、サブブロックのサイズの種類に応じて、使用される量子化マトリクスや要素の走査方法が一意に決まる構成としたが、量子化マトリクスの要素の走査方法を複数の走査方法の中から選択する識別子をヘッダから復号する構成としても構わない。例えば、図9(b)に示される走査方法を用いるかあるいは図9(d)に示される走査方法を用いるかを示す情報を、図6(b)に示されるビットストリームのヘッダ部分から量子化マトリクス走査方法情報符号として復号する構成としても良い。これにより、各量子化マトリクスが最適な方法で走査され、量子化マトリクスの符号量がより少ないビットストリームを復号することができる。
また、本実施形態では、図8(b)の縦長量子化マトリクスは図9(b)の垂直スキャンで、図8(c)の横長量子化マトリクスは図9(d)の水平スキャンで逆走査して復号されるものとしたが、用いられる走査方法はこれに限定されない。例えば、図8(b)の縦長量子化マトリクスに対しては図9(c)のような走査方法を用いても良く、水平方向よりも水平方向の要素を先に逆走査・復号することで、同様に符号量が削減されたビットストリームを復号することができる。同様にして、図8(c)の横長量子化マトリクスに対しては、図9(e)のような走査方法を用いても良い。
[第2の実施形態]
図1、図2に示した各処理部はハードウェアでもって構成しているものとして上記実施形態では説明した。しかし、これらの図に示した各処理部で行う処理を、パーソナルコンピュータに代表される情報処理装置で実行するコンピュータプログラムによって実現させる例を第2の実施形態として説明する。
図5は、本第2の実施形態におけるコンピュータのハードウェアの構成例を示すブロック図である。
CPU501は、RAM502やROM503に格納されているコンピュータプログラムやデータを用いてコンピュータ全体の制御を行う。
RAM502は、外部記憶装置506からロードされたコンピュータプログラムやデータ、I/F(インターフェース)507を介して外部から取得したデータなどを一時的に記憶するために用いられる。更に、RAM502は、CPU501が各種の処理を実行する際に用いるワークエリアを有する。即ち、RAM502は、例えば、フレームメモリとして割り当てたり、その他の各種のエリアを適宜提供したりすることができる。
ROM503には、本コンピュータの設定データ(BIOSを含む)や、ブートプログラムなどが格納されている。操作部504は、キーボードやマウスなどにより構成されており、本コンピュータのユーザが操作することで、各種の指示をCPU501に対して入力することができる。表示部505は、CPU501による処理結果を表示する。また表示部505は例えば液晶ディスプレイで構成される。
外部記憶装置506は、ハードディスクドライブ装置に代表される、大容量情報記憶装置である。外部記憶装置506には、OS(オペレーティングシステム)や、図1、図2に示した各部の機能をCPU501に実現させるためのコンピュータプログラムが保存されている。更には、外部記憶装置506には、処理対象としての各画像データが保存されていても良い。
外部記憶装置506に保存されているコンピュータプログラムやデータは、CPU501による制御に従って適宜、RAM502にロードされ、CPU501による処理対象となる。I/F507には、LANやインターネット等のネットワーク、投影装置や表示装置などの他の機器を接続することができ、本コンピュータはこのI/F507を介して様々な情報を取得したり、送出したりすることができる。508は上述の各部を繋ぐバスである。
上述の構成において、本装置の電源がONになると、CPU501はROM503のブートプログラムを実行することで、外部記憶装置506からOSをRAM502にロードし実行する。この結果、操作部504と表示部505によるユーザインターフェースが機能する。そして、CPU501は、ユーザにより画像符号化、復号に係るプログラムを実行指示を受け付けると、そのプログラムを外部記憶装置506からRAM502に読み出し、OSの下で実行する。この結果、CPU501は、図1または図2の各処理部として処理を行い、CPU501が図3又は図4に従って制御を行うことで、本装置が画像符号化装置或いは画像復号装置として機能することになる。なお、図1、図2におけるフレームメモリは、RAM502が代用されるものとする。また、符号化対象の画像データや符号化画像データは外部記憶装置506に格納されるものとする。
(その他の実施例)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
本発明は静止画・動画の符号化・復号を行う符号化装置・復号装置に用いられる。特に、量子化マトリクスを使用する符号化方式および復号方式に適用が可能である。
101、201…入力端子、112、208…出力端子、102…ブロック分割部、103…量子化マトリクス保持部、104…予測部、105…変換・量子化部、106、204…逆量子化・逆変換部、107、205…画像再生部、108、206… フレームメモリ、109、207…インループフィルタ部、110…符号化部、111…統合符号化部、113…量子化マトリクス符号化部、202…分離復号部、203…復号部、209…量子化マトリクス復号部

Claims (9)

  1. 画像を符号化する画像符号化装置であって、
    符号化対象の画像を予め設定された複数種類の矩形ブロックのいずれかに分割する分割手段と、
    前記複数種類の矩形ブロックそれぞれに対応する複数種類の量子化マトリクスを生成する生成手段と、
    該生成手段で生成した、それぞれの量子化マトリクスを、それぞれの形状に応じた走査順に従って符号化する第1の符号化手段と、
    前記分割手段で得た着目の矩形ブロックの画像を周波数変換し、得られた変換係数を前記着目の矩形ブロックの形状に応じた量子化マトリクスを用いて量子化する量子化手段と、
    該量子化手段で得た量子化後の変換係数を符号化する第2の符号化手段と、
    前記第1の符号化手段で得た符号化データと、前記第2の符号化手段で得た符号化データとを統合する統合手段と
    を有することを特徴とする画像符号化装置。
  2. 前記分割手段は、整数N,MがN>Mの関係にあるとしたとき、符号化対象の画像から、N×N画素のブロック、M×N画素のブロック、N×M画素のブロックのいずれかで着目のブロックを分割し、
    前記第1の符号化手段は、
    N×M画素の量子化マトリクスについては、水平方向に沿った走査を、低周波から高周波に向かって行うことで符号化する
    ことを特徴とする請求項1に記載の画像符号化装置。
  3. 前記第1の符号化手段は、1つの量子化マトリクスを符号化するとき、当該量子化マトリクスにおける最初の量子化ステップ値については、予め設定された初期値との差分を求め、以降の量子化ステップ値については直前の量子化ステップ値との差分を求め、該差分に符号を割り当てることで符号化することを特徴とする請求項2に記載の画像符号化装置。
  4. 前記第1の符号化手段は、差分が0に近いほど短い符号を割り当てたテーブルを用いて符号化することを特徴とする請求項3に記載の画像符号化装置。
  5. 前記第2の符号化手段は、
    符号化済みの画像を格納するフレームメモリを参照して、前記着目の矩形ブロックに対する予測データを生成し、
    前記着目の矩形ブロックが表す画像と、前記予測データとの予測誤差を求め、
    該予測誤差を周波数変換し、
    周波数変換で得られた係数を前記着目の矩形ブロックに対応する量子化マトリクスを用いて量子化し、
    前記予測データを特定するための情報と、前記量子化で得た係数を符号化する
    ことを特徴とする請求項1乃至4のいずれか1項に記載の画像符号化装置。
  6. 請求項1に記載の画像符号化装置により得た符号化データを復号する画像復号装置であって、
    復号対象の符号化データから、量子化マトリクスの符号化データと、画像データの符号化データとを分離する分離手段と、
    該分離手段により得た前記量子化マトリクスの符号化データを、再生しようとする量子化マトリクスの形状に応じた走査順に従って復号し、復号して得られた複数種類の量子化マトリクスを保持する第1の復号手段と、
    前記分離手段により得た着目ブロックの画像データの符号化データを復号することで、前記着目ブロックの量子化後の係数を得る第2の復号手段と、
    該第2の復号手段で得た前記着目ブロックの量子化後の係数を、当該着目ブロックに対応する量子化マトリクスを用いて逆量子化し、当該逆量子化で得た係数を逆直交変換することで前記着目ブロックの画像を再生する再生手段と
    を有することを特徴とする画像復号装置。
  7. 画像を符号化する画像符号化装置の制御方法であって、
    符号化対象の画像を予め設定された複数種類の矩形ブロックのいずれかに分割する分割工程と、
    前記複数種類の矩形ブロックそれぞれに対応する複数種類の量子化マトリクスを生成する生成工程と、
    該生成工程で生成した、それぞれの量子化マトリクスを、それぞれの形状に応じた走査順に従って符号化する第1の符号化工程と、
    前記分割工程で得た着目の矩形ブロックの画像を周波数変換し、得られた変換係数を前記着目の矩形ブロックの形状に応じた量子化マトリクスを用いて量子化する量子化工程と、
    該量子化工程で得た量子化後の変換係数を符号化する第2の符号化工程と、
    前記第1の符号化工程で得た符号化データと、前記第2の符号化工程で得た符号化データとを統合する統合工程と
    を有することを特徴とする画像符号化装置の制御方法。
  8. 請求項1に記載の画像符号化装置により得た符号化データを復号する画像復号装置の制御方法であって、
    復号対象の符号化データから、量子化マトリクスの符号化データと、画像データの符号化データとを分離する分離工程と、
    該分離工程により得た前記量子化マトリクスの符号化データを、再生しようとする量子化マトリクスの形状に応じた走査順に従って復号し、復号して得られた複数種類の量子化マトリクスを保持する第1の復号工程と、
    前記分離工程により得た着目ブロックの画像データの符号化データを復号することで、前記着目ブロックの量子化後の係数を得る第2の復号工程と、
    該第2の復号工程で得た前記着目ブロックの量子化後の係数を、当該着目ブロックに対応する量子化マトリクスを用いて逆量子化し、当該逆量子化で得た係数を逆直交変換することで前記着目ブロックの画像を再生する再生工程と
    を有することを特徴とする画像復号装置の制御方法。
  9. コンピュータが読み込み実行することで、前記コンピュータに、請求項7又は8に記載の方法の各工程を実行させるためのプログラム。
JP2019103181A 2018-06-29 2019-05-31 画像符号化装置及び画像復号装置及びそれらの制御方法及びプログラム Pending JP2020010320A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018125298 2018-06-29
JP2018125298 2018-06-29

Publications (1)

Publication Number Publication Date
JP2020010320A true JP2020010320A (ja) 2020-01-16

Family

ID=68985602

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019103181A Pending JP2020010320A (ja) 2018-06-29 2019-05-31 画像符号化装置及び画像復号装置及びそれらの制御方法及びプログラム

Country Status (3)

Country Link
JP (1) JP2020010320A (ja)
TW (1) TW202002635A (ja)
WO (1) WO2020003740A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111556319B (zh) * 2020-05-14 2021-12-17 电子科技大学 一种基于矩阵分解的视频编码方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4705921B2 (ja) * 2004-01-20 2011-06-22 パナソニック株式会社 量子化マトリクスおよび動画像の復号化方法、復号化装置、プログラムおよび記録媒体
US9641840B2 (en) * 2011-05-20 2017-05-02 Sony Corporation Processing device and image processing method for encoding and decoding image
WO2013005386A1 (en) * 2011-07-01 2013-01-10 Panasonic Corporation Method and apparatus for encoding and decoding video using adaptive quantization matrix for square and rectangular transform units
JP2013038758A (ja) * 2011-07-13 2013-02-21 Canon Inc 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
WO2013065259A1 (ja) * 2011-11-01 2013-05-10 日本電気株式会社 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法およびプログラム
WO2013157825A1 (ko) * 2012-04-16 2013-10-24 한국전자통신연구원 영상 부호화/복호화 방법 및 장치

Also Published As

Publication number Publication date
TW202002635A (zh) 2020-01-01
WO2020003740A1 (ja) 2020-01-02

Similar Documents

Publication Publication Date Title
US11985352B2 (en) Image coding apparatus, image coding method, and storage media
US20240089448A1 (en) Image encoding apparatus, image decoding apparatus, control methods thereof, and non-transitory computer-readable storage medium
US20240089439A1 (en) Image decoding device, method, and non-transitory computer-readable storage medium
JP2023113858A (ja) 画像復号装置、画像復号方法、及びプログラム
JP2023080359A (ja) 画像復号装置、画像復号方法、及びプログラム
JP2020010320A (ja) 画像符号化装置及び画像復号装置及びそれらの制御方法及びプログラム
WO2021054012A1 (ja) 画像符号化装置、画像復号装置及びそれらの制御方法及びプログラム
WO2020183859A1 (ja) 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、及びプログラム
JP2021150723A (ja) 画像符号化装置、画像符号化方法、及びプログラム、画像復号装置、画像復号方法、及びプログラム
JP2024023793A (ja) 画像符号化装置及び画像復号装置及び画像符号化方法及び画像復号方法及びプログラム

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20210103

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210113