WO2014147679A1 - 画像符号化装置および画像符号化方法 - Google Patents

画像符号化装置および画像符号化方法 Download PDF

Info

Publication number
WO2014147679A1
WO2014147679A1 PCT/JP2013/006101 JP2013006101W WO2014147679A1 WO 2014147679 A1 WO2014147679 A1 WO 2014147679A1 JP 2013006101 W JP2013006101 W JP 2013006101W WO 2014147679 A1 WO2014147679 A1 WO 2014147679A1
Authority
WO
WIPO (PCT)
Prior art keywords
unit
image
quantization matrix
quantization
orthogonal transform
Prior art date
Application number
PCT/JP2013/006101
Other languages
English (en)
French (fr)
Inventor
安倍 清史
一仁 木村
秀之 大古瀬
荒川 博
耕治 有村
和真 榊原
Original Assignee
パナソニック株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by パナソニック株式会社 filed Critical パナソニック株式会社
Publication of WO2014147679A1 publication Critical patent/WO2014147679A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

 画像符号化装置(100)は、ピクチャを取得する取得部(102)と、取得部(102)が取得したピクチャである入力ピクチャ内に文字または線画を含む領域である文字領域があるか否かを判定する判定部(111)と、入力ピクチャごとに、互いにサイズの異なる複数の直交変換単位のブロックサイズのそれぞれに対して量子化行列を設定する量子化行列設定部(112)とを備え、量子化行列設定部(112)は、複数の直交変換単位のブロックサイズのうち4×4画素のブロックサイズに対しては、入力ピクチャ内に文字領域があると判定されたか否かに応じて異なる量子化行列を設定する。

Description

画像符号化装置および画像符号化方法
 本開示は、入力されたピクチャをブロックに分割して符号化する画像符号化装置に関するものである。
 現在、ITU-TとISO/IECとの共同により、HEVC(High Efficiency Video Coding)と呼ばれる次世代画像符号化方式の標準化活動が進んでいる(非特許文献1参照)。
 一般に、画像符号化処理(以下、単に、符号化処理とも記載する)においては、情報量の圧縮を目的として、符号化対象のブロックと、これに対応する予測画像との差分画像に対して、直交変換および量子化を行い、さらに可変長符号化を行うことで符号列に変換する。
 HEVCでは、直交変換において、符号化対象ブロックごとに、4×4画素、8×8画素、16×16画素、および32×32画素の中から任意のサイズの直交変換処理単位であるトランスフォームユニット(以下、TUと称す)を選択して直交変換を行う。さらに、4×4画素のTUが選択された場合に限り、直交変換を行わずに差分画像をそのまま量子化することが可能である。
 また、量子化においては、量子化行列を用いて周波数成分ごとに異なる量子化幅を設定することで、主観的に劣化が目立ち難くなるように量子化を行う。
JCTVC-L1003: High Efficiency Video Coding (HEVC) text specification draft10 (01/2013)
 しかしながら、HEVCでは、規格上、ブロックサイズが4×4画素のTUに対して1つの量子化行列が設定され、直交変換の有無に応じて量子化行列を変更することはできない。したがって、HEVCでは、ブロックサイズが4×4画素のTUに対して、直交変換の有無が切り替えられることを考慮せずに量子化行列が設定された場合、適切な量子化行列が設定されていないことによる画質の劣化や符号化効率の低下が発生する場合がある。
 本開示は、上記課題を解決するものであり、HEVCで定められるような直交変換の有無の切り替えを含む符号化処理を実行する場合に、画質劣化や符号化効率の低下を抑制することができる画像符号化装置等を提供する。
 本開示に係る画像符号化装置は、ピクチャを所定の符号化規格にて符号化する画像符号化装置であって、ピクチャを取得する取得部と、前記取得部が取得したピクチャである入力ピクチャ内に文字または線画を含む領域である文字領域があるか否かを判定する判定部と、前記入力ピクチャごとに、互いにサイズの異なる複数の直交変換単位のブロックサイズのそれぞれに対して量子化行列を設定する量子化行列設定部と、前記入力ピクチャを分割した画像である単位画像を生成するピクチャ分割部と、前記単位画像に対応する予測画像を生成する予測画像生成部と、前記単位画像と、当該単位画像に対応する予測画像との画素値の差分を示す画像である差分画像を生成する差分演算部と、前記差分画像をさらに少なくとも1つ以上の前記直交変換単位に分割し、ブロックサイズが4×4画素である前記直交変換単位については、前記直交変換単位ごとに(1)前記差分画像を直交変換した残差係数を生成して出力する第1処理と、(2)前記差分画像をそのまま残差係数として出力する第2処理と、を選択的に実行する変換部と、前記変換部が出力する残差係数を、前記複数の直交変換単位のブロックサイズのそれぞれに対して設定された量子化行列を用いて量子化する量子化部と、前記量子化部が量子化した残差係数が符号化された符号列であって、前記量子化行列設定部が設定した量子化行列がヘッダ領域に記述された符号列を生成する符号列生成部とを備え、前記量子化行列設定部は、前記複数の直交変換単位のブロックサイズのうち4×4画素のブロックサイズに対しては、前記入力ピクチャ内に前記文字領域があると判定されたか否かに応じて異なる量子化行列を設定する。
 なお、これらの包括的または具体的な態様は、システム、方法、集積回路、コンピュータプログラムまたはコンピュータ読み取り可能なCD-ROMなどの記録媒体で実現されてもよい。また、これらの包括的または具体的な態様は、システム、方法、集積回路、コンピュータプログラムまたは記録媒体の任意な組み合わせで実現されてもよい。
 本開示における画像符号化装置は、直交変換の有無を切り替えて符号化処理を実行する場合に、画質劣化や符号化効率の低下を抑制することができる。
図1は、実施の形態1に係る画像符号化装置の構成を示すブロック図である。 図2は、直交変換部および非直交変換部のそれぞれが行う処理を説明するための概念を示す図である。 図3は、逆量子化部の逆量子化と、逆直交変換部および逆非直交変換部の変換処理とを説明するための模式図である。 図4は、実施の形態1に係る画像符号化装置の量子化行列の設定処理を示すフローチャートである。 図5は、符号列生成部によって生成される符号列の一例を示す図である。 図6は、4×4画素のTU用の量子化行列の具体例を説明するための図である。 図7は、実施の形態2に係る画像符号化装置の構成を示すブロック図である。 図8は、実施の形態2に係る画像符号化装置の量子化行列の設定処理を示すフローチャートである。
 (本開示の基礎となった知見)
 近年、マルチメディアアプリケーションの発展に伴い、画像、音声およびテキストなど、あらゆるメディアの情報を統一的に扱うことが一般的になってきた。
 ここで、ディジタル化された画像は膨大なデータ量を持つため、蓄積および伝送のためには、画像の情報圧縮技術が不可欠である。一方で、圧縮した画像データを相互運用するためには、圧縮技術の標準化も重要である。
 例えば、画像圧縮技術の標準規格としては、ITU-T(国際電気通信連合 電気通信標準化部門)のH.261、H.263、H.264、ISO/IEC(国際標準化機構)のMPEG-1、MPEG-3、MPEG-4、MPEG-4AVCなどがある。また、現在は、ITU-TとISO/IECとの共同によるHEVC(非特許文献1)と呼ばれる次世代画像符号化方式の標準化活動が進んでいる。
 このような画像の符号化では、符号化対象の各ピクチャを符号化単位ブロックに分割し、符号化単位ブロックごとに時間方向および空間方向の冗長性を削減することによって情報量の圧縮を行う。
 時間的な冗長性の削減を目的とする画面間予測符号化では、前方または後方のピクチャを参照してブロック単位で動きの検出および予測画像の作成を行い、得られた予測画像と符号化対象のブロックとの差分画像を取得する。
 また、空間的な冗長性の削減を目的とする画面内予測符号化では、周辺の符号化済みブロックの画素情報をから予測画像の生成を行い、得られた予測画像と符号化対象のブロックとの差分画像を取得する。そして、さらに得られた差分画像に対して離散コサイン変換等の直交変換および量子化を行い、可変長符号化を用いて符号列を生成することで情報量が圧縮される。
 HEVCでは、前述の直交変換において、符号化対象ブロックごとに、ブロックサイズが4×4画素のTU、8×8画素のTU、16×16画素のTU、32×32画素のTUの中から任意のブロックサイズのTUを選択して直交変換を行うことが可能となっている。画像の性質に応じてTUのブロックサイズを適応的に切り替えることで符号化効率の向上が可能となる。また、4×4画素のTUが選択された場合に限り、直交変換を行わずに差分画像をそのまま量子化することも可能である。
 また、前述の量子化処理では、符号化対象ブロックごとに設定した量子化パラメータとピクチャごとに設定した量子化行列とを掛け合わせることで決定される量子化幅によって量子化が行われる。
 一般的に量子化行列は、人が認識し易い(人が画質の劣化に気付き易い)低周波数領域の成分に対してはより細かい係数値を適用するように構成される。一方、人が認識し難い(人が画質の劣化に気付き難い)高周波数領域の成分に対してはより粗い係数値を適用するように構成される。
 つまり、量子化行列は、低周波数領域から高周波数領域にかけて傾斜を持つ係数値で構成される。また、量子化行列は、直交変換のサイズごとに定義されることが必要であるため、HEVCでは、4×4画素のTU、8×8画素のTU、16×16画素のTU、32×32画素のTUそれぞれに対応した量子化行列が設定される。
 HEVCでは前述の通り、直交変換を行う際に4×4画素のブロックサイズのTUが選択された場合、(1)直交変換によって生成された残差係数に対して量子化する方法(第1の量子化処理)と、(2)直交変換を行わずに差分画像をそのまま量子化する方法(第2の量子化処理)とをTUごとに切り替えることが可能である。
 しかしながら、HEVCでは、規格上、量子化を行うために使用される量子化行列は、ブロックサイズが4×4画素TUに対して1つしか設定することができない。つまり、HEVCでは、第1の量子化処理と第2の量子化処理との両方の量子化処理において共通の量子化行列が用いられる。
 したがって、第1の量子化処理に対して最適化された量子化行列が設定されると、第2の量子化処理を行った場合に画質劣化が発生してしまう。逆に、第2の量子化処理に対して最適化された量子化行列が設定されると、第1の量子化処理を行った場合に符号化効率の低下を発生させてしまう。
 本開示は、上記課題を解決するものであり、直交変換の有無の切り替えを含む符号化処理において、画質劣化や符号化効率の低下を抑制することができる画像符号化装置等を提供する。
 本開示の一態様に係る画像符号化装置は、ピクチャを所定の符号化規格にて符号化する画像符号化装置であって、ピクチャを取得する取得部と、前記取得部が取得したピクチャである入力ピクチャ内に文字または線画を含む領域である文字領域があるか否かを判定する判定部と、前記入力ピクチャごとに、互いにサイズの異なる複数の直交変換単位のブロックサイズのそれぞれに対して量子化行列を設定する量子化行列設定部と、前記入力ピクチャを分割した画像である単位画像を生成するピクチャ分割部と、前記単位画像に対応する予測画像を生成する予測画像生成部と、前記単位画像と、当該単位画像に対応する予測画像との画素値の差分を示す画像である差分画像を生成する差分演算部と、前記差分画像をさらに少なくとも1つ以上の前記直交変換単位に分割し、ブロックサイズが4×4画素である前記直交変換単位については、前記直交変換単位ごとに(1)前記差分画像を直交変換した残差係数を生成して出力する第1処理と、(2)前記差分画像をそのまま残差係数として出力する第2処理と、を選択的に実行する変換部と、前記変換部が出力する残差係数を、前記複数の直交変換単位のブロックサイズのそれぞれに対して設定された量子化行列を用いて量子化する量子化部と、前記量子化部が量子化した残差係数が符号化された符号列であって、前記量子化行列設定部が設定した量子化行列がヘッダ領域に記述された符号列を生成する符号列生成部とを備え、前記量子化行列設定部は、前記複数の直交変換単位のブロックサイズのうち4×4画素のブロックサイズに対しては、前記入力ピクチャ内に前記文字領域があると判定されたか否かに応じて異なる量子化行列を設定する。
 また、前記量子化行列設定部は、前記複数の直交変換単位のブロックサイズのうち4×4画素以外のブロックサイズに対しては、前記入力ピクチャ内に前記文字領域があると判定されたか否かに関係なく同じ量子化行列を設定してもよい。
 また、前記量子化部は、前記第1処理および前記第2処理のいずれの処理が行われたかに関係なく、ブロックサイズが4×4画素である前記直交変換単位を同じ量子化行列を用いて量子化してもよい。
 また、前記入力ピクチャ内に前記文字領域があると判定された場合、前記量子化行列設定部は、全ての係数値が同じ値である量子化行列を前記複数の直交変換単位のブロックサイズのうち4×4画素のブロックサイズに対して設定し、前記入力ピクチャ内に前記文字領域がないと判定された場合、前記量子化行列設定部は、低周波数成分から高周波数成分にかけて傾斜を持った係数値で構成される量子化行列を前記複数の直交変換単位のブロックサイズのうち4×4画素のブロックサイズに対して設定してもよい。
 また、前記入力ピクチャ内に前記文字領域があると判定された場合、前記量子化行列設定部は、少なくとも一部の係数値が低周波数成分から高周波数成分にかけて傾斜を有し、前記少なくとも一部の係数値以外の全ての係数値が同じ値である量子化行列を前記複数の直交変換単位のブロックサイズのうち4×4画素のブロックサイズに対して設定し、前記入力ピクチャ内に前記文字領域がないと判定された場合、前記量子化行列設定部は、低周波数成分から高周波数成分にかけて傾斜を持った係数値で構成される量子化行列を前記複数の直交変換単位のブロックサイズのうち4×4画素のブロックサイズに対して設定してもよい。
 また、前記少なくとも一部の係数値は、DC成分の係数値および前記DC成分に隣接する成分の係数値であってもよい。
 また、前記少なくとも一部の係数値は、DC成分の係数値および前記DC成分の近隣に位置する低周波数成分の係数値であってもよい。
 また、前記入力ピクチャ内に前記文字領域があると判定された場合、前記量子化行列設定部は、低周波数成分から高周波数成分にかけて傾斜を持った係数値で構成される第1量子化行列を前記複数の直交変換単位のブロックサイズのうち4×4画素のブロックサイズに対して設定し、前記入力ピクチャ内に前記文字領域がないと判定された場合、前記量子化行列設定部は、低周波数成分から高周波数成分にかけて前記第1量子化行列よりも急な傾斜を持った係数値で構成される量子化行列を前記複数の直交変換単位のブロックサイズのうち4×4画素のブロックサイズに対して設定してもよい。
 なお、これらの包括的または具体的な態様は、システム、方法、集積回路、コンピュータプログラムまたはコンピュータ読み取り可能なCD-ROMなどの記録媒体で実現されてもよい。また、これらの包括的または具体的な態様は、システム、方法、集積回路、コンピュータプログラムまたは記録媒体の任意な組み合わせで実現されてもよい。
 以下、適宜図面を参照しながら、実施の形態を詳細に説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。
 なお、発明者らは、当業者が本開示を十分に理解するために添付図面および以下の説明を提供するのであって、これらによって請求の範囲に記載の主題を限定することを意図するものではない。
 (実施の形態1)
 以下、実施の形態1について、図面を参照しながら説明する。
 [画像符号化装置の構成および動作]
 図1は、実施の形態1に係る画像符号化装置の構成を示すブロック図である。図1に示される画像符号化装置100は、ピクチャ単位で入力された画像をブロック(処理単位)に分割する。そして、画像符号化装置100は、ブロック単位で符号化処理を行い、符号列を生成する。
 画像符号化装置100は、ピクチャメモリ101と、取得部102と、ピクチャ分割部103と、変換部104(直交変換部104aおよび非直交変換部104b)と、量子化部105と、逆量子化部106と、逆直交変換部107と、逆非直交変換部108とを備える。また、画像符号化装置100は、予測画像生成部109と、符号列生成部110と、判定部111と、量子化行列設定部112とを備える。
 ピクチャメモリ101は、映像信号をピクチャ単位で格納し、ピクチャ分割部103からの読出し命令を受け付けると当該読出し命令に係る画像信号を出力する。ピクチャメモリ101は、具体的には、半導体メモリや強誘電体メモリなどである。なお、映像信号には、静止画の映像信号および動画の映像信号の両方が含まれる。
 取得部102は、ピクチャメモリ101からピクチャを取得する。以下、取得部102が取得したピクチャを入力ピクチャと記載する。
 ピクチャ分割部103は、入力ピクチャを、符号化処理単位であるコーディングユニット(以下、CUと称す)と呼ばれるブロックに分割する。ピクチャ分割部103は、例えば、画像信号を64×64画素のブロックサイズのCUに分割する。なお、CU単位に分割された入力ピクチャを単位画像とも称する。
 さらに、ピクチャ分割部103は、CUを予測画像生成の処理単位であるプレディクションユニット(以下、PUと称す)と呼ばれるブロックに分割する。ピクチャ分割部103は、例えば、CUをさらに8×8画素のPUに分割する。
 また、ピクチャ分割部103は、CUを直交変換の処理単位であるトランスフォームユニット(以下、TUと称す)と呼ばれるブロックに分割する。ピクチャ分割部103は、例えば、画像信号を8×8画素のTUに分割する。
 以降の処理は、処理内容に応じて、CU、PU、およびTUのいずれかのブロック単位で行われる。なお、CUからPU、TUへの分割は、画像符号化装置100の他の構成要素によって行われてもよい。例えば、変換部104が、CUからTUへの分割を行ってもよい。
 差分演算部113は、ピクチャ分割部103から入力されたPU単位の画像信号(処理画像)と、予測画像生成部109から入力されたPU単位の予測画像信号(予測画像)との差分を算出し、差分画像信号(差分画像)を生成する。言い換えれば、差分演算部113は、処理画像と、当該処理画像に対応する予測画像との画素値の差分を示す画像である差分画像を生成する。
 また、差分演算部113は、生成した差分画像信号を直交変換部104aもしくは非直交変換部104bのいずれかに出力する。
 このとき、差分演算部113は、ピクチャ分割部103によって分割されたTUのブロックサイズに基づいて、直交変換部104aおよび非直交変換部104bのうちいずれか一方に出力する。
 TUのブロックサイズが8×8画素、16×16画素、または32×32画素である場合、差分演算部113は、差分画像信号を直交変換部104aに出力する。
 一方、TUのブロックサイズが4×4画素である場合、差分演算部113は、直交変換部104aおよび非直交変換部104bのうちいずれか一方に差分画像信号を出力する。この場合、差分演算部113は、直交変換部104aおよび非直交変換部104bのうち、再構成画像の画質がよりよくなると判断される方に差分画像信号を出力する。再構成画像とは、符号化されたピクチャを復号した画像のことである。
 直交変換部104aは、差分演算部113から入力される差分画像信号をTU単位で直交変換し、残差係数信号(残差係数)を生成する。すなわち、直交変換部104aは、TUごとに差分画像を直交変換した残差係数を生成して出力する第1処理を行う。
 一方、非直交変換部104bは、差分演算部113から入力される差分画像信号を直交変換することなく、差分画像信号をそのまま残差係数信号(残差係数)として生成する。すなわち、非直交変換部104bは、差分画像をそのまま残差係数として出力する第2処理を行う。
 以上説明したように、変換部104は、直交変換部104aおよび非直交変換部104bからなり、ブロックサイズが4×4画素のTUについては、TUごとに第1処理と第2処理とを選択的に実行する。
 ここで、直交変換部104aおよび非直交変換部104bのそれぞれが行う処理について説明する。図2は、直交変換部104aおよび非直交変換部104bのそれぞれが行う処理を説明するための模式図である。なお、図2ではTUのブロックサイズは、4×4画素である。
 図2の(a)は、直交変換部104aが生成する残差係数を示す。直交変換部104aは、差分画像を直交変換し、図2の(a)に示される残差係数を生成する。生成される残差係数における各々の係数値は、周波数成分ごとの信号の大きさを示すものであり、左上が低周波数成分の係数、右下が高周波数成分の係数となっている。図2の(a)に示される残差係数では、直交変換を行ったことにより大きな信号が左上の低周波数成分に集中している。
 図2の(b)は、非直交変換部104bが直交変換せずにそのまま残差画像を出力した場合の残差係数を示す。図2の(b)における残差係数における各々の係数値は、差分画像の対応する画素位置の画素値そのものであり、信号の変換は行われていない。
 量子化部105は、直交変換部104aまたは非直交変換部104bから出力される残差係数信号をTU単位で量子化する。量子化部105は、具体的には、設定された量子化値と量子化行列とを用いて、残差係数信号をTU単位で量子化し、量子化残差係数信号(量子化残差係数)を生成する。
 ここで、量子化値は、CU単位で設定される。一方、量子化行列は、ピクチャ単位で量子化行列設定部112によって設定される。つまり、量子化部105は、量子化行列設定部112から量子化行列を取得する。
 以下、量子化部105の処理の具体例について図2を用いて説明する。量子化部105は、図2の(a)に示される残差係数を量子化することにより、図2の(c)に示される量子化残差係数を生成する。
 また、量子化部105は、図2の(b)に示される残差係数を量子化することにより、図2の(d)に示される量子化残差係数を生成する。
 逆量子化部106は、量子化部105から入力される量子化残差係数信号をTU単位で逆量子化し、再構成残差係数信号(再構成残差係数)を生成する。そして、逆量子化部106は、生成した再構成残差係数を、逆直交変換部107および逆非直交変換部108のいずれかに出力する。
 逆量子化部106は、逆量子化の対象となる量子化残差係数信号が、直交変換部104aの第1処理によって生成されたものである場合、生成した再構成残差係数を逆直交変換部107に出力する。一方、逆量子化部106は、逆量子化の対象となる量子化残差係数信号が、非直交変換部104bの第2処理によって生成されたものである場合、生成した再構成残差係数を逆非直交変換部108に出力する。
 ここで、逆量子化部106の逆量子化の具体例について説明する。図3は、逆量子化部106の逆量子化と、逆直交変換部107および逆非直交変換部108の変換処理とを説明するための模式図である。
 逆量子化部106は、図3の(c)に示される量子化残差係数を逆量子化することにより、図3の(e)に示される再構成残差係数を生成する。一方、逆量子化部106は、図3の(d)に示される量子化残差係数を逆量子化することにより、図3の(f)に示される再構成残差係数を生成する。
 逆直交変換部107は、逆量子化部106から入力される再構成残差係数信号をTU単位で逆直交変換し、再構成差分画像信号(再構成差分画像)を生成する。
 具体的には、逆直交変換部107は、上述の図3の(e)に示される再構成残差係数を逆直交変換し、図3の(g)に示される再構成差分画像を生成する。
 一方、逆非直交変換部108は、逆量子化部106から入力される再構成残差係数信号に対してTU単位で逆直交変換を行わず、再構成残差係数信号をそのまま再構成差分画像として生成する。
 具体的には、逆直交変換部107は、上述の図3の(f)に示される再構成残差係数を逆直交変換せずに、この再構成残差係数を図3の(h)に示される再構成差分画像として出力する。
 加算演算部114は、逆直交変換部107または逆非直交変換部108から入力される再構成差分画像信号と、予測画像生成部109から入力される予測画像信号とをPU単位で加算することにより再構成画像信号(再構成画像)を生成する。
 予測画像生成部109は、ピクチャ分割部103から入力されたPU単位の画像信号を基に、加算演算部114から入力される再構成画像信号を用いてPU単位で画面内予測または画面間予測を行って予測画像を生成する。
 画面間予測を用いる場合、予測画像生成部109は、既に符号化済みの過去のピクチャの再構成画像信号を用いる。
 一方、画面内予測を用いる場合、予測画像生成部109は、符号化対象のPUに隣接する既に符号化済みの同じピクチャの再構成画像信号を用いる。なお、画像符号化装置100に入力される映像信号が1枚のピクチャのみから構成される静止画の映像信号である場合は、過去のピクチャが存在しないため、画面内予測が用いられる。
 符号列生成部110は、量子化部105から入力された量子化残差係数信号、量子化行列設定部112から入力された量子化行列信号、および、その他の復号化処理時に必要となる符号化情報信号に対して、可変長符号化および算術符号化を行うことで符号列を生成する。つまり、符号列生成部110は、量子化部105が量子化した残差係数が符号化された符号列であって、量子化行列設定部112が設定した量子化行列がヘッダ領域に記述された符号列を生成する。
 [判定部および量子化行列設定部]
 ここで、画像符号化装置100の特徴的な構成である、判定部111および量子化行列設定部112について、図4のフローチャートを用いて具体的に説明する。図4は、画像符号化装置100の量子化行列の設定処理のフローチャートである。
 まず、判定部111は、画像符号化装置100を動作させる際に外部から入力される外部信号に基づいて、入力ピクチャに文字や線画を含む領域である文字領域があるか否かを判定する(S401)。外部信号は、入力ピクチャに文字領域があるか否かを示す信号である。
 外部信号は、入力インターフェースを通じてユーザによって画像符号化装置100(判定部111)に入力されてもよい。外部信号は、例えば、ユーザが文字領域を有するピクチャを符号化したい場合などに、ユーザによって直接入力されてもよい。
 また、外部信号は、入力ピクチャが新聞や雑誌などの出版物の紙面である場合に自動的に画像符号化装置100(判定部111)に設定されてもよい。
 量子化行列設定部112は、変換部104が第1処理を実行するか第2処理を実行するかに関係なく、入力ピクチャごとに量子化行列を設定する。
 具体的には、ステップS401において、入力ピクチャに文字領域がないと判定された場合(S401でNo)、量子化行列設定部112は、4×4画素のTUに対応する量子化行列を生成および設定する。このとき、量子化行列設定部112が生成する量子化行列は、低周波数領域から高周波数領域にかけて傾斜を有する量子化行列である(S402)。
 一方、ステップS401において、入力ピクチャに文字領域があると判定された場合(S401でYes)、量子化行列設定部112は、4×4画素のTUに対応する量子化行列を生成および設定する。このとき、量子化行列設定部112が生成する量子化行列は、低周波数領域から高周波数領域にかけて傾斜を持たない量子化行列である(S403)。
 以上のように、量子化行列設定部112は、複数のブロックサイズのTUのうちブロックサイズが4×4画素のTUに対応する量子化行列として、入力ピクチャ内に文字領域があると判定されたか否かに応じて異なる量子化行列を設定する。
 さらに、量子化行列設定部112は、ブロックサイズが4×4画素以外の大きさのTU(例えば、ブロックサイズが8×8画素、16×16画素、32×32画素のTU)の各々に対応する複数の量子化行列を生成および設定する。このとき、量子化行列設定部112が生成および設定する量子化行列のそれぞれは、低周波数領域から高周波数領域にかけて傾斜を有する量子化行列である(S404)。
 このように、量子化行列設定部112は、複数のTUのうち4×4画素のTU以外のTUには、入力ピクチャ内に文字領域があると判定されたか否かに関係なく量子化行列を設定する。
 以上をまとめると、4×4画素のTUの量子化に利用される量子化行列は、判定部111の判定結果に応じて係数値が変化する。一方、ブロックサイズが4×4画素のTU以外の大きさのTUの量子化に利用される量子化行列は、判定部111の判定結果に依存せずに設定される。
 量子化行列設定部112は、設定した量子化行列を量子化部105に出力する。そして、量子化部105は、TU単位の残差係数信号を量子化する際に、当該TUに設定された量子化行列を使用する。
 また、量子化行列設定部112は、設定した量子化行列を符号列生成部110に出力する。そして、符号列生成部110は、この量子化行列に関する情報がヘッダ領域に記述(記載)された符号列を生成する。
 図5は、符号列生成部110によって生成される符号列の一例を示す図である。
 図5に示される符号列においては、符号列のヘッダ領域の一部であるPicture Parameter Set(PPS)の中に、4×4画素のTUに対応する量子化行列(4×4QM)から、32×32画素のTUに対応する量子化行列(32×32QM)までの4種類の量子化行列(量子化行列の係数値)が記載されている。
 なお、図5の例ではPPSに量子化行列が記載されているが、Sequence Parameter Set(SPS)に量子化行列が記載されてもよく、PPSとSPSの両方に量子化行列が記載されてもよい。
 また、図5の例では、4×4QMから32×32QMまでの4種類の量子化行列全てが記載されているが、少なくとも入力ピクチャの量子化に使用されるTUに対応した量子化行列が記載されればよい。
 [4×4画素のTU用の量子化行列]
 図4で説明したように、4×4画素のTUに設定される量子化行列は、低周波数領域(低周波数成分)から高周波数領域(高周波数成分)にかけて傾斜を有するものと、傾斜を持たないものとの2種類ある。以下、4×4画素のTU用の量子化行列について図面を参照しながら説明する。
 図6は、4×4画素のTU用の量子化行列の具体例を説明するための図である。
 なお、量子化行列では、係数値が小さいほど細かく量子化を行うことを意味する。また、量子化行列の最も左上の係数値は、DC(Direct Current)成分である。すなわち量子化行列の左上は低周波数成分に対応する係数値であり、量子化行列の右下は、高周波数成分に対応する係数値である。
 図6の(a)は、図4のステップS402において設定される傾斜を持つ量子化行列の一例である。図6の(a)に示される量子化行列では、最も左上に位置するDC成分の係数値が8、最も右下に位置する係数値が48となっており、低周波数成分である左上から高周波数成分である右下にかけて係数値に傾斜がある。
 図6の(a)に示されるような量子化行列は、量子化部105に入力される残差係数信号が直交変換されたものであることを前提とするものである。したがって、量子化部105に入力される残差係数信号が直交変換部104aから入力されたものである場合に、図6の(a)のような傾斜を有する量子化行列が用いられれば、効率のよい量子化が可能となる。
 具体的には、人が認識し易い(人が画質の劣化に気付き易い)低周波数成分は、小さな量子化幅(細かい精度)で量子化され、低周波数成分についての発生符号量は大きくなるが情報の精度は高くなる。逆に、人が認識し難い(人が画質の劣化に気付き難い)高周波数成分は大きな量子化幅(粗い精度)で量子化され、高周波数成分についての情報の精度は低くなるが発生符号量は小さくなる。その結果、両者のバランスが取れることで効率の良い量子化を行うことができる。
 一方、量子化部105に入力される残差係数信号が非直交変換部104bから入力されたものである場合に、図6の(a)のような傾斜を有する量子化行列が用いられれば、画質の悪化が発生してしまう。なぜなら、周波数成分とは無関係に、符号化対象のTUの左上の画素位置における画素は細かい精度で量子化され、符号化対象のTUの右下の画素位置における画素は粗い精度で量子化されることになるからである。つまり、TU内の画素位置によって画質の良し悪しが異なる主観的に違和感のある再構成画像が生成されてしまう。
 図6の(b)は、ステップS403において生成される傾斜を持たない量子化行列の一例である。図6の(b)に示される量子化行列では、DC成分から右下に位置する高周波数成分の係数値まで、全ての係数値が16となっており、左上から右下にかけて係数値に傾斜がないことが分かる。
 量子化部105に入力される残差係数信号が直交変換部104aから入力されたものである場合に、図6の(b)のような傾斜を有しない量子化行列が用いられれば、人が認識し易い(人が画質の劣化に気付き易い)低周波数成分も、人が認識し難い(人が画質の劣化に気付き難い)高周波数成分も、同じ量子化幅で量子化される。その結果、人の視覚特性に即した量子化が行われず効率の悪い量子化が行われることになる。
 一方、量子化部105に入力される残差係数信号が非直交変換部104bから入力されたものである場合に、図6の(b)のような傾斜を有しない量子化行列が用いられれば、画質が均一化される。なぜなら、周波数成分とは無関係に、符号化対象のTUの左上の画素位置における画素も、符号化対象のTUの右下の画素位置における画素も、同じ量子化幅で量子化が行われるからである。つまり、TU内の画素位置によって画質の良し悪しが均一な主観的に違和感が少ない再構成画像が生成される。
 [文字領域を含む画像の符号化における効果]
 一般的に、文字や線画のように隣接する画素の画素値が極端に変化するような画像(ピクチャ)に対しては、小さなブロックサイズのTUを用いた方が符号化ノイズを抑制しやすい。また、このような画像は、直交変換部104aを用いた直交変換を行っても、周波数成分が想定どおりに偏らないため、非直交変換部104bを用いた直交変換を行わない処理が効果的に働く場合が多い。
 したがって、文字や線画を含む画像の量子化においては、図6の(b)に示されるような傾斜を持たない量子化行列を使用したほうが、符号化効率が高くなる傾向がある。逆に、文字や線画を含む画像の量子化において、図6の(a)に示されるような傾斜を持つ量子化行列を使用してしまうと主観的に違和感のある画像となってしまう可能性が高くなる。
 一方、自然画像のように隣接する画素の画素値が連続的に変化するような画像(ピクチャ)に対しては、大きなブロックサイズのTUを用いた方が発生符号量を削減しやすい。また、このような画像は、直交変換部104aを用いた直交変換を行う処理が効果的に働く場合が多い。
 したがって、自然画像の量子化においては、図6の(a)に示されるような傾斜を持つ量子化行列を使用すると、符号化効率が高くなる傾向がある。逆に、自然画像の量子化において、図6の(b)に示されるような傾斜を持たない量子化行列を使用すると、主観的には大きな違和感は発生しないが符号化効率が低下してしまう可能性が高くなる。
 ここで、上述のように、画像の文字領域の符号化においては、HEVCで規定されるTUの中では最もブロックサイズの小さい4×4画素のTUを選択し、直交変換を行わずに量子化することが好ましい場合が多くなる。つまり、文字領域を含む入力ピクチャの符号化においては、4×4画素のTUが選択された場合に、直交変換の有無が切り替えられることが想定される。
 しかしながら、HEVCでは、入力ピクチャごとに4×4画素のTUに設定する量子化行列を変更することは可能であるが、直交変換の有無に連動して4×4画素のTUに設定する量子化行列を変更することはできない。
 そこで、実施の形態1では、文字領域を含む入力ピクチャの符号化においては、4×4画素のTUが選択された場合に直交変換の有無が切り替えられることを想定し、4×4画素のTUには、入力ピクチャに文字領域が含まれるか否かに応じて異なる量子化行列を設定する。具体的には、量子化行列設定部112は、入力ピクチャに文字領域が含まれる場合、図6の(b)に示されるような傾斜を持たない量子化行列を4×4画素のTUに設定する。
 これにより、入力ピクチャ内の文字領域の符号化においては、高い符号化効率を得ることが可能となる。一方、入力ピクチャ内の自然画像の領域の符号化では4×4画素のTUを使用する頻度が低いため、図6の(b)に示されるような量子化行列が用いられることによる符号化効率の低下は限定的である。
 また、実施の形態1では、入力ピクチャに文字領域が含まれない場合は、量子化行列設定部112は、図6の(a)に示されるような低周波数領域から高周波数領域にかけて傾斜を持つ量子化行列を4×4画素のTUに設定する。これにより、入力ピクチャに文字領域が含まれない場合には、従来と同様の高い符号化効率を得ることが可能となる。
 [量子化行列の別の例]
 上記実施の形態1では、4×4画素のTUに設定される量子化行列は、図6の(a)および(b)にそれぞれ示される2つの量子化行列のいずれかであるとした。しかしながら、図6の(a)および(b)にそれぞれ示される量子化行列は一例であり、図6に記載された係数値とは異なる係数値で構成される量子化行列が設定されてもよい。
 例えば、傾斜を持たない量子化行列に代えて、少なくとも一部に傾斜を有する量子化行列が設定されてもよい。図6の(c)に示される量子化行列は、一部に傾斜を有する量子化行列の一例である。
 図6の(c)に示される量子化行列は、DC成分の係数値およびDC成分に隣接する成分の係数値のみ低周波数成分から高周波数成分にかけて傾斜を有している。DC成分の係数値およびDC成分に隣接する成分以外の係数値は全て同じ値である。具体的には、DC成分の係数値は8であり、およびDC成分に隣接する成分の係数値は、8よりも大きく16よりも小さな値である。DC成分の係数値およびDC成分に隣接する成分以外の係数値は、全て16である。
 4×4画素のTUに図6の(c)に示される量子化行列が設定された場合、量子化部105に入力される残差係数信号が直交変換部104aから入力されたものであるときは、低周波数成分の周辺の成分のみ小さな量子化幅(細かい精度)で量子化が行われる。これに対し、低周波数成分の周辺以外の成分は中間的な量子化幅で量子化が行われる。図6の(a)に示される傾斜を持った量子化行列が設定された場合のように高周波数成分の発生符号量を小さくする効果はないが、低周波数成分の周辺の情報の精度を高くする効果を得ることができる。
 一方、4×4画素のTUに図6の(c)に示される量子化行列が設定された場合、量子化部105に入力される残差係数信号が非直交変換部104bから入力されたものであるときは、符号化対象のTUの左上の画素位置とその周辺における画素は小さい量子化幅で量子化される。また、これら以外の画素は中間的な量子化幅で量子化が行われることになる。傾斜を持たない量子化行列が設定された場合のように全画素の画質を均一にすることはできないが、TU内の一部分の画素位置のみ極端に画質が悪くなるという現象は発生しないため主観的に違和感のない画像を得ることができる。
 なお、図6の(c)に示される量子化行列は、DC成分の係数値およびDC成分に隣接する成分の係数値のみ低周波数成分から高周波数成分にかけて傾斜を有していたが、DC成分に隣接していなくてもDC成分の近隣の成分の係数値のみ低周波数成分から高周波数成分にかけて傾斜を有するように設定してもよい。なお、「DC成分の近隣の成分」とは、例えば、最も周波数の高い成分よりもDC成分(最も周波数の低い成分)の近くに位置する成分を意味する。
 また、例えば、傾斜を持たない量子化行列に代えて、緩い傾斜を有する量子化行列が設定されてもよい。図6の(d)に示される量子化行列は、緩い傾斜を有する量子化行列の一例である。
 図6の(d)に示される量子化行列が有する傾斜は、図6の(a)に示される量子化行列が有する傾斜よりも緩い。言い換えれば、図6の(a)に示される量子化行列が有する傾斜は、図6の(d)に示される量子化行列が有する傾斜よりも急である。
 具体的には、図6の(d)に示される量子化行列は、DC成分の係数値が8、右下に位置する高周波数成分の係数値が28となっており、左上から右下にかけて係数値にやや傾斜がある。しかしながら、図6の(d)に示される量子化行列は、図6(a)に示される量子化行列と比較すると傾斜が半分以下であり、ほとんど傾斜を持たない量子化行列である。
 4×4画素のTUに図6の(d)に示される量子化行列が設定された場合、量子化部105に入力される残差係数信号が直交変換部104aから入力されたものであるときは、低周波数成分の情報の精度を高めながら、高周波数成分の発生符号量を小さくする効果を得ることができる。しかしながら、図6の(a)に示される量子化行列が設定された場合に比べると、上記効果は、小さくなる。
 一方、4×4画素のTUに図6の(d)に示される量子化行列が設定された場合、量子化部105に入力される残差係数信号が非直交変換部104bから入力されたものであるときは、符号化対象のTUの左上に位置する画素は細かい精度で量子化される。また、符号化対象のTUの右下に位置する画素はやや粗い精度で量子化される。しかしながら、図6の(a)に示される量子化行列が設定された場合に比べるとブロック内の画素位置による画質差を低減できるため、主観的に違和感のない画像を得ることができる。
 (実施の形態2)
 以下、実施の形態2について、図面を参照しながら説明する。
 [画像符号化装置の構成および動作]
 図7は、実施の形態2に係る画像符号化装置100aの構成を示すブロック図である。画像符号化装置100aは、ピクチャ単位で入力された画像をブロック(処理単位)に分割し、ブロック単位で符号化処理を行い、符号列を生成する。
 画像符号化装置100aと、画像符号化装置100との違いは、画像符号化装置100aの判定部111aが、ピクチャメモリ101から入力された画像信号を用いて処理を行っている点のみである。画像符号化装置100aの判定部111a以外の構成要素については、画像符号化装置100と同様であるのでここでは説明を省略する。
 [判定部および量子化行列設定部]
 画像符号化装置100aの特徴的な構成である、判定部111aおよび量子化行列設定部112について、図8のフローチャートを用いて具体的に説明する。図8は、画像符号化装置100aの量子化行列の設定処理のフローチャートである。
 まず、判定部111aは、ピクチャメモリ101から入力された符号化対象のピクチャの画像信号から画像特徴量を算出して文字領域を抽出する(S801)。なお、判定部111aは、取得部102が取得した入力ピクチャの画像信号から画像特徴量を算出して文字領域を抽出してもよい。
 画像特徴量の算出には、OCR(Optical Character Recognition)など、どのような方法が用いられてもよい。例えば、判定部111aは、画素値が特定の2値に集中しているかどうかを表す情報を画像特徴量とし、算出された画像特徴量が特定の閾値以上の領域を文字領域として抽出する。
 次に、判定部111aは、ステップS801における抽出結果に従って、入力ピクチャに文字領域があるか否かを判定する(S802)。入力ピクチャに文字領域がない場合は(S802でNo)、量子化行列設定部112は、ステップS402の処理を実行する(S402)。入力ピクチャに文字領域がある場合は(S802でYes)、量子化行列設定部112は、ステップS403の処理を実行する(S403)。
 ステップS402、S403、およびS404の各々における量子化行列設定部112の処理については、実施の形態1で説明したものと同様である。また、画像符号化装置が生成する符号列についても、実施の形態1で説明したものと同様である。
 実施の形態2では、画像符号化装置100aは、符号化対象のピクチャ(入力ピクチャ)を用いて符号化対象のピクチャ内に文字領域があるかどうかを判定する。すなわち、画像符号化装置100aでは、実施の形態1で説明した外部信号が必要ないため、ユーザは符号化対象のピクチャがどのようなコンテンツであるかを意識せずに符号化処理を実施することが可能となる。
 (その他の実施の形態)
 以上のように、本開示における実装の例示として、実施の形態1を説明した。しかしながら、本開示は、これに限定されず、適宜、変更、置き換え、付加、省略などを行った実施の形態にも適用可能である。また、上記実施の形態1で説明した各構成要素を組み合わせて、新たな実施の形態とすることも可能である。
 上記実施の形態では、変換部104は、第1処理(直交変換部104aによる変換処理)と第2処理(非直交変換部104bによる変換処理)とを選択的に実行したが、変換部104の第1処理と第2処理との切り替えについては様々な方法が考えられる。例えば、変換部104は、各TUに対して第1処理を行い、第1処理の結果、周波数成分の偏りが小さいTUについてはさらに第2処理を行ってもよい。
 また、実施の形態2のような構成であれば、変換部104は、文字領域を含むTUには、第1処理と第2処理とを選択的に実行し、文字領域を含まないTUには、常に第1処理のみを行ってもよい。
 また、上記実施の形態では、量子化行列設定部112は、各ブロックサイズのTUに対応する量子化行列を生成した。しかしながら、量子化行列は、画像符号化装置100(100a)の内部または外部に設けられた記憶部に予め記憶されていてもよい。この場合、量子化行列設定部112は、記憶部から読み出した量子化行列を各TUに設定する。
 また、上記実施の形態では、TUのブロックサイズは、PUのブロックサイズと等しいものとして説明したが、TUのブロックサイズは、PUのブロックサイズよりも小さくてもよい。すなわち、PU単位の差分画像をさらに分割したTU単位で量子化が行われてもよい。また、TUのブロックサイズは、PUのブロックサイズよりも大きくてもよい。すなわち、PU単位の差分画像を統合したTU単位で量子化が行われてもよい。
 なお、上記実施の形態において、各構成要素は、専用のハードウェアで構成されるか、各構成要素に適したソフトウェアプログラムを実行することによって実現されてもよい。各構成要素は、CPUまたはプロセッサなどのプログラム実行部が、ハードディスクまたは半導体メモリなどの記録媒体に記録されたソフトウェアプログラムを読み出して実行することによって実現されてもよい。
 なお、上記実施の形態では、所定の符号化規格の一例であるHEVCにしたがって符号化処理を行う画像符号化装置100(100a)について説明した。しかしながら、本開示は、HEVCとは異なる符号化規格であって、HEVCに類似する符号化規格にしたがって符号化処理を行う画像符号化装置(画像符号化方法)として実現されてもよい。
 また、上記実施の形態で示した画像符号化装置に含まれる各手段と同等の機能を備えるプログラムを、フレキシブルディスク等の記録媒体に記録するようにすることにより、上記実施の形態で示した処理を、独立したコンピュータシステムにおいて簡単に実施することが可能となる。なお、記録媒体としてはフレキシブルディスクに限らず、光ディスク、ICカード、ROMカセット等、プログラムを記録できるものであれば同様に実施することができる。
 また、上記実施の形態で示した画像符号化装置に含まれる各手段と同等の機能を集積回路であるLSIとして実現してもよい。これらは一部または全てを含むように1チップ化されてもよい。またLSIは集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと称されることもある。
 また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現しても良い。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
 さらには、半導体技術の進歩または派生する別技術によりLSIなどに置き換わる集積回路の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。
 また、上記実施の形態に係る、画像符号化装置、またはその変形例の機能のうち少なくとも一部を組み合わせてもよい。
 なお、上記実施の形態は、いずれも包括的または具体的な例を示すものであり、上記実施の形態で示される数値、構成要素、構成要素の接続形態、ステップ、ステップの順序などは、一例である。
 以上のように、本開示における技術の例示として、実施の形態を説明した。そのために、添付図面および詳細な説明を提供した。
 したがって、添付図面および詳細な説明に記載された構成要素の中には、課題解決のために必須な構成要素だけでなく、上記技術を例示するために、課題解決のためには必須でない構成要素も含まれ得る。そのため、それらの必須ではない構成要素が添付図面や詳細な説明に記載されていることをもって、直ちに、それらの必須ではない構成要素が必須であるとの認定をするべきではない。
 また、上述の実施の形態は、本開示における技術を例示するためのものであるから、請求の範囲またはその均等の範囲において種々の変更、置き換え、付加、省略などを行うことができる。
 本開示は、例えば、新聞や雑誌等の紙面の静止画の画像データに符号化処理を行い、静止画像符号列として出力する画像符号化装置として有用である。また、本開示は、文字や図が多重化された動画像の画像データに符号化処理を行い、動画像符号列として出力する画像符号化装置として有用である。
 100、100a 画像符号化装置
 101 ピクチャメモリ
 102 取得部
 103 ピクチャ分割部
 104 変換部
 104a 直交変換部
 104b 非直交変換部
 105 量子化部
 106 逆量子化部
 107 逆直交変換部
 108 逆非直交変換部
 109 予測画像生成部
 110 符号列生成部
 111、111a 判定部
 112 量子化行列設定部
 113 差分演算部
 114 加算演算部

Claims (9)

  1.  ピクチャを所定の符号化規格にて符号化する画像符号化装置であって、
     ピクチャを取得する取得部と、
     前記取得部が取得したピクチャである入力ピクチャ内に文字または線画を含む領域である文字領域があるか否かを判定する判定部と、
     前記入力ピクチャごとに、互いにサイズの異なる複数の直交変換単位のブロックサイズのそれぞれに対して量子化行列を設定する量子化行列設定部と、
     前記入力ピクチャを分割した画像である単位画像を生成するピクチャ分割部と、
     前記単位画像に対応する予測画像を生成する予測画像生成部と、
     前記単位画像と、当該単位画像に対応する予測画像との画素値の差分を示す画像である差分画像を生成する差分演算部と、
     前記差分画像をさらに少なくとも1つ以上の前記直交変換単位に分割し、ブロックサイズが4×4画素である前記直交変換単位については、前記直交変換単位ごとに(1)前記差分画像を直交変換した残差係数を生成して出力する第1処理と、(2)前記差分画像をそのまま残差係数として出力する第2処理と、を選択的に実行する変換部と、
     前記変換部が出力する残差係数を、前記複数の直交変換単位のブロックサイズのそれぞれに対して設定された量子化行列を用いて量子化する量子化部と、
     前記量子化部が量子化した残差係数が符号化された符号列であって、前記量子化行列設定部が設定した量子化行列がヘッダ領域に記述された符号列を生成する符号列生成部とを備え、
     前記量子化行列設定部は、前記複数の直交変換単位のブロックサイズのうち4×4画素のブロックサイズに対しては、前記入力ピクチャ内に前記文字領域があると判定されたか否かに応じて異なる量子化行列を設定する
     画像符号化装置。
  2.  前記量子化行列設定部は、前記複数の直交変換単位のブロックサイズのうち4×4画素以外のブロックサイズに対しては、前記入力ピクチャ内に前記文字領域があると判定されたか否かに関係なく同じ量子化行列を設定する
     請求項1に記載の画像符号化装置。
  3.  前記量子化部は、前記第1処理および前記第2処理のいずれの処理が行われたかに関係なく、ブロックサイズが4×4画素である前記直交変換単位を同じ量子化行列を用いて量子化する
     請求項1または2に記載の画像符号化装置。
  4.  前記入力ピクチャ内に前記文字領域があると判定された場合、前記量子化行列設定部は、全ての係数値が同じ値である量子化行列を前記複数の直交変換単位のブロックサイズのうち4×4画素のブロックサイズに対して設定し、
     前記入力ピクチャ内に前記文字領域がないと判定された場合、前記量子化行列設定部は、低周波数成分から高周波数成分にかけて傾斜を持った係数値で構成される量子化行列を前記複数の直交変換単位のブロックサイズのうち4×4画素のブロックサイズに対して設定する
     請求項1~3のいずれか1項に記載の画像符号化装置。
  5.  前記入力ピクチャ内に前記文字領域があると判定された場合、前記量子化行列設定部は、少なくとも一部の係数値が低周波数成分から高周波数成分にかけて傾斜を有し、前記少なくとも一部の係数値以外の全ての係数値が同じ値である量子化行列を前記複数の直交変換単位のブロックサイズのうち4×4画素のブロックサイズに対して設定し、
     前記入力ピクチャ内に前記文字領域がないと判定された場合、前記量子化行列設定部は、低周波数成分から高周波数成分にかけて傾斜を持った係数値で構成される量子化行列を前記複数の直交変換単位のブロックサイズのうち4×4画素のブロックサイズに対して設定する
     請求項1~3のいずれか1項に記載の画像符号化装置。
  6.  前記少なくとも一部の係数値は、DC成分の係数値および前記DC成分に隣接する成分の係数値である
     請求項5に記載の画像符号化装置。
  7.  前記少なくとも一部の係数値は、DC成分の係数値および前記DC成分の近隣に位置する低周波数成分の係数値である
     請求項5に記載の画像符号化装置。
  8.  前記入力ピクチャ内に前記文字領域があると判定された場合、前記量子化行列設定部は、低周波数成分から高周波数成分にかけて傾斜を持った係数値で構成される第1量子化行列を前記複数の直交変換単位のブロックサイズのうち4×4画素のブロックサイズに対して設定し、
     前記入力ピクチャ内に前記文字領域がないと判定された場合、前記量子化行列設定部は、低周波数成分から高周波数成分にかけて前記第1量子化行列よりも急な傾斜を持った係数値で構成される量子化行列を前記複数の直交変換単位のブロックサイズのうち4×4画素のブロックサイズに対して設定する
     請求項1~3のいずれか1項に記載の画像符号化装置。
  9.  ピクチャを所定の符号化規格にて符号化する画像符号化方法であって、
     ピクチャを取得する取得ステップと、
     前記取得ステップにおいて取得したピクチャである入力ピクチャ内に文字または線画を含む領域である文字領域があるか否かを判定する判定ステップと、
     前記入力ピクチャごとに、互いにサイズの異なる複数の直交変換単位のブロックサイズのそれぞれに対して量子化行列を設定する量子化行列設定ステップと、
     前記入力ピクチャを分割した画像である単位画像を生成するピクチャ分割ステップと、
     前記単位画像に対応する予測画像を生成する予測画像生成ステップと、
     前記単位画像と、当該単位画像に対応する予測画像との画素値の差分を示す画像である差分画像を生成する差分演算ステップと、
     前記差分画像をさらに少なくとも1つ以上の前記直交変換単位に分割し、ブロックサイズが4×4画素である前記直交変換単位については、前記直交変換単位ごとに(1)前記差分画像を直交変換した残差係数を生成して出力する第1処理と、(2)前記差分画像をそのまま残差係数として出力する第2処理と、を選択的に実行する変換ステップと、
     前記変換ステップにおいて出力する残差係数を、前記複数の直交変換単位のブロックサイズのそれぞれに対して設定された量子化行列を用いて量子化する量子化ステップと、
     前記量子化ステップにおいて量子化した残差係数が符号化された符号列であって、前記量子化行列設定ステップにおいて設定した量子化行列がヘッダ領域に記述された符号列を生成する符号列生成ステップとを含み、
     前記量子化行列設定ステップにおいては、前記複数の直交変換単位のブロックサイズのうち4×4画素のブロックサイズに対しては、前記入力ピクチャ内に前記文字領域があると判定されたか否かに応じて異なる量子化行列を設定する
     画像符号化方法。
PCT/JP2013/006101 2013-03-22 2013-10-11 画像符号化装置および画像符号化方法 WO2014147679A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2013059529A JP2016105528A (ja) 2013-03-22 2013-03-22 画像符号化装置および画像符号化方法
JP2013-059529 2013-03-22

Publications (1)

Publication Number Publication Date
WO2014147679A1 true WO2014147679A1 (ja) 2014-09-25

Family

ID=51579421

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2013/006101 WO2014147679A1 (ja) 2013-03-22 2013-10-11 画像符号化装置および画像符号化方法

Country Status (2)

Country Link
JP (1) JP2016105528A (ja)
WO (1) WO2014147679A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3088026C (en) * 2017-12-15 2023-10-03 Lg Electronics Inc. Image coding method on basis of transformation and device therefor

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07184158A (ja) * 1991-01-23 1995-07-21 Ricoh Co Ltd デジタル電子スチルカメラ
JP2003046789A (ja) * 2001-08-02 2003-02-14 Canon Inc 画像符号化装置及び画像復号化装置
JP2003143414A (ja) * 2001-11-05 2003-05-16 Canon Inc 画像処理装置および画像処理方法
JP2009522968A (ja) * 2006-01-09 2009-06-11 マティアス・ナロシュケ ハイブリッドなビデオ符号化における予測誤差の適応符号化

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07184158A (ja) * 1991-01-23 1995-07-21 Ricoh Co Ltd デジタル電子スチルカメラ
JP2003046789A (ja) * 2001-08-02 2003-02-14 Canon Inc 画像符号化装置及び画像復号化装置
JP2003143414A (ja) * 2001-11-05 2003-05-16 Canon Inc 画像処理装置および画像処理方法
JP2009522968A (ja) * 2006-01-09 2009-06-11 マティアス・ナロシュケ ハイブリッドなビデオ符号化における予測誤差の適応符号化

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
DAVID FLYNN ET AL.: "Transform Skipping in the presence of Scaling Lists", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG 16 WP3 AND ISO/IEC JTC1/SC29/WGLL 10TH MEETING, 11 July 2012 (2012-07-11) - 20 July 2012 (2012-07-20), STOCKHOLM, SE *
YOSHITAKA MORIGAMI ET AL.: "On Transform Skip", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 10TH MEETING, 11 July 2012 (2012-07-11) - 20 July 2012 (2012-07-20), STOCKHOLM, SE *

Also Published As

Publication number Publication date
JP2016105528A (ja) 2016-06-09

Similar Documents

Publication Publication Date Title
US8885706B2 (en) Apparatus and methodology for a video codec system with noise reduction capability
JP5957559B2 (ja) 大きいサイズの変換単位を用いた映像符号化、復号化方法及び装置
TWI431948B (zh) 轉換區塊之效率編碼和解碼
JP6351040B2 (ja) 層状の信号品質階層のおける信号処理およびインヘリタンスの方法、プログラム、及び、コンピュータシステム
KR101266577B1 (ko) 화상 처리 방법 및 장치
JP6245888B2 (ja) エンコーダおよび符号化方法
JP2005333622A (ja) イメージおよびビデオの予測可逆符号化
JP2016226001A (ja) デコーダおよび復号方法
JP2009518992A (ja) ビデオ信号をグループ別にエンコーディングおよびデコーディングする方法および装置
JP2016532341A (ja) データ符号化及び復号化
TW201415418A (zh) 使用誤差平面編碼的數據壓縮方法及裝置
JP2015181225A (ja) 動画像符号化装置および動画像符号化方法
KR20230107627A (ko) 후처리 제어를 이용한 비디오 디코딩
KR102113904B1 (ko) 보간을 이용한 연산 방법, 인코더, 및 디코더
KR101703330B1 (ko) 이미지 재부호화 방법 및 그 장치
JP2008271039A (ja) 画像符号化装置及び画像復号化装置
WO2014147679A1 (ja) 画像符号化装置および画像符号化方法
JPWO2006038679A1 (ja) 動画像符号化の装置、方法及びプログラムと、動画像復号の装置方法及びプログラム
JP7064644B2 (ja) 動画像符号化装置
JP5593468B1 (ja) 画像符号化装置及び画像符号化方法
CN111108747B (zh) 获得信号的时间样本的目标表示
JP2017073598A (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
JP2006005478A (ja) 画像符号化装置及び画像復号装置
JP3676651B2 (ja) 段階的可逆画像信号符号化方法,復号方法,符号化装置,復号装置,およびその符号化,復号プログラムの記録媒体
JP2022548685A (ja) 画像データの符号化及び復号化

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13878685

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 13878685

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP