JP2016105528A - 画像符号化装置および画像符号化方法 - Google Patents

画像符号化装置および画像符号化方法 Download PDF

Info

Publication number
JP2016105528A
JP2016105528A JP2013059529A JP2013059529A JP2016105528A JP 2016105528 A JP2016105528 A JP 2016105528A JP 2013059529 A JP2013059529 A JP 2013059529A JP 2013059529 A JP2013059529 A JP 2013059529A JP 2016105528 A JP2016105528 A JP 2016105528A
Authority
JP
Japan
Prior art keywords
quantization matrix
image
quantization
unit
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013059529A
Other languages
English (en)
Inventor
安倍 清史
Seishi Abe
清史 安倍
一仁 木村
Kazuhito Kimura
一仁 木村
秀之 大古瀬
Hideyuki Okose
秀之 大古瀬
荒川 博
Hiroshi Arakawa
博 荒川
耕治 有村
Koji Arimura
耕治 有村
和真 榊原
Kazuma Sakakibara
和真 榊原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Original Assignee
Panasonic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp filed Critical Panasonic Corp
Priority to JP2013059529A priority Critical patent/JP2016105528A/ja
Priority to PCT/JP2013/006101 priority patent/WO2014147679A1/ja
Publication of JP2016105528A publication Critical patent/JP2016105528A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Abstract

【課題】画像符号化装置において、ブロック単位で直交変換を行う処理と行わない処理とが切り替わる符号化を行う場合でも、量子化行列を用いた量子化処理を適切に行うことを可能とする。【解決手段】本発明に係る画像符号化装置100は、文字領域有無判定部111において符号化対象ピクチャとする入力画像に文字や線の領域があるかどうかを判定し、文字や線の領域がないと判定された場合は、全てのブロックサイズに対応する量子化行列を、低周波数成分から高周波数成分にかけて傾斜を持つ係数値で生成し、文字や線の領域があると判定された場合は、4×4画素のブロックサイズに対応する量子化行列のみを、低周波数成分から高周波数成分にかけて傾斜を持たない係数値で生成し、生成した量子化行列を用いて量子化処理を行う。【選択図】図1

Description

本発明は、入力された画像をブロックに分割して符号化する画像符号化装置に関するものである。
近年、マルチメディアアプリケーションの発展に伴い、画像、音声及びテキストなど、あらゆるメディアの情報を統一的に扱うことが一般的になってきた。また、ディジタル化された画像は膨大なデータ量を持つため、蓄積及び伝送のためには、画像の情報圧縮技術が不可欠である。一方で、圧縮した画像データを相互運用するためには、圧縮技術の標準化も重要である。例えば、画像圧縮技術の標準規格としては、ITU−T(国際電気通信連合 電気通信標準化部門)のH.261、H.263、H.264、ISO/IEC(国際標準化機構)のMPEG−1、MPEG−3、MPEG−4、MPEG−4AVCなどがある。また、現在は、ITU−TとISO/IECとの共同によるHEVCと呼ばれる次世代画像符号化方式の標準化活動が進んでいる。
このような画像の符号化では、符号化対象の各ピクチャを符号化単位ブロックに分割し、ブロック毎に時間方向および空間方向の冗長性を削減することによって情報量の圧縮を行う。時間的な冗長性の削減を目的とする画面間予測符号化では、前方または後方のピクチャを参照してブロック単位で動きの検出および予測画像の作成を行い、得られた予測画像と符号化対象のブロックとの差分画像を取得する。また空間的な冗長性の削減を目的とする画面内予測符号化では、周辺の符号化済みブロックの画素情報をから予測画像の生成を行い、得られた予測画像と符号化対象のブロックとの差分画像を取得する。さらに得られた差分画像に対して離散コサイン変換等の直交変換および量子化を行い、可変長符号化を用いて符号列を生成することで情報量が圧縮される。
HEVC(非特許文献1)では、前述の直交変換において、符号化対象とするブロック毎に、4×4画素、8×8画素、16×16画素、32×32画素のサイズの中から任意のサイズを選択して直交変換を行うことが可能となっている。これにより、画像の性質に応じて直交変換のサイズを適応的に切り替えることで符号化効率の向上に大きく貢献している。また、4×4画素のサイズを選択した場合に限り、直交変換を行わずに差分画像をそのまま量子化するという方法を選択することも可能となっている。
また、前述の量子化処理では、ブロック毎に設定した量子化パラメータとピクチャ毎に設定した量子化行列とを掛け合わせることで決定される量子化幅によって量子化が行われる。一般的に量子化行列は、人が認識し易い(人が画質の劣化に気付き易い)低周波数領域の成分に対してはより細かい係数値を適用するように構成される。一方、人が認識し難い(人が画質の劣化に気付き難い)高周波数領域の成分に対してはより粗い係数値を適用するように構成される。その結果、上記量子化行列は、低周波数領域から高周波数領域にかけて傾斜を持つ係数値で構成される。また、量子化行列は直交変換のサイズ毎に定義することが必要であるため、HEVCでは、4×4画素、8×8画素、16×16画素、32×32画素のそれぞれに対応した量子化行列を符号化対象とするピクチャに設定する。
JCTVC-L1003: High Efficiency Video Coding (HEVC) text specification draft10 (01/2013)
HEVCでは前述の通り、直交変換を行う際のサイズとして4×4画素を選択した場合、(1)直交変換を行って生成した残差係数に対して量子化する方法と、(2)直交変換を行わずに差分画像をそのまま量子化する方法とのいずれかをブロック毎に選択することが可能となっている。しかし、量子化を行うために使用される量子化行列は、4×4画素のサイズに対して1つしか設定することができないため、両者の方法に対して同じ量子化行列が適用されてしまう。
直交変換を行うことを想定した量子化行列を設定すると、直交変換を行わない場合に画質劣化を発生させてしまい、逆に、直交変換を行わないことを想定した量子化行列を設定すると、直交変換を行った場合に符号化効率の低下を発生させてしまう。
本発明は上記課題を解決するものであり、HEVCを用いた画像符号化装置において、(1)直交変換を行って生成した残差係数に対して量子化する方法と、(2)直交変換を行わずに差分画像をそのまま量子化する方法とを効果的に使用しながら、画質劣化や符号化効率の低下を発生させない量子化行列を設定する方法を提供することを目的とする。
本開示における画像符号化装置は、入力画像を量子化処理が含まれた所定の符号化規格にて符号化し、符号列を生成する画像符号化装置であって、入力画像を取得する取得部と、取得した入力画像を、予め設定される複数のブロックサイズのうちいずれかのブロックサイズで構成される画素群毎に出力するブロック分割部と、取得した入力画像内に文字または線画で描画された領域があるか否かを判定する文字領域有無判定部と、出力される画素群に対する予測画像を生成する予測画像生成部と、生成した予測画像と出力される画素群との差分値を残差画像として出力する差分演算部と、(1)差分画像を直交変換し残差係数を生成して出力する第1動作と、(2)差分画像を直交変換せずに差分画像をそのまま出力する第2動作と、を選択的に切り替えて実行する直交変換部と、直交変換部から出力される出力結果を量子化する際に利用する量子化行列を、直交変換処理の有無に関係なく共通して設定する量子化行列生成部と、設定した量子化行列を用いて出力結果を量子化する量子化部と、前記量子化行列生成部から出力される量子化行列を符号列のヘッダ領域に記述して符号列を生成する符号列生成部と、を備え、量子化行列生成部が生成する量子化行列のうち、4×4画素ブロック用の量子化に利用する量子化行列は、文字領域有無判定部における判定結果に基づいてその係数値が変化し、4×4画素ブロック用以外の量子化に利用する量子化行列は、文字領域有無判定部における判定結果に依存せず共通の係数値が設定される。
なお、本発明は、このような画像符号化装置として実現することができるだけでなく、このような画像符号化装置に含まれる各手段と同等の処理をプログラムや集積回路としても実現することもできる。
以上より、本発明における画像符号化装置は、直交変換を行って生成した残差係数に対して量子化する方法と、直交変換を行わずに差分画像をそのまま量子化する方法とを効果的に使用しながら、画質劣化や符号化効率の低下を発生させない量子化行列を設定することが可能となる。
本実施の形態1に係る画像符号化装置を示すブロック図 直交変換処理および量子化処理で生成される信号の一例を説明するための概念を示す図 逆量子化処理および逆直交変換処理で生成される信号の一例を説明するための概念を示す図 本実施の形態1に係る量子化行列生成処理を示すフローチャート 本実施の形態によって生成される符号列の一例を説明するための概念を示す図 本実施の形態によって生成される量子化行列の一例を説明するための概念を示す図 本実施の形態2に係る画像符号化装置を示すブロック図 本実施の形態2に係る量子化行列生成処理を示すフローチャート
(実施の形態1)
以下、本実施の形態1について、図面を参照しながら説明する。
(符号化装置全体の処理説明)
図1は、本実施の形態に係る画像符号化装置100のブロック図である。画像符号化装置100は、ピクチャ単位で入力された画像をブロックに分割する。そして、画像符号化装置100はブロック単位で符号化処理し、符号列を生成する。
この画像符号化装置100は、ピクチャメモリ101と、ブロック分割部102と、直交変換部103と、非直交変換部104と、量子化部105と、逆量子化部106と、逆直交変換部107と、逆非直交変換部108と、予測画像生成部109と、符号列生成部110と、文字領域有無判定部111と、量子化行列生成部112とを備えている。
ピクチャメモリ101は、入力画像信号をピクチャ単位で格納し、ブロック分割部102からの読出し命令を受け付けると当該読出し命令に係る画像信号を出力する。
ブロック分割部102は、ピクチャメモリ101から入力された画像信号を、符号化処理単位であるコーディングユニット(以下、CUと称す)と呼ばれるブロックに分割する。例えばブロック分割部102は、画像信号を64×64画素のCUに分割し出力する。
さらに、ブロック分割部102は、CUを予測画像生成の処理単位であるプレディクションユニット(以下、PUと称す)と呼ばれるブロックに分割する。ブロック分割部102は、例えば画像信号を8×8画素のPUに分割し出力する。
またブロック分割部102は、CUを直交変換の処理単位であるトランスフォームユニット(以下、TUと称す)と呼ばれるブロックに分割する。ブロック分割部102は、例えば画像信号を8×8画素のTUに分割する。
以降の処理は、処理内容に応じて、これらのCU、PU、TUのいずれかのブロック単位で処理が行われる。
差分演算部113は、ブロック分割部102から入力されたPU単位の画像信号と、予測画像生成部109から入力されたPU単位の予測画像信号との差分を算出し、差分画像信号を生成する。
差分演算部113は、生成した差分画像信号を直交変換部103もしくは非直交変換部104のいずれかに出力する。
このとき、差分演算部113は、ブロック分割部102によって分割されたTUのサイズに基づいて、直交変換部103および非直交変換部104のうちいずれか一方に出力する。
TUのサイズが8×8画素もしくは16×16画素もしくは32×32画素である場合、差分演算部113は、常に差分画像信号を直交変換部103に出力する。
一方、TUのサイズが4×4画素である場合、差分演算部113は直交変換部103と非直交変換部104のうちいずれか一方を任意で選択して出力する。この場合、差分演算部113は、一般的に符号化処理を行った結果生成される再構成画像の画質がよりよくなると判断される方を任意の一方として選択する。
直交変換部103は、差分演算部113から入力される差分画像信号に対してTU単位で直交変換し、残差係数を生成する。
図2(a)は、直交変換部103が生成する残差係数を示す。直交変換部103は、図2に示す差分画像を直交変換し、図2(a)に示す残差係数を生成する。生成される残差係数における各々の係数値は周波数成分毎の信号の大きさを示すものであり、左上が低周波数成分の係数、右下が高周波数成分の係数となっている。図2(a)に示す残差係数では、直交変換を行ったことにより大きな信号が左上の低周波数成分に集中している。
一方、非直交変換部104は、差分演算部113から入力される差分画像信号に対してTU単位での直交変換を行わず、差分画像信号をそのまま残差係数として生成する。
図2(b)は、非直交変換部104が直交変換せずにそのまま残差画像を出力した場合の残差係数を示す。図2(b)における残差係数における各々の係数値は差分画像の対応する画素位置の画素値そのものであり、信号の変換は行われていないことが分かる。
量子化部105は、直交変換部103もしくは非直交変換部104から入力される残差係数信号をTU単位で量子化する。このとき、量子化部105は、量子化値および量子化行列を用いて、残差係数信号をTU単位で量子化し、量子化残差係数を生成する。
ここで、量子化値は、CU単位で設定される値である。
一方、量子化行列は、ピクチャ単位で設定される値である。なお、量子化部105は、量子化行列生成部112から量子化行列を取得する。
具体的に、量子化部105は、図2(a)に示す残差係数を量子化することにより、図2(c)に示す量子化残差係数を生成する。
また、量子化部105は、図2(b)に示す残差係数を量子化することにより、図2(d)に示す量子化残差係数を生成する。
逆量子化部106は、量子化部105から入力される量子化残差係数信号に対してTU単位で逆量子化し、再構成残差係数を生成する。逆量子化部106は、生成した再構成残差係数を、逆直交変換部107もしくは逆非直交変換部108のいずれかに出力する。入力される量子化残差係数信号が、直交変換部103による処理を行って生成されたものである場合、逆量子化部106は、再構成残差係数を逆直交変換部107に出力する。一方、逆量子化部106は、非直交変換部104による処理を行って生成されたものである場合、再構成残差係数を逆非直交変換部108に出力する。
具体的に逆量子化部106は、図3(c)に示す量子化残差係数を逆量子化することにより、図3(e)に示す再構成残差係数を生成する。一方、逆量子化部106は、図3(d)に示す量子化残差係数(d)を逆量子化することにより、図3(f)に示す再構成残差係数を生成する。
逆直交変換部107は、逆量子化部106から入力される再構成残差係数信号に対してTU単位で逆直交変換し、再構成差分画像を生成する。
具体的に逆直交変換部107は、図3(e)に示す再構成残差係数を逆直交変換し、図3(g)に示す再構成差分画像を生成する。
一方、逆非直交変換部108は、逆量子化部106から入力される再構成残差係数信号に対してTU単位で逆直交変換を行わず、再構成残差係数信号をそのまま再構成差分画像として生成する。
具体的に逆直交変換部107は、図3(f)に示す再構成残差係数を逆直交変換せずに、この再構成残差係数を図3(h)に示す再構成差分画像として出力する。
加算演算部114は、逆直交変換部107もしくは逆非直交変換部108から入力される再構成差分画像信号と、予測画像生成部109から入力される予測画像信号とをPU単位で加算することにより再構成画像を生成する。
予測画像生成部109は、ブロック分割部102から入力されたPU単位の画像信号を基に、加算演算部114から入力される再構成画像信号を用いてPU単位で画面内予測または画面間予測を行って予測画像を生成する。画面間予測を用いる場合、予測画像生成部109は既に符号化済みの過去のピクチャの再構成画像信号を用いる。一方、画面内予測を用いる場合、予測画像生成部109は符号化対象のPUに隣接する既に符号化済みの同じピクチャの再構成画像信号を用いる。なお、画像符号化装置100に入力される入力画像が1枚のピクチャのみから構成される静止画である場合は、過去のピクチャが存在しないため、常に画面内予測のみが用いられる。
符号列生成部110は、量子化部105から入力された量子化残差係数信号、および量子化行列生成部112から入力された量子化行列信号、およびその他の復号化処理時に必要となる符号化情報信号に対して、可変長符号化および算術符号化を行うことで符号列を生成する。
(文字領域有無判定部および量子化行列生成部の具体的な説明)
ここで、文字領域有無判定部111および量子化行列生成部112において量子化行列を生成する方法について、図4のフローチャートを用いて具体的に説明する。
まず、文字領域有無判定部111は、画像符号化装置100を動作させる際に外部から設定する外部信号を入力とし、入力された外部信号が符号化対象ピクチャとする入力画像に文字や線の領域があることを示しているかどうかを判定する(S401)。
なお、外部信号は、画像符号化装置100を動作させる際に、ユーザが符号化対象ピクチャとする入力画像に応じて直接設定しても良い。また、外部信号は、符号化対象ピクチャとする入力画像が新聞や雑誌などの出版物の紙面である場合に自動的に設定されるようにしても良い。
ステップS401において、入力画像に文字や線の領域がないと判定された場合、量子化行列生成部112は、4×4画素のTUブロックに対応する量子化行列であって、低周波領域から高周波領域にかけて傾斜を有する量子化行列を生成する(S402)。
一方、ステップS401において、入力画像に文字や線の領域があると判定された場合、量子化行列生成部112は、4×4画素のTUブロックに対応する量子化行列であって、低周波領域から高周波領域にかけて傾斜を持たない量子化行列を生成する(S403)。
さらに、量子化行列生成部112は、4×4画素以外のTUブロック(例えば、8×8画素、16×16画素、32×32画素のTUブロック)に対応する各々の量子化行列であって、低周波領域から高周波領域にかけて傾斜を有する量子化行列を生成する(S404)。
つまり、4×4画素ブロック用の量子化に利用する量子化行列は、文字等の領域判定結果に基づいてその係数値が変化する。一方、4×4画素ブロック用以外の量子化に利用する量子化行列は、文字等の領域判定結果に依存せず共通の係数値が設定される。
量子化行列生成部112は、生成した量子化行列を量子化部105に出力する。そして、量子化部105は、TU単位の残差係数信号を量子化する際に、この量子化行列を使用する。また、量子化行列生成部112は、生成した量子化行列を符号列生成部110に出力する。そして、符号列生成部110は、この量子化行列に関する情報をヘッダ領域に有する符号列を生成する。
図5は符号列生成部110によって生成される符号列の例である。
符号列のヘッダ領域の一部であるPicture Parameter Set(PPS)の中に、4×4画素のTUブロックに対応する量子化行列(4×4QM)から、32×32画素のTUブロックに対応する量子化行列(32×32QM)までが記載されている。
なお、図5の例ではPPSに量子化行列を記載しているが、Sequence Parameter Set(SPS)に量子化行列を記載した場合も、PPSとSPSの両方に量子化行列を記載した場合も同様である。また、図5の例では4×4QMから32×32QMまでの4種類の量子化行列を記載しているが、符号化対象とするピクチャで使用されるTUブロックサイズに対応した量子化行列のみを記載した場合も同様である。
(4×4画素用の量子化行列に関する説明)
以下、4×4画素用の量子化行列について図面を参照しながら説明する。
図6は、4×4画素用の量子化行列の具体例を説明するための図である。
ここで、量子化行列の最も左上の係数値をDC(Direct Current)成分とする。
図6(a)は、ステップS402において生成される傾斜を持つ量子化行列の例である。最も左上に位置するDC成分の係数値が8、最も右下に位置する係数値が48となっており、低周波数成分である左上から高周波数成分である右下にかけて係数値に傾斜があることが分かる。
量子化部105に入力される残差係数信号が直交変換部103から入力されたものである場合、人が認識し易い(人が画質の劣化に気付き易い)低周波数成分は、小さな量子化幅(細かい精度)で量子化される。これにより、発生符号量は大きくなるが情報の精度は高くなる。逆に、人が認識し難い(人が画質の劣化に気付き難い)高周波数成分は大きな量子化幅(粗い精度)で量子化される。これにより、情報の精度は低くなるが発生符号量は小さくなる。その結果、両者のバランスが取れることで効率の良い量子化を行うことができる。
一方、量子化部105に入力される残差係数信号が非直交変換部104から入力されたものである場合、周波数成分とは無関係に、符号化対象ブロックの左上の画素位置における画素は細かい精度で量子化される。それに対して、符号化対象ブロックの右下の画素位置における画素は粗い精度で量子化されることになる。その結果、ブロック内の画素位置によって画質の良し悪しが異なる主観的に違和感のある画像となってしまう。
次に、図6(b)は、ステップS403において生成される傾斜を持たない量子化行列の例である。DC成分から右下に位置する高周波数成分の係数値まで、全ての係数が16となっており、左上から右下にかけて係数値に傾斜がないことが分かる。
量子化部105に入力される残差係数信号が直交変換部103から入力されたものである場合、人が認識し易い(人が画質の劣化に気付き易い)低周波数成分も、人が認識し難い(人が画質の劣化に気付き難い)高周波数成分も、同じ量子化幅で量子化される。その結果、人の視覚特性に即した量子化が行われず効率の悪い量子化が行われることになる。
一方、量子化部105に入力される残差係数信号が非直交変換部104から入力されたものである場合、周波数成分とは無関係に、符号化対象ブロックの左上の画素位置における画素も、符号化対象ブロックの右下の画素位置における画素も、同じ量子化幅で量子化が行われることになり、ブロック内の画素位置によって画質の良し悪しが均一な主観的に違和感が少ない画像となる。
(文字を含む画像における効果の説明)
一般的に、文字や線のように画素の値が小さな範囲で極端に変化するような画像に対しては、小さなTUブロックサイズを用いた方が符号化ノイズを抑制し易い。また、さらに非直交変換部104を用いた直交変換を行わない処理が効果的に働く場合が多い。従って、図6(b)の傾斜を持たない量子化行列を使用すると、符号化効率が高くなる傾向がある。逆に、図6(a)の傾斜を持つ量子化行列を使用してしまうと主観的に違和感のある画像となってしまう可能性が高くなる。
一方、自然画像のように画素の値が連続的に変化するような画像に対しては、大きなTUブロックサイズを用いた方が発生符号量を削減し易い。さらに、直交変換部103を用いた直交変換を行なう処理が効果的に働く場合が多い。従って、図6(a)の傾斜を持つ量子化行列を使用すると、符号化効率が高くなる傾向がある。逆に、図6(b)の傾斜を持たない量子化行列を使用すると主観的には大きな違和感は発生しないが符号化効率が低下してしまう可能性が高くなる。
本実施の形態では、符号化対象ピクチャとする入力画像に文字や線の領域を含む場合にのみ、4×4画素のTUブロックに対応する量子化行列のみを図6(b)の傾斜を持たない量子化行列を使用する。これにより、符号化対象ピクチャ内における文字や線の領域に対しては高い符号化効率を得ることが可能となる。一方、符号化対象ピクチャ内における自然画像の領域では4×4画素のTUブロックを使用する頻度が低いため、符号化効率の低下を限定的とすることができる。
また、本実施の形態では、符号化対象ピクチャとする入力画像に文字や線の領域を含まない場合は、4×4画素のTUブロックに対応する量子化行列も他のTUブロックサイズに対応する各々の量子化行列と同様に図6(a)の傾斜を持つ量子化行列を使用する。これにより、従来と同様の高い符号化効率を得ることが可能となる。
(4×4量子化行列の別の例)
なお、図6(a)および(b)で説明した量子化行列は一例であり、図に記載した係数値とは異なる係数値で構成される量子化行列を用いることも可能である。
例えば、図6(c)は図6(b)で説明した傾斜を持たない量子化行列の別の例である。DC成分が8、およびその周辺の係数値のみが小さな値を持ち、それ以外の係数値は全て16となっており、ほとんど傾斜を持たない量子化行列となっていることが分かる。
量子化部105に入力される残差係数信号が直交変換部103から入力されたものである場合は、低周波数成分の周辺のみ小さな量子化幅(細かい精度)で量子化が行われることになり、それ以外の成分は中間的な量子化幅で量子化が行われることになる。図6(a)のように高周波数成分の発生符号量を小さくする効果はないが、低周波数成分の周辺の情報の精度を高くする効果を得ることができる。
一方、量子化部105に入力される残差係数信号が非直交変換部104から入力されたものである場合、符号化対象ブロックの左上の画素位置とその周辺における画素は細かい精度で量子化されることになり、それ以外の成分は中間的な量子化幅で量子化が行われることになる。図6(b)のように全画素位置の画質を均一にすることはできないが、ブロック内の一部分の画素位置のみ画質が悪くなくという現象は発生しないため主観的に違和感のない画像を得ることができる。
また、図6(d)は図6(b)で説明した傾斜を持たない量子化行列のまた別の例である。DC成分が8、右下に位置する高周波数成分の係数値が28となっており、左上から右下にかけて係数値にやや傾斜があるが、図6(a)と比較すると傾斜が半分以下であり、ほとんど傾斜を持たない量子化行列となっていることが分かる。
量子化部105に入力される残差係数信号が直交変換部103から入力されたものである場合は、図6(a)に比べると効果は小さくなくなるが、低周波数成分の情報の精度を高めながら、高周波数成分の発生符号量を小さくなるという効果を得ることができる。
一方、量子化部105に入力される残差係数信号が非直交変換部104から入力されたものである場合、符号化対象ブロックの左上の画素位置における画素は細かい精度で量子化されることになり、符号化対象ブロックの右下の画素位置における画素はやや粗い精度で量子化されることになる。しかし、図6(a)に比べるとブロック内の画素位置によって極端に画質の良し悪しが異なるという現象を低減できるため主観的に違和感のない画像を得ることができる。
(実施の形態2)
以下、本実施の形態2について、図面を参照しながら説明する。
(符号化装置全体の処理説明)
図7は、本実施の形態に係る画像符号化装置700のブロック図である。画像符号化装置700は、ピクチャ単位で入力された画像をブロックに分割し、ブロック単位で符号化処理し、符号列を生成する。
実施の形態1において図1を用いて説明した画像符号化装置100との違いは、文字領域有無判定部711においてピクチャメモリ101から入力された画像信号を用いて処理を行っている点のみであり、それ以外の処理ブロックについては全く同じであるのでここでは説明を省略する。
(文字領域有無判定部および量子化行列生成部の具体的な説明)
図8のフローチャートは文字領域有無判定部711および量子化行列生成部112において量子化行列を生成する処理方法を示したものである。
まず、文字領域有無判定部711は、ピクチャメモリ101から入力された符号化対象ピクチャの入力画像信号から画像特徴量を算出して文字や線の領域を抽出する(S801)。
画像特徴量の算出方法はどのような方法を用いても同様に扱うことが可能であるが、例えば、画素値が特定の2値に集中しているかどうかを表す情報を画像特徴量とし、算出された画像特徴量が特定の閾値以上の場合は、その領域を文字や線の領域として抽出するという方法がある。
次に、S801の抽出結果に従って、入力画像に文字や線の領域があるかを判定し、文字や線の領域がない場合はステップS402の処理に、文字や線の領域がある場合はステップS403の処理に切り替える(S802)。
量子化行列生成部112における、ステップS402、S403、S404の各々の処理、および生成される量子化行列、および生成される符号列については、実施の形態1において、図4、図5、図6を用いて説明したものと全く同じであるのでここでは説明を省略する。
本実施の形態を用いると、画像符号化装置700を動作させる際に、ユーザが符号化対象ピクチャとする入力画像に応じて、入力画像に文字や線の領域があるかどうかを示す外部信号を設定する必要がなくなるため、ユーザは符号化対象ピクチャがどのようなコンテンツであるかを意識せずに符号化処理を実施することが可能となる。
(まとめ)
以下、本実施形態1および2に記載される画像符号化装置100および画像符号化装置700は、入力画像を取得し、取得した入力画像を、予め設定される複数のブロックサイズのうちいずれかのブロックサイズで構成される画素群毎に出力し、取得した入力画像内に文字または線画で描画された領域があるか否かを判定し、出力される画素群に対する予測画像を生成し、生成した予測画像と出力される画素群との差分値を残差画像として出力し、(1)差分画像を直交変換し残差係数を生成して出力する第1動作と、(2)差分画像を直交変換せずに差分画像をそのまま出力する第2動作とを選択的に切り替えて実行し、第1動作および第2動作の結果である出力結果を量子化する際に利用する量子化行列を、直交変換処理の有無に関係なく共通して設定し、設定した量子化行列を用いて出力結果を量子化し、設定した量子化行列を符号列のヘッダ領域に記述して符号列を生成し、生成する量子化行列のうち、4×4画素ブロック用の量子化に利用する量子化行列は、文字領域の判定結果に基づいてその係数値が変化し、4×4画素ブロック用以外の量子化に利用する量子化行列は、文字領域の判定結果に依存せず共通の係数値が設定される特徴を有する。
また、取得した入力画像内に文字または線画で描画された領域があると文字領域有無判定部が判定した場合、量子化行列生成部は、低周波数領域から高周波数領域までの全ての係数値が同じである4×4画素ブロック用の量子化行列を生成し、取得した入力画像内に文字または線画で描画された領域がないと文字領域有無判定部が判定した場合、量子化行列生成部は、低周波数領域から高周波数領域にかけて傾斜を持った係数値で構成される4×4画素ブロック用の量子化行列を生成する構成でも構わない。
また、取得した入力画像内に文字または線画で描画された領域があると文字領域有無判定部が判定した場合、量子化行列生成部は、DC成分およびDC成分に隣接する係数値のみ低周波成分から高周波成分にかけて傾斜を有し、それ以外の係数値はすべて同じ値である4×4画素ブロック用の量子化行列を生成し、取得した入力画像内に文字または線画で描画された領域がないと文字領域有無判定部が判定した場合、量子化行列生成部は、低周波数領域から高周波数領域にかけて傾斜を持った係数値で構成される4×4画素ブロック用の量子化行列を生成する構成でも構わない。
また、取得した入力画像内に文字または線画で描画された領域があると文字領域有無判定部が判定した場合、量子化行列生成部は、低周波数領域から高周波数領域にかけて傾斜を有する4×4画素ブロック用の量子化行列(以下、第1量子化行列と称す)を生成し、取得した入力画像内に文字または線画で描画された領域がないと文字領域有無判定部が判定した場合、量子化行列生成部は、第1量子化行列が有する低周波数領域から高周波数領域までに傾斜よりも急な傾斜を持った4×4画素ブロック用の量子化行列を生成する構成でも構わない。
(その他の実施形態)
さらに、上記実施の形態で示した画像符号化装置に含まれる各手段と同等の機能を備えるプログラムを、フレキシブルディスク等の記録媒体に記録するようにすることにより、上記実施の形態で示した処理を、独立したコンピュータシステムにおいて簡単に実施することが可能となる。なお、記録媒体としてはフレキシブルディスクに限らず、光ディスク、ICカード、ROMカセット等、プログラムを記録できるものであれば同様に実施することができる。
また、上記実施の形態で示した画像符号化装置に含まれる各手段と同等の機能を集積回路であるLSIとして実現してもよい。これらは一部または全てを含むように1チップ化されてもよい。またLSIは集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現しても良い。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらには、半導体技術の進歩または派生する別技術によりLSIなどに置き換わる集積回路の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。
また、上記実施の形態に係る、画像符号化装置、またはその変形例の機能のうち少なくとも一部を組み合わせてもよい。
本発明は、例えば、新聞や雑誌等の紙面を静止画の画像データとして入力し、符号化処理を行うことで静止画像符号列として出力する画像符号化装置や、文字や図が多重化された映像を動画の画像データとして入力し、符号化処理を行うことで動画像符号列として出力する画像符号化装置として有用である。
100 画像符号化装置
101 ピクチャメモリ
102 ブロック分割部
103 直交変換部
104 非直交変換部
105 量子化部
106 逆量子化部
107 逆直交変換部
108 逆非直交変換部
109 予測画像生成部
110 符号列生成部
111 文字領域有無判定部
112 量子化行列生成部
113 差分演算部
114 加算演算部
700 画像符号化装置
711 文字領域有無判定部

Claims (5)

  1. 入力画像を量子化処理が含まれた所定の符号化規格にて符号化し、符号列を生成する画像符号化装置であって、
    入力画像を取得する取得部と、
    前記取得した入力画像を、予め設定される複数のブロックサイズのうちいずれかのブロックサイズで構成される画素群毎に出力するブロック分割部と、
    前記取得した入力画像内に文字または線画で描画された領域があるか否かを判定する文字領域有無判定部と、
    前記出力される画素群に対する予測画像を生成する予測画像生成部と、
    前記生成した予測画像と前記出力される画素群との差分値を残差画像として出力する差分演算部と、
    (1)前記差分画像を直交変換し残差係数を生成して出力する第1動作と、(2)前記差分画像を直交変換せずに差分画像をそのまま出力する第2動作と、を選択的に切り替えて実行する直交変換部と、
    前記直交変換部から出力される出力結果を量子化する際に利用する量子化行列を、直交変換処理の有無に関係なく共通して設定する量子化行列生成部と、
    前記設定した量子化行列を用いて前記出力結果を量子化する量子化部と、
    前記量子化行列生成部から出力される量子化行列を符号列のヘッダ領域に記述して符号列を生成する符号列生成部と、を備え、
    前記量子化行列生成部が生成する量子化行列のうち、4×4画素ブロック用の量子化に利用する量子化行列は、前記文字領域有無判定部における判定結果に基づいてその係数値が変化し、4×4画素ブロック用以外の量子化に利用する量子化行列は、前記文字領域有無判定部における判定結果に依存せず共通の係数値が設定される、
    画像符号化装置。
  2. 前記取得した入力画像内に文字または線画で描画された領域があると前記文字領域有無判定部が判定した場合、前記量子化行列生成部は、低周波数領域から高周波数領域までの全ての係数値が同じである4×4画素ブロック用の量子化行列を生成し、
    前記取得した入力画像内に文字または線画で描画された領域がないと前記文字領域有無判定部が判定した場合、前記量子化行列生成部は、低周波数領域から高周波数領域にかけて傾斜を持った係数値で構成される4×4画素ブロック用の量子化行列を生成する、
    請求項1に記載の画像符号化装置。
  3. 前記取得した入力画像内に文字または線画で描画された領域があると前記文字領域有無判定部が判定した場合、前記量子化行列生成部は、DC成分および前記DC成分に隣接する係数値のみ低周波成分から高周波成分にかけて傾斜を有し、それ以外の係数値はすべて同じ値である4×4画素ブロック用の量子化行列を生成し、
    前記取得した入力画像内に文字または線画で描画された領域がないと前記文字領域有無判定部が判定した場合、前記量子化行列生成部は、低周波数領域から高周波数領域にかけて傾斜を持った係数値で構成される4×4画素ブロック用の量子化行列を生成する、
    請求項1に記載の画像符号化装置。
  4. 前記取得した入力画像内に文字または線画で描画された領域があると前記文字領域有無判定部が判定した場合、前記量子化行列生成部は、低周波数領域から高周波数領域にかけて傾斜を有する4×4画素ブロック用の量子化行列(以下、第1量子化行列と称す)を生成し、
    前記取得した入力画像内に文字または線画で描画された領域がないと前記文字領域有無判定部が判定した場合、前記量子化行列生成部は、前記第1量子化行列が有する低周波数領域から高周波数領域までに傾斜よりも急な傾斜を持った4×4画素ブロック用の量子化行列を生成する、
    請求項1に記載の画像符号化装置。
  5. 入力画像を量子化処理が含まれた所定の符号化規格にて符号化し、符号列を生成する画像符号化方法であって、
    入力画像を取得し、
    前記取得した入力画像を、予め設定される複数のブロックサイズのうちいずれかのブロックサイズで構成される画素群毎に出力し、
    前記取得した入力画像内に文字または線画で描画された領域があるか否かを判定し、
    前記出力される画素群に対する予測画像を生成し、
    前記生成した予測画像と前記出力される画素群との差分値を残差画像として出力し、
    (1)前記差分画像を直交変換し残差係数を生成して出力する第1動作と、(2)前記差分画像を直交変換せずに差分画像をそのまま出力する第2動作と、を選択的に切り替えて実行し、
    前記第1動作および第2動作の結果である出力結果を量子化する際に利用する量子化行列を、直交変換処理の有無に関係なく共通して設定し、
    前記設定した量子化行列を用いて前記出力結果を量子化し、
    前記設定した量子化行列を符号列のヘッダ領域に記述して符号列を生成し、
    前記生成する量子化行列のうち、4×4画素ブロック用の量子化に利用する量子化行列は、前記文字領域の判定結果に基づいてその係数値が変化し、4×4画素ブロック用以外の量子化に利用する量子化行列は、前記文字領域の判定結果に依存せず共通の係数値が設定される、
    画像符号化方法。
JP2013059529A 2013-03-22 2013-03-22 画像符号化装置および画像符号化方法 Pending JP2016105528A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2013059529A JP2016105528A (ja) 2013-03-22 2013-03-22 画像符号化装置および画像符号化方法
PCT/JP2013/006101 WO2014147679A1 (ja) 2013-03-22 2013-10-11 画像符号化装置および画像符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013059529A JP2016105528A (ja) 2013-03-22 2013-03-22 画像符号化装置および画像符号化方法

Publications (1)

Publication Number Publication Date
JP2016105528A true JP2016105528A (ja) 2016-06-09

Family

ID=51579421

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013059529A Pending JP2016105528A (ja) 2013-03-22 2013-03-22 画像符号化装置および画像符号化方法

Country Status (2)

Country Link
JP (1) JP2016105528A (ja)
WO (1) WO2014147679A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115297326A (zh) * 2017-12-15 2022-11-04 Lg电子株式会社 图像编解码方法和发送方法及非暂态计算机可读存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2876258B2 (ja) * 1991-01-23 1999-03-31 株式会社リコー デジタル電子スチルカメラ
JP2003046789A (ja) * 2001-08-02 2003-02-14 Canon Inc 画像符号化装置及び画像復号化装置
JP2003143414A (ja) * 2001-11-05 2003-05-16 Canon Inc 画像処理装置および画像処理方法
HUE037348T2 (hu) * 2006-01-09 2018-08-28 Musmann Hans Georg A predikciós hiba adaptív kódolása hibrid video kódolásban

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115297326A (zh) * 2017-12-15 2022-11-04 Lg电子株式会社 图像编解码方法和发送方法及非暂态计算机可读存储介质

Also Published As

Publication number Publication date
WO2014147679A1 (ja) 2014-09-25

Similar Documents

Publication Publication Date Title
CN111066326B (zh) 机器学习视频处理系统和方法
CN110024392B (zh) 用于视频译码的低复杂度符号预测
CN105453570B (zh) 用于下一代视频的对分区数据的内容自适应熵编码
ES2623298T3 (es) Filtrado de vídeo de post-procesamiento controlado por flujo de bits
US8885706B2 (en) Apparatus and methodology for a video codec system with noise reduction capability
US9955176B2 (en) Efficient and scalable intra video/image coding using wavelets and AVC, modified AVC, VPx, modified VPx, or modified HEVC coding
TW201832562A (zh) 具有減低複雜性之視訊寫碼中之雙邊濾波器
WO2020055288A2 (en) Apparatus and method for filtering in video coding with look-up table selected based on bitstream information
CN107431805B (zh) 编码方法和装置以及解码方法和装置
TW202002636A (zh) 網格寫碼之量化係數寫碼
JP2007097145A (ja) 画像符号化装置及び画像符号化方法
JP2014039257A (ja) デコーダおよび復号方法
KR102589712B1 (ko) 비디오 디코딩 방법 및 장치, 저장 매체
CN112385216A (zh) 用于多行帧内预测的帧内插值滤波器
JP2014033460A (ja) 動画像復号化装置
KR20210021580A (ko) 비디오 코딩에서의 필터링을 위한 장치 및 방법
JP2015181225A (ja) 動画像符号化装置および動画像符号化方法
CN113039793A (zh) 指数分区的方法与系统
KR102113904B1 (ko) 보간을 이용한 연산 방법, 인코더, 및 디코더
JP2024023885A (ja) 動画像符号化装置及び動画像符号化方法
KR101703330B1 (ko) 이미지 재부호화 방법 및 그 장치
KR20140023918A (ko) 동화상 부호화 장치
JP5593468B1 (ja) 画像符号化装置及び画像符号化方法
JP2016105528A (ja) 画像符号化装置および画像符号化方法
CN111108747B (zh) 获得信号的时间样本的目标表示