JP5593468B1 - 画像符号化装置及び画像符号化方法 - Google Patents

画像符号化装置及び画像符号化方法 Download PDF

Info

Publication number
JP5593468B1
JP5593468B1 JP2014516109A JP2014516109A JP5593468B1 JP 5593468 B1 JP5593468 B1 JP 5593468B1 JP 2014516109 A JP2014516109 A JP 2014516109A JP 2014516109 A JP2014516109 A JP 2014516109A JP 5593468 B1 JP5593468 B1 JP 5593468B1
Authority
JP
Japan
Prior art keywords
unit
determination
determination block
block
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014516109A
Other languages
English (en)
Other versions
JPWO2014155451A1 (ja
Inventor
和真 榊原
清史 安倍
秀之 大古瀬
耕治 有村
博 荒川
一仁 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2014516109A priority Critical patent/JP5593468B1/ja
Application granted granted Critical
Publication of JP5593468B1 publication Critical patent/JP5593468B1/ja
Publication of JPWO2014155451A1 publication Critical patent/JPWO2014155451A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

入力画像を符号化する画像符号化装置(100)であって、入力画像に含まれる複数の画素からなる判定ブロック毎に、当該判定ブロックが文字又は線画を含む特定領域であるか否かを判定する特定領域判定部(103)と、複数の変換処理単位の中から適応的に選択された変換処理単位で、判定ブロックの直交変換を選択的に行うことで、残差係数を出力する直交変換部(105)とを備え、直交変換部(105)は、特定領域判定部(103)によって判定ブロックが特定領域であると判定された場合、常に4×4画素のブロックサイズに設定された変換処理単位毎に、判定ブロックの直交変換を選択的に行う。

Description

本開示は、符号化動作における直交変換を選択的に行うことができる画像符号化装置に関する。
近年、マルチメディアアプリケーションの発展に伴い、画像、音声及びテキストなど、あらゆるメディアの情報を統一的に扱うことが一般的になってきた。また、ディジタル化された画像は膨大なデータ量を持つため、蓄積及び伝送のためには、画像の情報圧縮技術が不可欠である。
一方で、圧縮した画像データを相互運用するためには、圧縮技術の標準化も重要である。例えば、画像圧縮技術の標準規格としては、ITU−T(国際電気通信連合 電気通信標準化部門)のH.261、H.263、H.264、及び、ISO/IEC(国際標準化機構)のMPEG−1、MPEG−3、MPEG−4、MPEG−4AVCなどがある。また、現在は、ITU−TとISO/IECとの共同によるHEVC(High Efficiency Video Coding)と呼ばれる次世代画像符号化方式の標準化活動が進んでいる。
このような画像の符号化では、符号化対象の各ピクチャを符号化単位ブロックに分割し、ブロック毎に時間方向及び空間方向の冗長性を削減することによって情報量の圧縮を行う。時間的な冗長性の削減を目的とする画面間予測符号化では、前方又は後方のピクチャを参照してブロック単位で動きの検出及び予測画像の作成を行い、得られた予測画像と符号化対象のブロックとの差分画像を取得する。また、空間的な冗長性の削減を目的とする画面内予測符号化では、周辺の符号化済みブロックの画素情報から予測画像の生成を行い、得られた予測画像と符号化対象のブロックとの差分画像を取得する。
得られた差分画像に対して離散コサイン変換等の直交変換及び量子化を行う。直交変換では、輝度成分情報及び色差成分情報を周波数成分情報に変換する。一般的に、周波数成分が高いほど、人間の目で認識しにくい情報となる。そのため、通常、量子化では高周波数領域ほど量子化の幅を粗くし、人間の目で認識しにくい情報を省略し、人間の目で劣化が分かりにくいように符号化が行われる。さらに、可変長符号化を用いて符号列を生成することで情報量が圧縮される。
HEVC(非特許文献1参照)では、前述の直交変換において、直交変換対象のブロックサイズが、4×4画素、8×8画素、16×16画素、32×32画素の4候補がある。ブロックサイズを決定する際には、符号化対象のブロック毎に、四分木構造で分割できる範囲の中で、4候補の中からコスト判定によっていずれか1つのブロックサイズを選択する。
これにより、画像の性質に応じて直交変換のサイズを適応的に切り替えることで符号化効率の向上に大きく貢献している。また、4×4画素のサイズを選択した場合に限り、直交変換を行わずに差分画像をそのまま量子化するという方法を選択することも可能となっている。
また、前述の量子化処理では、ブロック毎に設定した量子化パラメータと、ピクチャ毎に設定した量子化行列とを掛け合わせることで決定される量子化幅によって量子化が行われる。
JCTVC−L1003:High Efficiency Video Coding(HEVC) text specification draft 10(01/2013)
HEVCでは、前述の通り、直交変換のブロックサイズが4種類あり、分割方法も複雑なため、いずれか1つのサイズを選ぼうとすると、直交変換に要する演算処理量がH.264に比べ多くなる。
また、単に演算処理量を低減するために、直交変換対象のブロックを一意に定めた場合、画像の種類によっては、直交変換及び量子化により発生したノイズによって主観的な画質が低下する恐れもある。
そこで、本開示は、主観画質を向上させ、かつ、演算処理量を削減することができる画像符号化装置及び画像符号化方法を提供する。
本開示に係る画像符号化装置は、入力画像を符号化する画像符号化装置であって、入力画像に含まれる複数の画素からなる判定ブロック毎に、当該判定ブロックが文字又は線画を含む特定領域であるか否かを判定する判定部と、複数の変換処理単位の中から適応的に選択された変換処理単位で、判定ブロックの直交変換を選択的に行うことで、残差係数を出力する直交変換部とを備え、直交変換部は、判定部によって判定ブロックが特定領域であると判定された場合、4×4画素のブロックサイズに常に設定された変換処理単位毎に、判定ブロックの直交変換を選択的に行う。
本開示に係る画像符号化装置によれば、主観画質を向上させ、かつ、演算処理量を削減することができる。
図1は、実施の形態1に係る画像符号化装置を示すブロック図である。 図2は、実施の形態1に係る特定領域の判定と直交変換処理とを示すフローチャートである。 図3は、実施の形態2に係る画像符号化装置を示すブロック図である。 図4は、実施の形態2に係る特定領域の判定と直交変換処理とを示すフローチャートである。 図5は、実施の形態2の変形例に係る特定領域の判定と直交変換処理とを示すフローチャートである。 図6は、実施の形態3に係る画像符号化装置を示すブロック図である。 図7は、実施の形態3に係る特定領域の判定と直交変換処理と量子化パラメータの設定とを示すフローチャートである。 図8は、実施の形態3に係る量子化パラメータの設定を示すフローチャートである。 図9は、実施の形態4に係る画像符号化装置を示すブロック図である。 図10は、実施の形態4に係る特定領域の判定と直交変換処理と量子化パラメータの設定とを示すフローチャートである。 図11は、実施の形態4の変形例に係る特定領域の判定と直交変換処理と量子化パラメータの設定とを示すフローチャートである。
以下、適宜図面を参照しながら、実施の形態を詳細に説明する。ただし、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。
なお、発明者らは、当業者が本開示を十分に理解するために添付図面及び以下の説明を提供するのであって、これらによって請求の範囲に記載の主題を限定することを意図するものではない。
(実施の形態1)
以下、図1及び図2を用いて、実施の形態1を説明する。
[画像符号化装置全体の処理説明]
図1は、本実施の形態に係る画像符号化装置100のブロック図である。画像符号化装置100は、ピクチャ単位で入力された画像をブロックに分割し、ブロック単位で符号化処理を行うことで、符号列を生成する。
図1に示すように、画像符号化装置100は、ピクチャメモリ101と、ブロック分割部102と、特定領域判定部103と、差分演算部104と、直交変換部105と、量子化部106と、逆量子化部107と、逆直交変換部108と、加算演算部109と、予測画像生成部110と、符号列生成部111とを備える。
ピクチャメモリ101は、入力画像信号をピクチャ単位で格納する。ピクチャメモリ101は、ブロック分割部102からの読出し命令を受け付けた場合に、当該読出し命令に係る画像信号を出力する。
なお、入力画像信号は、例えば、新聞又は雑誌などの紙面の静止画を示す画像データである。あるいは、入力画像信号は、文字又は線画が多重化された映像、例えば、字幕を含む映像を示す動画像データでもよい。
ブロック分割部102は、ピクチャメモリ101から入力された画像信号を、符号化処理単位であるコーディングユニット(CU)と呼ばれる、例えば、64×64画素のブロックに分割する。
ブロック分割部102は、さらに、CUを予測画像生成の処理単位であるプレディクションユニット(PU)と呼ばれる、例えば、8×8画素のブロックに分割する。
上記においてCUは、64×64画素のブロックを説明したが、32×32画素、16×16画素、8×8画素のブロックサイズでも構わない。
上記においてPUは、8×8画素のブロックを説明したが、例えば8×16画素、8×4画素などの別のサイズでも構わない。なお、PUは、CUのブロックサイズと同じサイズ、又は、CUを2分割若しくは4分割したサイズとなる。
特定領域判定部103は、入力画像に含まれる複数の画素からなる判定ブロック毎に、当該判定ブロックが文字又は線画を含む特定領域であるか否かを判定する。具体的には、特定領域判定部103は、ブロック分割部102から出力された符号化対象ピクチャから画像特徴量を取得し、予め定められる判定ブロック毎に特定領域であるか否かを判定する。
なお、特定領域とは、文字又は線画を含む領域をいう。文字又は線画で描画された領域には、文字又は線画と背景画像との間にエッジが発生しやすい。したがって、特定領域は、エッジを含む領域でもある。
特定領域と判定された判定ブロックは、直交変換の処理単位であるトランスフォームユニット(TU)と呼ばれるブロックのサイズ(TUサイズ)として、常に4×4画素が選択される。TUサイズは、32×32画素、16×16画素、8×8画素、4×4画素のブロックがある。特定領域でないと判断された判定ブロックのTUサイズは、上記の32×32画素〜4×4画素のブロックのうち、直交変換及び量子化などの符号化効率が高くなる1つが選ばれる。
なお、TUは、CUのブロックサイズと同じサイズか、それよりも小さいブロックサイズとなる。また、以降の処理は、処理内容に応じて、CU、PU、TUのいずれかのブロック単位で処理が行われるものとする。
特定領域の判定の詳細については、後述する。
差分演算部104は、特定領域判定部103から入力されたPU単位の画像信号と、予測画像生成部110から入力されたPU単位の予測画像信号との差分値である差分画像信号を生成する。差分演算部104は、生成した差分画像信号を直交変換部105に出力する。
直交変換部105は、複数の変換処理単位の中から適応的に選択された変換処理単位で、判定ブロックの直交変換を選択的に行うことで、残差係数信号を出力する。具体的には、直交変換部105は、差分演算部104から入力される差分画像信号に、TU単位で直交変換を行うことで、残差係数信号を生成する。
なお、直交変換部105は、変換処理単位(TU)が4×4画素の場合に、直交変換を行うか否かを選択可能である。つまり、直交変換部105は、TUサイズが4×4画素の場合、直交変換を選択的に行う。
例えば、直交変換部105は、TUサイズが4×4画素の場合、差分画像信号に直交変換を行うことで、残差係数信号を生成して出力することができる(動作A)。あるいは、直交変換部105は、TUサイズが4×4画素の場合、差分画像信号に直交変換を行うことなく、差分画像信号をそのまま残差係数信号として出力することもできる(動作B)。直交変換部105は、例えば、所定のコスト判定に基づいて、動作A及び動作Bのうち符号化効率の優れた方を選択する。
直交変換部105は、特定領域判定部103によって判定ブロックが特定領域であると判定された場合、4×4画素のブロックサイズに常に設定された変換処理単位(TU)毎に、判定ブロックの直交変換を選択的に行うことで、残差係数を出力する。すなわち、直交変換部105は、判定ブロックに含まれるTU毎に、直交変換を行うか否かを判定する。直交変換部105は、TU毎に、(i)直交変換を行う場合は、差分画像信号を直交変換することで残差係数信号を生成して出力し、(ii)直交変換を行わない場合は、差分画像信号をそのまま残差係数信号として出力する。
また、直交変換部105は、特定領域判定部103によって判定ブロックが特定領域ではないと判定された場合、予め定められた複数の変換処理単位(TU)から選択された変換処理単位で、判定ブロックの直交変換を選択的に行うことで、残差係数を出力する。具体的には、直交変換部105は、判定ブロックが特定領域ではないと判定された場合、32×32画素〜4×4画素のブロックから1つのブロックを選択する。なお、4×4画素のブロックが変換処理単位として選択された場合、上述したように、直交変換部105は、直交変換を行うか否かを選択可能である。
量子化部106は、直交変換部105から入力される残差係数信号に、TU単位で量子化を行う。このとき、量子化部106は、CU単位で設定される量子化値(量子化パラメータ)及び量子化行列に従って、残差係数信号の量子化を行うことで、量子化残差係数信号を生成する。
逆量子化部107は、量子化部106から入力される量子化残差係数信号に、TU単位で逆量子化を行うことで、再構成残差係数信号を生成する。逆量子化部107は、生成した再構成残差係数信号を逆直交変換部108に出力する。
逆直交変換部108は、逆量子化部107から入力される再構成残差係数信号に、TU単位で逆直交変換を行うことで、再構成差分画像信号を生成する。そして、逆直交変換部108は、生成した再構成差分画像信号を加算演算部109に出力する。
なお、逆直交変換部108は、TUサイズが4×4画素の場合に、逆直交変換を行うか否かを選択可能である。具体的には、逆直交変換部108は、逆量子化部107から再構成残差係数信号が入力された場合、再構成残差係数信号が直交変換部105において直交変換したものである場合、再構成残差係数信号を逆直交変換することで、再構成差分画像信号を生成して出力する。また、逆直交変換部108は、再構成残差係数信号が直交変換部105において直交変換せずに得られたものである場合、再構成残差係数信号を逆直交変換せずにそのまま再構成差分画像信号として加算演算部109に出力する。
加算演算部109は、逆直交変換部108から入力される再構成差分画像信号と、予測画像生成部110から入力される予測画像信号とをPU単位で加算することにより、再構成画像信号を生成する。
予測画像生成部110は、特定領域判定部103から入力されたPU単位の画像信号に、加算演算部109から入力される再構成画像信号を用いて、PU単位で画面内予測(イントラ予測)又は画面間予測(インター予測)を行うことで、予測画像を生成する。予測画像生成部110は、画面間予測を用いる場合は、既に符号化済みの過去のピクチャの再構成画像信号を用いる。一方、予測画像生成部110は、画面内予測を用いる場合は、符号化対象のPUに隣接する既に符号化済みの同じピクチャの再構成画像信号を用いる。なお、画像符号化装置100に入力される入力画像が1枚のピクチャのみから構成される静止画である場合は、過去のピクチャが存在しないため、常に画面内予測のみが用いられる。
符号列生成部111は、量子化部106から入力された量子化残差係数信号、量子化行列信号、及び、その他の復号化処理時に必要となる符号化情報信号に、可変長符号化及び算術符号化を行うことで、符号列を生成する。
[特定領域判定部及び直交変換部]
ここで、特定領域判定部103及び直交変換部105が行う処理について、図2を用いて具体的に説明する。図2は、本実施の形態に係る特定領域の判定と直交変換処理とを示すフローチャートである。
まず、特定領域判定部103は、入力画像に含まれる複数の画素からなる判定ブロック毎に、当該判定ブロックが文字又は線画を含む特定領域であるか否かを判定する(S110)。具体的には、特定領域判定部103は、ブロック分割部102から出力された符号化対象ブロック(CU)に含まれる判定ブロックから画像特徴量を算出して、当該判定ブロックが特定領域であるか否かを判定する。
ここで、特定領域判定部103は、例えば、輝度成分に基づく情報を画像特徴量として算出する。文字又は線画の輝度成分は、一般的に、高輝度と低輝度とに大きく集中し、小さな範囲で輝度が極端に変化する。したがって、隣接する画素間の輝度成分の傾斜は、大きくなる傾向がある。
特定領域判定部103は、例えば、隣接する画素間の輝度差を画像特徴量として算出する。特定領域判定部103は、判定ブロックの中における画素の割合であって、隣接する画素間の輝度差が大きい画素の割合が、所定の割合以上の場合は、当該判定ブロックが特定領域であると判定する。
具体的には、特定領域判定部103は、隣接する画素間の輝度値の差分を算出する。そして、特定領域判定部103は、算出した差分が予め定められた第1閾値より大きいか否かを判定する。第1閾値より大きいと判定した場合、当該隣接する画素は、輝度差が大きい画素であると判定する。特定領域判定部103は、判定ブロックに含まれる全ての画素に対して、輝度値の差分と第1閾値との比較を行う。第1閾値は、例えば、輝度値の最小値と最大値との差の50%以上の値である。
さらに、特定領域判定部103は、輝度差が大きい画素と判定した画素が、判定ブロックの中で占める割合を算出する。そして、特定領域判定部103は、算出した割合が所定の割合(第2閾値)以上であるか否かを判定する。例えば、特定領域判定部103は、画素の割合が第2閾値以上であるか否かを判定する。画素の割合が第2閾値以上である場合、特定領域判定部103は、判定ブロックが特定領域であると判定する。第2閾値は、例えば、20%以上の値である。
なお、上記においては、輝度成分を画像特徴量の基準としたが、符号化対象ピクチャから算出される情報であればどのような基準でも構わない。
また、特定領域判定部103は、判定ブロックのサイズを、例えば、8×8画素に設定する。本実施の形態では、後述するように特定領域と判定された判定ブロックを4×4画素の変換処理単位で直交変換する。このため、判定ブロックのサイズは、4×4画素以上の大きさであればよい。しかし、判定ブロックが4×4画素の場合、1つの判定ブロックあたりの画素サンプル数が少なく、ノイズに影響され誤判定が多くなる。したがって、特定領域を判断する判定ブロックは、8×8画素からなるブロックであることが好ましい。
判定ブロックが特定領域であると判定した場合(S110でYes)、特定領域判定部103は、TUサイズとして4×4画素ブロックを常に選択する(S120)。一方、判定ブロックが特定領域でないと判断した場合(S110でNo)、特定領域判定部103は、32×32画素〜4×4画素のうちいずれか1つをTUサイズとして選択する(S130)。TUサイズは、例えば、符号化対象ブロックに基づいて判断され、例えば、複雑な画像に対しては小さなTUサイズが、簡単な画像に対しては大きなTUサイズが選ばれる。
直交変換部105は、選択されたTU毎に判定ブロックの直交変換を選択的に行う(S140)。例えば、直交変換部105は、TUサイズが4×4画素の場合に、直交変換を行うことを選択した場合は、差分画像信号を直交変換することで、残差係数信号を生成して出力する。また、直交変換部105は、TUサイズが4×4画素の場合に、直交変換を行わないことを選択した場合は、差分画像信号をそのまま残差係数信号として出力する。また、直交変換部105は、TUサイズが4×4画素ではない場合、差分画像信号を必ず直交変換することで、残差係数信号を生成して出力する。なお、直交変換部105は、特定領域判定部103から出力されるTUを受け取ることで、TUサイズが4×4画素であるか否かを判定する。
なお、上記の説明では、TUサイズとして4×4画素を選択する処理では、特定領域判定部103がTUサイズを決める場合について説明したが、これに限らない。例えば、ブロック分割部102がTUサイズを決定した後で、特定領域判定部103がTUサイズを上書きすることで4×4画素に決定しても構わない。また、上記の説明では、ブロック分割部102が各々のブロックサイズを決めていたが、特定領域判定部103が決定したTUのサイズに応じてCU及びPUのサイズを決めても構わない。
また、上記の説明では判定ブロックサイズを8×8画素としたが、4×4画素以上のサイズであれば、それ以外の予め定められたサイズでも構わない。この予め定められたサイズは、取得した入力画像内の1文字に占める画素数に依存して設定しても構わない。
具体的には、特定領域判定部103は、入力画像内の1文字が1つの判定ブロックに収まるように判定ブロックサイズを決定してもよい。入力画像内の文字のサイズは、入力画像の画面解像度に依存する。例えば、雑誌又は新聞などを符号化する場合において、画面解像度が決定した場合、文字のサイズも自ずと決定することが多い。したがって、画面解像度に応じて判定ブロックを設定することで、1文字が1つの判定ブロックに収まるようにすることができる。
したがって、例えば、特定領域判定部103は、入力画像の画面解像度に応じて判定ブロックサイズを決定してもよい。具体的には、特定領域判定部103は、入力画像の画面解像度が1920×1080(フルHD)以上、3840×2160(4K2K)以下である場合に、判定ブロックサイズを8×8画素に決定してもよい。これにより、8×8画素の判定ブロック内に1文字が収まるようにすることができる。なお、この場合、エッジを含む判定ブロックの数を減らすこともできる。
また、特定領域判定部103は、判定ブロックサイズをCUサイズなどの、入力画像に対して非固定のサイズに決定しても構わない。つまり、特定領域判定部103は、判定ブロックのサイズをN×N画素(Nは4以上の整数)に設定してもよい。一例として、Nは8である。
以上のように、特定領域判定部103によって、特定領域であると判定された判定ブロックのTUサイズが常に4×4画素ブロックに限定される。特定領域では、文字又は線画に接する周辺で高周波成分が多い。直交変換と量子化とにより、高周波成分の情報が失われやすくなるため、文字又は線画に接する周辺でノイズが発生しやすい。
そこで、4×4画素という小さなブロックサイズを用いて直交変換及び量子化を行うことで、ノイズの発生を小さなブロックに留めることができる。したがって、ブロックサイズが大きい場合より、符号化対象ピクチャ内における文字又は線画の領域に対する主観画質を向上させることができる。
また、通常、TUサイズは4種類あり、複雑な分割方法によって決定される。このため、TUサイズを決定する際には、演算処理量が多くなる。しかし、特定領域を判定することにより、特定領域であると判定された判定ブロックのTUサイズを常に4×4画素ブロックと一意に設定することで、処理を省くことができる。そのため、文字又は線画の多い入力画像ほど演算処理量を大幅に削減できる。
[まとめ]
本実施の形態に係る画像符号化装置は、入力画像を符号化する画像符号化装置100であって、入力画像に含まれる複数の画素からなる判定ブロック毎に、当該判定ブロックが文字又は線画を含む特定領域であるか否かを判定する特定領域判定部103と、複数の変換処理単位の中から適応的に選択された変換処理単位で、判定ブロックの直交変換を選択的に行うことで、残差係数を出力する直交変換部105とを備え、直交変換部105は、特定領域判定部103によって判定ブロックが特定領域であると判定された場合、4×4画素のブロックサイズに常に設定された変換処理単位毎に、判定ブロックの直交変換を選択的に行う。
このように、特定領域であると判定された判定ブロックでは、常に4×4画素のサイズで直交変換を行い、特定領域ではないと判定された判定ブロックでは、予め定められた複数のTUサイズの中から選択されたTUサイズで直交変換を行う。このとき、特定領域は、高周波成分が多いので、量子化によってノイズが発生しやすい領域である。しかしながら、発生したノイズは、4×4画素という小さなサイズに抑えられているので、主観的な画質を向上させることができる。
また、判定ブロックが特定領域であると判定された場合、当該判定ブロックのTUサイズとして常に4×4画素が一意的に決定されるので、TUサイズの決定に要する処理を省くことができ、演算処理量を削減することができる。このように、適したサイズで直交変換が行われることで、特定領域の高画質化が実現し、また、特定領域においてTUサイズを一意に決定できるため、演算処理量が削減できる。
(実施の形態2)
以下では、図3及び図4を用いて、実施の形態2を説明する。
[画像符号化装置全体の処理説明]
図3は、本実施の形態に係る画像符号化装置200のブロック図である。画像符号化装置200は、ピクチャ単位で入力された画像をブロックに分割し、ブロック単位で符号化処理を行うことで、符号列を生成する。なお、実施の形態2において、実施の形態1と異なる点を中心に説明し、同一の構成については、説明を省略する場合がある。
図3に示すように、本実施の形態に係る画像符号化装置200は、図1に示す画像符号化装置100と比べて、特定領域判定部103及び直交変換部105の代わりに、特定領域判定部203及び直交変換部205を備える点が異なっている。
特定領域判定部203は、実施の形態1に示す動作に加えて、判定ブロックが特定領域であるか否かを判定した結果を直交変換部205に出力する。
直交変換部205は、特定領域判定部203によって判定ブロックが特定領域ではないと判定された場合、判定ブロックの直交変換を必ず実行する。具体的には、直交変換部205は、特定領域判定部203から判定結果を受け取り、受け取った判定結果に基づいて直交変換を行うか否かを決定する。
HEVCでは、TUサイズが4×4画素の場合に限り、直交変換を行うか否かを選択可能である。しかしながら、本実施の形態では、特定領域判定部203によって判定ブロックが特定領域ではないと判定された場合に、TUサイズとして4×4画素のブロックが選択された場合であっても、直交変換部205は、必ず直交変換を実行する。
一方で、特定領域判定部203によって判定ブロックが特定領域であると判定された場合には、TUサイズとして常に4×4画素が選択される。この場合は、直交変換部205は、直交変換を選択的に実行することができる。
[特定領域判定部及び直交変換部]
ここで、本実施の形態に係る特定領域判定部203及び直交変換部205における処理について、図4を用いて具体的に説明する。図4は、本実施の形態に係る特定領域の判定と直交変換処理とを示すフローチャートである。
ここで、TUのサイズを決定するまでの処理(S110〜S130)は、図2と同じであるため、説明を省略する。
判定ブロックが特定領域であると判定された場合(S110でYes)、判定ブロックのTUサイズとして常に4×4画素が選択される(S120)。このとき、直交変換部205は、4×4画素ブロック毎に判定ブロックに直交変換を選択的に実行する(S140)。
例えば、直交変換部205は、直交変換しない場合よりも直交変換した場合に得られる再構成画像と入力画像との差分が小さい場合、直交変換の実行を選択する。一方で、直交変換部205は、直交変換する場合よりも直交変換しない場合に得られる再構成画像と入力画像との差分が小さい場合、直交変換を実行しないことを選択する。このように、直交変換部205は、判定ブロックが特定領域であると判定された場合は、実施の形態1と同様にして、直交変換を選択的に実行する。
一方で、判定ブロックが特定領域ではないと判定された場合(S120でNo)、判定ブロックのTUサイズとして4×4画素〜32×32画素のうちいずれか1つが選択される。この場合、直交変換部205は、選択されたTUサイズで常に直交変換を行う(S250)。
例えば、直交変換部205は、TUサイズとして4×4画素が選択された場合は、通常であれば、直交変換を実行するか否かを選択可能である。しかしながら、直交変換を行うか否かを全ての4×4画素のブロックで判定することは、多大な演算処理量を必要とする。
これに対して、本実施の形態に係る直交変換部205は、判定ブロックが特定領域ではないと判定された場合に、TUサイズが4×4画素が選択されたとしても、直交変換を必ず実行する。これにより、直交変換を行うか否かを決定するのに要する演算処理量を削減することができる。
特定領域ではないと判定された判定ブロックは、文字又は線画を含まない領域、例えば、自然画などである。このため、直交変換及び量子化によって高周波成分が失われたとしても、主観的には目立たない。つまり、主観的な画質は劣化しない。
一方で、特定領域であると判定された領域は、文字又は線画を含む領域であるので、上述したように、高周波成分が失われた場合には、ノイズが目立ち、主観的な画質が劣化する場合がある。このため、直交変換を行わない方が主観的な画質が良い場合は、直交変換部205が直交変換を行わないと選択することで、主観的な画質を向上させることができる。
以上のように、特定領域判定部203及び直交変換部205によって、判定ブロックが文字又は線画を含む特定領域である場合、判定ブロックのTUサイズを常に4×4画素ブロックとして一意に設定できる。さらに、特定領域に対してのみ直交変換を行うか否かを切り替えて動作させることができる。
HEVCでは、4×4画素ブロックにおいて、直交変換を行うか否かを切り替えることができ、高画質化に効果的である。しかしながら、全ての4×4画素ブロックで直交変換を行うか否かを切り替えた場合、処理量が大幅に増加する。
そこで、本実施の形態のように、直交変換を行うか否かを切り替えると効果の大きい特定領域である場合にのみ、選択的な直交変換を行うことで、処理量を大幅に増加させることなく、適した直交変換及び量子化処理が行うことができる。これにより、符号化対象ピクチャ内における特定領域に対して高い符号化効率を得ることができ、符号化後における画像の主観画質の向上及び演算処理量の増加を抑制させることができる。
また、特定領域でない領域では、周波数成分が特定の成分に集中せず広がりを持つ。そのため、常に直交変換を行うことで、符号化効率を向上させることができる。
[まとめ]
本実施の形態に係る画像符号化装置では、直交変換部205は、特定領域判定部203によって判定ブロックが特定領域ではないと判定された場合、判定ブロックの直交変換を必ず実行する。
これにより、特定領域ではないと判定された場合には直交変換を必ず実行するので、直交変換を行うか否かを決定するのに要する処理量を削減することができる。一方で、特定領域であると判定された場合には、主観画質が向上するように選択的に直交変換を行うことができる。このように、必要な場合にのみ、適応的に直交変換を行うか否かを切り替えることができるため、演算処理量を抑えつつ、主観画質の向上及び符号化効率の向上を実現できる。
なお、例えば、図5に示すように、判定ブロックが特定領域であると判定された場合にも(S110でYes)、直交変換部205は、4×4画素ブロック毎に判定ブロックに直交変換を必ず実行してもよい。なお、図5は、本実施の形態の変形例に係る特定領域の判定と直交変換処理とを示すフローチャートである。
図5に示すように、判定ブロックが特定領域であると判定された場合(S110でYes)、及び、判定ブロックが特定領域ではないと判定された場合(S110でNo)のいずれの場合でも、直交変換部205は、設定された変換処理単位毎に、判定ブロックの直交変換を必ず実行する(S250)。つまり、特定領域判定部203の判定結果によらず、直交変換部205は、直交変換を必ず実行してもよい。言い換えると、判定ブロックが特定領域であるか否かに関わらず、直交変換部205は、直交変換を必ず実行してもよい。
このように、本実施の形態の変形例に係る画像符号化装置では、直交変換部205は、特定領域判定部203によって判定ブロックが特定領域であると判定された場合、4×4画素のブロックサイズに常に設定された変換処理単位毎に、判定ブロックの直交変換を必ず実行する。
これにより、4×4画素ブロックで直交変換を行うか否かを判定するのに要する処理を削減することができるので、演算処理量を削減することができる。
(実施の形態3)
以下では、図6〜図8を用いて、実施の形態3を説明する。
[画像符号化装置全体の処理説明]
図6は、本実施の形態に係る画像符号化装置300のブロック図である。画像符号化装置300は、ピクチャ単位で入力された画像をブロックに分割し、ブロック単位で符号化処理を行うことで、符号列を生成する。なお、実施の形態3において、実施の形態1と異なる点を中心に説明し、同一の構成については、説明を省略する場合がある。
図6に示すように、本実施の形態に係る画像符号化装置300は、図1に示す画像符号化装置100と比べて、特定領域判定部103の代わりに特定領域判定部303を備える点と、新たに量子化パラメータ設定部312を備える点とが異なっている。
なお、特定領域判定部303は、実施の形態1に示す動作に加えて、判定ブロックが特定領域であるか否かを判定した結果を量子化パラメータ設定部312に出力する。
量子化パラメータ設定部312は、特定領域判定部303から出力される判定結果を用いて、量子化部106で利用する量子化パラメータの設定を行う。
具体的には、量子化パラメータ設定部312は、予め定められた基準に基づいて量子化パラメータを所定の処理単位で設定する。例えば、量子化パラメータ設定部312は、レート制御などに基づいて量子化パラメータを所定の処理単位で設定する。具体的には、量子化パラメータ設定部312は、生成される符号列が所定のビットレートに近づくように量子化パラメータを設定する。ここで、所定の処理単位は、量子化パラメータを変更可能な処理単位である。例えば、所定の処理単位は、判定ブロックである。
さらに、量子化パラメータ設定部312は、判定ブロックが特定領域である場合に、設定した量子化パラメータをより大きな値に再設定する。言い換えると、量子化パラメータ設定部312は、判定ブロックが特定領域である場合、判定ブロックが特定領域ではないと判定された場合に設定される量子化パラメータの値Q2より大きな値であるQ1に、量子化パラメータを設定する。
そして、量子化パラメータ設定部312は、設定した量子化パラメータを量子化部106に出力する。
量子化部106は、直交変換部105から入力される残差係数信号に対してTU単位で量子化を行う。このとき、量子化部106は、量子化パラメータ設定部312で設定される量子化値(量子化パラメータ)及び量子化行列を用いて量子化を行うことで、量子化残差係数信号を生成する。量子化部106の詳細については、後述する。
逆量子化部107は、量子化部106から入力される量子化残差係数信号に、当該量子化残差係数信号が量子化部106において量子化された際に用いられた量子化値(量子化パラメータ)及び量子化行列を用いて逆量子化することで、量子化残差係数信号を逆直交変換部108に出力する。
[特定領域判定部、直交変換部及び量子化パラメータ設定部]
続いて、本実施の形態に係る特定領域判定部303、直交変換部105及び量子化パラメータ設定部312における処理について、図7及び図8を用いて具体的に説明する。図7は、本実施の形態に係る特定領域の判定と直交変換処理と量子化パラメータの設定とを示すフローチャートである。
ここで、TUのサイズの決定(S110〜S130)と、直交変換(S140)とは、図2と同じであるため、説明を省略する。
判定ブロックが特定領域であると判定された場合(S110でYes)、量子化パラメータ設定部312は、量子化パラメータをQ1に設定する(S360)。
一方、判定ブロックが特定領域ではないと判定された場合(S110でNo)、量子化パラメータ設定部312は、量子化パラメータをQ2に設定する(S370)。
量子化パラメータは、例えば、判定ブロック毎に設定される。量子化パラメータ設定部312は、判定ブロックが特定領域であるか否かに応じて、量子化パラメータを設定する。例えば、判定ブロックが特定領域である場合、判定ブロックの量子化に用いる量子化パラメータをQ1に、判定ブロックが特定領域ではない場合、判定ブロックの量子化に用いる量子化パラメータをQ2に設定する。
Q1は、Q2以上の値に設定される。Q2は、特定領域と判定されない場合に設定される値であり、レート制御などに基づいて決定される値である。これに対して、量子化パラメータ設定部312は、レート制御などに基づいて決定されたQ2に、オフセットを加えることで、Q2より大きな値になるQ1を量子化パラメータとして設定する。これにより、特定領域と判定された判定ブロックを、粗く量子化することができる。
判定ブロックが特定領域である場合、TUサイズが常に4×4画素に設定される。これにより、特定領域の高画質化が実現しているが、TUがたくさん存在するため、オーバーヘッドが大きくなり、符号量増加につながる。そこで、特定領域の量子化パラメータを特定領域でない領域の量子化パラメータよりも大きな値に設定することで、符号量の増加を抑制することが可能となる。特定領域では、TUサイズが4×4画素の小さいブロックであるため、予測方向が当たりやすく、予測精度が高い。例えば、符号化対象の入力画像が自然画などの複雑な画像である場合でも、TUサイズが4×4画素の小さいブロックサイズであるために、TUは、単純な直線などの画像になる。このため、予測精度が高くなって、残差成分を減らすことができるため、粗く量子化しても画質が劣化しにくい。
なお、上記の説明においては、判定ブロック毎に量子化パラメータを設定したが、量子化パラメータを設定する処理単位である所定の処理単位のサイズは、どのような基準でも構わない。例えば、所定の処理単位は、複数の判定ブロックから構成されてもよい。例えば、所定の処理単位は、CUでもよい。
この場合、所定の処理単位には、判定ブロックが少なくとも1つ以上含まれる。つまり、所定の処理単位が判定ブロックのサイズ以上の大きさである。このように、複数の判定ブロックをまとめる場合、量子化パラメータ設定部312は、所定の処理単位内における特定領域であると判定された判定ブロックの割合に基づいて量子化パラメータを設定する。具体的には、量子化パラメータ設定部312は、所定の処理単位内における特定領域と判定された判定ブロックの割合が予め定められた閾値より大きい場合、予め定められた基準に基づいて決定される量子化値を、より大きな値に設定する。
例えば、所定の処理単位のサイズが32×32画素であり、その中に16個の8×8画素の判定ブロックが含まれている場合を想定する。このとき、16個の判定ブロックのうち特定領域と判定された判定ブロックが8個以上存在すると判定した場合に、量子化パラメータ設定部312は、特定領域と判定された判定ブロックが7個以下存在すると判定した場合に比べて、量子化パラメータを大きくする。
ここで、量子化パラメータの設定方法の一例について、図8を用いて説明する。図8は、本実施の形態に係る量子化パラメータの設定を示すフローチャートである。
まず、量子化パラメータ設定部312は、予め定められた基準に基づいて量子化パラメータをQ2に設定する(S361)。例えば、量子化パラメータ設定部312は、レート制御などに基づいて量子化パラメータを決定する。
次に、量子化パラメータ設定部312は、所定の処理単位内における特定領域と判定された判定ブロックの割合が、予め定められた閾値より大きいか否かを判定する(S362)。
特定領域と判定された判定ブロックの割合が閾値より大きい場合(S362でYes)、量子化パラメータ設定部312は、Q2にオフセットを加えることで、Q2より大きい値であるQ1を量子化パラメータとして設定する(S363)。特定領域と判定された判定ブロックの割合が閾値以下である場合(S362でNo)、量子化パラメータ設定部312は、Q2に設定された量子化パラメータをそのまま量子化部106に出力する。
このように、量子化パラメータ設定部312は、特定領域と判定された判定ブロックの割合が閾値より大きい場合の量子化パラメータとして、特定領域と判定された判定ブロックの割合が閾値以下である場合の量子化パラメータより大きな値を設定する。
[まとめ]
本実施の形態に係る画像符号化装置300は、特定領域判定部303によって特定領域であると判定された判定ブロックの量子化パラメータを、当該判定ブロックが特定領域ではないと判定された場合に設定される量子化パラメータより大きな値に設定する量子化パラメータ設定部312と、量子化パラメータ設定部312によって設定された量子化値を用いて残差係数を量子化する量子化部106とを備える。
これにより、特定領域であると判定された判定ブロックの量子化パラメータを、特定領域でないと判定された場合に設定される量子化パラメータより大きな値にするので、特定領域と判定された判定ブロックの符号量を削減することができる。また、特定領域と判定された判定ブロックは、TUサイズとして4×4画素、すなわち、小さいブロックが選択されるので、画質の劣化は目立ちにくい。したがって、特定領域の主観画質の劣化を抑制し、かつ、符号量を削減することができる。
また、本実施の形態に係る画像符号化装置300は、量子化値を設定する処理単位である所定の処理単位が判定ブロックのサイズ以上である場合において、所定の処理単位内における特定領域であると判定された判定ブロックの割合が予め定められた閾値より大きい場合の量子化パラメータを、所定の処理単位内における特定領域と判定された判定ブロックの割合が閾値以下である場合の量子化パラメータより大きな値に設定する量子化パラメータ設定部312と、量子化パラメータ設定部312によって設定された量子化値を用いて残差係数を量子化する量子化部106とを備えてもよい。
これにより、特定領域の割合が大きい領域の量子化パラメータを、特定領域の割合が小さい領域の量子化パラメータより大きな値にするので、特定領域の割合が大きい領域の符号量を削減することができる。
(実施の形態4)
以下では、図9及び図10を用いて、実施の形態4を説明する。
なお、実施の形態4は、上述した実施の形態2と実施の形態3とを組み合わせた実施の形態である。
[画像符号化装置全体の処理説明]
図9は、実施の形態の変形例に係る画像符号化装置400のブロック図である。画像符号化装置400は、ピクチャ単位で入力された画像をブロックに分割し、ブロック単位で符号化処理を行うことで、符号列を生成する。なお、実施の形態4において、実施の形態2及び3と異なる点を中心に説明し、同一の構成については、説明を省略する場合がある。
図9に示すように、画像符号化装置400は、図6に示す実施の形態3に係る画像符号化装置300と比べて、直交変換部105の代わりに直交変換部205を備える点が異なっている。直交変換部205は、実施の形態2に係る直交変換部205と同一の構成である。
[特定領域判定部、直交変換部及び量子化パラメータ設定部]
続いて、本実施の形態に係る特定領域判定部303、直交変換部205及び量子化パラメータ設定部312における処理について、図10を用いて説明する。図10は、実施の形態の変形例に係る特定領域の判定と直交変換処理と量子化パラメータの設定とを示すフローチャートである。
図10に示すように、TUのサイズを決定するまでの処理(S110〜S130)と、直交変換の選択的な実行(S140)及び直交変換の実行(S250)とは、実施の形態2で説明した図4と同じである。量子化パラメータの設定(S360及びS370)は、実施の形態3で説明した図8と同じである。
[まとめ]
以上のように、本実施の形態に係る画像符号化装置400では、特定領域であると判定された判定ブロックには、TUサイズとして選択された4×4画素のブロック毎に、直交変換が選択的に実行される。さらに、特定領域であると判定された判定ブロックの量子化に用いる量子化パラメータは、特定領域ではないと判定された場合に設定される量子化パラメータの値Q2より大きな値であるQ1に設定される。
これにより、例えば、4×4画素のブロックに直交変換が実行されない場合、量子化の対象となる残差係数は、周波数領域ではなく空間領域の値である。具体的には、残差係数は、輝度値の差分を示している。空間領域で量子化が行われるので、高周波成分が失われるという影響は現れず、画質の劣化を抑制することができる。
また、特定領域は文字又は線画を含む領域であるので、自然画に比べてイントラ予測の精度もよく、残差係数は小さな値になる場合が多い。このため、TUのブロック数は多くなるが、1つのTUの符号量を削減することができ、全体としての符号量を抑制することもできる。このとき、特定領域と判定された判定ブロックに対する量子化パラメータを大きくするので、1つのTUの符号量をさらに削減することができる。
また、TUサイズが4×4画素の小さいブロックであるため、予測方向が当たりやすく、予測精度が高い。例えば、符号化対象の入力画像が自然画などの複雑な画像である場合でも、TUサイズが4×4画素の小さいブロックサイズであるために、TUは、単純な直線などの画像になり、予測精度が高くなる。
一方で、特定領域ではないと判定された判定ブロックでは、直交変換が必ず実行される。特定領域ではないと判定された判定ブロックは、自然画などの複雑な画像である。このため、直交変換及び量子化によって高周波成分が失われたとしても、主観的な画質の劣化は抑制される。したがって、主観的な画質を劣化させることなく、直交変換を行うか否かを決定するのに要する処理量を削減することができる。
以上のように、本実施の形態に係る画像符号化装置400によれば、主観画質を向上させ、かつ、演算処理量を削減することができる。
なお、実施の形態2の変形例と同様に、例えば、図11に示すように、判定ブロックが特定領域であると判定された場合にも(S110でYes)、直交変換部205は、4×4画素ブロック毎に判定ブロックに直交変換を必ず実行してもよい。なお、図11は、本実施の形態の変形例に係る特定領域の判定と直交変換処理とを示すフローチャートである。
図11に示すように、判定ブロックが特定領域であると判定された場合(S110でYes)、及び、判定ブロックが特定領域ではないと判定された場合(S110でNo)のいずれの場合でも、直交変換部205は、設定された変換処理単位毎に、判定ブロックの直交変換を必ず実行する(S250)。つまり、特定領域判定部203の判定結果によらず、直交変換部205は、直交変換を必ず実行してもよい。言い換えると、判定ブロックが特定領域であるか否かに関わらず、直交変換部205は、直交変換を必ず実行してもよい。
これにより、実施の形態2の変形例と同様に、4×4画素ブロックで直交変換を行うか否かを判定するのに要する処理を削減することができるので、演算処理量を削減することができる。
(他の実施の形態)
以上のように、本出願において開示する技術の例示として、実施の形態1〜4を説明した。しかしながら、本開示における技術は、これに限定されず、適宜、変更、置き換え、付加、省略などを行った実施の形態にも適用可能である。また、上記実施の形態1〜4で説明した各構成要素を組み合わせて、新たな実施の形態とすることも可能である。
例えば、実施の形態2の変形例及び実施の形態4の変形例において、判定ブロックが特定領域であるか否かに関わらず、直交変換部205は、設定された変換処理単位毎に、判定ブロックに直交変換を必ず実行する例について説明したが、これに限らない。例えば、実施の形態2とは逆に、直交変換部205は、判定ブロックが特定領域であると判定された場合(S110でYes)に、直交変換を必ず実行し、判定ブロックが特定領域ではないと判定された場合(S110でNo)に、直交変換を選択的に実行してもよい。この場合においても、判定ブロックが特定領域であると判定された場合には、直交変換を行うか否かを判定するのに要する処理を削減することができるので、演算処理量を削減することができる。
実施の形態1〜4では、各実施の形態に係る画像符号化装置が利用する符号化規格としてHEVC規格を説明した。符号化規格は、直交変換を選択的に実行できればよい。したがって、符号化規格は、HEVC規格に限定されない。
さらに、上記実施の形態で示した画像符号化装置に含まれる各手段と同等の機能を備えるプログラムを、フレキシブルディスク等の記録媒体に記録するようにすることにより、上記実施の形態で示した処理を、独立したコンピュータシステムにおいて簡単に実施することが可能となる。なお、記録媒体としてはフレキシブルディスクに限らず、光ディスク、ICカード、ROM(Read Only Memory)カセット等、プログラムを記録できるものであれば同様に実施することができる。
また、上記実施の形態で示した画像符号化装置に含まれる各手段と同等の機能を集積回路であるLSIとして実現してもよい。これらは一部又は全てを含むように1チップ化されてもよい。またLSIは集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサで実現しても良い。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用してもよい。
さらには、半導体技術の進歩又は派生する別技術によりLSIなどに置き換わる集積回路の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。
具体的には、本開示に係る画像符号化装置100、200、300及び400を構成する各構成要素(ピクチャメモリ101と、ブロック分割部102と、特定領域判定部103、203及び303と、差分演算部104と、直交変換部105及び205と、量子化部106と、逆量子化部107と、逆直交変換部108と、加算演算部109と、予測画像生成部110と、符号列生成部111と、量子化パラメータ設定部312と)は、CPU(Central Processing Unit)、RAM(Random Access Memory)、ROM、通信インターフェース、I/Oポート、ハードディスク、ディスプレイなどを備えるコンピュータ上で実行されるプログラムなどのソフトウェアで実現されてもよく、電子回路などのハードウェアで実現されてもよい。
また、上記実施の形態に係る、画像符号化装置、又はその変形例の機能のうち少なくとも一部を組み合わせてもよい。
以上のように、本開示における技術の例示として、実施の形態を説明した。そのために、添付図面及び詳細な説明を提供した。
したがって、添付図面及び詳細な説明に記載された構成要素の中には、課題解決のために必須な構成要素だけでなく、上記技術を例示するために、課題解決のためには必須でない構成要素も含まれ得る。そのため、それらの必須ではない構成要素が添付図面や詳細な説明に記載されていることをもって、直ちに、それらの必須ではない構成要素が必須であるとの認定をするべきではない。
また、上述の実施の形態は、本開示における技術を例示するためのものであるから、請求の範囲又はその均等の範囲において種々の変更、置き換え、付加、省略などを行うことができる。
本開示は、例えば、新聞又は雑誌等の紙面を静止画の画像データとして入力し、符号化処理を行うことで静止画像符号列として出力する画像符号化装置に有用である。また、文字又は図が多重化された映像を動画の画像データとして入力し、符号化処理を行うことで動画像符号列として出力する画像符号化装置として有用である。
100、200、300、400 画像符号化装置
101 ピクチャメモリ
102 ブロック分割部
103、203、303 特定領域判定部
104 差分演算部
105、205 直交変換部
106 量子化部
107 逆量子化部
108 逆直交変換部
109 加算演算部
110 予測画像生成部
111 符号列生成部
312 量子化パラメータ設定部

Claims (8)

  1. 入力画像を符号化する画像符号化装置であって、
    前記入力画像に含まれる複数の画素からなる判定ブロック毎に、当該判定ブロックが文字又は線画を含む特定領域であるか否かを判定する判定部と、
    複数の変換処理単位の中から適応的に選択された変換処理単位で、前記判定ブロックの直交変換を選択的に行うことで、残差係数を出力する直交変換部とを備え、
    前記直交変換部は、前記判定部によって前記判定ブロックが前記特定領域であると判定された場合、4×4画素のブロックサイズに常に設定された変換処理単位毎に、前記判定ブロックの直交変換を選択的に行う
    画像符号化装置。
  2. 前記直交変換部は、前記判定部によって前記判定ブロックが前記特定領域ではないと判定された場合、前記判定ブロックの直交変換を必ず実行する
    請求項1に記載の画像符号化装置。
  3. 前記直交変換部は、前記判定部によって前記判定ブロックが前記特定領域であると判定された場合、4×4画素のブロックサイズに常に設定された変換処理単位毎に、前記判定ブロックの直交変換を必ず実行する
    請求項1又は2に記載の画像符号化装置。
  4. 前記判定部は、さらに、前記判定ブロックのサイズをN×N画素(Nは4以上の整数)に設定する
    請求項1〜3のいずれか1項に記載の画像符号化装置。
  5. 前記Nは、8である
    請求項4に記載の画像符号化装置。
  6. 前記画像符号化装置は、さらに、
    前記判定部によって前記特定領域であると判定された判定ブロックの量子化パラメータを、当該判定ブロックが前記特定領域ではないと判定された場合に設定される量子化パラメータより大きな値に設定する設定部と、
    前記設定部によって設定された量子化値を用いて前記残差係数を量子化する量子化部とを備える
    請求項1〜5のいずれか1項に記載の画像符号化装置。
  7. 前記画像符号化装置は、さらに、
    量子化値を設定する処理単位である所定の処理単位が前記判定ブロックのサイズ以上である場合において、前記所定の処理単位内における前記特定領域であると判定された判定ブロックの割合が予め定められた閾値より大きい場合の量子化パラメータを、前記所定の処理単位内における前記特定領域と判定された判定ブロックの割合が前記閾値以下である場合の量子化パラメータより大きな値に設定する設定部と、
    前記設定部によって設定された量子化値を用いて前記残差係数を量子化する量子化部とを備える
    請求項1〜5のいずれか1項に記載の画像符号化装置。
  8. 入力画像を符号化する画像符号化方法であって、
    前記入力画像に含まれる複数の画素からなる判定ブロック毎に、当該判定ブロックが文字又は線画を含む特定領域であるか否かを判定し、
    複数の変換処理単位の中から適応的に選択された変換処理単位で、前記判定ブロックの直交変換を選択的に実行することで、残差係数を出力し、
    前記直交変換の選択的な実行では、
    前記判定ブロックが前記特定領域であると判定された場合、4×4画素のブロックサイズに常に設定された変換処理単位毎に、前記判定ブロックの直交変換を選択的に行う
    画像符号化方法。
JP2014516109A 2013-03-27 2013-12-02 画像符号化装置及び画像符号化方法 Active JP5593468B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014516109A JP5593468B1 (ja) 2013-03-27 2013-12-02 画像符号化装置及び画像符号化方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2013065876 2013-03-27
JP2013065876 2013-03-27
PCT/JP2013/007050 WO2014155451A1 (ja) 2013-03-27 2013-12-02 画像符号化装置及び画像符号化方法
JP2014516109A JP5593468B1 (ja) 2013-03-27 2013-12-02 画像符号化装置及び画像符号化方法

Publications (2)

Publication Number Publication Date
JP5593468B1 true JP5593468B1 (ja) 2014-09-24
JPWO2014155451A1 JPWO2014155451A1 (ja) 2017-02-16

Family

ID=51622550

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014516109A Active JP5593468B1 (ja) 2013-03-27 2013-12-02 画像符号化装置及び画像符号化方法

Country Status (2)

Country Link
JP (1) JP5593468B1 (ja)
WO (1) WO2014155451A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017104011A1 (ja) * 2015-12-16 2017-06-22 三菱電機株式会社 画像符号化装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108391132B (zh) * 2018-04-19 2020-09-25 西安万像电子科技有限公司 文字块编码方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010081368A (ja) * 2008-09-26 2010-04-08 Toshiba Corp 画像処理装置、動画像復号装置、動画像符号化装置、画像処理方法、動画像復号方法、及び、動画像符号化方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010081368A (ja) * 2008-09-26 2010-04-08 Toshiba Corp 画像処理装置、動画像復号装置、動画像符号化装置、画像処理方法、動画像復号方法、及び、動画像符号化方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CUILING LAN,JIZHENG XU,GARY J.SULLIVAN,FENG WU: "Intra transform skipping", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC 1/SC 29/WG11 9TH, vol. JCTVC-I0408, JPN6014024268, 7 May 2012 (2012-05-07), US, pages 1 - 11, ISSN: 0002864068 *
MARTA MRAK,ANDREA GABRIELLINI,DAVID FLYNN,MATTEO NACCARI: "Complexity reduction for intra transform skipping proposal", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC 1/SC 29/WG11 9TH, vol. JCTVC-I0564, JPN6014024270, 7 May 2012 (2012-05-07), US, pages 1 - 10, ISSN: 0002864069 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017104011A1 (ja) * 2015-12-16 2017-06-22 三菱電機株式会社 画像符号化装置

Also Published As

Publication number Publication date
WO2014155451A1 (ja) 2014-10-02
JPWO2014155451A1 (ja) 2017-02-16

Similar Documents

Publication Publication Date Title
JP2022095944A (ja) ビデオを符号化して送信する方法およびコンピュータプログラム
JP2022521515A (ja) 交差成分フィルタリングのための方法、装置、およびプログラム
KR102165147B1 (ko) 계층형 신호 디코딩 및 신호 복원
CN113168718A (zh) 调色板解码的方法和装置
TW201830972A (zh) 用於視訊寫碼之低複雜度符號預測
CN113615185B (zh) 用于视频编解码的方法和装置
JP2005333622A (ja) イメージおよびビデオの予測可逆符号化
JPWO2014054267A1 (ja) 画像符号化装置及び画像符号化方法
TW201334544A (zh) 判定視訊寫碼之解塊濾波之邊界強度值
JP2007060164A (ja) 動きベクトル検出装置および動きベクトル検出方法
JP2022520408A (ja) ビデオ復号のための方法、装置、およびコンピュータプログラム
US20210358005A1 (en) Video coding apparatus and video coding method
KR20210118166A (ko) 적응형 개수의 영역들을 갖는 기하학적 파티셔닝을 위한 모양 적응 이산 코사인 변환
CN112399165B (zh) 解码方法及装置以及计算机设备和存储介质
JP2023512898A (ja) ビデオフィルタリングにおけるオフセットの方法及び装置
CN112019845A (zh) 对点云进行编码的方法、装置以及存储介质
JP2010098352A (ja) 画像情報符号化装置
JP2022523697A (ja) 適応的な数の領域を伴う幾何学的分割におけるインター予測
JP2024023885A (ja) 動画像符号化装置及び動画像符号化方法
JP2011250400A (ja) 動画像符号化装置及び動画像符号化方法
JP5593468B1 (ja) 画像符号化装置及び画像符号化方法
CN115398899A (zh) 视频滤波方法和装置
JP2015146634A (ja) 画像符号化装置および画像符号化方法
JP2023105074A (ja) 運動ベクトルインタ予測のための大域的運動モデル
JP2017073598A (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140617

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140703

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140729

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140804

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250