JP2018137542A - 符号化装置、符号化方法、及び、プログラム - Google Patents

符号化装置、符号化方法、及び、プログラム Download PDF

Info

Publication number
JP2018137542A
JP2018137542A JP2017029229A JP2017029229A JP2018137542A JP 2018137542 A JP2018137542 A JP 2018137542A JP 2017029229 A JP2017029229 A JP 2017029229A JP 2017029229 A JP2017029229 A JP 2017029229A JP 2018137542 A JP2018137542 A JP 2018137542A
Authority
JP
Japan
Prior art keywords
image
quantization parameter
complexity
encoding
quantization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017029229A
Other languages
English (en)
Other versions
JP2018137542A5 (ja
JP6906324B2 (ja
Inventor
小林 幸史
Yukifumi Kobayashi
幸史 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2017029229A priority Critical patent/JP6906324B2/ja
Priority to US15/895,508 priority patent/US10630982B2/en
Publication of JP2018137542A publication Critical patent/JP2018137542A/ja
Publication of JP2018137542A5 publication Critical patent/JP2018137542A5/ja
Application granted granted Critical
Publication of JP6906324B2 publication Critical patent/JP6906324B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

【課題】視覚特性を考慮した良好な画質の静止画像を提供可能とするための技術を提供する。【解決手段】符号化対象画像の静止画を構成する各ブロックの画像の特徴を検出する検出手段と、前記各ブロックについて、前記検出された特徴に基づき、量子化パラメータを決定する決定手段と、前記決定された量子化パラメータを用いて、前記符号化対象画像の前記各ブロックを量子化する量子化手段を含む、前記符号化対象画像を符号化する符号化手段とを備える符号化装置。【選択図】 図1

Description

本発明は符号化装置、符号化方法、及び、プログラムに関する。
動画像の国際標準符号化規格として、HEVC(High Efficiency Video Coding)符号化方式がある。このHEVC符号化方式は動画像符号化方式であるが、静止画を符号化するためのプロファイルとして、静止画プロファイルが新たに導入された(非特許文献1参照)。これにより、今後HEVCを用いた静止画ファイルが普及するものと期待されている。
汎用の静止画用の符号化規格であるJPEG(Joint Photographic Experts Group)では、画面内では量子化パラメータが一定であり、ノーマルやファインといった画質モードごとに量子化テーブルが用意されていた。しかし、画像の難易度に応じて量子化テーブルを変更するといった制御は行なわれていない。これは画質モードごとに画質レベルを一定にするためである。
HEVCでも同様の考え方を適用して、画質モードごとに画面全体での量子化パラメータqPを固定して、画面内の全てのCU(Coding Unit)の量子化パラメータを同一にすることが考えられる。
インプレスジャパン 「H.265/HEVC教科書」、2013年10月21日発行
しかしながら、量子化パラメータを画面内で固定して符号化を行なった場合、視覚特性として劣化が目立つ部分と、劣化が目立たない部分とが同一パラメータで処理されるので、劣化が目立つ部分の画質を改善して良好な静止画像を提供することが困難となる。
そこで、本発明は、視覚特性を考慮した良好な画質の静止画像を提供可能とするための技術を提供することを目的とする。
上記課題を解決する発明は、符号化装置であって、
符号化対象画像の静止画を構成する各ブロックの画像の特徴を検出する検出手段と、
前記各ブロックについて、前記検出された特徴に基づき、量子化パラメータを決定する決定手段と、
前記決定された量子化パラメータを用いて、前記符号化対象画像の前記各ブロックを量子化する量子化手段を含む、前記符号化対象画像を符号化する符号化手段とを備える。
本発明によれば、視覚特性を考慮した良好な静止画像を提供することができる。
発明の実施形態に対応する符号化装置の構成例を示すブロック図。 発明の実施形態に対応する量子化制御処理の一例に対応するフローチャート。 発明の実施形態に対応する量子化パラメータテーブルの一例を示す図。 発明の実施形態に対応する周波数変換後の周波数成分と位置との関係の一例を示す図。 発明の実施形態に対応する量子化パラメータテーブルの他の一例を示す図。
以下、図面を参照しながら本発明の好適な実施の形態を説明する。
[実施形態1]
図1は、発明の実施形態に対応する符号化装置の構成例を示すブロック図である。ここでは、HEVC符号化方式を実現する符号化装置100を例に示してある。これ以降の実施形態の説明では符号化装置100についてデジタルカメラを例に挙げて説明するが、符号化装置100の実施形態はデジタルカメラに限定されるものではない。例えば符号化装置100は、パーソナルコンピュータ、携帯電話、スマートフォン、PDA、タブレットデバイス、デジタルビデオカメラ、携帯型メディアプレーヤなどの撮像機能や録音機能を有する任意の情報処理装置、撮像装置、情報生成装置、或いは、データ生成装置とすることができる。以下、図1を参照して、まず、符号化装置100における動画記録時の動作について説明する。
<動画記録時の動作>
撮影される画像はレンズ101を通して、撮像部102に入力される。レンズ101は、例えば、光学レンズユニットと絞り・ズーム・フォーカスなど制御する光学系を含んで構成される。また、撮像部102は、光学レンズユニットを経て導入された光(映像)を電気的な映像信号に変換するための撮像素子などで構成される。撮像素子としては、一般的には、CMOS(Complementary Metal Oxide Semiconductor)や、CCD(Charge Coupled Device)が利用される。撮像部102は、レンズ101で結像された被写体光を撮像素子により電気信号に変換し、ノイズ低減処理などを行い、デジタル画素データを画像データとして出力する。本実施形態の符号化装置100では、画像データは、DCF(Design Rule for Camera File system)の規格に従って、記録媒体112に記録される。本実施形態では、符号化装置100としてデジタルカメラを例に説明しているため撮像部102が構成要素として含まれているが、符号化装置100は必ずしも撮像部102を含んで構成されていなくても良い。
撮像部102から出力された画像データは現像処理部103に送られる。現像処理部103は、ディベイヤー処理、キズ補正、ノイズ除去、拡大縮小処理、YCbCr形式への色変換などの各画像処理を行う。画像処理後の、圧縮符号化が可能な形式となった画像データは符号化フレームバッファ104に入力される。この画像データのことを「符号化対象画像」という。また、過去に符号化済みで参照画像として用いられる画像データは、参照フレームバッファ105に格納されており、これを「参照画像」という。
イントラ・インター予測部106では、ブロックごとにイントラ予測(画面内予測)、ならびにインター予測(画面間予測)を行う。イントラ予測動作においては、符号化フレームバッファ104に格納されている符号化対象画像と、イントラ・インター予測部106の内に保存されている過去に符号化済みの画面内の周辺画像からイントラ予測を行い、予測モードを決定する。予測モードを決定すると、符号化対象画像と、決定された予測モードのイントラ予測画像との間で画素の差分をとり、差分画像を生成する。また、インター予測動作においては、符号化フレームバッファ104に格納されている符号化対象画像と、参照フレームバッファ105に格納されている参照画像との間でブロックマッチングをとり、動きベクトル検出を行う。符号化対象画像と、検出された動きベクトル位置の予測画像との間で画素の差分をとり、差分画像を生成する。
イントラ・インター予測部106は、イントラ予測とインター予測とで生成された各差分画像に基づき符号化効率の良い予測方式を選択し、選択された予測方式の差分画像を直交変換部108に出力する。イントラ・インター予測部106は、ローカルデコード画像作成用に動きベクトル検出位置の予測画像、もしくはイントラ予測の予測画像を動き補償部115に出力する。
特徴検出部107は、符号化フレームバッファ104に格納されている符号化対象画像を取得し、符号化対象ブロックの特徴を検出する。検出された特徴を示す特徴情報は、量子化制御に使用するため、量子化制御部110に送る。直交変換部108は、入力された差分画像に対して離散コサイン変換を行い、変換係数を生成し、量子化部109に出力する。量子化部109では、直交変換部108から提供された変換係数に対して、量子化制御部110が出力する量子化ステップサイズに従い、量子化を行う。量子化された変換係数は符号化ストリーム作成のため可変長符号化部111、ならびにローカルデコード画像作成のため逆量子化部113に出力される。
可変長符号化部111では、量子化後の変換係数に対してジグザグスキャン、オルタネートスキャン等を行い、可変長符号化が行われる。これに対して、動きベクトルや量子化ステップサイズ、ブロック分割情報、適応オフセット処理用パラメータなどの符号化方式情報を可変長符号化したものを付加し、符号化ストリームを生成する。生成された符号化ストリームは記録媒体112に記録される。また符号化の際にブロックごとの発生符号量を算出し、量子化制御部110に出力する。
量子化制御部110は、可変長符号化部111から入力された発生符号量を用いて、目標とする符号量になるように仮の量子化ステップサイズを決定する(これをQstep_preとする)。その後、特徴検出部107から入力される特徴情報に応じて量子化ステップサイズを決定する(これをQstepとする)。例えば、特徴として画像の周波数成分を利用する場合、高周波成分が多いほど視覚特性として画質劣化が目立たなくなるため、量子化ステップサイズを大きくする。逆に、低周波成分が多い場合は、視覚特性として画質劣化が目立つため、量子化ステップサイズを小さくする。このような量子化ステップサイズを変更するためのパラメータを「activity」と呼ぶ。
activityは0.5〜2の間の任意の値をとりうるパラメータであって、平均的な周波数成分のときに1の値をとり、それより高域成分が多い場合に値を1より大きくし、それより低域成分が多い場合に値を1より小さくするものとする。また、目標符号量に合いやすいように、画面全体の特徴量などからactivityの増減量は決定されるものとする。このパラメータを用いて、Qstepは式(1)で算出される。
Qstep = Qstep_pre×activity ... (1)
式(1)により、発生符号量が多く、Qstep_preが大きい値になった場合であっても、activityが低周波成分が多いことを示す場合にはQstepの値は小さい値に修正され、低周波成分において画質劣化が目立たないように量子化ステップサイズが調整される。また、式(1)により、発生符号量が少なくQstep_preが小さい値になった場合であっても、activityが高周波成分が多いことを示す場合にはQstepの値は大きい値に修正され、高周波成分が多い場合には多少の画質劣化は問題とならないため、画像の特徴を考慮して符号量を削減することができる。このようにして決定した量子化ステップサイズ(Qstep)を量子化部109に出力する。また、量子化ステップサイズ(Qstep)は、量子化パラメータqPに変換されて、符号化ストリームのヘッダに含まれる。
逆量子化部113では、量子化部109から送られてきた量子化後の変換係数に対して逆量子化を行い、ローカルデコード用の変換係数を生成する。この変換係数は逆直交変換部114に出力される。
逆直交変換部114では、量子化部109から入力された変換係数に対して逆離散コサイン変換を行い差分画像を生成する。生成された差分画像は動き補償部115に出力される。動き補償部115では、イントラ・インター予測部106から送られてきた予測画像と、逆直交変換部114から送られてきた差分画像とを加算することにより、ローカルデコード用の画像データを生成する。生成された画像データはデブロッキングフィルタ部116に出力される。
デブロッキングフィルタ部116では、入力された画像データに対してデブロッキングフィルタをかける。デブロッキングフィルタ後の画像は、適応オフセット処理部117に出力される。適応オフセット処理部117では、バンドオフセット処理、エッジオフセット処理、もしくは何も処理をしない、のいずれかの選択を行い、適応オフセット処理を行うバンド位置、エッジ方向、オフセット値などを決定する。参照フレームバッファ105には、デブロッキングフィルタ後の画像に対して適応オフセット処理を行ったものをローカルデコード画像として格納する。また、適応オフセット処理として、どの処理を選択したか、バンド位置、エッジ方向、オフセット値などの適応オフセット処理用のパラメータを符号化ストリームとして生成するため、可変長符号化部111に出力する。
このような動作により、動画像記録時の符号化ストリーム、ローカルデコード画像が作成される。なお、画質モード設定部118は静止画の画質モード設定を行う部分であり、詳細は後で説明する。
<静止画記録時の動作>
次に、静止画記録時の動作について説明する。静止画記録時においては、符号化を行う画像は1枚しかないためイントラ・インター予測部106ではイントラ予測のみが行われる。静止画記録における量子化制御について説明する。動画記録時には、目標符号量に合うように量子化ステップサイズQstepが決定される。
一方の静止画記録において従来のJPEG符号化では、画質モードに応じてあらかじめ定められた量子化テーブルを用いて量子化処理が行われるのが一般的である。例えば、ノーマル、ファイン、スーパーファインの3つの画質モードがある場合、ノーマルモードは量子化テーブル1、ファインモードは量子化テーブル2、スーパーファインモードは量子化テーブル3を用いる、というようにあらかじめ決められている。これは、量子化テーブルによってほぼ画質が決まるため、各画質モードにおいて画質レベルを一定にするためである。
同様の考え方をHEVCに適用する場合、画質モードに応じて量子化ステップサイズ(量子化パラメータ)を一定にすることが考えられる。HEVC符号化方式では、AVC/H.264方式と同様,量子化ステップサイズの対数と比例する値(量子化パラメータ:qP)の概念を利用する。量子化パラメータqPの値は0から51まで規定されており、以下では、静止画記録時における量子化パラメータqPの値の調整により量子化制御を行なう場合を説明する。例えば、ノーマルモードは量子化パラメータqP=20、ファインモードは量子化パラメータqP=15、スーパーファインモードは量子化パラメータqP=10、と設定する。これにより、画質モードに応じて画質レベルを一定にすることができる。
しかし、このように制御した場合、画面内で量子化パラメータが固定のため、視覚特性的に画質劣化が目立つ部分も画質劣化が目立たない部分も同一の量子化パラメータqPを用いることになるため、必ずしも視覚特性的に良好な画像が得られることにはならない。そこで本実施形態においては、量子化パラメータを画面内で固定にするのではなく、符号化対象画像の特徴に応じた量子化パラメータを割り当てるように、量子化制御を実行する。
本実施形態における量子化制御に関する動作について説明する。図2は、本実施形態に対応する量子化制御処理の一例を示すフローチャートである。該フローチャートに対応する処理は、例えば、特徴検出部107、画質モード設定部118、量子化制御部110として機能する1以上のプロセッサが対応するプログラム(ROM等に格納)を実行することにより実現できる。
まず、S201において、特徴検出部107が符号化対象ブロックの特徴を検出する。画像の特徴としてはさまざまなものが考えられるが、ここでは画像の複雑さを表す特徴として、画像の分散値を検出する。本実施形態では、まず、ブロック内の画素の平均値をブロック内の画素値の合計をブロックを構成する画素数により割った値として求める。そして、ブロック内の画素の分散値を、ブロック内の各画素値と画素の平均値との差分の合計をブロックを構成する画素数により割った値として求めることとする。例えば、ブロックサイズが16×16で、画素値がP1〜P256までの256個ある場合、画素の平均値Pmean、および画素の分散値Varは以下の式(2)、(3)により算出することができる。
Figure 2018137542
Figure 2018137542
続くS202において、特徴検出部107は算出された分散値をもとに、符号化対象ブロックの画像の複雑度のレベルを判定する。複雑度は複数の段階で検出することができ、本実施形態では複雑度を高、中、低の3段階のレベルで判定するものとし、分散値が高いほど複雑な画像とみなす。具体的には、分散値Varに対する閾値Vth1、Vth2を設定し、Var>Vth1のとき高複雑度、Vth1≧Var>Vth2のとき中複雑度、Vth2≧Varのとき低複雑度とする。
特徴検出部107は、複雑度の判定結果の複雑度情報を、符号化対象ブロックの特徴として量子化制御部110に提供する。なお、ここでは複雑度を3段階のレベルに変換したが、例えば、閾値間隔を狭くして10段階のようにもっと細かく分類するようにしてもよく、また、任意の段階数とすることができる。
続くS203において、量子化制御部110は、画質モード設定部118から、設定されている静止画の画質モード情報を取得する。画質モード設定部118は、ユーザ操作に応じて静止画の画質モードを設定する。例えば、ノーマル、ファイン、スーパーファインなどの設定を行い、画質モード情報を量子化制御部110に出力する。本実施形態ではこの3段階の設定を行うものとし、スーパーファインが最も高画質で符号量が最も多いモード、ファインモードがスーパーファインモードよりも画質を落とし、符号量を削減するモード、ノーマルモードがファインモードよりも更に画質を落とし、より符号量を削減するモードとする。画質モードは3モードの例を示したが、例えばモード1〜モード10のように、画質レベルを細かく10段階に分けるようなものでもよい。
続くS204において、量子化制御部110は、画質モード設定部118から取得した画質モード情報、および特徴検出部107から取得した複雑度情報に従って量子化パラメータqPを決定する。量子化パラメータは、画質モードごとに、各複雑度に応じた値を予め決めておくことができる。あるいは、算出ルールを決めておき複雑度情報に応じて値を修正しても良い。このとき、画像が複雑なほど視覚特性により画質劣化が目立たなくなるため、複雑なものほど量子化パラメータとして大きい値を設定し、複雑ではないものほど量子化パラメータとして小さい値を設定する。例えば、スーパーファインモードについて中複雑度の量子化パラメータを10と決めた場合、高複雑度は14、低複雑度は6のように高複雑度の量子化パラメータ>中複雑度の量子化パラメータ>低複雑度の量子化パラメータのように決めておくことができる。或いは、中間段階である中複雑度の量子化パラメータ(本実施形態では、10)を基準として、高複雑度の量子化パラメータから所定値(本実施形態では、4)を加算し、低複雑度の量子化パラメータについては所定値を減算するようにしても良い。
同様に、ファインモードではスーパーファインモードよりも画質レベルを落とし符号量を削減するため、中複雑度を15、高複雑度を19、低複雑度を11といったように、各複雑度でスーパーファインモードよりも大きい量子化パラメータを設定することができる。また、ノーマルモードではファインモードよりも画質レベルを落とすため、中複雑度を20、高複雑度を24、低複雑度を16といったように設定することができる。
上記の例では、画質モード毎に固定的に量子化パラメータqPを割り当てる場合の値を中複雑度に割り当て、低複雑度と高複雑度の量子化パラメータはその値を基準に増減させた。このとき、画面内で適応的に量子化パラメータの制御を行なわない場合には、中複雑度の値のみを用いるように制御することができる。また、画像の複雑度に応じて量子化パラメータを切替えるモードと、固定のモードとを任意に切り替えられるようにしてもよい。
このようなモードごとの各複雑度における量子化パラメータの設定例を図3に示す。量子化制御部110では、図3の量子化パラメータの設定に従い、画質モード、符号化対象ブロックの複雑度に応じて量子化パラメータを選択する。選択された量子化パラメータに応じた量子化ステップサイズが量子化部109に送られ、量子化処理が行われる。
このように、本実施形態では、静止画の符号化時において画像のブロックごとに分散値を用いて複雑度を検出し、画質モードごとに複雑度に応じた量子化パラメータに基づき量子化処理を行なって符号化対象画像の符号化を行うことができる。これにより、同一の画質モードであっても、視覚特性として劣化が目立つ部分と、劣化が目立たない部分とで、量子化パラメータを切替えることができるので、同一画質モードでの画像内の画質のバラツキを抑えることができる。また、複雑度に応じて量子化パラメータが設定されるため、視覚特性を考慮した量子化処理を行うことが可能となる。
[実施形態2]
上述の実施形態1では、画像の特徴として分散値を用いる場合を説明した。これに対し、本実施形態では、ブロックごとの画像の特徴として分散値ではなく周波数成分を用いる場合について説明する。ここでは、主に実施形態1との差異について説明する。静止画の符号化時に、特徴検出部107は周波数変換を行い画素ブロックを周波数成分に変換する。周波数変換の方法としてはDCT(Discrete Cosine Transform)やアダマール変換などが挙げられる。ここでは周波数変換の方法としてアダマール変換を用いて説明を行うが、周波数成分に変換できるものであれば、どのような周波数変換方法を用いてもよい。
16×16画素のブロックに対してアダマール変換を行うものとする。アダマール変換後の周波数成分と位置の関係を図4に示す。アダマール変換後は、左上が直流成分となり、右下に行くほど高周波成分となる。ここで、画像の複雑度を表す指標として高周波成分の強度(量)を用いる。ある位置より右下の成分を高周波成分と位置づけ、その成分の総量を求める。例えば、図4において網掛け部分の成分を高周波成分と位置づける。なお、高周波成分の範囲は、図4に示す例に限定されるものではなく、変更することができる。
本実施形態では、当該高周波成分の周波数成分の絶対値和を算出する(これをSAV:Sum of Absolute Valueとする)。算出された高周波成分SAVをもとに、画像を複雑度のレベルに変換する。SAVは、値が大きいほど画像が複雑とみなすことができる。そこで、図2のフローチャートのS202では、特徴検出部107は高周波成分SAVに対する閾値Sth1、Sth2を設定し、SAV>Sth1のとき高複雑度、Sth1≧SAV>Sth2のとき中複雑度、Sth2≧SAVのとき低複雑度と判定することができる。この複雑度情報が、符号化対象ブロックの特徴として量子化制御部110に送られる。量子化制御部110では実施形態1と同様に、画質モードごとに、複雑度に応じた量子化パラメータに基づき量子化処理を行なって符号化対象画像の符号化を行うことができる。
以上のように、静止画の符号化時において符号化対象画像におけるブロックごとに周波数成分を用いて複雑度を検出し、画質モードごとに複雑度に応じた量子化パラメータに基づき量子化処理を行うことができる。これにより、同一の画質モードであっても、視覚特性として劣化が目立つ部分と、劣化が目立たない部分とで、量子化パラメータを切替えることができるので、同一画質モードでの画像内の画質のバラツキを抑えることができる。また、複雑度に応じて量子化パラメータが設定されるため、視覚特性を考慮した量子化処理を行うことが可能となる。また、本実施形態では、アダマール変換を行うサイズとして16×16画素の場合の例を示したが、アダマール変換を行うサイズはこれに限ったものではなく、どのようなサイズを用いてもよい。
[実施形態3]
本実施形態では、ブロックごとの画像の特徴検出として複雑度に加え、エッジ検出も行う場合について説明する。ここでは、主に上記実施形態との差異について説明する。本実施形態に対応する量子化制御処理では、静止画の符号化時に、図2のS202において特徴検出部107は、分散値を用いた複雑度の検出に加え、エッジ検出を行う。エッジとは、例えば背景部分と被写体部分の境界部分や、平坦な画像から複雑な画像へと空間的に急激に変化している部分を指す。エッジ検出方法には公知の様々な方法があるが、本実施形態ではどのようなエッジ検出方法を用いてもよい。
特徴検出部107から量子化制御部110へは、複雑度情報およびエッジ検出情報が提供される。量子化制御部110は、画質モード設定部118からの画質モード情報と、特徴検出部107からの複雑度情報及びエッジ情報とに基づき量子化パラメータを決定する。
量子化パラメータは、画質モードごとに、各複雑度、およびエッジ検出時における量子化パラメータを予め定めておくことができる。或いは、演算により各量子化パラメータを算出しても良い。画像が複雑なほど視覚特性により画質劣化が目立たなくなるため、複雑なものほど量子化パラメータとして大きい値を設定し、複雑ではないものほど量子化パラメータとして小さい値を設定することができる。エッジは比較的複雑な画像になるため、もともとは中、または高複雑度に分類される可能性が高い。しかし、エッジ部分は視覚的に劣化が目立つため、量子化パラメータとしてはそれらよりも小さい値を設定する。
モードごとの各複雑度、およびエッジ検出時における量子化パラメータの設定例を図5に示す。実施形態1における量子化パラメータの設定例に加え、エッジ検出時の量子化パラメータとして、スーパーファインモードでは8、ファインモードでは13、ノーマルモードでは18と設定する。ここでは基準となる中複雑度の量子化パラメータの値よりも少し小さい値となっている。エッジと複雑度とでは、エッジ優先とすることができる。すなわちエッジ検出と判定されたらエッジ用の量子化パラメータを用い、エッジ検出と判定されなかったら各複雑度の量子化パラメータを用いる。このとき、処理として、エッジが検出されたか否かを先に判定し、エッジが検出された場合には、画質モードに対応するエッジ検出時の量子化パラメータを選択し、エッジが検出されなかった場合に、画質モードと複雑度に応じた量子化パラメータを選択するようにしても良い。また、先に画質モードと、複雑度に応じた量子化パラメータを選択しておき、エッジが検出された場合に、エッジ検出時のパラメータの値に変更するように制御しても良い。
また、上述の説明では、特徴検出部107が複雑度とエッジとの両方を特徴として検出しているが、これ以外にエッジのみを検出するようにしてもよい。その場合、エッジ検出された場合とエッジ検出されない場合の2通りの量子化パラメータを用いればよい。例えば、エッジが検出されない場合は中複雑度の量子化パラメータの値を選択し、エッジが検出された場合は中複雑度の量子化パラメータの値を選択し、エッジ用の量子化パラメータを選択するようにしてもよい。
以上のように、静止画の符号化時において画像のブロックごとにエッジ、および複雑度を検出し、画質モードごとに、エッジ、および複雑度に応じた量子化パラメータに基づき量子化処理を行なって符号化対象画像の符号化を行うことができる。これにより、同一画質モードでの画像内の画質のバラツキを抑えつつ、視覚特性を考慮した良好な画像を得ることができる。
(その他の実施例)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
107 特徴検出部、109 量子化部、110 量子化制御部

Claims (13)

  1. 符号化対象画像の静止画を構成する各ブロックの画像の特徴を検出する検出手段と、
    前記各ブロックについて、前記検出された特徴に基づき、量子化パラメータを決定する決定手段と、
    前記決定された量子化パラメータを用いて、前記符号化対象画像の前記各ブロックを量子化する量子化手段を含む、前記符号化対象画像を符号化する符号化手段と
    を備えることを特徴とする符号化装置。
  2. 前記検出手段は、前記各ブロックの画像の特徴として、画像の複雑度を複数の段階で検出し、
    前記決定手段は、前記検出された複雑度の段階に基づき、前記量子化パラメータを決定する
    ことを特徴とする請求項1に記載の符号化装置。
  3. 前記画像の複雑度は、前記各ブロックに含まれる画素の分散値として検出されることを特徴とする請求項2に記載の符号化装置。
  4. 前記画像の複雑度は、前記各ブロックに含まれる画素が有する高周波成分の強度として検出されることを特徴とする請求項2に記載の符号化装置。
  5. 前記検出手段は、前記各ブロックの画像の特徴としてエッジを検出し、
    前記決定手段は、前記エッジが検出されたか否かに基づき、前記量子化パラメータを決定する
    ことを特徴とする請求項1に記載の符号化装置。
  6. 前記決定手段は、前記複雑度が高くなるほど、値が大きくなるように前記量子化パラメータを決定することを特徴とする請求項2から4のいずれか1項に記載の符号化装置。
  7. 前記決定手段は、前記複数の段階のうち中間の段階を基準として、複雑度が高くなるほど値を前記中間の複雑度に対して与えられる値よりも大きくし、複雑度が低くなるほど値を前記中間の複雑度に対して与えられる値よりも小さくするように、前記量子化パラメータを決定することを特徴とする請求項2から4のいずれか1項に記載の符号化装置。
  8. 前記検出手段は、前記各ブロックについてエッジ検出を行ない、
    前記決定手段は、エッジが検出されたブロックについて、前記複雑度に基づく量子化パラメータよりも、エッジ検出に基づく量子化パラメータを優先することにより、前記量子化パラメータを決定することを特徴とする請求項2から4、6及び7のいずれか1項に記載の符号化装置。
  9. 前記決定手段は、前記エッジが検出されたブロックについて設定する前記量子化パラメータを、前記画像の複雑度が所定の複雑度である場合よりも小さい値となるように決定することを特徴とする請求項8に記載の符号化装置。
  10. 前記符号化対象画像を符号化するための画質モードを設定する設定手段を更に備え、
    前記決定手段は、前記設定された画質モードに更に基づいて前記量子化パラメータを決定することを特徴とする請求項1から9のいずれか1項に記載の符号化装置。
  11. 前記決定手段は、前記静止画について固定的に割り当てられる量子化パラメータの値を変更した値を選択することにより、前記量子化パラメータを決定することを特徴とする請求項1から10のいずれか1項に記載の符号化装置。
  12. 符号化対象画像の静止画を構成する各ブロックの画像の特徴を検出する検出工程と、
    前記各ブロックについて、前記検出された特徴に基づき、量子化パラメータを決定する決定工程と、
    前記決定された量子化パラメータを用いて、前記符号化対象画像の前記各ブロックを量子化する量子化工程を含む、前記符号化対象画像を符号化する符号化工程と
    を含むことを特徴とする符号化方法。
  13. コンピュータを請求項1から11のいずれか1項に記載の符号化装置の各手段として機能させるためのプログラム。
JP2017029229A 2017-02-20 2017-02-20 符号化装置、符号化方法、及び、プログラム Active JP6906324B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2017029229A JP6906324B2 (ja) 2017-02-20 2017-02-20 符号化装置、符号化方法、及び、プログラム
US15/895,508 US10630982B2 (en) 2017-02-20 2018-02-13 Encoding apparatus, encoding method, and non-transitory computer-readable storage medium for performing encoding with quantization parameters according to a feature of an image

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017029229A JP6906324B2 (ja) 2017-02-20 2017-02-20 符号化装置、符号化方法、及び、プログラム

Publications (3)

Publication Number Publication Date
JP2018137542A true JP2018137542A (ja) 2018-08-30
JP2018137542A5 JP2018137542A5 (ja) 2020-04-02
JP6906324B2 JP6906324B2 (ja) 2021-07-21

Family

ID=63168143

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017029229A Active JP6906324B2 (ja) 2017-02-20 2017-02-20 符号化装置、符号化方法、及び、プログラム

Country Status (2)

Country Link
US (1) US10630982B2 (ja)
JP (1) JP6906324B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023210594A1 (ja) * 2022-04-27 2023-11-02 ヌヴォトンテクノロジージャパン株式会社 画像符号化装置及び画像符号化方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7016660B2 (ja) * 2017-10-05 2022-02-07 キヤノン株式会社 符号化装置、その制御方法、および制御プログラム、並びに撮像装置
US10812797B2 (en) * 2018-02-05 2020-10-20 Tencent America LLC Method, apparatus and medium for decoding or encoding using a low-complexity transform

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8363717B2 (en) * 2005-05-17 2013-01-29 Canon Kabushiki Kaisha Image processing apparatus
US8064517B1 (en) * 2007-09-07 2011-11-22 Zenverge, Inc. Perceptually adaptive quantization parameter selection
JP5427785B2 (ja) * 2007-09-28 2014-02-26 ドルビー ラボラトリーズ ライセンシング コーポレイション ビデオ圧縮技法及びビデオ伝達技法
US8363719B2 (en) * 2007-10-29 2013-01-29 Canon Kabushiki Kaisha Encoding apparatus, method of controlling thereof, and computer program
US9473792B2 (en) * 2009-11-06 2016-10-18 Texas Instruments Incorporated Method and system to improve the performance of a video encoder
US8428381B2 (en) * 2010-06-04 2013-04-23 Altek Corporation Image compression method with variable quantization parameter
TWI603611B (zh) * 2011-12-21 2017-10-21 Jvc Kenwood Corp Motion picture encoding apparatus, motion picture encoding method, and recording medium for moving picture encoding program
JP6226578B2 (ja) * 2013-06-13 2017-11-08 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム
US10097851B2 (en) * 2014-03-10 2018-10-09 Euclid Discoveries, Llc Perceptual optimization for model-based video encoding
US10091507B2 (en) * 2014-03-10 2018-10-02 Euclid Discoveries, Llc Perceptual optimization for model-based video encoding

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023210594A1 (ja) * 2022-04-27 2023-11-02 ヌヴォトンテクノロジージャパン株式会社 画像符号化装置及び画像符号化方法

Also Published As

Publication number Publication date
US10630982B2 (en) 2020-04-21
JP6906324B2 (ja) 2021-07-21
US20180241996A1 (en) 2018-08-23

Similar Documents

Publication Publication Date Title
JP4455487B2 (ja) 復号化装置及び復号化方法及びプログラム
JP4372197B2 (ja) 画像符号化装置及び画像復号装置
JP5893002B2 (ja) ビデオ符号化におけるレート制御
JP4194479B2 (ja) 画像処理装置及び方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体
JP2009273156A (ja) 画像復号方法および画像復号装置
JP2008503918A (ja) ビデオ・コーデック量子化のための方法および装置
JP6906324B2 (ja) 符号化装置、符号化方法、及び、プログラム
JP2015115903A (ja) 撮像装置、撮像装置の制御方法、コンピュータプログラム
JP2015050661A (ja) 符号化装置、符号化装置の制御方法、及び、コンピュータプログラム
CN116918331A (zh) 编码方法和编码装置
JP6871727B2 (ja) 撮像装置、画像処理方法、及び、プログラム
KR20180099369A (ko) 비디오 비트율 제어 방법, 및 이를 이용한 영상 부호화 방법 및 장치
JP2009081830A (ja) 動画像圧縮符号化における符号化処理方法及び符号化処理装置
JP7256658B2 (ja) 画像符号化装置及びその制御方法及びプログラム
JP6269431B2 (ja) 画像処理装置、画像処理方法及び画像処理システム
US10516896B2 (en) Encoding device, encoding method, and storage medium
WO2019142836A1 (ja) 符号化装置、復号装置、符号化方法、復号方法、符号化プログラム、および復号プログラム
JP2014110509A (ja) 画像符号化装置及び画像符号化方法
US9942569B2 (en) Image encoding apparatus and control method of the same
JP2015115901A (ja) 符号化装置、符号化装置の制御方法、及び、コンピュータプログラム
JP6200220B2 (ja) 画像処理装置、符号化装置、復号装置、及びプログラム
KR100771138B1 (ko) 촬영 장치 및 영상 보정 방법
JP6912978B2 (ja) 符号化装置及びプログラム
JP4626644B2 (ja) 符号化装置、符号化方法、プログラム、及び、撮像装置
JP2008227876A (ja) 撮像装置

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200217

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200217

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210104

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20210103

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210113

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210218

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210315

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210415

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210531

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210629

R151 Written notification of patent or utility model registration

Ref document number: 6906324

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151