JP6796463B2 - 映像符号化装置、映像復号装置、及びプログラム - Google Patents

映像符号化装置、映像復号装置、及びプログラム Download PDF

Info

Publication number
JP6796463B2
JP6796463B2 JP2016222975A JP2016222975A JP6796463B2 JP 6796463 B2 JP6796463 B2 JP 6796463B2 JP 2016222975 A JP2016222975 A JP 2016222975A JP 2016222975 A JP2016222975 A JP 2016222975A JP 6796463 B2 JP6796463 B2 JP 6796463B2
Authority
JP
Japan
Prior art keywords
unit
noise
quantization
conversion coefficient
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016222975A
Other languages
English (en)
Other versions
JP2018082299A (ja
Inventor
俊枝 三須
俊枝 三須
市ヶ谷 敦郎
敦郎 市ヶ谷
菊文 神田
菊文 神田
境田 慎一
慎一 境田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2016222975A priority Critical patent/JP6796463B2/ja
Publication of JP2018082299A publication Critical patent/JP2018082299A/ja
Application granted granted Critical
Publication of JP6796463B2 publication Critical patent/JP6796463B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、映像符号化装置、映像復号装置、及びプログラムに関する。
映像符号化の手法として、動き補償予測および直交変換(例えば、離散コサイン変換等の周波数変換)を基本とするハイブリッド符号化がある。ハイブリッド符号化方式では、直交変換の結果として得られる変換係数に対し、量子化処理を行い、その量子化ステップに応じて圧縮率及び画質を設定することが行われている。前記量子化ステップを大きくするほど、圧縮率は高くなる反面、量子化歪のために画質の劣化も大きくなる。量子化歪とは、前記変換係数が量子化及び逆量子化の過程において、元の係数値から外れることをいう。この量子化歪に起因する画質劣化を目立たなくするため、符号化装置の局部復号部における逆直交変換部(逆周波数変換部)において雑音を付加する手法が開示されている(例えば、特許文献1)。
再公表WO2011/64944号公報
ところで、特許文献1に記載の手法では、逆直交変換部において雑音を付加するものの、当該雑音を直接的に相殺する手段を有しない。そのため、復号装置における逆量子化後の変換係数値は尚も量子化ステップ間隔の離散的な値しか取り得ず、量子化ステップの中間的な変換係数値での復号ブロックが現れることがない。そのため、従来の手法では、十分なディザリング効果が得られない場合があった。従って、量子化歪に起因する画質劣化を目立たなくすることが望まれている。
本発明のいくつかの態様は、量子化歪に起因する画質劣化を目立たなくすることができる映像符号化装置、映像復号装置、及びプログラムを提供することを目的の一つとする。
また、本発明の他の態様は、後述する実施形態に記載した作用効果を奏することを可能にする映像符号化装置、映像復号装置、及びプログラムを提供することを目的の一つとする。
上述した課題を解決するために、本発明の一態様は、第1の映像信号を直交変換して第1の変換係数を取得し、前記第1の変換係数を量子化し、前記量子化の処理結果をエントロピー符号化して符号を生成し、前記量子化の処理結果を逆量子化して第2の変換係数を取得し、前記第2の変換係数を逆直交変換して第2の映像信号を取得し、前記第2の映像信号を用いて予測を行う映像符号化装置であって、雑音信号を発生する雑音発生部と、前記雑音発生部が発生した雑音信号を、前記量子化前に、第1の映像信号、又は、前記第1の変換係数に加算する加算部と、前記雑音発生部が発生した雑音信号を、前記逆量子化後に、第2の映像信号、又は、前記第2の変換係数から減算する減算部と、を具備することを特徴とする映像符号化装置である。
また、本発明の一態様は、前記映像復号装置であって、前記加算部は、前記雑音発生部が発生した雑音信号を、前記直交変換後、且つ、前記量子化前に、前記第1の変換係数に加算し、前記減算部は、前記雑音発生部が発生した雑音信号を、前記逆量子化後、且つ、前記逆直交変換前に、前記第2の変換係数に加算する映像符号化装置である。
また、本発明の一態様は、前記映像復号装置であって、前記雑音発生部は、前記第1の変換係数に対する量子化ステップに応じた値域を有する一様乱数又は一様な疑似乱数に基づいて、雑音信号を発生する映像符号化装置である。
また、本発明の一態様は、前記映像復号装置であって、前記雑音発生部は、前記第1の変換係数の各々の周波数成分の高低に応じた値域を有する雑音信号を発生する映像符号化装置である。
また、本発明の一態様は、前記映像符号化装置がエントロピー符号化した符号の復号結果を逆量子化して第3の変換係数を取得し、前記第3の変換係数を逆直交変換して第3の映像信号を取得する映像復号装置であって、前記映像符号化装置が具備する前記雑音発生部と同系列の雑音信号を発生する復号側雑音発生部と、前記雑音発生部が発生した雑音信号を、前記逆量子化後に、第2の映像信号又は前記第2の変換係数から減算する復号側減算部と、を具備することを特徴とする映像復号装置である。
また、本発明の一態様は、コンピュータを、前記映像符号化装置、又は、前記映像復号装置として機能させるためのプログラムである。
本発明の一態様によれば、量子化歪に起因する画質劣化を目立たなくすることができる。
本発明に第1の実施形態に係る映像信号処理システムの構成を示すブロック図である。 同実施形態に係る映像信号処理システムの効果を説明するための図である。 同実施形態に係る映像信号処理システムにより処理した画像を示す図である。 本発明の第2の実施形態に係る映像信号処理システムの構成を示す図である。 同実施形態に係る映像信号処理システムにおける雑音の生成処理を説明するための図である。 変形例に係る映像信号処理システムの構成を示すブロック図である。 従来技術に係る映像信号処理システムの構成を示すブロック図である。 従来技術に係る映像信号処理システムにより処理した画像を示す図である。
以下、本発明の実施形態について、図面を参照して説明する。
[第1の実施形態]
本発明の第1の実施形態について説明する。
まず、本実施形態に係る映像信号処理システム1は、ハイブリッド符号化方式により、映像を符号化、復号するシステムである。
図1は、映像信号処理システム1の構成を示すブロック図である。また、図7は、従来技術に係る映像信号処理システム9の構成を示すブロック図である。
映像信号処理システム1は、映像符号化装置10と、伝送・蓄積装置20と、映像復号装置30と、を備える。また、映像信号処理システム9は、映像符号化装置70と、伝送・蓄積装置80と、映像復号装置90と、を備える。映像符号化装置10は、映像符号化装置70に対応する。伝送・蓄積装置20は、伝送・蓄積装置80に対応する。映像復号装置30は、映像復号装置90に対応する。
映像符号化装置10は、映像信号をエントロピー符号化し、符号化したビット列を伝送・蓄積装置20に出力する。
伝送・蓄積装置20は、伝送路、蓄積装置、又は、その両者の複合媒体であり、映像符号化装置10から取得したビット列を、映像復号装置30に出力する。
映像復号装置30は、伝送・蓄積装置20から取得したビット列を復号する。
映像符号化装置10は、ブロック分割部100と、メモリ101と、予測部102と、減算部103と、変換部104と、量子化部105と、エントロピー符号化部106と、逆量子化部107と、逆変換部108と、加算部109と、雑音発生部110と、加算部111と、減算部112と、を備える。これに対して、映像符号化装置70は、ブロック分割部700と、メモリ701と、予測部702と、減算部703と、変換部704と、量子化部705と、エントロピー符号化部706と、逆量子化部707と、逆変換部708と、加算部709と、を備える。映像符号化装置10のブロック分割部100、メモリ101、予測部102、減算部103、変換部104、量子化部105、エントロピー符号化部106、逆量子化部107、逆変換部108、加算部109は、ブロック分割部700、メモリ701、予測部702、減算部703、変換部704、量子化部705、エントロピー符号化部706、逆量子化部707、逆変換部708、加算部709と同様の構成である。
つまり、映像符号化装置10は、映像符号化装置70と比較して、雑音発生部110と、加算部111と、減算部112と、を備える点が異なる。
映像復号装置30は、エントロピー復号部300と、逆量子化部301と、逆変換部302と、メモリ303と、予測部304と、加算部305と、雑音発生部306と、減算部307と、を備える。映像復号装置90は、エントロピー復号部900と、逆量子化部901と、逆変換部902と、メモリ903と、予測部904と、加算部905と、を備える。映像復号装置30のエントロピー復号部300、逆量子化部301、逆変換部302、メモリ303、予測部304、加算部305は、映像復号装置90のエントロピー復号部900、逆量子化部901、逆変換部902、メモリ903、予測部904、加算部905と同様の構成である。
つまり、映像復号装置30は、映像復号装置90と比較して、雑音発生部306と、減算部307と、を備える点が異なる。
次に、映像符号化装置10の構成について説明する。
ブロック分割部100は、入力画像を、複数の部分領域(以下、「ブロック」と称する。)に分割する。ここで、入力画像は、映像信号の場合は、フレームである。典型的にはブロック形状は矩形である。以下では、一例として、水平方向(横方向)に8画素、垂直方向(縦方向)に8画素の64画素領域によって画像を分割する場合について説明する。
なお、ブロック分割部100は異なるブロック形状複数の中から、画像の特徴や符号化時のレート歪特性によってブロック形状を適応的に選択して、ブロック分割するものであっても構わない。この場合、ブロック分割部100は、ブロック位置等に応じてブロック形状を変えつつ順次ブロックを切り出し、当該ブロック単位で以降の符号化処理を行う。
メモリ101は、符号化処理及び復号処理をブロック単位で実行した結果である局部復号ブロックを順次記憶する。すなわち、メモリ101は、画像のうちこれまでに符号化・復号された部分領域の画素値列を保持する。
予測部102は、メモリ101に保持されている画素値列に基づき、ブロック分割部100が次に符号化するブロック内の画素値列を推測(予測)して、予測画素値列を得る。予測部102には、例えば、画像内予測(イントラ予測)や動き補償予測(フレーム間予測、インター予測)が含まれる。
減算部103は、ブロック分割部100から取得したブロック内の画素値列から、予測部102により予測された画素値列を画素位置ごとに減じ、その結果たる残差値列を出力する。
変換部104は、減算部103から取得した残差値列に対し、数学的な変換を施し、その結果たる変換係数列を出力する。変換部104が実行する変換は、単一種類であっても構わないし、複数種類の中からブロック形状や画像の特徴、レート歪特性に応じて適応的に選択した物であっても構わない。
変換部104において実行する変換としては、例えば、離散コサイン変換(DCT:Discrete Cosine Transform)、離散サイン変換(DST:Discrete Sine Transform)、ウェーブレット変換、ウォルシュ・アダマール変換、及び、これらの変換に整数近似や離散近似を施した変換が挙げられる。
量子化部105は、変換部104によって得られた変換係数列を、当該変換係数列の信号値レベルに比して多くない信号値レベルに変換(量子化)する。具体的には、量子化部105は、変換係数列を所定の正値(量子化ステップ)によって除し、その結果を整数値に丸めた数列を出力する。
なお、量子化部105は、変換係数列の各項を、各項の位置ごとに決められた量子化ステップ(量子化テーブル)によって除すよう構成してもよい。さらに、量子化ステップや量子化テーブルを予め複数用意しておき、これらの中から使用者により指定されたものを用いたり、自動的に選択されたものを用いたりしても構わない。さらに量子化部105は、これら複数の量子化ステップ、量子化テーブルを、自動的に切り替えるように構成しても構わない。
ここで、量子化部105による量子化の演算例について説明する。
あるブロックBについて、n番目の変換係数をc(B)とし、当該ブロックBの変換係数cに対する量子化ステップをQ(B)とおく。nは、0以上N−1以下の整数である。また、Nは、変換部104において変換を施した結果の変換係数の総数を表す自然数である。変換係数の順番(n番目)は、例えば、2次元空間周波数を、低周波数領域から高周波数領域へとジグザグ走査して設定される。
ここで、変換係数c(B)を量子化ステップQ(B)で量子化した結果たる量子化変換係数をq(B)とおくと、従来(例えば、映像符号化装置70の量子化部705)は、下記の式(1)の演算により量子化を実行していた。
ここで、関数
は、実数zよりも大きくない最大の整数を表す(床関数)。
これに対して、量子化部105は、下記の式(2)に示す演算により量子化を実行する。
式(2)は、雑音e(B)を、変換係数c(B)に加算する点が、式(1)とは異なる。雑音e(B)は、雑音発生部110が発生する乱数である。雑音e(B)については、後述する。
エントロピー符号化部106は、量子化部105が取得した量子化変換係数列をそのエントロピーに基づいて符号化する。エントロピー符号化部106は、量子化変換係数列の他、ブロック分割部100、変換部104、量子化部105、予測部102による符号化の各処理の動作状態をも符号化しても構わない。符号化の各処理の動作状態とは、例えば、複数の異なる動作のうちのいずれを用いたかを表す識別子であり、具体的には、モード等である。
エントロピー符号化部106には、例えば、ハフマン符号化やその変形であるCAVLC(Context−Adaptive Variable−Length Coding)等の可変長符号化、或いは、算術符号化やその変形であるCABAC(Context−based Adaptive Binary Arithmetic Coding)を用いることができる。
逆量子化部107は、量子化部105が取得した量子化変換係数列に、量子化ステップを乗ずることにより、逆量子化変換係数列を得る。
例えば、ブロックBに係る量子化変換係数をq(B)とおき、ブロックBに係る量子化ステップをQ(B)とおくと、逆量子化部107は、下記の式(3)に示す演算により、ブロックBを逆量子化し、逆量子化変換係数dを得る。
逆変換部108は、逆量子化部107が取得した逆量子化変換係数列に対し変換部104の逆変換を実行し、その結果たる復号残差値列を得る。復号残差値列は、減算部112において、量子化部105により加算された雑音e(B)についての補正を受け、補正復号残差値列として、加算部109に出力される。
加算部109は、予測部102が取得した予測画素値列と、減算部112による補正復号残差値列とを画素位置ごとに加算し、その結果たる復号画素値列を出力する。加算部109が出力した復号画素値列は、メモリ101内の現在処理中のブロックに対応する記憶領域に書き込まれる。
以下では、映像符号化装置10に特有の構成である雑音発生部110と、加算部111と、減算部112とについて説明する。
雑音発生部110は乱数系列を発生する。この乱数系列は疑似乱数系列であって構わない。雑音発生部110は、疑似乱数系列により雑音を発生する場合、漸化式等の数式により順次疑似乱数を発生してもよいし、或いは、ROM(Read Only Memory)やRAM(Random Access Memory)上に表形式で予め記録された数列を順次読み出して疑似乱数を発生しても構わない。雑音発生部110は、好ましくは、ブロックBの量子化ステップQ(B)に応じて、半開区間[−Q(B)/2,+Q(B)/2)を値域とする一様乱数を発生する。例えば、雑音発生部110は、下記の式(4)により雑音eを生成する。
ここで、Uは一様分布である。なお、雑音e(B)は半開区間[−Q(B)/2,+Q(B)/2)内のあらゆる実数値を取ってもよいし、当該区間内の有限の個数の実数値集合の中の値を取っても構わない。
加算部111は、雑音発生部110が発生した雑音e(B)を、変換部104が取得した変換係数c(B)に加算し、その結果c(B)+e(B)を量子化部105に対して出力する。
減算部112は、逆量子化部107から取得した逆量子化された変換係数d(B)から、雑音発生部110が生成した雑音e(B)を減じ、その結果d(B)−e(B)を、補正変換係数列として逆変換部108に対して出力する。
以上の動作により、映像符号化装置10は、入力画像をビット列に変換する。
次に、映像復号装置30の構成と動作について説明する。
エントロピー復号部300は、エントロピー符号化部106と対をなす構成であり、エントロピー符号化部106と逆の処理を行う。エントロピー復号部300は、伝送・蓄積装置20により伝送・蓄積されたビット列を復号し、量子化変換係数列を出力する。また、エントロピー復号部300は、量子化変換係数列に加えて、ブロック分割部100、変換部104、量子化部105、予測部102による符号化の各処理の動作状態を出力する。
逆量子化部301は、エントロピー復号部300が取得した量子化変換係数列に対して、逆量子化部107と同様の処理を行う。
逆量子化部301、逆変換部302、メモリ303、予測部304、加算部305は、それぞれ、逆量子化部301、逆変換部108、メモリ101、予測部102、および加算部109と同様の処理を行い、メモリ303内に復号画像を構成する。
メモリ303内に復号画像が完全に構成されると、メモリ303は復号画像を出力する。なお、映像符号化装置10及び映像復号装置30が動画像を処理するものである場合には、メモリ303に構成された画像を必要に応じて保持して出力のタイミングを調整してもよい。さらに、映像符号化装置10及び映像復号装置30が動画像をフレームの順序を入れ替えて符号化を行う場合、メモリ303が出力する復号画像をメモリ303内もしくはその後段に設けられる他のメモリに一時的に蓄積し、画像の出力順序が入力画像の順序と一致するよう出力順序を入れ替える。
以下では、映像復号装置30に特有の構成である、雑音発生部306と減算部307とを備える。
雑音発生部306は、雑音発生部110と同様の処理を行い、雑音を発生する。雑音発生部306は、映像復号装置30があるブロックBを処理する際には、映像符号化装置10の雑音発生部110が同ブロックBを処理した際に発生した雑音と同一の雑音を発生する。つまり、雑音発生部306は、雑音発生部110と共通の乱数系列を発生する。ブロックBのn番目の変換係数cに対する雑音として、乱数eを発生する。
雑音発生部110及び雑音発生部306は、共通の系列の雑音を発生するために、共通の乱数シードを使用してもよい。この場合、乱数シードは、雑音発生部110及び雑音発生部306において共通の定数であってもよいし、雑音発生部110で使用した乱数シードを、映像符号化装置10から映像復号装置30へ通知するよう構成しても構わない。
減算部307は、減算部112と同様の処理を行う。具体的には、減算部307は、あるブロックBに関して、逆量子化部301から取得した逆量子化変換係数d(B)から、雑音発生部306が発生した雑音e(B)を減じ、補正変換係数d(B)−e(B)を得る。減算部307は、取得した補正変換係数列を、逆変換部302に対して出力する。
以上の説明したように、映像符号化装置10は、第1の映像信号(例えば、残差値列)を直交変換して第1の変換係数を取得し、前記第1の変換係数を量子化し、前記量子化の処理結果(例えば、量子化変換係数)をエントロピー符号化して符号を生成し、前記量子化の処理結果を逆量子化して第2の変換係数(例えば、逆量子化変換係数)を取得し、前記第2の変換係数を逆直交変換して第2の映像信号(例えば、復号残差値列)を取得し、前記第2の映像信号に係る映像信号(例えば、補正復号残差値列)に基づいて予測を行う映像符号化装置であって、雑音信号を発生する雑音発生部110(雑音発生部の一例)と、雑音発生部110が発生した雑音信号を、前記量子化前に、第1の映像信号、又は、前記第1の変換係数に加算する加算部111と、雑音発生部110が発生した雑音信号を、前記逆量子化後に、第2の映像信号、又は、前記第2の変換係数から減算する減算部112と、を具備する。
これにより、変換係数の量子化にあたってディザリングが適用され、ブロック歪の出現形態が時々刻々変化する。また、時間平均的に量子化歪が相殺されるように符号化が施される。
また、映像復号装置30は、映像符号化装置10がエントロピー符号化した符号の復号結果を逆量子化して第3の変換係数(例えば、逆量子化変換係数)を取得し、前記第3の変換係数を逆直交変換して第3の映像信号(例えば、復号残差値列)を取得する映像復号装置であって、映像符号化装置10が具備する雑音発生部110と同系列の雑音信号を発生する雑音発生部306(復号側雑音発生部の一例)と、雑音発生部306が発生した雑音信号を、前記逆量子化後に、前記第3の変換係数、又は、第3の映像信号から減算する減算部307(復号側減算部の一例)と、を具備する。
また、映像符号化装置10において、加算部111は、雑音発生部110が発生した雑音信号を、直交変換後、且つ、量子化前に、第1の変換係数に加算し、減算部112は、雑音発生部110が発生した雑音信号を、逆量子化後、且つ、逆直交変換前に、前記第2の変換係数に加算する。
これにより、映像符号化装置10は、量子化対象の変換係数に対して、雑音の加算を行い、逆量子化により得られた変換係数に対して減算を行う。よって、映像符号化装置10は、量子化歪を効率的に抑制することができる。
また、映像符号化装置10において、雑音発生部110は、第1の変換係数に対する量子化ステップに応じた値域を有する一様乱数又は一様な疑似乱数に基づいて、雑音信号を発生する。
これにより、映像符号化装置10は、付加する雑音を量子化歪のディザリングに必要十分なレベルとすることができる。よって、映像符号化装置10は、雑音の過付加による画質劣化を引き起こしてしまったり、雑音の不足によりディザリングが不十分になってしまったりすることを避けることができる。
ここで、図2、3を参照して映像信号処理システム1の作用効果を具体的に説明する。
図2は、量子化の入出力特性の例を示すグラフである。
この例において、変換係数「+2」が量子化部105に入力されると、その出力たる量子化変換係数は「0」となる。比較対象の映像信号処理システム9の場合、量子化変換係数「0」に対して、映像復号装置30の逆量子化部901から出力される逆量子化変換係数は「0×10=0」である。量子化を適用しない本来の変換係数は「+2」であったから、映像信号処理システム9における量子化・逆量子化で発生した量子化歪の絶対値は「2」である。
次に、量子化変換係数の後においてのみ雑音を付加する単純なディザリングの量子化歪について説明する。
まず、あるブロックのある周波数成分について、継続的に変換係数が値「+2」をとるとする。また、雑音としては、U[−5,+5)の一様乱数を付加するものとする。この場合、量子化変換係数値は、乱数値が「−5」以上「+3」未満のときは「0」となり、乱数値が「+3」以上「+5」未満のときは「+1」となる。よって、逆量子化変換係数は、乱数値が「−5」以上「+3」未満のときは「0」となり、乱数値が「+3」以上「+5」未満のときは「+10」となる。乱数が実数体上で一様であるとすると、逆量子化変換係数は、80%の確率で「0」をとり、20%の確率で「+10」をとるため、逆量子化変換係数値の期待値は「0×0.8+10×0.2=+2」である。よって、逆量子化変換係数値は期待値としては本来の変換係数値である「+2」と同値であり、ブロック歪などの符号化劣化は目立たなくなる。
しかしながら、逆量子化変換係数は「0」及び「+10」の二者択一であり、2種類の両極端な符号化劣化態様が確率的に切り替わって表示されることとなる。しかも、逆量子化変換係数値が「+10」をとる瞬間の量子化歪の絶対値は「8」であり、瞬間的には却って目障りな歪となる可能性がある。つまり、単純なディザリングでは、量子化歪が目立ってしまうことがある。
次に、映像信号処理システム1における量子化歪について説明する。
上記と同様に、あるブロックのある周波数成分について、継続的に変換係数が値「+2」をとる場合を考える。また、雑音発生部110は、U[−5,+5)の一様乱数を発生するものとする。この場合、量子化変換係数は、乱数値が「−5」以上「+3」未満のときは「0」となり、乱数値が「+3」以上「+5」未満のときは「+1」となる。よって、逆量子化変換係数は、乱数値が「−5」以上「+3」未満のときは「0」、乱数値が「+3」以上「+5」未満のときは「+10」となる。乱数が実数体上で一様であるとすると、逆量子化変換係数は、80%の確率で「0」をとり、20%の確率で「+10」をとる。ここまでは、上記の単純なディザリングの場合と同様である。
しかしながら、映像信号処理システム1では、逆量子化部107、逆量子化部301の後段において乱数値を減算する減算部112、減算部307が設けられている。減算部112及び減算部307から出力される変換係数値は、乱数値eが「−5」以上「+3」未満のときは「−e」となり、乱数値eが「+3」以上「+5」未満のときは「10−e」となる。すなわち、減算部112及び減算部307の出力からは、「−3」を超え「+5」以下、及び、「+5」を超え「+7」以下の値が一様に出現することになる。つまり、映像信号処理システム1の場合は、減算部112及び減算部307から出力される変換係数値として、「−3」を超え「+7」以下の値が一様に出現する。よって、減算部112及び減算部307から出力される変換係数値の期待値は、本来の変換係数値である「+2」と同値であり、ブロック歪などの符号化劣化は目立たなくなる。しかも、逆量子化変換係数値は「−3」から「+7」のさまざまな値をとるため劣化の悪影響が平滑化されて知覚されづらくなる。加えて、逆量子化変換係数値における量子化歪の絶対値の最大値は、上記の単純なディザリングの場合の「8」に比して小さい「4」である。つまり、変換係数の分散を小さくすることができるため、瞬間的な劣化が目立ちにくい。
図8は、比較対象の映像信号処理システム9により符号化、復号した画像の例を示す。また、図3は、映像信号処理システム1により符号化、復号した画像の例を示す。
図8に示す画像例と、図3に示す画像例とでは、入力画像は同一である。
図8に示す画像例P9では、低周波数領域における画像劣化が目立っている。例えば、画像領域P91、P92では、精細な輝度の変化が失われ、ブロック状の不自然なエッジが生じている。
これに対して、図3に示す画像例P1では、低周波数領域においても画像劣化が目立たない。例えば、画像領域P91に対応する画像領域P11、及び、画像領域P92に対応する画像領域P12では、輝度が精細に変化しており、視覚的に自然な画像となっている。
以上説明したように、映像信号処理システム1は、変換係数に対する雑音重畳により、量子化歪が生じる際の誤差の符号及び振幅を時間的に変化させるディザリング効果を生じる。また、映像信号処理システム1は、逆量子変換係数値を局部復号時に当該雑音値を相殺するように変動させることにより、逆量子化変換係数を量子化ステップより細かい単位で摂動させるため、ブロック歪の現れ方を多様化し、画質の劣化を目立たなくすることができる。また、量子化ステップ単位のディザリングでは量子化歪の絶対量としては却って大きくなり符号化効率の低下を招くが、映像信号処理システム1は、量子化歪の絶対量を抑えるため、符号化効率の低下を抑えることができる。
[第2の実施形態]
本発明の第2の実施形態について説明する。ここでは、上述した実施形態と同様の構成については、同一の符号を付し、説明を援用する。
図4は、本実施形態に係る映像信号処理システム1Aの構成を示すブロック図である。
映像信号処理システム1Aは、映像信号処理システム1が備える映像符号化装置10、映像復号装置30に代えて、映像符号化装置10A、映像復号装置30Aを備える。
映像符号化装置10Aは、映像符号化装置10が備える雑音発生部110に代えて、雑音発生部110Aを備える。同様に、映像復号装置30Aは、映像復号装置30が備える雑音発生部306に代えて、雑音発生部306Aを備える。
雑音発生部110A及び雑音発生部306Aは、雑音発生部110及び雑音発生部306と同様に雑音を発生する。ただし、雑音発生部110及び雑音発生部306は、一様雑音を発生したのに対して、雑音発生部110A及び雑音発生部306Aは周波数成分ごとに値域が異なる雑音成分を生成する点が異なる。
図5は、本実施形態に係る雑音の生成処理を説明するための模式図である。
図5に示すように、雑音発生部110A及び雑音発生部306Aは、一様雑音rに対して、周波数成分ごとの重み付け係数を乗算することにより、雑音eを生成する。ここで、周波数成分ごとの重み付け係数は、低周波数成分に対して重みを大きくし、高周波数成分に対して重みを小さくする。
以上説明したように、映像信号処理システム1Aにおいて、雑音発生部110A及び雑音発生部306Aは、変換係数の各々の周波数成分の高低に応じた値域を有する雑音信号を発生する。
一般に、ブロック歪に関しては、低周波数成分の方が、高周波数成分に比して目立ちやすい。この点、映像信号処理システム1Aは、周波数成分の高低に応じて、加算、減算する雑音の地域を調整するため、画質の劣化をさらに目立ちにくくすることができる。
[変形例]
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成は上述の実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。例えば、上述の第1〜第2の実施形態において説明した各構成は、任意に組み合わせることができる。また、上述の第1〜第2の実施形態において説明した各構成は、任意に分離して、別体の装置に備えることができる。
例えば、図6の変形例に係る映像信号処理システム1Bのブロック図に示すように、上述の第1〜第2の実施形態において説明した雑音の加算(加算部111B)は、量子化部105による処理の前ではなく、変換部104による処理の前に行われても構わない。この場合、雑音の減算は、逆量子化部107、逆量子化部301による処理の後ではなく、逆変換部302による処理の後(減算部112B、減算部307B)で行う。例えば、量子化ステップが均一であれば、映像符号化装置10Bの雑音発生部110B及び映像復号装置30Bの雑音発生部306Bが発生する雑音を一様乱数又は一様な疑似乱数とすることにより、映像信号処理システム1と同様の効果を得ることができる。
また、上述した実施形態において、雑音の減算を省略してもよい。例えば、量子化ステップに応じた値域を有する雑音の加算や周波数成分ごとに重み付けを行った雑音の加算のみでも、従来のディザリング手法に比して、画質劣化を目立たなくすることができる。
また、上述の映像符号化装置10、10A、10B、映像復号装置30、30A、30Bの機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより映像符号化装置10、10A、10B、映像復号装置30、30A、30Bとしての処理を行ってもよい。ここで、「記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行する」とは、コンピュータシステムにプログラムをインストールすることを含む。ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、インターネットやWAN、LAN、専用回線等の通信回線を含むネットワークを介して接続された複数のコンピュータ装置を含んでもよい。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。このように、プログラムを記憶した記録媒体は、CD−ROM等の非一過性の記録媒体であってもよい。また、記録媒体には、当該プログラムを配信するために配信サーバからアクセス可能な内部または外部に設けられた記録媒体も含まれる。配信サーバの記録媒体に記憶されるプログラムのコードは、端末装置で実行可能な形式のプログラムのコードと異なるものでもよい。すなわち、配信サーバからダウンロードされて端末装置で実行可能な形でインストールができるものであれば、配信サーバで記憶される形式は問わない。なお、プログラムを複数に分割し、それぞれ異なるタイミングでダウンロードした後に端末装置で合体される構成や、分割されたプログラムのそれぞれを配信する配信サーバが異なっていてもよい。さらに「コンピュータ読み取り可能な記録媒体」とは、ネットワークを介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。また、上記プログラムは、上述した機能の一部を実現するためのものであってもよい。さらに、上述した機能をコンピュータシステムに既に記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
また、上述した実施形態における映像符号化装置10、10A、10B、映像復号装置30、30A、30Bの一部、または全部を、LSI(Large Scale Integration)等の集積回路として実現してもよい。映像符号化装置10、10A、10B、映像復号装置30、30A、30Bの各機能部は個別にプロセッサ化してもよいし、一部、または全部を集積してプロセッサ化してもよい。また、集積回路化の手法はLSIに限らず専用回路、または汎用プロセッサで実現してもよい。また、半導体技術の進歩によりLSIに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いてもよい。
以上、図面を参照してこの発明の一実施形態について詳しく説明してきたが、具体的な構成は上述のものに限られることはなく、この発明の要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。
1、1A、1B…映像信号処理システム、10、10A、10B…映像符号化装置、100…ブロック分割部、101…メモリ、102…予測部、103…減算部、104…変換部、105…量子化部、106…エントロピー符号化部、107…逆量子化部、108…逆変換部、111、111B…加算部、112、112B…減算部、20…伝送・蓄積装置、30、30A、30B…映像復号装置、300…エントロピー復号部、301…逆量子化部、302…逆変換部、303…メモリ、304…予測部、305…加算部、306、306A、306B…雑音発生部、307、307B…減算部

Claims (4)

  1. 第1の映像信号を直交変換して第1の変換係数を取得し、前記第1の変換係数を量子化し、前記量子化の処理結果をエントロピー符号化して符号を生成し、前記量子化の処理結果を逆量子化して第2の変換係数を取得し、前記第2の変換係数を逆直交変換して第2の映像信号を取得し、前記第2の映像信号に係る映像信号に基づいて予測を行う映像符号化装置であって、
    雑音信号を発生する雑音発生部と、
    前記雑音発生部が発生した雑音信号を、前記量子化前に、第1の映像信号、又は、前記第1の変換係数に加算する加算部と、
    前記雑音発生部が発生した雑音信号を、前記逆量子化後に、第2の映像信号、又は、前記第2の変換係数から減算する減算部と、
    を具備し、
    前記加算部は、前記雑音発生部が発生した雑音信号を、前記直交変換後、且つ、前記量子化前に、前記第1の変換係数に加算し、
    前記減算部は、前記雑音発生部が発生した雑音信号を、前記逆量子化後、且つ、前記逆直交変換前に、前記第2の変換係数に加算する、
    映像符号化装置。
  2. 前記雑音発生部は、前記第1の変換係数に対する量子化ステップに応じた値域を有する一様乱数又は一様な疑似乱数に基づいて、雑音信号を発生する
    請求項に記載の映像符号化装置。
  3. 前記雑音発生部は、前記第1の変換係数の各々の周波数成分の高低に応じた値域を有する雑音信号を発生する
    請求項1又は請求項に記載の映像符号化装置。
  4. コンピュータを、請求項1から請求項のいずれか一項に記載の映像符号化装置して機能させるためのプログラム。
JP2016222975A 2016-11-16 2016-11-16 映像符号化装置、映像復号装置、及びプログラム Active JP6796463B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016222975A JP6796463B2 (ja) 2016-11-16 2016-11-16 映像符号化装置、映像復号装置、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016222975A JP6796463B2 (ja) 2016-11-16 2016-11-16 映像符号化装置、映像復号装置、及びプログラム

Publications (2)

Publication Number Publication Date
JP2018082299A JP2018082299A (ja) 2018-05-24
JP6796463B2 true JP6796463B2 (ja) 2020-12-09

Family

ID=62199142

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016222975A Active JP6796463B2 (ja) 2016-11-16 2016-11-16 映像符号化装置、映像復号装置、及びプログラム

Country Status (1)

Country Link
JP (1) JP6796463B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7467034B2 (ja) * 2018-08-10 2024-04-15 キヤノン株式会社 画像処理方法、画像処理装置、画像処理システム、およびプログラム
WO2020031601A1 (ja) * 2018-08-10 2020-02-13 キヤノン株式会社 画像処理方法、画像処理装置、画像処理システム、およびプログラム

Also Published As

Publication number Publication date
JP2018082299A (ja) 2018-05-24

Similar Documents

Publication Publication Date Title
JP6263590B2 (ja) ハイブリッドなビデオ符号化における予測誤差の適応符号化
JP5283628B2 (ja) 映像復号方法及び映像符号化方法
JP5454584B2 (ja) 映像符号化装置および映像復号装置
JP4747975B2 (ja) 画像処理装置および方法、プログラム、並びに、記録媒体
US20100322303A1 (en) Video encoding/decoding method and apparatus
JP5421757B2 (ja) 画像符号化装置
JP2008526072A (ja) スケーラブル符号化
US20100054619A1 (en) Method and apparatus for inverse quantizing image, and method and apparatus for decoding image
KR101973571B1 (ko) 영상 변환 부호화/복호화 방법 및 장치
JP6796463B2 (ja) 映像符号化装置、映像復号装置、及びプログラム
US20240223810A1 (en) Image decoding apparatus, image decoding method, and storage medium
JP7553687B2 (ja) 復号装置、プログラム、及び復号方法
JP7100194B2 (ja) 画像符号化装置、画像復号装置、及びプログラム
JP6681731B2 (ja) 符号化装置、復号装置、及びプログラム
JP2018011159A (ja) 画像符号化装置及び画像復号装置及びそれらの制御方法及びプログラム
US20210377523A1 (en) Encoding device, encoding method, decoding device, and decoding method
WO2019150435A1 (ja) 映像符号化装置、映像符号化方法、映像復号装置、映像復号方法、及び映像符号化システム
JP5560452B2 (ja) 画像処理方法及び画像処理装置
WO2020203962A1 (ja) 画像生成装置、画像生成方法、及びプログラム
JP2018056903A (ja) 画像符号化装置、画像復号装置、符号化プログラム、及び復号プログラム
JP6727900B2 (ja) 符号化装置、復号装置、及びプログラム
WO2012001833A1 (ja) 動画像符号化装置、動画像復号化装置及び方法
JP2008177916A (ja) 画像符号化装置及び方法
JP3199786B2 (ja) 画像処理装置
KR20140104404A (ko) 영상 데이터의 엔트로피 부호화, 복호화 방법 및 장치

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20181026

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191002

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200812

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200818

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201002

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201020

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201116

R150 Certificate of patent or registration of utility model

Ref document number: 6796463

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250