JP7469866B2 - 符号化装置および符号化方法、復号装置および復号方法 - Google Patents

符号化装置および符号化方法、復号装置および復号方法 Download PDF

Info

Publication number
JP7469866B2
JP7469866B2 JP2019201032A JP2019201032A JP7469866B2 JP 7469866 B2 JP7469866 B2 JP 7469866B2 JP 2019201032 A JP2019201032 A JP 2019201032A JP 2019201032 A JP2019201032 A JP 2019201032A JP 7469866 B2 JP7469866 B2 JP 7469866B2
Authority
JP
Japan
Prior art keywords
data
frequency components
sub
image data
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019201032A
Other languages
English (en)
Other versions
JP2021077942A (ja
JP2021077942A5 (ja
Inventor
大輔 坂本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2019201032A priority Critical patent/JP7469866B2/ja
Priority to US17/081,370 priority patent/US20210136394A1/en
Publication of JP2021077942A publication Critical patent/JP2021077942A/ja
Publication of JP2021077942A5 publication Critical patent/JP2021077942A5/ja
Application granted granted Critical
Publication of JP7469866B2 publication Critical patent/JP7469866B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/1883Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit relating to sub-band structure, e.g. hierarchical level, directional tree, e.g. low-high [LH], high-low [HL], high-high [HH]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Description

本発明は符号化装置および符号化方法、ならびに復号装置および復号方法に関する。
デジタルカメラの撮像素子に多く用いられている単板式のカラーイメージセンサには、予め定められた複数色のフィルタが規則的に配置されたカラーフィルタ(CFA)が設けられている。色の組み合わせや配置方法が異なる様々なカラーフィルタが知られているが、図2(a)に示す原色ベイヤ配列のカラーフィルタが代表的である。
原色ベイヤ配列のCFAは2×2を1単位としてR(赤)、G0(緑)、G1(緑)、B(青)のフィルタが周期的に配列されている。撮像素子の1画素あたり1つのフィルタが設けられるため、1回の撮影で得られる画像データを構成する画素データは、RGBのうち1つの色成分の情報しか有していない。この状態の画像データをRAWデータと呼ぶ。
RAWデータはそのまま表示するには適していない。そのため、一般には様々な画像処理を適用して、RAWデータを汎用機器で表示可能な形式(例えばJPEG形式やMPEG形式)に変換してから記録している。しかしながら、変換の過程でデータ量の削減などのために不可逆的な画像処理が適用されることから、変換前のRAWデータを記録可能なデジタルカメラも存在する。
RAWデータのデータ量は、撮像素子の画素数増加に伴って非常に大きくなっている。そのため、連写速度の向上や記録媒体の容量節約などを目的として、データ量を削減(圧縮)してから記録することも提案されている。特許文献1には、RAWデータをR、G0、B、G1の4つのプレーンに分離した後に符号化する方法が示されている。
特開2003-125209号公報
RAWデータのような画像データを符号化してデータ量を削減する場合、符号化による画質低下を抑制しつつ、圧縮率(データ削減率)を高めることが重要である。本発明は、良好な符号化効率を実現しつつ、符号化による画質低下を抑制する符号化を実現する符号化装置および符号化方法を提供することを目的の1つとする。
上述の目的は、周波数変換して低周波成分のサブバンドデータと高周波成分のサブバンドデータとを生成する変換手段と、第1の画像データを変換手段により周波数変換して生成された第1の画像データよりも解像度が小さい低周波成分のサブバンドデータから第1の画像データの解像度を有する第2の画像データを生成する生成手段と、第1の画像データを変換手段により周波数変換して生成された高周波成分のサブバンドデータと、第2の画像データを変換手段により周波数変換して生成された高周波成分のサブバンドデータとの差分を求める演算手段と、第1の画像データの低周波成分のサブバンドデータと、差分とを符号化して、符号化データを生成する符号化手段と、を有することを特徴とする符号化装置によって達成される。
本発明によれば、良好な符号化効率を実現しつつ、符号化による画質低下を抑制する符号化を実現する符号化装置および符号化方法を提供することができる。
第1実施形態に係る符号化装置および復号装置の機能構成例を示すブロック図 符号化装置におけるプレーン変換に関する図 可逆5-3DWTおよび可逆5-3逆DWTに関する図 サブバンド分解に関する図 第1実施形態に係る符号化装置および復号装置の処理の概要を模式的に示す図 第1実施形態において用いるニューラルネットワークを構成するニューロンの構成例を示す図 実施形態において超解像処理に利用可能なニューラルネットワークの構成例を示す図 図7のニューラルネットワークで用いる重みおよびバイアスの学習方法に関する模式図 DCTを用いた周波数変換に関する図 DC係数の構成を説明するための図 実施形態おける符号化データのデータ構造例に関する図 図11のデータ構造例におけるヘッダ情報の詳細の例に関する図 図12におけるニューラルネットワークに関する情報の具体例を説明するための図 図11のデータ構造例におけるヘッダ情報の詳細の別の例に関する図 第2実施形態に係る符号化装置および復号装置の機能構成例を示すブロック図 第2実施形態に係る符号化データのヘッダ情報の詳細の例に関する図
以下、添付図面を参照して本発明をその例示的な実施形態に基づいて詳細に説明する。なお、以下の実施形態は特許請求の範囲に係る発明を限定しない。また、実施形態には複数の特徴が記載されているが、その全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。
なお、以下の実施形態で説明する符号化装置および復号装置は、画像データを処理可能な電子機器において実現することができる。このような電子機器には、デジタルカメラ、コンピュータ機器(パーソナルコンピュータ、タブレットコンピュータ、メディアプレーヤ、PDAなど)、携帯電話機、スマートフォン、ゲーム機、ロボット、ドローン、ドライブレコーダが含まれる。これらは例示であり、本発明は他の電子機器にも適用可能である。
●(第1実施形態)
図1(a)は、本発明の実施形態に係る符号化装置100の機能構成例を示すブロック図である。符号化装置100はプレーン変換部101、周波数変換部102、超解像部103、高周波差分演算部104、量子化部105、エントロピー符号化部106、量子化パラメータ設定部107を有する。これら各部(機能ブロック)は、ASICなどの専用ハードウェア回路により、不揮発性メモリに記憶されたプログラムをDSPやCPUなどの汎用プロセッサによってシステムメモリに読み込んで実行することにより、あるいはその組み合わせにより実現できる。以下では便宜上、各機能ブロックが自律的に、他の機能ブロックと連携しながら動作するように説明する。
ここでは、符号化の対象であるRAWデータ(第1の画像データ)が、図2(a)に示した原色ベイヤ配列のCFAを備えた撮像素子から読み出されたものであるとする。RAWデータは、プレーン変換部101に入力される。
プレーン変換部101は、図2(b)に示すように、RAWデータをCFAの色配列に応じたグループ(プレーン)に分離して、周波数変換部102に供給する。ここでは、プレーン変換部101は、原色ベイヤ配列のCFAを構成するR、G0、G1、Bの4種類のフィルタのうち、同じ種類のフィルタが設けられた画素から得られる画素データをグループ化する。Rフィルタが設けられた画素(R画素)から得られる画素データのグループをRプレーンとよぶ。したがってプレーン変換部101はRAWデータをRプレーン、G0プレーン、G1プレーン、Bプレーンに分離し、各プレーンを周波数変換部102に供給する。
周波数変換部102は、プレーン変換部101から入力された各プレーンのデータに対して可逆5-3離散ウェーブレット変換(DWT)を1回実行する。5-3DWTは、5タップのローパスフィルタ(LPF)と3タップのハイパスフィルタ(HPF)とを用いたDWTであり、5/3DWTとも呼ばれる。
ここで可逆5-3DWTの具体的な適用方法について、図3(a)および図4を用いて説明する。図3(a)において、a~eは画素データ列、b’,d’はDWTを実行して生成される高周波成分のDWT係数、c’’はDWTを実行して生成される低周波成分のDWT係数を示している。高周波成分のDWT係数b’,d’は、画素データa~eを用いて
(式1) b’=b-(a+c)/2
(式2) d’=d-(c+e)/2
によって得られる。式1、式2は使用する画素データが異なるが、数式での演算は同一である。
また、低周波成分のDWT係数c’’は、画素データa~eと高周波成分のDWT係数b’およびd’から
(式3) c’’=c+(b’+d’+2)/4
あるいは
(式4) c’’=(-a+2b+6c+2d-e) /8
によって得られる。
図3(a)に示すDWTは1次元DWTである。1次元DWTを各プレーンのデータについて垂直方向と水平方向に実施することで、2次元DWTが実現できる。2次元DWTの結果、図4に600で示すように、プレーンデータが1LL、1LH、1HL、1HHの4つのサブバンド(周波数成分)データに分解される。
1HHサブバンドはレベル1の水平方向、垂直方向ともに高周波成分のサブバンドを示している。図4に示すように、レベル1の各サブバンドデータを構成する水平および垂直方向の係数の数は、プレーンデータを構成する水平および垂直方向の画素データの半数となる。
図4の600における1LLサブバンドに2次元DWTを適用すると、1LLサブバンドがさらにサブバンド分割され、610で示すようなレベル2のサブバンドデータ(2LL、2LH、2HL、2HH)が得られる。レベル2の各サブバンドデータを構成する水平および垂直方向の係数の数は、レベル1のサブバンドデータを構成する水平および垂直方向の画素データの半数となる。
なお、本実施形態では周波数変換部102が、入力される各プレーンのデータに対して2次元DWTを1回適用するものとする。したがって周波数変換部102は、低周波成分である1LLのサブバンドデータを超解像部103およびエントロピー符号化部106に、高周波成分1LH、1HL、1HHのサブバンドデータを高周波差分演算部104に、それぞれ供給する。
超解像部103(変換手段)は、各プレーンの1LLサブバンドデータに超解像処理を適用する。超解像部103は超解像処理により、図5(a)の801に示すように、プレーン変換部101から出力されるプレーンデータと同じ解像度のデータ(超解像画像データまたは第2の画像データと呼ぶ)を生成する。超解像部103は、生成した超解像画像データを周波数変換部102に供給する。超解像処理の詳細については後述する。
周波数変換部102は超解像部103から入力された超解像画像データに対して可逆5-3DWTを1回適用してレベル1のサブバンドデータ(1LL’、高周波成分1LH’、1HL’、1HH’)を生成する。そして、高周波成分1LH’、1HL’、1HH’を高周波差分演算部104に供給する。
高周波差分演算部104には、周波数変換部102から高周波成分のサブバンドデータが2セット供給される。1セットはプレーンデータをサブバンド分割して得られた高周波成分(1LH,1HL,1HH)のサブバンドデータである。また、もう1セットは1LLに基づく超解像画像データをサブバンド分割して得られた高周波成分(1LH’,1HL’,1HH’)のサブバンドデータである。
高周波差分演算部104は、2セットの高周波成分のサブバンドデータについて、同じ種類のサブバンドデータの差分を演算する。すなわち、高周波差分演算部104は、図5(a)の803に示すように1LH-1LH’、1HL-1HL’、1HH-1HH’を演算し、演算結果を量子化部105に供給する。
量子化パラメータ設定部107は、ユーザーが設定した圧縮率に従い、各プレーンの各サブバンド間差分に与える量子化パラメータを決定し、量子化部105に供給する。なお、一般に同一符号量で画質を良くするためには視覚的な影響の少ない高周波のサブバンド、およびレベルの低いサブバンドほど強く量子化される。そのためレベル1まで周波数変換を実施した場合には1HH-1HH’>1HL-1HL’≒1LH-1LH’、となるように量子化パラメータが設定される。
また、量子化パラメータ設定部107は、超解像部103に対して、ニューラルネットワークを構成するニューロンに設定する重みおよびバイアスを供給する。量子化パラメータ設定部107は、重みおよびバイアスをエントロピー符号化部106にも供給する。
量子化部105は、高周波差分演算部104から供給されるサブバンドデータの差分1LH-1LH’、1HL-1HL’、1HH-1HH’の各々に対して、量子化パラメータ設定部107から設定された量子化パラメータを用いて量子化する。そして、量子化部105は、量子化した差分データと量子化パラメータとをエントロピー符号化部106に供給する。
エントロピー符号化部106は、周波数変換部102から供給される低周波成分1LLと、量子化部105から供給される高周波成分の差分1LH-1LH’、1HL-1HL’、 1HH-1HH’の量子化データとをエントロピー符号化する。エントロピー符号化の方法に制限は無いが、例えばEBCOT(Embedded Block Coding with Optimized Truncation)を用いることができる。エントロピー符号化部106は、符号化したデータと、量子化パラメータと、重みおよびバイアスとを例えば1つのデータファイルに格納して出力したり、符号化データストリームとして出力したりする。
超解像部103についてさらに説明する。本実施形態において超解像部103は、ニューラルネットワークを用いて超解像処理を実現する。
図6は、超解像部103が用いるニューラルネットワークの構成要素となるニューロンの構成例である。ニューロン900は、複数の入力値(ここではxからx)のぞれぞれに対して別個に供給される重み(wからw)を乗じて加算した後、バイアスbを加算してx’を求める。さらに、活性化関数にx’を入力して得られるyを出力する。
ニューロン900の入力値は、ニューラルネットワークに入力される1LLサブバンドデータ、あるいは上流もしくは前段のニューロンの出力である。また、ニューロン900の出力yは下流もしくは後段の他のニューロンに入力されるか、超解像画像データとしてニューラルネットワークから出力される。
より具体的には、ニューロン900でx’を求める演算は以下の式5で表される。
Figure 0007469866000001
なお、重み(w乃至w)およびバイアスbは量子化パラメータ設定部107から供給される。
続いて式5で求めたx’を活性化関数に入力して出力yを得る。活性化関数は非線形の関数であり、例えば式6に示すシグモイド関数や、式7に示すReLU(ランプ関数)などを用いることができるが、これらに限定されない。
(式6) y=1/(1+e-x’
(式7) y=0 (x’≦0),y=x’ (x’>0)
図7(a)はニューロン900を用いたニューラルネットワーク1000の構成例を示す図である。ニューラルネットワーク1000は、入力層1001、第1中間層1002、第2中間層1003、および出力層1004の4層構成である。各層の間には複数のニューロン900が配置されている。
各層のデータがニューロン900に入力され、ニューロン900の出力が次の層のデータとなる。第1中間層1002、第2中間層1003のデータ数は一致している必要はない。したがって、層間に設けられるニューロン900の数は0以外の任意の数でよい。なお、本実施形態ではデータ数を4倍にする超解像処理を実現するため、入力層のデータ数Nに対して出力層のデータ数が4Nとなるようにニューラルネットワーク1000が構成されている。
入力層1001のin~inはニューラルネットワーク1000に入力される1LLサブバンドデータである。また、出力層100のout~out4Nはニューラルネットワーク1000が出力する超解像画素データである。
図7(b)はニューロン900を用いた別のニューラルネットワーク1100の構成例を示す図である。ニューラルネットワーク1100はスキップコネクションを含んでいる。入力層1101と第1中間層1102間の波線の矢印がスキップコネクションを示し、in、inは第1中間層1102と第2中間層1103の間に配置されたニューロン900に直接入力されている。このように、超解像部103が用いるニューラルネットワークはスキップコネクションを含む構成であってもよい。
また、CNN(Convolution Neural Network)やDBN(Deep Brief Network)といった他の任意の構成のニューラルネットワークを用いてもよい。また、ニューラルネットワークの層数は4に限定されず、任意の複数層のニューラルネットワークを用いることができる。
次に、ニューロン900で適用する重みおよびバイアスの決定方法について説明する。本実施形態では図8に示すような構成によって機械学習を利用してこれらのパラメータを決定する。図8に示す重み・バイアス更新部1203および重み・バイアス設定部1204は符号化装置100の構成(例えば量子化パラメータ設定部107の一部)であってもよいし、符号化装置100とは別の学習装置の構成であってもよい。
学習にあたり、図1(a)の周波数変換部102から出力される1LLサブバンドデータ1200を超解像部103に供給する。重み・バイアス設定部1204は超解像部103に対し、重みおよびバイアスを設定する。重みおよびバイアスの初期値は任意であり、例えば乱数を用いることができる。
超解像部103は設定された重みおよびバイアスをニューロン900で用いて超解像処理を実行し、サブバンド分割前のプレーンデータと同じ解像度(1LLサブバンドデータの4倍の解像度)の超解像プレーンデータ1201を生成する。超解像部103は超解像プレーンデータ1201を重み・バイアス更新部1203に供給する。
重み・バイアス更新部1203には超解像プレーンデータ1201と、1LLサブバンドデータの元になった、サブバンド分割前の原画プレーンデータ1202とが入力される。原画プレーンデータ1202はプレーン変換部101が出力するプレーンデータに相当する。
重み・バイアス更新部1203は超解像プレーンデータ1201と原画プレーンデータ1202とを比較し、誤差逆伝搬法などを用いて超解像プレーンデータ1201が原画プレーンデータに近づくように、重みおよびバイアスを更新する。重み・バイアス更新部1203は、更新した重みおよびバイアスを重み・バイアス設定部1204に供給する。これにより、重み・バイアス設定部1204から超解像部103に供給する重みおよびバイアスが更新される。
重みおよびバイアスを更新する際に用いる指標としては例えばPSNR(Peak signal-to-noise ratio)や差分絶対値和などを用いることができるが、これらに限定されない。PSNRを用いる場合にはPSNRが大きくなるように重みおよびバイアスを更新する。また、差分絶対値和を用いる場合には差分絶対値和が小さくなるように重みおよびバイアスを更新する。
上述した重みおよびバイアスの更新処理を大量の学習用データに対して実行することにより、超解像部103のニューラルネットワークが有するニューロンで適用する重みおよびバイアスを決定する。このように機械学習を用いて重みおよびバイアスを決定することにより、超解像部103において元のプレーンデータに近い超解像画像データを生成することができる。その結果、超解像画像データをサブバンド分割して得られる高周波成分についても、元のプレーンデータをサブバンド分割して得られる高周波成分に近いものになる。
したがって、高周波差分演算部104で得られる、超解像データに基づく高周波成分とプレーンデータに基づく高周波成分との差分結果は0に近い値が支配的になり、エントロピー符号化による符号化効率を高めることができる。
なお、本実施形態においては2次元DWTによるサブバンド分割を1回適用する構成について説明した。しかし、サブバンド分割を複数回適用してもよい。サブバンド分割を複数回適用する場合も、LLサブバンドデータに対して超解像処理を行う。サブバンド分割はLLサブバンドデータに対して適用するため、適用するサブバンド分割の回数にかかわらず、LLサブバンドデータは1種類しか存在しない。
例えば図4の610に示すようにサブバンド分割を2回適用した場合には、2LLサブバンドデータに対して超解像処理を適用する。超解像部103では、サブバンド分割の適用回数をpとすると、水平方向および垂直方向のそれぞれについて解像度(データ数)を2倍する超解像処理をLLサブバンドデータに適用する。また、高周波差分演算部104で差分を演算される高周波成分のサブバンドデータは、1HL、1LH、1HHからpHL、pLH、pHHの3p種類になる。
また、本実施形態では画像データを周波数成分に分割する方式として2次元DWTを用いたが、他の周波数変換方法を用いてもよい。例えば、MPEG2やH.264などの規格で用いられている離散コサイン変換(Discrete Cosine Transform:DCT)を用いることができる。
H.264では符号化する画像データを水平16画素×垂直16画素のマクロブロックに分割し、さらに4画素×4画素のブロック単位でDCTを適用して周波数変換したのちに符号化する。図9は、DCTを適用して得られるDCT係数を模式的に示す図である。4×4の係数のうち、左上の係数をDC係数、それ以外の係数をAC係数と呼ぶ。周波数変換部102は、超解像処理の対象となる低周波成分(サブバンドデータ)を、図10に示すように、DCTを行う単位であるブロックごとにDC係数を取り出して構成することができる。DCTを4画素×4画素のブロックごとに適用する場合、DC係数からなるサブバンドデータは元データの1/16の解像度となる。したがって、超解像部103では水平方向および垂直方向に4倍ずつ解像度を増やす超解像処理をサブバンドデータに適用する。DCTを適用するブロックのサイズが異なる場合でも、超解像処理の倍率が異なる以外は基本的に同様である。なお、DC係数についても1LLサブバンドの係数と同様、量子化を行わないものとする。
図11を用いて、符号化結果(符号化RAWデータおよび量子化パラメータ)を記録するためのデータ形式の例について説明する。データ形式は図11(a)に示す階層構造を有する。データは、符号化データ全体に関わる情報を示す「main_header」から始まる。また、RAWデータを画素ブロック(タイル)単位に符号化することを想定して「tile_header」と「tile_data」とが繰り返し含まれている。これによりタイル単位にデータを格納することが可能となっている。符号化がブロック単位に行われない場合、「tile_header」と「tile_data」はそれぞれ1つのみが含まれる。
「tile_data」には、符号化RAWデータがプレーン単位に順次格納される。各プレーンに関わる情報を示す「plane_header」とそのプレーンについての符号化データである「plane_data」とがプレーンごとに繰り返される。プレーンごとの符号化データである「plane_data」は、サブバンドごとの符号化データで構成される。したがって、「plane_data」には、各サブバンドに関わる情報を示す「sb_header」と、そのサブバンドについての符号化データである「sb_data」とがサブバンドインデックス順に配置される。サブバンドインデックスは、例えば図11(b)に示すように割り当てられている。本実施形態では低周波成分のサブバンドデータ(LLサブバンドデータやDC係数)については量子化を行わない。そのため、サブバンドインデックス0については係数をエントロピー符号化したデータが格納される。また、高周波成分に対応するサブバンドインデックス1~3については高周波差分演算部104で算出した差分を量子化およびエントロピー符号化したデータが格納される。
例えば、図7(a)に示した構成のニューラルネットワークを用いた場合について具体的な各ヘッダ情報のシンタクス要素の例を図12に示す。
「main_header」には以下の情報が格納される。
「coded_data_size」:符号化RAWデータ全体のデータ量
「width」:RAWデータの幅
「height」:RAWデータの高さ
「depth」:RAWデータのビット深度
「plane」:RAWデータの符号化時のプレーン数
「lev」:各プレーンのサブバンド分解レベル
「layer」、「activator」、「node」、「b」、「w」は超解像処理におけるニューラルネットワークの構成を示すシンタクス要素である。
「layer」:中間層の数
「activator」:活性化関数を特定する情報。例えば「0」であればシグモイド関数、「1」であればReLUとする。情報や関数の種類や数は単なる例示であり、任意に設定できる。
「node」:超解像処理における各中間層のニューロンの数
「b」:各ニューロンのバイアス
「w」:各ニューロンに入力される前階層のニューロンに乗算される重み
ニューラルネットワークに関する各シンタクスの詳細については後述する。
「tile_header」には以下の情報が含まれる。
「tile_index」:タイル分割位置を識別するためのタイルのインデックス
「tile_data_size」:タイルに含まれる符号化データ量
「tile_width」:タイルの幅
「tile_height」:タイルの高さ
「plane_header」には以下の情報が含まれる。
「plane_index」:プレーンを識別するためのプレーンインデックス
「plane_data_size」:プレーンの符号化データ量
「sb_header」には以下の情報が含まれる。
「sb_index」:サブバンドを識別するためのサブバンドインデックス
「sb_data_size」:サブバンドの符号化データ量
「sb_qp_data」:各サブバンドの量子化パラメータ
図12のように各ヘッダのシンタクス要素を構成した場合、符号化装置がニューラルネットワークの構成に関するヘッダ情報に基づいて自身が有するニューラルネットワークの構成を更新可能に構成することができる。この場合、符号化装置の超解像部103が用いるニューラルネットワークのニューロンで用いる重みやバイアスなどを外部から変更することが可能である。そのため、本実施形態の符号化装置を搭載した機器に対するファームウェアの更新などを通じ、学習が進んで精度が向上した重みやバイアスを超解像部103に設定することができる。したがって、搭載済みの符号化装置の符号化効率をより高めることが可能になる。
次に、「main_header」に含まれるニューラルネットワークに関するシンタクス「layer」、「activator」、「node」、「b」、「w」と、ニューラルネットワークの具体的な構成との関係を、図13(a)を用いて説明する。なお、ここでは符号化されている1LLサブバンドデータが4×4の16個の係数からなるものとする。したがって、例えば図13(a)に示すような、16入力、64出力のニューラルネットワークに対応した情報が各項目に格納される。
図13(b)は図13(a)における入力層2101と第1中間層2102のmid00に接続されるニューロン901の構成例を示している。基本的な構成は図6に示したニューロン900と同様である。まず、図13(a)のニューラルネットワークは中間層を2つ有するため、「layer」=2とする。また、図13(b)に示すように、ニューロン901では活性化関数としてReLUを用いる場合、「activator」=1とする。
第1中間層2102に接続されるニューロンの数は3、第2中間層2103に接続されるニューロンの数は2、出力層2104に接続されるニューロンの数は64である。したがって「node(0)」=3、「node(1)」=2、「node(2)」=64とする。「node(i)」はiは層の番号を示している。i=0が第1中間層に相当する。
バイアスb(i)(j)はiが層の番号、jがニューロン番号を示す。ニューロン番号jは接続される層の要素の順番に振られる番号である。「b(0)(0)」は第1中間層2102に接続される3つのニューロンのうち、mid00に接続されるニューロン901に設定されるバイアス値である。図13(b)に示すニューロン901の場合、「b(0)(0)」=1となる。
同様に、図13(a)のmid01に接続されるニューロンのバイアス値を「b(0)(1)」に、図13(a)のmid02に接続されるニューロンのバイアス値を「b(0)(2)」に格納する。
w(i)(j)(k)はiが層の番号、jがニューロン番号,kが前階層のニューロン番号を示している。また、「w」の総数は一階層前のニューロンの数と同一である。第1中間層2102に接続されるニューロンのそれぞれには、LLサブバンドの係数が入力されるため、重みwの総数は16である。
図13(b)に示すように、重みwはニューロンに入力される前階層のニューロンの出力に乗算される。「w(0)(0)(0)」は図13(b)に示す第1中間層2102のmid00に接続されるニューロン901において、入力inに乗算される重みである。同様に、「w(0)(0)(1)」はinに乗算される重み、「w(0)(0)(2)」はinに乗算される重み、「w(0)(0)(15)」はin15に乗算される重みである。したがって、図13(b)に示すニューロン901の場合、「w(0)(0)(0)」=2、「w(0)(0)(1)」=3、「w(0)(0)(2)」=4、...「w(0)(0)(15)」=20が格納される。
他のニューロンについても、同様に重みを格納する。第1中間層2102のmid01に接続されるニューロンについては「w(0)(1)(n)」(n=0~15)に重みを格納する。第1中間層2102のmid02に接続されるニューロンについては「w(0)(2)(n)」(n=0~15)に重みを格納する。
他のニューロンについても同様にバイアスおよび重みを格納する。出力層2104に接続されたニューロンに関して、「b(2)(0)」、...「b(2)(63)」、重み「w(2)(0)(0)」、...「w(2)(63)(1)」を格納する。
以上のように各項目に情報を含めることにより、復号装置において符号化時に超解像画像データの生成に用いたニューラルネットワークを復元することができる。また、復号装置が有するニューラルネットワークの構成を更新することができる。
続いて、各ヘッダ情報のシンタクス要素のもう一つの構成例について図14に基づき説明を行う。
なお、図12では「main_header」に、符号化時の超解像度処理に用いたニューラルネットワークの構成に関するシンタクス要素「layer」、「activator」、「node」、「b」、「w」を含めたが、これらは必須ではない。例えば図14に示すように、「main_header」にはニューラルネットワークの構成に関するシンタクス要素である「layer」、「activator」、「node」、「b」、「w」を含めなくてもよい。
図14の形式で符号化データを記録する場合には、符号化装置と復号装置とで同一かつ固定の構成を有するニューラルネットワークを用いる。この場合、ニューラルネットワークを用いた超解像度処理の精度をファームウェアの更新などで向上させることはできないが、符号化データファイルの容量を小さくできる。
上述した符号化装置によって生成される符号化データは、符号化装置と逆の処理を行う復号装置によって復号することができる。図1(b)は、図1(a)の符号化装置と対をなす復号装置の機能構成例を示すブロック図である。復号装置200は、エントロピー復号部201、逆量子化部202、超解像部203、周波数変換部204、高周波復元部205、逆周波数変換部206、ベイヤー変換部207とを有する。これら各部(機能ブロック)は、ASICなどの専用ハードウェア回路により、不揮発性メモリに記憶されたプログラムをDSPやCPUなどの汎用プロセッサによってシステムメモリに読み込んで実行することにより、あるいはその組み合わせにより実現できる。以下では便宜上、各機能ブロックが自律的に、他の機能ブロックと連携しながら動作するように説明する。
エントロピー復号部201はEBCOT(Embedded Block Coding with Optimized Truncation)などによって、符号化されたウェーブレット係数を図5(b)に804で示すように復号する。エントロピー復号部201は復号された低周波成分1LLのサブバンドデータは超解像部203および逆周波数変換部206に供給する。またエントロピー復号部201は、復号された高周波成分の差分1LH-1LH’、1HL-1HL’、1HH-1HH’のデータと量子化パラメータとを逆量子化部202に供給する。さらに、エントロピー復号部201は、符号化データファイルにニューラルネットワークの構成に関する要素(「layer」、「activator」、「node」、「b」、「w」)が含まれている場合、これらの情報を超解像部203に供給する。
逆量子化部202は、エントロピー復号部201から送られた復元された高周波成分の差分1LH-1LH’、1HL-1HL’、1HH-1HH’を、量子化パラメータを用いて逆量子化し、高周波復元部205に供給する。
超解像部203はエントロピー復号部201から入力される低周波成分1LLのサブバンドデータに超解像度処理を適用し、サブバンド分割前のプレーンデータと同じ解像度のデータ(超解像画像データ)を生成して、周波数変換部204に供給する。この処理は、図5(b)において、804から805を生成する処理に相当する。超解像部203においてもニューラルネットワークを用いてサブバンドデータから解像度の高いデータを生成する。なお、エントロピー復号部201からニューラルネットワークの構成に関する情報が供給されている場合、超解像部203は供給される情報に基づいてニューラルネットワークを構成して、超解像度処理に用いる。
周波数変換部204は超解像画像データに対して可逆5-3DWTを1回実行し、低周波成分1LL’および高周波成分1LH’、1HL’、1HH’にサブバンド分割する。この処理は、図5(b)において、805から806を生成する処理に相当する。周波数変換部204は高周波成分1LH’、1HL’、1HH’のサブバンドデータを高周波復元部205に供給する。
高周波復元部205は逆量子化部202から供給される高周波成分の差分データと、周波数変換部204から送信される高周波成分のサブバンドデータとを、対応するサブバンドごとに加算する。具体的には、高周波復元部205は1LH-1LH’には1LH’を、1HL-1HL’には1HL’を、1HH-1HH’には1HH’を加算する。これにより、高周波復元部205は図5(b)の807に示すように高周波成分1LH、1HL、1HHのサブバンドデータを復元する。この復元は、高周波成分のサブバンドデータの加算データの取得に相当する。高周波復元部205は復元した高周波成分1LH、1HL、1HHのサブバンドデータを逆周波数変換部206に供給する。
逆周波数変換部206はエントロピー復号部201から供給される低周波成分1LLのサブバンドデータと、高周波復元部205から供給される復元された高周波成分1LH、1HL、1HHのサブバンドデータとに対して逆周波数変換を適用する。逆周波数変換は符号化時に行われた周波数変換の逆処理であり、可逆5-3逆DWT(逆離散ウェーブレット変換)である。逆周波数変換により、1プレーン分のデータが得られる。逆周波数変換部206は、符号化データに含まれるR、G0、B、G1の各プレーンについてのデータをベイヤー変換部207に供給する。
可逆5-3逆DWTの具体的な適用方法について、図3(b)を用いて説明する。図3(b)において、a’,c’,e’は高周波成分のDWT変換係数、b’’,d’’は低周波成分のDWT変換係数を示している。また、b,dはDWTの開始位置の画素を0番目とした時の偶数番目のプレーンの画素データ、cはDWT開始位置の画素を0番目とした時の奇数番目のプレーンの画素データを示している。DWT開始位置の画素を0番目とした時の偶数番目のプレーンの画素データb,dは
(式8) b=b’’-(a’+c’+2)/4
(式9) d=d’’-(c’+e’+2)/4
によって得られる。式8、式9は使用する画素データが異なるが、数式での演算は同一である。
また、DWT開始位置の画素を0番目とした時の奇数番目の色プレーンの画素データcは
(式10) c=c’+(b+d)/2
によって得られる。
図3(b)に示す逆DWTは1次元逆DWTである。1次元逆DWTをサブバンドデータの水平方向、垂直方向に実施することで各プレーンのデータに逆変換する。
ベイヤー変換部207は逆周波数変換部206から供給されるR、G0、B、G1の各プレーンのデータをベイヤ配列となるように再合成し、復号されたRAWデータとして出力する。
本実施形態では、画像をサブバンド分割して符号化する際、高周波成分のサブバンドデータについては、低周波成分のサブバンドデータに基づいて生成した画像をサブバンド分割して得られた高周波成分のサブバンドデータとの差分を符号化するようにした。これにより、高周波成分に関する符号化データ量を大幅に削減することができ、良好な符号化効率が実現できる。また、低周波成分のサブバンドデータについては量子化を行わないようにすることで、低周波成分については量子化誤差による画質低下が生じないため、高品質の復号画像データを得ることができる。
また、学習済みのニューラルネットワークを用いて低周波成分のサブバンドデータの解像度を増加させることにより、高周波成分の差分結果を0付近に集約することが可能であり、一層の符号化効率の向上が実現できる。また、復号装置で符号化に用いたニューラルネットワークを構成するための情報を符号化データに含めることにより、復号装置が有しているニューラルネットワークの性能を向上させることができる。
本実施形態に係る符号化装置においてプレーンへの変換は必須でない。また、本実施形態に係る符号化装置はRAWデータに限らず、任意の画像に対する符号化に適用可能である。
●(第2実施形態)
次に、本発明の第2実施形態について、図15(a)を用いて説明する。図15(a)において、第1実施形態で説明した符号化装置100と同様の機能ブロックについては同じ参照数字を付してある。本実施形態の符号化装置1800は、逆量子化部1801を有する点を除き、第1実施形態で説明した符号化装置100と同様の機能構成を有する。したがって、以下では第1実施形態と異なる部分について重点的に説明する。
第1実施形態では低周波成分である1LLのサブバンドデータについては量子化しない構成であったが、本実施形態では1LLのサブバンドデータも量子化する。そして、量子化した1LLのサブバンドデータを逆量子化部1801で逆量子化して超解像部103に供給する。
したがって、本実施形態において、周波数変換部102は、1LLのサブバンドデータを超解像部103ではなく量子化部105に供給する。
そして、量子化部105は、1LLのサブバンドデータを、量子化パラメータ設定部107から設定された量子化パラメータを用いて量子化し、エントロピー符号化部106および逆量子化部1801に供給する。
量子化パラメータ設定部107は、例えばユーザが設定した圧縮率に応じた量子化パラメータを、1LLのサブバンドデータに適用する量子化パラメータとして量子化部105および逆量子化部1801に設定することができる。
逆量子化部1801は量子化部105から供給される量子化済みの1LLのサブバンドデータを、量子化時に用いられた量子化パラメータを用いて逆量子化し、超解像部103に供給する。
超解像部103は逆量子化部1801から入力された1LLサブバンドデータに対して第1実施形態と同様に超解像処理を適用して超解像画像データを生成し、周波数変換部102に供給する。
超解像画像データに対する周波数変換部102の動作と、高周波差分演算部104の動作は第1実施形態と同様であるため説明を省略する。
量子化パラメータ設定部107は、高周波成分の差分データを量子化するための量子化パラメータを量子化部105に設定する。この量子化パラメータは、例えばユーザが設定した圧縮率に応じて決定されてよい。なお、視覚的な影響の少ない高周波のサブバンド、およびレベルの低いサブバンドほど大きな量子化ステップで量子化することで、同一符号量で画質の低下を抑制することができる。例えば周波数変換部102でレベル1のサブバンド分割を適用した場合、1HH-1HH’用の量子化ステップ>1HL-1HL’用の量子化ステップ≒1LH-1LH’用の量子化ステップ、という大小関係を満たす量子化パラメータを設定することができる。量子化パラメータ設定部107は、このような大小関係を満たす量子化パラメータを、複数の圧縮率のそれぞれについて予め用意しておき、設定された圧縮率に基づいて適切な量子化パラメータを量子化部105に設定することができる。
量子化部105は、高周波差分演算部104から供給される高周波成分の差分データ(1LH-1LH’、1HL-1HL’、1HH-1HH’)の各々に対して、量子化パラメータ設定部107から設定された量子化パラメータを用いて量子化する。そして、量子化部105は量子化したデータを、エントロピー符号化部106に供給する。
エントロピー符号化部106は、量子化された低周波成分1LLのサブバンドデータと、量子化された高周波成分の差分データとに対して、EBCOTなどのエントロピー符号化を適用し、符号化データとして出力する。
本実施形態では、低周波成分についても量子化を行うことで、第1実施形態よりも符号化データ量を削減することができる。
なお、超解像処理に用いるニューラルネットワークに設定する重み・バイアスの学習は図8を用いて第1実施形態で説明したように実施可能である。入力される1LLのサブバンドデータ1200が量子化および逆量子化されている点のみ異なる。なお、本実施形態においても、DWT以外の方法で周波数変換を行ってもよい。
本実施形態においては低周波成分1LLのサブバンドデータに適用する量子化パラメータが、設定される圧縮率(デジタルカメラであれば記録画質に相当)に応じて異なる。そのため、ニューラルネットワークの重みおよびバイアスの学習を、圧縮率ごとに行ってもよい。学習に要する時間や、保持する重みおよびバイアスのデータ量が増加するが、圧縮率に応じてより適切な超解像度処理が実施可能である。
圧縮率ごとに学習を行う場合における符号化データファイルのヘッダ情報のシンタクス要素の構成例について図16を用いて説明する。図16のシンタクス要素は「main_header」に「layer」、「node」、「b」、「w」を含まず、「nw_pat」を含む点が第1実施形態で説明した図12のシンタクス要素と異なる。
「nw_pat」はユーザが選択した圧縮率を特定可能な情報を格納する。例えば低圧縮、中圧縮、高圧縮の3つから圧縮率が選択可能な場合、低圧縮:0、中圧縮:1、高圧縮:2といった値を格納することができる。超解像処理は設定された圧縮率ごとに学習した重み、バイアスを用いてなされる。この場合、復号装置においても同様に、圧縮率に応じた重みおよびバイアスを保持しておき、復号時に「nw_pat」の値に応じた重みおよびバイアスをニューラルネットワークに設定する。
なお、各ヘッダ情報のシンタクス要素は図14の構成として、設定された圧縮率で学習した重み、バイアスの選択は「sb_header」の「sb_qp_data」を参照して行うようにしてもよい。
次に、符号化装置1800と対をなす復号装置1900について、図15(b)を用いて説明する。図15(b)において、第1実施形態で説明した復号装置200と同様の機能ブロックについては同じ参照数字を付してある。本実施形態の復号装置1900は、1LLのサブバンドデータが逆量子化部202から超解像部203に供給される点を除き、第1実施形態で説明した復号装置200と同様の機能構成を有する。したがって、以下では第1実施形態と異なる部分について重点的に説明する。
エントロピー復号部201はEBCOT(Embedded Block Coding with Optimized Truncation)などによって、符号化されたウェーブレット係数を図8(b)に804で示すように復号する。エントロピー復号部201は復号された低周波成分1LLのサブバンドデータと、高周波成分の差分1LH-1LH’、1HL-1HL’、1HH-1HH’のデータと、量子化パラメータとを逆量子化部202に転送する。
逆量子化部202は、エントロピー復号部201から供給される、復号された低周波成分1LLのサブバンドデータ、高周波成分の差分1LH-1LH’、1HL-1HL’、1HH-1HH’のデータを、量子化パラメータを用いて逆量子化する。逆量子化された低周波成分1LLは超解像部203と逆周波数変換部206に供給する。また、逆量子化された1LH-1LH’、1HL-1HL’、1HH-1HH’は高周波復元部205に供給する。
超解像部203はエントロピー復号部201から入力される低周波成分1LLのサブバンドデータに超解像部103と同じ超解像度処理を適用し、サブバンド分割前のプレーンデータと同じ解像度のデータ(超解像画像データ)を生成する。そして、超解像部203は生成した超解像画像データを周波数変換部204に供給する。
周波数変換部204は超解像画像データに対して可逆5-3DWTを1回実行し、低周波成分1LL’および高周波成分1LH’、1HL’、1HH’にサブバンド分割する。周波数変換部204は高周波成分1LH’、1HL’、1HH’のサブバンドデータを高周波復元部205に供給する。
高周波復元部205は逆量子化部202から供給される高周波成分の差分データと、周波数変換部204から送信される高周波成分のサブバンドデータとを、対応するサブバンドごとに加算する。具体的には、高周波復元部205は1LH-1LH’には1LH’を、1HL-1HL’には1HL’を、1HH-1HH’には1HH’を加算する。高周波復元部205は復元した高周波成分1LH、1HL、1HHのサブバンドデータを逆周波数変換部206に供給する。
逆周波数変換部206は逆量子化部202から供給される低周波成分1LLのサブバンドデータと、高周波復元部205から供給される復元された高周波成分1LH、1HL、1HHのサブバンドデータとに対して逆周波数変換を適用する。逆周波数変換は符号化時に行われた周波数変換の逆処理であり、可逆5-3逆DWTである。逆周波数変換により、1プレーン分のデータが得られる。逆周波数変換部206は、符号化データに含まれるR、G0、B、G1の各プレーンについてのデータをベイヤー変換部207に供給する。
ベイヤー変換部207は逆周波数変換部206から供給されるR、G0、B、G1の各プレーンのデータをベイヤ配列となるように再合成し、復号されたRAWデータとして出力する。
本実施形態によれば、第1実施形態では量子化しない1LLのサブバンドデータを量子化するようにしたため、符号化データ量をさらに削減することができる。
●(変形例)
第1実施形態では低周波成分である1LLのサブバンドデータは量子化を行わずに、高周波成分の差分のデータのみを量子化し、第2実施形態では低周波成分である1LLのサブバンドデータと高周波成分の差分のデータの両方を量子化するものとした。
変形例では、符号化装置100については、プレーン変換部101、周波数変換部102、超解像部103、高周波差分演算部の処理は、第1実施形態、及び、第2実施形態と同様であるが、量子化部105において量子化するデータが異なる。複号装置200については、エントロピー複合部201、超解像部203、周波数変換部204、高周波復元部205、逆周波数変換部206での処理は、第1実施形態、及び、第2実施形態と同様であるが、逆量子化部202において逆量子化するデータが異なる。
変形例1では、符号化装置100においては、周波数変換部102により周波数変換されたデータのうち、低周波成分である1LLのサブバンドデータについては、第2実施形態と同様に量子化部105により量子化を行う。そして、高周波成分の差分データ(1LH-1LH’、1HL-1HL’、1HH-1HH’)に対しては、量子化部105において量子化を行わずに、エントロピー符号化部106において符号化する。低周波成分である1LLのサブバンドデータについては、量子化することによりデータ量を削減し、高周波成分については差分データであるためそもそもデータ量が少ないため、量子化を行わないようにしている。複号装置200においては、逆量子化部202では、エントロピー複合部201で復号されたデータのうち、低周波成分である1LLのサブバンドデータについては、第2実施形態と同様に逆量子化を行う。そして、逆量子化したデータを、超解像部203、逆周波数変換部206に入力して第2の実施形態と同様の処理を行う。復号されたデータのうち、高周波成分のデータ(実際には、高周波成分の差分データ)については、逆量子化部202による逆量子化を行わずに、高周波復元部に入力する。そして、超解像画像を周波数変換部204により周波数変換した高周波成分と、エントロピー複合部201で復号した高周波成分のデータ(差分データ)とを加算する。
このように、変形例1では、低周波成分のサブバンドデータは量子化(逆量子化)を行うようにし、高周波成分の差分データは、量子化(逆量子化)を行わないようにする。データ量の多い低周波成分のサブバンドを量子化するため圧縮効率を高めてデータ量を削減することができる。また、高周波成分のサブバンドについては、差分データでありデータ量が小さく、量子化することによりデータが消失してしまう可能性があるため、量子化せずにそのままエントロピー符号化し、データの消失を防いでいる。
また、変形例2として、低周波成分のサブバンドデータと、高周波成分のサブバンドの差分データの両方について、符号化の際には、量子化を行わず符号化し、複号の際にも、逆量子化を行わないようにすることも考えられる。
(その他の実施形態)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
本発明は上述した実施形態の内容に制限されず、発明の精神および範囲から離脱することなく様々な変更および変形が可能である。したがって、発明の範囲を公にするために請求項を添付する。
100…符号化装置、101…プレーン変換部、102…周波数変換部、103…超解像部、104…高周波差分演算部、105…量子化部、106…エントロピー符号化部、107…量子化パラメータ設定部

Claims (18)

  1. 周波数変換して低周波成分のサブバンドデータと高周波成分のサブバンドデータとを生成する変換手段と、
    第1の画像データを前記変換手段により周波数変換して生成された前記第1の画像データよりも解像度が小さい低周波成分のサブバンドデータから、前記第1の画像データの解像度を有する第2の画像データを生成する生成手段と、
    前記第1の画像データを前記変換手段により周波数変換して生成された高周波成分のサブバンドデータと、前記第2の画像データを前記変換手段により周波数変換して生成された高周波成分のサブバンドデータとの差分を求める演算手段と、
    前記第1の画像データの低周波成分のサブバンドデータと、前記差分とを符号化して、符号化データを生成する符号化手段と、
    を有することを特徴とする符号化装置。
  2. 前記差分を量子化する量子化手段をさらに有し、
    前記符号化手段は前記量子化された前記差分を符号化する、
    ことを特徴とする請求項1に記載の符号化装置。
  3. 前記量子化手段はさらに前記第1の画像データの低周波成分のサブバンドデータを量子化し、
    前記符号化手段は前記量子化された前記差分と、前記量子化された前記低周波成分のサブバンドデータとを符号化する、
    ことを特徴とする請求項2に記載の符号化装置。
  4. 前記第1の画像データの低周波成分のサブバンドデータを量子化する量子化手段をさらに有し、
    前記符号化手段は前記量子化された前記第1の画像データの低周波成分のサブバンドデータを符号化する、
    ことを特徴とする請求項1に記載の符号化装置。
  5. 前記第1の画像データの低周波成分のサブバンドデータの量子化に用いる量子化パラメータが、圧縮率の設定に応じて異なることを特徴とする請求項4に記載の符号化装置。
  6. 前記生成手段が、学習済みのニューラルネットワークを用いて前記第1の画像データの低周波成分のサブバンドデータから前記第2の画像データを生成することを特徴とする請求項1から5のいずれか1項に記載の符号化装置。
  7. 前記符号化手段は、前記ニューラルネットワークの構成に関する情報と、前記符号化データとを出力することを特徴とする請求項6に記載の符号化装置。
  8. 前記変換手段は2次元の離散ウェーブレット変換を用いて前記周波数変換を行い、
    前記低周波成分がLLサブバンド、前記高周波成分がLH、HL、HHサブバンドであることを特徴とする請求項1から7のいずれか1項に記載の符号化装置。
  9. 前記変換手段は離散コサイン変換を用いて前記周波数変換を行い、
    前記低周波成分がDC係数、前記高周波成分がAC係数であることを特徴とする請求項1から7のいずれか1項に記載の符号化装置。
  10. 前記第1の画像データが撮像素子によって得られたRAWデータであることを特徴とする請求項1から9のいずれか1項に記載の符号化装置。
  11. 撮像素子と、
    前記撮像素子によって得られたRAWデータを符号化する請求項1から10のいずれか1項に記載の符号化装置と、
    を有することを特徴とする撮像装置。
  12. 符号化装置が実行する符号化方法であって、
    第1の画像データを周波数変換して生成された前記第1の画像データよりも解像度が小さい低周波成分のサブバンドデータから、前記第1の画像データの解像度を有する第2の画像データを生成する生成工程と、
    前記第1の画像データを周波数変換して生成された高周波成分のサブバンドデータと、前記第2の画像データを周波数変換して生成された高周波成分のサブバンドデータとの差分を求める演算工程と、
    前記第1の画像データの低周波成分のサブバンドデータと、前記差分とを符号化して、符号化データを生成する符号化工程と、
    を有することを特徴とする符号化方法。
  13. コンピュータを、請求項1から10のいずれか1項に記載の符号化装置が有する各手段として機能させるためのプログラム。
  14. 符号化データを復号する復号手段と、
    前記復号手段により前記符号化データを復号して得られたデータのうちの低周波成分のサブバンドデータであって、前記符号化データに対応する画像データよりも解像度が小さい低周波成分のサブバンドデータから、前記符号化データに対応する画像データの解像度を有する第2の画像データを生成する生成手段と、
    前記第2の画像データを周波数変換して、低周波成分のサブバンドデータと高周波成分のサブバンドデータとを生成する変換手段と、
    前記復号手段により前記符号化データを復号して得られたデータのうちの高周波成分のサブバンドデータに、前記変換手段により周波数変換して生成された高周波成分のサブバンドデータを加算して、高周波成分のサブバンドデータの加算データを取得する演算手段と、
    前記復号手段により前記符号化データを復号して得られたデータのうちの前記低周波成分のサブバンドデータと、前記演算手段により取得した高周波成分のサブバンドデータの加算データとを、逆周波数変換する逆周波数変換手段と、
    を有することを特徴とする復号装置。
  15. 前記復号手段により前記符号化データを復号して得られたデータのうちの高周波成分のサブバンドデータを逆量子化する逆量子化手段をさらに有し、
    前記演算手段は、前記逆量子化手段により逆量子化された高周波成分のサブバンドデータに、前記変換手段により周波数変換して生成された高周波成分のサブバンドデータを加算する、
    ことを特徴とする請求項14に記載の復号装置。
  16. 前記変換手段は2次元の逆離散ウェーブレット変換を用いて前記逆周波数変換を行い、
    前記低周波成分がLLサブバンド、前記高周波成分がLH、HL、HHサブバンドであることを特徴とする請求項14または15に記載の復号装置。
  17. 復号装置が実行する復号方法であって、
    符号化データを復号して得られたデータのうちの低周波成分のサブバンドデータであって、前記符号化データに対応する画像データよりも解像度が小さい低周波成分のサブバンドデータから、前記符号化データに対応する画像データの解像度を有する第2の画像データを生成する生成工程と、
    前記第2の画像データを周波数変換して、低周波成分のサブバンドデータと高周波成分のサブバンドデータとを生成する変換工程と、
    前記符号化データを復号して得られたデータのうちの高周波成分のサブバンドデータを周波数変換して生成された高周波成分のサブバンドデータを加算して、高周波成分のサブバンドデータの加算データを取得する演算工程と、
    前記符号化データを復号して得られたデータのうちの前記低周波成分のサブバンドデータと、前記演算工程で取得される高周波成分のサブバンドデータの加算データとを、逆周波数変換する逆周波数変換工程と、
    を有することを特徴とする復号方法。
  18. コンピュータを、請求項14から16のいずれか1項に記載の復号装置が有する各手段として機能させるためのプログラム。
JP2019201032A 2019-11-05 2019-11-05 符号化装置および符号化方法、復号装置および復号方法 Active JP7469866B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019201032A JP7469866B2 (ja) 2019-11-05 2019-11-05 符号化装置および符号化方法、復号装置および復号方法
US17/081,370 US20210136394A1 (en) 2019-11-05 2020-10-27 Encoding apparatus and encoding method, and decoding apparatus and decoding method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019201032A JP7469866B2 (ja) 2019-11-05 2019-11-05 符号化装置および符号化方法、復号装置および復号方法

Publications (3)

Publication Number Publication Date
JP2021077942A JP2021077942A (ja) 2021-05-20
JP2021077942A5 JP2021077942A5 (ja) 2022-11-11
JP7469866B2 true JP7469866B2 (ja) 2024-04-17

Family

ID=75688376

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019201032A Active JP7469866B2 (ja) 2019-11-05 2019-11-05 符号化装置および符号化方法、復号装置および復号方法

Country Status (2)

Country Link
US (1) US20210136394A1 (ja)
JP (1) JP7469866B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220096624A (ko) * 2020-12-31 2022-07-07 엘지디스플레이 주식회사 표시 장치
US20240102534A1 (en) 2021-04-30 2024-03-28 Bando Chemical Industries, Ltd. Toothed belt
WO2023013736A1 (ja) * 2021-08-06 2023-02-09 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法、および復号方法
CN113920013B (zh) * 2021-10-14 2023-06-16 中国科学院深圳先进技术研究院 一种基于超分辨率的小图像多目标检测方法
CN115100039B (zh) * 2022-06-27 2024-04-12 中南大学 一种基于深度学习的轻量级图像超分辨率重建方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050074177A1 (en) 2003-10-03 2005-04-07 Daijiro Ichimura Video coding method
JP2013061650A (ja) 2011-09-12 2013-04-04 Thomson Licensing データの暗号化を選択的にフォーマット維持する方法及び装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050074177A1 (en) 2003-10-03 2005-04-07 Daijiro Ichimura Video coding method
JP2005117196A (ja) 2003-10-03 2005-04-28 Matsushita Electric Ind Co Ltd 映像符号化方法
JP2013061650A (ja) 2011-09-12 2013-04-04 Thomson Licensing データの暗号化を選択的にフォーマット維持する方法及び装置

Also Published As

Publication number Publication date
JP2021077942A (ja) 2021-05-20
US20210136394A1 (en) 2021-05-06

Similar Documents

Publication Publication Date Title
JP7469866B2 (ja) 符号化装置および符号化方法、復号装置および復号方法
JP5027936B2 (ja) 適応スキャン順序付けのための方法、記録媒体、プログラム、及び処理装置。
JP5838258B2 (ja) データをロッシー圧縮符号化する方法および装置、および、データを再構築する対応する方法および装置
JP4718609B2 (ja) 多次元デジタル信号のフィルタリング方法及び装置、並びに、関連する符号化/復号化方法及び装置
JP4594688B2 (ja) 画像符号化処理方法、画像復号化処理方法、動画圧縮処理方法、動画伸張処理方法、画像符号化処理プログラム、画像符号化装置、画像復号化装置、画像符号化/復号化システム、拡張画像圧縮伸張処理システム
US20040141652A1 (en) Picture encoding apparatus and method, program and recording medium
JP5469127B2 (ja) 画像データ符号化装置ならびにその動作制御方法およびそのプログラム
CN100558164C (zh) 图像处理方法和采用该图像处理方法的图像编码装置
JP2021077942A5 (ja)
WO2020078228A1 (zh) 视频编码、视频解码方法、装置、计算机设备和存储介质
JP6857973B2 (ja) 画像符号化装置及びその制御方法
JP6986868B2 (ja) 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、プログラム
Dardouri et al. Dynamic neural network for lossy-to-lossless image coding
JP4449400B2 (ja) 画像符号化装置及び方法、並びにプログラム及び記録媒体
JP7033013B2 (ja) 画像符号化装置、画像復号装置、及び、それらの制御方法、並びに、プログラム
CN116567240A (zh) 基于自适应通道和空间窗口熵模型的图像压缩方法及系统
US8989278B2 (en) Method and device for coding a multi dimensional digital signal comprising original samples to form coded stream
US8279932B2 (en) Information processing apparatus and method
JP4003628B2 (ja) 画像符号化装置及び方法、並びにプログラム
JP7475842B2 (ja) 画像復号装置、制御方法、およびプログラム
JP4806464B2 (ja) 画像圧縮装置、画像圧縮方法、画像復元装置、及びプログラム
WO2020230188A1 (ja) 符号化装置、符号化方法及びプログラム
JP7469865B2 (ja) 画像処理装置および画像処理方法
JP4636547B2 (ja) 符号化装置、プログラム及び情報記録媒体
JP7393819B2 (ja) 画像処理システム、符号化装置、復号装置、画像処理方法、画像処理プログラム、符号化方法、符号化プログラム、復号方法、及び復号プログラム

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20210103

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210113

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221102

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221102

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20231124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240115

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240308

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240405

R150 Certificate of patent or registration of utility model

Ref document number: 7469866

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150