JP2010041654A - 動画像符号化方法および装置 - Google Patents

動画像符号化方法および装置 Download PDF

Info

Publication number
JP2010041654A
JP2010041654A JP2008205532A JP2008205532A JP2010041654A JP 2010041654 A JP2010041654 A JP 2010041654A JP 2008205532 A JP2008205532 A JP 2008205532A JP 2008205532 A JP2008205532 A JP 2008205532A JP 2010041654 A JP2010041654 A JP 2010041654A
Authority
JP
Japan
Prior art keywords
feature
image
unit
feature amount
modulation coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2008205532A
Other languages
English (en)
Inventor
Naoto Date
直人 伊達
Tomoo Yamakage
朋夫 山影
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2008205532A priority Critical patent/JP2010041654A/ja
Publication of JP2010041654A publication Critical patent/JP2010041654A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】復号化側において入力画像を忠実に再現できるような適切なモデル情報を符号化側において選定可能な動画像符号化装置を提供する。
【解決手段】符号化対象の入力画像をノイズ成分とノイズ成分以外のベース画像に分離する。ベース画像を圧縮符号化して符号化データを得る。ノイズ成分を複数のブロックに分割する。ノイズ成分のブロック毎の第1特徴量を算出する。様々な形状パターンのノイズ画像の第2特徴量を保持するデータベースから第1特徴量との類似度が最も高い第2特徴量を探索する。該探索された第2特徴量を示すインデックスを生成する。第2特徴量の強度を第2特徴量の強度で除して変調係数を算出する。インデックスおよび変調係数のそれぞれの代表値を決定する。符号化データに代表値を多重化して符号化ストリームを生成する。
【選択図】 図1

Description

この発明は、フィルムグレインを良好に再現可能な動画像符号化方法および装置に関する。
デジタルバーサタイルディスク(DVD)のコンテンツ用途等を目的として映画フィルム映像を符号化する場合、映画本来の雰囲気を損なってしまうという問題がある。これは、符号化に伴い映像中のフィルムグレイン(フィルムの粒子感)が失われるためである。フィルムグレインはハリウッドの魂とも呼ばれており、DVDオーサリングスタジオにおいて非常に重要視されている。
フィルムグレインをうまく再現するための方法として、特許文献1に開示されたフィルムグレインシミュレーション方法があげられる。代表例に、動画像符号化の国際標準規格の一つであるH.264におけるフィルムグレインテクノロジー(Film Grain Technology:FGT)がある。
FGTにおける符号化処理では、まず動画像である入力画像に対してフィルムグレイン除去処理を施すことにより、フィルムグレインを除去したメイン画像を生成する。生成されたメイン画像に対して、符号化部により動き補償、直交変換および量子化を用いた圧縮符号化の処理を行う。一方、ノイズ推定部により入力画像とメイン画像との差分からフィルムグレイン画像を生成し、フィルムグレインを再現するための情報(引用するフィルムグレイン画像データベースを識別するための情報、フィルムグレインの強度等)を推定してモデル情報を生成する。
次に、FGTにおける復号処理では、復号部によって復号画像としてフィルムグレインが除去されているメイン画像を生成し、ノイズ生成部によって符号化部から送られてきたモデル情報を用いてメイン画像からノイズ画像、すなわちフィルムグレイン画像を生成する。生成されたメイン画像とフィルムグレイン画像を足し合わせることで、フィルムグレインが再現された出力画像を得る。
このようなFGTの利点は、フィルムグレインを分離してモデル化するため、符号化処理によってフィルムグレインが失われることがなく、映画本来の雰囲気を再現できることである。
米国特許出願公開第2006/0082649号明細書
FGTでは、フィルムグレインを再現するためのモデル情報に従い、フィルムグレインを生成する、復号側の処理のみが規定されており、符号化側の処理は規定されていない。
本発明は、復号化側において入力画像を忠実に再現できるような適切なモデル情報を符号化側において選定可能な動画像符号化方法および装置を提供することを目的とする。
本発明の第1様態によると、符号化対象画像をノイズ成分とノイズ成分以外のベース画像に分離するステップと、前記ベース画像を圧縮符号化して符号化データを得るステップと、前記ノイズ成分を複数のブロックに分割するステップと、前記ノイズ成分の前記ブロック毎の第1特徴量を算出するステップと、様々な形状パターンのノイズ画像の第2特徴量を保持したデータベースから前記第1特徴量との類似度が最も高い第2特徴量を探索し、探索された第2特徴量を示すインデックスを生成するステップと、前記第1特徴量の強度を前記第2特徴量の強度で除して変調係数を算出するステップと、前記インデックスおよび前記変調係数のそれぞれの代表値を決定するステップと、前記符号化データに前記代表値を多重化して符号化ストリームを生成するステップと、を具備する動画像符号化方法を提供する。
本発明の第2の態様によると、符号化対象画像を圧縮符号化して符号化データを得るステップと、前記符号化データを復号化して復号画像を得るステップと、前記符号化対象画像および復号画像をそれぞれ複数のブロックに分割するステップと、前記符号化対象画像のブロック毎の第1特徴量を算出するステップと、前記復号画像のブロック毎の第2特徴量を算出するステップと、前記第1特徴量から前記第2特徴量を差し引いて第3特徴量を算出するステップと、様々な形状パターンのノイズ画像の第4特徴量を保持したデータベースから前記第3特徴量との類似度が最も高い第4特徴量を探索し、該探索された第4特徴量を示すインデックスを生成するステップと、前記第3特徴量の強度を前記第4特徴量の強度で除して変調係数を算出するステップと、前記インデックスおよび前記変調係数のそれぞれの代表値を決定するステップと、前記符号化データに前記代表値を多重化して符号化ストリームを生成するステップと、を具備する動画像符号化方法を提供する。
本発明の第3の態様によると、符号化対象画像をノイズ成分とノイズ成分以外のベース画像に分離するステップと、前記ベース画像を圧縮符号化して符号化データを得るステップと、前記ノイズ成分を複数のブロックに分割するステップと、前記ノイズ成分の前記ブロック毎の第1特徴量を算出するステップと、様々な形状パターンのノイズ画像の第2特徴量を保持したデータベースから前記第1特徴量との類似度が最も高い第2特徴量を探索し、探索された第2特徴量を示す第1インデックス列を生成するステップと、前記第1特徴量の強度を前記第2特徴量の強度で除して第1変調係数列を算出するステップと、前記符号化対象画像を圧縮符号化して符号化データを得るステップと、前記符号化データを復号化して復号画像を得るステップと、前記符号化対象画像および復号画像をそれぞれ複数のブロックに分割するステップと、前記符号化対象画像のブロック毎の第3特徴量を算出するステップと、前記復号画像のブロック毎の第4特徴量を算出するステップと、前記第3特徴量から前記第4特徴量を差し引いて第5特徴量を算出するステップと、前記データベースから前記第5特徴量との類似度が最も高い第2特徴量を探索し、該探索された第2特徴量を示す第2インデックス列を生成するステップと、前記第5特徴量の強度を前記第2特徴量の強度で除して第2変調係数列を算出するステップと、前記第2変調係数列の要素が前記第1変調係数列の要素より大きい場合は、前記第2インデックス列の要素を前記第1インデックス列の要素で置き換え、かつ前記第2変調係数列の要素を前記第1変調係数列の要素で置き換えることによって、前記第2インデックス列および第2変調係数列を更新するステップと、更新後の第2インデックスおよび第2変調係数列のそれぞれの代表値を決定するステップと、前記符号化データに前記代表値を多重化して符号化ストリームを生成するステップと、を具備する動画像符号化方法を提供する。
さらに、本発明によると上述した動画像符号化処理をハードウェアにより実現する動画像符号化装置、あるいは上述した動画像符号化処理をコンピュータに行わせるためのプログラムが提供される。
一般的に映画に対して動画像符号化処理を施すと、高周波成分であるフィルムグレインが損失し映画の雰囲気を損なってしまう傾向がある。これに対し、本発明によるとフィルムグレインを忠実に再現するためのモデル情報を選定することが可能となり、これを映像圧縮データに付加できる。従って、より高品質な映像をデジタルバーサタイルディスク(DVD)のコンテンツ等に収録し、ユーザに提供することが可能となる。
以下、添付図面を参照して本発明の実施の形態を説明する。
(第1の実施形態)
<動画像符号化装置について>
本発明の第1の実施形態に係る動画像符号化装置は、図1に示されるようにノイズリダクション部11、符号化部12、減算部13、ブロック分割部14、特徴量算出部15、データベース探索/インデックス生成部16、変調係数算出部17、インデックスと変調係数のための代表値決定化部18、多重化部19およびノイズデータベース20を備えている。
以下、図2に示すフローチャートを参照しつつ図1の動画像符号化装置について詳しく説明する。
符号化対象画像である動画像入力端子10からの入力画像100は、まずノイズリダクション部11によってノイズ成分であるフィルムグレインが除去される(ステップS201)。フィルムグレインが除去された画像101をベース画像と呼ぶ。ベース画像101は符号化部12に入力され、動き補償、直交変換および量子化による周知の動画像圧縮符号化処理が施されることにより、ベース画像符号化データ102が生成される(ステップS202)。
一方、減算部13においてフィルムグレインを含む入力画像100とフィルムグレインが除去されたベース画像101との差分がとられ、ノイズ成分であるフィルムグレイン画像103が生成される(ステップS203)。言い換えれば、入力画像10はノイズリダクション部11と減算部13によって、ベース画像101とフィルムグレイン画像103とに分離される。ノイズリダクション部11および減算部13は、このような分離を行うための分離部を形成している。
次に、フィルムグレイン画像103はブロック分割部14によって複数のブロックに分割され、ブロック画像104が生成される(ステップS204)。さらに、特徴量算出部15においてブロック画像104の特徴量、つまりフィルムグレイン画像103のブロック毎の特徴量105(以下、特徴量Aと記載する)が算出される(ステップS205)。
ノイズデータベース20は、例えば図3に示すような様々な形状パターンのノイズ画像(登録ノイズ画像という)の特徴量を記憶保持している。ノイズデータベース20内の登録ノイズ画像の特徴量には、ノイズ画像の水平方向の位置を表す水平インデックスと垂直方向の位置を表す垂直インデックスが対応付けられている。特徴量Aおよびノイズデータベース20内の特徴量の具体例については、後述する。
特徴量算出部15においてフィルムグレイン画像103のブロック毎の特徴量Aが算出されると、次にデータベース探索/インデックス生成部16によってデータベース探索、すなわちノイズデータベース20から特徴量Aとの類似度が最も高い、登録ノイズ画像の特徴量Bを探索する処理が行われる(ステップS206)。このデータベース探索により、ノイズデータベース20内の探索された特徴量Bを示すインデックス106が生成される(ステップS207)。図4は、このようにしてインデックスが生成される様子を示している。
次に、変調係数算出部17において特徴量算出部15で算出された特徴量Aの強度をノイズデータベース20から探索された特徴量Bの強度で除することにより変調係数107が算出される(ステップS208)。変調係数107は、後述する復号化側(動画像復号化装置)においてフィルムグレイン画像(ノイズ成分)を生成する際に必要な、ノイズ画像に対して乗じる係数である。
次に、代表値決定部18においてインデックス106および変調係数107の代表値が決定され、それに基づきモデル情報108、具体的には後述するFilm Grain SEIが生成される(ステップS209)。
最後に、多重化部19においてベース画像符号化データ102にモデル情報108が多重化され、符号化ストリーム109が生成される(ステップS210)。
ここで、ノイズ画像であるフィルムグレイン画像の特徴量やノイズデータベース20内の登録ノイズ画像の特徴量としては、例えば周波数振幅スペクトル、正規化ノイズ画像の分散値、または正規化ノイズ画像の全変動が挙げられる。これらの場合、特徴量どうしの類似度を示す指標としては、周波数振幅スペクトルの正規化相関、正規化ノイズ画像の分散値の近さ、または正規化ノイズ画像の全変動の近さ、といった位相成分を考慮しない指標を用いる。
ノイズ画像同士の照合においては、一般的な画像照合(顔画像照合、指紋照合等)で用いられる画像同士の内積や、位相限定相関のような、形状情報が強く意味をもつ指標で相関をとることは適切ではない。これは、ノイズ画像の見た目の雰囲気が同様であっても、必ずしも同一形状の波形(特徴量)が現れるとは限らないためである。言い換えると、見た目の雰囲気が同様なノイズ画像をそれぞれ周波数帯域分割した場合に、周波数成分間の位相差は必ずしも同一とはならないということである。
変調係数算出部17は、入力画像100に含まれるフィルムグレインの信号強度を算出するために、フィルムグレイン画像のブロック毎に特徴量Aの強度をインデックスの指し示すノイズデータベース20内の登録ノイズ画像の特徴量Bの強度で除して変調係数を算出するという処理を行う。特徴量の強度としては、特徴量の絶対値積分値、標準偏差、または絶対値の最大値などを用いることができる。
上記のような処理の結果、データベース探索/インデックス生成部16および変調係数算出部17では、例えば図5に示すようなインデックスおよび変調係数が得られる。動画像復号化装置においては、各ブロックのインデックスが指し示す、ノイズデータベース内の登録ノイズ画像の特徴量に変調係数を掛け合わせることで、入力画像100に含まれるフィルムグレインを再現することが可能となる。
インデックスおよび変調係数の代表値決定部17は、図5中に示したインデックスと変調係数の情報量を削減するため、インデックスおよび変調係数それぞれについて代表値の決定(代表値化)を行う。前述のFGTにおいて、フィルムグレインを再現するためのモデル情報108はfilm grain characteristics SEI message(Film Grain SEI)として規定されており、Film Grain SEI中には図6に示されるようにレンジ、変調係数、水平インデックスおよび垂直インデックスの情報が記載されている。
例えば、図6の一行目の情報(レンジ0〜100、変調係数0.06、水平インデックス6、垂直インデックス10)の意味は、動画像復号化時のフィルムグレイン生成処理において、復号画像のブロックの信号平均値が0〜100に収まるブロックに対し、水平インデックス6、垂直インデックス10の登録ノイズ画像からノイズ画像を切り出して0.06倍に変調し、それらを加算するという処理を表す。
代表値決定部18におけるインデックスおよび変調係数の代表値化では、まず、インデックスおよび変調係数をベース画像(または復号画像)のブロック信号平均値に関連づける。次にレンジを決定し、インデックスおよび変調係数をレンジ毎にクラス分けする。レンジの決定法には、信号レベルを単純にN等分する、信号値のヒストグラムをN等分する等が挙げられる。最後に、各レンジに対応するクラス内で、インデックスおよび変調係数の平均値や中央値をそれぞれ代表値として算出することで、Film Grain SEIのフォーマットに合致した代表値化が完了する。
こうして代表値化されたインデックスおよび変調係数の記載されたFilm Grain SEIは、多重化部19においてベース画像符号化データ102に付加され、符号化ストリーム109が生成される。符号化ビットストリーム109は、例えば図示しないDVDあるいはHD DVDのような蓄積媒体に記録されるか、あるいはインターネットのような伝送媒体に送出される。
以上述べた動画像符号化装置の処理により、入力画像100に含まれるフィルムグレインを忠実に再現するためのモデル情報(Film Grain SEI)を選定し、符号化ストリーム109に付加することが可能となる。なお、これらの処理は色空間のそれぞれの要素に対して独立に適用され得る。例えば、YCbCr空間であれば、Y成分、Cb成分、Cr成分それぞれに独立に適用され得る。
<動画像復号化装置について>
次に、図7を用いて図1の動画像符号化装置に対応する動画像復号化装置について説明する。図7の動画像復号化装置は、分離部(デマルチプレクサ)31、復号化部(デコーダ)32、ノイズ生成部33、ノイズデータベース34および加算部35を有する。
入力端子30に前記の蓄積媒体から再生される、あるいは伝送媒体を介して送られてくる符号化ストリーム300(基本的に、図1の動画像符号化装置から出力される符号化ストリーム109と同じ)が入力される。分離部31では、符号化ビットストリーム300から符号化データ301とモデル情報302が分離される。復号化部32では、符号化データ301が復号されることによって、ベース画像304が生成される。
ノイズ生成部33では、モデル情報302中のインデックスに従ってノイズデータベース34からノイズ画像の特徴量が探索されると共に、探索された特徴量にモデル情報302中の変調係数が乗じられることにより、ノイズ画像(フィルムグレイン画像)304が生成される。最後に、加算部35においてベース画像303とノイズ画像304が加算されることによって、フィルムグレインが再現された動画像の出力画像305が得られる。
(第2の実施形態)
図8は、本発明の第2の実施形態に係る動画像符号化装置であり、符号化部12、復号化部21、ブロック分割部22A,22B、特徴量算出部23A,23B、減算部24、ノイズデータベース20、データベース探索/インデックス生成部26、変調係数算出部27、代表値決定部28および多重化部19を有する。本実施形態では、図1中に示したノイズリダクション部11は存在しない。
以下、図9に示すフローチャートを参照しつつ図8の動画像符号化装置について詳しく説明する。
符号化対象画像である動画像入力端子10からの入力画像100は、本実施形態ではまず符号化部12に入力され、動き補償、直交変換および量子化による周知の動画像圧縮符号化処理が施されることにより符号化データ102が生成される(ステップS211)。符号化データ102は復号化部21により復号化され、復号画像111が生成される(ステップS212)。符号化部12においては、高周波成分が損失するという一般的な画像圧縮の性質のため、フィルムグレインが減少する。従って、符号化部12から出力される符号化データ102を復号化部21により復号化して得られる復号画像111は、第1の実施形態においてノイズリダクション部11により得られるベース画像101とほぼ等価であるということができる。
次に、ブロック分割部22A,22Bにより入力画像100および復号画像111がそれぞれ複数のブロックに分割され、ブロック画像112A,112Bが生成される(ステップS213)。さらに、特徴量算出部23A,23Bにおいてブロック画像112A,112Bの特徴量113A,113B(特徴量C,Dとする)が算出される(ステップS2214)。次に、減算部24において特徴量113Aから特徴量113Bが差し引かれることにより、差分特徴量114(特徴量Aとする)が生成される(ステップS215)。
ここで、具体的に特徴量C,Dは例えば周波数振幅スペクトルであるとする。この場合、減算部24において特徴量Cから特徴量Dが差し引かれることにより得られる特徴量Aは、符号化部12の圧縮符号化処理によって失われた周波数振幅スペクトル(損失分周波数振幅スペクトルという)、言い換えればフィルムグレイン画像のブロック毎の特徴量を示すことになる。
ノイズデータベース20は、第1の実施形態と同様に、例えば図3に示すような様々な形状パターンのノイズ画像(登録ノイズ画像)の特徴量を記憶保持している。ノイズデータベース20内の登録ノイズ画像の特徴量には、ノイズ画像の水平方向の位置を表す水平インデックスと垂直方向の位置を表す垂直インデックスが対応付けられている。
特徴量算出部23A,23Bおよび減算器24においてフィルムグレイン画像103のブロック毎の特徴量Aが算出されると、次にデータベース探索/インデックス生成部16によってデータベース探索、すなわちノイズデータベース20から特徴量Aとの類似度が最も高い、登録ノイズ画像の特徴量Bを探索する処理が行われる(ステップS216)。例えば、特徴量Aが各ブロックの損失周波数振幅スペクトルの場合、損失周波数振幅スペクトルとの正規化相関が最も高いノイズデータベース20内の登録ノイズ画像の周波数振幅スペクトルが特徴量Bとして探索される。このようなデータベース探索により、ノイズデータベース20内の特徴量Bを示すインデックス116が生成される(ステップS217)。図4は、このようにしてインデックスが生成される様子を示している。
次に、変調係数算出部27において特徴量Aの強度を特徴量Bの強度で除することにより、変調係数117が算出される(ステップS218)。具体的には、例えば各ブロックの損失周波数振幅スペクトルの強度(総和)をインデックスの指し示す登録ノイズの周波数振幅スペクトルの強度(総和)で除することにより、変調係数が算出される。変調係数117は、図7で説明した動画像復号化装置においてフィルムグレイン画像(ノイズ成分)を生成する際に必要な、ノイズ画像に対して乗じる係数である。
次に、代表値決定部28においてインデックス116および変調係数117の代表値が決定され(代表値化)、それに基づきモデル情報118、具体的にはFilm Grain SEIが生成される(ステップS219)。代表値化の手法は第1の実施形態と同様であるため、説明を省略する。
最後に、多重化部19においてベース画像符号化データ102にモデル情報118が多重化されることにより、符号化ストリーム109が生成される(ステップS220)。
このように本実施形態においても、第1の実施形態と同様に入力画像100に含まれるフィルムグレインを忠実に再現するためのモデル情報(Film Grain SEI)を選定し、符号化ストリーム109に付加することが可能となる。なお、これらの処理は色空間のそれぞれの要素に対して独立に適用され得る。例えば、YCbCr空間であれば、Y成分、Cb成分、Cr成分それぞれに独立に適用され得る。
なお、本実施形態に係る動画像符号化装置に対応する動画像復号化装置は、例えば第1の実施形態で説明した図7に示した構成でよい。
(第3の実施形態)
図10は、本発明の第3の実施形態に係る動画像符号化装置であり、図1に示した第1の実施形態と図8に示した第2の実施形態に係る動画像符号化装置を組み合わせた構成となっている。すなわち、図10の動画像符号化装置は、ノイズリダクション部11、符号化部12、減算部13、ブロック分割部14、第1の特徴量算出部15、第1のデータベース探索/インデックス列生成部16、第1の変調係数列算出部17、符号化部12、復号化部21、ブロック分割部22A,22B、第2、第3の特徴量算出部23A,23B、減算部24、第2のデータベース探索/インデックス列生成部26、第2の変調係数列算出部27、ノイズデータベース20、更新部29、代表値決定部28および多重化部19を有する。
ここで、ノイズリダクション部11、減算部13、ブロック分割部14、第1の特徴量算出部15、データベース探索/インデックス列生成部16および変調係数列算出部17を経由して処理を行う経路を「第1処理経路」と呼び、また符号化部12、復号化部21、ブロック分割部22A,22B、第2、第3の特徴量算出部23A,23B、減算部24、データベース探索/インデックス列生成部26および変調係数列算出部27を経由して処理を行う経路を「第2処理経路」と呼ぶことにする。
<第1処理経路について>
第1処理経路では、代表値決定部18の前までの処理について第1の実施形態と同様の処理が行われる。すなわち、符号化対象画像である動画像入力端子10からの入力画像100から、ノイズリダクション部11によってノイズ成分であるフィルムグレインが除去され、ベース画像101が生成される。ベース画像101は、符号化部12によって動き補償、直交変換および量子化による周知の動画像圧縮符号化処理が施されることにより、ベース画像符号化データ102が生成される。
一方、減算部13においてフィルムグレインを含む入力画像100とフィルムグレインが除去されたベース画像101との差分がとられ、ノイズ成分であるフィルムグレイン画像103が生成される。言い換えれば、入力画像10はノイズリダクション部11と減算部13からなる分離部によって、ベース画像101とフィルムグレイン画像103とに分離される。
次に、フィルムグレイン画像103はブロック分割部14によって複数のブロックに分割され、ブロック画像104が生成される。さらに、特徴量算出部15においてブロック画像104の特徴量、つまりフィルムグレイン画像103のブロック毎の特徴量105(特徴量A)が算出される。
特徴量算出部15においてフィルムグレイン画像103のブロック毎の特徴量Aが算出されると、次にデータベース探索/インデックス列生成部16によってデータベース探索、すなわち図3に示したようなノイズデータベース20から特徴量Aとの類似度が最も高い、登録ノイズ画像の特徴量Bを探索する処理が行われる。このデータベース探索により、ノイズデータベース20内の特徴量Bを示すインデックス106が図4に示すように生成され、第1インデックス列として出力される。さらに、第1の変調係数列算出部17において特徴量Aの強度を特徴量Bの強度で除することにより、変調係数107の列(第1変調係数列)が算出される。
<第2処理経路について>
第2処理経路では、代表値決定部18の前までの処理について第2の実施形態と同様の処理が行われる。すなわち、動画像入力端子10からの入力画像100は、符号化部12に入力され、動き補償、直交変換および量子化による周知の動画像圧縮符号化処理が施されることにより、符号化データ102が生成される。符号化データ102は復号化部21により復号化され、復号画像111が生成される。符号化部12においては、高周波成分が損失するという一般的な画像圧縮の性質のため、フィルムグレインが減少する。従って、符号化部12から出力される符号化データ102を復号化部21により復号化して得られる復号画像111は、第1の実施形態においてノイズリダクション部11により得られるベース画像101とほぼ等価であるということができる。
次に、ブロック分割部22A,22Bにより入力画像100および復号画像111がそれぞれ複数のブロックに分割され、ブロック画像112A,112Bが生成される。さらに、特徴量算出部23A,23Bにおいてブロック画像112A,112Bの特徴量113A,113B(特徴量C,Dとする)が算出される。次に、減算部24において特徴量113Aから特徴量113Bが差し引かれることにより、差分特徴量114(特徴量Aとする)が生成される。
ここで、具体的に特徴量C,Dは例えば周波数振幅スペクトルであるとする。この場合、減算部24において特徴量Cから特徴量Dが差し引かれることにより得られる特徴量Aは、符号化部12の圧縮符号化処理によって失われた周波数振幅スペクトル(損失分周波数振幅スペクトルという)、言い換えればフィルムグレイン画像のブロック毎の特徴量を示すことになる。
特徴量算出部23A,23Bおよび減算器24においてフィルムグレイン画像103のブロック毎の特徴量Aが算出されると、次にデータベース探索/インデックス生成部16によってデータベース探索、すなわちノイズデータベース20から特徴量Aとの類似度が最も高い、登録ノイズ画像の特徴量Bを探索する処理が行われる。例えば、特徴量Aが各ブロックの損失周波数振幅スペクトルの場合、損失周波数振幅スペクトルとの正規化相関が最も高いノイズデータベース20内の登録ノイズ画像の周波数振幅スペクトルが特徴量Bとして探索される。このようなデータベース探索により、ノイズデータベース20内の特徴量Bを示すインデックス116が図4に示すようにして生成され、第2インデックス列として出力される。
次に、第2の変調係数列算出部27において特徴量Aの強度を特徴量Bの強度で除することにより、変調係数117の列(第2変調係数列)が算出される。具体的には、例えば各ブロックの損失周波数振幅スペクトルの強度(総和)をインデックスの指し示す登録ノイズの周波数振幅スペクトルの強度(総和)で除することにより、変調係数が算出される。変調係数117は、図7で説明した動画像復号化装置においてフィルムグレイン画像(ノイズ成分)を生成する際に必要な、ノイズ画像に対して乗じる係数である。
<更新処理および代表値化について>
次に、更新部29において第1処理経路で得られる第1インデックス列および第1変調係数列を用いて、第2処理経路で得られる第2インデックス列および第2変調係数列が適宜更新される。具体的には、更新部29は第1変調係数列の要素と第2変調係数列の要素を比較し、第2変調係数列の要素が第1変調係数列の要素よりも大きければ、図11に示すように第2インデックス列の要素と第2変調係数列の要素を第1インデックス列の要素と第1変調係数列の要素で置き換えることによって、第2インデックス列および第2変調係数列の更新を行う。符号化品質が低い場合、第2変調係数列の要素にはフィルムグレイン以外にもエッジやテクスチャの成分が加味され、必要以上に大きな値となってしまう。この影響を抑えるため、本実施形態では上述の置き換え処理を行う。
代表値決定部310は、更新部29において上記のように更新された図11中に示す第2インデックス列および第2変調係数列の情報量を削減するために代表値化、すなわち第2インデックスおよび第2変調係数列それぞれについての代表値の決定を行い、モデル情報118、具体的にはFilm Grain SEIを生成する。代表値化の手法は第1の実施形態と同様であるため、説明を省略する。
こうして代表値化された第2インデックス列および第2変調係数列の記載されたFilm Grain SEIは、多重化部19においてベース画像符号化データ102に付加され、符号化ストリーム109が生成される。符号化ビットストリーム109は、例えば図示しないDVDあるいはHD DVDのような蓄積メディアに記録されるか、あるいはインターネットのような伝送媒体に送出される。
なお、本実施形態に係る動画像符号化装置に対応する動画像復号化装置は、例えば第1の実施形態で説明した図7に示した構成でよい。
以上のような処理により、本実施形態においても入力画像100に含まれるフィルムグレインを忠実に再現するためのモデル情報(Film Grain SEI)を選定し、符号化ストリーム109に付加することが可能となる。なお、これらの処理は色空間のそれぞれの要素に対して独立に適用され得る。例えば、YCbCr空間であれば、Y成分、Cb成分、Cr成分それぞれに独立に適用され得る。
第1の実施形態に係る動画像符号化装置を示すブロック図 図1の動画像符号化装置の処理手順を示すフローチャート 同実施形態におけるノイズデータベースの内容の一例を示す図 同実施形態において生成されるインデックスを示す図 同実施形態において生成されるインデックスおよび変調係数を示す図 film grain characteristics SEI messageに記載される情報を示す図 第1の実施形態に係る動画像復号化装置を示すブロック図 第2の実施形態に係る動画像符号化装置を示すブロック図 第2の実施形態の処理手順を示すフローチャート 第3の実施形態に係る動画像符号化装置を示すブロック図 第3の実施形態において第2インデックス列および第2変調係数列が更新される様子を示す図
符号の説明
10・・・動画像入力端子
11・・・ノイズリダクション部
12・・・符号化部
13・・・減算部
14・・・ブロック分割部
15・・・特徴量算出部
16・・・データベース探索/インデックス列生成部
17・・・変調係数列算出部
18・・・代表値決定部
19・・・多重化部
20・・・ノイズデータベース
107・・・動画像符号化装置
100・・・入力画像
101・・・ベース画像
102・・・ベース画像符号化データ
103・・・フィルムグレイン画像(ノイズ成分)
104・・・ブロック画像
105・・・特徴量
106・・・インデックス
107・・・変調係数
108・・・代表値(モデル情報)
109・・・符号化ストリーム
21・・・復号化部
22A,22B・・・ブロック分割部
23A,23B・・・特徴量算出部
24A・・・減算部
26・・・データベース探索/インデックス列生成部
27・・・変調係数列算出部
28・・・代表値決定部
29・・・更新部
111・・・復号画像
112A,112B・・・ブロック画像
113A,113B・・・特徴量
114・・・差分特徴量
30・・・符号化データ入力端子
31・・・分離部
32・・・復号化部
33・・・ノイズ生成部
34・・・ノイズデータベース
35・・・加算部
300・・・入力符号化ストリーム
301・・・符号化データ
302・・・モデル情報
303・・・ベース画像
304・・・ノイズ画像
305・・・出力画像

Claims (12)

  1. 符号化対象画像をノイズ成分とノイズ成分以外のベース画像に分離するステップと、
    前記ベース画像を圧縮符号化して符号化データを得るステップと、
    前記ノイズ成分を複数のブロックに分割するステップと、
    前記ノイズ成分の前記ブロック毎の第1特徴量を算出するステップと、
    様々な形状パターンのノイズ画像の第2特徴量を保持したデータベースから前記第1特徴量との類似度が最も高い第2特徴量を探索し、探索された第2特徴量を示すインデックスを生成するステップと、
    前記第1特徴量の強度を前記第2特徴量の強度で除して変調係数を算出するステップと、
    前記インデックスおよび前記変調係数のそれぞれの代表値を決定するステップと、
    前記符号化データに前記代表値を多重化して符号化ストリームを生成するステップと、を具備する動画像符号化方法。
  2. 符号化対象画像を圧縮符号化して符号化データを得るステップと、
    前記符号化データを復号化して復号画像を得るステップと、
    前記符号化対象画像および復号画像をそれぞれ複数のブロックに分割するステップと、
    前記符号化対象画像のブロック毎の第1特徴量を算出するステップと、
    前記復号画像のブロック毎の第2特徴量を算出するステップと、
    前記第1特徴量から前記第2特徴量を差し引いて第3特徴量を算出するステップと、
    様々な形状パターンのノイズ画像の第4特徴量を保持したデータベースから前記第3特徴量との類似度が最も高い第4特徴量を探索し、該探索された第4特徴量を示すインデックスを生成するステップと、
    前記第3特徴量の強度を前記第4特徴量の強度で除して変調係数を算出するステップと、
    前記インデックスおよび前記変調係数のそれぞれの代表値を決定するステップと、
    前記符号化データに前記代表値を多重化して符号化ストリームを生成するステップと、を具備する動画像符号化方法。
  3. 符号化対象画像をノイズ成分とノイズ成分以外のベース画像に分離するステップと、
    前記ベース画像を圧縮符号化して符号化データを得るステップと、
    前記ノイズ成分を複数のブロックに分割するステップと、
    前記ノイズ成分の前記ブロック毎の第1特徴量を算出するステップと、
    様々な形状パターンのノイズ画像の第2特徴量を保持したデータベースから前記第1特徴量との類似度が最も高い第2特徴量を探索し、探索された第2特徴量を示す第1インデックス列を生成するステップと、
    前記第1特徴量の強度を前記第2特徴量の強度で除して第1変調係数列を算出するステップと、
    前記符号化対象画像を圧縮符号化して符号化データを得るステップと、
    前記符号化データを復号化して復号画像を得るステップと、
    前記符号化対象画像および復号画像をそれぞれ複数のブロックに分割するステップと、
    前記符号化対象画像のブロック毎の第3特徴量を算出するステップと、
    前記復号画像のブロック毎の第4特徴量を算出するステップと、
    前記第3特徴量から前記第4特徴量を差し引いて第5特徴量を算出するステップと、
    前記データベースから前記第5特徴量との類似度が最も高い第2特徴量を探索し、該探索された第2特徴量を示す第2インデックス列を生成するステップと、
    前記第5特徴量の強度を前記第2特徴量の強度で除して第2変調係数列を算出するステップと、
    前記第2変調係数列の要素が前記第1変調係数列の要素より大きい場合は、前記第2インデックス列の要素を前記第1インデックス列の要素で置き換え、かつ前記第2変調係数列の要素を前記第1変調係数列の要素で置き換えることによって、前記第2インデックス列および第2変調係数列を更新するステップと、
    更新後の第2インデックスおよび第2変調係数列のそれぞれの代表値を決定するステップと、
    前記符号化データに前記代表値を多重化して符号化ストリームを生成するステップと、を具備する動画像符号化方法。
  4. 符号化対象画像をノイズ成分とノイズ成分以外のベース画像に分離する分離部と、
    前記ベース画像を圧縮符号化して符号化データを得る符号化部と、
    前記ノイズ成分を複数のブロックに分割する分割部と、
    前記ノイズ成分の前記ブロック毎の第1特徴量を算出する特徴量算出部と、
    様々な形状パターンのノイズ画像の第2特徴量を保持したデータベースと、
    前記データベースから前記第1特徴量との類似度が最も高い第2特徴量を探索し、探索された第2特徴量を示すインデックスを生成するデータベース探索/インデックス生成部と、
    前記第1特徴量の強度を前記第2特徴量の強度で除して変調係数を算出する変調係数算出部と、
    前記インデックスおよび前記変調係数のそれぞれの代表値を決定する代表値決定部と、
    前記符号化データに前記代表値を多重化して符号化ストリームを生成する多重化部と、を具備する動画像符号化装置。
  5. 符号化対象画像を圧縮符号化して符号化データを得る符号化部と、
    前記符号化データを復号化して復号画像を得る復号化部と、
    前記符号化対象画像および復号画像をそれぞれ複数のブロックに分割する分割部と、
    前記符号化対象画像のブロック毎の第1特徴量を算出する第1の特徴量算出部と、
    前記復号画像のブロック毎の第2特徴量を算出する第2の特徴量算出部と、
    前記第1特徴量から前記第2特徴量を差し引いて第3特徴量を算出する減算部と、
    様々な形状パターンのノイズ画像の第4特徴量を保持したデータベースと、
    前記データベースから前記第3特徴量との類似度が最も高い第4特徴量を探索し、該探索された第4特徴量を示すインデックスを生成するデータベース探索/インデックス生成部と、
    前記第3特徴量の強度を前記第4特徴量の強度で除して変調係数を算出する変調係数算出部と、
    前記インデックスおよび前記変調係数のそれぞれの代表値を決定する代表値決定部と、
    前記符号化データに前記代表値を多重化して符号化ストリームを生成する多重化部と、を具備する動画像符号化装置。
  6. 符号化対象画像をノイズ成分とノイズ成分以外のベース画像に分離する分離部と、
    前記ベース画像を圧縮符号化して符号化データを得る符号化部と、
    前記ノイズ成分を複数のブロックに分割する分割部と、
    前記ノイズ成分の前記ブロック毎の第1特徴量を算出する第1の特徴量算出部と、
    様々な形状パターンのノイズ画像の第2特徴量を保持したデータベースと、
    前記データベースから前記第1特徴量との類似度が最も高い第2特徴量を探索し、探索された第2特徴量を示す第1インデックス列を生成する第1のデータベース探索/インデックス生成部と、
    前記第1特徴量の強度を前記第2特徴量の強度で除して第1変調係数列を算出する第1の変調係数列算出部と、
    前記符号化対象画像を圧縮符号化して符号化データを得る符号化部と、
    前記符号化データを復号化して復号画像を得る復号化部と、
    前記符号化対象画像および復号画像をそれぞれ複数のブロックに分割する分割部と、
    前記符号化対象画像のブロック毎の第3特徴量を算出する第3の特徴量算出部と、
    前記復号画像のブロック毎の第4特徴量を算出する第4の特徴量算出部と、
    前記第3特徴量から前記第4特徴量を差し引いて第5特徴量を算出する減算部と、
    前記データベースから前記第5特徴量との類似度が最も高い第2特徴量を探索し、該探索された第2特徴量を示す第2インデックス列を生成する第2のデータベース探索/インデックス生成部と、
    前記第5特徴量の強度を前記第2特徴量の強度で除して第2変調係数列を算出する第2の変調係数列算出部と、
    前記第2変調係数列の要素が前記第1変調係数列の要素より大きい場合は、前記第2インデックス列の要素を前記第1インデックス列の要素で置き換え、かつ前記第2変調係数列の要素を前記第1変調係数列の要素で置き換えることによって、前記第2インデックス列および第2変調係数列を更新する更新部と、
    更新後の第2インデックスおよび第2変調係数列のそれぞれの代表値を決定する代表値決定部と、
    前記符号化データに前記代表値を多重化して符号化ストリームを生成する多重化部と、を具備する動画像符号化装置。
  7. 前記特徴量は、正規化した周波数振幅スペクトルであることを特徴とする請求項4乃至6のいずれか1項記載の動画像符号化装置。
  8. 前記特徴量は、正規化した波形の分散値であることを特徴とする請求項4乃至6のいずれか1項記載の動画像符号化装置。
  9. 前記特徴量は、正規化した波形の全変動であることを特徴とする請求項4乃至6のいずれか1項記載の動画像符号化装置。
  10. 前記特徴量の強度は、前記特徴量の絶対値積分値であることを特徴とする請求項4乃至6のいずれか1項記載の動画像符号化装置。
  11. 前記特徴量の強度は、前記特徴量の標準偏差であることを特徴とする請求項4乃至6のいずれか1項記載の動画像符号化装置。
  12. 前記特徴量の強度は、前記特徴量の絶対値の最大値であることを特徴とする請求項4乃至6のいずれか1項記載の動画像符号化装置。
JP2008205532A 2008-08-08 2008-08-08 動画像符号化方法および装置 Withdrawn JP2010041654A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008205532A JP2010041654A (ja) 2008-08-08 2008-08-08 動画像符号化方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008205532A JP2010041654A (ja) 2008-08-08 2008-08-08 動画像符号化方法および装置

Publications (1)

Publication Number Publication Date
JP2010041654A true JP2010041654A (ja) 2010-02-18

Family

ID=42013665

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008205532A Withdrawn JP2010041654A (ja) 2008-08-08 2008-08-08 動画像符号化方法および装置

Country Status (1)

Country Link
JP (1) JP2010041654A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014017739A (ja) * 2012-07-10 2014-01-30 Nippon Hoso Kyokai <Nhk> 画像符号化装置、画像復号装置およびプログラム
JP2014022845A (ja) * 2012-07-13 2014-02-03 Nippon Hoso Kyokai <Nhk> 画像符号化装置、画像復号装置、超解像装置およびそれらのプログラム
JP2015507902A (ja) * 2012-01-18 2015-03-12 ロッサト、ルカ 安定した情報および過渡的/確率的情報の別個のエンコードおよびデコード
JP2018148578A (ja) * 2012-08-24 2018-09-20 アイキューブド研究所株式会社 送信装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015507902A (ja) * 2012-01-18 2015-03-12 ロッサト、ルカ 安定した情報および過渡的/確率的情報の別個のエンコードおよびデコード
US10504246B2 (en) 2012-01-18 2019-12-10 V-Nova International Limited Distinct encoding and decoding of stable information and transient/stochastic information
US11232598B2 (en) 2012-01-18 2022-01-25 V-Nova International Limited Distinct encoding and decoding of stable information and transient/stochastic information
JP2014017739A (ja) * 2012-07-10 2014-01-30 Nippon Hoso Kyokai <Nhk> 画像符号化装置、画像復号装置およびプログラム
JP2014022845A (ja) * 2012-07-13 2014-02-03 Nippon Hoso Kyokai <Nhk> 画像符号化装置、画像復号装置、超解像装置およびそれらのプログラム
JP2018148578A (ja) * 2012-08-24 2018-09-20 アイキューブド研究所株式会社 送信装置

Similar Documents

Publication Publication Date Title
KR101611375B1 (ko) 압축된 비디오에서 구문 요소의 cabac/avc 준수 워터마킹
EP3479343B1 (en) Efficient histogram-based luma look matching
CN109068139B (zh) 用于环内再成形的方法、设备和计算机可读存储介质
AU2012211249B2 (en) Encoding of video stream based on scene type
KR101073535B1 (ko) 기술적 모델 매개변수들을 사용하여 향상 계층 데이터를 인코딩하고 디코딩하기 위한 시스템 및 방법
CN102132563B (zh) 可伸缩视频编码和解码中的转换操作
UA126871C2 (uk) Перетворення зображення в кодуванні відео з використанням оптимізації залежності викривлення від швидкості передачі
Wu et al. Lossless compression of JPEG coded photo collections
US20080205518A1 (en) Image Coder for Regions of Texture
US7536054B2 (en) Image compression device, image compression method, image compression program, compression encoding method, compression encoding device, compression encoding program, decoding method, decoding device, and decoding program
JP6517691B2 (ja) 少なくとも1つの第2の画像成分の参照ブロックに対して第1の画像成分の現在ブロックを符号化するための方法、符号化装置および対応するコンピュータプログラム
JP6409516B2 (ja) ピクチャ符号化プログラム、ピクチャ符号化方法及びピクチャ符号化装置
US20170099485A1 (en) Encoding of Video Stream Based on Scene Type
JP2010041654A (ja) 動画像符号化方法および装置
Shanableh Feature extraction and machine learning solutions for detecting motion vector data embedding in HEVC videos
US20160249067A1 (en) Method for encoding and decoding a media signal and apparatus using the same
KR20060109448A (ko) 비디오 신호 인코딩 방법
US20150281689A1 (en) Method of coding and decoding images, a coding and decoding device, and corresponding computer programs
US8306116B2 (en) Image prediction apparatus and method, image encoding apparatus, and image decoding apparatus
CN113228674A (zh) 视频编码和视频解码
Li et al. High dynamic range image compression based on visual saliency
JPH10313458A (ja) 画像データ変換装置及び方法、予測係数生成装置及び方法、予測係数格納媒体
JP2008141436A (ja) 動画像符号化方法、装置及びプログラム
WO2007072543A1 (ja) 動画符号化方法
JP2011114631A (ja) 動画像符号化方法、動画像符号化装置、動画像復号化方法、及び動画像復号化装置

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20111101