JP2008141436A - Moving image encoding method, device and program - Google Patents
Moving image encoding method, device and program Download PDFInfo
- Publication number
- JP2008141436A JP2008141436A JP2006324996A JP2006324996A JP2008141436A JP 2008141436 A JP2008141436 A JP 2008141436A JP 2006324996 A JP2006324996 A JP 2006324996A JP 2006324996 A JP2006324996 A JP 2006324996A JP 2008141436 A JP2008141436 A JP 2008141436A
- Authority
- JP
- Japan
- Prior art keywords
- image
- noise
- generate
- model information
- main
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
本発明は、フィルムグレインを良好に再現可能な動画像符号化方法、装置及びプログラムに関する。 The present invention relates to a moving image encoding method, apparatus, and program capable of satisfactorily reproducing film grain.
デジタルバーサタイルディスク(DVD)のコンテンツ用途等を目的として映画フィルム映像を符号化する場合、映画本来の雰囲気を損なってしまうという問題がある。これは、符号化に伴い映像中のフィルムグレイン(フィルムの粒子感)が失われるためである。フィルムグレインはハリウッドの魂とも呼ばれており、DVDオーサリングスタジオにおいて非常に重要視されている。 When a movie film image is encoded for the purpose of digital versatile disc (DVD) content use, there is a problem that the original atmosphere of the movie is impaired. This is because film grain in the video (film grain feeling) is lost with encoding. Film grain is also called the soul of Hollywood and is very important in DVD authoring studios.
フィルムグレインをうまく再現するための方法として、特許文献1に開示されたフィルムグレインシミュレーション方法があげられる。代表例に、動画像符号化の国際標準規格の一つであるH.264におけるフィルムグレインテクノロジー(Film Grain Technology:FGT)がある。
As a method for successfully reproducing the film grain, there is a film grain simulation method disclosed in
FGTにおける符号化処理では、まず動画像である入力画像に対してフィルムグレイン除去処理を施すことにより、フィルムグレインを除去したメイン画像を生成する。生成されたメイン画像に対して、符号化部により動き補償、直交変換及び量子化を用いた圧縮符号化の処理を行う。一方、ノイズ推定部により入力画像とメイン画像との差分からフィルムグレイン画像を生成し、フィルムグレインを再現するための情報(引用するフィルムグレイン画像データベースを識別するための情報、フィルムグレインの強度等)を推定してモデル情報を生成する。 In the encoding process in FGT, first, a main image from which film grain is removed is generated by performing film grain removal processing on an input image that is a moving image. The generated main image is subjected to compression coding processing using motion compensation, orthogonal transformation, and quantization by the coding unit. On the other hand, information for generating a film grain image from the difference between the input image and the main image by the noise estimation unit and reproducing the film grain (information for identifying the cited film grain image database, film grain strength, etc.) Is used to generate model information.
次に、FGTにおける復号処理では、復号部によって復号画像としてフィルムグレインが除去されているメイン画像を生成し、ノイズ生成部によって符号化部から送られてきたモデル情報を用いてメイン画像からノイズ画像、すなわちフィルムグレイン画像を生成する。生成されたメイン画像とフィルムグレイン画像を足し合わせることで、フィルムグレインが再現された出力画像を得る。 Next, in the decoding process in FGT, a main image from which film grain is removed as a decoded image is generated by a decoding unit, and a noise image is generated from the main image using model information transmitted from the encoding unit by a noise generation unit. That is, a film grain image is generated. By adding the generated main image and the film grain image, an output image in which the film grain is reproduced is obtained.
このようなFGTの利点は、フィルムグレインを分離してモデル化するため、符号化処理によってフィルムグレインが失われることがなく、映画本来の雰囲気を再現できることである。
発明者らの検討によれば、FGTにおいて復号画像に対して微弱なフィルムグレイン画像を足し合わせると、すなわちフィルムグレインを再現するための情報のうちフィルムグレインの強度を示す情報の値が小さいときに、出力画像のブロック縦境界に歪みが見えるという現象が生じることが確認された。これは出力画像の品質を大きく損ねるため、問題である。これはFGTのフィルムグレイン画像生成処理において、フィルムグレイン画像の継ぎ目を目立たなくする目的で、ブロックの縦境界(vertical edge)に対して、デブロッキングフィルタと呼ばれる平滑フィルタ処理を施すことが原因と思われる。 According to the studies by the inventors, when a weak film grain image is added to the decoded image in the FGT, that is, when the value of information indicating the strength of the film grain is small among the information for reproducing the film grain. It was confirmed that the phenomenon of distortion appearing at the block vertical boundary of the output image occurred. This is a problem because it greatly deteriorates the quality of the output image. This is considered to be caused by applying a smoothing filter process called deblocking filter to the vertical edges of blocks in order to make the seams of film grain images inconspicuous in FGT film grain image generation processing. It is.
本発明は、微弱なフィルムグレイン画像を加算する際に見られるブロックの縦境界の歪みを回避することを目的とする。 An object of the present invention is to avoid the distortion of the vertical boundary of a block seen when adding a weak film grain image.
本発明の一態様によると、ノイズ画像を含む符号化対象の入力画像に対しノイズ除去処理を施して第1メイン画像を生成するステップと、前記入力画像及び第1メイン画像から前記ノイズ画像を推定して前記ノイズ画像に対応するモデル情報を生成するステップと、前記モデル情報を参照して、フィルムグレイン再現のためのフィルムグレイン画像の各ノイズ画像ブロック間の境界に対する平滑フィルタ処理によって損なわれる画像成分を生成するステップと、前記第1メイン画像と前記画像成分を加算して第2メイン画像を生成するステップと、前記第2メイン画像を符号化して符号化データを生成するステップと、
前記符号化データに前記モデル情報を多重化して符号化ストリームを出力するステップと、を具備する動画像符号化方法が提供される。
According to an aspect of the present invention, a step of generating a first main image by performing noise removal processing on an input image to be encoded including a noise image, and estimating the noise image from the input image and the first main image Generating model information corresponding to the noise image, and referring to the model information, an image component that is impaired by smooth filter processing on a boundary between each noise image block of the film grain image for film grain reproduction Generating a second main image by adding the first main image and the image component, encoding the second main image to generate encoded data,
And a step of multiplexing the model information with the encoded data and outputting an encoded stream.
本発明のさらに具体的な態様によると、第1ノイズ画像を含む符号化対象の入力画像に対しノイズ除去処理を施して第1メイン画像を生成するステップと、前記入力画像及び第1メイン画像から前記第1ノイズ画像を推定して前記第1ノイズ画像に対応するデータベースID及び強度変調係数を含むモデル情報を生成するステップと、前記モデル情報を参照して前記第1メイン画像中の複数の画素を含む画像ブロック毎に該画像ブロックの画素平均値に関連づけられたデータベースIDに従って、ノイズ画像ブロックを格納したノイズデータベースを選択するステップと、前記ノイズデータベースからノイズ画像ブロックを切り出すステップと、前記モデル情報を参照して前記画素平均値に関連づけられた強度変調係数を選択するステップと、前記強度変調係数によって前記ノイズ画像ブロックを変調して変調ノイズ画像を生成するステップと、前記変調ノイズ画像の各ノイズ画像ブロック間の境界に平滑フィルタ処理を施して平滑化ノイズ画像を生成するステップと、前記変調ノイズ画像から前記平滑化ノイズ画像を差し引いて差分画像を生成するステップと、前記第1メイン画像と前記差分画像を加算して第2メイン画像を生成するステップと、前記第2メイン画像を符号化して符号化データを生成するステップと、前記符号化データに前記モデル情報を多重化して符号化ストリームを出力するステップと、を具備する動画像符号化方法が提供される。 According to a more specific aspect of the present invention, a step of generating a first main image by performing a noise removal process on an input image to be encoded including a first noise image, and from the input image and the first main image Estimating the first noise image to generate model information including a database ID and an intensity modulation coefficient corresponding to the first noise image; and a plurality of pixels in the first main image with reference to the model information Selecting a noise database storing a noise image block according to a database ID associated with the pixel average value of the image block for each image block including: cutting out a noise image block from the noise database; and the model information Selecting an intensity modulation coefficient associated with the pixel average value with reference to Modulating the noise image block by the intensity modulation coefficient to generate a modulated noise image; and applying a smoothing filter process to a boundary between the noise image blocks of the modulated noise image to generate a smoothed noise image; Subtracting the smoothed noise image from the modulated noise image to generate a difference image; adding the first main image and the difference image to generate a second main image; and the second main image A moving picture encoding method is provided, which includes the steps of: generating encoded data by encoding the model information; and outputting the encoded stream by multiplexing the model information with the encoded data.
ここで、前記第2メイン画像を生成するステップは、前記差分画像を該差分画像に係数を乗じた後、前記第1メイン画像に加算するようにしてもよい。 Here, the step of generating the second main image may include adding the difference image to the first main image after multiplying the difference image by a coefficient.
また、前記第2メイン画像を生成するステップは、前記差分画像を該差分画像にオフセットを足し合わせた後、前記第1メイン画像に加算するようにしてもよい。 In the step of generating the second main image, the difference image may be added to the first main image after adding the offset to the difference image.
本発明の他の態様によると、ノイズ画像を含む符号化対象の入力画像に対しノイズ除去処理を施して第1メイン画像を生成するステップと、前記入力画像及び第1メイン画像から前記ノイズ画像を推定して前記ノイズ画像に対応する、複数のパラメータを有するモデル情報を生成するステップと、フィルムグレイン再現のためのフィルムグレイン画像の各ノイズ画像ブロック間の境界に対する平滑フィルタ処理によって周期パターンが発生する特定パラメータ範囲を記憶するステップと、前記パラメータの値が前記特定パラメータ範囲内にあるか否かを判別するステップと、前記判別するステップにより前記パラメータの値が前記特定パラメータ範囲内にあると判別された場合に、前記パラメータの値を前記特定パラメータ範囲外の値に修正するステップと、前記メイン画像を符号化して符号化データを生成するステップと、前記符号化データに前記修正するステップを経たモデル情報を多重化して符号化ストリームを出力するステップと、を具備する動画像符号化方法が提供される。 According to another aspect of the present invention, a step of generating a first main image by performing a noise removal process on an input image to be encoded including a noise image, and the noise image from the input image and the first main image. A periodic pattern is generated by generating model information having a plurality of parameters corresponding to the noise image by estimation and smoothing filter processing on a boundary between each noise image block of the film grain image for film grain reproduction. The step of storing the specific parameter range, the step of determining whether or not the value of the parameter is within the specific parameter range, and the step of determining determine that the value of the parameter is within the specific parameter range. The parameter value is corrected to a value outside the specified parameter range. And a step of generating encoded data by encoding the main image, and a step of multiplexing the model information that has undergone the correcting step and outputting an encoded stream to the encoded data. An image encoding method is provided.
さらに、本発明の別の態様によると、上述した動画像符号化処理をハードウェアにより実現する動画像符号化装置あるいは上述した動画像符号化処理をコンピュータに行わせるためのプログラムが提供される。 Furthermore, according to another aspect of the present invention, there is provided a moving image encoding apparatus that implements the above-described moving image encoding processing by hardware, or a program for causing a computer to perform the above-described moving image encoding processing.
本発明によれば、FGTにおいて微弱なフィルムグレイン画像を加算する際に見られるブロックの縦境界の歪みを回避することが可能となる。 ADVANTAGE OF THE INVENTION According to this invention, it becomes possible to avoid the distortion of the vertical boundary of the block seen when adding a weak film grain image in FGT.
以下、添付図面を参照して本発明の実施の形態を説明する。なお、以下の説明では画像信号を単に画像と呼ぶ。 Embodiments of the present invention will be described below with reference to the accompanying drawings. In the following description, the image signal is simply referred to as an image.
(第1の実施形態)
図1に示されるように、本発明の一実施形態に係る動画像符号化装置は、ノイズリダクション部11、ノイズ推定部12、ブロック縦境界信号生成部13、加算部14、符号化部(エンコーダ)15及び多重化部(マルチプレクサ)16を有する。一方、図1の動画像符号化装置に対応する動画像復号化装置は、図2に示されるように分離部(デマルチプレクサ)21、復号部(デコーダ)22、ノイズ生成部23及び加算部24を有する。
(First embodiment)
As shown in FIG. 1, a moving image encoding apparatus according to an embodiment of the present invention includes a
図1の動画像符号化装置では、入力端子10に入力される動画像である入力画像101に対して、ノイズリダクション部11によりノイズ除去処理が施され、メイン画像102(第1メイン画像)が生成される。ノイズ推定部12は、入力画像101とメイン画像102の差分から、入力画像101中に含まれるノイズ(フィルムグレイン)をモデル化し、モデル情報103を出力する。モデル情報103は、具体的には例えば後述するFGTテーブルを構築するための情報であり、film grain characteristics SEIメッセージとも呼ばれる。
In the moving image encoding apparatus in FIG. 1, noise reduction processing is performed by the
ブロック縦境界信号発生部13は、ノイズ推定部12から出力されるモデル情報103を参照して、メイン画像102からFGTの平滑フィルタ処理によってブロック縦境界において損なわれる画像成分(この画像成分は、加算部14によってメイン画像102のブロック縦境界に加算される信号であり、以後ブロック縦境界信号という)104を生成する。ブロック縦境界信号104は、加算部14においてノイズリダクション部11からのメイン画像102に足し合わされ、ブロック縦境界の歪みを補償可能なメイン画像105(第2メイン画像)が生成される。
The block vertical boundary
加算器14から出力されるメイン画像105は、符号化部15(例えばH.264エンコーダ)により動き補償、DCTのような直交変換及び量子化を用いた圧縮符号化が施され、符号化データ106が生成される。符号化データ106は多重化部16によりノイズ推定部13から出力されるモデル情報103と共に多重化され、符号化ビットストリーム107として出力される。符号化ビットストリーム107は、例えば図示しないDVDあるいはHD DVDのような蓄積メディアに記録されるか、あるいはインターネットのような伝送媒体に送出される。
The
一方、図2の動画像復号化装置においては、入力端子20に上記の蓄積メディアから再生される、あるいは伝送媒体を介して送られてくる符号化ビットストリーム201(基本的に符号化ストリーム107と同じ)が入力される。分離部21では、符号化ビットストリーム201から符号化データ202とモデル情報203が分離される。復号部22では、符号化データ202が復号されることによって、メイン画像(復号画像)204が生成される。ノイズ生成部108は、モデル情報203に従ってメイン画像204からノイズ画像(フィルムグレイン画像)205が生成される。最後に、加算部24においてメイン画像204とノイズ画像205が加算されることによって、フィルムグレインが再現された動画像の出力画像206が得られる。
On the other hand, in the moving picture decoding apparatus in FIG. 2, an encoded bit stream 201 (basically, an encoded
ノイズ生成部23での処理には、特許文献1と同様にノイズ画像の継ぎ目を目立たなくすることを目的とする、ブロック縦境界に対する平滑フィルタ処理が含まれ、これがブロック縦境界に歪みを発生させる原因となる。図3は、その様子を示す図であり、ノイズ画像(フィルムグレイン画像)をメイン画像(復号画像)に加算して得られる出力画像(結果画像)においては、フィルムグレインが再現されるが、ブロック縦境界の歪みである縦線が入ってしまい、画質を損ねる結果となる。FGTの規格とは異なるが、このような平滑フィルタ処理を行わずにノイズ生成処理を行ったところ、出力画像のブロック縦境界への歪みは出現せず、正常な画像が得られることが確認された。
The processing in the
そこで、図1に示した動画像符号化装置では、図2の動画像復号化装置のノイズ生成部23における平滑フィルタ処理によって損なわれる画像成分(これをブロック縦境界信号という)104をブロック縦境界信号生成部13により生成し、このブロック縦境界信号104をノイズリダクション部11から出力されるメイン画像102に加算する。これによって出力画像206は、ノイズ生成部23における平滑フィルタ処理を省略した場合の画像に近づくため、図3に示したようなブロック縦境界の歪みのない、高品質な画像となる。
Therefore, in the moving picture encoding apparatus shown in FIG. 1, an image component (this is called a block vertical boundary signal) 104 that is damaged by the smoothing filter processing in the
次に、ブロック縦境界信号生成部13について詳細に説明する。
図4は、ノイズ推定部12によって生成されるモデル情報103であるFGTテーブル301の例であり、ここではレンジL、レンジH、DB_ID及びCOFFの4項目を有する。レンジL及びレンジHは、メイン画像の例えば8×8画素ブロックの平均画素値に対して設定される下限及び上限を表す。DB_IDは、レンジL及びレンジHで示される範囲に対応する図5のノイズデータベース302を指し示すIDである。COFFは、レンジL及びレンジHで示される範囲に対応する強度(振幅)変調係数である。ノイズデータベース302においては、例えば図5に示されるようにID1,ID2,・・・の位置にノイズ画像ブロックのデータが格納されている。
Next, the block vertical boundary
FIG. 4 is an example of the FGT table 301 which is the
ここで、図2に示した動画像復号化装置では、以下のようにしてノイズ生成部23によりノイズ画像205が生成される。まず、復号部22から出力されるメイン画像204の画素ブロックの平均画素値が入るレンジL及びレンジHで示される範囲に対応するDB_IDに従ってノイズデータベースからノイズ画像ブロックが切り出される。切り出されたノイズ画像ブロックに対して、メイン画像204の画素ブロックの平均画素値に対応する強度変調係数COFFが乗じられて変調が施されることにより、変調ノイズ画像が生成される。生成された変調ノイズ画像のノイズ画像ブロック間の縦境界に平滑フィルタ処理が施されることによって、メイン画像204に対して加算されるべきノイズ画像205が生成される。
Here, in the moving picture decoding apparatus shown in FIG. 2, the
図1中に示したブロック縦境界信号生成部13は、図2の動画像復号化装置におけるノイズ生成部23の上述した処理に着目して、例えば図6のフローチャートに示す手順によりブロック縦境界信号104を生成する。
The block vertical boundary
まず、メイン画像102(ノイズリダクション部11から出力されるノイズ除去後の画像)の例えば8×8画素ブロックの平均画素値を算出する(ステップS101)。この平均画素値をキーとしてFGTテーブル301を参照することにより、平均画素値に対応するノイズデータベース302のIDであるDB_IDを決定する(ステップS102)。ステップS102で決定されたDB_IDをキーとしてノイズデータベース302を参照し、DB_IDに対応するノイズ画像ブロックを切り出す(ステップS103)。
First, for example, an average pixel value of an 8 × 8 pixel block of the main image 102 (image after noise removal output from the noise reduction unit 11) is calculated (step S101). By referring to the FGT table 301 using the average pixel value as a key, DB_ID that is an ID of the
次に、ステップS102と同様に平均画素値によってFGTテーブル301を参照し、平均画素値に対応する強度変調係数COFFを決定する(ステップS104)。ステップS103で切り出されたノイズ画像ブロックに対して、ステップS104で決定されたCOFFに従って強度変調を施す(ステップS105)。 Next, as in step S102, the intensity modulation coefficient COFF corresponding to the average pixel value is determined by referring to the FGT table 301 based on the average pixel value (step S104). The noise image block cut out in step S103 is intensity-modulated according to COFF determined in step S104 (step S105).
例えば、ステップS101で算出された平均画素値が“30”であれば、図4より平均画素値“30”に対応するDB_IDは“2”である。このため、ステップS102ではDB_IDはID2と決定され、ステップS103においてID2に対応するノイズ画像ブロックが切り出される。一方、図4より平均画素値“30”に対応する強度変調係数COFFは0.5と決定され、ステップS103で切り出されたノイズ画像ブロックに対して0.5が乗じられる。 For example, if the average pixel value calculated in step S101 is “30”, the DB_ID corresponding to the average pixel value “30” is “2” from FIG. For this reason, DB_ID is determined to be ID2 in step S102, and a noise image block corresponding to ID2 is cut out in step S103. On the other hand, the intensity modulation coefficient COFF corresponding to the average pixel value “30” is determined to be 0.5 from FIG. 4, and 0.5 is multiplied to the noise image block cut out in step S103.
ステップS101〜S105の処理がメイン画像102の全ての画像ブロックについて行われることにより、ステップS105ではメイン画像102の全ての画像ブロックに対応しかつ強度変調が施されたノイズ画像ブロックからなる変調ノイズ画像が生成される。
By performing the processing of steps S101 to S105 for all image blocks of the
次に、ステップS105で生成された変調ノイズ画像のノイズ画像ブロックの縦境界に平滑フィルタ処理を施して平滑化ノイズ画像を生成する(ステップS106)。ステップS105で生成された変調ノイズ画像から、ステップS106で生成された平滑化ノイズ画像を差し引くことにより得られる差分画像をブロック縦境界信号104として生成する(ステップS107)。 Next, a smoothing noise image is generated by performing smoothing filter processing on the vertical boundary of the noise image block of the modulated noise image generated in step S105 (step S106). A difference image obtained by subtracting the smoothed noise image generated in step S106 from the modulated noise image generated in step S105 is generated as the block vertical boundary signal 104 (step S107).
以上のように本実施形態では、図1の動画像符号化装置においてノイズリダクション部11から出力されるノイズ除去後のメイン画像102にブロック縦境界信号生成部13により生成されるブロック縦境界信号104を足し合わせた後、符号化部15により符号化を行う。ブロック縦境界信号104は、前述したように動画像復号化装置のノイズ生成部23における平滑フィルタ処理によって損なわれる画像成分であり、符号化前に予めメイン画像102に加算される。
As described above, in the present embodiment, the block
従って、動画像復号化装置においては、ノイズ生成部23からのノイズ画像205が復号部22からのメイン画像204に加算されることによりフィルムグレインが再現されつつも、ノイズ生成部23での平滑フィルタ処理によるブロック縦境界の歪みのない高品質の出力画像107を得ることができる。
Therefore, in the moving picture decoding apparatus, the
次に、第1の実施形態の変形例について説明する。図7は、変形例に係るブロック縦境界信号生成部13の処理手順であり、図6のステップS107の後にステップS108の処理を追加している。ステップS108では、ステップS107で変調ノイズ画像から平滑化ノイズ画像を差し引いて得られる差分画像に対して、符号化歪みによる劣化を考慮した係数を掛け合わせることで強度変調を施すことによってブロック縦境界信号104を生成する。
Next, a modification of the first embodiment will be described. FIG. 7 shows a processing procedure of the block vertical boundary
図8は、他の変形例に係るブロック縦境界信号生成部13の処理手順であり、図6のステップSの後にステップS109の処理を追加している。ステップS109では、ステップS107で変調ノイズ画像から平滑化ノイズ画像を差し引いて得られる差分画像に対して、オフセットを加算することによってブロック縦境界信号104を生成する。
FIG. 8 shows a processing procedure of the block vertical boundary
図2の動画像復号化装置におけるノイズ生成部23では、平滑フィルタの丸めによりブロック縦境界の歪みは負側に出る確率が高い。そこで、ステップS109では例えば正方向のオフセットを差分画像に対して加算することによって、ブロック縦境界の歪みをより正確に補償できるようなブロック縦境界信号104を生成する。
In the
なお、図7のステップS108と図8のステップS109の処理を組み合わせてもよく、それによってブロック縦境界の歪みをさらに正確に補償することが可能である。 Note that the processing in step S108 in FIG. 7 and step S109 in FIG. 8 may be combined, thereby making it possible to more accurately compensate for distortion at the block vertical boundary.
(第2の実施形態)
図9は、本発明の第2の実施形態に係る動画像符号化装置を示している。本実施形態では、図1からブロック縦境界信号生成部13及び加算部14が除去され、代わりにパラメータ範囲判別部17と特定パラメータ範囲記憶部18及びパラメータ修正部19が追加されている。
(Second Embodiment)
FIG. 9 shows a video encoding apparatus according to the second embodiment of the present invention. In this embodiment, the block vertical boundary
ノイズ推定部12から出力されるモデル情報103は、パラメータ修正部19を経て多重化部16に入力される。パラメータ範囲判別部17は、モデル情報103が特定パラメータ範囲記憶部18に記憶されている予め定められた範囲(特定パラメータ範囲という)内にあるか否かを判別する。
The
ここで、特定パラメータ範囲とは、FGTの弊害である周期パターンの歪み(言い換えればブロック縦境界の歪み)が観測されるようなモデル情報103のパラメータ範囲をいう。図10は、このような特定パラメータ範囲の一例を示す図であり、この例では先に例示したモデル情報103(FGTテーブル)のうちDB_IDを横軸にとり、COFFを縦軸にとっており、図10の斜線で示す範囲が特定パラメータ範囲である。
Here, the specific parameter range refers to the parameter range of the
パラメータ修正部19は、入力されたモデル情報103が特定パラメータ範囲外にある場合は、モデル情報103をそのままモデル情報108として出力する。一方、モデル情報103が特定パラメータ範囲内にある場合、パラメータ修正部19はモデル情報103を特定パラメータ外となるように修正してモデル情報108を出力する。
If the
このように本実施形態によると、モデル情報のパラメータのうち動画像復号化装置の出力画像206に周期パターンの歪みを発生させるような範囲の値については利用しないようにすることにより、ブロック縦境界の歪みのような周期パターンの歪みが発生しない高品質な出力画像206が得られる。
As described above, according to the present embodiment, by not using the values of the range of the model information parameters that cause the distortion of the periodic pattern in the
以上説明した本発明の実施形態に基づく動画像符号化処理は、ハードウェアでも実現可能であるが、パーソナルコンピュータのようなコンピュータを用いてソフトウェアにより実行することも可能である。従って、本発明によれば上述した動画像符号化処理をコンピュータに行わせるためのプログラム、あるいは当該プログラムを格納したコンピュータ読み取り可能な記憶媒体を提供することができる。 The moving image encoding processing based on the embodiment of the present invention described above can be realized by hardware, but can also be executed by software using a computer such as a personal computer. Therefore, according to the present invention, it is possible to provide a program for causing a computer to perform the above-described moving image encoding process or a computer-readable storage medium storing the program.
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、図6〜図8のフローチャートに示した各ステップの処理順序は適宜変更できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。 Note that the present invention is not limited to the above-described embodiment as it is, and can be embodied by modifying the constituent elements without departing from the scope of the invention in the implementation stage. In addition, the processing order of each step shown in the flowcharts of FIGS. 6 to 8 can be changed as appropriate. In addition, various inventions can be formed by appropriately combining a plurality of constituent elements disclosed in the embodiment. For example, some components may be deleted from all the components shown in the embodiment. Furthermore, constituent elements over different embodiments may be appropriately combined.
10・・・動画像の入力端子
11・・・ノイズリダクション部
12・・・ノイズ推定部
13・・・ブロック縦境界信号生成部
14・・・加算部
15・・・符号化部
16・・・多重化部
17・・・パラメータ範囲判別部
18・・・特定パラメータ範囲記憶部
19・・・パラメータ修正部
20・・・符号化ストリームの入力端子
21・・・分離部
22・・・復号部
23・・・ノイズ生成部
24・・・加算部
101・・・入力画像
102・・・第1メイン画像
103・・・モデル情報
104・・・ブロック縦境界信号
105・・・第2メイン画像
106・・・符号化データ
107・・・符号化ビットストリーム
108・・・モデル情報
201・・・符号化ストリーム
202・・・符号化データ
203・・・モデル情報
204・・・メイン画像
205・・・ノイズ画像
206・・・出力画像
DESCRIPTION OF
Claims (16)
前記入力画像及び第1メイン画像から前記ノイズ画像を推定して前記ノイズ画像に対応するモデル情報を生成するステップと、
前記モデル情報を参照して、フィルムグレイン再現のためのフィルムグレイン画像の各ノイズ画像ブロック間の境界に対する平滑フィルタ処理によって損なわれる画像成分を生成するステップと、
前記第1メイン画像と前記画像成分を加算して第2メイン画像を生成するステップと、
前記第2メイン画像を符号化して符号化データを生成するステップと、
前記符号化データに前記モデル情報を多重化して符号化ストリームを出力するステップと、を具備する動画像符号化方法。 Performing a noise removal process on an input image to be encoded including a noise image to generate a first main image;
Estimating the noise image from the input image and the first main image to generate model information corresponding to the noise image;
Referring to the model information, generating an image component that is impaired by smoothing filter processing on a boundary between each noise image block of a film grain image for film grain reproduction; and
Adding the first main image and the image component to generate a second main image;
Encoding the second main image to generate encoded data;
And a step of multiplexing the model information with the encoded data and outputting an encoded stream.
前記入力画像及び第1メイン画像から前記第1ノイズ画像を推定して前記第1ノイズ画像に対応するデータベースID及び強度変調係数を含むモデル情報を生成するステップと、
前記モデル情報を参照して前記第1メイン画像中の複数の画素を含む画像ブロック毎に該画像ブロックの画素平均値に関連づけられたデータベースIDに従って、ノイズ画像ブロックを格納したノイズデータベースを選択するステップと、
前記ノイズデータベースからノイズ画像ブロックを切り出すステップと、
前記モデル情報を参照して前記画素平均値に関連づけられた強度変調係数を選択するステップと、
前記強度変調係数によって前記ノイズ画像ブロックを変調して変調ノイズ画像を生成するステップと、
前記変調ノイズ画像の各ノイズ画像ブロック間の境界に平滑フィルタ処理を施して平滑化ノイズ画像を生成するステップと、
前記変調ノイズ画像から前記平滑化ノイズ画像を差し引いて差分画像を生成するステップと、
前記第1メイン画像と前記差分画像を加算して第2メイン画像を生成するステップと、
前記第2メイン画像を符号化して符号化データを生成するステップと、
前記符号化データに前記モデル情報を多重化して符号化ストリームを出力するステップと、を具備する動画像符号化方法。 Performing a noise removal process on an input image to be encoded including a first noise image to generate a first main image;
Estimating the first noise image from the input image and the first main image to generate model information including a database ID and an intensity modulation coefficient corresponding to the first noise image;
Selecting a noise database storing a noise image block for each image block including a plurality of pixels in the first main image according to a database ID associated with a pixel average value of the image block with reference to the model information When,
Cutting out a noise image block from the noise database;
Selecting an intensity modulation coefficient associated with the pixel average value with reference to the model information;
Modulating the noise image block with the intensity modulation coefficient to generate a modulated noise image;
Applying a smoothing filter process to a boundary between each noise image block of the modulated noise image to generate a smoothed noise image;
Subtracting the smoothed noise image from the modulated noise image to generate a difference image;
Adding the first main image and the difference image to generate a second main image;
Encoding the second main image to generate encoded data;
And a step of multiplexing the model information with the encoded data and outputting an encoded stream.
前記入力画像及び第1メイン画像から前記ノイズ画像を推定して前記ノイズ画像に対応する、複数のパラメータを有するモデル情報を生成するステップと、
フィルムグレイン再現のためのフィルムグレイン画像の各ノイズ画像ブロック間の境界に対する平滑フィルタ処理によって周期パターンが発生する特定パラメータ範囲を記憶するステップと、
前記パラメータの値が前記特定パラメータ範囲内にあるか否かを判別するステップと、
前記判別するステップにより前記パラメータの値が前記特定パラメータ範囲内にあると判別された場合に、前記パラメータの値を前記特定パラメータ範囲外の値に修正するステップと、
前記メイン画像を符号化して符号化データを生成するステップと、
前記符号化データに前記修正するステップを経たモデル情報を多重化して符号化ストリームを出力するステップと、を具備する動画像符号化方法。 Performing a noise removal process on an input image to be encoded including a noise image to generate a first main image;
Estimating the noise image from the input image and the first main image to generate model information having a plurality of parameters corresponding to the noise image;
Storing a specific parameter range in which a periodic pattern is generated by a smoothing filter process for a boundary between each noise image block of a film grain image for film grain reproduction;
Determining whether the value of the parameter is within the specific parameter range; and
Correcting the parameter value to a value outside the specific parameter range when the parameter value is determined to be within the specific parameter range by the determining step;
Encoding the main image to generate encoded data;
A method of multiplexing the model information that has undergone the correcting step and outputting an encoded stream to the encoded data.
前記入力画像及び第1メイン画像から前記ノイズ画像を推定して前記ノイズ画像に対応するモデル情報を生成する推定部と、
前記モデル情報を参照して、フィルムグレイン再現のためのフィルムグレイン画像の各ノイズ画像ブロック間の境界に対する平滑フィルタ処理によって損なわれる画像成分を生成する生成部と、
前記第1メイン画像と前記画像成分を加算して第2メイン画像を生成する加算部と、
前記第2メイン画像を符号化して符号化データを生成する符号化部と、
前記符号化データに前記モデル情報を多重化して符号化ストリームを出力する多重化部と、を具備する動画像符号化装置。 A noise reduction unit that generates a first main image by performing noise removal processing on an input image to be encoded including a noise image;
An estimation unit that estimates the noise image from the input image and the first main image and generates model information corresponding to the noise image;
A generation unit that refers to the model information and generates an image component that is impaired by smoothing filter processing on a boundary between each noise image block of a film grain image for film grain reproduction;
An adder for adding the first main image and the image component to generate a second main image;
An encoding unit that encodes the second main image to generate encoded data;
And a multiplexing unit that multiplexes the model information with the encoded data and outputs an encoded stream.
前記入力画像及び第1メイン画像から前記第1ノイズ画像を推定して前記第1ノイズ画像に対応するデータベースID及び強度変調係数を含むモデル情報を生成する推定部と、
前記モデル情報を参照して前記第1メイン画像中の複数の画素を含む画像ブロック毎に該画像ブロックの画素平均値に関連づけられたデータベースIDに従って、ノイズ画像ブロックを格納したノイズデータベースを選択する手段と、
前記ノイズデータベースからノイズ画像ブロックを切り出す手段と、
前記モデル情報を参照して前記画素平均値に関連づけられた強度変調係数を選択する手段と、
前記強度変調係数によって前記ノイズ画像ブロックを変調して変調ノイズ画像を生成する手段と、
前記変調ノイズ画像の各ノイズ画像ブロック間の境界に平滑フィルタ処理を施して平滑化ノイズ画像を生成する手段と、
前記変調ノイズ画像から前記平滑化ノイズ画像を差し引いて差分画像を生成する生成部と、
前記第1メイン画像と前記差分画像を加算して第2メイン画像を生成する加算部と、
前記第2メイン画像を符号化して符号化データを生成する符号化部と、
前記符号化データに前記モデル情報を多重化して符号化ストリームを出力する多重化部と、を具備する動画像符号化装置。 A noise reduction unit that generates a first main image by performing a noise removal process on an input image to be encoded including a first noise image;
An estimation unit that estimates the first noise image from the input image and the first main image and generates model information including a database ID and an intensity modulation coefficient corresponding to the first noise image;
Means for selecting a noise database storing a noise image block for each image block including a plurality of pixels in the first main image according to a database ID associated with a pixel average value of the image block with reference to the model information When,
Means for extracting a noise image block from the noise database;
Means for selecting an intensity modulation coefficient associated with the pixel average value with reference to the model information;
Means for modulating the noise image block with the intensity modulation coefficient to generate a modulated noise image;
Means for applying a smoothing filter process to a boundary between each noise image block of the modulated noise image to generate a smoothed noise image;
A generating unit that subtracts the smoothed noise image from the modulated noise image to generate a difference image;
An adder for adding the first main image and the difference image to generate a second main image;
An encoding unit that encodes the second main image to generate encoded data;
And a multiplexing unit that multiplexes the model information with the encoded data and outputs an encoded stream.
前記入力画像及び第1メイン画像から前記ノイズ画像を推定して前記ノイズ画像に対応する、複数のパラメータを有するモデル情報を生成する生成部と、
フィルムグレイン再現のためのフィルムグレイン画像の各ノイズ画像ブロック間の境界に対する平滑フィルタ処理によって周期パターンが発生する特定パラメータ範囲を記憶する記憶部と、
前記パラメータの値が前記特定パラメータ範囲内にあるか否かを判別する判別部と、
前記判別するステップにより前記パラメータの値が前記特定パラメータ範囲内にあると判別された場合に、前記パラメータの値を前記特定パラメータ範囲外の値に修正する修正部と、
前記メイン画像を符号化して符号化データを生成する符号化部と、
前記符号化データに前記修正部を経たモデル情報を多重化して符号化ストリームを出力する多重化部と、を具備する動画像符号化装置。 A generation unit that performs noise removal processing on an input image to be encoded including a noise image to generate a first main image;
A generation unit configured to generate model information having a plurality of parameters corresponding to the noise image by estimating the noise image from the input image and the first main image;
A storage unit for storing a specific parameter range in which a periodic pattern is generated by smoothing filter processing on a boundary between each noise image block of a film grain image for film grain reproduction;
A determination unit for determining whether or not the value of the parameter is within the specific parameter range;
A correction unit that corrects the value of the parameter to a value outside the specific parameter range when the value of the parameter is determined to be within the specific parameter range by the determining step;
An encoding unit that encodes the main image to generate encoded data;
And a multiplexing unit that multiplexes the encoded data with the model information that has passed through the correction unit and outputs an encoded stream.
前記入力画像及び第1メイン画像から前記ノイズ画像を推定して前記ノイズ画像に対応するモデル情報を生成する処理と、
前記モデル情報を参照して、フィルムグレイン再現のためのフィルムグレイン画像の各ノイズ画像ブロック間の境界に対する平滑フィルタ処理によって損なわれる画像成分を生成する処理と、
前記第1メイン画像と前記画像成分を加算して第2メイン画像を生成する処理と、
前記第2メイン画像を符号化して符号化データを生成する処理と、
前記符号化データに前記モデル情報を多重化して符号化ストリームを出力する処理と、を含む動画像符号化処理をコンピュータに行わせるためのプログラム。 A process of generating a first main image by performing a noise removal process on an input image to be encoded including a noise image;
Processing for estimating the noise image from the input image and the first main image and generating model information corresponding to the noise image;
With reference to the model information, a process of generating an image component that is damaged by a smoothing filter process on a boundary between each noise image block of a film grain image for film grain reproduction;
A process of adding the first main image and the image component to generate a second main image;
A process of generating the encoded data by encoding the second main image;
A program for causing a computer to perform a moving image encoding process including: a process of multiplexing the model information with the encoded data and outputting an encoded stream.
前記入力画像及び第1メイン画像から前記第1ノイズ画像を推定して前記第1ノイズ画像に対応するデータベースID及び強度変調係数を含むモデル情報を生成する処理と、
前記モデル情報を参照して前記第1メイン画像中の複数の画素を含む画像ブロック毎に該画像ブロックの画素平均値に関連づけられたデータベースIDに従って、ノイズ画像ブロックを格納したノイズデータベースを選択する処理と、
前記ノイズデータベースからノイズ画像ブロックを切り出す処理と、
前記モデル情報を参照して前記画素平均値に関連づけられた強度変調係数を選択する処理と、
前記強度変調係数によって前記ノイズ画像ブロックを変調して変調ノイズ画像を生成する処理と、
前記変調ノイズ画像の各ノイズ画像ブロック間の境界に平滑フィルタ処理を施して平滑化ノイズ画像を生成する処理と、
前記変調ノイズ画像から前記平滑化ノイズ画像を差し引いて差分画像を生成する処理と、
前記第1メイン画像と前記差分画像を加算して第2メイン画像を生成する処理と、
前記第2メイン画像を符号化して符号化データを生成する処理と、
前記符号化データに前記モデル情報を多重化して符号化ストリームを出力する処理と、を含む動画像符号化処理をコンピュータに行わせるためのプログラム。 A process of generating a first main image by performing a noise removal process on an input image to be encoded including a first noise image;
Processing for estimating the first noise image from the input image and the first main image and generating model information including a database ID and an intensity modulation coefficient corresponding to the first noise image;
Processing for selecting a noise database storing a noise image block for each image block including a plurality of pixels in the first main image according to a database ID associated with a pixel average value of the image block with reference to the model information When,
A process of cutting out a noise image block from the noise database;
Selecting an intensity modulation coefficient associated with the pixel average value with reference to the model information;
Processing to generate a modulated noise image by modulating the noise image block with the intensity modulation coefficient;
Processing to generate a smoothed noise image by applying a smoothing filter process to a boundary between each noise image block of the modulated noise image;
A process of subtracting the smoothed noise image from the modulated noise image to generate a difference image;
A process of generating the second main image by adding the first main image and the difference image;
A process of generating the encoded data by encoding the second main image;
A program for causing a computer to perform a moving image encoding process including: a process of multiplexing the model information with the encoded data and outputting an encoded stream.
前記入力画像及び第1メイン画像から前記ノイズ画像を推定して前記ノイズ画像に対応する、複数のパラメータを有するモデル情報を生成する処理と、
フィルムグレイン再現のためのフィルムグレイン画像の各ノイズ画像ブロック間の境界に対する平滑フィルタ処理によって周期パターンが発生する特定パラメータ範囲を記憶する処理と、
前記パラメータの値が前記特定パラメータ範囲内にあるか否かを判別する処理と、
前記判別する処理により前記パラメータの値が前記特定パラメータ範囲内にあると判別された場合に、前記パラメータの値を前記特定パラメータ範囲外の値に修正する処理と、
前記メイン画像を符号化して符号化データを生成する処理と、
前記符号化データに前記修正する処理を経たモデル情報を多重化して符号化ストリームを出力する処理と、を含む動画像符号化処理をコンピュータに行わせるためのプログラム。 A process of generating a first main image by performing a noise removal process on an input image to be encoded including a noise image;
Processing to generate model information having a plurality of parameters corresponding to the noise image by estimating the noise image from the input image and the first main image;
A process for storing a specific parameter range in which a periodic pattern is generated by a smoothing filter process on a boundary between each noise image block of a film grain image for film grain reproduction;
Processing for determining whether or not the value of the parameter is within the specific parameter range;
A process for correcting the parameter value to a value outside the specific parameter range when the parameter value is determined to be within the specific parameter range by the determining process;
A process of encoding the main image to generate encoded data;
A program for causing a computer to perform a moving image encoding process including: a process of multiplexing model information that has undergone the correction process to the encoded data and outputting an encoded stream.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006324996A JP2008141436A (en) | 2006-11-30 | 2006-11-30 | Moving image encoding method, device and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006324996A JP2008141436A (en) | 2006-11-30 | 2006-11-30 | Moving image encoding method, device and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008141436A true JP2008141436A (en) | 2008-06-19 |
Family
ID=39602462
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006324996A Pending JP2008141436A (en) | 2006-11-30 | 2006-11-30 | Moving image encoding method, device and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008141436A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012133707A (en) * | 2010-12-24 | 2012-07-12 | Canon Inc | Image processing device and control method of image processing device |
-
2006
- 2006-11-30 JP JP2006324996A patent/JP2008141436A/en active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012133707A (en) * | 2010-12-24 | 2012-07-12 | Canon Inc | Image processing device and control method of image processing device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA2559131C (en) | Stereoscopic parameter embedding apparatus and stereoscopic image reproducer | |
KR101229942B1 (en) | Film grain sei message insertion for bit-accurate simulation in a video system | |
JP5490544B2 (en) | System and method for reducing artifacts in images | |
WO2005022921A1 (en) | Moving picture encoding method and moving picture decoding method | |
JP2000059743A (en) | Image processing unit, and image processing method and serving medium thereof | |
JPWO2012131895A1 (en) | Image coding apparatus, method and program, image decoding apparatus, method and program | |
TW201721627A (en) | Image processing device and image processing method | |
TW201608873A (en) | High precision up-sampling in scalable coding of high bit-depth video | |
JP2010068101A (en) | Apparatus and program for editing moving image | |
WO2019050972A2 (en) | Tone-curve optimization method and associated video encoder and video decoder | |
US11477455B2 (en) | In-loop reshaping with local illumination compensation in image coding | |
JP2004242318A (en) | Video block dividing method and its apparatus | |
JP2009534968A (en) | Digital watermarking method | |
JP2011029998A (en) | Image recording device, image recording method and program | |
JP2007336275A (en) | Moving image reproducing device | |
JP4543873B2 (en) | Image processing apparatus and processing method | |
JP2003179921A (en) | Coded image decoding apparatus | |
EP1302078B1 (en) | Method and apparatus for coding a video image flux | |
JP2008141436A (en) | Moving image encoding method, device and program | |
JP2009302755A (en) | Storage reproducer, storage device, reproducer, and storage reproduction method | |
JP2010041654A (en) | Moving-image encoding method and device | |
WO2008007717A1 (en) | Dynamic image decoding device and dynamic image encoding device | |
US20070140343A1 (en) | Image encoding method, and image decoding method | |
JP2016519519A (en) | Video signal processing method and apparatus | |
JP2007110189A (en) | Image quality evaluation apparatus and image quality evaluation method |