JP2006081066A - 画像生成装置および画像生成プログラム - Google Patents

画像生成装置および画像生成プログラム Download PDF

Info

Publication number
JP2006081066A
JP2006081066A JP2004265138A JP2004265138A JP2006081066A JP 2006081066 A JP2006081066 A JP 2006081066A JP 2004265138 A JP2004265138 A JP 2004265138A JP 2004265138 A JP2004265138 A JP 2004265138A JP 2006081066 A JP2006081066 A JP 2006081066A
Authority
JP
Japan
Prior art keywords
image
unit
encoding
frequency
feature amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004265138A
Other languages
English (en)
Inventor
Takuya Kawakita
卓哉 川北
Hiromatsu Aoki
博松 青木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2004265138A priority Critical patent/JP2006081066A/ja
Publication of JP2006081066A publication Critical patent/JP2006081066A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】画像データを符号化する前に、画像にローパスフィルターをかけるだけでは、全体的にぼやけた画像になり、視覚的に画質が向上したとは言えなくなるという問題点を克服する画像処理方法を提供する。
【解決手段】画像の生成の前に、画像の特徴量を抽出する特徴量抽出部22と、前記の特徴量抽出部22で抽出された特徴量を用いて入力画像信号に対して変更を行う画像合成部23と、前記の特徴量抽出部22で抽出された特徴量を用いて、符号量を調整することができるような圧縮符号化部24とを備え、画像合成部23において、画像の特徴量によって動的に符号量を変更することにより、最適な情報量削減を行ない画質を向上させることができ、圧縮符号化部24においても、画像の特徴量を利用することで符号量が最小となるように情報量削減を行うことで、さらに画質を向上させることができる画像生成装置、およびその方法を提供することを目的とする。
【選択図】図11

Description

本発明は画像データの高画質化技術に関する。
近年、ハードウエア技術の著しい発展に伴い、コンピュータの処理能力は著しく向上した。そのため、現在ではパーソナルコンピュータを用いて、誰もが容易にデジタル化された大容量の画像データを扱えるようになってきた。それと同時にコンピュータのネットワーク化、ネットワークの高速化も急速に進み、ネットワーク経由でストリーミングなどの方法で動画を視聴することも可能になってきている。また、コンピュータのみならず携帯電話でもデータ通信を行えるようになってきており、近年では、動画を視聴することができる携帯電話機も増えてきた。
しかしながら、画像のデータ量は膨大であり、携帯電話機で画像データを非圧縮で見ることは困難であるし、現在のネットワークの通信速度では、動画データを非圧縮のままネットワーク経由で流通させるのは不可能であるのはもちろん、蓄積するのも困難である。したがって、画像データを保存・蓄積したり、ネットワーク経由で配信する際には、通常、静止画の場合であればJPEG国際標準方式、動画の場合であればMPEG国際標準方式に代表される圧縮符号化が行われる。
前記のJPEG国際標準方式とMPEG国際標準方式による画像圧縮符号化方式は、いずれも8×8画素のブロック単位に2次元離散コサイン変換(DCT)し、量子化して得られる量子化2次元DCT係数をエントロピー符号化することでデータを圧縮する。2次元DCTや、量子化は非可逆であるため、符号化して得られた画像データは、符号化前に比べ、画質が劣化する。特に、モバイル機器での再生用途に用いられる低ビットレートのMPEG−4 Visual符号化データでは、量子化誤差によるブロックノイズが視覚的に知覚されやすく、この特徴は、動きが激しく、情報量の多い絵柄の場合に顕著に現れる。
この問題を解決するために、画像データを符号化する前に画像にフィルタリングを施す(以下、プレフィルタ処理と記載)ことにより、圧縮符号化の際の画質劣化を抑える処理が行われる。例えば、プレフィルタ処理としてローパスフィルター(以下、LPFと記載)を施し、視覚的に知覚されにくい高周波成分を除去することで、画像の情報量を減少させ、圧縮符号化の際の画質劣化を抑えることができる。
しかしながら、フレーム毎に、画像全体に一様にLPFをかける手法では、画質の劣化が視覚的に知覚されないようにするのは非常に困難である。この問題を解決するために、8×8のブロックごとに圧縮符号化の難易度を算出し、その難易度によって画像にかけるLPFの帯域を制限することで、高周波成分を除去しつつも圧縮符号化の際の画質劣化を抑えることができる手法が提案されている(例えば、特許文献1参照)。さらに、圧縮符号化後のフレームデータと入力画像信号との誤差に基づいてプレフィルタ処理を行わせることで、圧縮符号化時に画像に破綻をきたすことを防止する手法が提案されている(例えば、特許文献2参照)。
特開2001−352546号公報 特開2000−115765号公報
しかしながら、圧縮符号化の難易度によってLPFの帯域を制限する手法や、圧縮符号化後のフレームデータと入力画像信号との誤差に基づいて、プレフィルタ処理を行う手法は、いずれも、プレフィルタ処理による画像データの情報量削減と圧縮符号化処理での画像データの情報量削減とは互いに独立に行なわれるため、視覚的に画質の劣化を知覚できない範囲で、符号量を最小化するために最適な圧縮符号化データを得ることは困難であり、圧縮符号化データの画質を向上させるために最適な手法とは言えない。この問題は、低ビットレートのMPEG−4 Visual符号化データにおいて、特に顕著に現れる。
本発明は、上述した従来技術の問題点を鑑みてなされたものであり、画像データに対し、MPEG−4 Visual方式に代表されるような低ビットレートへの圧縮符号化をする際に、画質劣化を最小限に抑えつつ、符号化データの最適な情報量削減を行う画像生成装置、およびその方法を提供することを目的とする。
前記従来の課題を解決するために、本発明の画像生成装置、画像生成プログラムは、
画像データをフレーム毎、n個(n>0)のブロックに分割し、前記ブロック毎、画素値データを周波数変換して得られる周波数変換係数を前記ブロック毎に決定される量子化スケールで量子化し、符号化する画像生成装置であって、前記ブロック毎、画像特徴量を算出する算出手段と、前記画像データに変更を加える変更手段と、前記変更されたフレームデータを圧縮符号化する際に、前記画像特徴量に基づき、非可逆圧縮処理である量子化処理を行った後の量子化周波数変換係数を、微小に変化させる係数変更手段とを備える。
このような構成により、次のように画像を生成することができる。フレーム毎に、画像全体に一様にLPFをかける手法では、画像の特徴とは無関係にLPFをかけるため、LPFの強度が強すぎる場合に発生する画像のぼけや、圧縮符号化の量子化誤差によるブロックノイズのいずれもが、視覚的に知覚されないようにするのは非常に困難であるが、ブロック毎に画像特徴量を算出し、算出された画像特徴量を用いてプレフィルタ処理を行うことにより、画像に対して動的にフィルタリング処理を行うことができる。
また、プレフィルタ処理による画像データの情報量削減と圧縮符号化処理での画像データの情報量削減とは互いに独立して行なわれるため、視覚的に画質の劣化を知覚できない範囲で、符号量を最小化するために最適な圧縮符号化データを得ることは困難であったが、上述の構成によれば、プレフィルタ処理の際に利用した画像特徴量を圧縮符号化処理の際にも利用して、非可逆圧縮処理である量子化処理を行った後の量子化周波数変換係数を直接操作することができる。
本発明による画像生成装置、画像生成プログラムによれば、フレーム毎に、画像全体に一様にLPFをかける手法では、画質の劣化が視覚的に知覚されないようにするのは非常に困難であるが、ブロック毎に画像特徴量を算出し、算出された画像特徴量を利用し、動的にフィルタリング処理を施すことにより、LPFの強度が強すぎる場合に発生する画像のぼけや、圧縮符号化の量子化誤差によるブロックノイズのいずれもが、視覚的に知覚されないようにすることができ、画質を向上させることができる。
また、プレフィルタ処理による情報量削減と圧縮符号化処理での画像データの情報量削減とを互いに独立に行う場合、視覚的に画質の劣化を知覚できない範囲で、符号量を最小化するために最適な圧縮符号化データを得ることは困難であったが、プレフィルタ処理の際に利用した画像特徴量を用いて、非可逆圧縮処理である量子化処理を行った後の量子化周波数変換係数を直接操作することで、画像の中の画質劣化が目立ちやすい部分については符号量を減らさずに、画質劣化が目立ちにくい部分のみ符号量を最小化するように、量子化周波数変換係数を操作することが可能になるので、視覚的に知覚できない範囲で、符号量を最小化することができ、その結果、同じビットレートの画像では、より小さな量子化ステップサイズでの符号化が可能になるため、プレフィルタ処理で画質を向上させたのに加え、更なる画質の向上をはかることができる。
本発明の実施の形態について説明する前に、まず、MPEG−4 Visual符号化の処理概要について説明する。
図1は、MPEG−4 Visual符号化の処理構成図を示す。MPEG−4 Visualでは、VOP(Video Object Plane)と呼ばれる単位で符号化を行う。(最も単純な場合には、VOPはフレームに相当する。)図1において、入力部10では、圧縮符号化する画像データがVOP単位で入力され、各VOPは、16×16画素単位のマクロブロックに分割される。
動き検出・符号化部11は、動き検出部111、マクロブロックタイプ設定部112、動きベクトル符号化部113とから構成されており(図2)、動き検出部111では、入力部10から入力されたマクロブロックデータと参照用画像記憶部16で蓄積されている参照用画像データとを用いて動きベクトルを算出し、マクロブロックタイプ設定部112では動き検出の結果をもとに、マクロブロックタイプが設定され、ノンイントラマクロブロックの場合のみ動きベクトル符号化部113で可変長符号化が行われる。
予測部12では、動き検出・符号化部2で算出された動きベクトルと参照用画像記憶部16で蓄積されている参照用画像データとを用いて、予測画像が生成される。
変換部13は、予測誤差生成部131、DCT部132、量子化部133とから構成されており(図3)、予測誤差生成部131では、ノンイントラマクロブロックの場合のみ入力部10から入力されたマクロブロックデータと予測部で生成された予測画像とから生成される誤差画像マクロブロックデータを出力し、イントラマクロブロックの場合には、入力部10から入力されたマクロブロックデータをそのまま出力し、DCT部132に入力する。DCT部132では、予測誤差生成部131から出力されたマクロブロックデータを8×8画素のブロックごとに2次元離散コサイン変換(DCT)を行い、量子化部133では、DCT部132から出力された2次元DCT係数を量子化する。
DCT符号化部14は、DC/AC予測部141、スキャン部142、可変長符号化部143から構成され(図4)、DC/AC予測部141では、変換部13から出力された2次元量子化DCT係数と隣接するマクロブロックの2次元DCT係数をもとに予測される値とから2次元量子化DCT係数誤差成分を算出し、スキャン部142では、DC/AC予測部で求めた2次元量子化DCT係数誤差成分を符号化する順番に並び替え、可変長符号化部143では、スキャン部142で並び替えた2次元量子化DCT係数誤差成分を符号化する。
参照用画像生成部15は、逆量子化部151、逆DCT部152、画像再構成部153とから構成され(図5)、逆量子化部151では、変換部13で出力される2次元量子化DCT係数を逆量子化し、逆DCT部152では、逆量子化部151で逆量子化された2次元DCT係数に逆DCTを行い、画像再構成部153では、逆DCT部152で出力された画素値により画像を再構成する。ノンイントラマクロブロックの場合には、予測部で生成された予測画像の画素値を加算して画像を再構成する。参照用画像記憶部16では、参照用画像生成部15で再構成された画像が蓄積される。
パラメータ設定部17では、動き検出・符号化部11とDCT符号化部14から出力される符号量をもとに、次マクロブロックを符号化する際の量子化パラメータを設定し、出力部18では、動き検出・符号化部11とDCT符号化部14から出力される符号とをMPEG−4 Visual符号化データとして出力する。
以上のように構成されたMPEG−4 Visual符号化の処理構成図について、図6に示すフローチャートを用いてその動作を説明する。第1に入力部に、MPEG−4 Visual符号化を行なう画像データを読み出しておく(S1)。第2に、MPEG−4符号化パラメータを初期化しておく(S2)。次に、画像データをVOP単位でマクロブロックに分割し、マクロブロック毎、動き検出・符号化処理を行なう(S3)。動き検出・符号化処理の動作については、図7に示しており、まず、蓄積されている参照用画像を用いて動き検出を行ない、動きベクトルを求める(S31)。次いで、動き検出の結果を用いてマクロブロックタイプを設定し(S32)、ノンイントラマクロブロックの場合には、動きベクトルを符号化し、出力部に出力する(S33)。
動き検出・符号化処理の次には、参照用画像と動きベクトルを用いて、予測画像を生成し(S4)、更に、変換処理を行なう(S5)。変換処理の動作については、図8に示しており、まず、入力したマクロブロックデータと、予測画像データとを用いて予測誤差を生成する(S51)。ただし、イントラマクロブロックについては、マクロブロックデータをそのまま予測誤差データとする。次いで、予測誤差データを8×8画素のブロック毎に対し、2次元DCTを施し(S52)、パラメータ設定部から入力された量子化スケールを用いて2次元DCT係数を量子化する(S53)。
変換処理の次には、DCT符号化処理を行なう(S6)。DCT符号化処理の動作については、図9に示しており、まず、隣接するブロックの量子化2次元DCT係数を用いてDC/AC予測を行ない、量子化2次元DCT係数誤差を算出する(S61)。次いで、スキャンにより、符号化を行なう順番に量子化2次元DCT係数を並び替え(S62)、可変長符号化し、出力部に出力する(S63)。
DCT符号化処理の次には、参照用画像生成処理を行なう(S7)。参照用画像生成処理の動作については、図10に示しており、まず、変換部で算出した量子化2次元DCT係数を逆量子化する(S71)。次いで、逆量子化した2次元DCT係数に逆DCTを施し、参照用画像の予測誤差を生成する(S72)。最後に、予測画像と参照用画像の予測誤差とを加算して参照用画像を生成し(S73)、参照用画像記憶部に蓄積する。ただし、イントラマクロブロックの場合には、参照用画像の予測誤差をそのまま参照用画像として蓄積する。
参照用画像生成処理の次には、出力した符号量をもとに、次のマクロブロックを符号化する際に用いる量子化パラメータを設定する(S8)。ステップS3からステップS8までの処理をマクロブロック単位に行ない、1VOPの処理が終了したら、次のVOPのタイプを設定する(S9)。ステップS3からステップS9までの処理を全VOPに対して繰り返し行ない、画像データを全て読み出して符号化した時点で処理を終了する。
以上を踏まえて、以下に、本発明の実施の形態について、図を用いて説明する。
(実施の形態)
図11は本発明の実施の形態における処理構成図である。図11において、画像入力部21では入力画像信号を取り込み、特徴量抽出部22で入力画像信号から各画素におけるエッジの強さと方向という画像特徴量を算出する算出手段を実行する。画像合成部23は、特徴量抽出部22において検出された特徴量を利用して入力画像信号に変更を加えるフレーム変更手段を実行する。圧縮符号化部24において圧縮符号化が行われる。画像信号出力部25において画像信号が出力される。
ここで上記処理構成について図11の処理構成図と、図12に示すフローチャートを用いてその動作を個別に説明する。
まず第1の説明として、画像信号入力部21について説明する。画像信号入力部において、大きさがm×n画素(m,n>0)である画像の入力画像信号(I)を読み込む(S101)。
次に第2の説明として、特徴量抽出部22について説明する。まず、入力画像信号(I)に対しハイパスフィルター(以下、HPFと記載)をかけることにより、入力画像信号(I)のエッジ(E1〜E4)を検出する(S102)。この際、エッジを検出するためのHPFは、図13のように複数の方向に対するHPFを用意する。本実施例では、縦・横・斜めの4つのHPFで説明しているが、必ずしも図13のように4方向のみである必要はなく、1方向でも2方向でも3方向でもよく、4方向以上であっても良い。また、このHPFのフィルタリングを行う係数(以下、タップ係数と記載)を方向ごとに個別に設定可能であるようにすることで、各方向ごとに検出したいエッジの強さを決定できるものとする。さらに、本実施例では、注目画素近傍の5×5画素の画素値についてフィルタリングを行っているが、必ずしも5×5画素である必要はない。
さらに、HPFによって方向ごとに検出されたエッジ成分のうちノイズ信号を除去するコアリング処理を施す。本発明においては、コアリング処理において弱いエッジ成分についても、エッジ信号の値を小さくするような処理を行う(S103)。具体的には、図14において、x軸に入力信号、y軸に出力信号をとったグラフにおいて、入力輝度に対する設定値、a・b・c・d(a<b<0<c<d)を設定し、それぞれの領域における傾きe・f・g・hを設定する。入力輝度をLi、出力輝度をLoとすると、Li<aの時にはLiを、Lo=e(Li−a)+f(a−b)で一意に決定されるLoに補正し、b1<L<b2の時にはLiを、Lo=F(Li−b)で一意に決定されるLoに補正し、b2<L<b3の時には、Lo=0に補正し、b3<L<b4の時にはLiを、Lo=g(Li−c)で一意に決定されるLoに補正しb4<Lの時にはLiを、Lo=h(Li−d)+g(d−c)で一意に決定されるLoに補正するものとする。入力輝度に対する設定値を4つ(a・b・c・d)設定することにより、それぞれ入力輝度Liの大きさによって任意の値にエッジ信号を抑圧することができる。また、それぞれの傾きを個別に設定することで、画像の特徴に合わせたエッジを抽出することができる。この傾きは、前記のHPFのタップ係数の絶対値の和が大きな値である時は、bとcの絶対値を小さくするというように、HPFのタップ係数と連動させてもよい。さらに、本実施例では図14のように線形で説明したが、必ずしも線形である必要はなく、非線形であってもよい。以上のコアリング処理により、エッジ信号からノイズを除去し、弱いエッジ成分をさらに弱めた信号(E1'〜E4')を得ることができる。
コアリング処理を施されたエッジ信号(E1'〜E4')に対してLPFをかけることで、それぞれの方向のエッジ成分の情報量を減少させる(S104)。このLPFは、たとえば、垂直方向のエッジ信号については、水平方向のLPFを、水平方向のLPFについては、垂直方向のLPFをかけるというように、各エッジ成分の方向と関連づけても良い。
その後、LPFをかけられた方向毎のエッジ信号について、ある任意のピクセル(x1,y1)に注目した時に、そのピクセル(x1,y1)の値で、最も絶対値の大きなエッジ成分をそのピクセルにおけるエッジ信号成分(e)とする(S105)。このエッジ成分の抽出処理を(x,y)の全ピクセルに対して行うことにより、画像のエッジ成分が求められる。
第3の説明として、画像合成部23について説明する。第1の説明における入力画像信号(I)、および第2の説明において出力されたエッジ信号成分(e)について、それぞれ同じ座標上のピクセルの値を加算することにより合成する(S106)。また、この画像合成部23の前に入力画像信号(I)にLPFをかける処理をしてもよく、画像を合成した後に、LPFをかける処理を行ってもよい。
以上第1から第3までの説明による処理により、劣化が目立ちやすい範囲については符号量を減らさずに、劣化が目立ちにくい範囲のみ符号量を減らすというように、画像に対して動的に情報量を減らすことができるので、画質を向上させることができる。
第4の説明として、画像の信号圧縮部24について図15の処理構成図を用いて説明する。本発明においては、プレフィルタ処理で利用した画像のエッジとエッジの強さという特徴量を利用し、MPEG−4 Visual符号化処理を行うように構成されており、画像の信号圧縮部24は、入力部10と、動き検出・符号化部11と、予測部12と、変換部13と、画像特徴量入力部40と、符号量調整部41と、DCT符号化部14と、参照用画像生成部15と、参照用画像記憶部16と、パラメータ設定部17と、出力部18とから構成される。本発明における信号圧縮部24が図1で示されるMPEG−4符号化部と異なるのは、外部から画像特徴量が入力される点と、前記の入力された画像特徴量を用いて符号量調整部41において非可逆圧縮処理である量子化処理を行った後の量子化周波数変換係数を調整した後に、DCT符号化部14および、参照用画像生成部15において処理がなされるという点である。
以上のように構成された本発明の圧縮符号化部24の処理構成について、図16に示すフローチャートを用いてその動作を個別に説明する。
第1に、MPEG−4 Visual符号化を行なう画像データを読み出しておく(S1)。第2に、MPEG−4符号化パラメータを初期化しておく(S2)。次に、画像データをVOP単位でマクロブロックに分割し、マクロブロック毎、動き検出・符号化処理を行なう(S3)。動き検出・符号化処理の動作については、図7に示しており、まず、蓄積されている参照用画像を用いて動き検出を行ない、動きベクトルを求める(S31)。次いで、動き検出の結果を用いてマクロブロックタイプを設定し(S32)、ノンイントラマクロブロックの場合には、動きベクトルを符号化し、出力部に出力する(S33)。
動き検出・符号化処理の次には、参照用画像と動きベクトルを用いて、予測画像を生成し(S4)、更に、変換処理を行なう(S5)。変換処理の動作については、図8に示しており、まず、入力したマクロブロックデータと、予測画像データとを用いて予測誤差を生成する(S51)。ただし、イントラマクロブロックについては、マクロブロックデータをそのまま予測誤差データとする。次いで、予測誤差データを8×8画素のブロック毎に対し、2次元DCTを施し(S52)、パラメータ設定部から入力された量子化スケールを用いて2次元DCT係数を量子化する(S53)。
その後、量子化された2次元DCT係数に対して符号量の調整を行う(S200)。図17に示すように、特徴量抽出部22において抽出されたエッジ情報を8×8のブロックごとに読み出し(S201)、読み出されたエッジ情報をもとに、符号量を減少させるDCT係数を設定する。具体的には、読み出されたエッジ信号のうち、垂直成分のエッジ信号(V1)に着目し、そのエッジ成分の平均値V2がvi<V2<vjの場合(vi,vj>0)に、8×8のDCT係数の(0,k)の座標(0≦k<8)であらわされる位置の符号量の絶対値を減少させる(S202)。同様に、水平方向のエッジ成分(H1)についても、水平方向のエッジ成分の平均値H2が、hi<H2<hjの場合(hi,hj>0)に、8×8のDCT係数の(l,0)の座標(0≦l<8)であらわされる位置の符号量の絶対値を減少させる(S203)。さらに、V2<viかつH2<hiである場合には、DCT係数のうちの高周波成分(例えば、DCT係数の(3,3)〜(7,7)の座標中に含まれる画素)の符号量の絶対値を減少させる(S204)。これにより、ブロックごとの特徴を判断しながら、動的に符号量を減少させ、視覚的に知覚できない範囲で、符号量を最小化することができる。
その後、符号量が減少したDCT係数に対して、DCT符号化処理を行なう(S6)。DCT符号化処理の動作については、図9に示しており、まず、隣接するブロックの量子化2次元DCT係数を用いてDC/AC予測を行ない、量子化2次元DCT係数誤差を算出する(S61)。次いで、スキャンにより、符号化を行なう順番に量子化2次元DCT係数を並び替え(S62)、可変長符号化し、出力部に出力する(S63)。
DCT符号化処理の次には、参照用画像生成処理を行なう(S7)。参照用画像生成処理の動作については、図10に示しており、まず、符号量調整処理分で算出された量子化2次元DCT係数を逆量子化する(S71)。次いで、逆量子化した2次元DCT係数に逆DCTを施し、参照用画像の予測誤差を生成する(S72)。最後に、予測画像と参照用画像の予測誤差とを加算して参照用画像を生成し(S73)、参照用画像記憶部に蓄積する。ただし、イントラマクロブロックの場合には、参照用画像の予測誤差をそのまま参照用画像として蓄積する。
参照用画像生成処理の次には、出力した符号量をもとに、次のマクロブロックを符号化する際に用いる量子化パラメータを設定する(S8)。ステップS3からステップS8までの処理をマクロブロック単位に行ない、1VOPの処理が終了したら、次のVOPのタイプを設定する(S9)。ステップS3からステップS9までの処理を全VOPに対して繰り返し行ない、画像データを全て読み出して符号化した時点で処理を終了する。
以上の本発明の実施の形態により、画像処理による符号量を最小になるように調整するとともに、画質の劣化を抑えることができ、それにより、生成される画像の画質を向上させることができる。
なお、本実施形態ではプレフィルタ処理で利用した画像特徴量をMPEG−4 Visual符号化処理でも利用し、符号量を調整する例で説明したが、MPEG−1符号化処理やMPEG−2符号化処理やJPEG符号化処理でも本質的には処理構成は同じであり、同様の処理で符号量を調整し、画像を出力することができる。
また、本実施形態ではm×n画素の2次元空間の画像について処理を行っているが、3次元以上の空間の画像においても同様の処理で符号量を調整し、画像を出力することができる。
本発明はネットストリーミングなどの画像配信分野で利用する画像生成装置および、画像生成プログラム等として有効である。
MPEG−4 Visual符号化の処理構成図 MPEG−4 Visual符号化の動き検出・符号化部の処理構成図 MPEG−4 Visual符号化の変換部の処理構成図 MPEG−4 Visual符号化のDCT符号化部の処理構成図 MPEG−4 Visual符号化の参照用画像生成部の処理構成図 MPEG−4 Visual符号化の処理を示すフローチャート MPEG−4 Visual符号化の動き検出・符号化部の処理を示すフローチャート MPEG−4 Visual符号化の変換部の処理を示すフローチャート MPEG−4 Visual符号化のDCT符号化部の処理を示すフローチャート MPEG−4 Visual符号化の参照用画像生成部の処理を示すフローチャート 本発明の画像処理方法の処理構成図 本発明の画像処理方法の処理を示すフローチャート 本発明の実施の形態におけるHPFの構成例を示す図 本発明のコアリング処理の概要を示すグラフ 本発明の圧縮符号化の処理構成図 本発明の圧縮符号化処理を示すフローチャート 本発明の符号量調整処理を示すフローチャート
符号の説明
1 MPEG−4 Visual符号化の処理構成図
10 入力部
11 動き検出・符号化部
12 予測部
13 変換部
14 符号化手段を実行する符号化部
15 参照用画像生成部
16 参照用画像記憶部
17 パラメータ設定部
18 出力部
111 動き検出部
112 マクロブロックタイプ設定部
113 動きベクトル符号化部
131 予測誤差生成部
132 フレームデータをブロック毎に周波数変換する周波数変換手段を実行するDCT部
133 量子化周波数変換係数を算出する量子化手段を実行する量子化部
141 DC/AC予測部
142 スキャン部
143 可変長符号化部
151 逆量子化部
152 逆DCT部
153 画像再構成部
21 画像信号入力部
22 特徴量抽出部
23 画像合成部
24 圧縮符号化部
25 画像信号出力部
31 垂直ハイパスフィルター
32 水平ハイパスフィルター
33 斜めハイパスフィルター1
34 斜めハイパスフィルター2
Li 入力輝度信号
Lo 出力輝度信号
a 強いマイナスエッジ成分と弱いマイナスエッジ成分の境界
b 弱いマイナスエッジ成分とノイズ成分の境界
c ノイズ成分と弱いプラスエッジ成分の境界
d 弱いプラスエッジ成分と強いプラスエッジ成分の境界
e 入力輝度Lに対する傾き(Li<b1)
f 入力輝度Lに対する傾き(b1<Li<b2)
g 入力輝度Lに対する傾き(b3<Li<b4)
h 入力輝度Lに対する傾き(b4<Li)
40 入力部
41 動き検出・符号化部
42 予測部
43 変換部
44 量子化周波数変換係数を画像特徴量に基づき、変化させる係数変更手段を実行する符号量調整部
45 画像特徴量入力部
46 DCT符号化部
47 参照用画像生成部
48 参照用画像記憶部
49 パラメータ設定部
50 出力部

Claims (6)

  1. 画像データをフレーム毎、n個(n>0)のブロックに分割し、前記ブロック毎、画素値データを周波数変換して得られる周波数変換係数を前記ブロック毎に決定される量子化スケールで量子化し、符号化する画像生成装置であって、前記フレーム毎、画像特徴量を算出する算出手段と、前記算出された画像特徴量をもとに、前記フレームデータに変更を加えるフレーム変更手段と、前記変更されたフレームデータを前記ブロック毎に周波数変換する周波数変換手段と、前記周波数変換係数を前記ブロックごとに決定される量子化スケールで量子化して量子化周波数変換係数を算出する量子化手段と、前記量子化周波数変換係数を前記画像特徴量に基づき、微小に変化させる係数変更手段と、変更した前記量子化周波数変換係数を符号化する符号化手段とを備える画像生成装置。
  2. 前記画像特徴量は、エッジの方向と強度を表す指標を算出することを特徴とする、請求項1に記載の画像生成装置。
  3. 前記係数変更手段は、前記画像特徴量を用いて、前記量子化周波数変換係数のうち、変更する周波数成分をL組(0<L)設定する手段と、前記設定したL組の周波数成分毎に、前記量子化周波数変換係数に、±Δa(Δa>0)の範囲のそれぞれの値を加算した(2×Δa+1)組の変更値を取得する手段と、前記変更値毎に、符号化した際の符号量が最小になる前記変更値を前記量子化周波数変換係数と置き換える手段とから構成されることを特徴とする、請求項1または請求項2に記載の画像生成装置。
  4. コンピュータに、画像データをフレーム毎、n個(n>0)のブロックに分割し、前記ブロック毎、画素値データを周波数変換して得られる周波数変換係数を前記ブロック毎に決定される量子化スケールで量子化し、符号化する手段を実行させる画像生成プログラムであって、前記フレーム毎、画像特徴量を算出する算出手段と、前記算出された画像特徴量をもとに、前記フレームデータに変更を加えるフレーム変更手段と、前記変更されたフレームデータを前記ブロック毎に周波数変換する周波数変換手段と、前記周波数変換係数を前記ブロックごとに決定される量子化スケールで量子化して量子化周波数変換係数を算出する量子化手段と、前記量子化周波数変換係数を前記画像特徴量に基づき、微小に変化させる係数変更手段と、変更した前記量子化周波数変換係数を符号化する符号化手段とを実行させる機能を備える画像生成プログラム。
  5. 前記画像特徴量は、エッジの方向と強度を表す指標を算出することを特徴とする、請求項4に記載の画像生成プログラム。
  6. 前記係数変更手段は、前記画像特徴量を用いて、前記量子化周波数変換係数のうち、変更する周波数成分をL組(0<L)設定する手段と、前記設定したL組の周波数成分毎に、前記量子化周波数変換係数に、±Δa(Δa>0)の範囲のそれぞれの値を加算した(2×Δa+1)組の変更値を取得する手段と、前記変更値毎に、符号化した際の符号量が最小になる前記変更値を前記量子化周波数変換係数と置き換える手段とから構成されることを特徴とする、請求項4または請求項5に記載の画像生成プログラム。
JP2004265138A 2004-09-13 2004-09-13 画像生成装置および画像生成プログラム Pending JP2006081066A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004265138A JP2006081066A (ja) 2004-09-13 2004-09-13 画像生成装置および画像生成プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004265138A JP2006081066A (ja) 2004-09-13 2004-09-13 画像生成装置および画像生成プログラム

Publications (1)

Publication Number Publication Date
JP2006081066A true JP2006081066A (ja) 2006-03-23

Family

ID=36160123

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004265138A Pending JP2006081066A (ja) 2004-09-13 2004-09-13 画像生成装置および画像生成プログラム

Country Status (1)

Country Link
JP (1) JP2006081066A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010093377A (ja) * 2008-10-03 2010-04-22 Fujitsu Ltd 画像予測装置及び方法、画像符号化装置、画像復号化装置
JP2016149605A (ja) * 2015-02-10 2016-08-18 日本電信電話株式会社 映像符号化ストリーム生成方法、映像符号化ストリーム生成装置及び映像符号化ストリーム生成プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010093377A (ja) * 2008-10-03 2010-04-22 Fujitsu Ltd 画像予測装置及び方法、画像符号化装置、画像復号化装置
US8306116B2 (en) 2008-10-03 2012-11-06 Fujitsu Limited Image prediction apparatus and method, image encoding apparatus, and image decoding apparatus
JP2016149605A (ja) * 2015-02-10 2016-08-18 日本電信電話株式会社 映像符号化ストリーム生成方法、映像符号化ストリーム生成装置及び映像符号化ストリーム生成プログラム

Similar Documents

Publication Publication Date Title
JP5283628B2 (ja) 映像復号方法及び映像符号化方法
JP5054826B2 (ja) 時空間的複雑度を用いた符号化モード決定方法及び装置
JP4455487B2 (ja) 復号化装置及び復号化方法及びプログラム
US8326064B2 (en) Image re-encoding method to decode image data which is orthogonally transformed per first block and encoded by a first encoding method
WO2009123033A1 (ja) デブロッキングフィルタ処理装置、デブロッキングフィルタ処理方法
US7760964B2 (en) Method and architecture for temporal-spatial deblocking and deflickering with expanded frequency filtering in compressed domain
US20110069752A1 (en) Moving image encoding/decoding method and apparatus with filtering function considering edges
US11743475B2 (en) Advanced video coding method, system, apparatus, and storage medium
JPH04196976A (ja) 画像符号化装置
JP2009531980A (ja) デジタルビデオエンコーダの内部予測及びモード決定処理の計算を低減する方法
JP2006157481A (ja) 画像符号化装置及びその方法
JP6114782B2 (ja) 画像の圧縮
TW202103495A (zh) 解碼影像資料的方法、編碼影像資料的方法及儲存編碼影片資訊的非暫態電腦可讀取儲存媒介
JP2006229411A (ja) 画像復号化装置及び画像復号化方法
GB2495942A (en) Prediction of Image Components Using a Prediction Model
JP2010245734A (ja) 映像圧縮符号化データの復号装置
KR101223780B1 (ko) 압축 화상 노이즈 제거 장치와 재생 장치
KR101345294B1 (ko) 영상의 양자화 장치 및 방법
JP4784618B2 (ja) 動画像符号化装置、動画像復号化装置、動画像符号化プログラム、及び動画像復号化プログラム
JP2006081066A (ja) 画像生成装置および画像生成プログラム
JP2008544621A (ja) ビデオエラー隠蔽を向上させる符号化及び復号の方法及び装置
JP4857152B2 (ja) 直交変換・量子化装置
JP5256095B2 (ja) 圧縮画像ノイズ除去装置と再生装置
KR20070092481A (ko) H.264 동영상 부호화기의 적응적 고속 움직임 추정 방법
JP2006157084A (ja) 画像符号化装置、画像符号化方法、及びコンピュータプログラム