JP4945533B2 - 画像処理装置及び画像処理方法 - Google Patents

画像処理装置及び画像処理方法 Download PDF

Info

Publication number
JP4945533B2
JP4945533B2 JP2008230745A JP2008230745A JP4945533B2 JP 4945533 B2 JP4945533 B2 JP 4945533B2 JP 2008230745 A JP2008230745 A JP 2008230745A JP 2008230745 A JP2008230745 A JP 2008230745A JP 4945533 B2 JP4945533 B2 JP 4945533B2
Authority
JP
Japan
Prior art keywords
pixel
value
pixels
block
constituent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008230745A
Other languages
English (en)
Other versions
JP2010068084A (ja
Inventor
秀則 竹島
敏充 金子
直 三島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2008230745A priority Critical patent/JP4945533B2/ja
Priority to US12/404,578 priority patent/US8111939B2/en
Publication of JP2010068084A publication Critical patent/JP2010068084A/ja
Application granted granted Critical
Publication of JP4945533B2 publication Critical patent/JP4945533B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)

Description

本発明は、ブロックノイズやリンギングを除去する、画像処理方法及び画像処理装置に関する。
画像の情報量を削減するために、JPEG、MPEG−1/2/4やH.261/263/264など、ブロック単位の変換を利用した圧縮符号化が広く用いられている。圧縮符号化された静止画や動画像フレームから元の画像を復号すると、ブロックノイズやリンギングと呼ばれる人工ノイズが発生することが多い。これらの人工ノイズに単純な平滑化フィルタを適用すると、ノイズの除去と同時に画像本来のパターン(エッジやテクスチャ)まで失われてしまう。
これに対し、圧縮符号化を行った際の情報(変換の単位となるブロックサイズ、変換の際の変換係数及び量子化情報)を用い、画像本来のパターンを保ちつつ、人工ノイズを効果的に除去する方法が提案されている(例えば、非特許文献1)。
Y. Yang et al., Regularized Reconstruction to Reduce Blocking Artifacts of Block Discrete Cosine Transform Compressed Images, IEEE Trans. Circuits and System for Video Technology, vol 3, no. 6, Dec. 1993.
上記した従来技術では、符号化情報を得ることが出来ない画像に対して、人工ノイズを効果的に除去することが出来なかった。
上記課題を解決するために本発明は、入力画像が符号化された際の、フレーム内の変換単位であるブロックの境界を推定する推定手段と、前記フレーム内の画素とその画素に隣接する少なくとも1つの画素とを構成画素として有する対象画素群の特徴値を、(a)前記対象画素群のすべての構成画素が同じ前記ブロックに属する場合には、前記構成画素の画素値の変化の程度から算出し、(b)前記対象画素群の構成画素が異なる複数の前記ブロックに属する場合には、前記構成画素の画素値と、前記構成画素の周辺に存在し前記構成画素と同じブロックに属する周辺画素の画素値との画素値の変化の程度から算出する、特徴値算出手段と、前記対象画素群の画素間で画素値を平滑化する際の強度値を、前記特徴値から算出する強度値算出手段と、前記強度値算出手段が求めた前記強度値に応じて、前記対象画素群の画素値を平滑化する平滑化手段と、を備えたことを特徴とする画像処理装置、及び前記画像処理装置が行う画像処理方法を提供する。
また、入力画像が符号化された際の、フレーム内の変換単位であるブロックの境界を推定する推定手段と、前記推定手段が推定したブロック境界と異なる位置で前記フレームを、前記推定手段が推定する前記ブロック境界とは異なる境界で分割し、複数の区画を生成する分割手段と、前記区画内の画素とその画素に隣接する少なくとも1つの画素とを構成画素として有する対象画素群の特徴値を、(a)前記対象画素群のすべての構成画素が同じ前記ブロックに属する場合には、前記構成画素の画素値から算出し、(b)前記対象画素群の構成画素が異なる複数の前記ブロックに属する場合には、前記構成画素の画素値と、前記構成画素の周辺に存在し前記構成画素と同じブロックに属する周辺画素の画素値との画素値の変化の程度から算出する、特徴値算出手段と、前記構成画素間で画素値を平滑化する際の強度を示し、前記差分量が大きい程、前記強度が小さくなるような強度値を算出する強度値算出手段と、前記強度値算出手段が求めた前記強度値に応じた強度で、前記構成画素間の画素値を平滑化し、出力画素値を得る平滑化手段と、前記区画毎の前記出力画素値から、1つのフレームに統合する統合手段と、を備えた画像処理装置及び前記画像処理装置が行う画像処理方法を提供する。
符号化情報を得ることが出来ない画像の人工ノイズを効果的に除去することが出来る。
以下、本発明の実施形態について図面を参照しながら詳細に説明する。なお、同じ構成には同じ符号を付し、重複する説明は省略する。
(第1の実施形態)
図1は、本実施形態の画像処理装置100の構成を示す図である。本実施形態の画像処理装置は、入力される復号画像(以下、入力画像と記載)から、ブロックノイズやリンギングなどの人工ノイズの少ない画像への変換処理を行う。なお、入力画像は既に復号されており、符号化されていた際のブロック情報を得ることが出来ない場合について説明する。
画像処理装置100は、ブロック情報推定部101、特徴値算出部102、正則化強度算出部103、エネルギー最小化部104、を有する。
ブロック情報推定部101は、入力画像の付加情報が得られる場合には付加情報を用いて入力画像が符号化された際の変換単位であるフレーム内のブロックの境界(以下、ブロック境界と記載)を推定する。本実施形態では、ブロック情報推定部101は、ブロック情報として、推定されるブロックサイズを求める。
ブロック境界を推定するために用いる付加情報とは、ファイルのフォーマット情報やMIME情報(データの形式を指定する文字列)等を示す。例えば、入力画像のファイルの種類がJPEGである場合は8x8(画素を単位とする。以下省略して記載する。)に、MPEGである場合は8x8に、H.264である場合は4x4のサイズで符号化が行われたと推定することができる。入力画像を復号したデコーダから符号化の情報を得ることが出来ない場合であっても、入力画像は、付加情報を伴っている場合が多い。例えば、ファイルの拡張子やMIMEタイプが得られることもあるし、メタデータなどの付加情報からファイルフォーマットに関する情報が得られることもある。これらの付加情報に基づいて、実際に符号化が行われた際のブロックサイズに関する情報を得ることが出来ない場合であってもブロックサイズを推定することが出来る。ブロック情報推定部101は、推定したブロックサイズのサイズデータをブロック情報として求める。
なお、付加情報に依らずに8x8など比較的良く使われる所定のブロックサイズで符号化の変換処理が行われたと推定し、そのブロック間の境界をブロック境界として推定する構成であってもかまわない。
特徴値算出部102は、ブロック情報推定部101が推定したブロック情報を利用し、入力画像のフレーム内で隣接する複数の画素(以下、構成画素と記載)の集合(以下、対象画素群と記載)の画素間の相関の程度を示す特徴値を、対象画素群をずらしながら順次算出する。例えば、ブロックサイズがMxNであったと推定するブロック情報が求められたフレームは、フレーム内をMxNで区切った境界がブロック境界であったと推定される。
なお、対象画素群をずらす際には、構成画素が異なる画素の集合となるような画素群であればよい。本実施形態では、構成画素が2つの隣接画素である場合について説明する。画素群を構成する画素の数は、その他の任意の数であって構わない。特徴値は、対象画素群の画素値(例えば、輝度値やRGB値)の画素間の変化を示すものである。本実施形態では、特徴値として構成画素間の画素値の差分量(以下、エッジ強度と記載)を利用する例について述べる。その際に、ブロック境界をはさんだ対象画素群における特徴値を求める際には、その周辺のエッジ強度に応じて特徴値を求める。例えば、図2,図3に示すように、画素が複数のブロックに属する対象画素群800の特徴値802を算出する場合、対象画素群のうち少なくとも1つの構成画素の画素値と、その構成画素と同じブロックに属すると推定される周辺の画素の画素値との間のエッジ強度を求める。図2では、対象画素群800の画素それぞれ同じブロック内で推定エッジ方向と直交する方向で隣接する1画素間のエッジ強度803を求める例について示している。また、図3では、対象画素群800の画素それぞれが同じブロック内で隣接する3画素間のエッジ強度901を求める例について示している。求めた周辺のエッジ強度803、901に応じて、対象画素群800の特徴値802の大きさを求める。大きさの求め方として例えば、求めた周辺のエッジ強度803、901の代表値(例えば、最大値、最小値、中央値や平均値のうちいずれかひとつ)を対象画素群の特徴値とする。
正則化強度算出部103は、特徴値算出部102が求めた特徴値に基づいて対象画素群間での画素値の平滑化を行う際の重みに相当する正則化強度を決める。正則化強度と特徴値との関数をあらかじめ決めておき、特徴値を代入することで求める。なお、あらかじめ定められた関数は、特徴値が大きい(画素間の差分が大きい)程、正則化強度が小さくなるような関数である。また、特徴値が離散値である場合には、各特徴値と対応した正則化強度が記憶されたテーブルを保持していても良い。詳細については後述する。
エネルギー最小化部104は、正則化強度算出部103が求めた正則化強度に基づきフレーム内の画素の画素値の平滑化を正則化再構成法によって行う。この処理をエネルギー最小化と呼ぶ。詳細については後述する。
図4は、本実施形態の画像処理装置の動作を示すフローチャートである。
まず、ブロック情報推定部101が入力画像のフレームが符号化された際のブロックサイズを推定する(S101)。次に、フレーム内の画素のうち隣接する複数の画素を対象画素群として順次設定する(S102)。特徴値算出手段102は、ブロック情報推定部が推定したブロックサイズを利用し、対象画素群を構成する画素がすべて同じブロックに属していたと推定されるか判断する(S103)。対象画素群を構成する画素がすべて同じブロックに属していたと推定される場合(S103,Yes)には、対象画素群の画素間のエッジ強度を対象画素群の特徴値として算出する(S104)。対象画素群を構成する画素がすべて同じブロックに属していなかったと推定される場合(S103,No)には、対象画素群の周辺の画素との画素間のエッジ強度から(例えば、最大値や平均値などの代表値を用いて)、対象画素群の特徴値を算出する(S105)。正則化強度算出部103は、特徴値から、対象画素群の正則化強度を算出する(S106)。フレーム内の全ての対象画素群の正規化強度を算出したか判断する(S107)。フレーム内の全ての対象画素群の正則化強度を算出したと判定した場合(S107,Yes)には、エネルギー最小化部104がフレーム内の画素の画素値の平滑化を正則化再構成法によって行う。得られた画素値の集合を出力画像として出力する(S108)。フレーム内の、全ての求めるべき対象画素群の正則化強度を算出していないと判定した場合(S107,No)には、S102から、対象画素群を再度設定し、繰り返す。
なお、図4では、フレーム内の全ての対象画素群に対して正則化強度を求めた後にエネルギーの最小化を行う構成としたが、エネルギー関数を一部の対象画素群に対してのみ定義し、それを最小化しても良い。
(正則化再構成法)
次に、正則化再構成法について説明する。はじめに、入力画像に対して定義した拘束式を連立方程式として定式化し、それらの連立方程式をなるべく満たすようにするためのデータ項(Data terms)、および、ノイズを除去するための項である正則化項(Regularization terms)の2つを備えたエネルギー関数を定義し、そのエネルギー関数を最小化し出力画像を得る。
一般的な人工ノイズの除去では、入力画像と出力画像の解像度は等しい。ただし、人工ノイズの除去と同時にスケーリングを行うことも可能で、その場合を考えると、入力画像と出力画像の解像度は必ず一致しない。以下、入力画像と出力画像の解像度が同じであっても異なっていても良いように、入力画像の画素数をL、出力画像の画素数をMとして説明を進める。L=Mでもかまわない。
入力画像の各画素にインデックスi={1、2、3、…、L}を付与し、画素値をy1,y2,y3…であらわす。なお、画素値がスカラー値でない場合、yは縦ベクトルであらわすものとする。例えば、画素値がRGBの3次元で与えられる場合、3次元の縦ベクトルであらわす。出力信号にもインデックスj={1、2、3、…、M}を付与し、画素値をx1,x2,x3…であらわす。
人工ノイズの除去では、通常、出力画像の各画素値が入力画像の各画素値から大きく外れることは好ましくない。一般的な人工ノイズの除去では、L=Mであり、かつ、y=xから大きく外れないように出力画像の画素値を求めれば良い。ただし、例えば圧縮符号化に伴うノイズに加えて画像本来のパターンのぼけを補正し、先鋭化する場合には、図5に示すように、入力画素301の画素値は、出力画素302の画素値に対して積和演算を加えることで得られたものと考えて、そのぼけを除去した値を求めることが好ましい。あるいは、LとMが異なるスケーリングを含む場合には、図6に示すように、出力画素402の画素値xにスケーリングに対応した積和演算を施した値が入力画素401の画素値に近くなるように、出力画像の画素値yを求めることが好ましい。一般には、入力画素値を出力画素値の重みつき和であらわした連立方程式を立てると良い。求めたい出力画素値x1,x2,x3…に対し、各インデックスiについて、重みの係数をwijであらわせば、出力画像の各画素値が入力画像の各画素値から大きく外れることを避けるために、(式1)をなるべく満たすような最適化問題を解けばよいことがわかる。
Figure 0004945533
重み係数はPoint Spread Function(PSF)と呼ばれる。入力画像以外に、出力画素値の重みつき和の値が推定できる拘束式が得られるなら、それらについてもインデックスを付与して式を追加し、追加した式の本数だけLの値を増やすことができる。このような拘束式の追加方法はL<Mの場合によく使われ、その具体的な方法は、非特許文献(S. C. Park et al., “Super-Resolution Image Reconstruction: A Technical Overview,”’ IEEE Signal Processing Magazine, pp.21-36, May 2003.)に述べられている。なお、この方法はL<Mでない場合であっても利用することができる。
数1の拘束式を入力画像の画素数だけ立てるとL個の式が得られる。これらをまとめて行列表記すると、ベクトルx=(x,x,x,…,x)T、ベクトルy=( y,y,y,…, y)T、行列W=(( w11, w12, w13 , …, w1M) T,( w21, w22, w23 , …, w2M) T,…) Tを導入すると、各インデックスiに対する式をまとめてy=Wxと表すことができる。
人工ノイズの除去においては、この拘束式からのずれをできるだけ抑えながら、同時に人工ノイズを抑えることが目的となる。ここで、人工ノイズが大きいほど値が大きくなるようなxの関数Ereg(x)を考える。エネルギー最小化部104は、エネルギー関数(式2)のEを最小化することにより、人工ノイズの除去を行う。
Figure 0004945533
ノルムの右下の添え字はノルムがL2ノルムであることを表す。(右上の添え字は2乗を表す。)λは正則化の強さを制御するパラメータである。
(正則化強度の算出方法)
次に、正則化強度算出部103が求める正則化強度をL=Mの場合について説明する。正則化再構成法では、人工ノイズが大きいほど値が大きくなると期待できる関数Ereg(x)によって、人工ノイズを効果的に除去することができる。以下、対象画素群として2画素が抽出された場合について説明する。
関数Ereg(x)として、画像のフレーム内に発生する人工ノイズ、例えばリンギングを除去する関数を設計する。人間は強いエッジ付近での弱いエッジを知覚しにくいという性質を持つため、エッジ強度が弱い場合にリンギングを平滑化できれば、人間の知覚する画質は改善すると考えられる。そこで、図7に示すように、画素値の相関が低い501のような画素間では平滑化を行わず、画素値の相関が高い502のような画素間で強い平滑化を行う。それによって、物体(オブジェクト)の輪郭のような画像本来のパターンに起因する部分には影響を与えずに、平坦部におけるリンギングのようなノイズを選択的に除去することができる。上記の性質を持つ関数として、例えば次の式を利用することができる。
reg(x)=Σgi,je(xi,xj
ここで、Σは対象画素群(i,j)にする正則化項e(・)の値の重みつき和をとったものである。正則化項e(・)としては、図8のように、その対象画素群における画素間のエッジ強度が強いほど小さい値となる関数であれば何でも良い。例えば、指数関数を用いれば、(式3)を利用することが出来る。
Figure 0004945533
エネルギー関数Eの最小化においては、画素値の差分(xi−xj) 2は正則化の役割を持つ。このコストが2次でない場合には必ずしも正則化の役割を持つわけではないが、便宜上、線形システムに対する正則化の役割を持つか否かにかかわらず、Ereg(x)は正則化項である。また、gi,jは正則化項の強さを制御する正則化強度である。di,jは、特徴値算出部102が算出した特徴値である。例えば、入力画像の対象画素群(i,j)の各画素値に対して適当な積和演算を施した値を利用することが出来る。例えば、画素値の1次微分の離散近似、つまり図10や図11のフィルタ係数を利用した積和演算を施せば良い。もちろん、積和演算の係数は図9の2次微分の離散近似でも良いし、また他の係数であっても良い。また、非線形操作である近傍9画素の差分のメディアンを算出しても良い。なお、図9に示すフィルタを用いた場合には、その周辺画素群の構成画素は5つである。また、図10、図11に示すフィルタを用いた場合には、その画素群の構成画素は2つである。
(正則化再構成法を用いたエネルギー最小化)
次に、エネルギー最小化部104がエネルギー関数を最小化する(S108)具体的な方法について述べる。エネルギー関数の最小化には、例えば、シーケンシャル最小化やパラレル最小化が利用できる。
これらの最小化の過程では、繰り返し演算に基づく最適化を行う。このような最適化では初期値として仮のxが必要となる。仮のxは、例えば入力画像の補間により生成できる。どのような補間方法を用いてもかまわないが、例えば、次の方法が使える。
(A)線形補間
既知の2点を用いて補間する。補間に用いる2点は、できるだけ補間すべき点の近くを用いることが望ましい。既知の2点の位置をa,a+1、その画素値をy,yとし、補間すべき点の位置をa+cで表すと、補間値は
Figure 0004945533
で求められる。
(B)キュービックコンボリューション法
既知の等間隔に配置された4点を用いて補間する。補間に用いる4点は、補間位置を中心とした2以下の範囲に配置されているものとする。補間値は、各点に対し、補間位置を中心とした次の重みカーネル
Figure 0004945533
の値をかけてそれらの和を求めることで得られる。dは各点の補間位置からの距離を表す。γは補間関数を制御するパラメータで、例えばγ=−1.0あるいはγ=−0.5とする。
(シーケンシャル最小化)
reg(x)は2次のエネルギー項を有するため、適当な行列Rを用いて
Figure 0004945533
と書ける関数である場合を考える。例えば先に説明した、隣接画素の画素値の差分を求めて2乗し、その重みつき和を求めるエネルギー項はこの形で書ける。
シーケンシャル最小化の流れの一例を図12に示す。そのアルゴリズムは次の通りである。以下の処理は、エネルギー最小化部104が行う。
(ステップ1)仮のxを生成する(S1301)。仮のxは、例えば入力画像の補間により生成できる。補間には、例えば線形補間やキュービックコンボリューション法が利用できる。
(ステップ2)
y=Wxを構成する第i番目の式は次の形で書ける。
Figure 0004945533
ここで、
Figure 0004945533
は重みを並べた横ベクトルで、yi,Wiは入力として与えられる(S1302)。ノイズの影響をあまり受けずに各
Figure 0004945533
を満たすxを求めるために、シーケンシャル最小化では、ステップサイズβiおよび定数δiを別途与え、次の繰り返し演算を実行する(並列化なしの例:S1303〜S1304)。なお、
Figure 0004945533
は、xの推定値を意味する。
Figure 0004945533
ステップサイズβiや定数δiはすべてのiに対して同じ値(例えばβi=1,δi=1)でもよいし、例えば
Figure 0004945533
の様に、式ごとに変えてもよい。
(ステップ3)方程式0=Rxについても、y=Wxと同様に、式ごとに評価を行う。このとき、ステップサイズにはλをかける。
(ステップ4)所定の回数、ステップ2〜3を繰り返す(S1305)。
(ステップ5)得られた推定画像
Figure 0004945533
を出力する(S1306)。
(パラレル最小化)
次に、図13を参照しながら、パラレル最小化の方法(steepest descent法)を説明する。
(ステップ1)仮のxを生成する(S1401)。具体的には、仮のxを、例えば入力画像に線形補間やキュービックコンボリューション法などを適用して生成する。
(ステップ2)
Eのベクトルxに対する勾配方向∂E/∂xを求め、xの推定値
Figure 0004945533
をエネルギー関数の勾配方向に−β倍したステップ進める操作を繰り返す。その更新は
Figure 0004945533
により行える。
具体的な手順は次の通りである。Wおよびyを与える(S1402)。なお、上記の式をそのまま実行する場合は、まず、エネルギー関数の勾配ベクトルを図示しないバッファ等に保持させ、ゼロで初期化する(S1403)。次に、∂E/∂xの各項を評価してエネルギー関数の勾配ベクトルを更新する(S1404〜S1405)。すべての式の評価が終わった段階で、β倍を行い、それを推定値
Figure 0004945533
から減ずる(S1406)。
(ステップ3)別途定めた回数だけステップ2を繰り返す(S1407)。決定的なパラメータはなく、パラメータ設定は画質と処理コストのトレードオフとなる。実用上は、例えば、処理コストを考えて繰り返し回数を適当な値(例えば、1〜20回程度)に設定し、βの値を変化させながら良い画質が得られるパラメータを探す。
(ステップ4)得られた出力画像
Figure 0004945533
を出力する(S1408)。
(ブロック情報の推定:画像パターンからの推定)
入力画像から、ブロックサイズを推定する例について説明する。ブロックノイズは特徴的な画像パターンを発生させるため、画像のフォーマット情報が得られない場合であっても、ブロック境界を推定することができる。
例えば、フレームを16x16ごとに分割し、その境界はすべてブロック境界であると仮定したうえで、その内部がブロックサイズ4x4、8x8、16x16のいずれかのブロックで分割されていると想定し、これらの候補から各16x16ブロック内部におけるブロックサイズを選択することを考える。まず、各候補ブロックサイズに対し、ブロック間の各2画素に対するエッジ強度をすべて(あるいは、適当に選んだいくつかの画素対に対して)求め、その代表値(例えば、平均値や中央値)を求める。このとき、その候補ブロックサイズが正しいのであれば、エッジ強度の代表値は高い値になり、その候補ブロックサイズが誤っているのであれば、エッジ強度の代表値は低い値になることが期待できる。したがって、それらのうちで代表値が最も高いブロックサイズ候補をブロックサイズとして選択すれば、原理的にはブロックサイズを推定できる。実際は、この原理をそのまま用いると大きなブロックサイズを選択される可能性が高くなってしまうため、小さいブロックサイズが選択されやすいように何らかのバイアスをかけておくと良い。例えば、比較の前に4x4に対する代表値を1.5倍、8x8に対する代表値を1.25倍しておくという方法を利用することができる。
上記の正則化強度に関する上記の説明では、入力画像の画素数Lと出力画像の画素数Mが同じである場合について例示した。つまり、入力画像の各対象画素群に対する正則化強度を求めていた。入力画像の各対象画素群に対する正則化強度に基づいて、出力画像の各対象画素群に対する正則化強度を決めるステップを追加することで、入力画像の画素数Lと出力画像の画素数Mが異なる出力画像を得ることができる。
例えば、出力画像の各対象画素群を構成する各出力画素位置について、次の操作を行う。はじめに、各出力画素位置の近傍(例えば、最近傍、k−最近傍や、別途定めた範囲)にある入力画像の画素を探索する。次に、その画素を含む入力画像の各対象画素群に対する正則化強度を取得し、その代表値(例えば、最大値、最小値、平均値や中央値)を算出する。最後に、算出された代表値を、注目する対象画素群の正則化強度とする。
上記のようにすれば、入力画像から異なる解像度の画像を生成することが出来、また、ブロックノイズやリンギングを除去することができる。
このようにエネルギー項を求めることで、リンギングを抑制することができる。しかし、画像圧縮によってブロックノイズが発生していると、推定ブロック境界に存在する対象画素群(すなわち、互いに所属するブロックが異なる画素を含む複数の画素によって構成される対象画素群)においては、ブロックノイズによって対象画素群のエッジ強度(先の例ではdの値)が大きく評価されてしまい、画像圧縮前のエッジ強度によらず正則化強度の値が小さくなってしまう。そこで、ブロックノイズに対応するために、本発明では、正則化強度を次に述べる方法で変化させる。
なお、本実施形態では、対象画素群を構成する画素数が2である場合e(xi,xj)について例示したが、3以上の画素で構成された対象画素群を順次設定してもよい。例えば、各画素iに対して、画素iと隣接する4つの画素とを含めた、5つの画素を有する対象画素群
Figure 0004945533
を考え、正則化エネルギー項を
Figure 0004945533
としても良い。ただし、インデックスiはラスタスキャン順に割り当てられるものとし、widthは画像の横方向の画素数を表すものとする。[数18]の例では、dとして、図9の2次微分の離散近似を用いている。なお、上記の例はdの形[数18]にこれに限定するものではない。
上記の実施形態の画像処理装置は、入力画像のデコーダから量子化情報やブロック境界の情報を得ることが出来ない場合であっても、ブロックノイズやリンギングの除去をすることが出来るため有効である。したがって、既存の画像デコーダの後段にカスケード接続して利用することができる。仕様の公開されない画像デコーダであっても、後段にカスケード接続することができるため、有効である。
人間は強いエッジ付近での弱いエッジを知覚しにくいという性質を持つ。エッジ強度が弱い場合に推定ブロック境界を平滑化できれば、人間の知覚する画質は大きく改善すると考えられる。したがって、ブロックノイズについても、リンギングのときと同様に、エッジ強度が弱い場合に推定ブロック境界を平滑化する方法を考える。
JPEGやMPEGに代表される変換符号化を用いた画像圧縮では、画像全体を4x4や8x8のブロックで区切り、各ブロックでDCTなどの線形変換を行い、得られた係数を量子化することで圧縮を行う。したがって、逆変換により復元された画像は、圧縮に用いたブロックの境界部分において強いノイズが生じる。その一例を図14に示す。
図14は、本来は画素値が滑らかに変化する部分が、変換符号化によってブロックノイズを生み出した結果を表す説明図である。ブロックの境界701をはさんで、702のような暗い画素値を持つブロックと703のような明るい画素を持つブロックが存在している。このように、画素値が滑らかに変化する部分であるなら、そのブロック境界を平滑化したいのであるが、ブロック境界をはさんだ対象画素群においてエッジ強度を求めても、そのエッジ強度はブロックノイズによって高い値となってしまい、その正則化強度は弱く設定されてしまう。
本実施形態では、各対象画素群で重みの異なる画素間の平滑化項を利用した正則化再構成法を利用した。平滑化項の重みとして、画素間のエッジ強度が小さいほど、大きくなるような重みを用いた。また、ブロック境界の可能性が高い位置を推定し、ブロック境界をまたぐと考えられる各対象画素群の重みについては、周辺にあるブロック境界をまたがない画素間のエッジ強度を用いた。この場合についても同様に、周辺にあるブロック境界をまたがない画素間のエッジ強度が小さいほど重みが大きくなるような重みを用いた。リンギングは、画像本来のパターンと比べ相対的に弱い画素間のエッジ強度が小さいほど、各画素間の重みを大きく設定することにより、平滑化される。対象画素群の画素間にブロック境界が存在する場合には、周辺のパターンが滑らかなパターンである場合ブロック境界は平滑化され、周辺のパターンが滑らかでない場合にはブロック境界も平滑化されない。
したがって、ブロック境界と推定された画素間にブロック境界が存在しない場合であっても、その部分にエッジやテクスチャがあれば、その周辺にもエッジやテクスチャがあると考えられる。そのため、ブロック境界位置でない部分をブロック境界と判定しても、画像本来のパターンに与える影響が少ない。したがって、本実施形態の画像処理装置によれば、符号化情報を利用することができない入力画像に対しても、人工ノイズの除去を効果的に行うことができる。
(第2の実施形態)
本実施形態の画像処理装置は、第1の実施形態の画像処理装置と異なり、1つのフレーム内の処理を並列化し処理する。処理速度が向上するため、入力画像に対してリアルタイムで処理を行う場合に有効である。前述の、正則化再構成法は繰り返し演算によって個々の画素値の変化を伝播させることで平滑化の効果を上げる方法であるため、その効果をなるべく損なわない方法での並列化が望ましい。
並列化を行う1つの方法は、フレームを適当な大きさに区切り、区画ごとに別々の並列ユニットに処理をさせることである。このとき、並列化処理の境界とブロック境界が重なると、その部分ではブロックノイズ平滑化の効果が期待できなくなる。また、境界付近の画素値の変化が伝播されなくなる。この解決方法は、区画の一部を重ねたうえで、重なり部分の結果を平均化することであり、ある程度、ブロックノイズ平滑化の効果を得ることができる。
図15は、本実施形態の画像処理装置200の構成を示す図である。
画像処理装置200は、図1の画像処理装置と比較して、フレーム分割部201、統合部203を有し、また、並列処理部202を複数有する点で異なる。
フレーム分割部201は、入力画像の1枚のフレーム内を並列処理部202の数に応じた数の適当な大きさの区画に分割する。その際に、ブロック情報推定部101が推定したブロック境界と、区画とが重ならないように区切る。図16は、並列化処理の境界とブロック境界が重ならないように区切る方法の例を示す図である。ブロック境界が推定できる場合は、例えばブロック境界1501に区画の境界が重ならないように、個々の並列ユニットに対する区画(処理範囲)を1502、1503のように設定すれば良い。ブロック境界が推定できない場合は、適当なブロックサイズ(例えば8x8)を仮定することで推定されるブロック境界に重ならないように区画を設定すれば良い。また、この区切り方と先に説明した区画の一部を重ね合わせる方法は併用可能である。
並列処理部202は、それぞれ図1に示した特徴値算出部102、正則化強度算出部103、エネルギー最小化部104を有する。1つの並列処理部202は、フレーム分割部201が生成した区画に対して出力する画素値を算出する。
統合部203は、並列処理部202がそれぞれ求めた区画毎の出力画素値を統合し、元の1枚のフレームの画像として出力する。
上記の各実施形態の画像処理装置およびプログラムの実施形態として2次元の画像の例を示したが、2次元の画像以外にも容易に拡張することが可能である。例えば、画像を2次元平面・時間あるいは2次元平面・奥行きについて展開する動画像あるいは3次元ボクセル画像に対する人工ノイズの除去についても、各符号化ブロックが2次元ではなく3次元や4次元、あるいはそれ以上の次元でのブロック(超ブロック)である点を除き、そのまま適用することが可能である。画像の座標系はN次元空間(N:自然数)と考える。一般的には、画素を、N次元空間(N:自然数)内の微小な範囲として扱い、画素値を、画素という範囲内で、ある時間だけサンプリングした信号強度の積分値として扱う。便宜上、画素の中心位置を特に画素の位置と呼ぶことにする。また、動画像のように座標系に時間軸を含む場合でも、画素値のサンプリングはある時間(シャッタースピード)に対して信号を積分することによって行うと考える。なお、画素は必ずしも密に配置される必要はない。例えば、動画像の人工ノイズ除去においては、画素が配置される空間は水平・垂直と時間方向の3次元であるが、このとき、シャッタースピードがフレームレートより小さい場合には時間方向に隙間があらわれる。また、例えば、撮像系が隣の画素の光の一部も積分値に加えてしまうなら、画素間には重なりがあることになる。これらの場合も含め、N次元空間内の微小な範囲を画素と呼ぶことにする。
上記の各実施形態の画像処理装置を用いると、デコーダから符号化に関する情報が得られない場合であってもブロックノイズやリンギングを効果的に除去することができる。したがって、上記の各実施形態の画像処理装置は、任意の画像デコーダの後段にカスケード接続して利用することが可能である。例えば、DVDやネット映像のように、解像度が低く、かつ符号化歪みを有する動画像をテレビ再生する場合、画像デコーダの後段にカスケード接続することで、符号化歪みを除去した画像を再生することができる。
上記の各実施形態では、画像のブロックサイズに関する情報が与えられない場合について説明した。なお、デコーダからブロックサイズに関する情報を得ることが出来る画像についても、上記の方法によってノイズを除去することは可能である。また、ブロックサイズに関する情報を適宜ブロックサイズの推定に用いても良い。
上述の実施形態の中で示した処理手順に示された指示は、プログラムに基づいて実行することが可能である。上記の指示は、プログラムとして、磁気ディスク、光ディスク、半導体メモリ、又はこれに類する記録媒体に記録される。コンピュータは、この記録媒体からプログラムを読み込み、プログラムに記述されている指示をCPUで実行させれば、上述した実施形態の信号処理装置と同様な動作を実現することができる。コンピュータがプログラムを取得する場合又は読み込む場合はネットワークを通じて取得又は読み込んでもよい。また、記憶媒体からコンピュータや組み込みシステムにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているオペレーティングシステムや、データベース管理ソフト、ネットワーク等のミドルウェア等が本実施形態を実現するための各処理の一部を実行してもよい。
本願発明の実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本発明の実施形態における機能を実現することが可能な機器、装置を総称している。
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
第1の実施形態の画像処理装置を示す図。 対象画素群が異なるブロックに属すると推定される場合の正則化強度を示す図。 対象画素群が異なるブロックに属すると推定される場合の正則化強度を示す図。 第1の実施形態の画像処理装置の動作を示すフローチャート。 入力画像と出力画像との解像度が同じ場合の重み係数の例を示す図。 入力画像と出力画像との解像度が異なる場合の重み係数の例を示す図。 オブジェクトの輪郭における平滑化の重み付の例を示す図。 特徴値と正則強度との関係を示す図。 2次微分の離散近似のフィルタ係数の例。 水平一次微分の離散近似のフィルタ係数の例。 垂直一次微分の離散近似のフィルタ係数の例。 シーケンシャル最小化の動作を示す図。 パラレル最小化の動作を示す図。 ブロック境界によるゆがみの例を示す図。 第2の実施形態の画像処理装置を示す図。 並列処理の処理範囲と推定ブロック境界の例を示す図。
符号の説明
100・・・画像処理装置
101・・・ブロック情報推定部
102・・・特徴値算出部
103・・・正則化強度算出部
104・・・エネルギー最小化部

Claims (10)

  1. 入力画像が符号化された際の、フレーム内の変換単位であるブロックの境界を推定する推定手段と、
    前記フレーム内の画素とその画素に隣接する少なくとも1つの画素とを構成画素として有する対象画素群の特徴値を、
    (a)前記対象画素群のすべての構成画素が同じ前記ブロックに属する場合には、前記構成画素の画素値の変化の程度から算出し、
    (b)前記対象画素群の構成画素が異なる複数の前記ブロックに属する場合には、前記構成画素の画素値と、前記構成画素の周辺に存在し前記構成画素と同じブロックに属する周辺画素の画素値との画素値の変化の程度から算出する、
    特徴値算出手段と、
    前記対象画素群の画素間で画素値を平滑化する際の強度値を、前記特徴値から算出する強度値算出手段と、
    前記強度値算出手段が求めた前記強度値に応じて、前記対象画素群の画素値を平滑化する平滑化手段と、
    を備えたことを特徴とする画像処理装置。
  2. 前記平滑化手段は、前記対象画素群の前記強度値と前記構成画素の画素値とから求める第1項と、前記構成画素の出力画素値に広がり関数による重み値を乗じた重み付き和と前記構成画素の画素値との差が小さいほど小さな値をとる第2項とを求め、前記第1項と前記第2項との加重和が小さくなるような出力画素の画素値を、前記構成画素の画素値として求めることを特徴とする請求項1記載の画像処理装置。
  3. 前記特徴値算出手段は、前記特徴値を画素値の差分量を用いて算出することを特徴とする請求項2記載の画像処理装置。
  4. 前記強度値算出手段は、前記差分量が大きい程、前記強度値が小さくなるような強度値を算出することを特徴とする請求項3記載の画像処理装置。
  5. 前記推定手段は、前記フレームを所定のブロックサイズで分割した際の境界を前記ブロック境界として推定することを特徴とする請求項2記載の画像処理装置。
  6. 前記推定手段は、前記入力画像のフォーマット情報を得て、前記フォーマット情報からブロックサイズを推定し、前記フレームを前記ブロックサイズで分割した際の境界を前記ブロック境界として推定することを特徴とする請求項2記載の画像処理装置。
  7. 前記推定手段は、複数のブロックサイズの候補それぞれで前記フレームを分割した際の前記ブロック境界をまたぐ画素間の画素値の相関の程度を求め、前記相関が低い前記ブロックサイズの候補の境界を前記ブロック境界として推定することを特徴とする請求項5乃至6記載の画像処理装置。
  8. 入力画像が符号化された際の、フレーム内の変換単位であるブロックの境界を推定する推定手段と、
    前記推定手段が推定したブロック境界と異なる位置で前記フレームを、前記推定手段が推定する前記ブロック境界とは異なる境界で分割し、複数の区画を生成する分割手段と、
    前記区画内の画素とその画素に隣接する少なくとも1つの画素とを構成画素として有する対象画素群の特徴値を、
    (a)前記対象画素群のすべての構成画素が同じ前記ブロックに属する場合には、前記構成画素の画素値から算出し、
    (b)前記対象画素群の構成画素が異なる複数の前記ブロックに属する場合には、前記構成画素の画素値と、前記構成画素の周辺に存在し前記構成画素と同じブロックに属する周辺画素の画素値との画素値の変化の程度から算出する、
    特徴値算出手段と、
    前記構成画素間で画素値を平滑化する際の強度を示し、前記差分量が大きい程、前記強度が小さくなるような強度値を算出する強度値算出手段と、
    前記強度値算出手段が求めた前記強度値に応じた強度で、前記構成画素間の画素値を平滑化し、出力画素値を得る平滑化手段と、
    前記区画毎の前記出力画素値から、1つのフレームに統合する統合手段と、
    を備えた画像処理装置。
  9. 入力画像が符号化された際の、フレーム内の変換単位であるブロックの境界を推定する推定ステップと、
    前記フレーム内の画素とその画素に隣接する少なくとも1つの画素とを構成画素として有する対象画素群の特徴値を、
    (a)前記対象画素群のすべての構成画素が同じ前記ブロックに属する場合には、前記構成画素の画素値から算出し、
    (b)前記対象画素群の構成画素が異なる複数の前記ブロックに属する場合には、前記構成画素の画素値と、前記構成画素の周辺に存在し前記構成画素と同じブロックに属する周辺画素の画素値との画素値の変化の程度から算出する、
    特徴値算出ステップと、
    前記対象画素群の画素間で画素値を平滑化する際の強度値を、前記特徴値から算出する強度値算出ステップと、
    前記強度値に応じて、前記対象画素群の画素値を平滑化する平滑化ステップと、
    を備えたことを特徴とする画像処理方法。
  10. 入力画像が符号化された際の、フレーム内の変換単位であるブロックの境界を推定する推定ステップと、
    前記推定手段が推定したブロック境界と異なる位置で前記フレームを、前記推定手段が推定する前記ブロック境界とは異なる境界で分割し、複数の区画を生成する分割ステップと、
    前記区画内の画素とその画素に隣接する少なくとも1つの画素とを構成画素として有する対象画素群の特徴値を、
    (a)前記対象画素群のすべての構成画素が同じ前記ブロックに属する場合には、前記構成画素の画素値から算出し、
    (b)前記対象画素群の構成画素が異なる複数の前記ブロックに属する場合には、前記構成画素の画素値と、前記構成画素の周辺に存在し前記構成画素と同じブロックに属する周辺画素の画素値との画素値の変化の程度から算出する、
    特徴値算出ステップと、
    前記構成画素間で画素値を平滑化する際の強度を示し、前記差分量が大きい程、前記強度が小さくなるような強度値を算出する強度値算出ステップと、
    前記強度値算出手段が求めた前記強度値に応じた強度で、前記構成画素間の画素値を平滑化し、出力画素値を得る平滑化ステップと、
    前記区画毎の前記出力画素値から、1つのフレームに統合する統合ステップと、
    を備えた画像処理方法。
JP2008230745A 2008-09-09 2008-09-09 画像処理装置及び画像処理方法 Expired - Fee Related JP4945533B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008230745A JP4945533B2 (ja) 2008-09-09 2008-09-09 画像処理装置及び画像処理方法
US12/404,578 US8111939B2 (en) 2008-09-09 2009-03-16 Image processing device and image processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008230745A JP4945533B2 (ja) 2008-09-09 2008-09-09 画像処理装置及び画像処理方法

Publications (2)

Publication Number Publication Date
JP2010068084A JP2010068084A (ja) 2010-03-25
JP4945533B2 true JP4945533B2 (ja) 2012-06-06

Family

ID=41799362

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008230745A Expired - Fee Related JP4945533B2 (ja) 2008-09-09 2008-09-09 画像処理装置及び画像処理方法

Country Status (2)

Country Link
US (1) US8111939B2 (ja)
JP (1) JP4945533B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2489272B (en) * 2011-03-23 2013-03-13 Toshiba Res Europ Ltd An image processing system and method
JP5928465B2 (ja) * 2011-07-21 2016-06-01 日本電気株式会社 劣化復元システム、劣化復元方法およびプログラム
US10742988B2 (en) * 2015-02-12 2020-08-11 Lg Electronics Inc. Method and apparatus for processing video signal using graph-based transform
CN107548292B (zh) 2015-05-20 2019-12-27 索尼奥林巴斯医疗解决方案公司 信号处理装置和医疗观察系统
CN116132697A (zh) * 2023-01-06 2023-05-16 百果园技术(新加坡)有限公司 一种图像块效应检测方法、系统、设备及存储介质

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001285876A (ja) * 2000-03-30 2001-10-12 Sony Corp 画像符号化装置とその方法、ビデオカメラ、画像記録装置、画像伝送装置
JP4165220B2 (ja) * 2000-07-06 2008-10-15 セイコーエプソン株式会社 画像処理方法、プログラムおよび画像処理装置
JP2002232889A (ja) * 2001-01-31 2002-08-16 Sony Corp ブロック歪低減回路、再生装置、受信装置、ブロック歪低減方法
JP2002314431A (ja) * 2001-04-09 2002-10-25 Iwaki Akiyama 画像の符号化及び復号化方式
JP4035717B2 (ja) * 2002-08-23 2008-01-23 富士ゼロックス株式会社 画像処理装置及び画像処理方法
JP4047879B2 (ja) * 2005-08-23 2008-02-13 松下電器産業株式会社 動きベクトル検出装置および動きベクトル検出方法
JP4455487B2 (ja) 2005-12-16 2010-04-21 株式会社東芝 復号化装置及び復号化方法及びプログラム
JP4649355B2 (ja) * 2006-03-27 2011-03-09 富士通株式会社 ブロックノイズ検出方法及び装置並びにブロックノイズ低減方法及び装置
JP2008124742A (ja) * 2006-11-10 2008-05-29 Sony Corp 画像処理装置、画像処理方法、およびプログラム
JP2008153812A (ja) * 2006-12-15 2008-07-03 Sharp Corp ノイズ除去装置

Also Published As

Publication number Publication date
US8111939B2 (en) 2012-02-07
US20100061652A1 (en) 2010-03-11
JP2010068084A (ja) 2010-03-25

Similar Documents

Publication Publication Date Title
JP4920599B2 (ja) ハイブリッドビデオ圧縮の量子化雑音除去用の非線形ループ内デノイズフィルタ
KR101137753B1 (ko) 고속의 메모리 효율적인 변환 구현 방법
Luo et al. Removing the blocking artifacts of block-based DCT compressed images
US9652830B2 (en) Method and apparatus for performing hierarchical super-resolution of an input image
US6950473B2 (en) Hybrid technique for reducing blocking and ringing artifacts in low-bit-rate coding
JP5007228B2 (ja) 画像クリーンアップおよび前置符号化
Fedorov et al. Variational framework for non-local inpainting
KR20140135968A (ko) 초해상도화를 수행하는 방법 및 장치
KR20130001213A (ko) 입력 이미지로부터 증가된 픽셀 해상도의 출력 이미지를 생성하는 방법 및 시스템
JP2003018398A (ja) ピクセル画像から超解像度画像を生成する方法
US8396313B2 (en) Image compression and decompression using the PIXON method
CN111724307B (zh) 一种基于最大后验概率和非局部低秩先验的图像超分辨重建方法,终端及可读存储介质
JP4945533B2 (ja) 画像処理装置及び画像処理方法
Vishnukumar et al. Single image super-resolution based on compressive sensing and improved TV minimization sparse recovery
Vaksman et al. Patch ordering as a regularization for inverse problems in image processing
JP7202091B2 (ja) 画質評価装置、学習装置及びプログラム
Goto et al. Learning-based super-resolution image reconstruction on multi-core processor
JP2017097397A (ja) 画像処理方法、画像処理装置および画像処理プログラム
JP5198500B2 (ja) 信号処理装置及びプログラム
Zhang et al. Image magnification based on a blockwise adaptive Markov random field model
KR100903817B1 (ko) 새로운 거리 가중치를 이용한 적응적 선형 보간 방법,지역적 패턴을 고려한 적응적 선형 보간 방법, 패턴가중치를 이용한 적응적 선형 보간 방법
Singh et al. A content adaptive method of de-blocking and super-resolution of compressed images
JP5522736B2 (ja) 画像超解像装置およびそのプログラム
WO2004017157A2 (en) Imprroved video compression system
JP7544359B2 (ja) 最適化装置、訓練装置、合成装置、それらの方法、およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110318

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20111125

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20111205

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120207

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120305

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150309

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees