JP3549720B2 - 画像処理装置 - Google Patents
画像処理装置 Download PDFInfo
- Publication number
- JP3549720B2 JP3549720B2 JP01603998A JP1603998A JP3549720B2 JP 3549720 B2 JP3549720 B2 JP 3549720B2 JP 01603998 A JP01603998 A JP 01603998A JP 1603998 A JP1603998 A JP 1603998A JP 3549720 B2 JP3549720 B2 JP 3549720B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- conversion
- filter
- frequency
- feature amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000006243 chemical reaction Methods 0.000 claims description 109
- 239000011159 matrix material Substances 0.000 claims description 34
- 238000013528 artificial neural network Methods 0.000 claims description 15
- 238000000605 extraction Methods 0.000 claims description 15
- 239000000284 extract Substances 0.000 claims description 2
- 238000000034 method Methods 0.000 description 35
- 238000004364 calculation method Methods 0.000 description 23
- 230000006870 function Effects 0.000 description 21
- 230000008569 process Effects 0.000 description 14
- 230000008859 change Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 10
- 230000006978 adaptation Effects 0.000 description 4
- 230000006866 deterioration Effects 0.000 description 4
- 230000007423 decrease Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformation in the plane of the image
- G06T3/40—Scaling the whole image or part thereof
- G06T3/4007—Interpolation-based scaling, e.g. bilinear interpolation
Description
【発明の属する技術分野】
本発明は、多階調画像に対して、高解像度変換や拡大処理などを行う画像処理装置に関するものである。
【0002】
【従来の技術】
例えばスキャナやデジタルカメラなどによって入力された多階調画像に対して、高解像度変換や拡大処理などを行う際には、補間画素の周辺の画素のデータを用いて積和演算を行い、演算結果に基づいて補間画素のデータを決定する。このような補間演算法としては、▲1▼補間画素に最も近い位置にある画素のデータを、該補間画素のデータとして用いる単純補間法(Nearest Neighbor)、▲2▼周辺画素のデータを用いて、平面的な積和演算を行う線型補間法(Bi−Linear )、▲3▼周辺画素のデータを用いて、曲面的な積和演算を行う曲面補間法(Cubic Convolution )などが挙げられる。
【0003】
それぞれの補間演算法には、長所と短所がある。単純補間法においては、処理時間は早いが、斜めのライン等がギザギザの状態(ジャギー)になってしまい、画質としては良くない。線型補間法においては、処理時間は比較的短く、濃度変化の緩やかな部分の補間に対してはうまく補間がなされるが、エッジ部のような、急激に濃度が変化している部分に対しては、エッジがぼけて補間されてしまう。曲面補間法においては、濃度変化が緩やかな部分で若干画質が落ちるが、滑らかな画像が得られ、エッジもぼけずに補間される。しかしながら、処理時間が比較的長くかかり、濃度変化の緩やかな部分に小さな点のようなノイズがある場合、そのノイズを強調してしまい、画質が劣化する。
【0004】
【発明が解決しようとする課題】
上記のような補間演算法をそのまま単独で用いると、例えば文字画像や写真画像が混在した画像に対して、文字部分の解像性と写真領域の滑らかさとを同時に満足した高解像度変換や拡大処理を行うことができない。
【0005】
これに対して、部分領域の濃度変化に基づいてエッジ部と非エッジ部とを判断し、各領域ごとにそれぞれ異なる補間処理を行う方法が提案されている。例えば、特開平5−135165号公報には、ある注目画素とその周辺画素を含めた局所領域において、濃度の最大値と最小値とを求め、その最大値から最小値を引いた最大濃度値を用いて、文字領域か写真領域かを判断する画像処理装置が開示されている。
【0006】
しかしながら、局所領域にノイズが発生していた場合などには、実際には濃度変化が少ないはずの領域であるにも関わらず、最大濃度差として大きな値が得られ、間違った判断をすることが考えられる。また、このような、濃度変化を用いるエッジの抽出方法では、抽出の仕方によっては、エッジの方向の変化に伴って局所領域内の濃度変化のパターンが変化してしまう。よって、画像を回転させた場合などには、異なる抽出条件が必要となり、条件式が複雑化し、処理時間が長くなるなどの問題が生じる。
【0007】
本発明の目的は、文字画像と写真画像とが混在した画像に対しても、文字領域の解像性と写真領域の滑らかさとを同時に満足した高解像度変換や拡大処理を行うことができる画像処理装置を提供することにある。
【0008】
【課題を解決するための手段】
上記の課題を解決するために、本発明の第1画像処理装置は、処理対象の多階調画像を部分画像に分割し、各部分画像に対して高解像度変換や拡大処理を行う画像処理装置であって、上記部分画像に対して周波数変換処理を行う周波数変換手段と、上記周波数変換手段の出力に基づいて、上記部分画像の特徴量を抽出する特徴量抽出手段と、上記特徴量抽出手段の出力に基づいて、上記部分画像に対して高解像度変換や拡大処理を行うための変換フィルタを選択する変換フィルタ選択手段とを備えていることを特徴としている。
【0009】
上記の構成によれば、周波数変換手段が上記部分画像に対して周波数変換処理を行い、特徴量抽出手段が上記部分画像の特徴量を抽出し、変換フィルタ選択手段が、上記特徴量抽出手段の出力に基づいて上記変換フィルタを選択するので、各部分画像の特徴に適した補間を行うことができる。詳しく説明すると、周波数変換処理の結果に基づいて各部分画像の特徴を判断するので、部分画像内にノイズが生じている場合でも、そのノイズにほとんど影響されずに、該部分画像に最適な変換フィルタを選択することができる。よって、例えば文字画像のようなエッジ画像に対しては、そのエッジが保存されるような補間をし、例えば写真画像のような濃度変化が滑らかな画像に対しては、その滑らかさが維持されるような補間をすることができる。これにより、画質劣化の少ない高解像度変換画像を得ることができる。
【0010】
本発明の第2画像処理装置は、第1画像処理装置の構成において、上記変換フィルタ選択手段は、上記特徴量を入力とし、上記部分画像に対する各変換フィルタの適合度を出力する階層型ニューラルネットワークを備え、上記適合度に基づいて変換フィルタを選択することを特徴としている。
【0011】
上記特徴量から上記部分画像に対する各変換フィルタの適合度を算出する際に、例えば論理演算のような形式で演算を行う場合、上記特徴量の数が多くなると膨大な計算量となり、処理時間が長くなってしまう。しかしながら、上記の構成によれば、予め学習させてある階層型ニューラルネットワークによって各変換フィルタの適合度を算出するので、上記特徴量の数が多少多くなっても、短い処理時間で演算を行うことができる。よって、特徴量をある程度多くすることができるので、より的確に、各部分画像に適した変換フィルタを選択することができる。
【0012】
本発明の第3画像処理装置は、第1画像処理装置の構成において、上記特徴量抽出手段は、上記周波数変換手段によって得られた、部分画像と同サイズの周波数変換係数からなるマトリクスを、複数のパターンで複数の領域に分割し、各領域毎に周波数変換係数の平均値を上記特徴量として算出することを特徴としている。
【0013】
上記の構成によれば、特徴量抽出手段は、上記の周波数変換係数からなるマトリクスを複数のパターンで複数の領域に分割し、各領域毎に周波数変換係数の平均値を上記特徴量として算出するので、部分画像内にエッジがある場合、エッジが向いている方向によらず、各部分画像の特徴を的確に示す特徴量を算出することができる。
【0014】
本発明の第4画像処理装置は、第3画像処理装置の構成において、上記特徴量抽出手段は、上記周波数変換係数の絶対値の平均値を上記特徴量として算出することを特徴としている。
【0015】
周波数変換係数は、一般に正負の値をとるので、上記の各領域毎の周波数変換係数の平均値をとる際に、そのままの値で総和を計算すると、正負の値同士で打ち消し合ってしまい、特徴が現れなくなってしまう。しかしながら、上記の構成によれば、上記特徴量として、周波数変換係数の絶対値の平均値を用いるので、上記の各領域の特徴を確実に反映することができる。よって、各部分画像の特徴を的確に示す特徴量を算出することができる。
【0016】
本発明の第5画像処理装置は、第3画像処理装置の構成において、上記特徴量抽出手段は、上記の周波数変換係数からなるマトリクスの交流成分を複数の領域に分割するパターンとして、低周波成分から高周波成分までの複数の領域に分割するパターンと、マトリクスの左上を中心として放射状に一定の角度で複数の領域に分割するパターンとを用いることを特徴としている。
【0017】
上記の構成によれば、低周波成分から高周波成分までの複数の領域に分割するパターンと、マトリクスの左上を中心として放射状に一定の角度で複数の領域に分割するパターンとによって、上記の周波数変換係数からなるマトリクスの交流成分を複数の領域に分割するので、部分画像内にエッジがある場合、そのエッジの方向が、縦か横かそれ以外かを判断することができる。よって、より的確に、各部分画像の特徴を示す特徴量を算出することができる。
【0018】
本発明の第6画像処理装置は、第1画像処理装置の構成において、上記周波数変換手段は、4×4のマトリクスサイズの離散コサイン変換によって周波数変換を行うことを特徴としている。
【0019】
上記の構成によれば、4×4のマトリクスサイズの離散コサイン変換によって周波数変換を行っているので、通常良く用いられる8×8のマトリクスサイズの離散コサイン変換に比べて、実際に装置として設計した場合、回路の規模を小さくすることができ、また、処理量も減少する。よって、装置の小型化およびコストの低減化が可能となり、かつ、演算時間を短縮することができる。
【0020】
本発明の第7画像処理装置は、第2画像処理装置の構成において、上記変換フィルタとして、シグモイド関数を用いたフィルタを用いる場合、該シグモイド関数は、xを補間画素の位置座標とすると、1/(1+exp(-Wg(x-0.5)))の式で表され、上記変換フィルタ選択手段においてシグモイド関数を用いたフィルタが選択された場合に、その適合度の大きさに比例して上式のWgの値が大きくなるように設定されていることを特徴としている。
【0021】
上記の構成によれば、上記変換フィルタ選択手段においてシグモイド関数を用いたフィルタが選択された場合に、その適合度の大きさに比例して上式のWgの値が大きくなるように設定されているので、適合度に応じて、その適合度に最適な補間処理を行うことができる。例えば、適合度が大きい場合には、シグモイド関数のしきい値付近の傾きが大きくなり、エッジが保存されるような補間処理がなされ、適合度が小さい場合には、シグモイド関数のしきい値付近の傾きが小さくなり、滑らかな補間処理がなされることになる。よって、部分画像の特徴に応じて、より詳細に補間処理の制御を行うことが可能となり、画質劣化の少ない、自然な高解像度変換画像を得ることができる。
【0022】
【発明の実施の形態】
本発明の実施の一形態について図1ないし図9に基づいて説明すれば、以下のとおりである。
【0023】
図1は、本実施の形態に係る画像処理装置の概略構成を示すブロック図である。該画像処理装置は、部分画像抽出手段1、周波数変換手段2、係数演算手段(特徴量抽出手段)3、変換フィルタ選択手段4、および補間処理手段5を備えている。
【0024】
部分画像抽出手段1は、イメージスキャナやデジタルカメラ等の画像入力装置から入力された原画像のデータ、もしくは、既に入力され、ハードディスクやメモリなどの記憶装置に記憶されている多階調の原画像データから、処理対象となる部分画像のデータをメモリに読み出してくる。
【0025】
周波数変換手段2は、部分画像抽出手段1によって抽出された部分画像に対して、該部分画像と同サイズの、DCT(Discrete Cosine Transform )等の周波数変換マトリクスを用いて周波数変換処理を行う。そして、抽出された部分画像の周波数領域に変換された値を、周波数変換マトリクスの係数としてメモリ等に一時保存しておく。
【0026】
係数演算手段3は、次に示すような動作を行う。周波数変換手段2によって得られた、周波数変換係数からなるマトリクスを、例えば、低周波から高周波までの3つの領域、およびマトリクスの左上を中心としてマトリクス左側から上側まで放射状に、30度ずつ3つの領域に分割する。そしてこれらの6つの領域毎に係数の絶対値の平均値を求め、各領域の平均係数値として一時保存しておく。
【0027】
変換フィルタ選択手段4は、次に示すような動作を行う。係数演算手段3によって計算された6つの領域の平均係数値を、階層型のニューラルネットワークに入力する。上記階層型ニューラルネットワークとしては、予め実験データの学習によって最適な補間演算法を用いたフィルタを選択することができる、6入力3出力の3層パーセプトロンを用いる。階層型ニューラルネットワークは、6つの入力データに基づいて画像の特徴を判断し、3つのフィルタに対する適合度を出力する。これらの適合度の中で最大の適合度をもつフィルタが、部分画像に対応するフィルタとして選択される。上記の3つのフィルタとして、本実施形態では、曲線補間法を用いたフィルタ、線型補間法を用いたフィルタ、およびシグモイド関数を用いたフィルタを用いる。
【0028】
補間処理手段5は、変換フィルタ選択手段4によって選択されたフィルタを用いて、部分画像に対し、高解像度変換や拡大処理を行うための補間処理を行い、補間データをメモリなどに保存する。
【0029】
次に、本実施形態に係る画像処理装置における処理の流れを、詳細に説明する。ここでは、3種類の特徴的な部分画像の例として、図2(a)ないし(c)に示すような、4×4画素からなり、256階調を有する部分画像に対しての処理について説明する。なお、図2(a)は非エッジ画像、図2(b)は斜めエッジ画像、図2(c)は縦エッジ画像を示している。また、以下の説明においては、2倍の解像度変換を行う補間処理について説明する。
【0030】
部分画像抽出手段1は、予め入力された原画像から、図2(a)ないし(c)に示すような4×4画素分の画像データを読み出してくる。そして、そのデータをバッファに一次保存すると同時に、周波数変換手段2にそのデータを送る。
【0031】
そして、一連の流れが終了し、バッファに一次保存している画像データを変換し終えたら、横方向に、次の4×4画素の画像データを読み出しに行く。この際に、図3に示すように、現在の4×4画素の右端一列分の画素が、次の4×4画素の左端一列分の画素となるように読み出してくる。また、横方向への4×4画素の読み出しが一番右端の画素の列まで来たときには、下の行の一番左端から読み出すことになるが、この際にも、直上の4×4画素の下端一行分の画素が、直下の4×4画素の上端一行分の画素となるように読み出してくる。これにより、ブロック歪みが解消される。
【0032】
周波数変換手段2は、部分画像抽出手段から送られてきた画像データを、基底の長さが4のDCTで周波数変換を行う。
【0033】
ここで、DCTについて簡単に説明する。DCTとは、離散コサイン変換の略であり、画像処理で使用される2次元DCTを式で表すと次のようになる。
【0034】
【数1】
【0035】
ただし、
ここで、x(m,n)は画像データ、 auv(m,n) は2次元DCTの基底、N は基底の長さ、X(u,v)はDCT係数である。また、C(u),C(v) は定数であり、次に示す値となっている。
【0036】
C(p)=1/ √2 (p=0), C(p)=1 (p≠0)
さらに、X(u,v)においては、X(0,0)をDC係数、残りのX(u,v)をAC係数という。
【0037】
本実施形態で用いる2次元DCTは、基底が4(N=22 )のマトリクスサイズであるので、高速演算アルゴリズムが適用可能である。具体的な式は次のようになる。
【0038】
【数2】
【0039】
また、高速演算のために、上記cos() の値を予め求めておき、図4に示すようなマトリクスとしてメモリなどに用意しておく。なお、図4のマトリクス上の数値は、高速演算処理を行うために、本来は浮動小数値で表される値を12ビット左へシフト演算し、固定小数値で表したものである。
【0040】
そして、この高速演算アルゴリズムを用い、各部分画像の画像データを図5(a)ないし(c)に示すように周波数変換し、周波数変換係数からなるマトリクスとしてバッファに一次保存しておく。なお、図5(a)は非エッジ画像、図5(b)は斜めエッジ画像、図5(c)は縦エッジ画像に対応している。
【0041】
以上のように、本実施形態で用いる2次元DCTは、4×4のマトリクスサイズなので、通常よく用いられる8×8のマトリクスサイズのDCTに比べ、ハードウェア化した際に、回路規模を小さくすることができる。また、処理量も少なくて済むので、演算時間の短縮にもつながる。
【0042】
係数演算手段3は、次に示すような動作を行う。各部分画像に対応する、上記の周波数変換係数からなるマトリクスを、図6(a)および(b)に示すように、低周波から高周波までの3つの領域、およびマトリクスの左上を中心としてマトリクス左側から上側まで放射状に、30度ずつ3つの領域に分割する。そして、これらの6つの領域毎に係数の絶対値の総和を求め、それをそれぞれの領域毎の係数の数で割ることにより、各領域の係数の平均値を求める。具体的な式は次のようになる。
【0043】
f1= {|X(1,0)|+|X(0,1)|+|X(1,1)|}/3
f2= {|X(2,0)|+|X(2,1)|+|X(0,2)|+|X(1,2)|+|X(2,2)|}/5
f3= {|X(3,0)|+|X(3,1)|+|X(3,2)|
+|X(0,3)|+|X(1,3)|+|X(2,3)|+|X(3,3)|}/7
f4= {|X(0,1)|+|X(0,2)|+|X(1,2)|+|X(0,3)|+|X(1,3)|}/5
f5= {|X(1,1)|+|X(2,2)|+|X(3,2)|+|X(2,3)|+|X(3,3)|}/5
f6= {|X(1,0)|+|X(2,0)|+|X(3,0)|+|X(2,1)|+|X(3,1)|}/5
以上のように、各領域の係数を絶対値に変換して、各領域の係数の平均値を求めている。これにより、各領域の係数が正負の値をとる場合、各領域の係数の総和をとる際に、それぞれの係数同士で打ち消し合い、その係数の特徴が現れなくなるという問題を回避することができる。また、上記のような2つのパターンによって周波数変換係数からなるマトリクスを3つの領域に分割することにより、部分画像内にエッジがある場合、そのエッジの向きが縦か横かそれ以外かを検出することができる。なお、上記の非エッジ画像、斜めエッジ画像、および縦エッジ画像に対応する部分画像における上記のf1〜f6の値を、図5(a)ないし(c)の周波数変換係数からなるマトリクスの下部に示しておく。
【0044】
以上のようにして求められた各平均係数値データを、変換フィルタ選択手段4に送る。
【0045】
変換フィルタ選択手段4では、係数演算手段3から送られてきた6つの各平均係数値データを、図7に示すような、6入力3出力の階層型ニューラルネットワークに入力する。この階層型ニューラルネットワークは、予め実験によりエッジ部分や非エッジ部分でそれぞれ最適なフィルタが選択されるように学習されている。6つの入力ユニットに各平均係数値データを入力すると、9つの中間層ユニットを介して、各ユニット間の相互作用によって、該平均係数値データを有する部分画像に対する各フィルタの適合度が出力される。各ユニットにおける演算の具体的な式は次のようになる。
【0046】
【数3】
【0047】
ここで、f(X)はシグモイド関数であり、f(X)=1/(1+exp(−X))で表される関数である。また、x は入力層に入力される入力値、H は中間層の各ユニットの出力値、O は出力層の各ユニットの出力値である。w およびv はそれぞれ入力層から中間層、および中間層から出力層への結合の重みの値、θおよびγはそれぞれ中間層および出力層におけるオフセット値である。
【0048】
この階層型ニューラルネットワークの出力結果を基に、第1番目の出力ユニットからの出力値が一番大きいときには線型補間法を用いたフィルタを選択し、第2番目の出力ユニットからの出力値が一番大きいときには曲線補間法を用いたフィルタを選択し、第3番目の出力ユニットからの出力値が一番大きいときにはシグモイド関数を用いたフィルタを選択する。そして、その結果を次の補間処理手段5に送る。
【0049】
以上のように、上記の6つの各平均係数値データから、各フィルタの適合度を算出する手段として、上記のような階層型ニューラルネットワークを用いているので、例えば論理演算などによって適合度を算出する場合に比べて、処理時間を短くすることができる。また、本実施形態では、階層型ニューラルネットワークにおける入力が6、出力が3であったが、この入力および出力の数が多くなる場合には、上記のような階層型ニューラルネットワークの優位性が大きくなる。
【0050】
補間処理手段5では、変換フィルタ選択手段4によって選択されたフィルタを用いて、部分画像抽出手段1によって抽出され、バッファに一次保存されている部分画像データから、2倍の解像度変換を行うための補間処理を行う。
【0051】
変換フィルタ選択手段4が線型補間法を用いたフィルタを選択した場合には、補間処理手段5は線型補間法による補間処理を行う。具体的な演算は次に示す式によって行われる。
【0052】
p(u,v)= {(i+1)−u }{(j+1)−v } Pij
+{(i+1)−u }(v−j)Pij+1
+ (u−i){(j+1)−v } Pi+1j
+ (u−i)(v−j)Pi+1j+1
i=[u ], j=[v ]([]はガウス記号:整数部分だけをとる)
ここで、u,v は補間画素の座標値、 Pは原画素の画素値を表している。上記の演算における原画素と補間画素との位置関係を、図8(a)に示す。上記のような式を用いて2倍の解像度変換を行う場合には、補間画素p(u,v)は、p(i+0.5,j)、p(i,j+0.5)、p(i+0.5,j+0.5)となる。
【0053】
以上のような計算により、図2(a)に示すような非エッジ画像は、図9(a)に示すような、2倍の解像度変換が施された画像となる。
【0054】
また、変換フィルタ選択手段4が曲線補間法を用いたフィルタを選択した場合には、補間処理手段5は曲線補間法による補間処理を行う。具体的な演算は次に示す式によって行われる。
【0055】
【数4】
【0056】
上記の演算における原画素と補間画素との位置関係を、図8(b)に示す。線型補間法と同様に、上記のような式を用いて2倍の解像度変換を行う場合には、補間画素p(u,v)は、p(i+0.5,j)、p(i,j+0.5)、p(i+0.5,j+0.5)となる。
【0057】
以上のような計算により、図2(b)に示すような斜めエッジ画像は、図9(b)に示すような、2倍の解像度変換が施された画像となる。
【0058】
さらに、変換フィルタ選択手段4がシグモイド関数を用いたフィルタを選択した場合には、補間処理手段5はシグモイド関数を用いたフィルタによる補間処理を行う。具体的な演算は次に示す式によって行われる。
【0059】
t1=1/(1+exp( −25・O3((i+1)−u−0.5)))
t2=1/(1+exp( −25・O3((j+1)−v−0.5)))
t3=1/(1+exp( −25・O3(u−i−0.5)))
t4=1/(1+exp( −25・O3(v−j−0.5)))
p(u,v)= t1・t2・ Pij
+ t1・t4・ Pij+1
+ t3・t2・ Pi+1j
+ t3・t4・ Pi+1j+1
i=[u ], j=[v ] ([]はガウス記号:整数部分だけをとる)
線型補間法と同様に、u,v は補間画素の座標値、 Pは原画素の画素値を表している。上記の演算における原画素と補間画素との位置関係を、図8(a)に示す。上記のような式を用いて2倍の解像度変換を行う場合には、補間画素p(u,v)は、p(i+0.5,j)、p(i,j+0.5)、p(i+0.5,j+0.5)となる。
【0060】
以上のような計算により、図2(c)に示すような縦エッジ画像は、図9(c)に示すような、2倍の解像度変換が施された画像となる。
【0061】
なお、上式において、O3は上記階層型ニューラルネットワークにおける第3番目の出力ユニットの出力値である。すなわち、O3はシグモイド関数を用いたフィルタに対する適合度を表している。これにより、シグモイド関数を用いたフィルタに対する適合度の大きさに応じて、シグモイド関数のしきい値付近の傾きを変化させることができる。適合度が大きい場合には、シグモイド関数のしきい値付近の傾きが大きくなり、部分画像にエッジ部分がある場合、そのエッジが保存されるような補間処理がなされる。一方、適合度が小さい場合には、シグモイド関数のしきい値付近の傾きが小さくなり、より滑らかな補間処理がなされる。したがって、部分画像の特徴によく適応した補間処理を行うことができる。
【0062】
以上のように補間処理された画像データは、メモリ等に保存され、高解像度変換画像、あるいは拡大画像として適宜用いられる。
【0063】
なお、上記の例では、周波数変換にDCTを用いたが、特にこれに限定するものではなく、例えばフーリエ変換やウェーブレット変換などを用いても構わない。また、上記の例では、DCTの基底サイズとして4×4のものを用いたが、特にこれに限定するものではなく、例えば8×8などのサイズでも処理を行うことは可能である。さらに、上記の例では、フィルタとして、線型補間法、曲線補間法、およびシグモイド関数を用いたものを使用したが、特にこれに限定するものではなく、滑らかな補間が可能なフィルタ、およびエッジ部分を保存もしくは強調できるフィルタであれば、他のフィルタでも構わない。
【0064】
以上のような構成により、本実施形態に係る画像処理装置は、文字画像などのエッジ部分を多く含む画像と、写真画像などの非エッジ部分を多く含む画像とが混在した多階調画像に対して、エッジ部分はエッジを保存し、非エッジ部分である滑らかな部分はその滑らかさを維持しながら補間を行うので、画質劣化の少ない高解像度変換画像を提供することができる。
【0065】
【発明の効果】
以上のように、本発明の第1画像処理装置は、処理対象の多階調画像を部分画像に分割し、各部分画像に対して高解像度変換や拡大処理を行う画像処理装置であって、上記部分画像に対して周波数変換処理を行う周波数変換手段と、上記周波数変換手段の出力に基づいて、上記部分画像の特徴量を抽出する特徴量抽出手段と、上記特徴量抽出手段の出力に基づいて、上記部分画像に対して高解像度変換や拡大処理を行うための変換フィルタを選択する変換フィルタ選択手段とを備えている構成である。
【0066】
これにより、各部分画像の特徴に適した補間を行うことができ、画質劣化の少ない高解像度変換画像を得ることができるという効果を奏する。
【0067】
本発明の第2画像処理装置は、第1画像処理装置の構成による効果に加えて、上記変換フィルタ選択手段は、上記特徴量を入力とし、上記部分画像に対する各変換フィルタの適合度を出力する階層型ニューラルネットワークを備え、上記適合度に基づいて変換フィルタを選択する構成である。
【0068】
これにより、上記特徴量の数が多少多くなっても、短い処理時間で演算を行うことができる。よって、特徴量をある程度多くすることができるので、より的確に、各部分画像に適した変換フィルタを選択することができるという効果を奏する。
【0069】
本発明の第3画像処理装置は、第1画像処理装置の構成による効果に加えて、上記特徴量抽出手段は、上記周波数変換手段によって得られた、部分画像と同サイズの周波数変換係数からなるマトリクスを、複数のパターンで複数の領域に分割し、各領域毎に周波数変換係数の平均値を上記特徴量として算出する構成である。
【0070】
これにより、部分画像内にエッジがある場合、エッジが向いている方向によらず、各部分画像の特徴を的確に示す特徴量を算出することができるという効果を奏する。
【0071】
本発明の第4画像処理装置は、第3画像処理装置の構成による効果に加えて、上記特徴量抽出手段は、上記周波数変換係数の絶対値の平均値を上記特徴量として算出する構成である。
【0072】
これにより、上記特徴量として、周波数変換係数の絶対値の平均値を用いるので、上記の各領域の特徴を確実に反映することができ、各部分画像の特徴を的確に示す特徴量を算出することができるという効果を奏する。
【0073】
本発明の第5画像処理装置は、第3画像処理装置の構成による効果に加えて、上記特徴量抽出手段は、上記の周波数変換係数からなるマトリクスの交流成分を複数の領域に分割するパターンとして、低周波成分から高周波成分までの複数の領域に分割するパターンと、マトリクスの左上を中心として放射状に一定の角度で複数の領域に分割するパターンとを用いる構成である。
【0074】
これにより、部分画像内にエッジがある場合、そのエッジの方向が、縦か横かそれ以外かを判断することができ、より的確に、各部分画像の特徴を示す特徴量を算出することができるという効果を奏する。
【0075】
本発明の第6画像処理装置は、第1画像処理装置の構成による効果に加えて、上記周波数変換手段は、4×4のマトリクスサイズの離散コサイン変換によって周波数変換を行う構成である。
【0076】
これにより、実際に装置として設計した場合、回路の規模を小さくすることができ、また、処理量も減少する。よって、装置の小型化およびコストの低減化が可能となり、かつ、演算時間を短縮することができるという効果を奏する。
【0077】
本発明の第7画像処理装置は、第2画像処理装置の構成による効果に加えて、上記変換フィルタとして、シグモイド関数を用いたフィルタを用いる場合、該シグモイド関数は、xを補間画素の位置座標とすると、1/(1+exp(-Wg(x-0.5)))の式で表され、上記変換フィルタ選択手段においてシグモイド関数を用いたフィルタが選択された場合に、その適合度の大きさに比例して上式のWgの値が大きくなるように設定されている構成である。
【0078】
これにより、適合度に応じて、その適合度に最適な補間処理を行うことができる。よって、部分画像の特徴に応じて、より詳細に補間処理の制御を行うことが可能となり、画質劣化の少ない、自然な高解像度変換画像を得ることができるという効果を奏する。
【図面の簡単な説明】
【図1】本発明の実施の一形態に係る画像処理装置の概略構成を示すブロック図である。
【図2】同図(a)ないし(c)は、4×4画素からなる3種類の部分画像の例を示す説明図である。
【図3】4×4画素の部分画像を順に読み出す方法を示す説明図である。
【図4】周波数変換演算に用いる、基底の長さが4の場合のcos() の演算結果のマトリクスを示す説明図である。
【図5】同図(a)ないし(c)は、3種類の部分画像に対する周波数変換係数のマトリクス、および各領域毎の平均係数値を示す説明図である。
【図6】同図(a)および(b)は、周波数変換係数のマトリクスを3つの領域に分割する様子を示す説明図である。
【図7】本実施形態で用いられる階層型ニューラルネットワークの構成を示す模式図である。
【図8】同図(a)ないし(b)は、元になる部分画像の画素の位置と、補間画素の位置との関係を示す説明図である。
【図9】同図(a)ないし(c)は、3種類の部分画像を補間処理した結果を示す説明図である。
【符号の説明】
1 部分画像抽出手段
2 周波数変換手段
3 係数演算手段(特徴量抽出手段)
4 変換フィルタ選択手段
5 補間処理手段
Claims (5)
- 処理対象の多階調画像を部分画像に分割し、各部分画像に対して高解像度変換や拡大処理を行う画像処理装置であって、
上記部分画像に対して周波数変換処理を行う周波数変換手段と、
上記周波数変換手段の出力に基づいて、上記部分画像の特徴量を抽出する特徴量抽出手段と、
上記特徴量抽出手段の出力に基づいて、上記部分画像に対して高解像度変換や拡大処理を行うための変換フィルタを選択する変換フィルタ選択手段とを備えており、
上記特徴量抽出手段は、上記周波数変換手段によって得られた、部分画像と同サイズの周波数変換係数からなるマトリクスを、複数のパターンで複数の領域に分割し、各領域毎に周波数変換係数の平均値を上記特徴量として算出するようになっており、
さらに、この特徴量抽出手段は、上記の周波数変換係数からなるマトリクスの交流成分を複数の領域に分割するパターンとして、低周波成分から高周波成分までの複数の領域に分割するパターンと、マトリクスの左上を中心として放射状に一定の角度で複数の領域に分割するパターンとを用いることを特徴とする画像処理装置。 - 上記変換フィルタ選択手段は、上記特徴量を入力とし、上記部分画像に対する各変換フィルタの適合度を出力する階層型ニューラルネットワークを備え、上記適合度に基づいて変換フィルタを選択することを特徴とする請求項1記載の画像処理装置。
- 上記特徴量抽出手段は、上記周波数変換係数の絶対値の平均値を上記特徴量として算出することを特徴とする請求項1記載の画像処理装置。
- 上記周波数変換手段は、4×4のマトリクスサイズの離散コサイン変換によって周波数変換を行うことを特徴とする請求項1記載の画像処理装置。
- 上記変換フィルタとして、シグモイド関数を用いたフィルタを用いる場合、該シグモイド関数は、xを補間画素の位置座標とすると、 1/(1+exp(-Wg(x-0.5))) の式で表され、上記変換フィルタ選択手段においてシグモイド関数を用いたフィルタが選択された場合に、その適合度の大きさに比例して上式の Wg の値が大きくなるように設定されていることを特徴とする請求項2記載の画像処理装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP01603998A JP3549720B2 (ja) | 1998-01-28 | 1998-01-28 | 画像処理装置 |
US09/238,847 US6272261B1 (en) | 1998-01-28 | 1999-01-28 | Image processing device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP01603998A JP3549720B2 (ja) | 1998-01-28 | 1998-01-28 | 画像処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11213146A JPH11213146A (ja) | 1999-08-06 |
JP3549720B2 true JP3549720B2 (ja) | 2004-08-04 |
Family
ID=11905451
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP01603998A Expired - Fee Related JP3549720B2 (ja) | 1998-01-28 | 1998-01-28 | 画像処理装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US6272261B1 (ja) |
JP (1) | JP3549720B2 (ja) |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9925902D0 (en) * | 1999-11-03 | 1999-12-29 | Vlsi Vision Ltd | Colour image restoration with anti-alias |
US6369787B1 (en) * | 2000-01-27 | 2002-04-09 | Myson Technology, Inc. | Method and apparatus for interpolating a digital image |
KR100658660B1 (ko) * | 2000-08-23 | 2006-12-15 | 삼성전자주식회사 | 큐빅 컨벌루션 보간계수 생성방법 |
US7254304B2 (en) * | 2000-10-06 | 2007-08-07 | Jonathan Westphal | Devices and techniques for logical processing |
US7474337B1 (en) * | 2000-10-24 | 2009-01-06 | Sony Corporation | Method and apparatus to provide edge enhancements as part of a demosaicing process |
US20040190786A1 (en) * | 2003-03-24 | 2004-09-30 | Khageshwar Thakur | Method of image enhancement for an imaging apparatus |
US20050129306A1 (en) * | 2003-12-12 | 2005-06-16 | Xianglin Wang | Method and apparatus for image deinterlacing using neural networks |
US7272261B2 (en) * | 2004-06-04 | 2007-09-18 | Xerox Corporation | Method and system for classifying scanned-media |
KR100636152B1 (ko) * | 2004-07-09 | 2006-10-19 | 삼성전자주식회사 | 여백없는 이미지 인쇄 방법 및 장치 |
US20060007462A1 (en) * | 2004-07-09 | 2006-01-12 | Samsung Electronics Co., Ltd. | Method and apparatus for printing borderless image |
US7500183B2 (en) * | 2004-12-22 | 2009-03-03 | The Go Daddy Group, Inc. | Target web page edited using overlay on host web page |
US7500182B2 (en) * | 2004-12-22 | 2009-03-03 | Go Daddy Group, Inc. | Host web page displaying target web page image |
US8115977B2 (en) * | 2005-09-08 | 2012-02-14 | Go Daddy Operating Company, LLC | Document color and shades of gray optimization using monochrome patterns |
US7502135B2 (en) * | 2005-09-08 | 2009-03-10 | The Go Daddy Group, Inc. | Document color and shades of gray optimization using dithered monochrome surfaces |
US8179565B2 (en) * | 2005-09-08 | 2012-05-15 | Go Daddy Operating Company, LLC | Document color and shades of gray optimization using outlining |
US7777917B2 (en) * | 2005-09-08 | 2010-08-17 | The Go Daddy Group, Inc. | Document color and shades of gray optimization using solid monochrome colors |
US9495072B2 (en) * | 2006-02-02 | 2016-11-15 | At&T Intellectual Property I, L.P. | System and method for sharing content with a remote device |
US7778486B2 (en) * | 2006-02-24 | 2010-08-17 | The Go Daddy Group, Inc. | Online image processing systems and methods |
US9215417B2 (en) * | 2008-02-05 | 2015-12-15 | At&T Intellectual Property I, Lp | Managing media content for a personal television channel |
JP5212046B2 (ja) * | 2008-11-25 | 2013-06-19 | 株式会社ニコン | デジタルカメラおよび画像処理装置並びに画像処理プログラム |
JP5507962B2 (ja) | 2009-11-05 | 2014-05-28 | キヤノン株式会社 | 情報処理装置及びその制御方法、プログラム |
US9015093B1 (en) | 2010-10-26 | 2015-04-21 | Michael Lamport Commons | Intelligent control with hierarchical stacked neural networks |
US8775341B1 (en) | 2010-10-26 | 2014-07-08 | Michael Lamport Commons | Intelligent control with hierarchical stacked neural networks |
JP6110592B2 (ja) * | 2011-05-11 | 2017-04-05 | アイキューブド研究所株式会社 | 画像処理装置、画像処理方法、およびプログラム |
EP3204871A4 (en) * | 2014-10-09 | 2017-08-16 | Microsoft Technology Licensing, LLC | Generic object detection in images |
US10366302B2 (en) * | 2016-10-10 | 2019-07-30 | Gyrfalcon Technology Inc. | Hierarchical category classification scheme using multiple sets of fully-connected networks with a CNN based integrated circuit as feature extractor |
JP6840506B2 (ja) * | 2016-10-20 | 2021-03-10 | キヤノン株式会社 | 画像処理装置、画像処理方法、プログラム |
JP7115891B2 (ja) * | 2018-04-06 | 2022-08-09 | 富士フイルム株式会社 | 画像診断支援装置、方法およびプログラム |
EP3993414A1 (en) * | 2020-11-03 | 2022-05-04 | Ateme | Method for image processing and apparatus for implementing the same |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5309526A (en) * | 1989-05-04 | 1994-05-03 | At&T Bell Laboratories | Image processing system |
JPH05135165A (ja) | 1991-11-13 | 1993-06-01 | Toshiba Corp | 画像処理装置 |
JPH05344340A (ja) * | 1992-04-09 | 1993-12-24 | Matsushita Electric Ind Co Ltd | 階調変換処理方法および装置 |
US5381183A (en) * | 1992-07-03 | 1995-01-10 | Mitsubishi Denki Kabushiki Kaisha | Motion-adaptive scanning-line conversion circuit |
JPH0750752A (ja) * | 1993-08-06 | 1995-02-21 | Fuji Xerox Co Ltd | 画像密度変換方法及び装置 |
JP3373008B2 (ja) * | 1993-10-20 | 2003-02-04 | オリンパス光学工業株式会社 | 画像像域分離装置 |
JP3489796B2 (ja) * | 1994-01-14 | 2004-01-26 | 株式会社リコー | 画像信号処理装置 |
WO1996034344A1 (en) * | 1995-04-27 | 1996-10-31 | Northrop Grumman Corporation | Adaptive filtering neural network classifier |
US5933537A (en) * | 1996-07-29 | 1999-08-03 | Polaroid Corporation | Method and apparatus for conversion of frequency-coefficient matrices |
US6075926A (en) * | 1997-04-21 | 2000-06-13 | Hewlett-Packard Company | Computerized method for improving data resolution |
JP3836947B2 (ja) * | 1997-06-20 | 2006-10-25 | パイオニア株式会社 | サンプリングレート変換ユニット、サンプリングレート変換装置及びサンプリングレート変換方法 |
-
1998
- 1998-01-28 JP JP01603998A patent/JP3549720B2/ja not_active Expired - Fee Related
-
1999
- 1999-01-28 US US09/238,847 patent/US6272261B1/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH11213146A (ja) | 1999-08-06 |
US6272261B1 (en) | 2001-08-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3549720B2 (ja) | 画像処理装置 | |
US7149355B2 (en) | Image processing apparatus, image processing method, image processing program, and computer-readable record medium storing image processing program | |
JP3887245B2 (ja) | シグマ・フィルタを使用する階調のデスクリーニング | |
JP3143209B2 (ja) | 画像変倍装置 | |
JP4502303B2 (ja) | 画像処理装置 | |
JP3890175B2 (ja) | 画像処理方法及び装置 | |
US7411699B2 (en) | Method and apparatus to enhance digital image quality | |
JPH11144053A (ja) | 画像データの補間処理方法 | |
JP3738791B2 (ja) | 画像処理方法および装置 | |
JPH06309452A (ja) | 解像度変換処理装置 | |
JP4857975B2 (ja) | 画像処理システムおよび画像処理プログラム | |
RU2411584C2 (ru) | Способ адаптивного сглаживания для подавления растровой структуры изображений | |
KR20070119482A (ko) | 이미지 리샘플링 방법 | |
JP4084719B2 (ja) | 画像処理装置および該画像処理装置を備える画像形成装置、ならびに画像処理方法、画像処理プログラムおよびコンピュータ読み取り可能な記録媒体 | |
JPH07307942A (ja) | 画像雑音除去装置 | |
JP3972625B2 (ja) | 画像処理装置および画像処理方法 | |
JP2006050481A (ja) | 画像処理装置、画像処理方法及びそのプログラム | |
JP4035696B2 (ja) | 線分検出装置及び画像処理装置 | |
JP2004282511A (ja) | 画像処理装置 | |
JP6686122B1 (ja) | 画像処理装置、画像処理方法およびプログラム | |
KR100514734B1 (ko) | 디지털 화질 개선방법 및 장치 | |
JP2007086907A (ja) | 画像処理装置、画像処理方法およびプログラム | |
JP2005316985A (ja) | 画像拡大装置及び画像拡大方法 | |
JP2001043357A (ja) | 画像処理方法、画像処理装置及び記録媒体 | |
JP2004192164A (ja) | 画像処理装置および該画像処理装置を備える画像形成装置、ならびに画像処理方法、画像処理プログラムおよびコンピュータ読み取り可能な記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040204 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040210 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040406 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040420 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040421 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080430 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090430 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090430 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100430 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100430 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110430 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120430 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120430 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130430 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |