JP2010192966A - 画像処理装置及び画像処理プログラム - Google Patents
画像処理装置及び画像処理プログラム Download PDFInfo
- Publication number
- JP2010192966A JP2010192966A JP2009032370A JP2009032370A JP2010192966A JP 2010192966 A JP2010192966 A JP 2010192966A JP 2009032370 A JP2009032370 A JP 2009032370A JP 2009032370 A JP2009032370 A JP 2009032370A JP 2010192966 A JP2010192966 A JP 2010192966A
- Authority
- JP
- Japan
- Prior art keywords
- determination
- block
- attribute
- image
- region
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Image Analysis (AREA)
- Facsimile Image Signal Circuits (AREA)
Abstract
【解決手段】画像処理装置の分割手段は、受け付けた画像を領域に分割し、第1の判断手段は、前記分割手段によって分割された領域がある属性に属するか否かを判断し、第2の判断手段は、前記分割手段によって分割された領域が該属性に属するか否かを、前記第1の判断手段によって行われる判断手法とは異なる判断手法によって判断し、第3の判断手段は、前記第1の判断手段による判断結果と前記第2の判断手段による判断結果に基づいて、前記分割手段によって分割された領域が前記属性に属するか否かを判断する。
【選択図】図1
Description
請求項1の発明は、受け付けた画像を領域に分割する分割手段と、前記分割手段によって分割された領域がある属性に属するか否かを判断する第1の判断手段と、前記分割手段によって分割された領域が該属性に属するか否かを、前記第1の判断手段によって行われる判断手法とは異なる判断手法によって判断する第2の判断手段と、前記第1の判断手段による判断結果と前記第2の判断手段による判断結果に基づいて、前記分割手段によって分割された領域が前記属性に属するか否かを判断する第3の判断手段を具備することを特徴とする画像処理装置である。
一般にカラー画像のデータ量は大きいため、圧縮して蓄積又は伝送等が行われる。画像に歪みを与えない可逆圧縮方式では、高い圧縮率を得ることができないため、一般的な圧縮画像フォーマットとしては、JPEG(Joint Photographic Experts Group)方式(さらに具体的にはJPEGベースライン方式、以下、単純にJPEG方式と称する)が利用されることが多い。JPEG方式は非可逆符号化の一種であるため、圧縮によって、画像に歪みが生じる。そのため、極端に高い圧縮率を得ることは困難である。
これらは、JPEGの画像歪みは、主として、高周波成分電力の大きな画像のエッジ部分に発生する、という現象を避けるため、受け付けた画像を、高周波成分電力の大きな文字/線画部分と、文字/線画部分を除いたバックグラウンド部分に分解して、バックグラウンド部分は、JPEGで高い圧縮率で圧縮し、文字/線画部分は、可逆符号化で圧縮する、という方策を採るものである。
図14の例に示されるように、画像1410を絵柄部分1414と文字/線画部分1412に分ける。さらに最終的な出力画像として、絵柄部分1414を選択するか、文字/線画部分1412を選択するかのセレクタ情報1416を保持する。この3層のデータを用いて画像を表現するものである。以下、絵柄部分をバックグラウンド画像、文字/線画部分をフォアグラウンド画像とする。
図15に示す例での一番下の層であるバックグラウンド画像1510に対しては、JPEG等の多値画像形式で圧縮を行う。その他の層(2値画像1520〜1580)に対しては、2値画像符号化方式で圧縮する。各2値画像符号化層の画像には色情報が付与されているため、復号時にはその色を付与して復号する。
図16(a)の例に示すように、画像1600の絵柄画像1610中に文字が実際に存在している場合は、図16(b)の例に示す画像1650のように、文字として抜き出しても問題はない。
ところが、図17や図18の例に示すように、本来であれば、絵柄中の模様とすべきもの(図17(b)、図18(b)の例に示す模様)までも、文字として抽出してしまうと、画質が劣化する原因となる。なお、図17(a)に示す画像1700の絵柄画像1710は写真画像であって、色の濃い線が混じっているものであり、図18(a)に示す画像1800の絵柄画像1810は人物を撮影した写真画像である。
一般に特許文献1に記載の方式では、フォアグラウンドの圧縮率を高く設定する。また、特許文献2に記載の方式では、文字として抜き出した画像の色を1色で塗りつぶすことになる。そのため、絵柄部の画像が、文字として抜き出されてしまった場合、抜き出さない場合と比較して、画質劣化が発生する。
そのためには、受け付けた画像から絵柄部を正確に抜き出すことができればよい。図16、図17、図18の例に示す画像1600、1700、1800を対象とした場合の望ましい絵柄部抽出例は、図19(b)、図20(b)、図21(b)の例に示す絵柄画像1960、2060、2160の斜線部となる。なお、図19(b)の例に示す絵柄画像1960は、文字部分(「ABC」の部分)以外の部分を絵柄部として抽出したものである。
従来より、複写機、ファクシミリ等の画像処理装置においては、画像中の各領域毎に適した画像処理を施し、画質を向上させている。例えば、受け付けた画像に文字や線画などの文字領域と写真や網点などの絵柄領域が混在していた場合、その画像を再生するときには文字領域と絵柄領域を分離し、文字領域には解像度を重視した処理を実施し、絵柄領域には階調性を重視した処理を施すことが、画像品質の面から望ましい。
具体的には、スキャナ等によって画像を読み取ったり、ファクシミリ等で画像が送信されてきた場合に、文字・線画・写真・網点等が混在した画像を印刷する場合、文字・線画等によって構成されている文字領域に対しては解像度を重視した処理を実施し、写真・網点等によって構成されている絵柄領域に対しては、階調性を重視した処理を施す。これにより、高画質な再生画像となる。
したがって、このような技術に適用する場合にあっても、前述の通り、図16、図17、図18の例に示す画像1600、1700、1800を対象とした場合の望ましい絵柄部抽出例は、図19(b)、図20(b)、図21(b)の例に示す絵柄画像1960、2060、2160の斜線部となる。
本実施の形態による処理例として、ブロック毎の領域判断(領域分割)を行うものとする。
まず、2つのパラメタ(強いパラメタと弱いパラメタ)で、ブロック毎に領域判断を行う。例えば、ここでは、絵柄/文字判断を行うものとする。なお、判断したい属性には、絵柄、写真、網点、文字、等々種々のものがあるが、ここでは、説明を簡単にするため、絵柄と文字の2つとする。
強いパラメタは、高い確度を持って、絵柄であると判断できるものだけを選び出すためのパラメタであるとする。強いパラメタで絵柄と判断した場合は、文字である可能性は低いこととなる。
弱いパラメタは、強いパラメタよりも確度が低いが、ある程度、絵柄であると判断するためのパラメタである。弱いパラメタで絵柄と判断した場合は、文字であっても絵柄と判断されている場合がある。
このような2次元的な広がりを持つ絵柄領域をブロックに分割する場合、絵柄領域ブロックに隣接するブロックは絵柄領域である可能性が高い。逆に、絵柄領域ブロックに隣接しないブロックは、絵柄領域である可能性は比較的低い。
さらに、既に絵柄であると判断されたブロック(以下、絵柄ブロック)に接する弱ブロックも、絵柄であると判断する。絵柄ブロックに接する弱ブロックの絵柄ブロック化は、反復的に行う。すなわち、弱ブロックが絵柄ブロック化された後に、絵柄ブロック化された弱ブロック周囲の弱ブロックも絵柄であると判断する。
このような処理を図11に示す例に対して行うと、図12の例に示す黒部分のように、絵柄部を判断することになる。
前述の説明では、「既に絵柄であると判断されたブロックに接する弱ブロックを、絵柄であると判断する。」としており、この場合は、既に絵柄であると判断されたブロックに接している領域のみを判定するため、高速の判定が可能である。また、その他の処理例として、強ブロック又は弱ブロックに関係なく絵柄として判断されたブロックを連結してブロックの塊とし、その塊の中に強ブロックが存在すれば、その塊全体を絵柄として判断する方法でもよい。
前述の説明では、確度の違いを「強いパラメタ」と「弱いパラメタ」で変化させていたが、パラメタの違いでなくてもよい。「強い判断処理」、「弱い判断処理」など、判断処理そのものが違っていてもよい。また、「広いブロック」、「狭いブロック」のようにブロックサイズが違っていてもよい。この場合は、「広いブロックで絵柄と判断された画素」に連結する「狭いブロックで絵柄と判断された画素」を絵柄と判断すればよい。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、コンピュータ・プログラム、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。
弱−判断モジュール130は、ブロック化モジュール110、結合処理モジュール140と接続されている。ブロック化モジュール110によって分割されたブロックが絵柄の属性に属するか否かを、強−判断モジュール120によって行われる判断手法とは異なる判断手法によって判断する。そして、その判断結果を結合処理モジュール140に渡す。「強−判断モジュール120によって行われる判断手法とは異なる判断手法」とは、強−判断モジュール120によって絵柄の属性に属すると判断したブロック(以下、第1のブロック)のうち、少なくとも1つ以上のブロックが異なるように、弱−判断モジュール130が絵柄の属性に属するブロック(以下、第2のブロック)と判断すればよい。したがって、ブロックによっては、第1のブロックとも判断され、第2のブロックとも判断されているものがある。また、第1のブロック数と第2のブロック数とが同じであっても、異なるブロックがあればよい。
まず、ブロック内の画素値のヒストグラムを取得する。
ヒストグラムの最大値が閾値TH以下であれば、そのブロックは絵柄であると判断する。
絵柄ブロックでは、滑らかに画素値が変動することが多いため、画素値のヒストグラム(画素値毎の出現頻度)は、画素値が異なっても類似した値になる。そのため、ヒストグラムの最大値は小さな値となる。逆に文字ブロックでは、背景画素と文字色画素がほとんどを占める。この場合には、背景画素の出現頻度と文字色画素の出現頻度が大きくなるため、ヒストグラムの最大値が大きくなる。
また、例えば、受け付けた画像がカラー画像である場合には、一旦カラー画像をYCbCrや、Lab等の輝度色差系の色空間に変換してから、Y成分、あるいはL成分等の輝度信号をグレイスケール値と捉えて、グレイスケール値のヒストグラムを取得すればよい。
弱−判断モジュール130では、前述の処理で閾値THとして閾値TWを用いる。閾値TWは、閾値TSと異なる値である。
ここで、強−判断モジュール120は、絵柄であることを高い精度で確信できる判断器であるため、閾値TSは、閾値TWと比べて比較的小さな値とすればよい。
また、弱−判断モジュール130は、絵柄である可能性はあるが、条件次第では文字である可能性もあるブロックを抽出する判断器であるため、閾値TWは、閾値TSと比べて比較的大きな値とすればよい。
また、画像処理装置の小型化及び高速化を図るために、強−判断モジュール120と弱−判断モジュール130において、共通化したモジュール(装置、プログラム(アルゴリズム)等)を用いて、そのモジュールが処理を行う場合に閾値だけを異ならせるようにしてもよい。つまり、強−判断モジュール120と弱−判断モジュール130を一つのモジュールで実現させてもよい。
より具体的な例として、統合判断処理モジュール160は、ラベル付けモジュール150から受け取った処理結果から各ラベル毎に、ラベル内に強−判断モジュール120の出力が1となっているブロックが存在しているか否かを判断する。
ラベル2でも同様の判断処理を行う。ラベル2の画素内に、強−判断モジュール120の出力(図12参照)が1となる画素が存在しているか否かを検査する。ラベルが2の場合には、そのような画素が存在しているため、ラベル2に対応するブロックは絵柄と判断する。
同様な判断処理によって、ラベル3、ラベル4に対応するブロックは絵柄とは判断しない。
<ブロック形状>
ブロック形状は矩形以外であってもよい。また、全てのブロックは同じ形状でなくともよい。矩形以外の形状のブロックを採用した場合、ブロックAとブロックBが接しているという条件は、ブロックA内の1個以上の画素とブロックB内の1個以上の画素が接しているという条件に切り替えて処理すればよい。ラベル付けモジュール150でのラベル付けは、ブロックを1画素と捉えるのではなく、受け付けた画像と同じ解像度で1画素単位にラベル付けを行えばよい。
強−判断モジュール120、弱−判断モジュール130において、カラー画像を一旦グレイスケールに変換してグレイスケールのヒストグラムを取得したが、カラー値そのもののヒストグラムを利用してもよい。
カラー成分がRGBであれば、R、G、Bそれぞれのヒストグラムを取得する。その他の色成分、例えば、YCbCrであれば、Y、Cb、Crそれぞれのヒストグラムを取得する。それぞれのヒストグラムの最大値が全て、閾値以下であれば、絵柄と判定する。閾値は色成分に依存せず同じ値でもよいし、色成分毎に違う値でもよい。
結合処理モジュール140では、強−判断モジュール120の出力と弱−判断モジュール130の出力との論理和を取得していた。しかし、強−判断モジュール120、弱−判断モジュール130の処理内容によっては、強−判断モジュール120で1であれば、論理的に必ず弱−判断モジュール130の出力も1となる場合がある。このような場合は、弱−判断モジュール130の出力をそのまま結合処理モジュール140の出力として用いてもよく、結合処理モジュール140は不要である。
前述の実施の形態で示したヒストグラムの最大値を用いる場合がこれにあたる。この場合は結合処理モジュール140は不要となる。
前述の実施の形態では、強−判断モジュール120と弱−判断モジュール130で別々に処理していたが、必ずしも別々に処理する必要は無い。前述の実施の形態で使用したようなヒストグラムを用いる判断器では、ブロックのヒストグラムは同じものを用いて、閾値だけ変更することによって、強ブロック、弱ブロック、その他に判別するようにしてもよい。
if (H>TW) Y=0
else if (H>TS) Y=1
else Y=2
これは、もしHが閾値TWより大であるならばYを0とし、それ以外の場合は、Hが閾値TSより大であるならばYを1とし、それ以外の場合は、Yを2とするものである。この演算処理によって、一度に、強−判断モジュール120の判断結果と、弱−判断モジュール130の判断結果を得ることができる。前述の演算処理の例では、YのLSB(最下位ビット)が弱−判断モジュール130の判断結果であり、Yの下から2ビット目が強−判断モジュール120の判断結果となる。
if (H>TW) Y=0
else if (H>TS) Y=1
else Y=3
これは、もしHが閾値TWより大であるならばYを0とし、それ以外の場合は、Hが閾値TSより大であるならばYを1とし、それ以外の場合は、Yを3とするものである。これによって、YのLSBが弱−判断モジュール130及び結合処理モジュール140による処理結果であり、Yの下から2ビット目が強−判断モジュール120の判断結果となる。
前述の実施の形態では、説明を簡単にするために、ラベル付け処理を画像全体に行った後に統合判断処理モジュール160による判断処理を行った。しかし、実際にはラベル付けを行っているときに、ラスタスキャンをしているため、ラベル付けを行いながら各ラベル内に強ブロックが存在するかどうかを判断するようにしてもよい。
例えば、強ブロックが2、弱ブロックが1、それ以外が0とする画像のラベル付けを行うとする。
基本のラベル付けは、画素値が1以上の画素の連結状態を見てラベル付けをすればよい。その際に、各ラベル内に強ブロックが含まれているか否かをラベル・強ブロックフラグ対応テーブル500に記入していく。
ラベル・強ブロックフラグ対応テーブル500を図5の例に示す。ラベル・強ブロックフラグ対応テーブル500は、ラベル番号欄510、強ブロックフラグ欄520を有している。初期状態は、全てのラベルに強ブロックが含まれない(強ブロックフラグ=0)とする。ラベル付けの途中でラスタスキャンをするが、そのラスタスキャン中の画素値が2であれば、そのラベルに対応する強ブロックフラグ欄520を1に書き換える。ラベルを統合する場合には、統合するラベルに対応する強ブロックフラグの論理和を取るようにすればよい。
前述の実施の形態では、ラベル付けモジュール150がラベル付けを行うことによって、強ブロックに連結する全てのブロックを抽出したが、必ずしもそのようにしなくてもよい。
統合判断処理モジュール160は、強−判断モジュール120と弱−判断モジュール130の判断結果を用いて、強ブロックに接していて、かつ、強ブロックから予め定められた距離内にある弱ブロックのみを絵柄と判断してもよい。
(1)強ブロックを絵柄ブロックとする。
(2)ラスタスキャンを行い、絵柄ブロックに接している弱ブロックを絵柄とする。
(3)上記(2)のラスタスキャンをP回行う。
このラスタスキャンの回数Pを制御することによって、強ブロックへの距離的近さを制御する。
前述の実施の形態の強−判断モジュール120、弱−判断モジュール130では、ヒストグラムを用いた判断器を利用したが、判断器はどのようなものでもよい。
強−判断モジュール120及び弱−判断モジュール130は、ブロック内の画素値、画素値頻度、画素塊数のいずれか1つ以上に基づいて、そのブロックが絵柄の属性に属するか否かの判断を行うようにしてもよい。
例えば、画素値を用いた判断として、そのブロック内の画素値の最大値と最小値の差分値と予め定められた閾値との比較で行うようにしてもよい。また、画素値頻度を用いた判断として、そのブロックにおける画素値頻度の最大値と予め定められた閾値との比較で行うようにしてもよい。また、画素塊数を用いた判断として、そのブロック内の画素塊数と閾値との比較で行うようにしてもよい。
これらを組み合わせた判断を行うようにしてもよい。例えば、そのブロック内の画素値の最大値と最小値の差分値と予め定められた閾値との比較で行う判断と、そのブロックにおける画素値頻度の最大値と予め定められた閾値との比較で行う判断を行い、強−判断モジュール120は、両方の判断が絵柄の属性に属していると判断した場合(論理積)に絵柄の属性に属していると判断し、弱−判断モジュール130は、いずれか一方の判断が絵柄の属性に属していると判断した場合(論理和)に絵柄の属性に属していると判断する。
より具体的な例を以下に示す。
強−判断モジュール120、弱−判断モジュール130の絵柄の判断器は、例えば、特許文献6、特許文献7、特許文献8等に記載されている方法を用いてもよい。
強−判断モジュール120、弱−判断モジュール130の絵柄の判断器として、他の形態でもよい。
例えば、図17に示されるような小さなノイズを文字として判断しないようにする判断器としてもよい。
まず、受け付けた画像から文字部分を抜き出す。文字部分を抜き出す手法は、特許文献1、特許文献2、特許文献3、特許文献4、特許文献5等に記載されている手法を用いればよい。
抜き出した文字部分は、文字部が1、非文字部が0の2値画像として表現する。この2値画像をラベル付けする。
そのラベル付けされた2値画像をブロックに分割して、ブロック内の文字ラベル種類数を計測する。文字ラベル種類数は、単純に連結している画素塊の数と捉えてもよい。
文字ラベル種類数が多いブロックは、図17の例に示されるような小さなノイズが多いブロックであるため、絵柄と判断する。ここで、閾値THを定めて、文字ラベル種類数がTHよりも多いときに、絵柄と判断すればよい。
強−判断モジュール120と弱−判断モジュール130における処理対象のブロックサイズを異ならせてもよい。
強−判断モジュール120では、弱−判断モジュール130と比べてブロックサイズを大きくする。ブロックサイズが大きいと、判別の位置精度が悪くなる代わりに、判別の確度を高くすることができる。
弱−判断モジュール130として、強−判断モジュール120と比べて小さなブロックサイズを採用する。判別の位置精度を高くする代わりに、判別の確度が低くなる。
異なるブロックサイズとするために、例えば、ブロック化モジュール110によって分割されたブロックを結合して新たなサイズのブロックとしてもよいし、ブロック化モジュール110が、強−判断モジュール120、弱−判断モジュール130用に、それぞれ異なるブロックサイズでブロックに分割するようにしてもよい。
そして、強−判断モジュール120と弱−判断モジュール130は、それぞれパラメタ(閾値)で判断するようにしてもよい。
そこで、ここでは、強−判断モジュール120と弱−判断モジュール130のブロックサイズの最大公約数を用いて処理を行う。最大公約数のブロックサイズの精度で、強−判断モジュール120、弱−判断モジュール130の出力を行えばよい。
例えば、強−判断モジュール120のブロックサイズを横8画素×縦8画素(図6(a)参照)、弱−判断モジュール130のブロックサイズを横6画素×縦3画素(図7(a)参照)とする。
横方向の最大公約数は2、縦方向の最大公約数は1であるので、強−判断モジュール120、弱−判断モジュール130の出力ブロックサイズは、横2画素×縦1画素とすればよい。すなわち、横2画素×縦1画素の精度で、判断結果を出力する。横2画素×縦1画素の精度であるので、強−判断モジュール120の1ブロックの出力がXのとき、横4画素、縦8画素全てXのブロック(図6(b)参照)を出力すればよい。弱−判断モジュール130の1ブロックの出力がXのとき、横3画素、縦3画素全てXのブロック(図7(b)参照)を出力すればよい。
このようにして作成した出力画像の解像度は、強−判断モジュール120と弱−判断モジュール130で同じとなるため、結合処理モジュール140等での処理(例えば、論理演算)が行える。
なお、論理演算可能とするためには、必ずしも最大公約数のブロックを取る必要はない。すなわち1×1画素のブロック精度で論理演算を行えばよい。
以上のように論理演算可能なブロックサイズとして、結合処理モジュール140、ラベル付けモジュール150、統合判断処理モジュール160による処理を行えばよい。
前述の実施の形態の統合判断処理モジュール160では、ブロック単位に絵柄/非絵柄を判断していた。
このようなブロック単位の判断では、図19に示す例のように、文字部分を排除して絵柄判断することは困難である。
そこで、さらに、以下の手法を用いる。
統合判断処理モジュール160は、絵柄の属性に属するブロック内に絵柄の属性とは異なる画素塊の全体が含まれている場合は、そのブロックは絵柄であると判断するようにしてもよい。
統合判断処理モジュール160は、絵柄の属性に属するブロック内に絵柄の属性とは異なる画素塊の一部が含まれている場合は、そのブロックは絵柄ではないと判断するようにしてもよい。
そのブロックは絵柄であると一旦判断された後に、文字(非絵柄)である画素塊があるか否かを判断し、その画素塊の全体がブロック内に収まっている場合は、その画素塊を含めて対象ブロックは絵柄であると判断し、その画素塊がブロック内に収まっていない場合(一部はブロック内にあるが、他の一部はそのブロック内にない場合である。つまり画素塊が複数のブロックをまたがって存在している場合)は、その画素塊の一部が含まれている対象ブロックは絵柄ではない(この場合は、文字である)と判断する。
絵柄ブロック中に、文字が全て含まれずに、絵柄ブロックから文字がはみ出してしまっている場合、その文字は絵柄とは判断しない(図9参照)。
ここで、判別で用いるブロックサイズが十分小さければ、図19に示す例のように、文字部分を排除して絵柄と判断し得る。
前述の処理において、絵柄ブロック中の「文字ではない画素」は、絵柄であると判断すればよい。
例えば、文字画素塊の画素のうち、絵柄ブロック中に存在する画素と、非絵柄ブロック中に存在する画素の比Rを次の式1のように算出する。
R=非絵柄ブロック中に存在する画素数/絵柄ブロック中に存在する画素数 (式1)
この比Rと予め定められた閾値との比較を行って、閾値よりも大きければその文字を非絵柄として判断する。小さければその文字を絵柄として判断する。
R=非絵柄ブロック中に存在する画素数/文字部全画素数 (式2)
この場合も、この比Rと予め定められた閾値との比較を行って、閾値よりも大きければその文字を非絵柄として判断する。小さければその文字を絵柄として判断する。
R=絵柄ブロック中に存在する画素数/文字部全画素数 (式3)
この場合は、この比Rと予め定められた閾値との比較を行って、閾値よりも大きければその文字を絵柄として判断する。小さければその文字を非絵柄として判断する。
前述の実施の形態では、絵柄と非絵柄の判断を例示したが、本実施の形態が判断するブロックの属性は、ほかの属性であってもよい。2次元的に分布しており、塊として出現しやすい属性であれば、安定的に判断することができる。
ここで、強いパラメタと弱いパラメタの決定方法に関して説明する。
ここでは、前述の実施の形態と同様に、ブロック内画素値のヒストグラムの最大値と閾値との比較とを行うこととする。
強−判断モジュール120では、強いパラメタを閾値として比較することになる。ヒストグラムの最大値が強いパラメタよりも小さければ、強ブロックとして判断される。
弱−判断モジュール130では、弱いパラメタを閾値として比較することになる。ヒストグラムの最大値が弱いパラメタよりも小さければ、弱いブロックとして判断される。
ここで、ある画像をブロックに分割して、ブロック毎に、絵柄か非絵柄かが判断されている教師データを用いる。教師データは、例えばオペレータによる操作によって与えるようにしてもよい。
一般に、絵柄ブロックのヒストグラムの最大値は小さく、非絵柄ブロックのヒストグラムの最大値は大きい。
2つの属性のブロックの頻度分布に重なりが無ければ、その分布間にパラメタを設定することによって、1つの判断器で判断ができる。しかし、一般には2つの属性のブロックの頻度分布に重なりが生じてしまう。
そこで、以下のように2つのパラメタを設定する。
強いパラメタは、絵柄ブロックだけを判定できるパラメタである。強いパラメタよりも小さなブロックは、高い確率で絵柄ブロックであると判断できる。例えば、非絵柄ブロックを全く選択しない値を強いパラメタとすればよい。
弱いパラメタは、絵柄ブロックを全て抽出できるパラメタである。弱いパラメタよりも大きなブロックは、高い確率で非絵柄ブロックであると判断できる。例えば、全ての絵柄ブロックを選択できる値を弱いパラメタとすればよい。
このように、非絵柄ブロックを「全く」選択しない、又は、「全て」の絵柄ブロックを選択できる値を決定することは、かなり困難な場合がある。そこで、ある割合で間違いが混在する値としてもよい。
例えば、非絵柄ブロックをX%以下しか選択しない値を強いパラメタとすればよい。そして、絵柄ブロックを選択しない割合をY%以下とする値を弱いパラメタとすればよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray Disc(登録商標))、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
120…強−判断モジュール
130…弱−判断モジュール
140…結合処理モジュール
150…ラベル付けモジュール
160…統合判断処理モジュール
Claims (10)
- 受け付けた画像を領域に分割する分割手段と、
前記分割手段によって分割された領域がある属性に属するか否かを判断する第1の判断手段と、
前記分割手段によって分割された領域が該属性に属するか否かを、前記第1の判断手段によって行われる判断手法とは異なる判断手法によって判断する第2の判断手段と、
前記第1の判断手段による判断結果と前記第2の判断手段による判断結果に基づいて、前記分割手段によって分割された領域が前記属性に属するか否かを判断する第3の判断手段
を具備することを特徴とする画像処理装置。 - 前記第3の判断手段は、前記第1の判断手段によって前記属性に属すると判断された領域である第1の領域に前記第2の判断手段によって該属性に属すると判断された第2の領域が接している場合に、該第2の領域を該属性に属すると判断する
ことを特徴とする請求項1に記載の画像処理装置。 - 前記第3の判断手段は、前記第1の領域と前記第2の領域を結合し、その結合した領域内に該第1の領域が含まれているか否かによって、前記領域が前記属性に属するか否かを判断する
ことを特徴とする請求項1に記載の画像処理装置。 - 前記第1の判断手段及び前記第2の判断手段は、前記領域内の画素値、画素値頻度、画素塊数のいずれか1つ以上に基づいて、該領域が前記属性に属するか否かの判断を行う
ことを特徴とする請求項1から3のいずれか一項に記載の画像処理装置。 - 前記第2の判断手段は、前記第1の判断手段によって領域が前記属性に属するか否かの判断をする場合の閾値とは異なる閾値を用いて、領域の判断を行う
ことを特徴とする請求項1から4のいずれか一項に記載の画像処理装置。 - 前記第2の判断手段は、前記第1の判断手段によって領域が前記属性に属するか否かの判断をする場合の領域の大きさとは異なる領域の大きさを用いて、領域の判断を行う
ことを特徴とする請求項1から4のいずれか一項に記載の画像処理装置。 - 前記属性に属する領域内に含まれている画素と該属性には属していない領域に含まれている画素の割合に基づいて、画素塊が該属性であるか否かを判断する画素塊判断手段を有する
ことを特徴とする請求項1から6のいずれか一項に記載の画像処理装置。 - 前記画素塊判断手段は、前記属性に属する領域内に画素塊の全体が含まれている場合は、該画素塊は該属性であると判断する
ことを特徴とする請求項7に記載の画像処理装置。 - 前記画素塊判断手段は、前記属性に属する領域内に画素塊の一部が含まれている場合は、該画素塊は該属性であると判断する
ことを特徴とする請求項7に記載の画像処理装置。 - コンピュータを、
受け付けた画像を領域に分割する分割手段と、
前記分割手段によって分割された領域がある属性に属するか否かを判断する第1の判断手段と、
前記分割手段によって分割された領域が該属性に属するか否かを、前記第1の判断手段によって行われる判断手法とは異なる判断手法によって判断する第2の判断手段と、
前記第1の判断手段による判断結果と前記第2の判断手段による判断結果に基づいて、前記分割手段によって分割された領域が前記属性に属するか否かを判断する第3の判断手段
として機能させることを特徴とする画像処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009032370A JP5206468B2 (ja) | 2009-02-16 | 2009-02-16 | 画像処理装置及び画像処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009032370A JP5206468B2 (ja) | 2009-02-16 | 2009-02-16 | 画像処理装置及び画像処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010192966A true JP2010192966A (ja) | 2010-09-02 |
JP5206468B2 JP5206468B2 (ja) | 2013-06-12 |
Family
ID=42818576
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009032370A Expired - Fee Related JP5206468B2 (ja) | 2009-02-16 | 2009-02-16 | 画像処理装置及び画像処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5206468B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019139497A (ja) * | 2018-02-09 | 2019-08-22 | 株式会社日立ソリューションズ・クリエイト | 画像処理システム及び画像処理方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004145634A (ja) * | 2002-10-24 | 2004-05-20 | Toshiba Tec Corp | 画像処理装置及び画像処理方法 |
-
2009
- 2009-02-16 JP JP2009032370A patent/JP5206468B2/ja not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004145634A (ja) * | 2002-10-24 | 2004-05-20 | Toshiba Tec Corp | 画像処理装置及び画像処理方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019139497A (ja) * | 2018-02-09 | 2019-08-22 | 株式会社日立ソリューションズ・クリエイト | 画像処理システム及び画像処理方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5206468B2 (ja) | 2013-06-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4600491B2 (ja) | 画像処理装置及び画像処理プログラム | |
US20040017579A1 (en) | Method and apparatus for enhancement of digital image quality | |
JP5206503B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5887770B2 (ja) | 画像処理装置及び画像処理プログラム | |
US7667711B2 (en) | Image processing system, a method thereof, and a recording medium thereof | |
JP4771428B2 (ja) | 画像処理装置、画像処理方法、プログラムおよび記録媒体 | |
JP5206468B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4857975B2 (ja) | 画像処理システムおよび画像処理プログラム | |
JP5742283B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4135656B2 (ja) | 画像領域判定方法、画像処理装置およびプログラム | |
US20120249573A1 (en) | Image processing apparatus, image processing method, and computer-readable medium | |
JP2011039972A (ja) | 画像処理装置及び画像処理プログラム | |
JP5326670B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4894664B2 (ja) | 画像処理システム及び画像処理プログラム | |
JP5407582B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2006093880A (ja) | 画像処理装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体 | |
JP2004236157A (ja) | 画像処理装置、画像処理方法及び画像処理プログラム | |
JP6481301B2 (ja) | 画像処理装置及び画像処理プログラム | |
RU2737001C1 (ru) | Устройство и способ обработки изображений и носитель данных | |
US20070165281A1 (en) | Method and apparatus identifying halftone regions within a digital image | |
JP6145983B2 (ja) | 画像処理装置およびコンピュータプログラム | |
US10567767B2 (en) | Image processing apparatus and non-transitory computer readable medium | |
JP2005303506A (ja) | 画像処理装置、画像処理方法、画像処理用プログラム及び記憶媒体 | |
JP6596837B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2011166765A (ja) | 画像形成装置及び画像形成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120123 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121023 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121113 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121221 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130122 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130204 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160301 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5206468 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |