JP2010192966A - 画像処理装置及び画像処理プログラム - Google Patents

画像処理装置及び画像処理プログラム Download PDF

Info

Publication number
JP2010192966A
JP2010192966A JP2009032370A JP2009032370A JP2010192966A JP 2010192966 A JP2010192966 A JP 2010192966A JP 2009032370 A JP2009032370 A JP 2009032370A JP 2009032370 A JP2009032370 A JP 2009032370A JP 2010192966 A JP2010192966 A JP 2010192966A
Authority
JP
Japan
Prior art keywords
determination
block
attribute
image
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009032370A
Other languages
English (en)
Other versions
JP5206468B2 (ja
Inventor
Shunichi Kimura
俊一 木村
Koichi Fujii
晃一 藤井
Yutaka Koshi
裕 越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2009032370A priority Critical patent/JP5206468B2/ja
Publication of JP2010192966A publication Critical patent/JP2010192966A/ja
Application granted granted Critical
Publication of JP5206468B2 publication Critical patent/JP5206468B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

【課題】画像を分割した領域の属性を判断する場合にあって、その属性に属する領域を属していないとする誤った判断、又はその属性に属していない領域を属しているとする誤った判断を抑制するようにした画像処理装置を提供する。
【解決手段】画像処理装置の分割手段は、受け付けた画像を領域に分割し、第1の判断手段は、前記分割手段によって分割された領域がある属性に属するか否かを判断し、第2の判断手段は、前記分割手段によって分割された領域が該属性に属するか否かを、前記第1の判断手段によって行われる判断手法とは異なる判断手法によって判断し、第3の判断手段は、前記第1の判断手段による判断結果と前記第2の判断手段による判断結果に基づいて、前記分割手段によって分割された領域が前記属性に属するか否かを判断する。
【選択図】図1

Description

本発明は、画像処理装置及び画像処理プログラムに関する。
受け付けた画像を、例えば絵柄領域と文字領域に分けて、それぞれの領域に異なる画像処理を施すことが行われている。
これに関連する技術として、例えば、特許文献1には、デジタル画像データの圧縮率を高めることを課題とし、オリジナルピクセルマップを2つのプレーンにセグメント化し、次に各プレーンを効率的な方法で別々に圧縮し、損失性圧縮法で圧縮するピクセルは一方のプレーンに配置され、非損失性圧縮が施されるべきピクセルはもう一方のプレーンに配置され、セレクタプレーンはオリジナルピクセルマップの全てのピクセルを追跡するために作成されることが開示されている。
また、例えば、特許文献2には、文書を、複数のバイナリ前景平面を有する複合ラスタコンテンツフォーマットで画像データに変換するシステム及び方法を提供することを課題とし、画像データを線毎に分析して、類似の色及びエッジ特徴を有する画素を特定し、1つの線上にあるこれらの画素と別の線上の画素とは、両者が類似の特徴を共有する場合にはリンクされ、これらのリンクされた画素同士は領域としてグループ化され、この領域の平均色が計算され、画素が属する領域を特定する画像マップが、領域の最終的なテーブルと共に生成されることが開示されている。
また、例えば、特許文献3には、画像の分離処理、特に文字線画の分離を良好に行い、解像度変換処理や圧縮処理を施した際の画質劣化を低減し、高画質かつ高圧縮率で画像を送信又は蓄積可能な画像処理装置及び画像処理方法を提供することを課題とし、画像データが入力されると、色空間変換部にて所定の色空間に変換後、選択データ生成部で分離情報プレーンに文字線画情報を抽出し、膨張処理部において、分離情報プレーンに対して文字線画を太らせる膨張処理を施し、膨張分離情報プレーンを生成し、この膨張分離情報プレーンを用いて多層分離部にて文字線画部の色情報を文字情報プレーンに、文字線画部以外の絵柄情報と背景画像を絵柄情報プレーンに分離し、膨張分離情報プレーンを用いて分離することにより、文字線画の輪郭部が絵柄情報プレーンに分離されるのを防止することが開示されている。
また、例えば、特許文献4には、像域分離において、網点抽出可能な水色などの色領域上に書かれた文字などについては、その領域全体が網点抽出されてしまうため、色領域上に書かれた文字を像域分離結果として抽出することができないことを課題とし、まず、入力画像データに対して2値化部で前景と背景を分離し、かつ線分抽出部で所定画素数分の幅の線分を抽出する処理を行い、2値化部で前景とされた連結する画素に対してラベリング部で同一のラベルを付与し、この同一ラベルが付与されたラベル領域毎に、ラベル特徴量算出部で画像特徴量を算出し、そのラベル領域毎のラベル特徴量から該ラベル領域の属性を第1属性判定部で判定し、そして、ラベリング部でラベリングされたラベル領域毎の第1属性判定部による属性判定結果を用いて、線分補正部で線分抽出部によって抽出された線分の補正を行うことが開示されている。
また、例えば、特許文献5には、像域分離において、1つの文字の中で幅の太い箇所と細い箇所が存在した場合に、抽出される箇所とされない箇所が存在し、また絵柄中に誤抽出が発生する場合は、ブロック状の誤抽出となることがあり、画像を再現した際に画質劣化が目立ちやすいことを課題とし、まず、入力画像データに対し、シャドー抽出部によって濃度の濃い領域を抽出するとともに、網点抽出部によって網点で構成された領域を抽出する一方、線分抽出部によって第1の所定画素数分の幅の線分を抽出し、そして、シャドー抽出部及び網点抽出部で抽出された各領域から、小領域抽出部によって第2の所定画素数分の幅を有する領域を抽出し、この抽出された領域に基づいて、線分補正部において線分抽出部によって抽出された線分の補正を行うことが開示されている。
また、例えば、特許文献6には、符号化する画像が写真的な画像、又は、文字的な画像のどちらであっても良好に符号化するとともに、特に、色画像のようにエッジのレベル差の小さい場合や、ブロック境界にわずかにエッジがかかる場合であっても、画像の特性に応じた符号化を行うことのできる画像符号化装置を提供することを目的とし、入力される画像信号より、1ブロック抽出部において、画素ブロックを抽出し、抽出された画素ブロックに対し、領域判定部において、分散情報、ヒストグラム情報、ダイナミックレンジ情報等の特徴量に基づいて、画素ブロックが写真的か、文字的かを判定し、画素ブロックが写真的な場合には、画素ブロックは、変換符号化部において変換符号化され、画素ブロックが文字的な場合には、ブロック近似符号化部によってブロック近似符号化されることが開示されている。
また、例えば、特許文献7には、カラー文字/中間調の混在画像のそれぞれの領域を高性能で識別でき、ハードウェア実現性にも優れた画像領域識別方式を提供することを目的とし、複数画素のブロック化手段と、ブロック内の画素から複数の特性値を検出する特性値検出と、複数の特性値から文字/中間調の領域識別を行う領域識別手段とを備え、複数の特性値は、ブロック内平均値と高レベル画素及び中間レベル画素のそれぞれのブロック内の総和値との3種とし、領域識別手段は、複数の特性値の量子化手段と、予め領域識別のための中間レベル画素の総和値の閾値をセットしたLUTと、比較手段とを備え、ブロック内平均値と高レベル画素の総和値とを量子化し合成した値をアドレスとしてLUTから中間レベル画素の総和値の閾値を求め、実際に求めた中間レベル画素の総和値とを比較してブロック内の領域を識別することが開示されている。
また、例えば、特許文献8には、画像をその局所的な特徴に基づいて良好に2種類の領域に分離することを課題とし、画像入力部から入力された画像信号は、画像蓄積部に蓄積され、特徴判別部は、画像蓄積部から画像を画素単位、又は、所定サイズの矩形領域毎に読み出し、所定の特徴について2値の判別を行い、結果をそれぞれ判別結果記憶部に記憶し、領域決定部は、判別結果記憶部に記憶されている判別結果に基づいて領域情報を決定し、出力選択部は、原稿蓄積部内の画素データを順次読み出し、領域決定部の決定した領域情報にしたがって2つの領域を振り分けて第1の領域を含む画像信号と第2の領域を含む画像信号の2通りの画像出力を得ることが開示されている。
特開2000−196893号公報 特開2005−228331号公報 特開2000−194857号公報 特開2001−127999号公報 特開2001−144954号公報 特開平06−319133号公報 特開平04−317261号公報 特開2000−261663号公報
本発明は、画像を分割した領域の属性を判断する場合にあって、その属性に属する領域を属していないとする誤った判断、又はその属性に属していない領域を属しているとする誤った判断を抑制するようにした画像処理装置及び画像処理プログラムを提供することを目的としている。
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、受け付けた画像を領域に分割する分割手段と、前記分割手段によって分割された領域がある属性に属するか否かを判断する第1の判断手段と、前記分割手段によって分割された領域が該属性に属するか否かを、前記第1の判断手段によって行われる判断手法とは異なる判断手法によって判断する第2の判断手段と、前記第1の判断手段による判断結果と前記第2の判断手段による判断結果に基づいて、前記分割手段によって分割された領域が前記属性に属するか否かを判断する第3の判断手段を具備することを特徴とする画像処理装置である。
請求項2の発明は、前記第3の判断手段は、前記第1の判断手段によって前記属性に属すると判断された領域である第1の領域に前記第2の判断手段によって該属性に属すると判断された第2の領域が接している場合に、該第2の領域を該属性に属すると判断することを特徴とする請求項1に記載の画像処理装置である。
請求項3の発明は、前記第3の判断手段は、前記第1の領域と前記第2の領域を結合し、その結合した領域内に該第1の領域が含まれているか否かによって、前記領域が前記属性に属するか否かを判断することを特徴とする請求項1に記載の画像処理装置である。
請求項4の発明は、前記第1の判断手段及び前記第2の判断手段は、前記領域内の画素値、画素値頻度、画素塊数のいずれか1つ以上に基づいて、該領域が前記属性に属するか否かの判断を行うことを特徴とする請求項1から3のいずれか一項に記載の画像処理装置である。
請求項5の発明は、前記第2の判断手段は、前記第1の判断手段によって領域が前記属性に属するか否かの判断をする場合の閾値とは異なる閾値を用いて、領域の判断を行うことを特徴とする請求項1から4のいずれか一項に記載の画像処理装置である。
請求項6の発明は、前記第2の判断手段は、前記第1の判断手段によって領域が前記属性に属するか否かの判断をする場合の領域の大きさとは異なる領域の大きさを用いて、領域の判断を行うことを特徴とする請求項1から4のいずれか一項に記載の画像処理装置である。
請求項7の発明は、前記属性に属する領域内に含まれている画素と該属性には属していない領域に含まれている画素の割合に基づいて、画素塊が該属性であるか否かを判断する画素塊判断手段を有することを特徴とする請求項1から6のいずれか一項に記載の画像処理装置である。
請求項8の発明は、前記画素塊判断手段は、前記属性に属する領域内に画素塊の全体が含まれている場合は、該画素塊は該属性であると判断することを特徴とする請求項7に記載の画像処理装置である。
請求項9の発明は、前記画素塊判断手段は、前記属性に属する領域内に画素塊の一部が含まれている場合は、該画素塊は該属性であると判断することを特徴とする請求項7に記載の画像処理装置である。
請求項10の発明は、コンピュータを、受け付けた画像を領域に分割する分割手段と、前記分割手段によって分割された領域がある属性に属するか否かを判断する第1の判断手段と、前記分割手段によって分割された領域が該属性に属するか否かを、前記第1の判断手段によって行われる判断手法とは異なる判断手法によって判断する第2の判断手段と、前記第1の判断手段による判断結果と前記第2の判断手段による判断結果に基づいて、前記分割手段によって分割された領域が前記属性に属するか否かを判断する第3の判断手段として機能させることを特徴とする画像処理プログラムである。
請求項1の画像処理装置によれば、画像を分割した領域の属性を判断する場合にあって、第1の判断手段あるいは第2の判断手段のいずれか一方のみを用いてある属性に属するか否かを判断する場合に比べて、その属性に属する領域を属していないとする誤った判断、又はその属性に属していない領域を属しているとする誤った判断を抑制できる。
請求項2、3の画像処理装置によれば、画像を分割した領域以上の面積を有する領域の属性を判断するにあたって、第1の判断手段あるいは第2の判断手段のいずれか一方のみを用いてある属性に属するか否かを判断する場合に比べて、その判断の誤りを抑制できる。
請求項4の画像処理装置によれば、本構成を有さない場合に比べて、効率的な判断ができる。
請求項5の画像処理装置によれば、本構成を有さない場合に比べて、装置の小型化および高速化が可能となる。
請求項6の画像処理装置によれば、判定位置精度が高い判断と判定が安定した判断を選択することが可能となる。
請求項7の画像処理装置によれば、本構成を有さない場合に比べて、精密な判断ができる。
請求項8の画像処理装置によれば、本構成を有さない場合に比べて、ある属性ではないと判断する可能性を高くすることができる。
請求項9の画像処理装置によれば、本構成を有さない場合に比べて、ある属性であると判断する可能性を高くすることができる。
請求項10の画像処理プログラムによれば、画像を分割した領域の属性を判断する場合にあって、本構成を有さない場合に比べて、その属性に属する領域を属していないとする誤った判断、又はその属性に属していない領域を属しているとする誤った判断を抑制できる。
本実施の形態の構成例についての概念的なモジュール構成図である。 弱−判断モジュール、強−判断モジュールによる処理結果の例を示す説明図である。 結合処理モジュールによる処理結果の例を示す説明図である。 ラベル付けモジュールによる処理結果の例を示す説明図である。 ラベル・強ブロックフラグ対応テーブルのデータ構造の例を示す説明図である。 強−判断モジュールのブロックサイズの例を示す説明図である。 弱−判断モジュールのブロックサイズの例を示す説明図である。 絵柄ブロックと文字との関係の例を示す説明図である。 絵柄ブロックと文字との関係の例を示す説明図である。 強−判断モジュール、弱−判断モジュールで用いるパラメタの選定の例を示す説明図である。 2種類のパラメタで判断した場合の例を示す説明図である。 判断結果の例を示す説明図である。 本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。 層分けした画像の例を示す説明図である。 層分けした画像の例を示す説明図である。 文字の抜き出し処理例を示す説明図である。 文字として抜き出した場合の誤り例を示す説明図である。 文字として抜き出した場合の誤り例を示す説明図である。 絵柄画像の抜き出し処理例を示す説明図である。 絵柄画像の抜き出し処理例を示す説明図である。 絵柄画像の抜き出し処理例を示す説明図である。
まず、本実施の形態の理解を容易にするために、本実施の形態が適用され得る技術(本実施の形態による処理が行われた後に適用される技術)について、2種類説明する。
<1>受け付けた画像を絵柄領域と文字領域に分割し、各領域に適した画像圧縮方式を適用する。これは、全体の画像圧縮率を向上させるために、本実施の形態が用いられるものである。なお、絵柄とは、文字・線画以外をいい、主に写真、網点画像があり、非可逆圧縮の対象となる。
一般にカラー画像のデータ量は大きいため、圧縮して蓄積又は伝送等が行われる。画像に歪みを与えない可逆圧縮方式では、高い圧縮率を得ることができないため、一般的な圧縮画像フォーマットとしては、JPEG(Joint Photographic Experts Group)方式(さらに具体的にはJPEGベースライン方式、以下、単純にJPEG方式と称する)が利用されることが多い。JPEG方式は非可逆符号化の一種であるため、圧縮によって、画像に歪みが生じる。そのため、極端に高い圧縮率を得ることは困難である。
そこで、従来のJPEG方式よりも高い圧縮率を得る方式として、特許文献1、特許文献2等に示されるような多層構造の画像フォーマットが提案されてきた。
これらは、JPEGの画像歪みは、主として、高周波成分電力の大きな画像のエッジ部分に発生する、という現象を避けるため、受け付けた画像を、高周波成分電力の大きな文字/線画部分と、文字/線画部分を除いたバックグラウンド部分に分解して、バックグラウンド部分は、JPEGで高い圧縮率で圧縮し、文字/線画部分は、可逆符号化で圧縮する、という方策を採るものである。
その中で、特許文献1記載の技術は、3層方式を採用している。
図14の例に示されるように、画像1410を絵柄部分1414と文字/線画部分1412に分ける。さらに最終的な出力画像として、絵柄部分1414を選択するか、文字/線画部分1412を選択するかのセレクタ情報1416を保持する。この3層のデータを用いて画像を表現するものである。以下、絵柄部分をバックグラウンド画像、文字/線画部分をフォアグラウンド画像とする。
特許文献2記載の技術は、バックグラウンド多値画像1層と、2値画像のN層の構造で圧縮する方式を採用している。多値JPEG画像をバックグラウンド画像として、その上に色情報を持つ2値画像を重ねていくものである。
図15に示す例での一番下の層であるバックグラウンド画像1510に対しては、JPEG等の多値画像形式で圧縮を行う。その他の層(2値画像1520〜1580)に対しては、2値画像符号化方式で圧縮する。各2値画像符号化層の画像には色情報が付与されているため、復号時にはその色を付与して復号する。
前述のように、絵柄部分と、文字部分に分割して符号化することによって、画質を保ちながら、圧縮率を上げるようにしている。なお、特許文献1、特許文献2に記載の技術においては、受け付けた画像から文字部分を抜き出すことによって、領域分割を行っている。そして、文字以外の画素が絵柄部分となる。
また、受け付けた画像から文字部分を抜き出す技術は、他に、特許文献3、特許文献4、特許文献5等のように様々にある。これらに記載の文字抜き出し方法は、絵柄の中に存在している文字を抜き出すことも行うものである。
図16(a)の例に示すように、画像1600の絵柄画像1610中に文字が実際に存在している場合は、図16(b)の例に示す画像1650のように、文字として抜き出しても問題はない。
ところが、図17や図18の例に示すように、本来であれば、絵柄中の模様とすべきもの(図17(b)、図18(b)の例に示す模様)までも、文字として抽出してしまうと、画質が劣化する原因となる。なお、図17(a)に示す画像1700の絵柄画像1710は写真画像であって、色の濃い線が混じっているものであり、図18(a)に示す画像1800の絵柄画像1810は人物を撮影した写真画像である。
一般に特許文献1に記載の方式では、フォアグラウンドの圧縮率を高く設定する。また、特許文献2に記載の方式では、文字として抜き出した画像の色を1色で塗りつぶすことになる。そのため、絵柄部の画像が、文字として抜き出されてしまった場合、抜き出さない場合と比較して、画質劣化が発生する。
そこで、望ましくは、図16の例に示す場合では、文字部分は、文字として抽出し、文字以外は絵柄として抽出すべきである。さらに、図17、図18の例に示す場合では、文字として抽出しないようにすべきである。
そのためには、受け付けた画像から絵柄部を正確に抜き出すことができればよい。図16、図17、図18の例に示す画像1600、1700、1800を対象とした場合の望ましい絵柄部抽出例は、図19(b)、図20(b)、図21(b)の例に示す絵柄画像1960、2060、2160の斜線部となる。なお、図19(b)の例に示す絵柄画像1960は、文字部分(「ABC」の部分)以外の部分を絵柄部として抽出したものである。
<2>受け付けた画像に画像処理を適用するにあたって、領域毎に適した画像処理の方法又はパラメタ等を用いる。これは、画像処理後の画質を向上させるために、本実施の形態が用いられるものである。
従来より、複写機、ファクシミリ等の画像処理装置においては、画像中の各領域毎に適した画像処理を施し、画質を向上させている。例えば、受け付けた画像に文字や線画などの文字領域と写真や網点などの絵柄領域が混在していた場合、その画像を再生するときには文字領域と絵柄領域を分離し、文字領域には解像度を重視した処理を実施し、絵柄領域には階調性を重視した処理を施すことが、画像品質の面から望ましい。
具体的には、スキャナ等によって画像を読み取ったり、ファクシミリ等で画像が送信されてきた場合に、文字・線画・写真・網点等が混在した画像を印刷する場合、文字・線画等によって構成されている文字領域に対しては解像度を重視した処理を実施し、写真・網点等によって構成されている絵柄領域に対しては、階調性を重視した処理を施す。これにより、高画質な再生画像となる。
したがって、このような技術に適用する場合にあっても、前述の通り、図16、図17、図18の例に示す画像1600、1700、1800を対象とした場合の望ましい絵柄部抽出例は、図19(b)、図20(b)、図21(b)の例に示す絵柄画像1960、2060、2160の斜線部となる。
次に、本実施の形態の理解を容易にするために、本実施の形態による具体的な処理例を示して説明する。
本実施の形態による処理例として、ブロック毎の領域判断(領域分割)を行うものとする。
まず、2つのパラメタ(強いパラメタと弱いパラメタ)で、ブロック毎に領域判断を行う。例えば、ここでは、絵柄/文字判断を行うものとする。なお、判断したい属性には、絵柄、写真、網点、文字、等々種々のものがあるが、ここでは、説明を簡単にするため、絵柄と文字の2つとする。
強いパラメタは、高い確度を持って、絵柄であると判断できるものだけを選び出すためのパラメタであるとする。強いパラメタで絵柄と判断した場合は、文字である可能性は低いこととなる。
弱いパラメタは、強いパラメタよりも確度が低いが、ある程度、絵柄であると判断するためのパラメタである。弱いパラメタで絵柄と判断した場合は、文字であっても絵柄と判断されている場合がある。
このような2種類のパラメタで判断したブロックは、図11の例に示すような構造を持つと考えられる。図11に示す例において、1つの四角形は1つのブロックを示している。そして、1つのブロックは、複数の画素で構成されている。例えば、縦M画素、横N画素の矩形であるとする。M、Nの値のとしては、限定しないが、例えば、数画素(1画素であってもよい)から数百画素の様々な範囲にある。図11に示す例で、斜線のブロックは、強いパラメタで絵柄と判断されたブロックであることを示している(以下、強ブロックとする)。縦線のブロックは、弱いパラメタで絵柄と判断されたブロックであることを示している(以下、弱ブロックとする)。弱ブロックは、強ブロックの周囲に分布していることがわかる。
通常、絵柄領域は、2次元的な広がりを持つものである。
このような2次元的な広がりを持つ絵柄領域をブロックに分割する場合、絵柄領域ブロックに隣接するブロックは絵柄領域である可能性が高い。逆に、絵柄領域ブロックに隣接しないブロックは、絵柄領域である可能性は比較的低い。
そこで、本実施の形態では、まず、強ブロックは、絵柄であると判断する。次に、強ブロックに接する弱ブロックは、絵柄であると判断する。
さらに、既に絵柄であると判断されたブロック(以下、絵柄ブロック)に接する弱ブロックも、絵柄であると判断する。絵柄ブロックに接する弱ブロックの絵柄ブロック化は、反復的に行う。すなわち、弱ブロックが絵柄ブロック化された後に、絵柄ブロック化された弱ブロック周囲の弱ブロックも絵柄であると判断する。
このような処理を図11に示す例に対して行うと、図12の例に示す黒部分のように、絵柄部を判断することになる。
このような処理を行うことによって、強ブロックに連結していない弱ブロックを絵柄とは判断しない。つまり、2次元的に連続していない孤立した確度の低いブロックを絵柄とは判断しなくなる。また、強ブロックに連結している弱ブロックは絵柄と判断する。つまり、確度の低いブロックであっても、確度の高いブロックと2次元的に連結していれば、絵柄と判断する。
2次元的に連結しているブロックを前述のように処理することは、擬似的により面積の広いブロックを用いているということになる。これにより、ブロックサイズが比較的小さくても安定的に領域判断を行うものである。
前述の説明では、ブロックが絵柄か否かを判断していたが、これに限定されず、例えば、判断するのは文字か否かであってもよいし、網点か否かであってもよいし、写真か否かであってもよい。
前述の説明では、「既に絵柄であると判断されたブロックに接する弱ブロックを、絵柄であると判断する。」としており、この場合は、既に絵柄であると判断されたブロックに接している領域のみを判定するため、高速の判定が可能である。また、その他の処理例として、強ブロック又は弱ブロックに関係なく絵柄として判断されたブロックを連結してブロックの塊とし、その塊の中に強ブロックが存在すれば、その塊全体を絵柄として判断する方法でもよい。
前述の説明では、確度の違いを「強いパラメタ」と「弱いパラメタ」で変化させていたが、パラメタの違いでなくてもよい。「強い判断処理」、「弱い判断処理」など、判断処理そのものが違っていてもよい。また、「広いブロック」、「狭いブロック」のようにブロックサイズが違っていてもよい。この場合は、「広いブロックで絵柄と判断された画素」に連結する「狭いブロックで絵柄と判断された画素」を絵柄と判断すればよい。
以下、図面に基づき本発明を実現するにあたっての好適な一実施の形態の例を説明する。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、コンピュータ・プログラム、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。
本実施の形態である画像処理装置は、図1に示すように、ブロック化モジュール110、強−判断モジュール120、弱−判断モジュール130、結合処理モジュール140、ラベル付けモジュール150、統合判断処理モジュール160を有している。画像を属性毎に分割する技術に関するものである。以下、属性として絵柄を主に例示して説明する。
ブロック化モジュール110は、強−判断モジュール120、弱−判断モジュール130と接続されている。受け付けた画像をブロックに分割する。画像を受け付けるとは、例えば、スキャナ、カメラ等で画像を読み込むこと、ファクシミリ等で通信回線を介して外部機器から画像を受信すること、ハードディスク(コンピュータに内蔵されているものの他に、ネットワークを介して接続されているもの等を含む)等に記憶されている画像を読み出すこと等が含まれる。画像は、2値画像、多値画像(カラー画像を含む)であってもよい。受け付ける画像は、1枚であってもよいし、複数枚であってもよい。また、画像の内容として、ビジネスに用いられる文書、広告宣伝用のパンフレット等であってもよい。ブロックに分割(ブロック化)とは、例えば、ここでは、N×Mの矩形形状に受け付けた画像を分割することをいう。そして、各ブロックの画素値を強−判断モジュール120、弱−判断モジュール130に渡す。
強−判断モジュール120は、ブロック化モジュール110、結合処理モジュール140、統合判断処理モジュール160と接続されている。ブロック化モジュール110によって分割されたブロックが絵柄の属性に属するか否かを判断する。そして、その判断結果を結合処理モジュール140、統合判断処理モジュール160に渡す。
弱−判断モジュール130は、ブロック化モジュール110、結合処理モジュール140と接続されている。ブロック化モジュール110によって分割されたブロックが絵柄の属性に属するか否かを、強−判断モジュール120によって行われる判断手法とは異なる判断手法によって判断する。そして、その判断結果を結合処理モジュール140に渡す。「強−判断モジュール120によって行われる判断手法とは異なる判断手法」とは、強−判断モジュール120によって絵柄の属性に属すると判断したブロック(以下、第1のブロック)のうち、少なくとも1つ以上のブロックが異なるように、弱−判断モジュール130が絵柄の属性に属するブロック(以下、第2のブロック)と判断すればよい。したがって、ブロックによっては、第1のブロックとも判断され、第2のブロックとも判断されているものがある。また、第1のブロック数と第2のブロック数とが同じであっても、異なるブロックがあればよい。
強−判断モジュール120、弱−判断モジュール130による絵柄の判断処理について、より具体的な例を説明する。
まず、ブロック内の画素値のヒストグラムを取得する。
ヒストグラムの最大値が閾値TH以下であれば、そのブロックは絵柄であると判断する。
絵柄ブロックでは、滑らかに画素値が変動することが多いため、画素値のヒストグラム(画素値毎の出現頻度)は、画素値が異なっても類似した値になる。そのため、ヒストグラムの最大値は小さな値となる。逆に文字ブロックでは、背景画素と文字色画素がほとんどを占める。この場合には、背景画素の出現頻度と文字色画素の出現頻度が大きくなるため、ヒストグラムの最大値が大きくなる。
例えば、受け付けた画像がグレイスケール画像である場合には、その画素値そのもののヒストグラムを取得すればよい。
また、例えば、受け付けた画像がカラー画像である場合には、一旦カラー画像をYCbCrや、Lab等の輝度色差系の色空間に変換してから、Y成分、あるいはL成分等の輝度信号をグレイスケール値と捉えて、グレイスケール値のヒストグラムを取得すればよい。
強−判断モジュール120では、前述の処理で閾値THとして閾値TSを用いる。
弱−判断モジュール130では、前述の処理で閾値THとして閾値TWを用いる。閾値TWは、閾値TSと異なる値である。
ここで、強−判断モジュール120は、絵柄であることを高い精度で確信できる判断器であるため、閾値TSは、閾値TWと比べて比較的小さな値とすればよい。
また、弱−判断モジュール130は、絵柄である可能性はあるが、条件次第では文字である可能性もあるブロックを抽出する判断器であるため、閾値TWは、閾値TSと比べて比較的大きな値とすればよい。
また、画像処理装置の小型化及び高速化を図るために、強−判断モジュール120と弱−判断モジュール130において、共通化したモジュール(装置、プログラム(アルゴリズム)等)を用いて、そのモジュールが処理を行う場合に閾値だけを異ならせるようにしてもよい。つまり、強−判断モジュール120と弱−判断モジュール130を一つのモジュールで実現させてもよい。
強−判断モジュール120、弱−判断モジュール130による判断結果の出力は、ブロック毎に1ビットの情報としてもよい。例えば、ここで、絵柄と判定された場合に1、それ以外の場合に0とする。図2(a)に強−判断モジュール120の出力例を示し、図2(b)に弱−判断モジュール130の出力例を示す。図2(a)は図11の例に示す縦線のブロック(弱ブロック)、図2(b)は図11の例に示す斜線のブロック(強ブロック)にそれぞれ対応するものである。
結合処理モジュール140は、強−判断モジュール120、弱−判断モジュール130、ラベル付けモジュール150と接続されている。強−判断モジュール120、弱−判断モジュール130から判断結果を受け取り、第1のブロックと第2のブロックを結合する。そして、その処理結果をラベル付けモジュール150に渡す。例えば、両者からの判断結果の論理和(OR)処理を行う。図3に結合処理モジュール140による出力例を示す。
ラベル付けモジュール150は、結合処理モジュール140、統合判断処理モジュール160と接続されている。結合処理モジュール140の出力をラベル付けする。そして、その処理結果を統合判断処理モジュール160に渡す。ラベル付け処理は、連結している画素に対して同じ値のラベルを付与する周知のアルゴリズムを用いる。ここでは、1つのブロックを1画素であると捉えてラベル付けを行う。図4にラベル付けモジュール150の出力例を示す。
統合判断処理モジュール160は、強−判断モジュール120、ラベル付けモジュール150と接続されている。強−判断モジュール120による判断結果と弱−判断モジュール130による判断結果(ここでは、結合処理モジュール140、ラベル付けモジュール150による処理結果)に基づいて、ブロック化モジュール110によって分割されたブロックが絵柄の属性に属するか否かを判断する。
より具体的な例として、統合判断処理モジュール160は、ラベル付けモジュール150から受け取った処理結果から各ラベル毎に、ラベル内に強−判断モジュール120の出力が1となっているブロックが存在しているか否かを判断する。
例えば、図4に示した例では、ラベルが1の画素内に、強−判断モジュール120の出力(図2(b)参照)が1となる画素が存在しているか否かを検査する。ラベルが1の場合には、そのような画素は存在していないため、ラベル1に対応するブロックは絵柄とは判断しない。
ラベル2でも同様の判断処理を行う。ラベル2の画素内に、強−判断モジュール120の出力(図12参照)が1となる画素が存在しているか否かを検査する。ラベルが2の場合には、そのような画素が存在しているため、ラベル2に対応するブロックは絵柄と判断する。
同様な判断処理によって、ラベル3、ラベル4に対応するブロックは絵柄とは判断しない。
以上で、本実施の形態は、ブロック毎に絵柄/非絵柄の判断を行っている。最終的に、統合判断処理モジュール160は、ブロック毎の、絵柄の属性に属しているか否かの判断結果を出力する。
以下に、本実施の形態の変形例を説明する。
<ブロック形状>
ブロック形状は矩形以外であってもよい。また、全てのブロックは同じ形状でなくともよい。矩形以外の形状のブロックを採用した場合、ブロックAとブロックBが接しているという条件は、ブロックA内の1個以上の画素とブロックB内の1個以上の画素が接しているという条件に切り替えて処理すればよい。ラベル付けモジュール150でのラベル付けは、ブロックを1画素と捉えるのではなく、受け付けた画像と同じ解像度で1画素単位にラベル付けを行えばよい。
<カラー画像のヒストグラム>
強−判断モジュール120、弱−判断モジュール130において、カラー画像を一旦グレイスケールに変換してグレイスケールのヒストグラムを取得したが、カラー値そのもののヒストグラムを利用してもよい。
カラー成分がRGBであれば、R、G、Bそれぞれのヒストグラムを取得する。その他の色成分、例えば、YCbCrであれば、Y、Cb、Crそれぞれのヒストグラムを取得する。それぞれのヒストグラムの最大値が全て、閾値以下であれば、絵柄と判定する。閾値は色成分に依存せず同じ値でもよいし、色成分毎に違う値でもよい。
<結合処理モジュール140>
結合処理モジュール140では、強−判断モジュール120の出力と弱−判断モジュール130の出力との論理和を取得していた。しかし、強−判断モジュール120、弱−判断モジュール130の処理内容によっては、強−判断モジュール120で1であれば、論理的に必ず弱−判断モジュール130の出力も1となる場合がある。このような場合は、弱−判断モジュール130の出力をそのまま結合処理モジュール140の出力として用いてもよく、結合処理モジュール140は不要である。
前述の実施の形態で示したヒストグラムの最大値を用いる場合がこれにあたる。この場合は結合処理モジュール140は不要となる。
<強−判断モジュール120と弱−判断モジュール130>
前述の実施の形態では、強−判断モジュール120と弱−判断モジュール130で別々に処理していたが、必ずしも別々に処理する必要は無い。前述の実施の形態で使用したようなヒストグラムを用いる判断器では、ブロックのヒストグラムは同じものを用いて、閾値だけ変更することによって、強ブロック、弱ブロック、その他に判別するようにしてもよい。
例えば、ヒストグラムの最大値をHとし、強−判断モジュール120、弱−判断モジュール130における判断器の出力をYとした場合の演算処理を示す。
if (H>TW) Y=0
else if (H>TS) Y=1
else Y=2
これは、もしHが閾値TWより大であるならばYを0とし、それ以外の場合は、Hが閾値TSより大であるならばYを1とし、それ以外の場合は、Yを2とするものである。この演算処理によって、一度に、強−判断モジュール120の判断結果と、弱−判断モジュール130の判断結果を得ることができる。前述の演算処理の例では、YのLSB(最下位ビット)が弱−判断モジュール130の判断結果であり、Yの下から2ビット目が強−判断モジュール120の判断結果となる。
また、例えば、次のような演算処理としてもよい。
if (H>TW) Y=0
else if (H>TS) Y=1
else Y=3
これは、もしHが閾値TWより大であるならばYを0とし、それ以外の場合は、Hが閾値TSより大であるならばYを1とし、それ以外の場合は、Yを3とするものである。これによって、YのLSBが弱−判断モジュール130及び結合処理モジュール140による処理結果であり、Yの下から2ビット目が強−判断モジュール120の判断結果となる。
<ラベル付けモジュール150と統合判断処理モジュール160>
前述の実施の形態では、説明を簡単にするために、ラベル付け処理を画像全体に行った後に統合判断処理モジュール160による判断処理を行った。しかし、実際にはラベル付けを行っているときに、ラスタスキャンをしているため、ラベル付けを行いながら各ラベル内に強ブロックが存在するかどうかを判断するようにしてもよい。
例えば、強ブロックが2、弱ブロックが1、それ以外が0とする画像のラベル付けを行うとする。
基本のラベル付けは、画素値が1以上の画素の連結状態を見てラベル付けをすればよい。その際に、各ラベル内に強ブロックが含まれているか否かをラベル・強ブロックフラグ対応テーブル500に記入していく。
ラベル・強ブロックフラグ対応テーブル500を図5の例に示す。ラベル・強ブロックフラグ対応テーブル500は、ラベル番号欄510、強ブロックフラグ欄520を有している。初期状態は、全てのラベルに強ブロックが含まれない(強ブロックフラグ=0)とする。ラベル付けの途中でラスタスキャンをするが、そのラスタスキャン中の画素値が2であれば、そのラベルに対応する強ブロックフラグ欄520を1に書き換える。ラベルを統合する場合には、統合するラベルに対応する強ブロックフラグの論理和を取るようにすればよい。
<ラベル付けを行わない形態>
前述の実施の形態では、ラベル付けモジュール150がラベル付けを行うことによって、強ブロックに連結する全てのブロックを抽出したが、必ずしもそのようにしなくてもよい。
統合判断処理モジュール160は、強−判断モジュール120と弱−判断モジュール130の判断結果を用いて、強ブロックに接していて、かつ、強ブロックから予め定められた距離内にある弱ブロックのみを絵柄と判断してもよい。
このような処理とするには、統合判断処理モジュール160が以下の処理((1)〜(3))を行う。
(1)強ブロックを絵柄ブロックとする。
(2)ラスタスキャンを行い、絵柄ブロックに接している弱ブロックを絵柄とする。
(3)上記(2)のラスタスキャンをP回行う。
このラスタスキャンの回数Pを制御することによって、強ブロックへの距離的近さを制御する。
<判断器の別の形態>
前述の実施の形態の強−判断モジュール120、弱−判断モジュール130では、ヒストグラムを用いた判断器を利用したが、判断器はどのようなものでもよい。
強−判断モジュール120及び弱−判断モジュール130は、ブロック内の画素値、画素値頻度、画素塊数のいずれか1つ以上に基づいて、そのブロックが絵柄の属性に属するか否かの判断を行うようにしてもよい。
例えば、画素値を用いた判断として、そのブロック内の画素値の最大値と最小値の差分値と予め定められた閾値との比較で行うようにしてもよい。また、画素値頻度を用いた判断として、そのブロックにおける画素値頻度の最大値と予め定められた閾値との比較で行うようにしてもよい。また、画素塊数を用いた判断として、そのブロック内の画素塊数と閾値との比較で行うようにしてもよい。
これらを組み合わせた判断を行うようにしてもよい。例えば、そのブロック内の画素値の最大値と最小値の差分値と予め定められた閾値との比較で行う判断と、そのブロックにおける画素値頻度の最大値と予め定められた閾値との比較で行う判断を行い、強−判断モジュール120は、両方の判断が絵柄の属性に属していると判断した場合(論理積)に絵柄の属性に属していると判断し、弱−判断モジュール130は、いずれか一方の判断が絵柄の属性に属していると判断した場合(論理和)に絵柄の属性に属していると判断する。
より具体的な例を以下に示す。
<判断器の別の形態その1>
強−判断モジュール120、弱−判断モジュール130の絵柄の判断器は、例えば、特許文献6、特許文献7、特許文献8等に記載されている方法を用いてもよい。
<判断器の別の形態その2>
強−判断モジュール120、弱−判断モジュール130の絵柄の判断器として、他の形態でもよい。
例えば、図17に示されるような小さなノイズを文字として判断しないようにする判断器としてもよい。
まず、受け付けた画像から文字部分を抜き出す。文字部分を抜き出す手法は、特許文献1、特許文献2、特許文献3、特許文献4、特許文献5等に記載されている手法を用いればよい。
抜き出した文字部分は、文字部が1、非文字部が0の2値画像として表現する。この2値画像をラベル付けする。
そのラベル付けされた2値画像をブロックに分割して、ブロック内の文字ラベル種類数を計測する。文字ラベル種類数は、単純に連結している画素塊の数と捉えてもよい。
文字ラベル種類数が多いブロックは、図17の例に示されるような小さなノイズが多いブロックであるため、絵柄と判断する。ここで、閾値THを定めて、文字ラベル種類数がTHよりも多いときに、絵柄と判断すればよい。
<判断器の別の形態その3>
強−判断モジュール120と弱−判断モジュール130における処理対象のブロックサイズを異ならせてもよい。
強−判断モジュール120では、弱−判断モジュール130と比べてブロックサイズを大きくする。ブロックサイズが大きいと、判別の位置精度が悪くなる代わりに、判別の確度を高くすることができる。
弱−判断モジュール130として、強−判断モジュール120と比べて小さなブロックサイズを採用する。判別の位置精度を高くする代わりに、判別の確度が低くなる。
異なるブロックサイズとするために、例えば、ブロック化モジュール110によって分割されたブロックを結合して新たなサイズのブロックとしてもよいし、ブロック化モジュール110が、強−判断モジュール120、弱−判断モジュール130用に、それぞれ異なるブロックサイズでブロックに分割するようにしてもよい。
そして、強−判断モジュール120と弱−判断モジュール130は、それぞれパラメタ(閾値)で判断するようにしてもよい。
ブロックサイズが異なる場合は、強−判断モジュール120と弱−判断モジュール130の出力画素数が違ってしまうこととなる。
そこで、ここでは、強−判断モジュール120と弱−判断モジュール130のブロックサイズの最大公約数を用いて処理を行う。最大公約数のブロックサイズの精度で、強−判断モジュール120、弱−判断モジュール130の出力を行えばよい。
例えば、強−判断モジュール120のブロックサイズを横8画素×縦8画素(図6(a)参照)、弱−判断モジュール130のブロックサイズを横6画素×縦3画素(図7(a)参照)とする。
横方向の最大公約数は2、縦方向の最大公約数は1であるので、強−判断モジュール120、弱−判断モジュール130の出力ブロックサイズは、横2画素×縦1画素とすればよい。すなわち、横2画素×縦1画素の精度で、判断結果を出力する。横2画素×縦1画素の精度であるので、強−判断モジュール120の1ブロックの出力がXのとき、横4画素、縦8画素全てXのブロック(図6(b)参照)を出力すればよい。弱−判断モジュール130の1ブロックの出力がXのとき、横3画素、縦3画素全てXのブロック(図7(b)参照)を出力すればよい。
このようにして作成した出力画像の解像度は、強−判断モジュール120と弱−判断モジュール130で同じとなるため、結合処理モジュール140等での処理(例えば、論理演算)が行える。
なお、論理演算可能とするためには、必ずしも最大公約数のブロックを取る必要はない。すなわち1×1画素のブロック精度で論理演算を行えばよい。
以上のように論理演算可能なブロックサイズとして、結合処理モジュール140、ラベル付けモジュール150、統合判断処理モジュール160による処理を行えばよい。
<文字部除去>
前述の実施の形態の統合判断処理モジュール160では、ブロック単位に絵柄/非絵柄を判断していた。
このようなブロック単位の判断では、図19に示す例のように、文字部分を排除して絵柄判断することは困難である。
そこで、さらに、以下の手法を用いる。
統合判断処理モジュール160は、絵柄の属性に属するブロック内に絵柄の属性とは異なる画素塊の全体が含まれている場合は、そのブロックは絵柄であると判断するようにしてもよい。
統合判断処理モジュール160は、絵柄の属性に属するブロック内に絵柄の属性とは異なる画素塊の一部が含まれている場合は、そのブロックは絵柄ではないと判断するようにしてもよい。
そのブロックは絵柄であると一旦判断された後に、文字(非絵柄)である画素塊があるか否かを判断し、その画素塊の全体がブロック内に収まっている場合は、その画素塊を含めて対象ブロックは絵柄であると判断し、その画素塊がブロック内に収まっていない場合(一部はブロック内にあるが、他の一部はそのブロック内にない場合である。つまり画素塊が複数のブロックをまたがって存在している場合)は、その画素塊の一部が含まれている対象ブロックは絵柄ではない(この場合は、文字である)と判断する。
より具体的な例として、絵柄ブロックの中に、文字(非絵柄)の全体が含まれている場合には、その文字は絵柄中の文字であると判断する(図8参照)。図8の例に示すように1つの絵柄ブロックでは文字がはみ出している場合でも、はみ出す先が絵柄ブロックであれば、絵柄ブロックの中に文字が全て含まれると判断する。
絵柄ブロック中に、文字が全て含まれずに、絵柄ブロックから文字がはみ出してしまっている場合、その文字は絵柄とは判断しない(図9参照)。
ここで、判別で用いるブロックサイズが十分小さければ、図19に示す例のように、文字部分を排除して絵柄と判断し得る。
前述の処理において、絵柄ブロック中の「文字ではない画素」は、絵柄であると判断すればよい。
さらに、精密に判断するには、統合判断処理モジュール160は、絵柄の属性に属するブロック又は絵柄の属性には属していないブロックに含まれている絵柄ではない画素塊の画素の割合に基づいて、そのブロックは絵柄であるか否かを判断するようにしてもよい。
例えば、文字画素塊の画素のうち、絵柄ブロック中に存在する画素と、非絵柄ブロック中に存在する画素の比Rを次の式1のように算出する。
R=非絵柄ブロック中に存在する画素数/絵柄ブロック中に存在する画素数 (式1)
この比Rと予め定められた閾値との比較を行って、閾値よりも大きければその文字を非絵柄として判断する。小さければその文字を絵柄として判断する。
又は、比Rは、次の式2を用いてもよい。つまり、文字の全画素数と、非絵柄ブロック中に存在する画素の画素数との比であってもよい。
R=非絵柄ブロック中に存在する画素数/文字部全画素数 (式2)
この場合も、この比Rと予め定められた閾値との比較を行って、閾値よりも大きければその文字を非絵柄として判断する。小さければその文字を絵柄として判断する。
又は、比Rは、次の式3を用いてもよい。つまり、文字の全画素数と、絵柄ブロック中に存在する画素の画素数との比であってもよい。
R=絵柄ブロック中に存在する画素数/文字部全画素数 (式3)
この場合は、この比Rと予め定められた閾値との比較を行って、閾値よりも大きければその文字を絵柄として判断する。小さければその文字を非絵柄として判断する。
<他の属性の判断>
前述の実施の形態では、絵柄と非絵柄の判断を例示したが、本実施の形態が判断するブロックの属性は、ほかの属性であってもよい。2次元的に分布しており、塊として出現しやすい属性であれば、安定的に判断することができる。
<強いパラメタと弱いパラメタの決定方法>
ここで、強いパラメタと弱いパラメタの決定方法に関して説明する。
ここでは、前述の実施の形態と同様に、ブロック内画素値のヒストグラムの最大値と閾値との比較とを行うこととする。
強−判断モジュール120では、強いパラメタを閾値として比較することになる。ヒストグラムの最大値が強いパラメタよりも小さければ、強ブロックとして判断される。
弱−判断モジュール130では、弱いパラメタを閾値として比較することになる。ヒストグラムの最大値が弱いパラメタよりも小さければ、弱いブロックとして判断される。
ここで、ある画像をブロックに分割して、ブロック毎に、絵柄か非絵柄かが判断されている教師データを用いる。教師データは、例えばオペレータによる操作によって与えるようにしてもよい。
ヒストグラムの最大値を横軸にとり、絵柄ブロックと非絵柄ブロックの頻度をプロットすると図10の例に示すようになる。
一般に、絵柄ブロックのヒストグラムの最大値は小さく、非絵柄ブロックのヒストグラムの最大値は大きい。
2つの属性のブロックの頻度分布に重なりが無ければ、その分布間にパラメタを設定することによって、1つの判断器で判断ができる。しかし、一般には2つの属性のブロックの頻度分布に重なりが生じてしまう。
そこで、以下のように2つのパラメタを設定する。
強いパラメタは、絵柄ブロックだけを判定できるパラメタである。強いパラメタよりも小さなブロックは、高い確率で絵柄ブロックであると判断できる。例えば、非絵柄ブロックを全く選択しない値を強いパラメタとすればよい。
弱いパラメタは、絵柄ブロックを全て抽出できるパラメタである。弱いパラメタよりも大きなブロックは、高い確率で非絵柄ブロックであると判断できる。例えば、全ての絵柄ブロックを選択できる値を弱いパラメタとすればよい。
このように、非絵柄ブロックを「全く」選択しない、又は、「全て」の絵柄ブロックを選択できる値を決定することは、かなり困難な場合がある。そこで、ある割合で間違いが混在する値としてもよい。
例えば、非絵柄ブロックをX%以下しか選択しない値を強いパラメタとすればよい。そして、絵柄ブロックを選択しない割合をY%以下とする値を弱いパラメタとすればよい。
図13を参照して、本実施の形態の画像処理装置のハードウェア構成例について説明する。図13に示す構成は、例えばパーソナルコンピュータ(PC)などによって構成されるものであり、スキャナ等のデータ読み取り部1317と、プリンタなどのデータ出力部1318を備えたハードウェア構成例を示している。
CPU(Central Processing Unit)1301は、前述の実施の形態において説明した各種のモジュール、すなわち、ブロック化モジュール110、強−判断モジュール120、弱−判断モジュール130、結合処理モジュール140等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。
ROM(Read Only Memory)1302は、CPU1301が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)1303は、CPU1301の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス1304により相互に接続されている。
ホストバス1304は、ブリッジ1305を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス1306に接続されている。
キーボード1308、マウス等のポインティングデバイス1309は、操作者により操作される入力デバイスである。ディスプレイ1310は、液晶表示装置又はCRT(Cathode Ray Tube)などがあり、各種情報をテキストやイメージ情報として表示する。
HDD(Hard Disk Drive)1311は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU1301によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、ブロック化モジュール110が受け付けた画像、各モジュールの処理結果データなどが格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。
ドライブ1312は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体1313に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース1307、外部バス1306、ブリッジ1305、及びホストバス1304を介して接続されているRAM1303に供給する。リムーバブル記録媒体1313も、ハードディスクと同様のデータ記録領域として利用可能である。
接続ポート1314は、外部接続機器1315を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート1314は、インタフェース1307、及び外部バス1306、ブリッジ1305、ホストバス1304等を介してCPU1301等に接続されている。通信部1316は、ネットワークに接続され、外部とのデータ通信処理を実行する。データ読み取り部1317は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部1318は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。
なお、図13に示す画像処理装置のハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図13に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図13に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、ファクシミリ、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファクシミリ等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。
また、前述の実施の形態の説明において、「以上」、「以下」、「より大きい」、「より小さい(未満)」としたものは、その組み合わせに矛盾が生じない限り、それぞれ「より大きい」、「より小さい(未満)」、「以上」、「以下」としてもよい。
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray Disc(登録商標))、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
110…ブロック化モジュール
120…強−判断モジュール
130…弱−判断モジュール
140…結合処理モジュール
150…ラベル付けモジュール
160…統合判断処理モジュール

Claims (10)

  1. 受け付けた画像を領域に分割する分割手段と、
    前記分割手段によって分割された領域がある属性に属するか否かを判断する第1の判断手段と、
    前記分割手段によって分割された領域が該属性に属するか否かを、前記第1の判断手段によって行われる判断手法とは異なる判断手法によって判断する第2の判断手段と、
    前記第1の判断手段による判断結果と前記第2の判断手段による判断結果に基づいて、前記分割手段によって分割された領域が前記属性に属するか否かを判断する第3の判断手段
    を具備することを特徴とする画像処理装置。
  2. 前記第3の判断手段は、前記第1の判断手段によって前記属性に属すると判断された領域である第1の領域に前記第2の判断手段によって該属性に属すると判断された第2の領域が接している場合に、該第2の領域を該属性に属すると判断する
    ことを特徴とする請求項1に記載の画像処理装置。
  3. 前記第3の判断手段は、前記第1の領域と前記第2の領域を結合し、その結合した領域内に該第1の領域が含まれているか否かによって、前記領域が前記属性に属するか否かを判断する
    ことを特徴とする請求項1に記載の画像処理装置。
  4. 前記第1の判断手段及び前記第2の判断手段は、前記領域内の画素値、画素値頻度、画素塊数のいずれか1つ以上に基づいて、該領域が前記属性に属するか否かの判断を行う
    ことを特徴とする請求項1から3のいずれか一項に記載の画像処理装置。
  5. 前記第2の判断手段は、前記第1の判断手段によって領域が前記属性に属するか否かの判断をする場合の閾値とは異なる閾値を用いて、領域の判断を行う
    ことを特徴とする請求項1から4のいずれか一項に記載の画像処理装置。
  6. 前記第2の判断手段は、前記第1の判断手段によって領域が前記属性に属するか否かの判断をする場合の領域の大きさとは異なる領域の大きさを用いて、領域の判断を行う
    ことを特徴とする請求項1から4のいずれか一項に記載の画像処理装置。
  7. 前記属性に属する領域内に含まれている画素と該属性には属していない領域に含まれている画素の割合に基づいて、画素塊が該属性であるか否かを判断する画素塊判断手段を有する
    ことを特徴とする請求項1から6のいずれか一項に記載の画像処理装置。
  8. 前記画素塊判断手段は、前記属性に属する領域内に画素塊の全体が含まれている場合は、該画素塊は該属性であると判断する
    ことを特徴とする請求項7に記載の画像処理装置。
  9. 前記画素塊判断手段は、前記属性に属する領域内に画素塊の一部が含まれている場合は、該画素塊は該属性であると判断する
    ことを特徴とする請求項7に記載の画像処理装置。
  10. コンピュータを、
    受け付けた画像を領域に分割する分割手段と、
    前記分割手段によって分割された領域がある属性に属するか否かを判断する第1の判断手段と、
    前記分割手段によって分割された領域が該属性に属するか否かを、前記第1の判断手段によって行われる判断手法とは異なる判断手法によって判断する第2の判断手段と、
    前記第1の判断手段による判断結果と前記第2の判断手段による判断結果に基づいて、前記分割手段によって分割された領域が前記属性に属するか否かを判断する第3の判断手段
    として機能させることを特徴とする画像処理プログラム。
JP2009032370A 2009-02-16 2009-02-16 画像処理装置及び画像処理プログラム Expired - Fee Related JP5206468B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009032370A JP5206468B2 (ja) 2009-02-16 2009-02-16 画像処理装置及び画像処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009032370A JP5206468B2 (ja) 2009-02-16 2009-02-16 画像処理装置及び画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2010192966A true JP2010192966A (ja) 2010-09-02
JP5206468B2 JP5206468B2 (ja) 2013-06-12

Family

ID=42818576

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009032370A Expired - Fee Related JP5206468B2 (ja) 2009-02-16 2009-02-16 画像処理装置及び画像処理プログラム

Country Status (1)

Country Link
JP (1) JP5206468B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019139497A (ja) * 2018-02-09 2019-08-22 株式会社日立ソリューションズ・クリエイト 画像処理システム及び画像処理方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004145634A (ja) * 2002-10-24 2004-05-20 Toshiba Tec Corp 画像処理装置及び画像処理方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004145634A (ja) * 2002-10-24 2004-05-20 Toshiba Tec Corp 画像処理装置及び画像処理方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019139497A (ja) * 2018-02-09 2019-08-22 株式会社日立ソリューションズ・クリエイト 画像処理システム及び画像処理方法

Also Published As

Publication number Publication date
JP5206468B2 (ja) 2013-06-12

Similar Documents

Publication Publication Date Title
JP4600491B2 (ja) 画像処理装置及び画像処理プログラム
US20040017579A1 (en) Method and apparatus for enhancement of digital image quality
JP5206503B2 (ja) 画像処理装置及び画像処理プログラム
JP5887770B2 (ja) 画像処理装置及び画像処理プログラム
US7667711B2 (en) Image processing system, a method thereof, and a recording medium thereof
JP4771428B2 (ja) 画像処理装置、画像処理方法、プログラムおよび記録媒体
JP5206468B2 (ja) 画像処理装置及び画像処理プログラム
JP4857975B2 (ja) 画像処理システムおよび画像処理プログラム
JP5742283B2 (ja) 画像処理装置及び画像処理プログラム
JP4135656B2 (ja) 画像領域判定方法、画像処理装置およびプログラム
US20120249573A1 (en) Image processing apparatus, image processing method, and computer-readable medium
JP2011039972A (ja) 画像処理装置及び画像処理プログラム
JP5326670B2 (ja) 画像処理装置及び画像処理プログラム
JP4894664B2 (ja) 画像処理システム及び画像処理プログラム
JP5407582B2 (ja) 画像処理装置及び画像処理プログラム
JP2006093880A (ja) 画像処理装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP2004236157A (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP6481301B2 (ja) 画像処理装置及び画像処理プログラム
RU2737001C1 (ru) Устройство и способ обработки изображений и носитель данных
US20070165281A1 (en) Method and apparatus identifying halftone regions within a digital image
JP6145983B2 (ja) 画像処理装置およびコンピュータプログラム
US10567767B2 (en) Image processing apparatus and non-transitory computer readable medium
JP2005303506A (ja) 画像処理装置、画像処理方法、画像処理用プログラム及び記憶媒体
JP6596837B2 (ja) 画像処理装置及び画像処理プログラム
JP2011166765A (ja) 画像形成装置及び画像形成方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120123

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121023

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121113

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130122

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130204

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160301

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5206468

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees