JP4393411B2 - 画像処理装置、画像処理プログラムおよび画像処理方法 - Google Patents

画像処理装置、画像処理プログラムおよび画像処理方法 Download PDF

Info

Publication number
JP4393411B2
JP4393411B2 JP2005096213A JP2005096213A JP4393411B2 JP 4393411 B2 JP4393411 B2 JP 4393411B2 JP 2005096213 A JP2005096213 A JP 2005096213A JP 2005096213 A JP2005096213 A JP 2005096213A JP 4393411 B2 JP4393411 B2 JP 4393411B2
Authority
JP
Japan
Prior art keywords
area
density distribution
background
entry
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2005096213A
Other languages
English (en)
Other versions
JP2006277398A (ja
Inventor
智久 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2005096213A priority Critical patent/JP4393411B2/ja
Priority to CNB2006100674870A priority patent/CN100530219C/zh
Priority to US11/391,219 priority patent/US7612918B2/en
Publication of JP2006277398A publication Critical patent/JP2006277398A/ja
Application granted granted Critical
Publication of JP4393411B2 publication Critical patent/JP4393411B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/409Edge or detail enhancement; Noise or error suppression

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Description

本発明は、文書や帳票への文字などの所定情報の記入に由来する色画素を含む領域を抽出することで、文書や帳票の画像の背景領域のノイズの影響をなくす画像処理装置、画像処理プログラムおよび画像処理方法に関する。
文書の濃淡画像からノイズ除去を行う方法としては様々な方法が提案されている。ノイズ除去の従来の技術としては、濃淡画像に対して平均化フィルタやガウシアンフィルタによる平滑化を行う技術がある(例えば非特許文献1 pp108-110参照)。
また、特許文献1には、二値化した画像にオープニング等のモルフォロジー演算を施す方法等が記載されている(同文献 pp179-180)。
さらに、非特許文献1には、ノイズの影響が少なくなるように二値画像を生成する方法としては、二値化した画像に対してメディアンフィルタ等による孤立点除去を行う方法が開示されている(同文献 p113)。
しかし、これらの方法では、背景部分の濃度分布が広く、記入による黒画素の濃度分布との重なりが大きい場合で、背景画素の濃度がたまたま高くなっている領域が孤立点とみなせない程度に大きい場合に、当該領域をノイズとして除去できない。
ディジタル画像処理.財団法人画像情報教育振興協会(CG-ARTS協会),July,2004,pp108-113,pp179-180
上述したように従来の方法では、背景部分の濃度分布が広く、記入による黒画素の濃度分布との重なりが大きい場合にノイズを除去できない場合がある。
従来の方法で指定領域の記入の有無を判定する場合、上記のように背景ノイズが顕著であると文字などの記入の有無の判定を誤る可能性がある。
本発明はこのような課題を解決するためになされたもので、文字などが記入された原画像より背景ノイズの影響を除き、その後の処理(文字認識など)に寄与できる画像処理装置、画像処理プログラムおよび画像処理方法を提供することを目的としている。
上記した目的を達成するために、本発明の画像処理装置は、処理対象の画像の領域のうちで、記入がない余白部分または予め用意した白紙帳票の領域の濃度分布を背景領域の画素の濃度分布として求める背景濃度分布導出部と、前記画像の領域のうちで、任意に指定された指定領域の濃度分布を求める領域濃度分布導出部と、前記背景領域の濃度分布に対する前記指定領域の濃度分布の逸脱の程度を示す評価値を求め、前記評価値が予め定められた閾値以上の場合は前記指定領域への文字の記入があるものと判定し、前記評価値が閾値未満の場合は前記指定領域への文字の記入がないものと判定する記入有無判定部とを具備する。
本発明の画像処理装置は、処理対象の画像の領域のうちで、記入がない余白部分または予め用意した白紙帳票の領域の濃度分布を背景領域の画素の濃度分布として求める背景濃度分布導出部と、前記背景領域の画素の濃度を推定する背景濃度推定部と、前記画像の領域のうちで、任意に指定された指定領域を分割した各々の小領域の濃度分布を求める領域濃度分布導出部と、前記背景領域の濃度分布に対する前記小領域の濃度分布の逸脱の程度を示す評価値を求め、前記評価値が予め定められた閾値以上の場合は前記小領域への文字の記入があるものと判定し、前記評価値が閾値未満の場合は前記小領域への文字の記入がないものと判定する記入有無判定部と、前記記入有無判定部により文字の記入がないと判定された前記画像の小領域の画素の濃度を、前記背景濃度推定部により推定された背景領域の画素の濃度へ置換する領域濃度置換手段とを具備する。
本発明の画像処理装置は、処理対象の画像の領域のうちで、記入がない余白部分または予め用意した白紙帳票の領域の濃度分布を背景領域の画素の濃度分布として求める背景濃度分布導出部と、前記画像の領域のうちで、任意に指定された指定領域を第1の方向に分割した各々の小領域の濃度分布を求める領域濃度分布導出部と、前記背景領域の濃度分布に対する前記小領域の濃度分布の逸脱の程度を示す評価値を求め、前記評価値が予め定められた閾値以上の場合は前記小領域への文字の記入があるものと判定し、前記評価値が閾値未満の場合は前記小領域への文字の記入がないものと判定する記入有無判定部と、前記記入有無判定部により文字の記入があると判定された小領域でかつ隣り合うもの同士を連結して一つ以上の文字の記入範囲を検出する領域検出手段とを具備する。
本発明の画像処理装置は、処理対象の画像の領域のうちで、記入がない余白部分または予め用意した白紙帳票の領域の濃度分布を背景領域の画素の濃度分布として求める背景濃度分布導出部と、前記画像の領域のうちで、任意に指定された指定領域を第1の方向に分割した各々の小領域の濃度分布を求める第1領域濃度分布導出部と、前記背景領域の濃度分布に対する前記小領域の濃度分布の逸脱の程度を示す評価値を求め、前記評価値が予め定められた閾値以上の場合は前記小領域への文字の記入があるものと判定し、前記評価値が閾値未満の場合は前記小領域への文字の記入がないものと判定する第1記入有無判定部と、前記第1記入有無判定部により文字の記入があると判定された小領域でかつ上下に隣り合うもの同士を連結して文字の記入方向の領域である行領域を検出する第1の領域検出手段と、前記第1の領域検出手段により検出された行領域を前記第1の方向と交差する第2の方向に分割した各々の小領域の濃度分布を求める第2領域濃度分布導出部と、前記背景領域の濃度分布に対する前記小領域の濃度分布の逸脱の程度を示す評価値を求め、前記評価値が予め定められた閾値以上の場合は前記小領域への文字の記入があるものと判定し、前記評価値が閾値未満の場合は前記小領域への文字の記入がないものと判定する第2記入有無判定部と、前記第2記入有無判定部により文字の記入があると判定された小領域でかつ左右に隣り合うもの同士を連結して一つ以上の文字の記入範囲を検出する第2の領域検出手段とを具備する。
本発明の画像処理装置は、処理対象の画像の領域のうちで、記入がない余白部分または予め用意した白紙帳票の領域の濃度分布を背景領域の画素の濃度分布として求める背景濃度分布導出部と、前記画像の領域のうちで、任意に指定された指定領域を第1の方向に分割した各々の小領域の濃度分布を求める第1領域濃度分布導出部と、前記背景濃度分布導出部により求められた背景領域の画素の濃度分布と前記第1領域濃度分布導出部により求められた小領域の濃度分布とを基に該当小領域への文字の記入の有無を判定する第1記入有無判定部と、前記第1記入有無判定部により文字の記入があると判定された小領域でかつ隣り合うもの同士を連結して一つ以上の文字の記入範囲を検出する第1の領域検出手段と、前記第1の領域検出手段により検出された文字の記入範囲を第1の方向と交差する第2の方向に分割した各々の小領域の濃度分布を求める第2領域濃度分布導出部と、前記背景濃度分布導出部により求められた背景領域の画素の濃度分布と前第2記領域濃度分布導出部により求められた小領域の濃度分布とを基に該当小領域への文字の記入の有無を判定する第2記入有無判定部と、前記第2記入有無判定部により文字の記入があると判定された小領域でかつ隣り合うもの同士を連結して一つ以上の文字の記入範囲を検出する第2の領域検出手段とを具備する。
本発明の画像処理プログラムは、コンピュータに画像処理を実行させる画像処理プログラムにおいて、前記コンピュータを、処理対象の画像の領域のうちで、記入がない余白部分または予め用意した白紙帳票の領域の濃度分布を背景領域の画素の濃度分布として求める背景濃度分布導出部と、前記画像の領域のうちで、任意に指定された指定領域の濃度分布を求める領域濃度分布導出部と、前記背景領域の濃度分布に対する前記指定領域の濃度分布の逸脱の程度を示す評価値を求め、前記評価値が予め定められた閾値以上の場合は前記指定領域への文字の記入があるものと判定し、前記評価値が閾値未満の場合は前記指定領域への文字の記入がないものと判定する記入有無判定部として機能させることを特徴とする。
本発明の画像処理方法は、コンピュータが画像を処理する画像処理方法であって、処理対象の画像の領域のうちで、記入がない余白部分または予め用意した白紙帳票の領域の濃度分布を前記コンピュータが背景領域の画素の濃度分布として求めるステップと、前記画像の領域のうちで、任意に指定された指定領域の濃度分布を前記コンピュータが求めるステップと、前記背景領域の濃度分布に対する前記指定領域の濃度分布の逸脱の程度を示す評価値を前記コンピュータが求め、前記評価値が予め定められた閾値以上の場合は前記指定領域への文字の記入があるものと判定し、前記評価値が閾値未満の場合は前記指定領域への文字の記入がないものと判定するステップとを有することを特徴としている。
本発明では、背景濃度分布推定部は、所定情報が記入されていることが予想される文書や帳票の原画像の背景画素の濃度分布を推定する。領域濃度分布推定部は、原画像の指定領域について濃度分布を推定する。そして、記入有無判定部は、背景画素の濃度分布と指定領域の濃度分布とから指定領域への所定情報の記入の有無を判定する。
本発明では、領域濃度分布推定部は、画像を分割した各々の小領域について濃度分布を推定する。また、記入有無判定部は、画像を分割した各々の小領域の濃度分布と画像の背景画素の濃度分布とを基に当該領域への所定情報の記入の有無を判定する。この判定の結果、所定情報の記入がないものと判定された領域の濃度を、背景濃度推定部によって推定された背景濃度へ置換することにより原画像よりノイズを除去する。
本発明では、記入有無判定部は、第1の方向(長手方向)に分割した小領域の濃度分布と背景画素の濃度分布とを基に当該領域への所定情報の記入の有無を判定する。その後、領域検出手段は、記入有無判定部によって所定情報の記入が有るものと判定された領域で隣り合う物同士を連結した領域を所定情報の行領域として検出する。
本発明では、領域濃度分布推定部は、領域検出手段が検出した行領域を第1の方向と交差する第2の方向に分割し、更に細分化した各々の小領域について濃度分布を推定する。その後、記入有無判定部は、背景画素の濃度の分布と領域の濃度分布から所定情報の記入の有無の判定を行う。そして、第2領域検出手段は、記入有無判定部によって所定の情報の記入があると判定された領域で隣り合う物同士を連結することにより所定情報の記入範囲を含む領域、つまり文字または文字群の領域を検出する。
以上説明したように本発明によれば、文字などの所定情報が記入された原画像より背景ノイズの影響を除き、その後の処理に寄与できる画像処理装置、画像処理プログラムおよび画像処理方法を提供することができる。
以下、本発明の実施の形態を図面を参照して詳細に説明する。
(第1実施形態)
図1は本発明に係る第1実施形態の画像処理装置の構成を示す図、図2は図1の画像処理装置の動作を示すフローチャートである。
第1実施形態の画像処理装置は、図1に示すように、スキャナ1とこのスキャナ1を接続したコンピュータ3(以下PC3と称す)とから構成されている。
スキャナ1は、文字認識対象の帳票の表面の画像を読み取り取得する画像取得手段として機能する。帳票には、所定の情報として文字が記入されているものとする。以下、この発明では、「記入」とは、文字などが手書きされた場合と、印刷された場合の双方の意味を含む。画像情報は、スキャナ1に限らず、文書ファイルからの変換によって取得しても良い。また他のコンピュータに蓄積されている画像情報をLANなどのネットワークを通じてPC3が取得しても良い。
PC3の機能は、CPU、RAM、ROMなどのメモリ、ハードディスク装置などの補助記憶装置、キーボードなどの入力装置およびマウスなどの指示装置、モニタなどの表示装置、スキャナ1とのインターフェースボードなどのハードウェアと、オペレーティングシステム(以下OSと称す)および文字認識アプリケーションソフトウェアなどのプログラムとが協動して実現される。
具体的には、PC3は、操作部10、原画像記憶部11、背景濃度分布推定部12、領域濃度分布推定部13、記入有無判定部14、判定結果出力部15などの機能を有している。
操作部10は、例えばキーボート、マウスなどの入力装置、表示装置などを含むものであり、PC3に対して画像処理のために行れた操作を受け付ける。例えば操作部10は、画像の中の処理対象の領域を指定する手段として機能する。
原画像記憶部11には、スキャナ1によって取得された画像情報(以下原画像と称す)が記憶される。
背景濃度分布推定部12は、原画像記憶部11に記憶されている処理対象の原画像を読み出してその原画像の領域のうちで背景となる領域の画素の濃度分布を推定する。つまり背景濃度分布推定部12は、入力された画像の背景領域の画素の濃度分布を推定する。背景濃度分布推定部12は、原画像において文字認識対象のイメージと隣接する背景部分における画素の濃度分布を推定するものである。
具体的には、原画像中で文字認識対象のイメージがない余白部分の領域または予め用意した白紙帳票の領域を参照領域とし、この参照領域の画素の濃度分布のヒストグラムを作成し、これを用いることによって原画像において文字認識対象のイメージと隣接する背景部分の画素の濃度(背景濃度)の分布を推定する。
図16に、罫線31で設けられた文字記入領域に「354」などの数字が記入されている帳票30を示す。この帳票30において、文字認識対象である数字の「5」に隣接する背景部分32の濃度分布を推定するとき、例えば余白部分33を参照領域として指定し、この余白部分33の画素の濃度分布に基づいて、背景部分32の画素の濃度分布を推定する。
上記参照領域としては、帳票の種類毎に参照領域の座標値を背景濃度分布推定部12内に設けたメモりに予め記憶しておき、背景濃度分布の推定をするたびに、その帳票に対応付けられてメモりに記憶されている参照領域の座標値を読み出して、原画像記憶部11に記憶されている原画像における参照領域として特定すればよい。これ以外に、例えばメモリに保存しておいた白紙帳票の画像を参照領域の画像として読み出しても良い。更に、原画像を表示装置に表示し、マウスで原画像上の領域を指定することで参照領域を指定しても良い。
領域濃度分布推定部13は、原画像記憶部11から原画像を読み出し、指定された領域の濃度分布を推定する。つまり、領域濃度分布推定部13は、原画像中で指定された領域の画素の濃度分布を推定する。画素の濃度分布は、例えば画素の濃度のヒストグラムを作成することによって推定する。また、この他の濃度分布の推定方法としては、例えばk-means法などを用いることもでき、濃度の確率分布を推定できる方法ならばどのような方法を用いてもよい。
濃度分布の推定をする指定領域の指定方法は、次の通りである。まず、図示しない領域濃度分布推定部13内に設けたメモリに、帳票の種類毎に文字認識対象のイメージが存在する領域を予め座標値として保持しておき、領域濃度分布推定部13がこのメモリに登録された座標値に基づいて指定領域を決定する。例えば、図16に図示した帳票30では、数字「3」、「5」、「4」が記入されている罫線31で囲われたそれぞれの領域が指定領域である。また、指定領域の指定方法は、操作部10の表示装置に表示した原画像をマウスを用いて範囲を指定することでも良い。
記入有無判定部14は、背景濃度分布推定部12により推定された背景画素の濃度分布と、領域濃度分布推定部13により推定された指定領域の画素の濃度分布から指定領域における文字などの所定情報の記入の有無を判定する。この際、記入有無判定部14は、指定領域の濃度分布が、背景の濃度分布からどれだけ逸脱しているかを評価する評価値を求め、その評価値と予め定められた閾値とを比較して、評価値が予め定められた閾値以上の場合は文字の記入があるものと判定し、評価値が閾値未満の場合は文字の記入がないものと判定する。
指定領域の濃度分布が、背景の濃度分布からどれだけ逸脱しているかを評価する評価値としては、画素の濃度をx、背景の濃度分布をf(x)、指定領域の濃度分布をg(x)、とした場合、次の式で求められる評価値E1を用いることができる。
Figure 0004393411
また、上記以外に、次の式で求められる評価値E2を用いることもできる。
Figure 0004393411
ここで用いる評価値としては、指定領域の濃度分布の背景の濃度分布からの逸脱の程度を反映する値ならば、上式で挙げたものに限らずいかなる評価値を用いても良い。
判定結果出力部15は、例えば表示手段(モニタなどの表示装置)、印刷手段(プリンタなどの印刷装置、記憶手段(ハードディスク装置など)のうちの少なくとも1つからなり、記入有無判定部14により判定された結果を出力する。
この第1実施形態の画像処理装置は、PC3に本発明を実現する画像処理認識ソフトウェアを組み込むことによって構成できる。このため、以下ではそのような構成を仮定して説明を行う。但し、本発明は、上記構成それぞれを、専用ハードウェアやその集合体、または分散処理用のコンピュータネットワークなどでハードウェア的に分散して構成してもよく、上述した各部の機能を実現できる構成ならば、ここで挙げた構成に関わらずどのような構成で実装しても良い。また、本発明の機能を実現可能であれば、上記構成のうちすべての構成を備える必要はなく、一部の機能を省いて利用しても良い。
以下、図2のフローチャートを参照してこの第1実施形態の画像処理装置の動作を説明する。
この画像処理装置の場合、オペレータが、例えば文字などが記入された帳票をスキャナ1にセットしてPC3のキーボードまたはマウスにて読み取り操作を行うと、スキャナ1は、帳票の表面をCCDイメージセンサなどでスキャニングして帳票の画像を取得し(図2のS101)、その画像をPC3へ入力する。PC3では、入力された画像が原画像記憶部11に記憶されると共に(S102)、表示装置の画面に表示される。以下、入力された画像を原画像という。
背景濃度分布推定部12は、原画像記憶部11に記憶されている原画像を読み出し、背景画素の濃度分布を推定する(S103)。
領域濃度分布推定部13は、原画像記憶部11に記憶されている原画像を読み出し、図示しないメモリに予め保持されている帳票の種類毎に登録されている指定領域の座標値で特定される原画像における領域の濃度分布を推定する(S104)。所定情報である文字は、例えば英数字、かな、漢字、記号、図形などが該当する。
次に、記入有無判定部14は、背景濃度分布推定部12により推定された背景画素の濃度分布と、領域濃度分布推定部13により推定された指定領域の画素の濃度分布とから原画像の指定領域における文字などの記入の有無を判定する(S105)。
指定領域での文字などの記入の有無が判定されると、判定結果出力部15は、記入有無判定部14により判定された結果を表示装置の画面やプリンタなどへ出力するので(S106)、オペレータは、PC3による画像領域への文字などの記入の有無の判定結果(判定精度など)を確認できる。
このようにこの第1実施形態の画像処理装置によれば、原画像の背景画素の濃度分布を推定した結果と、文字などの記入有無判別対象として指定した領域の濃度分布を推定した結果とから、原画像の指定領域における文字などの記入の有無を判別するので、原画像の背景ノイズが顕著な場合にも文字などの記入の有無を正しく判定することができる。
(第2実施形態)
以下、本発明の第2実施形態の画像処理装置ついて説明する。図3は第2実施形態の画像処理装置の構成を示すブロック図である。
第2実施形態の画像処理装置は、図3に示すように、スキャナ1とPC3とからなる。なおこの第2実施形態において第1実施形態と同様の構成には同一の符号を付しその説明は省略する。
PC3は、操作部10、原画像記憶部11、背景濃度分布推定部12、領域濃度分布推定部13、記入有無判定部14、背景濃度推定部16、背景領域消去部17などから構成されている。
背景濃度分布推定部12は、第1実施形態と同じものであり、背景画素の濃度分布を推定する。
領域濃度分布推定部13は、原画像を分割した各々の小領域について領域内の画素の濃度分布を推定する。濃度分布は、第1実施形態における領域濃度分布推定部13と同等の方法で推定する。
記入有無判定部14は、背景濃度分布推定部12により推定された画素の濃度分布と領域濃度分布推定部13により推定された小領域の濃度分布とに基づいて該当小領域における所定情報の記入の有無を判定する。つまり記入有無判定部14は、原画像を分割した各々の小領域について背景画素の濃度分布及び領域の濃度分布から小領域への文字の記入の有無を判定する。
背景濃度推定部16は、原画像の背景領域の濃度を推定する。背景濃度推定部16は、原画像の予め指定された文字の記入のない領域を参照領域とし、この参照領域上の濃度の中央値を求めることによって背景濃度を推定する。参照領域として、例えば図16に示した帳票30の余白部分33が該当する。参照領域の指定方法としては、予め定めた閾値で原画像に対して仮の二値化を行い、二値化の結果における黒画素が予め定められた距離内に無い画素の集合を参照領域として指定する方法を用いる。この他、背景画素のみからなると期待できる領域を指定する方法ならばいかなる方法を用いても良い。
背景領域消去部17は、記入有無判定部14により文字の記入がないと判定された原画像の領域を上記背景濃度推定部16により推定された背景濃度で塗りつぶす処理を行う。つまり背景領域消去部17は、記入有無判定部14により文字の記入がないと判定された小領域に対応する原画像の領域の濃度を、背景濃度推定部16により推定された背景濃度で置換する領域濃度置換手段として機能する。
以下、図4〜図7を参照してこの第2実施形態の画像処理装置の動作を説明する。
原画像の領域への分割は、縦方向および横方向に予め指定された間隔で分割することによって行う。例えば図4に示すように、原画像にノイズ51が含まれている場合、記入文字を含むような領域を指定すると、図5に示すように、少なくとも指定領域を含む範囲61が設定されて、その範囲が複数の小領域62に分割される。
原画像の領域を分割する上で、各小領域62の画素数が濃度分布を推定できる程度になる分割方法ならば、原画像の領域をいかなる方法で分割してもよい。
記入有無判定部14は、分割された小領域62の各々について、上記背景濃度分布推定部12で推定された背景画素の濃度分布と、上記領域濃度分布推定部13により推定された指定領域の画素の濃度分布とから当該領域への記入の有無を判定する。つまり記入有無判定部14は、第1実施形態と同等の方法で記入の有無を判定する。
背景領域消去部17は、記入有無判定部14によって記入がないと判定された領域内の画素の濃度を、上記背景濃度推定部16で推定した背景濃度で置換することにより、原画像を修正する。これにより、図6に示すように、背景に存在するはずのノイズが消去された状態の画像が得られる。修正された画像は、画像出力部18により紙、表示画面またはファイルなどへ出力される。領域内の画素の濃度を背景濃度で置換するということは、領域内を背景と同色で塗りつぶすことと同意である。
この画像処理装置の場合、第1実施形態と同様に、スキャナ1によって帳票の画像が取得されて原画像記憶部11に記憶される(図7のS201〜S202)。
背景濃度分布推定部12は、原画像記憶部11に記憶されている原画像を読み出し、背景画素の濃度分布を推定する(S203)。参照領域は、第1実施例と同様に指定すればよい。
一方、領域濃度分布推定部13は、指定された領域を少なくとも含む範囲を分割対象領域として設定し(S204)、その領域を複数の均等な小領域に分割し(S205)、分割した各々の領域について領域の濃度分布を推定する(S206)。所望の領域とは、少なくとも文字が記入されている部分を含むようなノイズを消去する画像の範囲である。
記入有無判定部14は、原画像を分割した各々の小領域62について背景画素濃度分布及び領域の濃度分布から、その小領域62内に文字の記入があるか否か(記入の有無)を判定する(S207)。文字の記入の有無については、単なるノイズ程度の濃度分布か、それ以上の濃度分布かによって判定する。文字としては、例えば英数字、かな、漢字、記号、図形などが該当する。
この判定の結果、小領域62に文字などの記入がないものと判定された場合(S208のNo)、背景領域消去部17は、記入有無判定部14により文字の記入がないものと判定された小領域62内の画素の濃度を、背景濃度推定部16により推定された背景濃度へ置換することにより原画像を修正する(S209)。つまり、背景領域消去部17は、記入有無判定部14により記入がないと判定された該当小領域62を、上記背景濃度推定部16で推定された背景濃度で塗りつぶす。
これにより、図6に示すように、背景に存在するノイズが消去された状態の画像が生成される。修正された画像は、画像出力部18によって、原画像のファイルとは別名のファイル名でハードディスク装置へ保存、紙に印刷、表示画面へ表示などの少なくとも1つの画像出力処理が行われる。尚、記入有無判定部14によって小領域62に文字の記入があると判定された場合(S208のYes)、その小領域については、画像の修正処理は行わない。
このようにこの第2実施形態の画像処理装置によれば、第1実施形態の構成に加えて、背景濃度推定部16と背景領域消去部17とを設けたことで、濃度画像中の文字の記入がないと判定できる領域からノイズを除去することができる。
(第3実施形態)
以下、本発明の第3実施形態の画像処理装置を説明する。図8は第3実施形態の画像処理装置の構成を示すブロック図である。
第3実施形態の画像処理装置は、図8に示すように、スキャナ1とPC3とからなる。尚この第3実施形態において第1実施形態と同様の構成には同一の符号を付しその説明は省略する。
PC3は、操作部10、原画像記憶部11、背景濃度分布推定部12、領域濃度分布推定部13、記入有無判定部14、行検出部19、行検出結果出力部20などから構成されている。
背景濃度分布推定部12は、その機能としては第1実施形態と同等であり、背景画素の濃度分布を推定する。
領域濃度分布推定部13は、原画像を長手方向(画像を縦方向に所定間隔で区分する方向)に均等な幅で複数の小領域に分割し、分割した各々の小領域について濃度分布を推定する。濃度分布は、第1実施形態における領域濃度分布推定部と同等の方法で推定する。
行検出部19は、記入有無判定部14によって文字の記入があるものと判定された領域でかつ上下に隣り合うもの同士を連結した領域を文字の高さ(文字の上下の幅)を含む行領域として検出する。尚、行検出部19での行検出方法は、このような方法に限定する必要はない。例えば、文字認識装置において既に公知となっている、行方向に黒画素の数を計数して生成したヒストグラムに基づいて、計数値が所定の値を超えた範囲を行位置として検出するようにしても良い。つまり、行検出部21は、文字の記入があると判定された小領域(横長に区分された領域)から、ある方向、例えば縦方向などに延長される文字の記入幅(文字の高さ)を含む行領域を検出する第1の領域検出手段として機能する。
行検出結果出力部20は、例えば表示手段(モニタなどの表示装置)、印刷手段(プリンタなどの印刷装置)、記憶手段(ハードディスク装置など)のうちの少なくとも1つからなり、行検出部19により求められた行検出結果を出力する。
以下、図9,図10を参照してこの第3実施形態の画像処理装置の動作を説明する。
この画像処理装置の場合、第1実施形態と同様に、スキャナ1によって帳票の画像が取得されて原画像記憶部11に記憶される(図9のS301〜S302)。
背景濃度分布推定部12は、原画像記憶部11に記憶されている原画像を読み出し、指定された参照領域について、その背景画素の濃度分布を推定する(S303)。
一方、領域濃度分布推定部13は、指定された領域を少なくとも含む範囲を分割対象領域として設定し(S304)、その分割対象領域を長手方向(縦方向)に細長く複数の均等な小領域に分割し(S305)、長手方向に細長く分割した各々の領域について領域の濃度分布を推定する(S306)。所望の領域とは、少なくとも文字が記入されている部分を含むようなノイズを消去する画像の範囲である。
すなわち、領域濃度分布推定部13は、原画像を縦方向に予め設定された間隔で分割することによって原画像を行方向に均等な複数の小領域に分割する。
例えば、図4に示した原画像の指定領域を長手方向(画像を縦方向に所定間隔で区分する方向:第1の方向)に分割すると、原画像は、図10に示すように、長手方向(画像を縦方向に所定間隔で区分する方向)に等分割された複数の小領域71〜76が生成される。この例では、原画像を長手方向(画像を縦方向に所定間隔で区分する方向)に等間隔に分割して複数の小領域71〜76を生成したが、領域分割は、この例のように一定間隔とする必要はなく、行の位置によらず行の上端と下端が分割境界のいずれかと近接すると期待できる方法ならばいかなる方法を用いても良い。
記入有無判定部14は、分割された各々の行の小領域71〜76について、上記背景濃度分布推定部12で推定された背景画素の濃度分布と、上記領域濃度分布推定部13により推定された指定領域の画素の濃度分布とから当該小領域への文字の記入の有無を判定する(S307)。文字の記入の有無は、第1実施形態と同等の方法で判定する。
行検出部19は、記入有無判定部14によって記入が有ると判定された領域でかつ上下に隣り合う物同士を連結して文字の高さの幅の行領域を検出する(S308)。
図10の例では、原画像が上から順に小領域71,72,73,74,75,76に分割され、小領域71,72,75,76が文字の記入なし、小領域73,74に文字が記入されているものと判定されることになり、この場合、行検出部19によって上の小領域73とその下の小領域74とが連結され、この連結された領域が、記入されている文字の高さの幅を少なくとも含む行領域として検出される。
このようにして行検出部19によって行領域が検出されると、行検出結果出力部20は、行領域検出結果を、表示装置の画面やプリンタなどへ出力するので(S309)、オペレータは、PC3による行領域検出結果を確認できる。
このようにこの第3実施形態の画像処理装置によれば、原画像の処理対象領域を縦方向に複数の小領域に分割し、各々の小領域について文字の有無を判定したときに、文字が存在するものと判定された小領域同士を連結して文字または文字群(文字列)の行領域を検出する行検出部19を設けたことで、ノイズの影響を受けずに、原画像に記入されている文字または文字群(文字列)の行を正しく検出することができる。
(第4実施形態)
以下、本発明の第4実施形態を説明する。図11は第4実施形態の画像処理装置の構成を示すブロック図である。
第4実施形態の画像処理装置は、図11に示すように、スキャナ1とPC3とからなる。尚この第4実施形態において第1実施形態と同様の構成には同一の符号を付しその説明は省略する。
PC3は、操作部10、原画像記憶部11、背景濃度分布推定部12、領域濃度分布推定部13、記入有無判定部14、行検出部21、文字領域検出部22、文字領域検出結果出力部23などから構成されている。
背景濃度分布推定部12は、その機能としては第1実施形態と同等であり、背景画素の濃度分布を推定する。
行検出部21は、例えば第3実施形態において説明した領域濃度分布推定部13、記入有無判定部14および行検出部19と同等の機能を有するものであり、原画像から文字の行の領域を検出する。すなわち、行検出部21は、原画像の領域のうちで、指定領域を長手方向に分割した各々の小領域の濃度分布を推定する第1領域濃度分布推定部として機能する。また、行検出部21は、背景濃度分布推定部12により推定された背景領域の画素の濃度分布と自身が推定した小領域の濃度分布とを基に該当小領域への文字の記入の有無を判定する第1記入有無判定部として機能する。さらに、行検出部21は、文字の記入があると判定した小領域でかつ上下に隣り合うもの同士を連結して文字の記入幅を含む領域である行領域を検出する。
行領域の検出方法については、第3実施形態で説明した方法に限定する必要はなく、行を検出できる方法ならばいかなる方法を用いてもよい。
領域濃度分布推定部13は、行検出部21で検出された行領域を長手方向と直交する方第2の方向(行領域を横方向に所定間隔で区分する方向)に区分して分割し、分割してできた各々の小領域について濃度分布を推定する第2領域濃度分布推定部として機能する。つまり領域濃度分布推定部13は、行検出部21により検出された文字が含まれている行領域を、左右が等間隔となるように第2の方向に区分しさらに小さな複数の小領域に分割し、分割した各々の小領域について濃度分布を推定する。濃度分布については、領域濃度分布推定部13は、第1実施形態における領域濃度分布推定部13と同等の方法で推定する。
尚、この例では、行領域の分割方向を長手方向と直交する第2の方向(左右方向)としたが、必ずしも直交する必要はなく、行領域を細かく分割できれば、いずれの方向であっても良い。例えば斜め方向(交差する方向)や曲線で分割しても良い。
記入有無判定部14は、背景濃度分布推定部12により推定された背景領域の画素の濃度分布と領域濃度分布推定部13により推定された小領域の濃度分布とに基づいて該当小領域への文字の記入の有無を判定する第2記入有無判定部として機能する。つまり、記入有無判定部14は、行領域を分割してできた各々の小領域について背景画素の濃度の分布と、領域の濃度分布とから記入の有無の判定を行う。尚記入の有無については、第1実施形態と同等の方法で判定する。
文字領域検出部22は、記入有無判定部14によって文字の記入があるものと判定された小領域で左右に隣り合う物同士を連結することにより文字または文字群(文字列)の領域を検出する。すなわち、文字領域検出部22は、記入有無判定部14により文字の記入があると判定された小領域でかつ左右に隣り合うもの同士を連結して文字の記入範囲を含む領域、つまり文字を囲む領域(文字領域)を検出する第2の検出手段として機能する。
以下、図12を参照してこの第4実施形態の画像処理装置の動作を説明する。
この第4実施形態の画像処理装置の場合、第1実施形態と同様に、スキャナ1によって帳票の画像が取得されて原画像記憶部11に記憶される(図12のS401〜S402)。
背景濃度分布推定部12は、原画像記憶部11に記憶されている原画像を読み出し、背景画素の濃度分布を推定する(S403)。参照領域は、操作部10より指定する他、処理対象の画像がほぼ決まった大きさの場合、予め参照する領域を設定しておいても良く、また処理対象の画像とは別の画像、または別の画像領域であっても良い。つまり、参照領域は、帳票表面全体の画素濃度を推定するための領域である。
一方、行検出部21は、例えば第3実施形態で示した図9のS305〜S309の行領域検出処理を実行することで(S404)、原画像の指定領域内において、文字が記入されている行領域を検出する。
具体的には、行検出部21は、原画像記憶部11より読み出した原画像を画面に表示すると共に、領域の指定を促す表示を行う。
ここで、オペレータが原画像のうちの所望の領域を操作部10によって指定操作すると、行検出部21は、指定された領域を少なくとも含む範囲を分割対象領域として設定し、その分割対象領域を横方向に複数の均等な小領域に分割し、横方向に分割した各々の領域について領域の濃度分布を推定する。そして、行検出部21は、原画像記憶部11より読み出した原画像を画面に表示すると共に、領域の指定を促す表示を行う。
ここで、オペレータが原画像のうちの所望の領域を操作部10によって指定操作すると、行検出部21は、指定された領域を少なくとも含む範囲を分割対象領域として設定し、その分割対象領域を長手方向に細長い複数の均等な小領域に分割し、長手方向に細長く分割した各々の小領域について領域の濃度分布を推定する。
行検出部21は、分割された各々の細長い小領域(図10の小領域71〜76)について、推定した背景画素の濃度分布と、指定領域の画素の濃度分布とから当該小領域への文字の記入の有無を判定する。最後に、行検出部21は、文字の記入が有ると判定した領域でかつ上下に隣り合う物同士を連結して文字の高さの幅の行領域(図10の小領域73と小領域74を連結した領域)を検出する。
このようにして文字が記入されている行領域が行検出部21によって検出されると、領域濃度分布推定部13は、行検出部21で検出された行領域を横方向に所定間隔で均等に区分して行領域を分割して(S405)、行領域を更に細分化した複数の小領域を生成し、各々の小領域について濃度分布を推定する(S406)。
つまり、行検出部21が指定領域内において、まず行領域を検出した後、領域濃度分布推定部13は、その行領域をさらに横方向(列方向)に予め指定された間隔で分割することによってさらに細分化した小領域に分割する。
例えば、図4の原画像の指定領域を行方向に分割して行を検出すると、図10に示した小領域73と小領域74とを連結した行領域が生成され、その生成された行領域を、更に横方向に所定間隔で区分し分割すると、図13に示すように、行領域は、細かな複数の小領域a〜qに分割される。
行領域を分割する上では、一定間隔でなくとも、文字の位置によらず文字の左端と右端が分割境界のいずれかと近接すると期待できる方法ならばいかなる方法で領域分割しても良い。
領域濃度分布推定部13によって小領域の濃度分布が推定されると、記入有無判定部14は、行領域を分割してできた各々の小領域a〜qについて背景画素の濃度の分布と、その領域の濃度分布とから文字の記入の有無を判定する(S407)。
そして、文字領域検出部22は、記入有無判定部14によって文字の記入があるものと判定された小領域g〜lでかつ左右に隣り合う物同士を連結することにより文字または文字群(文字列)の領域を検出する(S408)。この領域を、所定情報の記入範囲を含む領域という。
すなわち、原画像を初めに分割して得た行領域は、記入有無判定部14によって、例えば左から順に縦方向に複数の均等な小領域a〜qに分割され、このうち小領域a〜f,m〜qについては記入なし、小領域g〜lについては記入ありと判定される。この場合、文字領域検出部22は、記入ありと判定された複数の小領域g〜lを左右に隣り合うもの同士を連結した領域を文字または文字群(文字列)の領域として検出する。
このようにして行検出部19によって文字または文字群(文字列)の領域が検出されると、文字領域検出結果出力部23は、文字領域検出結果を、表示装置の画面やプリンタなどへ出力するので(S409)、オペレータは、PC3による文字領域検出結果を確認できる。
このようにこの第4実施形態の画像処理装置によれば、第3実施形態の領域濃度分布推定部13、記入有無判定部14および行検出部19の機能を有する行検出部21と、この行検出部21が検出した行領域をさらに細分化した各々の小領域a〜qの文字の記入の有無の判定結果から文字領域を検出する文字領域検出部22とを設けたことで、ノイズの影響を受けずに文字または文字群の領域を正しく検出することができる。
(第5実施形態)
以下、本発明の第5実施形態の画像処理装置について説明する。図14は第5実施形態の画像処理装置の構成を示すブロック図である。この第5実施形態の画像処理装置は、各画素が複数の濃度値の組で表現されるカラー画像を原画像として処理する例である。
この第5実施形態の画像処理装置は、図14に示すように、スキャナ1とPC3とからなる。尚この第5実施形態において第1実施形態および第2実施形態と同様の構成には同一の符号を付しその説明は省略する。
PC3は、操作部10、原画像記憶部11、記入有無判定部14、濃度値変換部24、背景濃度分布推定部25、領域濃度分布推定部26、背景濃度推定部27、背景領域消去部17、画像出力部18などから構成されている。
原画像記憶部11には、スキャナ1から入力されたカラー画像が原画像として記憶される。濃度値変換部24は、原画像記憶部11の原画像の各画素の濃度値の組を原画像の濃度値の組と同一または異なる表現形式の濃度値の組に変換する。
背景濃度分布推定部25は、原画像の背景画素について濃度値変換部24により変換された濃度の分布を推定する。
領域濃度分布推定部26は、原画像を分割した各々の領域について濃度値変換部24により変換された濃度の分布を推定する。
背景濃度推定部27は、原画像の背景濃度を推定する。
記入有無判定部14は、原画像を分割した各々の領域について背景画素の濃度分布と領域の濃度分布とから、指定された領域への文字の記入の有無を判定する。
背景領域消去部17は、記入有無判定部14により文字の記入がないものと判定された領域内の画素の濃度の組を、背景濃度推定部27により推定された背景濃度の組で置換することにより原画像を修正し、画像出力部18へ渡し、画像出力部18は受け取った出力画像を出力する。
濃度値変換部24は、原画像の各画素の濃度値のM個の組を、原画像の濃度値の組と同一または近似する表現形式のN個の濃度値の組に変換する。
背景濃度推定部27は、スキャナ1から入力された原画像の領域内で予め指定された領域を参照領域とし、例えば一例として上記参照領域上の濃度X(i)の中央値を濃度値の番号i毎に求めることによって背景濃度を推定する。これ以外に、参照領域の濃度値の組として代表的な組を求める方法ならばここに挙げた方法に限らずいかなる方法を用いても良い。
上記参照領域の指定方法としては、例えば予め定めた閾値で原画像に対して仮の二値化を行い、上記二値化の結果における黒画素が予め定められた距離内に無い画素の集合を参照領域として指定する。これ以外に、参照領域の指定方法としては、背景画素のみからなると期待できる領域を指定する方法ならばいかなる方法を用いても良い。
背景濃度分布推定部25は、第1実施形態における背景濃度分布推定部12とほぼ同等であり、背景画素の濃度分布を推定する。背景濃度分布推定部25と、第1実施形態における背景濃度分布推定部12とで異なる点は、第1実施形態における背景濃度分布推定部12では分布の推定対象がモノクロ画像を想定したもののため単一の濃度値であったのに対し、この第5実施形態の背景濃度分布推定部25では、分布の推定対象が濃度値変換部24によって変換された濃度値の組である点である。
領域濃度分布推定部26は、原画像を分割した領域の各々について濃度値変換部24により変換された濃度分布を推定する。濃度分布自体は、第1実施形態における領域濃度分布推定部とほぼ同等の方法で推定する。
この第5実施形態の領域濃度分布推定部26と、第1実施形態における領域濃度分布推定部13とで異なる点は、第1実施形態における領域濃度分布推定部13では、分布の推定対象がモノクロ画像を想定したもののため単一の濃度値であったのに対し、この第5実施形態の領域濃度分布推定部26では、分布の推定対象が濃度値変換部24によって変換された濃度値の組である点である。また、この第5実施形態の画像処理装置では、第2実施形態における領域分割と同等の方法で原画像を分割する。
記入有無判定部14は、背景濃度分布推定部25により推定された背景画素の濃度分布と、領域濃度分布推定部26により推定された指定領域の画素の濃度分布とから指定領域への文字の記入の有無を判定する。文字の記入の有無については、指定領域の濃度値の組の分布が、背景の濃度値の組の分布からどれだけ逸脱しているかを評価する評価値を求め、その評価値と予め定められた閾値とを比較し、評価値が予め定められた閾値以上の場合は文字の記入あり、閾値未満の場合は文字の記入なしと判定する。
指定領域の濃度の組の分布が、背景の濃度の組の分布からどれだけ逸脱しているかを評価する評価値としては、画素の濃度値の組(Y(1),…Y(N))に対し、背景の濃度分布をf(Y(1),…Y(N))、指定領域の濃度分布をg(Y(1),…Y(N))とした場合、以下の式で求められる評価値E3を用いる。
Figure 0004393411
また、上記以外に、次の式で求められる評価値E4を用いることもできる。
Figure 0004393411
ここで用いる評価値は、指定領域の濃度分布の背景の濃度分布からの逸脱の程度を反映する値ならば、上式で挙げたものに限らずいかなる評価値を用いても良い。
背景領域消去部17は、記入有無判定部14において文字の記入がないものと判定された原画像の領域内の画素の濃度の組を、背景濃度推定部27で推定された濃度の組で置換することにより、原画像を修正し、出力画像を生成する。すなわち、背景領域消去部17は、記入有無判定部14により文字の記入がないものと判定された該当領域内の濃度の組を、背景濃度推定部27により推定された背景濃度の組で置換する領域濃度置換手段として機能する。
後処理として、PC3に、例えば文字認識ソフトウェアがインストールされている場合、文字認識ソフトウェアを起動して、ノイズを除去した画像に対して文字認識処理を実行する。
この場合、文字認識ソフトウェアは、画像出力部18に出力された画像(ノイズ除去済みの画像)を用いて文字認識処理を実行することで、高精度な文字認識結果を得ることができる。
以下、図15のフローチャートを参照してこの第5実施形態の画像処理装置の動作を説明する。
この画像処理装置の場合、第1実施形態と同様に、スキャナ1によって帳票の画像が取得されて原画像記憶部11に記憶される(図15のS501〜S502)。
濃度値変換部24は、原画像記憶部11に記憶された原画像(入力画像)を読み出して原画像の各画素の濃度値のM個の組を、原画像の濃度値の組と同一または異なる表現形式のN個の濃度値の組に変換する(S503)。
この例のように原画像がカラー画像の場合、原画像の各画素は、複数の濃度値によって表現されるが、以下では各画素を構成する濃度値の個数をM、濃度値の番号をi、i番目の濃度値をX(i)と表現する。
以下では、変換後の濃度の番号をj、変換後のj番目の濃度値を画像処理装置(j)と表現する。変換後の濃度値の個数:Nは1以上であれば、M以上でもM未満でも良い。
例えば、原画像がRGB形式の3値で表現されており、X(1)を赤色成分の濃度値、X(2)を緑色成分の濃度値、X(3)を青色成分の濃度値とした場合、N=3であるが、N=3でY(1)=X(1),Y(2)=X(2),Y(3)=X(3)としても良く、N=1でY(1)=(X(1)+X(2)+X(3))/3としても良く、N=3とし、Y(1)をHSI表色系の色相値、Y(2)を彩度値、Y(3)を明度値としても良く、Y(j)の算出方法としては、ここに挙げた方法に限らず、原画像の各画素の濃度値の組からの算出方法ならばいかなる方法を用いても良い。
背景濃度分布推定部25は、濃度値変換部24により変換された濃度値の画像領域内の指定された参照領域について、その背景画素の濃度分布を推定する(S504)。参照領域は、操作部10より指定する他、処理対象の画像がほぼ決まった大きさの場合、予め参照する領域をメモリなどに設定しておいても良く、また処理対象の画像とは別の画像、または別の画像領域であっても良い。つまり、参照領域は、帳票表面全体の画素濃度を推定するための領域である。
一方、領域濃度分布推定部26は、濃度値変換部24により変換された濃度値の画像を画面に表示すると共に、領域の指定を促す表示を行う。
領域濃度分布推定部26は、指定された領域を少なくとも含む範囲を分割対象領域として設定し(S505)、その領域を複数の均等な小領域に分割し(S506)、分割した各々の領域について領域の濃度分布を推定する(S507)。所望の領域とは、少なくとも文字が記入されている部分を含むようなノイズを消去する画像の範囲である。
記入有無判定部14は、原画像を分割した各々の小領域62について背景画素濃度分布及び領域の濃度分布から、その小領域62内に文字などの記入があるか否か(記入の有無)を判定する(S508)。文字などの記入の有無については、単なるノイズ程度の濃度分布か、それ以上の濃度分布かによって判定する。文字としては、例えば英数字、かな、漢字、記号、図形などが該当する。
この判定の結果、記入有無判定部14により小領域に文字の記入がないものと判定された場合(S509のNo)、背景領域消去部17は、文字の記入がない該当小領域内の画素の濃度の組を、背景濃度推定部27により推定された背景濃度の組で置換することにより原画像を修正し(S510)、画像出力部18へ渡し、画像出力部18は受け取った出力画像を出力する。
これにより、背景に存在するはずのノイズが消去された状態のカラー画像が生成される。修正されたカラー画像は、画像出力部18によって、原画像のファイルとは別名のファイル名でハードディスク装置へ保存、紙に印刷、表示画面へ表示などの少なくとも1つの画像出力処理が行われる。尚、記入有無判定部14によって小領域に文字の記入があるものと判定された場合(S509のYes)、その小領域については、画像の修正処理は行わない。
このようにこの第5実施形態の画像処理装置によれば、原画像に対して濃度を変換する濃度値変換部24と、背景濃度の組を推定する背景濃度推定部27と、文字の記入がない領域内の画素の濃度の組を背景濃度推定部27が推定した背景濃度の組で置換して画像を修正する背景領域消去部17とを設けたことで、スキャナ1から入力される画像がカラー画像の場合であってもノイズの影響を受けずに、濃度画像中の文字の記入がないと判定できる領域からノイズを除去することができる。
すなわち、上記実施形態によれば、記入有無判定部14は、画像全体の濃度分布が推定できる程度の画素数の領域を参照領域として、文字が記入されているべき指定領域について記入の有無を判定することによって、背景ノイズが顕著で画素単体の濃度では文字の記入とノイズの区別がつかないような画像における、文字などの記入の有無の判定、濃度画像からのノイズの除去、行の検出、文字または文字群(文字列)の領域の検出を、より安定して行うことができる。
尚、本発明は上記第1〜第5実施形態に限定されるものではない。
上記した実施形態では、背景濃度分布推定部と背景濃度推定部によりそれぞれ背景濃度分布と背景濃度とを計算して求める例について説明したが、背景濃度分布と背景濃度を、例えば特定の値を決めてROMなどに登録しておき、その値を使用しても良い。
第1実施形態の画像処理装置の構成を示すブロック図。 第1実施形態の画像処理装置の動作を示すフローチャート。 第2実施形態の画像処理装置の構成を示すブロック図。 背景にノイズが含まれた原画像の一例を示す図。 原画像を細かな領域に分割した一例を示す図。 原画像の背景よりノイズを除去した画像の一例を示す図。 第2実施形態の画像処理装置の動作を示すフローチャート。 第3実施形態の画像処理装置の構成を示すブロック図。 第3実施形態の画像処理装置の動作を示すフローチャート。 第3実施形態の画像処理装置において行領域検出の一例を示す図。 第4実施形態の画像処理装置の構成を示すブロック図。 第4実施形態の画像処理装置の動作を示すフローチャート。 第4実施形態の画像処理装置において文字領域検出の一例を示す図。 第5実施形態の画像処理装置の構成を示すブロック図。 第5実施形態の画像処理装置の動作を示すフローチャート。 帳票の構成の一例を示す図。
符号の説明
1…スキャナ、3…コンピュータ(PC)、10…操作部、11…原画像記憶部、12…背景濃度分布推定部、13…領域濃度分布推定部、14…記入有無判定部、15…判定結果出力部、16…背景濃度推定部、17…背景領域消去部、18…画像出力部、19…行検出部、20…行検出結果出力部、21…行検出部、22…文字領域検出部、23…文字領域検出結果出力部、24…濃度値変換部、25…背景濃度分布推定部、26…領域濃度分布推定部、27…背景濃度推定部。

Claims (7)

  1. 処理対象の画像の領域のうちで、記入がない余白部分または予め用意した白紙帳票の領域の濃度分布を背景領域の画素の濃度分布として求める背景濃度分布導出部と、
    前記画像の領域のうちで、任意に指定された指定領域の濃度分布を求める領域濃度分布導出部と、
    前記背景領域の濃度分布に対する前記指定領域の濃度分布の逸脱の程度を示す評価値を求め、前記評価値が予め定められた閾値以上の場合は前記指定領域への文字の記入があるものと判定し、前記評価値が閾値未満の場合は前記指定領域への文字の記入がないものと判定する記入有無判定部と
    を具備することを特徴とした画像処理装置。
  2. 処理対象の画像の領域のうちで、記入がない余白部分または予め用意した白紙帳票の領域の濃度分布を背景領域の画素の濃度分布として求める背景濃度分布導出部と、
    前記背景領域の画素の濃度を推定する背景濃度推定部と、
    前記画像の領域のうちで、任意に指定された指定領域を分割した各々の小領域の濃度分布を求める領域濃度分布導出部と、
    前記背景領域の濃度分布に対する前記小領域の濃度分布の逸脱の程度を示す評価値を求め、前記評価値が予め定められた閾値以上の場合は前記小領域への文字の記入があるものと判定し、前記評価値が閾値未満の場合は前記小領域への文字の記入がないものと判定する記入有無判定部と、
    前記記入有無判定部により文字の記入がないと判定された前記画像の小領域の画素の濃度を、前記背景濃度推定部により推定された背景領域の画素の濃度へ置換する領域濃度置換手段と
    を具備することを特徴とした画像処理装置。
  3. 処理対象の画像の領域のうちで、記入がない余白部分または予め用意した白紙帳票の領域の濃度分布を背景領域の画素の濃度分布として求める背景濃度分布導出部と、
    前記画像の領域のうちで、任意に指定された指定領域を第1の方向に分割した各々の小領域の濃度分布を求める領域濃度分布導出部と、
    前記背景領域の濃度分布に対する前記小領域の濃度分布の逸脱の程度を示す評価値を求め、前記評価値が予め定められた閾値以上の場合は前記小領域への文字の記入があるものと判定し、前記評価値が閾値未満の場合は前記小領域への文字の記入がないものと判定する記入有無判定部と、
    前記記入有無判定部により文字の記入があると判定された小領域でかつ隣り合うもの同士を連結して一つ以上の文字の記入範囲を検出する領域検出手段と
    を具備することを特徴とした画像処理装置。
  4. 処理対象の画像の領域のうちで、記入がない余白部分または予め用意した白紙帳票の領域の濃度分布を背景領域の画素の濃度分布として求める背景濃度分布導出部と、
    前記画像の領域のうちで、任意に指定された指定領域を第1の方向に分割した各々の小領域の濃度分布を求める第1領域濃度分布導出部と、
    前記背景領域の濃度分布に対する前記小領域の濃度分布の逸脱の程度を示す評価値を求め、前記評価値が予め定められた閾値以上の場合は前記小領域への文字の記入があるものと判定し、前記評価値が閾値未満の場合は前記小領域への文字の記入がないものと判定する第1記入有無判定部と、
    前記第1記入有無判定部により文字の記入があると判定された小領域でかつ上下に隣り合うもの同士を連結して文字の記入方向の領域である行領域を検出する第1の領域検出手段と、
    前記第1の領域検出手段により検出された行領域を前記第1の方向と交差する第2の方向に分割した各々の小領域の濃度分布を求める第2領域濃度分布導出部と、
    前記背景領域の濃度分布に対する前記小領域の濃度分布の逸脱の程度を示す評価値を求め、前記評価値が予め定められた閾値以上の場合は前記小領域への文字の記入があるものと判定し、前記評価値が閾値未満の場合は前記小領域への文字の記入がないものと判定する第2記入有無判定部と、
    前記第2記入有無判定部により文字の記入があると判定された小領域でかつ左右に隣り合うもの同士を連結して一つ以上の文字の記入範囲を検出する第2の領域検出手段と
    を具備することを特徴とした画像処理装置。
  5. 処理対象の画像の領域のうちで、記入がない余白部分または予め用意した白紙帳票の領域の濃度分布を背景領域の画素の濃度分布として求める背景濃度分布導出部と、
    前記画像の領域のうちで、任意に指定された指定領域を第1の方向に分割した各々の小領域の濃度分布を求める第1領域濃度分布導出部と、
    前記背景濃度分布導出部により求められた背景領域の画素の濃度分布と前記第1領域濃度分布導出部により求められた小領域の濃度分布とを基に該当小領域への文字の記入の有無を判定する第1記入有無判定部と、
    前記第1記入有無判定部により文字の記入があると判定された小領域でかつ隣り合うもの同士を連結して一つ以上の文字の記入範囲を検出する第1の領域検出手段と、
    前記第1の領域検出手段により検出された文字の記入範囲を第1の方向と交差する第2の方向に分割した各々の小領域の濃度分布を求める第2領域濃度分布導出部と、
    前記背景濃度分布導出部により求められた背景領域の画素の濃度分布と前第2記領域濃度分布導出部により求められた小領域の濃度分布とを基に該当小領域への文字の記入の有無を判定する第2記入有無判定部と、
    前記第2記入有無判定部により文字の記入があると判定された小領域でかつ隣り合うもの同士を連結して一つ以上の文字の記入範囲を検出する第2の領域検出手段と
    を具備することを特徴とした画像処理装置。
  6. コンピュータに画像処理を実行させる画像処理プログラムにおいて、
    前記コンピュータを、
    処理対象の画像の領域のうちで、記入がない余白部分または予め用意した白紙帳票の領域の濃度分布を背景領域の画素の濃度分布として求める背景濃度分布導出部と、
    前記画像の領域のうちで、任意に指定された指定領域の濃度分布を求める領域濃度分布導出部と、
    前記背景領域の濃度分布に対する前記指定領域の濃度分布の逸脱の程度を示す評価値を求め、前記評価値が予め定められた閾値以上の場合は前記指定領域への文字の記入があるものと判定し、前記評価値が閾値未満の場合は前記指定領域への文字の記入がないものと判定する記入有無判定部
    として機能させることを特徴とする画像処理プログラム
  7. コンピュータが画像を処理する画像処理方法であって、
    処理対象の画像の領域のうちで、記入がない余白部分または予め用意した白紙帳票の領域の濃度分布を前記コンピュータが背景領域の画素の濃度分布として求めるステップと、
    前記画像の領域のうちで、任意に指定された指定領域の濃度分布を前記コンピュータが求めるステップと、
    前記背景領域の濃度分布に対する前記指定領域の濃度分布の逸脱の程度を示す評価値を前記コンピュータが求め、前記評価値が予め定められた閾値以上の場合は前記指定領域への文字の記入があるものと判定し、前記評価値が閾値未満の場合は前記指定領域への文字の記入がないものと判定するステップと
    を有することを特徴とする画像処理方法
JP2005096213A 2005-03-29 2005-03-29 画像処理装置、画像処理プログラムおよび画像処理方法 Active JP4393411B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2005096213A JP4393411B2 (ja) 2005-03-29 2005-03-29 画像処理装置、画像処理プログラムおよび画像処理方法
CNB2006100674870A CN100530219C (zh) 2005-03-29 2006-03-29 图像处理装置
US11/391,219 US7612918B2 (en) 2005-03-29 2006-03-29 Image processing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005096213A JP4393411B2 (ja) 2005-03-29 2005-03-29 画像処理装置、画像処理プログラムおよび画像処理方法

Publications (2)

Publication Number Publication Date
JP2006277398A JP2006277398A (ja) 2006-10-12
JP4393411B2 true JP4393411B2 (ja) 2010-01-06

Family

ID=37030419

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005096213A Active JP4393411B2 (ja) 2005-03-29 2005-03-29 画像処理装置、画像処理プログラムおよび画像処理方法

Country Status (3)

Country Link
US (1) US7612918B2 (ja)
JP (1) JP4393411B2 (ja)
CN (1) CN100530219C (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7711193B2 (en) * 2006-11-07 2010-05-04 Aol Inc. Recognizing blank and nearly blank images
JP4761217B2 (ja) * 2007-01-17 2011-08-31 富士ゼロックス株式会社 画像処理装置、画像形成装置、画像形成システム、および画像処理プログラム
JP4908301B2 (ja) * 2007-04-24 2012-04-04 京セラミタ株式会社 画像形成装置及び画像形成プログラム
JP4890351B2 (ja) * 2007-05-31 2012-03-07 シャープ株式会社 画像処理装置、画像処理プログラムおよび該画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体、ならびに画像処理方法
US7743086B2 (en) * 2007-06-14 2010-06-22 Microsoft Corporation Distributed kernel density estimation
JP6707825B2 (ja) * 2015-09-14 2020-06-10 富士ゼロックス株式会社 情報処理装置及びプログラム
US11559337B2 (en) * 2018-12-14 2023-01-24 Zimmer Biomet Spine, Inc. Expended tab reinforcement sleeve
JP2021044687A (ja) * 2019-09-11 2021-03-18 京セラドキュメントソリューションズ株式会社 画像処理装置、画像処理方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07113962B2 (ja) 1986-12-19 1995-12-06 マツダ株式会社 画像処理方法
JP2714012B2 (ja) 1988-07-19 1998-02-16 株式会社東芝 宛名領域検出装置
US5179599A (en) * 1991-06-17 1993-01-12 Hewlett-Packard Company Dynamic thresholding system for documents using structural information of the documents
US6323957B1 (en) * 1998-06-01 2001-11-27 Xerox Corporation Background noise removal for a low-cost digital color copier
JP4421761B2 (ja) 1999-12-27 2010-02-24 富士フイルム株式会社 画像処理方法および装置並びに記録媒体
JP3985928B2 (ja) 2000-02-14 2007-10-03 株式会社リコー 画像処理方法、画像処理装置、文字認識装置及び記憶媒体
US6807301B1 (en) * 2000-02-25 2004-10-19 Fujitsu Limited Image production controlling device, image producing device, image production controlling method, and a storage medium
GB2403007B (en) 2000-03-14 2005-03-09 Intel Corp Estimating text color and segmentation of images
US6470094B1 (en) * 2000-03-14 2002-10-22 Intel Corporation Generalized text localization in images
US6473522B1 (en) 2000-03-14 2002-10-29 Intel Corporation Estimating text color and segmentation of images
KR100339691B1 (ko) * 2001-11-03 2002-06-07 한탁돈 코드인식을 위한 장치 및 그 방법

Also Published As

Publication number Publication date
CN1841407A (zh) 2006-10-04
JP2006277398A (ja) 2006-10-12
US7612918B2 (en) 2009-11-03
US20060221410A1 (en) 2006-10-05
CN100530219C (zh) 2009-08-19

Similar Documents

Publication Publication Date Title
JP4393411B2 (ja) 画像処理装置、画像処理プログラムおよび画像処理方法
JP5934762B2 (ja) 文字の形状特徴を使用した文字比較による文書改変検知方法、コンピュータプログラム、記録媒体および情報処理装置
US8194941B2 (en) Character noise eliminating apparatus, character noise eliminating method, and character noise eliminating program
JP2009535899A (ja) 走査されたカラー画像からの複調画像の生成
JP2008198157A (ja) 表認識プログラム、表認識方法および表認識装置
CN103198468B (zh) 图像处理装置、图像处理方法和图像处理系统
JP4764903B2 (ja) テキストマップの中からライン構造を検出する方法および画像処理装置
JP2013500527A (ja) 文書内の表の自動的な位置特定
JP2010074342A (ja) 画像処理装置、画像形成装置、及びプログラム
JPH09311905A (ja) 行検出方法および文字認識装置
JP2021044803A (ja) 画像処理装置、画像処理方法、及びプログラム
JP5046243B2 (ja) 画像処理装置、画像処理方法、およびプログラム
JP2007079586A (ja) 画像処理装置
JP5424694B2 (ja) 画像認識装置、及びプログラム
JP4825888B2 (ja) 文書画像処理装置および文書画像処理方法
JP2007079587A (ja) 画像処理装置
JP4803001B2 (ja) 画像処理装置及び画像処理プログラム
US8589416B2 (en) System and method of performing data processing on similar forms
JP2016181111A (ja) 画像処理装置、及び画像処理プログラム
JP2010044517A (ja) 画像処理装置、画像処理方法、画像処理プログラム及び記録媒体
JP4810995B2 (ja) 画像処理装置、方法及びプログラム
JP5146199B2 (ja) 差分抽出装置及び差分抽出プログラム
JP5298830B2 (ja) 画像処理プログラム、画像処理装置及び画像処理システム
JP5277750B2 (ja) 画像処理プログラム、画像処理装置及び画像処理システム
JP2009272714A (ja) 画像処理装置、画像処理方法、プログラム及びプログラムを記録した記録媒体

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071225

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080222

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080318

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20080530

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090817

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091013

R150 Certificate of patent or registration of utility model

Ref document number: 4393411

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121023

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121023

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131023

Year of fee payment: 4

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350