JP2000231601A - 画像処理装置 - Google Patents

画像処理装置

Info

Publication number
JP2000231601A
JP2000231601A JP11030632A JP3063299A JP2000231601A JP 2000231601 A JP2000231601 A JP 2000231601A JP 11030632 A JP11030632 A JP 11030632A JP 3063299 A JP3063299 A JP 3063299A JP 2000231601 A JP2000231601 A JP 2000231601A
Authority
JP
Japan
Prior art keywords
density
image data
character
data
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP11030632A
Other languages
English (en)
Inventor
Yoshinori Ookuma
好憲 大熊
Koji Ito
晃治 伊東
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP11030632A priority Critical patent/JP2000231601A/ja
Publication of JP2000231601A publication Critical patent/JP2000231601A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 文字と文字記入枠の濃度の関係が一意的に決
まらない場合でも、確実に文字を表す文字データのみを
抽出する。 【解決手段】 画像データ記憶部11に格納された画像
データの濃度分布が、画像データ濃度計数部12より求
められる。左斜め方向濃度計数部13及び右斜め方向濃
度計数部14は、斜め方向の等濃度画素を検出し、その
画素の濃度値を計数する。文字枠は罫線で構成されるの
で、斜め方向には等濃度線が現れない。濃度領域判定部
15は、等濃度画素の濃度の計数結果及び濃度分布を参
照し、文字記入枠データ、文字データ及び下地データの
各濃度範囲を判定する。文字領域検出部16により、文
字データの濃度範囲の画素を黒、その他の濃度範囲の画
素を白とした2値化が行われ、文字データからなる2値
画像が生成される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字記入枠が印刷
された帳票等の媒体を光学的に走査し、該媒体の光情報
を量子化して電気信号に変換するイメージスキャナ等に
接続され、該電気信号からなる画像データから、文字デ
ータまたは文字記入枠情報等を抽出する画像処理装置に
関するものである。
【0002】
【従来の技術】帳票等に記載された文字を読取り、文字
コードに変換するには、イメージスキャナ等の光学機器
からなる画像読取部を用い、該画像読取部で取得した画
像データから文字データを抽出し、この文字データと予
め用意した辞書とを照合する方法がある。このような一
連の処理を広義で文字認識という。文字認識の技術にお
いて、文字記入枠を含む帳票等の画像データから文字デ
ータを抽出する際に、文字記入枠が非ドロップアウトカ
ラーの場合、まず画像データから文字記入枠の位置情報
を検出し、該文字記入枠の位置情報に基づいて文字記入
枠内の文字データを抽出していた。このように、文字記
入枠内に記載された文字データを抽出する画像処理装置
としては、例えば次のような文献に記載された文字切出
装置があった。 文献;特開平3−269690号公報 上記文献に記載された装置は、多値の画像データから濃
度分布を求め、文字記入枠を表す文字記入枠データの濃
度範囲を黒とし、その他の濃度範囲を白として2値画像
を生成して文字記入枠の位置を決定し、該文字記入枠内
に位置する文字データの濃度範囲を黒とし、その他を白
として2値画像を生成し、文字データを取得していた。
【0003】
【発明が解決しようとする課題】しかしながら、前記文
献に記載された文字切出装置等の従来の画像処理装置で
は、次のような課題があった。図2は、帳票の例を示す
図であり、図3は、図2の濃度分布を示す図である。図
2に示すように、文字記入枠1aと該文字記入枠1a内
の文字1bとが印刷或いは記入され、下地1cが白色の
帳票1の画像データからは、例えば図3のように3群2
a,2b,2cに別れた濃度分布が得られる。この濃度
分布に対し、前記文献に記載された装置では、文字1b
の濃度値は文字記入枠1aの濃度値よりも小さい、即
ち、濃度値が黒色方向に位置すると限定し、3群の濃度
分布2a,2b,2cに対し、文字1bが濃度分布2
b、文字記入枠1aが濃度分布2a、帳票1の下地1c
が濃度分布2cに対応すると一意に決定していた。
【0004】ところが、文字1bを表す文字データと文
字記入枠1aを表す文字記入枠データの濃度分布の関係
は一意に決定されるものではなく、文字記入枠1aに記
入した文字色によっては、文字データの濃度値が文字記
入枠データの濃度値よりも大きい場合、つまり、濃度値
が白色方向に位置する場合も考えられる。このため、従
来の画像処理装置では、文字データを正しく抽出できな
い場合があるという問題があった。そこで、本発明は、
多値画像データから取得した濃度分布において、文字デ
ータの濃度分布と文字記入枠データの濃度分布の関係を
自動的に検出することにより、精度良く文字データ或い
は文字記入枠データを検出する画像処理装置を提供する
ことを目的とする。
【0005】
【課題を解決するための手段】前記課題を解決するため
に、本発明のうちの第1の発明は、文字記入枠が印刷さ
れると共に文字が印刷或いは記入された媒体の画像デー
タから文字データのみを抽出する画像処理装置におい
て、次のような画像データ記憶部、画像データ濃度計数
部、複数の方向成分濃度計数手段、濃度領域判定部及び
文字領域検出部を備えている。
【0006】前記画像データ記憶部は、前記媒体を走査
して画素単位に量子化された電気信号を出力する画像読
取部に接続され、該電気信号を前記媒体の多値の前記画
像データとして格納するものである。画像データ濃度計
数部は、前記画像データ記憶部に格納された前記画像デ
ータの濃度分布を求めるものである。複数の方向成分濃
度計数部は、前記画像データに対して予め設定された大
きさの観測窓を用い、指定した方向の隣接画素と着目画
素の濃度値の差が所定の範囲以内の場合、該着目画素の
濃度値を計数する手段である。濃度領域判定部は、前記
各方向成分濃度計数手段の計数結果及び前記濃度分布に
基づき、前記画像データにおける前記文字記入枠に相当
する文字記入枠データ、前記画像データにおける前記文
字に相当する前記文字データ、及び前記画像データにお
ける前記媒体の下地に相当する下地データの各濃度範囲
を判定するものである。文字領域検出部は、前記濃度領
域判定部の判定結果に基づき、前記画像データに対し、
前記文字データの濃度範囲の画素を黒、その他の濃度範
囲の画素を白とした2値化を行い該文字データからなる
2値画像を生成するものである。
【0007】第2の発明では、第1の発明の画像処理装
置における複数の方向成分濃度計数手段のうちの少なく
とも1つは、前記文字記入枠を構成する罫線とは異なる
方向とし、該方向の隣接画素と着目画素の濃度値の差が
所定の範囲以内の場合、該着目画素の濃度値を計数する
構成にしている。第1及び第2の発明によれば、以上の
ように画像処理装置を構成したので、画像データ記憶部
により、媒体の多値の画像データが格納される。画像デ
ータ濃度計数部により、画像データ記憶部に格納された
画像データの濃度分布が求められる。複数の方向成分濃
度計数部により、各方向の等濃度情報が検出され、方向
毎の濃度分布が抽出される。濃度領域判定部により、各
方向成分濃度計数手段の計数結果及び前記画像データの
濃度分布に基づき、画像データにおける文字記入枠に相
当する文字記入枠データ、文字に相当する文字データ、
及び媒体の下地に相当する下地データの各濃度範囲がそ
れぞれ判定される。文字領域検出部により、画像データ
に対し、文字データの濃度範囲の画素を黒、その他の濃
度範囲の画素を白とした2値化を行い該文字データから
なる2値画像を生成される。すなわち、文字データのみ
が抽出される。
【0008】第3の発明は、文字記入枠が印刷されると
共に文字が印刷或いは記入された媒体の画像データから
文字記入枠の位置情報を抽出する画像処理装置におい
て、第1の発明と同様の画像データ記憶部、画像データ
濃度計数部、複数の方向成分濃度計数手段及び濃度領域
判定部を備えると共に、次のような罫線領域検出部及び
表情報作成部を設けている。前記罫線領域検出部は、前
記濃度領域判定部の判定結果に基づき、前記画像データ
に対し、前記文字記入枠データの濃度範囲の画素を黒、
その他の濃度範囲の画素を白とした2値化を行い該文字
記入枠データからなる2値画像を生成するものである。
表情報作成部は、前記罫線領域検出部で生成された2値
画像を走査することにより、前記文字記入枠の座標デー
タを取得するものである。
【0009】第4の発明は、第3の発明の画像処理装置
における複数の方向成分濃度計数手段のうちの少なくと
も1つは、前記文字記入枠を構成する罫線とは異なる方
向とし、該方向の隣接画素と着目画素の濃度値の差が所
定の範囲以内の場合、該着目画素の濃度値を計数する構
成にしている。第3及び第4の発明によれば、以上のよ
うに画像装置を構成したので、第1及び第2の発明と同
様に、画像データ記憶部により、画像データが格納さ
れ、画像濃度計数部により、その画像データの濃度分布
が求められる。複数の方向成分濃度計数部により、各方
向の等濃度情報が検出され、方向毎の濃度分布が抽出さ
れる。濃度領域判定部により、各方向成分濃度計数手段
の計数結果及び前記画像データの濃度分布に基づき、画
像データにおける濃度範囲がそれぞれ判定される。罫線
領域検出部は、画像データに対し、文字記入枠データの
濃度範囲の画素を黒、その他の濃度範囲の画素を白とし
た2値化を行い、文字記入枠データからなる2値画像を
生成する。表情報作成部により、この画像が走査され、
文字記入枠の座標データが取得される。これが、文字記
入枠の位置情報となる。
【0010】第5の発明は、文字記入枠が印刷されると
共に文字が印刷或いは記入された媒体の画像データから
文字データのみを抽出する画像処理装置において、第1
の発明と同様の画像データ記憶部及び画像データ濃度計
数部を備えると共に、次のような濃度勾配画像データ生
成部、文字枠濃度範囲検出部、文字枠データ生成部、文
字枠位置検出部及び文字データ検出部を設けている。前
記濃度勾配画像データ生成部は、前記画像データに対し
て予め設定された観測窓を用い、指定した方向で濃度が
急変する画素を検出すると共に該画素の濃度を検出し、
これらの検出結果で形成される多値の濃度勾配画像デー
タを生成する処理を複数の方向に関して行うものであ
る。文字枠濃度範囲検出部は、前記複数の方向に関する
前記濃度勾配画像データを合成することにより、前記文
字記入枠を表す文字記入枠データの濃度分布を検出し、
該文字記入枠データの濃度範囲を検出するものである。
文字枠データ生成部は、前記文字記入枠データの濃度範
囲内の画素を抽出して2値画像を生成するものである。
文字枠位置検出部は、前記文字枠データ生成部で生成さ
れた前記2値画像の分布に基づき前記文字記入枠の罫線
を構成する画素を検出し、この検出結果から該文字記入
枠の位置情報を抽出するものである。
【0011】文字データ検出部は、前記画像データ濃度
計数部で検出した濃度分布と前記文字枠濃度範囲検出部
で検出した文字記入枠データの濃度分布とを比較するこ
とにより、前記文字データと前記文字記入枠データ及び
下地データを分離するための2値化閾値を複数個検出
し、該文字データと文字記入枠データが接触した場合と
接触しない場合とで2値化閾値を異ならせて、前記画像
データ記憶部に格納した画像データから文字データを検
出するものである。
【0012】第6の発明では、第5の発明の画像処理装
置における前記濃度勾配画像データ生成部は、前記濃度
勾配画像データを求める処理を前記多値の画像データの
水平方向と垂直方向と左斜め方向と右斜め方向とに関し
て行い、それぞれ多値の水平方向濃度勾配画像データと
垂直方向濃度勾配画像データと左斜め方向濃度勾配画像
データと右斜め方向濃度勾配画像データとを生成する構
成にしている。第7の発明では、第6の発明の画像処理
装置における前記文字枠濃度範囲検出部は、前記水平方
向濃度勾配画像データ及び前記垂直方向濃度勾配画像デ
ータを合成した画像と前記左斜め方向濃度勾配画像デー
タ及び前記右斜め方向濃度勾配画像データを合成した画
像との濃度の差分から、前記濃度範囲を求める構成にし
ている。
【0013】第5〜第7の発明によれば、以上のように
画像処理装置を構成したので、第1及び第2の発明と同
様に、画像データ記憶部により、画像データが格納さ
れ、画像データ濃度計数部により、その画像データの濃
度分布が求められる。そして、濃度勾配画像データ生成
部では、画像データに対して予め設定された観測窓を用
い、指定した方向で濃度が急変する画素を検出すると共
に該画素の濃度を検出し、これらの検出結果で形成され
る多値の濃度勾配画像データを生成する処理を複数の方
向に関して行う。文字枠濃度範囲検出部により、複数の
方向に関する濃度勾配画像データが合成され、文字記入
枠データの濃度分布と濃度範囲が検出される。文字枠デ
ータ生成部により、文字記入枠データの濃度範囲内の画
素が抽出されて2値画像か生成される。文字枠位置検出
部により、2値画像の分布に基づき文字記入枠の罫線を
構成する画素が検出され、この検出結果から文字記入枠
の位置情報が抽出される。
【0014】文字データ検出部は、前記画像データ濃度
計数部で検出した濃度分布と前記文字枠濃度範囲検出部
で検出した文字記入枠データの濃度分布とを比較するこ
とにより、前記文字データと前記文字記入枠データ及び
下地データを分離するための2値化閾値を複数個検出
し、該文字データと文字記入枠データが接触した場合と
接触しない場合とで2値化閾値を異ならせて、前記画像
データ記憶部に格納した画像データから文字データを検
出する。
【0015】第8の発明は、下線を含む文字が記載され
た媒体の画像データから文字データのみを抽出する画像
処理装置において、第5の発明と同様の画像データ記憶
部、画像データ濃度計数部及び濃度勾配画像データ生成
部を備えると共に、次のような下線濃度範囲検出部、下
線データ生成部、下線位置検出部及び文字データ検出部
を設けている。
【0016】前記下線濃度範囲検出部は、前記複数の方
向に関する前記濃度勾配画像データから、前記下線を表
す下線データの濃度分布と濃度範囲を検出するものであ
る。下線データ生成部は、前記下線データの濃度範囲内
の画素を抽出して2値画像を生成するものである。下線
位置検出部は、前記下線データ生成部で生成された前記
2値画像の分布に基づき前記下線を構成する画素を検出
し、この検出結果から該下線の位置情報を抽出するもの
である。文字データ検出部は、前記画像データ濃度計数
部で検出した濃度分布と前記下線濃度範囲検出部で検出
した濃度分布とを比較することにより、前記文字データ
と下線データ及び下地データを分離する2値化閾値を複
数個検出し、該文字データと下線データが接触した場合
と接触しない場合とで2値化閾値を異ならせて、前記画
像データ記憶部に格納した画像データから文字データを
検出するものである。
【0017】第9の発明は、第8の発明の画像処理装置
における前記濃度勾配画像データ生成部は、前記濃度勾
配画像データを求める処理を前記多値の画像データの垂
直方向と左斜め方向と右斜め方向とに関して行い、それ
ぞれ多値の垂直方向濃度勾配画像データと左斜め方向濃
度勾配画像データと右斜め方向濃度勾配画像データとを
生成する構成にしている。
【0018】第8及び第9の発明によれば、以上のよう
に画像処理装置を構成したので、第5〜第7の発明と同
様に、画像データ記憶部により、画像データが格納さ
れ、画像データ濃度計数部により、その画像データの濃
度分布が求められる。そして、濃度勾配画像データ生成
部では、画像データに対して予め設定された観測窓を用
い、指定した方向で濃度が急変する画素を検出すると共
に該画素の濃度を検出し、これらの検出結果で形成され
る多値の濃度勾配画像データを生成する処理を複数の方
向に関して行う。下線濃度範囲検出部により、複数の方
向に関する濃度勾配画像データから、下線データの濃度
範囲及び濃度分布が検出される。下線データ生成部によ
り、下線データの濃度範囲内の画素が抽出されて2値画
像が生成され、下線位置検出部により、下線データ生成
部で生成された2値画像の分布に基づき、下線を構成す
る画素が検出される。この検出結果から下線の位置情報
が抽出される。
【0019】文字データ検出部は、前記画像データ濃度
計数部で検出した濃度分布と前記下線濃度範囲検出部で
検出した濃度分布とを比較することにより、前記文字デ
ータと下線データ及び下地データを分離する2値化閾値
を複数個検出し、該文字データと下線データが接触した
場合と接触しない場合とで2値化閾値を異ならせて、前
記画像データ記憶部に格納した画像データから文字デー
タを検出する。
【0020】
【発明の実施の形態】第1の実施形態 図1は、本発明の第1の実施形態を示す画像処理装置の
構成図である。この画像処理装置10は、文字記入枠が
印刷された帳票等の媒体を光学的に走査して光情報を取
得し、該光情報を量子化して電気信号に変換する画像読
取部20に接続され、前記文字記入枠に記入された文字
の文字データを抽出するものであり、画像データ記憶部
11を備えている。画像データ記憶部11は、イメージ
メモリ等で構成され、画像読取部20から与えられた帳
票の多値画像データを記憶するものである。
【0021】画像データ記憶部11には、該画像データ
記憶部11に格納された画像データの各画素の濃度値を
計数すると共に、その濃度分布を求める画像データ濃度
計数部12が接続されている。画像データ濃度計数部1
2には、左斜め方向濃度計数部13と右斜め方向濃度計
数部14とが接続されている。左斜め方向濃度計数部1
3は、画像データ濃度計数部12と相俟って(m×n)
個の観測窓(m,nは例えば3)を用い、着目窓の画素
と着目窓に隣接する左斜め方向の観測窓の画素の濃度値
を検出し、該濃度値の差が所定の範囲以内の場合、着目
窓の画素の濃度値を計数する方向成分濃度計数手段であ
る。右斜め方向濃度計数部14は、画像データ濃度計数
部12と相俟って(m×n)個の観測窓を用い、着目窓
の画素と着目窓に隣接する右斜め方向の観測窓の画素の
濃度値を検出し、該濃度値の差が所定の範囲以内の場
合、着目窓の画素の濃度値を計数する方向成分濃度計数
手段である。
【0022】画像データ濃度計数部12、左斜め方向濃
度計数部13及び右斜め方向濃度計数部14の出力側
に、濃度領域判定部15が接続され、該濃度領域判定部
15の出力側に文字領域検出部16が接続されている。
濃度領域判定部15は、画像データ濃度計数部12が求
めた濃度分布に対し、文字記入枠データの濃度範囲と文
字データの濃度範囲と下地データである白地の濃度範囲
とを判定する手段である。文字領域検出部16は、濃度
領域判定部15の判定結果に基づいて、文字データの濃
度範囲を黒、その他の濃度範囲を白として2値画像を生
成するものである。なお、前記所定の範囲は、経験上に
より設定される閾値である。
【0023】図4は、図1の動作を示すフローチャート
である。この図4を参照しつつ、この画像処理装置の動
作を説明する。この画像処理装置は、図4のS1〜S9
の処理を行い、文字データを抽出する。まず、処理S1
において、画像読取部20は、帳票等の媒体を光学的に
走査し、媒体からの光情報を順次量子化して画素単位の
電気信号に変換する。処理S2において、画像データ記
憶部11は、画像データ読取部20から与えられた電気
信号を多値の画像データとして取り込み、取得した画像
データを、メモリ上にX―Y座標を仮想的に設定して格
納する。
【0024】図5は、図1の濃度検出で用いる観測窓を
示す図である。処理S3において、画像データ濃度計数
部12は、画像データ記憶部11に格納された画像デー
タの各画素の濃度値を計数し、例えば前記図3のような
濃度分布を検出する。この濃度分布の検出には、図5に
示すような(m×n)個の観測窓を設け、該観測窓を用
いて画像データを走査し、例えば観測窓a0から見える
濃度値を計数すれば良い。また、画像データ濃度計数部
12は、該観測窓の走査の際に、着目窓a0の濃度値と
観測窓a1及び観測窓a8の濃度値の差が所定の範囲以
内におさまり、かつ、その他の観測窓の濃度値と着目窓
a0の濃度値の差が所定の範囲外になるような着目窓a
0の濃度値を検出した場合に、左斜め方向濃度計数部1
3にカウント値を加算するように指示する。同様に、画
像データ濃度計数部12は、着目窓a0の濃度値と観測
窓a3及び観測窓a6の濃度値の差が所定の範囲以内に
おさまり、かつ、その他の観測窓の濃度値と前記着目窓
a0の濃度値の差が所定の範囲外になる着目窓a0の濃
度値を検出した場合に、右斜め方向濃度計数部14にカ
ウント値を加算するように指示する。
【0025】図6(a),(b)は、方向成分濃度計数
手段で求めた濃度分布を示す図であり、同図(a)が左
斜め方向濃度計数部13で検出した濃度分布例を示し、
及び同図(b)が右斜め方向濃度計数部14で検出した
濃度分布例を示している。処理S4において、左斜め方
向濃度計数部13は、着目窓a0の濃度値と観測窓a1
及び観測窓a8の濃度値の差が所定の範囲以内におさま
り、その他の観測窓の濃度値とは所定の範囲外となる濃
度値を検出した場合、観測窓a0で観測した濃度値のカ
ウント値を加算し、図6(a)のような分布を抽出す
る。右斜め方向濃度計数部14は、着目窓a0の濃度値
と観測窓a3及び観測窓a6の濃度値の差が所定の範囲
以内におさまり、その他の観測窓の濃度値とは所定の範
囲外となる濃度値を検出した場合、観測窓a0で観測し
た濃度値のカウント値を加算し、図6(b)のような分
布を抽出する。
【0026】処理S5において、濃度領域判定部15
は、図6(a),(b)の分布に基づき、図3の画像デ
ータの濃度分布2a,2b,2cのどれが文字データ、
文字記入枠データ、或いは下地データの領域かを判定す
る。以下に、この処理を詳細に説明する。例えば、(m
×n)の観測窓で画像データを観測した時、文字記入枠
を構成する水平罫線の場合、背景である白地から水平罫
線への濃度変化を窓a0とa4、a5の濃度値、窓al
〜a3の濃度値、窓a6〜a8の濃度値がそれぞれ等し
くなり、窓a0の濃度値よりも窓a2の濃度値が大きい
(または小さい)、窓a0の濃度値よりも窓a7の濃度
値が小さい(または大きい)という状態になる。
【0027】このように画像データの等濃度線は、文字
記入枠や文字を構成する線分の画像データの輪郭線と同
じ方向に形成されることが多い。これは、等濃度線の方
向を検出することにより、文字記入枠や文字を構成する
線分の方向を検出することができることを意味する。よ
って、水平罫線と垂直罫線のみで構成される文字記入枠
データの等濃度線は、水平方向と垂直方向にのみ観察さ
れて検出される。一方、水平/垂直/斜めの各方向の線
分から形成される文字データの等濃度線は、水平/垂直
/斜めの各方向に観察されて検出される。更に、背景の
場合、白地を示す濃度値付近で水平/垂直/斜めの各方
向の等濃度の分布が無作為に抽出できるため、文字デー
タと同様に水平/垂直/斜めの各方向において等濃度の
分布が検出される。
【0028】そこで、濃度領域判定部15は、図6
(a)に示す左斜め方向濃度計数部13で検出した分布
と、図6(b)に示す右斜め方向濃度計数部14で検出
した分布と、図3の画像データの濃度分布とを比較し、
左斜め方向濃度計数部13及び右斜め方向濃度計数部1
4の分布では検出されない濃度Bを文字記入枠データの
濃度位置として判定する。また、濃度Aよりも白色方向
に位置する濃度Cを背景の白地を示す濃度位置、残りの
濃度Aを文字データの濃度位置として判定する。さら
に、濃度領域判定部15は、濃度値A,B,Cを中心と
して文字記入枠データ/文字データ/背景データの各濃
度範囲を決定し、その文字データの濃度範囲を文字領域
検出部16に出力する。
【0029】処理S6〜S8において、文字領域検出部
16は、濃度領域判定部15から文字データの濃度範囲
を取得し、画像データ記憶部11に格納された画像デー
タを走査し、画素の濃度値が文字データの濃度範囲内な
らば黒、その他の濃度範囲内ならば白として2値画像を
生成する。処理S9において、文字領域検出部16は、
2値画像を文字データとし、例えば該文字領域検出部1
6内に設置したイメージメモリ上に格納する。なお、こ
のイメージメモリ上にはX―Y座標を仮想的に設定し、
この座標系で表される位置の画素をこのメモリから読出
せるようにしている。
【0030】以上のように、この第1の実施形態によれ
ば、画像データ濃度計数部12と、左斜め方向濃度計数
部13と、右斜め方向濃度計数部14と、濃度領域判定
部15と、文字領域検出部16とを設けたので、多値画
像データから取得した濃度分布において、文字データの
濃度分布2bと文字記入枠の濃度分布2aの関係を自動
的に検出することができ、精度良く文字データのみを検
出することが可能になる。
【0031】第2の実施形態 図7は、本発明の第2の実施形態を示す画像処理装置の
構成図である。この画像処理装置30は、文字記入枠が
印刷されると共に文字が印刷或いは記入された帳票等の
媒体から前記文字記入枠の位置情報を抽出するものであ
り、該媒体を光学的に走査して光情報を取得し、該光情
報を量子化して電気信号に変換する画像読取部40に接
続された第1の実施形態と同様の画像データ記憶部31
を備えている。画像データ記憶部31には、第1の実施
形態と同様の画像データ濃度計数部32が接続されると
共に、画像データ濃度計数部32には、左斜め方向濃度
計数部33と右斜め方向濃度計数部34とが接続されて
いる。これら左斜め方向濃度計数部33及び右斜め方向
濃度計数部34も第1の実施形態で使用したものと同じ
ものである。
【0032】画像データ濃度計数部32、左斜め方向濃
度計数部33及び右斜め方向濃度計数部34の出力側
に、濃度領域判定部35が接続され、濃度領域判定部3
5の出力側に、罫線領域検出部36が接続されている。
罫線領域検出部36の出力側には、表情報作成部37が
接続されている。濃度領域判定部35は、第1の実施形
態と同様に、画像データ濃度計数部32が求めた濃度分
布に対し、文字記入枠データの濃度範囲と文字データの
濃度範囲と白地データの濃度範囲とを判定する手段であ
る。罫線領域検出部36は、濃度領域判定部35の判定
結果に基づいて、文字記入枠データの濃度範囲を黒、そ
の他の濃度範囲を白として2値画像を生成するものであ
る。表情報作成部37は、罫線領域検出部36が生成し
た2値画像を走査し、水平罫線及び垂直罫線の位置を抽
出し、該抽出した罫線の位置座標に基づいて文字記入枠
の位置座標を検出するものである。
【0033】図8は、図7の動作を示すフローチャート
である。この図7を参照しつつ、この画像処理装置の動
作を説明する。この画像処理装置は、図7のS11〜S
21の処理を行い、文字記入枠データを抽出する。処理
S11〜S14は、第1の実施形態と同様の動作であ
り、これらの処理により、例えば図3の画像データの濃
度分布と、図6(a),(b)の分布とが得られる。
【0034】処理S11〜S14の後の処理S15にお
いて、濃度領域判定部35は、左斜め方向濃度計数部3
3で検出した分布と、右斜め方向濃度計数部34で検出
した分布とを比較し、これらの分布では検出されない濃
度Bを文字記入枠データの濃度位置として判定する。ま
た、図6(a),(b)の濃度Bよりも白色方向に位置
する濃度Cを背景の白地を示す濃度位置、残りの濃度A
を文字データの濃度位置として判定する。さらに、濃度
領域判定部35は、文字記入枠データ/文字データ/背
景データの濃度A,B,Cを中心とし、各濃度範囲を決
定し、文字記入枠データの濃度範囲を罫線領域検出部3
6に出力する。
【0035】処理S16〜S18において、罫線領域検
出部36は、濃度領域判定部35から文字記入枠データ
の濃度範囲を取得し、画像記憶部31に格納された画像
データを走査し、画素の濃度値が文字記入枠データの濃
度範囲内ならば黒、その他の濃度範囲内ならば白として
2値画像を生成する。処理S19において、罫線領域検
出部36は、例えば該罫線領域検出部36内のイメージ
メモリに2値画像を格納する。なお、イメージメモリ上
にはX―Y座標を仮想的に設定し、この座標系で表され
る位置の画素をメモリ上から読出せるようにしている。
処理S20において、表情報作成部37では、罫線領域
検出部36に格納された2値画像データから黒画素の連
結を検出し、該黒画素の連結の外接矩形枠を求め、水平
方向に一定以上の長さを持つ外接矩形枠を水平罫線とし
て抽出し、その座標位置を取得する。同様に、垂直方向
に一定以上の長さを持つ矩形を垂直罫線として抽出し、
その座標位置を取得する。処理S21において、表情報
作成部37は、水平罫線座標および垂直罫線座標に基づ
いて、互いに隣り合った2本の水平罫線と互いに隣り合
った2本の垂直罫線との交点である4つ一組の交点の位
置座標を、表領域を構成する各矩形枠の位置座標として
抽出する。つまり、文字記入枠の位置情報を取得する。
【0036】以上のように、この第2の実施形態によれ
ば、画像データ濃度計数部32と、左斜め方向濃度計数
部33と、右斜め方向濃度計数部34と、濃度領域判定
部35と、罫線領域検出部36と、表情報作成部37を
設けたので、多値画像データから取得した濃度分布にお
いて、文字データの濃度分布と文字記入枠データの濃度
分布の関係を自動的に検出することができ、精度良く文
字記入枠データを検出することが可能になる。
【0037】第3の実施形態 図9は、本発明の第3の実施形態を示す画像処理装置の
構成図である。この画像処理装置50は、文字記入枠が
印刷されると共に文字が印刷或いは記入された帳票等の
媒体から該文字記入枠を表す文字記入枠データを抽出す
るものであり、該媒体を光学的に走査して光情報を取得
し、該光情報を量子化して電気信号に変換する画像読取
部60に接続された第1の実施形態と同様の画像データ
記憶部51を備えている。画像データ記憶部51の出力
側には、水平方向濃度勾配画像データ生成部52a、垂
直方向濃度勾配画像データ生成部52b、左斜め方向濃
度勾配画像データ生成部52c、右斜め方向濃度勾配画
像データ生成部52dからなる濃度勾配画像データ生成
部52と、画像データ濃度計数部53とが接続されてい
る。濃度勾配画像データ生成部52は、(m×n)の観
測窓により画像データ記憶部51に格納した多値画像デ
ータから水平/垂直/左斜め/右斜めの各方向において
濃度勾配が急峻である画素を抽出し、濃度勾配画像デー
タを生成するものである。画像データ濃度計数部53
は、画像データの濃度分布を求めるものである。
【0038】濃度勾配画像データ生成部52の出力側に
は、文字枠濃度範囲検出部54が接続されている。文字
枠濃度範囲検出部54は、濃度勾配画像データ生成部5
2で生成された各方向の濃度勾配画像データを組み合わ
せて文字枠候補データを生成し、文字記入枠データの濃
度分布及び濃度範囲を検出するものである。文字枠濃度
範囲検出部54の出力側には、該文字枠濃度範囲検出部
54で生成した文字記入枠データに対し、その濃度範囲
にある画素を黒、その他を白として2値画像を生成する
文字枠データ生成部55が接続され、該文字枠データ生
成部55の出力側には、文字枠位置検出部56が接続さ
れている。文字枠位置検出部56は、文字枠データ生成
部55で生成した2値画像から、罫線位置を検出するも
のである。文字枠位置検出部56の出力側には、該文字
枠位置検出部56及び文字枠濃度範囲検出部54の検出
結果と画像データ記憶部51からの多値画像と画像デー
タ濃度計数部53で求めた濃度分布とを入力し、該濃度
分布に基づいて、文字枠位置検出部56で検出した罫線
領域と、それ以外の領域とで2値化閾値を異ならせて多
値の画像データを2値化することで文字データを抽出す
る文字データ検出部57が接続されている。
【0039】次に、図9の画像処理装置50の動作を説
明する。図10は、図9の動作を示すフローチャートで
ある。この画像処理装置50は、図10のS31〜S4
1の処理を行い、文字データを抽出する。
【0040】まず、処理S31において、画像読取部6
0は、帳票等の媒体を光学的に走査し、媒体からの光情
報を順次量子化して画素単位の電気信号に変換する。処
理S32において、画像データ記憶部31は、画像デー
タ読取部40から与えられた電気信号を多値の画像デー
タとして取り込み、取得した画像データを、メモリ上に
X―Y座標を仮想的に設定して格納する。処理S33に
おいて、濃度勾配画像データ生成部52は、図5に示す
ような、(m×n)の観測窓を設け、この観測窓を用い
て画像データ記憶部51に格納した画像データを走査
し、着目窓a0の濃度値と隣接する観測窓anの濃度値
の差分が所定の値以上離れている場合、着目窓a0の画
素を抽出し、逆に着目窓a0の濃度値と隣接する観測窓
anの濃度値の差分が所定の値未満であれば、着目窓a
0の画素は抽出しないようにして、濃度勾配画像データ
を生成する。なお、前記所定の値は、経験上により設定
される閾値である。
【0041】濃度勾配画像データは、水平/垂直/左斜
め方向/右斜めの各方向において生成する。具体的に
は、水平方向濃度勾配画像データ生成部52aが、着目
窓a0の濃度値と観測窓a4及び観測窓a5の濃度値の
差分が所定の値以上離れている場合のみ、該着目窓a0
の画素を抽出して水平方向濃度勾配画像データを生成す
る。同様に、垂直方向濃度勾配画像データ生成部52b
が、着目窓a0の濃度値と観測窓a2及び観測窓a7の
濃度値の差分が所定の値以上離れている場合のみ、該着
目窓a0の画素を抽出して垂直方向濃度勾配画像データ
を生成する。左斜め方向濃度勾配画像データ生成部52
cが、着目窓a0の濃度値と観測窓al及び観測窓a8
の濃度値の差分が所定の値以上離れている場合のみ、該
着目窓a0の画素を抽出して左斜め方向濃度勾配画像デ
ータを生成する。右斜め方向濃度勾配画像データ生成部
52dが、着目窓a0の濃度値と観測窓a3及び観測窓
a6の濃度値の差分が所定の値以上離れている場合の
み、着目窓a0の画素を抽出して右斜め方向濃度勾配画
像データを生成する。処理S34において、文字枠濃度
範囲検出部54は、各方向の濃度勾配画像データに基づ
き、文字枠候補データを生成し、さらに、処理S35に
おいて文字記入枠データの濃度分布と濃度範囲を検出す
る。以下に、これらの処理を詳細に説明する。
【0042】例えば、文字記入枠を構成する水平罫線の
場合、下地である白地から水平罫線への濃度変化を(m
×n)の観測窓で観測した時、窓a0と窓a4,a5の
濃度値、窓al〜a3の濃度値、窓a6〜a8の濃度値
がそれぞれ等しくなり、窓a0の濃度値よりも窓a2の
濃度値が大きい(または小さい)、窓a0の濃度値より
も窓a7の濃度値が小さい(または大きい)という状態
になる。このように、画像データは濃度勾配を持ち、そ
の等濃度線は文字記入枠や文字を構成する線分の画像デ
ータの輪郭線と同じ方向で形成されることが多い。これ
は、等濃度線の方向を検出することにより、文字記入枠
や文字を構成する線分の方向を検出することが出来るこ
とを意味すると共に、等濃度線に垂直に交わる濃度勾配
でも文字記入枠や文字を構成する線分の方向を検出する
ことが出来ることを意味する。よって、水平罫線と垂直
罫線で形成される文字記入枠データは、垂直方向の濃度
勾配画像データと水平方向の濃度勾配画像データから検
出できる。また、水平/垂直/左斜め/右斜めの各方向
の線分から形成される文字データは、水平/垂直/左斜
め/右斜めの各方向における濃度勾配画像データから検
出される。
【0043】文字枠濃度範囲検出部54は、処理S34
において、前記水平方向濃度勾配画像データと垂直方向
濃度勾配データとを、例えば論理和を用いて合成し、文
字枠候補データを生成すると共に、該文字枠候補データ
の濃度分布を取得する。さらに、文字枠濃度範囲検出部
54は、処理S35において、前記左斜め方向濃度勾配
画像データと右斜め方向濃度勾配画像データを合成し、
該合成画像の濃度分布を取得する。そして、文字枠候補
データの濃度分布値から、左斜め/右斜め方向濃度勾配
画像データの濃度分布を引いたものを文字記入枠データ
の濃度分布として抽出し、該濃度分布値の最小濃度から
最大濃度値までを文字記入枠データの濃度範囲して出力
する。
【0044】図11は、図10中の処理S37の概要を
示す図である。処理S37において、文字枠位置検出部
56は、文字枠データ生成部55で生成した2値画像デ
ータを取得し、図11に示すように、該2値画像データ
に対し、縦方向の周辺分布58aと横方向の周辺分布5
8bを検出する。各周辺分布58a,58bにおける周
辺分布値が所定の閾値58c,58d以上となる座標位
置を罫線位置として検出し、各罫線の始点座標と終点座
標を抽出する。そして、縦方向および横方向から検出し
た罫線を組み合わせ、その交点を求めることにより文字
記入枠の座標位置を検出する。一方、画像データ濃度計
数部53は、画像データ記憶部51に格納された画像デ
ータの各画素の濃度値を計数し、図3に示すような濃度
分布を検出する。該濃度値の計数には第1及び第2の実
施形態で用いた(m×n)の観測窓を設け、該観測窓を
用いて画像データを走査し、例えば観測窓a0から見え
る濃度値を計数すれば良い。
【0045】処理S38において、文字データ検出部5
7は、画像データ濃度計数部53で取得した画像データ
の濃度分布と文字枠濃度範囲検出部54で検出した文字
記入枠データの濃度分布を比較し、画像データ記憶部5
1に格納された画像データから文字データのみを抽出す
るのに必要な2値化閾値を抽出する。この処理S38を
次の図12を参照して説明する。
【0046】図12は、2値化閾値の抽出例を示す図で
あり、濃度分布を示す図3中の要素と共通の要素には共
通の符号が付されている。画像データ濃度計数部53で
取得した画像データの濃度分布を59とした場合、最も
白側に位置する濃度分布2cが背景の濃度分布に相当す
る。また、文字枠濃度範囲検出部54で検出した文字枠
の濃度範囲と該濃度分布59とを比較することにより、
濃度分布2aと濃度分布2bのどちらが文字記入枠デー
タの濃度分布か判別できる。ここで濃度分布2bを文字
データの濃度分布、濃度分布2aを文字記入枠データの
濃度分布と判定したと仮定すると、文字記入枠データと
文字データが交差しない場合、背景データと文字データ
を分離するには、図12の濃度αを2値化閾値に設定す
れば良い。また、文字記入枠データと文字データが交差
する場合には、文字枠位置検出部56が取得した文字枠
領域内において、文字枠の濃度範囲であるβ−γ間の濃
度値を持つ画素以外を黒画素、β−γ間の濃度値を持つ
画素を白画素として抽出すれば良い。処理S39からS
41において、文字データ検出部57は、画像データ記
憶部51に格納された画像データに対し、濃度αを第1
の2値化閾値とした2値化と、濃度β及びγを第2の2
値化閾値とした2値化を行い、これらから文字データの
画像を抽出する。
【0047】以上のように、この第3の実施形態によれ
ば、画像データ記憶部51と、濃度勾配画像データ生成
部52と、文字枠濃度範囲検出部54と、文字枠データ
生成部55と、文字枠位置検出部56と、画像データ濃
度計数部53と、文字データ検出部57とを設けること
により、文字データの濃度分布と文字記入枠データの濃
度分布の関係を自動的に検出することができ、擦れが少
ない文字データを精度良く抽出することが可能になる。
【0048】第4の実施形態 図13は、本発明の第4の実施形態を示す画像処理装置
の構成図である。この画像処理装置70は、下線を含む
文字列が記載された帳票等の媒体から該文字を表す文字
データを抽出するものであり、該媒体を光学的に走査し
て光情報を取得し、該光情報を量子化して電気信号に変
換する画像読取部80に接続された第1の実施形態と同
様の画像データ記憶部71を備えている。画像データ記
憶部71の出力側には、垂直方向濃度勾配画像データ生
成部72a、左斜め方向濃度勾配画像データ生成部72
b、右斜め方向濃度勾配画像データ生成部72cからな
る濃度勾配画像データ生成部72と、画像データ濃度計
数部73とが接続されている。濃度勾配画像データ生成
部72は、(m×n)の観測窓により画像データ記憶部
71に格納した多値画像データから垂直/左斜め/右斜
めの各方向において濃度勾配が急峻である画素を抽出
し、濃度勾配画像データを生成するものである。画像デ
ータ濃度計数部73は、第3の実施形態と同様に、画像
データの濃度分布を求めるものである。
【0049】濃度勾配画像データ生成部72の出力側に
は、下線濃度範囲検出部74が接続されている。下線濃
度範囲検出部74は、濃度勾配画像データ生成部72で
生成された垂直方向濃度勾配画像データを下線候補デー
タとし、該下線候補データの濃度分布と左斜め及び右斜
め方向濃度勾配画像データの濃度分布から下線データの
濃度範囲を検出するものである。下線濃度範囲検出部7
4の出力側には、該下線濃度範囲検出部74で生成した
下線データに対し、その濃度範囲にある画素を黒、その
他を白として2値画像を生成する下線データ生成部75
が接続され、該下線データ生成部75の出力側には、下
線位置検出部76が接続されている。下線位置検出部7
6は、下線データ生成部75で生成した2値画像から、
下線位置を検出するものである。下線位置検出部76の
出力側には、該下線位置検出部76及び下線濃度範囲検
出部74の検出結果と画像データ記憶部71からの多値
の画像データと画像データ濃度計数部73で求めた濃度
分布とを入力し、該濃度分布に基づいて、下線位置検出
部76で検出した下線領域と、それ以外の領域とで2値
化閾値を異ならせて多値画像データを2値化することで
文字データを抽出する文字データ検出部77が、接続さ
れている。
【0050】図14は、図13の動作を示すフローチャ
ートである。この図13を参照しつつ、この画像処理装
置70の動作を説明する。この画像処理装置70は、図
14の処理S51〜S61を行い、文字データを抽出す
る。以下に、その処理S51〜S61の内容を説明す
る。まず、最初の処理S51とそれに続く処理S52
は、第3の実施形態と同様の処理であり、帳票等の媒体
の多値の画像データが画像データ記憶部71に格納され
る。
【0051】処理S53において、濃度勾配画像データ
生成部72は、図5に示すような(m×n)の観測窓を
設け、この観測窓を用いて画像データ記憶部71に格納
した画像データを走査し、着目窓a0の濃度直と隣接す
る観測窓anの濃度値の差分が所定の値以上離れている
場合、着目窓a0の画素を抽出し、逆に着目窓a0の濃
度値と隣接する観測窓anの濃度値の差分が所定の値未
満であれば、着目窓a0の画素は抽出しないようにし
て、濃度勾配画像を生成する。なお、前記所定の値は、
経験上により設定される閾値である。濃度勾配画像の生
成は、垂直/左斜め方向/右斜め方向に関して行う。具
体的には、垂直方向濃度勾配画像データ生成部72a
が、着目窓a0の濃度値と観測窓a2及び観測窓a7の
濃度値の差分が任意の値以上離れている場合のみ、該着
目窓a0の画素を抽出して垂直方向濃度勾配画像データ
を生成する。左斜め方向濃度勾配画像データ生成部72
bが、着目窓a0の濃度値と観測窓al及び観測窓a8
の濃度値の差分が任意の値以上離れている場合のみ、該
着目窓a0の画素を抽出して左斜め方向濃度勾配画像デ
ータを生成する。右斜め方向濃度勾配画像データ生成部
72cが、着目窓a0の濃度値と観測窓a3及び観測窓
a6の濃度値の差分が任意の値以上離れている場合の
み、着目窓a0の画素を抽出して右斜め方向濃度勾配画
像データを生成する。
【0052】処理S54において、下線濃度範囲検出部
74は、各方向の濃度勾配画像データに基づき、下線候
補データを生成する。第3の実施形態の文字記入枠とは
異なり、下線のように、取り除きたいデータが1方向の
みで形成される場合、その下線に垂直に交わる方向の濃
度勾配を検出すれば、下線データを特定できる。つま
り、下線データは、垂直方向の濃度勾配画像データから
検出できる。また、下線以外のデータで構成される文字
データでは、左斜め/右斜めの各方向の濃度勾配画像デ
ータから検出できる。そこで、下線濃度範囲検出部74
は、垂直方向濃度勾配画像データを下線データとし、そ
の濃度範囲を取得する。処理S55において、下線濃度
範囲検出部74は、左斜め方向濃度勾配画像データと右
斜め方向濃度勾配画像データを合成し、該合成画像の濃
度範囲を取得する。そして、下線データの濃度範囲値か
ら左斜め及び右斜め方向濃度勾配画像データの合成画像
の濃度範囲値を引いたものを下線の濃度範囲として検出
する。
【0053】処理S56において、下線データ生成部7
5は、下線濃度範囲検出部74で検出した下線データに
対し、下線の濃度範囲内にある画素を黒画素、下線デー
タの濃度範囲外の濃度値を持つ画素を白画素として2値
画像を生成する。処理S57において、下線位置検出部
76は、下線データ生成部75で生成した2値画像を取
得し、該2値画像に対し、縦方向の周辺分布を検出す
る。そしてこの周辺分布が所定の閾値以上となる座標位
置を下線位置として検出する。一方、画像データ濃度計
数部73は、画像データ記憶部71に格納された画像デ
ータの各画素の濃度値を計数し、図3に示すような濃度
分布を検出する。該濃度値の計数には第1及び第2の実
施形態で用いた(m×n)の観測窓を設け、該観測窓を
用いて画像データを走査し、例えば観測窓a0から見え
る濃度値を計数すれば良い。処理S58において、文字
データ検出部77は、画像データ濃度計数部73で取得
した画像データの濃度分布と下線濃度範囲検出部74で
検出した下線データの濃度範囲を比較し、画像データ記
憶部71に格納された画像データから文字データのみを
抽出するのに必要な2値化閾値を抽出する。この処理S
58を次の図15を参照して説明する。
【0054】図15は、2値化閾値の抽出例を示す図で
あり、濃度分布を示す図3中の要素と共通の要素には共
通の符号が付されている。画像データ濃度計数部73で
取得した画像データの濃度分布を79とした場合、最も
白側に位置する濃度分布2cが背景の濃度分布に相当す
る。また、下線濃度範囲検出部74で検出した下線の濃
度範囲と該濃度分布79とを比較することにより、濃度
分布2aと濃度分布2bのどちらが下線の濃度分布か判
別できる。ここで濃度分布2bを文字データの濃度分
布、濃度分布2aを下線データの濃度分布と判定したと
仮定すると、下線データと文字データが交差しない場
合、背景データと文字データを分離するには、図15の
濃度αを2値化閾値に設定すれば良い。また、下線デー
タと文字データが交差する場合には、下線位置検出部7
6が取得した下線領域内において、下線データの濃度範
囲であるβ−γ間の濃度値を持つ画素以外を黒画素、β
−γ間の濃度値を持つ画素を白画素として抽出すれば良
い。処理S59〜S61において、文字データ検出部7
7は、画像データ記憶部71に格納された画像データに
対し、濃度αを第1の2値化閾値とした2値化と、濃度
β及びγを第2の2値化閾値とした2値化を行い、文字
データの画像を抽出する。
【0055】以上のように、この第4の実施形態によれ
ば、画像データ記憶部71と、濃度勾配画像データ生成
部72と、下線濃度範囲検出部74と、下線データ生成
部75と、下線位置検出部76と、画像データ濃度計数
部73と、文字データ検出部77とを設けることによ
り、文字データの濃度分布と下線の濃度分布の関係を自
動的に検出することができ、擦れが少ない文字データを
精度良く検出することが可能になる。
【0056】
【発明の効果】以上詳細に説明したように、第1及び第
2の発明によれば、媒体の画像データを格納する画像デ
ータ記憶部と、画像データの濃度分布を求める画像デー
タ濃度計数部と、指定した方向の隣接画素と着目画素の
濃度値の差が所定の範囲以内の場合、着目画素の濃度値
を計数する複数の方向成分濃度計数手段と、該計数結果
及び濃度分布に基づき、文字記入枠データ、文字データ
及び下地データの各濃度範囲を判定する濃度領域判定部
と、文字データの濃度範囲の画素を黒、その他の濃度範
囲の画素を白とした2値化を行い文字データからなる2
値画像を生成する文字領域検出部とを設けたので、文字
と文字記入枠の濃度の関係が一意的に決まらない場合で
も、それに対応して文字データのみを抽出でき画像装置
を実現できる。
【0057】第3及び第4の発明によれば、媒体の画像
データを格納する画像データ記憶部と、画像データの濃
度分布を求める画像データ濃度計数部と、指定した方向
の隣接画素と着目画素の濃度値の差が所定の範囲以内の
場合、着目画素の濃度値を計数する複数の方向成分濃度
計数手段と、該計数結果及び濃度分布に基づき、文字記
入枠データ、文字データ及び下地データの各濃度範囲を
判定する濃度領域判定部と、文字枠データの濃度範囲の
画素を黒、その他の濃度範囲の画素を白とした2値化を
行い文字枠データからなる2値画像を生成する罫線領域
検出部と、表情報作成部を設けたので、文字と文字記入
枠の濃度の関係が一意的に決まらない場合でも、それに
対応して文字枠の位置情報を抽出する画像処理装置を実
現できる。
【0058】第5〜第7の発明よれば、画像データ記憶
部と、画像データ濃度計数部と、指定した方向で濃度が
急変する画素を検出すると共に該画素の濃度を検出し、
濃度勾配画像データを生成する処理を複数の方向に関し
て行う濃度勾配画像データ生成部と、複数の方向に関す
る濃度勾配画像データを合成することにより、文字記入
枠データの濃度範囲を検出する文字枠濃度範囲検出部
と、文字記入枠データの濃度範囲内の画素を抽出して2
値画像を生成する文字枠データ生成部と、該2値画像の
分布に基づき文字記入枠の位置情報を抽出する文字枠位
置検出部と、前記画像データ濃度計数部で検出した濃度
分布と文字枠濃度範囲検出部で検出した文字記入枠デー
タの濃度分布とを比較することにより、文字データと文
字記入枠データ及び下地データを分離するための2値化
閾値を複数個検出し、文字データと文字記入枠データが
接触した場合と接触しない場合とで2値化閾値を異なら
せることにより、文字データを検出する文字データ検出
部とを設けたので、文字と文字記入枠の濃度の関係が一
意的に決まらない場合でも、それに対応して文字データ
の抽出する画像処理装置を実現できる。
【0059】第8及び第9の発明では、画像データ記憶
部と、画像データ濃度計数部と、濃度勾配画像データ生
成部と、濃度勾配画像データから、下線候補データの濃
度範囲を検出する下線濃度範囲検出部と、下線候補デー
タの濃度範囲内の画素を抽出して2値画像を生成する下
線データ生成部と、その2値画像の分布に基づき下線を
構成する画素を検出し、下線の位置情報を抽出する下線
位置検出部と、前記画像データ濃度計数部で検出した濃
度分布と文字枠濃度範囲検出部で検出した下線データの
濃度分布とを比較することにより、文字データと下線デ
ータ及び下地データを分離するための2値化閾値を複数
個検出し、文字データと下線データが接触した場合と接
触しない場合とで2値化閾値を異ならせることにより、
文字データを検出する文字データ検出部とを設けたの
で、下線を含む文字が記載された画像データから文字デ
ータのみを自動的に抽出できる画像処理装置が実現でき
る。
【図面の簡単な説明】
【図1】本発明の第1の実施形態を示す画像処理装置の
構成図である。
【図2】帳票の例を示す図である。
【図3】図2の濃度分布を示す図である。
【図4】図1の動作を示すフローチャートである。
【図5】図1の濃度検出で用いる観測窓を示す図であ
る。
【図6】方向成分濃度計数手段で求めた濃度分布を示す
図である。
【図7】本発明の第2の実施形態を示す画像処理装置の
構成図である。
【図8】図7の動作を示すフローチャートである。
【図9】本発明の第3の実施形態を示す画像処理装置の
構成図である。
【図10】図9の動作を示すフローチャートである。
【図11】図10中の処理S37の概要を示す図であ
る。
【図12】2値化閾値の抽出例を示す図である。
【図13】本発明の第4の実施形態を示す画像処理装置
の構成図である
【図14】図13の動作を示すフローチャートである
【図15】2値化閾値の抽出例を示す図である。
【符号の説明】
10,30,50,70 画像処理装置 11,31,51,71 画像データ記憶部 12,32,53,73 画像データ濃度計数部 13,33 左斜め方向濃度計数部 14,34 右斜め方向濃度計数部 15,35 濃度領域判定部 16 文字領域検出部 20,40,60,80 画像読取部 36 罫線領域検出部 37 表情報作成部 52,72 濃度勾配画像データ生成部 54 文字濃度範囲検出部 55 文字枠データ作成部 56 文字枠位置検出部 57,77 文字データ検出部 74 下線濃度範囲検出部 75 下線データ生成部 76 下線位置検出部

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 文字記入枠が印刷されると共に文字が印
    刷或いは記入された媒体の画像データから文字データの
    みを抽出する画像処理装置において、 前記媒体を走査して画素単位に量子化された電気信号を
    出力する画像読取部に接続され、該電気信号を前記媒体
    の多値の前記画像データとして格納する画像データ記憶
    部と、 前記画像データ記憶部に格納された前記画像データの濃
    度分布を求める画像データ濃度計数部と、 前記画像データに対して予め設定された大きさの観測窓
    を用い、指定した方向の隣接画素と着目画素の濃度値の
    差が所定の範囲以内の場合、該着目画素の濃度値を計数
    する複数の方向成分濃度計数手段と、 前記各方向成分濃度計数手段の計数結果及び前記濃度分
    布に基づき、前記画像データにおける前記文字記入枠に
    相当する文字記入枠データ、前記画像データにおける前
    記文字に相当する前記文字データ、及び前記画像データ
    における前記媒体の下地に相当する下地データの各濃度
    範囲を判定する濃度領域判定部と、 前記濃度領域判定部の判定結果に基づき、前記画像デー
    タに対し、前記文字データの濃度範囲の画素を黒、その
    他の濃度範囲の画素を白とした2値化を行い該文字デー
    タからなる2値画像を生成する文字領域検出部とを、備
    えたことを特徴とする画像処理装置。
  2. 【請求項2】 前記複数の方向成分濃度計数手段のうち
    の少なくとも1つは、前記文字記入枠を構成する罫線と
    は異なる方向とし、該方向の隣接画素と着目画素の濃度
    値の差が所定の範囲以内の場合、該着目画素の濃度値を
    計数する構成にしたことを特徴とする請求項1記載の画
    像処理装置。
  3. 【請求項3】 文字記入枠が印刷されると共に文字が印
    刷或いは記入された媒体の画像データから文字記入枠の
    位置情報を抽出する画像処理装置において、 前記媒体を走査して画素単位に量子化された電気信号を
    出力する画像読取部に接続され、該電気信号を前記媒体
    の多値の前記画像データとして格納する画像データ記憶
    部と、 前記画像データ記憶部に格納された前記画像データの濃
    度分布を求める画像データ濃度計数部と、 前記画像データに予め設定された大きさの観測窓を用
    い、指定した方向の隣接画素と着目画素の濃度値の差が
    所定の範囲以内の場合、該着目画素の濃度値を計数する
    複数の方向成分濃度計数手段と、 前記各方向成分濃度計数手段の計数結果及び前記濃度分
    布に基づき、前記画像データにおける前記文字記入枠に
    相当する文字記入枠データ、前記画像データにおける前
    記文字に相当する前記文字データ、及び前記画像データ
    における前記媒体の下地に相当する下地データの各濃度
    範囲を判定する濃度領域判定部と、 前記濃度領域判定部の判定結果に基づき、前記画像デー
    タに対し、前記文字記入枠データの濃度範囲の画素を
    黒、その他の濃度範囲の画素を白とした2値化を行い該
    文字記入枠データからなる2値画像を生成する罫線領域
    検出部と、 前記罫線領域検出部で生成された2値画像を走査するこ
    とにより、前記文字記入枠の座標データを取得する表情
    報作成部とを、備えたことを特徴とする画像処理装置。
  4. 【請求項4】 前記複数の方向成分濃度計数手段のうち
    の少なくとも一つは、前記文字記入枠を構成する罫線と
    は異なる方向とし、該方向の隣接画素と着目画素の濃度
    値の差が所定の範囲以内の場合、該着目画素の濃度値を
    計数する構成にしたことを特徴とする請求項3記載の画
    像処理装置。
  5. 【請求項5】 文字記入枠が印刷されると共に文字が印
    刷或いは記入された媒体の画像データから文字データの
    みを抽出する画像処理装置において、 前記媒体を走査して画素単位に量子化された電気信号を
    出力する画像読取部に接続され、該電気信号を前記媒体
    の多値の前記画像データとして格納する画像データ記憶
    部と、 前記画像データ記憶部に格納された前記画像データの濃
    度分布を求める画像データ濃度計数部と、 前記画像データに対して予め設定された観測窓を用い、
    指定した方向で濃度が急変する画素を検出すると共に該
    画素の濃度を検出し、これらの検出結果で形成される多
    値の濃度勾配画像データを生成する処理を複数の方向に
    関して行う濃度勾配画像データ生成部と、 前記複数の方向に関する前記濃度勾配画像データを合成
    することにより、前記文字記入枠を表す文字記入枠デー
    タの濃度分布を検出し、該文字記入枠データの濃度範囲
    を検出する文字枠濃度範囲検出部と、 前記文字記入枠データの濃度範囲内の画素を抽出して2
    値画像を生成する文字枠データ生成部と、 前記文字枠データ生成部で生成された前記2値画像の分
    布に基づき前記文字記入枠の罫線を構成する画素を検出
    し、この検出結果から該文字記入枠の位置情報を抽出す
    る文字枠位置検出部と、 前記画像データ濃度計数部で検出した濃度分布と前記文
    字枠濃度範囲検出部で検出した文字記入枠データの濃度
    分布とを比較することにより、前記文字データと前記文
    字記入枠データ及び下地データを分離するための2値化
    閾値を複数個検出し、該文字データと該文字記入枠デー
    タが接触した場合と接触しない場合とで2値化閾値を異
    ならせて、前記画像データ記憶部に格納した画像データ
    から該文字データを検出する文字データ検出部とを、備
    えたことを特徴とする画像処理装置。
  6. 【請求項6】 前記濃度勾配画像データ生成部は、前記
    濃度勾配画像データを求める処理を前記多値の画像デー
    タの水平方向と垂直方向と左斜め方向と右斜め方向とに
    関して行い、それぞれ多値の水平方向濃度勾配画像デー
    タと垂直方向濃度勾配画像データと左斜め方向濃度勾配
    画像データと右斜め方向濃度勾配画像データとを生成す
    る構成にしたことを特徴とする請求項5記載の画像処理
    装置。
  7. 【請求項7】 前記文字枠濃度範囲検出部は、 前記水平方向濃度勾配画像データ及び前記垂直方向濃度
    勾配画像データを合成した画像と前記左斜め方向濃度勾
    配画像データ及び前記右斜め方向濃度勾配画像データを
    合成した画像との濃度の差分から、前記濃度範囲を求め
    る構成にしたことを特徴とする請求項6記載の画像処理
    装置。
  8. 【請求項8】 下線を含む文字が印刷或いは記入された
    媒体の画像データから文字データのみを抽出する画像処
    理装置において、 前記媒体を走査して画素単位に量子化された電気信号を
    出力する画像読取部に接続され、該電気信号を前記媒体
    の多値の前記画像データとして格納する画像データ記憶
    部と、 前記画像データ記憶部に格納された前記画像データの濃
    度分布を求める画像データ濃度計数部と、 前記画像データに対して予め設定された観測窓を用い、
    指定した方向で濃度が急変する画素を検出すると共に該
    画素の濃度を検出し、これらの検出結果で形成される多
    値の濃度勾配画像データを生成する処理を複数の方向に
    関して行う濃度勾配画像データ生成部と、 前記複数の方向に関する前記濃度勾配画像データから、
    前記下線を表す下線データの濃度分布と濃度範囲を検出
    する下線濃度範囲検出部と、 前記下線データの濃度範囲内の画素を抽出して2値画像
    を生成する下線データ生成部と、 前記下線データ生成部で生成された前記2値画像の分布
    に基づき前記下線を構成する画素を検出し、この検出結
    果から該下線の位置情報を抽出する下線位置検出部と、 前記画像データ濃度計数部で検出した濃度分布と前記下
    線濃度範囲検出部で検出した下線データの濃度分布とを
    比較することにより、前記文字データと前記下線データ
    及び下地データを分離するための2値化閾値を複数個検
    出し、該文字データと該下線データが接触した場合と接
    触しない場合とで2値化閾値を異ならせて、前記画像デ
    ータ記憶部に格納した画像データから該文字を検出する
    文字データ検出部とを、備えたことを特徴とする画像処
    理装置。
  9. 【請求項9】 前記濃度勾配画像データ生成部は、前記
    濃度勾配画像データを求める処理を前記多値の画像デー
    タの垂直方向と左斜め方向と右斜め方向とに関して行
    い、それぞれ多値の垂直方向濃度勾配画像データと左斜
    め方向濃度勾配画像データと右斜め方向濃度勾配画像デ
    ータとを生成する構成にしたことを特徴とする請求項8
    記載の画像処理装置。
JP11030632A 1999-02-08 1999-02-08 画像処理装置 Withdrawn JP2000231601A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11030632A JP2000231601A (ja) 1999-02-08 1999-02-08 画像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11030632A JP2000231601A (ja) 1999-02-08 1999-02-08 画像処理装置

Publications (1)

Publication Number Publication Date
JP2000231601A true JP2000231601A (ja) 2000-08-22

Family

ID=12309234

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11030632A Withdrawn JP2000231601A (ja) 1999-02-08 1999-02-08 画像処理装置

Country Status (1)

Country Link
JP (1) JP2000231601A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9883064B2 (en) 2015-12-08 2018-01-30 Kyocera Document Solutions Inc. Image reader and image forming apparatus determining direction of document to be read

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9883064B2 (en) 2015-12-08 2018-01-30 Kyocera Document Solutions Inc. Image reader and image forming apparatus determining direction of document to be read

Similar Documents

Publication Publication Date Title
JP4323328B2 (ja) 取り込み画像データから文字列を識別して抜出するシステムおよび方法
US6798906B1 (en) Image processing apparatus and method including line segment data extraction
US8331670B2 (en) Method of detection document alteration by comparing characters using shape features of characters
JP2003132358A (ja) 画像処理方法、装置およびシステム
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
EP0505729A2 (en) Image binarization system
US8494272B2 (en) Image processing device, image processing method, and computer readable medium for judging if images are matched
JP2003115031A (ja) 画像処理装置および方法
JP2000231601A (ja) 画像処理装置
JPH10232926A (ja) 画像処理装置及びその方法
JP2001291056A (ja) 文書画像認識装置及び記録媒体
JP2894111B2 (ja) 光学式活字文字認識装置における認識結果の総合判定方式
JPH03125569A (ja) 画像2値化装置
JP3850488B2 (ja) 文字抽出装置
JPH05128306A (ja) 文章画像の属性判別方法
JP2853140B2 (ja) 画像領域識別装置
JPH0535914A (ja) 画像傾き検出方法
Beran et al. Recognition of printed music score
JP3754721B2 (ja) 画像処理装置及びその方法
JPH10143607A (ja) 画像処理装置
JP2000331118A (ja) 画像処理装置及び記録媒体
JP2853141B2 (ja) 画像領域識別装置
JP3277977B2 (ja) 文字認識方法
JP2005208979A (ja) 特徴量抽出装置および特徴量抽出方法、ならびに文書ファイリング装置
JPH05282489A (ja) 文章画像の属性判別方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20060509