JP2002189984A - 文書読取装置 - Google Patents

文書読取装置

Info

Publication number
JP2002189984A
JP2002189984A JP2000388071A JP2000388071A JP2002189984A JP 2002189984 A JP2002189984 A JP 2002189984A JP 2000388071 A JP2000388071 A JP 2000388071A JP 2000388071 A JP2000388071 A JP 2000388071A JP 2002189984 A JP2002189984 A JP 2002189984A
Authority
JP
Japan
Prior art keywords
character
area
processing unit
marking
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000388071A
Other languages
English (en)
Inventor
Yoshimi Nouji
善美 能塒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2000388071A priority Critical patent/JP2002189984A/ja
Publication of JP2002189984A publication Critical patent/JP2002189984A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 簡単な操作で必要な部分のみ抽出することの
できる文書読取装置を実現する。 【解決手段】 必要な部分がマーキングされた文書10
0の画像データを画像入力処理部1で読み取る。マーキ
ング領域抽出処理部2は、画像データから色成分の相違
に基づいてマーキング領域を抽出する。文字検索領域決
定処理部3は、抽出されたマーキング領域を含む矩形領
域を設定する。行・文字切出し処理部4は、設定された
矩形領域内の文字を切り出す。対象文字決定処理部5
は、行・文字切出し処理部4で切り出された文字と、マ
ーキング領域抽出処理部2で抽出されたマーキング領域
との重なり部分を抽出し、この重なり部分の文字を処理
対象文字として設定する。文字認識処理部6は、対象文
字決定処理部5で設定された文字を文字認識辞書7を用
いて文字認識処理する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書画像からマー
キングされた文字を抽出する文書読取装置に関する。
【0002】
【従来の技術】企業の基幹業務系のドキュメントイメー
ジ処理システムでは、文字認識専用の帳票を作成し、大
量に処理することが一般的である。システムは帳票フォ
ーマットに従い、指定された領域に対して、文字認識処
理などの処理を実行する。近年、文字認識専用に作成さ
れた帳票ではない、既存または一般帳票に対して、同様
のイメージ処理を行おうとするシステムが出現してい
る。このような帳票においても、事前に帳票フォーマッ
トを作成しておくことが一般的であるが、表解析や項目
探索などといった技術を応用して、読取対象とすべき領
域を画像上から抽出するという試みが種々の機関等で行
われてきている。しかし、このような技術は為替などの
一部の帳票に限られており、一般に実用的なレベルとは
言い難い。
【0003】文書入力系のドキュメントイメージ処理シ
ステムで、情報の抽出保存や再利用を目的に必要な部分
のみを電子化する場合、文書の全体イメージをディスプ
レイ上に表示し、マウス等のポインティングデバイスを
使用して矩形枠を描画することで必要な部分を囲む方法
が一般的である。このような問題点に対し、例えば、特
開平9−65119号公報等に示されるように、原稿上
にマーカで処理対象となる領域を指示し、このマーカ領
域に基づいて必要な部分を抽出する技術があった。
【0004】
【発明が解決しようとする課題】しかしながら、上記従
来の技術では、マーカで囲まれた閉領域に外接する矩形
領域を処理対象としているため、必要のない文字までも
抽出されてしまうという問題点があった。例えば、必要
な部分が、文書中の複数行に亘り、かつ、行中に部分的
な抽出箇所を含むような部分であった場合でも、処理対
象が矩形領域であるため、マーキングされていない抽出
する必要のない文字までも結果として出力してしまい、
正確な文字抽出結果が得られないという問題点があっ
た。もし、このような従来の方法を用いて必要な文字の
みを正確に抽出しようとすれば、行毎にマーキングした
り文字毎にマーキングするといった処理を行わなくては
ならず、非常に手間のかかる作業を要求されることにな
る。
【0005】
【課題を解決するための手段】本発明は、前述の課題を
解決するため次の構成を採用する。 〈構成1〉読取対象となる文書の画像データを読み取る
画像入力処理部と、文書上のマーキング領域を、文書上
の他の領域とマーキング領域の色成分の相違に基づいて
抽出するマーキング領域抽出処理部と、マーキング領域
抽出処理部によって抽出されたマーキング領域を含む矩
形領域を設定する文字検索領域決定処理部と、文書中
の、文字検索領域決定処理部で設定された矩形領域内の
文字を切り出す行・文字切出し処理部と、行・文字切出
し処理部で切り出された文字と、マーキング領域抽出処
理部で抽出されたマーキング領域との重なり部分を抽出
し、この重なり部分の文字を処理対象文字とする対象文
字決定処理部とからなることを特徴とする文書読取装
置。
【0006】〈構成2〉読取対象となる文書の画像デー
タを読み取る画像入力処理部と、文書上のマーキング領
域を、文書上の他の領域とマーキング領域の色成分の相
違に基づいて抽出するマーキング領域抽出処理部と、マ
ーキング領域抽出処理部によって抽出されたマーキング
領域を含む罫線で囲まれた領域を抽出するセル抽出処理
部と、セル抽出処理部で抽出された領域内の文字を処理
対象文字として文字認識を行う文字認識処理部とからな
ることを特徴とする文書読取装置。
【0007】
【発明の実施の形態】以下、本発明の実施の形態を具体
例を用いて詳細に説明する。 《具体例1》 〈構成〉図1は、本発明の文書読取装置の具体例1の構
成図である。図の装置は、画像入力処理部1、マーキン
グ領域抽出処理部2、文字検索領域決定処理部3、行・
文字切出し処理部4、対象文字決定処理部5、文字認識
処理部6、文字認識辞書7、画像データ格納メモリ8、
マーキング領域抽出結果格納メモリ9、文字検索領域位
置格納メモリ10、行・文字切出し結果格納メモリ1
1、対象文字位置格納メモリ12、文字認識結果格納メ
モリ13からなる。
【0008】画像入力処理部1は、イメージスキャナ等
からなり、マーキングした帳票等の文書100の画像を
画像データとして読み取り、これを画像データ格納メモ
リ8に格納する機能部である。画像データ格納メモリ8
は、画像入力処理部1で読み取った画像データを格納す
るためのメモリである。マーキング領域抽出処理部2
は、画像データ格納メモリ8に格納されている画像デー
タからマーキング領域の位置とサイズを抽出する機能を
有している。マーキング領域抽出結果格納メモリ9は、
マーキング領域抽出処理部2で抽出したマーキング領域
の位置・サイズ情報を格納するメモリである。文字検索
領域決定処理部3は、マーキング領域抽出結果格納メモ
リ9に格納されたマーキング領域の位置・サイズから、
文字の抽出(行切出し、文字切出し)を行う領域を決定
する機能部である。この領域とは、マーキング領域を含
み、文字の縦サイズ以内の所定のサイズの余裕を持った
矩形領域である。文字検索領域位置格納メモリ10は、
文字検索領域決定処理部3で決定した領域の位置・サイ
ズ情報を格納するメモリである。
【0009】行・文字切出し処理部4は、文字検索領域
内で、一般的な文字認識装置と同じように、行切出し、
文字切出しを順に行う機能部である。行・文字切出し結
果格納メモリ11は、行・文字切出し処理部4にて切り
出された行・文字切出し結果を格納するためのメモリで
ある。対象文字決定処理部5は、行・文字切出し結果格
納メモリ11に格納された行・文字切出し結果とマーキ
ング領域抽出結果格納メモリ9に格納されたマーキング
領域との重なりを検出し、マーキングされた文字かどう
かを判定する機能部である。対象文字位置格納メモリ1
2は、マーキングされた文字であると判定された文字の
座標情報を格納するメモリである。文字認識処理部6
は、対象文字位置格納メモリ12に格納された文字座標
部分の画像を文字認識する機能部である。文字認識結果
格納メモリ13は、文字認識処理部6にて文字認識した
結果を格納するためのメモリである。文字認識辞書7
は、文字認識処理部6にて用いる認識辞書である。
【0010】尚、上記マーキング領域抽出処理部2〜文
字認識処理部6は、それぞれの処理に対応したソフトウ
ェアとこれを実行するプロセッサやメモリ等のハードウ
ェアで構成されている。また、画像データ格納メモリ8
〜文字認識結果格納メモリ13は、それぞれ専用のメモ
リ、または、メモリ内の各領域で構成されている。
【0011】〈動作〉次に、上記具体例1の動作を説明
する。図2は、具体例1の処理説明図であり、図面中の
処理番号が下記の説明と対応している。
【0012】[処理]文書100上の文字認識対象部
分(文字列・領域)を赤マーカで彩色する。マーキング
は文字全体をカバーする形で彩色してもよいし、文字の
半分程度をカバーする形でもよい(但し、マーキング部
分が文字領域にある程度重なっていることが必要)。
尚、図2中、マーキング部分は網掛けで示している。
【0013】このような文書100を画像入力処理部1
でその画像を読み取り、画像データ格納メモリ8に格納
する。画像入力処理部1では、マーキング領域を抽出す
るため、入力画像はカラー画像1面のみ、または、モノ
クロ画像の場合、マーカの色成分のみを抽出したモノク
ロ画像とマーカの色成分を除いたモノクロ画像の2面が
必要である。即ち、モノクロ画像の場合、マーカが赤色
の場合は、赤抽出画像と赤ドロップアウト画像が必要と
いうことになる。また、モノクロ画像とすれば、データ
量が少なくなるため、それ以降の演算量を減少させるこ
とができる。
【0014】[処理]画像データ格納メモリ8に格納
された文書の画像データを読み出し、マーキング領域抽
出処理部2により、赤のマーキング領域を色成分によっ
て抽出する。カラー画像の場合は、マーカと同じ色成分
のみを抽出する処理を行う。モノクロ画像の場合はマー
カの色成分のみを抽出した画像を使用してマーキング領
域を抽出する。一般にマーキング処理は、縦方向のサイ
ズがほぼ一定で横長のボーダー型領域をとるものとす
る。このようなボーダー型を著しく逸脱したものについ
ては、ゴミとして除去する処理を行う。また、ボーダー
型領域内で、かすれ、抜けがある場合はこれを補い、マ
ーキング領域として矩形領域を形成する。このようにし
て抽出したマーキング領域のデータをマーキング領域抽
出結果格納メモリ9に格納する。
【0015】[処理]文字検索領域決定処理部3は、
マーキング領域抽出結果格納メモリ9に格納されている
マーキング領域のデータに基づいて文字検索領域を決定
する。ここでは、マーキング領域を含む矩形領域を設定
する。また、マーキング領域が近傍に複数存在する場合
は、一つの領域にまとめる処理を行う。マーキング領域
は、必ずしも文字全体をカバーしていないという前提で
あるため、1文字分以内に相当するサイズの余剰領域を
加える。図中の点線枠が設定した矩形領域である。そし
て、このような矩形領域のデータを文字検索領域位置格
納メモリ10に格納する。
【0016】[処理]行・文字切出し処理部4は、文
字検索領域位置格納メモリ10に格納されている矩形領
域のデータに基づき、当該矩形領域内の行切出し・文字
切出しを行う。この例では、点線枠に示すように1行目
の文字列と3〜5行目の文字列とが切り出され、各文字
の座標データが行・文字切出し結果格納メモリ11に格
納される。
【0017】[処理]対象文字決定処理部5は、上記
処理で切り出した文字の座標と処理で抽出したマー
キング領域を1文字ずつ比較し、重なる部分を検出す
る。ここで、マーキング領域との重なりがある文字を対
象文字列として決定する。これにより、マーキングされ
た1行目の文字列と、3〜5行目のマーキング領域に重
なる文字列が抽出される(図中、アンダーラインで示す
文字列)。そして、これらの文字列の位置データが対象
文字位置格納メモリ12に格納される。
【0018】その後は、文字認識処理部6により、文字
認識辞書7を用いて文字認識を行う。これにより、1行
目の文字列“CASEの定義”と、3〜5行目の文字列
“構造化分析・設技法に基づいた開発支援ツール群を駆
使して、生産性を高めようとするアプローチ”とが文字
認識されて抽出される。
【0019】〈効果〉以上のように具体例1によれば、
マーキング領域を含む矩形領域の文字を処理対象として
切り出し、この切り出した文字のうち、マーキング領域
と重なる文字のみを対象文字として決定するようにした
ので、簡単な操作で必要な部分のみを電子化することが
できる。従って、大量の文書を入力処理する場合でも、
予め処理対象領域・文字をマーキングしておくことで、
文書の一括処理が可能となる。例えば、マーキングする
担当者と、文書読取装置の操作担当者を別にすれば、全
体の処理時間と費用を更に短縮・低減することができ
る。
【0020】《具体例2》具体例2は、表形式といった
罫線が存在する文書であっても容易かつ正確に必要な部
分のみを抽出できるようにしたものである。
【0021】〈構成〉図3は、具体例2の文書読取装置
の構成図である。図の装置は、画像入力処理部21、マ
ーキング領域抽出処理部22、セル抽出処理部23、文
字認識処理部24、文字認識辞書25、画像データ格納
メモリ26、マーキング領域抽出結果格納メモリ27、
処理対象領域抽出結果格納メモリ28、文字認識結果格
納メモリ29からなる。
【0022】画像入力処理部21は、具体例1の画像入
力処理部1と同様に、イメージスキャナ等からなり、マ
ーカで彩色した帳票等の文書100の画像を画像データ
として読み取り、これを画像データ格納メモリ26に格
納する機能部である。また、画像データ格納メモリ26
は、具体例1の画像データ格納メモリ8と同様である。
マーキング領域抽出処理部22は、具体例1のマーキン
グ領域抽出処理部2と同様に、画像データ格納メモリ2
6に格納されている画像データからマーキング領域の位
置とサイズを抽出する機能を有している。マーキング領
域抽出結果格納メモリ27は、具体例1のマーキング領
域抽出結果格納メモリ9と同様である。
【0023】セル抽出処理部23は、マーキング領域抽
出結果格納メモリ27に格納されたマーキング位置に基
づき、その位置から外側方向に向かって罫線を抽出し、
4方向(垂直・水平方向)に罫線が検出された場合、こ
の領域を処理対象となるセルとして抽出する機能部であ
る。処理対象領域抽出結果格納メモリ28は、セル抽出
処理部23で抽出されたセル領域の位置・サイズ情報を
格納するメモリである。文字認識処理部24は、処理対
象領域抽出結果格納メモリ28に格納されたセル領域の
画像を文字認識する機能部である。文字認識辞書25
は、文字認識処理部24にて用いる認識辞書である。文
字認識結果格納メモリ29は、文字認識処理部24にて
文字認識した結果を格納するためのメモリである。
【0024】尚、上記マーキング領域抽出処理部22〜
文字認識処理部24は、それぞれの処理に対応したソフ
トウェアとこれを実行するプロセッサやメモリ等のハー
ドウェアで構成されている。また、画像データ格納メモ
リ26〜文字認識結果格納メモリ29は、それぞれ専用
のメモリ、または、メモリ内の各領域で構成されてい
る。
【0025】〈動作〉次に、上記具体例2の動作を説明
する。図4は、具体例2の処理説明図であり、図面中の
処理番号が下記の説明と対応している。
【0026】[処理]文書100上の文字認識対象セ
ルを赤マーカで彩色する。マーキング処理はセル全体を
カバーする形で彩色してもよいし、セルの一部でもよい
(但し、セルの内側に閉じていることが必要)。尚、図
4中、マーキング部分は網掛けで示している。
【0027】このような文書100を画像入力処理部1
でその画像を読み取る。マーキング部分を抽出するた
め、入力画像はカラー画像1面のみ、または、モノクロ
画像の場合、マーカの色成分のみを抽出したモノクロ画
像とマーカの色成分を除いたモノクロ画像の2面が必要
である。即ち、モノクロ画像の場合、マーカが赤色の場
合は、赤抽出画像と赤ドロップアウト画像が必要という
ことになる。
【0028】[処理]マーキング領域抽出処理部2に
より、赤マーキング領域を色成分によって抽出する。カ
ラー画像の場合は、マーカと同じ色成分のみを抽出する
処理を行う。モノクロ画像の場合はマーカの色成分のみ
を抽出した画像を使用してマーキング領域を抽出する。
マーキング領域はあるサイズ以上の大きさを有するもの
とし、そのサイズに満たないものはゴミとして対象から
削除する。
【0029】[処理]セル抽出処理部23により、マ
ーキング領域を含むセル領域を決定する。ここでは、マ
ーキング領域の中心から、垂直・水平の4方向に罫線の
有無を検索する。罫線が見つかれば、その位置までを処
理対象領域として決定する。そして、この処理対象領域
のデータを処理対象領域抽出結果格納メモリ28に格納
する。
【0030】[処理]文字認識処理部24は、処理対
象領域抽出結果格納メモリ28に格納された処理対象領
域のデータに対して、文字認識辞書25を用いて文字認
識を行う。図中、点線内のセル領域が文字認識対象とな
る部分である。これにより、必要な部分のみ文字認識結
果を得ることができる。
【0031】〈効果〉以上のように具体例2によれば、
マーキング領域を含む罫線で囲まれた領域を抽出し、こ
の領域を文字認識するようにしたので、簡単な操作で必
要な部分のみを電子化することができる。従って、大量
の文書を入力処理する場合でも、予め処理対象領域・文
字列をマーキングしておくことで、文書の一括処理が可
能となる。例えば、マーキングする担当者と、文書読取
装置の操作担当者を別にすれば、全体の処理時間と費用
を更に短縮・低減することができる。
【0032】また、具体例2では、図4に示すように、
罫線で囲まれた領域内であれば、認識対象の文字にマー
キングする必要がない。従って、文字に重ならないよう
マーキングすれば、文字上にマーキングすることによる
改ざんの恐れもない等、不正防止に寄与することができ
る。
【0033】尚、上記具体例1、2ではマーカとして赤
のマーカとしたが、これに限定されるものではなく、文
字と異なる色であればどのような色であってもよい。
【図面の簡単な説明】
【図1】本発明の文書読取装置の具体例1の構成図であ
る。
【図2】本発明の文書読取装置の具体例1の処理説明図
である。
【図3】本発明の文書読取装置の具体例2の構成図であ
る。
【図4】本発明の文書読取装置の具体例2の処理説明図
である。
【符号の説明】
1、21 画像入力処理部 2、22 マーキング領域抽出処理部 3 文字検索領域決定処理部 4 行・文字切出し処理部 5 対象文字決定処理部 6 文字認識処理部 23 セル抽出処理部 24 文字認識処理部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 読取対象となる文書の画像データを読み
    取る画像入力処理部と、 前記文書上のマーキング領域を、当該文書上の他の領域
    と前記マーキング領域の色成分の相違に基づいて抽出す
    るマーキング領域抽出処理部と、 前記マーキング領域抽出処理部によって抽出されたマー
    キング領域を含む矩形領域を設定する文字検索領域決定
    処理部と、 前記文書中の、前記文字検索領域決定処理部で設定され
    た矩形領域内の文字を切り出す行・文字切出し処理部
    と、 前記行・文字切出し処理部で切り出された文字と、前記
    マーキング領域抽出処理部で抽出されたマーキング領域
    との重なり部分を抽出し、この重なり部分の文字を処理
    対象文字とする対象文字決定処理部とからなることを特
    徴とする文書読取装置。
  2. 【請求項2】 読取対象となる文書の画像データを読み
    取る画像入力処理部と、 前記文書上のマーキング領域を、当該文書上の他の領域
    と前記マーキング領域の色成分の相違に基づいて抽出す
    るマーキング領域抽出処理部と、 前記マーキング領域抽出処理部によって抽出されたマー
    キング領域を含む罫線で囲まれた領域を抽出するセル抽
    出処理部と、 前記セル抽出処理部で抽出された領域内の文字を処理対
    象文字として文字認識を行う文字認識処理部とからなる
    ことを特徴とする文書読取装置。
JP2000388071A 2000-12-21 2000-12-21 文書読取装置 Pending JP2002189984A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000388071A JP2002189984A (ja) 2000-12-21 2000-12-21 文書読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000388071A JP2002189984A (ja) 2000-12-21 2000-12-21 文書読取装置

Publications (1)

Publication Number Publication Date
JP2002189984A true JP2002189984A (ja) 2002-07-05

Family

ID=18854878

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000388071A Pending JP2002189984A (ja) 2000-12-21 2000-12-21 文書読取装置

Country Status (1)

Country Link
JP (1) JP2002189984A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7920742B2 (en) 2006-03-06 2011-04-05 Fuji Xerox Co., Ltd. Image processing apparatus, program and recording medium for document registration

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7920742B2 (en) 2006-03-06 2011-04-05 Fuji Xerox Co., Ltd. Image processing apparatus, program and recording medium for document registration

Similar Documents

Publication Publication Date Title
CN109308476B (zh) 票据信息处理方法、系统及计算机可读存储介质
JP4461769B2 (ja) 文書検索・閲覧手法及び文書検索・閲覧装置
JP2008108114A (ja) 文書処理装置および文書処理方法
Li et al. Comic image understanding based on polygon detection
JP4136282B2 (ja) 画像処理装置及び画像処理方法並びに記憶媒体
JP2013030040A (ja) 情報処理プログラム、情報処理装置および文字認識方法
JP2002189984A (ja) 文書読取装置
JP4143320B2 (ja) 図面変換方法、図面変換装置、図面変換プログラム及び記録媒体
JPH07168910A (ja) 文書レイアウト解析装置及び文書フォ−マット識別装置
JP4143245B2 (ja) 画像処理方法および装置並びに記憶媒体
JP2012234345A (ja) 帳票読取装置、角印検出方法、および、角印検出プログラム
JP3814334B2 (ja) 画像処理装置及びその方法
CN110727820B (zh) 一种为图片获得标签的方法和系统
JP2576080B2 (ja) 文字切出し方法
JP2003016385A (ja) 画像処理装置、方法、プログラム、及び記憶媒体
JP3763966B2 (ja) 画像認識方法、装置および記録媒体
JPH11242716A (ja) 画像処理方法および記録媒体
JP2746345B2 (ja) 文字認識の後処理方法
JP3412998B2 (ja) 画像処理装置及びその方法
JP2000339405A (ja) 光学的文字認識システム、同システムに於ける帳票のフォーマットコントロール作成方法、及び同方法が格納された記憶媒体
JP2925270B2 (ja) 文字読取装置
JPH11250256A (ja) 図形認識処理方法及びそのプログラムを記録した記録媒体
JPH04156694A (ja) 文字認識方式
CN117765557A (zh) Pdf文档图表提取方法、装置、电子设备及存储介质
JP2021043478A (ja) 情報処理装置、その制御方法及びプログラム