JP3215176B2 - 文書画像処理装置及び文書画像処理方法 - Google Patents

文書画像処理装置及び文書画像処理方法

Info

Publication number
JP3215176B2
JP3215176B2 JP23824692A JP23824692A JP3215176B2 JP 3215176 B2 JP3215176 B2 JP 3215176B2 JP 23824692 A JP23824692 A JP 23824692A JP 23824692 A JP23824692 A JP 23824692A JP 3215176 B2 JP3215176 B2 JP 3215176B2
Authority
JP
Japan
Prior art keywords
grid
format
registered
document
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP23824692A
Other languages
English (en)
Other versions
JPH0689365A (ja
Inventor
由明 黒沢
俊二 有吉
修一 辻本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP23824692A priority Critical patent/JP3215176B2/ja
Publication of JPH0689365A publication Critical patent/JPH0689365A/ja
Application granted granted Critical
Publication of JP3215176B2 publication Critical patent/JP3215176B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、例えば帳票などの文書
上に記載された文字の読み取りに用いられる文書画像処
理装置及び文書画像処理方法に関する。
【0002】
【従来の技術】最近、銀号や保険会社などでは、帳票な
どの処理にコンピュータが用いられ、帳票上に記された
文字列を、例えば光学的なパターン認識により読取り、
これをコード化してコンピュータに入力するようなこと
が行なわれている。
【0003】ところで、このような帳票上に記された文
字列を読取り対象とする場合、帳票のフォーマットを事
前に知る必要がある。そこで、帳票のように定型的なも
のに対する文字列の読取り処理では、帳票の定型的なフ
ォーマットを事前に覚えさせておき、読み取るべき文字
列の記載位置を予め特定することにより、効率のよい文
字列の読み取りを実現している。
【0004】一方、最近になって、フォーマットの異な
る帳票に対しても文字列の読取りを可能にすることが考
えられている。ところが、このように帳票のフォーマッ
トが異なると、読み取るべき文字列の記載位置がそれぞ
れ異なるため、各帳票の入力画像を解析するなどして文
字列の記載位置などを抽出する必要がある。
【0005】そこで、従来では、白/黒の画素で表現さ
れる帳票の入力画像について、黒画素の連結性を調べる
ことにより帳票を構成する段組位置を決定するととも
に、各段組内において文字列方向に隣接する文字を統合
することで文字列を定義し、かかる文字列の読み取りを
行なうようにしている。
【0006】
【発明が解決しようとする課題】ところが、このような
考えを採用したものでは、帳票の入力画像について黒画
素の連結性を調べることで帳票を構成する段組位置を決
定するようにしているため、仮に、帳票の入力画像をス
キャナなどにより生成する際に明瞭な入力画像が得られ
ないことがあって黒画素の連結性が不安定なことがある
と、帳票を構成する段組位置を誤検出し、文字列の読み
取りが正確にできなくなるという問題点があった。
【0007】本発明は、上記事情に鑑みてなされたもの
で、帳票などの文書のフォーマットを正確に特定でき、
効率のよい文字列の読み取りを可能にした文書画像処理
装置及び文書画像処理方法を提供することを目的とす
る。
【0008】
【課題を解決するための手段】本発明は、格子状の表を
形成するけい線について定義した第1の文書フォーマッ
ト及び該格子状の表に記入される文字列の内容について
該格子状の表の列ごとに定義した第2の文書フォーマッ
トを含む登録フォーマットを記憶するための登録フォー
マット記憶手段と、文書より入力画像を生成する画像入
力手段と、この画像入力手段より出力された入力画像か
ら格子状の表を形成するけい線及び該格子状の表に記入
されている文字列を抽出する抽出手段と、前記抽出手段
より抽出された前記格子状の表を形成するけい線と前記
登録フォーマット記憶手段に登録された前記第1の文書
フォーマットとを照合するとともに、この照合によって
複数の認識結果の候補が得られた場合には、前記抽出手
段より抽出された前記格子状の表に記入されている文字
列の内容と前記登録フォーマット記憶手段に登録された
前記第2の文書フォーマットとを前記格子状の表の各列
ごとに照合して、該複数の認識結果の候補のうちから最
もマッチング度合いの高い認識結果を選択するマッチン
グ手段とを具備したことを特徴とする。また、本発明
は、格子状の表を形成するけい線について定義した第1
の文書フォーマット及び該格子状の表に記入される文字
列の内容について該格子状の表の列ごとに定義した第2
の文書フォーマットを含む登録フォーマットを登録フォ
ーマット記憶手段に記憶し、文書より入力画像を生成
し、生成された前記入力画像から格子状の表を形成する
けい線及び該格子状の表に記入されている文字列を抽出
し、抽出された前記格子状の表を形成するけい線と前記
登録フォーマット記憶手段に登録された前記第1の文書
フォーマットとを照合するとともに、この照合によって
複数の認識結果の候補が得られた場合には、抽出された
前記格子状の表に記入されている文字列の内容と前記登
録フォーマット記憶手段に登録された前記第2の文書フ
ォーマットとを前記格子状の表の各列ごとに照合して、
該複数の認識結果の候補のうちから最もマッチング度合
いの高い認識結果を選択することを特徴とする。
【0009】
【0010】
【作用】本発明によれば、格子状の表を形成するけい線
について定義した第1の文書フォーマット及び該格子状
の表に記入される文字列の内容について該格子状の表の
列ごとに定義した第2の文書フォーマットを含む登録フ
ォーマットを登録フォーマット記憶手段に記憶し、文書
より入力画像を生成し、生成された前記入力画像から格
子状の表を形成するけい線及び該格子状の表に記入され
ている文字列を抽出し、抽出された前記格子状の表を形
成するけい線と前記登録フォーマット記憶手段に登録さ
れた前記第1の文書フォーマットとを照合するととも
に、この照合によって複数の認識結果の候補が得られた
場合には、抽出された前記格子状の表に記入されている
文字列の内容と前記登録フォーマット記憶手段に登録さ
れた前記第2の文書フォーマットとを前記格子状の表の
各列ごとに照合して、該複数の認識結果の候補のうちか
ら最もマッチング度合いの高い認識結果を選択する。こ
れにより、文書中の格子状の表を正確に認識し、格子状
の表の要素として記入された文字列を正確に認識するこ
とができる。
【0011】
【0012】
【実施例】以下、本発明の一実施例を図面に従い説明す
る。図1は同実施例の概略構成を示している。
【0013】この場合、同実施例は、帳票1、画像入力
部2、特徴抽出部3、登録フォーマット記憶部4、マッ
チング部5、マッチング結果表示部6、文字認識部7、
認識結果出力部8により構成されている。
【0014】しかして、帳票1に関する入力画像は、画
像入力部2を介してシステム内に取り込まれる。画像入
力部2は、スキャナーやFAXデータの入力部などが用
いられる。
【0015】そして、画像入力部2より出力される入力
画像は、特徴抽出部3に送られる。特徴抽出部3は、入
力画像よりその特徴を抽出する。ここでの特徴として
は、例えば帳票内のけい線を構成する線分、文字列部
分、その文字列を認識した文字認識結果などが考えられ
る。
【0016】図2(a)(b)は、それぞれ帳票1に関
する入力画像を示すもので、特徴抽出部3では、これら
の入力画像に対して同図(c)(d)に示すように入力
帳票内のけい線を構成する線分情報を特徴として抽出す
るようになる。そして、特徴抽出部3より抽出された特
徴は、登録フォーマット記憶部4からの出力とともにマ
ッチング部5に送られる。
【0017】登録フォーマット記憶部4は、帳票のフォ
ーマットに関する特徴データを登録しているもので、こ
こでは、図3に示すように帳票のけい線の位置情報と記
入欄の記入項目などが登録されている。
【0018】この状態で、マッチング部5により、登録
フォーマット記憶部4に登録されている帳票の特徴デー
タであるけい線の位置情報と特徴抽出部3より抽出され
た入力帳票のけい線情報とのマッチング処理が行われ
る。ここでは、登録フォーマット記憶部4に登録されて
いるけい線が、特徴抽出部3より抽出された入力帳票の
けい線のどこに存在するか、その位置が特定されるよう
になる。
【0019】この場合、登録フォーマット記憶部4に複
数のフォーマットに関する特徴データを登録しておき、
これら複数のフォーマット情報のうちのどのフォーマッ
トに特徴抽出部3より抽出された入力帳票が該当するか
特定するようにしてもよい。勿論、あらかじめどのフォ
ーマットの帳票が入力されたかを指定するようにするこ
ともできる。
【0020】この結果、例えば、図2(c)に示す入力
帳票のけい線情報に対して図示矢印aおよびbのそれぞ
れの位置が登録フォーマット記憶部4に登録されたフォ
ーマットの上端と対応することになる。このことは、特
徴として抽出された入力帳票のけい線に対して登録フォ
ーマット記憶部4に登録されたフォーマットが図示矢印
aまたはbの位置の2候補があることになる。同様にし
て、図2(d)の場合は、登録されたフォーマットが図
示矢印c、d、eの3候補があることになる。
【0021】このマッチング部5でのマッチング処理結
果は、マッチング結果表示部6に送られる。マッチング
結果表示部6では、前記複数の候補位置に関して、それ
ぞれの特定位置を図4(a)(b)(c)に示すように
順次表示し、オペレータに正しいマッチング位置の指示
入力を促すようになる。
【0022】この場合、図4(a)は、図2(d)の図
示矢印cで表される候補、図4(b)は、同図の図示矢
印dで表される候補、図4(c)は、同図の図示矢印e
で表される候補にそれぞれ対応している。
【0023】ここでは、図4(a)が正しいので、オペ
レータは図4(a)が表示された時点で、それが正しい
ことを知らせるキー入力を行なう。これにより、マッチ
ング部5より複数出力されていた曖昧な位置情報は一意
に決定されるようになる。
【0024】なお、この例では、マッチング結果表示部
6での特定位置の表示を登録フォーマットの外枠を太い
線にして原画像の上に重ねて表示しているが、その方法
には様々な方式がある。例えば、太線のかわりに原画の
表示濃度や色に対して特定位置表示用の線分の濃度を変
えたり、色をかえて表示することもできるし、外枠だけ
でなくすべてのけい線を原画の上に重ねて表示するよう
にしてもよい。また、領域を塗りつぶすようにして表示
してもよいし、領域に薄い色を重ねあわせて表示するよ
うな方法を使ってもよい。
【0025】そして、上記のようにして決定された図4
(a)の表示内容について、文字認識部7において、登
録フォーマットのけい線情報によってけい線部分を取り
除き、記入または印刷された文字列を読み取るようにな
る。ここで、けい線を取り除く方法や文字認識方式には
様々な手法があるが、ここではそれを特に限定しない。
【0026】そして、文字認識部7での認識結果は認識
結果出力部8より外部に出力されることになる。勿論、
この時点で認識結果についてオペレータによる確認や修
正プロセスがあってもよい。
【0027】ところで、上述のマッチング部5において
マッチングの正しさの度合いに数値で表す方法を導入す
るようにしてもよい。例えば、図4の例では、登録フォ
ーマットとマッチした各エリア内において文字認識を行
ない、その認識結果と登録フォーマットに定義された各
項目の記載内容との比較チェックを行なうようにする。
例では「番号」「品名」「金額」と、図4(a)の第1
番目の欄の「1」「ダイコン」「¥259」が比較され
る。この場合、「番号」は数字、「品名」はカタカナ、
「金額」は¥+数字と定義されているとすると、図4
(a)の選択された領域の4個の欄はすべて項目定義の
内容にマッチする。一方、図4(b)では,選択された
領域の第4番目の欄は空白でありマッチしない。図4
(c)も同じく第3、第4番目の欄はマッチしない。す
なわち,図4(a)(b)(c)の順で選択された領域
のマッチング度合が低くなる。
【0028】この他にも対応づけを行なったけい線のマ
ッチング度合、すなわち長さのずれ線に垂直方向のず
れ、方向のずれ、太さのずれなどの項目を考慮したけい
線の対応する度合を上記マッチング度合の計算に含める
ようにしてもよい。また、図5のa〜cに示す各欄の左
方に特定の文字が必ず印刷されているような場合は、こ
このプレプリントの情報を登録フォーマット記憶部4に
登録しておいてもよく、この部分を入力画像とのマッチ
ングにおいてチェックすることによりその有無をマッチ
ング度合の計算に含めるようにしてもよい。いずれにし
てもシステムは選択された領域の正しらしさを計算する
評価式を内蔵しており、それをマッチング時に計算する
ことによって、選択された領域を正しいと思われる順に
ならべることができる。
【0029】そして、オペレータに選択された領域を提
示する際に、正しい順に提示するようにすれば、無駄な
選択領域をオペレータがチェックする機会は減少するの
で、作業時間の短縮に役だつ。また、正しらしさの評価
値がある閾値を越えるとか、その値の1位と2位の差が
ある閾値以上である場合には、オペレータによるチェッ
クすなわちマッチング結果表示部6の処理を省略して、
第1位の選択領域を文字認識部7に入力するようにし
て、残りのケースについてのみマッチング結果表示部6
でオペレータによってチェックするようにもできる。
【0030】上記の説明では対応が取られる欄の数を4
個と固定したが、これを可変になるようにしてもよい。
すなわち、欄の数がたて方向にn1 個〜n2 個、横方向
にm1 個〜m2 個存在するというような定義でもよい。
たとえば、1個以上の欄があればよいことにすると、選
択領域の候補数はさらに増えることになる。このケース
では選択領域に含まれる登録フォーマットの欄とうまく
マッチした欄の数が多い程評価基準が高いようなマッチ
ング度合の評価式を定義すれば、マッチング結果表示部
6における無駄な選択領域の表示とオペレータの確認を
避ける事ができる。またこの場合に、含まれる欄の数が
多いものから順に評価式を計算するようにして、評価値
がある閾値を越えるような時にその選択領域に含まれる
部分領域については評価を最初から行なわないようにし
て処理時間を短縮するようにもできる。けい線は空白部
分に仮のけい線があると見なして抽出した仮けい線であ
ってもよい。
【0031】従って、このようにすれば、画像入力部2
より生成された帳票1にかかる入力画像から、特徴抽出
部3により文書フォーマットを認識するのに必要な特徴
が抽出され、この抽出された特徴と予め登録フォーマッ
ト記憶部4に登録された文書フォーマットに関する特徴
データとがマッチング部5により照合され、このマッチ
ング結果として複数の候補が出力されると、オペレータ
によりこれら複数の候補より入力画像に対応する文書フ
ォーマットが特定されるようになるので、帳票などの文
書フォーマットを正確に特定できるともに、文書中の読
み取るべき文字列の記載位置を正確に特定でき、文字列
の読み取りを効率よく行うことができるようになる。次
に、本発明の他の実施例を説明する。図6は同他の実施
例の概略構成を示している。
【0032】この場合、同他の実施例は、帳票11、画
像入力部12、エレメント抽出部13、登録フォーマッ
ト記憶部14、マッチング部15、文字認識部16、認
識結果出力部17により構成されている。
【0033】しかして、この場合も帳票11に関する入
力画像は、画像入力部12を介してシステム内に取り込
まれる。画像入力部12は、スキャナーやFAXデータ
の入力部などが用いられる。
【0034】そして、画像入力部2より出力される入力
画像は、エレメント抽出部13に送られる。エレメント
抽出部13は、帳票11上に記載された文字、行、パラ
グラフ、ブロック、カラム、段組、けい線、記入欄、ヘ
ッダ、フッタ、タイトルなどをエレメントとしてそれら
を抽出するようにしている。
【0035】図7は、入力される帳票11の入力画像を
示している。そして、エレメント抽出部13は、例え
ば、図8(a)に示すように帳票11中に記入または印
刷された文字列の行18をエレメントとして抽出するよ
うにしている。この場合、各行18は、矩形で表現され
ており、具体的には各矩形の位置を定義する情報がエレ
メントデータとして抽出されることになる。
【0036】エレメント抽出部13は、図8(b)に示
すように帳票11中に印刷されたけい線19をエレメン
トとして抽出するようにしてもよい。この場合、けい線
19は、文字領域に対応していて文字に対応する外接長
方形がエレメントとして図中に表現されるようになる。
具体的にはこれら外接長方形の位置を定義する情報がエ
レメントのデータとして抽出されることになる。
【0037】ここでは、正しく外接長方形が困難である
場合もあるので、ある程度以下の大きさの連結領域を取
り出して、それらの外接長方形を文字エリアを表わすエ
レメントとしてもよい。また、重なりあう連結領域をマ
ージして新しいエリアを作成し、それをエレメントとし
てもよい。これらの連結領域や文字エリアを横方向、ま
たは縦方向にマージして行を抽出することも可能であ
る。また、文字エリアの文字を認識すれば文字の存在位
置だけでなく文字コード、または候補文字コード群をエ
レメントとすることもできる。
【0038】また、エレメント抽出部13は、図8
(c)に示すように帳票11中のヘッダ20、フッタ2
1をエレメントとして抽出することもできる。これらヘ
ッダ20、フッタ21の他に、タイトル、パラグラフ、
ブロック、カラム、段組などもエレメントとして採用す
ることが可能であり、これらは、すでに知られているレ
イアウト理解技術によって抽出することができる。
【0039】一方、図9は、別の帳票11に関する入力
画像の例で、図10は、この入力画像に対してエレメン
トとして抽出されたブロック22を示すものである。こ
こでのブロック22とは、区切線、スペース、段落など
によって区切られた一連の行からなるものである。パラ
グラフは文章中に表われる段落によって区切られた行の
かたまりであるが、このプラグラフは、ブロックの一種
と見なせる。
【0040】また、図11は、図9に示す入力画像に対
してエレメントとして抽出されるカラム23を示すもの
である。ここでのカラム23はブロックを縦方向に接続
したもので、カラム23が頁全体を構成する形が段組
で、この場合は2段組の例を示している。
【0041】これら以外にも破線とか、写真とか図形な
ど様々なエレメントが考えられる。エレメントには属性
が付属してもよく、それは色濃度線の太さ、文字フォン
ト、形状のバリエーションなどである。そして、エレメ
ント抽出部13より抽出されたエレメントは、登録フォ
ーマット記憶部14からの出力とともにマッチング部1
5に送られる。登録フォーマット記憶部14は、認識対
象となる複数の帳票のレイアウト情報を上述した各エレ
メントによる記述によってそれぞれ登録している。
【0042】この状態で、マッチング部15によりエレ
メント抽出部13より抽出されたエレメントと登録フォ
ーマット記憶部14に登録されたエレメントの記述によ
るフォーマット情報とのマッチング処理が行なわれる。
【0043】ここでのマッチング処理は、例えば、文字
コードの一致性、矩形の位置情報のずれ量、線のずれ量
などを評価量として、もっとも不一致やずれの少ない対
応関係を見つけ出すことによって行なう。より良い対応
関係の発見法としては「リラキゼーション法の変形」や
「ずらしながらマッチングを取り最適マッチングを発見
する方法」などを適用することができる。
【0044】このようにして登録されたフォーマットと
の対応が取られ、入力画像の各エレメント位置が特定さ
れると、これらの位置関係に基づいて、登録フォーマッ
ト記憶部14またはその他の部分に記憶されている認識
に関する情報や指示に基づいて、入力画像内の各エレメ
ント位置に存在する文字は文字認識部16により認識さ
れ、この認識結果が、認識結果出力部17により外部に
出力されるようになる。勿論、この時点で認識結果につ
いてオペレータによる確認や修正プロセスがあってもよ
い。
【0045】図12は、図7と同じタイプの帳票24を
例示したものであるが、この帳票24には後述の可変部
分25と行の構成の固定部分26、27がある。この場
合、可変部分25は、3個の記入欄を横方向に接続した
記入行を縦方向に接続して構成されたもので、その数を
可変としている。上述の図7では、3行であるが、図1
2では6行である。
【0046】そして、このようなケースに対応するため
に、登録フォーマット記憶部14では、可変エレメント
と固定エレメントが分けて登録している。この場合、可
変エレメントは、位置の変動範囲やエレメントの変動範
囲などが記述されている。例えば、図12の例では、記
入欄のエレメントが縦方向に2行から10行まで、また
は、それを構成するけい線のエレメントが縦方向に4本
から14本までのように記載されることになる。
【0047】また、図12の固定部分26、27は、そ
の文字数や文字そのもの、文字フォント、文字の大きさ
が可変になっているが、これらを可変部分と見なして登
録することもでき、またこれらを行エレメントとしてし
まうことによって固定部分にすることができる。もしこ
れを可変とした場合、例えば固定部分26の最初の行の
表現は「SHEETNo.(1〜5ケタの数字列)」のよ
うに定義すればよい。また、例えば、フォーマット登録
として、登録されているエレメントであるが、読取り対
象としないというような指定も可能であることは言うま
でもない。例えば、図12で、固定部分26、27を読
取らなくても良いエレメントとするようなこともでき
る。
【0048】なお、変動部分25についてはエレメント
そのものが変化しうることを表現できるようにしてもよ
い。例えば図7に示す破線エレメントは普通の線分にも
なり得ることを指定できるようにすれば、図12では破
線部分が普通の線分になっているが、そのような入力が
あっても問題が起きない。
【0049】このようにエレメントが可変、またはエレ
メントから構成されるものが可変であるように記述でき
ることはシステムの柔軟性に寄与する。また、可変性や
固定性、すなわち固定エレメント、可変エレメントと云
う固定部、可変部を明示的に分離して定義することはシ
ステム設計を容易にする点やオペレータによる定義をわ
かりやすくする点などで効果的である。次に、マッチン
グ部15でのマッチング処理の具体例を説明する。
【0050】この場合、登録フォーマットの各エレメン
トに対応するもっとも可能性の高いエレメントを入力画
像のエレメントより選び出すことになるが、ここでは、
例えば入力画像の複数のエレメントが登録フォーマット
の1個のエレメントにだけ対応しないように対応づけを
行なう。
【0051】図13(a)(b)(c)は、この例を説
明するためのもので、41は入力画像中から抽出された
エレメントを示し、ここでは、文字エリア31、32、
33と線分34、35からなっている。また、42は登
録フォーマット内のエレメントを示し、ここでは文字エ
リア36、37と線分38、39からなっている。
【0052】そして、第1回目のマッチング処理では、
図13(a)に示すように個々のエレメントは、その種
類と位置の近さから対応づけられる。この場合は、31
と36、32と37、34と38、35と39に対応づ
けられる。また、弱い対応関係として32と36、33
と37が破線で示すように対応づけられる。次のステッ
プでは対応した各エレメントについて、周囲のエレメン
トとの関係をチェックして対応関係の変更を行なう。
【0053】図13(b)は、第2回目の処理でエレメ
ント37の対応づけをやり直した例を示している。ここ
ではエレメント37の隣のエレメント36と38の位置
関係が登録フォーマットに記述されているものとして、
その対応関係が入力画像中のエレメント間でも成立する
かどうかが検証される。上述の図13(a)から得られ
た対応関係から36−37−38の位置関係は、31−
32−34となるが、弱い関係の37と33に着目した
時、同じく弱い関係の36と32を使い、弱い関係なが
ら32−33−34が同じく36−37−38のエレメ
ントの位置関係に対応することがわかる。位置関係につ
いて言えば、この方がより良く36−37−38の位置
関係に対応するので、トータルな確さらしさが、もし3
2−33−34の組が31−32−34を上まわったと
すれば37と33の関係が強化され、逆に37と32の
関係が弱められるようになる。
【0054】さらに、第3回目として図13(c)に示
すような処理が行われる。この場合、エレメント36に
着目した時に36−37の位置関係を32−33の位置
関係の方が33と37の関係が強化されているためによ
りよく表わすことになるので、36と32の関係が強化
されて、36と31の関係が弱められることになる。
【0055】こうして、3回目にして正しい関係が得ら
れるようになるが、一般には、このようなステップをく
り返すことによって最終的に正しい対応づけを得ること
ができる。
【0056】このような手法は一般にリラキゼーション
として知られる方式を変形してこの問題に適用したもの
である。また、別の対応づけ方法も可能である。例え
ば、登録フォーマットに記述されたエレメントの位置を
上下左右にずらしながら入力画像内のエレメントと対応
ずけを行い、各個の対応関係の良さを表わす数値を全体
として総合し、もっとも良い値を取ると推定されるずれ
量を検出することによって、その時の各エレメントの対
応を最終的な対応ずけとするものである。
【0057】また、登録フォーマットを作成する際にサ
ンプル用の入力画像を用いて、これをレイアウト理解し
て、エレメント情報を抽出し、その結果を原画像に重ね
てオペレータに対して表示し、オペレータがそれらの結
果、たとえば図8で示したような各エレメントの表示画
像に対してポインティンプデバイスを用いてエレメント
やそれに関する情報の付加、削除、修正を行って、登録
フォーマットを作成するような手段も有効な方式であ
る。
【0058】従って、このようにすれば画像入力部12
より生成された帳票11にかかる入力画像から、エレメ
ント抽出部13により所定のエレメントが抽出され、こ
の抽出されたエレメントとと予め登録フォーマット記憶
部14に登録された複数種類のエレメントによる文書フ
ォーマットとがマッチング部15により照合され、この
マッチング結果より入力画像に対応する文書フォーマッ
トが特定されるようになるので、この場合も、上述した
実施例と同様にして、帳票などの文書フォーマットを正
確に特定できるともに、文書中の読み取るべき文字列の
記載位置を正確に特定でき、文字列の読み取りを効率よ
く行うことができるようになる。なお、本発明は、上記
実施例にのみ限定されず、要旨を変更しない範囲で適宜
変形して実施できる。
【0059】
【発明の効果】本発明によれば、格子状の表を形成する
けい線について定義した第1の文書フォーマット及び該
格子状の表に記入される文字列の内容について該格子状
の表の列ごとに定義した第2の文書フォーマットを含む
登録フォーマットを登録フォーマット記憶手段に記憶
し、文書より入力画像を生成し、生成された前記入力画
像から格子状の表を形成するけい線及び該格子状の表に
記入されている文字列を抽出し、抽出された前記格子状
の表を形成するけい線と前記登録フォーマット記憶手段
に登録された前記第1の文書フォーマットとを照合する
とともに、この照合によって複数の認識結果の候補が得
られた場合には、抽出された前記格子状の表に記入され
ている文字列の内容と前記登録フォーマット記憶手段に
登録された前記第2の文書フォーマットとを前記格子状
の表の各列ごとに照合して、該複数の認識結果の候補の
うちから最もマッチング度合いの高い認識結果を選択す
るので、文書中の格子状の表を正確に認識し、格子状の
表の要素として記入された文字列を正確に認識すること
ができる。
【0060】
【図面の簡単な説明】
【図1】本発明の一実施例の概略構成を示す図。
【図2】一実施例の特徴抽出部での特徴抽出例を示す
図。
【図3】一実施例の登録フォーマット記憶部に登録され
た特徴データ例を示す図。
【図4】一実施例のマッチング結果表示部でのマッチン
グ処理の結果例を示す図。
【図5】一実施例での異なる特徴抽出例を示す図。
【図6】本発明の他の実施例の概略構成を示す図。
【図7】他の実施例の帳票の入力画像を示す図。
【図8】他の実施例のエレメント抽出部での抽出例を示
す図。
【図9】他の実施例の他の帳票の入力画像を示す図。
【図10】図9の入力画像に対するエレメント抽出例を
示す図。
【図11】図9の入力画像に対するエレメント抽出例を
示す図。
【図12】他の実施例の他の帳票の入力画像を示す図。
【図13】他の実施例のマッチング部でのマッチング処
理を説明するための図。
【符号の説明】
1、11…帳票、2、12…画像入力部、3…特徴抽出
部、4、14…登録フォーマット記憶部、5、15…マ
ッチング部、6…マッチング結果表示部、7、16…文
字認識部、8、17…認識結果出力部、13…エレメン
ト抽出部、18…行、19…けい線、20…ヘッダ、2
1…フッタ、22…ブロック、23…カラム、24…帳
票、25…可変部分、26、27…固定部分。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平4−104385(JP,A) 特開 昭61−59568(JP,A) 特開 昭62−38984(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/20

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】格子状の表を形成するけい線について定義
    した第1の文書フォーマット及び該格子状の表に記入さ
    れる文字列の内容について該格子状の表の列ごとに定義
    した第2の文書フォーマットを含む登録フォーマットを
    記憶するための登録フォーマット記憶手段と、 文書より入力画像を生成する画像入力手段と、 この画像入力手段より出力された入力画像から格子状の
    表を形成するけい線及び該格子状の表に記入されている
    文字列を抽出する抽出手段と 前記抽 出手段より抽出された前記格子状の表を形成する
    けい線と前記登録フォーマット記憶手段に登録された
    記第1の文書フォーマットとを照合するとともに、この
    照合によって複数の認識結果の候補が得られた場合に
    は、前記抽出手段より抽出された前記格子状の表に記入
    されている文字列の内容と前記登録フォーマット記憶手
    段に登録された前記第2の文書フォーマットとを前記格
    子状の表の各列ごとに照合して、該複数の認識結果の候
    補のうちから最もマッチング度合いの高い認識結果を選
    するマッチング手段とを具備したことを特徴とする文
    書画像処理装置。
  2. 【請求項2】格子状の表を形成するけい線について定義
    した第1の文書フォーマット及び該格子状の表に記入さ
    れる文字列の内容について該格子状の表の列ごとに定義
    した第2の文書フォーマットを含む登録フォーマットを
    登録フォーマット記憶手段に記憶し、 文書より入力画像を生成し、 生成された前記入力画像から格子状の表を形成するけい
    線及び該格子状の表に記入されている文字列を抽出し、 抽出された前記格子状の表を形成するけい線と前記登録
    フォーマット記憶手段に登録された前記第1の文書フォ
    ーマットとを照合するとともに、この照合によって複数
    の認識結果の候補が得られた場合には、抽出された前記
    格子状の表に記入されている文字列の内容と前記登録フ
    ォーマット記憶手段に登録された前記第 2の文書フォー
    マットとを前記格子状の表の各列ごとに照合して、該複
    数の認識結果の候補のうちから最もマッチング度合いの
    高い認識結果を選択することを特徴とする文書画像処理
    方法。
JP23824692A 1992-09-07 1992-09-07 文書画像処理装置及び文書画像処理方法 Expired - Fee Related JP3215176B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP23824692A JP3215176B2 (ja) 1992-09-07 1992-09-07 文書画像処理装置及び文書画像処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP23824692A JP3215176B2 (ja) 1992-09-07 1992-09-07 文書画像処理装置及び文書画像処理方法

Publications (2)

Publication Number Publication Date
JPH0689365A JPH0689365A (ja) 1994-03-29
JP3215176B2 true JP3215176B2 (ja) 2001-10-02

Family

ID=17027323

Family Applications (1)

Application Number Title Priority Date Filing Date
JP23824692A Expired - Fee Related JP3215176B2 (ja) 1992-09-07 1992-09-07 文書画像処理装置及び文書画像処理方法

Country Status (1)

Country Link
JP (1) JP3215176B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4416890B2 (ja) 1999-12-20 2010-02-17 富士通株式会社 帳票識別装置
JP4742404B2 (ja) * 2000-05-17 2011-08-10 コニカミノルタビジネステクノロジーズ株式会社 画像認識装置、画像形成装置、画像認識方法および画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JP4881722B2 (ja) * 2006-12-28 2012-02-22 日立コンピュータ機器株式会社 帳票識別装置、及び帳票識別プログラム
JP4825243B2 (ja) * 2008-06-20 2011-11-30 富士通フロンテック株式会社 帳票認識装置、方法、データベース作成装置、方法、及びプログラム
JP6227903B2 (ja) 2013-06-07 2017-11-08 Jfeスチール株式会社 粉末冶金用合金鋼粉および鉄基焼結体の製造方法
KR20160045825A (ko) 2013-09-26 2016-04-27 제이에프이 스틸 가부시키가이샤 분말 야금용 합금 강분 및 철기 소결체의 제조 방법
JP6322291B2 (ja) * 2014-09-26 2018-05-09 株式会社日立製作所 文書処理装置および項目抽出方法
WO2019008766A1 (ja) * 2017-07-07 2019-01-10 株式会社クラビス 証憑処理システムおよび証憑処理プログラム

Also Published As

Publication number Publication date
JPH0689365A (ja) 1994-03-29

Similar Documents

Publication Publication Date Title
JP3294995B2 (ja) 帳票読取装置
US6466694B2 (en) Document image processing device and method thereof
JP4996940B2 (ja) 帳票認識装置およびそのプログラム
JP2001325562A (ja) 画像認識装置、画像形成装置、画像認識方法および画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JP4183527B2 (ja) 帳票定義データ作成方法および帳票処理装置
JP2835178B2 (ja) 文書読取装置
KR100268367B1 (ko) 화성 처리 방법과 장치
JP4280355B2 (ja) 文字認識装置
JP2008059527A (ja) 画像処理装置およびプログラム
US6549662B1 (en) Method of recognizing characters
JP3215176B2 (ja) 文書画像処理装置及び文書画像処理方法
JP4807618B2 (ja) 画像処理装置及び画像処理プログラム
JPH08320914A (ja) 表認識方法および装置
JPH08329187A (ja) 文書読取装置
JP2001126010A (ja) 帳票処理装置、帳票定義作成方法、領域抽出方法及び記憶媒体
JPH11232439A (ja) 文書画像構造解析方法
JP3732254B2 (ja) フォーマット情報生成方法及びフォーマット情報生成装置
JP4517822B2 (ja) 画像処理装置及びプログラム
JP3484446B2 (ja) 光学文字認識装置
JP2917427B2 (ja) 図面読取装置
JPH10207981A (ja) 帳票認識方法
JP2918666B2 (ja) 文字画像切出し方法
JP2677271B2 (ja) 文字認識装置
JP4081074B2 (ja) 帳票処理装置、帳票処理方法、及び帳票処理プログラム
JP2544589B2 (ja) 文書処理方法及び装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees