JPH0689365A - 文書画像処理装置 - Google Patents

文書画像処理装置

Info

Publication number
JPH0689365A
JPH0689365A JP4238246A JP23824692A JPH0689365A JP H0689365 A JPH0689365 A JP H0689365A JP 4238246 A JP4238246 A JP 4238246A JP 23824692 A JP23824692 A JP 23824692A JP H0689365 A JPH0689365 A JP H0689365A
Authority
JP
Japan
Prior art keywords
document
matching
format
image
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4238246A
Other languages
English (en)
Other versions
JP3215176B2 (ja
Inventor
Yoshiaki Kurosawa
由明 黒沢
Shunji Ariyoshi
俊二 有吉
Shuichi Tsujimoto
修一 辻本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP23824692A priority Critical patent/JP3215176B2/ja
Publication of JPH0689365A publication Critical patent/JPH0689365A/ja
Application granted granted Critical
Publication of JP3215176B2 publication Critical patent/JP3215176B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】本発明は、帳票などの文書フォーマットを正確
に特定でき、効率のよい文字列の読み取りを可能にした
文書画像処理装置を提供する。 【構成】画像入力部2より生成される帳票1の入力画像
から、特徴抽出部3により文書フォーマットを認識する
のに必要な特徴が抽出されると、この抽出された特徴と
予め登録フォーマット記憶部4に登録された文書フォー
マットに関する特徴データとがマッチング部5により照
合され、このマッチング結果として複数の候補が出力さ
れると、オペレータによりこれら複数の候補より入力画
像に対応する文書フォーマットが特定されるようにして
いる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、例えば帳票などの文書
上に記載された文字の読み取りに用いられる文書画像処
理装置に関するものである。
【0002】
【従来の技術】最近、銀号や保険会社などでは、帳票な
どの処理にコンピュータが用いられ、帳票上に記された
文字列を、例えば光学的なパターン認識により読取り、
これをコード化してコンピュータに入力するようなこと
が行なわれている。
【0003】ところで、このような帳票上に記された文
字列を読取り対象とする場合、帳票のフォーマットを事
前に知る必要がある。そこで、帳票のように定型的なも
のに対する文字列の読取り処理では、帳票の定型的なフ
ォーマットを事前に覚えさせておき、読み取るべき文字
列の記載位置を予め特定することにより、効率のよい文
字列の読み取りを実現している。
【0004】一方、最近になって、フォーマットの異な
る帳票に対しても文字列の読取りを可能にすることが考
えられている。ところが、このように帳票のフォーマッ
トが異なると、読み取るべき文字列の記載位置がそれぞ
れ異なるため、各帳票の入力画像を解析するなどして文
字列の記載位置などを抽出する必要がある。
【0005】そこで、従来では、白/黒の画素で表現さ
れる帳票の入力画像について、黒画素の連結性を調べる
ことにより帳票を構成する段組位置を決定するととも
に、各段組内において文字列方向に隣接する文字を統合
することで文字列を定義し、かかる文字列の読み取りを
行なうようにしている。
【0006】
【発明が解決しようとする課題】ところが、このような
考えを採用したものでは、帳票の入力画像について黒画
素の連結性を調べることで帳票を構成する段組位置を決
定するようにしているため、仮に、帳票の入力画像をス
キャナなどにより生成する際に明瞭な入力画像が得られ
ないことがあって黒画素の連結性が不安定なことがある
と、帳票を構成する段組位置を誤検出し、文字列の読み
取りが正確にできなくなるという問題点があった。
【0007】本発明は、上記事情に鑑みてなされたもの
で、帳票などの文書のフォーマットを正確に特定でき、
効率のよい文字列の読み取りを可能にした文書画像処理
装置を提供することを目的とする。
【0008】
【課題を解決するための手段】本発明は、文書より入力
画像を生成する画像入力手段と、この画像入力手段より
出力された入力画像から文書フォーマットを認識するの
に必要な特徴を抽出する特徴抽出手段と、予め文書フォ
ーマットに関する特徴データを登録した登録フォーマッ
ト記憶手段と、前記特徴抽出手段より抽出された特徴と
前記登録フォーマット記憶手段に登録された特徴データ
を照合するマッチング手段と、このマッチング手段での
マッチング結果として得られる複数の候補を出力する出
力手段とを具備し、この出力手段に出力される複数の候
補より前記入力画像に対応する文書フォーマットを特定
するように構成されている。
【0009】また、本発明は、文書より入力画像を生成
する画像入力手段と、この画像入力手段より出力された
入力画像から所定のエレメントを抽出するエレメント抽
出手段と、予め複数種類のエレメントによる文書フォー
マットを登録した登録フォーマット記憶手段と、前記エ
レメント抽出手段より抽出されたエレメントと前記登録
フォーマット記憶手段に登録された特徴データを照合す
るマッチング手段とを具備し、このマッチング手段での
マッチング結果に基ずいて前記入力画像に対応する文書
フォーマットを特定するように構成されている。
【0010】
【作用】この結果、本発明は、文書より生成された入力
画像から文書フォーマットを認識するのに必要な特徴が
抽出され、この抽出された特徴と予め登録された文書フ
ォーマットに関する特徴データとが照合され、この結果
として複数の候補が出力されると、これら複数の候補よ
り入力画像に対応する文書フォーマットが特定されるよ
うになる。これにより、帳票などの文書フォーマットを
照合する結果として取り出した部分の行数や桁数が文書
によって異なっていても特定できるようになるので、文
書中の読み取るべき文字列の記載位置を正確に特定でき
るようになる。
【0011】また、本発明は、文書より入力画像を生成
された画像入力から所定のエレメントが抽出され、この
抽出されたエレメントと予め登録された複数種類のエレ
メントによる文書フォーマットとが照合され、この結果
として入力画像に対応する文書フォーマットが特定され
るようになる。あらかじめ登録された文書フォーマット
に、エレメント間の相互関係(包含関係や位置関係)を
も記述したおき、複数種類のエレメントに対して照合を
行って各照合結果が矛盾したり照合結果が確認できなか
ったりしたときに、この相互関係を利用して入力画像の
文書フォーマットを特定するとさらに効果的である。従
って、この場合も帳票などの文書フォーマットを特定で
きるようになるので、文書中の読み取るべき文字列の記
載位置を正確に特定できるようになる。
【0012】
【実施例】以下、本発明の一実施例を図面に従い説明す
る。図1は同実施例の概略構成を示している。
【0013】この場合、同実施例は、帳票1、画像入力
部2、特徴抽出部3、登録フォーマット記憶部4、マッ
チング部5、マッチング結果表示部6、文字認識部7、
認識結果出力部8により構成されている。
【0014】しかして、帳票1に関する入力画像は、画
像入力部2を介してシステム内に取り込まれる。画像入
力部2は、スキャナーやFAXデータの入力部などが用
いられる。
【0015】そして、画像入力部2より出力される入力
画像は、特徴抽出部3に送られる。特徴抽出部3は、入
力画像よりその特徴を抽出する。ここでの特徴として
は、例えば帳票内のけい線を構成する線分、文字列部
分、その文字列を認識した文字認識結果などが考えられ
る。
【0016】図2(a)(b)は、それぞれ帳票1に関
する入力画像を示すもので、特徴抽出部3では、これら
の入力画像に対して同図(c)(d)に示すように入力
帳票内のけい線を構成する線分情報を特徴として抽出す
るようになる。そして、特徴抽出部3より抽出された特
徴は、登録フォーマット記憶部4からの出力とともにマ
ッチング部5に送られる。
【0017】登録フォーマット記憶部4は、帳票のフォ
ーマットに関する特徴データを登録しているもので、こ
こでは、図3に示すように帳票のけい線の位置情報と記
入欄の記入項目などが登録されている。
【0018】この状態で、マッチング部5により、登録
フォーマット記憶部4に登録されている帳票の特徴デー
タであるけい線の位置情報と特徴抽出部3より抽出され
た入力帳票のけい線情報とのマッチング処理が行われ
る。ここでは、登録フォーマット記憶部4に登録されて
いるけい線が、特徴抽出部3より抽出された入力帳票の
けい線のどこに存在するか、その位置が特定されるよう
になる。
【0019】この場合、登録フォーマット記憶部4に複
数のフォーマットに関する特徴データを登録しておき、
これら複数のフォーマット情報のうちのどのフォーマッ
トに特徴抽出部3より抽出された入力帳票が該当するか
特定するようにしてもよい。勿論、あらかじめどのフォ
ーマットの帳票が入力されたかを指定するようにするこ
ともできる。
【0020】この結果、例えば、図2(c)に示す入力
帳票のけい線情報に対して図示矢印aおよびbのそれぞ
れの位置が登録フォーマット記憶部4に登録されたフォ
ーマットの上端と対応することになる。このことは、特
徴として抽出された入力帳票のけい線に対して登録フォ
ーマット記憶部4に登録されたフォーマットが図示矢印
aまたはbの位置の2候補があることになる。同様にし
て、図2(d)の場合は、登録されたフォーマットが図
示矢印c、d、eの3候補があることになる。
【0021】このマッチング部5でのマッチング処理結
果は、マッチング結果表示部6に送られる。マッチング
結果表示部6では、前記複数の候補位置に関して、それ
ぞれの特定位置を図4(a)(b)(c)に示すように
順次表示し、オペレータに正しいマッチング位置の指示
入力を促すようになる。
【0022】この場合、図4(a)は、図2(d)の図
示矢印cで表される候補、図4(b)は、同図の図示矢
印dで表される候補、図4(c)は、同図の図示矢印e
で表される候補にそれぞれ対応している。
【0023】ここでは、図4(a)が正しいので、オペ
レータは図4(a)が表示された時点で、それが正しい
ことを知らせるキー入力を行なう。これにより、マッチ
ング部5より複数出力されていた曖昧な位置情報は一意
に決定されるようになる。
【0024】なお、この例では、マッチング結果表示部
6での特定位置の表示を登録フォーマットの外枠を太い
線にして原画像の上に重ねて表示しているが、その方法
には様々な方式がある。例えば、太線のかわりに原画の
表示濃度や色に対して特定位置表示用の線分の濃度を変
えたり、色をかえて表示することもできるし、外枠だけ
でなくすべてのけい線を原画の上に重ねて表示するよう
にしてもよい。また、領域を塗りつぶすようにして表示
してもよいし、領域に薄い色を重ねあわせて表示するよ
うな方法を使ってもよい。
【0025】そして、上記のようにして決定された図4
(a)の表示内容について、文字認識部7において、登
録フォーマットのけい線情報によってけい線部分を取り
除き、記入または印刷された文字列を読み取るようにな
る。ここで、けい線を取り除く方法や文字認識方式には
様々な手法があるが、ここではそれを特に限定しない。
【0026】そして、文字認識部7での認識結果は認識
結果出力部8より外部に出力されることになる。勿論、
この時点で認識結果についてオペレータによる確認や修
正プロセスがあってもよい。
【0027】ところで、上述のマッチング部5において
マッチングの正しさの度合いに数値で表す方法を導入す
るようにしてもよい。例えば、図4の例では、登録フォ
ーマットとマッチした各エリア内において文字認識を行
ない、その認識結果と登録フォーマットに定義された各
項目の記載内容との比較チェックを行なうようにする。
例では「番号」「品名」「金額」と、図4(a)の第1
番目の欄の「1」「ダイコン」「¥259」が比較され
る。この場合、「番号」は数字、「品名」はカタカナ、
「金額」は¥+数字と定義されているとすると、図4
(a)の選択された領域の4個の欄はすべて項目定義の
内容にマッチする。一方、図4(b)では,選択された
領域の第4番目の欄は空白でありマッチしない。図4
(c)も同じく第3、第4番目の欄はマッチしない。す
なわち,図4(a)(b)(c)の順で選択された領域
のマッチング度合が低くなる。
【0028】この他にも対応づけを行なったけい線のマ
ッチング度合、すなわち長さのずれ線に垂直方向のず
れ、方向のずれ、太さのずれなどの項目を考慮したけい
線の対応する度合を上記マッチング度合の計算に含める
ようにしてもよい。また、図5のa〜cに示す各欄の左
方に特定の文字が必ず印刷されているような場合は、こ
このプレプリントの情報を登録フォーマット記憶部4に
登録しておいてもよく、この部分を入力画像とのマッチ
ングにおいてチェックすることによりその有無をマッチ
ング度合の計算に含めるようにしてもよい。いずれにし
てもシステムは選択された領域の正しらしさを計算する
評価式を内蔵しており、それをマッチング時に計算する
ことによって、選択された領域を正しいと思われる順に
ならべることができる。
【0029】そして、オペレータに選択された領域を提
示する際に、正しい順に提示するようにすれば、無駄な
選択領域をオペレータがチェックする機会は減少するの
で、作業時間の短縮に役だつ。また、正しらしさの評価
値がある閾値を越えるとか、その値の1位と2位の差が
ある閾値以上である場合には、オペレータによるチェッ
クすなわちマッチング結果表示部6の処理を省略して、
第1位の選択領域を文字認識部7に入力するようにし
て、残りのケースについてのみマッチング結果表示部6
でオペレータによってチェックするようにもできる。
【0030】上記の説明では対応が取られる欄の数を4
個と固定したが、これを可変になるようにしてもよい。
すなわち、欄の数がたて方向にn1 個〜n2 個、横方向
にm1 個〜m2 個存在するというような定義でもよい。
たとえば、1個以上の欄があればよいことにすると、選
択領域の候補数はさらに増えることになる。このケース
では選択領域に含まれる登録フォーマットの欄とうまく
マッチした欄の数が多い程評価基準が高いようなマッチ
ング度合の評価式を定義すれば、マッチング結果表示部
6における無駄な選択領域の表示とオペレータの確認を
避ける事ができる。またこの場合に、含まれる欄の数が
多いものから順に評価式を計算するようにして、評価値
がある閾値を越えるような時にその選択領域に含まれる
部分領域については評価を最初から行なわないようにし
て処理時間を短縮するようにもできる。けい線は空白部
分に仮のけい線があると見なして抽出した仮けい線であ
ってもよい。
【0031】従って、このようにすれば、画像入力部2
より生成された帳票1にかかる入力画像から、特徴抽出
部3により文書フォーマットを認識するのに必要な特徴
が抽出され、この抽出された特徴と予め登録フォーマッ
ト記憶部4に登録された文書フォーマットに関する特徴
データとがマッチング部5により照合され、このマッチ
ング結果として複数の候補が出力されると、オペレータ
によりこれら複数の候補より入力画像に対応する文書フ
ォーマットが特定されるようになるので、帳票などの文
書フォーマットを正確に特定できるともに、文書中の読
み取るべき文字列の記載位置を正確に特定でき、文字列
の読み取りを効率よく行うことができるようになる。次
に、本発明の他の実施例を説明する。図6は同他の実施
例の概略構成を示している。
【0032】この場合、同他の実施例は、帳票11、画
像入力部12、エレメント抽出部13、登録フォーマッ
ト記憶部14、マッチング部15、文字認識部16、認
識結果出力部17により構成されている。
【0033】しかして、この場合も帳票11に関する入
力画像は、画像入力部12を介してシステム内に取り込
まれる。画像入力部12は、スキャナーやFAXデータ
の入力部などが用いられる。
【0034】そして、画像入力部2より出力される入力
画像は、エレメント抽出部13に送られる。エレメント
抽出部13は、帳票11上に記載された文字、行、パラ
グラフ、ブロック、カラム、段組、けい線、記入欄、ヘ
ッダ、フッタ、タイトルなどをエレメントとしてそれら
を抽出するようにしている。
【0035】図7は、入力される帳票11の入力画像を
示している。そして、エレメント抽出部13は、例え
ば、図8(a)に示すように帳票11中に記入または印
刷された文字列の行18をエレメントとして抽出するよ
うにしている。この場合、各行18は、矩形で表現され
ており、具体的には各矩形の位置を定義する情報がエレ
メントデータとして抽出されることになる。
【0036】エレメント抽出部13は、図8(b)に示
すように帳票11中に印刷されたけい線19をエレメン
トとして抽出するようにしてもよい。この場合、けい線
19は、文字領域に対応していて文字に対応する外接長
方形がエレメントとして図中に表現されるようになる。
具体的にはこれら外接長方形の位置を定義する情報がエ
レメントのデータとして抽出されることになる。
【0037】ここでは、正しく外接長方形が困難である
場合もあるので、ある程度以下の大きさの連結領域を取
り出して、それらの外接長方形を文字エリアを表わすエ
レメントとしてもよい。また、重なりあう連結領域をマ
ージして新しいエリアを作成し、それをエレメントとし
てもよい。これらの連結領域や文字エリアを横方向、ま
たは縦方向にマージして行を抽出することも可能であ
る。また、文字エリアの文字を認識すれば文字の存在位
置だけでなく文字コード、または候補文字コード群をエ
レメントとすることもできる。
【0038】また、エレメント抽出部13は、図8
(c)に示すように帳票11中のヘッダ20、フッタ2
1をエレメントとして抽出することもできる。これらヘ
ッダ20、フッタ21の他に、タイトル、パラグラフ、
ブロック、カラム、段組などもエレメントとして採用す
ることが可能であり、これらは、すでに知られているレ
イアウト理解技術によって抽出することができる。
【0039】一方、図9は、別の帳票11に関する入力
画像の例で、図10は、この入力画像に対してエレメン
トとして抽出されたブロック22を示すものである。こ
こでのブロック22とは、区切線、スペース、段落など
によって区切られた一連の行からなるものである。パラ
グラフは文章中に表われる段落によって区切られた行の
かたまりであるが、このプラグラフは、ブロックの一種
と見なせる。
【0040】また、図11は、図9に示す入力画像に対
してエレメントとして抽出されるカラム23を示すもの
である。ここでのカラム23はブロックを縦方向に接続
したもので、カラム23が頁全体を構成する形が段組
で、この場合は2段組の例を示している。
【0041】これら以外にも破線とか、写真とか図形な
ど様々なエレメントが考えられる。エレメントには属性
が付属してもよく、それは色濃度線の太さ、文字フォン
ト、形状のバリエーションなどである。そして、エレメ
ント抽出部13より抽出されたエレメントは、登録フォ
ーマット記憶部14からの出力とともにマッチング部1
5に送られる。登録フォーマット記憶部14は、認識対
象となる複数の帳票のレイアウト情報を上述した各エレ
メントによる記述によってそれぞれ登録している。
【0042】この状態で、マッチング部15によりエレ
メント抽出部13より抽出されたエレメントと登録フォ
ーマット記憶部14に登録されたエレメントの記述によ
るフォーマット情報とのマッチング処理が行なわれる。
【0043】ここでのマッチング処理は、例えば、文字
コードの一致性、矩形の位置情報のずれ量、線のずれ量
などを評価量として、もっとも不一致やずれの少ない対
応関係を見つけ出すことによって行なう。より良い対応
関係の発見法としては「リラキゼーション法の変形」や
「ずらしながらマッチングを取り最適マッチングを発見
する方法」などを適用することができる。
【0044】このようにして登録されたフォーマットと
の対応が取られ、入力画像の各エレメント位置が特定さ
れると、これらの位置関係に基づいて、登録フォーマッ
ト記憶部14またはその他の部分に記憶されている認識
に関する情報や指示に基づいて、入力画像内の各エレメ
ント位置に存在する文字は文字認識部16により認識さ
れ、この認識結果が、認識結果出力部17により外部に
出力されるようになる。勿論、この時点で認識結果につ
いてオペレータによる確認や修正プロセスがあってもよ
い。
【0045】図12は、図7と同じタイプの帳票24を
例示したものであるが、この帳票24には後述の可変部
分25と行の構成の固定部分26、27がある。この場
合、可変部分25は、3個の記入欄を横方向に接続した
記入行を縦方向に接続して構成されたもので、その数を
可変としている。上述の図7では、3行であるが、図1
2では6行である。
【0046】そして、このようなケースに対応するため
に、登録フォーマット記憶部14では、可変エレメント
と固定エレメントが分けて登録している。この場合、可
変エレメントは、位置の変動範囲やエレメントの変動範
囲などが記述されている。例えば、図12の例では、記
入欄のエレメントが縦方向に2行から10行まで、また
は、それを構成するけい線のエレメントが縦方向に4本
から14本までのように記載されることになる。
【0047】また、図12の固定部分26、27は、そ
の文字数や文字そのもの、文字フォント、文字の大きさ
が可変になっているが、これらを可変部分と見なして登
録することもでき、またこれらを行エレメントとしてし
まうことによって固定部分にすることができる。もしこ
れを可変とした場合、例えば固定部分26の最初の行の
表現は「SHEETNo.(1〜5ケタの数字列)」のよ
うに定義すればよい。また、例えば、フォーマット登録
として、登録されているエレメントであるが、読取り対
象としないというような指定も可能であることは言うま
でもない。例えば、図12で、固定部分26、27を読
取らなくても良いエレメントとするようなこともでき
る。
【0048】なお、変動部分25についてはエレメント
そのものが変化しうることを表現できるようにしてもよ
い。例えば図7に示す破線エレメントは普通の線分にも
なり得ることを指定できるようにすれば、図12では破
線部分が普通の線分になっているが、そのような入力が
あっても問題が起きない。
【0049】このようにエレメントが可変、またはエレ
メントから構成されるものが可変であるように記述でき
ることはシステムの柔軟性に寄与する。また、可変性や
固定性、すなわち固定エレメント、可変エレメントと云
う固定部、可変部を明示的に分離して定義することはシ
ステム設計を容易にする点やオペレータによる定義をわ
かりやすくする点などで効果的である。次に、マッチン
グ部15でのマッチング処理の具体例を説明する。
【0050】この場合、登録フォーマットの各エレメン
トに対応するもっとも可能性の高いエレメントを入力画
像のエレメントより選び出すことになるが、ここでは、
例えば入力画像の複数のエレメントが登録フォーマット
の1個のエレメントにだけ対応しないように対応づけを
行なう。
【0051】図13(a)(b)(c)は、この例を説
明するためのもので、41は入力画像中から抽出された
エレメントを示し、ここでは、文字エリア31、32、
33と線分34、35からなっている。また、42は登
録フォーマット内のエレメントを示し、ここでは文字エ
リア36、37と線分38、39からなっている。
【0052】そして、第1回目のマッチング処理では、
図13(a)に示すように個々のエレメントは、その種
類と位置の近さから対応づけられる。この場合は、31
と36、32と37、34と38、35と39に対応づ
けられる。また、弱い対応関係として32と36、33
と37が破線で示すように対応づけられる。次のステッ
プでは対応した各エレメントについて、周囲のエレメン
トとの関係をチェックして対応関係の変更を行なう。
【0053】図13(b)は、第2回目の処理でエレメ
ント37の対応づけをやり直した例を示している。ここ
ではエレメント37の隣のエレメント36と38の位置
関係が登録フォーマットに記述されているものとして、
その対応関係が入力画像中のエレメント間でも成立する
かどうかが検証される。上述の図13(a)から得られ
た対応関係から36−37−38の位置関係は、31−
32−34となるが、弱い関係の37と33に着目した
時、同じく弱い関係の36と32を使い、弱い関係なが
ら32−33−34が同じく36−37−38のエレメ
ントの位置関係に対応することがわかる。位置関係につ
いて言えば、この方がより良く36−37−38の位置
関係に対応するので、トータルな確さらしさが、もし3
2−33−34の組が31−32−34を上まわったと
すれば37と33の関係が強化され、逆に37と32の
関係が弱められるようになる。
【0054】さらに、第3回目として図13(c)に示
すような処理が行われる。この場合、エレメント36に
着目した時に36−37の位置関係を32−33の位置
関係の方が33と37の関係が強化されているためによ
りよく表わすことになるので、36と32の関係が強化
されて、36と31の関係が弱められることになる。
【0055】こうして、3回目にして正しい関係が得ら
れるようになるが、一般には、このようなステップをく
り返すことによって最終的に正しい対応づけを得ること
ができる。
【0056】このような手法は一般にリラキゼーション
として知られる方式を変形してこの問題に適用したもの
である。また、別の対応づけ方法も可能である。例え
ば、登録フォーマットに記述されたエレメントの位置を
上下左右にずらしながら入力画像内のエレメントと対応
ずけを行い、各個の対応関係の良さを表わす数値を全体
として総合し、もっとも良い値を取ると推定されるずれ
量を検出することによって、その時の各エレメントの対
応を最終的な対応ずけとするものである。
【0057】また、登録フォーマットを作成する際にサ
ンプル用の入力画像を用いて、これをレイアウト理解し
て、エレメント情報を抽出し、その結果を原画像に重ね
てオペレータに対して表示し、オペレータがそれらの結
果、たとえば図8で示したような各エレメントの表示画
像に対してポインティンプデバイスを用いてエレメント
やそれに関する情報の付加、削除、修正を行って、登録
フォーマットを作成するような手段も有効な方式であ
る。
【0058】従って、このようにすれば画像入力部12
より生成された帳票11にかかる入力画像から、エレメ
ント抽出部13により所定のエレメントが抽出され、こ
の抽出されたエレメントとと予め登録フォーマット記憶
部14に登録された複数種類のエレメントによる文書フ
ォーマットとがマッチング部15により照合され、この
マッチング結果より入力画像に対応する文書フォーマッ
トが特定されるようになるので、この場合も、上述した
実施例と同様にして、帳票などの文書フォーマットを正
確に特定できるともに、文書中の読み取るべき文字列の
記載位置を正確に特定でき、文字列の読み取りを効率よ
く行うことができるようになる。なお、本発明は、上記
実施例にのみ限定されず、要旨を変更しない範囲で適宜
変形して実施できる。
【0059】
【発明の効果】本発明によれば、文書より生成された入
力画像から文書フォーマットを認識するのに必要な特徴
が抽出され、この抽出された特徴と予め登録された文書
フォーマットに関する特徴データとが照合され、この結
果として複数の候補が出力されると、これら複数の候補
より入力画像に対応する文書フォーマットが特定される
ようになるので、帳票などの文書フォーマットを照合す
る結果として取り出した部分の行数や桁数が文書によっ
て異なっていても特定できるようになり、文書中の読み
取るべき文字列の記載位置を正確に特定でき、効率のよ
い文字列の読み取りを安定して実現できる。
【0060】また、本発明は、文書より生成された画像
入力から所定のエレメントが抽出され、この抽出された
エレメントと予め登録された複数種類のエレメントによ
る文書フォーマットとが照合され、この結果として入力
画像に対応する文書フォーマットが特定されるようにな
るので、この場合も帳票などの文書フォーマットを特定
できるようになり、文書中の読み取るべき文字列の記載
位置を正確に特定でき、効率のよい文字列の読み取りを
安定して実現できる。
【図面の簡単な説明】
【図1】本発明の一実施例の概略構成を示す図。
【図2】一実施例の特徴抽出部での特徴抽出例を示す
図。
【図3】一実施例の登録フォーマット記憶部に登録され
た特徴データ例を示す図。
【図4】一実施例のマッチング結果表示部でのマッチン
グ処理の結果例を示す図。
【図5】一実施例での異なる特徴抽出例を示す図。
【図6】本発明の他の実施例の概略構成を示す図。
【図7】他の実施例の帳票の入力画像を示す図。
【図8】他の実施例のエレメント抽出部での抽出例を示
す図。
【図9】他の実施例の他の帳票の入力画像を示す図。
【図10】図9の入力画像に対するエレメント抽出例を
示す図。
【図11】図9の入力画像に対するエレメント抽出例を
示す図。
【図12】他の実施例の他の帳票の入力画像を示す図。
【図13】他の実施例のマッチング部でのマッチング処
理を説明するための図。
【符号の説明】
1、11…帳票、2、12…画像入力部、3…特徴抽出
部、4、14…登録フォーマット記憶部、5、15…マ
ッチング部、6…マッチング結果表示部、7、16…文
字認識部、8、17…認識結果出力部、13…エレメン
ト抽出部、18…行、19…けい線、20…ヘッダ、2
1…フッタ、22…ブロック、23…カラム、24…帳
票、25…可変部分、26、27…固定部分。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 文書より入力画像を生成する画像入力手
    段と、 この画像入力手段より出力された入力画像から文書フォ
    ーマットを認識するのに必要な特徴を抽出する特徴抽出
    手段と、 予め文書フォーマットに関する特徴データを登録した登
    録フォーマット記憶手段と、 前記特徴抽出手段より抽出された特徴と前記登録フォー
    マット記憶手段に登録された特徴データを照合するマッ
    チング手段と、 このマッチング手段でのマッチング結果として得られる
    複数の候補を出力する出力手段とを具備し、 この出力手段に出力される複数の候補より前記入力画像
    に対応する文書フォーマットを特定することを特徴とす
    る文書画像処理装置。
  2. 【請求項2】 文書より入力画像を生成する画像入力手
    段と、 この画像入力手段より出力された入力画像から所定のエ
    レメントを抽出するエレメント抽出手段と、 予め複数種類のエレメントによる文書フォーマットを登
    録した登録フォーマット記憶手段と、 前記エレメント抽出手段より抽出されたエレメントと前
    記登録フォーマット記憶手段に登録された特徴データを
    照合するマッチング手段とを具備し、 このマッチング手段でのマッチング結果に基ずいて前記
    入力画像に対応する文書フォーマットを特定することを
    特徴とする文書画像処理装置。
JP23824692A 1992-09-07 1992-09-07 文書画像処理装置及び文書画像処理方法 Expired - Fee Related JP3215176B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP23824692A JP3215176B2 (ja) 1992-09-07 1992-09-07 文書画像処理装置及び文書画像処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP23824692A JP3215176B2 (ja) 1992-09-07 1992-09-07 文書画像処理装置及び文書画像処理方法

Publications (2)

Publication Number Publication Date
JPH0689365A true JPH0689365A (ja) 1994-03-29
JP3215176B2 JP3215176B2 (ja) 2001-10-02

Family

ID=17027323

Family Applications (1)

Application Number Title Priority Date Filing Date
JP23824692A Expired - Fee Related JP3215176B2 (ja) 1992-09-07 1992-09-07 文書画像処理装置及び文書画像処理方法

Country Status (1)

Country Link
JP (1) JP3215176B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001325562A (ja) * 2000-05-17 2001-11-22 Minolta Co Ltd 画像認識装置、画像形成装置、画像認識方法および画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
US6778712B1 (en) 1999-12-20 2004-08-17 Fujitsu Limited Data sheet identification device
JP2008165506A (ja) * 2006-12-28 2008-07-17 Hitachi Computer Peripherals Co Ltd 帳票識別装置、及び帳票識別プログラム
JP2010003155A (ja) * 2008-06-20 2010-01-07 Fujitsu Frontech Ltd 帳票認識装置、方法、データベース作成装置、方法、及びプログラム
KR20160006769A (ko) 2013-06-07 2016-01-19 제이에프이 스틸 가부시키가이샤 분말 야금용 합금강분 및 철기 소결체의 제조 방법
WO2016046988A1 (ja) * 2014-09-26 2016-03-31 株式会社日立製作所 文書処理装置および項目抽出方法
KR20160045825A (ko) 2013-09-26 2016-04-27 제이에프이 스틸 가부시키가이샤 분말 야금용 합금 강분 및 철기 소결체의 제조 방법
WO2019008766A1 (ja) * 2017-07-07 2019-01-10 株式会社クラビス 証憑処理システムおよび証憑処理プログラム

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6778712B1 (en) 1999-12-20 2004-08-17 Fujitsu Limited Data sheet identification device
JP2001325562A (ja) * 2000-05-17 2001-11-22 Minolta Co Ltd 画像認識装置、画像形成装置、画像認識方法および画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JP2008165506A (ja) * 2006-12-28 2008-07-17 Hitachi Computer Peripherals Co Ltd 帳票識別装置、及び帳票識別プログラム
JP2010003155A (ja) * 2008-06-20 2010-01-07 Fujitsu Frontech Ltd 帳票認識装置、方法、データベース作成装置、方法、及びプログラム
US8891871B2 (en) 2008-06-20 2014-11-18 Fujitsu Frontech Limited Form recognition apparatus, method, database generation apparatus, method, and storage medium
KR20160006769A (ko) 2013-06-07 2016-01-19 제이에프이 스틸 가부시키가이샤 분말 야금용 합금강분 및 철기 소결체의 제조 방법
KR20160045825A (ko) 2013-09-26 2016-04-27 제이에프이 스틸 가부시키가이샤 분말 야금용 합금 강분 및 철기 소결체의 제조 방법
WO2016046988A1 (ja) * 2014-09-26 2016-03-31 株式会社日立製作所 文書処理装置および項目抽出方法
JPWO2016046988A1 (ja) * 2014-09-26 2017-06-01 株式会社日立製作所 文書処理装置および項目抽出方法
WO2019008766A1 (ja) * 2017-07-07 2019-01-10 株式会社クラビス 証憑処理システムおよび証憑処理プログラム

Also Published As

Publication number Publication date
JP3215176B2 (ja) 2001-10-02

Similar Documents

Publication Publication Date Title
US6466694B2 (en) Document image processing device and method thereof
Fujisawa et al. Segmentation methods for character recognition: from segmentation to document structure analysis
JP3294995B2 (ja) 帳票読取装置
US5164899A (en) Method and apparatus for computer understanding and manipulation of minimally formatted text documents
US5721940A (en) Form identification and processing system using hierarchical form profiles
US6721451B1 (en) Apparatus and method for reading a document image
JP3088019B2 (ja) 媒体処理装置及び媒体処理方法
JP4996940B2 (ja) 帳票認識装置およびそのプログラム
JP2004139484A (ja) 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム
JPH05307638A (ja) ビットマップ・イメージ・ドキュメントのコード化データへの変換方法
JP4280355B2 (ja) 文字認識装置
JP2730665B2 (ja) 文字認識装置および方法
US6728403B1 (en) Method for analyzing structure of a treatise type of document image
JP3525997B2 (ja) 文字認識方法
CN113610068B (zh) 基于试卷图像的试题拆解方法、系统、存储介质及设备
JP3215176B2 (ja) 文書画像処理装置及び文書画像処理方法
JP3598711B2 (ja) 文書ファイリング装置
CN116682118A (zh) 一种古文字识别方法、系统、终端及介质
Sutheebanjard et al. A modified recursive xy cut algorithm for solving block ordering problems
JPH08320914A (ja) 表認識方法および装置
Yamashita et al. A document recognition system and its applications
JP3898645B2 (ja) 帳票書式編集装置および帳票書式編集プログラム
JP2001126010A (ja) 帳票処理装置、帳票定義作成方法、領域抽出方法及び記憶媒体
JPH11328306A (ja) 文書画像の論理要素抽出方法、装置および記録媒体
JP3673616B2 (ja) 商品券識別方法及び装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees