JPH10143605A - 光学文字認識装置 - Google Patents

光学文字認識装置

Info

Publication number
JPH10143605A
JPH10143605A JP8304731A JP30473196A JPH10143605A JP H10143605 A JPH10143605 A JP H10143605A JP 8304731 A JP8304731 A JP 8304731A JP 30473196 A JP30473196 A JP 30473196A JP H10143605 A JPH10143605 A JP H10143605A
Authority
JP
Japan
Prior art keywords
format
character recognition
registered
registration
optical character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8304731A
Other languages
English (en)
Other versions
JP3484446B2 (ja
Inventor
Kazuhiro Takehara
和宏 竹原
Yoji Kishida
陽二 岸田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP30473196A priority Critical patent/JP3484446B2/ja
Publication of JPH10143605A publication Critical patent/JPH10143605A/ja
Application granted granted Critical
Publication of JP3484446B2 publication Critical patent/JP3484446B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 個人の属性に関する情報を示す文字が記入済
みの入力文書であっても登録及び認識が可能であり、構
成が大幅に簡略化されているとともに、処理時間の短縮
を実現することができる光学文字認識装置を提供する。 【解決手段】 本発明に係る光学文字認識装置は、入力
文書を電子化する光電変換手段2と、電子化された画像
を記憶する画像記憶手段3aと、画像から罫線枠を抽出
する罫線枠抽出手段5と、抽出された罫線枠の格子点の
座標列を記憶する罫線枠座標列記憶手段3bと、罫線枠
座標列と登録名などの外部からの入力情報とで表される
入力文書のフォーマットを設定するフォーマット設定手
段6と、設定されたフォーマットの内容が登録されるフ
ォーマット内容登録手段4aと、登録済みフォーマット
の数を記憶するフォーマット登録数記憶手段4bとを備
えている。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は光学文字認識装置に
係り、詳しくは、運転免許証や保険証、学生証などの一
般的な定型文書の登録及び認識を行う際に用いられる光
学文字認識装置の構成に関する。
【0002】
【従来の技術】従来から、光学文字認識装置の一例とし
ては、特開平6−52156号公報で開示された文書処
理装置が知られており、この文書処理装置においては、
個人の属性に関する情報を示す文字が未記入のままの文
書、いわゆる見本文書を電子化したうえで登録してお
き、見本文書の画像から罫線枠及び罫線枠間の関係を抽
出した後、罫線枠内に記入されている項目名などの文字
を識別し、かつ、予め与えられた知識と照合したうえで
罫線枠部分及び識別した文字からなる見本文書の画像構
造を理解して自動的に文書の書式情報を登録することが
行われている。そして、入力文書の認識に際しても、登
録時と同様、文書処理装置内において入力文書の画像構
造を理解したうえで予め登録されていた見本文書のうち
のいずれであるかを判断した後、該当する見本文書の書
式情報に基づいた認識処理が実行されることになってい
る。
【0003】
【発明が解決しようとする課題】しかしながら、従来の
技術に係る文書処理装置には、見本文書を必要とするば
かりか、入力文書の画像構造を理解する機能を実現する
手段を備えている必要があり、さらには、入力文書の画
像構造を理解するのに多大な処理時間を要するため、使
い勝手が悪くて実用的でないという不都合があった。
【0004】本発明は、このような不都合に鑑みて創案
されたものであって、個人の属性に関する情報を示す文
字が記入済みの入力文書であっても登録及び認識が可能
であり、構成が大幅に簡略化されているとともに、処理
時間の短縮を実現することができる光学文字認識装置の
提供を目的としている。
【0005】
【課題を解決するための手段】本発明の請求項1に係る
光学文字認識装置は、入力文書を電子化する光電変換手
段と、電子化された入力文書の画像を記憶する画像記憶
手段と、入力文書の画像から罫線枠を抽出する罫線枠抽
出手段と、抽出された罫線枠の格子点の座標列を記憶す
る罫線枠座標列記憶手段と、罫線枠の格子点の座標列と
登録名や罫線枠で区切られた登録領域の属性、キーワー
ドなどの外部からの入力情報とで表される入力文書のフ
ォーマットを設定するフォーマット設定手段と、設定さ
れたフォーマットの内容が登録されるフォーマット内容
登録手段と、登録済みフォーマットの数を記憶するフォ
ーマット登録数記憶手段とを備えている。
【0006】請求項2に係る光学文字認識装置は、請求
項1に記載されたものであって、フォーマット設定手段
が、入力文書のフォーマットに付される登録名が登録済
みフォーマットの登録名に該当するか否かを判定し、か
つ、登録済みフォーマットの登録名に該当しない登録名
のフォーマットのみをフォーマット内容登録手段に登録
する機能を有している。請求項3に係る光学文字認識装
置は、請求項1または請求項2に記載されたものであっ
て、フォーマット設定手段が、それぞれの登録領域に対
して入力情報を登録する機能を有している。
【0007】請求項4に係る光学文字認識装置は、請求
項1ないし請求項3のいずれかに記載されたものであっ
て、フォーマット設定手段が、入力文書のフォーマット
を登録済みフォーマットと区別するキーワードが必要で
あるか否かを判定し、必要なキーワードの入力を外部に
対して指示する機能を有している。請求項5に係る光学
文字認識装置は、請求項1ないし請求項4のいずれかに
記載されたものであって、入力文書のフォーマットが登
録済みフォーマットのうちのいずれに該当するかを検索
して判定し、該当する登録済みフォーマットに基づく文
字認識の実行を指示するフォーマット検索/判定手段
と、指示されたフォーマットの文字認識を実行する文字
認識手段と、文字認識結果を処理する文字認識結果処理
手段とを備えている。
【0008】請求項6に係る光学文字認識装置は、請求
項5に記載されたものであって、フォーマット検索/判
定手段が、入力文書のフォーマットが登録済みフォーマ
ットのいずれに該当するかの判定が不可となった要因を
外部に対して指示させる機能を有している。請求項7に
係る光学文字認識装置は、請求項5または請求項6に記
載されたものであって、フォーマット検索/判定手段
が、入力文書のフォーマットが該当する登録済みフォー
マットの登録名を外部に対して指示させる機能を有して
いる。
【0009】請求項8に係る光学文字認識装置は、請求
項1ないし請求項4のいずれかに記載されたものであっ
て、入力文書のフォーマットが登録済みフォーマットの
いずれに該当するかを外部からの指示に基づいて指定す
るフォーマット指定手段(フォーマット指定部)と、指
定された登録済みフォーマットに基づく文字認識の実行
を指示するフォーマット検索/判定手段とを備えてい
る。請求項9に係る光学文字認識装置は、請求項8に記
載されたものであって、フォーマット検索/判定手段
が、フォーマット指定手段で指定されたフォーマットの
登録名を外部に対して指示させる機能を有している。
【0010】請求項10に係る光学文字認識装置は、請
求項1ないし請求項9のいずれかに記載されたものであ
って、外部から指示された登録領域の属性に基づく文字
認識の実行手順を指定する文字認識手順指定手段を備え
ている。請求項11に係る光学文字認識装置は、請求項
1ないし請求項9のいずれかに記載されたものであっ
て、外部から指示された登録領域の属性と文字認識結果
との関係をチェックし、文字認識結果が不適切であるこ
とを外部に対して指示する認識結果チェック手段を備え
ている。
【0011】
【発明の実施の形態】以下、本発明の実施の形態を図面
に基づいて説明する。
【0012】図1は本実施の形態に係る光学文字認識装
置の構成を示すブロック図であり、本実施の形態に係る
光学文字認識装置は運転免許証などのような定型文書の
登録及び認識を行う際に用いられるものである。
【0013】光学文字認識装置は、図1で示すように、
登録/認識モード切替手段1と、光電変換手段2と、一
時記憶領域であるRAM3と、データ記憶装置であるハ
ードディスク4と、罫線枠抽出手段である罫線枠読取手
段5と、フォーマット設定手段6とともに、フォーマッ
ト指定手段7と、フォーマット検索/判定手段8と、文
字認識手段9と、文字認識結果処理手段10と、文字認
識手順指定手段である認識モード選択手段11と、認識
結果チェック手段12と、認識/単語辞書13と、外部
への情報表示手段であるディスプレイ14と、外部から
の情報入力手段であるキーボード15及びマウス16と
を備えており、これらの各種手段同士はバス17を介し
たうえで互いに接続されている。そして、RAM3に
は、光電変換手段2で電子化された入力文書の画像を一
時記憶するための画像記憶手段である文書画像格納領域
3aと、罫線枠読取手段5で読み取られた罫線枠の格子
点の座標列(以下、罫線枠座標列という)を一時記憶す
るための罫線枠座標列記憶手段である罫線枠座標列格納
領域3bとが設けられている。
【0014】また、この際におけるハードディスク4に
は、RAM3の罫線枠座標列格納領域3bに格納された
罫線枠座標列と、登録名や罫線枠で区切られた登録領域
の属性、キーワードなどの利用者によって外部から与え
られる入力情報とが登録されるフォーマット内容登録手
段としてのフォーマット構造体登録領域4aと、このフ
ォーマット構造体登録領域4aに登録されたフォーマッ
トの数を記憶するフォーマット登録数記憶手段であると
ころのフォーマット登録数記憶領域4bと、認識結果/
画像格納領域4cとが設けられている。
【0015】ところで、光学文字認識装置を構成する各
種手段のそれぞれは、以下のようなものとなっている。
すなわち、登録/認識モード切替手段1は、利用者が光
学文字認識装置を入力文書の登録モードで使用するか認
識モードで使用するかを決定するためのブロックであ
り、具体的には切替スイッチなどである。そして、光電
変換手段2は、入力文書を光学的に読み込んで電子化し
たうえ、電子化された入力文書の画像をRAM3の文書
画像格納領域3aに送って格納させるものであり、罫線
枠読取手段5は、文書画像格納領域3aに格納された入
力文書の画像から罫線枠を抽出して読み取ったうえ、読
み取った罫線枠座標列を罫線枠座標列格納領域3bに格
納して記憶させるブロックである。
【0016】また、フォーマット設定手段6は、RAM
3の罫線枠座標列格納領域3bに格納された罫線枠座標
列と、登録名や罫線枠で区切られた登録領域の属性、キ
ーワードなどの利用者によって外部から与えられる入力
情報とをハードディスク4のフォーマット構造体登録領
域4aに登録して格納させるブロックであり、登録モー
ド時にのみ作動することになっている。そして、このフ
ォーマット設定手段6は、入力文書のフォーマットに付
される登録名が登録済みフォーマットの登録名に該当す
るか否かを判定し、登録済みフォーマットの登録名に該
当しない登録名のフォーマットのみをフォーマット構造
体登録領域4aに対して登録する機能と、キーボード1
5やマウス16を用いて外部から指示された入力情報を
登録する機能とを有しているとともに、入力文書のフォ
ーマットを登録済みフォーマットと区別するキーワード
が必要であるか否かを判定したうえで必要なキーワード
の入力を外部に指示する機能を有している。
【0017】さらに、フォーマット指定手段7は入力文
書のフォーマットがフォーマット構造体登録領域4aに
登録済みのフォーマットのうちのいずれに該当するかを
利用者が外部から指示して指定するためのブロックであ
る一方、フォーマット検索/判定部8は、入力文書のフ
ォーマットが直接指定されたときは該当する登録済みフ
ォーマットを検索し、また、指定されなかったときは登
録済みフォーマットのいずれに該当するかを自動的に検
索したうえで判定するブロックであり、フォーマット指
定手段7及びフォーマット検索/判定部8は認識モード
時のみ作動することになっている。なお、このフォーマ
ット検索/判定部8による登録済みフォーマットの検索
は、罫線枠座標列格納領域3bに格納された罫線枠座標
列が同じであることを基準として行われることになって
おり、罫線枠座標列で判定できない場合には、文字認識
手段9を動作させたうえでのキーワードに基づく判定も
実行される。そして、フォーマット検索/判定部8は、
入力文書のフォーマットが登録済みフォーマットのいず
れに該当するかの判定が不可となった要因、例えばキー
ワードの未入力などをディスプレイ14上の表示でもっ
て外部に対して指示させる機能と、入力文書のフォーマ
ットが該当する登録済みフォーマットの登録名を外部に
対して指示させる機能とを有している。
【0018】一方、文字認識手段9は文字認識を実行す
るためのブロックであり、フォーマット検索/判定部8
からの指示に基づいて文字認識手段9で実行された文字
認識の結果は文字認識結果処理手段10によって処理さ
れたうえ、ハードディスク4の認識結果/画像格納領域
4cに格納して保存されることになっている。なお、こ
の際における文字認識結果は、ディスプレイ14上に表
示されることになっており、キーボード15やマウス1
6を用いたうえでの利用者による文字認識結果の修正な
ども文字認識結果処理手段10によって処理される。そ
して、認識モード選択手段11は、外部から指示された
登録領域の属性に基づく文字認識手段9での文字認識の
実行手順を指定するブロックであり、入力情報に基づい
た高速認識を実行するか、あるいはまた、通常速度での
認識を実行したうえで入力情報に対応した文字認識結果
が得られたか否かを認識結果チェック手段12で行わせ
るかを利用者が選択する際に用いられるものである。
【0019】さらにまた、この認識結果チェック手段1
2は、外部から指示された登録領域の属性と文字認識結
果との関係をチェックし、文字認識結果が不適切である
場合には文字認識結果が不適切であることをディスプレ
イ14上の表示でもって外部に指示する機能を有してい
る。そして、認識/単語辞書13は文字認識手段9によ
る文字認識の実行時に用いられるブロックであり、以上
説明した文字認識手段9、フォーマット検索/判定部
8、文字認識結果処理手段10、認識モード選択手段1
1、認識結果チェック手段12、認識/単語辞書13の
それぞれは認識モード時にのみ作動することになってい
る。なお、ディスプレイ14は利用者が作業する際に必
要となる情報、例えば画像や罫線枠に関する情報などを
表示するものであり、フォーマット設定手段6や文字認
識結果処理手段10などによって利用されることになっ
ている。また、キーボード15やマウス16は利用者が
外部からの指示や情報を入力する場合に用いられるもの
であり、フォーマット設定手段5や文字認識結果処理手
段10において利用されている。
【0020】図2(a)〜(d)の各々は本実施の形態
に係る光学文字認識装置において登録及び認識される入
力文書の書式例を示す説明図であり、この際の入力文書
としては運転免許証などが一般的である。まず、これら
の書式例における「氏名」,「生年月日」,「住所」の
文字が記載された領域は予め印刷済みの領域であり、
「(写真)」の文字が記載された領域は写真などが貼付
される領域である一方、「氏名」,「生年月日」,「住
所」が記載された領域の右側に位置する領域に記載され
た文字列は4つの書式例ごとに異なっている。
【0021】そして、光電変換後における入力文書それ
ぞれの画像はRAM3の文書画像格納領域3a内におけ
る左上隅側に寄せて格納されることになっており、図2
中に記入された(0,0)などの座標点は文書画像格納領
域3a内における左上隅位置を原点とした際の座標位置
を示している。なお、図2(a)と(d)とでは座標点
が少し異なっているが、このような座標点の相違は電子
化に伴う誤差であるに過ぎず、これら2つの入力文書は
同じフォーマットを有している。そこで、この際におい
ては、図2(a)及び(d)の入力文書が同じフォーマ
ットであり、図2(b)及び(c)で示された入力文書
のそれぞれは図2(a)及び(d)と異なるフォーマッ
トを有していることになる。
【0022】図3は本実施の形態に係る光学文字認識装
置の登録モード時における動作手順を示すフローチャー
トであり、以下、図3に基づいて登録モード時の動作手
順を説明する。
【0023】まず、最初に、登録/認識モード切替手段
1を用いたうえで登録モードであることが利用者によっ
て設定され(ステップ3−1)、光電変換手段2に対し
て入力された登録用文書が2値化によって電子化された
後、電子化された入力文書の画像がRAM3の文書画像
格納領域3aに格納される(ステップ3−2)。つぎ
に、文書画像格納領域3aに格納された入力文書の画像
から罫線枠を読み取ることを、罫線枠手段5が実行す
る。なお、ここでは、画像処理において直線を求める際
のハフ変換が利用されており、縦横方向の罫線を求めた
うえで両方向の罫線の論理和を得ることによって罫線枠
を算出している。
【0024】そして、読み取られた罫線枠は、罫線枠座
標列として表されたうえでRAM3の罫線枠座標列格納
領域3bに格納される(ステップ3−3)。つまり、こ
の際における罫線枠座標列の順序は上側にある座標優
先、かつ、同一行では左側の座標優先とされており、図
2(a)の文書画像における罫線枠座標列は、(0,
0)、(30,0)、(50,0)、(120,0)、(30,1
0)、(50,10)、(120,10)、(30,20)、(50,2
0)、(120,20)、(0,30)、(30,30)、(50,3
0)、(120,30)というような長さ14の罫線枠座標列
として表されることになる。
【0025】引き続き、フォーマット設定手段6を用い
たうえで入力文書のフォーマットを設定することが利用
者によって行われた後、設定されたフォーマットはハー
ドディスク4のフォーマット構造体登録領域4aに登録
される(ステップ3−4)。すなわち、ここでのフォー
マットとは入力文書に対して付加される情報の構造体を
意味しており、ステップ3−3で求められた罫線枠座標
列とともに、登録名や罫線枠で区切られた登録領域の属
性、キーワードなどのような外部からの入力情報を含ん
でいる。なお、フォーマット設定動作の詳しい手順につ
いては、図4に基づいて後述する。そして、入力文書の
フォーマット設定が終了した後、さらに登録すべき入力
文書があるか否かに基づく処理終了の判断をしたうえ
(ステップ3−5)、登録すべき入力文書があればステ
ップ3−2へと戻ることになり、登録すべき入力文書が
なければ登録モードに従った処理を終了する。
【0026】図4は入力文書のフォーマット設定時にお
ける動作手順を示すフローチャートであり、光学文字認
識装置の登録モード時における入力文書のフォーマット
設定(ステップ3−4)では以下のような手順に従った
動作が行われる。
【0027】まず、利用者によってフォーマットの登録
名(以下、ラベルともいう)が設定される(ステップ4
−1)。なお、ここでの登録名またはラベルとは入力文
書が何の文書であるかを示す表示であり、「運転免許
証」や「○○大学学生証」といった類いである。そし
て、フォーマット設定手段5では、登録済みフォーマッ
トのラベルと重複するラベルの登録を拒否することと
し、キーボード15やマウス16を用いて外部から指示
されたラベルがハードディスク4のフォーマット構造体
登録領域4aにおける登録済みフォーマットのラベルと
重複している場合にはディスプレイ14上に表示するこ
とによって利用者に異なるラベルを入力するよう促すこ
とが行われる。また、利用者がラベルを入力しやすいよ
うディスプレイ14上に登録済みフォーマットのラベル
を一覧的に表示させることも実行されている。
【0028】つぎに、罫線枠座標列の修正/登録が実行
されることになり、ここでは、RAM3の罫線枠座標列
格納領域3bに一時記憶されている罫線枠座標列を利用
しながら罫線枠画像を作成し、かつ、ディスプレイ14
上に表示された罫線枠画像を視認しながら利用者がキー
ボード15やマウス16を用いて罫線枠座標列を修正し
たうえ、修正された罫線枠座標列をハードディスク4の
フォーマット構造体登録領域4aに対して登録すること
が行われる(ステップ4−2)。引き続き、罫線枠で分
割されている長方形の小領域である登録領域として表さ
れるフィールドのそれぞれに対して登録領域の属性が設
定/登録されることになり、RAM3の罫線枠座標列格
納領域3b内に一時記憶されている罫線枠座標列から抽
出したフィールドの座標及び数を利用したうえで利用者
が各フィールドについての属性登録を実行する。
【0029】そして、この際における処理の流れとして
は、まず、フィールド数カウンタCNを初期化(CN=
0)した後(ステップ4−3)、フィールド数ANのフ
ィールドに対して属性を設定/登録することが繰り返し
て行われる(ステップ4−4からステップ4−6)。な
お、属性が設定/登録されるフィールドは順不同であ
り、この際におけるフィールドの座標は、左上座標及び
右下座標が自動的に登録され、かつ、左下座標及び右上
座標が左上座標及び右下座標から計算で求められた後、
ディスプレイ14上の表示によって現フィールドの属性
登録を促された利用者がキーボード15やマウス16を
用いて属性を設定することが行われる。ところで、フィ
ールドの属性とは、文字登録領域と、画像登録領域と、
その他の登録領域との相違を示すための基準を意味して
おり、文字登録領域については「住所」,「氏名」,
「生年月日」などの詳しい属性が設定される。
【0030】さらに、フィールド数カウンタCNがフィ
ールド数AN以上になると、各フィールドに対する属性
の設定/登録が終了したことになり、キーワードを登録
するか否かが選択された後(ステップ4−7)、利用者
がキーワード登録を選択した際には引き続いてキーワー
ドの登録が実行される(ステップ4−8)。なお、キー
ワードとは、類似の罫線枠をもった入力文書の画像であ
っても1つのフィールドを認識することによって区別可
能とするために設定されるものである。すなわち、第2
図(a)の入力文書と図2(c)の入力文書とを登録し
た場合、両者は同じ罫線枠座標のフォーマットを有して
おり、これだけでは判別が不可能となるので、このよう
な不都合を回避すべくキーワードが登録されるのであ
る。
【0031】そして、キーワードの登録時には、単語を
登録しておくキーワード名登録と、キーワードの属性を
登録しておくキーワード属性登録とが採用されており、
キーワード名登録においては、図2(a)中の左上座標
(30,0)と右下座標(50,10)との間の領域には「氏
名」という単語が記載されていると登録される一方、図
2(c)中の左上座標(30,0)と右下座標(50,10)
との間の領域には「生年月日」という単語が記載されて
いることが登録される。また、キーワード属性登録で
は、図2(a)の左上座標(50,0)と右下座標(120,
10)との間の頼域が「氏名」の属性であると登録し、図
2(c)の左上座標(50,0)と右下座標(120,10)と
の間の領域が「生年月日」の属性であるとして登録する
ことが行われる。さらに、キーワード登録が実行された
後もしくはステップ4−7でキーワードを登録しないこ
とが選択された場合には、入力文書のフォーマット設定
に関わる処理が終了する。
【0032】図5はハードディスク4のフォーマット構
造体登録領域4aに登録された入力文書のフォーマット
を例示する説明図であり、このフォーマットは図4で示
したフローチャートの動作手順にしたがって設定された
うえ、図3で示したフローチャートのステップ3−4で
フォーマット構造体登録領域4aに対して登録されたフ
ォーマットの一例である。
【0033】この際におけるフォーマットは入力文書に
対して付加される各種情報の構造体であり、最初の32
バイト分の領域5aがステップ4−1で設定されるラベ
ル用として確保され、つぎの2バイト分の領域5bがス
テップ4−2でもって登録される罫線枠座標列の長さ用
として確保されたうえ、4バイト分ずつで罫線枠座標列
用となる領域5cが罫線枠座標列の長さ分だけ確保され
ている。そして、これらの領域5cでは、先頭側の2バ
イト分がX座標用、残りの2バイト分がY座標用となっ
ている。引き続いては、フィールドの総数を示す2バイ
ト分の領域5dが確保されており、この領域5dには文
字登録領域または画像登録領域のいずれかに対して登録
されたフィールドの総数を示す数値が収納されている。
なお、この際、文字登録にも画像登録にも使われないフ
ィールドは省かれている。
【0034】さらに、ステップ4−3及び4−4で設定
されるフィールドそれぞれの座標及び属性を示す10バ
イト分ずつ複数の領域5eがフィールドの総数に対応し
た分だけ確保されており、各領域5eにおける2バイト
分ずつのそれぞれは左上座標(X座標)用、左上座標
(Y座標)用、右下座標(X座標)用、右下座標(Y座
標)用及びフィールド属性用となっている。なお、フィ
ールド属性用である2バイト分には、文字登録領域また
は画像登録領域のいずれかであるか、そして、文字登録
領域であれば「氏名」であるか「住所」であるかなどを
示す数値が収納されることになる。引き続き、キーワー
ド登録の有無を示す2バイト分の領域5fが確保されて
おり、キーワード登録がある場合には、キーワード属性
を示す2バイト分の領域5gと、キーワード名を示す3
2バイト分の領域5hとがそれぞれ確保されているとと
もに、キーワードの座標を示す2バイト分ずつの領域5
iが確保されている。
【0035】そして、この際の領域5iにおける2バイ
ト分ずつのそれぞれは、左上座標(X座標)用、左上座
標(Y座標)用、右下座標(X座標)用、右下座標(Y
座標)用及びフィールド属性用となっている。なお、キ
ーワード登録がない場合の領域5fには0の数値が収納
される一方、キーワード登録がある場合の領域5fには
1の数値が収納されることになり、キーワード属性が登
録された場合は領域5gに対してキーワード属性を示す
数値が収納されることになる。また、キーワード名が登
録された場合のキーワード属性を示す領域5gには意味
をなさない数値が収納されることになり、領域5hに対
してはキーワード名が収納される。したがって、図2
(a)で示した入力文書の書式例の登録名を「○○大学
学生証」とし、かつ、左上座標(30,0)と右下座標(5
0,10)との間の「氏名」と書かれた領域をキーワード
名=「氏名」として登録した場合には、以下に示すよう
なフォーマットが得られることになる。
【0036】 ==== 登録名(32byte) ○○大学学生証 座標列長さ(2byte) 14 座標(4×14byte) (0,0)、(30,0)、(50,0)、(120,0)、(30,10) (50,10)、(120,10)、(30,20)、(50,20)、(120,20) (0,30)、(30,30)、(50,30)、(120,30) 登録数(2byte) 4 1番目(10byte) (0,0)、(30,30)…画像登録を表す数値 2番目(10byte) (50,0)、(120,10)…「氏名」を表す数値 3番目(10byte) (50,10)、(120,20)…「生年月日」を表す数値 4番目(10byte) (50,20)、(120,30)…「住所」を表す数値 キーワード有無(2byte) 1 属性(2byte) 属性に割り当てられていない数値 キーワード名(32byte) 氏名 座標(4×2byte) (30,0)、(50,10) ==== 図6は本実施の形態に係る光学文字認識装置の認識モー
ド時における動作手順を示すフローチャートであり、以
下、図6に基づいて認識モード時の動作手順を説明す
る。
【0037】まず、登録/認識モード切替手段1を用い
たうえで認識モードであることが利用者によって設定さ
れた後(ステップ6−1)、利用者がフォーマットを指
定する際にはキーボード15またはマウス16を用いた
うえで外部から指示されたラベルの登録済みフォーマッ
トがフォーマット指定手段7によって直接的に設定され
る(ステップ6−2)。そして、認識モード選択手段1
1でもって認識モードを利用者が選択することにより、
入力情報に基づいた高速認識を実行する高速モードか、
通常速度での認識を実行したうえで入力情報に対応した
文字入力結果が得られたか否かをチェックするチェック
モードかが外部からの指示に基づいて選択される(ステ
ップ6−3)。その後、光電変換手段2に対して入力さ
れた登録用文書が2値化して電子化された後、電子化さ
れた入力文書の画像がRAM3の文書画像格納領域3a
に対して格納される(ステップ6−4)。
【0038】つぎに、文書画像格納領域3aに格納され
た入力文書の画像から罫線枠を読み取ることが実行さ
れ、読み取られた罫線枠は罫線枠座標列としたうえでR
AM3の罫線枠座標列格納領域3bに対して格納される
(ステップ6−5)。そして、フォーマットの指定があ
るか否かが判定されることになり(ステップ6−6)、
ステップ6−2でフォーマットが指定されている場合に
は、フォーマット検索/判定手段8が指定された登録済
みフォーマットを検索して特定したうえ、指定された登
録済みフォーマットを文字認識手段9へと送ることが行
われる(ステップ6−7)。また、フォーマットが指定
されていない場合のフォーマット検索/判定手段8は、
罫線枠座標列格納領域3bによって一時記憶されている
フォーマットが登録済みフォーマットのうちのいずれに
該当するかを検索したうえで判定することを行う(ステ
ップ6−8)。なお、罫線枠座標列のみによるフォーマ
ットの判定が不可の場合にはキーワードの認識も実行さ
れることになるが、フォーマット判定動作についての詳
しい説明は図7及び図8に基づいて後述する。
【0039】そして、フォーマットの判定が成功したか
否かがステップ6−9でもって判定された後、判定が失
敗である場合には、フォーマットを指定し直したうえで
ステップ6−7に戻って文字認識を続行するか、認識モ
ードでの処理を終了するかが利用者によって判断される
(ステップ6−10)。また、フォーマットの判定が成
功した場合には、外部からの指示に基づいてフォーマッ
トを直接的に指定することが実行された場合(ステップ
6−7)と同じく、判定もしくは指定されたフォーマッ
トに基づく文字認識が文字認識手段9によって実行され
ることになる。なお、文字認識の実行に先立っては、高
速モードまたはチェックモードのいずれがステップ6−
3において選択されているかによって動作が異なり(ス
テップ6−11)、高速モードである場合には判定もし
くは指定されたフォーマットに基づく文字認識が文字認
識手段9によって実行される(ステップ6−12)一
方、チェックモードが選択されている場合には文字認識
手段9による通常速度での文字認識が実行されたうえ、
認識結果チェック手段12によって入力情報に対応した
文字認識結果が得られたか否かがチェックされる(ステ
ップ6−13)。
【0040】すなわち、この際における文字認識では、
判定もしくは指定されたフォーマットの文字認識を必要
とする領域に対応する入力画像の登録領域を算出したう
え、この入力画像の登録鎖域内を文字認識することが行
われており、高速モードの場合には登録領域の属性に即
した文字認識、例えば、「氏名」の属性を持つフィール
ドでは認識/単語辞書13の算用数字や記号などを使用
しない文字認識が実行される一方、チェックモードの場
合には登録領域の属性と関係のない文字認識、例えば、
「氏名」の属性を持つフィールドであっても認識/単語
辞書13の算用数字や記号などを含む辞書すべてを使用
しながらの文字認識が実行されることになる。そして、
チェックモードの場合には、引き続いて文字認識結果と
フィールドの属性とを認識結果チェック手段12に転送
したうえ、この認識結果チェック手段12において文字
認識結果とフィールドの属性との間に矛盾が生じている
か否かをチェックすることが行われる。なお、このチェ
ックにおいては、例えば、「氏名」の属性を持つフィー
ルドの文字認識結果に算用数字や記号などが存在してい
れば文字認識結果が信用できないなどという判断がなさ
れる。そして、文字認識結果が信用できないとの判断が
なされた場合には、文字認識結果とともに信用できない
旨が文字認識結果処理手段10に対して転送される。
【0041】さらに、引き続き、文字認識結果処理手段
10においては文字認識結果を処理することが行われて
おり、ディスプレイ14上に表示された文字認識結果を
視認しながらの利用者による文字認識結果の修正などが
キーボード15やマウス16を用いたうえで実行される
(ステップ6−14)。なお、文字認識結果が信用でき
ないとの判断がなされたフィールドでは反転表示などに
よって利用者の注意が喚起されており、修正された文字
認識結果はハードディスク4の認識結果/画像格納領域
4cに格納して保存される。ところで、この際における
フィールドの属性が画像登録領域である場合には、指定
もしくは判定された登録済みフォーマットから算出され
た画像登録領域に基づいたうえ、その画像登録領域内の
画像が認識結果/画像格納領域4cによって保存される
ことになる。そして、以上のような認識処理が終了する
と、さらに認識すべき入力文書があるか否かに基づく処
理終了の判断が行われることになり(ステップ6−1
5)、認識すべき入力文書があればステップ6−4へと
戻ることになり、なければ認識モードに従った処理を終
了する。
【0042】図7はフォーマット判定時の動作手順を示
すフローチャートであり、光学文字認識装置の認識モー
ド時におけるフォーマット判定(ステップ6−8)では
以下のような手順に従った動作が実行される。
【0043】最初に、フォーマットカウンタCNを0と
し、距離値FD1,FD2を無限大とする初期化が行わ
れる(ステップ7−1)。なお、この際においては、登
録済みフォーマットの番号や登録済みフォーマットの数
を表すFN1,FN2の初期値を定めておく必要はな
く、フォーマット登録数記憶領域4bに保存されている
登録済みフォーマットの数を示すFNは1以上(FN≧
1)とされている。つぎに、RAM3の罫線枠座標列格
納領域3bに一時記憶されている罫線枠座標列とCN番
目のフォーマットの罫線枠座標列との距離dis(CN)
を求める(ステップ7−2)。ところで、この際におけ
る距離の算出方法としては時系列のデータの距離を求め
る際のDP−マッチング(動的計画法)が利用されてお
り、各座標間の距離は絶対値差距離を用いて表されると
ともに、数ドット程度の誤差は吸収するものとしてい
る。したがって、図2の入力文書に適用した際、図2
(a),(c),(d)のそれぞれで示された書式例の
罫線枠座標列は全て同じであって距離が0となる一方、
図2(b)で示された書式例の罫線枠座標列の罫線枠座
標列のみが他とは異なり、距離が0ではないことになっ
ている。なお、距離の数値は、DP−マッチングの構成
の仕方に依存している。
【0044】引き続き、FD1とdis(CN)とを比較
し(ステップ7−3)、FD1<dis(CN)ならばF
D2=FD1,FN2=FN1とし、FD1,FN1は
新たにFD1=dis(CN),FN1=CNと設定し直
すことを行う(ステップ7−4)。また、FD1<dis
(CN)でなければdis(CN)<FD2であるか否か
が判定されることになり(ステップ7−5)、dis(C
N)<FD2ならばFD2=dis(CN),FN2=C
Nと設定し直すことが行われる(ステップ7−6)。つ
ぎに、フォーマットカウンタCNの値を1だけ増加させ
て(ステップ7−7)CN≧ANになったか否かを判定
し(ステップ7−8)、CN≧ANになるまでステップ
7−2からステップ7−7の動作を繰り返した後、CN
≧ANになったと判定された場合には、FD1≠FD2
であるか否かが判定される(ステップ7−9)。そし
て、FD1≠FD2である場合には、FD1が最小値で
あってFD2が2番目に小さい値であるため、入力文書
のフォーマットはFD1番目の登録済みフォーマットに
最も近似しているとの判断が下されることになり、登録
済みフォーマットの番号としてFN1の値を文字認識手
段9に対して伝え、かつ、判定成功としてフォーマット
判定の処理を終了する(ステップ7−12)。
【0045】一方、ステップ7−9でFD1=FD2と
判定された場合には、FD1番目の登録済みフォーマッ
トとFD2番目の登録済みフォーマットとの距離が等し
く、罫線枠座標列のみでは入力文書のフォーマットに最
も近似している登録済みフォーマットが何番目であるか
を特定できないため、キーワードを用いたうえでの判定
を行うことになる。そこで、引き続き、キーワードを用
いたうえでの判定、つまり、FD1番目及びFD2番目
のうちのいずれの登録済みフォーマットが入力文書のフ
ォーマットに近似しているかがキーワードを用いて判定
されることになり(ステップ7−10)、キーワードを
用いた判定が成功したか否かを判定したうえ(ステップ
7−11)、キーワードによる判定が成功した場合には
特定された登録済みフォーマットの番号を文字認識手段
9に伝えてフォーマット判定の処理を終了する(ステッ
プ7−12)。
【0046】また、ステップ7−11によってキーワー
ドを用いた判定が失敗したと判定された場合には、キー
ワードによる判定が失敗したことをディスプレイ14上
に表示したうえでフォーマット判定の処理を終了する
(ステップ7−13)。なお、キーワード判定時の動作
については、図8に基づいて後述する。ところで、本実
施の形態ではFD1=FD2の際にキーワード判定を実
行するとしているが、予め所要の閾値THを設定してお
いたうえ、FD2の値から閾値THを差し引いた値より
もFD1の値が大きい(FD1>FD2−TH)場合に
のみキーワード判定を実行することも考えられる。ま
た、本実施の形態では、入力文書のフォーマットにおけ
る罫線枠座標列と最小距離をなす2つの登録済みフォー
マットのうちから近似したフォーマットを求めるとして
いるが、より多くの登録済みフォーマットのうちから近
似したものを求めるような拡張を行うことも可能であ
る。
【0047】図8はキーワード判定時の動作手順を示す
フローチャートであり、このキーワード判定は罫線枠座
標列のみによってフォーマット判定を行うことができな
い際に採用されることになっている。
【0048】最初に、FN1番目及びFN2番目両方の
フォーマットについてキーワードが登録されているか否
かを判定する(ステップ8−1)。そして、少なくとも
どちらか一方のフォーマットにキーワードが登録されて
いなければ、キーワードが未登録であるフォーマットの
番号や登録名などをディスプレイ14上に表示すること
により、利用者に対してキーワード判定が失敗したこと
を知らせる(ステップ8−5)。また、両方のフォーマ
ットにキーワードが登録されている場合には、キーワー
ドの座標で囲われた文書画像格納領域3aの画像に対す
る文字認識が文字認識手段9によって実行されたうえ、
両方のフォーマットに関する文字認識結果がフォーマッ
ト検索/判定手段9に送られる(ステップ8−2)。つ
ぎに、両方の認識結果に基づき、どちらか一方のみが正
解であるか否かが判定される(ステップ8−3)。な
お、この判定においては、図4のステップ4−8で行わ
れたキーワードの登録がキーワード登録名で実行されて
いる際にはキーワード登録名と文字認識結果とが等しい
ことによって正解とし、キーワード属性登録が実行され
ている際には文字認識結果の適否が認識結果チェック手
段12でもってチェックされたうえ、適切であれば正解
とすることが行われる。
【0049】そして、どちらか一方のみが正解であれば
判定は成功したことになり、正解した登録済みフォーマ
ットの番号を文宇認識手段9に伝えたうえで処理を終了
する(ステップ8−4)。また、どちらもが正解でない
場合には、「どちら(FN1及びFN2)の登録済みフ
ォーマットも不正解」というような内容をディスプレイ
14上に表示し、利用者に対してキーワード判定が失敗
したことを知らせる(ステップ8−5)。なお、この実
施の形態では1つのキーワードだけが登録されるとして
いるが、複数のキーワードを登録しておいてもよいこと
は勿論であり、また、少なくとも一方の登録済みフォー
マットにおけるキーワード登録名と文字認識結果とが等
しいという条件が厳し過ぎるならば、文字認識結果がキ
ーワード登録名により近似しているかという条件に基づ
く判定を行うことも可能である。
【0050】ところで、以上説明した入力文書の登録及
び認識の具体例を、図2によって示すと以下のようにな
る。まず、図2(a),(b)が登録された際、キーワ
ードが登録されていなくても、認識時における図2
(d)は図2(a)と同じであると判定される。しか
し、図2(a),(c)がキーワード登録なしで登録さ
れた際、認識時の罫線枠座標列による判定では図2
(d)が図2(a),(c)と同じと判定されることに
なり、キーワードが登録がされていないので、キーワー
ドが必要である旨のメッセージがディスプレイ14上に
表示されることになる。また、図2(a),(c)にお
いて、図2(a)では左上座標(30,0)及び右下座標
(50,10)の領域内に「氏名」という単語が書かれてい
ると登録し、かつ、図2(c)では左上座標(30,0)
及び右下座標(50,10)の領域内に「生年月日」という
単語が書かれていると登録することを行うと、図2
(d)はキーワード判定によって図2(a)と同じフォ
ーマットであると判定されることになる。
【0051】つぎに、本実施の形態に係る光学文字認識
装置を発展させた変形例を、図9に基づいて説明する。
すなわち、以上説明した光学文字認識装置においては、
類似した罫線枠を有する入力文書のフォーマットを判定
するためにキーワードを用いており、キーワード登録が
不備であることを認識時に知らせるとしていたが、この
変形例はキーワード登録が不備の際には登録時に知らせ
る機能を有していることを特徴とするものである。な
お、この変形例に係る光学文字認識装置の構成は実施の
形態と基本的に同一であるから、ここでの詳しい説明は
省略する。
【0052】図9は変形例に係る光学文字認識装置の登
録モード時における動作手順を示すフローチャートであ
り、以下、入力文書(用紙1枚分)のフォーマット登録
を行う際の手順を説明する。なお、図9中で使用されて
いる記号CNはカウンタであり、ANはハードディスク
4のフォーマット登録数記憶領域4bに保存されている
登録済みフォーマットの登録数を示している。
【0053】まず、最初に、利用者が外部からフォーマ
ット設定手段6を介したうえで現在登録中の入力文書に
対するフォーマットを設定することが行われる(ステッ
プ9−1)。なお、フォーマット設定の動作手順は、実
施の形態と全く同じである。そこで、設定されたフォー
マットはフォーマット構造体登録領域4aに一時登録さ
れることになるが、フォーマット登録数記憶領域4bに
おける登録済みフォーマットの登録数は増加していない
こととなる。そして、この際、フォーマット検索/判定
手段8では、新たに一時登録されたフォーマットと、こ
れ以外のフォーマットとを区別することが行われてい
る。つぎに、カウンタCN=0の初期化が実行され(ス
テップ9−2)、かつ、CN≧ANであるか否かの判定
が行われた後(ステップ9−3)、CN≧ANでなけれ
ば現在登録中のフォーマットとCN番目のフォーマット
とが異なっているか否かが判定される(ステップ9−
4)。なお、この際における判定は、罫線枠座標列が違
っているか、つまり、DP−マッチングによる距離が0
でないか、また、距離が0である場合にはキーワードが
異なっているかに基づいて行われることになっており、
その詳しい手順は実施の形態の場合と同じである。
【0054】そして、ステップ9−4でフォーマットが
異なっていると判定された際には、カウンタCNの値を
1だけ増加させたうえ(ステップ9−5)、つぎの登録
済みフォーマットと比較することが繰り返して実行され
ることになり、現在登録中のフォーマットとCN番目の
フォーマットとの差異を発見できなければステップ9−
1へと進んだうえ、実施の形態におけると同様、ディス
プレイ14上に差異が発見できない旨を表示する。そこ
で、利用者は、新たなフォーマットとCN番目のフォー
マットとの両方、あるいは、いずれか一方についてのフ
ォーマット設定を再度行うことになる。さらにまた、登
録済みフォーマットの全てと異なるフォーマットである
と判定された場合には、ステップ9−3からステップ9
−6へと進むことになり、一時登録中のフォーマットを
実際に登録してしまうことが行われる。その結果、登録
済みフォーマットの登録数も1だけ増加することにな
り、登録処理が終了する。
【0055】
【発明の効果】以上説明したように、本発明の請求項1
に係る光学文字認識装置によれば、見本文書を必要とせ
ず、また、入力文書の構造を理解する必要もなくなるの
で、個人の属性に関する情報を示す文字が記入済みの入
力文書であっても登録及び認識が可能であり、構成が大
幅に簡略化されているとともに、処理時間の短縮を実現
することができるという効果が得られる。そして、請求
項2の構成によれば、登録名の異なる入力文書のフォー
マットのみを登録することが容易となり、請求項3の構
成によれば、文字認識を高速でもって実行しうるという
効果が得られる。
【0056】また、請求項4の構成によれば、罫線枠座
標列のみでは判定が不可となる際にもキーワードによっ
て確実な判定が行えることとなり、請求項5の構成によ
れば、利用者が登録済みフォーマットの該当するフォー
マットを指定しなくても自動的に該当するフォーマット
を見い出して表示することが行われることになり、請求
項6の構成によれば、該当するフォーマットの判定が不
可となる要因が利用者に対して示されるという効果が得
られる。
【0057】さらに、請求項8の構成によれば、利用者
の指定によって登録済みフォーマットのうちから該当す
るフォーマットを選択しうることとなり、請求項7及び
請求項9の構成によれば、入力文書のフォーマットに該
当するフォーマットの登録名が表示されるので処理手順
の簡素化を図りうることになる。さらにまた、請求項1
0の構成によれば、文字認識の手順を指定することによ
って高速処理が行えることになるという効果が得られる
ことになる一方、請求項11の構成によれば、認識結果
が適切であるか否かが利用者によって容易に確認できる
という実用上有益な効果が得られる。
【図面の簡単な説明】
【図1】本実施の形態に係る光学文字認識装置の構成を
示すブロック図である。
【図2】本実施の形態に係る光学文字認識装置において
登録及び認識される入力文書の書式例を示す説明図であ
る。
【図3】本実施の形態に係る光学文字認識装置の登録モ
ード時における動作手順を示すフローチャートである。
【図4】フォーマット設定時における動作手順を示すフ
ローチャートである。
【図5】フォーマット構造体登録領域に登録された入力
文書のフォーマットを例示する説明図である。
【図6】本実施の形態に係る光学文字認識装置の認識モ
ード時における動作手順を示すフローチャートである。
【図7】フォーマット判定時の動作手順を示すフローチ
ャートである。
【図8】キーワード判定時の動作手順を示すフローチャ
ートである。
【図9】変形例に係る光学文字認識装置の登録モード時
における動作手順を示すフローチャートである。
【符号の説明】 2 光電変換手段 3a 文書画像格納領域(画像記憶手段) 3b 罫線枠座標列格納領域(罫線枠座標列記憶手段) 4a フォーマット構造体登録領域(フォーマット内容
登録手段) 4b フォーマット登録数記憶領域(フォーマット登録
数記憶手段) 5 罫線枠読取手段(罫線枠抽出手段) 6 フォーマット設定手段 7 フォーマット指定手段 8 フォーマット検索/判定手段 9 文字認識手段 10 文字認識結果処理手段 11 認識モード選択手段(文字認識手順指定手段) 12 認識結果チェック手段

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 入力文書を電子化する光電変換手段と、
    電子化された入力文書の画像を記憶する画像記憶手段
    と、入力文書の画像から罫線枠を抽出する罫線枠抽出手
    段と、抽出された罫線枠の格子点の座標列を記憶する罫
    線枠座標列記憶手段と、罫線枠の格子点の座標列と登録
    名や罫線枠で区切られた登録領域の属性、キーワードな
    どの外部からの入力情報とで表される入力文書のフォー
    マットを設定するフォーマット設定手段と、設定された
    フォーマットの内容が登録されるフォーマット内容登録
    手段と、登録済みフォーマットの数を記憶するフォーマ
    ット登録数記憶手段とを備えていることを特徴とする光
    学文字認識装置。
  2. 【請求項2】 請求項1記載の光学文字認識装置であっ
    て、 フォーマット設定手段は、入力文書のフォーマットに付
    される登録名が登録済みフォーマットの登録名に該当す
    るか否かを判定し、かつ、登録済みフォーマットの登録
    名に該当しない登録名のフォーマットのみをフォーマッ
    ト内容登録手段に登録する機能を有していることを特徴
    とする光学文字認識装置。
  3. 【請求項3】 請求項1または請求項2記載の光学文字
    認識装置であって、 フォーマット設定手段は、それぞれの登録領域に対して
    入力情報を登録する機能を有していることを特徴とする
    光学文字認識装置。
  4. 【請求項4】 請求項1ないし請求項3のいずれかに記
    載の光学文字認識装置であって、 フォーマット設定手段は、入力文書のフォーマットを登
    録済みフォーマットと区別するキーワードが必要である
    か否かを判定し、必要なキーワードの入力を外部に対し
    て指示する機能を有していることを特徴とする光学文字
    認識装置。
  5. 【請求項5】 請求項1ないし請求項4のいずれかに記
    載の光学文字認識装置であって、 入力文書のフォーマットが登録済みフォーマットのうち
    のいずれに該当するかを検索して判定し、該当する登録
    済みフォーマットに基づく文字認識の実行を指示するフ
    ォーマット検索/判定手段と、指示されたフォーマット
    の文字認識を実行する文字認識手段と、文字認識結果を
    処理する文字認識結果処理手段とを備えていることを特
    徴とする光学文字認識装置。
  6. 【請求項6】 請求項5記載の光学文字認識装置であっ
    て、 フォーマット検索/判定手段は、入力文書のフォーマッ
    トが登録済みフォーマットのいずれに該当するかの判定
    が不可となった要因を外部に対して指示させる機能を有
    していることを特徴とする光学文字認識装置。
  7. 【請求項7】 請求項5または請求項6記載の光学文字
    認識装置であって、 フォーマット検索/判定手段は、入力文書のフォーマッ
    トが該当する登録済みフォーマットの登録名を外部に対
    して指示させる機能を有していることを特徴とする光学
    文字認識装置。
  8. 【請求項8】 請求項1ないし請求項4のいずれかに記
    載の光学文字認識装置であって、 入力文書のフォーマットが登録済みフォーマットのいず
    れに該当するかを外部からの指示に基づいて指定するフ
    ォーマット指定手段と、指定された登録済みフォーマッ
    トに基づく文字認識の実行を指示するフォーマット検索
    /判定手段とを備えていることを特徴とする光学文字認
    識装置。
  9. 【請求項9】 請求項8記載の光学文字認識装置であっ
    て、 フォーマット検索/判定手段は、フォーマット指定手段
    で指定されたフォーマットの登録名を外部に対して指示
    させる機能を有していることを特徴とする光学文字認識
    装置。
  10. 【請求項10】 請求項1ないし請求項9のいずれかに
    記載の光学文字認識装置であって、 外部から指示された登録領域の属性に基づく文字認識の
    実行手順を指定する文字認識手順指定手段を備えている
    ことを特徴とする光学文字認識装置。
  11. 【請求項11】 請求項1ないし請求項9のいずれかに
    記載の光学文字認識装置であって、 外部から指示された登録領域の属性と文字認識結果との
    関係をチェックし、文字認識結果が不適切であることを
    外部に対して指示する認識結果チェック手段を備えてい
    ることを特徴とする光学文字認識装置。
JP30473196A 1996-11-15 1996-11-15 光学文字認識装置 Expired - Fee Related JP3484446B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP30473196A JP3484446B2 (ja) 1996-11-15 1996-11-15 光学文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP30473196A JP3484446B2 (ja) 1996-11-15 1996-11-15 光学文字認識装置

Publications (2)

Publication Number Publication Date
JPH10143605A true JPH10143605A (ja) 1998-05-29
JP3484446B2 JP3484446B2 (ja) 2004-01-06

Family

ID=17936540

Family Applications (1)

Application Number Title Priority Date Filing Date
JP30473196A Expired - Fee Related JP3484446B2 (ja) 1996-11-15 1996-11-15 光学文字認識装置

Country Status (1)

Country Link
JP (1) JP3484446B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000105836A (ja) * 1998-09-29 2000-04-11 Fuji Xerox Co Ltd 論理構造抽出装置
JP2003141447A (ja) * 2001-11-06 2003-05-16 Canon Inc 帳票検索システム
JP2004139484A (ja) * 2002-10-21 2004-05-13 Hitachi Ltd 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム
WO2020203339A1 (ja) * 2019-03-29 2020-10-08 Arithmer株式会社 活字文字列認識装置、プログラム、及び方法。

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000105836A (ja) * 1998-09-29 2000-04-11 Fuji Xerox Co Ltd 論理構造抽出装置
JP2003141447A (ja) * 2001-11-06 2003-05-16 Canon Inc 帳票検索システム
JP2004139484A (ja) * 2002-10-21 2004-05-13 Hitachi Ltd 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム
WO2020203339A1 (ja) * 2019-03-29 2020-10-08 Arithmer株式会社 活字文字列認識装置、プログラム、及び方法。
JP6820578B1 (ja) * 2019-03-29 2021-01-27 Arithmer株式会社 活字文字列認識装置、プログラム、及び方法。

Also Published As

Publication number Publication date
JP3484446B2 (ja) 2004-01-06

Similar Documents

Publication Publication Date Title
US7236653B2 (en) System and method for locating document areas using markup symbols
US20070098263A1 (en) Data entry apparatus and program therefor
JPH03201166A (ja) 日本語文書読取翻訳システムの修正時における表示方式
JP2004258706A (ja) 帳票定義データ作成方法および帳票処理装置
JP2008059157A (ja) 書類確認支援システム、書類確認支援装置およびプログラム
JP2973913B2 (ja) 入力シートシステム
JPH10143605A (ja) 光学文字認識装置
JP2008282094A (ja) 文字認識処理装置
CN103902514A (zh) 一种Word格式提取及再利用方法
JP5445740B2 (ja) 画像処理装置、画像処理システムおよび処理プログラム
JP2009182530A (ja) 業務処理遂行支援装置
JP2001005831A (ja) ファイリング方法及びそれを格納した記録媒体
JP3083171B2 (ja) 文字認識装置及び方法
JP2005050094A (ja) 光学的文字読取装置
JP2001028032A (ja) 画像情報処理装置及びマークシート
JP4092768B2 (ja) 文字認識装置および文字認識方法
JP4462508B2 (ja) 情報処理装置並びに定義情報生成方法
JPH01292586A (ja) 文字認識支援装置
JP3335494B2 (ja) 文字認識処理装置
JP3147613B2 (ja) 字形データ管理装置及びそれを備える文字出力装置
JP2024003769A (ja) 文字認識システム、コンピュータによる文字の認識方法、および文字検索システム
JPH06251187A (ja) 文字認識誤り修正方法及び装置
JP2669897B2 (ja) 誤読文字の修正方法
JPH1166232A (ja) 帳票定義方法
CN117558013A (zh) 一种将手写表单数据录入到pdf电子表单的方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071024

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081024

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081024

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091024

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091024

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101024

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111024

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121024

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees