JPH0769938B2 - 文字読取装置 - Google Patents

文字読取装置

Info

Publication number
JPH0769938B2
JPH0769938B2 JP63087611A JP8761188A JPH0769938B2 JP H0769938 B2 JPH0769938 B2 JP H0769938B2 JP 63087611 A JP63087611 A JP 63087611A JP 8761188 A JP8761188 A JP 8761188A JP H0769938 B2 JPH0769938 B2 JP H0769938B2
Authority
JP
Japan
Prior art keywords
character
unit
field
characters
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63087611A
Other languages
English (en)
Other versions
JPH01259476A (ja
Inventor
由紀 田邉
正廣 大川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP63087611A priority Critical patent/JPH0769938B2/ja
Publication of JPH01259476A publication Critical patent/JPH01259476A/ja
Publication of JPH0769938B2 publication Critical patent/JPH0769938B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 〔概要〕 文字の照合を行って認識する認識部を複数備え、手書き
文字を書込み領域と活字文字を書込む領域が用紙上の一
行中に複数混在する場合、認識処理効率を高める文字読
取装置に関し、 認識部に生ずる遊び時間を短縮して文字の認識処理効率
を高めることを目的とし、複数種の字体の文字を認識す
る複数の認識手段と、用紙から読み取った文字画像領域
内の文字について予め与えられている字体情報に基づ
き、同種の文字からなる複数の文字画像領域内の文字の
切り出しをまとめて連続的に行う手段とを備え、前記複
数の認識手段は、前記同種の字体からなる複数の文字画
像領域からなる複数の文字画像領域から切り出された文
字を文字単位で順番に認識する構成とする。
〔産業上の利用分野〕
本発明は文字の照合を行って認識する認識部を複数備え
た文字読取装置に係り、特に手書き文字を書込むフィー
ルド(用紙上に設けられた文字記入領域)と活字文字を
書込むフィールドが用紙の一行中に複数混在する場合、
認識処理効率を高める文字読取装置に関する。
近年、情報化社会の発展に伴い、計算機システムに入力
するデータが多量化し、より高速なデータの入力装置が
要求されるようになって来た。このため文字読取装置に
おいても、より高速な文字の読取りが必要であり、用紙
上の一行中に存在する複数のフィールドから読取られた
文字列より文字を一文字ずつ切出し、例えば、標準パタ
ーンと照合して認識する認識部を複数設け、高速に処理
する文字読取装置が使用されている。
ところで、この複数の認識部は常に効率良く動作するこ
とが必要である。
〔従来の技術〕
第5図は従来の技術を説明するブロック図で、第6図は
第5図の動作を説明する図である。
光源1から例えば帳票2に光を投射し、その反射光をレ
ンズ3により集光して光電変換二値化回路4上に結像さ
せる。光電変換二値化回路4は、例えばCCDによって反
射光を電気信号に変換し、帳票2が例えば矢印Aの方向
に移動するに伴い、帳票2上の第6図(a)に示す如き
フィールドに記入された文字を読取る。そして、電気信
号に変換されたデータは二値化され、画像メモリ5に文
字パターン列として格納される。
帳票2には、第6図(a)に示す如く、例えばフィール
ド(1)とフィールド(2)とフィールド(3)が、帳
票の一行中に存在し、フィールド(1)とフィールド
(3)が手書きの文字を記入するフィールドであり、フ
ィールド(2)が活字文字を記入するフィールドである
とすると、画像メモリ5には各フィールド毎に文字パタ
ーン列が格納される。
認識部6の制御部10には予めフィールド(1)(3)が
手書き文字が記入されるフィールドであり、フィールド
(2)が活字文字が記入されるフィールドであることを
示す帳票2のフィールド情報が与えられており、手書き
文字と活字文字とでは文字の切出しから、文字を認識す
るまでの処理が異なるため、制御部10は画像メモリ5に
格納された各フィールド(1)(2)(3)毎に、夫々
文字パターン列を読出して、文字切出し部11に出力させ
る。
即ち、先ず帳票2のフィールド(1)から読取られ画像
メモリ5に格納された文字パターン〜が読出され、
この文字パターン〜は文字切出し部11に入力する。
文字切出し部11は制御部10の制御に基づき、画像メモリ
5から入力した文字パターン〜に対し、第6図
(b)に示す如く、連続して文字の切出しを行い、一文
字分の文字パターンを切出すと、切替部12に送出す
る。
切替部12は第6図(c)に示す如く、この文字パターン
を認識部7の特徴抽出部17に送出する。これは制御部
10が次の文字パターン以後の文字切出し制御のため、
特徴抽出部13、照合部14、判定部15の制御が出来ないた
めである。
特徴抽出部17は制御部16の制御により、文字パターン
の特徴を抽出し、照合部18に送出する。照合部18は辞書
8から標準パターンの特徴を読出して照合する。そし
て、特徴の相違度が小さい順に辞書8内の候補文字が複
数選択され、判定部19に送出される。
判定部19は、フィールド(1)が数字であるとか、英字
であるとかという予め与えられた帳票2のフォーマット
情報に基づき、最終的に候補文字を選択し、編集部9に
送出する。
文字切出し部11で次に切出された文字パターンは、切
替部12から特徴抽出部17に送出され、前記同様にして判
定結果が編集部9に送出される。
同様に切出された文字パターンは、第6図(b)に示
す如く、ここで文字切出し部11の文字切出し動作が文字
パターンまで完了したため、切替部12を経て特徴抽出
部13に送出され、特徴抽出部13で抽出された文字パター
ンの特徴は、照合部14で辞書8の標準パターンの特徴
と照合される。そして、相違度の小さい順に辞書8内の
候補文字が複数判定部15に送出され、前記同様に予め与
えられた帳票2のフォーマット情報に基づき、最終的に
候補文字が選択され、編集部9に送出される。
編集部9は認識部6と7から送出された認識結果の文字
を制御部10から与えられる情報に基づき、〜の順に
編集する。
第6図(a)に示すフィールド(2)については活字文
字の認識であるため、制御部10と16の制御プログラムが
異なり、特徴抽出部13と17における抽出特徴及び辞書8
の内容も異なるが、上記同様に第6図(c)に示す如
く、認識部7で文字パターンとが認識され、第6図
(b)に示す如く、認識部6で文字パターンとが認
識され、編集部9に送出される。そして、編集部9はこ
の文字を〜の順に編集する。
第6図(a)に示すフィールド(3)の場合はフィール
ド(1)の場合と全く同様で、第6図(b)に示す如
く、認識部6で文字パターンとが認識され、第6図
(c)に示す如く、認識部7で文字パターンとと
が認識され、編集部9はこの文字を〜の順に編集す
る。
〔発明が解決しようとする課題〕
上記の如く、従来はフィールド(1)の認識処理が完了
するまで、次のフィールド(2)の認識処理に移行する
ことが出来ず、同様にフィールド(2)の認識処理が完
了してから、フィールド(3)の認識処理に移行してい
る。
従って、各フィールド毎に早く認識処理を完了した認識
部が遊んでしまい、手書き文字のフィールドと活字文字
のフィールドが一行中に混在する帳票を処理する場合、
一行中にフィールドの数が多い程処理効率が低下すると
いう問題がある。
本発明はこのような問題点に鑑み、手書き文字のフィー
ルド(1)と(3)をまとめて連続して画像メモリ5か
ら読出し、文字切出しから認識までを終了させ、次に活
字文字フィールド(2)を読出して文字切出しから認識
までを終了させるようにして、認識部6と7に生ずる遊
び時間を短縮し文字の認識処理効率を高めることを目的
としている。
〔課題を解決するための手段〕
第1図は本発明の原理ブロック図である。
第5図と同一符号は同一機能のものを示す。認識部22の
制御部20は指示手段21の指示に基づき、予め与えられた
帳票のフォーマット情報に基づき、画像メモリ5に格納
されている文字パターン列が、手書き文字フィールドか
ら読取られたものか、活字文字フィールドから読取られ
たものか、又、複数の手書き文字フィールドから読取ら
れた文字パターン列があるか、複数の活字文字フィール
ドから読取られた文字パターン列があるか調べる。
そして、複数の手書き文字フィールドから読取られた文
字パターン列がある場合、この複数の文字パターン列を
まとめて連続して画像メモリ5から読出し、文字切出し
部11に入力させる。
制御部20は一連の文字パターン列の文字切出しを完了す
るまで、切替部12を経て切出した各文字パターンを認識
部7に送出させ、その後は交互に特徴抽出部13に送出し
て、文字パターンの特徴を抽出させ、照合部14で辞書8
の特徴と照合させ、候補文字を判定部15に送出させ、フ
ォーマット情報に基づき候補文字を選択させる。そし
て、判定部15と認識部7から選択した文字を編集部9に
送出してフィールド毎に文字列を編集させる。
活字文字フィールドから読取られた文字パターン列があ
る場合も上記と同様である。
〔作用〕
上記の如く構成することにより、制御部20は指示手段21
の指示に基づき、手書き文字のフィールドと活字文字の
フィールドとに分けて、夫々のフィールドの文字列を一
度に認識させるため、従来のようにフィールド毎に発生
する認識部22又は7に生ずる遊び時間が総合すると短縮
する。従って、文字読取装置の処理効率を高めることが
出来る。
〔実施例〕
第2図は本発明の一実施例を示す回路のブロック図で、
第3図は第2図の動作を説明するフローチャートで、第
4図は第2図の動作を説明する図である。
第5図と同一符号は同一機能のものを示す。認識部22の
制御部20は指示プログラム23の指示に基づき、第3図に
示す如く、予め与えられた帳票のフォーマット情報に基
づき、手書き文字フィールドと活字文字フィールドとを
区分する。
即ち、画像メモリ5に格納されている文字パターン列
が、手書き文字フィールドから読取られたものか、活字
文字フィールドから読取られたものかを認識して区分す
る。そして、手書き文字フィールドが有るか調べる。
手書き文字フィールドが無ければ、活字文字フィールド
があるか調べるルーチンに移行し、手書き文字フィール
ドがあれば、複数有るか調べる。複数なければ該当フィ
ールドの文字パターン列を読出し、複数有れば複数のフ
ィールド分の文字パターン列をまとめて順次連続して読
出し、文字の認識を行わせる。
即ち、第4図(a)に示すフィールド(1)と(3)が
手書き文字フィールドであるとすると、制御部20は文字
パターンからまで読出した後、続いて文字パターン
からまでを読出し、文字切出し部11に入力させる。
文字切出し部11は制御部20の制御により第4図(b)に
示す如く、文字切出しを連続して行い、文字からを
夫々切出した後も続いて文字からまでを夫々切出
す。
制御部20は文字の切出し中に切出された。例えば文字
ととは切替部12を経て認識部7に送出して認識さ
せ、その後は交互に切替部12を経て、文字は特
徴抽出部13に送出させて特徴を抽出させ、照合部14にお
いて辞書8から標準パターンの特徴を読出させて照合さ
せ、候補文字を判定部15に送出させる。判定部15はフォ
ーマット情報に基づき、候補文字を選択して編集部9に
送出する。
又、制御部20は文字を認識部7に送出させて認
識させる。編集部9はフォーマット情報に基づき、フィ
ールド毎に判定部15と認識部7の判定部が送出した文字
を編集して、各フィールド毎に文字列として送出する。
制御部20は第3図に示す如く、続いて活字文字フィール
ドがあるか調べ、活字文字フィールドが無ければ動作を
終了し、活字文字フィールドがあれば、複数有るか調べ
る。複数なければ該当フィールドの文字パターン列を読
出し、複数有れば複数のフィールド分の文字パターン列
をまとめて順次連続して読出し、文字の認識を行わせ
る。
即ち、第4図(a)に示すフィールド(2)が活字文字
フィールドであるとすると、制御部20は文字パターン
からまで読出し、文字切出し部11に入力させる。文字
切出し部11は制御部20の制御により第4図(b)に示す
如く、文字切出しを連続して行い、文字からまでを
夫々切出す。
制御部20は文字の切出し中に切出された、例えば文字
は切替部12を経て認識部7に送出して認識させ、その後
は交互に切替部12を経て、文字を特徴抽出部13に送
出させて特徴を抽出させ、照合部14において辞書8から
標準パターンの特徴を読出させて照合させ、候補文字を
判定部15に送出させる。判定部15はフォーマット情報に
基づき、候補文字を選択して編集部9に送出する。
又、制御部20は文字を認識部7に送出させて認識させ
る。編集部9はフォーマット情報に基づき、フィールド
毎に判定部15と認識部7の判定部が送出した文字を編集
して、各フィールド毎に文字列として送出する。
〔発明の効果〕
以上説明した如く、本発明は手書き文字のフィールドと
活字文字のフィールドが混在する帳票等から文字を読取
った場合、手書き文字のフィールドと、活字文字のフィ
ールドとに区分して、夫々のフィールドの文字列をまと
めて認識するため、複数の認識部の遊び時間が少なくな
り、文字読取装置の処理効率を高めることが出来る。
【図面の簡単な説明】
第1図は本発明の原理ブロック図、 第2図は本発明の一実施例を示す回路のブロック図、 第3図は第2図の動作を説明するフローチャート、 第4図は第2図の動作を説明する図、 第5図は従来の技術を説明するブロック図、 第6図は第5図の動作を説明する図である。 図において、 1は光源、2は帳票、 3はレンズ、4は光電変換二値化回路、 5は画像メモリ、6,7,22は認識部、 8は辞書、9は編集部、 10,16,20は制御部、11は文字切出し部、 12は切替部、13,17は特徴抽出部、 14,18は照合部、15,19は判定部、 21は指示手段、23は指示プログラムである。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】複数種の字体の文字を認識する複数の認識
    手段と、 用紙から読み取った文字画像領域内の文字について予め
    与えられている字体情報に基づき、同種の文字からなる
    複数の文字画像領域内の文字の切り出しをまとめて連続
    的に行う手段とを備え、 前記複数の認識手段は、前記同種の字体からなる複数の
    文字画像領域から切り出された文字を文字単位で順番に
    認識することを特徴とする文字読取装置。
JP63087611A 1988-04-08 1988-04-08 文字読取装置 Expired - Lifetime JPH0769938B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63087611A JPH0769938B2 (ja) 1988-04-08 1988-04-08 文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63087611A JPH0769938B2 (ja) 1988-04-08 1988-04-08 文字読取装置

Publications (2)

Publication Number Publication Date
JPH01259476A JPH01259476A (ja) 1989-10-17
JPH0769938B2 true JPH0769938B2 (ja) 1995-07-31

Family

ID=13919769

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63087611A Expired - Lifetime JPH0769938B2 (ja) 1988-04-08 1988-04-08 文字読取装置

Country Status (1)

Country Link
JP (1) JPH0769938B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI671686B (zh) * 2018-01-24 2019-09-11 緯創資通股份有限公司 影像數據擷取方法及影像數據擷取裝置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57147775A (en) * 1981-03-09 1982-09-11 Nec Corp Character reader
JPS61206090A (ja) * 1985-03-11 1986-09-12 Mitsubishi Electric Corp 文字読取装置

Also Published As

Publication number Publication date
JPH01259476A (ja) 1989-10-17

Similar Documents

Publication Publication Date Title
JPH0769938B2 (ja) 文字読取装置
JPH0520794B2 (ja)
JPS57168382A (en) Optical character reader
JP2578767B2 (ja) 画像処理方法
JP2578768B2 (ja) 画像処理方法
JPH0713994A (ja) 文字認識装置
JPS6146573A (ja) 文字認識装置
JPS6129976A (ja) 文字認識方法
JPH0210472B2 (ja)
JPS62281091A (ja) パタ−ン情報認識方法
JPS62281090A (ja) パタ−ン情報認識方法
JP2000339405A (ja) 光学的文字認識システム、同システムに於ける帳票のフォーマットコントロール作成方法、及び同方法が格納された記憶媒体
JPS5914078A (ja) 帳票読取装置
JP2851102B2 (ja) 文字切出し方法
JP2549831B2 (ja) 文字認識装置の入力パターン・文字列登録方法
JPH0272497A (ja) 光学的文字読取装置
JPH0944593A (ja) 文字認識制御装置
JPS63257081A (ja) 文書入力方式
JPH0576674B2 (ja)
JPS62281088A (ja) 画像処理方法
JPS5851390A (ja) 活字文字認識装置
JPH06187450A (ja) パターン認識方法と認識装置
JPS6327991A (ja) 入力情報認識装置用ヒストグラム作成方法
JPS62281089A (ja) 画像処理方法
JPS6318483A (ja) 光学的情報入力装置用文字認識方法