JP3292595B2 - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JP3292595B2 JP3292595B2 JP14424594A JP14424594A JP3292595B2 JP 3292595 B2 JP3292595 B2 JP 3292595B2 JP 14424594 A JP14424594 A JP 14424594A JP 14424594 A JP14424594 A JP 14424594A JP 3292595 B2 JP3292595 B2 JP 3292595B2
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- character
- recognition
- field
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Character Discrimination (AREA)
Description
識結果を出力する文字認識装置に関する。文字認識装置
として、例えば保険契約書,売上伝票,払込取扱書など
の帳票上に印刷または記入された文字を読み取り、認識
した結果を画面上やプリンタに出力、またはメモリ上に
保存する装置がある。
字の字形がその文字を書いた人の癖に左右されやすく、
正確に識別するのは困難であった。したがって、手書き
文字の認識を正確に行うことができる文字認識装置の開
発が要望されていた。
7に示すようなものがある。図7において、1は帳票の
入力部であり、入力部1はイメージスキャナよりなり、
帳票の入力を行う。2はフィールド検出部であり、フィ
ールド検出部2は、入力部1より入力された帳票のフィ
ールドを検出する。フィールドは、例えば郵便番号のよ
うなひとまとまりの記入単位を指す。
はフィールド検出部2で検出したフィールド内から1文
字ごとのイメージを切り出す。4は認識部であり、認識
部4はフィールド上の切り出された文字と辞書5とをテ
ンプレートを用いて照合し、文字認識を行う。認識部4
で文字認識した認識結果は、文字コードとして出力部6
に送られる。出力部6は表示部またはプリンタよりな
り、文字コードに対応する認識文字を表示または印字す
る。
成者によって用意されており、辞書5の内容は作成者の
判断によって作成されていた。したがって、文字を書く
人の字形の癖は考慮されることがなかった。
認識装置にあっては、辞書の内容は、作成者の判断によ
って作成され、文字を書く人の字形の癖には一切関与し
ないようになっているため、文字を書く人の癖によって
左右されやすい手書き文字を、自動的に正しく識別する
ことは困難であった。
てなされたものであって、文字を書く人の癖に左右され
ず、手書き文字を正しく認識することができる文字認識
装置を提供することを目的とする。
図である。本発明は、入力する文字を切り出して第1の
辞書と照合して文字認識を行う第1の認識手段と、第1
の認識手段により同じカテゴリと認識された入力文字の
中から、第1の辞書との距離が最も小さい文字を取り出
して第1の辞書と同じものが登録された第2の辞書の対
応するカテゴリの部分に登録する辞書登録手段と、入力
する文字と辞書登録手段により文字が登録された第2の
辞書とを照合し文字認識を行う第2の認識手段とを備え
たことを特徴とする。
ィールドとして検出するフィールド検出手段を設け、該
フィールド検出手段により検出されたフィールド上の文
字と第1の辞書とを照合して文字認識を行った後、第2
の辞書にはフィールドごとに第1の辞書との距離が最も
小さい文字を登録する手段とを有することを特徴とす
る。
によれば、入力する文字のうち典型的な文字、例えば辞
書17との距離が最も小さい文字を取り出して、第2の
辞書19に登録し、登録した典型的な文字と入力する文
字とを照合して文字認識を行うようにしたため、文字を
書く人の癖に左右されることなく手書き文字を正しく認
識することができる。
して検出し、フィールドごとに第2の辞書19を生成す
るため、例えば一枚の帳票上で異なるフィールドを別の
人が書いているような場合にも、手書き文字を正しく認
識することができる。
する。図2〜図6は本発明の一実施例を示す図である。
図2は本発明の一実施例に係る文字認識装置のブロック
図である。図2において、11はイメージスキャナより
なる入力部であり、入力部11は帳票の入力を行う。1
2はフィールド検出手段としてのフィールド検出部であ
り、フィールド検出部12は、帳票内の任意のフィール
ドの検出を行う。すなわち、フィールド検出部12は、
帳票のフォーマットを、フィールドの位置や大きさなど
の既知情報として与えておくことにより、入力された帳
票のフィールドを検出する。ここでいうフィールドと
は、住所,名前,金額欄といった、ひとまとまりの記入
単位を指す。
保険契約申込書の例であり、郵便番号,都道府県,市郡
区,町村字,丁番号などのひとまとまりの記入単位14
A〜14Qがそれぞれフィールド14を構成する。郵便
番号は2つのフィールド14A,14Bよりなり、住所
は5つのフィールド14C〜14Gよりなり、保険契約
申込者は、氏,名の2つのフィールド14H,14Iよ
りなり、被保険者は、氏,名の2つのフィールド14
J,14Kよりなり、電話番号は、市外,市内,番号の
3つのフィールド14L〜14Nよりなり、申込年月日
は、年,月,日の3つのフィールド14O〜14Qより
なるが、郵便番号,住所,保険契約申込者,被保険者,
電話番号,申込年月日を1つのフィールドとして取り扱
っても良い。
ールドとして取り扱うようにしても良い。図2におい
て、15は文字切出し部であり、文字切出し部15はフ
ィールド検出部12により検出したフィールド14内か
ら1文字ごとのイメージを切り出す。
16はあらかじめ組み込まれている大分類用の第1の辞
書17を用いて、対象となるフィールド14上の文字の
認識を行う。第1の認識部16は、認識結果と、テンプ
レートとの距離を出力結果として辞書登録手段としての
辞書登録部18に出力する。辞書登録部18は、第1の
辞書17との距離が最も小さい文字を典型的な文字とし
てフィールド14ごとに第2の辞書19に登録する。ま
た、第2の辞書19内にはあらかじめ第1の辞書17と
同じものを登録しておく。
図である。図4において、A,A,B,C,A,Cは、
フィールド14内の文字の認識結果を示す。a1 ,
a2 ,b1 ,c1 ,am ,cn は第1の辞書17との各
距離を示す。したがって、カテゴリAと認識された文字
がm個あり、また、カテゴリCと認識された文字がn個
あり、また、カテゴリBと認識された文字が1個あるこ
とを示す。
合、その中の距離a1 ,a2 ,amのうち最も距離が小
さい文字、例えば距離a1 に対応する文字パターンAを
第2の辞書19のカテゴリの部分に登録する。また、カ
テゴリCと認識された文字がn個ある場合、その中の距
離c1 ,cnのうち最も距離が小さい文字、例えば距離
c1 に対応する文字パターンCを第2の辞書19のカテ
ゴリCの部分に登録する。
しかない場合、その距離b1 に対応する文字パターンB
を第2の辞書19のカテゴリBの部分に登録する。ま
た、図5はフィールドと認識結果と距離の他の説明図で
ある。図5において、14はフィールドであり、このフ
ィールド14は6つの枠より構成され、フィールド14
内には手書き文字が書かれる。
内の文字の認識結果である。a1 ,a2 ,b1 ,c1 ,
a3 ,c2 は第1の辞書17との距離を示す。したがっ
て、カテゴリ0と認識された文字が3個あり、カテゴリ
1と認識された文字が1個あり、カテゴリ2と認識され
た文字が2個あることを示す。カテゴリ0と認識された
文字が3個ある場合、その中の距離a1 ,a2 ,a3の
うち最も距離が小さい文字、例えば距離a1 に対応する
文字が第2の辞書19のカテゴリ0の部分に登録され
る。
ある場合、その中の距離c1 ,c2のうち距離が小さい
方の文字、例えば距離c1 に対応する文字が第2の辞書
19のカテゴリ2の部分に登録される。また、カテゴリ
1と認識された文字は1個しかないので、その文字(距
離b1に対応する文字)が第2の辞書19のカテゴリ1
の部分に登録される。
の第2の認識部であり、第2の認識部20はフィールド
14のすべての文字に対して第2の辞書19を用いて文
字認識を行う。すなわち、第2の認識部20は、第2の
辞書19にフィールド14ごとに登録された、第1の辞
書17との距離が最も小さい文字、すなわち典型的な文
字と再度入力したフィールド14内の文字とを照合し、
その認識結果を出力部21に与える。出力部21は表示
部またはプリンタよりなり、認識結果を表示または印刷
する。
するためのフローチャートである。図6において、ま
ず、ステップS1で入力部11により帳票13の入力を
行う。帳票13としては、例えば図3に示すような保険
契約申込書がある。この帳票13のフィールド14には
郵便番号などが手書きされる。
2により入力された帳票13のフィールド14の検出を
行う。フィールド14の検出は、帳票13上の規定の領
域である、郵便番号,都道府県などのように、ひとまと
まりの記入単位14A〜14Qごとに行うが、住所,保
険契約申込書,被保険者,電話番号などのように複数の
フィールド14をまとめてひとつのフィールドとしても
良い。
として取り扱うようにしても良い。この場合には、フィ
ールド検出部12を省略することができる。次に、ステ
ップS3で文字切出し部15によりフィールド検出部1
2で検出したフィールド14内から一文字ごとのイメー
ジを切り出す。次に、ステップS4で第1の認識部16
により第1の辞書17を用いて対象となるフィールド1
4内の手書き文字の認識を行う。そして、ステップS5
で第1の認識部16により認識した結果とテンプレート
との距離を辞書登録部18に出力する。すなわち、認識
対象文字と第1の辞書17を照合し、テンプレートから
はみ出る部分の距離が最も小さい文字パターンを認識結
果として距離とともに出力する。
4内のすべての文字の認識が終了したか否かを判別し、
終了していない場合には、ステップS3に戻り、ステッ
プS3で次の文字を切り出し、終了した場合にはステッ
プS7に進む。ステップS7ではカテゴリ数iを設定
し、順次取り込む。カテゴリ数iとしては、例えば図5
に示すようにカテゴリが数字の場合には、1,2,3,
4,5,6,7,8,9,0がカテゴリ数iとなる。
数jを設定し、順次取り込む。フィールド内文字数jと
しては、例えば図5に示すように、フィールド14のブ
ロックが6個の場合には1,2,3,4,5,6がフィ
ールド内文字数jとなる。次に、ステップS9でカテゴ
リ数Ciと認識結果数Ajが一致するか判別する。カテ
ゴリ数Ciとしては、図5の場合を例にとると、C1 は
1、C2 は2、C3 は3、C4 は4、C5 は5、C6 は
6、C7 は7、C8 は8、C9 は9、C0 は0となる。
合を例にとると、A1 は0、A2 は0、A3 は1、A4
は2、A5 は0、A6 は2となる。したがって、C0 =
A1、C0 =A2 、C0 =A5 、C1 =A3 、C2 =A
4 、C2 =A6 のとき、Ci=Ajとなる。次に、ステ
ップS10でどのAjの距離がCiの中で最小であるか
否かを判別し、ステップS11でAiの距離が最小のも
のをmi とする。
5 の距離はa3 であり、a1 ,a2,a3 のうち、例え
ばa1 が最小であると判別された場合には、A1 をm1
とする。また、A4 の距離はc1 、A6 の距離はc2 で
あり、例えばc1 <c2 のときはA4 をm4 とする。ま
た、C1 は1個しかなく、A3 の距離はb1 であるの
で、A3 をm3 とする。
の典型的な文字の取出しが終了したら、ステップS13
でmi に対応するカテゴリを第2の辞書19に登録す
る。すなわち、距離a1 に対応する文字0、距離b1 に
対応する文字1、距離C1 に対応する文字2をそれぞれ
第2の辞書19の各カテゴリの部分に登録する。次に、
ステップS14で再度帳票13の入力を行い、フィール
ド14を検出し、一文字の切り出しを行う。
第2の辞書19とを照合する。すなわち、再入力した文
字と第2の辞書19に登録された、第1の辞書17との
距離が最も小さい文字、すなわち、典型的な文字とを照
合する。そして、ステップS16で全てのフィールド1
4について第1の認識部16および第2の認識部20に
よる文字認識が終了したら、ステップS17で認識結果
を出力部21に与え、ステップS18で出力部21は認
識結果を表示または印刷する。
の第2の辞書19を、フィールド14内の文字から第1
の辞書17との距離が最も小さい文字である典型的な文
字を取り出して生成するようにしたため、すなわち、フ
ィールド14ごとに典型的な文字が登録された第2の辞
書19を生成するようにしたため、文字を書いた人の癖
がそのまま第2の辞書19に反映されることになり、文
字を書く人の癖に左右されることなく、手書き文字を正
しく認識することができる。
第2の辞書19を生成するため、例えば一枚の帳票13
上に異なるフィールド14を別の人が書いているような
場合でも対応することができる。なお、本実施例におい
ては、フィールド検出部12によって帳票13上の特定
の領域をフィールド14として検出するようにしたが、
帳票全体を一つのフィールドとみなすことによりフィー
ルド検出部12を省略しても良い。帳票全体の文字数が
少ない場合には、こうした方が能率的である。
ば、入力する文字のうち典型的な文字を取り出して第2
の辞書に登録し、入力する文字と登録した典型的な文字
とを照合して文字認識を行うようにしたため、文字を書
く人の癖に左右されず、手書き文字を正しく識別するこ
とができる。
の辞書を生成するため、例えば一枚の帳票上で異なるフ
ィールドを別の人が書いているような場合でも、手書き
文字を正しく識別することができる。
Claims (3)
- 【請求項1】入力する文字を切り出して第1の辞書と照
合して文字認識を行う第1の認識手段と、 前記第1の認識手段により同じカテゴリと認識された入
力文字の中から、前記第1の辞書との距離が最も小さい
文字を取り出して前記第1の辞書と同じものが登録され
た第2の辞書の対応するカテゴリの部分に登録する辞書
登録手段と、 前記入力する文字と前記辞書登録手段により文字が登録
された第2の辞書とを照合し文字認識を行う第2の認識
手段とを備えたことを特徴とする文字認識装置。 - 【請求項2】帳票上の特定の領域をフィールドとして検
出するフィールド検出手段を設け、該フィールド検出手
段により検出されたフィールド上の文字と前記第1の辞
書とを照合して文字認識を行った後、前記第2の辞書に
は前記フィールドごとに前記第1の辞書との距離が最も
小さい文字を登録する手段とを有することを特徴とする
請求項1記載の文字認識装置。 - 【請求項3】文字認識装置による文字認識方法であっ
て、 入力する文字を切り出して第1の辞書と照合して文字認
識を行う第1の認識ステップと、 前記第1の認識ステップにより同じカテゴリと認識され
た入力文字の中から、前記第1の辞書との距離が最も小
さい文字を取り出して前記第1の辞書と同じものが登録
された第2の辞書の対応するカテゴリの部分に登録する
辞書登録ステップと、 前記入力する文字と前記辞書登録ステップにより文字が
登録された第2の辞書とを照合し文字認識を行う第2の
認識ステップとを備えたことを特徴とする文字認識方
法 。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP14424594A JP3292595B2 (ja) | 1994-06-27 | 1994-06-27 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP14424594A JP3292595B2 (ja) | 1994-06-27 | 1994-06-27 | 文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0816724A JPH0816724A (ja) | 1996-01-19 |
JP3292595B2 true JP3292595B2 (ja) | 2002-06-17 |
Family
ID=15357621
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP14424594A Expired - Lifetime JP3292595B2 (ja) | 1994-06-27 | 1994-06-27 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3292595B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001040789A1 (fr) * | 1999-12-02 | 2001-06-07 | Hymo Corporation | Gels de polyacrylamide premoules pour l'electrophorese, procede de production de ces derniers et procede d'electrophorese dans lequel on utilise ces gels |
-
1994
- 1994-06-27 JP JP14424594A patent/JP3292595B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH0816724A (ja) | 1996-01-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3422924B2 (ja) | 文字認識装置、文字認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JPH0684006A (ja) | オンライン手書き文字認識方法 | |
JPH1011531A (ja) | 帳票読取装置 | |
JP3483919B2 (ja) | 伝票文書情報システム | |
JP3292595B2 (ja) | 文字認識装置 | |
JP2008282094A (ja) | 文字認識処理装置 | |
JP2001005804A (ja) | 文字認識装置を利用したデータベース登録方法 | |
JPH06103402A (ja) | 名刺認識装置 | |
JP3360030B2 (ja) | 文字認識装置および文字認識方法および文字認識方法をプログラムの形で記録した記録媒体 | |
JP2000090192A (ja) | 住所および郵便番号の文字列修正方法 | |
JP2575408B2 (ja) | 郵便物の宛先住所読取装置 | |
JP2922365B2 (ja) | Ocr処理システムにおける漢字住所データ処理方法 | |
JP2002366893A (ja) | 帳票認識方法 | |
JP4224914B2 (ja) | 文字読取システム及び文字読取方法 | |
JP3163859B2 (ja) | 運転免許証認識装置及び運転免許証認識方法 | |
JP3007697B2 (ja) | 単語照合装置及び単語照合方法 | |
JPH08241314A (ja) | 文書ファイリングシステム | |
JP2000172706A (ja) | 文字列分類装置 | |
JPH0546815A (ja) | 光学式文字読取装置における住所単語照合方法 | |
JPH0256086A (ja) | 文字認識の後処理方法 | |
JP2001312694A (ja) | 多種類の帳票認識方法および装置 | |
JP2570703B2 (ja) | 文字読取装置 | |
JP3001618B2 (ja) | 紙上の文字等の複写方法と記号の認識方法 | |
JPH117492A (ja) | キー入力編集方法及び編集装置 | |
JPS63282586A (ja) | 文字認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20020226 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080329 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090329 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100329 Year of fee payment: 8 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100329 Year of fee payment: 8 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110329 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140329 Year of fee payment: 12 |
|
EXPY | Cancellation because of completion of term |