JP3292595B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP3292595B2
JP3292595B2 JP14424594A JP14424594A JP3292595B2 JP 3292595 B2 JP3292595 B2 JP 3292595B2 JP 14424594 A JP14424594 A JP 14424594A JP 14424594 A JP14424594 A JP 14424594A JP 3292595 B2 JP3292595 B2 JP 3292595B2
Authority
JP
Japan
Prior art keywords
dictionary
character
recognition
field
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP14424594A
Other languages
English (en)
Other versions
JPH0816724A (ja
Inventor
康裕 浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP14424594A priority Critical patent/JP3292595B2/ja
Publication of JPH0816724A publication Critical patent/JPH0816724A/ja
Application granted granted Critical
Publication of JP3292595B2 publication Critical patent/JP3292595B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字を入力して文字認
識結果を出力する文字認識装置に関する。文字認識装置
として、例えば保険契約書,売上伝票,払込取扱書など
の帳票上に印刷または記入された文字を読み取り、認識
した結果を画面上やプリンタに出力、またはメモリ上に
保存する装置がある。
【0002】手書き文字を認識する場合には、手書き文
字の字形がその文字を書いた人の癖に左右されやすく、
正確に識別するのは困難であった。したがって、手書き
文字の認識を正確に行うことができる文字認識装置の開
発が要望されていた。
【0003】
【従来の技術】従来の文字認識装置としては、例えば図
7に示すようなものがある。図7において、1は帳票の
入力部であり、入力部1はイメージスキャナよりなり、
帳票の入力を行う。2はフィールド検出部であり、フィ
ールド検出部2は、入力部1より入力された帳票のフィ
ールドを検出する。フィールドは、例えば郵便番号のよ
うなひとまとまりの記入単位を指す。
【0004】3は文字切出し部であり、文字切出し部3
はフィールド検出部2で検出したフィールド内から1文
字ごとのイメージを切り出す。4は認識部であり、認識
部4はフィールド上の切り出された文字と辞書5とをテ
ンプレートを用いて照合し、文字認識を行う。認識部4
で文字認識した認識結果は、文字コードとして出力部6
に送られる。出力部6は表示部またはプリンタよりな
り、文字コードに対応する認識文字を表示または印字す
る。
【0005】ここで、前記辞書5は、文字認識装置の作
成者によって用意されており、辞書5の内容は作成者の
判断によって作成されていた。したがって、文字を書く
人の字形の癖は考慮されることがなかった。
【0006】
【発明が解決しようとする課題】このような従来の文字
認識装置にあっては、辞書の内容は、作成者の判断によ
って作成され、文字を書く人の字形の癖には一切関与し
ないようになっているため、文字を書く人の癖によって
左右されやすい手書き文字を、自動的に正しく識別する
ことは困難であった。
【0007】本発明は、このような従来の問題点に鑑み
てなされたものであって、文字を書く人の癖に左右され
ず、手書き文字を正しく認識することができる文字認識
装置を提供することを目的とする。
【0008】
【課題を解決するための手段】図1は本発明の原理説明
図である。本発明は、入力する文字を切り出して第1の
辞書と照合して文字認識を行う第1の認識手段と、第1
の認識手段により同じカテゴリと認識された入力文字の
中から、第1の辞書との距離が最も小さい文字を取り出
して第1の辞書と同じものが登録された第2の辞書の対
応するカテゴリの部分に登録する辞書登録手段と、入力
する文字と辞書登録手段により文字が登録された第2の
辞書とを照合し文字認識を行う第2の認識手段とを備え
たことを特徴とする。
【0009】また、本発明は、帳票上の特定の領域をフ
ィールドとして検出するフィールド検出手段を設け、該
フィールド検出手段により検出されたフィールド上の文
字と第1の辞書とを照合して文字認識を行った後、第
の辞書にはフィールドごとに第1の辞書との距離が最も
小さい文字を登録する手段とを有することを特徴とす
【0010】
【作用】このような構成を備えた本発明の文字認識装置
によれば、入力する文字のうち典型的な文字、例えば辞
書17との距離が最も小さい文字を取り出して、第2の
辞書19に登録し、登録した典型的な文字と入力する文
字とを照合して文字認識を行うようにしたため、文字を
書く人の癖に左右されることなく手書き文字を正しく認
識することができる。
【0011】また、帳票上の特定の領域をフィールドと
して検出し、フィールドごとに第2の辞書19を生成す
るため、例えば一枚の帳票上で異なるフィールドを別の
人が書いているような場合にも、手書き文字を正しく認
識することができる。
【0012】
【実施例】以下、本発明の実施例を図面に基づいて説明
する。図2〜図6は本発明の一実施例を示す図である。
図2は本発明の一実施例に係る文字認識装置のブロック
図である。図2において、11はイメージスキャナより
なる入力部であり、入力部11は帳票の入力を行う。1
2はフィールド検出手段としてのフィールド検出部であ
り、フィールド検出部12は、帳票内の任意のフィール
ドの検出を行う。すなわち、フィールド検出部12は、
帳票のフォーマットを、フィールドの位置や大きさなど
の既知情報として与えておくことにより、入力された帳
票のフィールドを検出する。ここでいうフィールドと
は、住所,名前,金額欄といった、ひとまとまりの記入
単位を指す。
【0013】図3に帳票の例を示す。図3の帳票13は
保険契約申込書の例であり、郵便番号,都道府県,市郡
区,町村字,丁番号などのひとまとまりの記入単位14
A〜14Qがそれぞれフィールド14を構成する。郵便
番号は2つのフィールド14A,14Bよりなり、住所
は5つのフィールド14C〜14Gよりなり、保険契約
申込者は、氏,名の2つのフィールド14H,14Iよ
りなり、被保険者は、氏,名の2つのフィールド14
J,14Kよりなり、電話番号は、市外,市内,番号の
3つのフィールド14L〜14Nよりなり、申込年月日
は、年,月,日の3つのフィールド14O〜14Qより
なるが、郵便番号,住所,保険契約申込者,被保険者,
電話番号,申込年月日を1つのフィールドとして取り扱
っても良い。
【0014】さらに、また、帳票13全体を一つのフィ
ールドとして取り扱うようにしても良い。図2におい
て、15は文字切出し部であり、文字切出し部15はフ
ィールド検出部12により検出したフィールド14内か
ら1文字ごとのイメージを切り出す。
【0015】16は第1の認識部であり、第1の認識部
16はあらかじめ組み込まれている大分類用の第1の辞
書17を用いて、対象となるフィールド14上の文字の
認識を行う。第1の認識部16は、認識結果と、テンプ
レートとの距離を出力結果として辞書登録手段としての
辞書登録部18に出力する。辞書登録部18は、第1の
辞書17との距離が最も小さい文字を典型的な文字とし
てフィールド14ごとに第2の辞書19に登録する。ま
た、第2の辞書19内にはあらかじめ第1の辞書17と
同じものを登録しておく。
【0016】図4はフィールドと認識結果と距離の説明
図である。図4において、A,A,B,C,A,Cは、
フィールド14内の文字の認識結果を示す。a1
2 ,b1 ,c1 ,am ,cn は第1の辞書17との各
距離を示す。したがって、カテゴリAと認識された文字
がm個あり、また、カテゴリCと認識された文字がn個
あり、また、カテゴリBと認識された文字が1個あるこ
とを示す。
【0017】カテゴリAと認識された文字がm個ある場
合、その中の距離a1 ,a2 ,amのうち最も距離が小
さい文字、例えば距離a1 に対応する文字パターンAを
第2の辞書19のカテゴリの部分に登録する。また、カ
テゴリCと認識された文字がn個ある場合、その中の距
離c1 ,cnのうち最も距離が小さい文字、例えば距離
1 に対応する文字パターンCを第2の辞書19のカテ
ゴリCの部分に登録する。
【0018】また、カテゴリBと認識された文字が1個
しかない場合、その距離b1 に対応する文字パターンB
を第2の辞書19のカテゴリBの部分に登録する。ま
た、図5はフィールドと認識結果と距離の他の説明図で
ある。図5において、14はフィールドであり、このフ
ィールド14は6つの枠より構成され、フィールド14
内には手書き文字が書かれる。
【0019】0,0,1,2,0,2はフィールド14
内の文字の認識結果である。a1 ,a2 ,b1 ,c1
3 ,c2 は第1の辞書17との距離を示す。したがっ
て、カテゴリ0と認識された文字が3個あり、カテゴリ
1と認識された文字が1個あり、カテゴリ2と認識され
た文字が2個あることを示す。カテゴリ0と認識された
文字が3個ある場合、その中の距離a1 ,a2 ,a3
うち最も距離が小さい文字、例えば距離a1 に対応する
文字が第2の辞書19のカテゴリ0の部分に登録され
る。
【0020】また、カテゴリ2と認識された文字が2個
ある場合、その中の距離c1 ,c2のうち距離が小さい
方の文字、例えば距離c1 に対応する文字が第2の辞書
19のカテゴリ2の部分に登録される。また、カテゴリ
1と認識された文字は1個しかないので、その文字(距
離b1に対応する文字)が第2の辞書19のカテゴリ1
の部分に登録される。
【0021】図2に戻り、20は第2の認識手段として
の第2の認識部であり、第2の認識部20はフィールド
14のすべての文字に対して第2の辞書19を用いて文
字認識を行う。すなわち、第2の認識部20は、第2の
辞書19にフィールド14ごとに登録された、第1の辞
書17との距離が最も小さい文字、すなわち典型的な文
字と再度入力したフィールド14内の文字とを照合し、
その認識結果を出力部21に与える。出力部21は表示
部またはプリンタよりなり、認識結果を表示または印刷
する。
【0022】次に、動作を説明する。図6は動作を説明
するためのフローチャートである。図6において、ま
ず、ステップS1で入力部11により帳票13の入力を
行う。帳票13としては、例えば図3に示すような保険
契約申込書がある。この帳票13のフィールド14には
郵便番号などが手書きされる。
【0023】次に、ステップS2でフィールド検出部1
2により入力された帳票13のフィールド14の検出を
行う。フィールド14の検出は、帳票13上の規定の領
域である、郵便番号,都道府県などのように、ひとまと
まりの記入単位14A〜14Qごとに行うが、住所,保
険契約申込書,被保険者,電話番号などのように複数の
フィールド14をまとめてひとつのフィールドとしても
良い。
【0024】さらに、帳票13全体を一つのフィールド
として取り扱うようにしても良い。この場合には、フィ
ールド検出部12を省略することができる。次に、ステ
ップS3で文字切出し部15によりフィールド検出部1
2で検出したフィールド14内から一文字ごとのイメー
ジを切り出す。次に、ステップS4で第1の認識部16
により第1の辞書17を用いて対象となるフィールド1
4内の手書き文字の認識を行う。そして、ステップS5
で第1の認識部16により認識した結果とテンプレート
との距離を辞書登録部18に出力する。すなわち、認識
対象文字と第1の辞書17を照合し、テンプレートから
はみ出る部分の距離が最も小さい文字パターンを認識結
果として距離とともに出力する。
【0025】次に、ステップS6で1つのフィールド1
4内のすべての文字の認識が終了したか否かを判別し、
終了していない場合には、ステップS3に戻り、ステッ
プS3で次の文字を切り出し、終了した場合にはステッ
プS7に進む。ステップS7ではカテゴリ数iを設定
し、順次取り込む。カテゴリ数iとしては、例えば図5
に示すようにカテゴリが数字の場合には、1,2,3,
4,5,6,7,8,9,0がカテゴリ数iとなる。
【0026】次に、ステップS8ではフィールド内文字
数jを設定し、順次取り込む。フィールド内文字数jと
しては、例えば図5に示すように、フィールド14のブ
ロックが6個の場合には1,2,3,4,5,6がフィ
ールド内文字数jとなる。次に、ステップS9でカテゴ
リ数Ciと認識結果数Ajが一致するか判別する。カテ
ゴリ数Ciとしては、図5の場合を例にとると、C1
1、C2 は2、C3 は3、C4 は4、C5 は5、C6
6、C7 は7、C8 は8、C9 は9、C0 は0となる。
【0027】また、認識結果数Ajとしては、図5の場
合を例にとると、A1 は0、A2 は0、A3 は1、A4
は2、A5 は0、A6 は2となる。したがって、C0
1、C0 =A2 、C0 =A5 、C1 =A3 、C2 =A
4 、C2 =A6 のとき、Ci=Ajとなる。次に、ステ
ップS10でどのAjの距離がCiの中で最小であるか
否かを判別し、ステップS11でAiの距離が最小のも
のをmi とする。
【0028】A1 の距離はa1 、A2 の距離はa2 、A
5 の距離はa3 であり、a1 ,a2,a3 のうち、例え
ばa1 が最小であると判別された場合には、A1 をm1
とする。また、A4 の距離はc1 、A6 の距離はc2
あり、例えばc1 <c2 のときはA4 をm4 とする。ま
た、C1 は1個しかなく、A3 の距離はb1 であるの
で、A3 をm3 とする。
【0029】次に、ステップS12でフィールド14内
の典型的な文字の取出しが終了したら、ステップS13
でmi に対応するカテゴリを第2の辞書19に登録す
る。すなわち、距離a1 に対応する文字0、距離b1
対応する文字1、距離C1 に対応する文字2をそれぞれ
第2の辞書19の各カテゴリの部分に登録する。次に、
ステップS14で再度帳票13の入力を行い、フィール
ド14を検出し、一文字の切り出しを行う。
【0030】次に、ステップS15で再入力した文字と
第2の辞書19とを照合する。すなわち、再入力した文
字と第2の辞書19に登録された、第1の辞書17との
距離が最も小さい文字、すなわち、典型的な文字とを照
合する。そして、ステップS16で全てのフィールド1
4について第1の認識部16および第2の認識部20に
よる文字認識が終了したら、ステップS17で認識結果
を出力部21に与え、ステップS18で出力部21は認
識結果を表示または印刷する。
【0031】このように、手書き文字の詳細識別のため
の第2の辞書19を、フィールド14内の文字から第1
の辞書17との距離が最も小さい文字である典型的な文
字を取り出して生成するようにしたため、すなわち、フ
ィールド14ごとに典型的な文字が登録された第2の辞
書19を生成するようにしたため、文字を書いた人の癖
がそのまま第2の辞書19に反映されることになり、文
字を書く人の癖に左右されることなく、手書き文字を正
しく認識することができる。
【0032】また、フィールド14ごとに詳細識別用の
第2の辞書19を生成するため、例えば一枚の帳票13
上に異なるフィールド14を別の人が書いているような
場合でも対応することができる。なお、本実施例におい
ては、フィールド検出部12によって帳票13上の特定
の領域をフィールド14として検出するようにしたが、
帳票全体を一つのフィールドとみなすことによりフィー
ルド検出部12を省略しても良い。帳票全体の文字数が
少ない場合には、こうした方が能率的である。
【0033】
【発明の効果】以上説明してきたように、本発明によれ
ば、入力する文字のうち典型的な文字を取り出して第2
の辞書に登録し、入力する文字と登録した典型的な文字
とを照合して文字認識を行うようにしたため、文字を書
く人の癖に左右されず、手書き文字を正しく識別するこ
とができる。
【0034】また、フィールドごとに詳細識別用の第2
の辞書を生成するため、例えば一枚の帳票上で異なるフ
ィールドを別の人が書いているような場合でも、手書き
文字を正しく識別することができる。
【図面の簡単な説明】
【図1】本発明の原理説明図
【図2】本発明の一実施例を示すブロック図
【図3】帳票の例を示す図
【図4】フィールド、認識結果、距離の説明図
【図5】フィールド、認識結果、距離の他の説明図
【図6】動作を説明するフローチャート
【図7】従来例を示す図
【符号の説明】
11:入力部 12:フィールド検出部(フィールド検出手段) 13:帳票 14:フィールド 14A〜14Q:記入単位 15:文字切出し部 16:第1の認識部 17:第1の辞書 18:辞書登録部(辞書登録手段) 19:第2の辞書 20:第2の認識部(第2の認識手段) 21:出力部
フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06K 9/62 - 9/68 JICSTファイル(JOIS)

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】入力する文字を切り出して第1の辞書と照
    合して文字認識を行う第1の認識手段と、 前記第1の認識手段により同じカテゴリと認識された入
    力文字の中から、前記第1の辞書との距離が最も小さい
    文字を取り出して前記第1の辞書と同じものが登録され
    た第2の辞書の対応するカテゴリの部分に登録する辞書
    登録手段と、 前記入力する文字と前記辞書登録手段により文字が登録
    された第2の辞書とを照合し文字認識を行う第2の認識
    手段とを備えたことを特徴とする文字認識装置。
  2. 【請求項2】帳票上の特定の領域をフィールドとして検
    出するフィールド検出手段を設け、該フィールド検出手
    段により検出されたフィールド上の文字と前記第1の辞
    書とを照合して文字認識を行った後、前記第2の辞書に
    は前記フィールドごとに前記第1の辞書との距離が最も
    小さい文字を登録する手段とを有することを特徴とする
    請求項1記載の文字認識装置。
  3. 【請求項3】文字認識装置による文字認識方法であっ
    て、 入力する文字を切り出して第1の辞書と照合して文字認
    識を行う第1の認識ステップと、 前記第1の認識ステップにより同じカテゴリと認識され
    た入力文字の中から、前記第1の辞書との距離が最も小
    さい文字を取り出して前記第1の辞書と同じものが登録
    された第2の辞書の対応するカテゴリの部分に登録する
    辞書登録ステップと、 前記入力する文字と前記辞書登録ステップにより文字が
    登録された第2の辞書とを照合し文字認識を行う第2の
    認識ステップとを備えたことを特徴とする文字認識方
JP14424594A 1994-06-27 1994-06-27 文字認識装置 Expired - Lifetime JP3292595B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP14424594A JP3292595B2 (ja) 1994-06-27 1994-06-27 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14424594A JP3292595B2 (ja) 1994-06-27 1994-06-27 文字認識装置

Publications (2)

Publication Number Publication Date
JPH0816724A JPH0816724A (ja) 1996-01-19
JP3292595B2 true JP3292595B2 (ja) 2002-06-17

Family

ID=15357621

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14424594A Expired - Lifetime JP3292595B2 (ja) 1994-06-27 1994-06-27 文字認識装置

Country Status (1)

Country Link
JP (1) JP3292595B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU769771B2 (en) * 1999-12-02 2004-02-05 Hymo Corporation Polyacrylamide precast gels for electrophoresis, process for producing the same and electrophoresis method by using the gels

Also Published As

Publication number Publication date
JPH0816724A (ja) 1996-01-19

Similar Documents

Publication Publication Date Title
WO2020224131A1 (zh) 票据识别方法、装置、电子设备和计算机可读存储介质
JP3422924B2 (ja) 文字認識装置、文字認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3294995B2 (ja) 帳票読取装置
JPH0684006A (ja) オンライン手書き文字認識方法
JP3483919B2 (ja) 伝票文書情報システム
JP3292595B2 (ja) 文字認識装置
JP2008282094A (ja) 文字認識処理装置
JPH08221510A (ja) 帳票文書処理装置および帳票文書処理方法
JPH0689365A (ja) 文書画像処理装置
JP2001005804A (ja) 文字認識装置を利用したデータベース登録方法
JPH06103402A (ja) 名刺認識装置
JP3360030B2 (ja) 文字認識装置および文字認識方法および文字認識方法をプログラムの形で記録した記録媒体
JP2000090192A (ja) 住所および郵便番号の文字列修正方法
JP2575408B2 (ja) 郵便物の宛先住所読取装置
JP2922365B2 (ja) Ocr処理システムにおける漢字住所データ処理方法
JP4224914B2 (ja) 文字読取システム及び文字読取方法
JP3163859B2 (ja) 運転免許証認識装置及び運転免許証認識方法
JP3007697B2 (ja) 単語照合装置及び単語照合方法
JP2000172706A (ja) 文字列分類装置
JPH0546815A (ja) 光学式文字読取装置における住所単語照合方法
JPH0256086A (ja) 文字認識の後処理方法
JP2001312694A (ja) 多種類の帳票認識方法および装置
JP2570703B2 (ja) 文字読取装置
JP2005301477A (ja) 住所認識システム及び住所認識方法
JP3001618B2 (ja) 紙上の文字等の複写方法と記号の認識方法

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020226

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080329

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090329

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100329

Year of fee payment: 8

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100329

Year of fee payment: 8

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110329

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140329

Year of fee payment: 12

EXPY Cancellation because of completion of term