JPH0734207B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0734207B2
JPH0734207B2 JP62332090A JP33209087A JPH0734207B2 JP H0734207 B2 JPH0734207 B2 JP H0734207B2 JP 62332090 A JP62332090 A JP 62332090A JP 33209087 A JP33209087 A JP 33209087A JP H0734207 B2 JPH0734207 B2 JP H0734207B2
Authority
JP
Japan
Prior art keywords
character
candidate
characters
dictionary
feature amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP62332090A
Other languages
English (en)
Other versions
JPH01173272A (ja
Inventor
一治 薄井
Original Assignee
松下電送株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 松下電送株式会社 filed Critical 松下電送株式会社
Priority to JP62332090A priority Critical patent/JPH0734207B2/ja
Publication of JPH01173272A publication Critical patent/JPH01173272A/ja
Publication of JPH0734207B2 publication Critical patent/JPH0734207B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、文字認識装置に関し、特に、入力文字パター
ンから抽出した特徴量と特徴量辞書との比較によって候
補文字を一つに絞り込むことが難しい漢字や手書き文字
の認識に好適な文字認識装置に関する。
従来の技術 一般に文字認識装置においては、入力文字パターンから
特徴量を抽出し、この特徴量と特徴量辞書との比較を行
って特徴量の距離が小さい候補文字を求める。しかし、
類似文字が多い漢字や、文字変形によって特徴量の変動
が大きな手書き文字などを認識対象とした場合、候補文
字を一つに絞り込むと認識率が低下してしまう。
そこで、漢字や手書き文字を認識する装置においては、
特徴量辞書との比較によって、特徴量の距離が小さい順
に順位をつけて複数の候補文字を求め、それをディスプ
レイに表示し、オペレータにより候補文字群から正しい
文字を選択させるなどの方法が採られている。しかし、
オペレータの介入が必要であるため、大量の文書の自動
入力という目的にはそぐわない。
このような候補文字群からの文字選択のためのオペレー
タの介入を排除するために、入力文字パターンの特徴量
と特徴量辞書との比較によって得た複数の候補文字の共
通パターン要素(部首など)を識別し、入力文字パター
ンから共通パターン要素を除いた部分パターンの認識を
行い、この認識結果に基づき候補文字群から一つの候補
文字を自動的に選択するという文字認識方法が考案され
ている(特開昭59−45587号)。
発明が解決しようとする問題点 しかし、上述の文字認識方法は、共通パターン要素の識
別、除去、部分パターンの認識といった面倒な処理が必
要となるため、文字認識装置の構成が著しく複雑化し、
また認識処理速度が低下するという問題があった。
本発明は、上述の問題点に鑑みてなされたもので、装置
構成をそれほど複雑化することなく、かつ認識処理速度
を低下させることなく、高い確度で候補文字の絞り込み
を自動的に行うことができる文字認識装置を提供するこ
とを目的とする。
問題点を解決するための手段 本発明は上述の問題点を解決するため、各文字毎にそれ
との特徴量の距離が小さい文字を登録したテーブルを設
けておき、入力文字パターンから抽出された特徴量と特
徴量辞書との比較により求められた候補文字群中の各候
補文字について、それに対応して前記テーブルに登録さ
れている文字と他の候補文字との一致数を調べ、この一
致数が最大の候補文字を第1順位の候補文字に決定する
という構成を備えたものである。
作用 本発明は上述の構成によって、特徴量辞書との比較によ
る場合に比べ相当に高い確度で第1順位の候補文字を自
動的に決定することができ、漢字や手書き文字などの認
識率の大幅な向上を達成できる。
発明者が行った実験によれば、100名の手書き文字のデ
ータベースを作成し、学習済みの手書き漢字および未学
習の手書き漢字の認識性能を評価したところ、特徴量辞
書との比較によって求められた第1順位の候補文字の正
解率はそれぞれ94.6%および91.2%であったが、テーブ
ルとの一致数により決定された第1順位の候補文字の正
解率はそれぞれ97.0%および95.1%と大幅に向上するこ
とが確認された。
また、テーブル照合手段は比較的簡単な構成とすること
ができ、またその処理の高速化は容易であるため、認識
処理速度の大幅の低下や装置構成の著しい複雑化を招く
おそれもない。
実施例 以下本発明の一実施例について、図面を参照しながら説
明する。
第1図は本発明の一実施例による文字認識装置の概略構
成を示す。1は文書などの原稿のイメージを読み取る原
稿読取り部、2は読み取られた原稿イメージから一つ一
つの文字パターンの切り出し、正規化などを行う前処理
部である。3は前処理部2から入力された文字パターン
の特徴量を抽出する特徴抽出部である。4は各種文字の
標準パターンの特徴量を登録した特徴量辞書であり、こ
れは実際的にはROMなどの記憶装置上におかれる。5は
入力文字パターンから抽出された特徴量と特徴量辞書4
との比較を行って、特徴量の距離が小さい複数の候補文
字を求める辞書照合部であり、6はその候補文字のコー
ドを一次的に保持するレジスタである。ここまでの構成
は、従来の文字認識装置と同様である。
7は文字間方向分布テーブルであり、実際的にはROMな
どの記憶装置上におかれる。この文字間方向分布テーブ
ル7には、各文字に対応させて、それと特徴空間上で近
い文字が最も近いものから順に最高7文字まで登録され
ている。すなわち、各文字毎に、それとの特徴量の距離
が小さい文字が最小距離のものから順に登録されてい
る。この文字間方向分布テーブルの内容を第1表に例示
する。
8はテーブル照合部であり、これはレジスタ6に設定さ
れた各候補文字と文字間方向分布テーブル7の内容とを
比較し、各候補文字について、それに対応して文字間方
向分布テーブル7に登録されている文字と他の候補文字
との一致数を計数し、一致数が最大の候補文字を第1順
位の候補文字に決定し、その文字コードを認識結果とし
て出力レジスタ9に設定する。10は前記各部の動作を制
御する制御部である。
以上のように構成された文字認識装置について、以下そ
の動作を説明する。制御部10の制御下で、原稿読取り部
1によって原稿のイメージが読み取られ、そのイメージ
から前処理部2によって文字パターンが切出され、その
正規化パターンが特徴抽出部3に入力される。特徴抽出
部3によって、この正規化された入力文字パターンの特
徴量が抽出されて辞書照合部5に入力される。辞書照合
部5により、入力文字パターンの特徴量と特徴量辞書4
との比較が行われ、距離が小さな候補文字が距離の小さ
いものから順位付けされて最高7文字まで抽出され、そ
れぞれの文字コードがレジスタ6に設定される。
辞書照合部5により一つの入力文字パターンの候補文字
が抽出されると、テーブル照合部8により、文字間方向
分布テーブル7との照合が行われ、候補文字群中の一つ
の候補文字が第1順位の候補文字に決定され、その文字
コードが出力レジスタ9に設定される。
例えば辞書照合部5によって、第2表のような順位で7
つの候補文字が抽出されたとする。
この場合、各候補文字に対応して文字間方向分布テーブ
ル7に登録された文字の中で、第1表中に下線を付けた
文字が他の候補文字と一致する。すなわち、候補文字
「私」に対応して登録された文字の中で「払」、
「弘」、「仏」、「拡」の4文字が他の候補文字と一致
し、その一致数は4となる。同様に、候補文字「弘」、
「仏」、「払」、「拡」、「扶」、「技」のそれぞれに
ついての一致数は3、3、6、1、2、0となる。した
がって、一致数が6の「払」が第1順位の候補文字に決
定され、その文字コードが出力レジスタ9に設定され
る。
第2図はテーブル照合部8の回路構成の一例を示すもの
で、11は制御判定回路、12は文字比較回路、13は一致数
カウンタ、14は最大値レジスタ、15は候補レジスタであ
る。動作は以下の通りである。
制御判定回路11は、制御部10より起動されると、一致数
カウンタ13および最大値レジスタ14をリセットした後、
レジスタ6内の第1順位の候補文字に対応して文字間方
向分布テーブル7に登録された最初の文字のコードを読
み出して文字比較回路12に入力する。次にレジスタ6内
の第2順位以下の各候補文字のコードを順番に文字比較
回路12に入力し、文字比較回路12によって文字コードの
比較を行わせ、文字比較回路12から一致信号が出力され
ると、一致数カウンタ13を+1する。
次に、第1順位の候補文字に対応して登録された次の文
字のコードを文字間方向テーブル7から読み出し、同様
にレジスタ6内の第1順位以外の候補文字のコードを順
次、文字比較回路12に入力して比較を行わせる。
このような比較を第1順位の候補文字に対応して文字間
方向分布テーブル7に登録された全文字について行う
と、一致数カウンタ13の値と最大値レジスタ14の値との
比較判定を行い、前者の値が後者の値より大きい場合に
は、一致数カウンタ13の値を最大値レジスタ14に設定
し、現在比較した候補文字のコードを候補レジスタ15に
設定する。最初に実行される第1順位の候補文字の比較
の場合、当然にその文字コードが候補レジスタ15に設定
される。
次に制御判定回路11は、一致数カウンタ13のリセット
後、レジスタ6内の第2順位の候補文字のコードに対応
して登録された文字のコードを文字間方向分布テーブル
7から順に読み出し、またレジスタ6内の第2順位の候
補文字以外の候補文字のコードを順に文字比較回路12に
入力して比較を行わせ、その一致数を一致数カウンタ13
に求める。そして、一致数カウンタ13の値と最大値レジ
スタ14の値との比較判定を行い、前者の値が後者の値よ
り大きい場合には、現在比較した第2順位の候補文字の
コードを候補レジスタ15に設定し、一致数レジスタ13の
値を最大値レジスタ14に設定する。
同様の動作がレジスタ6内の最後の候補文字まで行わ
れ、候補レジスタ15に一致数が最大の候補文字のコード
が得られ、これが第1順位の候補文字のコードとして出
力レジスタ9に設定され、制御判定回路11より制御部10
へ終了が通知される。
なお本実施例では、辞書照合部5により抽出される候補
文字数を7、文字間方向分布テーブル7に各文字対応に
登録される文字数を7としたが、各文字数は増減可能で
あり、その文字数を増やすことにより認識率をさらに改
善可能である。また、テーブル照合部8によって決定さ
れた第1順位の候補文字を認識結果として出力したが、
一致数の多い順に第2順位以下の候補文字についても順
位付けを行い、各候補文字をディスプレイに表示して必
要に応じてオペレータによる選択を可能とすることもで
きる。文字間方向分布テーブルを独立したテーブルとせ
ずに、例えば特徴量辞書4と一体化することも可能であ
る。
また、テーブル照合部8は第2図に示したような比較的
簡単なハードウエア回路として容易に実現可能である
が、マイクロプロセッサシステム上でソフトウエアによ
って実現することも容易である。ソフトウエアによって
実現した場合でも、処理は単純で短時間に実行可能であ
るから、認識処理の著しい速度低下を招くことはない。
発明の効果 以上の説明から明らかなように、本発明は、各文字毎に
特徴空間上で近い文字を登録したテーブルを設けてお
き、テーブル照合手段により、辞書照合手段により抽出
された各候補文字について、それに対応して前記テーブ
ルに登録されている文字と他の候補文字との一致数を調
べ、この一致数が最大の候補文字を第1順位の候補文字
に決定するため、オペレータの介入を排除し、また文字
認識装置の著しい複雑化や認識処理速度の低下を招くこ
となく、漢字や手書き文字の認識率を大幅に向上するこ
とができる、という効果を有するものである。
【図面の簡単な説明】
第1図は本発明の一実施例による文字認識装置の概略ブ
ロック図、第2図は同装置内のテーブル照合部の回路構
成の一例を示すブロック図である。 3……特徴抽出部、4……特徴量辞書、5……辞書照合
部、7……文字間方向分布テーブル、8……テーブル照
合部。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】入力文字パターンから抽出された特徴量と
    特徴量辞書との比較により複数の候補文字を求める辞書
    照合手段と、各文字毎にそれとの特徴量の距離が小さい
    文字を登録したテーブルと、前記辞書照合手段によって
    求められた各候補文字について、それに対応して前記テ
    ーブルに登録されている文字と他の候補文字との一致数
    を調べ、この一致数が最大の候補文字を第1順位の候補
    文字に決定するテーブル照合手段とを有することを特徴
    とする文字認識装置。
JP62332090A 1987-12-28 1987-12-28 文字認識装置 Expired - Lifetime JPH0734207B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62332090A JPH0734207B2 (ja) 1987-12-28 1987-12-28 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62332090A JPH0734207B2 (ja) 1987-12-28 1987-12-28 文字認識装置

Publications (2)

Publication Number Publication Date
JPH01173272A JPH01173272A (ja) 1989-07-07
JPH0734207B2 true JPH0734207B2 (ja) 1995-04-12

Family

ID=18251033

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62332090A Expired - Lifetime JPH0734207B2 (ja) 1987-12-28 1987-12-28 文字認識装置

Country Status (1)

Country Link
JP (1) JPH0734207B2 (ja)

Also Published As

Publication number Publication date
JPH01173272A (ja) 1989-07-07

Similar Documents

Publication Publication Date Title
KR100249055B1 (ko) 문자인식장치및방법
US5940532A (en) Apparatus for and method of recognizing hand-written characters
EP0239061B1 (en) Optical character reader apparatus and optical character reading method
JPH0734207B2 (ja) 文字認識装置
JP3940450B2 (ja) 文字読取装置
KR940007345B1 (ko) 온라인 한글 필기체 문자의 인식방법
JPS592191A (ja) 手書き日本語文の認識処理方式
JP3000349B2 (ja) キー入力編集方法及び編集装置
JP3361258B2 (ja) 文字読取装置
JP2697790B2 (ja) 文字タイプ決定方法
JP2677271B2 (ja) 文字認識装置
JP2003115028A (ja) 帳票識別辞書自動生成方法及び帳票処理システム
JP3037727B2 (ja) Ocrシステム
JPH0488490A (ja) 文字認識装置
JP2671984B2 (ja) 情報認識装置
JP2851865B2 (ja) 文字認識装置
JPS607586A (ja) 文字情報認識装置
JPH09179935A (ja) 文字認識装置およびその制御方法
JPH0366704B2 (ja)
JPH06131492A (ja) ナンバープレート認識方法
JPH06215197A (ja) 文字認識方法および装置
JP2000132635A (ja) 認識データ確認方法
JPH096920A (ja) 手書き文字認識方法及びその装置
JPS6160189A (ja) 光学的文字読取装置
JPH0355874B2 (ja)