JPS6222187A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPS6222187A
JPS6222187A JP60160451A JP16045185A JPS6222187A JP S6222187 A JPS6222187 A JP S6222187A JP 60160451 A JP60160451 A JP 60160451A JP 16045185 A JP16045185 A JP 16045185A JP S6222187 A JPS6222187 A JP S6222187A
Authority
JP
Japan
Prior art keywords
character
dictionary
input
feature vector
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60160451A
Other languages
English (en)
Inventor
Koichi Ejiri
公一 江尻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP60160451A priority Critical patent/JPS6222187A/ja
Publication of JPS6222187A publication Critical patent/JPS6222187A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔技術分野〕 本発明は、文字認識装置に関する。
〔従来技術〕
一般に1文字認識装置においては1文字読取部で文字パ
ターンを読み取り、その入力文字パターンの特徴ベクト
ルを特徴抽出部で抽出し、その特徴ベクトルと辞書に登
録されている文字の特徴ベクトルとの距離演算を辞書検
索部で実行し、最小距離の文字を検索している。認識可
能な文字は。
辞書に登録されている文字に限られる。
ところで、日常的に使用される漢字は500字程度とい
われているが9人名や地名、専門用語などで特殊な文字
を使うことがあり、しかも、そのような文字の使用頻度
は使用者によって大幅に異なるため、従来は、かなり多
くの特殊な文字も辞書に登録せざるを得す、辞書の容量
増大を招き。
不経済であった。また、登録文字の増大に伴い類似文字
も多くなるため、正続率が低下する可能性もある。
そこで、使用頻度の高い文字を登録した辞書を用意して
おき、使用者側で必要な時に文字を辞書に追加登録する
ようにした文字認識装置もある。
その装置では、追加登録しようとする文字のパターンを
入力して特徴ベクトルを抽出させ、キーボードより、そ
の入力文字の文字コードを入力し。
特徴ベクトルと文字コードとを辞書に追加登録するよう
になっている。しかし、このように文字の追加登録の際
に1文字コード(JISコード)を捜してキー人力する
ことは手間がかかり、一般の使用者にとって煩わしい作
業であった。
【目 的〕
本発明の目的は、辞書の容量削減を図るとともに、面倒
な作業を行うことなく、辞書に予め登録されていない文
字の認識を可能にした文字認識装置を提供することにあ
る。
〔構 成〕
本発明によれば1文字入力部により文字のパターンが読
み取られて特徴抽出部へ入力され、そこで入力文字の特
徴ベクトルが抽出されて辞書検索部へ入力され、この辞
書検索部により入力文字の特徴ベクトルと辞書に登録さ
れている文字の特徴ベクトルとの距離演算が行われて入
力文字が認識される文字認識装置において、少なくとも
辞書に登録されていない文字のパターンを発生するため
の文字発生装置が備えられ、辞書を用いて認識できない
文字が入力された場合1文字発生装置により文字のパタ
ーンが特徴ベクトル抽出部に入力されその特徴ベクトル
が抽出されて辞書検索部に入力され、辞書検索部におい
て、文字発生装置により発、生された文字の特徴ベクト
ルと入力文字の特徴ベクトルとの距離演算が行われ、文
字発生装置により発生された文字の中の入力文字との距
離が最小の文字が認識結果とされるものである。
〔実施例〕
以下1図面を参照し本発明の実施例について説明する。
第1図は、本発明による文字認識装置の概略ブロック図
である。この図において、1は文字読取部であり、入力
帳票から文字パターンを順次読み取り、その文字パター
ンデータを特徴抽出部2に出力する。この特徴抽出部2
において、入力文字のパターンの特徴が抽出され、その
特徴ベクトルViを辞書検索部3へ出力する。
辞書検索部3は、特徴抽出部2より入力された特徴ベク
トルViを内部のレジスタメモリ13に保持し、辞書4
より登録された文字の特徴ベクトルVoと文字コードJ
iを1文字ずつ読み込んで内部のレジスタメモリ13に
保持し、2つの特徴ベクトルVoとViの距離Diを計
算し、その距離Diをレジスタメモリ131;文字コー
ドJiと対にして保持する。他の文字の特徴ベクトルに
ついても辞書4から順次読み込んで入力文字の特徴ベク
トルとの距離計算を行い、求めた距離をレジスタメモリ
13に保持する。このような距離計算を順次実行するが
、レジスタメモリ13に保持されている距離の比較を行
い、最小の距離とその文字コードとをレジスタメモリ1
3に残し、他の距離および文字コードはレジスタメモリ
13から順次排除する。このようにして、レジスタメモ
リ13に残された最小距離が、予め設定された閾値より
小さければ、その文字コードを認識結果として入出力制
御部5を介し表示装置6へ出力し表示させる。
さて、辞書4には使用頻度の高い比較的限られた数の文
字の特徴ベクトルだけが登録されているため、そこに登
録されていない文字が文字読取部lによって読み取られ
た場合には認識できない。
つまり、その場合はレジスタメモリ13に最後に残る最
小距離が、予め定められた閾値より大きくなる。この場
合、辞書検索部3は辞書4に登録されていない文字が入
力されたと判定し、文字発生装置i!8を利用した文字
認識処理に移行する。その処理を第2図に示すブローチ
ヤードに沿って説明する。
辞書検索部3は1文字発生装置8から1つの文字iのパ
ターンを特徴抽出部2に入力させる(ステップ20)。
このパターンの特徴ベクトルViが抽出され、これがレ
ジスタメモリ13に保持される(ステップ25)、辞書
検索部3は、入力文字の特徴ベクトルvOと文字発生装
置8から入力された文字の特徴ベクトルvlとの距離を
計算しくステップ30)、その距離とレジスタメモリ1
3に既に保持されている他の文字の距離とを比較し、最
小の距離Diと文字コードJiをレジスタメモリ13に
残す(ステップ35)、残りの文字が存在するか判定し
くステップ40)、残っている文字が存在するならばス
テップ20に戻る。
文字発生装置8によってすべての文字のパターンが入力
され、その認識処理が実行されたならば。
レジスタメモリ13に残された最小の距離Diの文字i
のコードJiを入出制御部5を介して表示装置6に送り
、対応する文字を表示させ(ステップ45)、その文字
コードJiと特徴ベクトルViを辞書4に追加登録する
(ステップ50)。
このようにして辞書4に予め登録されていない文字も認
識することができる。つまり、辞書4には使用頻度の高
い文字だけを登録しておけばよく。
辞書4の容量を大幅に削減できる。また1文字発生装置
で発生した文字パターンを用いて認識した文字について
は、その特徴ベクトルが辞書4に追加登録されるため、
一種の学曹がなされ、一旦学習された文字については、
辞書4は予め登録されていた文字と同じように扱われる
ため、その認識時間は短縮する。そして、辞書への追加
登録は自動的になされ、従来のようにオペレータが文字
コードを捜してキー人力するというような煩わしさはな
い。
なお、辞書4がROMの場合、あるいは辞書4の容量が
小さい場合は、別にメモリを設け、そのメモリに文字の
追加登録を行うようにしてもよい。
なお、以上の説明においては1文字発生装置を利用した
認識処理において、最小距離となった文字だけを出力す
るようにしていたが、複数の候補文字を出力つまり表示
させると同時に1文字読取部によって読み取られた文字
パターンも表示させ。
キー −ドアから入力文字に対応する候補文字を指定し
、それを辞書4に追加登録させるようにしてもよい。
さて、前記実施例においては、辞書に登録されていない
文字が入力された場合に1文字発生装置からすべての文
字のパターンを特徴抽出部に順次入力させていた。しか
し、辞書に追加登録済みの文字については、改めて文字
発生装置で発生させることは無駄である。そのような無
駄を防ぐための変形例を、フローチャートとして第3図
に示す。
この図において、ステップ20からステップ50までは
前記実施例と同様であるが、新しいステップ55が追加
されている。
この変形例においては、文字発生装置内部に各文字毎に
、そのパターンの発生を抑止させるためのフラグが用意
されている。ステップ55において、文字iのパターン
発生抑止フラグをセットすることにより、その後のその
文字のパターン発生を抑止する。
なお、辞書にも登録されていす、また文字発生装置にも
登録されていない文字1例えば特定の用途に用いられる
ような変形文字が入力される場合も考えられる。このよ
うな変形文字が入力された場合、前記実施例においては
、最小距離が予め定められた閾値より大きくなるため、
リジェクトされることになるが、その時に、候補文字を
すべてキャンセルして、辞書ならびに文字発生装置に登
録されている文字のコード体系とは別の新しいコードを
予め定義しておき、その1つのコードをキー −ドから
入力し、そのコードと入力文字の特徴ベクトルとを辞書
に追加登録する。このようにすれば、変形文字の認識も
可能となる。
〔効 果〕
以上説明したように、本発明によれば、辞書容量を大幅
に削減し、かつ文字コードを捜してキー人力するという
ような面倒な作業を行うことなく。
辞書に登録されていない文字の認識も可能となるなどの
効果が得られる。
【図面の簡単な説明】
第1図は本発明による文字認識装置の概略ブロック図、
第2図は同文字認識装置における未登録文字の認識処理
のフローチャート、第3図は変形例を説明するためのフ
ローチャートである。 1・・・文字読取部、 2・・・特徴抽出部。 3・・・辞書検索部、 4・・・辞書、8・・・文字発
生装置。

Claims (3)

    【特許請求の範囲】
  1. (1)文字入力部により文字のパターンが読み取られて
    特徴抽出部へ入力され、そこで入力文字の特徴ベクトル
    が抽出されて辞書検索部へ入力され、この辞書検索部に
    より入力文字の特徴ベクトルと辞書に登録されている文
    字の特徴ベクトルとの距離演算が行われて入力文字が認
    識される文字認識装置において、少なくとも辞書に登録
    されていない文字のパターンを発生するための文字発生
    装置が備えられ、辞書を用いて認識できない文字が入力
    された場合、文字発生装置により文字のパターンが特徴
    ベクトル抽出部に入力されその特徴ベクトルが抽出され
    て辞書検索部に入力され、辞書検索部において、文字発
    生装置により発生された文字の特徴ベクトルと入力文字
    の特徴ベクトルとの距離演算が行われ、文字発生装置に
    より発生された文字の中の入力文字との距離が最小の文
    字が認識結果とされることを特徴とする文字認識装置。
  2. (2)文字発生装置により文字のパターンを発生して入
    力文字が認識された場合、その文字の特徴ベクトルと文
    字コードが辞書に追加登録されることを特徴とする特許
    請求の範囲第1項記載の文字認識装置。
  3. (3)文字発生装置のパターン発生可能な文字の中で特
    徴ベクトルが辞書に追加登録された文字はパターンの発
    生を抑止されることを特徴とする特許請求の範囲第2項
    記載の文字認識装置。
JP60160451A 1985-07-20 1985-07-20 文字認識装置 Pending JPS6222187A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60160451A JPS6222187A (ja) 1985-07-20 1985-07-20 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60160451A JPS6222187A (ja) 1985-07-20 1985-07-20 文字認識装置

Publications (1)

Publication Number Publication Date
JPS6222187A true JPS6222187A (ja) 1987-01-30

Family

ID=15715216

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60160451A Pending JPS6222187A (ja) 1985-07-20 1985-07-20 文字認識装置

Country Status (1)

Country Link
JP (1) JPS6222187A (ja)

Similar Documents

Publication Publication Date Title
WO1995027954A1 (en) Pattern recognition method and system
JPH05135207A (ja) 文字認識方法及び装置
JPS6222187A (ja) 文字認識装置
KR100248601B1 (ko) 온라인 문자 인식 방법 및 장치
JP4718699B2 (ja) 文字認識装置、文字認識方法、プログラム、およびコンピュータ読み取り可能な記録媒体
JPS60147868A (ja) 辞書作成装置
JP3233803B2 (ja) 難読漢字検索装置
JPH09288717A (ja) 文字認識装置
JPS6224382A (ja) 手書き文字の認識方法
JP2851865B2 (ja) 文字認識装置
JP2922900B2 (ja) 手書き文字認識装置
JP2827066B2 (ja) 数字列混在文書の文字認識の後処理方法
JPH04115383A (ja) オンライン手書き文字認識装置の文字認識方式
JPS6059487A (ja) 手書文字認識装置
JP2905334B2 (ja) オンライン手書き文字認識用辞書作成方法およびオンライン手書き文字認識用辞書作成装置
JPS55138180A (en) Real-time character recognition unit with additional registering function
JPH0934999A (ja) 文字処理装置
JP2639314B2 (ja) 文字認識方式
JPS60207983A (ja) 文字認識用辞書作成方式
JPS6246390A (ja) オンライン手書き文字認識方法
JPS62236088A (ja) 濁点・半濁点つき文字の認識装置
JPH07192018A (ja) 外国人名検索装置
JPS63157291A (ja) 定型文書の文字認識方法
JPH01125683A (ja) 文字認識装置
JPH035877A (ja) データ操作方式