JPS6249581A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPS6249581A
JPS6249581A JP60190364A JP19036485A JPS6249581A JP S6249581 A JPS6249581 A JP S6249581A JP 60190364 A JP60190364 A JP 60190364A JP 19036485 A JP19036485 A JP 19036485A JP S6249581 A JPS6249581 A JP S6249581A
Authority
JP
Japan
Prior art keywords
pattern
dictionary
matching
characters
standard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60190364A
Other languages
English (en)
Inventor
Yoshihisa Tanabe
田辺 吉久
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP60190364A priority Critical patent/JPS6249581A/ja
Publication of JPS6249581A publication Critical patent/JPS6249581A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は文字認識装置に関するものである。
〔発明の技術的背景〕
光学的文字読取装置(OCR)等の文字認識装置におけ
る文字認識方式には各種のものがあり、近年その認識率
は飛躍的に向上し、占ぎ方に制限の少ない自由手書文字
の認識も可能になっている。
最も言過に行なわれている方式としては光゛層変換の後
に読み取りパターンを正規化し、その特徴を抽出した上
で標準辞書と比較し、その一致の程度をn次元空間にお
けるユークリッド距離として求めるものである。
すなわち、特徴点の標準辞書におけるベクトルを(a、
b、・・・nl)とし、読取りパターンの抽出された特
徴点を(a、b、・・・n2)と1れば、これら両ベク
トルのn次元空間における距離Xは として求められ、この距離Xが標準パターンとの整合度
を表わすことからある閾値を導入してこの閾値との比較
によりどの文字種(カテゴリー)に属するかを決定覆る
ようにしている。
(背景技術の問題点〕 しかしながら、このような従来の文字認識方法を用いる
文字認識装置では変形のためどのカテゴリーに属するか
がまぎられしいパターンや、標準パターンとして記憶さ
れていないパターンが入力されたときの認識精度が良好
でないという問題がある。これはある程度類似している
場合に類似するのか類似しないのかを判断するのは大変
困難なためである。
〔発明の目的〕
本発明はこのような問題を解決するためなされたもので
、標準パターンとして登録されていないパターンや変形
によってカテゴリーがはっきりしない文字パターンに対
しても確実に読み取りまたはりジエクトが可能な文字認
識装置を提供することを目的とする。
〔発明の概要〕
上記目的達成のため、本発明による文字認識装置におい
ては、通常の標準辞書の他に過去の読み取り結果にもと
づく類似性の傾向をベクトルとして有する第2の辞書を
準備し、標準辞書でリジェクトされたものについて再度
整合をとるようにしている。このため認識精度をさらに
向上させることができる。
〔発明の実施例〕
以下、図面を参照しながら本発明の一実施例を詳細に説
明する。
第1図は本発明にかかる文字認識装置の一実施例の構成
を示すブロック図である。
これによれば、この装置は帳票10上の文字記号等を光
電変換し、吊子化する光電変換部11、その出力を格納
するパターンメモリ12、このパターンメモリから読み
取りパターンを取出して大きざの一定化、ボカシ、細線
化等の前処理を行なうパターン正規化部13、その出力
にもとづいて読み取りパターンの特徴を抽出する特徴抽
出部14、ここで得られた特徴を標準辞書である辞書△
16に格納された標準パターンの特徴と整合をとる整合
部15、整合結果が予め定められた閾値と比較して大き
いか小さいかを判定する閾値処理部17、認識結果を出
力する出力部21を備えており、この部分は通常の文字
認識装置の構成と同様である。
本発明においては、閾値処理部17において文字認識が
不能でリジェクトされた場合に辞mB19に基づいて整
合をとる整合部18、閾値処理を行なう閾値処理部20
を設けている点が従来とは異なる。
ここで、辞12Bについて詳細に説明すると、この辞書
Bは過去に標準辞書を用いて得られた整合結果のデータ
からある文字種(カテゴリー)に対してどの文字種が類
似する傾向を示すかのデータを得、そのデータに基づい
て得た特徴ベクトルQを格納したものである。すなわち
、例えば数字の「3」として入力された文字パターンに
ついては標準辞書に従うと「5」、「8」などと類似度
が高いというデータが得られており、これらについては
類似度が高いほど近い距離を与えるようにしてベクトル
を構成する。
いま、文字種の数をm、特徴を表わすベクトルの数をn
とし、入カバターンの特徴ベクトルをr、辞書Bに格納
される特徴ベクトルをq、標準辞書λij をφ  とすれば、 λ1,1   λ1,2    λn、mQ−(S  
  、S    、・・・S   )として表わされる
。ここで λij−λij S   −3(f、φ  ) λij             λijであってS 
 は入カバターンfと辞書φ  との類似度を表わして
いる。
このような特徴ベクトルqは従来と同様にカルーネン・
レーベ(にarhunen−Loevc)変換により展
開され、辞IBに格納される。
次に、本発明の文字認識装置の動作を第2図のフローブ
ヤートを参照して説明する。
まず帳票10を読み込み光電変換部11で光電変換する
と共に岳子化し、得られたパターンをパターンメモリ1
2に格納する(ステップ101)。
次にこの読み取りパターンをパターン正規化部13によ
り正規化するパターン処理を行ない、さらに特徴抽出部
14により読み取りパターンの特徴を抽出する(ステッ
プ102)。この抽象された特徴に基づいて整合部15
は辞書A16内の標準パターンの特徴と比較し、その比
較結果を数値化する整合を行なう(ステップ103)。
次にこの整合結果に対し、予め定められた閾値を当ては
めて認識文字を決定する閾値処理を行なう(ステップ1
04)。ここで2!識が完了したかどうかが判断され(
ステップ105)、リジェクトされずに認識が完了した
ときは出力部21から結果が編集されて出力される(ス
テップ108)。一方、整合、閾値処理で特定の文字種
であると認識するに至らずリジェクトされたときは特徴
ベクトルqを含む辞17819の内容との整合が整合部
18で行なわれる(ステップ106)、この整合結果に
対しては通常と同様に閾値処理部20で閾値処理が行な
われて可能性の高い文字が決定され(ステップ107)
、出力部21から出力される。
このようにこの実施例では過去の認識結果にもとづく類
似傾向を認識不能文字にあてはめて整合をとるようにし
ているのでより精度の高い文字認識ができる。
以上の実施例においては辞書Bの内容は類似傾向が認め
られる文字種について類似度が高いほど近い距離を有す
るベクトルとして表現しているが、これに限ることなく
、文字コードを要素とし、過去の誤認の有無により1ま
たは0の距離を与えるようにしてもよく、さらに抽出さ
れる一つまたはそれ以上の特徴をベクトル要素の一つと
してもよい。
また、辞IBによる認識はもともとリジェクトされたも
のに適用しているので、これにより認識された文字につ
いては出力時に何らかの警告マークを付するようにして
もよい。
さらに辞1Bの適用によりどの文字であるかの可能性が
わかるため、B値処理時の得点が高くないものについて
は次候補データを併せて出力するようにしてもよい。
また、辞mBは過去のデータベースに基づいて作成され
るが、運用後の認識結果のデータを蓄積しておき、゛適
宜辞書Bの内容を更新することが可能である。
(発明の効果) 以上のように本発明によれば標準辞書によって読み取る
ことができなかった読み取りパターンに対して過去の読
み取りデータにもとづいて類似する文字の傾向をベクト
ル表現した第2の辞書を適用するようにしているので、
文字認識精度を向上させることができ、特に変形文字、
手出き文字に対しても良好な結果を得ることかできる。
【図面の簡単な説明】 第1図は本発明の文字認識装置の一実施例を示すブロッ
ク図、第2図はその動作を示すフローチャートである。 11・・・光電変換部、12・・・パターンメモリ、1
3・・・パターン正規化部、14・・・特徴抽出部、1
5.18・・・整合部、16・・・辞書A、17.20
・・・閾値処理部、19・・・辞IB、21・・・出力
部。

Claims (2)

    【特許請求の範囲】
  1. 1.帳票上の文字、記号等を読み取り、その読み取りパ
    ターンを標準辞書に基づいて認識する文字認識装置にお
    いて、 過去の読み取りデータにもとづいて類似する文字の傾向
    をベクトルとして表現した第2の辞書を備え、 前記標準辞書によって認識できなかった読み取りパター
    ンを前記第2の辞書にもとづいて認識するようにしたこ
    とを特徴とする文字認識装置。
  2. 2.第2の辞書がある文字種に対し、類似する順に距離
    を与えたベクトルデータにより構成されたものである特
    許請求の範囲第1項記載の文字認識装置。
JP60190364A 1985-08-29 1985-08-29 文字認識装置 Pending JPS6249581A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60190364A JPS6249581A (ja) 1985-08-29 1985-08-29 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60190364A JPS6249581A (ja) 1985-08-29 1985-08-29 文字認識装置

Publications (1)

Publication Number Publication Date
JPS6249581A true JPS6249581A (ja) 1987-03-04

Family

ID=16256953

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60190364A Pending JPS6249581A (ja) 1985-08-29 1985-08-29 文字認識装置

Country Status (1)

Country Link
JP (1) JPS6249581A (ja)

Similar Documents

Publication Publication Date Title
US4651289A (en) Pattern recognition apparatus and method for making same
US5287275A (en) Image recognition apparatus and method for recognizing a pattern within an image
JP2991473B2 (ja) 文字の認識方法及び音素の認識方法
US4491965A (en) Character recognition apparatus
JPS6249581A (ja) 文字認識装置
JPS56149676A (en) Pattern recognizer
KR19980058349A (ko) 영상정보를 이용한 사람 식별 방법
Amin Recognition of printed Arabic text using machine learning
Jeong et al. Hand-written digit recognition using Fourier descriptors and contour information
JPS5922178A (ja) 図形認識装置
JP2660998B2 (ja) 日本語処理装置
JPH051512B2 (ja)
JPS59106084A (ja) 文字読取り装置
JP2851865B2 (ja) 文字認識装置
JP3666909B2 (ja) 文字認識装置及び方法
JPS61221888A (ja) パタ−ン認識装置
JP2549831B2 (ja) 文字認識装置の入力パターン・文字列登録方法
JPS6095689A (ja) 光学的文字読取装置
JPS60138689A (ja) 文字認識方法
JP3281530B2 (ja) 文字認識装置
JPH0475556B2 (ja)
JPS62275300A (ja) 連続音声認識方法
JP3011984B2 (ja) パターン照合方法
JPH0654503B2 (ja) パタ−ン認識装置
JP3079202B2 (ja) 文字認識方法及び文字認識装置