JPS62166483A - 文字認識装置の認識文字選択方法 - Google Patents

文字認識装置の認識文字選択方法

Info

Publication number
JPS62166483A
JPS62166483A JP61009453A JP945386A JPS62166483A JP S62166483 A JPS62166483 A JP S62166483A JP 61009453 A JP61009453 A JP 61009453A JP 945386 A JP945386 A JP 945386A JP S62166483 A JPS62166483 A JP S62166483A
Authority
JP
Japan
Prior art keywords
character
distance
candidate
characters
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61009453A
Other languages
English (en)
Inventor
Masahiro Nakamura
昌弘 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP61009453A priority Critical patent/JPS62166483A/ja
Publication of JPS62166483A publication Critical patent/JPS62166483A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔技術分野〕 本発明は文字認識装置における認識文字選択方法に関す
る。
〔従来技術〕
文字認識装置においては、一般に入力文字パタ−ンの特
徴をとらえ、その特徴量とあらかじめ用意した辞書の特
徴量との演算結果(距離)の大小を比較して認識文字を
決定する。即ち、入力文字パターンの特徴量をPl(、
辞書(テンプレート)の特徴量をD Hとした時、距離
D = l D u  P Hlを求め、D < T 
II(T oはりジェクトのスレショート)となるテン
プレートを候補文字とし、その中で耐n(D)のものを
選択する。
この従来技術では、リジェクトスレショールドの設定が
リジェクト率及び誤読率に大きな影響を与えること\な
る。例えば、リジェクトスレショールドを小さくすると
、誤読率は低くなるがリジェクト率が高くなる。逆にリ
ジェクトスレショールドを大きくすると、リジェクト率
は下がるが、候補文字が増えるため、結果として誤読率
も増加する。光学文字読取袋W (OCR)などとして
は、誤読率の低い方が望ましいが、とはいってもリジェ
クト率が高すぎると実用にならず、リジェクトスレショ
ールドをどのように設定するかNが大きな問題となる。
〔目 的〕
本発明の目的は、OCR等の文字認識装置における文字
認識率の向上を図ることにある。
〔構 成〕
本発明は、算出された距離りについて、まず成る程度大
きい第1のリジェクトスレショールドTH0を設定して
リジェクト率を低くし、次にTI(1よりきびしい第2
のリジェクトスレショールドT H2を設定して誤読を
防ぎ、T H1とT H2の間の候補文字に対しては、
距離の最小のものを第1位D 1.次に小さいものを第
2位D2と定め、第1位と第2位の距離の差D2  D
+を第3のリジェクトスレショールドT H3と比較す
ることにより、全体として認識率の向−Lを実現するも
のである。以下、図面により本発明の一実施例について
説明する。
第1図は本発明で対象とする文字認識装置の一実施例の
ブロック図である。
第1図において、原稿等は光学的画像読取装置10で読
み取られて2値化され、原画像メモリ5=3− 0に格納される。処理装置(CPU)30は、メモリ5
0に格納された原入力文字パターンを読み出し、プログ
ラムメモリ(ROM)40の特徴抽出処理プログラム4
1の支援の下で入力文字の特徴を抽出し、その特徴量P
Hをデータメモリ(RAM)60の特徴量格納領域61
に格納する。特徴量PHの求め方には既に種々の方法が
あり、また、これは本発明の要旨とするところでないの
で、これ以上の説明は省略する。データメモリ60のリ
ジェクトスレショールド格納領域62,63゜64には
、それぞれリジエクトスレショールドTHs 、 T 
H2−T H3がキーボード20より入力されて格納さ
れている。二〜で、T’ HsとT H2の間にはT 
H1> T H2の関係があるとする。TH3はT H
8,T H2とは独立に設定する。
さて、処理装[20はプログラムメモリ40の認識処理
プログラム42の支援の下で、データメモリの領域61
に格納された入力文字パターンの特徴量PHと辞書メモ
リ70にあらかじめ用意された辞書(テンプレート)の
特徴量DHとの距離Dを順に求め、その大小を比較して
認識文字を決定する。本発明はこの認識処理に特徴を有
するものであり、以下、これについて詳述する。
第2図は本発明による認識文字選択の処理フローの一実
施例を示す。まず、入力文字パターンの特徴量PHと辞
書の特徴量DHとの距離D=lD□−PH1を順に算出
する(ステップ101)。
次に、この距離りとある程度大きい値をもつ第1のリジ
ェクトスレショールドT HIを比較しくステップ10
2)、THI≧Dなる文字を第1の候補文字群とする。
T H1< Dである文字は、この時点でリジェクトす
る(ステップ107)。
次に、第1の候補文字群について、それらの距離りをT
 H1よりきびしい第2のリジェクトスレショールドT
H2(即ち、T H2< T H□)と比較する(ステ
ップ103)。そして、TH2≧Dなる文字を第2の候
補文字群とし、この第2の候補文字群の中で最小距離の
ものを認識文字として選択する(ステップ108)。第
2の候補文字群が存在しない時、即ち、第1の候補文字
群が全てT H2< Dである時、第1の候補文字群中
の距離の小さい方から2文字を第1位候補、第2位候補
として選択する(ステップ104)。こ2で、第1位候
補文字の距離をり1、第2位候補文字の距離をD2とす
る。次に、この選択した第1位候補文字と第2位候補文
字の距離の差D2  D+について第3のリジェクトス
レショールドTH,と比較する(ステップ105)。こ
の時、D2  DI≧1゛H3であれば、距離D1の第
1位候補文字を認識文字として選択しくステップ108
)、D2D r < T H3であれば、当該入力文字
パターンは認識不能としてリジェクトする(ステップ1
゜6)。
このように、THl、TH2、THaの3段のりジエク
トスレショールドによる候補文字選択により、ある程度
大きいスレショートT T(lによりリジェクト率を低
くおさえながら、T H1に比べてきびしいスレショー
トT H2により誤読を防ぐと\もに、その中間の曖昧
な候補文字群のものに対しては、第1位と第2位の候補
文字の距離の差をみることにより、リジェクト率を低く
することが可能になる。
第3図は本発明による認識文字選択の他の実施例の処理
フローを示したものである。第2図と異なる点は、D 
2  D l<T I(3の時、別の特徴抽出等の特殊
処理を施こし、それについて認識処理を行って認識文字
を選択するようにしたことであり、これにより認識率が
さらに向上する。
〔効 果〕
以上の説明から明らかな如く、本発明によれば、3段の
りジエクトスレショールドによる候補文字選択により、
リジェクト率および誤読率をともに低くおさえることが
でき、全体として認識率の向上が期待される。
【図面の簡単な説明】
第1図は本発明で対象とする文字認識装置の一実施例の
ブロック図、第2図及び第3図は本発明による候補文字
選択の処理フロー図である。 10・・・光学的画像読取装置、 20・・・キーボード、 30・・処理装置、40・・
プログラムメモリ、 41・・・認識処理プログラム、
 50・・・原画像メモリ、60・・・データメモリ、
 61・・・特徴量格納領域、62.63.64・・・
リジエクトスレショールド格納領域、 70・・・辞書
メモリ。 第U図

Claims (3)

    【特許請求の範囲】
  1. (1)入力文字の特徴を抽出し、その特徴量とあらかじ
    め用意した辞書の特徴量を比較演算し、その距離Dの大
    小により入力文字を認識する文字認識装置において、 イ、前記距離Dを第1のリジェクトスレショールドTH
    _1と比較し、少なくともTH_1<Dである文字はリ
    ジェクトし、残りの文字を第1の候補文字群とすること
    、 ロ、前記第1の候補文字群について、その距離Dを前記
    TH_1より小さい第2のリジェクトスレショールドT
    H_2と比較し、少なくともTH_2>Dである文字を
    第2の候補文字群とし、その中で最小距離のものを最終
    認識文字として選択すること、ハ、前記第2の候補文字
    群が存在しない時、前記第1の候補文字群の中から距離
    の小さい順に第1位と第2位の候補文字を選び、それら
    の距離D_1、D_2の差D_2−D_1を第3のリジ
    ェクトスレショールドTH_3と比較し、少なくともD
    _2−D_1>TH_3であれば、前記第1の候補文字
    を最終認識文字として選択すること、 を特徴とする文字認識装置の認識文字選択方法。
  2. (2)前記第3のリジェクトスレショールドと比較し、
    D_2−D_1<TH_3である時、当該入力文字を認
    識不可能とすることを特徴する特許請求の範囲第1項記
    載の文字認識装置の認識文字選択方法。
  3. (3)前記第3のリジェクトスレショールドと比較し、
    D_2−D_1<TH_3である時、他の処理による文
    字認識を試みることを特徴とする特許請求の範囲第1項
    記載の文字認識装置の認識文字選択方法。
JP61009453A 1986-01-20 1986-01-20 文字認識装置の認識文字選択方法 Pending JPS62166483A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61009453A JPS62166483A (ja) 1986-01-20 1986-01-20 文字認識装置の認識文字選択方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61009453A JPS62166483A (ja) 1986-01-20 1986-01-20 文字認識装置の認識文字選択方法

Publications (1)

Publication Number Publication Date
JPS62166483A true JPS62166483A (ja) 1987-07-22

Family

ID=11720708

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61009453A Pending JPS62166483A (ja) 1986-01-20 1986-01-20 文字認識装置の認識文字選択方法

Country Status (1)

Country Link
JP (1) JPS62166483A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0373084A (ja) * 1989-04-28 1991-03-28 Hitachi Ltd 文字認識方法及びその装置
JP2014115781A (ja) * 2012-12-07 2014-06-26 Hitachi Information & Telecommunication Engineering Ltd 文字認識装置及び方法、文字認識プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0373084A (ja) * 1989-04-28 1991-03-28 Hitachi Ltd 文字認識方法及びその装置
JP2014115781A (ja) * 2012-12-07 2014-06-26 Hitachi Information & Telecommunication Engineering Ltd 文字認識装置及び方法、文字認識プログラム

Similar Documents

Publication Publication Date Title
US4989258A (en) Character recognition apparatus
US8761514B2 (en) Character recognition apparatus and method based on character orientation
CN102982349B (zh) 一种图像识别方法及装置
US10438083B1 (en) Method and system for processing candidate strings generated by an optical character recognition process
JPH1139493A (ja) 距離及び方向に鑑みたパターン整合装置及びその方法
CN111797685B (zh) 表格结构的识别方法及装置
JPS62166483A (ja) 文字認識装置の認識文字選択方法
Saiga et al. An OCR system for business cards
JP3344062B2 (ja) カタカナ手書き文字切り出し回路
JPS59158482A (ja) 文字認識装置
JPH03126188A (ja) 文字認識装置
JPS629958B2 (ja)
JP3466903B2 (ja) 文字認識用マルチテンプレート辞書作成方法
JP2973898B2 (ja) 文字認識方法及び装置
JPH09330378A (ja) パターン辞書比較方法
CN114385893A (zh) 一种基于节点提取的网页类别判定方法、装置及终端设备
JPS63269267A (ja) 文字認識方法
JPS6089289A (ja) 文字認識方式
JPH04260980A (ja) 図形認識装置
Gao et al. Character recognition in low quality document images using local and global features
CN116110077A (zh) 遮挡条件下基于块划分姿态辅助对齐的行人重识别方法
KR19990011492A (ko) 단어의 음소 구조에 따른 단어 그룹 형성 방법
JPS6410875B2 (ja)
JPH0330100A (ja) ナンバープレートの車種コード認識方法
JPS6252912B2 (ja)