JPS6089290A - パタ−ン認識方法 - Google Patents

パタ−ン認識方法

Info

Publication number
JPS6089290A
JPS6089290A JP58195890A JP19589083A JPS6089290A JP S6089290 A JPS6089290 A JP S6089290A JP 58195890 A JP58195890 A JP 58195890A JP 19589083 A JP19589083 A JP 19589083A JP S6089290 A JPS6089290 A JP S6089290A
Authority
JP
Japan
Prior art keywords
pattern
distance
threshold
candidate
patterns
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58195890A
Other languages
English (en)
Inventor
Masahiro Nakamura
昌弘 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP58195890A priority Critical patent/JPS6089290A/ja
Publication of JPS6089290A publication Critical patent/JPS6089290A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 ■技術分野 本発明は、OCR(光学文字認識)等、任意のパターン
データを読取ってそれがどのようなパターンであるのか
を認識するパターン認識に関し、特に、バ忍識候補パタ
ーンの選択に関する。
■従来技術 一般に文字H,′r3識装置においては、パターンデー
タを読取り、そのデータから各々のパターンすなわち文
字を切り出し、その文字データの特徴を抽出し、抽出し
た特徴パラメータを、人里の文字パターンの各々の標準
的な特徴パラメータを格納した辞書メモリの内容と比較
して、認識すべきパターンの特徴パラメータとの距離が
所定のし7さい値以下となった文字を候補として選択す
る。
ところで、認識対象となる文字の種類が非フ;(′に多
くなり辞書が大規模になったり、手i++’ ;!!文
字を認識するような場合、相互に類似性の高い文字を誤
認識する確率が高くなる。このような11(合に誤認識
を少なくする1つの方法として、しきい値を小さく設定
することが考えられる。しか(、これを行なうと、例え
ば手書き文字の形が乱1+、ている場合には、認識すべ
きパターンの特徴とlj iF中の所定パターンの特徴
との距離がしきい値以」−に大きくなって認識不可能に
なる可能性が高くなり、誤認識が減るかわりに認識率も
低くなる1、またこれを行なっても、もともと距離の小
さい4仰1文字が存在するパターンについては、誤認識
1.1防市し得ない。
そこで、認識のしきい値は比較的大きく設定しておき、
比較の結果特徴パラメータの距創がしきい値より小さい
文字が現われたら、それを全て候補文字とし、候補文字
が複数ならそれを表示しC最終的な判定はオペレータに
まかせるようにした装置が提案されている。しかしなが
ら、これだと候補文字の数が多い場合などはオペレータ
の負担が非常に大きく、また人間が介在する割合が大き
いため全体の認識処理速度が遅くなるという不都合があ
る。
■目的 本発明は、認識率を下げることなく誤認識を少なくし、
しかもオペレータの負担を小さくして認識処理速度を上
げることを目的とする。
■構成 特徴パラメータ判別のしきい値Tl41を比較的大きく
設定して候補パターンが複数項われる場合の、各々の候
補パターンの特徴と認識すべきパターンの特徴との距I
Wltは、互いに大きく異なる場合もあるし、互いにあ
まり差がない場合もある。互いの差が小さい場合には最
も差が小さいものを最終候補にすると誤認識が生ずる危
険が大きい。したがって、従来のように単に判別のしき
い値を小さくするのでは好ましい結果は得られないこと
になる。そこで、複数の候補が現われたI)、例えば最
も距l11iの近いものの距離D min を基IIす
して、Dmin+αというように、Dmjnがら所′)
jlの範囲内のものを選択するように第2のしきいIf
f Tl−12を設け(但し、TH2<THIとする)
AI、ば、誤認識を生ずる危険を伴なうことなく候補パ
ターンの数を絞ることができる。
以下、図面を参照して本発明の実施例!・説明する。
第1図に、本発明を実施しうる一形式の文字認識装置の
システム構成を示す。第1図を劣照して概略動作を説明
する。原稿上のパターンイφは)■電変換部を備える読
取走査ユニットで読取rH,れ、微小画素毎の白黒に対
応する2値電気信号1−変換される。前処理部では、そ
の2値電気fdすずなゎち画素データを処理してパター
ン単位にデータを分111(文字切り出し)したり、ス
ムージング等の処理を行なう。
その結果得られるパターン単位の画素データは特徴抽出
部に転送される。特徴抽出部では、文字を認識するのに
必要な特徴パラメータを抽出するために、例えば、各パ
ターンの軸郭に沿って所定画素で構成されるマトリクス
上の画素データを読んでその71−リクスパターンがど
のグループに属するかを順次調べる、等の処理を行なう
検索部では、特徴抽出部で得られた特徴パラメータを、
辞書記憶部のデータと比較し、辞書内のパターンから相
互の特徴パラメータの差が小さいものを候補として選択
し、その結果を候補文字i10憶部に出力する。このと
き候補文字を選択するために1つのしきい値(TRI)
を設定しである。つまり、識別ずべきパターンの特徴パ
ラメータとの距IIIがそのしきい値1’l[l以下の
ものは全て候補パターンとして選択される。制御部は、
最終的な候補文字の判別を行なったり、必要に応じ°C
入力部からのキー人力を受け41けたり、前処理部から
出力されるパターンデータを直接、表示部(例えばブラ
ウン管表示装置)に出力したり、出力部(例えばプリン
タ)に出力したりする。
第2図に、本発明による候補パターン選択手順の−例を
示す。第2図を参照しなからJ、8識方法?・説明する
。1文字分のパターンデータが到来すると、それの特徴
パラメータとの距nDが所定の(。
きい値THI以下のものを辞書メモリから検索して、そ
の結果を全て候補文字とする。ここで候補に上がった文
字が1文字のみであれば2.−れを刺子的な候補文字す
なわち認識結果とする1、もしイeζ補文字が何もなけ
れば、識別不可能であるから、表示装置に″識別不可能
″と表示して、オペレータからの入力を待つ。この場合
、表示装置に表示されるパターンの文字をオペレータが
識別し2”Cその文字に対応するコードをキー人力する
こと番コより、その文字が認識結果になる。
候補文字数が2以上である場合、まず、fれらの候補の
中で最も認識すべきパターンの特徴パラメータとの距I
l#Dが小さいものDmin を児11′)る。
そして、各々の候補文字について距離+ノr;:第2の
しきい値レベルTH2と比較し、距*Ie 1.) /
ノτ°1°H2以下のものを候補として残し、他のもの
書、1排除する。つまり、例えば第3図に示すように、
しきい値THIを参照して辞書を検索した結果、■、2
゜3.4,5,6,7,8,9および10(候補に上が
った順番)と10個の文字が候補に上がった場合、第9
番目の候補文字の距離りがDmiγ1であるから、その
D minにΔTHを加えたレベルを第2のしさいイ直
レベルTH2にする。つまり、C2識すべきパターンの
特徴と最も近い特徴を有する文字の距離を基準にして、
それよりΔTH上のレベルまでの間に存在する候補文字
のみを選択する。
したがって、候補に上がった文字の中で一方の距離!〕
が非フ;(に小さくもう一方の距11!ff1DがTi
11に近いレベルであるような場合には、そのうちの距
離が近いもののみが次の候補になり、距離の1ffft
、Itているものは除去される。第3図においては、1
0個の第1回候補文字について、第2のしきい値1’ 
H2で比較を行なうと、第2番目の候補文字ど第9番目
の候補文字との2つが選択され、これらが第2回目の候
補文字になる。
この処理を行なった結果、もし候補文字が1つに絞られ
るとそれをIrk#候補とし、ここでも2以上であれば
、更に次の処理を行なう。
通常の文書であれば、連続する文字の種類は互1)に関
係する。つまり、例えば英単語で;Ji)、lt、げ英
慎字が所定数連続してからスペース、カンマ、ピリオド
等が現われて、その後更に英単語あるいは記号の集りが
呪わ]しる。したがって、この実施例では、現在認識中
のパターンの候補に上が、)だ文字の種別と前回すなわ
ち1文字前に現ね11. j、パターンの種別とを参照
することにより第31iiI Itの選別を行なう。ま
ず、次の第1表に示すよう/I・関係で各々の候補文字
に対するパラメータωをめる。
第 1 表 但し、SPはスペース、CRはキャリッジリターン第1
表よりめられるパラメータωをそれ(、lシの候補文字
の距11tDに乗算し、ωDをめる。各々の候補につい
てωDを第3のしきい値T H3と比較し、ωD≦Tl
l3を満足するもののみを残す。
この処理は、異文字種間の類似文字、例えば英文字のO
(オー)と数字の0 (ゼロ)、英文字のBと数字の8
.英文字の■ (アイ)と数字の1 (イチ)等の識別
に刺して効果が大きい。したがって、例えばGOOD″
という単語を読取る場合に、まず第1tf目のGti−
i2識し°C第2番目のOをa2識する段階で、第3図
のように候補2(例えば英文字のO)と候補9(例えば
数字の0)の2つが現われたとすると、前の文字(G)
の種別が英文字であり、前記第1表を参照すると候補2
に対するωはrl」5候補9に対するO)はr5Jであ
るから、両者のO)■)の値は大きく差が旬くことにな
る。第3のしきい値T It 3の設定が適当であれば
、この場合候補2すなわち英文字のOが識別されること
になる。
もしこのような処理を行なっても更に2以」〕の候補が
ある場合には、それらの候補文字パターンを表示装置に
出力して、オペレータに選択し′Cもらう。しかしこの
場合でも、それまでの処理でかなり候補文字数が絞られ
ているので、オペ1ノー 夕が行なう作業は比較釣糸で
ある。
最終的に候補文字が決まると、その文字のコードを出力
装置に出力し、その文字の種別を、次の文字の識別に利
用するために記憶する。
なお、上記実施例においては、第2のし、さい値T)(
2を定めるためのD minからの幅△’I’l+を固
定値にしたが、例えばこの段階で前記ωのような文字種
別に応じたパラメータを利用して△1゛ト■を設定して
もよい。また、実施例ではパラメータωを各々の候補文
字の距離りに乗算した結jl、−をしきい値T)(3と
比較しているが、ωをDに加算する等の処理を行なって
もよい。ωの値は処3111の態様に応じて任看:に変
更しうる。
(Φ効果 以上のとおり、本発明によれば候補文字が複数項われる
場合にその中で最も小さい距離1)髪」に準にして第2
のしきい値T H,2を設定するので、誤認識が減ると
同時に認識率も向上する。
【図面の簡単な説明】
第1図は、本発明を実施する一形式の光学文字認識装置
を示すブロック図である。 第2図は、一実施例における候補文字選択手順を示すフ
ローチャー1へである。 第3図は、候補文字選択手順を説明するためのグラフで
ある。

Claims (3)

    【特許請求の範囲】
  1. (1)!2識すべきパターンのデータから特徴パラメー
    タを抽出し、それを予め備えた辞書内の各パターンの特
    徴パラメータと比較し、両者の距+11110が第1の
    しきい値THI以下のものをLg l!ill!候補パ
    ターンとするパターン認識方法において;認識候補パタ
    ーンが複数の場合に、すれらの認識候補パターンの中で
    、認識すべきパターンとの距@Dが最も小さいものの距
    Ill D min 3 l15準としそれよりも大き
    くかつ第1のしきい値’L”l11よりも小さい所定の
    しきい値TH2を設定し、各ノ・・の認識候補パターン
    の距離りをしきい値’I’ 112と比較して、距離り
    がT )I 2よりも大きいものは認識候補パターンか
    ら排除することを特徴と4−る、パターン認識方法。
  2. (2)しきい値T H2を、前記Dw+inに固定(1
    f1を加えた値とする、前記特許請求の範囲第(J )
     f「(記載のパターン認識方法。
  3. (3)複数の認識候補パターンが現われたら、認識すべ
    きパターンに隣接するパターンの種別を1つのパラメー
    タとして各々の認識候補パターンの種別と比較し、その
    結果で認識候補パターンを選択する、前記特許請求の範
    囲第(1)項又は第(2)項記載のパターン認識方法。
JP58195890A 1983-10-19 1983-10-19 パタ−ン認識方法 Pending JPS6089290A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58195890A JPS6089290A (ja) 1983-10-19 1983-10-19 パタ−ン認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58195890A JPS6089290A (ja) 1983-10-19 1983-10-19 パタ−ン認識方法

Publications (1)

Publication Number Publication Date
JPS6089290A true JPS6089290A (ja) 1985-05-20

Family

ID=16348684

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58195890A Pending JPS6089290A (ja) 1983-10-19 1983-10-19 パタ−ン認識方法

Country Status (1)

Country Link
JP (1) JPS6089290A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4741366A (en) * 1986-12-18 1988-05-03 Yokota Co., Ltd. Hand-weaving device
JPS63126082A (ja) * 1986-11-14 1988-05-30 Ricoh Co Ltd 文字認識方式
JPH02110795A (ja) * 1988-10-20 1990-04-23 Fujitsu Ltd パターン同定処理方式

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5211062B2 (ja) * 1973-02-05 1977-03-28
JPS552824A (en) * 1978-06-19 1980-01-10 Sadayoshi Yamazaki Cylindrical adiabatic cover
JPS5554793A (en) * 1978-10-12 1980-04-22 Campbell Frank Jun Shaped piece of refractory ceramic fibers

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5211062B2 (ja) * 1973-02-05 1977-03-28
JPS552824A (en) * 1978-06-19 1980-01-10 Sadayoshi Yamazaki Cylindrical adiabatic cover
JPS5554793A (en) * 1978-10-12 1980-04-22 Campbell Frank Jun Shaped piece of refractory ceramic fibers

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63126082A (ja) * 1986-11-14 1988-05-30 Ricoh Co Ltd 文字認識方式
US4741366A (en) * 1986-12-18 1988-05-03 Yokota Co., Ltd. Hand-weaving device
JPH02110795A (ja) * 1988-10-20 1990-04-23 Fujitsu Ltd パターン同定処理方式

Similar Documents

Publication Publication Date Title
US4837842A (en) Character and pattern recognition machine and method
TWI435276B (zh) 用以辨識手寫符號之方法及設備
JPH07121664A (ja) 自動ヨーロッパ言語決定装置
US20070009155A1 (en) Intelligent importation of information from foreign application user interface using artificial intelligence
CN112651402A (zh) 字符识别方法和装置
Verma et al. Removal of obstacles in Devanagari script for efficient optical character recognition
JPS6089290A (ja) パタ−ン認識方法
EP1010128B1 (en) Method for performing character recognition on a pixel matrix
JP2675303B2 (ja) 文字認識方法
JP2017146841A (ja) 文字認識装置、文字認識方法、およびプログラム
JPS5949630B2 (ja) パタ−ン認識装置
JP2640472B2 (ja) 文字認識方法
JP2580976B2 (ja) 文字切出し装置
JPH0562021A (ja) 標準フオント及び利用者指定カスタムフオントを認識するための光学式文字認識(ocr)システム
JP3209197B2 (ja) 文字認識装置及び文字認識プログラムを記録した記録媒体
JP2851865B2 (ja) 文字認識装置
JP2746345B2 (ja) 文字認識の後処理方法
JPS62271190A (ja) セグメント数字認識方式
JP3281530B2 (ja) 文字認識装置
Pradhan et al. An approach for reducing morphological operator dataset and recognize Optical Character based on significant features
JP2977244B2 (ja) 文字認識方法及び文字認識装置
JP2963474B2 (ja) 類似文字識別方法
JPH11120291A (ja) パタン認識システム
JPH03219384A (ja) 文字認識装置
CN119810812A (zh) 基于多属性监督的文本识别方法、装置及设备