JPS63228392A - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JPS63228392A
JPS63228392A JP62062994A JP6299487A JPS63228392A JP S63228392 A JPS63228392 A JP S63228392A JP 62062994 A JP62062994 A JP 62062994A JP 6299487 A JP6299487 A JP 6299487A JP S63228392 A JPS63228392 A JP S63228392A
Authority
JP
Japan
Prior art keywords
histogram
input pattern
direction code
dictionary
character recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62062994A
Other languages
English (en)
Inventor
Masahiro Nakamura
昌弘 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP62062994A priority Critical patent/JPS63228392A/ja
Publication of JPS63228392A publication Critical patent/JPS63228392A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔技術分野〕 本発明は、光学的文字読取装置(OCR)などにおける
文字認識方法に関する。
〔従来技術〕
OCRなどにおいて、入力パターンの輪郭部に方向コー
ドを付け、入力パターンの分割ブロック毎に方向コード
のヒストグラムをとり、このヒストグラムを特徴量とし
て利用する文字認識方法が知られている。
しかし従来、この種の文字認識方法においては、入力パ
ターンから抽出したヒストグラムと、種々の文字に関し
て同様の方法で予め用意した辞書のヒス1−グラムとの
距離の合計値を用いて候補を決定しているため、文字の
位相的特徴の微小な差が吸収されてしまい、例えば小文
字のrpJと大文字rpJを誤認識する確率が高いとい
う問題があづた。
また、距離演算では等距離の候補が複数出現する頻度が
高い。従来、等距離の複数の候補が出現した場合に、最
初に出現した候補または最後に出現した候補を最終的な
候補として選択するなどの方法が採られている。しかし
、この方法は、個々の入力パターンと直接的に関係した
情報量に基づくものでなく、人為的なルールに基づいて
いるため、誤認識の確率が高いという問題があった。
〔目 的〕
したがって、本発明の目的は、距離演算では誤認識を生
じやすいような文字も正しく認識可能な文字認識方法を
提供することにある。
〔構 成〕
この目的を達成するため、本発明は、入力パターンの輪
郭部に方向コードを付け、入力パターンの分割ブロック
毎に方向コードのヒストグラムをとり、このヒストグラ
ムと予め用意した辞書のヒストグラムとの値の差がゼロ
となるか又は所定値以下となる回数を計数し、この計数
値により候補を決定するものである。
〔実施例〕
以下、図面を参照し、本発明の詳細な説明する。
第1図は、本発明の文字認識方法を適用した文字認識装
置の一例を示す機能ブロック図である61は原稿画像を
読み取るスキャナである。2はスキャナ1から読み込ま
れたイメージから一文字単位に入力パターンを切り出す
文字切出し部である。3は入力パターンの輪郭部に方向
コードを付与する方向コード付与部である。
第2図に、方向コードとパターンとの対18図を示す。
各パターンの中央の白画素に方向コードが付与される。
すなわち、入力パターンの輪郭部の白画素に方向コード
(1〜8)が付けられる。
4は入力パターンを複数のブロックに分割し、ブロック
毎に方向コードのヒストグラムを抽出するヒストグラム
抽出部である。
第3図に、入力パターンの方向コード付けの一例を示す
。この例は、小文字rPJのパターンである。なお、0
は文字線内部の黒画素である。
この入力パターンを縦横に4X4のブロックに16分割
して抽出したヒストグラムを第4図に示す。この図にお
いて、最上行の数字列rlo042000.1とroo
060201Jはそれぞれ最上段の左から第1番目と第
2番目のブロックのヒストグラムであり、数字列中の数
字はブロック内の方向コード1〜8のそれぞれの出現数
である。
第2行の数字列r04061100Jと「o11310
30Jはそれぞれ最上段の第3#目と第4番目のブロッ
クのヒストグラムである。以下同様に、最終行の数字列
ro1310110Jと「00000000Jはそれぞ
れ最下段の左から第3番目および第4番目のブロックの
ヒストグラムである。
第1図に戻って、5は入力パターンから抽出されたヒス
トグラムと、辞書記憶部6に格納されている辞書のヒス
トグラムとの比較により文字認識を行い、入力文字の候
補を決定する認識部である。
本発明の特徴は、認識部5の認識処理内容にあるので、
以下、実施個別に認識処理内容を説明する。
害/111 本実施例では、入力パターンのヒストグラムと辞書のヒ
ストグラムとの値が一致した回数を計数し、計数値が最
大の辞書を入力文字パターンの候補として選択する。こ
の認識処理を第5図に示したフローチャートに沿って説
明する。
まず最大計数値Comaλをクリアしくステップ■)、
以下1文字列の処理を実行する。
ヒストグラムの次元数Kに1を設定し、計数値Cをクリ
アする(ステップ■)。ある文字の辞書に関して、次元
にの辞書のヒストグラムI)(k)と入力パターンのヒ
ストグラムP (k)の比較判定を行い(ステップ■)
、等しい場合は計数値Cに1を加える(ステップ■)。
次元数Kが最終値に達したか判定しくステップ■)、K
く最終値ならば次元数Kに1を加え(ステップ■)、同
様の処理を繰り返す。
次元数Kが最終値に達すると、一つの文字の辞書に関す
る処理を終了し、計数値Cと最大計数値C+*axとの
比較判定を行う(ステップ■)。
そして、c>cmaスならば、当該辞書の文字コードを
候補Candとして記憶し、計数値Cを改めて最大計数
値Cmaxとして設定する(ステップ■)。
同様の処理が各辞書について順次実行され、ステップ■
で最後の辞書まで処理が終了したと判定されると、その
時の候補Candが最終的に決定される。
具体例で説明すると、第6図は大文字「P」の辞書のヒ
ストグラムを示し、第7図は小文字rPJの辞書のヒス
トグラムを示す。第3図に示した入力パターンの場合、
その抽出ヒストグラム(第4図)と大文字[P」および
小文字rpJの辞書のヒストグラムとの距離を演算する
と、それぞれ63と69になり、入力パターンは大文字
「P」と認識されてしまう。しかし、それぞれの計数値
は82と86となるので、この計数値から入力パターン
を小文字「p」と正しく認識することができる。
去渕1」劣 実施例1ではヒストグラムの値の一致数を無条件に計数
したが、本実施例では、六方パターンと辞書のヒストグ
ラムの中で値が0で一致する回数を計数する。
すなわち、本実施例の認識処理においては、第5図のス
テップ4の位置で、 P (k) =D (k):!:
Oの判定を行う、その他は実施例1と同様である。
具体例は示さないが、本実施例によっても実施例1と同
様の効果が得られる。
実施例3 本実施例は、ヒストグラムの値の一致数の代わりに、ヒ
ストグラムの値の差が所定値Thより小さくなる回数を
計算する。換言すれば、実施例1はTh=Oとした場合
である。
すなわち、本実施例の認識処理においては、第5図のス
テップ4の位置で D= l p (k) −o (k)  1を計算して
D<Thの判定を行う、その他は実施例1と同様である
具体例は示さないが、本実施例によっても実施例1と同
様の効果を得られる。
以上、3つの実施例について説明したが、本発明はそれ
だけに限定されるものではなく、様々に変形して実施で
きるものである。
〔効 果〕
以上の説明から明らかなように、本発明は、ススパター
ンの輪郭部に方向コードを付け、入力パターンの分割ブ
ロック毎に方向コードのヒストグラムをとり、このヒス
トグラムと予め用意した辞書のヒストグラムとの値の差
がゼロとなるか又は所定値以下となる回数を計数し、こ
の計数値により候補を決定するから、従来の距離演算に
よる方法では誤認するような入力パターンについても。
その位相的特徴を正しく反映させた認識が可能であり、
認識率を向上できると2もに、距離演算よりも処理が簡
単であるため、処理の高速化を期待できる。
【図面の簡単な説明】
第1図は本発明の文字認識方法を適用した文字認識装置
の一例の機能ブロック図、第2図は方向コードとパター
ンとの対応図、第3図は入力パターンの方向コード付与
の一例を示す図、第4図は第3図に示した入力パターン
の抽出ヒストグラムを示す図、第5図は本発明の一実施
例における認識処理のフローチャート、第6図は大文字
rPJの辞書のヒストグラムを示す図、第7は小文字r
pJのヒストグラムを示す図である。 1・・・スキャナ、 2・・・文字切り出し部、3・・
・方向コード付与部、 4・・・ヒストグラム″抽出部、 5・・・認識部、6
・・・辞書記憶部。 第1図 入力へ〇ターンのとストク゛うへ 04 06 1 1000  +  +  31 03
 0010000005180201  +0 131
.011000000000第 5 図 第  6  図 4耳膚PのCストフ゛°うへ 600C1lOOOI0600000 第  7  図 :41p/)tzXドブ゛2へ o 2o5+  2oo0002103゜01 000
000406 σ3011700’0O0200131
1030 0f>04030202200402 手続補正書(方式) %式% 2、発明の名称 文字認識方法 3、補正をする者 事件との関係  出願人 住所  東京都大田区中馬込1丁目3番6号名称  (
674)  株式会社 リ コ −代表者      
 浜 1)  広 4、代理人 5、補正命令の日付 昭和62年5月6日(発送日昭和62年5月26日)7
、補正の内容 明細書第9頁最下行目の「第7」を「第7図に補正する
。 以上

Claims (2)

    【特許請求の範囲】
  1. (1)入力パターンの輪郭部に方向コードを付け、入力
    パターンの分割ブロック毎に方向コードのヒストグラム
    をとり、このヒストグラムと予め用意した辞書のヒスト
    グラムとの値の差がゼロとなるか又は所定値以下となる
    回数を計数し、この計数値により候補を決定することを
    特徴とする文字認識方法。
  2. (2)入力パターンのヒストグラムと辞書のヒストグラ
    ムとの値の差に関連した計数を、ヒストグラムの特定の
    値に関してだけ行うことを特徴とする特許請求の範囲第
    1項記載の文字認識方法。
JP62062994A 1987-03-18 1987-03-18 文字認識方法 Pending JPS63228392A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62062994A JPS63228392A (ja) 1987-03-18 1987-03-18 文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62062994A JPS63228392A (ja) 1987-03-18 1987-03-18 文字認識方法

Publications (1)

Publication Number Publication Date
JPS63228392A true JPS63228392A (ja) 1988-09-22

Family

ID=13216432

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62062994A Pending JPS63228392A (ja) 1987-03-18 1987-03-18 文字認識方法

Country Status (1)

Country Link
JP (1) JPS63228392A (ja)

Similar Documents

Publication Publication Date Title
US6259812B1 (en) Key character extraction and lexicon reduction cursive text recognition
JP3099797B2 (ja) 文字認識装置
JPS63228392A (ja) 文字認識方法
JPH02293989A (ja) 文字認識装置
JP2998054B2 (ja) 文字認識方法及び文字認識装置
JP3115139B2 (ja) 文字切り出し方法
JPH051512B2 (ja)
JPS63228391A (ja) 文字認識方法
JP2902097B2 (ja) 情報処理装置及び文字認識装置
JP3100786B2 (ja) 文字認識後処理方式
JP2895115B2 (ja) 文字切出し方法
JP2930996B2 (ja) 画像認識方法および画像認識装置
JP4215385B2 (ja) パターン認識装置、パターン認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JPS60138689A (ja) 文字認識方法
JP3659688B2 (ja) 文字認識装置
JP4633271B2 (ja) 辞書学習方法及び辞書学習プログラム
JPH06162266A (ja) オンライン手書き文字認識の方法及びその装置
JP2851865B2 (ja) 文字認識装置
JP2658153B2 (ja) 文字識別方式
JP3345469B2 (ja) 単語間隔度演算方法、単語間隔度演算装置、及び文字読取り方法、文字読取り装置
JP2658154B2 (ja) 文字識別方式
JPS62271190A (ja) セグメント数字認識方式
JPH0436885A (ja) 光学式文字読取装置
JP3162419B2 (ja) 認識辞書更新方法
JPS6336392A (ja) 閾値設定方式