JPS6255783A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPS6255783A JPS6255783A JP60196302A JP19630285A JPS6255783A JP S6255783 A JPS6255783 A JP S6255783A JP 60196302 A JP60196302 A JP 60196302A JP 19630285 A JP19630285 A JP 19630285A JP S6255783 A JPS6255783 A JP S6255783A
- Authority
- JP
- Japan
- Prior art keywords
- character
- recognized
- characters
- distance
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は、新聞・雑誌等の活字及び手書き文字を認識し
、例えばJISコード等の情報量に変換する文字認識装
置に関するものである。
、例えばJISコード等の情報量に変換する文字認識装
置に関するものである。
従来の技術
従来の文字認識装置では認識対象文字から得られた特徴
量と予め辞書に貯えられている各文字の特徴量の距離を
計算し、前記距離の小さい文字を認識候補文字としてい
た(例えば、電子通信学会技術研究報告〈パターン認識
と学習)PRL82−46“マルチ7オント印刷漢字認
識実験装置”目黒他)。
量と予め辞書に貯えられている各文字の特徴量の距離を
計算し、前記距離の小さい文字を認識候補文字としてい
た(例えば、電子通信学会技術研究報告〈パターン認識
と学習)PRL82−46“マルチ7オント印刷漢字認
識実験装置”目黒他)。
発明が解決しようとする問題点
しかしながら、実際には認識対象文字の特徴量と辞書と
の距離を求めて小さい距離の文字を認識候補文字とする
手法では、「えJや「之」、「夕」や「夕」などの形状
が非常に似ている文字は区別出来ない。本発明は上記問
題点を解決することを目的としたもので、形状が非常に
よく似た文字に対してもより正確に文字認識を行なうこ
とができる文字認識装置を提供することを目的としてい
る。
の距離を求めて小さい距離の文字を認識候補文字とする
手法では、「えJや「之」、「夕」や「夕」などの形状
が非常に似ている文字は区別出来ない。本発明は上記問
題点を解決することを目的としたもので、形状が非常に
よく似た文字に対してもより正確に文字認識を行なうこ
とができる文字認識装置を提供することを目的としてい
る。
問題点を解決するための手段
本発明は前記問題点を解決するため、認識対象文字の特
徴量と辞書の各文字との距離を前記各文字に付与された
重み係数により正規化し、前記正規化された距離を用い
て認識候補文字を求めるように構成している。
徴量と辞書の各文字との距離を前記各文字に付与された
重み係数により正規化し、前記正規化された距離を用い
て認識候補文字を求めるように構成している。
作 用
本発明は前記の技術的手段により、「え」や「之」のよ
うに非常に似た文字でも正確に文字認識が可能となる。
うに非常に似た文字でも正確に文字認識が可能となる。
実施例
以下、本発明の実施例について図面を参照しながら説明
する。
する。
第1図は、本発明による文字認識装置の一実施例の構成
図である。1は画像入力部であり、認識対象文字を含む
画像を走査して2値信号で画像を入力し画像メモリ2に
格納する。3は文字切り出し部であり、画像メモリ2か
ら文字を矩形で切り出す。4は特徴抽出部であり、文字
切り出し部3で切り出した文字のストローク等の特徴量
を求める。5は距離計算部であり、特徴抽出部4で求め
た認識対象文字の特徴量と、予め辞書6に登録されてい
る各文字の特徴量との距離を求める。7は分類部であり
、距離計算部6で得られた認識対象文字と辞書中の各文
字との距離を前記各文字に付与された係数(例えば出現
頻度で決定される係数)により正規化し、前記正規化さ
れた距離のなかで小さい文字を認識候補文字とする。B
Fi表示部であり、分類部7で得られた認識結果を表示
する。
図である。1は画像入力部であり、認識対象文字を含む
画像を走査して2値信号で画像を入力し画像メモリ2に
格納する。3は文字切り出し部であり、画像メモリ2か
ら文字を矩形で切り出す。4は特徴抽出部であり、文字
切り出し部3で切り出した文字のストローク等の特徴量
を求める。5は距離計算部であり、特徴抽出部4で求め
た認識対象文字の特徴量と、予め辞書6に登録されてい
る各文字の特徴量との距離を求める。7は分類部であり
、距離計算部6で得られた認識対象文字と辞書中の各文
字との距離を前記各文字に付与された係数(例えば出現
頻度で決定される係数)により正規化し、前記正規化さ
れた距離のなかで小さい文字を認識候補文字とする。B
Fi表示部であり、分類部7で得られた認識結果を表示
する。
以上のように構成された文字認識装置について、第2図
に示す入力画像を例に説明する。
に示す入力画像を例に説明する。
画像入力部1から入力された第2図に示すような画像は
2値化されて画像メモリ2に格納される。
2値化されて画像メモリ2に格納される。
文字切り出し部3は画像メモリ2に蓄えられている入力
画像から認識対象文字を第3図aに示すような矩形Rで
切り出す。
画像から認識対象文字を第3図aに示すような矩形Rで
切り出す。
特徴抽出部4では、文字切シ出し部で得られた第3図a
の認識対象文字パターンPについて、第3図すの矢印が
示す方向に着目画素を含んでM個以上連々っているか否
かを調べ方向コードを設定し、方向コード毎に各画素の
連結性を調べてストロークを抽出し、ストロークの数・
位置・長さ等の特徴量を抽出する。第3図Cに文字「え
」のストロークの抽出結果を示す。
の認識対象文字パターンPについて、第3図すの矢印が
示す方向に着目画素を含んでM個以上連々っているか否
かを調べ方向コードを設定し、方向コード毎に各画素の
連結性を調べてストロークを抽出し、ストロークの数・
位置・長さ等の特徴量を抽出する。第3図Cに文字「え
」のストロークの抽出結果を示す。
距離計算部6では、特徴抽出部で得られた認識対象文字
パターンPの特徴量’i()=’ e 町” en)と
予め貯えられている辞書6の各文字Ckの特徴量Ckj
との距離Dkを Dk=Σlf、−ck、l によシ求める。
パターンPの特徴量’i()=’ e 町” en)と
予め貯えられている辞書6の各文字Ckの特徴量Ckj
との距離Dkを Dk=Σlf、−ck、l によシ求める。
分類部7では、距離計算部で求めた認識対象文字Pと辞
書中の文字Ckとの距離Dkを第4図aで示すような文
字Ckに付与された係数で正規化し、距離Dkの中から
最も小さい値の文字Crnを第1候補文字とする。
書中の文字Ckとの距離Dkを第4図aで示すような文
字Ckに付与された係数で正規化し、距離Dkの中から
最も小さい値の文字Crnを第1候補文字とする。
表示部8では、分類部で得られた候補文字を表示する。
発明の効果
本発明によれば、認識対象文字から個別文字パターンを
抽出する場合に、「之」や「え」のように非常に形状の
似た文字に対しても高い確率で認識することが出来、文
字認識の精度を向上する事が出来る。例えば第3図aの
認識対象文字と辞書中の文字「え」との距離D1と辞書
中の文字「之」との距離D2は第4図すに示すようにD
2の方が小さく、第3図a(7:)認識対象文字「え」
の第1候補は「之」となるが、文字「之」の出現頻度は
rえ」よりも低いため重み係数は大きく、正規化された
距離Nkは第4図Cのようになり認識対象文字「え」が
第1候補として得られる。
抽出する場合に、「之」や「え」のように非常に形状の
似た文字に対しても高い確率で認識することが出来、文
字認識の精度を向上する事が出来る。例えば第3図aの
認識対象文字と辞書中の文字「え」との距離D1と辞書
中の文字「之」との距離D2は第4図すに示すようにD
2の方が小さく、第3図a(7:)認識対象文字「え」
の第1候補は「之」となるが、文字「之」の出現頻度は
rえ」よりも低いため重み係数は大きく、正規化された
距離Nkは第4図Cのようになり認識対象文字「え」が
第1候補として得られる。
第1図は本発明の一実施例による文字認識装置の構成図
、第2図は入力画像の一例を示す説明図、第3図は認識
対象文字パターンを切り出した文字の特徴を示す説明図
、第4図は文字毎に付与された重み係数を用いて距離の
正規化を行々った動作説明図である。 1・・・・・・画像入力部、2・・・・・・画像メモリ
部、3・・・・・・文字切シ出し部、4・・・・・・特
徴抽出部、6・・・・・・距離計算出部、6・・・・・
・辞書、7・・・・・・分類部、8・・・・・・表示部
。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 第2図 第3図 (aン CC) 第4図 (0−ン
、第2図は入力画像の一例を示す説明図、第3図は認識
対象文字パターンを切り出した文字の特徴を示す説明図
、第4図は文字毎に付与された重み係数を用いて距離の
正規化を行々った動作説明図である。 1・・・・・・画像入力部、2・・・・・・画像メモリ
部、3・・・・・・文字切シ出し部、4・・・・・・特
徴抽出部、6・・・・・・距離計算出部、6・・・・・
・辞書、7・・・・・・分類部、8・・・・・・表示部
。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 第2図 第3図 (aン CC) 第4図 (0−ン
Claims (1)
- 認識対象文字を含む画像を入力する画像入力部と、前記
画像入力部で入力された画像から認識対象となる文字を
矩形で切り出す文字切り出し部と、前記文字切り出し部
で得られた認識対象文字パターンの文字特徴を求める特
徴抽出部と、前記特徴抽出部で得られた文字特徴と予め
辞書に貯えられている各文字の特徴量との距離を求める
距離計算部と、前記距離計算部で得られた距離を文字に
付与された重み係数により上記距離を正規化し、正規化
した距離の小さい文字を認識候補文字とする分類部を有
することを特徴とする文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60196302A JPS6255783A (ja) | 1985-09-05 | 1985-09-05 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60196302A JPS6255783A (ja) | 1985-09-05 | 1985-09-05 | 文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS6255783A true JPS6255783A (ja) | 1987-03-11 |
JPH0584552B2 JPH0584552B2 (ja) | 1993-12-02 |
Family
ID=16355545
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP60196302A Granted JPS6255783A (ja) | 1985-09-05 | 1985-09-05 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6255783A (ja) |
-
1985
- 1985-09-05 JP JP60196302A patent/JPS6255783A/ja active Granted
Also Published As
Publication number | Publication date |
---|---|
JPH0584552B2 (ja) | 1993-12-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4813078A (en) | Character recognition apparatus | |
JP2713622B2 (ja) | 表形式文書読取装置 | |
JPH05242292A (ja) | 分離方法 | |
US7146047B2 (en) | Image processing apparatus and method generating binary image from a multilevel image | |
JPS6255783A (ja) | 文字認識装置 | |
JPS6330991A (ja) | 文字認識装置 | |
JP2537973B2 (ja) | 文字認識装置 | |
JPH0584553B2 (ja) | ||
JPS6378287A (ja) | 文字認識装置 | |
JPS63221495A (ja) | 文字認識装置 | |
JPS6180477A (ja) | 文書清書装置 | |
JPS6337490A (ja) | 文字認識装置 | |
JPH0576671B2 (ja) | ||
JPS62251888A (ja) | 文字認識装置 | |
JP2974167B2 (ja) | 文字の大分類認識方法 | |
JP2978801B2 (ja) | 手書き文字認識の文字入力方式 | |
JP2918363B2 (ja) | 文字分類方法及び文字認識装置 | |
JPH0215388A (ja) | 文字認識装置 | |
JPH0877293A (ja) | 文字認識装置および文字認識用辞書作成方法 | |
JP2004094734A (ja) | 文字認識方法および文字認識装置 | |
JPH0656625B2 (ja) | 特徴抽出方式 | |
JPS62219187A (ja) | 文字認識装置 | |
JPH11134439A (ja) | 単語認識方法 | |
JPS60147891A (ja) | 文字認識装置 | |
JPH10214308A (ja) | 文字判別方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
EXPY | Cancellation because of completion of term |