JPS5837780A - 文字認識方式 - Google Patents
文字認識方式Info
- Publication number
- JPS5837780A JPS5837780A JP56134840A JP13484081A JPS5837780A JP S5837780 A JPS5837780 A JP S5837780A JP 56134840 A JP56134840 A JP 56134840A JP 13484081 A JP13484081 A JP 13484081A JP S5837780 A JPS5837780 A JP S5837780A
- Authority
- JP
- Japan
- Prior art keywords
- character
- pattern
- matrix
- characters
- sub
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/751—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
本発明は、簡単でかつ高速で正確な文字認識方式に関す
るものである。
るものである。
一般に文字図形の認識は文字図形パターンからストロー
クを抽出し、それら抽出されたストロークの位置、長さ
、ストローク間の相互関係等の幾何学的な特徴を抽出す
る事により行なわれている。
クを抽出し、それら抽出されたストロークの位置、長さ
、ストローク間の相互関係等の幾何学的な特徴を抽出す
る事により行なわれている。
そしてストロークの抽出には、次のような2つの方法が
広く用いられている。
広く用いられている。
■ 文字図形の輪郭を追跡することにより検出された輪
郭点系列について曲率を計算し、その曲率の大きな値の
点を分割点として輪郭系列を分割し、分割された系列を
組合わせることによりストロークの抽出を行なう。
郭点系列について曲率を計算し、その曲率の大きな値の
点を分割点として輪郭系列を分割し、分割された系列を
組合わせることによりストロークの抽出を行なう。
■ 文字図形パターンに細線化処理を行なって骨格化し
、その骨格パターンの連結性及び骨格パターンを追跡し
、急激な角度の変化点等を検出してストロークを抽出す
る。
、その骨格パターンの連結性及び骨格パターンを追跡し
、急激な角度の変化点等を検出してストロークを抽出す
る。
しかし、■の方法は文字図形パターンが大きい場合や複
絨な場合には、その処理量が増大し処理速度の低下を招
くこと、また■の方法は文字図形パターンを細線化する
必要があり、さらKその細線化によるパターンの歪、ヒ
ゲの発生等の問題がありその後の処理を複雑化させるこ
と、等の欠点を有している。
絨な場合には、その処理量が増大し処理速度の低下を招
くこと、また■の方法は文字図形パターンを細線化する
必要があり、さらKその細線化によるパターンの歪、ヒ
ゲの発生等の問題がありその後の処理を複雑化させるこ
と、等の欠点を有している。
そこでこれらの欠点を除去する方法として、文字図形パ
ターンの線巾Wを検出し、前記パターンを所望の方向に
走査し、パターンの当該走査方向における記入点の長さ
lと、前記線巾Wとの間で、l:2nW (nは定数)
を満足する記入点を取り出すことにより走査方向のスト
ローク成分を表わすサブパターンを抽出し、さらに文字
枠内を(MxN)の領域(M、Nは整数)に分割して各
領域の文字線量を計算して認識する方法が提案されてい
る。
ターンの線巾Wを検出し、前記パターンを所望の方向に
走査し、パターンの当該走査方向における記入点の長さ
lと、前記線巾Wとの間で、l:2nW (nは定数)
を満足する記入点を取り出すことにより走査方向のスト
ローク成分を表わすサブパターンを抽出し、さらに文字
枠内を(MxN)の領域(M、Nは整数)に分割して各
領域の文字線量を計算して認識する方法が提案されてい
る。
しかし、第1図に漢字の木”の例を示すように、正しく
は(A)の垂直サブパターンが同図(B)の位置にある
べきものが、同図(C)のように文字が変形するとその
垂直サブパターンは(D)のように分割領域の位置がず
れ、すなわち、抽出する特徴が不安定となり、文字識別
を困難にしていた。このような文字の変形を吸収するた
めには、以後の処理が複雑になり、ひいては処理速度の
低下を招いていた。
は(A)の垂直サブパターンが同図(B)の位置にある
べきものが、同図(C)のように文字が変形するとその
垂直サブパターンは(D)のように分割領域の位置がず
れ、すなわち、抽出する特徴が不安定となり、文字識別
を困難にしていた。このような文字の変形を吸収するた
めには、以後の処理が複雑になり、ひいては処理速度の
低下を招いていた。
本発明の目的は、この従来の欠点を除去するために前記
特徴マトリクスにぼけ処理を施し、その特徴マトリクス
を用いた文字認識を行なうようにしたもので、以下詳細
に説明する。
特徴マトリクスにぼけ処理を施し、その特徴マトリクス
を用いた文字認識を行なうようにしたもので、以下詳細
に説明する。
第2図は、本発明の文字認識装置における実施例を示す
も゛のである。光信号人力1ば、光電変換部2において
2値の量子化されたディジタル電気信号に変換され、パ
ターンレジスタ3に格納される。それと同時に、線中計
算部4において入カバターンの線巾が計算される。垂直
サブパターン抽出部5は、パターンレジスタについて垂
直スキャンを全百行なって、黒ビットの連続の長さと計
算部4において計算された線巾との関係より垂直サブパ
ターン(VSP)を抽出する。同様に、水平サブパター
ン抽出部6は水平スキャンにより水平サブパターン(H
4F)を、右斜めサブパターン抽出部7は右斜め45°
スキヤンにより右斜めサブパターン(R8P)を、左斜
めサブパターン抽出部8は左斜め45°スキヤンにより
左斜めサブパターン(LSP)を抽出する。
も゛のである。光信号人力1ば、光電変換部2において
2値の量子化されたディジタル電気信号に変換され、パ
ターンレジスタ3に格納される。それと同時に、線中計
算部4において入カバターンの線巾が計算される。垂直
サブパターン抽出部5は、パターンレジスタについて垂
直スキャンを全百行なって、黒ビットの連続の長さと計
算部4において計算された線巾との関係より垂直サブパ
ターン(VSP)を抽出する。同様に、水平サブパター
ン抽出部6は水平スキャンにより水平サブパターン(H
4F)を、右斜めサブパターン抽出部7は右斜め45°
スキヤンにより右斜めサブパターン(R8P)を、左斜
めサブパターン抽出部8は左斜め45°スキヤンにより
左斜めサブパターン(LSP)を抽出する。
文字枠検出部9はパターンレジスタ3内の文字パターン
に外接する文字枠を検出し、その結果を文字枠分割決定
部1oへ送る。文字枠分割決定部1゜は検出された文字
枠内をMXNの領域(M、Nは整数、本実施例ではM=
=N=5)に分割するためのY軸、Y軸上の分割点座標
を決定する。ここでY軸は文字枠の水平方向を、Y軸は
垂直方向をそれぞれ示す。
に外接する文字枠を検出し、その結果を文字枠分割決定
部1oへ送る。文字枠分割決定部1゜は検出された文字
枠内をMXNの領域(M、Nは整数、本実施例ではM=
=N=5)に分割するためのY軸、Y軸上の分割点座標
を決定する。ここでY軸は文字枠の水平方向を、Y軸は
垂直方向をそれぞれ示す。
特徴マトリクス抽出部11は、文字枠分割決定部10に
より決定された分割点座標によりVS P 、 H8P
。
より決定された分割点座標によりVS P 、 H8P
。
R8P、LSP、USPの各サン°パターンレジスタ上
の文字枠領域をMXNの領域に分割し、各領域の黒ビッ
ト数Bljを計数し、線巾W゛を使用して式(IIKよ
り文字線長を示す特徴を計算し、MxNx5次元の特徴
マトリクスLIjを作成する。
の文字枠領域をMXNの領域に分割し、各領域の黒ビッ
ト数Bljを計数し、線巾W゛を使用して式(IIKよ
り文字線長を示す特徴を計算し、MxNx5次元の特徴
マトリクスLIjを作成する。
Lij= Btj/ W (
1)その後、■SP特徴マトリクスは文字枠のX軸方向
の長さΔXで、H8P特徴マトリクスはy軸方向の長さ
JYで、RAP、LAP及びUSP特徴マトリクスはF
υX)!+ (JY)2でそれぞれ正規化を行ない最終
的にMxNx5次元の正規化特徴マトリクスを作成する
。
1)その後、■SP特徴マトリクスは文字枠のX軸方向
の長さΔXで、H8P特徴マトリクスはy軸方向の長さ
JYで、RAP、LAP及びUSP特徴マトリクスはF
υX)!+ (JY)2でそれぞれ正規化を行ない最終
的にMxNx5次元の正規化特徴マトリクスを作成する
。
ぼけ処理部12は、特徴マ) IJクス作成部11で作
成された正規化特徴マ) IJクスにぼけ処理を施す。
成された正規化特徴マ) IJクスにぼけ処理を施す。
本実施例では、次に示すような方法でサブパターンの抽
出方向に対して垂直な方向にぼかす。すなわち、水平サ
ブパターンより作成した水平特徴マトリクスの要素M1
jについて、次式(2)を適用してぼけ特徴マトリクス
の要素M1jを計算する。
出方向に対して垂直な方向にぼかす。すなわち、水平サ
ブパターンより作成した水平特徴マトリクスの要素M1
jについて、次式(2)を適用してぼけ特徴マトリクス
の要素M1jを計算する。
同様に、垂直サブパターンより作成した垂直特徴マトリ
クスについては(3)式、右斜めサブパターンより作成
した右斜め特徴マ) IJクスについては(4)式、左
斜めサブパターンより作成した左斜め特徴マトリクスに
ついては(5)式を適用して、ぼけ特徴マ) IJクス
の要素M’4jを計算する。
クスについては(3)式、右斜めサブパターンより作成
した右斜め特徴マ) IJクスについては(4)式、左
斜めサブパターンより作成した左斜め特徴マトリクスに
ついては(5)式を適用して、ぼけ特徴マ) IJクス
の要素M’4jを計算する。
但しCは定数、また最も外側の領域について計算する場
合は、さらに外側の領域の要素がM匂と等しいものとみ
なす。
合は、さらに外側の領域の要素がM匂と等しいものとみ
なす。
上記各式は、注目要素値Mijと、それに垂直方向に隣
接する要素値Mi 、 j−1、Ml 、 j+1とを
用いて、重み付けした平均値でぼかすことを意味する。
接する要素値Mi 、 j−1、Ml 、 j+1とを
用いて、重み付けした平均値でぼかすことを意味する。
各要素値は水平特徴要素の各領域における長さと対応づ
けられる量なので、各要素の長さを垂直方向へ再配分す
るものと考えてよい。垂直特徴マ) IJクスの場合は
水平方向へ、右斜めは左斜めに、左斜めは右斜めに再配
分する。Cの値は、代表的には4であり、この例では一
律にC=4としている。
けられる量なので、各要素の長さを垂直方向へ再配分す
るものと考えてよい。垂直特徴マ) IJクスの場合は
水平方向へ、右斜めは左斜めに、左斜めは右斜めに再配
分する。Cの値は、代表的には4であり、この例では一
律にC=4としている。
識別部13は、標準文字マスク(fm)とぼけ特徴マト
リクス(f、)との間に式(6)で定義される距離(D
)な適用し、Dが最小の値となるような標準文字マスク
のカテゴリ名を文字名出力14に出力する。
リクス(f、)との間に式(6)で定義される距離(D
)な適用し、Dが最小の値となるような標準文字マスク
のカテゴリ名を文字名出力14に出力する。
D−’E罰り丁て〒 (6)以上説明した
ように、本実施例では正規化特徴マ) IJクスにぼけ
処理を施しているので、文字のさらに簡単な変換式を適
用することによりぼけ処理を施し、このぼけ特徴マトリ
クスを用いて識別を行なうので文字の変形を吸収するこ
とができ、簡単で正確な文字認識装置が実現できる。
ように、本実施例では正規化特徴マ) IJクスにぼけ
処理を施しているので、文字のさらに簡単な変換式を適
用することによりぼけ処理を施し、このぼけ特徴マトリ
クスを用いて識別を行なうので文字の変形を吸収するこ
とができ、簡単で正確な文字認識装置が実現できる。
第1図は従来の文字認識方式の説明図、第2図は本発明
に係る実施例の構成図である。 ■・・・・・・光信号入力、 2・・・・・・光電
変換部、3・・・・・・パターンレジスタ、4・・・・
・・線中計算部、5〜8・・・・・・サブパターン抽出
部、9・・・・・・文学枠検出部、 10・・・・・・文字枠分割決定部、 11・・・・・・特徴マトリクス抽出部、12・・・・
・・ぼけ処理部、 13・・・・・・識別部、14・
・・・・・文字名出力 特許出願人 沖電気工業株式会社 特許出願代理人 弁理士 山 本 恵 − 第1図 (A) (C)
に係る実施例の構成図である。 ■・・・・・・光信号入力、 2・・・・・・光電
変換部、3・・・・・・パターンレジスタ、4・・・・
・・線中計算部、5〜8・・・・・・サブパターン抽出
部、9・・・・・・文学枠検出部、 10・・・・・・文字枠分割決定部、 11・・・・・・特徴マトリクス抽出部、12・・・・
・・ぼけ処理部、 13・・・・・・識別部、14・
・・・・・文字名出力 特許出願人 沖電気工業株式会社 特許出願代理人 弁理士 山 本 恵 − 第1図 (A) (C)
Claims (1)
- 文字図形な光電変換し、量子化して得られたディジタル
信号を原パターンとしてパターンレジスタに格納し、前
記原パターンから各方向のストローク成分をあられすサ
ブパターンを抽出してサブパターンレジスタに格納し、
前記原パターンの文字枠内領域を前記サブパターンレジ
スタについてMXN個の領域(M、Nは整数)に分割し
、各領域内の文字線長をあられす特徴量を文字の大きさ
で正規化して特徴マ) IJクスを作成し、該特徴マト
リクスを標準文字マトリクスと照合して前記文字図形を
認識する文字認識方法において、前記特徴マトリクスに
ぼけ処理を施し、その特徴マトリクスとあらかじめ貯蔵
された辞書と照合して文字図形を識別することを特徴と
する文字認識方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP56134840A JPS5837780A (ja) | 1981-08-29 | 1981-08-29 | 文字認識方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP56134840A JPS5837780A (ja) | 1981-08-29 | 1981-08-29 | 文字認識方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS5837780A true JPS5837780A (ja) | 1983-03-05 |
JPS638514B2 JPS638514B2 (ja) | 1988-02-23 |
Family
ID=15137687
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP56134840A Granted JPS5837780A (ja) | 1981-08-29 | 1981-08-29 | 文字認識方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS5837780A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62125485A (ja) * | 1985-11-26 | 1987-06-06 | Oki Electric Ind Co Ltd | 文字認識方式 |
-
1981
- 1981-08-29 JP JP56134840A patent/JPS5837780A/ja active Granted
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62125485A (ja) * | 1985-11-26 | 1987-06-06 | Oki Electric Ind Co Ltd | 文字認識方式 |
Also Published As
Publication number | Publication date |
---|---|
JPS638514B2 (ja) | 1988-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS5837780A (ja) | 文字認識方式 | |
JPH0545992B2 (ja) | ||
JPS6262392B2 (ja) | ||
JPS62125485A (ja) | 文字認識方式 | |
JPH0545991B2 (ja) | ||
JPS62154079A (ja) | 文字認識方式 | |
JPS5894067A (ja) | 文字認識方法 | |
JPH01152586A (ja) | 文字図形認識方法 | |
JPS6318787B2 (ja) | ||
JPS6019287A (ja) | 文字認識方法 | |
JPS62114080A (ja) | 文字認識方式 | |
JPS6262393B2 (ja) | ||
JPS6038755B2 (ja) | 特徴抽出方式 | |
JPH0545990B2 (ja) | ||
JPS6038756B2 (ja) | 文字認識方式 | |
JPH0475553B2 (ja) | ||
JPH0545993B2 (ja) | ||
JPS6059488A (ja) | 文字認識装置 | |
JPH0547871B2 (ja) | ||
JPH01152585A (ja) | 特徴抽出方法 | |
JPH03670B2 (ja) | ||
JPH01152587A (ja) | 文字図形認識方法 | |
JPS5894065A (ja) | 文字認識装置 | |
JPS62164182A (ja) | 文字図形パタ−ン認識方式 | |
JPS60201485A (ja) | 手書文字認識装置 |