JP2643960B2 - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JP2643960B2
JP2643960B2 JP62319010A JP31901087A JP2643960B2 JP 2643960 B2 JP2643960 B2 JP 2643960B2 JP 62319010 A JP62319010 A JP 62319010A JP 31901087 A JP31901087 A JP 31901087A JP 2643960 B2 JP2643960 B2 JP 2643960B2
Authority
JP
Japan
Prior art keywords
character
pixel
pixels
phase structure
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP62319010A
Other languages
English (en)
Other versions
JPH01161589A (ja
Inventor
徹 二木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP62319010A priority Critical patent/JP2643960B2/ja
Publication of JPH01161589A publication Critical patent/JPH01161589A/ja
Application granted granted Critical
Publication of JP2643960B2 publication Critical patent/JP2643960B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は文字認識方法、特に光学的に入力された手書
き文字あるいは活字文字を認識する文字認識方法に関す
るものである。
[従来技術] 従来、文字認識方法として文字線が黒画素、背景部が
白画素で表された2値画像において、文字パターン領域
内に存在する白画素における位相情報及び黒画素におけ
る文字線情報を特徴とする文字認識方法が提案されてい
る。(電子通信学会論文誌Vol.J63−D,No.11、小森和
昭,川谷隆彦、石井健一郎,飯田行恭、“特徴集積によ
る手書き過多仮名文字の認識”) この方法では、白画素から所定の方向を見たとき、文
字線に出会うか否かによつてその白画素における位相構
造を決定し、その白画素に対応するコードを付与する。
黒画素においては、文字線の内部に存在するのかあるい
は文字線の輪郭部に存在するのかを、更に輪郭部ならば
その傾きも含めてコードとして与える。黒画素に対して
は、更に高次の特徴として、上下左右の方向にそれぞれ
最も近い白画素の位相構造を付与する。
しかし、従来の黒画素へ白画素の位相構造を付加する
方法には次のような欠点があつた。
i)黒画素に最も近い白画素、すなわち隣接した白画素
は、文字の輪郭線に沿つた方向の位相構造が不安定であ
り、正しい位相構造が抽出されない危険性がある。たと
えば、文字画像の一部である第6図において、白画素S
から見た場合、本来上方向には文字線がないと見なすべ
きなのが、輪郭のわずかな凹凸によつて生じたTを文字
線として捕えてしまうことになる。
ii)黒画素に隣接した白画素の位相構造を取り入れるこ
とは黒画素の局所的近傍しか見ていないことになり、文
字の背景部に含まれている情報の抽出が十分行われてい
ない。
[発明が解決しようとする問題点] 本発明は、上記従来例の欠点を除去し、文字の背景部
に含まれている情報を安定して抽出し、得られた特徴を
輪郭部の画素に付加することによつて情報量の多い安定
した特徴抽出を可能にする文字認識方法を提供する。
[問題点を解決するための手段及び作用] この問題点を解決するための一手段として、本発明の
文字認識方法は、認識すべき文字上の画素に、背景部の
位相構造の情報を付与して文字の識別をする文字認識方
法において、 文字の輪郭線上の画素に対して、該輪郭線の傾きと、
前記輪郭線上の前記画素から前記輪郭線の外に所定の距
離だけ離れた背景上の画素から抽出される位相構造の情
報とを付与する。
[実施例] まず、第4図,第5図に従つて、背景部の位相構造を
付加する一般的な文字認識方法について説明する。
第4図は、このような処理によつて付与されたコード
の例を表す図で、白画素Pにおいては、上下左右に操作
した場合、上,下,及び右方向に文字線が存在するので で表されるコードが付与される。一方、黒画素Qは輪郭
線上の点で、その点における輪郭線の傾きは垂直なので
“V"で表されるコードが、点Rは文字線の内部の点なの
で“I"で表されるコードが付与されている。
第5図は、第4図に示されているコードに更に高次の
特徴を付加したもので、黒画素Q,Rから上下左右の方向
にそれぞれ最も近い白画素の位相構造のコードを元のコ
ード“V",“I"に付け加えている。
以上の手続きによつてすべての画素にコードが付加さ
れ、そのコード別の画素数を集計することによつて特徴
ベクトルの抽出を行つている。
以下、図面を用いて本発明の第1の実施例について詳
細に説明する。
第1図は、本実施例による方法で抽出される特徴の一
部を表す図で、A,Bは特徴抽出が行われる点の例であ
る。輪郭線上の点においては、輪郭線追跡あるいは3×
3等のマスクを用いる方法などの従来技術によつて、輪
郭線の傾きを求めることが可能である。本実施例では、
輪郭線の傾きは45゜を単位として8方向に分類してい
る。第3図の矢印は、A,Bそれぞれの点における輪郭線
の傾きを輪郭線に垂直な法線ベクトルで表している。た
だし、法線ベクトルの向きは文字線の内部から外側へ向
かう方向にとるものとする。
次に、これらA,Bの黒画素に対して文字の背景部であ
る白画素の位相構造もとり込む。その際、輪郭線の白画
素に接している方向、すなわち第3図の法線ベクトルで
表されている方向の背景部だけに注目すれば十分であ
る。たとえば、第2図に示す、A付近の拡大図において
明らかなように、Aから見て法線ベクトルの方向以外に
は輪郭線の別の点A1,A2,A3が存在するので、その方向に
ある背景部の位相構造は、Aには取り入れる必要はな
い。
そこで、A,Bの各点から法線ベクトルに方向だけを考
慮し、さらに文字の変形,雑音に対して安定して位相構
造を抽出するために、ある程度離れた白画素の位相構造
を取り入れる。この白画素を元の黒画素の補点と呼ぶこ
とにする。
次に補点の求め方について、第1図に基づいて説明す
る。Aでは法線ベクトルが上を向いているので上方向に
走査を行い、文字線もしくは外接短形にぶつかる点を
A′とする。そして線分AA′をAA′:AA″=1:αの比に
分ける点を補点A″として選ぶ。αは定数で、0.3〜0.5
の値にするのが一般的であるが、最適値は認識対象によ
つて異なる。α=0のとき、補点A″はAの隣接点にな
る。Aにおける法線ベクトルは上向きなので、補点A″
から見て下方向に文字線は必ず存在するのでA″におけ
る位相構造を求めるとき下方向は考慮する必要がない。
この場合は、第9図の上段に示すように、上及び左右方
向の文字線の有無が情報となり、23=8次元の特徴ベク
トルが抽出される。
Bは法線ベクトルが斜めになる例で、この場合もBか
ら法線ベクトルの方向に操作して最初に文字線もしくは
外接短形にぶつかる点B′に対してBB′:BB″=1:αと
なるように補点B″を選ぶ。ただし、この場合はB″か
ら見てBは左上方向に存在するので補点B″における位
相構造としては、右方向及び下方向の文字線の有無を調
べるだけでよい。この場合は、第9図の下段に示すよう
に、下及び右方向の文字線の有無が情報となり、22=4
次元の特徴ベクトルが抽出される。
以上の方法によると、水平もしくは垂直の4方向の輪
郭線上の黒画素に関しては、補点の特徴ベクトルが23
8次元なので、4方向で4×8=32次元になる。一方、
斜めの輪郭線上の点に関しては、補点のベクトルが22
4次元なので、4方向で4×4=16次元となる。よつて
合計で32+16=48次元の特徴ベクトルが得られることに
なる。
尚、文字の背景部の位相構造を黒画素に反映させるた
めの補点の選び方は、第1の実施例の方法に限らない。
第7図は第2の実施例を表す図で、注目する黒画素D
から法線ベクトルの方向に一定の距離dだけ離れた点を
補点D″に選ぶ。この際、注目する黒画素Eからdだけ
離れるまでに文字線あるいは文字の外接短形にぶつかつ
てしまうときは、第1の実施例のように、線分EE′を1:
αに内分する点E″を補点に選べばよい。
また、斜めの輪郭線上の点に関しては、黒画素の近傍
においても比較的安定に位相構造が抽出できるので、補
点を設けずに背景部の位相構造を取り入れることも可能
である。第8図はそれを示す第3の実施例で、斜めの輪
郭線上の点Fから、直線右及び下方向に走査して文字線
にぶつかるか否かによつてFに位相構造を取り入れるこ
とができる。
尚、本実施例では、文字部を黒画素で、背景部を白画
素を表わす場合を説明するが、黒・白あるいは色は限定
されるものではない。又、説明の簡略化のため、位相構
造の抽出を輪郭線に垂直な法線ベクトル上の画素で行つ
ているが、法線ベクトル上に限定する必要はない。更
に、本発明による特徴抽出の方法は、その認識対象を文
字に限定せず、一般の2次元画像の認識に応用すること
も可能である。
以上説明したように、二次元文字画像から特徴ベクト
ルを抽出し認識を行う文字認識において、輪郭線上の黒
画素にその点における傾きに応じて所定の方法で定まる
白画素の位相構造を付与することによつて、文字の変
形、雑音に強く、かつ、計算量の少なくてすむ低次元の
特徴ベクトルを効果的に抽出することができ、認識性能
及び処理速度の向上に大きく役立つ。
[発明の効果] 本発明により、文字の背景部に含まれている情報を安
定して抽出し、得られた特徴を輪郭部の画素に付加する
ことによつて情報量の多い安定した特徴抽出を可能にす
る文字認識方法を提供できる。
【図面の簡単な説明】
第1図は本実施例によつて選び出される補点の例を示す
図、 第2図はそのうちA付近における拡大図、 第3図はA,Bにおける傾きと位相構造とを表わす図、 第4図,第5図,第6図は従来技術による特徴抽出の一
例を示す図、 第7図は第2の実施例の特徴抽出を示す図、 第8図は第3の実施例の特徴抽出を示す図、 第9図は本実施例の補点A″,B″における位相構造を示
す図である。

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】認識すべき文字上の画素に、背景部の位相
    構造の情報を付与して文字の識別をする文字認識方法に
    おいて、 文字の輪郭線上の画素に対して、 該輪郭線の傾きと、 前記輪郭線上の前記画素から前記輪郭線の外に所定の距
    離だけ離れた背景上の画素から抽出される位相構造の情
    報とを付与することを特徴とする文字認識方法。
  2. 【請求項2】位相構造の情報は、輪郭線と垂直な方向に
    所定の距離だけ離れた背景上の画素から抽出されること
    を特徴とする特許請求の範囲第1項記載の文字認識方
    法。
JP62319010A 1987-12-18 1987-12-18 文字認識方法 Expired - Fee Related JP2643960B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62319010A JP2643960B2 (ja) 1987-12-18 1987-12-18 文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62319010A JP2643960B2 (ja) 1987-12-18 1987-12-18 文字認識方法

Publications (2)

Publication Number Publication Date
JPH01161589A JPH01161589A (ja) 1989-06-26
JP2643960B2 true JP2643960B2 (ja) 1997-08-25

Family

ID=18105492

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62319010A Expired - Fee Related JP2643960B2 (ja) 1987-12-18 1987-12-18 文字認識方法

Country Status (1)

Country Link
JP (1) JP2643960B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7965904B2 (en) 2006-08-07 2011-06-21 Canon Kabushiki Kaisha Position and orientation measuring apparatus and position and orientation measuring method, mixed-reality system, and computer program

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2863105B2 (ja) * 1995-01-12 1999-03-03 矢崎総業株式会社 相対回転部材間継電装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7965904B2 (en) 2006-08-07 2011-06-21 Canon Kabushiki Kaisha Position and orientation measuring apparatus and position and orientation measuring method, mixed-reality system, and computer program

Also Published As

Publication number Publication date
JPH01161589A (ja) 1989-06-26

Similar Documents

Publication Publication Date Title
US5212739A (en) Noise tolerant optical character recognition system
EP0482187A1 (en) Row-by-row segmentation and thresholding for optical character recognition (system and method)
JP2000207489A (ja) 文字抽出方法、装置および記録媒体
JP2643960B2 (ja) 文字認識方法
EP1296283A2 (en) Half-tone dot elimination method and system thereof
JP2868134B2 (ja) 画像処理方法及び装置
JP2982150B2 (ja) 文字パターン処理方法及び装置
JP3172498B2 (ja) イメージ認識用特徴値抽出方法、およびその装置、イメージ解析プログラムを格納する記憶媒体
JP3187894B2 (ja) 文書画像傾き検出方法
JP2853169B2 (ja) パターン認識装置
JP3711186B2 (ja) サイズ識別方法および装置
KR100334624B1 (ko) 클러스터링기반문서영상분할방법
JPS61175880A (ja) 破線抽出装置
JP3104355B2 (ja) 特徴抽出装置
KR940007935B1 (ko) 문자 인식을 위한 후보 분류 방법
JPH09120430A (ja) 画像処理装置
JP2655598B2 (ja) 線分抽出方式
JP2926842B2 (ja) 文字切出し回路
KR930008060B1 (ko) 문서 인식방법
JPH02166583A (ja) 文字認識装置
JPH0573718A (ja) 領域属性識別方式
JPS63103392A (ja) 文字認識方式
JP2004213215A (ja) 画像入力方法及び画像入力装置
JPH05108882A (ja) 文字認識装置
JP2646642B2 (ja) 画像の内外領域判定システム

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees