JP2982150B2 - 文字パターン処理方法及び装置 - Google Patents

文字パターン処理方法及び装置

Info

Publication number
JP2982150B2
JP2982150B2 JP2224344A JP22434490A JP2982150B2 JP 2982150 B2 JP2982150 B2 JP 2982150B2 JP 2224344 A JP2224344 A JP 2224344A JP 22434490 A JP22434490 A JP 22434490A JP 2982150 B2 JP2982150 B2 JP 2982150B2
Authority
JP
Japan
Prior art keywords
character
pixel
character pattern
interest
distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2224344A
Other languages
English (en)
Other versions
JPH04106683A (ja
Inventor
徹 二木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2224344A priority Critical patent/JP2982150B2/ja
Priority to DE69131174T priority patent/DE69131174T2/de
Priority to EP91307768A priority patent/EP0476852B1/en
Publication of JPH04106683A publication Critical patent/JPH04106683A/ja
Priority to US08/250,941 priority patent/US5754689A/en
Application granted granted Critical
Publication of JP2982150B2 publication Critical patent/JP2982150B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は入力した文字パターンの形状の特徴を抽出す
る文字パターン処理方法及び装置に関し、特に、文字認
識の前段階における文字パターンの特徴を抽出する文字
パターン処理方法及び装置に関するものである。
[従来の技術] 従来、文字認識方法として文字線(文字パターン)が
黒画素、背景部が白画素で表された2値画像において、
文字パターン領域内に存在する白画素における位相情報
及び黒画素における文字線情報を特徴とする文字認識方
法が提案されている(電子通信学会論文誌Vol.J36−D,N
o.11、小森和昭,川谷隆彦,石井健一郎,飯田行恭,
“特徴集積による手書き片仮名文字の認識”)。
この方法では、白画素から所定の方向を見たとき、文
字線に出会うか否かによつてその白画素における位相構
造を決定し、その白画素に対応するコードを付与する。
黒画素においては、文字線の内部に存在するのかあるい
は文字線の輪郭部に存在するのかを、更に輪郭部ならば
その傾きも含めてコードとして与える。黒画素に対して
は、更に高次の特徴として、上下左右の方向にそれぞれ
最も近い白画素の位相構造を付与する。
[発明が解決しうようとしている課題] しかし、従来の黒画素へ白画素の位相構造を付加する
方法には次のような欠点があつた。
(i)黒画素に最も近い白画素、すなわち隣接した白画
素は、文字の輪郭線に沿つた方向の位相構造が不安定で
あり、正しい位相構造が抽出されない危険性がある。た
とえば、文字画像の一部である第6図において、白画素
Sから見た場合、本来上方向には文字線がないと見なす
べきなのが、輪郭のわずかな凹凸によつて生じたT部分
を文字線として捕えてしまうことになる。
(ii)黒画素に隣接した白画素の位相構造を取り入れる
ことは黒画素の局所的近傍しか見ていないことになり、
文字の背景部に含まれている情報の抽出が十分行われて
いないので、文字パターン認識において誤りを発生する
頻度が高くなる。
本発明はかかる問題点に鑑みなされたものであり、文
字パターンの高さと幅に基づいて特徴抽出する位置まで
の距離を求め、その文字パターン内の複数の注目画素か
ら、求めた距離だけ隔てた位置においてその文字パター
ンの特徴を抽出することで、文字パターンの輪郭のわず
かな凹凸の影響を受けず、かつ、近すぎず離れすぎずの
文字パターン内で共通の適切な距離での特徴抽出を行う
文字パターン処理方法及び装置を提供しようとするもの
である。
[課題を解決するための手段及び作用] この課題を解決するため、例えば本発明の文字パター
ン処理方法は以下の工程を備える。すなわち、 入力した文字パターン形状の特徴を抽出する文字パタ
ーン処理方法であって、 前記文字パターンの輪郭上の複数の注目画素におい
て、各注目画素における輪郭線の傾きを求め、 文字パターンの輪郭上の複数の注目画素の各々に対す
る位相情報を抽出する画素を定めるための距離を、当該
文字パターンの外接矩形の高さと幅とを加算した値に所
定値を乗算して求め、 前記複数の注目画素の各々において、求められた傾き
に垂直な方向に、前記求めた距離だけ前記注目画素から
離れた背景画素において、文字パターンの位相情報を抽
出し、 抽出した位相情報を前記注目画素の特徴情報として付
与することを特徴とする。
[実施例] 以下、添付図面に従つて、本発明に係る実施例を詳細
に説明する。
先ず、第5図(A),(B)に従つて、背景部の位相
構造を付加する一般的な文字パターン特徴の抽出方法に
ついて説明する。
第5図(A)は、このような処理によつて付与された
コードの例を表す図で、白画素Pにおいては、上下左右
に走査した場合、上,下及び右方向に文字線が存在する
ので“コ”で表されるコードが付与される。一方、黒画
素Qは輪郭線上の点で、その点における輪郭線の傾きは
垂直なので“V"で表わされるコードが、また、点Rは文
字線の内部の点なので“I"で表されるコードが付与され
ている。
第5図(B)は、同図(A)に示されているコードに
更に高次の特徴を付加したもので、黒画素Q,Rから上下
左右の方向にそれぞれ最も近い白画素の位相構造のコー
ドを元のコード“V",“I"に付け加えている。
以上の手続きによつてすべての画素にコードが付与さ
れ、そのコード別の画素数を集計することによつて特徴
ベクトルの抽出を行つている。
以下、本第1の実施例について詳細に説明する。
第1図は実施例における文字認識装置のブロック構成
図である。
図中、1は原稿画像を読取るイメージリーダ、2は読
取つた画像を展開する画像メモリ、3は装置全体を制御
するCPUである。4はCPUが処理する文字の切り出し処理
や特徴抽出、更には文字認識処理に係るプログラム(第
4図に示すフローチヤート)を記憶しているROMであ
る。5はCPU3のワークエリアとして使用するRAM、6は
文字認識処理の際に参照する辞書部、7は認識結果を出
力する出力部である。尚、実施例は、文字の特徴抽出処
理について説明するものであり、他の切り出し及び認識
処理は公知の手順を踏むものとして、その説明は省略す
る。
第2図(A)は、本実施例による方法で抽出される特
徴の一部を表す図で、図示でA,Bは特徴抽出が行われる
点の例である。本発明では黒画素のうち文字の輪郭点と
なつている画素だけに注目し、これらの点についてコー
ドを付与する。輪郭線上の点においては、輪郭線追跡あ
るいは3×3等のマスクを用いる方法などの従来技術に
よつて、輪郭線の傾きを求めることが可能である。本実
施例では、輪郭線の傾きは45゜を単位として8方向に分
類している。第3図は第2図(A)の点A,Bにおける傾
きと位相構造とを表わす図で、矢印は、点A,Bそれぞれ
の点における輪郭線の傾きを輪郭線に垂直な法線ベクト
ルで表している。ただし、法線ベクトルの向きは文字線
の内部から外側へ向かう方向にとるものとする。
次に、これらA,Bの黒画素に対して文字の背景部であ
る白画素の位相構造をとり込む。その際、輪郭線の白画
素に接している方向、すなわち、第3図の法線ベクトル
で表されている方向の背景部だけに注目すれば十分であ
る。たとえば、第2図(B)に示すA付近の拡大図にお
いて明らかなように、Aから見て法線ベクトルの方向以
外には輪郭線の別の点A1,A2,A3が存在し、それらの点に
おいても特徴抽出が行われるので、Aにおいては法線ベ
クトルの方向以外の位相構造を取り入れる必要はない。
そこで、実施例においては、A,Bの各点から法線ベク
トルの方向だけを考慮し、さらに文字の変形,雑音に対
して安定して位相構造を抽出するために、ある程度離れ
た白画素(図示のA′,B′点)の位相構造を取り入れ
る。
尚、以下では、この白画素を元の黒画素の補点と呼ぶ
ことにする。
次に補点の求め方について、第2図(A)に基づいて
説明する。点Aでは法線ベクトルが上を向いているの
で、上方向に距離dだけ離れた点A′を補点に選ぶ。こ
こで、距離dは文字の大きさをパラメータとして、予め
定められた方法によつて決定される。
本実施例では、次に述べる方法で距離dを求める。即
ち、認識しようとする文字の外接矩形の高さをh,幅をw
としたとき、γを定数として、 d=γ(h+w) で定める。これによつて、補点までの距離dを文字の大
きさにほぼ比例して決定することができ、入力文字の大
小に関わらず安定した特徴抽出を行うことが可能にな
る。
次に、補点A′、B′の位相構造の求め方について説
明する。
点Aにおける法線ベクトルは上向きなので、補点A′
から見て、下方向には必ず文字線が存在する。従って、
補点A′における位相構造を求めるとき、下方向は考慮
する必要がない。つまり補点A′の位相は、第9図の上
段に示すように、上及び左右方向の文字線の有無が情報
となり、23=8次元の特徴ベクトルが抽出される。
なお、点Aから距離dだけ離れるまでに、文字線もし
くは文字枠にぶつかてしまう場合は、ぶつかる点A″に
対して、AA″:AA′=1:αとなるように補点A′を選ぶ
(αは予め定められた定数である)。
第2図(A)に戻つて、点Bにおいては、その法線ベ
クトルが斜めになる。この場合も点Bから法線ベクトル
の方向に距離dだけ離れた位置の白画素B′を補点に選
ぶ。距離dの求め方、及びdだけ離れるまでに、文字線
もしくは文字枠にぶつかる場合の処置は点Aと同様であ
る。
ただし、点Bの補点B′から見てBは左上方向に存在
するので、補点B′における位相構造としては、右方向
及び下方向の文字線の有無を調べるだけでよい。この場
合、第9図の下段に示すように、下及び右方向の文字線
の有無が情報となり、22=4次元の特徴ベクトルが抽出
される。
以上の方法によると、水平もしくは垂直の4方向の輪
郭線上の黒画素に関しては、それぞれの補点の特徴ベク
トルが23=8次元なので、4方向(輪郭の傾きが上下左
右の4方向)で4×8=32次元になる。一方、斜めの輪
郭線上の黒画素に関しては、それぞれの補点のベクトル
が22=4次元なので、4方向(斜め右上、右下、左上、
左下の4方向)で4×4=16次元となる。よつて合計で
32+16=48次元の特徴ベクトルが得られることになる。
上述した原理に基づいて、実施例のCPU3は第4図に示
す手順に従つて、特徴を抽出していく。
先ず、ステツプS1において輪郭線追跡処理を行い、輪
郭線上の黒画素点の座標を得る。そして、ステツプS2に
おいて、その得られた注目画素に対する法線ベクトルを
得、次のステツプS3で注目画素に対する補点(法線ベク
トル方向に距離dだけ離れた白画素)座標を得る。ステ
ツプS4では、法線ベクトル方向に対応した方向の黒画素
が存在するか否かによる、補点位置における位相を得
る。ステツプS5では、こうして得られた注目画素の座標
位置、法線ベクトル、及び補点の位相情報をコード化し
て、記憶することで注目画素情報の特徴情報を得る。こ
の後、ステツプS6で注目文字パターンに対する全情報を
得たか否かを判断する。そして、否の場合にはステツプ
S1に戻り、以下同様の処理を行う。また、全情報の抽出
が終つたら、この特徴抽出処理から次の認識処理へと進
む。
<第2の実施例> 上述した第1の実施例では、補点を求める距離dが一
定であつたが、これに限定されるものではない。
すなわち、字種によつては、文字の縦横比が大きく変
わる場合があり、dを法線ベクトルの値に応じて変えた
方がよい場合がある。
第7図に示す英文字「J」の場合には、その文字の本
来の形状的特徴により、文字の横幅と縦長さの比が大き
く異なっている。このような場合、法線ベクトルの方向
が上下方向であるような、例えば点Cでは、hを文字の
外接矩形の高さとして、補点C′までの距離d1を d1=γ・h で与える。
一方、法線の方向が左右であるような点Dの場合は、
文字の外接矩形の幅をwとして、補点D′までの距離d2
を d2=γ・w で与える。
また、法線ベクトルの方向が斜めであるような点Eの
場合には、補点E′までの距離d3を d3=γ(h+w) で与える。
ただし、γ12は定数である。
このように、字形の本来的な特徴を考慮して、補点の
位置を決定することにより、背景の位相構造情報が特殊
化されるので、より特徴的なパターン認識が可能にな
る。
<第3の実施例> また、斜めの輪郭線上の点に関しては、黒画素の近傍
においても比較的安定に位相構造が抽出できるので、補
点を設けずに背景部の位相構造を取り入れることも可能
である。第8図はそれを示す第3の実施例で、斜めの輪
郭線上の点Fから、直接右及び下方向に走査して文字線
にぶつかるか否かによつてFに位相構造を取り入れるこ
とができる。
尚、本実施例では、文字部を黒画素で、背景部を白画
素で表わす場合を説明したが、黒・白あるいは色は限定
されるものではない。又、説明の簡略化のため、位相構
造の抽出を輪郭線に垂直な法線ベクトル上の画素で行つ
ているが、法線ベクトル上に限定する必要はない。更
に、本実施例による特徴抽出の方法は、その認識対象を
文字に限定せず、一般の2次元画像の認識に応用するこ
とも可能である。
以上説明したように本実施例によれば、二次元文字画
像から特徴ベクトルを抽出し認識を行う文字認識におい
て、輪郭線上の黒画素にその点における傾きに応じて所
定の方法で定まる白画素の位相構造を付与することによ
つて、文字の変形,雑音に強く、かつ、計算量の少なく
て済む低次元の特徴ベクトルを効果的に抽出することが
できるようになる。従つて、後処理である文字認識処理
における認識速度及び認識率を上げることが可能とな
る。
[発明の効果] 以上説明したように本発明によれば、文字パターンの
高さと幅に基づいて特徴抽出する位置までの距離を求
め、その文字パターン内の複数の注目画素から、求めた
距離だけ隔てた位置においてその文字パターンの特徴を
抽出することで、文字パターンの輪郭のわずかな凹凸の
影響を受けず、かつ、近すぎず離れすぎずの文字パター
ン内で共通の適切な距離での特徴抽出を行うことが可能
になる。
【図面の簡単な説明】
第1図は実施例の文字認識装置のブロツク構成図、 第2図(A)は本実施例による方法で選び出される特徴
の一部を示す図、 第2図(B)は第2図(A)の点A付近における拡大
図、 第3図は第1図のA,Bにおける傾きと位相構造とを表わ
す図、 第4図は実施例における特徴抽出に係るフローチヤー
ト、 第5図(A),(B)及び第6図は従来技術による特徴
抽出の一例を示す図、 第7図は第2の実施例の特徴抽出処理の概念を示す図、 第8図は第3図の実施例の特徴抽出処理の概念を示す
図、 第9図は本実施例の補点A′,B′における位相構造を示
す図である。 図中、1……イメージリーダ、2……画像メモリ、3…
…CPU、4……ROM、5……RAM、6……辞書部、7……
出力部である。
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G06K 9/46 G06K 9/62 JOIS(JICSTファイル) DATOLIS(特許ファイル)

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】入力した文字パターンの形状の特徴を抽出
    する文字パターン処理方法であって、 前記文字パターンの輪郭上の複数の注目画素において、
    各注目画素における輪郭線の傾きを求め、 文字パターンの輪郭上の複数の注目画素の各々に対する
    位相情報を抽出する画素を定めるための距離を、当該文
    字パターンの外接矩形の高さと幅とを加算した値に所定
    値を乗算して求め、 前記複数の注目画素の各々において、求められた傾きに
    垂直な方向に、前記求めた距離だけ前記注目画素から離
    れた背景画素において、文字パターンの位相情報を抽出
    し、 抽出した位相情報を前記注目画素の特徴情報として付与
    する ことを特徴とする文字パターン処理方法。
  2. 【請求項2】前記抽出した位相情報の注目画素の特徴情
    報として付与した後処理として、文字認識を行なうこと
    を特徴とする請求項第1項に記載の文字パターン処理方
    法。
  3. 【請求項3】入力した文字パターンの形状の特徴を抽出
    する文字パターン処理装置であって、 前記文字パターンの輪郭上の複数の注目画素において、
    各注目画素における輪郭線の傾きを求める傾き導出手段
    と、 文字パターンの輪郭上の複数の注目画素の各々に対する
    位相情報を抽出する画素を定めるための距離を、当該文
    字パターンの外接矩形の高さと幅とを加算した値に所定
    値を乗算して求める距離導出手段と、 前記複数の注目画素の各々において、求められた傾きに
    垂直な方向に、前記求めた距離だけ注目画素から離れた
    背景画素において、文字パターンの位相情報を抽出する
    位相抽出手段と、 抽出した位相情報を前記注目画素の特徴情報として付与
    する付与手段と を備えることを特徴とする文字パターン処理装置。
  4. 【請求項4】前記位相抽出手段で抽出した位相情報の注
    目画素の特徴情報として付与した後処理として、文字認
    識を行なう文字認識手段を有することを特徴とする請求
    項第3項に記載の文字パターン処理装置。
JP2224344A 1990-08-28 1990-08-28 文字パターン処理方法及び装置 Expired - Fee Related JP2982150B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2224344A JP2982150B2 (ja) 1990-08-28 1990-08-28 文字パターン処理方法及び装置
DE69131174T DE69131174T2 (de) 1990-08-28 1991-08-23 Verfahren und Gerät zur Bildverarbeitung
EP91307768A EP0476852B1 (en) 1990-08-28 1991-08-23 Image processing method and apparatus
US08/250,941 US5754689A (en) 1990-08-28 1994-05-31 Image processing method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2224344A JP2982150B2 (ja) 1990-08-28 1990-08-28 文字パターン処理方法及び装置

Publications (2)

Publication Number Publication Date
JPH04106683A JPH04106683A (ja) 1992-04-08
JP2982150B2 true JP2982150B2 (ja) 1999-11-22

Family

ID=16812293

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2224344A Expired - Fee Related JP2982150B2 (ja) 1990-08-28 1990-08-28 文字パターン処理方法及び装置

Country Status (4)

Country Link
US (1) US5754689A (ja)
EP (1) EP0476852B1 (ja)
JP (1) JP2982150B2 (ja)
DE (1) DE69131174T2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK0604687T3 (da) 1992-12-30 2000-10-23 Koninkl Kpn Nv Fremgangsmåde til afledning af tegneegenskaber i et tegngenkendelsessystem
US10725650B2 (en) * 2014-03-17 2020-07-28 Kabushiki Kaisha Kawai Gakki Seisakusho Handwritten music sign recognition device and program

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5418632A (en) * 1977-07-12 1979-02-10 Nippon Telegr & Teleph Corp <Ntt> Character identification system
EP0149457B1 (en) * 1984-01-13 1993-03-31 Kabushiki Kaisha Komatsu Seisakusho Method of identifying contour lines
JPS61246877A (ja) * 1985-04-25 1986-11-04 Canon Inc 図形変換装置

Also Published As

Publication number Publication date
DE69131174T2 (de) 1999-10-21
JPH04106683A (ja) 1992-04-08
US5754689A (en) 1998-05-19
EP0476852B1 (en) 1999-04-28
EP0476852A2 (en) 1992-03-25
EP0476852A3 (en) 1993-08-11
DE69131174D1 (de) 1999-06-02

Similar Documents

Publication Publication Date Title
JP3338537B2 (ja) 画像傾き検出装置
JP3878401B2 (ja) 画像処理装置、画像処理方法およびそれを記録した記録媒体
RU2621601C1 (ru) Устранение искривлений изображения документа
JP4738469B2 (ja) 画像処理装置、画像処理プログラムおよび画像処理方法
EP0482187A1 (en) Row-by-row segmentation and thresholding for optical character recognition (system and method)
US20090316219A1 (en) Image processing apparatus, image processing method and computer-readable storage medium
US7130085B2 (en) Half-tone dot elimination method and system thereof
JP2982150B2 (ja) 文字パターン処理方法及び装置
JP3006466B2 (ja) 文字入力装置
JP2868134B2 (ja) 画像処理方法及び装置
JP2643960B2 (ja) 文字認識方法
JP2000076378A (ja) 文字認識方法
JP2669661B2 (ja) 文書画像処理方法
JPH01129358A (ja) 表数値演算装置
JP3187895B2 (ja) 文字領域抽出方法
JP3196291B2 (ja) 文字認識方法および装置
JPH02273884A (ja) 文書画像の歪検出補正方法
JP3104355B2 (ja) 特徴抽出装置
Goto et al. Robust and fast text‐line extraction using local linearity of the text‐line
JP2853169B2 (ja) パターン認識装置
JP3084833B2 (ja) 特徴抽出装置
JP4282471B2 (ja) 画像特徴抽出装置、画像特徴抽出方法、プログラムおよび記録媒体
JP2002157550A (ja) 文字認識装置、文字認識方法、および記録媒体
JP3502130B2 (ja) 表認識装置および表認識方法
JPH0728939A (ja) 表のベクトル化装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees