JPH04106683A - 文字パターン処理方法及び装置 - Google Patents

文字パターン処理方法及び装置

Info

Publication number
JPH04106683A
JPH04106683A JP2224344A JP22434490A JPH04106683A JP H04106683 A JPH04106683 A JP H04106683A JP 2224344 A JP2224344 A JP 2224344A JP 22434490 A JP22434490 A JP 22434490A JP H04106683 A JPH04106683 A JP H04106683A
Authority
JP
Japan
Prior art keywords
character
picture element
point
information
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2224344A
Other languages
English (en)
Other versions
JP2982150B2 (ja
Inventor
Toru Futaki
徹 二木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2224344A priority Critical patent/JP2982150B2/ja
Priority to EP91307768A priority patent/EP0476852B1/en
Priority to DE69131174T priority patent/DE69131174T2/de
Publication of JPH04106683A publication Critical patent/JPH04106683A/ja
Priority to US08/250,941 priority patent/US5754689A/en
Application granted granted Critical
Publication of JP2982150B2 publication Critical patent/JP2982150B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は入力した原稿画像中の文字を認識する際に、文
字パターンの特徴を抽出する文字パターン特徴抽出方式
に関するものである。
[従来の技術] 従来、文字認識方法として文字線(文字パターン)が黒
画素、背景部が白画素で表された2値画像において、文
字パターン領域内に存在する白画素における位相情報及
び黒画素における文字線情報を特徴とする文字認識方法
が提案されている(電子通信学会論文誌Vol136−
D、No、11 、小森和昭、用谷隆彦1石井健一部、
飯田行恭、“特徴集積による手書き片仮名文字の認識”
)。
この方法では、白画素から所定の方向を見たとき、文字
線に8会うか否かによってその白画素における位相構造
を決定し、その白画素に対応するコードを付与する。黒
画素においては、文字線の内部に存在するのかあるいは
文字線の輪郭部に存在するのかを、更に輪郭部ならばそ
の傾きも含めてコードとして与える。黒画素に対しては
、更に高次の特徴として、上下左右の方向にそれぞれ最
も近い白画素の位相構造を付与する。
[発明が解決しようとしている課題] しかし、従来の黒画素へ白画素の位相構造を付加する方
法には次のような欠点があった。
(i)黒画素に最も近い白画素、すなわち隣接した白画
素は、文字の輪郭線に沿った方向の位相構造が不安定で
あり、正しい位相構造が抽出されない危険性がある。た
とえば、文字画像の一部である第6図において、白画素
Sから見た場合、本来上方向には文字線がないと見なす
べきなのが、輪郭のわずかな凹凸によって生じたT部分
を文字線として捕えてしまうことになる。
(ii)黒画素に隣接した白画素の位相構造を取り入れ
ることは黒画素の局所的近傍しか見ていないことになり
、文字の背景部に含まれている情報の抽出が十分行われ
ていないので、文字パターン認識において誤りを発生す
る頻度が高(なる。
本発明は、上記従来例の欠点を除去し、文字の背景部に
含まれている情報を安定して抽出し、得られた特徴を輪
郭部の画素に付加することによって安定した特徴抽出を
可能にする文字)〈ターン特徴抽出方式を提供すること
にある。
[課題を解決するための手段及び作用コこの課題を解決
する本発明の文字パターン特徴抽出方式は以下に示す構
成を備える。すなわち、入力した文字パターンにおける
特徴を抽出する文字パターン特徴抽出方式において、輪
郭追跡によって得られた注目画素に対する情報として、
当該注目画素位置における傾きと、該傾き方向に対すg
法線方向に所定距離前れた背景画素点における位相情報
を抽出する。
[実施例] 以下、添付図面に従って、本発明に係る実施例を詳細に
説明する。
先ず、第5図(A)、(B)に従って、背景部の位相構
造を付加する一般的な文字パターン特徴の抽出方法につ
いて説明する。
第5図(A)は、このような処理によって付与されたコ
ードの例を表す図で、白画素Pにおいては、上下左右に
走査した場合、上、下及び右方向に文字線が存在するの
で“コ”で表されるコードが付与される。一方、黒画素
Qは輪郭線上の点で、その点における輪郭線の傾きは垂
直なので“V”で表わされるコードが、また、点Rは文
字線の内部の点なので“■”で表されるコードが付与さ
れている。
第5図(B)は、同図(A)に示されているコードに更
に高次の特徴を付加したもので、黒画素Q、Rから上下
左右の方向にそれぞれ最も近い白画素の位相構造のコー
ドを元のコード“V”“■”に付は加えている。
以上の手続きによってすべての画素にコードが付与され
、そのコード別の画素数を集計することによって特徴ベ
クトルの抽出を行っている。
以下、本第1の実施例について詳細に説明する。
第1図は実施例における文字認識装置のブロック構成図
である。
図中、1は原稿画像を読取るイメージリーダ、2は読取
った画像を展開する画像メモリ、3は装置全体を制御す
るCPUである。4はCPUが処理する文字の切り出し
処理や特徴抽出、更には文字認識処理に係るプログラム
(第4図に示すフローチャート)を記憶しているROM
である。5はCPU3のワークエリアとして使用するR
AM、6は文字認識処理の際に参照する辞書部、7は認
識結果を出力する出力部である。尚、実施例は、文字の
特徴抽出処理について説明するものであり、他の切り出
し及び認識処理は公知の手順を踏むものとして、その説
明は省略する。
第2図(A)は、本実施例による方法で抽出される特徴
の一部を表す図で、図示でA、Bは特徴抽出が行われる
点の例である。本発明では黒画素のうち文字の輪郭点と
なっている画素だけに注目し、これらの点についてコー
トを付与する。輪郭線上の点においては、輪郭線追跡あ
るいは3×3等のマスクを用いる方法などの従来技術に
よって、輪郭線の傾きを求めることが可能である。本実
施例では、輪郭線の傾き1.145°を単位として8方
向に分類している。第3図は第1図(A)の点A、Bに
おける傾きと位相構造とを表わす図で、矢印は、点A、
Bそれぞれの点における輪郭線の傾きを輪郭線に垂直な
法線ベクトルで表している。ただし、法線ベクトルの向
きは文字線の内部から外側へ向かう方向にとるものとす
る。
次に、これらA、Bの黒画素に対して文字の背景部であ
る白画素の位相構造をとり込む。その際、輪郭線の白画
素に接している方向、すなわち、第3図の法線ベクトル
で表されている方向の背景部だけに注目すれば十分であ
る。たとえば、第2図(B)に示すA付近の拡大図にお
いて明らかなように、Aかも見て法線ベクトルの方向以
外には輪郭線の別の点A3.Ax 、Aaが存在し、そ
れらの点においても特徴抽出が行われるので、Aにおい
ては法線ベクトルの方向以外の位相構造を取り入れる必
要はない。
そこで、実施例においては、A、Bの各点から法線ベク
トルの方向だけを考慮し、さらに文字の変形、雑音に対
して安定して位相構造を抽出するために、ある程度前れ
た白画素(図示のAB°点)の位相構造を取り入れる。
尚、以下では、この白画素を元の黒画素の補点と呼ぶこ
とにする。
次に補点の求め方について、第1図(A)に基づいて説
明する。点Aでは法線ベクトルが上を向いているので、
上方向に距離dだけ離れた点A。
を補点に選ぶ。ここで、距離dは文字の大きさをパラメ
ータとして、予め定められた方法によって決定される。
本実施例では、次に述べる方法で距離dを求める。即ち
、認識しようとする文字の外接矩形の高さをり9幅をW
としたとき、γを定数として、d=γ(h+w) で定める。これによって、補点までの距離dを文字の大
きさにほぼ比例して決定することができ、入力文字の大
小に関わらず安定した特徴油圧を行うことが可能になる
次に、補点A’ 、B’の位相構造の求め方について説
明する。
点Aにおける法線ベクトルは上向きなので、補点A゛か
ら見て、下方向には必ず文字線が存在する。従って、補
点A°における位相構造を求めるとき、下方向は考慮す
る必要がない。つまり補点A゛の位相は、第9図の上段
に示すように、上及び左右方向の文字線の有無が情報と
なり、23=8次元の特徴ベクトルが抽出される。
なお、点Aから距離dだけ離れるまでに、文字線もしく
は文字枠にぶつかでしまう場合は、ぶつかる点A”に対
して、AA”:AA’=1:αとなるように補点A°を
選ぶ(αは予め定められた定数である)。
第1図(A)に戻って、点Bにおいては、その法線ベク
トルが斜めになる。この場合も点Bから法線ベクトルの
方向に距離dだけ離れた位置の白画素B゛を補点に選ぶ
。距離dの求め方、及びdだけ離れるまでに、文字線も
しくは文字枠にぶつかる場合の処置は点Aと同様である
ただし、点Bの補点B°から見てBは左上方向に存在す
るので、補点B°における位相構造としては、右方向及
び下方向の文字線の有無を調べるだけでよい。この場合
、第9図の下段に示すように、下及び右方向の文字線の
有無が情報となり、22=4次元の特徴ベクトルが抽出
される。
以上の方法によると、水平もしくは垂直の4方向の輪郭
線上の黒画素に関しては、それぞれの補点の特徴ベクト
ルが23=8次元なので、4方向(輪郭の傾きが上下左
右の4方向)で4X8=32次元になる。一方、斜めの
輪郭線上の黒画素に関しては、それぞれの補点のベクト
ルが22=4次元なので、4方向(斜め右上、右下、左
上、左下の4方向)で4X4=16次元となる。よって
合計で32+16=48次元の特徴ベクトルが得られる
ことになる。
上述した原理に基づいて、実施例のCPU3は第4図に
示す手順に従って、特徴を抽出してい(。
先ず、ステップS1において論客戦追跡処理を行い、輪
郭線上の黒画素点の座標を得る。そして、ステップS2
において、その得られた注目画素に対する法線ベクトル
を得、次のステップS3で注目画素に対する神意(法線
ベクトル方向に距離dだけ離れた白画素)座標を得る。
ステップS4では、法線ベクトル方向に対応した方向の
黒画素が存在するか否かによる、神意位置における位相
を得る。ステップS5では、こうして得られた注目画素
の座標位置、法線ベクトル、及び神意の位相情報をコー
ド化して、記憶することで注目画素情報の特徴情報を得
る。この後、ステップS6で注目文字パターンに対する
全情報を得たか否かを判断する。そして、否の場合には
ステップS1に戻り、以下同様の処理を行う。また、全
情報の抽出が終ったら、この特徴抽出処理から次の認識
処理えへと進む。
〈第2の実施例〉 上述した第1の実施例では、神意を求める距離dが一定
であったが、これに限定されるものではない。
すなわち、字種によっては、文字の縦横比が大きく変わ
る場合があり、dを法線ベクトルの値に応じて変えた方
がよい場合がある。
第7図に示す英文字「J」の場合には、その文字の本来
の形状的特徴により、文字の横幅と縦長さの比が太き(
異なっている。このような場合、法線ベクトルの方向が
上下方向であるような、例えば点Cでは、hを文字の外
接矩形の高さとして、神意C°までの距離d1を d、=γ、・h で与える。
一方、法線の方向が左右であるような点りの場合は、W
を文字の外接矩形の幅をWとして、神意D°までの距離
d2を d2=γ2 ・W で与える。
また、法線ベクトルの方向が斜めであるような点Eの場
合には、神意E°までの距離d3をd3=γ、(h+w
) で与える。
ただし、γ1.γ2.γ3は定数である。
このように、字形の本来的な特徴を考慮して、神意の位
置を決定することにより、背景の位相構造情報が特殊化
されるので、より特徴的なパターン認識が可能になる。
く第3の実施例〉 また、斜めの輪郭線上の点に関しては、黒画素の近傍に
おいても比較的安定に位相構造が抽出できるので、神意
を設けずに背景部の位相構造を取り入れることも可能で
ある。第8図はそれを示す第3の実施例で、斜めの輪郭
線上の点Fから、直接右及び下方向に走査して文字線に
ぶつかるか否かによってFに位相構造を取り入れること
ができる。
尚、本実施例では、文字部を黒画素で、背景部を白画素
で表わす場合を説明したが、黒・白あるいは色は限定さ
れるものではない。又、説明の簡略化のため、位相構造
の抽出を輪郭線に垂直な法線ベクトル上の画素で行って
いるが、法線ベクトル上に限定する必要はない。更に、
本実施例による特徴抽出の方法は、その認識対象を文字
に限定せず、一般の2次元画像の認識に応用することも
可能である。
以上説明したように本実施例によれば、二次元文字画像
から特徴ベクトルを抽圧し認識を行う文字認識において
、輪郭線上の黒画素にその点における傾きに応じて所定
の方法で定まる白画素の位相構造を付与することによっ
て、文字の変形、雑音に強(、かつ、計算量の少なくて
済む低次元の特徴ベクトルを効果的に抽出することがで
きるようになる。従って、後処理である文字認識処理に
おける認識速度及び認識率を上げることが可能となる。
[発明の効果] 以上説明したように本発明によれば、文字の背景部に含
まれている情報を安定して抽圧し、得られた特徴を輪郭
部の画素に付加することによって安定した特徴抽出が可
能になる。
【図面の簡単な説明】
第1図は実施例の文字認識装置のブロック構成図、 第2図(A)は本実施例による方法で選び出される特徴
の一部を示す図、 第2図(B)は第2図(A)の点A付近における拡大図
、 第3図は第1図のA、Bにおける傾きと位相構造とを表
わす図、 第4図は実施例における特徴抽出に係るフローチャート
、 第5図(A)、(B)及び第6図は従来技術による特徴
抽出の一例を示す図、 第7図は第2の実施例の特徴抽出処理の概念を示す図、 第8図は第3の実施例の特徴抽出処理の概念を示す図、 第9図は本実施例の神意A’ 、B’における位相構造
を示す図である。 図中、1・・・イメージリーグ、2・・・画像メモリ、
3・・・CPLI、4・・・ROM、5・・・RAM、
6・・・辞書部、7・・・8力部である。 第 図 にMへ軸メ 第 図(A) 第 図(B) 第 図 第 図

Claims (2)

    【特許請求の範囲】
  1. (1)入力した文字パターンにおける特徴を抽出する文
    字パターン特徴抽出方式において、 輪郭追跡によつて得られた注目画素に対する情報として
    、当該注目画素位置における傾きと、該傾き方向に対す
    る法線方向に所定距離離れた背景画素点における位相情
    報を抽出することを特徴とする文字パターン特徴抽出方
    式。
  2. (2)前記注目画素と背景画素位置との距離は、注目文
    字パターンの外接矩形の大きさ及び法線ベクトル方向に
    よつて変動することを特徴とする請求項第1項に記載の
    文字パターン特徴抽出方式。
JP2224344A 1990-08-28 1990-08-28 文字パターン処理方法及び装置 Expired - Fee Related JP2982150B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2224344A JP2982150B2 (ja) 1990-08-28 1990-08-28 文字パターン処理方法及び装置
EP91307768A EP0476852B1 (en) 1990-08-28 1991-08-23 Image processing method and apparatus
DE69131174T DE69131174T2 (de) 1990-08-28 1991-08-23 Verfahren und Gerät zur Bildverarbeitung
US08/250,941 US5754689A (en) 1990-08-28 1994-05-31 Image processing method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2224344A JP2982150B2 (ja) 1990-08-28 1990-08-28 文字パターン処理方法及び装置

Publications (2)

Publication Number Publication Date
JPH04106683A true JPH04106683A (ja) 1992-04-08
JP2982150B2 JP2982150B2 (ja) 1999-11-22

Family

ID=16812293

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2224344A Expired - Fee Related JP2982150B2 (ja) 1990-08-28 1990-08-28 文字パターン処理方法及び装置

Country Status (4)

Country Link
US (1) US5754689A (ja)
EP (1) EP0476852B1 (ja)
JP (1) JP2982150B2 (ja)
DE (1) DE69131174T2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH076209A (ja) * 1992-12-30 1995-01-10 Koninkl Ptt Nederland Nv 文字認識システムにおける文字の特徴を導出する方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015141260A1 (ja) * 2014-03-17 2015-09-24 株式会社河合楽器製作所 手書き音楽記号認識装置およびプログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5418632A (en) * 1977-07-12 1979-02-10 Nippon Telegr & Teleph Corp <Ntt> Character identification system
EP0149457B1 (en) * 1984-01-13 1993-03-31 Kabushiki Kaisha Komatsu Seisakusho Method of identifying contour lines
JPS61246877A (ja) * 1985-04-25 1986-11-04 Canon Inc 図形変換装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH076209A (ja) * 1992-12-30 1995-01-10 Koninkl Ptt Nederland Nv 文字認識システムにおける文字の特徴を導出する方法
US6240209B1 (en) 1992-12-30 2001-05-29 Koninklijke Ptt Nederland N.V. Method for deriving character features in a character recognition system

Also Published As

Publication number Publication date
JP2982150B2 (ja) 1999-11-22
DE69131174D1 (de) 1999-06-02
EP0476852A2 (en) 1992-03-25
EP0476852A3 (en) 1993-08-11
US5754689A (en) 1998-05-19
DE69131174T2 (de) 1999-10-21
EP0476852B1 (en) 1999-04-28

Similar Documents

Publication Publication Date Title
US5075895A (en) Method and apparatus for recognizing table area formed in binary image of document
JP3338537B2 (ja) 画像傾き検出装置
US5179599A (en) Dynamic thresholding system for documents using structural information of the documents
JP2930612B2 (ja) 画像形成装置
JPH02277183A (ja) 行抽出方法
US8472078B2 (en) Image processing apparatus for determining whether a region based on a combined internal region is a table region
WO1991020055A1 (en) Self-centering character stroke thickening for optical character recognition
JPH0418351B2 (ja)
JPH04106683A (ja) 文字パターン処理方法及び装置
EP0457546B1 (en) Image processing method and apparatus
JP2868134B2 (ja) 画像処理方法及び装置
JPH01161589A (ja) 文字認識方法
JPH02273884A (ja) 文書画像の歪検出補正方法
JP3095470B2 (ja) 文字認識装置
JPH0581475A (ja) 文字領域抽出方法
JP2003317107A (ja) 罫線抽出方法及び装置
JP2926842B2 (ja) 文字切出し回路
JP4282471B2 (ja) 画像特徴抽出装置、画像特徴抽出方法、プログラムおよび記録媒体
JPS6330980A (ja) パタ−ン認識装置
JPH03254275A (ja) 画像拡大縮小方法
KR100206825B1 (ko) 문서 영상화 방법
JPH0676108A (ja) 文書画像の傾き検出方法
JPH01152586A (ja) 文字図形認識方法
JPH0266681A (ja) 図面処理装置
JPH03172983A (ja) 表処理方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees