JPH1021398A - 方向特徴ベクトル抽出方法 - Google Patents

方向特徴ベクトル抽出方法

Info

Publication number
JPH1021398A
JPH1021398A JP8173398A JP17339896A JPH1021398A JP H1021398 A JPH1021398 A JP H1021398A JP 8173398 A JP8173398 A JP 8173398A JP 17339896 A JP17339896 A JP 17339896A JP H1021398 A JPH1021398 A JP H1021398A
Authority
JP
Japan
Prior art keywords
character
directional
feature vector
image
character stroke
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8173398A
Other languages
English (en)
Inventor
Fumiyoshi Nishio
文祥 西尾
Yasutaka Watanabe
康隆 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tamura Electric Works Ltd
Original Assignee
Tamura Electric Works Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tamura Electric Works Ltd filed Critical Tamura Electric Works Ltd
Priority to JP8173398A priority Critical patent/JPH1021398A/ja
Publication of JPH1021398A publication Critical patent/JPH1021398A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 斜め方向の輪郭線の方向特徴ベクトルを正確
に抽出するようにして正確な文字識別を行う. 【解決手段】 被識別文字の輪郭線画像を構成する黒画
素から輪郭線を水平,垂直,右上がり及び右下がりの各
方向パターンとして抽出すると共に、輪郭線画像を正規
化しこの正規化情報に基づいて上記の各方向パターンを
処理して各文字ストロークとして生成し、生成された各
方向の文字ストロークを水平及び垂直の各分割線により
それぞれ小領域に等分割し、分割された各小領域の黒画
素数を各個に計数して方向特徴ベクトルとして抽出する
場合、生成された右上がりまたは右下がりの各方向の文
字ストロークの画像を回転して分割線の方向に一致さ
せ、回転後の文字ストロークを小領域に分割する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は手書き文字等の被識
別文字を認識する文字認識技術に関し、特に被識別文字
の輪郭線から各方向パターンを抽出しかつ輪郭線の正規
化を行った後、この正規化情報に基づき処理された輪郭
線の各方向パターンから該パターンの方向特徴を示す方
向特徴ベクトルを抽出する方向特徴ベクトルの抽出方法
に関する。
【0002】
【従来の技術】一般に文字認識を行う場合は図7に示す
認識処理フローに従った手順で行われる。即ち、まず前
処理ステップS1において、認識されるべき被認識文字
の原画像からノイズ成分を除去する。次いで方向パター
ン作成ステップS2において、ノイズ成分が除去された
被認識文字の原画像から輪郭線画像を得て、この輪郭線
画像を各画素に分割し、文字情報を有する黒画素または
文字情報を有しない白画素の2値画素として構成する。
そして、黒画素または白画素の各画素からなる2値画像
から輪郭線画像の方向パターンを抽出する。
【0003】こうして方向パターンが抽出された後で、
次の正規化ステップS3では、その方向パターンが抽出
された画像が予め定められた大きさの正方形枠内に収ま
るようにその画像の各方向パターンを一定の比率で拡大
または縮小変換する。そして正規化処理された画像の各
方向パターンについて、次の特徴ベクトル作成ステップ
S4では、8×8の小領域(正方領域)に等分割し、各
小領域の黒画素数を特徴量とすることで、各方向パター
ンの特徴ベクトルを作成する。
【0004】次に大分類ステップS5では、上記ステッ
プS4で求めた入力文字(被認識文字)の方向特徴ベク
トルに対し、予め設けた辞書のベクトルの中で距離の近
いベクトルを有する候補文字を距離の近いものから順に
複数抽出する。この距離計算は、式(1)に示す4−近
傍距離(4−neighor−distance)と呼
ばれる一般的な計算法を用いて演算される。
【0005】即ち、 d4 ((i、j),(h,k))=|i−h|+|j−k| (1) (但し、(i、j)は入力文字の座標値、(h,k)は
辞書の文字の座標値) その後、詳細分類ステップS6では、精緻なパターン
(例えば、別に32×32次元の特徴ベクトルを用意す
る)を用いて詳細比較を行うことで最終的な文字識別を
行う。
【0006】
【発明が解決しようとする課題】従来は、方向特徴ベク
トルを抽出する場合、正規化処理された輪郭線の水平,
垂直,右上がり及び右下がりの各方向パターンについ
て、それぞれ8×8の各正方形領域に等分割し、等分割
した各小領域の画素数を計数してこの各小領域毎の計数
値をそのパターンの方向特徴ベクトルとしている。この
ため、上記の各小領域に等分割する分割線の方向と一致
した水平方向または垂直方向の各成分を有する輪郭線の
各文字ストロークについては、連続的な情報を得ること
ができ、従って正確な方向特徴ベクトルとして抽出する
ことができる。
【0007】しかし、右上がりまたは右下がり等の斜め
方向の成分を有する文字ストロークの場合は、図6に示
すように、文字ストロークSの方向成分が各小領域e1
〜e9を分割する分割線の方向と一致していないため、
ストロークの情報が隣接する各小領域に分散し、連続し
たストローク情報として得ることができない。このた
め、正確な方向特徴ベクトルとして抽出できず、従って
正確な文字識別を行うことができないという問題があっ
た。従って本発明は、斜め方向の輪郭線の方向特徴ベク
トルを正確に抽出するようにして正確な文字識別を行う
ことを目的とする。
【0008】
【課題を解決するための手段】このような課題を解決す
るために本発明は、被識別文字の輪郭線画像を構成する
黒画素から輪郭線を水平,垂直,右上がり及び右下がり
の各方向パターンとして抽出すると共に、輪郭線画像を
正規化しこの正規化情報に基づいて上記の各方向パター
ンを処理して各文字ストロークとして生成し、生成され
た各方向の文字ストロークを水平及び垂直の各分割線に
よりそれぞれ小領域に等分割し、分割された各小領域の
黒画素数を各個に計数して方向特徴ベクトルとして抽出
する場合、生成された文字ストロークの画像を分割線の
方向に一致させるように回転すると共に、回転後の文字
ストロークを小領域に等分割するようにした方法であ
る。従って、分割線の方向からずれた文字ストロークを
分割線に一致させることで、輪郭線の正確な方向特徴ベ
クトルが得られる。また、回転の対象となる文字ストロ
ークの画像を右上がりまたは右下がりの各方向の文字ス
トロークとする。従って、斜め方向の輪郭線の方向特徴
ベクトルを的確に抽出できる。
【0009】
【発明の実施の形態】以下、本発明について図面を参照
して説明する。図1は本発明を適用した装置の構成を示
すブロック図である。同図において、本装置は、CPU
1、タッチパネル2、タッチパネルの下面に形成された
LCD3、メモリ4、及び辞書メモリ5からなる手書き
文字入力装置である。ここで、タッチパネル2上の例え
ばA点からB点までの間を、図示しない入力ペンにより
押下しながら移動させると、CPU1はこの間の入力ペ
ンの移動軌跡を複数の座標値としてタッチパネル2を介
して入力する。そして、メモリ4にそのA点からB点ま
での線分を記憶すると共に、LCD3の対応部分にその
線分を表示する。このようにしてペン入力に基づく手書
き文字をLCD3に表示することができる。
【0010】また、こうしてメモリ4に記憶されかつL
CD3に表示された手書き文字について、CPU1は以
下に示すような各処理を行い、その処理結果と辞書メモ
リ5内に記憶された各字種とを比較することで、その手
書き文字がどの字種に該当するかを認識する。即ち、こ
の場合CPU1はまず被識別文字である入力文字(手書
き文字)からノイズ等を除去して滑らかな文字とする前
処理を行う。その後、図2(a)に示すこの原画像から
図2(b)に示すような輪郭線画像を得て、その輪郭線
画像を64×64の各画素として分割する。
【0011】そして、その輪郭線を構成する全画素(黒
画素)について、それぞれ各画素が有している方向成分
を検出する。即ち、輪郭線を構成する任意の黒画素に着
目し、その着目画素と、その着目画素の前後の黒画素と
の接続パターンから、着目画素の方向成分を検出する。
図3はこのような黒画素の方向成分の検出状況を示す図
である。
【0012】ここで、図3において、斜線部分の画素a
〜cは輪郭線を構成する黒画素を示し、斜線部分以外の
画素は白画素であるとする。そして、着目画素をb、そ
の前後の黒画素をそれぞれa,cとすると、輪郭線は、
黒画素aから水平に着目画素bに入り、さらに着目画素
bを通って右上がり方向にある黒画素cに達することか
ら、着目画素bでは、水平方向成分と右上がり方向成分
の2つの方向成分を有することが分かる。そしてこれら
2つの方向成分が着目画素bの方向成分として検出され
る。なお、輪郭線を構成する黒画素の方向成分としては
上述の2つの方向成分の他に、垂直方向成分と右下がり
方向成分があるが、1つの黒画素については、これら4
つの方向成分のうち2つの方向成分が割り付けられる。
【0013】CPU1は、輪郭線の方向パターンを抽出
する場合、輪郭線上の全ての各黒画素について、各黒画
素毎に順次方向成分を検出し、検出した各黒画素の方向
成分に基づき輪郭線の方向パターンを抽出する。このよ
うにして、図4(a)に示す原図形(輪郭線画像とす
る)から、図4(b)に示す水平,垂直,右下がり及び
右上がりの各方向パターンが生成される。
【0014】一方、それとは別に図4(a)の原図形か
ら線間隔を求めて、図4(c)に示すような線密度情報
を得る。ここで原図形を8×8の領域に分割するが、こ
のときの各領域の線密度が上記線密度情報と同一の密度
となるように分割線の位置を決定する非線形正規化処理
を行う。図4(d)はその非線形正規化処理の結果を示
す図である。そしてこの分割線の位置を示す非線形正規
化情報をもとに同図(b)のそれぞれの方向パターンに
対して非線形写像を行い、図4(e)のような各方向パ
ターン毎の処理結果を得る。
【0015】こうしたCPU1による非線形正規化処理
の終了後、CPU1は図4(e)に示す各方向パターン
毎にそれぞれ8×8の正方形の各小領域に等分割し、等
分割した各小領域の黒画素数を計数し、各小領域毎の計
数値をそのパターンの方向特徴ベクトルとして生成す
る。図5はこのような等分割の例を示す図であり、図5
(b)は水平方向の文字ストロークを、また図5(c)
は垂直方向の文字ストロークを、図5(d)及び図5
(e)はそれぞれ右下がり方向及び右上がり方向の各文
字ストロークを示している。
【0016】ここで、各小領域内の黒画素数から特徴量
(即ち、方向特徴ベクトル量)を得ようとすると、図5
(b),(c)に示すような水平及び垂直方向の各文字
ストロークに関しては正確な情報が抽出できるが、図5
(d),(e)に示すような斜め方向の文字ストローク
に関しては、領域分割線の方向と合致していないため連
続的なストローク情報が得られず、従って正確な方向特
徴ベクトルが得られないという問題がある。このため、
図5(d),(e)に示す斜め方向パターンの各文字ス
トロークについては、その画像を45゜だけ角度を反時
計方向に回転させて図5(h),(i)に示す画像に変
換し、この画像から方向特徴ベクトルを抽出できるよう
にする。
【0017】このような画像の回転変換は、以下の式
(2)及び式(3)からなる連立方程式に基づいて行わ
れる。即ち、変換後の文字ストロークの座標をx’,
y’とすると、変換前の文字ストロークのx座標は、 x=(x’−y’)/21/2 (2) また、変換前の文字ストロークのy座標は、 y=(x’+y’)/21/2 (3) として表すことができる。
【0018】従って、回転後の座標位置(x’,y’)
と元(回転前)の文字ストロークの座標位置(x,y)
との対応関係を、式(2),(3)から求め、元の文字
ストロークの座標位置の値を回転後の座標位置に移動さ
せることにより、画像(図形)を45゜回転させること
ができる。こうして、45゜回転した文字ストロークに
ついて、それぞれ図5(h),(i)に示すような8×
8の小領域に等分割する。その後、等分割された正方形
の各小領域内の黒画素の数を計数し、この各小領域毎の
計数値により、右下がり方向の文字ストロークに関する
方向特徴ベクトル及び右上がり方向の文字ストロークに
関する方向特徴ベクトルを得る。
【0019】このようにして方向特徴ベクトルを求める
ことができる。その後、求めた方向特徴ベクトルに対
し、辞書メモリ5内の辞書のベクトルの中で距離の近い
ベクトルを有する候補文字を距離の近いものから順に複
数抽出し、抽出された候補文字と入力文字とをさらに詳
細に比較することで、最終的な文字識別を行う。表1
は、本発明の方向特徴ベクトル抽出方法に基づく文字認
識実験の結果と、画像を回転させない従来方式による文
字認識の結果を認識率(%)で示したものである。な
お、図中の1位分類率,3位分類率,・・・は、被認識
文字のサンプルが辞書から候補文字として選択されたと
きの順位を示している。
【0020】
【表1】
【0021】ここで、本発明の方向特徴ベクトル抽出法
による認識実験結果と、従来方式による認識実験結果を
比較すると、何れの分類率においても本発明の方向特徴
ベクトル抽出法を用いた場合の文字認識率が従来方式を
上回っていることが分かる。このように、方向特徴ベク
トルを抽出する場合、斜め方向のストロークが主成分と
なる画像を45゜回転させて水平または垂直方向の画像
に変換するようにしたものである。従って、水平または
垂直方向の文字ストロークと同様に連続したストローク
情報を抽出することが可能になり、従って正確な画像の
方向特徴ベクトルを抽出することができる。
【0022】また、本実施の形態では、右上がり及び右
下がりの各方向成分を有する文字ストロークを45゜回
転させるようにしたが、回転角を自在に設定することに
より、水平または垂直方向の文字ストロークにも適用す
ることができる。一般に、文字を書く場合、右上がりの
文字を書くことが多い。このような場合に水平方向の文
字ストロークを所定角度だけ回転させてその右上がりの
文字を水平方向に近づけ、より正確な文字ストロークに
することができる。従って、正確な方向特徴ベクトルが
抽出され、正確な文字認識を行うことができる。なお、
垂直方向成分の文字ストロークについても同様である。
なお、本実施の形態では手書き文字の例について説明し
たが、OCRで読み取った文字データなど、ビットマッ
プデータであればどのような文字データであっても良
い。
【0023】
【発明の効果】以上説明したように本発明によれば、被
識別文字の輪郭線画像を構成する黒画素から輪郭線を水
平,垂直,右上がり及び右下がりの各方向パターンとし
て抽出すると共に、輪郭線画像を正規化しこの正規化情
報に基づいて上記の各方向パターンを処理して各文字ス
トロークとして生成し、生成された各方向の文字ストロ
ークを水平及び垂直の各分割線によりそれぞれ小領域に
等分割し、分割された各小領域の黒画素数を各個に計数
して方向特徴ベクトルとして抽出する場合、生成された
文字ストロークの画像を分割線の方向に一致させるよう
に回転すると共に、回転後の文字ストロークを小領域に
等分割するようにしたので、分割線の方向からずれた文
字ストロークの画像が分割線の方向に一致することによ
り連続したストローク情報が得られ、この結果、輪郭線
の正確な方向特徴ベクトルが得られることから、正確な
文字認識を行うことができる。また、回転の対象となる
文字ストロークの画像を右上がりまたは右下がりの各方
向の文字ストロークとしたので、斜め方向の輪郭線の方
向特徴ベクトルを的確に抽出できる。
【図面の簡単な説明】
【図1】 本発明を適用した装置の構成を示すブロック
図である。
【図2】 本装置で認識処理される原画像及びこの原画
像の輪郭線を示す図である。
【図3】 本装置における画素の方向成分の検出状況を
示す図である。
【図4】 輪郭線の方向パターンの抽出状況及び非線形
正規化処理の状況を示す図である。
【図5】 方向特徴ベクトルを得る際の文字ストローク
の回転状況を示す図である。
【図6】 正確な方向特徴ベクトルが得られない斜め方
向の輪郭線の例を示す図である。
【図7】 従来の文字認識過程を示す認識処理フローで
ある。
【符号の説明】
1…CPU、2…タッチパネル、3…LCD、4…メモ
リ、5…辞書メモリ。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 被識別文字の輪郭線画像を構成する黒画
    素から輪郭線を水平,垂直,右上がり及び右下がりの各
    方向パターンとして抽出すると共に、輪郭線画像を正規
    化しこの正規化情報に基づいて前記各方向パターンを処
    理して各文字ストロークとして生成し、生成された各方
    向の文字ストロークを水平及び垂直の各分割線によりそ
    れぞれ小領域に等分割し、分割された各小領域の黒画素
    数を各個に計数して方向特徴ベクトルとして抽出する方
    向特徴ベクトル抽出方法において、 生成された前記文字ストロークの画像を前記分割線の方
    向に一致させるように回転させると共に、回転後の文字
    ストロークを前記小領域に等分割することを特徴とする
    方向特徴ベクトル抽出方法。
  2. 【請求項2】 請求項1において、 前記回転の対象となる文字ストロークの画像は右上がり
    または右下がりの各方向の文字ストロークであることを
    特徴とする方向特徴ベクトル抽出方法。
JP8173398A 1996-07-03 1996-07-03 方向特徴ベクトル抽出方法 Pending JPH1021398A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8173398A JPH1021398A (ja) 1996-07-03 1996-07-03 方向特徴ベクトル抽出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8173398A JPH1021398A (ja) 1996-07-03 1996-07-03 方向特徴ベクトル抽出方法

Publications (1)

Publication Number Publication Date
JPH1021398A true JPH1021398A (ja) 1998-01-23

Family

ID=15959681

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8173398A Pending JPH1021398A (ja) 1996-07-03 1996-07-03 方向特徴ベクトル抽出方法

Country Status (1)

Country Link
JP (1) JPH1021398A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010108113A (ja) * 2008-10-29 2010-05-13 Hitachi Computer Peripherals Co Ltd 文字認識装置
JP2017167329A (ja) * 2016-03-16 2017-09-21 アイラボ株式会社 プログラム、情報記憶媒体及び筆順判定装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010108113A (ja) * 2008-10-29 2010-05-13 Hitachi Computer Peripherals Co Ltd 文字認識装置
JP2017167329A (ja) * 2016-03-16 2017-09-21 アイラボ株式会社 プログラム、情報記憶媒体及び筆順判定装置

Similar Documents

Publication Publication Date Title
CN110232311B (zh) 手部图像的分割方法、装置及计算机设备
US5410611A (en) Method for identifying word bounding boxes in text
US7437001B2 (en) Method and device for recognition of a handwritten pattern
JPH02268388A (ja) 文字認識方法
US8571264B2 (en) Method of using structural models for optical recognition
US10318803B1 (en) Text line segmentation method
JP2651009B2 (ja) 情報認識装置
CN111860309A (zh) 一种人脸识别方法及系统
JP2019102061A5 (ja)
US6246793B1 (en) Method and apparatus for transforming an image for classification or pattern recognition
CN111046881A (zh) 基于计算机视觉和深度学习的指针式仪表读数识别方法
Aziz et al. Bangla handwritten numeral character recognition using directional pattern
JP2007025902A (ja) 画像処理装置、画像処理方法
JPH1021398A (ja) 方向特徴ベクトル抽出方法
US6483943B1 (en) Feature value extraction methods and apparatus for image recognition and storage medium for storing image analysis program
Naz et al. Challenges in baseline detection of cursive script languages
JPH05225394A (ja) 文字認識システムの候補文字分類方法
JP2000076378A (ja) 文字認識方法
JPH0935000A (ja) 手書き文字認識方法及び装置
JPH07193716A (ja) エッジ強調装置
JPH1021397A (ja) 方向特徴ベクトル抽出方法
JPH1021332A (ja) 非線形正規化方法
KR100290606B1 (ko) 온라인 한글 필기체 문자 인식방법
Martyshkin et al. Research of the Handwriting Recognition Methods
JP2803709B2 (ja) 文字認識装置及び文字認識方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050113

A131 Notification of reasons for refusal

Effective date: 20061212

Free format text: JAPANESE INTERMEDIATE CODE: A131

A521 Written amendment

Effective date: 20070213

Free format text: JAPANESE INTERMEDIATE CODE: A523

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070313

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070326

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100413

Year of fee payment: 3

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 4

Free format text: PAYMENT UNTIL: 20110413

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120413

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees