JPH1027215A - 文字パターンの認識処理方法及び装置 - Google Patents

文字パターンの認識処理方法及び装置

Info

Publication number
JPH1027215A
JPH1027215A JP8179405A JP17940596A JPH1027215A JP H1027215 A JPH1027215 A JP H1027215A JP 8179405 A JP8179405 A JP 8179405A JP 17940596 A JP17940596 A JP 17940596A JP H1027215 A JPH1027215 A JP H1027215A
Authority
JP
Japan
Prior art keywords
character
character pattern
white pixels
mesh
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8179405A
Other languages
English (en)
Inventor
Minoru Mori
稔 森
Toru Wakahara
徹 若原
Kazumi Odaka
和己 小高
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP8179405A priority Critical patent/JPH1027215A/ja
Publication of JPH1027215A publication Critical patent/JPH1027215A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 文字線の傾きや位置ずれ、接続関係の変動の
影響を受けにくくし、手書き変形の多い文字対象を認識
可能とする。 【解決手段】 2値化された文字パターンを複数の粗い
メッシュ領域に分割する(301)。各メッシュ領域内
に存在する白画素について、あらかじめ定めた複数方向
に触手を伸ばして各方向別に白画素の連結長を求める
(302)。該白画素連結長から該白画素の背景部の方
向成分別の分布状況を表わす方向寄与度の値を各メッシ
ュ領域毎に計数し、文字パターンの特徴とする(30
3)。この特徴は、文字の2次元的な構造を表わし、か
つ、文字線の傾きや位置ずれ、接続関係の変化の影響を
受けにくく、手書き変形の多い文字対象の認識が可能に
なる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字パターンの認
識方法及び装置に関し、特に光電変換によって得られた
文字パターンを2値化した文字パターンに対して、手書
き漢字のような多字種、多様な手書き変形をもつ文字対
象を認識するのに好適な文字パターン認識方法及び装置
に関するものである。
【0002】
【従来の技術】文字パターン認識には、従来から種々の
方法が提案されているが、その一つにメッシュ分割法が
ある。従来、これの代表的な方法としては、次のような
ものが知られている。
【0003】第1の方法は、2値化し、位置及び大きさ
の正規化を行った文字パターンを、複数の粗いメッシュ
領域に分割し、各メッシュ領域内に存在する文字部に対
して複数方向の座標軸から観測し、該座標軸上の各位置
における該座標軸に直交する方向の文字部を横切る文字
線数を計数し、この情報から特徴ベクトルパターンを作
成し、すでに蓄えておいた各文字の特徴辞書テーブルと
のマッチングをとり、文字パターンの認識を行う方法で
ある。
【0004】また、第2の方法は、同様に、2値化し、
位置及び大きさの正規化を行った文字パターンを、複数
の粗いメッシュ領域に分割し、各メッシュ領域内に存在
する文字部に対して複数方向の座標軸から観測し、該座
標軸から走査した際に交差した文字部の黒画素につい
て、文字線の方向寄与度を求めることにより文字を認識
する方法である。
【0005】
【発明が解決しようとする課題】上記従来技術におい
て、第1の方法では、文字部を横切る文字線数によって
字種の違いによる文字線構造の大まかな複雑さの違いを
区別できるものの、より詳細な文字線構造の違いを表す
情報がない為、類似文字が多くかつ手書き変形も多い文
字対象をうまく認識できないという問題点があった。ま
た、第2の方法では、文字線の傾きや位置ずれ、接続関
係の変化等の手書き変形の多い文字対象をうまく認識で
きないという問題点があった。
【0006】本発明の目的は、2値化し、位置及び大き
さの正規化をされた文字パターンについて、文字の二次
元的な構造に関する情報がえられ、かつ文字線の傾きや
位置ずれ、接続関係の変化等を受けにくい特徴を用いる
ことにより、文字線の傾きや接続関係の変化等の手書き
変形の多い文字対象を認識することを可能にする文字パ
ターン認識処理方法及び装置を提供することにある。
【0007】
【課題を解決するための手段】上記目的を達成するた
め、本発明は、文字パターンにおける背景部の白点の方
向寄与度を複数に分割された各粗いメッシュ領域ごとに
計算することにより、文字線の相互配置関係に関する情
報を求めることを特徴とする。これにより、文字の二次
元的な構造が得られ、かつ文字線の傾きや位置ずれ、接
続関係の変化の影響を受けにくくなるので、手書き変形
の多い文字対象を認識できるようになる。
【0008】
【発明の実施の形態】以下に、図面を参照して本発明の
一実施例を説明する。図1は、本発明の一実施例を説明
する全体構成図である。図において、10は2値化され
た入力文字パターン、20は前処理部、30は特徴抽出
部、40は識別処理部、50は特徴辞書テーブル、60
は識別結果である。
【0009】前処理部20は、例えば従来から知られて
いる位置の正規化処理法を用いて、入力文字パターン1
0を構成する全黒点のx,y座標値の各々の平均値を算
出して文字の重心と定義し、ついで該重心が文字枠の中
心位置にくるように入力文字パターン全体の平行移動処
理を行う。また、同様に、従来から知られている大きさ
の正規化処理法を用いて、重心から各筆点への距離の平
均値があらかじめ定めた正規化半径に等しくなるよう
に、重心回りに一様に文字パターンの拡大/縮小処理を
行う。さらに、該前処理部20では、位置と大きさの正
規化処理後の文字パターンが文字枠をはみ出した場合に
は、文字枠にはみ出した文字部を除去する処理(枠取り
処理)を行ったり、また、位置と大きさの正規化処理後
の文字パターンの文字線輪郭部分の黒点の1メッシュの
凹凸をそれぞれ埋めるかまたは取り除く処理(平滑化処
理)を行う。
【0010】図2に、文字「圧」について、前処理部2
0の正規化処理により入力文字パターン10が正規化さ
れる例を示す。図2(a)は入力文字パターン10の例
である。図2(b)は、前処理部20において、該入力
文字パターン10に対して位置と大きさの正規化処理を
行った後の文字パターンである。また、図2(c)は、
位置と大きさの正規化処理後の文字パターンが文字枠を
はみ出した例、図2(d)は、これに対して枠取り処理
を行った例、図2(e)は、平滑化処理を行った例をそ
れぞれ示している。
【0011】特徴抽出部30は、本発明の主要部をなす
もので、前処理部20において正規化処理を施こされた
文字パターンを入力して、該文字パターンを複数の粗い
メッシュ領域に分割し、各メッシュ領域内の白画素につ
いてあらかじめ定めた複数方向に触手を伸ばし、各方向
に連絡する白点の点数を計数し、該白画素の方向寄与度
を求める処理を行う。
【0012】図3に、該特徴抽出部30の処理フローチ
ャートを示す。ここで、301は文字パターンを複数の
粗いメッシュ領域に分割する処理、302は各メッシュ
領域内の白画素について、複数方向(例えば8方向の場
合には0°、45°、90°、135°、180°、2
25°、270°、315°の8方向)に触手を伸ばし
て、各方向別に白画素の連結長を求める処理、303は
白画素連結長から該白画素の背景部の各方向成分別の分
布状況を表す方向寄与度の値を各メッシュ領域毎に計数
し、当該文字パターンの特徴とする処理である。なお、
この特徴抽出部30の具体的処理のアルゴリズムについ
ては後述する。
【0013】識別部40は、特徴抽出部30によって得
られた方向寄与度の値をもとに文字パターンを識別する
ための特徴テーブルを作成し、該特徴テーブルをもと
に、すでに蓄えておいた各文字の特徴辞書テーブル50
と従来から知られているマッチング方法によりマッチン
グをとり、文字パターンの識別を行う。
【0014】次に、特徴抽出部30の処理のアルゴリズ
ムとして、文字パターンをK個の粗いメッシュ領域に分
割し、各メッシュ領域内の背景部の白画素について8方
向(0°、45°、90°、135°、180°、22
5°、270°、315°)に触手を伸ばして、背景部
の方向寄与度を求め、文字パターンを識別する場合を説
明する。
【0015】図4は、前処理部20によって得られたN
×Nメッシュの文字パターンを、K個の粗いメッシュ領
域、例えば正方形のメッシュ領域に等分割する様子を示
す。図4において、1,2,・・・,k,・・・,Kが
それぞれメッシュ領域である。図5は、メッシュ領域内
の白画素について触手を伸ばす8方向(0°、45°、
90°、135°、180°、225°、270°、3
15°)を示した図、図6は、メッシュ領域内の白画素
から8方向に触手を伸ばして白画素連結長を求める様子
を示した図である。以下では、0°、45°、90°、
135°、180°、225°、270°、315°の
各8方向に、それぞれ1,2,3,4,5,6,7,8
の番号を付ける。
【0016】第k番目(1,2,・・・,k,・・・,
K)のメッシュ領域内における背景部の各白点の方向寄
与度fは、 f=(α1,α2,α3,α4,α5,α6,α7,α
8) なる8次元ベクトルで表される。ここで、α1,α2,
・・・,α8はそれぞれ、8方向の方向寄与度成分で、
該当白点から8方向に触手を伸ばし、各方向別に得られ
る白点連結長li(i=1,2,・・・,8)を用い
て、例として
【0017】
【数1】
【0018】で表される。このαiには、ここで示した
ユークリッド距離以外の距離を適用することも可能であ
る。
【0019】このようにして求められるfを各メッシュ
領域内の全白点について求め累積することにより、また
は累積した値を白点の数によって平均化することによ
り、第k番目のメッシュ領域において得られる特徴パタ
ーンfkは、 fk=(αk1,αk2,・・・,αk8) で表される。ここで、αk1,αk2,・・・,αk8
は、第k番目のメッシュ領域内に存在する全ての白点に
おける方向寄与度ベクトルをそれぞれ方向成分別に累積
した方向寄与度のベクトルの各要素、または方向成分別
に累積した方向寄与度のベクトルの各要素を白点の数に
よって平均化した各要素である。したがって文字パター
ンの特徴ベクトルFは、 F=(f1,f2,・・・,fk,・・・,fK) で表される。
【0020】このようにして表される文字パターンの特
徴ベクトルFの各要素の値を文字パターンの特徴として
特徴テーブルを作成し、識別部40において、例えば従
来から知られている識別関数としてユークリッド距離な
どの識別関数D(F)を求め、文字パターンを識別す
る。
【0021】ここで、識別関数は入力文字パターンの特
徴ベクトルと、あらかじめ蓄えられている特徴辞書テー
ブル50の各文字種ごとの特徴ベクトル間で距離値の演
算を行い、距離値の一番小さい(関数によっては一番大
きい)値をとった文字を候補文字として出力する。
【0022】特徴抽出部30で得られた入力文字パター
ンの特徴ベクトルをF=(f1,f2,・・・,fk,
・・・,fK)、特徴辞書テーブル50の各文字i(1
≦i≦M)の特徴ベクトルをSi=(si1,si2,
・・・,siK)とすると、例えばユークリッド距離の
場合、識別部40では、i=1〜Mまでの字種の間で、
【0023】
【数2】
【0024】の計算を行い、一番小さい値を取ったiの
字種を正解文字パターンとして出力する。
【0025】次に、特徴抽出部30における別のアルゴ
リズムの適用例を説明する。前処理部20によって得ら
れたN×Nメッシュの文字パターンを、K個の粗いメッ
シュ領域、例えば正方形のメッシュ領域に等分割する。
本アルゴリズムでは、第k番目(1,2,・・・,k,
・・・,K)のメッシュ領域内における背景部の各白点
の方向寄与度gを、 g=(β1,β2,β3,β4) なる4次元ベクトルで表す。ここで、β1,β2,・・
・,β4はそれぞれ4方向の方向寄与度成分で、該当白
点から8方向に触手を伸ばし、各方向別に得られる白点
連結長li(i=1,2,・・・,8)を用いて、例と
して
【0026】
【数3】
【0027】で表される。なお、このβiには、ここで
示したユークリッド距離以外の距離を適用することも可
能である。
【0028】このようにして求められるgを各メッシュ
領域内の全白点について求め、累積することにより、ま
たは累積した値を各メッシュ領域内の白点の数によって
平均化することにより、第k番目のメッシュ領域におい
て得られる特徴パターンgkは、 gk=(βk1,βk2,βk3,βk4) で表される。ここで、βk1,βk2,βk3,βk4
は、第k番目のメッシュ領域内に存在する全ての白点に
おける方向寄与度ベクトルをそれぞれ方向成分別に累積
した方向寄与度のベクトルの各要素、または方向成分別
に累積した方向寄与度のベクトルの各要素を白点の数に
よって平均化した各要素である。したがって文字パター
ンの特徴ベクトルGは、 G=(g1,g2,・・・,gk,・・・gK) で表される。
【0029】このようにして表される文字パターンの特
徴ベクトルGの各要素の値を文字パターンの特徴として
特徴テーブルを作成し、識別部40において、例えば従
来から知られている識別関数としてユークリッド距離な
どの識別関数D(G)を求め、文字パターンを識別す
る。
【0030】
【発明の効果】以上説明したように、本発明によれば、
背景部の方向寄与度を求めることにより、文字の相対配
置及び輪郭近傍の形状が抽出できるので、文字線の傾き
や位置ずれ、接続関係の変動の影響を受けにくくなるこ
とにより、手書き変形の多い文字対象を認識できること
が可能になる。
【図面の簡単な説明】
【図1】本発明の一実施例を示す全体構成図である。
【図2】前処理部における前処理の様子を示す図であ
る。
【図3】特徴抽出部における処理フローチャートであ
る。
【図4】特徴抽出部における文字パターンを粗いメッシ
ュ領域に分割する様子を示す図である。
【図5】特徴抽出部において白点連結長を求めるために
触手を伸ばす方向として、8方向にした場合を示す図で
ある。
【図6】特徴抽出部において白点連結長を求める様子を
示す図である。
【符号の説明】
10 入力文字パターン 20 前処理部 30 特徴抽出部 40 識別部 50 特徴辞書テーブル 60 識別結果

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 2値化された文字パターンを複数のメッ
    シュ領域に分割し、各メッシュ領域内に存在する白画素
    についてあらかじめ定めた複数方向に触手を伸ばして各
    方向別に白画素の連結長を求め、該白画素連結長から該
    白画素の背景部の方向成分別の分布状況を表す方向寄与
    度の値を各メッシュ領域毎に計数し、該方向寄与度の値
    を用いて文字パターンを認識することを特徴とする文字
    パターン認識処理方法。
  2. 【請求項2】 2値された文字パターンに文字の位置及
    び大きさについて正規化処理を行う前処理部と、前記正
    規化された文字パターンを複数のメッシュ領域に分割
    し、各メッシュ領域内に存在する白画素についてあらか
    じめ定めた複数方向に触手を伸ばして各方向別に白画素
    の連結長を求め、該白画素連結長から該白画素の背景部
    の方向成分別の分布状況を表す方向寄与度の値を各メッ
    シュ領域毎に計数して該文字パターンの特徴する特徴抽
    出部と、前記特徴を利用した識別処理を行う識別部とを
    備えることを特徴とする文字パターン認識装置。
JP8179405A 1996-07-09 1996-07-09 文字パターンの認識処理方法及び装置 Pending JPH1027215A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8179405A JPH1027215A (ja) 1996-07-09 1996-07-09 文字パターンの認識処理方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8179405A JPH1027215A (ja) 1996-07-09 1996-07-09 文字パターンの認識処理方法及び装置

Publications (1)

Publication Number Publication Date
JPH1027215A true JPH1027215A (ja) 1998-01-27

Family

ID=16065300

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8179405A Pending JPH1027215A (ja) 1996-07-09 1996-07-09 文字パターンの認識処理方法及び装置

Country Status (1)

Country Link
JP (1) JPH1027215A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6528658B1 (en) 1999-02-19 2003-03-04 Daicel Chemical Industries, Ltd. Process for preparing cycloalkanone

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6528658B1 (en) 1999-02-19 2003-03-04 Daicel Chemical Industries, Ltd. Process for preparing cycloalkanone

Similar Documents

Publication Publication Date Title
CN107748877B (zh) 一种基于细节点和纹理特征的指纹图像识别方法
JP4062987B2 (ja) 画像の領域分割方法、画像の領域分割装置、画像の領域分割プログラム
US5719959A (en) Similarity determination among patterns using affine-invariant features
EP0604687A1 (en) Method for deriving character features in a character recognition system
CN116503848A (zh) 车牌的智能识别方法、装置、设备及存储介质
JPH1027215A (ja) 文字パターンの認識処理方法及び装置
CN115471650A (zh) 一种气体压力仪表读数方法、装置、设备及介质
JPH1027216A (ja) 文字パターンの認識処理方法及び装置
JP4264332B2 (ja) 文字認識装置、ナンバープレート認識システム
CN112085816A (zh) 一种字形曲线生成方法及装置
JP3113769B2 (ja) 文字認識装置
JP2785747B2 (ja) 文字読取装置
Kurnia et al. Object detection on hindered condition by using chain code-based angle detection
JPS5951033B2 (ja) 図形基本要素抽出装置
Pal et al. Circular arc segmentation by curvature estimation and geometric validation
JP3758229B2 (ja) 線分抽出方法、線分抽出装置及び線分抽出処理プログラム
Shen et al. Feature extraction in fingerprint images
KR100235353B1 (ko) 패턴 인식 시스템에서 입력 영상의 원 추출 방법
RU2364936C1 (ru) Способ формирования представления (шаблона) отпечатка пальца человека
KR940007935B1 (ko) 문자 인식을 위한 후보 분류 방법
GB2329738A (en) Determining relationship between line segments in pattern recognition
JPS62271190A (ja) セグメント数字認識方式
JP3104355B2 (ja) 特徴抽出装置
JP2623559B2 (ja) 光学式文字読取装置
JP2000067162A (ja) 文字パターンの認識方法及びその装置及びその方法を記録した記録媒体

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040413