JP2649806B2 - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JP2649806B2
JP2649806B2 JP62190302A JP19030287A JP2649806B2 JP 2649806 B2 JP2649806 B2 JP 2649806B2 JP 62190302 A JP62190302 A JP 62190302A JP 19030287 A JP19030287 A JP 19030287A JP 2649806 B2 JP2649806 B2 JP 2649806B2
Authority
JP
Japan
Prior art keywords
bending
codes
code
degree
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP62190302A
Other languages
English (en)
Other versions
JPS6435674A (en
Inventor
信夫 宮本
隆彦 川谷
敏夫 堤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ENU TEI TEI DEETA TSUSHIN KK
Nippon Telegraph and Telephone Corp
Original Assignee
ENU TEI TEI DEETA TSUSHIN KK
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ENU TEI TEI DEETA TSUSHIN KK, Nippon Telegraph and Telephone Corp filed Critical ENU TEI TEI DEETA TSUSHIN KK
Priority to JP62190302A priority Critical patent/JP2649806B2/ja
Publication of JPS6435674A publication Critical patent/JPS6435674A/ja
Application granted granted Critical
Publication of JP2649806B2 publication Critical patent/JP2649806B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、文字認識方法に関するもので、特に文字の
入力2値パタンの輪郭線の方向が急激に変化する点(以
下、屈曲点という)およびその近傍の輪郭部の形状に関
する情報を用いて認識を行う文字認識方法に関するもの
である。
(従来の技術) 文字パタン輪郭部の屈曲点情報、すなわち屈曲点の位
置座標、屈曲点近傍の輪郭部の屈曲方向(以下、屈曲点
の屈曲方向と称す)や屈曲の度合い(凹凸種別を含む。
以下、屈曲点の屈曲度と称す)は、文字認識を行ううえ
で、非常に有効な情報である。
しかし、従来の文字認識方法においては、電子技術総
合研究所研究報告第831号[昭和58年]「構造解析法に
よる手書文字認識に関する研究」,(山本和彦著),87
ページから101ページに記載されている弛緩整合法に代
表されるように、隣接した屈曲点間の輪郭線を線分で置
き換え、文字パタンを多角形で近似したうえで、入力文
字パタンと辞書の対応する線分のマッチングを行うとい
う間接的な屈曲点情報の利用にとどまっており、直接認
識に使用した方法はなかった。
(発明が解決しようとする問題点) 前記の従来の方法、すなわち線分のマッチングを用い
る方法においては、マッチング処理に多大な処理量を要
するという問題点があった。しかし、処理量を低減する
ために線分のマッチングを行わず、屈曲点情報の相違点
で認識を行おうとすると、線分のもつ屈曲点間の相対的
位置関係の情報が利用できないため、入力文字パタンと
辞書と屈曲点の対応が不安定となり、結果として認識精
度が低下するという問題点がある。
本発明の目的は、文字パタン輪郭部の屈曲点情報を直
接認識に使用した、簡便かつ高精度な文字認識方法を提
供することにある。
(問題点を解決するための手段) 前記問題点を解決するため、本発明による文字認識方
法は、入力文字パタン輪郭部の屈曲点の位置座標と屈曲
方向と屈曲度をそれぞれ複数のコードに変換し、得られ
たコードのコード毎の出現個数を計数して用いるように
構成した方法と、入力文字パタン輪郭部の屈曲点の位置
座標と屈曲方向と屈曲度をそれぞれ複数のコードに変換
し、得られたコードを任意に組み合わせて得られたコー
ドのコード毎の出現個数を計数して用いるように構成し
た方法としたのである。
(作用) 本発明は、入力文字パタン輪郭部の屈曲点の位置座標
と屈曲方向と屈曲度をそれぞれ複数のコードに変換し、
得られたコード、または得られたコードを任意に組み合
わせて得られるコードについて、コード毎の出現個数を
計数して特徴として用いることを最も主要な特徴とし従
来のように線分のマッチングを行うことなく、文字パタ
ン輪郭部の屈曲点情報を複数のコードに変換することに
よって、直接、屈曲点情報を認識に使用できるのであ
る。
(実施例) 本発明の一実施例を図面とともに説明する。
第1図は、本発明の実施例を説明する構成図であっ
て、1は帳票、2は走査・光電変換部、3は文字切出し
部、4は前処理部、5は屈曲点情報抽出部、6はコード
変換部、7は特徴計数部、8は判定部、9は辞書部であ
る。文字の記入された帳票1は、走査・光電変換部2に
より2値量子化パタンに変換され、文字切出し部3によ
り1文字単位に切出される。切出された文字パタンは、
前処理部4で大きさの正規化や雑音除去を行われたの
ち、屈曲点情報抽出部5において輪郭部の屈曲点の検出
と屈曲点の位置座標、屈曲方向、屈曲度の各情報が求め
られる。コード変換部6では、屈曲点の位置座標、屈曲
方向、屈曲度を各々、複数のコードに変換し、それらの
コードをもとに特徴計数部7において特徴計数が行われ
る。判定部8では、辞書部9に格納されている、認識対
象カテゴリの各々を規定する特徴値のセットと逐次、比
較照合して入力文字パタンの属するカテゴリを決定し、
認識結果として出力する。
第1図において、走査・光電変換部2、文字切出し部
3、前処理部4、判定部8、辞書部9は、従来の技術に
より容易に構成できる。
屈曲点情報抽出部5における輪郭部の屈曲点の検出方
法は、従来から種々の方法が提案されているが、その1
つの方法としては、次のような方法がある。輪郭をトレ
ースして得られる輪郭点座標列を(X(i),Y(i))
(i=1〜n,n:輪郭点数)とするとき、(X(i−
s),Y(i−s))から(X(i),Y(i))に向う方
向DK(i)と、(X(i),Y(i))から(X(i+
s),Y(i+s))に向う方向DM(i)を求め、|DM
(i)−DK(i)|が一定値以上の輪郭点(X(i),Y
(i))を屈曲点とする。
また、屈曲点情報を定義する方法も種々の方法がある
が、その1つの方法としては、屈曲方向に|(DM(i)
+DK(i))/2|、屈曲度に、屈曲点の検出に用いた|DM
(i)−DK(i)|を用いる方法がある。なお、屈曲点
には凹の屈曲点と凸の屈曲点が存在するが、凹のときに
は屈曲度の値を負数で表現して凹凸を区別するようにし
ておくと、後の処理が簡単化される。
このように、屈曲点情報抽出部5も、従来の技術によ
り容易に構成できる。なお、本発明は、屈曲点情報の抽
出方法には、全く依存しない。
第2図は、コード変換部6と特徴計数部7の動作フロ
ーを説明する図である。第2図において、nは屈曲点数
のカウンタ、kは位置コード数のカウンタ、1は屈曲方
向コード数のカウンタ、mは屈曲度コード数のカウンタ
である。特徴計数部7には、コード毎の出現数を格納す
る特徴ベクトルが用意されている。特徴ベクトルの次元
数、すなわち特徴アドレス数は計数するコードの種類数
に等しく、特徴アドレスは計数するコードと1対1に対
応している。特徴ベクトルの各成分は、特徴計数を行う
前に予め全て0にクリアされている。屈曲点情報抽出部
5で得られる入力文字パタンの屈曲点情報は、ステップ
13で1屈曲点分ずつ読み出され、ステップ14で複数の位
置コードと複数の屈曲方向コードと複数の屈曲度コード
に変換される。次に、ステップ15から28において、1個
の屈曲点より得られる複数の位置コードと複数の屈曲方
向コードと複数の屈曲度コードの全ての組み合わせにつ
いて、これら3種のコードを組み合わせて得られるコー
ドの特徴アドレスを次式で求め(ステップ24)、その特
徴アドレスで指示される特徴ベクトルの成分に1を加算
する特徴計数処理を行う(ステップ25)。
a×(位置コード)+b×(屈曲方向コード) +(屈曲度コード) a:屈曲方向コードの種類数×屈曲度コードの種類数 b:屈曲度コードの種類数 この場合、特徴アドレス数は、 位置コードの種類数×屈曲方向コードの種類数×屈曲
度コードの種類数になる。なお、例えば、位置コードだ
けを単独で使用する場合には、計算を行うコードの特徴
アドレスは位置コードに等しくなり、特徴アドレス数は
位置コードの種類数に等しくなる。また、屈曲方向コー
ドと屈曲度コードのみを使用する場合には、計数を行う
コードの特徴アドレスは、 b×(屈曲方向コード)+(屈曲度コード) で求め、特徴アドレス数は、 屈曲方向コードの種類数×屈曲度コードの種類数 になる。
以上の処理を入力文字パタンより得られる全ての屈曲
点について実行する。
第3図は、文字パタンより得られる屈曲点を模式的に
示したものであり、黒点AからJが屈曲点である。
第4図は、位置座標を複数のコードに変換するテーブ
ルの例を示したものである。この例では、文字パタン外
接枠で囲まれる領域を4等分してコードを与えたテーブ
ル(a)と、9等分してコードを与えたテーブル(b)
の2種類のコードテーブルを用意している。第3図の屈
曲点Aの位置座標を(X,Y)とすると、第4図(a),
(b)で示されるように、屈曲点Aの位置コードとし
て、2種類のコード1,6が出力される。
第5図は、屈曲方向を複数のコードに変換するテーブ
ルの例を示したものである。この例では、方向を4分割
してコードの境界を45度ずらしたテーブル(a)、
(b)と、方向を8分割してコードの境界を22.5度ずら
したテーブル(c)、(d)の4種類のコードテーブル
を用意している。第3図の屈曲点Aの屈曲方向をSとす
ると、第5図(a)、(b)、(c)、(d)で示され
るように、屈曲点Aの屈曲方向コードとして、4種類の
コード0、5、9、17が出力される。
第6図は、屈曲度を複数のコードに変換するテーブル
の例を示したものである。この例では、屈曲度の境界を
ずらした4種類のコードテーブルを用意している。第3
図の屈曲点Aの屈曲度をTとすると、第6図で示される
ように、屈曲点Aの屈曲度コードとして、4種類のコー
ド3、8、16、24が出力される。
第3図の屈曲点Aの屈曲点情報を、第4図から第6図
までのコードテーブルに従ってコード化した場合の特徴
計数は、2種類の位置コードと4種類の屈曲方向コード
と4種類の屈曲度コードとを組み合わせた、次の32通り
のコードに対して行われる。
(1,0,3)(1,0,8)(1,0,16)(1,0,24)(1,5,3)
(1,5,8)(1,5,16)(1,5,24)(1,9,3)(1,9,8)
(1,9,16)(1,9,24)(1,17,3)(1,17,8)(1,17,1
6)(1,17,24)(6,0,3)(6,0,8)(6,0,16)(6,0,2
4)(6,5,3)(6,5,8)(6,5,16)(6,5,24)(6,9,3)
(6,9,8)(6,9,16)(6,9,24)(6,17,3)(6,17,8)
(6,17,16)(6,17,24) 但し、(位置コード,屈曲方向コード,屈曲度コー
ド) 第4図から第6図のコードテーブルの例では、計数を
行うコードの特徴アドレスを求める式の計数a、bは、
それぞれ、a=24×26=624、b=26である。アドレス
数は、24×26×13=8112個になる。
予め辞書に登録される特徴には、多数の学習パタンに
おいて、例えば第3図の屈曲点Aの位置変換が小さい場
合には、位置コード6を含むコードの特徴アドレスによ
り指定される特徴ベクトルの成分が特徴として選択され
る。反対に、位置変動が大きい場合には、位置コード1
を含むコードの特徴アドレスにより指定される特徴ベク
トルの成分が特徴として選択される。また、多数の学習
パタンにおいて、例えば屈曲点Aの屈曲方向コードS
が、右上方向を中心に分布している場合には、ほとんど
のパタンで出現する屈曲方向コード0または17を含むコ
ードの特徴アドレスにより指定される特徴ベクトルの成
分が特徴として選択される。屈曲度に関しても同様であ
る。なお、特徴の選択に際しては、着目カテゴリ内で安
定に出現するだけではなく、他カテゴリとの差を顕著に
表現する点も考慮されるのは言うまでもない。
(発明の効果) 以上説明したように、本発明によれば、マッチング等
の処理を必要としない、直接屈曲点情報を用いた簡便な
文字認識が実現できる。また、屈曲点情報を直接用いて
いるにもかかわらず、屈曲点の位置、屈曲方向、屈曲度
の変動や分布傾向に左右されない高精度な文字認識が実
現できるという利点がある。
【図面の簡単な説明】
第1図は本発明の一実施例の構成図、第2図はコード変
換部6と特徴計数部7の動作フローを説明する図、第3
図は文字パタンより得られる屈曲点を模式的に示した
図、第4図(a)(b)は本発明の実施例における、位
置座標を複数のコードに変換するテーブルの例を示した
図、第5図(a)(b)(c)(d)は本発明の実施例
における、屈曲方向を複数のコードに変換するテーブル
の例を示した図、第6図は本発明の実施例における、屈
曲度を複数のコードに変換するテーブルの例を示した図
である。 1……帳票、2……走査・光電変換部、3……文字切出
し部、4……前処理部、5……屈曲点情報抽出部、6…
…コード変換部、7……特徴計数部、8……判定部、9
……辞書部、11〜29……動作フローにおけるステップ等
を示す符号、n……屈曲点数のカウンタ、k……位置コ
ード数のカウンタ、l……屈曲方向コード数のカウン
タ、m……屈曲度コード数のカウンタ、S……屈曲方
向、A〜J……屈曲点、T……屈曲度、 コードを示す数字はステップ等の符号と同じ数字を用い
た区別は自明であるのでこのように用いた。
───────────────────────────────────────────────────── フロントページの続き 審査官 大野 克人

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】入力文字パタン輪郭部の屈曲点の位置座標
    と屈曲方向と屈曲度をそれぞれ複数のコードに変換し、
    得られたコードのコード毎の出現個数を計数して用いる
    ことを特徴とする文字認識方法。
  2. 【請求項2】入力文字パタン輪郭部の屈曲点の位置座標
    と屈曲方向と屈曲度をそれぞれ複数のコードに変換し、
    得られたコードを任意に組み合わせて得られたコードの
    コード毎の出現個数を計数して用いることを特徴とする
    文字認識方法。
JP62190302A 1987-07-31 1987-07-31 文字認識方法 Expired - Lifetime JP2649806B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62190302A JP2649806B2 (ja) 1987-07-31 1987-07-31 文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62190302A JP2649806B2 (ja) 1987-07-31 1987-07-31 文字認識方法

Publications (2)

Publication Number Publication Date
JPS6435674A JPS6435674A (en) 1989-02-06
JP2649806B2 true JP2649806B2 (ja) 1997-09-03

Family

ID=16255897

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62190302A Expired - Lifetime JP2649806B2 (ja) 1987-07-31 1987-07-31 文字認識方法

Country Status (1)

Country Link
JP (1) JP2649806B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2515400B2 (ja) * 1989-07-31 1996-07-10 ジューキ株式会社 自動縫製ミシン
US5590220A (en) * 1992-08-12 1996-12-31 International Business Machines Corporation Bending point extraction method for optical character recognition system

Also Published As

Publication number Publication date
JPS6435674A (en) 1989-02-06

Similar Documents

Publication Publication Date Title
Ogawa et al. Preprocessing for Chinese character recognition and global classification of handwritten Chinese characters
US5313528A (en) Method for extracting features from on-line handwritten characters
US5889889A (en) Method and apparatus for machine recognition of handwritten symbols from stroke-parameter data
JP3761937B2 (ja) パターン認識方法及び装置及びコンピュータ制御装置
JP2649806B2 (ja) 文字認識方法
Chi et al. Separation of single-and double-touching handwritten numeral strings
Ray et al. A new approach to polygonal approximation
JPS6232584A (ja) 輪郭形状特徴抽出方法
JPH0632075B2 (ja) パタ−ン認識装置
JP2953162B2 (ja) 文字認識装置
JP2633523B2 (ja) 手書き画入力装置
JP2671984B2 (ja) 情報認識装置
JPS5835674A (ja) オンライン手書文字特徴抽出方法
CN1096110A (zh) 微机汉字手写输入设备
JP2851865B2 (ja) 文字認識装置
JP2976426B2 (ja) 文字認識装置
JPS62271190A (ja) セグメント数字認識方式
JPH10334187A (ja) 文字認識装置及び文字認識方法
JPH0465431B2 (ja)
JP2651008B2 (ja) パターン認識方法
JPH045233B2 (ja)
JPS6089290A (ja) パタ−ン認識方法
JPS6022793B2 (ja) 文字識別装置
Wu et al. Recognition of Chinese characters by growing stroke window
JPS6198486A (ja) オンライン手書き文字認識方式

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080516

Year of fee payment: 11