JPH0632075B2 - パタ−ン認識装置 - Google Patents

パタ−ン認識装置

Info

Publication number
JPH0632075B2
JPH0632075B2 JP61133613A JP13361386A JPH0632075B2 JP H0632075 B2 JPH0632075 B2 JP H0632075B2 JP 61133613 A JP61133613 A JP 61133613A JP 13361386 A JP13361386 A JP 13361386A JP H0632075 B2 JPH0632075 B2 JP H0632075B2
Authority
JP
Japan
Prior art keywords
pattern
feature
contour
character
recognition device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61133613A
Other languages
English (en)
Other versions
JPS62290985A (ja
Inventor
康雄 黒須
修 国崎
佳弘 横山
宏一 岡澤
彰三 門田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP61133613A priority Critical patent/JPH0632075B2/ja
Publication of JPS62290985A publication Critical patent/JPS62290985A/ja
Publication of JPH0632075B2 publication Critical patent/JPH0632075B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、文字認識装置に係り、特に手書漢字の認識に
好適なパターン整合法を採用したパターン認識装置に関
する。
〔従来の技術〕
文字認識の手法は、文字パターンを2次元のまま扱うパ
ターン整合法と文字パターンの白地や端点、分岐点、屈
折点等の特徴点に注目して扱う構造解析法とに大別でき
る。
従来、英数字を認識の対象とする文字認識装置は、比較
的変形の小さな印刷文字に対してはパターン整合法が多
用され、変形の大きな手書文字に対しては構造解析法が
多用されていた。
一方、従来の手書漢字を認識する装置は、特開昭58-191
085号公報に記載のように、入力文字パターンから輪郭
線の方向コードと端点、分岐点、屈折点等の特徴点とス
トロークを抽出し、これらの特徴と組み合せることによ
って認識を行うものが知られている。この装置は、文字
パターンを2値パターンではなく、方向コードと特徴点
およびストロークを用いて表現しているため、各ストロ
ークが基準文字パターンに対して傾いたり、線幅が一定
でない文字に対しても高い認識精度を発揮することがで
きる。しかし、文字パターンの持つ特徴点の多様性につ
いては配慮されていなかった。
また、手書英数字を認識する別の装置は、特開昭56-652
75号公報に記載のように、入力文字パターンに対して2
軸に関する空間微分を施こし、輪郭線分の方向と強さと
求め認識を行なうものが知られている。これは手書英数
字を対象とした装置ではあるが、端点、分岐点、屈折点
等の特徴点を陽に表現していないため、特徴点に多様な
変形を有する手書漢字に対しても高い認識精度を発揮す
ることができる。
しかし、2次元上の文字パターンに対して空間微分を施
こすため、その積和処理に多大な時間が必要であっっ
た。
〔発明が解決しようとする問題点〕
手書漢字は、英数字カナ文字と比較して画数が多いた
め、文字線分のつぶれやかすれ等のトポロジーが破壊さ
れる映像的な歪が顕著に表われる性質を持っている。例
えば手書き文字「田」を対象とした実験により、文字の
ループ数は1から4個までほぼ均等に分布していること
が知られている。
このため、手書英数字認識において主流で占めていた構
造解析手法は、特徴点などのトポロジーを利用している
ため、そのままでは手書漢字に適用できないと考えられ
ていた。
上記第1の従来技術は、手書漢字の持つ特徴点の多様性
に対して配慮がなされておらず、それぞれの変形に対し
て専用の標準パターンを用意しなければならないという
問題点があった。
一方、漢字は対象字種数が非常に多く、JIS第1水準で
も3000、JIS第2水準になると6000にも及ぶ。これは、
従来の英数字と比較すると数十倍から数百倍の数であ
る。このため、手書漢字認識においては、認識処理量の
低減が実用化上の決め手であると考えられている。
上記第2の従来技術は、本来英数字をを対象として考案
された技術であるため、特徴抽出に要する処理量につい
て考慮がなされておらず、特徴の抽出に際して、多大な
処理量が必要であるという問題点があった。
本発明は、手書漢字認識に有効な特徴を高速に抽出する
ため、トポロジカルな特徴点を抽出することなく、かつ
文字パターンの各点に積和処理を施すことなく、輪郭か
ら方向コードを求めることによって方向性特徴を抽出す
るようにしたパターン認識装置を提供することを目的と
する。
〔問題点を解決するための手段〕
上記目的は、文字ストロークの方向別パターンが輪郭線
からも求められる性質を利用することにより達成され
る。
すなわち、入力文字パターンから輪郭を抽出し、雑音成
分を除去するため、相前後する輪郭点を用いて方向と強
さを抽出し、各方向面に割り付ける。
次に文字ストロークの位置ずれを吸収するため各方向面
にボカシ処理を施こし、これを特徴量とする。
以下、本発明の原理を図面により説明する。第2図は特
徴抽出の概念を表わす原理図である。
また、第3図は処理量を低減する上で役立つ方向割付テ
ーブルである。
第2図において、まず、2値画像である正規化文字パタ
ーンから輪郭点とその方向を抽出する。ここで方向は輪
郭点を求める過程で副産物として抽出できる。
さらに、輪郭の抽出は、2値画像の情報を圧縮するた
め、前処理としてハード的に施こす装置が多い。このた
め、ここでの処理量は実質的にゼロである場合が多い。
次に、線縁ノイズ等の雑音成分を除去するため、注目す
る輪郭点とこれを囲む輪郭点群を用いて方向と強度を決
定する。また方向別特徴面を作成するため、この決定に
従った強度を該当する方向面に割り付け、完成した方向
面を方向別特徴面と呼ぶ。ここでは、処理量を低減する
ため、第3図に示すテーブルを用いて各輪郭点の方向と
強度を決定した。
すなわち、3輪郭点を用い、2つの方向が同一の場合は
強度を2とし、異なる方向の場合は各々の方向を強度1
と決定した。また方向の差分が90度の場合は中間の方
向を選択し、強度を2とした。この様なテーブルをメモ
リ中に記憶させておけば、前記第2の従来技術のように
2次元上の文字パターン面に2回の空間微分を施こさな
くても、一回のテーブル参照により方向と強度を同時に
求めることができる。
最後に、文字線分の位置ずれを防ぐと共に、特徴の情報
量を圧縮するため、各方向別特徴面にボカシ処理を施こ
した。ここでは、6×6の窓関数を用いてコンポリュー
ションを施こし、1/16に情報量を圧縮した。
この一連の特徴抽出過程では、具体的な数値や手法を用
いて説明した。例えば、方向と強度を3輪郭点を用いて
決定したが、同一の効果が得られればこの限りではない
ことは言うまでもない。
〔作用〕
文字パターンの輪郭の方向成分から方向別特徴面を求
め、さらにボカシ処理を施こすことにより特徴を抽出す
る構成としたことにより、端点、分岐点、屈曲点等の特
徴点を陽に表わすことなく特徴を抽出できるようになっ
たため、特徴点に変形が顕著に発生する手書漢字を認識
の対象としても標準パターンを増加させることなく高い
認識精度が得られる。
また、輪郭から一回のテーブル参照のみで方向別特徴面
を作成できるため、従来技術に比べて一桁以上少ない処
理量で特徴を抽出でき、認識対象数の多い漢字について
特に有効である。
〔実施例〕
以下、本発明の実施例を図面を用いて説明する。
第1図は本発明によるパターン認識装置の一実施例の構
成を示すブロック図である。
第1図において、紙面等に記入された文字パターンは光
電変換部1によりビデオ信号に変換されたのち、アナロ
グディジタル変換部2によりサンプリング、量子化が行
われて二値メッシュパターンとなる。
光電変換部1およびアナログディジタル(A/D)変換部2
を合せて文字観測部20と呼ぶ。
観測された文字パターンは前処理部3において、切り出
し、雑音除去、正規化などの一連の前処理が行われて正
規化パターンとなる。
切り出しは、認識等の処理単位が一文字毎になるため、
紙面上の文字パターン群から一文字を取り出す処理を指
し、通常は一文字を含む100×100メッシュ程度の領域を
切り出す。
また雑音除去は、紙面等に付着したゴミ等の文字パター
ン以外のパターンを除去する処理を指し、濁点等の文字
パターンとの識別が難しく、種々の工夫が施されてい
る。
最後に、正規化処理は、認識を容易にするため、文字を
一定の大きさに揃える処理を指し、外接枠に揃える手法
や重心を揃える手法等種々工夫がこらされている。
次に、前処理を施こされた正規化パターンは方向別特徴
面作成部4に加えられ、方向別特徴面作成部4において
方向別に4枚の特徴パターンが作成される。
方向別特徴面作成部4では、先ず輪郭抽出を施こす。す
なわち、文字パターンの左上から順次下方へラスタスキ
ャンしてゆき、文字パターンに当った点から、文字パタ
ーンにそって輪郭を追跡する。
文字パターンの輪郭を追跡すると同時に、予め用意した
輪郭テーブルに各輪郭点の方向と座標を記述してゆく。
この様な手順を取り一文字分の輪郭を全て輪郭テーブル
に記述する。
また方向別特徴面作成部4では、一文字分の輪郭テーブ
ルが完成すると、方向割付テーブル5を参照しながら方
向別の4枚の特徴パターンを作成する。すなわち、作成
した輪郭テーブルの注目する輪郭点の方向と一つ前の輪
郭を取り出し、これらと方向割付テーブル5から注目す
る輪郭点の方向と強度を求める。
さらに具体的には、2つの方向をコード化し、前記第3
図の方向割付テーブルの上段との間でマッチングを取
り、一致した欄の方向と強度を参照する。
例えば、注目する輪郭点と一つ前の方向が共に下向きで
ある場合は、方向割付テーブルの第1欄で一致し、方向
は下向き、強度は2となる。注目する輪郭点の方向と強
度が求まると、対応する方向別特徴面の所定の座標に強
度を記入する。この様な手順を取り一文字分の方向別の
特徴パターンを作成する。
次に、方向別の4枚の特徴パターンはボカシ処理部6に
加えられ、ボカシ処理部6において各方向別特徴面にボ
カシ処理が加えられると共に、不必要となるメッシュを
除去するため再サンプリングし、情報量を圧縮する。
ボカシ処理部6では、先ずコンボリューションを取る。
すなわち、各方向別特徴パターンの左上から順次コンボ
リューションを取り、より小さな方向別特徴面を作成す
る。ここでは6×6の領域を用いてコンボリューション
を取り、次に64×64の4面の方向別特徴面を16×16の4
面の特徴面に情報量を圧縮した。この様な手順を取り4
枚の方向別特徴を作成する。
方向別特徴面作成部4、方向割付テーブル5およびボカ
シ処理部6を合せて特徴抽出部60と呼ぶ。
抽出されれた方向別特徴パターンは整合部7に加えら
れ、整合部7において特徴辞書8に格納された標準パタ
ーンとの間で類似度が算出される。
整合部7では、先ず4枚の方向別特徴パターンを入力特
徴バッファに格納する。
次に、特徴辞書8に記憶された標準パターンを順次読み
出し、入力特徴バッファとの間で類似度を求め、この類
似度を特徴辞書8に格納されたカテゴリー情報と共に判
定部9に加える。
判定部9では、先ず類似度とカテゴリー情報を用いて、
最も類似度の大きなカテゴリを選択する。次に、次大値
を持つ類似度と最大の類似度の絶対値を求める。この絶
対値が予め設定した閾値よりも大きけば、最大の類似度
を持つカテゴリーを受理する。
すなわち最大の類似度を持つカテゴリーが入力された文
字カテゴリーであるらしいと判定され、そのカテゴリー
のコードを出力線100に加える。
逆に前記絶対値が予め設定した閾値よりも小さければ、
最大の類似度を持つカテゴリーを拒否する。すなわち最
大の類似度を持つカテゴリーは入力された文字カテゴリ
ーではないらしいと判定され、拒否のコードを出力線10
0に加える。
さらにこれらの結果は出力端子101より外部に出力さ
れ、所望の処理が施こされる。
なお、第1図の説明においては、制御部10から回路各
部に制御信号が供給され、また回路各部の状態を通知す
る信号が制御部10に与えられるのであるが、本発明を
理解する上で必ずしも必要ではないので、これらは簡単
化のため図示および説明を省略してある。
以上説明から本実施例によれば、文字パターンの輪郭成
分から方向別特徴パターンを求め、さらにボカシ処理を
施こすことにより特徴を抽出する構成とし、トボロジカ
ルな特徴点を陽に抽出していないので、特徴点に変形が
顕著に発生する手書漢字を認識の対象としてもきわめて
高精度かつ高速に認識できる。
〔発明の効果〕
以上説明したように、本発明によれば、多大な処理量を
要する空間微分を施こすことなく、文字パターンの輪郭
成分から方向別特徴面を求めることができるので、膨大
な処理量を要求される漢字認識においても、きわめて高
速に認識することができ、また、端点、分岐点あるいは
屈曲点等のトポロジカルな特徴点を陽に表わすことなく
抽出できるので、特徴点に変形が著しく発生する手書漢
字を対象としても、きわめて高精度に認識できるなど、
従来技術の欠点を除いて優れた機能のパターン認識装置
を提供できる。
【図面の簡単な説明】
第1図は本発明によるパターン認識装置の一実施例を示
すブロック図、第2図は本発明に係る原理を表わす特徴
抽出の概念図、第3図は同じく本発明に係る原理を表わ
す方向割付テーブルの一部である。 1……光電変換部、2……A/D変換部 3……前処理部、4……方向別特徴面作成部 5……方向割付テーブル、6……ボカシ処理部 7……整合部、8……特徴辞書、9……判定部 10……制御部、20……文字観測部 60……特徴抽出部、100……出力線 101……出力端子。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 横山 佳弘 神奈川県横浜市戸塚区吉田町292番地 株 式会社日立製作所マイクロエレクトロニク ス機器開発研究所内 (72)発明者 岡澤 宏一 神奈川県横浜市戸塚区吉田町292番地 株 式会社日立製作所マイクロエレクトロニク ス機器開発研究所内 (72)発明者 門田 彰三 神奈川県小田原市国府津2880番地 株式会 社日立製作所小田原工場内 (56)参考文献 特開 昭60−61872(JP,A) 特開 昭57−146379(JP,A)

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】入力未知パターンを観測してパターン情報
    を得る手段と、あらかじめ定めたカテゴリーごとの標準
    パターンのパターン情報を記憶するメモリと、上記入力
    パターン情報と標準パターン情報とを比較して入力パタ
    ーンの属するカテゴリーを決定するかあるいはリジェク
    トするかを決定する手段を備えたパターン認識装置にお
    いて、光電変換により得られた二次元文字パターンの輪
    郭の方向成分を抽出し、相い前後する複数の輪郭成分か
    ら該輪郭成分の量子化方向およびその強さを求め、該量
    子化方向に対応して設けた特徴面に量子化方向の強さに
    応じた値を加算した方向性特徴パターンを作成し、所定
    の方向に関する該方向性特徴パターンに二次元ぼかし処
    理を施すことにより、上記パターン情報を得る手段を有
    することを特徴とするパターン認識装置。
  2. 【請求項2】特許請求範囲第1項記載のパターン認識装
    置において、ぼかし処理のおこなわれた方向性特徴パタ
    ーンと標準パターンとのパターン整合は所定の方向毎に
    独立な重み量を設定しておこなうことを特徴とするパタ
    ーン認識装置。
  3. 【請求項3】特許請求範囲第1項記載のパターン認識装
    置において、方向性特徴パターンと該特徴と別種の特徴
    を併用することを特徴とするパターン認識装置。
JP61133613A 1986-06-11 1986-06-11 パタ−ン認識装置 Expired - Lifetime JPH0632075B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61133613A JPH0632075B2 (ja) 1986-06-11 1986-06-11 パタ−ン認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61133613A JPH0632075B2 (ja) 1986-06-11 1986-06-11 パタ−ン認識装置

Publications (2)

Publication Number Publication Date
JPS62290985A JPS62290985A (ja) 1987-12-17
JPH0632075B2 true JPH0632075B2 (ja) 1994-04-27

Family

ID=15108903

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61133613A Expired - Lifetime JPH0632075B2 (ja) 1986-06-11 1986-06-11 パタ−ン認識装置

Country Status (1)

Country Link
JP (1) JPH0632075B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2658136B2 (ja) * 1988-03-11 1997-09-30 沖電気工業株式会社 文字認識方式
JP2658137B2 (ja) * 1988-03-11 1997-09-30 沖電気工業株式会社 文字認識方式
JP2658153B2 (ja) * 1988-04-07 1997-09-30 沖電気工業株式会社 文字識別方式
JP2658154B2 (ja) * 1988-04-07 1997-09-30 沖電気工業株式会社 文字識別方式
JPH02130692A (ja) * 1988-11-11 1990-05-18 Canon Inc 特徴抽出回路

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5665275A (en) * 1979-11-02 1981-06-02 Hitachi Ltd Pattern recognition system

Also Published As

Publication number Publication date
JPS62290985A (ja) 1987-12-17

Similar Documents

Publication Publication Date Title
US5113452A (en) Hand-written character recognition apparatus and method
DE3425449A1 (de) Verfahren und vorrichtung zur alphanumerischen handschriftenerkennung
Cowell Syntactic pattern recognizer for vehicle identification numbers
Fernandez et al. A new plant cell image segmentation algorithm
CN103279770A (zh) 基于笔画片段和轮廓特征的笔迹识别方法
Prasad et al. Offline handwritten character recognition of Gujrati script using pattern matching
Espinosa-Duro Fingerprints thinning algorithm
Vithlani et al. Structural and statistical feature extraction methods for character and digit recognition
Chiu et al. A novel stroke-based feature extraction for handwritten Chinese character recognition
JPH0632075B2 (ja) パタ−ン認識装置
CN111292346B (zh) 一种噪声环境下浇铸箱体轮廓的检测方法
Deshmukh et al. Analysis of directional features-stroke and contour for handwritten character recognition
Mostafa An adaptive algorithm for the automatic segmentation of printed Arabic text
Espinosa-Duro Mathematical Morphology approaches for fingerprint Thinning
JPS63298494A (ja) パタ−ン認識装置
Batuwita et al. Fuzzy recognition of offline handwritten numeric characters
Costa et al. Topological stacking grayscale thinning for edge detection and real-time applications
JPH0789364B2 (ja) パタ−ン認識装置
Pasha et al. Segmentation of Handwritten Documents Containing Kannada Script
JP2984315B2 (ja) 認識装置
Deng et al. Trace copy forgery detection for handwritten signature verification
Bucheet et al. Off-line Arabic signature recognition based on invariant moments properties
JP2795860B2 (ja) 文字認識装置
JP2976426B2 (ja) 文字認識装置
JPS62271190A (ja) セグメント数字認識方式