JPS63298494A - パタ−ン認識装置 - Google Patents

パタ−ン認識装置

Info

Publication number
JPS63298494A
JPS63298494A JP62131144A JP13114487A JPS63298494A JP S63298494 A JPS63298494 A JP S63298494A JP 62131144 A JP62131144 A JP 62131144A JP 13114487 A JP13114487 A JP 13114487A JP S63298494 A JPS63298494 A JP S63298494A
Authority
JP
Japan
Prior art keywords
pattern
line width
feature
character
points
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62131144A
Other languages
English (en)
Inventor
Yasuo Kurosu
康雄 黒須
Osamu Kunisaki
国崎 修
Yoshihiro Yokoyama
横山 佳弘
Koichi Okazawa
宏一 岡澤
Akizo Kadota
門田 彰三
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP62131144A priority Critical patent/JPS63298494A/ja
Publication of JPS63298494A publication Critical patent/JPS63298494A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、文字パターンの認識装置に係わり、特に、手
書き漢字の認識に好適なパターン認識装置に関する。
〔従来の技術〕
文字認識の手法は1文字パターンを二次元のまま扱うパ
ターン整合法と文字パターンの白地や端点2分岐点、屈
折点等の特徴点に注目して扱う構造解析法とに大別でき
る。従来、英数字を認識の対象とする文字認識装置Iけ
、比較的変形の小さな印刷文字に対してはパターン整合
法が多用され、変形の大きな手書文字に対しては構造解
析法が多用されていた。
一方、従来の手書漢字を認識する装置としては、特開昭
58−191085号公報に記載のように、入力文字パ
ターンから輪郭線の方向コードと端点。
分岐点、屈折点などの特徴点とストロークを抽出し、こ
れらの特徴を組み合わせることによって認識を行なうも
のが知られている。この装置は文字をパターンそのもの
ではなく、方向コードと特徴点およびストロークを用い
て表現しているため、各変形毎に標準パターンを用意さ
えしていれば、文字が傾いたシ、線幅が一定でない文字
に対しても高い認識精度を発揮することができる。
また、手書英数字を認識する別の装置としては、特開昭
56−65275号公報に記載のように、入力文字パタ
ーンに対して2軸(x、y座標軸)に関する空間微分を
施こし、輪郭線分の方向と強さを求めて認識を行なうも
のが知られている。これは手書英数字を対象とした装置
ではあるが、端点。
分岐点、屈折点等の特徴点を陽に表現していないため、
特徴点に多様な変形を有する手書漢字に対しても高い認
識精度を発揮することができる。
〔発明が解決しようとする問題点〕 手書漢字は、英数字、カナ文字と比較して画数が多いた
め、文字線分のっぷれやかすれ等のトポロジーが破壊さ
れる映像的な歪が顕著に表われる性質を持っている。例
えば、手書き文字「田」を対象とした実験によシ、文字
のループ数は1〜4個までほぼ均等に分布していること
が知られている。このため、手書英数字認識において主
流を占めていた構造解析法は、特徴点などのトポロジー
を利用しているため、そのままでは手書漢字に適用でき
ないと考えられていた。
上記特開昭58−191085号公報に記載される従来
技術は、手書漢字の持つ特徴点の多様性に対して配慮が
なされておらず、各々の変形に対して専用の標準パター
ンを用意しなければならないという問題点があった。し
かも、漢字は対象字種数が非常に多く、JIS第1水準
でも3000字種、JIS第2水準になると6000字
種にも及ぶことがら、手書漢字!&!FI&においては
、標準パターン容量の低減が実用化上の決め手であると
考えられている。
上記特開昭56−65275号公報に記載される従来技
術は、本来英数字を対象として考案された技術であるた
めに、手書漢字の持つ特徴点の多様性については配慮が
なされているが、線幅の変動については専用の標準パタ
ーンを用意しなければならないという問題点があった。
本発明の目的は、かかる問題点を解消し、標準パターン
容量を低減し、正確に文字パターンを認識できるように
したパターン認識装置を提供することにある。
〔問題点を解決するための手段〕
上記目的を達成するために、本発明は、入力文字パター
ンの線幅を計測する手段と、該入力文字パターンの各輪
郭点の方向、強度を抽出し該各輪郭点を方向毎に複数の
方向別特徴面に振りわけて複数の方向別特徴パターンを
作成する手段と、計測された前記線幅に応じて各方向別
特徴パターンの各特像量をシフトし正規化する手段と、
正規化された各方向別特徴パターンにボカシ処理を施こ
す手段を設け、ポカン処理が施こされた各方向別%像パ
ターンを標準文字パターンの比較対象とする。
〔作用〕
まず、入力文字パターンの黒点数から平均線幅を計測す
る。次に1人力文字パターンの輪郭点の方向成分から方
向別特徴パターンを求め、計測した線幅を用いて方向別
特徴パターンの線幅を正規化する。さらに、ボカシ処理
を施こすことにょ)特徴パターンを抽出する。これKよ
シ、端点9分岐点、屈曲点などの特徴点を陽に表わすこ
となく、かつ文字線幅の変動を吸収した特徴パターンを
抽出でき、このため、特徴点や線幅に変動が顕著に発生
する手書漢字を認識の対象としても、標準パターンを増
加させることなく高い認識精度が得られる。
〔実施例〕
以下、本発明の実施例を図面によって説明する。
第1図は本発明によるパターン認識装置の一実施例を示
すブロック図であって、1は光電変換部、2はA/D 
(アナログ/ディジタル)変換部、3は前処理部、4は
線幅計測部、5は方向別特徴面作成部、6は方向割付テ
ーブル、7はシフト処理部、8はポカン処理部、9は整
合部、1oは特徴辞書、11は判定部、12は制御部、
20は文字観測部、60は特徴抽出部である。
同図において、紙面等に記入された文字パターンは光電
変換部1によりビデオ信号に変換され、A/D変換部2
によりサンプリング、量子化が行われて二値メツシュパ
ターンとなる。これら光電変換部1とA/D変換部2と
が文字観測部20を構成している。
文字観測部20でこのように観測された文字パターンは
、前処理部3において、切シ出し、雑音除去、正規化な
どの一連の前処理が行われて正規化パターンとなる。
切り出しは、認識などの処理単位が一文字毎となること
から、紙面上の文字パターン群から一文字を取り出す処
理をいい、通常、−文字を含む100X100メツシユ
程度の領域を切り出すものである。また、雑音除去は、
紙面などに付着したゴミ等の文字パターン以外のパター
ンを除去する処理をいい、濁点などの文字パターンとの
識別が難しく、種々の工夫が施されている。最後に、正
規化処理は%認識を容易にするために1文字を一定の大
きさに揃える処理であシ、外接枠に揃える手法や重心を
揃える手法など種々工夫が施こされている。
第2図(a)は、文字観測部20で観測される文字を「
位」とした場合の前処理部3から出力される文字パター
ンを示す。  ゛ 次に、前処理部3で処理された正規パターンは線幅計測
部4に加えられ、文字パターンの平均線幅が計測される
。すなわち、まず、文字パターンの黒点数を計測する。
これは、文字パターンの左上から順次下方ヘラスタスキ
ャンしていキ、文字パターンの存在する領域の黒点数を
計測して黒点数レジスタにセットするものである。次に
、文字パターンの輪郭長を計測する。これは、文字パタ
ーンの左上から順次下方ヘラスタスキャンしていき、文
字パターンに当った点から文字パターンに沿って輪郭長
を計測し、これを輪郭長レジスタにセットするものであ
る。最後に1黒点数レジスタの内容を輪郭長レジスタの
内容を持って割シ算を実行し、平均線幅を算出する。算
出した平均線幅はさらに1/2に割シ算され、線幅レジ
スタに格納される。
また、前処理部3で処理された正規化パターンは線幅計
測部4に供給されるとともに、方向別特徴面作成部5に
も加えられる。方向別特徴面作成部5においては、方向
別に4枚の特徴パターンが作成される。すなわち、まず
、輪郭抽出を施こす。
これは、文字パターンの左上から順次下方ヘラスタスキ
ャンしていき1文字パターンに当った点から文字パター
ンに沿って輪郭を追跡するものである。この追跡と同時
に、予め用意した輪郭テーブルに各輪郭点の方向と座標
を記述していく。このような手順を取って一文字分の輪
郭を全て輪郭テーブルに記述する。第2図(b)はこの
輪郭テーブルに記述された文字「位」の輪郭パターンを
示す。
なお、輪郭の抽出は、2値画像の情報を圧縮するため、
前処理としてノ・−ド的に処理する装置が多い。このた
めに、ここでの処理量は実質的にゼロである場合が多い
一文字分の輪郭テーブルが完成すると、次に1線縁ノイ
ズなどの雑音成分を除去するために、各輪郭点毎にこれ
を囲こむ複数の輪郭点を用いて方向と強度を決定する。
また、互いに異なる方向範囲に対応する4つの座標系の
面、すなわち、方向別特徴面が設定されておシ、方向と
強度が決定された各輪郭点は、その方向く対応した方向
別特徴面に振りわけられる。このとき、振りわけられた
輪郭点の強度が方向別特徴面のこの輪郭点に対応した座
標位置に記入される。−文字の全ての輪郭点が夫々の方
向別特徴面にこのように振シわけられると、方向別特徴
面毎にパターンが形成される。
これを方向別特徴パターンという。第2図(Q)は文字
「位」に対する4つの方向別特徴パターンを示している
上記の輪郭点の方向、強度の決定には、方向割付テーブ
ル6が用いられる。ここで、これらの決定方法の一具体
例について説明する。
先の輪郭テーブルの作成に際し、各輪郭点の方向が得ら
れたが、この方向は注目する輪郭点から次の輪郭点をみ
た方向である。方向別特徴パターンを形成するための輪
郭点を特徴づける方向、強度は、注目する輪郭点から次
の輪郭点をみた方向とこれより1つ前の輪郭点から注目
する輪郭点をみた方向とを用い、方向割付テーブル6を
参照して決定する。
方向割付テーブル6はこれら2つの方向の関係に対する
輪郭点を特徴づける方向、強度を表わすものであって、
第3図にその一部を示す。この方向割付テーブル6では
、注目する輪郭点およびこれより1つ前の輪郭からみた
次の輪郭点の方向が互いに等しい場合には強度を2とし
、方向は1′つの方向となる。これら2つの方向が異な
る場合には、輪郭点を特徴づける方向は2つの夫々方向
で表わされ、各々方向に対して強度を1とする。しかし
、これら2つの方向の差分が900の場合には、輪郭上
を特徴づける方向をこれらの方向の中間の方向とし、強
度を2としている。
そこで、方向別特徴面作成部5では、注目する輪郭点か
らみた次の輪郭点の方向とその1つ前の輪郭点からみた
注目する輪郭点の方向が求まると、これらをコード化し
、方向割付テーブル6の上段との間でマツチングを取シ
、一致した欄の方向と強度を参照する。飼えば、注目す
る輪郭点と1つ前の方向が共に下向きである場合には、
方向割付テーブル6の第1欄で一致し、方向は下向き、
強度は2となる。注目する輪郭点の方向と強度が求まる
と、対応する方向別特徴面の所定の座標に強度を記入す
る。この場合、注目する輪郭点を特徴づける方向が2つ
の場合には、夫々の方向別特徴面に振シわける。このよ
うな手順を取り、1文字分の方向別特徴パターンを作成
する。
以上の処理により、前記の特開昭56−65275号公
報におけるような2次元上での文字パターン面に2回の
空間微分を施こすことなく、1回のテーブル参照によっ
て輪郭点の方向、強度を同時に求めることができる。
次に、方向別の4枚の特徴パターンはシフト処理部7に
加えられ、ここで、線幅計測部4で測定した線幅に基づ
いて、文字ストロークの線幅を正規化する。
すなわち、まず、線幅計測部4に格納された平均線幅の
2分の1の値を読み出し、この値にしたがって各方向別
特徴面の特徴音を文字ストロークの中心線に向ってシフ
トする。これは、各方向面毎に方向と直交する向きにラ
スクスキャンしていき、中心線よシも左側にある特徴は
右側にシフトし、逆に中心線よシも右側にある特徴は左
側にシフトするものでおる。このような手順を取り、4
枚の方向別特徴面にシフト処理を施こす。これによシ、
文字線幅の変動が吸収される。
第2図(d)は第2図(Q)の各方向別特徴面に対して
シフト処理を行なった結果を示している。
最後に、4枚の方向別特徴面のパターンは、文字線分を
位置ずれを防ぐために、ポカン処理部7に加えられ、こ
こで各方向別特徴面にボカシ処理が加えられると共に、
不必要となるメツシュを除去するために再サンプリング
して情報量を圧縮する。すなわち、まず、コンボリュー
ションを取る。
これは、各方向別特徴パターンの左上から順次コンボリ
ューションを取シ、よシ小さな方向別特徴面を作成する
。ここで、6×6の領域を用いてコンボリューションを
取り、次に、64X64の4面方向別特徴面を16X 
16の4面の特徴面に情報量を圧縮する。このような手
順を取り、4枚の方向別特徴を作成する。第2図(d)
にボカシ処理の例を示す。
線幅計測部4、方向別特徴面作成部5、方向割付テーブ
ル6、シフト処理部7およびボカシ処理部8が特徴抽出
部30を構成している。
このようにして、抽出された方向別特徴パターンは整合
部9に加えられ、ここで特徴辞書1oに格納された標準
パターンとの間で類似度が算出される。すなわち、まず
、4枚の方向別特徴パターンを入力特徴バッファに格納
する。次に、特徴辞610に記憶された標章パタ゛−ン
を順次読み出して入力特徴バッファとの間で類似度を求
め、この類似度を特徴辞書10に格納されたカテゴリー
悄報とともに判定部11に加える。
判定部11では、まず、類似度とカテゴリー情報を用い
て最も類似度の大きなカテゴリーを選択し、次に、次大
値を持つ類似度と最大の類似度の差の絶対値を求める。
この絶対値が予め設定した閾値よシも大きければ、最大
の類似度をもつカテゴリーを受理する。これは、最大の
類似度をもつカテゴリーが入力された文字カテゴリーで
あるらしいと判定されるものであシ、そのカテゴリーの
コードが出力される。逆に前記絶対値が予め設定した閾
値よりも小さければ、最大の類似度を持つカテゴリーを
拒否する。これは、最大の類似度を持つカテゴリーは入
力された文字カテゴリーではないらしいと判定するもの
であり、拒否のコードが出力される。
なお、第1図においては、制御部12から回路各部に制
御信号が供給され、また、回路各部の状態を通知する信
号が制御部12に与えられるのであるが、このことは本
発明を理解する上で必ずしも必要ではないので、これら
は簡単化のために図示せず、また、説明を省略しである
また、上記実施例では、輪郭点の方向と強度は3つの輪
郭点を用いて決定したが、同様の効果が得られるもので
あるならば、これに限られるものではない。
以上の説明からこの実施例によれば、文字線幅と文字パ
ターンの方向成分を求め、計測した線幅を用いて文字線
幅を正規化した方向性特徴を抽出する構成とし、文字線
幅の変動を吸収できるようKしているので、文字線幅の
変動が大きな手書漢字を認識の対象としても、きわめて
高精度にこれを認識できる。
また、輪郭から1回のテーブル参照のみで方向別特徴面
を作成できるため、従来技術に比べて一桁以上少ない処
理量で特徴を抽出でき、特に認識対象字株数の多い漢字
については有効である。
〔発明の効果〕
以上説明したように、本発明によれば、計測した文字線
幅を用いて線幅を正規化した方向性特徴を抽出すること
ができるので、線幅の変動や特徴点の変形が著しく発生
する手書漢字を対象としても、標準文字パターン容量を
小さくできかつきわめて高精度に認識できるなど、従来
技術の欠点を除いて優れた機能のパターン認識装置を提
供できる。
【図面の簡単な説明】
第1図は本発明によるパターン認識装置の一実施例を示
すブロック図、第2図は第1図における特徴抽出部の処
理を示す概念部、第3図は第1図における方向割付テー
ブルの一具体例の一部を示す図である。 1・・・光電変換部、2・・・A/D変換部、5・・・
前処理部、4・・・線幅計測部、5・・・方向別特徴面
作成部、6・・・方向割付テーブル、7・・・シフト処
理部、8・・・ポカン処理部、9・・・整合部、10・
・・特徴辞書、11・・・判定部、20・・・文字観測
部% 30・・・特徴抽出部。   ・

Claims (1)

    【特許請求の範囲】
  1. 1、未知文字パターンを観測して入力文字パターンを得
    、予じめ定められたカテゴリ毎の標準文字パターンを記
    憶したメモリから該標準文字パターンを読み出し、該標
    準文字パターンと該入力文字パターンとを比較して該未
    知文字パターンが属するカテゴリを決定もしくはリジェ
    クトするようにしたパターン認識装置において、入力文
    字パターンから該未知文字パターンの線幅を計測する第
    1の手段と、該入力文字パターンの各輪郭点の方向およ
    び強さを求めかつ方向に対応して予じめ設けられた特徴
    面毎に該輪郭点を強度を加えて区分し方向別特徴パター
    ンを生成する第2の手段と、該各方向別特徴パターンの
    線幅を該第1の手段で計測された線幅に応じて正規化す
    る第3の手段と、正規化された該方向別特徴パターンの
    夫々に二次元ボカシ処理を施こす第4の手段を設け、該
    第4の手段から得られる方向別特徴パターンを前記標準
    文字パターンとの比較対象とすることを特徴とするパタ
    ーン認識装置。
JP62131144A 1987-05-29 1987-05-29 パタ−ン認識装置 Pending JPS63298494A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62131144A JPS63298494A (ja) 1987-05-29 1987-05-29 パタ−ン認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62131144A JPS63298494A (ja) 1987-05-29 1987-05-29 パタ−ン認識装置

Publications (1)

Publication Number Publication Date
JPS63298494A true JPS63298494A (ja) 1988-12-06

Family

ID=15051029

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62131144A Pending JPS63298494A (ja) 1987-05-29 1987-05-29 パタ−ン認識装置

Country Status (1)

Country Link
JP (1) JPS63298494A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04177485A (ja) * 1990-11-07 1992-06-24 Matsushita Graphic Commun Syst Inc 文字認識装置
US6643401B1 (en) * 1998-12-16 2003-11-04 Fujitsu Limited Apparatus and method for recognizing character

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04177485A (ja) * 1990-11-07 1992-06-24 Matsushita Graphic Commun Syst Inc 文字認識装置
US6643401B1 (en) * 1998-12-16 2003-11-04 Fujitsu Limited Apparatus and method for recognizing character

Similar Documents

Publication Publication Date Title
CN106446952A (zh) 一种乐谱图像识别方法及装置
CN114863492B (zh) 一种低质量指纹图像的修复方法及修复装置
JPS63298494A (ja) パタ−ン認識装置
Mostafa An adaptive algorithm for the automatic segmentation of printed Arabic text
JPH0632075B2 (ja) パタ−ン認識装置
CN113408532A (zh) 一种基于多特征提取的药品标签数字识别方法
CN108256525B (zh) 一种基于图像处理的导轨目标位置检测方法
CN110659536A (zh) 指纹识别设备分辨率的测试方法及装置、系统及存储介质
EP0377129A3 (en) Fast spatial segmenter for handwritten characters
JPH0145669B2 (ja)
JPS622382A (ja) 画像処理方法
JPS6019285A (ja) ストロ−ク抽出方法
JP2976426B2 (ja) 文字認識装置
JPS603078A (ja) 文字認識方法
JPH0656625B2 (ja) 特徴抽出方式
JPH0420221B2 (ja)
KR19990027482A (ko) 패턴 인식 시스템에서 영상내 물체 구성 직선들의 관계 설정방법
JPH11351835A (ja) 工具の撮像画像処理による刃先部輪郭線抽出方法
CN114693954A (zh) 一种煤矿井下光斑特征提取方法及系统
JPH04177483A (ja) パターンマッチング方式
JP2658154B2 (ja) 文字識別方式
JPH096909A (ja) 文字読取装置
JPS63113690A (ja) パタ−ン認識装置
Lau et al. EDT based tracing maximum thinning algorithm on grey scale images
CN115761713A (zh) 一种车牌识别方法、系统、电子设备和可读存储介质