JPH0557633B2

JPH0557633B2 -

Info

Publication number: JPH0557633B2
Application number: JP58232584A
Authority: JP
Inventors: Yasuo Kurosu; Osamu Kunisaki; Yasuaki Nakano; Akizo Kadota
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1983-12-09
Filing date: 1983-12-09
Publication date: 1993-08-24
Also published as: JPS60124789A

Description

【発明の詳細な説明】〔発明の利用分野〕本発明は、パタン認識方式に関し、特に対象と
するカテゴリ数の多い漢字等の認識装置における
高速整合方式に関するものである。

〔発明の背景〕

従来より漢字認識の研究が進められており、印
刷漢字、オンライン手書き漢字等においても、実
用化、商品化が近づいている。

認識の手順は、一般的に、第１図に示すよう
に、最初、用紙を光学的に走査して文字パタンを
帳票より入力する。このとき、光学系と光センサ
により８〜10点／mmに標本化し、さらに適当な閾
値により“０”か“１”（白か黒）の２値パタン
に変換する。光電変換２の後、前処理部３では、
用紙の汚れや光学系、センサ等による雑音を除去
するための平滑化（一種の低域通過フイルタリン
グ）や、文字寸法を一定に揃える正規化を行う。

次の特徴抽出部５では、文字パタンから文字の
特徴を取り出す。すなわち、文字のストロークの
長さや角度、位置、ストロークの分布、背景部の
状態を特徴として用いる。認識の基準となる文字
についても、あらかじめ同じような処理を行つて
特徴を取り出して、その特徴を辞書に記憶してお
く。整合部１２，１３は２段階で行われ、第１段
と第２段とでは別種の特徴が用いられる。数字10
と英数カナ100と数字1000〜2000が対象字種（カ
テゴリ数）となる。入力文字パタンの特徴と、大
分類辞書１４、認識辞書１５中の標準パタンの特
徴とを比較し、入力パタンがどの標準パタンに最
も近いかを見つける、いわゆる整合処理が行われ
る。数字、英数カナまでは、１段目で一致を見つ
けることができるが、漢字の場合には字種が多
く、時間がかかるため、最初に粗いマツチングで
候補を10〜100字種に絞り、次に精密なマツチン
グで１字種に絞つて、これを判定結果とする。

このように、漢字認識装置においては、階層的
認識を行い、入力未知パタンとあらかじめ用意さ
れた標準パタン群とを比較して、最もマツチング
のとれた標準パタンの属するカテゴリにより入力
パタンの決定を行うが、処理の高速化のために
は、次のような方法が用いられている。その第１
の方法は、複数の特徴を用いるパタン認識装置に
おいて、各々の特徴のm₁×n₁絵素からなる入力
パタンと標準パタンの間で比較を行うこにより、
候補カテゴリの限定を行い、その後、複数の特徴
のm₂×n₂（ここで、m₁＜m₂、n₁＜n₂）絵素から
なる入力パタンと上記m₁×n₁における処理によ
つて限定された候補に対する複数の特徴の標準パ
タン群との比較を行い、未知パタンの識別を行う
ものである（電々公社「実用化報告」第32巻第２
号参照）。すなわち、先ず最初寸法の小さいパタ
ン相互を比較して高速に処理し、2000字程度から
１／４〜1/5に絞つてしまい、次に、絞られたものの
中から寸法の大きいパタン相互を比較して１つの
カテゴリを選択する。一般に、小さいパタンで比
較すると、高速処理が可能であるが、比較対象が
ぼけてしまうため不正確となる。そこで、次に大
きいパタンで正確に比較するのである。また、第
２の方法は、単一の特徴を用いるパタン認識装置
において、分類処理をm₁×n₁絵素の１段階のみ
に止めず、m₁×n₁、m₂×n₂、ｍ（ｌ−１）×ｎ（ｌ
−１）……（m_k＜m_k+1、n_k＜n_k+1、ｋ＝１、２、
……（ｌ−１））と多層用意しておくものである
（特公昭53−17020号公報参照）。これは、小さい
寸法から順次、大きい寸法のものを相互に比較し
ていくことにより、最初は高速であるが、ぼける
ので不正確であり、後方になるほど低速である
が、確に比較して、全体としての分類効率の向上
を図るのである。

しかし、上記第１、第２の方法では、いずれも
識別に用いる特徴と同一の特徴を情報圧縮して分
類に用いているため、必ずしも最適な分類効率の
向上がなされていないという問題点がある。

〔発明の目的〕

本発明の目的は、このような従来の問題点を改
善し、漢字パタンのように多数個のカテゴリ群
を、認識精度を落とすことなく、高速度で整合処
理することができるパタン認識システムを提供す
ることにある。

〔発明の概要〕

本発明の上記目的は、入力されたパタンから複
数の特徴を抽出する手段と、前記入力パタンの特
徴と比較すべき各標準パタンの複数の特徴を記憶
する手段、および、前記標準パタンの複数の特徴
と同じ数だけ直列に接続された階層整合手段を有
するパタン認識システムにおいて、前記特徴記憶
手段を、前記標準パタンの特徴と予め前記各標準
パタン毎に定めた分類能力順位から構成するとと
もに、パタンが入力されると前記特徴記憶手段中
の標準パタンに対応して定められている順位に応
じた特徴を読み出して、第１層の整合手段で当該
入力パタンの特徴との整合をとり、第２層の整合
手段では、第１層の整合結果で絞られた候補と、
次順位の分類能力を有する特徴とを比較照合し、
以下、順次、分類能力の下位の特徴を用いて整合
をとる制御手段を設けたことを特徴とするパタン
認識システムによつて達成される。

〔発明の実施例〕

以下、本発明の実施例を、図面により説明す
る。

第２図ａ〜ｅは、本発明の階層整合方法を示す
説明図である。

本発明では、入力パタンから複数の特徴を抽出
する特徴抽出部を設け、そこで、後述する如く、
各種の特徴を抽出して、各標準パタンごとに、特
徴の分類能力順位を決定して記憶部に格納する。
例えば、各種の特徴抽出方法のうち、第２図ａ，
ｂ，ｃの３種類の方法で特徴を取り出すものとす
る。第２図ａには、全体の構造、例えば国構え、
門構え、勹（ツツミ）構え、にんべん、さんず
い、うかんむり、わかんむり、しんにゆう等で分
類する方法を示し、第２図ｂには文字パタン周囲
の白の面積のヒストグラムを求めた分類方法（ペ
リフエラルによる方法）を示し、第２図ｃには上
下方向あるいは左右方向のストロークの交叉する
回数を求めた分類方法（ストローク密度による方
法）を示す。この場合、文字パタンによつて上記
分類方法は能力が異なり、ある文字に対してはペ
リフエラルによる方法が最も分類能力が高く、別
の文字に対してはストローク密度による方法が最
も分類能力が高い。そこで、各標準パタンごと
に、特徴の分類能力順位を決定して記憶してお
く。そして、入力パタンに対して、その分類能力
順位を用い、分類能力の高い特徴から順に整合処
理を行うのである（階層整合）。

階層整合とは、異なる特徴を分類能力の高い特
徴から順に配列し、順次、正解候補を絞つていく
方法である。すなわち、第１層目は対象カテゴリ
のすべての辞書との間で整合処理を行わなければ
ならないが、第２層目以後は絞られた候補を対象
として整合処理を実施する。したがつて、辞書の
一部との整合処理を実施することになり、異なる
特徴を同時に用いる方法や、同一特徴を階層的に
用いる方法と比較して、大幅に整合時間を短縮す
ることができる。さらに、分類能力の高い特徴か
ら順に配列することにより、候補の数を大幅に絞
ることができる。このようにして、本発明では、
認識精度を落さずに、整合時間を大幅に短縮でき
る。

なお、第２図ｄ，ｅは、分類方法の他の１つで
あつて、方向寄与度によるものである。これは、
漢字パタンの平面を分割し（第２図ｄでは４分
割）、分割されたメツシユ中の、それぞれのメツ
シユにおけるストロークの方向を求めるものであ
る。なお、ストロークとは、第２図ｄの斜線を施
した部分の筆画を指している。第２図ｅは、スト
ロークの方向を説明するための図であり、細長い
輪郭線でストロークの例を示している。ストロー
クの方向の度合い（これを「方向寄与度」と呼ん
でいる）を求めるため、ここでは、４つの方向、
すなわち、水平および垂直方向、斜め（右45゜の
方向、左45゜の方向）の方向に対して、ベクトル
を伸ばし、輪郭線、すなわち、ストローク境界に
至るまでのベクトルの長さを求める。第２図ｅに
示したストロークでは、左上から右下の方向への
ベクトルの長さが最長であり、水平、垂直方向の
ベクトルの長さはいずれもこれより短い。従つ
て、当該ストロークでは、左上から右下の方向へ
の斜めの方向の度合いが大きく、他の方向の度合
いが小さい。この方向寄与度を特徴として、分類
を行うことができる。

第３図は、本発明の一実施例を示すパタン認識
装置のブロツク図であり、第４図は第３図におけ
る分類能力順位記憶部の概念図である。

第３図において、入力帳票１に記載された文字
パタンを含む領域は、光電変換部２により電気信
号に変換される。光電変換器としては、ビデイコ
ン、飛点走査機あるいはCCD（Charge Coupled
Device）等の通常用いられるものでよい。

光電変換部２により電気信号に変換された文字
パタンは、多値のパタンとして前処理部３に供給
される。前処理部３は、多値パタンとして表示さ
れた帳票イメージを２値化し、１文字を切り出
す。この際に、大きさ、傾きの正規化、ノイズの
除去等の正規化処理が行われる。前処理部３によ
り必要な前処理が施された文字パタンは、バツフ
ア・メモリ４に蓄えられ、特徴抽出部５−１〜５
−３の処理の開始を待つ。第３図の実施例では、
説明の便宜上、特徴の種類を３種類とし、また階
層数を３層とする。特徴の種類および階層の数
は、上記以外の任意の値を取ることができる。

バツフア・メモリ４に蓄積された文字パタン
は、特徴抽出部５−１〜５−３に送られ、文字の
特徴を表わす特徴１〜３が抽出される。抽出する
特徴１〜３は、例えば第２図ａ〜ｄの全体の構
え、ペリフエラル、ストローク密度関数および方
向寄与度は勿論、その他の方法を含む特徴の中か
ら３つが選択される。

特徴抽出部５−１〜５−３により抽出された特
徴は、バツフア・メモリ６−１〜６−３に記憶さ
れ、次の階層整合に備える。

一方、あらかじめ定めた標準パタンPi（ｉは１、
２、３、……ｋ）に対して、複数の特徴群Pi(j)
（ｊは１、２、３）と閾値群THij（ｉは１、２、
３、……ｋ、ｊは１、２、３）を求めておき、標
準パタン記憶部８に格納しておく。この閾値群と
は、標準パタンから抽出された複数の特徴量（す
なわち、特徴ベクトル）が張る特徴空間上におい
て、入力パタンから抽出された特徴ベクトルが特
定のカテゴリに入る特徴空間上の領域を定めてい
るもので、分類能力が大きいものほど閾値は小さ
くてもよいことになる。すなわち、入力パタンに
対して距離を計算する際に、Ａの範囲しかないカ
テゴリでは、Ａ以上の計算は不要であり、Ａの範
囲に余裕値αを加えた値が閾値となる。

一方、各標準パタンにおける各特徴の分類能力
順位、つまり閾値を求めておき、分類能力記憶部
７に、閾値の小さい順に並べて格納しておく。

分類能力記憶部７の一例としては、第４図に示
すように、行にカテゴリ名（文字コード）を配置
し、列に層順を配置して、各マトリクスには各カ
テゴリの該当する層において使用される特徴名を
登録したテーブルが格納されている。第４図によ
れば、コード名「A4A2」のカテゴリにおける各
特徴は、Ｂ、Ｃ、Ａの順に分類能力が高いので、
階層整合ではこの順序で使用されることを示して
いる。このようにすれば、第１層で大略分類でき
ることになり、少なくとも第２層までですべて分
類される。第３層は、分類能力が低いので、役に
立たないようであるが、文字パタンの特徴の空間
はいずれも異つており、どれが１番分類能力が高
く、どれが２番目でどれが３番目かを決定するた
めには、同じ空間に合成し直さないと比較できな
いため、これが設置される。

階層整合を行うには、先ず分類能力記憶部７に
記憶された内容を読み出し、各標準パタンの第１
層から第３層までにおいて使用されるべき特徴名
を得る。これらの情報にしたがつて、階層整合を
実施する。

第５図は、第３図の階層整合の動作フローチヤ
ートである。

第５図において、ｊは層順を示し、ｉはカテゴ
リを示す。また、AFiはアクセプト・フラグを表
わし、入力パタンに対して閾値内に入つている場
合は“１”を立てて候補とする。

第１層処理においては、入力パタンのいずれか
の特徴と、すべての標準パタンの第１層目で処理
されるべき特徴との間で照合をとり、類似度Ｓを
得る。得られた類似度Ｓと閾値THijとを比較し、
閾値以下の標準パタンのみを第２層に候補として
送る。すなわち、ｊ＝１を立てて第１層目とした
後、インクリメントされた結果がｊ≦３であれ
ば、照合処理を続行し、ｉ＝１でカテゴリの最初
から開始する（ステツプ21〜23）。アクセプト・
フラグAFiを“１”として、ｉ≦ｋ、つまりカテ
ゴリの最後まで到達していないならば、入力パタ
ンと標準パタンの特徴間の類似度Ｓを求める（ス
テツプ24〜27）。

なお、ステツプ26では、前の層でアクセプトフ
ラグAFi＝１のものだけを抽出して、ステツプ27
で、入力パタンと標準パタンの特徴間の類似度Ｓ
を算出する。従つて、前の層でアクセプトフラグ
AFi＝０のものについては、類似度算出（ステツ
プ27）を行わず、ステツプ30で、次カテゴリに移
る。

次に、類似度Ｓと閾値THijとを比較してＳ＞
THijであればフラグAFi＝０とし、Ｓ≦THijで
あればｉ＝ｉ＋１、つまり次の標準パタンの特徴
との比較に移る（ステツプ28〜30）。このように、
最初にフラグAFi＝“１”を立てておき、マツチ
ングしてリジエクトされたときにフラグAFi＝
“０”とし、次の層では、ステツプ26に示すよう
に、AFi＝１のものだけを抽出して、比較の対象
とする。

第２層においては、第１層目において候補とな
つた標準パタンを抽出し、これと第２層目の特徴
との間で整合をとり、第１層と同じように候補数
を絞る。以下、順次同じ処理を繰り返して候補を
限定する。

階層照合部９において候補となつたカテゴリ
は、類似度Ｓとともに判定部１０に送られ、各層
の類似度Ｓを加算し、最終判定が下される。この
とき、単に類似度Ｓを加算するのも１つの方法で
あるが、各特徴の認別能力の逆数を重みとして用
いる方が一層有効である。

判定部１０の出力は後処理部１１に送られ、棄
却した文字の挿入等を行う。特徴文字が漢字等を
含む場合には、後処理部１１は日本語ワードプロ
セツサ等の日本語編集機能を有することが望まし
い。

以上の動作に必要な制御信号は、制御部２０か
ら供給される。制御部２０は通常のマイクロ・プ
ロセツサを用いればよい。

なお、実施例では、対象を文字に限定したが、
対象が音声や画像であつても、同じ扱いが可能で
あることは勿論である。

第３図の実施例では、莫大なカテゴリを有する
漢字等の認識を効率的に実行することができる。

〔発明の効果〕

以上説明したように、本発明によれば、高速に
整合処理を実施できるので、認識精度を落すこと
なく、パタン認識速度を向上することが可能であ
る。また、各標準パタンにおける各特徴の分類能
力順位、つまり閾値は、分類能力情報としてテー
ブルに保持されており、分類能力が大きいほど、
当該テーブルの閾値は小さくなつている。このた
め、分類能力の大きいカテゴリが定めている特徴
空間上の領域は小さくなり、従つて、認識の妨害
要因となる他のカテゴリの特徴ベクトルが当該領
域に入り込むことを排除でき、その結果、認識精
度が向上する。

【図面の簡単な説明】

第１図は従来の漢字認識方式の機能ブロツク
図、第２図は本発明に用いる各種の特徴抽出方法
の説明図、第３図は本発明の一実施例を示すパタ
ン認識方式の機能ブロツク図、第４図は第３図の
分類能力順位記憶部の概念図、第５図は第３図の
階層整合部の動作フローチヤートである。１：入力帳票、２：光電変換部、３：前処理
部、４，６：バツフア・メモリ、５：特徴抽出
部、７：分類能力記憶部、８：標準パタン記憶
部、９：階層整合部、１０：判定部、１１：後処
理部、２０：制御部。

Claims

【特許請求の範囲】１入力されたパタンから複数の特徴を抽出する
手段と、前記入力パタンの特徴と比較すべき各標
準パタンの複数の特徴を記憶する手段、および、
前記標準パタンの複数の特徴と同じ数だけ直列に
接続された階層整合手段を有するパタン認識シス
テムにおいて、前記特徴記憶手段を、前記標準パ
タンの特徴と予め前記各標準パタン毎に定めた分
類能力順位から構成するとともに、パタンが入力
されると、前記特徴記憶手段中の標準パタンに対
応して定められている順位に応じた特徴を読み出
して、第１層の整合手段で当該入力パタンの特徴
との整合をとり、第２層の整合手段では、第１層
の整合結果で絞られた候補と、次順位の分類能力
を有する特徴とを比較照合し、以下、順次、分類
能力の下位の特徴を用いて整合をとることを特徴
とするパタン認識システム。２前記階層整合手段の各層では、入力パタンの
いずれかの特徴とすべての標準パタンの特徴との
間で照合をとり、類似度を得て、該類似度と、標
準パタン毎に設定される閾値とを比較して、閾値
以下の標準パタンのみを、次の層に候補として送
ることを特徴とする特許請求の範囲第１項記載の
パタン認識システム。