JP2832928B2

JP2832928B2 - 文字認識方法

Info

Publication number: JP2832928B2
Application number: JP61271621A
Authority: JP
Inventors: 道義立川; 正之石上; 寛美石崎
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1986-11-14
Filing date: 1986-11-14
Publication date: 1998-12-09
Anticipated expiration: 2013-12-09
Also published as: JPS63126082A

Description

【発明の詳細な説明】〔技術分野〕本発明は文字認識方法に関し、特に文字の大分類と詳
細識別の組合せによる文字認識方法に関する。〔従来技術〕未知文字と辞書との詳細マッチングの前に、未知文字
の大分類を行い、未知文字の候補になり得る文字種を絞
り込み、絞り込んだ文字種についてだけ未知文字と辞書
との詳細マッチングを行うようにすると、文字認識処理
の効率化に効果がある。従来、このような文字大分類のための特徴量として
は、例えば文字パターンの射影データが用いられてい
る。しかし、候補文字種の絞り込みが不十分になった
り、十分に絞り込もうとした場合に必要な文字種が絞り
込み文字種から漏れやすい等の問題があった。また、辞書は大分類辞書と詳細分類辞書が別々に用意
され、まず、大分類辞書とのマッチングを行い、しかる
後に詳細分類辞書とのマッチングを行うため、文字認識
処理の効率化、辞書のメンテナンス等に限界があった。〔目的〕本発明の目的は、正確かつ十分な文字種の絞り込みを
可能とし、かつ、大分類識別から詳細認識への移行が容
易で、認識率を低下させることなく大分類及び詳細認識
を含めた全体の認識処理の効率を大幅に改善できる文字
認識方法を提供することにある。〔構成〕本発明は、文字認識処理の対象となる各文字種毎に、
大分類特徴量と判定闘値及び詳細特徴量を組としてあら
かじめ辞書に格納しておく。認識処理は、未知文字のパ
ターンを水平方向および垂直方向に走査して白から黒へ
変化する境界部の画素、黒から白へ変化する境界部の画
素、または、その両方の境界部の画素の個数またはそれ
と比例関係の値を大分類特徴量として抽出し、前記辞書
の各文字種について順次、当該文字種の大分類特徴量と
前記抽出された大分類特徴量と比較し、両者の差が当該
文字種に対する判定闘値以下の場合には、引き続いて当
該文字種の詳細特徴量により前記未知文字を詳細確認す
るが、前記両者の差が当該文字種に対する判定闘値以上
の場合には詳細認識をスキップして、次の文字種の処理
に移行する。これにより、所期の目的が達成される。〔実施例〕以下、本発明の実施例について図面を用い詳細に説明
する。第１図は、本発明の各実施例に係る機能的構成を示す
概略ブロック図である。図において、１は原稿から文字のパターンを読み取る
スキャナであり、２はスキャナ１から入力される画像デ
ータから文字行を切り出す行切出し部である。３は行切
出し部２により切り出された文字行データを一時的に記
憶する行バッファメモリである。４は行バッファメモリ３に記憶されている文字行デー
タから個々の文字のパターンを切り出す文字切出し部で
ある。５はその文字パターンを一時的に記憶する文字イ
メージメモリである。６は前処理部であり、これは文字イメージメモリ５上
で文字パターンの正規化、ノイズ除去などの処理を施
す。７は大分類特徴／詳細特徴抽出部であり、例えば一般
的なマイクロプロセッサを用いてプログラムによって特
徴抽出処理を行うものである。こゝでは、文字イメージ
メモリ５上の前処理後の文字パターンから、大分類用特
徴量と詳細特徴量が抽出される。大分類用特徴量は、ここでの実施例では、文字イメー
ジメモリ５に記憶されている文字パターンを水平方向お
よび垂直方向に走査して、白画素から黒画素への変化点
を順次カウントし、その積算値（総カウント値）を利用
するものとする。この大分類用特徴量の抽出処理につい
ては、第２図および第３図により後述する。詳細特徴量は入力文字と辞書との詳細マッチングに利
用するための特徴量である。この実施例では、本出願人
が提案済みの多層方向ヒストグラム法により詳細特徴量
として抽出される。この詳細特徴量の抽出は次のようにして行われる。ま
ず、文字イメージメモリ５に記憶されている文字パター
ンが走査され、文字線輪郭画素に方向コードが付けられ
る。この処理と同時に、またはその後に、文字パターン
の各辺からその対向辺に向かって文字パターンが走査さ
れ、白画素の次に現われる方向コードを検出し、その方
向コードが各走査線上で何番目に検出されたかによって
複数の層に層別にする。そして、文字パターンの枠内の
メッシュ領域毎に、ある層迄の層別に各方向コードのヒ
ストグラムを求める。このヒストグラムが詳細特徴量で
ある。この詳細特徴量は、それを成分とした多次元の特
徴ベクトルの形で特徴量メモリ８の領域8aに一時的に記
憶される。なお、大分類特徴量は、特徴量メモリ８の領域8bに一
時的に記憶される。第11図に、大分類用特徴量抽出の具体例を示す。これ
は、文字「あ」の場合、水平方向及び垂直方向に走査し
て、白画素から黒画素への変化点を順次カウントした結
果、その積算値は「400」であったことを示している。
同様に、文字「い」の場合は、「200」であったことを
示している。即ち、大分類用特徴量は文字パターンの複
雑度を表わしている。第12図に、詳細特徴量抽出の具体例を示す。ここで
は、簡単に方向コードを１〜８として、文字領域３×３
のメッシュに分割し、その各サブ領域１〜９での各方向
コード１〜８のヒストグラムを求めたものを詳細特徴量
としている。したがって、詳細特徴量の８×３×３＝72
個の数値の列（特徴ベクトル）の形で表わされる。例え
ば、「あ」の場合、詳細特徴量は「10,1,12,3,・・・」
の72個の数値列で表わされる。ここで、「10」はサブ領
域１の方向コード１の数、「１」は同サブ領域１の方向
コード２の数、「12」は同サブ領域１の方向コード３の
数、「３」は同サブ領域１の方向コード４の数を表わ
し、以下、同様にして、最後（72番目）はサブ領域９の
方向コード８の数を表わすことになる。このような詳細
特徴量は、所謂文字パターンの輪郭画素を追跡すること
で求められることは、よく知られるところである。９は辞書である。この辞書９には、文字認識処理の対
象とある各文字種毎に、標準文字パターンから抽出され
た同様の多層方向コストグラム法による特徴ベクトル
（詳細特徴量）、および大分類特徴／詳細特徴抽出部７
により抽出される大分類特徴量と同様の大分類特徴量
（ICOMPd）が格納されている。第13図に辞書９の具体例を示す。なお、判定闘値は、
大分類特徴量による絞り込みの判定に使用されるもの
で、これについては後述する。 10はマッチング部である。このマッチング部10は、入
力文字パターンから抽出された大分類特徴量（ICOMP）
を用いた入力文字の大分類と、この大分類により絞り込
まれた文字種に関して、詳細特徴量を用いた入力文字と
辞書との詳細マッチングとを行う部分であり、その処理
の概略フローチャートを第４図に示す。 12はマッチング部10により最終的に選ばれた候補文字
のコードを認識結果データとして出力する結果出力部で
ある。次に第２図および第３図を参照して、本発明の第１の
実施例における大分類特徴／詳細特徴抽出部７による大
分類特徴量の抽出処理について説明する。なお、以下の
説明におけるカウンタ、レジスタなどは大分類特／詳細
特徴抽出部７のマイクロプロセッサの内部レジスタまた
はメモリ上の特定領域であるが、図には示されていな
い。第２図に示すステップ20からステップ31は、文字パタ
ーンを左から右に主走査しながらラスタースキャンを行
い、白から黒へ変化する境界部の画素を検出し、走査線
上のNTH番目（層）以降の境界部画素を係数する処理部
分である。まず、カウンタICOMPおよびカウンタＪがクリアされ
る（ステップ20）。文字パターンの垂直座標を示すカウンタＪがインクリ
メントされ（ステップ22）、その値と文字パターンの垂
直サイズJSIZEとの比較判定が行われる（ステップ2
2）。Ｊ≦JSIZEならば、境界部画素の層番号を示すカウン
タICOUNT、文字パターンの水平座標を示すカウンタＩ、
およびフラグIFLGがリセットされる（ステップ23）。カンウンタＩがインクリメントされ（ステップ24）、
その値と文字パターンの水平サイズISIZEとの比較判定
が行われる（ステップ25）。Ｉ＞ISIZEの場合、現在の水平座標については走査は
終わりであるから、ステップ21に戻り、走査座標が副走
査方向へ進められる。Ｉ≦ISIZEの場合、現在の水平座標についての走査の
途中であるので、文字パターンのカウントI,Jで指定さ
れる座標の画素のデータIMAGE（I,J）が参照され、“0"
（白）であるか調べられる（ステップ26）。 “0"であれば、現在の画素は白画素であるから、フラ
グIFLGがリセットされ（ステップ27）、ステップ24に戻
る。 IMAGE（I,J）が“0"でなければ、つまり“1"（黒）の
場合、フラグIFLGが“0"であるか調べられる（ステップ
28）。これが“1"ならば、現在の画素は白から黒へ変化
する境界部の画素ではないからステップ24に戻る。フラグIFLGが“0"ならば、現在の画素は白から黒へ変
化す境界部の画素であるから、フラグIFLGが“1"にセッ
トされ、カウンタICOUNTがインクリメントされ（ステッ
プ29）。次のステップ30において、カウンタICOUNTとNTHとの
比較判定が行われる。この比較判定でICOUNT≧NTHであ
れば、現在の境界部画素は計算すべきものであるから、
カウンタICOMPがインクリメントされ（ステップ31）、
ステップ24に戻る。 ICOUNT＜NTHの場合、現在の境界部画素は計数すべき
ものではないので、直ちにステップ24に戻る。こゝで、NTH層以上境界部画素だけを計数するのは、
単純な文字（英数字など）の大分類特徴量は（ICOUNTの
最終値）をゼロとするか、または、複雑な文字の大分類
特徴量よりも十分に小さい値にするためであり、NTH値
は変更可能である。たゞし、すべての層の境界部画素を計数して、その層
数を大分類特徴量とする場合には、NTH＝１とすればよ
い。文字パターンの最下部までラスタースキャンが終わる
と、ステップ22の判定条件が成立し、第３図に示す処理
が進む。第３図に示すステップ32からステップ43は、文字パタ
ーンを上から下へ主走査しながらラスタースキャンを行
い、白から繰炉へ変化する境界部の画素を検出し、走査
線上のNTH番目（層）以降の境界部画素を計数する処理
部分がある。まず、カウンタＩがクリアされる（ステップ32）。文字パターンの水平座標を示すカウンタＩがインクリ
メントされ（ステップ33）、その値と文字パターンの垂
直サイズJSIZEとの比較判定が行われる（ステップ3
4）。Ｉ≦JSIZEならば、カウンタICOUNT、ＩおよびフラグI
FLGがリセットされる（ステップ35）。カウンタＪがインクリメントされ（ステップ36）、そ
の値と文字パターンの垂直サイズJSIZEとの比較判定が
行われる（ステップ37）。Ｊ＜ISIZEの場合、現在の垂直座標についての走査は
終わりであるから、ステップ33に戻り、走査座標が副走
査方向へ進められる。Ｊ≦JSIZEの場合、現在の水平座標についての走査の
途中であるので、文字パターンのカウンタI,Jで指定さ
れる座標の画素のデータIMAGE（I,J）が参照され、“0"
（白）であるか調べられる（ステップ38）。 “0"であれば、現在の画素は白画素であるから、フラ
グIFLGがリセットされ（ステップ39）、ステップ36に戻
る。 IMAGE（I,J）が“0"でなければ、つまり“1"（黒）の
場合、フラグIFLGが“0"であるか調べられる（ステップ
40）。これが“1"ならば、現在の画素は白から黒へ変化
する境界部の画素ではないからステップ36へ戻る。フラグIFLGが“0"ならば、現在の画素は白から黒へ変
化する境界部の画素であるから、フラグIFLGが“1"にセ
ットされ、カウンタICOUNTがインクリメントされる（ス
テップ41）。次のステップ42において、カウンタICOUNTとNTHとの
比較判定が行われる。この比較判定でICOUNT≧NTHであ
れば、現在の境界部画素は計数すべきものであるから、
カウンタICOMPがインクリメントされ（ステップ43）、
ステップ36に戻る。 ICOUNT＜NTHの場合、現在の境界部画素は計数すべき
ものではないので、直ちにステップ36に戻る。文字パターンの右端部までラスタースキャンが終わる
と、ステップ34の判定条件が成立し、大分類特徴の抽出
処理を完了する。次に、第４図を参照して、本実施例におけるマッチン
グ部10の処理を説明する。大分類特徴／詳細特徴抽出部７の特徴抽出処理が完了
すると、マッチング部10の処理が始まる。辞書９に格納されている一つの文字種の大分類特徴量
ICOMPdが読み出される（ステップ51）。その大分類特徴
量ICOMPdと、入力文字パターンから抽出された大分類特
徴量ICOMPとの差の絶対値と所定の判定闘値THとの比較
判定が行われる（ステップ52）。つまり大分類が行われ
る。その差の絶対値が判定闘値TH以下であれば、現在の文
字値は入力文字の候補になり得るから、当該文字種に関
して、辞書９に登録されている特徴ベクトルと、入力文
字から抽出された特徴ベクトルとを用いた詳細マッチン
グが行われる（ステップ53）。この詳細マッチングによ
り求められた特徴ベクトルの距離と、これまでの候補文
字の距離とが比較され、距離の小さいほうの候補文字が
残される。大分類特徴量の差の絶対値が判定闘値THより大きい場
合、当該文字種は入力文字の候補となり得ないから、詳
細マッチング処理が行われず、次の文字種の大分類が行
われる。最後の文字種に関する処理が完了すると、判定ステッ
プ50の条件が成立するので、処理が完了し、最終的に得
られた候補文字のコードが結果出力部12により出力され
る。ここで、大分類／詳細マッチング処理の具体例を説明
する。今、入力文字パターンの大分類特徴量は「400」
（第11図）、詳細特徴量（特徴ベクトル）は「10,1,12,
3,・・・」（第12図）であったとする。辞書９は第13図
の通りとする。まず、辞書９の文字種「Ａ」の大分類特
徴量「210」と入力文字パターンの大分類特徴量「400」
の差の絶対値は|210−400|＝190であり、これは判定闘
値「20」以上であるため、詳細マッチング処理を行わ
ず、即ち、詳細マッチング処理をスキップして、次の文
字種「Ｂ」に移行する。文字種「Ｂ」の大分類特徴量
「250」と入力文字パターンの大分類特徴量「400」の差
の絶対値は|250−400|＝150であり、これも判定闘値「4
0」以上であるため、詳細マッチング処理をスキップす
る。以下、辞書の照合が続き、文字種「あ」まできたと
する。文字種「あ」の大分類特徴量「390」と入力文字
パターンの大分類特徴量「400」の差の絶対値は、|390
−400|＝10であり、これは判定闘値「30」以下であるた
め、引き続いて詳細マッチング処理が行われる。この詳
細マッチング処理では、当該文字種「あ」の詳細特徴量
「12,2,11,2,・・・」と入力文字パターンの詳細特徴量
「10,1,12,3,・・・」とを、各要素毎に両者の差の絶対
値を求め、その総和を距離値とする。即ち、距離値は、
|12−10|＋|2−1|＋|11−12|＋|2−3|＋・・・を計算す
ることで求まる。以下、辞書９の各文字種と入力文字パ
ターンの照合を繰り返し、距離値の小さい文字種が候補
文字として残される。こうして、本例の場合は、少なく
とも文字種「あ」が残ることになる。次に、本発明の第２の実施例について説明する。この実施例と前記第１の実施例とは、大分類特徴量が
一部異なるだけであり、その他は同様である。すなわ
ち、前記第１実施例において、水平走査および垂直方向
により白から黒に変化する境界部の画素の個数を大分類
特徴量としたが、この実施例において、白から黒に変化
する境界部の画素と黒から白へ変化する境界部の画素の
両方の個数を大分類特徴量として利用する。第５図および第６図は、その大分類特徴量の抽出処理
の概略フローチャートであり、この図を参照して処理内
容を説明する。第５図のステップ60からステップ73は、文字パターン
を左から右に主走査しながらラスタースキャンを行い、
大分類特徴量を抽出する処理である。まず、カウンタICOMPおよびカウンタＪがクリアされ
る（ステップ60）。カウンタＪがインクリメントされ（ステップ61）、そ
の値と文字パターンの垂直サイズJSISZEとの比較判定が
行われる（ステップ62）。Ｊ≦JSIZEならば、カウンタＩおよびフラグIFLGがリ
セットされる（ステップ63）。カウンタＩがインクリメントされ（ステップ64）、そ
の値と文字パターンの水平サイズISIZEとの比較判定が
行われる。（ステップ65）。Ｉ＞ISIZEの場合、現在の水平座標についての走査は
終わりであるから、ステップ66の後にステップ61に戻
り、走査座標副走査方向へ進められる。Ｉ≦ISIZEの場合、現在の水平座標についての走査の
方向で途中であるので、文字パターンのカンウンタI,J
で指定される座標の画素のデータIMAGE（I,J）が参照さ
れ、“0"（白）であるか調べられる（ステップ67）。 “0"でなければフラグIFLGが“0"であるか調べられ
（ステップ68）、“1"ならば、現在の画素（黒）は白か
ら黒へ変化する境界部の画素ではないから（また黒から
白へ変化する境界部の画素でもない）ステップ64に戻
る。フラグIFLGが“0"ならば、現在の画素（黒）は白から
黒へ変化する境界部の画素であるから、フラグIFLGが
“1"にセットされ（ステップ69）、カウンタICOMPがイ
ンクリメントされ（ステップ70）、ステップ64に戻る。ステップ67において画素データが“0"（白）ならば、
フラグIFLGが“0"であるか調べられ（ステップ71）、
“0"ならば、現在の画素（白）は黒から白へ変化する境
界部の画素ではないから（また白から黒へ変化する境界
部の画素でもない）ステップ64に戻る。フラグIFLGが“0"でないならば、現在の画素（白）は
黒から白へ変化する境界部の画素であるから、フラグIF
LGが“0"にリセットされ（ステップ72）、カウンタICOM
Pがインクリメントされ（ステップ73）、ステップ64に
戻る。文字パターンの最下部までラスタースキャンが終わる
と、ステップ62の判定条件が成立し、大６図に示す処理
に進む。第６図に示すステップ74からステップ88は、文字パタ
ーンを上から下へ主走査しながらラスタースキャンを行
い、白から黒へ変化する境界部の画素および黒から白へ
変化する境界部の画素を計数する処理である。カウンタＩのクリア（ステップ74）の後のステップ75
からステップ88は、垂直走査である関係からカウンタＩ
とカウンタＪの関係が逆になっている以外は、第５図の
ステップ61からステップ73の対応するものと同様であ
る。文字パターンの右端部までラスタースキャンが終わる
と、ステップ76の判定条件が成立し、大分類特徴量の抽
出処理を完了する。さて、前記各実施例において、大分類により詳細マッ
チングを行うか否かの判定のための闘値THは、文字主に
関係なく固定してもよいが、文字種毎に用意し辞書に登
録しておいてもよい。そのような判定闘値の決定方法の一例を次に説明す
る。辞書作成に際しては、各文字種ｋに関してＭ個の文
字パターンから特徴ベクトルを抽出し、その平均ベクト
ルを標準文字パターンの特徴ベクトルとして辞書に登録
する。こゝで述べる判定闘値決定法では、文字種別に、
辞書作成用のＭ個の文字パターンのそれぞれから前述の
ような大分類特徴量を抽出し、それと、その平均（辞書
の標準文字パターンの大分類特徴量に対応）との差の偏
差（または分散）が判定闘値とした決定される。このような判定闘値の決定処理のフローチャートを第
７図に示す。この図において、ｋは文字種、ｍは各文字
種の辞書作成用パターンの番号（カウンタ）、Fkmは文
字種ｋのｍ番目の文字パターンから抽出された大分類特
徴量、Fkは文字種ｋの大分類特徴量の平均、THkはレジ
スタであり、ステップ98でレジスタTHkの値が文字種ｋ
の判定闘値として辞書に登録される。第14図及び第15図に具体例を示す。第14図は、文字種
「あ」に関して、複数の文字パターンからそれぞれ詳細
特徴量（特徴ベクトル）を抽出し、その平均ベクトルを
当該文字種「あ」の標準文字パターンの特徴ベクトルと
して辞書に登録する例を示したものである。ここで、詳
細特徴量の平均ベクトルは、各詳細特徴量の各要素（次
元）の数値の平均を順次求めることが得られる。第15図
は、この文字種「あ」の詳細特徴量の平均ベクトルに対
し、その大分類の特等量の平均と判定闘値の例を示した
ものである。ここで、判定闘値は、各大分類特徴量の数
値の平均、分散等から求められる。同様に、辞書作成用文字パターンのそれぞれの大分類
特徴量のその平均（辞書の辞書文字パターンの大分類特
徴量に対応）との差の絶対値の中央値（メディアン）
を、文字識別の判定闘値として決定することもできる。第８図は、そのような判定闘値を決定する処理のフロ
ーチャートであり、各符号は第７図と同様である。さて、手書き文字の認識の場合、利用者（筆記者）に
よって確認率に差がでる。また、同じ利用者でも、辞書
の癖に慣れるに従い認識率が向上する。したがって、文字種別に複数レベルの判定闘値を用意
しておき、利用者やその熟練度に応じて、大分類の判定
闘値として用いるレベルを指定し、そのレベルの判定闘
値をマッチング部10に選択的に使用させるようにすれ
ば、辞書と詳細マッチングをさらに減らし、認識時間を
一層短縮できる可能性がある。第図９は、そのような文字種別に複数レベルの判定闘
値を決定するための処理のフローチャートである。この
図において、Ｌはレベルであリ、THkは第７図のフロー
チャートによって決定された文字種ｋの判定闘値であ
る。THk（Ｌ）はレベルＬの判定闘値であり、MAXはレベ
ル数である。この場合、文字種ｋに対してMAX個の判定闘値THk
（１）,THk（２）,THk（３），…,THk（MAX）が決定さ
れる。第10図は、文字種別に複数レベルの判定闘値を決定す
る他の法を示すフローチャートである。この場合は、辞
書作成用の各文字パターンから抽出した大分類特徴量と
辞書の平均パターンとの差の絶対値Ｔ（ｍ）が小さい順
（または大きい順）にソートされる（ステップ120）。
そして、M/MAX番目ごとの差の絶対値がレベルＬの判定
闘値として決定され、登録される（ステップ122から12
6）。なお、最高レベル（Ｌ＝MAX）の判定闘値はＴ（Ｍ−
ｃ）の値が選ばれる（ステップ125）。こゝでｃは定数
（１または２）である。このようにするのは、辞書作成
文字パターンの変形の大きな異常パターンが含まれた場
合に、その影響を排除するためである。〔効果〕以上の説明から明らかなように、本発明の文字認識方
法においては、文字パターンの複雑度を的確に表す特徴
量を用いて入力文字の大分類を行い、候補となり得る文
字種を正確かつ十分に絞り込むことができ、また、その
特徴量の抽出も簡便であるから、認識率を低下させるこ
となく文字認識処理の効率を大幅に改善できる。さらに、本発明の文字認識方法においては、文字認識
処理の対象となる各文字識別の大分類特徴量と判定闘値
を辞書に持たせることで、変動の大きい文字、小さい文
字などに柔軟に対応でき、効率よく大分類識別速度を上
げることができる。また、文字種別に、大分類特徴量と
詳細特徴量を組として辞書に持たせることで、大分類識
別から詳細認識への移行が用意になり、さらに辞書構成
の簡単で辞書のメンテナンスが容易になり、新規辞書の
追加削除が簡単になる。

【図面の簡単な説明】第１図は本発明の各実施例に係る機能的構成を示す概略
ブロック図、第２図は本発明の第１の実施例における大
分類特徴量の抽出処理の前半部を示す概略フローチャー
ト、第３図はその抽出処理の後半部を示す概略フローチ
ャート、第４図は本発明の第１の実施例におけるマッチ
ング処理の概略フローチャート、第５図は本発明の第２
の実施例における大分類特徴量の抽出処理の前半部を示
す概略フローチャート、第６図はその抽出処理の後半部
を示す概略フローチャート、第７図は文字種別の判定闘
値を決定する処理の一例を示す概略フローチャート、第
８図は文字種別の判定闘値を決定する処理の他の例を示
す概略フローチャート、第９図は文字種毎に複数レベル
の判定闘値を決定する処理の一例を示す概略フローチャ
ート、第10図は文字種に複数レベルの判定闘値を決定す
る処理の他の例を示す概略フローチャート、第11図は大
分類特徴量抽出の具体例を示す図、第12図は詳細特徴量
抽出の具体例を示す図、第13図は辞書の具体例を示す
図、第14図は複数の詳細特徴量の平均ベクトルの算出例
を示す図、第15図は複数の大分類特徴量の平均と判定闘
値の算出例を示す図である。５……文字イメージメモリ、７……大分類特徴／詳細特徴抽出部、８……特徴量メモリ、９……辞書、 10……マッチング部。

───────────────────────────────────────────────────── フロントページの続き (72)発明者石崎寛美東京都大田区中馬込１丁目３番６号株式会社リコー内 (56)参考文献特開昭48−54836（ＪＰ，Ａ) 特開昭48−54837（ＪＰ，Ａ) 特開昭61−74083（ＪＰ，Ａ) 特開昭60−89290（ＪＰ，Ａ)

Claims

(57)【特許請求の範囲】１．同一辞書内に、文字認識処理の対象となる各文字種
毎に、大分類特徴量と判定闘値及び詳細特徴量を組とし
てあらかじめ格納し、未知文字のパターンを水平方向および垂直方向に走査し
て白から黒へ変化する境界部の画素、黒から白へ変化す
る境界部の画素、または、その両方の境界部の画素の個
数またはそれと比例関係の値を大分類特徴量として抽出
し、前記辞書の各文字種について順次、当該文字種の大分類
特徴量と前記抽出された大分類特徴量と比較し、両者の
差が当該文字種に対する判定闘値以下の場合に、引き続
いて当該文字種の詳細特徴量により前記未知文字を詳細
認識し、前記両者の差が当該文字種に対する判定闘値以
上の場合には詳細認識をスキップすることを特徴とする
文字認識方法。２．特許請求の範囲第１項記載の文字認識方法におい
て、文字種毎に、大分類特徴量の判定闘値を複数個用意
し、その中の一つを選択的に用いることを特徴とする文
字認識方法。