JP2832928B2 - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JP2832928B2
JP2832928B2 JP61271621A JP27162186A JP2832928B2 JP 2832928 B2 JP2832928 B2 JP 2832928B2 JP 61271621 A JP61271621 A JP 61271621A JP 27162186 A JP27162186 A JP 27162186A JP 2832928 B2 JP2832928 B2 JP 2832928B2
Authority
JP
Japan
Prior art keywords
character
large classification
feature amount
detailed
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61271621A
Other languages
English (en)
Other versions
JPS63126082A (ja
Inventor
道義 立川
正之 石上
寛美 石崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP61271621A priority Critical patent/JP2832928B2/ja
Publication of JPS63126082A publication Critical patent/JPS63126082A/ja
Application granted granted Critical
Publication of JP2832928B2 publication Critical patent/JP2832928B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 〔技術分野〕 本発明は文字認識方法に関し、特に文字の大分類と詳
細識別の組合せによる文字認識方法に関する。 〔従来技術〕 未知文字と辞書との詳細マッチングの前に、未知文字
の大分類を行い、未知文字の候補になり得る文字種を絞
り込み、絞り込んだ文字種についてだけ未知文字と辞書
との詳細マッチングを行うようにすると、文字認識処理
の効率化に効果がある。 従来、このような文字大分類のための特徴量として
は、例えば文字パターンの射影データが用いられてい
る。しかし、候補文字種の絞り込みが不十分になった
り、十分に絞り込もうとした場合に必要な文字種が絞り
込み文字種から漏れやすい等の問題があった。 また、辞書は大分類辞書と詳細分類辞書が別々に用意
され、まず、大分類辞書とのマッチングを行い、しかる
後に詳細分類辞書とのマッチングを行うため、文字認識
処理の効率化、辞書のメンテナンス等に限界があった。 〔目 的〕 本発明の目的は、正確かつ十分な文字種の絞り込みを
可能とし、かつ、大分類識別から詳細認識への移行が容
易で、認識率を低下させることなく大分類及び詳細認識
を含めた全体の認識処理の効率を大幅に改善できる文字
認識方法を提供することにある。 〔構 成〕 本発明は、文字認識処理の対象となる各文字種毎に、
大分類特徴量と判定闘値及び詳細特徴量を組としてあら
かじめ辞書に格納しておく。認識処理は、未知文字のパ
ターンを水平方向および垂直方向に走査して白から黒へ
変化する境界部の画素、黒から白へ変化する境界部の画
素、または、その両方の境界部の画素の個数またはそれ
と比例関係の値を大分類特徴量として抽出し、前記辞書
の各文字種について順次、当該文字種の大分類特徴量と
前記抽出された大分類特徴量と比較し、両者の差が当該
文字種に対する判定闘値以下の場合には、引き続いて当
該文字種の詳細特徴量により前記未知文字を詳細確認す
るが、前記両者の差が当該文字種に対する判定闘値以上
の場合には詳細認識をスキップして、次の文字種の処理
に移行する。これにより、所期の目的が達成される。 〔実施例〕 以下、本発明の実施例について図面を用い詳細に説明
する。 第1図は、本発明の各実施例に係る機能的構成を示す
概略ブロック図である。 図において、1は原稿から文字のパターンを読み取る
スキャナであり、2はスキャナ1から入力される画像デ
ータから文字行を切り出す行切出し部である。3は行切
出し部2により切り出された文字行データを一時的に記
憶する行バッファメモリである。 4は行バッファメモリ3に記憶されている文字行デー
タから個々の文字のパターンを切り出す文字切出し部で
ある。5はその文字パターンを一時的に記憶する文字イ
メージメモリである。 6は前処理部であり、これは文字イメージメモリ5上
で文字パターンの正規化、ノイズ除去などの処理を施
す。 7は大分類特徴/詳細特徴抽出部であり、例えば一般
的なマイクロプロセッサを用いてプログラムによって特
徴抽出処理を行うものである。こゝでは、文字イメージ
メモリ5上の前処理後の文字パターンから、大分類用特
徴量と詳細特徴量が抽出される。 大分類用特徴量は、ここでの実施例では、文字イメー
ジメモリ5に記憶されている文字パターンを水平方向お
よび垂直方向に走査して、白画素から黒画素への変化点
を順次カウントし、その積算値(総カウント値)を利用
するものとする。この大分類用特徴量の抽出処理につい
ては、第2図および第3図により後述する。 詳細特徴量は入力文字と辞書との詳細マッチングに利
用するための特徴量である。この実施例では、本出願人
が提案済みの多層方向ヒストグラム法により詳細特徴量
として抽出される。 この詳細特徴量の抽出は次のようにして行われる。ま
ず、文字イメージメモリ5に記憶されている文字パター
ンが走査され、文字線輪郭画素に方向コードが付けられ
る。この処理と同時に、またはその後に、文字パターン
の各辺からその対向辺に向かって文字パターンが走査さ
れ、白画素の次に現われる方向コードを検出し、その方
向コードが各走査線上で何番目に検出されたかによって
複数の層に層別にする。そして、文字パターンの枠内の
メッシュ領域毎に、ある層迄の層別に各方向コードのヒ
ストグラムを求める。このヒストグラムが詳細特徴量で
ある。この詳細特徴量は、それを成分とした多次元の特
徴ベクトルの形で特徴量メモリ8の領域8aに一時的に記
憶される。 なお、大分類特徴量は、特徴量メモリ8の領域8bに一
時的に記憶される。 第11図に、大分類用特徴量抽出の具体例を示す。これ
は、文字「あ」の場合、水平方向及び垂直方向に走査し
て、白画素から黒画素への変化点を順次カウントした結
果、その積算値は「400」であったことを示している。
同様に、文字「い」の場合は、「200」であったことを
示している。即ち、大分類用特徴量は文字パターンの複
雑度を表わしている。 第12図に、詳細特徴量抽出の具体例を示す。ここで
は、簡単に方向コードを1〜8として、文字領域3×3
のメッシュに分割し、その各サブ領域1〜9での各方向
コード1〜8のヒストグラムを求めたものを詳細特徴量
としている。したがって、詳細特徴量の8×3×3=72
個の数値の列(特徴ベクトル)の形で表わされる。例え
ば、「あ」の場合、詳細特徴量は「10,1,12,3,・・・」
の72個の数値列で表わされる。ここで、「10」はサブ領
域1の方向コード1の数、「1」は同サブ領域1の方向
コード2の数、「12」は同サブ領域1の方向コード3の
数、「3」は同サブ領域1の方向コード4の数を表わ
し、以下、同様にして、最後(72番目)はサブ領域9の
方向コード8の数を表わすことになる。このような詳細
特徴量は、所謂文字パターンの輪郭画素を追跡すること
で求められることは、よく知られるところである。 9は辞書である。この辞書9には、文字認識処理の対
象とある各文字種毎に、標準文字パターンから抽出され
た同様の多層方向コストグラム法による特徴ベクトル
(詳細特徴量)、および大分類特徴/詳細特徴抽出部7
により抽出される大分類特徴量と同様の大分類特徴量
(ICOMPd)が格納されている。 第13図に辞書9の具体例を示す。なお、判定闘値は、
大分類特徴量による絞り込みの判定に使用されるもの
で、これについては後述する。 10はマッチング部である。このマッチング部10は、入
力文字パターンから抽出された大分類特徴量(ICOMP)
を用いた入力文字の大分類と、この大分類により絞り込
まれた文字種に関して、詳細特徴量を用いた入力文字と
辞書との詳細マッチングとを行う部分であり、その処理
の概略フローチャートを第4図に示す。 12はマッチング部10により最終的に選ばれた候補文字
のコードを認識結果データとして出力する結果出力部で
ある。 次に第2図および第3図を参照して、本発明の第1の
実施例における大分類特徴/詳細特徴抽出部7による大
分類特徴量の抽出処理について説明する。なお、以下の
説明におけるカウンタ、レジスタなどは大分類特/詳細
特徴抽出部7のマイクロプロセッサの内部レジスタまた
はメモリ上の特定領域であるが、図には示されていな
い。 第2図に示すステップ20からステップ31は、文字パタ
ーンを左から右に主走査しながらラスタースキャンを行
い、白から黒へ変化する境界部の画素を検出し、走査線
上のNTH番目(層)以降の境界部画素を係数する処理部
分である。 まず、カウンタICOMPおよびカウンタJがクリアされ
る(ステップ20)。 文字パターンの垂直座標を示すカウンタJがインクリ
メントされ(ステップ22)、その値と文字パターンの垂
直サイズJSIZEとの比較判定が行われる(ステップ2
2)。 J≦JSIZEならば、境界部画素の層番号を示すカウン
タICOUNT、文字パターンの水平座標を示すカウンタI、
およびフラグIFLGがリセットされる(ステップ23)。 カンウンタIがインクリメントされ(ステップ24)、
その値と文字パターンの水平サイズISIZEとの比較判定
が行われる(ステップ25)。 I>ISIZEの場合、現在の水平座標については走査は
終わりであるから、ステップ21に戻り、走査座標が副走
査方向へ進められる。 I≦ISIZEの場合、現在の水平座標についての走査の
途中であるので、文字パターンのカウントI,Jで指定さ
れる座標の画素のデータIMAGE(I,J)が参照され、“0"
(白)であるか調べられる(ステップ26)。 “0"であれば、現在の画素は白画素であるから、フラ
グIFLGがリセットされ(ステップ27)、ステップ24に戻
る。 IMAGE(I,J)が“0"でなければ、つまり“1"(黒)の
場合、フラグIFLGが“0"であるか調べられる(ステップ
28)。これが“1"ならば、現在の画素は白から黒へ変化
する境界部の画素ではないからステップ24に戻る。 フラグIFLGが“0"ならば、現在の画素は白から黒へ変
化す境界部の画素であるから、フラグIFLGが“1"にセッ
トされ、カウンタICOUNTがインクリメントされ(ステッ
プ29)。 次のステップ30において、カウンタICOUNTとNTHとの
比較判定が行われる。この比較判定でICOUNT≧NTHであ
れば、現在の境界部画素は計算すべきものであるから、
カウンタICOMPがインクリメントされ(ステップ31)、
ステップ24に戻る。 ICOUNT<NTHの場合、現在の境界部画素は計数すべき
ものではないので、直ちにステップ24に戻る。 こゝで、NTH層以上境界部画素だけを計数するのは、
単純な文字(英数字など)の大分類特徴量は(ICOUNTの
最終値)をゼロとするか、または、複雑な文字の大分類
特徴量よりも十分に小さい値にするためであり、NTH値
は変更可能である。 たゞし、すべての層の境界部画素を計数して、その層
数を大分類特徴量とする場合には、NTH=1とすればよ
い。 文字パターンの最下部までラスタースキャンが終わる
と、ステップ22の判定条件が成立し、第3図に示す処理
が進む。 第3図に示すステップ32からステップ43は、文字パタ
ーンを上から下へ主走査しながらラスタースキャンを行
い、白から繰炉へ変化する境界部の画素を検出し、走査
線上のNTH番目(層)以降の境界部画素を計数する処理
部分がある。 まず、カウンタIがクリアされる(ステップ32)。 文字パターンの水平座標を示すカウンタIがインクリ
メントされ(ステップ33)、その値と文字パターンの垂
直サイズJSIZEとの比較判定が行われる(ステップ3
4)。 I≦JSIZEならば、カウンタICOUNT、IおよびフラグI
FLGがリセットされる(ステップ35)。 カウンタJがインクリメントされ(ステップ36)、そ
の値と文字パターンの垂直サイズJSIZEとの比較判定が
行われる(ステップ37)。 J<ISIZEの場合、現在の垂直座標についての走査は
終わりであるから、ステップ33に戻り、走査座標が副走
査方向へ進められる。 J≦JSIZEの場合、現在の水平座標についての走査の
途中であるので、文字パターンのカウンタI,Jで指定さ
れる座標の画素のデータIMAGE(I,J)が参照され、“0"
(白)であるか調べられる(ステップ38)。 “0"であれば、現在の画素は白画素であるから、フラ
グIFLGがリセットされ(ステップ39)、ステップ36に戻
る。 IMAGE(I,J)が“0"でなければ、つまり“1"(黒)の
場合、フラグIFLGが“0"であるか調べられる(ステップ
40)。これが“1"ならば、現在の画素は白から黒へ変化
する境界部の画素ではないからステップ36へ戻る。 フラグIFLGが“0"ならば、現在の画素は白から黒へ変
化する境界部の画素であるから、フラグIFLGが“1"にセ
ットされ、カウンタICOUNTがインクリメントされる(ス
テップ41)。 次のステップ42において、カウンタICOUNTとNTHとの
比較判定が行われる。この比較判定でICOUNT≧NTHであ
れば、現在の境界部画素は計数すべきものであるから、
カウンタICOMPがインクリメントされ(ステップ43)、
ステップ36に戻る。 ICOUNT<NTHの場合、現在の境界部画素は計数すべき
ものではないので、直ちにステップ36に戻る。 文字パターンの右端部までラスタースキャンが終わる
と、ステップ34の判定条件が成立し、大分類特徴の抽出
処理を完了する。 次に、第4図を参照して、本実施例におけるマッチン
グ部10の処理を説明する。 大分類特徴/詳細特徴抽出部7の特徴抽出処理が完了
すると、マッチング部10の処理が始まる。 辞書9に格納されている一つの文字種の大分類特徴量
ICOMPdが読み出される(ステップ51)。その大分類特徴
量ICOMPdと、入力文字パターンから抽出された大分類特
徴量ICOMPとの差の絶対値と所定の判定闘値THとの比較
判定が行われる(ステップ52)。つまり大分類が行われ
る。 その差の絶対値が判定闘値TH以下であれば、現在の文
字値は入力文字の候補になり得るから、当該文字種に関
して、辞書9に登録されている特徴ベクトルと、入力文
字から抽出された特徴ベクトルとを用いた詳細マッチン
グが行われる(ステップ53)。この詳細マッチングによ
り求められた特徴ベクトルの距離と、これまでの候補文
字の距離とが比較され、距離の小さいほうの候補文字が
残される。 大分類特徴量の差の絶対値が判定闘値THより大きい場
合、当該文字種は入力文字の候補となり得ないから、詳
細マッチング処理が行われず、次の文字種の大分類が行
われる。 最後の文字種に関する処理が完了すると、判定ステッ
プ50の条件が成立するので、処理が完了し、最終的に得
られた候補文字のコードが結果出力部12により出力され
る。 ここで、大分類/詳細マッチング処理の具体例を説明
する。今、入力文字パターンの大分類特徴量は「400」
(第11図)、詳細特徴量(特徴ベクトル)は「10,1,12,
3,・・・」(第12図)であったとする。辞書9は第13図
の通りとする。まず、辞書9の文字種「A」の大分類特
徴量「210」と入力文字パターンの大分類特徴量「400」
の差の絶対値は|210−400|=190であり、これは判定闘
値「20」以上であるため、詳細マッチング処理を行わ
ず、即ち、詳細マッチング処理をスキップして、次の文
字種「B」に移行する。文字種「B」の大分類特徴量
「250」と入力文字パターンの大分類特徴量「400」の差
の絶対値は|250−400|=150であり、これも判定闘値「4
0」以上であるため、詳細マッチング処理をスキップす
る。以下、辞書の照合が続き、文字種「あ」まできたと
する。文字種「あ」の大分類特徴量「390」と入力文字
パターンの大分類特徴量「400」の差の絶対値は、|390
−400|=10であり、これは判定闘値「30」以下であるた
め、引き続いて詳細マッチング処理が行われる。この詳
細マッチング処理では、当該文字種「あ」の詳細特徴量
「12,2,11,2,・・・」と入力文字パターンの詳細特徴量
「10,1,12,3,・・・」とを、各要素毎に両者の差の絶対
値を求め、その総和を距離値とする。即ち、距離値は、
|12−10|+|2−1|+|11−12|+|2−3|+・・・を計算す
ることで求まる。以下、辞書9の各文字種と入力文字パ
ターンの照合を繰り返し、距離値の小さい文字種が候補
文字として残される。こうして、本例の場合は、少なく
とも文字種「あ」が残ることになる。 次に、本発明の第2の実施例について説明する。 この実施例と前記第1の実施例とは、大分類特徴量が
一部異なるだけであり、その他は同様である。すなわ
ち、前記第1実施例において、水平走査および垂直方向
により白から黒に変化する境界部の画素の個数を大分類
特徴量としたが、この実施例において、白から黒に変化
する境界部の画素と黒から白へ変化する境界部の画素の
両方の個数を大分類特徴量として利用する。 第5図および第6図は、その大分類特徴量の抽出処理
の概略フローチャートであり、この図を参照して処理内
容を説明する。 第5図のステップ60からステップ73は、文字パターン
を左から右に主走査しながらラスタースキャンを行い、
大分類特徴量を抽出する処理である。 まず、カウンタICOMPおよびカウンタJがクリアされ
る(ステップ60)。 カウンタJがインクリメントされ(ステップ61)、そ
の値と文字パターンの垂直サイズJSISZEとの比較判定が
行われる(ステップ62)。 J≦JSIZEならば、カウンタIおよびフラグIFLGがリ
セットされる(ステップ63)。 カウンタIがインクリメントされ(ステップ64)、そ
の値と文字パターンの水平サイズISIZEとの比較判定が
行われる。(ステップ65)。 I>ISIZEの場合、現在の水平座標についての走査は
終わりであるから、ステップ66の後にステップ61に戻
り、走査座標副走査方向へ進められる。 I≦ISIZEの場合、現在の水平座標についての走査の
方向で途中であるので、文字パターンのカンウンタI,J
で指定される座標の画素のデータIMAGE(I,J)が参照さ
れ、“0"(白)であるか調べられる(ステップ67)。 “0"でなければフラグIFLGが“0"であるか調べられ
(ステップ68)、“1"ならば、現在の画素(黒)は白か
ら黒へ変化する境界部の画素ではないから(また黒から
白へ変化する境界部の画素でもない)ステップ64に戻
る。 フラグIFLGが“0"ならば、現在の画素(黒)は白から
黒へ変化する境界部の画素であるから、フラグIFLGが
“1"にセットされ(ステップ69)、カウンタICOMPがイ
ンクリメントされ(ステップ70)、ステップ64に戻る。 ステップ67において画素データが“0"(白)ならば、
フラグIFLGが“0"であるか調べられ(ステップ71)、
“0"ならば、現在の画素(白)は黒から白へ変化する境
界部の画素ではないから(また白から黒へ変化する境界
部の画素でもない)ステップ64に戻る。 フラグIFLGが“0"でないならば、現在の画素(白)は
黒から白へ変化する境界部の画素であるから、フラグIF
LGが“0"にリセットされ(ステップ72)、カウンタICOM
Pがインクリメントされ(ステップ73)、ステップ64に
戻る。 文字パターンの最下部までラスタースキャンが終わる
と、ステップ62の判定条件が成立し、大6図に示す処理
に進む。 第6図に示すステップ74からステップ88は、文字パタ
ーンを上から下へ主走査しながらラスタースキャンを行
い、白から黒へ変化する境界部の画素および黒から白へ
変化する境界部の画素を計数する処理である。 カウンタIのクリア(ステップ74)の後のステップ75
からステップ88は、垂直走査である関係からカウンタI
とカウンタJの関係が逆になっている以外は、第5図の
ステップ61からステップ73の対応するものと同様であ
る。 文字パターンの右端部までラスタースキャンが終わる
と、ステップ76の判定条件が成立し、大分類特徴量の抽
出処理を完了する。 さて、前記各実施例において、大分類により詳細マッ
チングを行うか否かの判定のための闘値THは、文字主に
関係なく固定してもよいが、文字種毎に用意し辞書に登
録しておいてもよい。 そのような判定闘値の決定方法の一例を次に説明す
る。辞書作成に際しては、各文字種kに関してM個の文
字パターンから特徴ベクトルを抽出し、その平均ベクト
ルを標準文字パターンの特徴ベクトルとして辞書に登録
する。こゝで述べる判定闘値決定法では、文字種別に、
辞書作成用のM個の文字パターンのそれぞれから前述の
ような大分類特徴量を抽出し、それと、その平均(辞書
の標準文字パターンの大分類特徴量に対応)との差の偏
差(または分散)が判定闘値とした決定される。 このような判定闘値の決定処理のフローチャートを第
7図に示す。この図において、kは文字種、mは各文字
種の辞書作成用パターンの番号(カウンタ)、Fkmは文
字種kのm番目の文字パターンから抽出された大分類特
徴量、Fkは文字種kの大分類特徴量の平均、THkはレジ
スタであり、ステップ98でレジスタTHkの値が文字種k
の判定闘値として辞書に登録される。 第14図及び第15図に具体例を示す。第14図は、文字種
「あ」に関して、複数の文字パターンからそれぞれ詳細
特徴量(特徴ベクトル)を抽出し、その平均ベクトルを
当該文字種「あ」の標準文字パターンの特徴ベクトルと
して辞書に登録する例を示したものである。ここで、詳
細特徴量の平均ベクトルは、各詳細特徴量の各要素(次
元)の数値の平均を順次求めることが得られる。第15図
は、この文字種「あ」の詳細特徴量の平均ベクトルに対
し、その大分類の特等量の平均と判定闘値の例を示した
ものである。ここで、判定闘値は、各大分類特徴量の数
値の平均、分散等から求められる。 同様に、辞書作成用文字パターンのそれぞれの大分類
特徴量のその平均(辞書の辞書文字パターンの大分類特
徴量に対応)との差の絶対値の中央値(メディアン)
を、文字識別の判定闘値として決定することもできる。 第8図は、そのような判定闘値を決定する処理のフロ
ーチャートであり、各符号は第7図と同様である。 さて、手書き文字の認識の場合、利用者(筆記者)に
よって確認率に差がでる。また、同じ利用者でも、辞書
の癖に慣れるに従い認識率が向上する。 したがって、文字種別に複数レベルの判定闘値を用意
しておき、利用者やその熟練度に応じて、大分類の判定
闘値として用いるレベルを指定し、そのレベルの判定闘
値をマッチング部10に選択的に使用させるようにすれ
ば、辞書と詳細マッチングをさらに減らし、認識時間を
一層短縮できる可能性がある。 第図9は、そのような文字種別に複数レベルの判定闘
値を決定するための処理のフローチャートである。この
図において、Lはレベルであリ、THkは第7図のフロー
チャートによって決定された文字種kの判定闘値であ
る。THk(L)はレベルLの判定闘値であり、MAXはレベ
ル数である。 この場合、文字種kに対してMAX個の判定闘値THk
(1),THk(2),THk(3),…,THk(MAX)が決定さ
れる。 第10図は、文字種別に複数レベルの判定闘値を決定す
る他の法を示すフローチャートである。この場合は、辞
書作成用の各文字パターンから抽出した大分類特徴量と
辞書の平均パターンとの差の絶対値T(m)が小さい順
(または大きい順)にソートされる(ステップ120)。
そして、M/MAX番目ごとの差の絶対値がレベルLの判定
闘値として決定され、登録される(ステップ122から12
6)。 なお、最高レベル(L=MAX)の判定闘値はT(M−
c)の値が選ばれる(ステップ125)。こゝでcは定数
(1または2)である。このようにするのは、辞書作成
文字パターンの変形の大きな異常パターンが含まれた場
合に、その影響を排除するためである。 〔効 果〕 以上の説明から明らかなように、本発明の文字認識方
法においては、文字パターンの複雑度を的確に表す特徴
量を用いて入力文字の大分類を行い、候補となり得る文
字種を正確かつ十分に絞り込むことができ、また、その
特徴量の抽出も簡便であるから、認識率を低下させるこ
となく文字認識処理の効率を大幅に改善できる。 さらに、本発明の文字認識方法においては、文字認識
処理の対象となる各文字識別の大分類特徴量と判定闘値
を辞書に持たせることで、変動の大きい文字、小さい文
字などに柔軟に対応でき、効率よく大分類識別速度を上
げることができる。また、文字種別に、大分類特徴量と
詳細特徴量を組として辞書に持たせることで、大分類識
別から詳細認識への移行が用意になり、さらに辞書構成
の簡単で辞書のメンテナンスが容易になり、新規辞書の
追加削除が簡単になる。
【図面の簡単な説明】 第1図は本発明の各実施例に係る機能的構成を示す概略
ブロック図、第2図は本発明の第1の実施例における大
分類特徴量の抽出処理の前半部を示す概略フローチャー
ト、第3図はその抽出処理の後半部を示す概略フローチ
ャート、第4図は本発明の第1の実施例におけるマッチ
ング処理の概略フローチャート、第5図は本発明の第2
の実施例における大分類特徴量の抽出処理の前半部を示
す概略フローチャート、第6図はその抽出処理の後半部
を示す概略フローチャート、第7図は文字種別の判定闘
値を決定する処理の一例を示す概略フローチャート、第
8図は文字種別の判定闘値を決定する処理の他の例を示
す概略フローチャート、第9図は文字種毎に複数レベル
の判定闘値を決定する処理の一例を示す概略フローチャ
ート、第10図は文字種に複数レベルの判定闘値を決定す
る処理の他の例を示す概略フローチャート、第11図は大
分類特徴量抽出の具体例を示す図、第12図は詳細特徴量
抽出の具体例を示す図、第13図は辞書の具体例を示す
図、第14図は複数の詳細特徴量の平均ベクトルの算出例
を示す図、第15図は複数の大分類特徴量の平均と判定闘
値の算出例を示す図である。 5……文字イメージメモリ、 7……大分類特徴/詳細特徴抽出部、 8……特徴量メモリ、9……辞書、 10……マッチング部。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 石崎 寛美 東京都大田区中馬込1丁目3番6号 株 式会社リコー内 (56)参考文献 特開 昭48−54836(JP,A) 特開 昭48−54837(JP,A) 特開 昭61−74083(JP,A) 特開 昭60−89290(JP,A)

Claims (1)

  1. (57)【特許請求の範囲】 1.同一辞書内に、文字認識処理の対象となる各文字種
    毎に、大分類特徴量と判定闘値及び詳細特徴量を組とし
    てあらかじめ格納し、 未知文字のパターンを水平方向および垂直方向に走査し
    て白から黒へ変化する境界部の画素、黒から白へ変化す
    る境界部の画素、または、その両方の境界部の画素の個
    数またはそれと比例関係の値を大分類特徴量として抽出
    し、 前記辞書の各文字種について順次、当該文字種の大分類
    特徴量と前記抽出された大分類特徴量と比較し、両者の
    差が当該文字種に対する判定闘値以下の場合に、引き続
    いて当該文字種の詳細特徴量により前記未知文字を詳細
    認識し、前記両者の差が当該文字種に対する判定闘値以
    上の場合には詳細認識をスキップすることを特徴とする
    文字認識方法。 2.特許請求の範囲第1項記載の文字認識方法におい
    て、文字種毎に、大分類特徴量の判定闘値を複数個用意
    し、その中の一つを選択的に用いることを特徴とする文
    字認識方法。
JP61271621A 1986-11-14 1986-11-14 文字認識方法 Expired - Lifetime JP2832928B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61271621A JP2832928B2 (ja) 1986-11-14 1986-11-14 文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61271621A JP2832928B2 (ja) 1986-11-14 1986-11-14 文字認識方法

Publications (2)

Publication Number Publication Date
JPS63126082A JPS63126082A (ja) 1988-05-30
JP2832928B2 true JP2832928B2 (ja) 1998-12-09

Family

ID=17502624

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61271621A Expired - Lifetime JP2832928B2 (ja) 1986-11-14 1986-11-14 文字認識方法

Country Status (1)

Country Link
JP (1) JP2832928B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2647911B2 (ja) * 1988-07-01 1997-08-27 日本電信電話株式会社 文字・図形領域抽出方法
JP2766205B2 (ja) * 1994-12-27 1998-06-18 長野日本電気ソフトウェア株式会社 文字認識装置
JP4590745B2 (ja) * 2001-01-31 2010-12-01 パナソニック電工株式会社 画像処理装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS4854836A (ja) * 1971-11-10 1973-08-01
JPS4854837A (ja) * 1971-11-10 1973-08-01
JPS6089290A (ja) * 1983-10-19 1985-05-20 Ricoh Co Ltd パタ−ン認識方法
JPS6174083A (ja) * 1984-09-18 1986-04-16 Fujitsu Ltd 文字認識装置
JPS61272887A (ja) * 1985-05-28 1986-12-03 Toshiba Corp 文字認識方式

Also Published As

Publication number Publication date
JPS63126082A (ja) 1988-05-30

Similar Documents

Publication Publication Date Title
US4903312A (en) Character recognition with variable subdivisions of a character region
US4757551A (en) Character recognition method and system capable of recognizing slant characters
US5539841A (en) Method for comparing image sections to determine similarity therebetween
JP3748164B2 (ja) パターン抽出装置
JPH05242292A (ja) 分離方法
JPH0772905B2 (ja) 記号列の認識方法
JP2001283152A (ja) 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
EP0843275A2 (en) Pattern extraction apparatus and method for extracting patterns
US5841905A (en) Business form image identification using projected profiles of graphical lines and text string lines
US20010033694A1 (en) Handwriting recognition by word separation into sillouette bar codes and other feature extraction
EP0482187A1 (en) Row-by-row segmentation and thresholding for optical character recognition (system and method)
CA2150110C (en) Methods and apparatus for classification of images using distribution maps
JP2832928B2 (ja) 文字認識方法
JP4228592B2 (ja) 文字認識装置
US20030123730A1 (en) Document recognition system and method using vertical line adjacency graphs
EP1010128B1 (en) Method for performing character recognition on a pixel matrix
JP4194309B2 (ja) 文書方向推定方法および文書方向推定プログラム
JPS63131287A (ja) 文字認識方式
JP3104355B2 (ja) 特徴抽出装置
KR950011065B1 (ko) 문자 인식방법
JPH0795336B2 (ja) 文字認識方式
JP3277977B2 (ja) 文字認識方法
JPH0546812A (ja) 文字の大分類認識方法
JPH03219384A (ja) 文字認識装置
JPS62269286A (ja) 文字認識方式

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term