JP2002024765A

JP2002024765A - 文字認識装置及び文字認識方法

Info

Publication number: JP2002024765A
Application number: JP2000201853A
Authority: JP
Inventors: Tsuguaki Ryu; 紹明劉; Kazuhisa Ichikawa; 一寿市川
Original assignee: Fuji Xerox Co Ltd
Current assignee: Fujifilm Business Innovation Corp
Priority date: 2000-07-04
Filing date: 2000-07-04
Publication date: 2002-01-25
Anticipated expiration: 2020-07-04
Also published as: JP4062866B2

Abstract

(57)【要約】【課題】特徴量の分布に依存することなく精度の高い
文字認識を簡易に行なう。【解決手段】文字画像入力手段１から未知文字パター
ンが入力され，特徴量抽出手段２，３，４によりペリフ
ェラル特徴量，ストローク特徴量及びメッシュ特徴量が
抽出される。これら特徴量から複合特徴量を求める。文
字カテゴリデータ作成手段９は，文字カテゴリに属して
いるすべての学習サンプルを用いて文字カテゴリデータ
を作成し，認識辞書作成手段８で認識辞書を作成し，認
識辞書格納手段８ａに格納する。認識手段７は，類似度
計算手段６を用いて，ビットごとにつき合わせを行ない
類似度を算出し，認識辞書に格納されている文字カテゴ
リデータの中から，未知文字パターンともっとも類似す
る文字カテゴリを求める。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は認識装置及び認識方
法に関し，特に文字認識を行う認識装置及び文字認識を
行う認識方法に関するものである。

【０００２】

【従来の技術】文字認識分野には，文字毎に，文字カテ
ゴリに属しているすべての学習サンプルを用いて該文字
の標準文字パターンを求め，求められた標準文字パター
ンを認識辞書に記憶しておく。認識するとき，入力され
た未知文字パターンを認識辞書に格納されているすべて
の標準文字パターンと比較し，もっとも近いものが認識
の結果として出力される方法がもっとも一般的な認識方
法である。ここで，文字特徴量の選択方法，標準文字パ
ターンの作成方法，距離尺度或いは類似度尺度は認識精
度を左右する重要な要素である。

【０００３】標準文字パターンの作成方法について，各
文字毎に，文字カテゴリに属しているすべての学習サン
プルの中心値を該文字の標準文字パターンとして認識辞
書に記憶させ，認識辞書を作成する方法がある。しか
し，文字カテゴリに属している学習サンプルの分布がば
らつき，かつ数が多い場合は，認識率が低いという問題
点がある。

【０００４】認識率を上げるために，各文字毎に複数の
標準文字パターンを用いて認識を行う方法がある。例え
ば，特開昭６３−１２９４８８号公報には，マルチフォ
ント文字を認識するために，各文字毎に複数の標準文字
パターンを認識辞書に記憶しておき，その認識辞書を用
いて認識を行う方法が提案された。また，学習サンプル
を学習しながら，対応している標準文字パターンを修正
し，或いは新しい標準文字パターンを追加して，認識辞
書を作成する方法がある。例えば，特開平７−２８９５
５号公報に記載されている方法が上記したものである。
しかし，これらの方法には，認識辞書に標準文字パター
ンの数が多いので，認識時間が長いという問題があり，
文字数が多い場合には，文字認識に要する処理時間は無
視できないものとなる。

【０００５】認識時間を短縮するために，例えば，特開
平１０−１６２１０３号公報には，手書き文字学習サン
プルを用いて手書き文字認識辞書，活字文字学習サンプ
ルを用いて活字文字認識辞書をそれぞれ作成しておき，
認識するとき，入力された未知文字が手書き文字か活字
文字かを判断し，手書き文字の場合は手書き文字認識辞
書，活字文字の場合は活字文字認識辞書を用いて認識を
行う方法が提案されている。しかし，文字フォントの種
類が多いので，文字フォントの種類をすべて区別するの
は容易でないし，特に手書き文字の場合は，学習サンプ
ルの分布が一定の法則に従わないので，１つの標準文字
パターンで文字カテゴリに属しているすべての学習サン
プルを表現するのは，認識率が低いという問題がある。

【０００６】距離尺度或いは類似度尺度については，こ
れまで数多く提案されている。代表的なものは，シテイ
ブロック距離，ユークリッド距離，重み付きユークリッ
ド距離，マハラノビス距離，投影距離などが挙げられ
る。これらの方法は文献『画像の処理と認識』安居院猛
・長尾智晴（１９９２，昭晃堂）と，『基本多変量解
析』浅野長一郎・江島伸興（日本規格協会），“手書き
文字認識における投影距離法”池田正幸・田中英彦・岡
本達（情処学論，ｖｏｌ．２４，ｎｏ．１，ｐｐ．１０
６−１１２，１９８３）に記載されている。文字Ｘ＝
（ｘ_１，ｘ_２，…，ｘ _ｎ）と文字Ｙ＝（ｙ_１，ｙ_２，
…，ｙ_ｎ）の間のシテイブロック距離Ｄ_ｃ（Ｘ，Ｙ）は
次の公式で計算する。ここで，｜Ｚ｜はＺの絶対値を表
す。

【０００７】

【数２】

【０００８】文字Ｘ＝（ｘ_１，ｘ_２，…，ｘ_ｎ）と文字
Ｙ＝（ｙ_１，ｙ_２，…，ｙ_ｎ）の間のユークリッド距離
Ｄ_ｅ（Ｘ，Ｙ）は次の公式で計算する。

【０００９】

【数３】

【００１０】文字ｉの学習サンプルをＳ_１，Ｓ_２，…。
Ｓ_ｋとし，サンプルＳ_１，Ｓ_２，…。Ｓ_ｋの中心値，す
なわち，文字ｉの標準文字パターンをＵ_ｉで表す。文字
Ｘ＝（ｘ_１，ｘ_２，…，ｘ_ｎ）と標準文字パターンＵ_ｉ
＝（ｕ_ｉ１，ｕ_ｉ２，…，ｕ _ｉｎ）間の重み付きユーク
リッド距離Ｄ_ｗ（Ｘ，Ｕ_ｉ）は次の公式で計算する。

【００１１】

【数４】ここで，

【００１２】

【数５】である。文字Ｘ＝（ｘ_１，ｘ_２，…，ｘ_ｎ）と標準文字
パターンＵ_ｉ＝（ｕ_ｉ１，ｕ_ｉ２，…，ｕ_ｉｎ）間のマ
ハラノビス距離Ｄ_ｍ（Ｘ，Ｕ_ｉ）は次の公式で計算す
る。

【００１３】

【数６】ここで，Σｉは文字ｉの学習サンプルの共分散行列を表
し，Ｚ^−１は行列Ｚの逆行列であり，Ｚ^Ｔは行列Ｚの転
置行列である。パターンＸ＝（ｘ_１，ｘ_２，…，ｘ_ｎ）
と標準パターンＵ_ｉ＝（ｕ_ｉ１，ｕ_ｉ２，…，ｕ_ｉｎ）
間の投影距離Ｄ_ｔ（Ｘ，Ｕ_ｉ）は次の公式で計算する。

【００１４】

【数７】ここで，Φ_ｊはパターンの学習サンプルから計算された
固有値を降順に並べたときにｊ番目に位置する固有値に
対応する固有ベクトルであり，（α，β）はベクトルα
とβの内積を表す。

【００１５】シテイブロック距離，ユークリッド距離及
び重み付きユークリッド距離は比較的簡単に求められる
が，高い認識率を保証するのは困難である。マハラノビ
ス距離は，生起確率がχ^２分布に従ったデータを対象と
している距離であり，生起確率の高い分布の中心部分ほ
ど距離が近く計算される。しかし，実際の文字の学習サ
ンプルの分布はχ^２分布に従っているわけではないの
で，認識率を保証できない。また，文字の共分散行列を
記憶するため，認識辞書が巨大であり，莫大な計算時間
がかかるので，実用性が低い。

【００１６】上述した従来技術には，２つの特徴があ
る。（１）１つ或いは複数の標準文字パターンで文字カ
テゴリを代表する；（２）文字パターンと文字パターン
間の距離，或いは類似度を用いて文字パターンを比較す
る。次に従来技術の特徴（１）と（２）は誤認が発生す
る重要な原因であることを示す。

【００１７】文字カテゴリに属している学習サンプルは
一般に一定の分布に従わない，集中して固まっている場
合もあるし，ばらばらに分散している場合もある。１つ
の標準文字パターンで文字カテゴリを代表した場合は，
図２７に示すように，文字Ｐの認識範囲は，該文字の標
準文字パターンを中心として（特徴（１）より），標準
文字パターンともっとも遠い該文字カテゴリに属してい
る学習サンプルと標準文字パターン間の距離を半径とす
る（特徴（２）より）多次元円Ｅ１になる。すなわち，
入力された未知文字パターンがＥ１範囲に入ると，文字
Ｐと認識される可能性が非常に高い。しかし，認識範囲
Ｅ１は実際の文字学習サンプルの分布範囲Ｅ２より大き
いため，多くの文字の認識範囲と重なってしまう。認識
するとき，入力された未知文字パターンが重なっている
範囲に入ると，間違って認識されることがある。例え
ば，図２８に示すように，文字Ｐ１の実際の分布範囲Ｅ
４と文字Ｐ２の実際の分布範囲Ｅ６と重なっていない
が，文字Ｐ１の認識範囲Ｅ３と文字Ｐ２の認識範囲Ｅ５
と重なっている。入力された未知文字Ｘが文字Ｐ１の実
際の分布範囲Ｅ４に入るので，文字Ｐ１と認識されるは
ずであるが，ＸがＰ１とＰ２の重なっている認識範囲に
入っているので，文字Ｐ２と間違って認識される。すな
わち，Ｘと文字Ｐ２の標準文字パターン間の距離がＸと
文字Ｐ１の標準文字パターン間の距離より小さいので，
文字Ｐ２と誤認される。

【００１８】文字毎に複数の標準文字を用いて認識を行
う場合は，認識範囲が重なっている文字の数が少なくな
り，認識精度がある程度改善されるが，本質的な解決法
ではない。

【００１９】文字の分布に従って文字の認識範囲を縮小
する，或いは文字の分布を想定して，認識範囲を想定し
た分布の形に近似するような距離関数，或いは類似度関
数を用いて認識を行う場合は（例えば，重み付きユーク
リッド距離，マハラノビス距離など），認識範囲が重な
っている文字の数が少なくなり，認識精度がある程度改
善されるが，分布が一定の規則に従わない文字に対し
て，高い認識率を保証できない問題点があり，本質的な
解決法ではない。

【００２０】

【発明が解決しようとする課題】本発明は，上述した事
情に鑑みてなされたもので，文字カテゴリを代表する標
準文字パターンを用いて文字認識を行うときの認識率低
下問題を解決し，高い認識率かつ簡単な文字認識方法を
提供することを目的とするものである。

【００２１】

【課題を解決するための手段】上記の課題を解決するた
め，本発明は，特許請求の範囲に記載のとおりの構成を
採用している。すなわち，本発明の具体的な構成では，
文字パターンのペリフェラル特徴量と，ストローク特徴
量と，メッシュ特徴量をそれぞれ抽出し，抽出された３
種類の特徴量を並べて該文字の複合特徴量を求め，各文
字毎に，文字カテゴリに属しているすべての学習サンプ
ルから，学習サンプル特徴量の各次元毎に，次元の値を
列挙し，列挙した値を変換し，変換された各次元の値を
該文字のカテゴリデータとして認識辞書に記憶させ，認
識辞書を作成しておく。認識するとき，文字パターンと
文字カテゴリ間の類似度の計算方法を用いて，入力され
た未知文字パターンと認識辞書に格納されているすべて
の文字カテゴリデータ間の類似度を計算し，もっとも類
似な文字カテゴリを認識の結果として出力することによ
り文字を高精度・高速かつ簡単に認識することができ
る。

【００２２】また，本発明によれば，特徴量の分布に対
応するビット列データからなる文字カテゴリデータと，
認識対象の同様の文字パターンの文字パターンデータと
を比較して文字認識を行なうので精度よく認識を行なえ
る。さらに，複数種類の特徴量のビット列パターンを連
結させればより正確な認識が可能となる。

【００２３】なお，本発明は装置および方法として実現
でき，またその方法の少なくとも一部をコンピュータプ
ログラムとして実装することができる。このコンピュー
タプログラムを記録した記録媒体（プログラムパッケー
ジ）や，当該コンピュータプログラムをコンピュータシ
ステムにインストールするためのコンピュータプログラ
ムを記録した記録媒体が，本発明の技術的な範囲に含ま
れることはもちろんである。

【００２４】

【発明の実施の形態】図１は，本発明の認識装置の実施
の一形態を示すブロック図である。図中，１は１文字分
の文字画像を入力する手段，２は文字のペリフェラル特
徴量を抽出する手段，３は文字のストローク特徴量を抽
出する手段，４は文字のメッシュ特徴量を抽出する手
段，５は文字の複合特徴量を求める手段，６は文字パタ
ーンと文字カテゴリ間の類似度を計算する手段，７は認
識手段，８は認識辞書作成手段，８ａは認識辞書を格納
する手段，９は文字カテゴリ作成手段，１０は記憶手段
である。

【００２５】メモリＭ１，Ｍ２及びＭ３は，それぞれ特
徴量抽出手段２，３，４で抽出されたペリフェラル特徴
量，ストローク特徴量及びメッシュ特徴量を格納する。
メモリＭ４は，複合特徴量を求める手段５で求められた
文字の複合特徴量を格納する。メモリＭ５は，認識辞書
から認識手段７で検出された入力された未知文字パター
ンともっとも類似な文字の名前とカテゴリデータを格納
する。

【００２６】特徴量抽出手段２は，文字画像入力手段１
で入力された１文字分の文字画像をそれぞれ横に２Ａ‐
１区分，縦に２Ａ‐１区分に分割し，文字画像の幅或い
は高さの１／Ｐを各区分の走査範囲として，各区分を走
査してペリフェラル特徴量を抽出する。特徴量格納手段
２ａは前記抽出されたペリフェラル特徴量をメモリＭ１
に格納する。

【００２７】特徴量抽出手段３は，文字画像入力手段１
で入力された１文字分の文字画像をそれぞれ横に２Ａ‐
１区分，縦に２Ａ‐１区分に分割し，各区分の走査範囲
を文字画像の幅或いは高さとして，各区分を走査してス
トローク特徴量を抽出する。特徴量格納手段３ａは前記
抽出されたストローク特徴量をメモリＭ２に格納する。

【００２８】特徴量抽出手段４は，文字画像入力手段１
で入力された１文字分の文字画像をそれぞれサイズがｂ
画像＊ｂ画像の子領域Ｂ個，２Ｃ個，Ｄ個に分割し，各
子領域を走査してメッシュ特徴量を抽出する。特徴量格
納手段４ａは前記抽出されたメッシュ特徴量をメモリＭ
３に格納する。

【００２９】複合特徴量を求める手段５は，前記抽出さ
れた３種類の特徴量を並べ，１つの特徴量として求め
る。複合特徴量格納手段５ａは前記求められた複合特徴
量をメモリＭ４に格納する。図２は文字の複合特徴量５
０を示している。複合特徴量５０がペリフェラル特徴量
５１，ストローク特徴量５２，メッシュ特徴量５３から
構成されている。

【００３０】文字カテゴリデータ作成手段９は，文字カ
テゴリに属しているすべての学習サンプルを用いて文字
カテゴリデータを作成する。作成された各文字カテゴリ
データを用いて，認識辞書作成手段８で認識辞書を作成
する。作成された認識辞書を認識辞書格納手段８ａで格
納する。図３は認識辞書内の認識辞書データを示す図で
ある。認識辞書データ６０は，すべての文字（ｍ個）の
データ６１〜６ｍから構成されている。各文字のデータ
は文字の名前と文字カテゴリデータのベクトルから構成
されている。

【００３１】認識手段７は，類似度計算手段６を用い
て，認識辞書に格納されている文字カテゴリデータの中
から，入力され未知文字パターンともっとも類似な文字
カテゴリを求め，その結果をメモリＭ５に記憶させる。
記憶手段１０は，認識手段７で認識された文字の名前と
カテゴリデータを格納する。

【００３２】次に本発明の文字認識装置の装置適用例と
して，情報端末装置に適用させた場合の装置構成につい
て説明する。図４は本発明の文字認識装置を情報端末装
置に適用させた場合の装置構成を示す図である。

【００３３】情報端末装置７０は，キーボート７１，外
部記憶装置７２，ディスプレイ７３，プロセッサ部７４
から構成される。キーボート７１は，ユーザが操作を指
示するための入力装置であり，その他の入力装置が付加
されていてもよい。外部記憶装置７２は，入力された未
知文字パターンのデータや，認識辞書のデータや，認識
結果や，ソフトウェアを格納する。また，特徴量格納手
段２ａ，３ａ，４ａ，複合特徴量格納手段５ａ，認識辞
書格納手段８ａをこの外部記憶装置７２の一部として構
成することができる。さらに，記憶手段１０によって認
識された文字の名前とカテゴリデータを格納してもよ
い。外部記憶装置７２の具体例として，例えばハードデ
ィスクなどで構成することができる。ディスプレイ７３
は，ユーザに対するメッセージや認識文字のデータ，認
識の結果などを表示するための出力装置である。もちろ
ん他の出力装置が付加されていてもよい。プロセッサ部
７４は，外部記憶装置７２に格納されているソフトウェ
アなどに従って，実際の処理を行う。プロセッサ部７４
は，具体的にマイクロプロセッサや，パーソナルコンピ
ュータなどのコンピュータシステムで構成することがで
きる。そして，文字特徴量抽出手段２，３，４，複合特
徴量を求める手段５，文字カテゴリデータ作成手段９，
類似度計算手段６，認識手段７は，このプロセッサ部７
４の上で動作するソフトウェアによって構成することが
できる。

【００３４】次に本発明の文字認識装置の動作をさらに
詳細に説明する。まず，特徴量抽出手段２について説明
する。

【００３５】図５は特徴量抽出手段２の実施の一形態を
示すブロック図である。メモリＭ２１〜メモリＭ２４は
文字画像入力手段１で入力された１文字分の文字画像を
記憶する。横領域分割手段２１は，メモリＭ２１に記憶
している１文字分の文字画像を横にＡ区分に分割する。
例えば，図８（ａ）は前記文字画像を横に４（Ａ＝４）
区分に分割した様子を示している。横領域分割手段２２
は，前記横領域分割手段２１で分割されたＡ区分に対し
て，ｋ（ｋ＝１，２，…，Ａ‐１）区分目の下半分とｋ
＋１区分目の上半分を１区分とし，メモリＭ２２に記憶
している１文字分の文字画像を横にＡ‐１区分に分割す
る。例えば，図８（ｂ）は前記文字画像を横に３（Ａ‐
１＝４‐１＝３）区分に分割した様子を示している。縦
領域分割手段２３は，メモリＭ２３に記憶している１文
字分の文字画像を縦にＡ区分に分割する。例えば，図９
（ａ）は前記文字画像を縦に４（Ａ＝４）区分に分割し
た様子を示している。縦領域分割手段２４は，前記縦領
域分割手段２３で分割されたＡ区分に対して，ｋ（ｋ＝
１，２，…，Ａ‐１）区分目の右半分とｋ＋１区分目の
左半分を１区分とし，メモリＭ２４に記憶している１文
字分の文字画像を縦に３（Ａ‐１＝４‐１＝３）区分に
分割した様子を示している。ここで，横区分数と縦区分
数は異なってもかまわない。

【００３６】走査範囲制御手段２６は，横区分に対して
前記文字画像の外接矩形の左辺と右辺の計２辺から文字
方向に文字の幅の１／Ｐまで走査することを制御し，縦
区分に対して前記文字画像の外接矩形の上辺と下辺の計
２辺から文字方向に文字の高さの１／Ｐまで走査するこ
とを制御する。ここで，Ｐは正整数である。

【００３７】特徴抽出手段２５は，まず，領域分割手段
２１，２２により分割された横の２Ａ‐１区分の各区分
毎に，前記走査範囲の制限手段２６によって制限された
走査範囲において，文字画像の左辺からａ回走査し（ａ
＝前記文字画像の高さ／Ａ），最初に文字を構成する画
素（黒画素）にあたるまでの背景画像の画素数を計数
し，ａ回走査して計数された画素数の平均値を求める。
続いて，領域分割手段２１，２２により分割された横の
２Ａ‐１区分の各区分毎に，前記走査範囲の制限手段２
６によって制限された走査範囲において，文字画像の右
辺からａ回走査し（ａ＝前記文字画像の高さ／Ａ），最
初に文字を構成する画素（黒画素）にあたるまでの背景
画像の画素数を計数し，ａ回走査して計数された画素数
の平均値を求める。また，領域分割手段２３，２４によ
り分割された縦の２Ａ‐１区分の各区分毎に，前記走査
範囲の制限手段２６によって制限された走査範囲におい
て，文字画像の上辺からａ回走査し（ａ＝前記文字画像
の幅／Ａ），最初に文字を構成する画素（黒画素）にあ
たるまでの背景画像の画素数を計数し，ａ回走査して計
数された画素数の平均値を求める。最後に，領域分割手
段２３，２４により分割された縦の２Ａ‐１区分の各区
分毎に，前記走査範囲の制限手段２６によって制限され
た走査範囲において，文字画像の下辺からａ回走査し
（ａ＝前記文字画像の幅／Ａ），最初に文字を構成する
画素（黒画素）にあたるまでの背景画像の画素数を計数
し，ａ回走査して計数された画素数の平均値を求める。
図１０（ａ），（ｂ）は，Ａ＝４，Ｐ＝３のとき，領域
分割手段２１，２２により分割された横７（２Ａ‐１）
区分の特徴量を抽出する様子を示す図である。図１０
（ｃ），（ｄ）は，Ａ＝４，Ｐ＝３のとき，領域分割手
段２３，２４により分割された縦７（２Ａ‐１）区分の
特徴量を抽出する様子を示す図である。

【００３８】記憶手段２ａは，特徴量抽出手段２５によ
って抽出された特徴量を図１に示すメモリＭ１に格納す
る。

【００３９】次に特徴量抽出手段３について説明する。
図６は特徴量抽出手段３の実施の一形態を示すブロック
図である。メモリＭ３１〜メモリＭ３４は文字画像入力
手段１で入力された１文字分の文字画像を記憶する。

【００４０】横領域分割手段３１は，メモリＭ３１に記
憶している１文字分の文字画像を横にＡ区分に分割す
る。例えば，図８（ａ）は前記文字画像を横に４（Ａ＝
４）区分に分割した様子を示している。横領域分割手段
３２は，前記横領域分割手段３１で分割されたＡ区分に
対して，ｋ（ｋ＝１，２，…，Ａ‐１）区分目の下半分
とｋ＋１区分目の上半分を１区分とし，メモリＭ３２に
記憶している１文字分の文字画像を横にＡ‐１区分に分
割する。例えば，図８（ｂ）は前記文字画像を横に３
（Ａ‐１＝４‐１＝３）区分に分割した様子を示してい
る。縦領域分割手段３３は，メモリＭ３３に記憶してい
る１文字分の文字画像を縦にＡ区分に分割する。例え
ば，図９（ａ）は前記文字画像を縦に４（Ａ＝４）区分
に分割した様子を示している。縦領域分割手段３４は，
前記縦領域分割手段３３で分割されたＡ区分に対して，
ｋ（ｋ＝１，２，…，Ａ‐１）区分目の右半分とｋ＋１
区分目の左半分を１区分とし，メモリＭ３４に記憶して
いる１文字分の文字画像を縦に３（Ａ‐１＝４‐１＝
３）区分に分割した様子を示している。ここで，横区分
数と縦区分数は異なってもかまわない。

【００４１】特徴抽出手段３５は，まず，領域分割手段
３１，３２により分割された横の２Ａ‐１区分の各区分
毎に，前記文字画像の幅を走査範囲として，文字画像の
左辺からａ回走査し（ａ＝前記文字画像の高さ／Ａ），
背景画素（白画素）から文字を構成する画素（黒画素）
に，及び文字を構成する画素（黒画素）から背景画素
（白画素）に変化する回数を計数し，ａ回走査して計数
された回数の平均値を求める。続いて，領域分割手段３
３，３４により分割された縦の２Ａ‐１区分の各区分毎
に，文字画像の高さを走査範囲として，文字画像の上辺
からａ回走査し（ａ＝前記文字画像の幅／Ａ），背景画
素（白画素）から文字を構成する画素（黒画素）に，及
び文字を構成する画素（黒画素）から背景画素（白画
素）に変化する回数を計数し，ａ回走査して計数された
回数の平均値を求める。図１１（ａ），（ｂ）は，Ａ＝
４のとき，領域分割手段３１，３２により分割された横
７（２Ａ‐１）区分の特徴量を抽出する様子を示す図で
ある。図１１（ｃ），（ｄ）は，Ａ＝４のとき，領域分
割手段３３，３４により分割された縦７（２Ａ‐１）区
分の特徴量を抽出する様子を示す図である。

【００４２】記憶手段３ａは，特徴量抽出手段３５によ
って抽出された特徴量を図１に示すメモリＭ２に格納す
る。

【００４３】次に特徴量抽出手段４について説明する。
図７は特徴量抽出手段４の実施の一形態を示すブロック
図である。メモリＭ４１〜メモリＭ４４は文字画像入力
手段１で入力された１文字分の文字画像を記憶する。

【００４４】子領域分割手段４１は，メモリＭ４１に記
憶している１文字分の文字画像をサイズがｂ画素＊ｂ画
素の子領域Ｂ個に分割する。例えば，図１２（ａ）は子
領域分割手段４１で前記文字画像を１６（Ｂ＝１６）個
の子領域に分割した様子を示している。子領域分割手段
４２は，前記子領域分割手段４１で分割されたＢ個の子
領域に対して，前記文字画像の右側にある子領域以外の
子領域毎に，子領域の右半分と右隣の子領域の左半分を
１子領域とし，Ｃ個の子領域に分割する。図１２（ｂ）
は子領域分割手段４２で前記文字画像を１２（Ｂ＝１６
のとき）個の子領域に分割した様子を示している。子領
域分割手段４３は，前記子領域分割手段４１で分割され
たＢ個の子領域に対して，前記文字画像の下側にある子
領域以外の子領域毎に，子領域の下半分と下隣の子領域
の上半分を１子領域とし，Ｃ個の子領域に分割する。図
１２（ｃ）は子領域分割手段４３で前記文字画像を１２
（Ｂ＝１６のとき）個の子領域に分割した様子を示して
いる。子領域分割手段４４は，前記子領域分割手段４２
で分割されたＣ個の子領域に対して，前記文字画像の下
側にある子領域以外の子領域毎に，子領域の下半分と下
隣の子領域の上半分を１子領域とし，Ｄ個の子領域に分
割する。図１２（ｄ）は子領域分割手段４４で前記文字
画像を９（Ｂ＝１６，Ｃ＝１２のとき）個の子領域に分
割した様子を示している。ここで，ｂとＢは共に正整数
であり，ｂ＊Ｂ＝文字画像の幅（或いは高さ）である。

【００４５】特徴抽出手段４５は，領域分割手段４１，
４２，４３，４４によりそれぞれ分割されたＢ，Ｃ，
Ｃ，Ｄ個の子領域の各子領域毎に，子領域画像の左辺か
ら走査し，文字を構成する画素（黒画素）数を計数する

【００４６】記憶手段４ａは，特徴量抽出手段４５によ
って抽出された特徴量を図１に示すメモリＭ３に格納す
る。

【００４７】次に文字の複合特徴量を求める手段５につ
いて説明する。複合特徴量を求める手段５は，特徴抽出
手段２，特徴抽出手段３及び特徴抽出手段４によって抽
出された特徴量を並べ，図１に示すメモリＭ４に記憶さ
せる。

【００４８】次に認識辞書格納手段８ａで文字カテゴリ
データを格納するときの文字カテゴリデータの作成手段
９について説明する。図１３は文字カテゴリデータの作
成手段９の実施の一形態を示すブロック図である。

【００４９】メモリＭ９０は１文字のすべての学習サン
プル特徴量を格納している。メモリＭ９１，Ｍ９２，Ｍ
９３，…，Ｍ９ｎ（ｎは特徴量ベクトルの次元数）は，
それぞれ特徴量の各次元の列挙した値を記憶する。

【００５０】文字サンプル特徴量の入力手段９０は，１
文字のすべての学習サンプル特徴量を入力し，メモリＭ
９０に記憶させる。

【００５１】列挙手段９１は，メモリＭ９０に格納して
いる１文字のすべての学習サンプルの特徴量から，次元
毎に，次元のとりうる値を列挙し，列挙した各次元の値
をそれぞれメモリＭ９１，Ｍ９２，Ｍ９３，…，Ｍ９ｎ
記憶させる。

【００５２】特徴量の変化範囲決定手段９４は，文字画
像分割手段４１（４２，４３，４４）で分割された子領
域内の画素数ｂ^２（メッシュ特徴量の最大値）を文字特
徴量の変化範囲とする。

【００５３】カテゴリデータの表現手段９３は，図１４
に示すように，ｎ次元のベクトルで表現し，各次元をｂ
^２＋１個のビットで表す。

【００５４】列挙した値を変換する手段９２は，メモリ
Ｍ９１，Ｍ９２，Ｍ９３，…，Ｍ９ｎに格納している各
次元の列挙した値を変換する。メモリＭ９ｉ（ｉ＝１，
２，…，ｎ）に記憶しているｉ次元目の列挙した値｛ｅ
_ｉ１，ｅ_ｉ２，．…，ｅ_ｉｓ｝に対して，カテゴリデー
タのｉ次元目の第ｅ_ｉｊ＋１ビットの値を“１”と設定
し（ｊ＝１，２，…，ｓ），その以外のビットの値を
“０”と設定する。

【００５５】格納手段８ａは，求められたカテゴリデー
タを認識辞書に格納させる。

【００５６】図１５（ａ）は，文字カテゴリに属してい
る５つの学習サンプルを示している。ここで，文字特徴
量の次元数ｎ＝６であり，文字特徴量の変化範囲が１６
である。従って，該文字カテゴリデータを６次元のベク
トルで表し，各次元を１７ｂｉｔｓで表す。図１５
（ｂ）は，列挙手段９１で列挙された各次元の値を示し
ている。例えば，列挙された１次元目の値は３，４，
６，８であり，２次元目の値は８，１０，１１，１２で
ある。図１５（ｃ）は，変換手段９２で求められた文字
カテゴリデータを示している。

【００５７】文字カテゴリデータの作成方法から分かる
ように，文字カテゴリデータは，ｎ次元空間に，文字カ
テゴリに属しているすべての学習サンプルが各次元毎に
現れる位置の範囲を示している。例えば，図１６は文字
カテゴリに属しているすべての学習サンプルが１次元
目，２次元目に現れる位置範囲を示している。ここで，
ａ１，ａ２は１次元目の位置範囲であり，ｂ１，ｂ２は
２次元目の位置範囲である。各次元に現れる位置範囲は
連続の場合もあるし，離散の場合もある。例えば，図１
５（ｃ）に示している文字カテゴリデータに対して，１
次元に現れる位置範囲は３〜４，６，８であり，２次元
に現れる位置範囲は８，１０〜１２である。３，５，６
次元の位置範囲は連続的なものであり，１，２，４次元
の位置範囲は離散的なものである。文字カテゴリデータ
で示す該文字カテゴリに属している学習サンプルが各次
元毎に現れる位置範囲は，該文字の認識範囲である。図
１６に示す４つの長方形は該文字の認識範囲である。図
に示すように，この認識範囲は比較的に文字の学習サン
プルの分布に近いので，認識範囲が重なっている文字の
数を大幅に削減することができる。例えば，図１７
（ａ）に示している７つの文字Ｐ１，Ｐ２，…，Ｐ７に
ついて，従来の技術により，Ｐ１〜Ｐ７の認識範囲は図
１７（ａ）に示している点線円Ｅ１１〜Ｅ１７である。
Ｅ１１はＥ１２及びＥ１６と，Ｅ１２はＥ１１，Ｅ１
３，Ｅ１５及びＥ１６と，Ｅ１３はＥ１２及びＥ１４
と，Ｅ１６はＥ１１，Ｅ１２，Ｅ１５，Ｅ１７と重なっ
ている。しかし，本発明により，文字の認識範囲は図１
７（ｂ）に示すＥ２１〜Ｅ２７である。図から分かるよ
うに，Ｅ２１，Ｅ２２，…，Ｅ２７は相互に重なってい
ない。

【００５８】次に文字パターンと文字カテゴリ間の類似
度を計算する手段６について説明する。類似度の計算手
段６は，メモリＭ４に格納されている未知文字Ｘ＝（ｘ
_１，ｘ_２，…，ｘ_ｎ）と認識辞書に格納している文字カ
テゴリデータＣａｔ（ｉ）＝（ｃａｔ_１（ｉ），ｃａｔ
_２（ｉ），…，ｃａｔ_ｎ（ｉ））間の類似度Ｓ（Ｘ，Ｃ
ａｔ（ｉ））は次のように計算される。

【００５９】

【数８】ここで，ｆ（ａ，ｂ）＝１，ｉｆｂのａ＋１ビット
目の値＝１；ｆ（ａ，ｂ）＝０，ｉｆｂのａ＋１ビ
ット目の値＝０である。

【００６０】関数ｆ（）の定義から分かるように，入力
された未知文字Ｘのｊ次元目の値ｘ _ｊはカテゴリデータ
のｊ次元目の位置範囲に入ると，類似度がすこし高くな
る。逆に，入力された未知文字Ｘのｊ次元の値ｘ_ｊはカ
テゴリデータのｊ次元目の位置範囲以外に入ると，類似
度がすこし低くなる。すべての次元に対して，ｆ（）＝
１なら，類似度＝１であるので，カテゴリに属している
すべての学習サンプルと該文字のカテゴリデータ間の類
似度は同じであり，“１”である。認識するとき，未知
文字Ｘが文字カテゴリデータで示す文字Ｐの認識範囲に
入ると，Ｓ（Ｘ，Ｐ）＝１になり，文字Ｐが認識の結果
として出力される。これは従来技術で実現できなかった
部分である。

【００６１】本発明の文字カテゴリデータ作成方法及び
文字パターンと文字カテゴリ間の類似度の計算方法は，
人間の認識機能に近似するものである。人間はものの特
徴を思い出すときに，ものの各特徴及び特徴量の変化範
囲が思い出される。例えば，“リンゴ”の特徴を思い出
すとき，“色は赤い，黄色い或いは青いなどがあり，黒
はないこと；味は甘い，甘酢っぱいなどがあり，辛いは
ないこと；重さが１５０グラム位〜４５０グラム位；”
などが自然に思い出される。つまり，人間は学習すると
き，学習対象の各特徴量を取って，各特徴及び特徴量の
変化範囲を記憶していることが考えられる。例えば，い
ろんな“リンゴ”を学習した後，“色”，“形”，
“味”，“重さ”，“高さ”，“幅”等の特徴，“色”
特徴量の変化範囲が“赤色，青色，黄色”，“重さ”特
徴量の変化範囲が“１５０グラム位〜４００グラム
位”，“高さ”特徴量の変化範囲が“６ｃｍ位〜１２ｃ
ｍ位”などが記憶されるはずである。認識するとき，取
れた特徴量の値は学習した“リンゴ”の特徴量の変化範
囲内の場合は，“リンゴ”として認識されるはずであ
る。勿論，人間は連想という機能を持っているので，未
学習したリンゴも認識できる。これは，未学習したリン
ゴは，学習したリンゴに似ているからである。

【００６２】次に認識手段７について説明する。認識手
段７は，文字と文字カテゴリ間の類似度を計算する手段
６を用いて，メモリＭ４に格納している未知文字パター
ンと，認識辞書に格納されているすべての文字カテゴリ
データ間の類似度を計算し，未知文字ともっとも類似な
文字カテゴリを認識の結果としてメモリＭ５に出力す
る。

【００６３】次に入力された１文字分の文字画像から，
特徴量抽出手段２で文字のペリフェラル特徴量を抽出す
るときの動作をフローチャートを用いて説明する。図１
８〜図２１は特徴量抽出手段２の動作手順を示すフロー
チャートである。図１８は文字画像を横に分割された２
Ａ‐１区分の各区分毎に，区分の左辺から該区分を走査
して，該分区の特徴量を抽出する動作手順のフローチャ
ートである。〔Ｓ１〕：未処理の区分に移動し，該区分の行数の初期
値をｋ＝１と設定し，該区分の特徴量を表す変数Ｆｅａ
を初期化する。〔Ｓ２〕：各区分に対して，該区分の一番上の行の一番
左の画素を取り出す。〔Ｓ３〕：取り出した画素が背景画素であるかどうかを
判定し，背景画像の場合は，Ｓ４へ行く。背景画素でな
い場合は，Ｓ７へ行く。〔Ｓ４〕：Ｆｅａ＝Ｆｅａ＋１。〔Ｓ５〕：取り出した画素が該行の左側から該行の“幅
／Ｐ”番目の画素であるかどうかを判定し，該行の“幅
／Ｐ”番目の画素である場合は，Ｓ６へ行く。そうでは
ない場合は，Ｓ７へ行く。〔Ｓ６〕：取り出した画素の右の画素を取り出す。Ｓ３
へ行く。〔Ｓ７〕：下の行に移動し，ｋ＝ｋ＋１である。Ｓ８へ
行く。〔Ｓ８〕：該区分の全行が全て処理されたかどうかを判
定し，全部処理された場合は，Ｓ９へ行く。また残った
場合は，Ｓ２へ行く。〔Ｓ９〕：該区分特徴量を求める。Ｓ１０へ行く。〔Ｓ１０〕：横の２Ａ‐１区分は全て処理されたかどう
かを判定し，全部処理された場合は，終了する。もた残
った区分があれば，Ｓ１へ行く。

【００６４】図１９は文字画像を横に分割された２Ａ‐
１区分の各区分毎に，区分の右辺から該区分を走査し
て，該分区の特徴量を抽出する動作手順のフローチャー
トである。〔Ｓ１１〕：未処理の区分に移動し，該区分の行数の初
期値をｋ＝１と設定し，該区分の特徴量を表す変数Ｆｅ
ａを初期化する。〔Ｓ１２〕：各区分に対して，該区分の一番上の行の一
番右の画素を取り出す。〔Ｓ１３〕：取り出した画素が背景画素であるかどうか
を判定し，背景画像の場合は，Ｓ１４へ行く。背景画素
でない場合は，Ｓ１７へ行く。〔Ｓ１４〕：Ｆｅａ＝Ｆｅａ＋１。〔Ｓ１５〕：取り出した画素が該行の右側から該行の
“幅／Ｐ”番目の画素であるかどうかを判定し，該行の
“幅／Ｐ”番目の画素である場合は，Ｓ１６へ行く。そ
うではない場合は，Ｓ１７へ行く。〔Ｓ１６〕：取り出した画素の左の画素を取り出す。Ｓ
１３へ行く。〔Ｓ１７〕：下の行に移動し，ｋ＝ｋ＋１である。Ｓ１
８へ行く。〔Ｓ１８〕：該区分の全行が全て処理されたかどうかを
判定し，全部処理された場合は，Ｓ１９へ行く。また残
った場合は，Ｓ１２へ行く。〔Ｓ１９〕：該区分特徴量を求める。Ｓ２０へ行く。〔Ｓ２０〕：横の２Ａ‐１区分は全て処理されたかどう
かを判定し，全部処理された場合は，終了する。もた残
った区分があれば，Ｓ１１へ行く。

【００６５】図２０は文字画像を縦に分割された２Ａ‐
１区分の各区分毎に，区分の上端から該区分を走査し
て，該分区の特徴量を抽出する動作手順のフローチャー
トである。〔Ｓ２１〕：未処理の区分に移動し，該区分の列数の初
期値をｋ＝１と設定し，該区分の特徴量を表す変数Ｆｅ
ａを初期化する。〔Ｓ２２〕：各区分に対して，該区分の一番左の列の一
番上の画素を取り出す。〔Ｓ２３〕：取り出した画素が背景画素であるかどうか
を判定し，背景画像の場合は，Ｓ２４へ行く。背景画素
でない場合は，Ｓ２７へ行く。〔Ｓ２４〕：Ｆｅａ＝Ｆｅａ＋１。〔Ｓ２５〕：取り出した画素が該列の上端から該列の
“高さ／Ｐ”番目の画素であるかどうかを判定し，該列
の“高さ／Ｐ”番目の画素である場合は，Ｓ２６へ行
く。そうではない場合は，Ｓ２７へ行く。〔Ｓ２６〕：取り出した画素の下の画素を取り出す。Ｓ
２３へ行く。〔Ｓ２７〕：右の列に移動し，ｋ＝ｋ＋１である。Ｓ２
８へ行く。〔Ｓ２８〕：該区分の全列が全て処理されたかどうかを
判定し，全部処理された場合は，Ｓ２９へ行く。また残
った場合は，Ｓ２２へ行く。〔Ｓ２９〕：該区分特徴量を求める。Ｓ３０へ行く。〔Ｓ３０〕：縦の２Ａ‐１区分は全て処理されたかどう
かを判定し，全部処理された場合は，終了する。もた残
った区分があれば，Ｓ２１へ行く。

【００６６】図２１は文字画像を縦に分割された２Ａ‐
１区分の各区分毎に，区分の下端から該区分を走査し
て，該分区の特徴量を抽出する動作手順のフローチャー
トである。〔Ｓ３１〕：未処理の区分に移動し，該区分の列数の初
期値をｋ＝１と設定し，該区分の特徴量を表す変数Ｆｅ
ａを初期化する。〔Ｓ３２〕：各区分に対して，該区分の一番左の列の一
番下の画素を取り出す。〔Ｓ３３〕：取り出した画素が背景画素であるかどうか
を判定し，背景画像の場合は，Ｓ３４へ行く。背景画素
でない場合は，Ｓ３７へ行く。〔Ｓ３４〕：Ｆｅａ＝Ｆｅａ＋１。〔Ｓ３５〕：取り出した画素が該列の下端から該列の
“高さ／Ｐ”番目の画素であるかどうかを判定し，該列
の“高さ／Ｐ”番目の画素である場合は，Ｓ３６へ行
く。そうではない場合は，Ｓ３７へ行く。〔Ｓ３６〕：取り出した画素の上の画素を取り出す。Ｓ
３３へ行く。〔Ｓ３７〕：右の列に移動し，ｋ＝ｋ＋１である。Ｓ３
８へ行く。〔Ｓ３８〕：該区分の全列が全て処理されたかどうかを
判定し，全部処理された場合は，Ｓ３９へ行く。また残
った場合は，Ｓ３２へ行く。〔Ｓ３９〕：該区分特徴量を求める。Ｓ４０へ行く。〔Ｓ４０〕：縦の２Ａ‐１区分は全て処理されたかどう
かを判定し，全部処理された場合は，終了する。もた残
った区分があれば，Ｓ３１へ行く。

【００６７】次に入力された１文字分の文字画像から，
特徴量抽出手段３で文字のストローク特徴量を抽出する
ときの動作をフローチャートを用いて説明する。図２２
および図２３は特徴量抽出手段３の動作手順を示すフロ
ーチャートである。図２２は文字画像を横に分割された
２Ａ‐１区分の各区分毎に，区分の左辺から該区分を走
査して，該分区の特徴量を抽出する動作手順のフローチ
ャートである。〔Ｓ４１〕：未処理の区分に移動し，該区分の行数の初
期値をｋ＝１と設定し，該区分の特徴量を表す変数Ｆｅ
ａを初期化する。〔Ｓ４２〕：各区分に対して，該区分の一番上の行の一
番左の画素及び該画素の右隣の画素を取り出す。〔Ｓ４３〕：取り出した画素が該画素の左隣の画素と同
じかどうかを判定し，同じの場合は，Ｓ４６へ行く。同
じではない場合は，Ｓ４４へ行く。〔Ｓ４４〕：Ｆｅａ＝Ｆｅａ＋１。〔Ｓ４５〕：該行の画素がすべて処理された場合は，Ｓ
４７へ行く。そうではない場合は，Ｓ４６へ行く。〔Ｓ４６〕：取り出した画素の右の画素を取り出す。Ｓ
４３へ行く。〔Ｓ４７〕：下の行に移動し，ｋ＝ｋ＋１である。Ｓ４
８へ行く。〔Ｓ４８〕：該区分の全行が全て処理されたかどうかを
判定し，全部処理された場合は，Ｓ４９へ行く。また残
った場合は，Ｓ４２へ行く。〔Ｓ４９〕：該区分特徴量を求める。Ｓ５０へ行く。〔Ｓ５０〕：横の２Ａ‐１区分は全て処理されたかどう
かを判定し，全部処理された場合は，終了する。もた残
った区分があれば，Ｓ４１へ行く。

【００６８】図２３は文字画像を縦に分割された２Ａ‐
１区分の各区分毎に，区分の上端から該区分を走査し
て，該分区の特徴量を抽出する動作手順のフローチャー
トである。〔Ｓ５１〕：未処理の区分に移動し，該区分の列数の初
期値をｋ＝１と設定し，該区分の特徴量を表す変数Ｆｅ
ａを初期化する。〔Ｓ５２〕：各区分に対して，該区分の一番左の列の一
番上の画素及び該画素の下の画素を取り出す。〔Ｓ５３〕：取り出した画素が該画素の上の画素と同じ
かどうかを判定し，同じの場合は，Ｓ５６へ行く。同じ
ではない場合は，Ｓ５４へ行く。〔Ｓ５４〕：Ｆｅａ＝Ｆｅａ＋１。〔Ｓ５５〕：該列の画素がすべて処理された場合は，Ｓ
５７へ行く。そうではない場合は，Ｓ５６へ行く。〔Ｓ５６〕：取り出した画素の下の画素を取り出す。Ｓ
５３へ行く。〔Ｓ５７〕：右の列に移動し，ｋ＝ｋ＋１である。Ｓ５
８へ行く。〔Ｓ５８〕：該区分の全列が全て処理されたかどうかを
判定し，全部処理された場合は，Ｓ５９へ行く。また残
った場合は，Ｓ５２へ行く。〔Ｓ５９〕：該区分特徴量を求める。Ｓ６０へ行く。〔Ｓ６０〕：縦の２Ａ‐１区分は全て処理されたかどう
かを判定し，全部処理された場合は，終了する。もた残
った区分があれば，Ｓ５１へ行く。

【００６９】次に入力された１文字分の文字画像から，
特徴量抽出手段４で文字のメッシュ特徴量を抽出すると
きの動作をフローチャートを用いて説明する。図２４は
特徴量抽出手段４の動作手順を示すフローチャートであ
る。〔Ｓ６１〕：各子領域に対して，該子領域の一番上の行
の一番左の画素を取り出す。〔Ｓ６２〕：取り出した画素が背景画素であるかどうか
を判定し，背景画素の場合は，Ｓ６５へ行く。背景画素
ではない場合は，Ｓ６３へ行く。〔Ｓ６３〕：該子領域の特徴量を１に増やす。〔Ｓ６４〕：該行の画素がすべて処理されたかどうかを
判定する。すべて処理された場合は，Ｓ６６へ行く。そ
うではない場合は，Ｓ６５へ行く。〔Ｓ６５〕：取り出した画素の右の画素を取り出す。Ｓ
６２へ行く。〔Ｓ６６〕：下の行に移動する。Ｓ６７へ行く。〔Ｓ６７〕：該子領域の全行が全て処理されたかどうか
を判定し，全部処理された場合は，Ｓ６８へ行く。また
残った場合は，Ｓ６１へ行く。〔Ｓ６８〕：Ｂ＋２Ｃ＋Ｄ個の子領域は全て処理された
かどうかを判定し，全部処理された場合は，終了する。
もた残った子領域があれば，Ｓ６９へ行く。〔Ｓ６９〕：未処理の子領域に移動する。Ｓ６１へ行
く。

【００７０】次に文字カテゴリに属しているすべての学
習サンプルから，文字カテゴリデータを作成する手段９
の動作をフローチャートを用いて説明する。図２５は文
字カテゴリデータ作成手段９の動作手順を示すフローチ
ャートである。〔Ｓ７０〕：文字の個数をｍと設定し，文字特徴量ベク
トル及びカテゴリデータベクトルの次元数をｎと設定す
る。文字の学習順番ｉ＝１と設定する。〔Ｓ７１〕：文字ｉの学習サンプルの個数をａ（ｉ）と
設定し，次元数ｊ＝１と設定する；〔Ｓ７２〕：学習サンプル特徴量のｊ次元目の列挙した
値を記憶する集合Ｓを空にする。カテゴリデータのｊ次
元目の値Ｃａｔ（ｉ，ｊ）＝０と設定し，サンプルの学
習順番ｋ＝１と設定する。〔Ｓ７３〕：文字ｉの第ｋ番目の学習サンプルのｊ次元
目の値Ｓａｍ（ｉ，ｋ，ｊ）が集合Ｓに含まれるかどう
かを判断する。含まれている場合は，Ｓ７５へ行く。含
まれていない場合はＳ７４へ行く。〔Ｓ７４〕：Ｓａｍ（ｉ，ｋ，ｊ）を集合Ｓにに加え
る。〔Ｓ７５〕：次に学習するサンプルを設定する。〔Ｓ７６〕：文字ｉのすべての学習サンプルを学習した
場合は，Ｓ７７へ行く。学習するサンプルはまた残った
場合は，Ｓ７３へ行く。〔Ｓ７７〕：集合Ｓから１の要素ｅを取り出す。Ｓ７８
へ行く。〔Ｓ７８〕：Ｃａｔ（ｉ，ｊ）の第ｅ＋１ビットに
“１”を代入する。〔Ｓ７９〕：集合Ｓから要素ｅを削除する。Ｓ８０へ行
く。〔Ｓ８０〕：集合Ｓが空であるかどうかを判定する。空
の場合は，Ｓ８１へ行く。空ではない場合は，Ｓ７７へ
行く。〔Ｓ８１〕：次に学習する次元を設定する。〔Ｓ８２〕：すべての次元が処理されたら，Ｓ７２へ行
く。そうではない場合は，Ｓ８３へ行く。〔Ｓ８３〕：次に学習する文字を設定する。〔Ｓ８４〕：すべての文字が学習された場合は，終了す
る。学習文字がまた残った場合は，Ｓ７１へ行く。

【００７１】次に認識手段７の動作をフローチャートを
用いて説明する。図２６は認識手段７の動作手順を示す
フローチャートである。〔Ｓ９０〕：認識辞書に格納している文字カテゴリデー
タの個数をｍと設定し，文字カテゴリデータの比較順番
ｉ＝１，最大類似度の初期値Ｓ_ｍａｘ＝０，認識結果を
記憶する変数Ｒｅｓ＝０にする。〔Ｓ９１〕：類似度計算手段６を用いて，入力された未
知文字Ｘと認識辞書に格納されている文字ｉのカテゴリ
データＣａｔ（ｉ）間の類似度Ｓ（Ｘ，Ｃａｔ（ｉ））
を計算する。〔Ｓ９２〕：類似度Ｓ（Ｘ，Ｃａｔ（ｉ））が最大類似
度Ｓ_ｍａｘより大きい場合は，Ｓ９３へ行く。大きくな
い場合は，Ｓ９４へ行く。〔Ｓ９３〕：類似度Ｓ（Ｘ，Ｃａｔ（ｉ））を最大類似
度Ｓ_ｍａｘにコピーし，文字ｉを認識の結果としてＲｅ
ｓに記憶させる。〔Ｓ９４〕：次に比較する文字カテゴリデータを設定す
る。〔Ｓ９５〕：すべての文字カテゴリデータが比較された
場合は，終了する。比較する文字カテゴリデータがまた
残った場合は，Ｓ９１へ行く。

【００７２】次に本発明の認識装置を用いて，具体的に
文字を認識したときの認識率及び認識速度について説明
する。

【００７３】文字の学習サンプルは，紙に印刷された文
字画像をスキャナでコンピュータに入力されたものであ
る。文字の個数は３４５５個である。１３種類の文字フ
ォントから文字毎に平均７００個の学習サンプルを用意
した。Ａ＝１６，Ｂ＝６４，Ｃ＝５６，Ｄ＝４９と設定
し，本発明の特徴量抽出手段を用いて，４１１次元の複
合特徴量（１２４次元のペリフェラル特徴量＋６２次元
のストローク特徴量＋２２５次元のメッシュ特徴量）を
抽出した。

【００７４】文字毎に，該文字のすべての学習サンプル
から該文字のカテゴリデータを求め，認識辞書を作成す
る。従来の認識方法と比較するために，文字毎に，文字
カテゴリに属しているすべての学習サンプルの中心値を
求め，各次元毎に，重みｗ_ｉを求める。求められた文字
カテゴリの中心値を該文字の代表とし，認識辞書を作成
する。また，すべての文字に対して，文字カテゴリに属
しているすべての学習サンプルを用いて，該文字カテゴ
リの共分散行列，固有値及び固有ベクトルを求める。

【００７５】本発明の認識方法及び従来の認識方法を用
いて，学習したサンプルを認識する実験を行った。従来
の認識方法は，それぞれシテイブロック距離，ユークリ
ッド距離，重み付きユークリッド距離，投影距離（Ｊ＝
３）を用いて認識を行う方法である。次の表は実験の結
果を表している。

【００７６】

【表１】

【００７７】従来認識方法の中に，もっとも高い認識率
は９７．８％であり，平均認識時間は８８ｍｓであっ
た。本発明の認識方法の認識率は９９．８％であり，平
均認識時間は２１ｍｓであった。

【００７８】従って，文字認識分野における未知文字を
認識する問題に対して，より高い認識精度かつ高速に文
字を認識することが可能になる。

【００７９】以上の説明から明らかなように，本実施例
の認識装置は，文字の複合特徴量を抽出し，文字カテゴ
リに属しているすべての学習サンプルを用いて文字カテ
ゴリデータを求め，求められた文字カテゴリデータを認
識辞書に記憶させ認識辞書を作成しておく。文字を認識
するとき，文字パターンと文字カテゴリ間の類似度の計
算方法を用いて，入力された未知文字を前記作成された
認識辞書に格納されているすべての文字カテゴリと比較
し，もっとも類似な文字カテゴリを認識の結果として出
力される。これにより，入力された未知文字を高精度・
高速かつ簡単に認識することができる。

【００８０】

【発明の効果】以上説明したように，本発明によれば，
特徴量の分布に対応するビット列データからなる文字カ
テゴリデータと，認識対象の同様の文字パターンの文字
パタンデータとを比較して文字認識を行なうので学習サ
ンプルの特徴量の分布に応じた類似となり，分布により
精度が落ちることがない。さらに，複数種類の特徴量の
ビット列パターンを連結させればより正確な認識が可能
となる。

【図面の簡単な説明】

【図１】本発明の認識装置の実施の一形態を示すブロ
ック図である。

【図２】文字の複合特徴量を示す図である。

【図３】認識辞書内のデータを示す図である。

【図４】本発明の認識装置の構成を示す図である。

【図５】特徴量抽出手段２の実施の一形態を示すブロ
ック図である。

【図６】特徴量抽出手段３の実施の一形態を示すブロ
ック図である。

【図７】特徴量抽出手段４の実施の一形態を示すブロ
ック図である。

【図８】横区分分割手段で分割された区分の様子を表
す図である。

【図９】縦区分分割手段で分割された区分の様子を表
す図である。

【図１０】特徴量抽出手段２で文字“Ａ”の特徴量を
抽出する様子を示す図である。

【図１１】特徴量抽出手段３で文字“Ａ”の特徴量を
抽出する様子を示す図である。

【図１２】子領域分割手段で分割された子領域の様子
を表す図である。

【図１３】文字カテゴリデータの作成手段９の実施の
一形態を示すブロック図である。

【図１４】文字カテゴリデータの構造を示す図であ
る。

【図１５】文字カテゴリデータを求める方法の説明図
である。

【図１６】文字カテゴリデータの意味を説明する図で
ある

【図１７】従来技術及び本発明の技術による文字の認
識範囲を示す図である。

【図１８】特徴量抽出手段２の動作手順を示すフロー
チャートである。

【図１９】特徴量抽出手段２の動作手順を示すフロー
チャートである。

【図２０】特徴量抽出手段２の動作手順を示すフロー
チャートである。

【図２１】特徴量抽出手段２の動作手順を示すフロー
チャートである。

【図２２】特徴量抽出手段３の動作手順を示すフロー
チャートである。

【図２３】特徴量抽出手段３の動作手順を示すフロー
チャートである。

【図２４】特徴量抽出手段４の動作手順を示すフロー
チャートである。

【図２５】文字カテゴリデータの作成手段の動作手順
を示すフローチャートである。

【図２６】認識手段の動作手順を示すフローチャート
である。

【図２７】文字カテゴリに属している学習サンプルの
分布範囲と認識範囲を示す図である。

【図２８】従来技術で認識を行うときの問題点を示す
図である。

【符号の説明】

１文字画像入力手段，２〜４特徴量抽出手段，５
複合特徴量を求める手段，６文字パターンとカテゴリ
間の類似度の計算手段，７認識手段，９文字カテゴリ
データ作成手段，Ｘ入力された未知文字，Ｃａｔ
（ｉ）認識辞書に格納している文字ｉのカテゴリデー
タ。

Claims

【特許請求の範囲】

【請求項１】文字カテゴリを表す参照用ビット列デー
タを記憶する手段と，認識対象文字の文字パターンの特
徴量から上記参照用ビット列データに対応する認識対象
ビット列データを抽出する手段と，上記認識対象ビット
列データと上記参照用ビット列データとを比較して上記
認識対象文字の文字パターンが上記文字カテゴリに属す
る尤度を算出する手段とを有することを特徴とする文字
認識装置。
【請求項２】相互に重ならない複数の部分範囲に特徴
量の範囲を分割し，こらら部分範囲を上記参照用ビット
列データのビットポジションに対応させ，上記文字カテ
ゴリに属する学習サンプルの文字パターンの特徴量が所
定回数以上出現する部分領域に対応するビットポジショ
ンのビット値を所定の値とし，それ以外のビットポジシ
ョンのビット値を他の値として，上記参照用ビット列デ
ータが生成され，上記認識対象の特徴量が出現する部分
領域に対応するビットポジションのビット値を上記所定
の値とし，それ以外のビットポジションの値を上記他の
値として，上記認識対象ビット列データを抽出すること
を特徴とする請求項１に記載の文字認識装置。
【請求項３】文字認識を行う文字認識装置において，
文字パターンの複合特徴量を抽出する手段と，各文字毎
に，文字カテゴリデータを作成する手段と，作成された
文字カテゴリデータを用いて認識辞書を作成する手段
と，文字パターンと文字カテゴリデータ間の類似度を計
算する手段と，前記類似度の計算手段を用いて，入力さ
れた未知文字パターンを認識辞書に格納されているすべ
ての文字カテゴリデータと比較し，もっとも類似する文
字カテゴリを認識の結果として出力することを特徴とす
る文字認識装置。
【請求項４】前記文字パターンの複合特徴量の抽出手
段は，文字のペリフェラル特徴量を抽出する手段と，文
字のストローク特徴量を抽出する手段と，文字のメッシ
ュ特徴量を抽出する手段とを備えたことを特徴とする請
求項３に記載された文字認識装置。
【請求項５】前記文字のペリフェラル特徴量を抽出す
る手段は，１文字分の文字画像を入力する手段と，前記
文字画像を記憶する手段と，前記文字画像の領域を分割
する手段と，文字の特徴量を取るための走査範囲の制限
手段と，前記文字画像の背景画像の特徴を取る手段とを
有することを特徴とする請求項４に記載された文字認識
装置。
【請求項６】前記文字画像の領域分割手段は，前記文
字画像の領域を横にＡ区分に分割する手段と，前記横に
分割されたＡ区分に対して，ｋ（ｋ＝１，２，…，Ａ‐
１）区分目の下半分とｋ＋１区分目の上半分を１区分と
し，横にＡ‐１区分に分割する手段と，前記文字画像の
領域を縦にＡ区分に分割する手段と，前記縦に分割され
たＡ区分に対して，ｋ（ｋ＝１，２，…，Ａ‐１）区分
目の右半分とｋ＋１区分目の左半分を１区分とし，縦に
Ａ‐１区分に分割する手段を要することを特徴とする請
求項５に記載された文字認識装置。
【請求項７】前記走査範囲の制限手段は，前記文字画
像の外接矩形の左辺と右辺の計２辺から文字方向に文字
の幅の１／Ｐまで走査する走査範囲の制限手段と前記文
字画像の外接矩形の上辺と下辺の計２辺から文字方向に
文字の高さの１／Ｐまで走査する走査範囲の制限手段を
有することを特徴とする請求項５に記載された文字認識
装置。
【請求項８】前記文字画像の背景画像の特徴を取る手
段は，前記文字画像の領域分割手段により分割された横
の２Ａ‐１区分の各区分毎に，前記走査範囲の制限手段
によって制限された走査範囲において，文字画像の左辺
からａ回走査し（ａ＝前記文字画像の高さ／Ａ），最初
に文字を構成する画素（黒画素）にあたるまでの背景画
像の画素数を計数する手段と，ａ回走査して計数された
画素数の平均値を前記横の２Ａ‐１区分毎にそれぞれ記
憶する手段と，前記文字画像の領域分割手段により分割
された横の２Ａ‐１区分の各区分毎に，前記走査範囲の
制限手段によって制限された走査範囲において，文字画
像の右辺からａ回走査し（ａ＝前記文字画像の高さ／
Ａ），最初に文字を構成する画素（黒画素）にあたるま
での背景画像の画素数を計数する手段と，ａ回走査して
計数された画素数の平均値を前記横の２Ａ‐１区分毎に
それぞれ記憶する手段と，前記文字画像の領域分割手段
により分割された縦の２Ａ‐１区分それぞれに対して，
前記走査範囲の制限手段によって制限された走査範囲に
おいて，文字画像の上辺からａ回走査し（ａ＝前記文字
画像の幅／Ａ），最初に文字を構成する画素（黒画素）
にあたるまでの背景画像の画素数を計数する手段と，ａ
回走査して計数された画素数の平均値を前記縦の２Ａ‐
１区分毎にそれぞれ記憶する手段と，前記文字画像の領
域分割手段により分割された縦の２Ａ‐１区分それぞれ
に対して，前記走査範囲の制限手段によって制限された
走査範囲において，文字画像の下辺からａ回走査し（ａ
＝前記文字画像の幅／Ａ），最初に文字を構成する画素
（黒画素）にあたるまでの背景画像の画素数を計数する
手段と，ａ回走査して計数された画素数の平均値を前記
縦の２Ａ‐１区分毎にそれぞれ記憶する手段とを有する
ことを特徴とする請求項５に記載された文字認識装置。
【請求項９】前記文字のストローク特徴量の抽出手段
は，１文字分の文字画像を入力する手段と，前記文字画
像を記憶する手段と，前記文字画像の領域分割手段と，
前記文字画像のストローク特徴量を抽出する手段を有す
ることを特徴とする請求項４に記載された文字認識装
置。
【請求項１０】前記文字画像の領域分割手段は，前記
文字画像の領域を横にＡ区分に分割する手段と，前記横
に分割されたＡ区分に対して，ｋ（ｋ＝１，２，…，Ａ
‐１）区分目の下半分とｋ＋１区分目の上半分を１区分
とし，横にＡ‐１区分に分割する手段と，前記文字画像
の領域を縦にＡ区分に分割する手段と，前記縦に分割さ
れたＡ区分に対して，ｋ（ｋ＝１，２，…，Ａ‐１）区
分目の右半分とｋ＋１区分目の左半分を１区分とし，縦
にＡ‐１区分に分割する手段を要することを特徴とする
請求項９に記載された文字認識装置。
【請求項１１】前記文字画像のストローク特徴量を抽
出する手段は，前記文字画像の領域分割手段により分割
された横の２Ａ‐１区分それぞれに対して，前記文字画
像の幅を走査範囲として，文字画像の左辺からａ回走査
し（ａ＝前記文字画像の高さ／Ａ），背景画素（白画
素）から文字を構成する画素（黒画素）に，及び文字を
構成する画素（黒画素）から背景画素（白画素）に変化
する回数を計数する手段と，ａ回走査して計数された回
数の平均値を前記横の２Ａ‐１区分毎にそれぞれ記憶す
る手段と，前記文字画像の領域分割手段により分割され
た縦の２Ａ‐１区分それぞれに対して，前記文字画像の
高さを走査範囲として，文字画像の上辺からａ回走査し
（ａ＝前記文字画像の幅／Ａ），背景画素（白画素）か
ら文字を構成する画素（黒画素）に，及び文字を構成す
る画素（黒画素）から背景画素（白画素）に変化する回
数を計数する手段と，ａ回走査して計数された回数の平
均値を前記縦の２Ａ‐１区分毎にそれぞれ記憶する手段
とを有することを特徴とする請求項９に記載された文字
認識装置。
【請求項１２】前記文字のメッシュ特徴量の抽出手段
は，１文字分の文字画像を入力する手段と，前記文字画
像を記憶する手段と，前記文字画像の領域分割手段と，
前記文字画像のメッシュ特徴量を抽出する手段を有する
ことを特徴とする請求項２に記載の文字認識装置。
【請求項１３】前記文字画像の領域分割手段は，前記
文字画像の領域をサイズがｂ画素＊ｂ画素の子領域Ｂ個
に分割する手段と，前記分割されたＢ個の子領域に対し
て，前記文字画像の右側にある子領域以外の子領域毎
に，子領域の右半分と右隣の子領域の左半分を１子領域
とし，Ｃ個の子領域に分割する手段と，前記分割された
Ｃ個の子領域に対して，前記文字画像の下側にある子領
域以外の子領域毎に，子領域の下半分と下隣の子領域の
上半分を１子領域とし，Ｄ個の子領域に分割する手段
と，前記分割されたＢ個の子領域に対して，前記文字画
像の下側にある子領域以外の子領域毎に，子領域の下半
分と下隣の子領域の上半分を１子領域とし，Ｃ個の子領
域に分割する手段を要することを特徴とする請求項１２
に記載された文字認識装置。
【請求項１４】前記文字画像のメッシュ特徴量を抽出
する手段は，前記文字画像の領域分割手段により分割さ
れたＢ＋２Ｃ＋Ｄ個の子領域それぞれに対して，子領域
画像の左辺から走査し，文字を構成する画素（黒画素）
数を計数する手段と，前記計数した画素数を前記Ｂ＋２
Ｃ＋Ｄ個の子領域毎にそれぞれ記憶する手段を有するこ
とを特徴とする請求項１２に記載された文字認識装置。
【請求項１５】前記文字カテゴリデータの作成手段
は，文字特徴量の変化範囲を決める手段と，カテゴリデ
ータの表現手段と，文字特徴量の各次元の値を列挙する
手段と，列挙した値をカテゴリデータに変換する手段
と，各次元の変換された値を該文字カテゴリの標準デー
タとすることを特徴とする請求項３に記載された文字認
識装置。
【請求項１６】前記文字特徴量の変化範囲を決める手
段は，前記請求項１３で分割された子領域内の画素数
（ｂ^２）を文字特徴量の変化範囲とすることを特徴とす
る請求項１５に記載された文字認識装置。
【請求項１７】前記カテゴリデータの表現手段は，文
字特徴量の次元数を有するベクトルでカテゴリデータを
表現し，ベクトルの各次元をｂ^２+１個（ｂ ^２は前記求
められた文字特徴量の変化範囲である）のビットで表現
することを特徴とする請求項１５記載された文字認識装
置。
【請求項１８】前記文字特徴量の各次元の値を列挙す
る手段は，文字カテゴリに属しているすべての学習サン
プルから，学習サンプル特徴量の各次元毎に，該次元の
とりうる値を列挙することを特徴とする請求項１５に記
載された文字認識装置。
【請求項１９】前記列挙した値をカテゴリデータに変
換する手段は，列挙した値｛ｅ_１，ｅ_２，．…，ｅ_ｓ｝
に対して，カテゴリデータの対応している次元の第ｅ_ｉ
＋１ビットの値を“１”と設定し（ｉ＝１，２，…，
ｓ），その以外のビットの値を“０”と設定することを
特徴とする請求項１５に記載された文字認識装置。
【請求項２０】前記認識辞書を作成する手段は，各文
字毎に，文字のカテゴリデータを求め，求められた文字
カテゴリデータを認識辞書に記憶させ認識辞書を作成す
る手段を備えたことを特徴とする請求項３に記載された
文字認識装置。
【請求項２１】前記文字パターンと文字カテゴリデー
タ間の類似度を計算する手段において，文字パターンＸ
＝（ｘ_１，ｘ_２，…，ｘ_ｎ）と文字カテゴリデータＣａ
ｔ＝（ｃａｔ_１，ｃａｔ_２，…，ｃａｔ_ｎ）間の類似度
Ｓ（Ｘ，Ｃａｔ）は次のように計算されることを特徴と
する請求項３に記載された文字認識装置。【数１】ここで，ｆ（ａ，ｂ）＝１，ｉｆｂのａ+１ビット
目の値＝１；ｆ（ａ，ｂ）＝０，ｉｆｂのａ＋１ビ
ット目の値＝０である。
【請求項２２】文字認識を行う文字認識方法において，
文字パターンのペリフェラル特徴量と，ストローク特徴
量と，メッシュ特徴量をそれぞれ抽出し，抽出された３
種類の特徴量を並べ該文字の複合特徴量を求め，各文字
毎に，請求項１５に記載されている文字カテゴリデータ
の作成手段を用いて，文字カテゴリデータを作成し，作
成された文字カテゴリデータを認識辞書に記憶させ認識
辞書を作成し，認識するとき，請求項２１に記載されて
いる文字パターンと文字カテゴリデータ間の類似度の計
算公式を用いて，入力された未知文字パターンを認識辞
書に格納されているすべての文字カテゴリデータと比較
し，もっとも類似な文字カテゴリを認識の結果として出
力されることを特徴とする文字認識方法。