JPH05250518A

JPH05250518A - 文字認識方法

Info

Publication number: JPH05250518A
Application number: JP4051305A
Authority: JP
Inventors: Takuya Okamoto; 卓哉岡本; Masatoshi Hino; 匡利樋野
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1992-03-10
Filing date: 1992-03-10
Publication date: 1993-09-28
Anticipated expiration: 2016-08-06
Also published as: JP3196291B2

Abstract

(57)【要約】【目的】文字認識に用いる特徴量の求め方を工夫するこ
とで、特徴数を減らしても、高精度な認識が可能とし、
また、高速な認識を可能とすること。【構成】上記目的を達成するため、特徴量として、１０
１の文字パターンより、文字を構成するストロークの方
向性に着目した特徴（１０２、１０３）を画素ごとに求
める。この特徴に対して、文字パターンのストロークに
適応したメッシュ分割を行ない、マッチングのための特
徴量（１０４、１０５）を得る。この特徴に対して、特
徴量辞書（１０６、１０７）とのずらしマッチングを行
なうことで文字認識を行なう。【効果】文字パターンごとに、そのストロークに適応し
たメッシュ分割を行なうことで、特徴数を減らすことが
できる。また、特徴数が減ることで、マッチングの処理
時間を減少することができる。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、画像で表現された文字
パターンを光学的に読み取り、各文字パターンを対応す
る文字コードに変換する文字認識技術に関し、特に印刷
文字を対象とし、１つの辞書で各種フォントの文字認識
を行うのに適した文字認識アルゴリズムに関する。

【０００２】

【従来の技術】従来、文字認識技術の１例として、例え
ば、電子通信学会論文誌’７９／１１Ｖｏｌ．Ｊ６２−
ＤＮｏ．１１「マルチフォント印刷漢字認識のため
の粗分類」（従来技術１）などで使われているメッシュ
分割方式によるものがある。これは、文字パターンを均
等な複数のメッシュ領域に分割し、その中の黒画素の割
合を特徴量とするものである。基本的には、特徴をぼか
すことによって位置ずれに対処したものであり、本発明
の如く、ずらしマッチングへの応用は考慮されていな
い。このため、詳細な認識には適さないという問題があ
る。

【０００３】従来の文字認識技術の他の例として、電子
通信学会論文誌’８５／１Ｖｏｌ．Ｊ６８−ＤＮ
ｏ．１ｐｐ．５６−６３「動的整合法による手書き
漢字認識」（従来技術２）がある。これは、文字パター
ンを取り出した後、一定サイズのパターンに正規化し、
正規化されたパターンについて、各画素ごとに縦、横、
斜めの方向性特徴を抽出し、各方向成分ごとに、別の文
字パターンとして求めた後、それぞれの画像について、
各画素ごとに一方向のみのずらしマッチングを行なうこ
とで、文字認識を実現するものである。本方式では、画
素の順序関係の整合性は、ずらす方向の１ライン中での
み行なわれ、他のラインとの整合性はとられていないと
いう問題がある。また、現パターンについて、正規化す
るために特徴数が増えてしまうという問題がある。

【０００４】その他、メッシュ分割を動的に行なう文字
認識技術として、電子通信学会論文誌’８４／１１Ｖ
ｏｌ．Ｊ６７−ＤＮｏ．１１ｐｐ．１３７９−１３
８３「線密度イコライゼーション−相関法のための非線
形正規化法」（ジュライ具術３）がある。これは、手書
き文字の変形を補正するために、パターン中の黒画素の
重心を基にして分割位置を変化させるものである。これ
は、全体パターンの歪を補正することができるが、ずら
しマッチングのための特徴量抽出には適さない。

【０００５】

【発明が解決しようとする課題】従来技術１に示された
メッシュパターン特徴は、線幅の違いや線の位置ずれに
よって特徴量が大きく変動し、様々なフォントを１つの
辞書で認識するのには適さない。また、ぼかしによって
位置ずれに対処をしており、識別率が低いという問題が
ある。

【０００６】従来技術２では、漢字など複雑な文字の認
識を行なう場合、文字パターンの正規化の数を小さくす
ると、文字パターンそのものが元のパターンと異なった
ものになるため、得られたパターンの特徴からは十分な
認識が行なえないという問題がある。したがって、認識
率をあげるためには分解能を下げることができず、マッ
チングのための特徴数が多くなる。また、マッチングの
ずらし許容度も大きくしないと、文字パターンの変形に
十分対応できなくなってしまう。こうしたことから、上
記従来方式では、認識率を維持しながら、認識速度を上
げることは困難である。また、ずらしについても、縦方
向性特徴については、各行ごとに、そこに含まれる全て
の画素の特徴をずらす必要があり、処理に時間がかかる
という問題点がある。

【０００７】従来技術３のメッシュ分割方式は、パター
ンの変形を補正するためのものであり、特徴数を減らし
て認識速度の高速化を図るためのものではない。

【０００８】本発明の目的は、各種フォントの認識を１
つの辞書で高精度に行なえるようにした文字認識方法を
提供することにある。

【０００９】本発明の他の目的は、特徴数を減らすこと
によって、高速に認識処理できる文字認識方法を提供す
ることにある。

【００１０】

【課題を解決するための手段】これらの目的を達成する
ために、本発明では、文字パターンを正規化する前に元
の文字パターンから特徴を抽出し、これを正規化する。
正規化は、文字パターンの持つ特徴をできるだけ失わな
い方式、例えばメッシュ分割方式を用いる。

【００１１】この場合、文字線のストローク方向に着目
した特徴量を抽出し、この特徴量が隣の画素と大きく異
なる位置を分割位置としてメッシュ分割する。特徴の変
化位置だけで分割すると正規化のための分割数が足りな
い場合は、全体のバランスを保った補間位置での分割を
行なう。

【００１２】本発明は、認識対象を印刷文字とし、縦方
向性の特徴については縦１ラインのメッシュごとに、横
方向性の特徴については横１ラインのメッシュごとにず
らした「ずらしマッチング方式」適用する。また、左右
分離、あるいは上下分離が生じた文字パターンについて
は、それぞれの部分について独立に特徴量を抽出して、
ずらしマッチングを行なう。

【００１３】

【作用】本発明の文字認識方法によれば、文字認識のた
めに抽出する特徴の数を減少した場合でも、従来技術と
同様の認識率を得ることができ、高速度の文字認識が可
能となる。

【００１４】

【実施例】先ず、図１を参照して、本発明による文字認
識方法の概要を説明する。

【００１５】文字パターン１０１から、画素ごとの特徴
量（画素特徴量）を抽出する。画素特徴量は、その画素
が含まれるストロークの方向性に関する特徴量であり、
縦、横、左斜め、右斜めの４つの方向について求められ
る。これら４つの特徴量のうち、縦方向、横方向の特徴
（１０２、１０３）だけをマッチングのための特徴量と
して用いる。このままでは、文字サイズの正規化が為さ
れていないので、縦方向と横方向のそれぞれの特徴につ
いて、文字パターンを一定の分割数で碁盤目状に分割
（メッシュ分割）する。このメッシュ分割の際、特徴の
ぼけを防ぐために、特徴量の値の差が大きくなる位置を
メッシュ分割位置に設定する。また、元の文字パターン
のバランスが崩れないようにメッシュ分割位置を追加
し、得られた各メッシュ内の画素特徴量の平均値をマッ
チングのためのメッシュ特徴量とする（１０４、１０
５）。次に、メッシュ特徴量を用いて対象の絞り込みを
行なった後、縦方向と横方向の各メッシュ特徴量を、特
徴量辞書（１０６、１０７）に用意してある縦方向性、
横方向性の特徴量とストローク単位のマッチングが行え
るように、図２に示すようなＤＰ（動的計画法）による
ずらしマッチング（ＤＰマッチング）を行なう。

【００１６】図３は、本実施例の文字認識装置の全体ブ
ロック図である。

【００１７】スキャナ３０１で入力された画像データ
は、スキャナコントローラ３０２を通して、メモリ３０
５に格納される。本実施例では、スキャナからの読み込
みによって得られる画像は、一定の閾値によって決定さ
れる２値のパターンである。

【００１８】ディスク３０３は、画像、パターンマッチ
ング用辞書、認識結果などを格納する。必要に応じて、
ディスクコントローラ３０４を介して、メモリ内容の格
納とメモリへの書き込みを行なう。認識処理はメモリ上
のデータを用いて行われる。メインメモリ３０５には、
認識時のワークデータや特徴量辞書が記憶される。

【００１９】ＣＰＵ３０６では、システム全体のコント
ロールを行ない、キーボード３１０からの入力などによ
り、順次処理を進めていく。各認識処理もここで行なわ
れる。ディスプレイ／キーボードコントローラ３０７
は、ＣＰＵから送られた表示内容をメモリ３０８に格納
し、これをディスプレイ３０９に表示する。また、キー
ボード３１０からの入力をメモリ３０８に蓄え、ＣＰＵ
からの読みだし要求に応ずる。３１１は、各装置間を接
続するためのバスである。

【００２０】図４に、文字認識処理の概略ブロック図を
示す。画像読みだし部４０１は、画データ４０２と、４
０３に格納された書式解析結果の文字外接矩形とから、
１文字分ごとの画像データを読みだす。読みだした内容
は、画素特徴量格納メモリ４０４に格納する。画素特徴
量格納メモリは、ａ，ｂ，ｃ，ｄの４枚あり、それぞれ
に白画素が「０」、黒画素が「１」の値を持つ画像デー
タとして格納される。

【００２１】画素特徴抽出部４０５では、４０４に格納
された文字パターンを基に、各画素ごとに、縦、横、左
斜め、右斜めの方向性特徴を４次元分抽出し、それぞ
れ、メモリ４０４の領域ａ，ｂ，ｃ，ｄに格納する。

【００２２】メッシュ分割部４０６では、４０４に格納
された画素特徴量を基に、同一メッシュ内には類似の特
徴を持つ画素ができるだけ入るように、所定数のメッシ
ュ分割位置を設定し、メッシュ分割位置格納メモリ４０
７に格納する。

【００２３】メッシュ特徴量抽出部４０８では、メモリ
４０７に格納されたメッシュ分割位置から得られる各メ
ッシュごとに、４０４に格納された画素特徴量中の画素
の持つ特徴の平均を求め、これを、メッシュの特徴量と
する。得られた特徴量は、メッシュ特徴量格納メモリ４
０９に格納する。

【００２４】パターンマッチング部４１０では、メモリ
４０９に格納された特徴量と、特徴量辞書格納メモリ４
１１に格納された特徴量辞書とのパターンマッチングを
行なう。そして、辞書中の各文字とのマッチングの評価
値と、辞書中の各文字の識別番号を、評価値格納メモリ
４１２に格納する。

【００２５】ソート部４１３では、評価値格納メモリ４
１２の内容を評価値を基に、評価の高い順になるように
ソートする。ここでは、評価値と一緒に文字の識別番号
もソートし、このソートで得られる順位が認識候補の順
位となる。

【００２６】図５に、本文字認識装置の処理の概略フロ
ーチャートを示す。

【００２７】５０１：初期化。特徴量辞書の読みだし等
を行なう。

【００２８】５０２：画像データの読みだし方法を決定
する。

【００２９】５０３：スキャナ起動。スキャナから読み
だす場合は、３０１のスキャナを起動し、画像データを
メモリに格納する。

【００３０】５０４：画像データ読みだし。ディスクに
格納された画像データを読みだす場合は、３０３のディ
スクからデータを読みだし、メモリに格納する。

【００３１】５０５：連結成分抽出。画像データがメモ
リに格納されると、画像全体をスキャンし、上下左右斜
めの８方向のいずれかで連続している黒画素の塊（連結
成分）を抽出し、それに外接する矩形で取り出す。

【００３２】５０６：書式解析。５０５で取り出した、
連結成分の並びをもとに、文字列抽出、領域抽出を行な
い、文字列、図、表などを判定する。

【００３３】５０７：文字抽出。書式解析で、文字列と
判断された部分について、文字切り出しを行ない、各行
ごとに１文字づつの境界を設定し、文字の外接矩形を抽
出する。

【００３４】５０８：文字認識。抽出された文字パター
ンを認識し、文字コードに変換する。

【００３５】文字認識の処理は、文字パターンからの特
徴抽出と抽出した特徴のパターンマッチングよりなる。
図６の文字認識処理全体のフローチャートにしたがっ
て、処理内容を詳しく述べる。

【００３６】６０１：認識対象となる文字数をＭに設定
する。

【００３７】６０２：カウンタｍを０クリアする。

【００３８】６０３：認識対象文字を全て認識したか判
定する。ｍ＜Ｍ６０４：文字矩形情報と画像データから、次に認識する
文字パターンを、１文字分読みだす。

【００３９】６０５：特徴抽出。読みだした文字パター
ンについて、パターンマッチングのための特徴量を求め
る。

【００４０】６０６：マッチング対象となる特徴量辞書
の文字数をＮに設定する。

【００４１】６０７：カウンタｎを０クリアする。

【００４２】６０８：特徴量辞書のＮ文字と比較が終わ
ったか、チェックする。

【００４３】６０９：４１１の特徴量辞書格納メモリに
格納された標準特徴量を読みだす。

【００４４】６１０：辞書に格納された各文字コードに
対応する標準特徴量と、６０５で画像からの文字パター
ンから求めた特徴量とのずらしマッチングを行ない、マ
ッチング距離値を求め、これを４１２のマッチング距離
格納メモリに格納する。

【００４５】６１１：カウンタｎのインクリメントを行
なう。

【００４６】６１２：４１２に格納したマッチングの距
離値を基に、ソートを行なう。

【００４７】６１３：認識結果として、ソート結果の上
位１０文字の文字コードと、マッチングの距離値を返
す。

【００４８】６１４：カウンタｍのインクリメントを行
なう。

【００４９】図７は、特徴抽出方式全体のフローチャー
トである。特徴量としては、文字パターンを構成するス
トロークの方向性に注目したものを用い、これを、画素
ごとに求めたあと、メッシュ分割して得る。

【００５０】７０１：文字パターン読み出しでは、ま
ず、画像データと文字矩形データとから、１文字分の文
字パターンを読みだし、４０４−ａ，ｂ，ｃ，ｄの４枚
の画素特徴量格納メモリに格納する。この際、各パター
ンの周囲には、一画素分の余白（白画素の特徴量：０）
を書き込む。図８は、各画素ごとに、黒の部分は１、白
の部分は０が格納されている状態。

【００５１】７０２：ラン長ラベル作成では、図９に示
したように、４０４−ａ，ｂ，ｃ，ｄの黒画素の位置に
は、それぞれ、その画素を含む、縦、横、左斜め、右斜
め、の各方向の連続した黒画素の数（以下これをラン長
とよぶ）を書き込む。白画素の位置には、すべて０を書
き込む。

【００５２】７０３：画素特徴量抽出では、４０４−
ａ，ｂ，ｃ，ｄに格納された各方向のラン長の同一の位
置の値を取り出し、式１で正規化し、これを再び、４０
４−ａ，ｂ，ｃ，ｄに書き込む。これにより、各方向の
画素特徴量は、０から１２８に正規化される。

【００５３】

【数１】

【００５４】図１０のａ，ｂ，ｃ，ｄは、図９のａ，
ｂ，ｃ，ｄの同一の位置に格納されている値をＨ，Ｖ，
Ｌ，Ｒとした場合、これを数１で正規化した値（ｈ，
ｖ，ｌ，ｒ）を格納した状態を示す。例えば、図９の、
位置９０１、９０２、９０３、９０４の値は、それぞれ
正規化されて、図１０の位置１００１、１００２、１０
０３、１００４の値になる。

【００５５】７０４：メッシュ分割では、２０４−ａ，
２０４−ｂに格納した縦方向性、横方向性の画素特徴量
の値をもとに、特徴のぼけを防ぐように、メッシュ分割
を行なう。斜め方向性特徴については、本実施例ではマ
ッチングに用いない為、メッシュ分割しないが、特徴を
斜方軸変換することで、同様にメッシュ分割して特徴抽
出してもよい。

【００５６】７０５：メッシュ特徴量抽出では、７０４
で求めたメッシュ分割位置をもとに、４０４−ａ，４０
２−ｂに格納された画素特徴量をメッシュ分割し、各メ
ッシュに含まれる画素特徴量の平均値を求め、これを各
メッシュのメッシュ特徴量とし、マッチングに用いる特
徴量とする。

【００５７】メッシュ分割では、１つのメッシュ内にで
きるだけ多くの特徴が入るように、メッシュ分割位置を
設定する。このために、隣合う画素の特徴量の差分を求
め、これが最も大きくなるような位置で分割を行なう。

【００５８】以下、図１１のフローチャートに従って、
本文字認識方式におけるメッシュ分割方式について詳し
く述べる。図１２から図１８は、メッシュ分割の際、４
０７に格納されるメッシュ分割位置を求めるための作業
テーブルの内容を示したものである。

【００５９】１１０１：差分投影値抽出では、隣合う画
素の画素特徴量の差分値を求め、これを１方向に投影し
た値を求める。縦方向性画素特徴量については、横に隣
りあう画素の特徴量の差分値を縦方向に投影する。横方
向性画素特徴量については、縦に隣りあう画素の特徴量
の差分値を横方向に投影する。この際、縦方向性画素特
徴量については、左右に並んだ特徴量が、”左側の値＜
右側の値”の場合と、”左側の値＞右側の値”の場合に
分けて、投影する。同様に、横方向性画素特徴量につい
ても、上下に並んだ特徴量が、”上側の値＜下側の値”
の場合と、”上側の値＞下側の値”の場合に分けて、投
影する。図１２に、図１０−ａに示した特徴量の、左右
に隣合った画素の値の差分値の縦方向への投影の様子を
示す。１２０１が、”左側の値＜右側の値”の投影値、
１２０２が、”左側の値＞右側の値”の投影値。

【００６０】１１０２：差分投影値の極大点取り出しで
は、１１０１で得た、差分投影値を画素境界の並びの方
向の関数として、極大になる位置を取り出す。図１３
に、図１２に示した投影値が、並びの位置の関数とし
て、極大となるような画素境界線の位置を”１”で示
す。

【００６１】１１０３：極大点ソートでは、１１０２で
得た極大点の、差分投影値が降順になるようにソートす
る。図１４に、図１３で極大になる位置を、その位置
の、差分の投影値（図１２）の大きさの降順でソートし
た結果を示す。このように、極大点のみを、メッシュ分
割位置とするのは、スキャナで文字パターンを読み込ん
だ際の線境界のがたつきや、ストロークの傾きにより、
投影値が大きい位置が連続した場合に、どこで、分割す
るかを決定するためである。

【００６２】１１０４：極大点による分割位置設定で
は、１１０３でソートして得られた順序で画素境界を取
り出して、メッシュ分割位置を設定する。図１５に、図
１４の差分投影値の大きな方から、分割位置として設定
した状態を示す。

【００６３】この例では、図１２の１２０１、１２０２
に示した投影値が、大きな位置から選択している。

【００６４】分割位置を設定する、別の方法としては、
図１２の１２０１と１２０２のそれぞれから、交互に分
割位置を取り出す方法がある。これは、次のようなもの
である。

【００６５】文字パターンの１本のストロークに注目し
た場合、その両側に白画素との境界線が現れることか
ら、たとえば、１２０１の投影値で設定された分割位置
と、ストロークをはさんで、反対側の分割位置が、１２
０２に存在するはずである。したがって、分割位置が１
つ得られた場合、その分割位置が、”左の値＜右の値”
の投影値（１２０１）から得られた分割位置であれば、
１２０１で見つかった分割位置の右側の、ストローク幅
として許容される範囲の、”左の値＞右の値”の投影値
（１２０２）の中から、この範囲の中で極大点を見つ
け、これを分割位置とする。同様に、”左の値＞右の
値”の投影値（１２０２）の中から見つかれば、見つか
った位置の左側の、ストローク幅として許容される範囲
の、”左の値＜右の値”の投影値（１２０１）の中か
ら、極大点を見つけ、これを分割位置とする。いずれの
場合も対応する分割位置が見つからなければ、特に対応
する分割は行なわない。このような分割を行なうこと
で、確実にストロークを抽出するような、分割を行なう
ことができる。

【００６６】１１０５：分割位置のソートでは、１１０
４で得た分割位置を、位置の順に並ぶように並びかえ
る。図１６に、図１５の分割位置をソートした状態を示
す。

【００６７】１１０６：補間分割では、１１０４で、分
割数が足りない場合、１１０５で設定した分割位置の間
を、全体で一定の分割数になるよう、さらに分割する。

【００６８】補間分割の詳しい内容を以下に述べる。

【００６９】図１７（ａ），（ｂ）に、図１５で設定さ
れた分割位置と、一定数で均等分割した場合の位置で最
も近いものとを対応づけた様子を示す。

【００７０】図１７（ａ）の場合は、１対１に対応して
いるが、図１７（ｂ）は、１対２に対応する位置があ
る。

【００７１】図１７（ｃ）に、図１７（ｂ）のように、
１対２（あるいはそれ以上）に対応する位置がある場合
に、全体として最もずれが少なくなるように、１対１に
対応づけた状態を示す。

【００７２】このように、単純に、最も近い位置との対
応をとるだけでは、だめな場合があり、全体としてのず
れが、最小になるような対応を見つけるのが本方式であ
る。

【００７３】図１８は、図１７（ｃ）のマッピングの結
果をもとに、分割数を一定にするために加える分割位置
を示したもの。このように、ストロークに適応した分割
位置と均等分割の分割位置と対応づけることで、元の文
字パターンからの変形をできるだけ防ぐようにメッシュ
分割位置を決定する。

【００７４】図１９と図２０に、全体としてのずれが最
小になるような対応を求めるために用いるテーブルを示
す。

【００７５】図１９の位置ずれ量では、図１５で取り出
した分割位置と、メッシュ分割数で均等分割した場合の
分割位置との差分値（差の絶対値）を求め、ここに示し
たマトリクス上に格納する。たとえば、１９０１に示し
た、”１”という値は、１９０２の”１１”という値
と、１９０３の”１２”という値の差分値である。

【００７６】この際、両端は固定であることと、順序関
係は一定であることと、１対１の対応しか許されないこ
とから、図中の斜線で示した位置が示す対応は許されな
い。

【００７７】図２０に示した、ＤＰによる均等分割位置
との対応づけでは、図１９の表の左側の列から順に、Ｄ
Ｐを用いて、最もずれの小さくなる対応を見つける。

【００７８】この対応を見つける際、次の条件を満たさ
なければならない。

【００７９】（ａ）対応は１対１。（ｂ）順序関係は変わらない。

【００８０】図１９のマトリクスの左下を、原点（０，
０）として、横方向の位置をｘ，縦方向の位置をｙとす
る。（ｘ，ｙ）の位置の値は、それぞれの分割位置、ｆ
（ｘ）と、ｇ（ｙ）の差となる。したがって、（ｘ，
ｙ）の位置の値を、Ｃ（ｘ，ｙ）とすると、Ｃ（ｘ，
ｙ）の値は、数２で表わされる値となる。

【００８１】

【数２】

【００８２】このＣ（ｘ，ｙ）は、ずれの大きさをあら
わすので、全体として最もずれを小さくするためには、
トータルでＣ（ｘ，ｙ）の累積値が最も小さくなるよう
な対応を、全てのｘについて、上記条件を満たしながら
決めなければならない。

【００８３】Ｔ（ｘ，ｙ）は、（ｘ，ｙ）の位置までの
ずれの累積値を示す。マトリクスのｘの値を０≦ｘ≦
ｍ、ｙの値を０≦ｙ≦ｎとする。Ｔ（ｘ，ｙ）を求める
ための漸化式を数３に示す。

【００８４】

【数３】

【００８５】図２０は、上記漸化式のＴ（ｍ，ｎ）を、
ＤＰにより解いた結果の対応づけを示す。表中の値は、
左から順に、上記条件を満たしながらその位置までのず
れの累積値の最小値を示す。〇印は、全体として最もず
れが小さくなるような対応を示す。また、各値から左下
に伸びている線は、１つ左の列中で上記条件を満たし、
最も小さい累積値を指している。つまり、数３のｘ≧２
の場合のｍｉｎで選ばれた位置を示す。このように、図
１９から、図２０を作成し、これにより累積のずれが最
小になる様な対応づけを設定する。

【００８６】図２１は、図２０から得た、各分割位置と
均等分割位置との対応関係を示す。

【００８７】図２２と図２３に、対応位置をずらして、
全体として、最もずれを小さくするための均等分割位置
との対応設定方式の処理フローチャートを示す。両端は
固定であり、１≦ｘ≦ｍ−１の範囲の対応を求める。

【００８８】２２０１：ずれの大きさを図１９のマトリ
クスに書き込むためのループのカウンタｘの初期値（ｘ
＝１）を設定する。

【００８９】２２０２：ｘ≦ｍ−１を満たすかどうか、
ｘの値のチェックを行う。

【００９０】２２０３：カウンタｙの初期値（ｙ＝ｘ）
を設定する。

【００９１】２２０４：ｙ≦ｘ＋ｎ−ｍを満たすかどう
か、ｙの値のチェックする。

【００９２】２２０５：ずれの大きさを計算。Ｃ（ｘ，
ｙ）＝｜ｆ（ｘ）−ｇ（ｙ）｜２２０６：ｙをインクリメント。ｙ＝ｙ＋１；２２０７：ｘをインクリメント。ｘ＝ｘ＋１；２２０８：トータルのずれ量の計算のための初期値設
定。

【００９３】Ｔ（１，ｙ）＝Ｃ（１，ｙ）（１≦ｙ≦１＋ｎ−ｍ）２２０９：トータルのずれ量を計算するための、ループ
のカウンタｘの初期値を設定する。ｘ＝２；２２１０：ｘの値のチェックを行なう。ｘ≦ｍ−１；２２１１：カウンタｙの初期値を設定する。ｙ＝ｘ；２２１２：ｙの値のチェックを行なう。ｙ≦ｘ＋ｎ−
ｍ；２２１３：ｘ−１≦ｚ≦ｙ−１の範囲のｚのうちで、Ｔ
（ｘ−１，ｚ）が最小となるｚをＺとする。

【００９４】２２１４：Ｆ（ｘ，ｙ）に、Ｚを書き込
む。

【００９５】Ｔ（ｘ，ｙ）＝Ｔ（ｘ−１，Ｚ）＋Ｃ（ｘ，ｙ）。

【００９６】２２１５：ｙをインクリメント。ｙ＝ｙ＋
１；２２１６：ｘをインクリメント。ｘ＝ｘ＋１；２２１７：カウンタｘに、初期値代入。ｘ＝ｍ−１；２２１８：ｍ−１≦ｚ≦ｎ−１の範囲のｚのうちで、Ｔ
（ｍ−１，ｚ）が最小になるｚをＺとする。

【００９７】２２１９：均等分割との対応テーブルＭ
（ｍ−１）に、Ｚを格納。

【００９８】Ｍ（ｍ−１）＝Ｚ；２２２０：ｚに初期値Ｚを代入する。

【００９９】２２２１：ｘの値のチェックを行なう。ｘ
＞１；２２２２：Ｆ（ｘ，ｙ）の値を見て、１つ左の分割位置
について、均等分割位置との対応を求める。ｚ＝Ｆ
（ｘ，ｚ）；２２２３：ｘをデクリメント。ｘ＝ｘ−１；２２２４：均等分割との対応テーブルＭ（ｘ）に、ｚを
格納。Ｍ（ｘ）＝ｚ；以上により、すべての、極大点に
よる分割位置の、均等分割位置との対応関係が得られ
る。

【０１００】このようにして得られた特徴量をもとに、
パターンマッチングを行なうが、認識対象が印刷文字で
ある場合、文字を構成するストロークの方向にそれほど
変動は無い。従って、ずらしを、ライン単位に行なうこ
とで、ずらしマッチングによるコストの増大を押さえて
いる。

【０１０１】文字パターン全体のマッチングを行なうた
めには、端のライン上の特徴量は、必ずマッチング対象
の同一の位置の特徴とマッチングしなければならない、
という制約が生じる。しかし、図２４に示したように、
元の文字パターンによっては、ストロークが端のライン
に現れる場合と、現れない場合がある。２３０１の文字
パターンからは、一番上のラインにストロークが現われ
る２３０２の特徴が得られるが、２３０３の文字パター
ンからは、一番上のラインにストロークが現われない、
２３０４の特徴が得られる。このため、正しくマッチン
グできない場合がある。

【０１０２】このような問題を解決するため、図２５に
示したように、特徴量の端のラインの外側に、１ライン
分、特徴量０のラインが存在すると仮定して、マッチン
グを行なう。これにより、上記の制約を満たしながら、
正しいマッチングが可能となる。

【０１０３】本実施例では、ＤＰマッチングによるずら
しマッチングを行なっている。文字パターンのマッチン
グの特性から、（ａ）左右の順序関係は、入れ替わってはならない。（ｂ）文字の線幅が異なる場合があるので、マッチング
は１対多も認める。（ｃ）マッチング漏れの文字線がないように、すべての
特徴量を対応させなければならない。という、３つの条件を満たしながらの、マッチングにな
る。

【０１０４】図２は、ＤＰマッチングの原理を示す。各
点が、それぞれのラインの対応で生じる特徴量の差によ
り得られるマッチングのコスト値になっている。図の左
下と右上をつなぐ経路の通る各点のコストの合計値が、
最小となるような経路を求め、このコスト値をパターン
マッチングのマッチングコストとする。

【０１０５】上記の条件（ａ），（ｂ），（ｃ）を満た
すために、経路は、図に示した上、右、右上しか許され
ない。

【０１０６】図２６は、文字の２次元的なストロークの
位置ずれを、１方向のみのずらしで吸収する原理を示し
たもの。このように、方向成分を抽出した上で、各々で
は、一方向のみにずらしを行なうことで、２次元方向の
ずらしを行なうことによる、処理時間の２次元的な増大
を押さえ、ずらしの許容度を広げることを可能としてい
る。

【０１０７】図２７は、マッチング方式のフローチャー
ト。ここでは、Ｍ×Ｎにメッシュ分割して得られた特徴
を、縦方向の１ライン分のメッシュ単位に、横方向のみ
にＰメッシュ分まで許容して、ずらす場合を示す。この
場合、Ｍは、ずらし方向のライン数。Ｎは、１ライン中
の特徴数となる。先に示したように、マッチングの際
に、両端に特徴量０のメッシュのラインをつけるので、
実際にマッチングの対象となるライン数は、Ｍ＋２とな
る。以下の説明ではＭが１６の場合を示す。

【０１０８】２６０１：コスト値計算を行なう。

【０１０９】Ｃ（ｘ，ｙ）に、認識対象側ｘラインと，
辞書側ｙラインの対応を行なったときのマッチングコス
トを入れる。

【０１１０】各点のマッチングのコスト値は、次のよう
に求められる。

【０１１１】例えば、図２の、２０１の位置に示された
コスト値は、ｘ側が６で、ｙ側が７なので、２０２のパ
ターンの６番のラインの特徴量の上から順に、取り出
す。これと、２０３のパターンの７番のラインの左から
順に取り出した特徴量と差分の絶対値の合計値を求め、
これをＣ（６，７）の値とする。

【０１１２】したがって、ｘ軸側の文字パターンの２次
元で表される特徴量を、Ａ（ｘ，ｉ）（０≦ｉ≦Ｎ−１）ｙ軸側の文字パターンの２次元で表される特徴量を、Ｂ（ｙ，ｊ）（０≦ｊ≦Ｎ−１）（図２では、ｘ，ｙが
入れ替わっている）とすると、Ｃ（ｘ，ｙ）は、次の式で得られる。

【０１１３】

【数４】

【０１１４】２６０２：ＤＰマッチングの初期値設定。

【０１１５】

【数５】

【０１１６】２６０３：ループカウンタｘの初期化ｘ＝０２６０４：ＤＰマッチングの値の更新（２＜＝ｘ＜＝１
５）

【０１１７】

【数６】

【０１１８】２６０５：カウンタインクリメントｘ＝ｘ＋１２６０６：ループチェックｘ＜＝１７２６０７：マッチング結果（最小値Ｍ）計算

【０１１９】

【数７】

【０１２０】以上の、特徴抽出、マッチングにより得ら
れたコスト値をソートして、文字認識結果とする。

【０１２１】ところで、漢字には、偏と作り、あるい
は、冠と足からできているものが存在する。偏と作りか
らできている文字の横方向のストロークの位置関係は、
偏と作りで必ずしも一定とは限らない。同様に、冠と足
からできている文字の、縦方向のストロークの位置関係
も、一定とは限らない。このため、文字パターンを半
分、あるいは、４つに分割して、それぞれのパターンに
ついて、上記方式によるメッシュ分割を行ない、特徴量
を抽出することで、このような、ずれに対処することが
できる。横方向性特徴を文字パターンから、求めたあ
と、これを、左右に２分割してメッシュ分割、マッチン
グする処理内容を、図２８に示す。

【０１２２】２７０１：方向性特徴抽出で、縦方向の特
徴抽出を行なう。

【０１２３】２７０２：方向性特徴を抽出した文字パタ
ーンのデータを左右に２分割する。

【０１２４】２７０３：分割したそれぞれについて、分
割しない場合と同様な、メッシュ分割を行なう。

【０１２５】２７０４：分割したそれぞれについて、ず
らしマッチングを行ない、それぞれのコストの合計値に
よって認識結果とする。

【０１２６】

【発明の効果】本発明の認識方法によれば、パターンマ
ッチングの特徴数を正規化するためのメッシュ分割を行
なうとき、分割による特徴量のぼけを防ぎ、ずらしマッ
チングに適した特徴量を得ることができる。また、ずら
しマッチングにより文字の２次元的なずれを吸収しなが
ら、ずらし量の許容度の増加による処理時間の増大を１
次元的な増加に押さえることができる。

【図面の簡単な説明】

【図１】本発明の文字認識方法の概略説明図。

【図２】ＤＰマッチングの原理説明図。

【図３】実施例の文字認識装置のシステム構成ブロック
図。

【図４】文字認識の処理内容のブロック図。

【図５】実施例の文字認識装置の処理フローチャート。

【図６】文字認識処理のフローチャート。

【図７】特徴抽出処理のフローチャート。

【図８】文字パターンの特徴抽出用メモリへの格納状態
を示す図。

【図９】文字データの各方向のラン長格納状態を示す
図。

【図１０】文字データの各画素の画素方向性特徴量格納
状態を示す図。

【図１１】メッシュ分割方式フローチャート。

【図１２】画素特徴量の差分値の格納状態を示す図。

【図１３】画素特徴量の差分値の極大点の抽出結果を示
図。

【図１４】画素特徴量の差分値の極大値のソート結果を
示す図。

【図１５】画素特徴量の差分値の極大点による、メッシ
ュ分割候補位置の設定を示す図。

【図１６】極大点によるメッシュ分割位置のソート結果
を示す図。

【図１７】極大点によるメッシュ分割位置と均等分割位
置の対応付けの例を示す図。

【図１８】補間分割位置の設定状態を示す図。

【図１９】分割位置の対応のずれ量を示すマトリクス
図。

【図２０】ＤＰによる分割位置のずれ量を最小にする対
応付けを示す図。

【図２１】ＤＰにより設定されたずれ量を最小にする対
応付けを示す図。

【図２２】極大点と均等分割位置の対応を求めるための
処理のフローチャート（その１）。

【図２３】極大点と均等分割位置の対応を求めるための
処理のフローチャート。（その２）

【図２４】文字パターンの変動による端のラインのメッ
シュの特徴の変化を示す図。

【図２５】文字パターンの端の変動を吸収するための値
０の特徴量ラインの追加を示す図。

【図２６】擬似的２次元ＤＰマッチングの原理を示す
図。

【図２７】ＤＰマッチング方式のフローチャート。

【図２８】２分割マッチングの処理内容のフローチャー
ト。

【符号の説明】

３０１…スキャナ、３０２…スキャナコントローラ、３
０３…ディスク、３０４…ディスクコントローラ、３０
５…メインメモリ、３０６…ＣＰＵ、３０７…ディスプ
レイ／キーボードコントローラ、３０８…メモリ（ビデ
オメモリ）、３０９…ディスプレイ、３１０…キーボー
ド、３１１…システムバス、４０１…画像読み出し部、
４０２…画像データ格納メモリ、４０３…書式解析結果
格納メモリ、４０４…画素特徴量格納メモリ、４０５…
画素特徴抽出部、４０６…メッシュ分割部、４０７…メ
ッシュ分割位置格納メモリ、４０８…メッシュ特徴量抽
出部、４０９…メッシュ特徴量格納メモリ、４１０…パ
ターンマッチング部、４１１…特徴量辞書格納メモリ、
４１２…マッチング評価値格納メモリ、４１３…ソート
部。

Claims

【特許請求の範囲】

【請求項１】２値画像で表現された文字パターンに対し
て、画素ごとの特徴量（画素特徴量）を求め、文字パタ
ーン全体を所定数のメッシュ領域に分割し、それぞれの
メッシュ中に含まれる画素の特徴量に基づいて各メッシ
ュごとの特徴（メッシュ特徴量）を求め、文字を認識す
る文字認識方法において、文字を構成するストロークの方向性に関する特徴量を求
め、各方向性特徴量をストロークが含まれる１ラインご
とにまとめ、そのラインに垂直な１方向に限定した、ず
らしマッチングを行なうことを特徴とする文字認識方
法。
【請求項２】請求項１の文字認識方法において、方向性
特徴量ごとに、各画素特徴量と、この画素に隣りあう画
素特徴量との差分値を求め、方向性と同じ方向に投影し
た投影値に基ぢて分割位置を決定し、該分割位置では前
記所定数のメッシュ領域分割ができない場合は、既に設
定済の分割位置と一定数の均等分割を行なった場合の分
割位置とを対応付け、対応付けされた均等分割位置の間
に存在する対応しなかった均等分割位置の数だけ、メッ
シュ分割位置を設定するようにしたことを特徴とする文
字認識方法。
【請求項３】請求項１の文字認識方法において、ずらし
マッチングを行なう際に、各ラインを複数の部分に分割
し、それぞれの部分で独立にずらしマッチングすること
を特徴とする文字認識方法。