JPS63150784A

JPS63150784A - 文字認識装置

Info

Publication number: JPS63150784A
Application number: JP61297776A
Authority: JP
Inventors: Toshiaki Yagasaki; 矢ケ崎　敏明
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 1986-12-16
Filing date: 1986-12-16
Publication date: 1988-06-23

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】［産業上の利用分野］本発明は、文字認識装置、特に前処理として認識過程に
引き渡すための文字の大きさの正規化を行う文字認識装
置に関するものである。

［従来の技術］従来、この種の装置は書かれた文字の位置が規定されて
おり、且つ文字の大きさに関しても所定の記入枠の中に
ある程度の大きさで書くことが限定されていた。一方、
フリーなフォーマットで任意の位置に書かれた文字を認
識する場合には、文字単位に切り出すことと、切り出さ
れた文字の大きさが未定のため大きさを正規化する必要
とが生しる。一般に大きさを正規化をするには、−文字
毎に切り出された文字パターンの外接枠から認識パター
ンへの変倍率を算出して、パターンを当てはめる手順を
とる。さらに、この変倍率も上記文字パターンのＸ方向
、Ｘ方向独立の変倍率を採用しているものが多い。この
場合、例えば“１”のような文字パターンが“口”のよ
うに正規化されたり、“Ｏ“や“０”のよりなＸ方向と
Ｘ方向とが微妙に違うパターンに関しては全くの同一の
認識パターンに正規化される。このような場合にＸ方向
、Ｘ方向の変倍率を変えることによって、つまり変倍率
の小さい方を基準に正規化を行なうという手段によって
容易に問題を解決できることも明らかになっている。

ところが、特殊文字の認識、つまり（“、”　・“、”
　・　“。”・・・）のような文字の認識においては、
上記の正規化手段では区別できなかったり、正規化によ
り別の文字になってしまうことがある。

［発明が解決しようとする問題点］本発明は、上述従来例の欠点を除去し、サイズの違う類
似文字やパターンの位置の異なる類似文字を識別して認
識する文字認識装置を提供することを目的とする。

［問題点を解決するための手段］上記目的を達成するために本発明の文字認識装置は以下
のような構成から成る。

即ち、配列された文字を認識する文字認識装置において
、所定方向に配列されたパターンを分離する分離手段と
、該分離手段により分離されたパターンを変倍して所定
の大きさに正規化する変倍手段とを備える。

［作用コ以上の構成において、配列された文字を認識する文字認
識装置において、所定方向に配列されたパターンを分離
する分離手段と、該分離手段により分離されたパターン
を変倍して所定の大きさに正規化する変倍手段とを備え
、変倍手段は、個々のパターンの変倍比率と複数のパタ
ーンの平均変倍比率とに基づいて、変倍比率を決定する
ように動作する。

［実施例］第２図（ａ）は従来の文字認識装置の構成を示すブロッ
ク図、第２図（ｂ）は従来の文字認識装置の処理フロー
チャートである。

従来の文字認識装置は、人力部２１とＣＰＵ２２とＲＯ
Ｍ２３とＲＡＭ２４と認識辞書２５と出力部２６とを備
え、人力部２１より文書をイメージデータで人力すると
、ＣＰＵ２２はＲＯＭ２３に格納された処理プログラム
に従って、ＲＡＭ２４をイメージデータの記憶及び補助
記憶として使いながら文字の切り出し一正規化一認識を
行い、表示装置や記憶装置等の出力部２６より出力する
。

その動作を第２図（ｂ）のフローチャートに従って説明
する。ステップ５２００で入力部２１からの人力文書デ
ータが入力される。ここではスキャナで入力する。この
スキャナは入力文章をイメージデータに変換するが、一
般的にＣＣＤ等のセンサを使うとイメージデータはアナ
ログ値を示す。このアナログ値を２値化（０，１のパタ
ーン）するのがステップ５２０１である。２値化された
イメージデータはイメージメモリのＲＡＭ２４に格納さ
れ、ステップ５２０２で文字の切り出しが行なわれる。

文字の切り出しを第３図の人力文書例に従って説明する
。イメージデータをＸ方向にスキャンしてＸ方向の濃度
ヒストグラムＨＹを求め、ライン毎に発生するパルス波
形毎に文字列の判別を行なう。第３図においては、■〜
■が文字列とみなされる。さらに文字列毎に分離して、
それぞれに対してＸ方向の濃度ヒストグラムピケをとる
。

第３図には０列の濃度ヒストグラムＨｘが示してあり、
これにより■・・・■のように１文字車位に文字が切り
出される。

第４図は１文字車位に切り出された文字例を表わしたの
ものである。第４図に示されるように、Ｘ方向の幅はす
べて同一の間隔であることがわかる。一方、Ｘ方向の幅
は文字の横の大きさで変化する。つまり、“ピ”、“キ
”はほぼ文字外形のままに切り出され、“−”は外形と
しては“ピ”とほぼ同じになるがＸ方向の幅の中心部の
みに片寄っている。“１“、“。”等は細長のデータが
切り出される。

ステップ５２０３では、ステップ５２０２で切り出され
た文字の平滑化処理がなされる。特にここでは孤立画像
の除去（ノイズ除去）が中心である。ステップ５２０４
では、第５図に示されるように文字外形の矩形抽出が行
なわれる。ステップ５２０５では、ステップ５２０４で
抽出された矩形図形ｆ（ｉ）と特徴描出される画像パタ
ーンの大きさＦとの縦幅と横幅の倍率から、大きさの正
規化をするための変倍率ｇが計算される。例えば、ステ
ップ５２０４で求められた第５図の矩形図形ｆ（ｉ）が
３２ｘ３２の画素からなっていて、特徴描出される画像
パターンＦが６４Ｘ６４のときは、変倍率ｇ＝２が得ら
れる。

この変倍率ｇだけｆ　（ｉ）を変倍することによって、
ステップ５２０６では正規化パターンＦ（ｉ）（正規化
される最終の画像パターン）が作り出される。ステップ
５２０７では正規化パターンＦ　（ｉ）の特徴描出が実
行され、ステップ３２０８で予め認識辞書２５に記憶さ
れたパラメータとの比較によって識別処理がなされ、ス
テップ５２０９で認識結果が出力部２６に出力される。

この場合、候補文字という形で複数個を出力することが
多い。

第１図（ａ）は第１の実施例の文字認識装置のブロック
図、第１図（ｂ）、（Ｃ）は第１の実施例の処理フロー
チャートである。

第１の実施例の文字認識装置は、人力部１１とＣＰＵ１
２とＲＯＭ１３とＲＡＭ１４と認識辞書１５と認識辞書
１６と出力部１７とを備え、人力部１１より文書をイメ
ージデータで人力すると、ＣＰＵ１２はＲＯＭ１３に格
納された処理プログラムに従って、ＲＡＭ１４をイメー
ジデータの記憶及び補助記憶として使用しながら、文字
の切り出しと正規化が実行される。正規化されたパター
ンに基づいて認識辞書１５と認識辞書１６とが選択され
て文字認識が実行され、表示装置や記憶装置等の出力部
１７より出力する。

その動作を第１図（ｂ）、（ｃ）の処理フローチャート
に従って説明する。ステップ３１００〜ステツプ５１０
３は前述のステップ３２００〜ステツプ５２０３と同一
の処理を行なう。ステップ５１０４では、連続したｎ文
字の切り出しパターンデータから、第５図で示されるよ
うな矩形データｆ　（１）　、　　ｆ　（２）　、　・
・・、　　ｆ　（ｎ）を得る。

ステップ５１０５において、得られた矩形データのＸ成
分の平均値ｆ′８とＸ成分の平均値ｆ′７とが、次式％式％により算出される。尚、ｆｘ（ｋ）、ｆｙ（ｋ）はｆ　
（ｋ）のＸ成分とＸ成分である。以下、Ｘ成分とＸ成分
とは処理が同じなので、第１図（ｂ）ではＸ、Ｙを区別
せず共通の書き方をする。ステップ５１０６においては
、平均値ｆ′と認識文字のサイズＦとから変倍率ｇ＝Ｆ
／ｆ’を算出する。

ステップ５１０７で各々の文字の変倍率ｇ’　（ｋ）　
−Ｆ／ｆ　（ｋ）を算出する。ｋは各文字の順番とする
。ステップ５１０８では、ｇとｇ’（ｋ）との比較がな
される。これは、各々の文字の変倍率ｇ’（ｋ）が平均
変倍率ｇに所定値Ａを加えた値より犬ぎければ、ステッ
プ５１０９で平均値変倍率をとることにより、異常に大
きな変倍が実行されないことになる。たとえば、切り出
された文字が第５図の“。”、“、”等の場合に与えら
れることになる。尚、本例のようにＸ、Ｙの区別をせず
全体の平均値・変倍率を算出して処理をしても良い。

一方、ステップ５１０８で各々の文字の変倍率ｇ′（ｋ
）が平均変倍率ｇに所定値Ａを加えた値以下ならば、従
来のように各々の文字の変倍率ｇ　（ｋ）を使用する。

ステップ５１０９，１１０で変倍された文字はステップ
５１１１で正規化パターンＦ　（ｋ）として、以下ステ
ップ３１１２〜１１５で特徴抽出して文字の認識を行い
、出力部１７に出力する。

この場合、第１図（ａ）のブロック図で、特殊文字の認
識辞書１５を別に設けて、ステップ５１１３で認識辞書
１５と１６の選択を行い、ステップ５１０９に進んだ場
合は特徴抽出後に認識辞書１５にアクセスがかかるよう
にすれば、認識時間の大幅な削減も達成できる。つまり
、第１の実施例では認識辞書１５は特殊文字認識辞書で
あり、認識辞書１６は他の文字となる。又、特殊文字の
認識辞書１５が与えられるために、特殊文字に対する認
識処理において、文字データの認識不良が回避できる。

更に、小文字のアルファベットや促音（や、ゆ、っ・・
・）などが判別できるために、これらの文字を認識辞書
１５に格納すれば、大文字と類似の小文字に対する判別
が達成できる。

第６図（ａ）は第２の実施例の文字認識装置のブロック
図、第６図（ｂ）、（ｃ）は第２の実施例の処理フロー
チャートである。

第２の実施例の文字認識装置は、人力部６１とＣＰＵ６
２とＲＯＭ６３とＲＡＭ６４と認識辞書１５ａ、１５ｂ
、６５ｃ、　・・・と出力部６７とを備え、人力部６１
より文書イメージデータで人力すると、ＣＰＵ６２はＲ
ＯＭ６３に格納された処理プログラムに従って、ＲＡＭ
６４をイメージデータの記憶及び補助記憶として使用し
ながら、文字の切り出しと正規化が実行される。正規化
された結果、つまり正規化された手順に基づいて、認識
辞書６５ａ、６５ｂ、６５ｃ、・・・が選択されて文字
認識が実行され、表示装置や記憶装置等の出力部６６よ
り出力する。

その動作を、第６図（ｂ）、（Ｃ）の処理フローチャー
トに従って説明する。ステップ３６００〜ステツプ５６
０３は、従来例の５２００〜５２０３と同一の処理を行
なう。ステップ５６０４では、切り出し文字パターンの
図形の重心が算出される。重心というのは、切り出され
た文字が例えば第７図に示されるような図形の場合には
、Ａ点を基準にＡ（０，０）。

Ｂ　（Ｗｌ　、　Ｏ）、　Ｃ（０，ｈｌ　）、　Ｄ　（
Ｗｌ　。

ｈ２）なる座標を設け、−例として、ｆ　（ｘ。

ｙ）が座標（ｘ、ｙ）における画素の濃度値とすると、を算出することで（ｘ＋　、ｙｒ　）が重心の座標とし
て求まる。ステップ５６０５においては、求められたＸ
　＋　＋　３’　＋の値に応じて第８図のように重心の
位置ｇ（ｉ）の割り当てを行う。ｉは１〜９の整数で、
第７図のパターンはｇ（５）が割りつけられる。′、″
のようなパターンはｇ（３）が割りつけられることにな
る。

ステップ５６０６では、上記パターンの外形図形が求め
られる。外形図形というのは、パターンの始めと終りの
位置をＸ方向、Ｘ方向につめることである。この時のＸ
方向の幅をｆ　（ｘ）、Ｘ方向の幅をｆ　（ｙ）とする
。ステップ５６０７では、所定値Ａとｔ　（ｘ）、　　
ｆ　（ｙ）をそれぞれ比較して両方ともｆ　（ｘ）、　
　ｆ　（ｙ）のほうが小さいならば、つまり促音文字や
特殊文字ならば、ステップ３６０８に進む。その他の文
字の場合はステップ５６０９に進むことになる。

ステップ５６０９では、ｇ　　′　＝Ｍｉｎ　　（Ｆｘ／ｆ（ｘ）、Ｆｙ／ｆ（
ｙ））でＸ方向とＸ方向の幅の変倍率の内で小さい値の
ほうが選択される。これで、“−”のような文字ではＸ
方向の変倍率がとられ、“１”のような文字の場合には
Ｘ方向の変倍率が選ばれることになる。尚、Ｆｘ、Ｆｙ
は、認識パターンが（６４゜６４）のパターンであると
するとＦｘ＝６４゜Ｆ３／＝６４となる。

一方、ステップ３６０８では、上記算出されたｇ　（ｉ
）によってフローが異なる。ｇ（１）のとき、つまり“
°”のような文字に対してはステップ５６１０ａに進み
、ｇ（２）のとき、つまり°゛＊”のような文字のとき
はステップ５６１０ｂに進み、ｇ（３）のとき、つまり
“、′のような文字のときはステップ５６１０ｃの処理
をする。

第６図（ｂ）にはｇ（１）〜ｇ（３）の場合しか図示し
なかったが、ｇ（４）・・・ｇ　（９）　ノＷＮ　合ニ
もそれぞれの処理を行う。又、ｇ（１）。

ｇ　（４）　、　ｇ　（７）をｇ（１）で代表させる処
理も考えられる。ステップ５６１０ａ、６１０ｂ。

６１０　ｃ　、−・−の処理は、Ｆ／ｆ詳しくは、Ｍｉ
ｎ（Ｆｘ／ｆ　（ｘ）　、　Ｆｙ／ｆ　（ｙ）　）で変
倍率が求められ、さらに１／４．１／３．１／２．・・
・をかけることにより正規化変倍率を異ならしめる。こ
れは、“°”と“、”との正規化後の特徴ベクトル空間
のパターンを異ならしめるもので、認識率の向上がはか
れる。

ステップ５６１１では、ステップ５６１０ａ。

６１０ｂ、６１０ｃ、・・・で求められたｇ′の変倍率
によって入力データの正規化が実行されＦ　（ｘ）、　
　Ｆ　（ｙ）の正規化パターンが求まることになる。正
規化パターンはステップ５６１２で特徴抽出が実行され
る。ステップ５６１３では、特徴抽出されたベクトルｆ
　（ａ）・・・但ａ＝１〜６４、に前述のステップで求
められたｇ′。

ｇ（ｉ）を付加することで、識別処理を行なう最終的な
ベクトル空間−が求められることになる。

第２の実施例では、ｇ’、ｇ（ｉ）の２つの値をベクト
ル空間に付けているが、どちらか一方でも大きな効果が
出る。ステップ５６１４では、ｇ’、ｇ（ｉ）の値によ
って認識辞書６５ａ。

６５ｂ、６５ｃ、・・・の選択が実行される。ｇ′とｇ
（ｉ）の組み合わせのそれぞれに対して認識辞書を設け
るならば、第６図（ｂ）のフローで示しただけでも４Ｘ
９＝３６種類の認識辞書を作ることがでとる。認識辞書
の数は、コストとシステムの必要性に応じて設ければ良
く、重心位置の決定のための区分けも９つに限らない。

又、第１の実施例と同様にＸ成分とｙ成分を分けずに処
理をしてもよい。以下、ステップ５６１５で選択された
認識辞書を基に文字の識別が行なわれ、ステップ５６１
６で候補文字が出力される。

以上述べてきたように本実施例によりサイズの違いによ
る類似文字“ヤ”、“ヤ”などに関しての識別に関して
有効な手段を提供するものである。そのために、切り出
された文字の矩形図形。

Ｘ方向の長さ、Ｘ方向の長さを算出することで、パター
ンの複数のＸ方向の平均値、Ｘ方向の平均値を求め、平
均値を基準にしてパターンデータの個々の長さを比較す
る手段を有し、比較結果に応じてパターンデータの変倍
率を決定することにある。又、上記変倍率は、各パター
ンデータによって独立に設けられることと、各パターン
の正規化への変倍率に応じて、平均値の変倍率か各パタ
ーンに対応する変倍率かが選択的に決められることを特
徴とする。

さらに、本実施例によると、フリーフォーストで書かれ
る文章に対して、句読点や“目°°。

“日”、“１″などの縦長の文章、又横長の文字に対し
ても読取りパターンデータを忠実に保ちながら、正規化
する手段を提供することで文字の認識率そのものを向上
することが可能となる。

さらに、本実施例では、切り出された文字の画像パター
ンの重心の位置を算出し、重心の位置と画像パターンの
大きさに応じて正規化のための変倍手段を変える。これ
により、パターンの位置関係によって異なる類似文字“
、”、“パなとの識別に関して有効な手段を提供するも
のである。

つまり、本実施例においては、上記類似文字には重心の
位置の違いが生じている点に着目して、文字外形図形パ
ターンからの大きさによる認識図形パターンへの変倍率
を異にすることで特徴ベクトルを空間の性質を違えてし
まう。

ざらに、本実施例は、上記手段において正規化された認
識図形パターンより特徴抽出することと、抽出によって
求められた特徴ベクトル空間に上記手段によって求めら
れた変倍率を特徴パラメータとして付加することを特徴
とする。又、上記手段において正規化され求められた特
徴ベクトル空間に、文字切り出し後に求められた重心の
アドレス位置のパラメータを付加することを特徴とする
。もちろん、上述の変倍パラメータ及び重心アドレス位
置のパラメータは独立した２つのベクトル空間として付
けることも可能である。

［発明の効果］本発明により、サイズの違う類似文字やパターンの位置
の異なる類似文字を識別して認識する文字認識装置を提
供できる。

【図面の簡単な説明】

第１図（ａ）は第１の実施例の文字認識装置のブロック
図、第１図（ｂ）、（Ｃ）は第１の実施例の処理フローチャ
ート、第２図（ａ）は従来の文字認識装置のブロック図、第２図（ｂ）は従来の処理フローチャート、第３図は人
力文字例を示す図、第４図は切り出した文字例を示す図、第５図は第４図の文字に対応する矩形図形を示す図、第６図（ａ）は第２の実施例の文字認識装置のブロック
図、第６図（ｂ）、（Ｃ）は第↓の実施例の処理フローチャ
ート、第７図は第２の実施例の重心の算出を説明する図、第８図は第２の実施例の重心の割り当て位置を説明する
図である。図中、１１・・・入力部、１２・・・ＣＰＵ、１３・・
・ＲＯＭ、１４・・・ＲＡＭ、１５．１６・・・認識辞
書、１７・・・出力部、６１・・・人力部、６２・・・
ｃｐｕ。６３・ＲＯＭ、６４・ＲＡＭ、６５ａ、６５ｂ。６５ｃ・・・認識辞書、６６・・・出力部である。特許出願人　　　キャノン株式会社第１図　（０）第１面　（Ｃ’）第２図　　（０）第６図　（０）第６図　（Ｃ）第８図

Claims

【特許請求の範囲】

（１）配列された文字を認識する文字認識装置において
、所定方向に配列されたパターンを分離する分離手段と
、該分離手段により分離された前記パターンを変倍して
所定の大きさに正規化する変倍手段とを備え、前記変倍手段は、個々のパターンの変倍比率と複数のパ
ターンの平均変倍比率とに基づいて、変倍比率を決定す
ることを特徴とする文字認識装置。
（２）変倍手段は、縦方向と横方向とを別々に変倍する
ことを特徴とする特許請求の範囲第１項記載の文字認識
装置。
（３）変倍手段は、個々のパターンの変倍比率と複数の
パターンの平均変倍比率とを比較する比較手段と、該比
較手段の比較結果から個々のパターンの変倍比率が複数
のパターンの平均変倍比率より大きい場合には複数のパ
ターンの平均変倍比率を、個々のパターンの変倍比率が
複数のパターンの平均変倍比率より小さい場合には個々
のパターンの変倍比率を正規化の変倍比率に決定する変
倍比率決定手段とを備えることを特徴とする特許請求の
範囲第１項記載の文字認識装置。