JPS63269267A

JPS63269267A - 文字認識方法

Info

Publication number: JPS63269267A
Application number: JP62103008A
Authority: JP
Inventors: Toshiaki Yagasaki; 矢ケ崎　敏明
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 1987-04-28
Filing date: 1987-04-28
Publication date: 1988-11-07
Anticipated expiration: 2012-11-12
Also published as: JP2675303B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】［産業上の利用分野］本発明は、文字認識装置、特に配列された文字を認識す
る文字認識装置に関するものである。

［従来の技術］従来、この種の装置は、文章の中から１文字ずつの文字
に切り出し、切り出された文字に対して大きさ・位置を
補正する前処理が実行される。更に、前処理により正規
化された文字は、情報収縮の形で特徴ベクトル空間が作
られる。このベクトル空間と予め作られている辞書デー
タとのマツチング処理が実行され、認識結果を出力する
。

このように、構成されている文字認識装置においては、
前処理の正規化の段階で小文字、大文字、特殊文字もす
べて同じ大きさになってしまうため、（１）　特殊文字（ｅｘ　、。）はアルファベットの“
０”と間違えやすい。

（２）入力文字データと辞書に対して全てアクセスする
ため時間がかかる。

（３）対象する辞書データが多いことで、誤認識も増え
る傾向にある。

［発明が解決しようとする問題点］本発明は、上記の欠点を除去し、アクセスする辞書デー
タを少なくし、更に文字データに応じて特徴抽出を変え
て、認識率の向上と高速化を図った文字認識装置を提供
する。

［問題点を解決するための手段］この問題点を解決するための一手段として、本発明の文
字認識装置は、配列された文字を認識する文字認識装置
であって、所定方向に配列されたパターンを分離する分
離手段と、該分離手段により分離された前記パターンの
濃度を検出する濃度検出手段と、該濃度検出手段が検出
した濃度に対応した辞書に基づいて、前記パターンを認
識する認識手段とを備える。

［作用］かかる構成において、分離手段により配列されたパター
ンから分離されたパターンの濃度を濃度検出手段で検出
し、認識手段は濃度に対応した辞書に基づいて、前記パ
ターンを認識する。

［実施例］第２図（ａ）は従来の文字認識装置の構成を示すブロッ
ク図、第２図（ｂ）は従来の文字認識装置の処理フロー
チャートである。

従来の文字認識装置は、人力部２１とＣＰＵ２２とＲＯ
Ｍ２３とＲＡＭ２４と認識辞書２５と出力部２６とを備
え、入力部２１より文書をイメージデータで人力すると
、ＣＰＵ２２によりＲＯＭ２３に格納された処理プログ
ラムに従って、ＲＡＭ２４をイメージデータの記憶及び
補助記憶として使いながら、文字の切り出し、正規化、
認識を行い、表示装置や記憶装置等の出力部２６より出
力する。

その動作を第２図（ｂ）のフローチャートに従って説明
する。ステップ５２００で人力部２１から入力文書デー
タが入力される。ここではスキャナで入力する。このス
キャナは入力文章をイメージデータに変換するが、一般
的にＣＣＤ等のセンサを使うと、イメージデータはアナ
ログ値を示す、該アナログ値を２値化（０，１のパター
ン）するのが、ステップ５２０１である。２値化された
イメージデータはイメージメモリのＲＡＭ２４に格納さ
れ、ステップ５２０２で文字の切り出しが行われる。

文字の切り出しを第３図の入力文書例に従って説明する
。イメージデータをＸ方向にスキャンして、Ｙ方向ヒス
トグラムを求める。これがＨＹＩＩであり、ライン毎に
発生するパルス波形毎に文字列の判別を行う。第３図で
は■〜■が文字列とみなされるやさらに文字列毎に分離
して、それぞれに対してＸ方向ヒストグラムをとる。

第３図では０列に関して示してあり、これが“ＨＸ”で
ある。これにより、１文字車位に文字が切り出される。

■〜のがその結果である。

該結果を文字毎に表わしたのが第４図に示される。第４
図に示されるようにＩ（Ｙ　％つまりＹ方向の幅はすべ
て同一の間隔であることがわかる。

一方、ＨＸに関しては文字の幅の大きさで変化する。つ
まり、４０２，４０３はほぼ文字外形によって切り出さ
れ、４０２はＨＹの中心に位置し、外形としては４０１
とほぼ同じになる。一方、４０４〜４０７に関し〔細長
のデータが作られる。

ステップ５２０３では切り出された第４図のようなデー
タに関して平滑化処理がなされる。特にここでは孤立画
像の除去（ノイズ除去）が中心である。ステップ５２０
４では短形図形の抽出が行われ、第５図に示されるよう
にする。ここでは、これをｆ（ｉ）とする。ステップ５
２０５ではステップ５２０４で抽出された短形図形に関
して、大きさの正規化をするための変倍率ｇがＦ　’／
ｆ（ｉ）により計算される。ただし、Ｆ′は特徴抽出さ
れる画像パターンの大きさである。つまり、第５図で求
められた図形が３２Ｘ３２の画素からなっていて、特徴
抽出されるべき画像パターンが６４Ｘ６４のときは、変
倍率ｇとして２が得られる。このｇから、Ｆ（１）（正
規化される最終の画像パターン）がｇ＊ｆ　（ｉ）によ
りステップ５２０６で作り出される。

ステップ５２０７ではこのパターンの特徴抽出が実行さ
れ、ステップ３２０８で認識辞書２５に基づいて識別処
理がなされ、ステップ５２０９で認識結果が出力部２６
に出力される。この場合、候補文字という形で複数個出
力することが多い。

第１図（ａ）は本発明の一実施例の文字認識装置のブロ
ック図であり、第１図（ｂ）は処理フローチャートであ
る。本実施例の文字認識装置は、入力部１１と、ＣＰＵ
１２、ＲＯＭ１３、ＲＡＭ１４、辞書１５ａ、辞書１５
ｂと出力部１６とを備えている。よって、入力部１１よ
り文書イメージデータを入力すると、ＣＰＵ１２により
ＲＯＭ１３に格納された処理プログラムに従って、ＲＡ
Ｍ１４にロードされたイメージデータより文字の切り出
し等の処理が実行される。該切り出された文字は、その
黒画素の量によって文字の特徴ベクトル空間の作成手順
を制御し、該手順に応じた辞書をアクセスして識別を行
い、結果を出力部１６に・ディスプレイする。

それらの動作を第１図（ｂ）の処理フローチャートに従
って説明する。ステップ５ｌｏｔ〜５１０４は、前述の
ステップ５２００〜３２０３と同一の処理を行う。ステ
ップ５１０７では、切り出し文字データの文字を形成す
る黒画素データをカウントする。つまり、上記データの
アドレスｆ　（ｘ、ｙ）をすべてアクセスし、ｆ　（ｘ
、ｙ）＝１のとき、和：ｓｕｍをカウントアツプしてい
く。

このように計算されたｓｕｎは、ステップ５１０８ａで
所定量ｎ、と比較する。つまり、Ｓｕｍの値は、切り出
された文字の複雑さに応じて変化する。つまり、特殊文
字“。”、“、”、：′″、“、″などは、ｓｕｍの値
が小さくなる。この特徴を利用することで、特殊文字で
あると判断できる。ｎ、に対応して、辞書１５ｂには特
殊文字のデータ及び簡単な文字のデータを格納しておく
。一方、辞書１５ａには文字データと、濃度に応じてｎ
ｌの上下に変化しそうな特殊文字とを格納して、誤認識
の軽減を図る。ここでは図示されていないが、ステップ
５１０８ａのｎ、値を複数設けることで、特殊文字、非
漢字（一部の漢字）、漢字データ等と分けることも可能
となる。つまり、黒画素データによる大分類を実行する
。

次にステップ５１０９．ステップ５１１３ではそれぞれ
の文字の大きさ９位置合わせなどの正規化を行い、ステ
ップ５１１０では該文字の６４次元の特徴ベクトル空間
を求める。つまり、ステップ５１１０へ行く文字につい
ては、より詳細なベクトル空間を算出する。

一方、ステップ５１１４では、文字の単純性からベクト
ル空間を１６次元として処理の高速性を得る。そして、
これらの結果よりステップ５１１２，１１６で、それぞ
れの辞書１５ａ。

１５ｂをアクセスして識別処理を実行後、ステップ５１
１７で結果を出力部１６に出力する。

第２の実施例として、黒画素の密度により辞書１５ａ、
１５ｂを分けた例を説明する。第１図（Ｃ）は第２の実
施例の処理フローチャートであり、第１図（ｂ）と同じ
部分は除いである。

ステップ５１０３の文字の切り出しステップ５１０４の
平滑化の後は、ステップ５１０５で上記切り出された文
字、つまり第５図で求められた文字エリアを算出し、こ
のデータによりステップ５１０６でｘ、ｙの平均値の算
出が行われ、ｘ×３／Ｘ１６（１６本／　ｍ　ｍのとき
）の結果を矩形領域の平均値ＡＶ、に代入する。ステッ
プ５１０７では、第５図で求められたデータより黒画素
データが求められる。その結果をＳｕｎ　（Ｊ）（ｊ＝
１、・・・ｋ：には文字の個数）とする。

ステップ５１０８ｂ”ｔ’５ｕｎ（ｊ）をＡＶ、で割り
、黒画素データの密度が算出される。そして、所定値ｎ
２と大小比較することで、ステップ５１１３に進むかス
テップ５１０９に進むかが決定される。つまり、ここで
文字形成画素データの少ない文字“。“、“、”、“；
“、“、”などは、ステップ５１１３に進むことになる
。以下は、辞書１５ａ、１５ｂの内容が変るだけで、第
１図（ｂ）と同様に、ステップＳｌ　１１．ステップ５
１１５では、それぞれの辞書１５ａ。

１５ｂをアクセスして識別処理がなされ、ステップＳｔ
ｔフで出力されることになる。

尚、特徴抽出のステップ３１１４．３１１０を処理フロ
ーチャートに従って変えることで、処理スピードの改善
が更に図れる。これは、ステップ５１０９に進む処理は
、密度が高いということで文字の複雑性が推定できるの
で、次元数を増やすことが必要であり、ステップ５１１
３側は次元数の低減を図る。

ここで、本発明で用いたベクトル空間について説明する
。第６図（ａ）が１６次元であり、第６図（ｂ）は６４
次元でもとめる方法である。

第６図（ａ）は、″。”に関する特徴抽出であり、上記
フローチャートではステップ５１１４で特徴抽出を行う
。この特徴抽出では、正規死後図示されるように４等分
に分けられる。それぞれの領域で→成分、／成分、ｉ成
分、＼成分により、データの輪郭線を追跡してベクトル
空間を求める。よって、ベクトル空間は、Ａ領域では（
ａｌ　ｔ　ａ’２　＋　　３　＋　８４　）％　Ｂ領域
では（ｂ＋　、ｂ２＋　　ｂ３．ｂ４）、ｃ、Ｄも同様
に４次元空間として求まり、トータルでは１６次元とな
る。第６図（ｂ）では、４Ｘ４Ｘ４で６４次元となる。

尚、第１図（ｂ）、（ｃ）のステップ５１０８ａ、ｂの判別を多段階設けることで、文字の複
雑性による大分類を達成することが容易となる。このと
き多数の辞書で辞書データを１つしかもっていないと、
データの濃度などで誤った辞書をアクセスする可能性が
あるので、データは複数の辞書にわたって格納する必要
がある。

本実施例では黒画素数を見たが、白画素によっても実現
できる。

［発明の効果コ本発明により、アクセスする辞書データを少なくし、更
に文字データに応じて特徴抽出を変えて、認識率の向上
と高速化を図った文字認識装置を提供できる。

【図面の簡単な説明】

第１図（ａ）は本実施例の文字認識装置のブロック図、第１図（ｂ）、（ｃ）は本実施例の文字認識装置の処理
フローチャート、第２図（ａ）は従来の文字認識装置のブロック図、第２図（ｂ）は従来の文字認識装置の処理フローチャー
ト、第３図は入力文書例を示す図、第４図は文字の切り出しを示す図、第５図は第４図の文字に対応する矩形図形を示す図、第６図（ａ）、（ｂ）はベクトル空間を説明する図であ
る。図中、１１・・・人力部、１２・・・ｃｐｕ、ｔ３・・
・ＲＯＭ、１４−ＲＡＭ、１５ａ、１５ｂ−辞書、１６
・・・出力部である。第１図（ａ）第１図（Ｃ）第２図（０）第６図（Ｇ）第６図（ｂ）

Claims

【特許請求の範囲】

（１）配列された文字を認識する文字認識装置において
、所定方向に配列されたパターンを分離する分離手段と、該分離手段により分離された前記パターンの濃度を検出
する濃度検出手段と、該濃度検出手段が検出した濃度に対応した辞書に基づい
て、前記パターンを認識する認識手段とを備えることを
特徴とする文字認識装置。
（２）濃度検出手段は、分離された矩形領域内のパター
ンを形成する画素数を数えることを特徴とする特許請求
の範囲第１項記載の文字認識装置。
（３）濃度検出手段は、分離された矩形領域内のパター
ンを形成する画素数を検出し、該画素数を前記矩形領域
の平均の大きさで割算したものを濃度とすることを特徴
とする特許請求の範囲第１項記載の文字認識装置。
（４）認識手段は、パターンの特徴を抽出する抽出手段
を備え、該抽出手段は濃度検出手段が検出した濃度に対
応して、特徴抽出を異ならしめることを特徴とする特許
請求の範囲第１項記載の文字認識装置。