JP2976445B2

JP2976445B2 - 文字認識装置

Info

Publication number: JP2976445B2
Application number: JP1189373A
Authority: JP
Inventors: 三喜男青木
Original assignee: Seiko Epson Corp
Current assignee: Seiko Epson Corp
Priority date: 1989-07-21
Filing date: 1989-07-21
Publication date: 1999-11-10
Anticipated expiration: 2014-11-10
Also published as: JPH0353393A

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は、紙面上に書かれた文字を画像として入力す
ることにより、文書画像から文字領域を抽出し、コード
番号に変換する文字認識装置に関する。

〔従来の技術〕

近年、文字認識装置の急激なる進歩により、様々な文
書画像から文字領域を自動的に抽出し、さらに一つ一つ
の文字を切り出し、認識し、自動的に文書ファイルが作
成できる様になってきており文字の認識方法には様々な
方法が考え出されている。

例えば、簡単な文字認識方法としては、文字の認識用
の辞書として文字そのものの辞書パターンを所有し、単
に抽出文字画像との一致度を比較する方法があるが、該
方法は、文字の位置ずれ、大きさの変動等に非常に弱く
ほとんど使用されていない。文字の位置ずれ、大きさの
変動等に影響されず、また簡単な方法として文字のメッ
シュ特徴やペリフェラル特徴を比較して認識する方法が
ある。該方法は、研究実用化報告第34巻第１号p.p.
47〜58に掲載されており、メッシュ特徴は、文字全体の
大まかな形状分布を表現したものである。特徴の抽出方
法は、文字の外接矩形を分割してｎ×ｎの小領域を求め
る。該各々の小領域に含まれる文字部の面積を計数しメ
ッシュ特徴とする。該メッシュ特徴は、一つの文字につ
きｎ×ｎコのデーターを持っており、ｎ×ｎコのうちの
ある領域における文字部の面積の割合を辞書として所有
しているデーターと比較することによって文字の推定を
行う。またペリフェラル特徴は、文字の周辺情報に着目
したものであり、特徴の抽出方法は、まず文字パターン
の外接矩形を求め、外接矩形の各辺をそれぞれｎ分割す
る。次に分割された各分割辺から文字に向かって走査し
ていき、最初に文字に出合うまでの面積、次に文字に出
合うまでの面積を計数する。各分割辺に対して同様の処
理を行うことにより、ｎ×４×２のデーターを持つペリ
フェラル特徴を得ることができ、該ｎ×４×２のデータ
ーと辞書として所有しているデーターとを比較すること
によって文字の推定が可能となる。以上の方法は、抽出
した文字の特徴を抽出し、該特徴と認識用の辞書データ
ーと比較して最も近いものを認識結果として出力してい
る。

〔発明が解決しようとする課題〕

しかしながら前記文字認識方法に代表される様に、今
まで開発されてきているほとんどの文字認識方法は、抽
出された文字の特徴を抽出し、該抽出データーと、辞書
として所有している文字の特徴データーとを比較し、辞
書中で最も近いものを該当文字として認識している。従
って、もし辞書中に正解が全く存在しない場合であって
も別の文字を認識結果として出力してしまう。

上記のことは、次の様なときにしばしば見られる。入
力文字画像の一文字一文字が完全に分離せず、どこかで
接触している場合、この場合、接触した結果、文字幅が
他と比べて十分に大きければ複数の文字が接触したもの
と判断できるが、もし例えばｗ等の通常の文字よりも少
し幅の広い文字と同程度の文字幅であった場合判断は非
常に難しく、誤まる可能性が非常に大きい。

そこで本発明は以上の課題を解決するもので、その目
的とするところは簡単なアルゴリズムで、隣同士の文字
が接触した様な文字画像、文字幅の一定でない文字画像
においても正確に文字を認識する文字認識装置を提供す
ることにある。

〔課題を解決するための手段〕

本発明の文字認識装置は、紙面等の反射光を光電変換
して文書画像を入力する光学的画像入力手段と、入力された前記文書画像から文字行及び単語の位置を
検出して単語領域を抽出する手段と、前記単語領域の文書画像から文字画像を抽出し、あら
かじめ所有している文字データー辞書との比較を行いな
がら文字コードに変換する文字認識を行い、認識結果を
出力する文字認識手段と、前記文字よりなる単語に対応した単語辞書データーと
を具備し、前記文字認識手段は、抽出された前記文字画像の文字
幅が、所定の文字画像の文字幅である場合は、一文字と
して認識して認識結果を決定するとともに、前記所定の
文字画像の文字幅より広い場合は、抽出された文字が一
文字である場合と二文字である場合の両方についての認
識結果をそれぞれ候補文字として二通りの単語候補を作
成し、作成された前記単語候補の一方が前記単語辞書デ
ーターに存在する場合には当該単語候補に応じた認識結
果を正しい認識結果として決定してなることを特徴とす
る。

また、本発明の文字認識装置は、紙面等の反射光を光
電変換して文書画像を入力する光学的画像入力手段と、入力された前記文書画像から文字行及び単語の位置を
検出して単語領域を抽出する手段と、前記単語領域の文書画像から文字画像を抽出し、あら
かじめ所有している文字データー辞書との比較を行いな
がら文字コードに変換する文字認識を行い、認識結果を
出力する文字認識手段と、前記文字よりなる単語に対応した単語辞書データーと
を具備し、前記文字認識手段は、抽出された前記文字画像の文字
幅が、所定の文字画像の文字幅である場合は、一文字と
して認識して認識結果を決定するとともに、前記所定の
文字画像の文字幅より広い場合は、抽出された文字が一
文字である場合と二文字である場合の両方についての認
識結果をそれぞれ候補文字として二通りの単語候補を作
成し、作成された前記単語候補の双方が前記単語辞書デ
ーターに存在する場合には、認識時の一致度の大きい前
記単語候補に応じた認識結果を正しい認識結果として決
定してなることを特徴とする。

また、本発明の文字認識装置は、紙面等の反射光を光
電変換して文書画像を入力する光学的画像入力手段と、入力された前記文書画像から文字行及び単語の位置を
検出して単語領域を抽出する手段と、前記単語領域の文書画像から文字画像を抽出し、あら
かじめ所有している文字データー辞書との比較を行いな
がら文字コードに変換する文字認識を行い、認識結果を
出力する文字認識手段と、前記文字よりなる単語に対応した単語辞書データーと
を具備し、前記文字認識手段は、抽出された前記文字画像の文字
幅が、所定の文字画像の文字幅である場合は、一文字と
して認識して認識結果を決定するとともに、前記所定の
文字画像の文字幅より広い場合は、抽出された文字が一
文字である場合と二文字である場合の両方についての認
識結果をそれぞれ候補文字として二通りの単語候補を作
成し、作成された前記単語候補の一方が前記単語辞書デ
ーターに存在する場合には当該単語候補に応じた認識結
果を正しい認識結果として決定し、かつ前記単語候補の
双方が前記単語辞書データーに存在する場合には、認識
時の一致度の大きい前記単語候補に応じた認識結果を正
しい認識結果として決定してなることを特徴とする。

〔実施例〕

以下本発明について実施例に基づいて詳細に説明す
る。

本発明の文字認識装置のブロック図を第１図に示す。
文字認識装置は、プログラムに従って処理を実行するCP
U101、文字画像を記憶装置に入力する画像入力装置10
2、文字認識結果を表示する文字表示手段103、認識用の
文字データー、単語辞書の納まっているROM104、文字画
像を記憶する記憶装置であるRAM105より構成されてい
る。

以下、本発明の文字認識装置の文字認識の方法を第４
図に示すフローチャートに基づいて、第２図、第３図を
用いて詳細に説明する。本発明の文字認識装置はまず初
めに画像入力装置102において光学的な方法により紙面
等に書かれた文字をイメージデーターとして記憶装置で
あるRAM105に入力する。次に入力した文字画像から単語
領域の抽出を行う。単語領域の抽出は、まず入力文字画
像の行方向の周辺分布を計数する。該周辺分布（図示せ
ず）は、文字行の存在する位置で値が大きくなり、文字
行と文字行との間は周辺分布の値が小さい。従って、該
周辺分布の値により文字行の位置を容易に推定すること
が可能である。文字行の位置を推定すると次に推定文字
行の行方向と垂直な方向の周辺分布を計数する。該周辺
分布（図示せず）の値の大きいところは文字の存在して
いる領域であり、小さいところは文字の存在していない
領域である。従って、文字の存在していない領域を調べ
ることにより、単語間隔と文字間隔の大きさが推定で
き、単語領域が抽出できる。

単語領域が抽出されると次は、抽出した単語内の一文
字一文字の文字を抽出しながら認識を行う。文字の認識
は、一文字一文字の文字を抽出した後にROM104に納まっ
ている文字データー辞書と比較する。ROM104中の文字デ
ーター辞書と抽出文字とを比較して、最も一致している
文字データーが抽出文字の認識結果となる。こうして各
文字について認識を一通り行うと、入力文字画像中の単
語の認識が終了する。従来の方法では、この時点で認識
を終了し認識結果を出力する。ところが、入力画像の中
には、一文字一文字の文字が全て離れているとは限ら
ず、第２図201に示したrecognizeのｎとｉの様に接触し
た文字画像も存在する。通常、隣接する文字画像が接触
した場合、その文字幅より複数文字が連結したものと判
断できる。しかしながら、第２図201のniの様な場合、
連結した文字の大きさは、文字ｍや文字ｗと同程度の大
きさとなり文字の大きさからは一文字なのか二文字なの
か判断できない。従来の方法においては、この場合、ｍ
やｗと同程度の大きさであるため複数文字であるとの疑
いは全く持たず一文字として認識してしまう。その結果
niをｍと認識してそのまま出力してしまい誤認識となっ
てしまう。

ところが本発明の場合、第２図及び第３図に示す様に
なる。入力画像201から一文字一文字の文字幅をチェッ
クしながら認識をすると、recogと通常の認識方法で認
識できる。しかしながら次の文字を抽出すると抽出文字
画像の文字幅が通常の文字画像の文字幅に比べて広い。
該文字幅は、複数文字と判断できるほどの文字幅でもな
い。この場合、本発明においては、抽出文字が一文字で
ある場合と二文字である場合の両方の場合について認識
を行う。その結果、一文字である場合には、m203が認識
結果となり、二文字である場合にはni204が認識結果と
なる。また、認識単語には、二通りの認識結果があると
いう意味で?203を記録する。こうして全文字について一
通り認識を行うと、第２図202に示すrecog?zeを得る。
次に文字を決定するために?203に候補文字m203及びni20
4を置き換えて単語205及び206を作成する。該単語205と
206のどちらの単語が正しいかは、第３図に示す様にROM
104中に納まっている単語辞書データと比較して決定す
る。まず認識結果301recogmzeが単語辞書データー303内
に存在するかどうかを調べる。通常の辞書検索方法によ
り単語を検索していくと、reclineまでくる。次にrecog
mzeが存在している可能性があるが実際に辞書303には、
reclineの次はrecognitionという単語となり、単語301r
ecogmzeは存在しないという結果を得る。同様に、単語3
02recognizeについて単語辞書データー303を検索する
と、単語recognizableの次に単語recognizeが存在し、
単語302は正しいという結果を得る。これにより、文字
画像201の６番目の文字はniという２文字であることが
判断でき、これを出力することにより正しい認識結果が
得られる。

また、一文字として認識した場合、二文字として認識
した場合の両方の場合において該当単語が単語辞書デー
ター中に存在した場合においては、文字認識時において
文字データーと比較した時の一致度の高い方の文字を認
識結果とする。こうすることにより、文字認識装置の信
頼性を少しでも高くすることができる。

以上述べた様に、入力文字画像内に隣接する文字が接
触して、一文字か二文字かの判断ができない場合、一文
字で認識した場合と、二文字で認識した場合の両方の場
合において文字を認識し、認識結果出力前に単語辞書デ
ーターと比較して該当単語を出力するので、今まで二文
字なのに誤って一文字として認識したり、あるいは逆に
一文字なのに誤って二文字として認識した様な誤りは無
くなる。よって該方法を構成要素に用いる文字認識装置
の信頼性を大幅に向上させることが可能となった。

〔発明の効果〕

以上述べた様に本発明は、文字認識時において認識途
中で抽出文字の文字幅が微妙で一文字か二文字かの判断
が不可能な場合には、両方の場合において文字を認識
し、一通り認識が終了したところで単語辞書データーと
比較して文字の決定を行うので、今まで二文字なのに誤
って一文字として認識したり、あるいは逆に一文字なの
に二文字として認識した様な誤りは全く無くなる。その
結果、今まで以上に文字の認識率を向上させ、また、文
字認識装置の信頼性を多いに向上させるという効果を有
する。

【図面の簡単な説明】

第１図は本発明の文字認識装置のブロック図。第２図、第３図に本発明の文字認識の様子を示す図。 201……入力画像 202……単語認識結果 203,204……候補文字 205,206……候補単語 301,302……候補単語 303……単語辞書第４図は本発明の文字認識装置のフローチャートを示す
図。

───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.⁶，ＤＢ名) G06K 9/72 G06K 9/62

Claims

(57)【特許請求の範囲】

【請求項１】紙面等の反射光を光電変換して文書画像を
入力する光学的画像入力手段と、入力された前記文書画像から文字行及び単語の位置を検
出して単語領域を抽出する手段と、前記単語領域の文書画像から文字画像を抽出し、あらか
じめ所有している文字データー辞書との比較を行いなが
ら文字コードに変換する文字認識を行い、認識結果を出
力する文字認識手段と、前記文字よりなる単語に対応した単語辞書データーとを
具備し、前記文字認識手段は、抽出された前記文字画像の文字幅
が、所定の文字画像の文字幅である場合は、一文字とし
て認識して認識結果を決定するとともに、前記所定の文
字画像の文字幅より広い場合は、抽出された文字が一文
字である場合と二文字である場合の両方についての認識
結果をそれぞれ候補文字として二通りの単語候補を作成
し、作成された前記単語候補の一方が前記単語辞書デー
ターに存在する場合には当該単語候補に応じた認識結果
を正しい認識結果として決定してなることを特徴とする
文字認識装置。
【請求項２】紙面等の反射光を光電変換して文書画像を
入力する光学的画像入力手段と、入力された前記文書画像から文字行及び単語の位置を検
出して単語領域を抽出する手段と、前記単語領域の文書画像から文字画像を抽出し、あらか
じめ所有している文字データー辞書との比較を行いなが
ら文字コードに変換する文字認識を行い、認識結果を出
力する文字認識手段と、前記文字よりなる単語に対応した単語辞書データーとを
具備し、前記文字認識手段は、抽出された前記文字画像の文字幅
が、所定の文字画像の文字幅である場合は、一文字とし
て認識して認識結果を決定するとともに、前記所定の文
字画像の文字幅より広い場合は、抽出された文字が一文
字である場合と二文字である場合の両方についての認識
結果をそれぞれ候補文字として二通りの単語候補を作成
し、作成された前記単語候補の双方が前記単語辞書デー
ターに存在する場合には、認識時の一致度の大きい前記
単語候補に応じた認識結果を正しい認識結果として決定
してなることを特徴とする文字認識装置。
【請求項３】紙面等の反射光を光電変換して文書画像を
入力する光学的画像入力手段と、入力された前記文書画像から文字行及び単語の位置を検
出して単語領域を抽出する手段と、前記単語領域の文書画像から文字画像を抽出し、あらか
じめ所有している文字データー辞書との比較を行いなが
ら文字コードに変換する文字認識を行い、認識結果を出
力する文字認識手段と、前記文字よりなる単語に対応した単語辞書データーとを
具備し、前記文字認識手段は、抽出された前記文字画像の文字幅
が、所定の文字画像の文字幅である場合は、一文字とし
て認識して認識結果を決定するとともに、前記所定の文
字画像の文字幅より広い場合は、抽出された文字が一文
字である場合と二文字である場合の両方についての認識
結果をそれぞれ候補文字として二通りの単語候補を作成
し、作成された前記単語候補の一方が前記単語辞書デー
ターに存在する場合には当該単語候補に応じた認識結果
を正しい認識結果として決定し、かつ前記単語候補の双
方が前記単語辞書データーに存在する場合には、認識時
の一致度の大きい前記単語候補に応じた認識結果を正し
い認識結果として決定してなることを特徴とする文字認
識装置。