JP3428504B2

JP3428504B2 - 文字認識装置

Info

Publication number: JP3428504B2
Application number: JP17182499A
Authority: JP
Inventors: 裕一中谷
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1999-06-18
Filing date: 1999-06-18
Publication date: 2003-07-22
Anticipated expiration: 2019-06-18
Also published as: JP2001005913A

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、画像情報として入
力された文字又は文字列画像から文字又は文字列を自動
認識する文字認識装置に関する。

【０００２】

【従来の技術】用紙等に印刷された単語等の文字情報を
光学的に読み取り画像情報として入力された単語画像情
報から単語を自動認識し文字コード情報等に自動変換す
る方法として、従来、認識対象とする単語画像情報（文
字又は文字列情報）全体を、１つの画像単位として、辞
書に予め登録しておき、入力された単語画像と、辞書の
画像情報を比較照合することで、単語認識が行われてい
た。

【０００３】この従来の方法は、入力単語画像中から文
字を切り出す必要がないため、処理速度は、単語の文字
長とは無関係とされ、単語認識処理の高速化が可能であ
るほか、隣接文字間に接触等が生じ、文字を切り出すこ
とが困難とされている単語画像の認識も行うことができ
るという利点を有している。

【０００４】この従来の方法の詳細については、例えば
文献（TinKam Ho,Jonathan J.Hull and Sargur N.
srihari, "A word shape analysis approach to l
exicon based word recognition",PRL 13(1992)pp.
821-826）等の記載が参照される。上記文献に記載され
た単語認識システムは、画像入力手段から入力された英
単語画像情報を入力とし、表記された英単語を自動認識
して出力するものであり、入力画像から特徴量を抽出す
る特徴抽出手段と、認識対象となる英単語画像の特徴量
を予め登録しておくための辞書を構成する記憶装置と、
入力画像から抽出された特徴量と辞書の内容とを照合す
る照合手段と、を備えている。照合手段は、入力画像か
ら抽出された特徴量と、辞書に登録された画像の特徴量
とを比較し、比較の結果、特徴量の近い英単語を出力す
る。

【０００５】図１４を参照して、その概略を説明する。
図１４において、符号５１０は入力画像、符号５１４は
辞書（不図示）に登録された単語画像（「辞書画像」と
いう）を示している。例えば、入力画像５１０を辞書画
像５１４と照合する場合、入力画像の４隅、すなわち５
０１、５０２、５０３、５０４と、辞書画像の４隅、す
なわち５０５、５０６、５０７、５０８とが一致するよ
うに、入力画像５１０を相似変換してから、両者を照合
する。

【０００６】

【発明が解決しようとする課題】しかしながら、上記し
た従来の手法は、下記記載の問題点を有している。

【０００７】第１の問題点は、単語全体を１つの画像単
位として認識を行うため、単語内での文字の位置の変動
があると認識精度が低下する、ということである。より
詳細には、例えば英文字では、文字の横幅がフォントと
カテゴリによって大きく変動するため、単語内での各文
字の位置も様々に変動する。このため、単語内での文字
の位置の変動があると、入力画像から抽出された特徴の
位置と、記憶装置に登録されている辞書画像の特徴の位
置との間に、大きなずれが生じることになる。これによ
り認識精度が低下してしまう。

【０００８】第２の問題点は、上記第１の問題点の解決
を図るために、入力単語画像と辞書の情報との照合の際
に、網羅的な位置合わせを行う場合、演算量が増大し、
処理時間が長大化する、ということである。

【０００９】したがって、本発明は、上記問題点に鑑み
てなされたものであって、その目的は、文字の位置変動
に対して安定且つ高い認識精度を保つとともに、高速処
理可能な文字認識装置を提供することにある。

【００１０】

【課題を解決するための手段】前記目的を達成する本発
明は、入力単語画像中の区切り図形を検出する区切り図
形抽出手段と、前記入力単語画像を前記区切り図形で区
切られた区間に分割する区切り図形照合手段と、前記区
切り図形照合手段で行われた分割を利用して、前記入力
単語画像を辞書記憶手段に予め記憶されている単語画像
テンプレートと照合する画像照合手段と、を備える。

【００１１】本発明においては、前記区切り図形抽出手
段は、単語画像の黒画素数を列毎にカウントして、縦線
を検出する手段と、前記縦線の周囲の画像を抜き出し、
予め用意された区切り図形を含む画像及び含まない画像
との照合を行う手段と、を備える。

【００１２】また本発明において、前記画像照合手段
は、網羅的な位置合わせによる画像照合を行う際に、前
記区切り図形照合手段において行われた分割を制約条件
として付与する手段を備える。

【００１３】さらに本発明においては、入力単語画像中
の区切り図形を検出する区切り図形抽出手段と、入力単
語画像を区切り図形で区切られた区間に分割する区切り
図形照合手段と、前記区切り図形照合手段で行われた分
割を利用して前記入力単語画像の区間単位に辞書記憶手
段に予め記憶された単語画像テンプレートと照合する画
像照合手段と、前記画像照合手段の照合結果に基づき分
割をやり直す分割制御手段と、を備える。

【００１４】

【発明の実施の形態】本発明の実施の形態について説明
する。本発明は、単語画像内の区切り図形により区間分
けを行ってから各区間毎に辞書との照合を行う。より詳
細には、本発明は、その好ましい実施の形態において、
画像入力手段から入力された単語画像に対して、２値
化、正規化等など所定の前処理を行い前処理済みの画像
（「前処理後画像」という）を出力する前処理手段（図
１の２１）と、前処理後画像から区切り図形を抽出する
区切り図形抽出手段（図１の２２）と、抽出された区切
り図形の位置及び種類を単語画像記憶部（図１の３１）
に予め登録された区切り図形の位置及び種類と照合し、
前処理後画像の分割を行う区切り図形照合手段（図１の
２３）と、該区切り図形照合手段によって分割された前
処理後画像と、該単語画像記憶部に予め登録された単語
画像との間で対応する区間毎に画像照合を行う画像照合
手段（図１の２４）とを有する。

【００１５】本発明は、別の実施の形態において、前処
理後画像と単語画像記憶部に予め登録された単語画像と
の間で網羅的な位置あわせによる照合を行うものであ
り、区切り図形照合手段（図７の２３）によって行われ
た分割を制約条件として利用することにより、網羅的な
位置あわせによる照合を、制約条件が無い場合に比べ少
ない計算量で実現する第２の画像照合手段２（図７の５
４）を有する。

【００１６】本発明は、さらに別の実施の形態におい
て、画像照合手段（図１１の２４）での前処理画像の各
部分画像毎の照合結果から、区切り図形照合手段（図１
１の２３）における分割が適切か否か判定し、不適な分
割箇所が存在する場合、区切り図形照合手段で分割を変
更し、画像照合手段（図１１の２４）に再び画像照合を
行わせるように制御する分割制御手段（図１１の６６）
を備える。

【００１７】また本発明は、その好ましい一実施の形態
において、画像入力手段から入力された文字又は文字列
を含む単語画像情報から該文字又は文字列を自動認識す
る処理を実行するコンピュータにおいて、（ａ）前記入
力された単語画像情報に対して、２値化、正規化等の所
定の前処理を施した前処理後画像情報を出力する前処理
処理と、（ｂ）前記前処理後画像情報中に予め定められ
た区切り図形があるか否かを調べ前記区切り図形を抽出
する区切り図形抽出処理と、（ｃ）前記抽出された区切
り図形の位置及び種類を、記憶手段に予め登録された区
切り図形の位置及び種類と照合し、該照合結果に基づ
き、前記前処理後画像情報を複数の部分画像に分割する
区切り図形照合処理と、（ｄ）前記区分された前処理後
画像情報の部分画像と、記憶手段に予め登録されたテン
プレート単語画像との間で対応する部分画像毎に画像の
照合を行う画像照合処理と、を備え、前記（ａ）乃至
（ｄ）の各処理は、前記コンピュータで実行させるプロ
グラムで実現される。

【００１８】また、前記画像照合処理（ｄ）において、
前記複数の部分画像について、前記処理（ｃ）での前記
入力単語画像の分割を制約条件として、前処理後画像情
報と記憶手段に予め登録された単語画像との間で網羅的
な位置あわせによる照合を行うようにしてもよい。

【００１９】さらに、別の処理（ｅ）として、前記画像
照合処理（ｄ）での前記前処理後画像の各部分画像毎の
照合結果から、前記前記分割が適切か否か判定し不適な
分割箇所が存在する場合、分割の内容を変更し、変更後
の分割に対応する部分画像について、前記処理（ｄ）で
再び画像照合を行わせる分割制御処理を備えてもよい。

【００２０】上記した（ａ）乃至（ｅ）の処理をコンピ
ュータ上で実行させるためのプログラムを記録した記録
媒体から該プログラムを読み出すか、もしくは通信媒体
から該プログラムを読み出して該コンピュータで実行す
ることで本発明を実施することができる。

【００２１】

【実施例】上記した本発明の実施の形態についてさらに
詳細に説明すべく、本発明の実施例について図面を参照
して詳細に説明する。

【００２２】図１は、本発明の第１の実施例の構成を示
す図である。図１を参照すると、本発明の第１の実施例
の単語認識システムは、単語画像を入力する入力装置１
と、プログラム制御により動作するデータ処理装置２
と、情報を記憶する記憶装置３と、出力装置４と、を含
む。

【００２３】記憶装置３は、単語画像記憶部３１を備え
ている。単語画像記憶部３１は、認識対象とする全ての
単語に対して、その単語を構成する文字の綴りと、単語
画像と、単語画像内に含まれる区切り図形の位置及び種
類と、単語画像をそこに含まれる区切り図形で分割した
結果得られた部分画像と、を１組とするテンプレートを
予め記憶している。各テンプレートには、識別用にテン
プレート番号が割り付けられている。

【００２４】区切り図形としては、例えば図２に６１、
６２、６３として示すように、縦棒に横棒がくっついた
図形（「区切り図形１」という）や、図２に６４、６５
として示すように、小文字のデセンダがあげられる。こ
こで、説明のため全ての画像には、図５に示すように、
座標系（ｘｙ座標）が設定されているものとする。また
図５に５６０で示す破線は、画像の最小包含長方形を表
している。

【００２５】ここで、図６の５１６の画像の中から、図
６の５１７、５１８、５１９の３つの区切り図形が抽出
されたものとし、この区切り図形のｘ座標を例えば縦棒
の重心のｘ座標として定める。そして、この座標が、左
から順に、１０、１００、６００であったとする。

【００２６】元の画像５１６を、ｘ方向に垂直に、この
３つのｘ座標で分割すると、元の画像５１６は、ｘ座標
が０から１０（図６の５５０）、１０から１００（図６
の５５１）、１００から６００（図６の５５２）、６０
０から１０００（図６の５５３）である４つの部分画像
に分割される。

【００２７】このようにして、部分画像を得ることを、
元の画像５１６を、区切り図形５１７、５１８、５１９
で分割するといい、得られた部分画像には、左から順に
１、２、３、４と番号を割り振る。

【００２８】図１を参照すると、データ処理装置２は、
前処理手段２１と、区切り図形抽出手段２２と、区切り
図形照合手段２３と、画像照合手段２４とを備える。

【００２９】前処理手段２１は、入力装置１から与えら
れた単語画像に対して、２値化処理、正規化処理等の前
処理を行い、前処理後画像として出力する。

【００３０】区切り図形抽出手段２２は、前処理手段２
１が出力した前処理後画像の中から、前処理後画像の区
間分けに用いる区切り図形を抽出し、その位置と種類と
を出力する。

【００３１】区切り図形照合手段２３は、区切り図形抽
出手段２２により抽出された区切り図形の位置及び種類
を、単語画像記憶部３１に予め登録されている区切り図
形の位置及び種類と登録全単語にわたって照合する。照
合に成功した場合、前処理後画像の分割を行い、テンプ
レート番号と得られた部分画像と出力する。

【００３２】画像照合手段２４は、区切り図形照合手段
２３により出力された全てのテンプレート番号につい
て、テンプレート番号に対応するテンプレート内の部分
画像を、区切り図形照合手段２３により出力された対応
する部分画像とを画像照合する。２つの画像間で画像照
合を行う方法は、公知の各種方法が用いられる。例え
ば、前述の文献（Tin Kam Ho, Jonathan J.Hull a
nd Sargur N.srihari, "Aword shape analysis app
roach to lexicon based word recognition",PRL 1
3(1992)pp.821-826）に記載された方法が用いられる。

【００３３】図３は、本発明の第１の実施例の処理手順
を説明するための流れ図である。図１及び図３を参照し
て、本発明の第１の実施例の動作について詳細に説明す
る。

【００３４】入力装置１から与えられた単語画像は、前
処理手段２１に供給される。

【００３５】前処理手段２１は、２値化（画素値を２値
に変換する）、大きさの正規化（画像の縦横の比率を一
定にする）などの処理を行い、前処理後画像を生成する
（図３のステップＡ１）。なお、２値化については画素
値をしきい値と比較して１、０信号に変換する等、公知
の各種方法が用いられる。

【００３６】区切り図形抽出手段２２は、前処理後画像
の中から区切り図形を抽出する（ステップＡ２）。区切
り図形の抽出方法は、区切り図形の種類に対応して用い
る。例えば図２に符号６４、６５で示した区切り図形は
「デセンダ」と呼ばれるものであり、公知の方法で抽出
される。例えば、まず単語画像のベースラインを検出
し、輪郭線の極小点のうちベースラインよりも下にある
ものをデセンダとすることができる。

【００３７】このようにして、区切り図形抽出手段２２
は、前処理後画像の中に含まれる区切り図形の種類と位
置を抽出する。

【００３８】また図２に符号６１、６２、６３で示すよ
うな図形（「区切り図形１」という）は、例えば、次の
ようにして抽出することができる。

【００３９】以下では、図６の画像５１６から区切り図
形１を抽出する場合について説明する。

【００４０】まず画像５１６の中から縦棒を検出する。
縦棒の検出方法としては、例えば、黒画素（２値化され
た画素のうち黒とされた画素）をｘ軸上に投影し、投影
された黒画素をカウントしてヒストグラムを作成したの
ち、ヒストグラムのピークを探す。更に、探索されたピ
ークのうちヒストグラムの値が閾値以上のもののみを選
ぶ。そして選ばれたピークに対応するｘ座標を、縦棒の
存在する位置として出力する。

【００４１】このようにして、図６の５１７、５１８、
５１９、及び図６の５２８から５３１までの縦棒が検出
できる。

【００４２】次に、検出された縦棒をそれぞれ中心とす
る部分画像と、予め用意したおいたテンプレートと画像
照合を行うことにより、部分画像に区切り図形１が存在
するか否かを判定する。画像照合で用いるテンプレート
は、２カテゴリ分用意する。その１つは、区切り図形１
を含むもの（例えば図６の５４０）であり、他の１つ
は、区切り図形１を含まないもの（例えば図６の５４
１、５４２）である。

【００４３】そして、これら２カテゴリの認識問題とし
て、区切り図形１を抽出することができる。また２つの
カテゴリに対する相違度も算出しておくものとする。

【００４４】例えば、図６の５１７、５１８、５１９
は、区切り図形１を含むテンプレートに近いので、区切
り図形１であると判定し、図６の５２８から５３１は区
切り図形１は含まないテンプレートに近いので、区切り
図形１ではないと判定する。

【００４５】近さの基準については、例えば、各々のカ
テゴリに対する相違度が小さいほど近いとすればよい。

【００４６】本発明の第１の実施例において、区切り図
形抽出は、文字を切り出すことなく行うことができる。
また処理時間の点からみても、認識対象となるカテゴリ
が２つしかないことから、単語認識システムで行われる
単語照合における認識対象カテゴリ（＝単語語彙数）と
比べると小さいため、大きなオーバーヘッドとはならな
い。

【００４７】区切り図形照合手段２３は、区切り図形抽
出手段２２によって抽出された区切り図形の種類及び位
置を、単語画像記憶部３１（単語辞書）内の１つのテン
プレートの図形の種類及び位置と照合する（ステップＡ
３）。

【００４８】例えば、前処理後画像が、図６に５１６と
して示すものであるとする。そして、この前処理後画像
５１６から抽出される区切り図形は、図６の５１７、５
１８、５１９の３つとする。そして、その種類はいずれ
も区切り図形１で、ｘ座標が左から１０、１００、６０
０であるものとする。

【００４９】一方、単語画像記憶部３１には、図４の画
像５２１が単語画像としてテンプレートに登録されてお
り、また図４の画像５２１に含まれる区切り図形とし
て、図４の５２５、５２６、５２７の３つが、その種類
（３つとも区切り図形１）と位置（左からｘ座標が２
０、１５０、８００）と共に登録されているものとす
る。

【００５０】このとき、照合成功の条件としては様々な
ものが用いられるが、例えば、前処理後画像から得られ
た区切り図形の数と種類が、テンプレートに登録された
区切り図形と同一のとき、照合に成功したものとするこ
とができる（ステップＡ４）。照合に失敗すればステッ
プＡ６へすすむ。

【００５１】画像照合手段２４では、前処理後画像とテ
ンプレートに登録された単語画像との間で画像照合を行
う（ステップＡ５）。

【００５２】本発明の第１の実施例においては、図６の
前処理後画像５１６と、図４のテンプレート画像５２１
とを照合するのではなく、前処理画像５１６の部分画像
１とテンプレート画像５２１の部分画像１、前処理画像
５１６の部分画像２とテンプレート画像５２１の部分画
像２、というように、前処理画像とテンプレート画像の
対応する部分画像毎の照合を行う。

【００５３】ここで、前処理画像５１６の部分画像１と
は、前処理画像５１６のうちｘ座標が０から１０の部分
を抜き出した画像のことであり、テンプレート画像５２
１の部分画像１とは、テンプレート画像５２１のうちｘ
座標が０から２０の部分を抜き出した画像のことであ
る。

【００５４】これら２つの画像は、縦横比が異なるの
で、縦横比を合わせてから、照合を行い、相違度を求め
る。

【００５５】相違度の算出を全ての部分画像に対して行
い、各部分画像の相違度から、画像全体の相違度を求め
る。例えば、部分画像の相違度を算術平均することによ
って求めることができる。

【００５６】そして、単語画像記憶部内のテンプレート
の数だけステップＡ３からＡ５の処理を繰り返し（ステ
ップＡ６）、すべてのテンプレートに対して処理が終了
したら結果を出力して終了する（ステップＡ７）。

【００５７】次に、本発明の第１の実施例の作用効果に
ついて説明する。

【００５８】本発明の第１の実施例では、単語画像から
文字を切り出すことなく、単語認識を行うことができる
ので、単語認識の速度は単語の長さと関係無く高速で、
文字切り出しの難しい単語画像も認識することができ
る。

【００５９】比較のため従来の方法について説明する
と、例えば図１４を参照すると、前処理後画像５１０
を、テンプレート画像５１４と縦横比を合わせて画像照
合していたため、左端（図１４の５１２）と右端（図１
４の５１３）は一致しても、単語画像の内部では、例え
ば図１４の５１１に示す「Ｉ」の字のように、位置がず
れて精度が低下する場合がある。

【００６０】本発明の第１の実施例では、画像５１０と
画像５１４の区切り図形を利用して、画像５１０と画像
５１４の代わりに、図４の画像５２０と図４の画像５２
１とを画像照合するため、位置ずれによる認識精度の低
下を低減することができる。

【００６１】次に、本発明の第２の実施例について説明
する。図７は、本発明の第２の実施例の構成を示す図で
ある。図７を参照すると、本発明の第２の実施例は、図
１に示した前記第１の実施例のデータ処理装置２におい
て、画像照合手段２４が、第２の画像照合手段５４で置
き換えたものである。

【００６２】第２の画像照合手段５４は、区切り図形照
合手段２３により出力された全てのテンプレート番号に
ついて、テンプレート番号に対応するテンプレート内の
単語画像と、前処理後画像との間で網羅的な位置合わせ
による照合を行う。

【００６３】図８は、本発明の第２の実施例の処理手順
を示す流れ図である。図７及び図８を参照して、本発明
の第２の実施例の動作について詳細に説明する。図８に
おいて、ステップＡ１〜Ａ７の各処理は、図３のステッ
プＡ１〜Ａ７の各処理と同一であり、ステップＡ４の判
定の結果、ステップＢ５が実行される点が相違してい
る。すなわち、図８のステップＢ５で示される図７の第
２の画像照合手段５４の動作以外は、前記第１の実施例
における各手段２１、２２、２３の動作と同一のため、
説明は省略する。

【００６４】前記第１の実施例における画像照合手段２
４では、前処理後画像と、テンプレート内の部分画像と
を、区切り図形照合手段２３によって得られた部分画像
毎に照合していた。しかしながら、区切り図形の位置検
出に誤差があったり、図９に、入力後画像５７０と、テ
ンプレート画像５２１として示すように、区切り図形の
位置を合わせてもなお、図９の５７３に示される「LとS
の境目」のように位置ずれが残る場合もある。

【００６５】第２の画像照合手段５４は、このような位
置ずれを網羅的な位置合わせによる照合を行うことで吸
収する。以下に詳説する。

【００６６】座標(x,y)における図９の画像５７０の画
素値をP1(x,y)、画像５２１の画素値をP2（x,y)とす
る。画像５７０と画像５２１の照合を行うにあたって、
まず画像５７０のうちｘ座標がｘ１である１列と、画像
５２１のうちｘ座標がｘ２である１列の相違度f(x1，x
2)を次式（１）で定義する。

【００６７】 f(x1,x2)=sum(0,1000,|P1(x1,i)-P2(x2,i)|) …(1)

【００６８】ここで、sum(p1,p2,p3(i))は、ｐ１以上ｐ
２以下の全ての整数ｉに対するｐ３（ｉ）の値の総和を
表わしている。|P1(x1,i)-P2(x2,i)|は、P1(x1,i)とP2
(x2,i)の距離である。

【００６９】次に、画像５７０のｘ座標が０以上ｘ１以
下の部分と、画像５２１のｘ座標が０以上ｘ２以下の部
分との相違度ｇ(x1,x2)を次式（２）で定義する。

【００７０】 g(x1,x2)=min(g(x1-1,x2-1)+f(x1,x2),g(x1,x2-1)+f(x1,x2),g(x1-1,x2)+f(x1 ,x2)) …(2) ただし、x1≦0またはx2≦0のときは、g(x1,x2)=0であ
る。

【００７１】すると、g(1000,1000)が、画像５７０と画
像５２１の相違度となる。

【００７２】ここまでは網羅的な位置合わせによる照合
と同じである。この場合は、図１０において、(0,0)、
(1000,0)、(1000,1000)、(0,1000)の４つの点からなる
四角形の内側にあるすべての座標に対してg(x1,x2)を計
算する必要がある。

【００７３】本実施例では、区切り図形照合手段２３に
よって照合された区切り図形の位置を利用して、この計
算を高速化する。

【００７４】例えば、区切り図形照合手段２３によっ
て、画像５７０と画像５２１の間で３つの区切り図形が
共通して存在し、そのｘ座標が画像５７０においては、 C(1),C(2),C(3)、画像５２１においては、 D(1),D(2),D(3) と出力されたとする。

【００７５】このとき、g(x1,x2)に対し、閉区間[0,max
(D(i)-M,0)]、及び、[min(D(i)+M,1000),1000]内の全て
の整数ｙに対し、 g(C(i),y)=+∞(i=1,2,3)、という制約条件を付け加える。

【００７６】ここでＭは、区切り図形の位置の検出誤差
を許容するためのマージンであり、例えばＭ=5とするこ
とができる。

【００７７】この制約条件を付け加えることで、g(x1,x
2)を計算する必要がある座標を、図１０の領域５６０に
制限することができる。

【００７８】本発明の第２の実施例の作用効果について
説明する。

【００７９】本発明の第２の実施例では、入力画像と辞
書画像との間で、網羅的な位置合わせによる照合を行う
ため、位置ずれに対応することができ、かつ、共通して
存在する区切り図形を利用して照合範囲に制約条件を付
け加えているため、そのような制約条件がない場合とく
らべて、高速に実行することができる。

【００８０】次に、本発明の第３の実施例について説明
する。図１１は、本発明の第３の実施例の構成を示す図
である。図１１を参照すると、本発明の第３の実施例
は、図１に示した前記第１の実施例と比べ、データ処理
装置２の構成に加えて、分割制御手段６６を備えてい
る。

【００８１】分割制御手段６６は、画像照合手段２４に
よる各部分画像毎の照合結果から、区切り図形照合手段
２３において過分割（過度な分割）が行われている可能
性のある個所を検出し、分割を変更して画像照合手段２
４に再び画像照合を行わせる。

【００８２】図１２は、本発明の第３の実施例の処理手
順を示す流れ図である。図１１及び図１２を参照して、
本発明の第３の実施例の動作について詳細に説明する。
図１１において、ステップＡ１〜Ａ７の各処理は、図３
のステップＡ１〜Ａ７の各処理と同一である。ステップ
Ｃ８、Ｃ９で示される、図１２の分割制御手段６６の動
作以外は、前記第１の実施例における各手段２１、２
２、２３の動作と同一のため、説明は省略する。

【００８３】分割制御手段６６は、画像照合手段２４に
よって出力された画像全体に対する相違度のうち最も小
さいものが予め定められたしきい値よりも大きい場合、
画像の分割を変更する（ステップＣ８）。

【００８４】例えば、図１３の前処理後５７０に対し、
区切り図形５７１、５７２、５７３、５７４が抽出され
ていたとする。このうち、区切り図形５７３は、ノイズ
の影響等により、誤って区切り図形として抽出されてし
まったものである。

【００８５】画像の分割を変更する場合、まず、区切り
図形抽出手段２２によって抽出された区切り図形のう
ち、区切り図形を含む画像への相違度が最も大きな区切
り図形を選び、区切り図形抽出手段２２によって抽出さ
れた区切り図形の中からそれを取り除き、ステップＡ３
へすすむ（ステップＣ９）。

【００８６】例えば、図１３の前処理後画像５７０に対
しては、「Ｌ」の中央部から右側に横棒が伸びること
は、英文字では不自然であることから、区切り図形５７
３が区切り図形を含む画像への相違度が最も大きな区切
り図形として選ばれたとする。

【００８７】このとき、分割制御手段６６は、区切り図
形５７３を除いた、区切り図形５７１、５７２、５７４
だけが抽出されたものとして、区切り図形照合手段２３
に処理を引き渡たし、区切り固形照合手段２３では区切
り図形５７１、５７２、５７４と単語画像記憶部３１の
区切り図形とを照合して、部分画像に分割する。

【００８８】次に、本発明の第３の実施例の作用効果に
ついて説明する。

【００８９】本発明の第３の実施例では、前記第１の実
施例の効果に加え、ノイズ等の影響により誤って区切り
図形が検出されてしまった場合に起こる、認識性能の低
下を軽減することができる。

【００９０】

【発明の効果】以上説明したように、本発明によれば下
記記載の効果を奏する。

【００９１】本発明の第１の効果は、単語認識の速度が
単語の長さと関係無く高速に行なうことができるととも
に、文字切り出しの難しい単語画像も認識することがで
きる、ということである。

【００９２】その理由は、本発明においては、単語画像
から文字を切り出すことなく、単語認識を行うためであ
る。

【００９３】本発明の第２の効果は、単語画像同士を画
像照合するとき、単語画像内の文字の位置ずれによる画
像照合精度の低下を軽減するとともに、認識処理速度度
を高速化する、ということである。

【００９４】その理由は、本発明においては、単語画像
から目印となる区切り図形を抽出して単語画像を分割
し、分割された部分画像単位で画像照合を行う、構成と
したためである。

【００９５】本発明の第３の効果は、入力画像と辞書画
像との間で、網羅的な位置合わせによる照合を行うた
め、位置ずれに対応することができるとともに、共通し
て存在する区切り図形を利用して照合範囲に制約条件を
付加しているため、照合処理を高速化する、ということ
である。

【図面の簡単な説明】

【図１】本発明の第１の実施例の構成を示す図である。

【図２】本発明の第１の実施例における区切り図形の例
を示す図である。

【図３】本発明の第１の実施例の動作を説明するための
流れ図である。

【図４】本発明の一実施例における画像照合を説明する
ための図である。

【図５】本発明の第１の実施例において、画像に設定す
る座標系について説明するための図である。

【図６】本発明の第１の実施例の動作について具体的に
説明するための図である。

【図７】本発明の第２の実施例の構成を示す図である。

【図８】本発明の第２の実施例の動作について説明する
ための流れ図である。

【図９】本発明の第２の実施例の動作について説明する
ための図であり、画像例を示す図である。

【図１０】本発明の第２の実施例による計算量の削減効
果を説明するための図である。

【図１１】本発明の第３の実施例の構成を示す図であ
る。

【図１２】本発明の第３の実施例の動作を説明するため
の流れ図である。

【図１３】本発明の第２の実施例の動作について説明す
るための図であり、画像例を示す図である。

【図１４】従来の技術における画像照合について説明す
るための図である。

【符号の説明】

１入力装置２、５、６データ処理装置３記憶装置４出力装置２１前処理手段２２区切り図形抽出手段２３区切り図形照合手段２４画像照合手段５４第２の画像照合手段６６分割制御手段３１単語画像辞書５０１〜５０４単語画像５１０の４隅５０５〜５０８単語画像５１４の４隅５１０、５１４、５１６、５２０、５２１、５６０、５
７０単語画像５１１〜５１３単語画像５１０と単語画像５１４の対
応する位置を表す矢印５１７〜５１９単語画像５１６に含まれる区切り図形５２８〜５３１単語画像５１６に含まれる非区切り図
形５２２〜５２４単語画像５２０と単語画像５２１の対
応する位置を表す矢印５２５〜５２７単語画像５２１に含まれる区切り図形５４０区切り図形テンプレート５４１、５４２非区切り図形テンプレート５５０〜５５３単語画像５１６の分割５６０第２の実施例によって計算対象となる座標の領
域５７１〜５７４単語画像５７０に含まれる区切り図形６１〜６５区切り図形

フロントページの続き (56)参考文献特開平11−120293（ＪＰ，Ａ) 特開平３−268190（ＪＰ，Ａ) 特開平６−28521（ＪＰ，Ａ) ＰＲＭＵ98−161 セグメンテーションの負荷を軽減した手書き住所認識，電子情報通信学会技術研究報告，日本, 1998年12月18日，Ｖｏｌ．98 Ｎｏ. 490，ｐｐ．87−93 ＰＲＭＵ99−240 特定形状を用いた印刷単語大分類，電子情報通信学会技術研究報告，日本，2000年２月，ｐｐ. 67−72 Ｄ−12−18 区切り図形を用いた印刷英単語大分類方式，1999年電子情報通信学会情報・システムサイエティ大会，日本，1999年８月16日，ｐ．182 パターン整合法による手書き文字列の分類実験，電子情報通信学会論文誌，日本，1997年５月，Ｖｏｌ．Ｊ80−Ｄ− ＩＩＮｏ．５，ｐｐ．1326−1328 キー文字駆動型地名推論に基づく手書きあて名認識，電子情報通信学会論文誌，日本，1997年５月，Ｖｏｌ．Ｊ80 −Ｄ−ＩＩＮｏ．５，ｐｐ．1077− 1085 (58)調査した分野(Int.Cl.⁷，ＤＢ名) G06K 9/00 - 9/82

Claims

(57)【特許請求の範囲】

【請求項１】入力単語画像中の区切り図形を検出する区
切り図形抽出手段と、前記入力単語画像を前記区切り図形で区切られた区間に
分割する区切り図形照合手段と、前記区切り図形照合手段で行われた分割を利用して、前
記入力単語画像を辞書記憶手段に予め記憶されている単
語画像テンプレートと照合する画像照合手段と、を備え、前記区切り図形抽出手段が、前記入力単語画像中の黒画
素数を列毎に計数して縦線を検出する手段と、前記縦線の周囲の画像を抜き出して該抜き出た画像を予
め用意された区切り図形を含む画像及び含まない画像と
照合する手段と、を備えたことを特徴とする文字認識装置。
【請求項２】前記画像照合手段が、網羅的な位置合わせ
による画像照合を行う際に、前記区切り図形照合手段に
おいて行われた分割を制約条件として付与する手段を備
えたことを特徴とする請求項１記載の文字認識装置。
【請求項３】予め定められた区切り図形の位置及び種類
を予め登録しておくとともに、入力単語画像の照合に用
いられるテンプレート単語画像を予め登録しておく記憶
手段と、画像入力手段から入力された文字又は文字列を含む単語
画像情報に対して所定の前処理を施してなる前処理後画
像情報を出力する前処理手段と、前記前処理後画像情報中に予め定められた区切り図形が
あるか否かを調べ前記区切り図形を抽出する区切り図形
抽出手段と、前記図形抽出手段で抽出された区切り図形の位置及び種
類を、前記記憶手段に予め登録された区切り図形の位置
及び種類と照合し、該照合結果に基づき、前記前処理後
画像情報を複数の部分画像に分割する区切り図形照合手
段と、前記区切り図形照合手段によって区分された前処理後画
像の部分画像と、前記記憶手段に予め登録されたテンプ
レート単語画像との間で対応する部分画像毎に画像の照
合を行う画像照合手段と、を備え、前記区切り図形抽出手段が、前記前処理後画像の２次元
画像の中からｙ軸方向の縦棒を検出し、その際、２値化
された画素のうち黒画素をｘ軸上に投影し、投影された
黒画素のヒストグラムを作成し、前記ヒストグラムのピ
ークを探し、該探索されたピークのうちヒストグラムの
値が予め定められた閾値以上のもののみを選択し、選ば
れたピークに対応するｘ座標を、縦棒の存在する位置と
して出力し、検出された縦棒をそれぞれ中心とする部分
画像と、予め用意しておいたテンプレート画像との照合
を行うことにより、前記部分画像に区切り図形が存在す
るか否かを判定する、ことを特徴とする文字認識装置。
【請求項４】予め定められた区切り図形の位置及び種類
を予め登録しておくとともに、入力単語画像の照合に用
いられるテンプレート単語画像を予め登録しておく記憶
手段と、画像入力手段から入力された文字又は文字列を含む単語
画像情報に対して所定の前処理を施した前処理後画像情
報を出力する前処理手段と、前記前処理後画像情報中に予め定められた区切り図形が
あるか否かを調べ前記区切り図形を抽出する区切り図形
抽出手段と、前記図形抽出手段で抽出された区切り図形の位置及び種
類を、前記記憶手段に予め登録された区切り図形の位置
及び種類と照合し、該照合結果に基づき、前記前処理後
画像情報を複数の部分画像に分割する区切り図形照合手
段と、前記区切り図形照合手段により出力された複数の部分画
像について、前記区切り図形照合手段による前記入力単
語画像の分割を制約条件として、前処理後画像情報と前
記記憶手段に予め登録されたテンプレート単語画像との
間で網羅的な位置合わせによる照合を行う画像照合手段
と、を備え、前記区切り図形抽出手段が、前記前処理後画像の２次元
画像の中からｙ軸方向の縦棒を検出し、その際、２値化
された画素のうち黒画素をｘ軸上に投影し、投影された
黒画素のヒストグラムを作成し、前記ヒストグラムのピ
ークを探し、該探索されたピークのうちヒストグラムの
値が予め定められた閾値以上のもののみを選択し、選ば
れたピークに対応するｘ座標を、縦棒の存在する位置と
して出力し、検出された縦棒をそれぞれ中心とする部分
画像と、予め用意しておいたテンプレート画像との照合
を行うことにより、前記部分画像に区切り図形が存在す
るか否かを判定する、ことを特徴とする文字認識装置。
【請求項５】前記画像照合手段での前記前処理後画像の
各部分画像毎の照合結果から、前記区切り図形照合手段
における分割が適切か否か判定し、不適な分割箇所が存
在する場合、分割を変更して前記画像照合手段に再び画
像照合を行わせるように制御する分割制御手段を備えた
ことを特徴とする請求項３又は４記載の文字認識装置。
【請求項６】前記記憶手段には、認識対象とする全ての
単語に対して、該単語を構成する文字綴りと、単語画像
と、単語画像内に含まれる区切り図形の位置及び種類
と、前記単語画像を区切り図形で分割した結果得られる
部分画像とを組とするテンプレートを予め記憶し、前記
テンプレートには、識別用にテンプレート番号が割り振
られている、ことを特徴とする請求項３乃至５のいずれ
か一に記載の文字認識装置。
【請求項７】画像照合で用いるテンプレート単語情報と
して、予め定められた区切り図形を含むものと前記区切
り図形を含まないものの２カテゴリを用意しておき、前
記前処理後画像情報の部分画像について前記区切り図形
を含むテンプレートに近い場合には区切り図形と判定
し、区切り図形を含まないテンプレートに近い場合、区
切り図形ではないと判定する、ことを特徴とする請求項
３又は４記載の文字認識装置。