JP3428504B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP3428504B2
JP3428504B2 JP17182499A JP17182499A JP3428504B2 JP 3428504 B2 JP3428504 B2 JP 3428504B2 JP 17182499 A JP17182499 A JP 17182499A JP 17182499 A JP17182499 A JP 17182499A JP 3428504 B2 JP3428504 B2 JP 3428504B2
Authority
JP
Japan
Prior art keywords
image
delimiter
word
matching
template
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP17182499A
Other languages
English (en)
Other versions
JP2001005913A (ja
Inventor
裕一 中谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP17182499A priority Critical patent/JP3428504B2/ja
Publication of JP2001005913A publication Critical patent/JP2001005913A/ja
Application granted granted Critical
Publication of JP3428504B2 publication Critical patent/JP3428504B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像情報として入
力された文字又は文字列画像から文字又は文字列を自動
認識する文字認識装置に関する。
【0002】
【従来の技術】用紙等に印刷された単語等の文字情報を
光学的に読み取り画像情報として入力された単語画像情
報から単語を自動認識し文字コード情報等に自動変換す
る方法として、従来、認識対象とする単語画像情報(文
字又は文字列情報)全体を、1つの画像単位として、辞
書に予め登録しておき、入力された単語画像と、辞書の
画像情報を比較照合することで、単語認識が行われてい
た。
【0003】この従来の方法は、入力単語画像中から文
字を切り出す必要がないため、処理速度は、単語の文字
長とは無関係とされ、単語認識処理の高速化が可能であ
るほか、隣接文字間に接触等が生じ、文字を切り出すこ
とが困難とされている単語画像の認識も行うことができ
るという利点を有している。
【0004】この従来の方法の詳細については、例えば
文献(TinKam Ho,Jonathan J.Hull and Sargur N.
srihari, "A word shape analysis approach to l
exicon based word recognition",PRL 13(1992)pp.
821-826)等の記載が参照される。上記文献に記載され
た単語認識システムは、画像入力手段から入力された英
単語画像情報を入力とし、表記された英単語を自動認識
して出力するものであり、入力画像から特徴量を抽出す
る特徴抽出手段と、認識対象となる英単語画像の特徴量
を予め登録しておくための辞書を構成する記憶装置と、
入力画像から抽出された特徴量と辞書の内容とを照合す
る照合手段と、を備えている。照合手段は、入力画像か
ら抽出された特徴量と、辞書に登録された画像の特徴量
とを比較し、比較の結果、特徴量の近い英単語を出力す
る。
【0005】図14を参照して、その概略を説明する。
図14において、符号510は入力画像、符号514は
辞書(不図示)に登録された単語画像(「辞書画像」と
いう)を示している。例えば、入力画像510を辞書画
像514と照合する場合、入力画像の4隅、すなわち5
01、502、503、504と、辞書画像の4隅、す
なわち505、506、507、508とが一致するよ
うに、入力画像510を相似変換してから、両者を照合
する。
【0006】
【発明が解決しようとする課題】しかしながら、上記し
た従来の手法は、下記記載の問題点を有している。
【0007】第1の問題点は、単語全体を1つの画像単
位として認識を行うため、単語内での文字の位置の変動
があると認識精度が低下する、ということである。より
詳細には、例えば英文字では、文字の横幅がフォントと
カテゴリによって大きく変動するため、単語内での各文
字の位置も様々に変動する。このため、単語内での文字
の位置の変動があると、入力画像から抽出された特徴の
位置と、記憶装置に登録されている辞書画像の特徴の位
置との間に、大きなずれが生じることになる。これによ
り認識精度が低下してしまう。
【0008】第2の問題点は、上記第1の問題点の解決
を図るために、入力単語画像と辞書の情報との照合の際
に、網羅的な位置合わせを行う場合、演算量が増大し、
処理時間が長大化する、ということである。
【0009】したがって、本発明は、上記問題点に鑑み
てなされたものであって、その目的は、文字の位置変動
に対して安定且つ高い認識精度を保つとともに、高速処
理可能な文字認識装置を提供することにある。
【0010】
【課題を解決するための手段】前記目的を達成する本発
明は、入力単語画像中の区切り図形を検出する区切り図
形抽出手段と、前記入力単語画像を前記区切り図形で区
切られた区間に分割する区切り図形照合手段と、前記区
切り図形照合手段で行われた分割を利用して、前記入力
単語画像を辞書記憶手段に予め記憶されている単語画像
テンプレートと照合する画像照合手段と、を備える。
【0011】本発明においては、前記区切り図形抽出手
段は、単語画像の黒画素数を列毎にカウントして、縦線
を検出する手段と、前記縦線の周囲の画像を抜き出し、
予め用意された区切り図形を含む画像及び含まない画像
との照合を行う手段と、を備える。
【0012】また本発明において、前記画像照合手段
は、網羅的な位置合わせによる画像照合を行う際に、前
記区切り図形照合手段において行われた分割を制約条件
として付与する手段を備える。
【0013】さらに本発明においては、入力単語画像中
の区切り図形を検出する区切り図形抽出手段と、入力単
語画像を区切り図形で区切られた区間に分割する区切り
図形照合手段と、前記区切り図形照合手段で行われた分
割を利用して前記入力単語画像の区間単位に辞書記憶手
段に予め記憶された単語画像テンプレートと照合する画
像照合手段と、前記画像照合手段の照合結果に基づき分
割をやり直す分割制御手段と、を備える。
【0014】
【発明の実施の形態】本発明の実施の形態について説明
する。本発明は、単語画像内の区切り図形により区間分
けを行ってから各区間毎に辞書との照合を行う。より詳
細には、本発明は、その好ましい実施の形態において、
画像入力手段から入力された単語画像に対して、2値
化、正規化等など所定の前処理を行い前処理済みの画像
(「前処理後画像」という)を出力する前処理手段(図
1の21)と、前処理後画像から区切り図形を抽出する
区切り図形抽出手段(図1の22)と、抽出された区切
り図形の位置及び種類を単語画像記憶部(図1の31)
に予め登録された区切り図形の位置及び種類と照合し、
前処理後画像の分割を行う区切り図形照合手段(図1の
23)と、該区切り図形照合手段によって分割された前
処理後画像と、該単語画像記憶部に予め登録された単語
画像との間で対応する区間毎に画像照合を行う画像照合
手段(図1の24)とを有する。
【0015】本発明は、別の実施の形態において、前処
理後画像と単語画像記憶部に予め登録された単語画像と
の間で網羅的な位置あわせによる照合を行うものであ
り、区切り図形照合手段(図7の23)によって行われ
た分割を制約条件として利用することにより、網羅的な
位置あわせによる照合を、制約条件が無い場合に比べ少
ない計算量で実現する第2の画像照合手段2(図7の5
4)を有する。
【0016】本発明は、さらに別の実施の形態におい
て、画像照合手段(図11の24)での前処理画像の各
部分画像毎の照合結果から、区切り図形照合手段(図1
1の23)における分割が適切か否か判定し、不適な分
割箇所が存在する場合、区切り図形照合手段で分割を変
更し、画像照合手段(図11の24)に再び画像照合を
行わせるように制御する分割制御手段(図11の66)
を備える。
【0017】また本発明は、その好ましい一実施の形態
において、画像入力手段から入力された文字又は文字列
を含む単語画像情報から該文字又は文字列を自動認識す
る処理を実行するコンピュータにおいて、(a)前記入
力された単語画像情報に対して、2値化、正規化等の所
定の前処理を施した前処理後画像情報を出力する前処理
処理と、(b)前記前処理後画像情報中に予め定められ
た区切り図形があるか否かを調べ前記区切り図形を抽出
する区切り図形抽出処理と、(c)前記抽出された区切
り図形の位置及び種類を、記憶手段に予め登録された区
切り図形の位置及び種類と照合し、該照合結果に基づ
き、前記前処理後画像情報を複数の部分画像に分割する
区切り図形照合処理と、(d)前記区分された前処理後
画像情報の部分画像と、記憶手段に予め登録されたテン
プレート単語画像との間で対応する部分画像毎に画像の
照合を行う画像照合処理と、を備え、前記(a)乃至
(d)の各処理は、前記コンピュータで実行させるプロ
グラムで実現される。
【0018】また、前記画像照合処理(d)において、
前記複数の部分画像について、前記処理(c)での前記
入力単語画像の分割を制約条件として、前処理後画像情
報と記憶手段に予め登録された単語画像との間で網羅的
な位置あわせによる照合を行うようにしてもよい。
【0019】さらに、別の処理(e)として、前記画像
照合処理(d)での前記前処理後画像の各部分画像毎の
照合結果から、前記前記分割が適切か否か判定し不適な
分割箇所が存在する場合、分割の内容を変更し、変更後
の分割に対応する部分画像について、前記処理(d)で
再び画像照合を行わせる分割制御処理を備えてもよい。
【0020】上記した(a)乃至(e)の処理をコンピ
ュータ上で実行させるためのプログラムを記録した記録
媒体から該プログラムを読み出すか、もしくは通信媒体
から該プログラムを読み出して該コンピュータで実行す
ることで本発明を実施することができる。
【0021】
【実施例】上記した本発明の実施の形態についてさらに
詳細に説明すべく、本発明の実施例について図面を参照
して詳細に説明する。
【0022】図1は、本発明の第1の実施例の構成を示
す図である。図1を参照すると、本発明の第1の実施例
の単語認識システムは、単語画像を入力する入力装置1
と、プログラム制御により動作するデータ処理装置2
と、情報を記憶する記憶装置3と、出力装置4と、を含
む。
【0023】記憶装置3は、単語画像記憶部31を備え
ている。単語画像記憶部31は、認識対象とする全ての
単語に対して、その単語を構成する文字の綴りと、単語
画像と、単語画像内に含まれる区切り図形の位置及び種
類と、単語画像をそこに含まれる区切り図形で分割した
結果得られた部分画像と、を1組とするテンプレートを
予め記憶している。各テンプレートには、識別用にテン
プレート番号が割り付けられている。
【0024】区切り図形としては、例えば図2に61、
62、63として示すように、縦棒に横棒がくっついた
図形(「区切り図形1」という)や、図2に64、65
として示すように、小文字のデセンダがあげられる。こ
こで、説明のため全ての画像には、図5に示すように、
座標系(xy座標)が設定されているものとする。また
図5に560で示す破線は、画像の最小包含長方形を表
している。
【0025】ここで、図6の516の画像の中から、図
6の517、518、519の3つの区切り図形が抽出
されたものとし、この区切り図形のx座標を例えば縦棒
の重心のx座標として定める。そして、この座標が、左
から順に、10、100、600であったとする。
【0026】元の画像516を、x方向に垂直に、この
3つのx座標で分割すると、元の画像516は、x座標
が0から10(図6の550)、10から100(図6
の551)、100から600(図6の552)、60
0から1000(図6の553)である4つの部分画像
に分割される。
【0027】このようにして、部分画像を得ることを、
元の画像516を、区切り図形517、518、519
で分割するといい、得られた部分画像には、左から順に
1、2、3、4と番号を割り振る。
【0028】図1を参照すると、データ処理装置2は、
前処理手段21と、区切り図形抽出手段22と、区切り
図形照合手段23と、画像照合手段24とを備える。
【0029】前処理手段21は、入力装置1から与えら
れた単語画像に対して、2値化処理、正規化処理等の前
処理を行い、前処理後画像として出力する。
【0030】区切り図形抽出手段22は、前処理手段2
1が出力した前処理後画像の中から、前処理後画像の区
間分けに用いる区切り図形を抽出し、その位置と種類と
を出力する。
【0031】区切り図形照合手段23は、区切り図形抽
出手段22により抽出された区切り図形の位置及び種類
を、単語画像記憶部31に予め登録されている区切り図
形の位置及び種類と登録全単語にわたって照合する。照
合に成功した場合、前処理後画像の分割を行い、テンプ
レート番号と得られた部分画像と出力する。
【0032】画像照合手段24は、区切り図形照合手段
23により出力された全てのテンプレート番号につい
て、テンプレート番号に対応するテンプレート内の部分
画像を、区切り図形照合手段23により出力された対応
する部分画像とを画像照合する。2つの画像間で画像照
合を行う方法は、公知の各種方法が用いられる。例え
ば、前述の文献(Tin Kam Ho, Jonathan J.Hull a
nd Sargur N.srihari, "Aword shape analysis app
roach to lexicon based word recognition",PRL 1
3(1992)pp.821-826)に記載された方法が用いられる。
【0033】図3は、本発明の第1の実施例の処理手順
を説明するための流れ図である。図1及び図3を参照し
て、本発明の第1の実施例の動作について詳細に説明す
る。
【0034】入力装置1から与えられた単語画像は、前
処理手段21に供給される。
【0035】前処理手段21は、2値化(画素値を2値
に変換する)、大きさの正規化(画像の縦横の比率を一
定にする)などの処理を行い、前処理後画像を生成する
(図3のステップA1)。なお、2値化については画素
値をしきい値と比較して1、0信号に変換する等、公知
の各種方法が用いられる。
【0036】区切り図形抽出手段22は、前処理後画像
の中から区切り図形を抽出する(ステップA2)。区切
り図形の抽出方法は、区切り図形の種類に対応して用い
る。例えば図2に符号64、65で示した区切り図形は
「デセンダ」と呼ばれるものであり、公知の方法で抽出
される。例えば、まず単語画像のベースラインを検出
し、輪郭線の極小点のうちベースラインよりも下にある
ものをデセンダとすることができる。
【0037】このようにして、区切り図形抽出手段22
は、前処理後画像の中に含まれる区切り図形の種類と位
置を抽出する。
【0038】また図2に符号61、62、63で示すよ
うな図形(「区切り図形1」という)は、例えば、次の
ようにして抽出することができる。
【0039】以下では、図6の画像516から区切り図
形1を抽出する場合について説明する。
【0040】まず画像516の中から縦棒を検出する。
縦棒の検出方法としては、例えば、黒画素(2値化され
た画素のうち黒とされた画素)をx軸上に投影し、投影
された黒画素をカウントしてヒストグラムを作成したの
ち、ヒストグラムのピークを探す。更に、探索されたピ
ークのうちヒストグラムの値が閾値以上のもののみを選
ぶ。そして選ばれたピークに対応するx座標を、縦棒の
存在する位置として出力する。
【0041】このようにして、図6の517、518、
519、及び図6の528から531までの縦棒が検出
できる。
【0042】次に、検出された縦棒をそれぞれ中心とす
る部分画像と、予め用意したおいたテンプレートと画像
照合を行うことにより、部分画像に区切り図形1が存在
するか否かを判定する。画像照合で用いるテンプレート
は、2カテゴリ分用意する。その1つは、区切り図形1
を含むもの(例えば図6の540)であり、他の1つ
は、区切り図形1を含まないもの(例えば図6の54
1、542)である。
【0043】そして、これら2カテゴリの認識問題とし
て、区切り図形1を抽出することができる。また2つの
カテゴリに対する相違度も算出しておくものとする。
【0044】例えば、図6の517、518、519
は、区切り図形1を含むテンプレートに近いので、区切
り図形1であると判定し、図6の528から531は区
切り図形1は含まないテンプレートに近いので、区切り
図形1ではないと判定する。
【0045】近さの基準については、例えば、各々のカ
テゴリに対する相違度が小さいほど近いとすればよい。
【0046】本発明の第1の実施例において、区切り図
形抽出は、文字を切り出すことなく行うことができる。
また処理時間の点からみても、認識対象となるカテゴリ
が2つしかないことから、単語認識システムで行われる
単語照合における認識対象カテゴリ(=単語語彙数)と
比べると小さいため、大きなオーバーヘッドとはならな
い。
【0047】区切り図形照合手段23は、区切り図形抽
出手段22によって抽出された区切り図形の種類及び位
置を、単語画像記憶部31(単語辞書)内の1つのテン
プレートの図形の種類及び位置と照合する(ステップA
3)。
【0048】例えば、前処理後画像が、図6に516と
して示すものであるとする。そして、この前処理後画像
516から抽出される区切り図形は、図6の517、5
18、519の3つとする。そして、その種類はいずれ
も区切り図形1で、x座標が左から10、100、60
0であるものとする。
【0049】一方、単語画像記憶部31には、図4の画
像521が単語画像としてテンプレートに登録されてお
り、また図4の画像521に含まれる区切り図形とし
て、図4の525、526、527の3つが、その種類
(3つとも区切り図形1)と位置(左からx座標が2
0、150、800)と共に登録されているものとす
る。
【0050】このとき、照合成功の条件としては様々な
ものが用いられるが、例えば、前処理後画像から得られ
た区切り図形の数と種類が、テンプレートに登録された
区切り図形と同一のとき、照合に成功したものとするこ
とができる(ステップA4)。照合に失敗すればステッ
プA6へすすむ。
【0051】画像照合手段24では、前処理後画像とテ
ンプレートに登録された単語画像との間で画像照合を行
う(ステップA5)。
【0052】本発明の第1の実施例においては、図6の
前処理後画像516と、図4のテンプレート画像521
とを照合するのではなく、前処理画像516の部分画像
1とテンプレート画像521の部分画像1、前処理画像
516の部分画像2とテンプレート画像521の部分画
像2、というように、前処理画像とテンプレート画像の
対応する部分画像毎の照合を行う。
【0053】ここで、前処理画像516の部分画像1と
は、前処理画像516のうちx座標が0から10の部分
を抜き出した画像のことであり、テンプレート画像52
1の部分画像1とは、テンプレート画像521のうちx
座標が0から20の部分を抜き出した画像のことであ
る。
【0054】これら2つの画像は、縦横比が異なるの
で、縦横比を合わせてから、照合を行い、相違度を求め
る。
【0055】相違度の算出を全ての部分画像に対して行
い、各部分画像の相違度から、画像全体の相違度を求め
る。例えば、部分画像の相違度を算術平均することによ
って求めることができる。
【0056】そして、単語画像記憶部内のテンプレート
の数だけステップA3からA5の処理を繰り返し(ステ
ップA6)、すべてのテンプレートに対して処理が終了
したら結果を出力して終了する(ステップA7)。
【0057】次に、本発明の第1の実施例の作用効果に
ついて説明する。
【0058】本発明の第1の実施例では、単語画像から
文字を切り出すことなく、単語認識を行うことができる
ので、単語認識の速度は単語の長さと関係無く高速で、
文字切り出しの難しい単語画像も認識することができ
る。
【0059】比較のため従来の方法について説明する
と、例えば図14を参照すると、前処理後画像510
を、テンプレート画像514と縦横比を合わせて画像照
合していたため、左端(図14の512)と右端(図1
4の513)は一致しても、単語画像の内部では、例え
ば図14の511に示す「I」の字のように、位置がず
れて精度が低下する場合がある。
【0060】本発明の第1の実施例では、画像510と
画像514の区切り図形を利用して、画像510と画像
514の代わりに、図4の画像520と図4の画像52
1とを画像照合するため、位置ずれによる認識精度の低
下を低減することができる。
【0061】次に、本発明の第2の実施例について説明
する。図7は、本発明の第2の実施例の構成を示す図で
ある。図7を参照すると、本発明の第2の実施例は、図
1に示した前記第1の実施例のデータ処理装置2におい
て、画像照合手段24が、第2の画像照合手段54で置
き換えたものである。
【0062】第2の画像照合手段54は、区切り図形照
合手段23により出力された全てのテンプレート番号に
ついて、テンプレート番号に対応するテンプレート内の
単語画像と、前処理後画像との間で網羅的な位置合わせ
による照合を行う。
【0063】図8は、本発明の第2の実施例の処理手順
を示す流れ図である。図7及び図8を参照して、本発明
の第2の実施例の動作について詳細に説明する。図8に
おいて、ステップA1〜A7の各処理は、図3のステッ
プA1〜A7の各処理と同一であり、ステップA4の判
定の結果、ステップB5が実行される点が相違してい
る。すなわち、図8のステップB5で示される図7の第
2の画像照合手段54の動作以外は、前記第1の実施例
における各手段21、22、23の動作と同一のため、
説明は省略する。
【0064】前記第1の実施例における画像照合手段2
4では、前処理後画像と、テンプレート内の部分画像と
を、区切り図形照合手段23によって得られた部分画像
毎に照合していた。しかしながら、区切り図形の位置検
出に誤差があったり、図9に、入力後画像570と、テ
ンプレート画像521として示すように、区切り図形の
位置を合わせてもなお、図9の573に示される「LとS
の境目」のように位置ずれが残る場合もある。
【0065】第2の画像照合手段54は、このような位
置ずれを網羅的な位置合わせによる照合を行うことで吸
収する。以下に詳説する。
【0066】座標(x,y)における図9の画像570の画
素値をP1(x,y)、画像521の画素値をP2(x,y)とす
る。画像570と画像521の照合を行うにあたって、
まず画像570のうちx座標がx1である1列と、画像
521のうちx座標がx2である1列の相違度f(x1,x
2)を次式(1)で定義する。
【0067】 f(x1,x2)=sum(0,1000,|P1(x1,i)-P2(x2,i)|) …(1)
【0068】ここで、sum(p1,p2,p3(i))は、p1以上p
2以下の全ての整数iに対するp3(i)の値の総和を
表わしている。|P1(x1,i)-P2(x2,i)|は、P1(x1,i)とP2
(x2,i)の距離である。
【0069】次に、画像570のx座標が0以上x1以
下の部分と、画像521のx座標が0以上x2以下の部
分との相違度g(x1,x2)を次式(2)で定義する。
【0070】 g(x1,x2)=min(g(x1-1,x2-1)+f(x1,x2),g(x1,x2-1)+f(x1,x2),g(x1-1,x2)+f(x1 ,x2)) …(2) ただし、x1≦0またはx2≦0のときは、g(x1,x2)=0であ
る。
【0071】すると、g(1000,1000)が、画像570と画
像521の相違度となる。
【0072】ここまでは網羅的な位置合わせによる照合
と同じである。この場合は、図10において、(0,0)、
(1000,0)、(1000,1000)、(0,1000)の4つの点からなる
四角形の内側にあるすべての座標に対してg(x1,x2)を計
算する必要がある。
【0073】本実施例では、区切り図形照合手段23に
よって照合された区切り図形の位置を利用して、この計
算を高速化する。
【0074】例えば、区切り図形照合手段23によっ
て、画像570と画像521の間で3つの区切り図形が
共通して存在し、そのx座標が画像570においては、 C(1),C(2),C(3)、 画像521においては、 D(1),D(2),D(3) と出力されたとする。
【0075】このとき、g(x1,x2)に対し、閉区間[0,max
(D(i)-M,0)]、及び、[min(D(i)+M,1000),1000]内の全て
の整数yに対し、 g(C(i),y)=+∞(i=1,2,3)、 という制約条件を付け加える。
【0076】ここでMは、区切り図形の位置の検出誤差
を許容するためのマージンであり、例えばM=5とするこ
とができる。
【0077】この制約条件を付け加えることで、g(x1,x
2)を計算する必要がある座標を、図10の領域560に
制限することができる。
【0078】本発明の第2の実施例の作用効果について
説明する。
【0079】本発明の第2の実施例では、入力画像と辞
書画像との間で、網羅的な位置合わせによる照合を行う
ため、位置ずれに対応することができ、かつ、共通して
存在する区切り図形を利用して照合範囲に制約条件を付
け加えているため、そのような制約条件がない場合とく
らべて、高速に実行することができる。
【0080】次に、本発明の第3の実施例について説明
する。図11は、本発明の第3の実施例の構成を示す図
である。図11を参照すると、本発明の第3の実施例
は、図1に示した前記第1の実施例と比べ、データ処理
装置2の構成に加えて、分割制御手段66を備えてい
る。
【0081】分割制御手段66は、画像照合手段24に
よる各部分画像毎の照合結果から、区切り図形照合手段
23において過分割(過度な分割)が行われている可能
性のある個所を検出し、分割を変更して画像照合手段2
4に再び画像照合を行わせる。
【0082】図12は、本発明の第3の実施例の処理手
順を示す流れ図である。図11及び図12を参照して、
本発明の第3の実施例の動作について詳細に説明する。
図11において、ステップA1〜A7の各処理は、図3
のステップA1〜A7の各処理と同一である。ステップ
C8、C9で示される、図12の分割制御手段66の動
作以外は、前記第1の実施例における各手段21、2
2、23の動作と同一のため、説明は省略する。
【0083】分割制御手段66は、画像照合手段24に
よって出力された画像全体に対する相違度のうち最も小
さいものが予め定められたしきい値よりも大きい場合、
画像の分割を変更する(ステップC8)。
【0084】例えば、図13の前処理後570に対し、
区切り図形571、572、573、574が抽出され
ていたとする。このうち、区切り図形573は、ノイズ
の影響等により、誤って区切り図形として抽出されてし
まったものである。
【0085】画像の分割を変更する場合、まず、区切り
図形抽出手段22によって抽出された区切り図形のう
ち、区切り図形を含む画像への相違度が最も大きな区切
り図形を選び、区切り図形抽出手段22によって抽出さ
れた区切り図形の中からそれを取り除き、ステップA3
へすすむ(ステップC9)。
【0086】例えば、図13の前処理後画像570に対
しては、「L」の中央部から右側に横棒が伸びること
は、英文字では不自然であることから、区切り図形57
3が区切り図形を含む画像への相違度が最も大きな区切
り図形として選ばれたとする。
【0087】このとき、分割制御手段66は、区切り図
形573を除いた、区切り図形571、572、574
だけが抽出されたものとして、区切り図形照合手段23
に処理を引き渡たし、区切り固形照合手段23では区切
り図形571、572、574と単語画像記憶部31の
区切り図形とを照合して、部分画像に分割する。
【0088】次に、本発明の第3の実施例の作用効果に
ついて説明する。
【0089】本発明の第3の実施例では、前記第1の実
施例の効果に加え、ノイズ等の影響により誤って区切り
図形が検出されてしまった場合に起こる、認識性能の低
下を軽減することができる。
【0090】
【発明の効果】以上説明したように、本発明によれば下
記記載の効果を奏する。
【0091】本発明の第1の効果は、単語認識の速度が
単語の長さと関係無く高速に行なうことができるととも
に、文字切り出しの難しい単語画像も認識することがで
きる、ということである。
【0092】その理由は、本発明においては、単語画像
から文字を切り出すことなく、単語認識を行うためであ
る。
【0093】本発明の第2の効果は、単語画像同士を画
像照合するとき、単語画像内の文字の位置ずれによる画
像照合精度の低下を軽減するとともに、認識処理速度度
を高速化する、ということである。
【0094】その理由は、本発明においては、単語画像
から目印となる区切り図形を抽出して単語画像を分割
し、分割された部分画像単位で画像照合を行う、構成と
したためである。
【0095】本発明の第3の効果は、入力画像と辞書画
像との間で、網羅的な位置合わせによる照合を行うた
め、位置ずれに対応することができるとともに、共通し
て存在する区切り図形を利用して照合範囲に制約条件を
付加しているため、照合処理を高速化する、ということ
である。
【図面の簡単な説明】
【図1】本発明の第1の実施例の構成を示す図である。
【図2】本発明の第1の実施例における区切り図形の例
を示す図である。
【図3】本発明の第1の実施例の動作を説明するための
流れ図である。
【図4】本発明の一実施例における画像照合を説明する
ための図である。
【図5】本発明の第1の実施例において、画像に設定す
る座標系について説明するための図である。
【図6】本発明の第1の実施例の動作について具体的に
説明するための図である。
【図7】本発明の第2の実施例の構成を示す図である。
【図8】本発明の第2の実施例の動作について説明する
ための流れ図である。
【図9】本発明の第2の実施例の動作について説明する
ための図であり、画像例を示す図である。
【図10】本発明の第2の実施例による計算量の削減効
果を説明するための図である。
【図11】本発明の第3の実施例の構成を示す図であ
る。
【図12】本発明の第3の実施例の動作を説明するため
の流れ図である。
【図13】本発明の第2の実施例の動作について説明す
るための図であり、画像例を示す図である。
【図14】従来の技術における画像照合について説明す
るための図である。
【符号の説明】
1 入力装置 2、5、6 データ処理装置 3 記憶装置 4 出力装置 21 前処理手段 22 区切り図形抽出手段 23 区切り図形照合手段 24 画像照合手段 54 第2の画像照合手段 66 分割制御手段 31 単語画像辞書 501〜504 単語画像510の4隅 505〜508 単語画像514の4隅 510、514、516、520、521、560、5
70 単語画像 511〜513 単語画像510と単語画像514の対
応する位置を表す矢印 517〜519 単語画像516に含まれる区切り図形 528〜531 単語画像516に含まれる非区切り図
形 522〜524 単語画像520と単語画像521の対
応する位置を表す矢印 525〜527 単語画像521に含まれる区切り図形 540 区切り図形テンプレート 541、542 非区切り図形テンプレート 550〜553 単語画像516の分割 560 第2の実施例によって計算対象となる座標の領
域 571〜574 単語画像570に含まれる区切り図形 61〜65 区切り図形
フロントページの続き (56)参考文献 特開 平11−120293(JP,A) 特開 平3−268190(JP,A) 特開 平6−28521(JP,A) PRMU98−161 セグメンテーショ ンの負荷を軽減した手書き住所認識,電 子情報通信学会技術研究報告,日本, 1998年12月18日,Vol.98 No. 490,pp.87−93 PRMU99−240 特定形状を用いた 印刷単語大分類,電子情報通信学会技術 研究報告,日本,2000年 2月,pp. 67−72 D−12−18 区切り図形を用いた印刷 英単語大分類方式,1999年電子情報通信 学会情報・システムサイエティ大会,日 本,1999年 8月16日,p.182 パターン整合法による手書き文字列の 分類実験,電子情報通信学会論文誌,日 本,1997年 5月,Vol.J80−D− II No.5,pp.1326−1328 キー文字駆動型地名推論に基づく手書 きあて名認識,電子情報通信学会論文 誌,日本,1997年 5月,Vol.J80 −D−II No.5,pp.1077− 1085 (58)調査した分野(Int.Cl.7,DB名) G06K 9/00 - 9/82

Claims (7)

    (57)【特許請求の範囲】
  1. 【請求項1】入力単語画像中の区切り図形を検出する区
    切り図形抽出手段と、 前記入力単語画像を前記区切り図形で区切られた区間に
    分割する区切り図形照合手段と、 前記区切り図形照合手段で行われた分割を利用して、前
    記入力単語画像を辞書記憶手段に予め記憶されている単
    語画像テンプレートと照合する画像照合手段と、 を備え 前記区切り図形抽出手段が、前記入力単語画像中の黒画
    素数を列毎に計数して縦線を検出する手段と、 前記縦線の周囲の画像を抜き出して該抜き出た画像を予
    め用意された区切り図形を含む画像及び含まない画像と
    照合する手段と、 を備え たことを特徴とする文字認識装置。
  2. 【請求項2】前記画像照合手段が、網羅的な位置合わせ
    による画像照合を行う際に、前記区切り図形照合手段に
    おいて行われた分割を制約条件として付与する手段を備
    えたことを特徴とする請求項1記載の文字認識装置。
  3. 【請求項3】予め定められた区切り図形の位置及び種類
    を予め登録しておくとともに、入力単語画像の照合に用
    いられるテンプレート単語画像を予め登録しておく記憶
    手段と、 画像入力手段から入力された文字又は文字列を含む単語
    画像情報に対して所定の前処理を施してなる前処理後画
    像情報を出力する前処理手段と、 前記前処理後画像情報中に予め定められた区切り図形が
    あるか否かを調べ前記区切り図形を抽出する区切り図形
    抽出手段と、 前記図形抽出手段で抽出された区切り図形の位置及び種
    類を、前記記憶手段に予め登録された区切り図形の位置
    及び種類と照合し、該照合結果に基づき、前記前処理後
    画像情報を複数の部分画像に分割する区切り図形照合手
    段と、 前記区切り図形照合手段によって区分された前処理後画
    像の部分画像と、前記記憶手段に予め登録されたテンプ
    レート単語画像との間で対応する部分画像毎に画像の照
    合を行う画像照合手段と、 を備え 前記区切り図形抽出手段が、前記前処理後画像の2次元
    画像の中からy軸方向の縦棒を検出し、その際、2値化
    された画素のうち黒画素をx軸上に投影し、投影された
    黒画素のヒストグラムを作成し、前記ヒストグラムのピ
    ークを探し、該探索されたピークのうちヒストグラムの
    値が予め定められた閾値以上のもののみを選択し、選ば
    れたピークに対応するx座標を、縦棒の存在する位置と
    して出力し、検出された縦棒をそれぞれ中心とする部分
    画像と、予め用意しておいたテンプレート画像との照合
    を行うことにより、前記部分画像に区切り図形が存在す
    るか否かを判定する、 ことを特徴とする文字認識装置。
  4. 【請求項4】予め定められた区切り図形の位置及び種類
    を予め登録しておくとともに、入力単語画像の照合に用
    いられるテンプレート単語画像を予め登録しておく記憶
    手段と、 画像入力手段から入力された文字又は文字列を含む単語
    画像情報に対して所定の前処理を施した前処理後画像情
    報を出力する前処理手段と、 前記前処理後画像情報中に予め定められた区切り図形が
    あるか否かを調べ前記区切り図形を抽出する区切り図形
    抽出手段と、 前記図形抽出手段で抽出された区切り図形の位置及び種
    類を、前記記憶手段に予め登録された区切り図形の位置
    及び種類と照合し、該照合結果に基づき、前記前処理後
    画像情報を複数の部分画像に分割する区切り図形照合手
    段と、 前記区切り図形照合手段により出力された複数の部分画
    像について、前記区切り図形照合手段による前記入力単
    語画像の分割を制約条件として、前処理後画像情報と前
    記記憶手段に予め登録されたテンプレート単語画像との
    間で網羅的な位置合わせによる照合を行う画像照合手段
    と、 を備え 前記区切り図形抽出手段が、前記前処理後画像の2次元
    画像の中からy軸方向 の縦棒を検出し、その際、2値化
    された画素のうち黒画素をx軸上に投影し、投影された
    黒画素のヒストグラムを作成し、前記ヒストグラムのピ
    ークを探し、該探索されたピークのうちヒストグラムの
    値が予め定められた閾値以上のもののみを選択し、選ば
    れたピークに対応するx座標を、縦棒の存在する位置と
    して出力し、検出された縦棒をそれぞれ中心とする部分
    画像と、予め用意しておいたテンプレート画像との照合
    を行うことにより、前記部分画像に区切り図形が存在す
    るか否かを判定する、 ことを特徴とする文字認識装置。
  5. 【請求項5】前記画像照合手段での前記前処理後画像の
    各部分画像毎の照合結果から、前記区切り図形照合手段
    における分割が適切か否か判定し、不適な分割箇所が存
    在する場合、分割を変更して前記画像照合手段に再び画
    像照合を行わせるように制御する分割制御手段を備えた
    ことを特徴とする請求項又は記載の文字認識装置。
  6. 【請求項6】前記記憶手段には、認識対象とする全ての
    単語に対して、該単語を構成する文字綴りと、単語画像
    と、単語画像内に含まれる区切り図形の位置及び種類
    と、前記単語画像を区切り図形で分割した結果得られる
    部分画像とを組とするテンプレートを予め記憶し、前記
    テンプレートには、識別用にテンプレート番号が割り振
    られている、ことを特徴とする請求項乃至のいずれ
    か一に記載の文字認識装置。
  7. 【請求項7】画像照合で用いるテンプレート単語情報と
    して、予め定められた区切り図形を含むものと前記区切
    り図形を含まないものの2カテゴリを用意しておき、前
    記前処理後画像情報の部分画像について前記区切り図形
    を含むテンプレートに近い場合には区切り図形と判定
    し、区切り図形を含まないテンプレートに近い場合、区
    切り図形ではないと判定する、ことを特徴とする請求項
    3又は4記載の文字認識装置。
JP17182499A 1999-06-18 1999-06-18 文字認識装置 Expired - Fee Related JP3428504B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP17182499A JP3428504B2 (ja) 1999-06-18 1999-06-18 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP17182499A JP3428504B2 (ja) 1999-06-18 1999-06-18 文字認識装置

Publications (2)

Publication Number Publication Date
JP2001005913A JP2001005913A (ja) 2001-01-12
JP3428504B2 true JP3428504B2 (ja) 2003-07-22

Family

ID=15930433

Family Applications (1)

Application Number Title Priority Date Filing Date
JP17182499A Expired - Fee Related JP3428504B2 (ja) 1999-06-18 1999-06-18 文字認識装置

Country Status (1)

Country Link
JP (1) JP3428504B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6621151B2 (ja) * 2018-05-21 2019-12-18 Necプラットフォームズ株式会社 情報処理装置、システム、方法及びプログラム

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
D−12−18 区切り図形を用いた印刷英単語大分類方式,1999年電子情報通信学会情報・システムサイエティ大会,日本,1999年 8月16日,p.182
PRMU98−161 セグメンテーションの負荷を軽減した手書き住所認識,電子情報通信学会技術研究報告,日本,1998年12月18日,Vol.98 No.490,pp.87−93
PRMU99−240 特定形状を用いた印刷単語大分類,電子情報通信学会技術研究報告,日本,2000年 2月,pp.67−72
キー文字駆動型地名推論に基づく手書きあて名認識,電子情報通信学会論文誌,日本,1997年 5月,Vol.J80−D−II No.5,pp.1077−1085
パターン整合法による手書き文字列の分類実験,電子情報通信学会論文誌,日本,1997年 5月,Vol.J80−D−II No.5,pp.1326−1328

Also Published As

Publication number Publication date
JP2001005913A (ja) 2001-01-12

Similar Documents

Publication Publication Date Title
US5410611A (en) Method for identifying word bounding boxes in text
KR100658119B1 (ko) 문자 인식 장치 및 방법
US5539841A (en) Method for comparing image sections to determine similarity therebetween
US7630551B2 (en) Method and system for line extraction in digital ink
US7162086B2 (en) Character recognition apparatus and method
JP4280355B2 (ja) 文字認識装置
US11551461B2 (en) Text classification
Baird Global-to-local layout analysis
Cao et al. Robust page segmentation based on smearing and error correction unifying top-down and bottom-up approaches
JP3428504B2 (ja) 文字認識装置
Kumar et al. Line based robust script identification for indianlanguages
JP2008084105A (ja) 文字切出方法及び文字認識装置
JP2751865B2 (ja) 文字列認識装置
JP2917427B2 (ja) 図面読取装置
JPH06180771A (ja) 英文字認識装置
Chen et al. Detection and location of multicharacter sequences in lines of imaged text
JP3197441B2 (ja) 文字認識装置
JP2906758B2 (ja) 文字読取装置
JP3710164B2 (ja) 画像処理装置及び方法
JP2576350B2 (ja) 文字列抽出装置
JPH0652358A (ja) 文字認識方法
Leedham et al. Isolating individual handwritten characters
JP2866920B2 (ja) 標準パターン作成方法及び装置並びに文字認識装置及び方法
JP2972443B2 (ja) 文字認識装置
JP2963474B2 (ja) 類似文字識別方法

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030415

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090516

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100516

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110516

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110516

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120516

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120516

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130516

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140516

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees