JP3428504B2 - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JP3428504B2 JP3428504B2 JP17182499A JP17182499A JP3428504B2 JP 3428504 B2 JP3428504 B2 JP 3428504B2 JP 17182499 A JP17182499 A JP 17182499A JP 17182499 A JP17182499 A JP 17182499A JP 3428504 B2 JP3428504 B2 JP 3428504B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- delimiter
- word
- matching
- template
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Description
力された文字又は文字列画像から文字又は文字列を自動
認識する文字認識装置に関する。
光学的に読み取り画像情報として入力された単語画像情
報から単語を自動認識し文字コード情報等に自動変換す
る方法として、従来、認識対象とする単語画像情報(文
字又は文字列情報)全体を、1つの画像単位として、辞
書に予め登録しておき、入力された単語画像と、辞書の
画像情報を比較照合することで、単語認識が行われてい
た。
字を切り出す必要がないため、処理速度は、単語の文字
長とは無関係とされ、単語認識処理の高速化が可能であ
るほか、隣接文字間に接触等が生じ、文字を切り出すこ
とが困難とされている単語画像の認識も行うことができ
るという利点を有している。
文献(TinKam Ho,Jonathan J.Hull and Sargur N.
srihari, "A word shape analysis approach to l
exicon based word recognition",PRL 13(1992)pp.
821-826)等の記載が参照される。上記文献に記載され
た単語認識システムは、画像入力手段から入力された英
単語画像情報を入力とし、表記された英単語を自動認識
して出力するものであり、入力画像から特徴量を抽出す
る特徴抽出手段と、認識対象となる英単語画像の特徴量
を予め登録しておくための辞書を構成する記憶装置と、
入力画像から抽出された特徴量と辞書の内容とを照合す
る照合手段と、を備えている。照合手段は、入力画像か
ら抽出された特徴量と、辞書に登録された画像の特徴量
とを比較し、比較の結果、特徴量の近い英単語を出力す
る。
図14において、符号510は入力画像、符号514は
辞書(不図示)に登録された単語画像(「辞書画像」と
いう)を示している。例えば、入力画像510を辞書画
像514と照合する場合、入力画像の4隅、すなわち5
01、502、503、504と、辞書画像の4隅、す
なわち505、506、507、508とが一致するよ
うに、入力画像510を相似変換してから、両者を照合
する。
た従来の手法は、下記記載の問題点を有している。
位として認識を行うため、単語内での文字の位置の変動
があると認識精度が低下する、ということである。より
詳細には、例えば英文字では、文字の横幅がフォントと
カテゴリによって大きく変動するため、単語内での各文
字の位置も様々に変動する。このため、単語内での文字
の位置の変動があると、入力画像から抽出された特徴の
位置と、記憶装置に登録されている辞書画像の特徴の位
置との間に、大きなずれが生じることになる。これによ
り認識精度が低下してしまう。
を図るために、入力単語画像と辞書の情報との照合の際
に、網羅的な位置合わせを行う場合、演算量が増大し、
処理時間が長大化する、ということである。
てなされたものであって、その目的は、文字の位置変動
に対して安定且つ高い認識精度を保つとともに、高速処
理可能な文字認識装置を提供することにある。
明は、入力単語画像中の区切り図形を検出する区切り図
形抽出手段と、前記入力単語画像を前記区切り図形で区
切られた区間に分割する区切り図形照合手段と、前記区
切り図形照合手段で行われた分割を利用して、前記入力
単語画像を辞書記憶手段に予め記憶されている単語画像
テンプレートと照合する画像照合手段と、を備える。
段は、単語画像の黒画素数を列毎にカウントして、縦線
を検出する手段と、前記縦線の周囲の画像を抜き出し、
予め用意された区切り図形を含む画像及び含まない画像
との照合を行う手段と、を備える。
は、網羅的な位置合わせによる画像照合を行う際に、前
記区切り図形照合手段において行われた分割を制約条件
として付与する手段を備える。
の区切り図形を検出する区切り図形抽出手段と、入力単
語画像を区切り図形で区切られた区間に分割する区切り
図形照合手段と、前記区切り図形照合手段で行われた分
割を利用して前記入力単語画像の区間単位に辞書記憶手
段に予め記憶された単語画像テンプレートと照合する画
像照合手段と、前記画像照合手段の照合結果に基づき分
割をやり直す分割制御手段と、を備える。
する。本発明は、単語画像内の区切り図形により区間分
けを行ってから各区間毎に辞書との照合を行う。より詳
細には、本発明は、その好ましい実施の形態において、
画像入力手段から入力された単語画像に対して、2値
化、正規化等など所定の前処理を行い前処理済みの画像
(「前処理後画像」という)を出力する前処理手段(図
1の21)と、前処理後画像から区切り図形を抽出する
区切り図形抽出手段(図1の22)と、抽出された区切
り図形の位置及び種類を単語画像記憶部(図1の31)
に予め登録された区切り図形の位置及び種類と照合し、
前処理後画像の分割を行う区切り図形照合手段(図1の
23)と、該区切り図形照合手段によって分割された前
処理後画像と、該単語画像記憶部に予め登録された単語
画像との間で対応する区間毎に画像照合を行う画像照合
手段(図1の24)とを有する。
理後画像と単語画像記憶部に予め登録された単語画像と
の間で網羅的な位置あわせによる照合を行うものであ
り、区切り図形照合手段(図7の23)によって行われ
た分割を制約条件として利用することにより、網羅的な
位置あわせによる照合を、制約条件が無い場合に比べ少
ない計算量で実現する第2の画像照合手段2(図7の5
4)を有する。
て、画像照合手段(図11の24)での前処理画像の各
部分画像毎の照合結果から、区切り図形照合手段(図1
1の23)における分割が適切か否か判定し、不適な分
割箇所が存在する場合、区切り図形照合手段で分割を変
更し、画像照合手段(図11の24)に再び画像照合を
行わせるように制御する分割制御手段(図11の66)
を備える。
において、画像入力手段から入力された文字又は文字列
を含む単語画像情報から該文字又は文字列を自動認識す
る処理を実行するコンピュータにおいて、(a)前記入
力された単語画像情報に対して、2値化、正規化等の所
定の前処理を施した前処理後画像情報を出力する前処理
処理と、(b)前記前処理後画像情報中に予め定められ
た区切り図形があるか否かを調べ前記区切り図形を抽出
する区切り図形抽出処理と、(c)前記抽出された区切
り図形の位置及び種類を、記憶手段に予め登録された区
切り図形の位置及び種類と照合し、該照合結果に基づ
き、前記前処理後画像情報を複数の部分画像に分割する
区切り図形照合処理と、(d)前記区分された前処理後
画像情報の部分画像と、記憶手段に予め登録されたテン
プレート単語画像との間で対応する部分画像毎に画像の
照合を行う画像照合処理と、を備え、前記(a)乃至
(d)の各処理は、前記コンピュータで実行させるプロ
グラムで実現される。
前記複数の部分画像について、前記処理(c)での前記
入力単語画像の分割を制約条件として、前処理後画像情
報と記憶手段に予め登録された単語画像との間で網羅的
な位置あわせによる照合を行うようにしてもよい。
照合処理(d)での前記前処理後画像の各部分画像毎の
照合結果から、前記前記分割が適切か否か判定し不適な
分割箇所が存在する場合、分割の内容を変更し、変更後
の分割に対応する部分画像について、前記処理(d)で
再び画像照合を行わせる分割制御処理を備えてもよい。
ュータ上で実行させるためのプログラムを記録した記録
媒体から該プログラムを読み出すか、もしくは通信媒体
から該プログラムを読み出して該コンピュータで実行す
ることで本発明を実施することができる。
詳細に説明すべく、本発明の実施例について図面を参照
して詳細に説明する。
す図である。図1を参照すると、本発明の第1の実施例
の単語認識システムは、単語画像を入力する入力装置1
と、プログラム制御により動作するデータ処理装置2
と、情報を記憶する記憶装置3と、出力装置4と、を含
む。
ている。単語画像記憶部31は、認識対象とする全ての
単語に対して、その単語を構成する文字の綴りと、単語
画像と、単語画像内に含まれる区切り図形の位置及び種
類と、単語画像をそこに含まれる区切り図形で分割した
結果得られた部分画像と、を1組とするテンプレートを
予め記憶している。各テンプレートには、識別用にテン
プレート番号が割り付けられている。
62、63として示すように、縦棒に横棒がくっついた
図形(「区切り図形1」という)や、図2に64、65
として示すように、小文字のデセンダがあげられる。こ
こで、説明のため全ての画像には、図5に示すように、
座標系(xy座標)が設定されているものとする。また
図5に560で示す破線は、画像の最小包含長方形を表
している。
6の517、518、519の3つの区切り図形が抽出
されたものとし、この区切り図形のx座標を例えば縦棒
の重心のx座標として定める。そして、この座標が、左
から順に、10、100、600であったとする。
3つのx座標で分割すると、元の画像516は、x座標
が0から10(図6の550)、10から100(図6
の551)、100から600(図6の552)、60
0から1000(図6の553)である4つの部分画像
に分割される。
元の画像516を、区切り図形517、518、519
で分割するといい、得られた部分画像には、左から順に
1、2、3、4と番号を割り振る。
前処理手段21と、区切り図形抽出手段22と、区切り
図形照合手段23と、画像照合手段24とを備える。
れた単語画像に対して、2値化処理、正規化処理等の前
処理を行い、前処理後画像として出力する。
1が出力した前処理後画像の中から、前処理後画像の区
間分けに用いる区切り図形を抽出し、その位置と種類と
を出力する。
出手段22により抽出された区切り図形の位置及び種類
を、単語画像記憶部31に予め登録されている区切り図
形の位置及び種類と登録全単語にわたって照合する。照
合に成功した場合、前処理後画像の分割を行い、テンプ
レート番号と得られた部分画像と出力する。
23により出力された全てのテンプレート番号につい
て、テンプレート番号に対応するテンプレート内の部分
画像を、区切り図形照合手段23により出力された対応
する部分画像とを画像照合する。2つの画像間で画像照
合を行う方法は、公知の各種方法が用いられる。例え
ば、前述の文献(Tin Kam Ho, Jonathan J.Hull a
nd Sargur N.srihari, "Aword shape analysis app
roach to lexicon based word recognition",PRL 1
3(1992)pp.821-826)に記載された方法が用いられる。
を説明するための流れ図である。図1及び図3を参照し
て、本発明の第1の実施例の動作について詳細に説明す
る。
処理手段21に供給される。
に変換する)、大きさの正規化(画像の縦横の比率を一
定にする)などの処理を行い、前処理後画像を生成する
(図3のステップA1)。なお、2値化については画素
値をしきい値と比較して1、0信号に変換する等、公知
の各種方法が用いられる。
の中から区切り図形を抽出する(ステップA2)。区切
り図形の抽出方法は、区切り図形の種類に対応して用い
る。例えば図2に符号64、65で示した区切り図形は
「デセンダ」と呼ばれるものであり、公知の方法で抽出
される。例えば、まず単語画像のベースラインを検出
し、輪郭線の極小点のうちベースラインよりも下にある
ものをデセンダとすることができる。
は、前処理後画像の中に含まれる区切り図形の種類と位
置を抽出する。
うな図形(「区切り図形1」という)は、例えば、次の
ようにして抽出することができる。
形1を抽出する場合について説明する。
縦棒の検出方法としては、例えば、黒画素(2値化され
た画素のうち黒とされた画素)をx軸上に投影し、投影
された黒画素をカウントしてヒストグラムを作成したの
ち、ヒストグラムのピークを探す。更に、探索されたピ
ークのうちヒストグラムの値が閾値以上のもののみを選
ぶ。そして選ばれたピークに対応するx座標を、縦棒の
存在する位置として出力する。
519、及び図6の528から531までの縦棒が検出
できる。
る部分画像と、予め用意したおいたテンプレートと画像
照合を行うことにより、部分画像に区切り図形1が存在
するか否かを判定する。画像照合で用いるテンプレート
は、2カテゴリ分用意する。その1つは、区切り図形1
を含むもの(例えば図6の540)であり、他の1つ
は、区切り図形1を含まないもの(例えば図6の54
1、542)である。
て、区切り図形1を抽出することができる。また2つの
カテゴリに対する相違度も算出しておくものとする。
は、区切り図形1を含むテンプレートに近いので、区切
り図形1であると判定し、図6の528から531は区
切り図形1は含まないテンプレートに近いので、区切り
図形1ではないと判定する。
テゴリに対する相違度が小さいほど近いとすればよい。
形抽出は、文字を切り出すことなく行うことができる。
また処理時間の点からみても、認識対象となるカテゴリ
が2つしかないことから、単語認識システムで行われる
単語照合における認識対象カテゴリ(=単語語彙数)と
比べると小さいため、大きなオーバーヘッドとはならな
い。
出手段22によって抽出された区切り図形の種類及び位
置を、単語画像記憶部31(単語辞書)内の1つのテン
プレートの図形の種類及び位置と照合する(ステップA
3)。
して示すものであるとする。そして、この前処理後画像
516から抽出される区切り図形は、図6の517、5
18、519の3つとする。そして、その種類はいずれ
も区切り図形1で、x座標が左から10、100、60
0であるものとする。
像521が単語画像としてテンプレートに登録されてお
り、また図4の画像521に含まれる区切り図形とし
て、図4の525、526、527の3つが、その種類
(3つとも区切り図形1)と位置(左からx座標が2
0、150、800)と共に登録されているものとす
る。
ものが用いられるが、例えば、前処理後画像から得られ
た区切り図形の数と種類が、テンプレートに登録された
区切り図形と同一のとき、照合に成功したものとするこ
とができる(ステップA4)。照合に失敗すればステッ
プA6へすすむ。
ンプレートに登録された単語画像との間で画像照合を行
う(ステップA5)。
前処理後画像516と、図4のテンプレート画像521
とを照合するのではなく、前処理画像516の部分画像
1とテンプレート画像521の部分画像1、前処理画像
516の部分画像2とテンプレート画像521の部分画
像2、というように、前処理画像とテンプレート画像の
対応する部分画像毎の照合を行う。
は、前処理画像516のうちx座標が0から10の部分
を抜き出した画像のことであり、テンプレート画像52
1の部分画像1とは、テンプレート画像521のうちx
座標が0から20の部分を抜き出した画像のことであ
る。
で、縦横比を合わせてから、照合を行い、相違度を求め
る。
い、各部分画像の相違度から、画像全体の相違度を求め
る。例えば、部分画像の相違度を算術平均することによ
って求めることができる。
の数だけステップA3からA5の処理を繰り返し(ステ
ップA6)、すべてのテンプレートに対して処理が終了
したら結果を出力して終了する(ステップA7)。
ついて説明する。
文字を切り出すことなく、単語認識を行うことができる
ので、単語認識の速度は単語の長さと関係無く高速で、
文字切り出しの難しい単語画像も認識することができ
る。
と、例えば図14を参照すると、前処理後画像510
を、テンプレート画像514と縦横比を合わせて画像照
合していたため、左端(図14の512)と右端(図1
4の513)は一致しても、単語画像の内部では、例え
ば図14の511に示す「I」の字のように、位置がず
れて精度が低下する場合がある。
画像514の区切り図形を利用して、画像510と画像
514の代わりに、図4の画像520と図4の画像52
1とを画像照合するため、位置ずれによる認識精度の低
下を低減することができる。
する。図7は、本発明の第2の実施例の構成を示す図で
ある。図7を参照すると、本発明の第2の実施例は、図
1に示した前記第1の実施例のデータ処理装置2におい
て、画像照合手段24が、第2の画像照合手段54で置
き換えたものである。
合手段23により出力された全てのテンプレート番号に
ついて、テンプレート番号に対応するテンプレート内の
単語画像と、前処理後画像との間で網羅的な位置合わせ
による照合を行う。
を示す流れ図である。図7及び図8を参照して、本発明
の第2の実施例の動作について詳細に説明する。図8に
おいて、ステップA1〜A7の各処理は、図3のステッ
プA1〜A7の各処理と同一であり、ステップA4の判
定の結果、ステップB5が実行される点が相違してい
る。すなわち、図8のステップB5で示される図7の第
2の画像照合手段54の動作以外は、前記第1の実施例
における各手段21、22、23の動作と同一のため、
説明は省略する。
4では、前処理後画像と、テンプレート内の部分画像と
を、区切り図形照合手段23によって得られた部分画像
毎に照合していた。しかしながら、区切り図形の位置検
出に誤差があったり、図9に、入力後画像570と、テ
ンプレート画像521として示すように、区切り図形の
位置を合わせてもなお、図9の573に示される「LとS
の境目」のように位置ずれが残る場合もある。
置ずれを網羅的な位置合わせによる照合を行うことで吸
収する。以下に詳説する。
素値をP1(x,y)、画像521の画素値をP2(x,y)とす
る。画像570と画像521の照合を行うにあたって、
まず画像570のうちx座標がx1である1列と、画像
521のうちx座標がx2である1列の相違度f(x1,x
2)を次式(1)で定義する。
2以下の全ての整数iに対するp3(i)の値の総和を
表わしている。|P1(x1,i)-P2(x2,i)|は、P1(x1,i)とP2
(x2,i)の距離である。
下の部分と、画像521のx座標が0以上x2以下の部
分との相違度g(x1,x2)を次式(2)で定義する。
る。
像521の相違度となる。
と同じである。この場合は、図10において、(0,0)、
(1000,0)、(1000,1000)、(0,1000)の4つの点からなる
四角形の内側にあるすべての座標に対してg(x1,x2)を計
算する必要がある。
よって照合された区切り図形の位置を利用して、この計
算を高速化する。
て、画像570と画像521の間で3つの区切り図形が
共通して存在し、そのx座標が画像570においては、 C(1),C(2),C(3)、 画像521においては、 D(1),D(2),D(3) と出力されたとする。
(D(i)-M,0)]、及び、[min(D(i)+M,1000),1000]内の全て
の整数yに対し、 g(C(i),y)=+∞(i=1,2,3)、 という制約条件を付け加える。
を許容するためのマージンであり、例えばM=5とするこ
とができる。
2)を計算する必要がある座標を、図10の領域560に
制限することができる。
説明する。
書画像との間で、網羅的な位置合わせによる照合を行う
ため、位置ずれに対応することができ、かつ、共通して
存在する区切り図形を利用して照合範囲に制約条件を付
け加えているため、そのような制約条件がない場合とく
らべて、高速に実行することができる。
する。図11は、本発明の第3の実施例の構成を示す図
である。図11を参照すると、本発明の第3の実施例
は、図1に示した前記第1の実施例と比べ、データ処理
装置2の構成に加えて、分割制御手段66を備えてい
る。
よる各部分画像毎の照合結果から、区切り図形照合手段
23において過分割(過度な分割)が行われている可能
性のある個所を検出し、分割を変更して画像照合手段2
4に再び画像照合を行わせる。
順を示す流れ図である。図11及び図12を参照して、
本発明の第3の実施例の動作について詳細に説明する。
図11において、ステップA1〜A7の各処理は、図3
のステップA1〜A7の各処理と同一である。ステップ
C8、C9で示される、図12の分割制御手段66の動
作以外は、前記第1の実施例における各手段21、2
2、23の動作と同一のため、説明は省略する。
よって出力された画像全体に対する相違度のうち最も小
さいものが予め定められたしきい値よりも大きい場合、
画像の分割を変更する(ステップC8)。
区切り図形571、572、573、574が抽出され
ていたとする。このうち、区切り図形573は、ノイズ
の影響等により、誤って区切り図形として抽出されてし
まったものである。
図形抽出手段22によって抽出された区切り図形のう
ち、区切り図形を含む画像への相違度が最も大きな区切
り図形を選び、区切り図形抽出手段22によって抽出さ
れた区切り図形の中からそれを取り除き、ステップA3
へすすむ(ステップC9)。
しては、「L」の中央部から右側に横棒が伸びること
は、英文字では不自然であることから、区切り図形57
3が区切り図形を含む画像への相違度が最も大きな区切
り図形として選ばれたとする。
形573を除いた、区切り図形571、572、574
だけが抽出されたものとして、区切り図形照合手段23
に処理を引き渡たし、区切り固形照合手段23では区切
り図形571、572、574と単語画像記憶部31の
区切り図形とを照合して、部分画像に分割する。
ついて説明する。
施例の効果に加え、ノイズ等の影響により誤って区切り
図形が検出されてしまった場合に起こる、認識性能の低
下を軽減することができる。
記記載の効果を奏する。
単語の長さと関係無く高速に行なうことができるととも
に、文字切り出しの難しい単語画像も認識することがで
きる、ということである。
から文字を切り出すことなく、単語認識を行うためであ
る。
像照合するとき、単語画像内の文字の位置ずれによる画
像照合精度の低下を軽減するとともに、認識処理速度度
を高速化する、ということである。
から目印となる区切り図形を抽出して単語画像を分割
し、分割された部分画像単位で画像照合を行う、構成と
したためである。
像との間で、網羅的な位置合わせによる照合を行うた
め、位置ずれに対応することができるとともに、共通し
て存在する区切り図形を利用して照合範囲に制約条件を
付加しているため、照合処理を高速化する、ということ
である。
を示す図である。
流れ図である。
ための図である。
る座標系について説明するための図である。
説明するための図である。
ための流れ図である。
ための図であり、画像例を示す図である。
果を説明するための図である。
る。
の流れ図である。
るための図であり、画像例を示す図である。
るための図である。
70 単語画像 511〜513 単語画像510と単語画像514の対
応する位置を表す矢印 517〜519 単語画像516に含まれる区切り図形 528〜531 単語画像516に含まれる非区切り図
形 522〜524 単語画像520と単語画像521の対
応する位置を表す矢印 525〜527 単語画像521に含まれる区切り図形 540 区切り図形テンプレート 541、542 非区切り図形テンプレート 550〜553 単語画像516の分割 560 第2の実施例によって計算対象となる座標の領
域 571〜574 単語画像570に含まれる区切り図形 61〜65 区切り図形
Claims (7)
- 【請求項1】入力単語画像中の区切り図形を検出する区
切り図形抽出手段と、 前記入力単語画像を前記区切り図形で区切られた区間に
分割する区切り図形照合手段と、 前記区切り図形照合手段で行われた分割を利用して、前
記入力単語画像を辞書記憶手段に予め記憶されている単
語画像テンプレートと照合する画像照合手段と、 を備え、 前記区切り図形抽出手段が、前記入力単語画像中の黒画
素数を列毎に計数して縦線を検出する手段と、 前記縦線の周囲の画像を抜き出して該抜き出た画像を予
め用意された区切り図形を含む画像及び含まない画像と
照合する手段と、 を備え たことを特徴とする文字認識装置。 - 【請求項2】前記画像照合手段が、網羅的な位置合わせ
による画像照合を行う際に、前記区切り図形照合手段に
おいて行われた分割を制約条件として付与する手段を備
えたことを特徴とする請求項1記載の文字認識装置。 - 【請求項3】予め定められた区切り図形の位置及び種類
を予め登録しておくとともに、入力単語画像の照合に用
いられるテンプレート単語画像を予め登録しておく記憶
手段と、 画像入力手段から入力された文字又は文字列を含む単語
画像情報に対して所定の前処理を施してなる前処理後画
像情報を出力する前処理手段と、 前記前処理後画像情報中に予め定められた区切り図形が
あるか否かを調べ前記区切り図形を抽出する区切り図形
抽出手段と、 前記図形抽出手段で抽出された区切り図形の位置及び種
類を、前記記憶手段に予め登録された区切り図形の位置
及び種類と照合し、該照合結果に基づき、前記前処理後
画像情報を複数の部分画像に分割する区切り図形照合手
段と、 前記区切り図形照合手段によって区分された前処理後画
像の部分画像と、前記記憶手段に予め登録されたテンプ
レート単語画像との間で対応する部分画像毎に画像の照
合を行う画像照合手段と、 を備え、 前記区切り図形抽出手段が、前記前処理後画像の2次元
画像の中からy軸方向の縦棒を検出し、その際、2値化
された画素のうち黒画素をx軸上に投影し、投影された
黒画素のヒストグラムを作成し、前記ヒストグラムのピ
ークを探し、該探索されたピークのうちヒストグラムの
値が予め定められた閾値以上のもののみを選択し、選ば
れたピークに対応するx座標を、縦棒の存在する位置と
して出力し、検出された縦棒をそれぞれ中心とする部分
画像と、予め用意しておいたテンプレート画像との照合
を行うことにより、前記部分画像に区切り図形が存在す
るか否かを判定する、 ことを特徴とする文字認識装置。 - 【請求項4】予め定められた区切り図形の位置及び種類
を予め登録しておくとともに、入力単語画像の照合に用
いられるテンプレート単語画像を予め登録しておく記憶
手段と、 画像入力手段から入力された文字又は文字列を含む単語
画像情報に対して所定の前処理を施した前処理後画像情
報を出力する前処理手段と、 前記前処理後画像情報中に予め定められた区切り図形が
あるか否かを調べ前記区切り図形を抽出する区切り図形
抽出手段と、 前記図形抽出手段で抽出された区切り図形の位置及び種
類を、前記記憶手段に予め登録された区切り図形の位置
及び種類と照合し、該照合結果に基づき、前記前処理後
画像情報を複数の部分画像に分割する区切り図形照合手
段と、 前記区切り図形照合手段により出力された複数の部分画
像について、前記区切り図形照合手段による前記入力単
語画像の分割を制約条件として、前処理後画像情報と前
記記憶手段に予め登録されたテンプレート単語画像との
間で網羅的な位置合わせによる照合を行う画像照合手段
と、 を備え、 前記区切り図形抽出手段が、前記前処理後画像の2次元
画像の中からy軸方向 の縦棒を検出し、その際、2値化
された画素のうち黒画素をx軸上に投影し、投影された
黒画素のヒストグラムを作成し、前記ヒストグラムのピ
ークを探し、該探索されたピークのうちヒストグラムの
値が予め定められた閾値以上のもののみを選択し、選ば
れたピークに対応するx座標を、縦棒の存在する位置と
して出力し、検出された縦棒をそれぞれ中心とする部分
画像と、予め用意しておいたテンプレート画像との照合
を行うことにより、前記部分画像に区切り図形が存在す
るか否かを判定する、 ことを特徴とする文字認識装置。 - 【請求項5】前記画像照合手段での前記前処理後画像の
各部分画像毎の照合結果から、前記区切り図形照合手段
における分割が適切か否か判定し、不適な分割箇所が存
在する場合、分割を変更して前記画像照合手段に再び画
像照合を行わせるように制御する分割制御手段を備えた
ことを特徴とする請求項3又は4記載の文字認識装置。 - 【請求項6】前記記憶手段には、認識対象とする全ての
単語に対して、該単語を構成する文字綴りと、単語画像
と、単語画像内に含まれる区切り図形の位置及び種類
と、前記単語画像を区切り図形で分割した結果得られる
部分画像とを組とするテンプレートを予め記憶し、前記
テンプレートには、識別用にテンプレート番号が割り振
られている、ことを特徴とする請求項3乃至5のいずれ
か一に記載の文字認識装置。 - 【請求項7】画像照合で用いるテンプレート単語情報と
して、予め定められた区切り図形を含むものと前記区切
り図形を含まないものの2カテゴリを用意しておき、前
記前処理後画像情報の部分画像について前記区切り図形
を含むテンプレートに近い場合には区切り図形と判定
し、区切り図形を含まないテンプレートに近い場合、区
切り図形ではないと判定する、ことを特徴とする請求項
3又は4記載の文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP17182499A JP3428504B2 (ja) | 1999-06-18 | 1999-06-18 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP17182499A JP3428504B2 (ja) | 1999-06-18 | 1999-06-18 | 文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001005913A JP2001005913A (ja) | 2001-01-12 |
JP3428504B2 true JP3428504B2 (ja) | 2003-07-22 |
Family
ID=15930433
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP17182499A Expired - Fee Related JP3428504B2 (ja) | 1999-06-18 | 1999-06-18 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3428504B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6621151B2 (ja) * | 2018-05-21 | 2019-12-18 | Necプラットフォームズ株式会社 | 情報処理装置、システム、方法及びプログラム |
-
1999
- 1999-06-18 JP JP17182499A patent/JP3428504B2/ja not_active Expired - Fee Related
Non-Patent Citations (5)
Title |
---|
D−12−18 区切り図形を用いた印刷英単語大分類方式,1999年電子情報通信学会情報・システムサイエティ大会,日本,1999年 8月16日,p.182 |
PRMU98−161 セグメンテーションの負荷を軽減した手書き住所認識,電子情報通信学会技術研究報告,日本,1998年12月18日,Vol.98 No.490,pp.87−93 |
PRMU99−240 特定形状を用いた印刷単語大分類,電子情報通信学会技術研究報告,日本,2000年 2月,pp.67−72 |
キー文字駆動型地名推論に基づく手書きあて名認識,電子情報通信学会論文誌,日本,1997年 5月,Vol.J80−D−II No.5,pp.1077−1085 |
パターン整合法による手書き文字列の分類実験,電子情報通信学会論文誌,日本,1997年 5月,Vol.J80−D−II No.5,pp.1326−1328 |
Also Published As
Publication number | Publication date |
---|---|
JP2001005913A (ja) | 2001-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5410611A (en) | Method for identifying word bounding boxes in text | |
KR100658119B1 (ko) | 문자 인식 장치 및 방법 | |
US5539841A (en) | Method for comparing image sections to determine similarity therebetween | |
US7630551B2 (en) | Method and system for line extraction in digital ink | |
US7162086B2 (en) | Character recognition apparatus and method | |
JP4280355B2 (ja) | 文字認識装置 | |
US11551461B2 (en) | Text classification | |
Baird | Global-to-local layout analysis | |
Cao et al. | Robust page segmentation based on smearing and error correction unifying top-down and bottom-up approaches | |
JP3428504B2 (ja) | 文字認識装置 | |
Kumar et al. | Line based robust script identification for indianlanguages | |
JP2008084105A (ja) | 文字切出方法及び文字認識装置 | |
JP2751865B2 (ja) | 文字列認識装置 | |
JP2917427B2 (ja) | 図面読取装置 | |
JPH06180771A (ja) | 英文字認識装置 | |
Chen et al. | Detection and location of multicharacter sequences in lines of imaged text | |
JP3197441B2 (ja) | 文字認識装置 | |
JP2906758B2 (ja) | 文字読取装置 | |
JP3710164B2 (ja) | 画像処理装置及び方法 | |
JP2576350B2 (ja) | 文字列抽出装置 | |
JPH0652358A (ja) | 文字認識方法 | |
Leedham et al. | Isolating individual handwritten characters | |
JP2866920B2 (ja) | 標準パターン作成方法及び装置並びに文字認識装置及び方法 | |
JP2972443B2 (ja) | 文字認識装置 | |
JP2963474B2 (ja) | 類似文字識別方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20030415 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090516 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100516 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110516 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110516 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120516 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120516 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130516 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140516 Year of fee payment: 11 |
|
LAPS | Cancellation because of no payment of annual fees |