JPH04289989A - 英文字認識装置 - Google Patents
英文字認識装置Info
- Publication number
- JPH04289989A JPH04289989A JP3054469A JP5446991A JPH04289989A JP H04289989 A JPH04289989 A JP H04289989A JP 3054469 A JP3054469 A JP 3054469A JP 5446991 A JP5446991 A JP 5446991A JP H04289989 A JPH04289989 A JP H04289989A
- Authority
- JP
- Japan
- Prior art keywords
- character
- word
- recognition
- characters
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000605 extraction Methods 0.000 claims description 14
- 230000007423 decrease Effects 0.000 abstract description 2
- 238000009795 derivation Methods 0.000 abstract 1
- 238000000034 method Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
Landscapes
- Character Discrimination (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【0001】
【産業上の利用分野】本発明は、英文字の認識を行なう
英文字認識装置に関するものである。
英文字認識装置に関するものである。
【0002】
【従来の技術】近年、文字認識装置をコンピュータ等の
入力装置として利用する要求が高まっており、安定な認
識結果を効率的に得ることのできる文字認識装置がコン
ピュータ等のシステムの性能向上に不可欠となっている
。
入力装置として利用する要求が高まっており、安定な認
識結果を効率的に得ることのできる文字認識装置がコン
ピュータ等のシステムの性能向上に不可欠となっている
。
【0003】このとき、従来の認識装置は、文書中の全
ての文字の認識処理を、認識対象としている全ての文字
の中から選び出すことにより行っていた。
ての文字の認識処理を、認識対象としている全ての文字
の中から選び出すことにより行っていた。
【0004】
【発明が解決しようとする課題】上記で説明したように
従来の文字認識装置は、文書中の全ての認識処理を、認
識対象としている全ての文字の中から選び出すことによ
り行っていたため、選出するための比較処理の回数が多
く、処理時間の増大を招いていた。また、認識対象文字
の中には形状が類似している文字、たとえば‘英文字の
O’と‘数字の0’や、‘英文字のl’と‘数字の1’
などが含まれており、それら相互間での誤認識による認
識率の低下が問題となっていた。
従来の文字認識装置は、文書中の全ての認識処理を、認
識対象としている全ての文字の中から選び出すことによ
り行っていたため、選出するための比較処理の回数が多
く、処理時間の増大を招いていた。また、認識対象文字
の中には形状が類似している文字、たとえば‘英文字の
O’と‘数字の0’や、‘英文字のl’と‘数字の1’
などが含まれており、それら相互間での誤認識による認
識率の低下が問題となっていた。
【0005】本発明は上記問題を解決するもので、比較
処理の回数を軽減し処理時間の短縮を図ることができる
とともに、誤認識を抑えるのに役立つ英文字認識装置を
提供することを目的とするものである。
処理の回数を軽減し処理時間の短縮を図ることができる
とともに、誤認識を抑えるのに役立つ英文字認識装置を
提供することを目的とするものである。
【0006】
【課題を解決するための手段】上記課題を解決するため
に、本発明の英文字認識装置は、文字領域切り出し部か
ら切り出された文字領域の先頭の文字画像より、英単語
の綴りを木構造にて表現した英単語辞書をもとに後続の
認識対象文字を求める認識対象文字決定部を設け、文字
領域の画像とこの認識対象文字決定部にて限定された認
識対象文字を比較し、それらの間の類似度を求め認識結
果を決定する文字認識部とを備えたものである。
に、本発明の英文字認識装置は、文字領域切り出し部か
ら切り出された文字領域の先頭の文字画像より、英単語
の綴りを木構造にて表現した英単語辞書をもとに後続の
認識対象文字を求める認識対象文字決定部を設け、文字
領域の画像とこの認識対象文字決定部にて限定された認
識対象文字を比較し、それらの間の類似度を求め認識結
果を決定する文字認識部とを備えたものである。
【0007】
【作用】上記構成により、文字の認識処理を行う度毎に
英単語の綴り情報をもとに認識対象とする文字は限定さ
れ、この限定された認識対象文字と文字領域の画像が比
較されることにより、認識結果となる文字の選出のため
の比較処理の回数は軽減し、処理時間は短縮されるとと
もに、類似文字の誤認識は抑えられ認識率は向上される
。
英単語の綴り情報をもとに認識対象とする文字は限定さ
れ、この限定された認識対象文字と文字領域の画像が比
較されることにより、認識結果となる文字の選出のため
の比較処理の回数は軽減し、処理時間は短縮されるとと
もに、類似文字の誤認識は抑えられ認識率は向上される
。
【0008】
【実施例】以下、本発明の一実施例を図面とともに説明
する。図1において、1は認識対象文書を文書画像とし
て入力する画像入力部、2は入力された文書画像から文
字列の集まりを見つけ、文章領域を出力する文章領域切
り出し部、3は文章領域から単語単位の区切りを見つけ
1つの単語の範囲を単語領域として出力する単語切り出
し部、4は単語領域から文字単位の区切りを見つけ1つ
の文字の範囲を文字領域として出力する文字領域切り出
し部である。5は文字領域内の画像の図形特徴と認識対
象となっている文字の認識辞書6を比較し、それらの間
の類似度を求め、認識結果を決定する文字認識部であり
、認識辞書6は認識対象となる全ての文字の図形特徴を
もとにあらかじめ用意されている。7は英単語の綴りを
木構造にて表現した英単語辞書8をもとに認識対象文字
を求める認識対象文字決定部であり、文字領域内の先頭
の文字画像を認識したら、その文字に引き続いて単語を
構成する文字として配置される可能性のある認識対象文
字を英単語辞書8から求め、認識辞書6の認識対象とな
る文字を選択する。9は1〜5の各部をつなぐ内部バス
、10,11,12はそれぞれ5と6、5と7、7と8
をつなぐ内部バスである。
する。図1において、1は認識対象文書を文書画像とし
て入力する画像入力部、2は入力された文書画像から文
字列の集まりを見つけ、文章領域を出力する文章領域切
り出し部、3は文章領域から単語単位の区切りを見つけ
1つの単語の範囲を単語領域として出力する単語切り出
し部、4は単語領域から文字単位の区切りを見つけ1つ
の文字の範囲を文字領域として出力する文字領域切り出
し部である。5は文字領域内の画像の図形特徴と認識対
象となっている文字の認識辞書6を比較し、それらの間
の類似度を求め、認識結果を決定する文字認識部であり
、認識辞書6は認識対象となる全ての文字の図形特徴を
もとにあらかじめ用意されている。7は英単語の綴りを
木構造にて表現した英単語辞書8をもとに認識対象文字
を求める認識対象文字決定部であり、文字領域内の先頭
の文字画像を認識したら、その文字に引き続いて単語を
構成する文字として配置される可能性のある認識対象文
字を英単語辞書8から求め、認識辞書6の認識対象とな
る文字を選択する。9は1〜5の各部をつなぐ内部バス
、10,11,12はそれぞれ5と6、5と7、7と8
をつなぐ内部バスである。
【0009】このように構成された本実施例の英文字認
識装置について、図2に示した全体の処理の流れ図、図
3に示した英単語辞書8の一部を用いて、以下その動作
を説明する。
識装置について、図2に示した全体の処理の流れ図、図
3に示した英単語辞書8の一部を用いて、以下その動作
を説明する。
【0010】まず認識したい文書を画像入力部1により
文書画像として入力する(ステップ13)。入力された
文書画像を文章領域切り出し部2に送り、文章領域切り
出し部2にて文書画像の縦方向および横方向の黒画素の
ヒストグラムを求め、これをもとに文章領域を見つけ、
そして文章領域の位置情報を内部データとして蓄える(
ステップ14)。
文書画像として入力する(ステップ13)。入力された
文書画像を文章領域切り出し部2に送り、文章領域切り
出し部2にて文書画像の縦方向および横方向の黒画素の
ヒストグラムを求め、これをもとに文章領域を見つけ、
そして文章領域の位置情報を内部データとして蓄える(
ステップ14)。
【0011】単語領域切り出し部3に文章領域の位置情
報を送り、文章領域内に対する単語領域切り出し処理を
行う。単語領域切り出し部3では単語の前後のスペース
が単語内の文字間よりも大きいことに注目し、ある幅以
上のスペースに挟まれた文字列を単語領域として切り出
し、文章領域切り出し部2にて見つけられた文章領域内
の全ての単語領域の位置情報を求め、内部データとして
蓄える(ステップ15)。
報を送り、文章領域内に対する単語領域切り出し処理を
行う。単語領域切り出し部3では単語の前後のスペース
が単語内の文字間よりも大きいことに注目し、ある幅以
上のスペースに挟まれた文字列を単語領域として切り出
し、文章領域切り出し部2にて見つけられた文章領域内
の全ての単語領域の位置情報を求め、内部データとして
蓄える(ステップ15)。
【0012】文字切り出し部4に単語領域の位置情報を
送り、単語領域に対する文字領域切り出し処理を行う。 文字領域切り出し部4では単語領域内の黒画素のヒスト
グラムの変化に注目し、ヒストグラムがある値以下の部
分を文字と文字の区切りとして単語領域内の文字の連な
りを文字単位に分離し文字領域として切り出し、単語領
域切り出し部3にて見つけられた単語領域内の全ての文
字領域の位置情報を求め、内部データとして蓄える(ス
テップ16)。
送り、単語領域に対する文字領域切り出し処理を行う。 文字領域切り出し部4では単語領域内の黒画素のヒスト
グラムの変化に注目し、ヒストグラムがある値以下の部
分を文字と文字の区切りとして単語領域内の文字の連な
りを文字単位に分離し文字領域として切り出し、単語領
域切り出し部3にて見つけられた単語領域内の全ての文
字領域の位置情報を求め、内部データとして蓄える(ス
テップ16)。
【0013】以上のステップ14からステップ16にて
求められた、文章領域・単語領域・文字領域の位置デー
タをもとに文字の認識処理を行う。認識処理は単語毎に
行われ、ステップ17からステップ29にて1つの単語
が認識される。
求められた、文章領域・単語領域・文字領域の位置デー
タをもとに文字の認識処理を行う。認識処理は単語毎に
行われ、ステップ17からステップ29にて1つの単語
が認識される。
【0014】1つの単語の認識の過程を「queen」
を例として示す。認識処理において2種類のフラグを使
用しており、以下のような意味を持つ。 1.ワードフラグ ... 処理しようとする単語
の認識対象文字を英単語辞書8をもとに限定できるか否
かを示すもので、値「0」は限定できる状態、値「1」
は限定できない状態を表わす。したがって処理しようと
する単語が英単語辞書8に記載されていることを前提と
する場合には、このフラグに「0」をセットし、記載さ
れていないことを前提とする場合には、「1」をセット
することとなる。
を例として示す。認識処理において2種類のフラグを使
用しており、以下のような意味を持つ。 1.ワードフラグ ... 処理しようとする単語
の認識対象文字を英単語辞書8をもとに限定できるか否
かを示すもので、値「0」は限定できる状態、値「1」
は限定できない状態を表わす。したがって処理しようと
する単語が英単語辞書8に記載されていることを前提と
する場合には、このフラグに「0」をセットし、記載さ
れていないことを前提とする場合には、「1」をセット
することとなる。
【0015】2.対象フラグ ... 認識の
際の認識対象文字を全ての文字としたか限定したかを示
すもので、値「0」は全ての文字とした状態、値「1」
は限定した状態を示す。
際の認識対象文字を全ての文字としたか限定したかを示
すもので、値「0」は全ての文字とした状態、値「1」
は限定した状態を示す。
【0016】また、「queen」の左端の文字から順
に第1、2、3、4、5文字とし、その順序にて認識処
理が行われるものとして以下動作を説明する。まずワー
ドフラグに「0」をセットし、これより認識しようとす
る単語が英単語辞書8に記載されていることを前提とし
て、単語の認識処理を行う。なお、この処理は一つの単
語を認識する度に行う(ステップ17)。
に第1、2、3、4、5文字とし、その順序にて認識処
理が行われるものとして以下動作を説明する。まずワー
ドフラグに「0」をセットし、これより認識しようとす
る単語が英単語辞書8に記載されていることを前提とし
て、単語の認識処理を行う。なお、この処理は一つの単
語を認識する度に行う(ステップ17)。
【0017】次にワードフラグが「0」か「1」を判定
し、認識の際の認識対象文字を限定するか否かを決定す
る。ワードフラグが「0」の場合は認識対象文字決定部
7が認識しようとする単語におけるこれまでの認識結果
の履歴により、英単語辞書8をもとに認識対象文字を限
定し(ステップ21)、対象フラグに「1」をセットす
る(ステップ22)。ワードフラグが「1」の場合は認
識対象文字を限定せず(ステップ19)、対象フラグに
「0」をセットする(ステップ20)。ここで、認識し
ようとする文字が第1文字目の場合は無条件に全ての文
字を認識対象とする。これは第1文字目がどのような文
字で始まるかは予測できないためで、第1文字目は常に
全ての文字を認識対象文字として文字認識部5で認識処
理を行う。
し、認識の際の認識対象文字を限定するか否かを決定す
る。ワードフラグが「0」の場合は認識対象文字決定部
7が認識しようとする単語におけるこれまでの認識結果
の履歴により、英単語辞書8をもとに認識対象文字を限
定し(ステップ21)、対象フラグに「1」をセットす
る(ステップ22)。ワードフラグが「1」の場合は認
識対象文字を限定せず(ステップ19)、対象フラグに
「0」をセットする(ステップ20)。ここで、認識し
ようとする文字が第1文字目の場合は無条件に全ての文
字を認識対象とする。これは第1文字目がどのような文
字で始まるかは予測できないためで、第1文字目は常に
全ての文字を認識対象文字として文字認識部5で認識処
理を行う。
【0018】次に認識対象文字の決定の過程を説明する
。この処理は認識対象文字決定部7にて行われ、図3に
示す単語辞書8をもとに認識対象文字が決定される。 英単語辞書8は単語の文字のつながりを木構造で表現し
たもので第1文字、第2文字、第3文字...と辿って
いくことにより注目する位置にどのような文字が当ては
められるかが得られる。たとえば第1文字が「q」の場
合、第2文字に当てはめ可能な文字は「u」のみとなり
、第1・2文字がそれぞれ「q」「u」の場合は第3文
字に当てはめ可能な文字は「a」「e」「i」「o」「
r」となる。
。この処理は認識対象文字決定部7にて行われ、図3に
示す単語辞書8をもとに認識対象文字が決定される。 英単語辞書8は単語の文字のつながりを木構造で表現し
たもので第1文字、第2文字、第3文字...と辿って
いくことにより注目する位置にどのような文字が当ては
められるかが得られる。たとえば第1文字が「q」の場
合、第2文字に当てはめ可能な文字は「u」のみとなり
、第1・2文字がそれぞれ「q」「u」の場合は第3文
字に当てはめ可能な文字は「a」「e」「i」「o」「
r」となる。
【0019】したがって、第1文字の認識結果を「q」
とした場合、第2文字目の認識対象文字は「u」のみと
なり、第1・2文字の認識結果がそれぞれ「q」「u」
の場合は第3文字目の認識対象文字は「a」「e」「i
」「o」「r」となり、認識辞書6の中から選択される
。
とした場合、第2文字目の認識対象文字は「u」のみと
なり、第1・2文字の認識結果がそれぞれ「q」「u」
の場合は第3文字目の認識対象文字は「a」「e」「i
」「o」「r」となり、認識辞書6の中から選択される
。
【0020】以上の処理で決定された認識対象文字は認
識辞書6から文字認識部5に送られ、注目する文字領域
の画像と各認識対象文字との間の形状の類似性を類似度
として求める(ステップ23)。そして各認識対象文字
の中に認識結果として決定するに値する類似度を持つ文
字があるかを判定する(ステップ24)。
識辞書6から文字認識部5に送られ、注目する文字領域
の画像と各認識対象文字との間の形状の類似性を類似度
として求める(ステップ23)。そして各認識対象文字
の中に認識結果として決定するに値する類似度を持つ文
字があるかを判定する(ステップ24)。
【0021】たとえば、第1文字は全ての認識対象文字
との間で類似度を求め、その中から最も形状が類似した
文字、すなわち「q」を認識結果とする。第2文字は第
1文字の認識結果が「q」であるので認識対象文字は「
u」のみとなり、認識辞書6の「u」との間の類似度を
求め、それが認識結果とするに値するものであれば「u
」を認識結果とする。
との間で類似度を求め、その中から最も形状が類似した
文字、すなわち「q」を認識結果とする。第2文字は第
1文字の認識結果が「q」であるので認識対象文字は「
u」のみとなり、認識辞書6の「u」との間の類似度を
求め、それが認識結果とするに値するものであれば「u
」を認識結果とする。
【0022】判定の結果、認識結果が得られた場合はそ
れを出力するとともに認識対象文字決定部に送る(ステ
ップ25)。認識対象文字決定部7ではそれを認識結果
の履歴として蓄える(ステップ26)。
れを出力するとともに認識対象文字決定部に送る(ステ
ップ25)。認識対象文字決定部7ではそれを認識結果
の履歴として蓄える(ステップ26)。
【0023】認識結果が得られなかった場合は処理しよ
うとする単語が単語辞書に記載されていないものと判断
し、以後、この単語の認識処理においては認識対象文字
の限定を行わないためにワードフラグに「1」をセット
する(ステップ27)。その後、対象フラグが「0」か
「1」かを判定し(ステップ28)、「0」の場合はリ
ジェクトコードを認識結果として出力し(ステップ29
)、「1」の場合はステップ18に処理を移し、全ての
文字を認識対象として認識処理をやり直す。
うとする単語が単語辞書に記載されていないものと判断
し、以後、この単語の認識処理においては認識対象文字
の限定を行わないためにワードフラグに「1」をセット
する(ステップ27)。その後、対象フラグが「0」か
「1」かを判定し(ステップ28)、「0」の場合はリ
ジェクトコードを認識結果として出力し(ステップ29
)、「1」の場合はステップ18に処理を移し、全ての
文字を認識対象として認識処理をやり直す。
【0024】以上、ステップ18からステップ29を単
語中の全ての文字が認識されるまで繰り返し(ステップ
30)、ステップ16からステップ30を文書中の全て
の単語が認識されるまで繰り返す(ステップ31)こと
により与えられた文書画像の文字認識処理を行う。
語中の全ての文字が認識されるまで繰り返し(ステップ
30)、ステップ16からステップ30を文書中の全て
の単語が認識されるまで繰り返す(ステップ31)こと
により与えられた文書画像の文字認識処理を行う。
【0025】
【発明の効果】以上説明したように本発明によれば、文
字の認識処理を行う度毎に英単語の綴り情報をもとに認
識対象とする文字を限定することにより、文字の認識処
理の際の比較処理の回数を軽減し、処理時間の短縮を図
るとともに、類似文字の相互間での誤認識を抑え認識率
の向上を図ることができる。
字の認識処理を行う度毎に英単語の綴り情報をもとに認
識対象とする文字を限定することにより、文字の認識処
理の際の比較処理の回数を軽減し、処理時間の短縮を図
るとともに、類似文字の相互間での誤認識を抑え認識率
の向上を図ることができる。
【図1】本発明の一実施例の英文字認識装置の構成図で
ある。
ある。
【図2】図1の英文字認識処理装置の全体の流れ図であ
る。
る。
【図3】単語辞書の内容の一部を示す図である。
1 画像入力部
2 文章領域切り出し部
3 単語領域切り出し部
4 文字領域切り出し部
5 文字認識部
6 認識辞書
7 認識対象文字決定部
8 単語辞書
Claims (1)
- 【請求項1】 認識対象文章を入力する画像入力部と
、入力された文書画像から文章領域を出力する文章領域
切り出し部と、文章領域から単語領域を出力する単語領
域切り出し部と、単語領域から無事領域を出力する文字
領域切り出し部と、英単語の綴りを木構造にて表現した
英単語辞書をもとに認識対象文字を求める認識対象文字
決定部と、文字領域の画像と前記認識対象文字決定部に
て限定された認識対象文字を比較し、それらの間の類似
度を求め認識結果を決定する文字認識部とを備えた英文
字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3054469A JPH04289989A (ja) | 1991-03-19 | 1991-03-19 | 英文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3054469A JPH04289989A (ja) | 1991-03-19 | 1991-03-19 | 英文字認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH04289989A true JPH04289989A (ja) | 1992-10-14 |
Family
ID=12971535
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3054469A Pending JPH04289989A (ja) | 1991-03-19 | 1991-03-19 | 英文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH04289989A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0896085A (ja) * | 1994-09-22 | 1996-04-12 | Ibm Japan Ltd | 文字認識文字補完方法及びコンピュータ・システム |
JPH1185909A (ja) * | 1997-09-03 | 1999-03-30 | Hitachi Ltd | 住所認識方法 |
-
1991
- 1991-03-19 JP JP3054469A patent/JPH04289989A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0896085A (ja) * | 1994-09-22 | 1996-04-12 | Ibm Japan Ltd | 文字認識文字補完方法及びコンピュータ・システム |
US5835635A (en) * | 1994-09-22 | 1998-11-10 | Interntional Business Machines Corporation | Method for the recognition and completion of characters in handwriting, and computer system |
JPH1185909A (ja) * | 1997-09-03 | 1999-03-30 | Hitachi Ltd | 住所認識方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8510099B2 (en) | Method and system of selecting word sequence for text written in language without word boundary markers | |
US7162086B2 (en) | Character recognition apparatus and method | |
JPH11120293A (ja) | 文字認識/修正方式 | |
Feild et al. | Improving open-vocabulary scene text recognition | |
US20180260652A1 (en) | Computer implemented method and system for optical character recognition | |
JPH04289989A (ja) | 英文字認識装置 | |
CN115909381A (zh) | 一种文本图像识别方法、系统及相关装置 | |
US8472719B2 (en) | Method of stricken-out character recognition in handwritten text | |
US20220067107A1 (en) | Multi-section sequential document modeling for multi-page document processing | |
Gao et al. | A segmentation algorithm for handwritten Chinese character strings | |
JP2001022883A (ja) | 文字認識方式及び該文字認識方式の機能を実現させるための記録媒体 | |
JPH04306786A (ja) | 文字認識装置 | |
JPH11328315A (ja) | 文字認識装置 | |
JPH0528324A (ja) | 英文字認識装置 | |
JP2746345B2 (ja) | 文字認識の後処理方法 | |
US20100254606A1 (en) | Method of recognizing text information from a vector/raster image | |
JP3116452B2 (ja) | 英文字認識装置 | |
JP3595081B2 (ja) | 文字認識方法 | |
JP3116453B2 (ja) | 英文字認識装置 | |
JPH11120294A (ja) | 文字認識装置および媒体 | |
JPH0468483A (ja) | 文字認識方法 | |
JPH04372087A (ja) | 英文字認識装置 | |
JP5672003B2 (ja) | 文字認識処理装置及びプログラム | |
JPH02230484A (ja) | 文字認識装置 | |
JPH10334190A (ja) | 文字認識方法、装置および記録媒体 |