JPH0528324A - 英文字認識装置 - Google Patents

英文字認識装置

Info

Publication number
JPH0528324A
JPH0528324A JP3182204A JP18220491A JPH0528324A JP H0528324 A JPH0528324 A JP H0528324A JP 3182204 A JP3182204 A JP 3182204A JP 18220491 A JP18220491 A JP 18220491A JP H0528324 A JPH0528324 A JP H0528324A
Authority
JP
Japan
Prior art keywords
character
recognition
area
unit
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3182204A
Other languages
English (en)
Inventor
Michiaki Nobuoka
道明 信岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP3182204A priority Critical patent/JPH0528324A/ja
Publication of JPH0528324A publication Critical patent/JPH0528324A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 本発明は、英文字の認識処理の軽減化・処理
時間の短縮化を図るとともに認識精度を著しく向上させ
た英文字認識装置の提供を目的とする。 【構成】 文書を入力する画像入力部と、入力された文
書画像から文書領域を出力する文章領域切出部と、文章
領域から単語領域を出力する単語領域切出部と、単語領
域から文字領域を出力する文字領域切出部と、切り出さ
れた文字領域の画像から文字を記憶している認識辞書を
基に認識を行う文字認識部と、この文字認識部と文字領
域切出部より得られる文字認識情報、文字領域切り出し
情報を蓄える文字情報格納部と、英単語の綴りを記憶し
ている単語辞書を基に認識候補文字列を決定する認識候
補文字列決定部と、この認識候補文字列決定部・文字領
域切出部・文字認識部を制御し認識文字コードを決定す
る制御部と、決定した認識文字コードを出力する出力部
と、を備えた英文字認識装置。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は英文字の認識を行う英文
字認識装置に関するものである。
【0002】
【従来の技術】近年、文字認識装置を電子計算機等の入
力装置として利用する要求が高まっており、安定な認識
結果を効率的に得ることが出来る文字入力装置が電子計
算機等のシステムの性能向上に不可欠となっている。
【0003】以下に従来の英文字認識装置について説明
する。従来の認識装置は、文字領域の画像と認識辞書と
の照合により認識を行っている。この認識において、認
識確度が低い場合、正しく文字領域が切り出されていな
いとし、再度この領域に対して文字領域の切り出しを行
い、認識を行うことにより、認識結果を求めていた。
【0004】
【発明が解決しようとする課題】しかしながら上記従来
の構成では、英文は文字間隔が一定でなく、また英文字
は字種、フォントにより文字幅が異なるため、接触ある
いは文字切れが存在する文字の文字領域を切り出すには
多くの処理工程を要し、処理に時間を要するとともに、
誤った位置で文字領域を切り出すことがあり、認識精度
が低いという問題点を有していた。
【0005】本発明は上記従来の問題点を解決するもの
で、英文字の認識処理の軽減化を図り処理時間を短縮す
るとともに認識精度を著しく向上させた英文字認識装置
を提供することを目的とする。
【0006】
【課題を解決するための手段】この目的を達成するため
に本発明の請求項1の英文字認識装置は、認識対象文書
を入力する画像入力部と、入力された文書画像から文章
領域を出力する文章領域切り出し部と、文章領域から単
語領域を出力する単語領域切り出し部と、単語領域から
文字領域を出力する文字領域切り出し部と、切り出され
た文字領域の画像から文字を記憶している認識辞書を基
に認識を行う文字認識部と、この文字認識部及び前記文
字領域切り出し部より得られる文字認識情報、文字領域
切り出し情報を蓄える文字情報格納部と、英単語の綴り
を記憶している単語辞書を基に認識候補文字列を決定す
る認識候補文字列決定部と、この認識候補文字列決定部
・前記文字領域切り出し部・前記文字認識部の制御を行
い認識文字コードを決定する制御部と、決定した認識文
字コードを出力する出力部と、を備えた構成からなり、
請求項2の英文字認識装置は、請求項1の英文字認識装
置における文字領域切り出し部及び文字認識部が、文字
情報格納部に文字領域切り出し情報、文字認識情報が格
納されている場合、これらの文字領域切り出し情報、文
字認識情報を基に文字領域の切り出し、文字認識を行う
ように構成されている。
【0007】
【作用】この構成によって、認識確度の低い文字領域の
再切り出し、再認識を行う際、単語辞書を基に領域内に
存在する文字列の候補を推定し、この文字列及び同一の
文章内の認識確度の高い文字より得られた情報を基に、
文字領域の切り出し、文字認識を行うので、認識処理を
軽減化できるとともに、処理時間を短縮させることがで
きるとともに、認識精度を向上させることができる。
【0008】
【実施例】以下本発明の一実施例について、図面を参照
しながら説明する。
【0009】図1は本発明の英文字認識装置の一実施例
のブロック図である。1は認識対象文書を文書画像とし
て入力する画像入力部、2は入力された文書画像から文
字列の集まりを見つけ、文章領域を出力する文章領域切
り出し部、3は文章領域から単語単位の区切りを見つけ
1つの単語の範囲を単語領域として出力する単語領域切
り出し部、4は文字情報格納部に蓄えられている情報を
もとに単語領域から文字単位の区切りを見つけ1つの文
字の範囲を文字領域として出力する文字領域切り出し
部、5は全ての認識対象文字の図形特徴を予め記憶して
いる認識辞書、あるいは文字領域に蓄えられている文字
の図形特徴を比較し、それらの間の認識度を求め、認識
を行う文字認識部、6は全ての認識対象文字の図形特徴
を予め記憶している認識辞書、7は文字領域切り出し部
4より得られた文字領域の大きさ及び、文字認識部5よ
り得られた文字の図形特徴を蓄えておく文字情報格納
部、8は英単語の綴りを記憶している単語辞書を基に認
識候補文字列を決定する認識候補文字列決定部、9は英
単語の綴りを記憶している単語辞書、10は文字領域切
り出し部4、文字認識部5及び認識候補文字列決定部8
の制御を行い認識文字コードを決定する制御部、11は
決定した認識文字コードを出力する出力部、12は1か
ら5の各部をつなぐ内部バス、13は4,5,8及び1
0の各部をつなぐ内部バス、14,15,16,17,
18はそれぞれ4と7,5と7,5と6,8と9,10
と11をつなぐ内部バスである。
【0010】以上のように構成された英文字認識装置に
ついて、図2乃至図5を用いて、以下その動作を説明す
る。
【0011】図2は本発明の一実施例の英文字認識装置
の全体フローチャートであり、図3は文字領域切り出し
処理行程のフローチャートであり、図4は文字認識処理
行程のフローチャートであり、図5は各処理行程でのデ
ータ構成を示す模式図である。
【0012】まず、認識したい文書を画像入力部1に文
書画像として入力する(s1)。入力された文書画像を
文章領域切り出し部2に送り、文章領域切り出し部2に
て、文書画像の縦方向及び横方向の黒画素のヒストグラ
ムを求め、これをもとに文章領域を抽出する。そして文
章領域の位置情報を内部データとして蓄える(s2)。
単語領域切り出し部3に文章領域の位置情報を送り、文
章領域内に対する単語領域の切り出し処理を行う。単語
領域切り出し部3では、単語の前後の空白が文字間の空
白より大きいことに着目し、ある幅以上の空白に挟まれ
た文字列を単語領域として切り出す。文章領域切り出し
部2にて見つけられた文章領域内の全ての単語領域の位
置情報を求め、内部データとして蓄える(s3)。図5
(a)乃至(c)に、画像入力部1及び文章領域切り出
し部2、単語領域切り出し部3での各データ構成の模式
図を示す。文字領域切り出し部4では、英文字は左右に
分離していないことに着目し、前後を空白に挟まれた領
域を文字とし、単語領域内の文字の連なりを文字単位に
分離し、文字領域として切り出す。文字の位置情報を、
内部データとして蓄える(図2s5,図3s24)。文
字認識部5に文字領域の位置情報を送り、文字領域内の
文字認識処理を行う。文字認識部5では、注目する文字
領域の画像の図形特徴と認識対象となる全ての文字の図
形特徴との間の類似性を類似度として求め、最も類似度
の高かった文字の認識文字コードと類似度の値を内部デ
ータとして蓄える(図2s4,図3s21,s22)。
制御部10に前記認識文字コード及び類似度を送り、文
字領域の大きさ、切り出された文字領域内図形特徴を、
文字情報格納部7に蓄える必要があるかを判定する。制
御部10では、類似度の値が認識結果に値するかを判定
し(図3s23)、認識結果に値する場合、文字情報格
納部7へ認識文字コード、文字領域の大きさ、文字領域
内の図形特徴を送る(s24)。文字情報格納部7は、
全ての認識対象文字の認識文字コードをインデックスと
する文字領域の大きさ、文字領域内の図形特徴を記憶す
るテーブルを持ち、制御部10より送られてきた認識文
字コードを基に、その文字コードに対応する文字領域の
大きさ及び文字領域内の図形特徴を蓄える。以上s4,
s5の処理を、全ての単語領域内に対して行う。
【0013】以下、s7乃至s11までの処理は、文書
領域内に存在する全ての単語領域に対して、単語毎に行
われる。制御部10では、単語領域内に、類似度の値が
認識結果に値しない文字が存在するかを判定する。認識
結果に値しない文字が存在しない場合、認識文字コード
を出力部11に送る(s7)。
【0014】単語領域内に、認識結果に値しない文字が
存在する場合の処理過程を以下に示す。図5(d)の例
では、単語領域「nothing」内の「t」と「h」
が接触しているため、1つの文字領域として切り出し、
文字認識処理が行われ、認識結果に値しないと判定され
る。その他の文字は認識結果に値すると判定され、文字
情報格納部7に大きさ、図形特徴が記憶される。
【0015】制御部10では、認識結果に値しない文字
コードが存在するとき、認識結果に値する文字の文字認
識コード並びにリジェクトコードの連なりを、認識候補
文字列決定部8へ送る(s7)。図5(e)の例では
「n」「o」「*」「i」「n」「g」各々の認識文字
コード(*はリジェクトコードを示す)の連なりを認識
候補文字列決定部8へ送る。認識候補文字列決定部8で
は、送られてきた認識確度の高い文字列と、予め単語の
綴りを記憶している単語辞書9との照合により、一致す
る単語を求め、認識候補文字列を決定し、この文字列の
各文字の認識文字コードを制御部10へ送る。図5
(e)の例では、最初の2文字が「no」で終わりの3
文字が「ing」である文字列と単語辞書との照合によ
り、単語「nothing」を得、認識候補文字列を
「t」「h」と決定し、制御部へ「t」及び「h」の認
識文字コードを送る(s8)。制御部10では、送られ
てきた認識候補文字列の認識文字コードを文字領域切り
出し部4、文字認識部5へ、認識結果に値しないと判定
された文字領域の位置情報を文字領域切り出し部4へ送
り、文字領域の再切り出し、文字の再認識を行う。図5
(d)の例では「t」及び「h」の認識文字コード、
「th」と切り出された文字領域の位置情報を文字領域
切り出し部4へ、「t」及び「h」の認識文字コードを
文字認識部5へ送る。以下、文字領域の再切り出し行程
を図3の文字領域切り出し処理行程のフローチャート、
文字の再認識行程を図4の文字認識処理行程のフローチ
ャートに沿って説明する。認識候補文字列が存在し、文
字情報格納部7に、この文字列を構成する文字の情報が
蓄えられている場合、格納されている大きさの情報を基
に、この領域内の文字単位の区切れ位置を求め、位置情
報を内部データとして蓄える(図3s15,s16,s
17,s18)。認識候補文字列が存在するが、文字情
報格納部7に、文字の情報が蓄えられていない場合は、
この領域内を認識候補文字列数に画像をもとに分割し、
位置情報を内部データとして蓄える(s19)。認識文
字列候補が存在しない場合は、再度文字切り出し処理を
行い、2番目に可能性の高い文字領域の分割を行い、位
置情報を内部データとして蓄える(s25)。図5
(d)の例では、情報格納部の「t」「h」のテーブル
には、「with」の認識処理後、大きさの情報が蓄え
られているので、これをもとに文字領域の切り出しを行
い、位置情報を蓄える。文字認識部5に新しく切り出さ
れた文字領域の位置情報を送り、文字領域内の認識を行
う。文字認識部5では、認識候補文字列が存在する場
合、文字領域の画像の図形特徴と、文字情報格納部7に
記憶されている認識候補文字の図形特徴との類似度を求
め、認識を行う(図4s26,s27)。認識結果に値
しないと判定された場合、文字情報格納部7に記憶され
ている全ての文字の図形特徴との類似度を求め、認識を
行う(s28,s29)。再度、認識結果に値しないと
された場合、認識辞書6を用いて認識を行う(s31,
s32)。再び、認識結果に値しないと判定された場合
は、認識不能とする(s33,s34)。認識候補文字
列が存在しない場合は、前記と同様の方法で、文字情報
格納部7に記憶されている図形特徴との認識を行い、認
識結果に値しないと判定された場合、認識辞書6を用い
て認識を行う。(s30,s31,s32,s33)。
以上の処理を行い、認識結果に値する文字の認識文字コ
ード(認識不能の場合はリジェクトコード)を内部デー
タとして蓄える。例では文字情報格納部7に記憶されて
いる「t」「h」の図形特徴との類似度を求め、「t」
「h」と認識される。制御部10に認識文字コードまた
はリジェクトコードを送る(s29,s34)。制御部
10では送られてきた認識文字コード(またはリジェク
トコード)を出力部11に送る。出力部11では、送ら
れてきた認識文字コードまたはリジャクトコードを出力
する(s8)。
【0016】以上、s4からa8を文書中の全ての単語
が認識されるまで繰り返す(s12)ことにより与えら
れた文書画像の英文字認識処理を行なう。
【0017】
【発明の効果】以上のように本発明は、文字間の接触、
文字のかすれ等の低品質文字が存在する文書の文字領域
切り出し、文字認識処理を、単語辞書、同一文章の文字
情報を用いて行なうので、認識処理の軽減化を図ること
ができ、その分処理時間を短縮し、高速で作業をすると
ともに、認識精度の向上を図ることができる優れた英文
字認識装置を実現できるものである。
【図面の簡単な説明】
【図1】本発明の英文字認識装置の一実施例のブロック
【図2】本発明の一実施例の英文字認識装置の全体フロ
ーチャート
【図3】文字領域切り出し処理行程のフローチャート
【図4】文字認識処理行程のフローチャート
【図5】各処理行程でのデータ構成を示す模式図
【符号の説明】
1 画像入力部 2 文書領域切り出し部 3 単語領域切り出し部 4 文字領域切り出し部 5 文字認識部 6 認識辞書 7 文字情報格納部 8 認識候補文字列決定部 9 単語辞書 10 制御部 11 出力部 12,13,14,15,16,17,18 内部バス

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】認識対象文書を入力する画像入力部と、入
    力された文書画像から文章領域を出力する文章領域切り
    出し部と、文章領域から単語領域を出力する単語領域切
    り出し部と、単語領域から文字領域を出力する文字領域
    切り出し部と、切り出された文字領域の画像から文字を
    記憶している認識辞書を基に認識を行う文字認識部と、
    この文字認識部及び前記文字領域切り出し部より得られ
    る文字認識情報、文字領域切り出し情報を蓄える文字情
    報格納部と、英単語の綴りを記憶している単語辞書を基
    に認識候補文字列を決定する認識候補文字列決定部と、
    この認識候補文字列決定部・前記文字領域切り出し部・
    前記文字認識部の制御を行い認識文字コードを決定する
    制御部と、決定した認識文字コードを出力する出力部
    と、を備えたことを特徴とする英文字認識装置。
  2. 【請求項2】文字領域切り出し部及び文字認識部は、文
    字情報格納部に文字領域切り出し情報、文字認識情報が
    格納されている場合、これらの文字領域切り出し情報、
    文字認識情報を基に文字領域の切り出し、文字認識を行
    うことを特徴とする請求項1記載の英文字認識装置。
JP3182204A 1991-07-23 1991-07-23 英文字認識装置 Pending JPH0528324A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3182204A JPH0528324A (ja) 1991-07-23 1991-07-23 英文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3182204A JPH0528324A (ja) 1991-07-23 1991-07-23 英文字認識装置

Publications (1)

Publication Number Publication Date
JPH0528324A true JPH0528324A (ja) 1993-02-05

Family

ID=16114179

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3182204A Pending JPH0528324A (ja) 1991-07-23 1991-07-23 英文字認識装置

Country Status (1)

Country Link
JP (1) JPH0528324A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002049890A (ja) * 2000-08-01 2002-02-15 Minolta Co Ltd 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
US6858182B1 (en) 1999-04-23 2005-02-22 Tanita Corporation Exhalation gaseous component gauge and a cellular phone equipped with function of measuring gaseous components
JP2006338578A (ja) * 2005-06-06 2006-12-14 Mitsubishi Electric Corp 文字認識装置
JP2013097784A (ja) * 2011-10-27 2013-05-20 King Abdulaziz City For Science & Technology (Kacst) 文字認識のための文字セグメントを自動的に識別する方法および装置
CN113688615A (zh) * 2020-05-19 2021-11-23 阿里巴巴集团控股有限公司 一种字段注释生成、字符串理解方法、设备及存储介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6858182B1 (en) 1999-04-23 2005-02-22 Tanita Corporation Exhalation gaseous component gauge and a cellular phone equipped with function of measuring gaseous components
JP2002049890A (ja) * 2000-08-01 2002-02-15 Minolta Co Ltd 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP2006338578A (ja) * 2005-06-06 2006-12-14 Mitsubishi Electric Corp 文字認識装置
JP2013097784A (ja) * 2011-10-27 2013-05-20 King Abdulaziz City For Science & Technology (Kacst) 文字認識のための文字セグメントを自動的に識別する方法および装置
CN113688615A (zh) * 2020-05-19 2021-11-23 阿里巴巴集团控股有限公司 一种字段注释生成、字符串理解方法、设备及存储介质
CN113688615B (zh) * 2020-05-19 2024-02-27 阿里巴巴集团控股有限公司 一种字段注释生成、字符串理解方法、设备及存储介质

Similar Documents

Publication Publication Date Title
JPH10207988A (ja) 文字認識方法および文字認識装置
KR20040005671A (ko) 문자인식 장치 및 방법
JPH0528324A (ja) 英文字認識装置
JPH06215184A (ja) 抽出領域のラベリング装置
JP3975825B2 (ja) 文字認識誤り訂正方法、装置及びプログラム
JPH0452509B2 (ja)
JP2985243B2 (ja) 文字認識方法
JPH09274645A (ja) 文字認識方法および装置
JP3442548B2 (ja) 文字認識方法および装置
JPH09185674A (ja) 誤認識文字検出装置、誤認識文字訂正装置、誤認識文字検出方法、および、誤認識文字訂正方法
JP3071745B2 (ja) 文字認識結果の後処理方法
JPH0589293A (ja) 英文字認識装置
JP2939945B2 (ja) ローマ字住所認識装置
JP3154752B2 (ja) 単語認識装置
JP3116453B2 (ja) 英文字認識装置
JP3151866B2 (ja) 英文字認識方法
JPH0944604A (ja) 文字認識処理方法
JPH06309507A (ja) 文字認識装置
JPS63138479A (ja) 文字認識装置
JPH0262659A (ja) 日本文訂正候補文字抽出装置
JPH07122890B2 (ja) 分離文字処理機能を持つ文書リーダ装置
JPH0696285A (ja) 文字認識装置
JPH05120494A (ja) 文字認識方法及びその装置
JPH06195521A (ja) 文字認識方法
JPH04372087A (ja) 英文字認識装置