JPH0573727A - 英文字認識方法 - Google Patents

英文字認識方法

Info

Publication number
JPH0573727A
JPH0573727A JP3236050A JP23605091A JPH0573727A JP H0573727 A JPH0573727 A JP H0573727A JP 3236050 A JP3236050 A JP 3236050A JP 23605091 A JP23605091 A JP 23605091A JP H0573727 A JPH0573727 A JP H0573727A
Authority
JP
Japan
Prior art keywords
character
recognition
character pattern
word
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3236050A
Other languages
English (en)
Inventor
Noboru Nakamura
昇 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP3236050A priority Critical patent/JPH0573727A/ja
Publication of JPH0573727A publication Critical patent/JPH0573727A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 ノイズ等を含んだ、一般的な印刷文書の英文
字認識率を向上させる。 【構成】 2値画像より8連結図形を求め、文字パター
ン候補を抽出する。まず抽出された文字パターン候補間
で、重ね合わせ法等により、複数の文字パターンのグル
ープに分類する。分類された文字パターン・グループの
代表パターンに対し、認識処理を行い、認識確度の高い
文字をキーとして、クロスワード・パズルのように、他
の単語を推測し、複数の単語により文字パターンのカテ
ゴリが示されるなら、その文字パターンのカテゴリを決
定する。さらに未確定の文字パターンに対して、動的な
重ね合わせを行うことにより、ノイズ等による位置ずれ
のある文字パターンに対しても、正確に文字認識を行う
ことが可能になる。 【効果】 一般的な文書において、文字は、単語ごとに
分かち書きされており、この事を利用して、正しく認識
されたことを確認し、その文字パターンを使って動的な
重ね合わせを行うことにより、従来手法に比較して、認
識率が向上する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、印刷された一般文書の
文字認識を行う英文字認識方法に関するものである。
【0002】
【従来の技術】従来の英文字認識方法は、一文字毎に認
識を行い、認識確度の高い文字は確定文字とし、認識確
度の低い文字に対しては、複数の候補の中から、単語辞
書と比較することにより、認識文字を決定していたが、
単語間に複数の不確定の文字がある場合には、認識不能
となることがあり、認識率の低下を招いていた。
【0003】これに対処するために、一般文書において
は、同じフォントが数多く使われる、分かち書きされた
単語は、ほとんどが、予め登録可能な単語であるという
知見に基づき、複数の単語により、クロス・ワード・パ
ズルのように、未確定の文字を決定する方法により、認
識率を向上させる方法が考案されているが、第4図のよ
うに、ノイズによる位置ずれにより、単純な重ね合わせ
だけでは、文字パターン群に分類できず、また認識にお
いても、異なる文字と認識される場合があった。これら
の問題点を鑑みて、本発明は、考案されたもので、上記
の処理を行って未確定の文字パターンに対して、動的な
重ね合わせを行うことにより、ノイズによる位置ずれの
ある文字パターンも認識可能となる。また動的重ね合わ
せを行う回数を限定できるために、認識速度をあまり落
とすことなく、認識率を向上させることが可能である。
【0004】
【発明が解決しようとする課題】一般文書における英文
字認識率を向上させる。
【0005】
【作用】上記に示す発明により、一般文書の文字認識を
正確に行うことが可能になる。
【0006】
【実施例】以下、本発明の一実施例について図面を参照
しながら説明する。図1は、英文字認識方法を用いた英
文字認識装置の構成図である。画像パターン読み取り部
1から文字領域抽出部2により文字領域を抽出する。次
に、抽出された文字領域より単語切り出し部3、文字パ
ターン切り出し部4により切り出された文字パターン
を、重ね合わせ法により、文字パターン群分類部5で複
数の文字パターン群に分類し、分類した文字パターン群
の代表パターンに対し、認識処理部6で文字パターン用
辞書7を用い、認識を行う。次に、認識確度の高い文字
をキーとして、単語辞書照合部8で、単語辞書9と比較
を行い、文字パターン群認識確定部10により、複数の
単語より、認識確度の低い文字パターン群に対しても、
認識文字を確定させる。この処理で確定出来ない文字パ
ターンに対して、既に確定した文字パターンを使って、
11動的重ね合わせ部により、位置をずらして、重ね合
わせを行うことにより、認識を行う。
【0007】処理全体の流れを、図2のフローチャート
を使って、説明する。初めに、画像データより文字領域
を抽出し、さらに単語、文字パターンを単位として、抽
出する。次に文字パターンを各々重ね合わせることによ
り、ある基準以上にているものを文字パターン群とす
る。文字パターン群の代表パターンに対し、認識を行
う。認識確度の高いものをキーとして、単語単位で単語
辞書と照合を行う。複数の単語であてはまる文字パター
ンを確定させる。これまでの処理ですべての文字パター
ン群の認識結果が確定できなければ、図5(A)のよう
に、ノイズ等による位置ずれがあり、図5(B)を単純
に重ね合わせても、同一とは認められない場合を、位置
ずれを考慮した文字パターンの動的な重ね合わせにより
確定させる。更に単語照合を行い、あてはまる単語の存
在しない場合、認識結果をそのまま出力する。
【0008】図3の具体例を用いて、本発明の説明を補
足する。各文字パターンを重ね合わせて、26の文字パ
ターン群に分類する。この26の文字パターン群を代表
する文字パターンに対し、認識処理を行う。認識処理の
結果により、(2) 、(6) 、(9) 、(10)、(12)、(13)、(1
7)、(18)の文字パターン群の認識確度が低いとすると、
a(10)d 、mak(6)s 、poi(10)(17)s、b(6)s(17) 、(17)
o 、の単語辞書との整合により、(10)=n、(6)=e 、(17)
=tが確定できる。これらを使って、未確定文字パターン
を含んだ単語を整理すると、(13)ombine、p(12)a(13)ti
(13)e 、t(18)e、t(18)eo(12)y、t(18)(12)ee 、Fi(12)
stより、(13)=c、(12)=r、(18)=hが決定される。次に文
字パターン群 (1)- (26)を使い、(2) 、(9) に対して、
動的な重ね合わせを行うことにより、(2)=(10)n 、(9)=
(6)e、が確定し、すべての文字が認識される。
【0009】
【発明の効果】以上のように、本発明は、一般文書にお
いて、重ね合わせ法等の簡易な方法を前もって行うこと
により、処理時間のかかる認識処理の回数を減らすこと
により、認識スピードを向上させるとともに、未確定文
字を複数の単語と照合し、確定しさらに動的な重ね合わ
せを行うことにより、ノイズを含んだ場合の認識率を向
上させることが可能となる。また、本発明は、認識処理
を限定していないため、どのような認識処理とも組み合
わせて使用することが可能である。
【図面の簡単な説明】
【図1】本発明の一実施例における英文字認識方法を用
いた文字認識装置の構成図
【図2】本発明の原理を示すフローチャート
【図3】実施例の一適用例を示す図
【図4】ノイズによる位置ずれの例を示す図
【図5】ノイズのビット・マップ・パターンにおける影
響を示す図
【符号の説明】
1 画像パターン読み取り部 2 文字領域抽出部 3 単語切り出し部 4 文字パターン切り出し部 5 文字パターン群分類部 6 認識処理部 7 文字パターン用辞書 8 単語辞書照合部 9 単語辞書 10 文字パターン群認識確定部 11 動的重ね合せ部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】入力画像より、文字領域を抽出し、抽出し
    た文字領域から、単語単位に切り出しを行い、更に単語
    内の文字候補図形を抽出した後、前記切り出した文字候
    補図形を重ね合わせ法等により、いくつかの文字パター
    ン群に分類し、分類した文字パターン群の代表パターン
    の認識を行い、認識確度の高いものをキーとして、単語
    辞書と比較を行うことにより、認識確度の低い文字パタ
    ーン群についても、確定させ、残りの未確定文字につい
    ても、動的な重ね合わせを行うことにより、正確に文字
    を認識することを特徴とする英文字認識方法。
JP3236050A 1991-09-17 1991-09-17 英文字認識方法 Pending JPH0573727A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3236050A JPH0573727A (ja) 1991-09-17 1991-09-17 英文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3236050A JPH0573727A (ja) 1991-09-17 1991-09-17 英文字認識方法

Publications (1)

Publication Number Publication Date
JPH0573727A true JPH0573727A (ja) 1993-03-26

Family

ID=16995009

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3236050A Pending JPH0573727A (ja) 1991-09-17 1991-09-17 英文字認識方法

Country Status (1)

Country Link
JP (1) JPH0573727A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100258934B1 (ko) * 1997-07-15 2000-06-15 윤종용 군집화된 알파벳 추출에 의한 온라인 영문 단어 인식장치 및방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100258934B1 (ko) * 1997-07-15 2000-06-15 윤종용 군집화된 알파벳 추출에 의한 온라인 영문 단어 인식장치 및방법

Similar Documents

Publication Publication Date Title
JPH04195692A (ja) 文書読取装置
US5561720A (en) Method for extracting individual characters from raster images of a read-in handwritten or typed character sequence having a free pitch
JPH0573727A (ja) 英文字認識方法
JPH06215184A (ja) 抽出領域のラベリング装置
JP3151866B2 (ja) 英文字認識方法
JP3998439B2 (ja) 画像処理装置、画像処理方法およびこれらの方法をコンピュータに実行させるプログラム
JP3197441B2 (ja) 文字認識装置
JP2993533B2 (ja) 情報処理装置及び文字認識装置
JPH10124615A (ja) 文字認識方法
JP3428504B2 (ja) 文字認識装置
JP3060237B2 (ja) 日本語文字認識装置
JPH02230484A (ja) 文字認識装置
JP2851102B2 (ja) 文字切出し方法
JPH0950488A (ja) 異サイズ混在文字列の読取り方法
JP2995825B2 (ja) 日本語文字認識装置
JPH05174185A (ja) 日本語文字認識装置
JPS6095690A (ja) 文字読取装置
JPS6274184A (ja) 文字認識装置
JP2001266070A (ja) 文字認識装置、文字認識方法および記憶媒体
JPH08293002A (ja) 文字認識装置及び文字認識方法
JPS62145486A (ja) 文字認識方式
JPH05242299A (ja) 文字認識装置
JPH06195508A (ja) 文字切り出し方法
JPS61220081A (ja) パタ−ン切り出し及び認識方式
JPH0546806A (ja) 文字認識方法