JPH0353392A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0353392A
JPH0353392A JP1189372A JP18937289A JPH0353392A JP H0353392 A JPH0353392 A JP H0353392A JP 1189372 A JP1189372 A JP 1189372A JP 18937289 A JP18937289 A JP 18937289A JP H0353392 A JPH0353392 A JP H0353392A
Authority
JP
Japan
Prior art keywords
character
word
recognition
dictionary
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1189372A
Other languages
English (en)
Other versions
JPH07117995B2 (ja
Inventor
Mikio Aoki
三喜男 青木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP1189372A priority Critical patent/JPH07117995B2/ja
Publication of JPH0353392A publication Critical patent/JPH0353392A/ja
Publication of JPH07117995B2 publication Critical patent/JPH07117995B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、紙面上に書かれた文字を画像として入力する
ことにより、文書画像から文字領域を抽出し、コード番
号に変換する文字認識装置に関する. 〔従来の技術〕 近年、文字認識装置の急激なる進歩により、様々な文書
画像から文字領域を自動的に抽出し、さらに一つ一つの
文字を切り出し、認識し、自動的に文書ファイルが作成
できる様になってきており文字の認識方法には様々な方
法が考え出されてい例えば、簡単な文字認識力法として
は、文字の認識用の辞書として文字そのものの辞書パタ
ーンを所有し、単に抽出文字画像との一致度を比較する
方法があるが、該方法は、文字の位置ずれ、大きさの変
動等に非常に弱くほとんど使用されていない.文字の位
原ずれ、大きさの変動等に影響されず、また簡I1な方
法として文字のメッシュ特徴やペリフエラル特徴を比較
して認識する方法がある。該認識方法は、6ノ[究実用
化報告 第34巻第1号p.p.47〜58に掲載され
ており、メッシュ特徴は、文字全体の大まかな形状分布
を表現したものである.特徴の抽出方法は、文字の外接
矩形を分割してnxnの小領域を求める.該各々の小領
域に含まれる文字部の面積をglIL1メッシュ特徴と
する6 該メッシュ特徴は、一つの文字につきnxnコ
のデーターを持っており、nxnコのうちのある領域に
おける文字部の面積の割合を辞書として所イjしている
データと比較することによって文字のlffl定を行う
。また、ペリフエラル特徴は、文字の周辺情報に着目し
たものであり、特徴の抽出方法は、まず文字パターンの
外接矩形を求め、外接矩形の各辺をそれぞれn分割する
.次に分割された各分割辺から文字に向かって走査して
いき、最初に文字に出合うまでの面積、次に文字に出合
うまでの@{C1を計数する。各分割辺に対して同様の
処理を行うことにより、nx4X2のデータを持つペリ
フエラル特徴を得ることができ、該nX4X2のデータ
と辞書として所有しているデータとを比較することによ
って文字の帷定が可能となる. 以上の方法は、アルゴリズム上も非常に簡単であり、認
m率も一文字あたり95%程度実現できるものである. 〔発明が解決しようとする課題〕 しかしながら、前記方法においては簡単なアルゴリズム
で1文字あたりの認識率が95%実現できても、それを
欧米文書等の単語に換算すると70%弱になってしまい
、文書ファイルに変換した時の文書の正確さがかなり低
い.また、単語においても95%程度の認識率を実現し
ようとすると、文字認識のアルゴリズムが非常に複雑に
なったり、文字認mH置が大型化する. そこで本発明は以上の様な課題を解決するもので、その
目的とするところは、簡単なアルゴリズムでかつ、小型
の装置で単語を高い認識率で認識する文字認識装置を提
供することにある.〔訓題を解決するための手段〕 本発明の文字認識妓置は (1)紙面等の反射光を光電変換して文書画像を入力す
る光学的画像入力手段と、 前記入力画像から文字行及び単語の位置を検知して一単
語一単語を抽出する手段と、 前記抽出単語から一文字一文字を抽出し、あらかじめ所
有している文字データ辞書との比較を行いながら文字コ
ードに変換する文字認識手段と、単語データ辞書とを具
備し、 前記単MrJの認識時において、認識文字中で辞書中の
文字データとの一致度の低かった文字に限り次候補文字
を記憶装置中の別の領域に格納し、単語の認識結果出力
前に単語辞書データと比較して該当生i6が存在しない
場合には単語中の前記一致度の低い文字を削記次候補文
字と入れ替えて単語辞書データと比較し該当単語が存在
する場合には該lli語を出力することを特徴とする。
(2)前記次候補文字は、候補文字の一致度が前記認識
単語中で最も低くても、次候補文字の一致度が候輔文字
の一致度に比べて極端に低い場合には前記文字の次候補
とはしないことを特徴とする. 〔実施例〕 以下本発明について実施例に基づいて詳細に説明する. 本発明の文字誌識装置のブロック図を第1図に示す.文
字認識装置はプログラムに従って処理を実行するCPU
 1 0 1、文字画像を記憶装置に入力する画像入力
装置102、文字認識結果を表示する文字表示手段10
3、認識用の文字データ、単語辞書の納まっているRO
M105より構成されている. 以下、本発明の文字認識装置の文字認識の方法を第3図
に示すフローチャートに基づいて、第2図、第4図、第
5図を用いて詳細に説明する.本発明の文字認8i!装
置はまず初めに画像入力装置102において、光学的な
方法により紙面等に書かれた文字をイメージデータとし
て記憶装置であるRAM105に入力する。次に入力し
た文字画像から単語領域の抽出を行う.単語領域の抽出
は、まず入力文字画像の行方向の周辺分布をM1敵する
.該周辺分布(図示せず〉は、文字行の存在する位置で
値が大きくなり、文字行と文字行との間は周辺分布の値
が小さい。従って、該周辺分布の値により文字行の位置
を容易に推定することが可能である。文字行の位置を推
定すると次に推定文字行の行方向と垂直な方向の周辺分
布を創数する.該周辺分布く図示せず)の値の大きいと
ころは文字の存在している領域であり、小さいところは
、文字の存在していない領域である。従って文字の存在
していない領域を調べることにより、単語間隔と文字間
隔の大きさがli定でき、単語領域が抽出?きる. 単語領域が抽出されると次は、抽出した単語の認識を行
う。単語の認識は、一文字一文字を抽出した後に、RO
M104に納まっている文字データ辞書と比較する.R
OM104中の文字データ辞書と抽出文字とを比較して
、最も一致している文字データが抽出文字の認識結果と
なる.こうして各文字について認識を一通り行うと、人
力文字画像中の単語の認識が終了する.従来の方法では
、この時点で認識を終了し認識結果を出力する.ところ
が、文字認識装置の一文字あたりの文字の認識率が95
%程度であった場合次のようなことが生じる. 今仮に入力文字画像より抽出した単語がrecogni
zeであったとする.該単語を文字認識装置において認
識した結果、第5図に示す様に、recognizeと
認識したとする。 (この様なことは95%程度の認識
率ではしばしば見られる)この場合、従来では認識した
結果501のrcc■gnizeをそのまま出力するか
、良くても、ROM104に納まっている単語辞書50
2と照合して出力するだけである。従ってそのまま出力
すれば当然間違えた答を出力するし、たとえROM10
4中の単語辞書502と照合しても、該単Kn li?
書502中に認識結果501に該当した単語は存在せず
、位置的に最も近い単語はRCとなってしまい全く違っ
た出力をする. ところが本発明の場合、前記文字画像と同じ画像から単
語領域を抽出し認識した結果は、第2図のようになる。
第2図に示す認識結果201は、従来の場合と同じよう
にrecognizeとなる。しかし本発明の場合、R
OM 1 0 4中の文字データと比較して文字の決定
を行う際に、二番目の候補文字、3番目の候補文字等の
次候補文字を抽出する.そして、単語の認識が終了した
時点で、U2 識単語内で、文字の辞書との一致度の最
も低い文字を拾い出し、該文字の次候補文字を記憶装置
であるRAM105中に格納する.該一致度が最も低い
文字は、もし単語内に認識の間違っている文字があると
したらその可能性の最も大きい文字である。従って、本
発明の場合、単語の認識の結果はm2図201に示すr
ccognizeが得られ、11′1語中で最も一致度
の低い文字は2文字目のc205であり、該文字の次候
補文字としてe203と0204が得られる.次に前記
認識桔果201をROM 1 0 4中の単語辞書20
2と比較して確認を行う.該認識結果201は、rcc
ognizeというスペルの単語である。従って、辞書
中202のrの部分を端から比較して該当単語を捜す.
rの次の文字はCであるので、辞書中でreで始まる単
語を捜した結果、RCという単語にぶつかる.次に、認
識結果の3文字目のCについて調べる.その結果、RC
の次の単語はRDとなり、rccと続く単語は全く存在
しないことが分かる.従って、認識結果201は間違っ
ている可能性がある.そこで、認識文字中で最も一致度
の低い文字を次候輔文字に入れ替えて単語の検索を行う
.認識単εrI201中で最も一致度の低い文字205
を次候補文字e203に入れ替えて単語辞書202中の
41語の検索を行うと、recognizableの次
にrecognizeという単語が存在し、次候?11
}文字203を入れ替えることによって該当単εRが存
在した.さらに、次候補文字204を入れ替えて辞書の
検索を行ってもrocognizeという単語は存在せ
ず、最も近い文字はrockyとなってしまう.従って
、入力文字画像はrecognizeという単語である
と判断でき、認識によって間違えた2文字目を修正する
ことができる。該結果recognizeを認識結果と
して出力することにより、文字認識装置の文字認識率は
高いものと判断される.その結果、一文字あたりの文字
認識率が95%程度で単語の認ga@が70%弱となっ
てしまった文字認tlit裂置において、認識方法その
ものを変えずに単語の認識率を95%程度まで上げるこ
とが可1jヒとなる。
また、単語中で文字の一致度の最も近い文字の次候?l
l文字の一致度が、認識文字の一致度に比べて極端に低
い場合について述べる。この場合は、第4図に述べる.
認識結果401はrecognizeという単語であり
、単語中で最も一致度の低い文字はe405となった。
該文字の次候桶文字はc403、o4 04が上げられ
たが、一致度は、e405に比べて極端に低い。従って
この場合、文字e405が間違っている可能性があって
も、次候補文字が合っている可能性はさらに低いので、
文字e405を次候補文字に入れ替えての単語の確認は
行わない.実際に第4図の場合には、認識結果401に
該当する単語は辞書402中に存在し、認識結果は正し
いとは認できるが、たとえ辞書402中にイ!在しなく
ても、次候補文字に入れ替えることによる認識率の向上
は見込まれないので、そのまま認識紀果として出力する
。そうすることにより、認識時間の短縮の効果がある。
以上述べた様に、認識単語を単語辞書と比較し、該当単
語が存在しない場合に、認識単語中で一致度の最も低い
文字を次候補文字に入れ替えて、該当単語が存在する場
合に、前記単語を認識結果として出力するので、文字認
識装置全体の認識率の向上が実現できる.よって該方法
を横成要素に用いる文字認識装置の信頼性を大幅に向上
させることが可能となった. 〔発明の効果〕 以上述べた様に本発明は、文字認識時において認識文字
中で認識用辞書データとの一致度の最も低い文字の次候
補文字を格納し、認識結果出力前に単語辞書を検索し、
該当単語が存在しない場合に、一致度の最も低い文字を
次候補文字に入れ替え検索し、該当単語が存在する場合
該単語を出力し、存在しない場合は前記認識単語を出力
するので、今まで一文字あたりの認識率が95%程度で
単語の認識率が70%弱となってしまった認識方法でも
容易に認msを95%程度に向上させることができる。
その結果、簡単なアルゴリズムで、かつ小型の装置で高
い認識率を持つ文字認識装置を実現することが可能とな
り、また、文字認識装置の信頼性を多いに向上させると
いう効果を有する。
【図面の簡単な説明】
第1図は本発明の文字認識装置を示すブロック図. 第2図、第4図は本発明の文字認識の様子を示す図. 201・・・認識紀果 202・・・単語辞書 203,204・・・次候補文字 205・・・一致度の最も低い文字 401・・・認識結果 402・・・単語辞書 403,404・・・次候補文字 405・・・一致度の最も低い文字 第3図に本発明の文字認識装置のフローチャートを示す
. 第5図は、従来の文字認識の様子を示す図。 501・・・認識結果 502・・・単語辞書 以  上

Claims (2)

    【特許請求の範囲】
  1. (1)紙面等の反射光を光電変換して文書画像を入力す
    る光学的画像入力手段と、 前記入力画像から文字行及び単語の位置を検知して一単
    語一単語を抽出する手段と、 前記抽出単語から一文字一文字を抽出し、あらかじめ所
    有している文字データ辞書との比較を行いながら文字コ
    ードに変換する文字認識手段と、単語データ辞書とを具
    備し、 前記単語の認識時において、認識文字中で辞書中の文字
    データとの一致度の低かった文字に限り次候補文字を記
    憶装置中の別の領域に格納し、単語の認識結果出力前に
    単語辞書データと比較して該当単語が存在しない場合に
    は単語中の前記一致度の低い文字を前記次候補文字と入
    れ替えて単語辞書データと比較し該当単語が存在する場
    合には該単語を出力することを特徴とする文字認識装置
  2. (2)前記次候補文字は、候補文字の一致度が前記認識
    単語中で最も低くても、次候補文字の一致度が候補文字
    の一致度に比べて極端に低い場合には、前記文字の次候
    補とはしないことを特徴とする請求項1記載の文字認識
    装置。
JP1189372A 1989-07-21 1989-07-21 文字認識装置 Expired - Lifetime JPH07117995B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1189372A JPH07117995B2 (ja) 1989-07-21 1989-07-21 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1189372A JPH07117995B2 (ja) 1989-07-21 1989-07-21 文字認識装置

Publications (2)

Publication Number Publication Date
JPH0353392A true JPH0353392A (ja) 1991-03-07
JPH07117995B2 JPH07117995B2 (ja) 1995-12-18

Family

ID=16240218

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1189372A Expired - Lifetime JPH07117995B2 (ja) 1989-07-21 1989-07-21 文字認識装置

Country Status (1)

Country Link
JP (1) JPH07117995B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0684006A (ja) * 1992-04-09 1994-03-25 Internatl Business Mach Corp <Ibm> オンライン手書き文字認識方法
JP2005346707A (ja) * 2004-05-20 2005-12-15 Microsoft Corp カメラで取得されたドキュメント用の低解像度のocr

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6116383A (ja) * 1984-07-03 1986-01-24 Mitsubishi Electric Corp 単語読取方式

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6116383A (ja) * 1984-07-03 1986-01-24 Mitsubishi Electric Corp 単語読取方式

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0684006A (ja) * 1992-04-09 1994-03-25 Internatl Business Mach Corp <Ibm> オンライン手書き文字認識方法
JP2005346707A (ja) * 2004-05-20 2005-12-15 Microsoft Corp カメラで取得されたドキュメント用の低解像度のocr
JP4698289B2 (ja) * 2004-05-20 2011-06-08 マイクロソフト コーポレーション カメラで取得されたドキュメント用の低解像度のocr

Also Published As

Publication number Publication date
JPH07117995B2 (ja) 1995-12-18

Similar Documents

Publication Publication Date Title
US5410611A (en) Method for identifying word bounding boxes in text
JP3343864B2 (ja) 語体の分離方法
JP3445394B2 (ja) 少なくとも二つのイメージセクションの比較方法
JP6900164B2 (ja) 情報処理装置、情報処理方法及びプログラム
JPH0772905B2 (ja) 記号列の認識方法
JPH08305796A (ja) パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置
KR20010093764A (ko) 어근 모델에 근거한 초서체 한자 주석의 검색법
JPH0353392A (ja) 文字認識装置
JPH0350692A (ja) 文字認識装置
JPS6316795B2 (ja)
JP2976445B2 (ja) 文字認識装置
JP2977244B2 (ja) 文字認識方法及び文字認識装置
JPH0728935A (ja) 文書画像処理装置
Hwang et al. Segmentation of a text printed in Korean and English using structure information and character recognizers
JPS6111886A (ja) 文字認識方式
JPS6125284A (ja) パターン認識装置
JP2727755B2 (ja) 文字列認識方法及びその装置
JPH01201789A (ja) 文字読取装置
JP2851865B2 (ja) 文字認識装置
JPS60138689A (ja) 文字認識方法
JPH05233877A (ja) 単語読み取り方法
JPS6046753B2 (ja) パタ−ンの特徴抽出方式
JPH06231310A (ja) 文字認識装置における文字認識方法
JPH0792819B2 (ja) パターン切出しおよび認識方法とそのシステム
JPH01201790A (ja) 文字読取装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081218

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081218

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091218

Year of fee payment: 14

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091218

Year of fee payment: 14