JPH0350692A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0350692A
JPH0350692A JP1185377A JP18537789A JPH0350692A JP H0350692 A JPH0350692 A JP H0350692A JP 1185377 A JP1185377 A JP 1185377A JP 18537789 A JP18537789 A JP 18537789A JP H0350692 A JPH0350692 A JP H0350692A
Authority
JP
Japan
Prior art keywords
word
character
recognition
candidate
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1185377A
Other languages
English (en)
Inventor
Mikio Aoki
三喜男 青木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP1185377A priority Critical patent/JPH0350692A/ja
Publication of JPH0350692A publication Critical patent/JPH0350692A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
[産業上の利用分野] 本発明は、紙面上に書かれた文字を画像として入力する
ことにより、文書画像から文字領域を抽出し、コード番
号に変換する文字認識装置に関する。 [従来の技術] 近年、文字認識装置の急激なる進歩により、様々な文書
画像から文字領域を自動的に抽出し、さらに一つ一つの
文字を切り出し、認識し、自動的に文書ファイルが作成
できる様になってきており文字の認識方法には様々な方
法が考え出されてぃる。 例えば、簡単な文字認識方法としては、文字の認識用の
辞書として文字そのものの辞書パターンを所有し、単に
抽出文字画像との一致度を比較する方法があるが、該方
法は、文字の位置ずれ、大きさの変動等に非常に弱くほ
とんど使用されていない1文字の位置ずれ、大きさの変
動等に影響されず、また簡単な方法として文字のメツシ
ュ特徴やペリフェラル特徴を比較して認識する方法があ
る。該認識方法は、研究実用化報告、第34巻、第1号
PP47〜58に掲載されており、メツシュ特徴は、文
字全体の大まかな形状分布を表現したものである。特徴
の抽出方法は、文字の外接矩形を分割してnxnの小領
域を求める。該各々の小領域に含まれる文字部の面積を
計数しメツシュ特徴とする。該メツシュ特徴は、一つの
文字につきnxnコのデータを持っており、nxnコの
うちのある領域における文字部の面積の割合を辞書とし
て所有しているデータと比較することによって文字の推
定を行う、またペリフェラル特徴は。 文字の周辺情報に着目したものであり、特徴の抽出方法
は、まず文字パターンの外接矩形を求め。 外接矩形の各辺をそれぞれn分割する。次に分割された
各分割辺から文字に向かって走査していき、最初に文字
に出合うまでの面積、次に文字に出合うまでの面積を計
数する。各分割辺に対して同様の処理を行うことにより
、nX4X2のデータを持つペリフェラル特徴を得るこ
とができ、該nX4X2のデータと辞書として所有して
いるデータとを比較することによって文字の推定が可能
となる。 以上の方法は、抽出した文字の特徴を抽出し、該特徴と
認識用の辞書データと比較して最も近いものを認識結果
として出力している。 [発明が解決しようとする課題〕 しかしながら、前記文字認識方法に代表される様に、今
まで開発されてきているほとんどの文字認識方法は、抽
出された文字の特徴を抽出し、該抽出データと、辞書と
して所有している文字の特徴データとを比較し、辞書中
で最も近いものを該当文字として認識している。従って
、もし辞書中で最も一致している文字と二番目に一致し
ている文字との差がほとんど無く、実際には二番目に一
致している文字が該当文字である様な場合においても何
の考慮無く一番目の文字を認識結果として出力してしま
う。 そこで本発明は、以上の課題を解決するものでその目的
とするところは簡単なアルゴリズムで非常に似たデータ
を持つ文字の区別を行い正確に認識結果を出力する文字
認識装置を提供することにある。 〔課題を解決するための手段] 本発明の文字認識装置は。 (1)紙面等の反射光を光電変換して文書画像を入力す
る光学的画像入力手段と、 前記抽出単語から一文字一文字を抽出し、あらかじめ所
有している文字データ辞書との比較を行いながら文字コ
ードに変換する文字認識手段と、単語データ辞書とを具
備し、 前記単語の認識時において、認識文字の候補文字が複数
個存在し、どうしても一つに絞ることのできない場合は
、前記候補文字を認識単語とは別の領域に格納し、認識
単語には前記文字の該当する位置に別の記号を設け、認
識結果出力前に候補文字を組み入れて単語を作成し単語
辞書データと比較して該当単語を出力することを特徴と
する。 (2)前記候補文字を組み入れて単語データ辞書と比較
した結果、複数の単語において該当単語が存在した場合
には、認識時の一致度の大きい方の文字を組み入れた単
語を該当単語とすることを特徴とする。 〔実 施 例〕 以下本発明について実施例に基づいて詳細に説明する。 本発明の文字認識装置のブロック図を第2図に示す0文
字認識装置は、プログラムに従って処理を実行するCP
U201.文字画像を記憶装置に入力する画像入力装置
202、文字認識結果を表示する文字表示手段203、
認識用の文字データ、単語データ辞書の納まっているR
OM204、文字画像を記憶する記憶装置であるROM
2058より構成されている。 以下、本発明の文字認識装置の文字認識の方法を第4図
に示すフローチャートに基づいて、第1図及び第3図を
用いて詳細に説明する0本発明の文字認識装置はまず初
めに画像入力装置202において光学的な方法により紙
面等に書かれた文字をイメージデータとして記憶装置で
あるROM205に入力する9次に入力した文書画像か
ら単語領域の抽出を行う、単語領域の抽出は、まず入力
文書画像の行方向の周辺分布を計数する。該周辺分布(
図示せず)は1文字行の存在する位置で値が大きくなり
1文字行と文字行との間は周辺分布の値が小さい、従っ
て、該周辺分布の値により文字行の位置を容易に推定す
ることが可能である。 文字行の位置を推定すると次に推定文字行の行方向と垂
直な方向の周辺分布を計数する。該周辺分布(図示せず
)の値の大きいところは文字の存在している領域であり
、小さいところは文字の存在していない領域である、従
って、文字の存在していない領域を調べることにより、
単語間隔と文字間隔の大きさが推定でき、単語領域を抽
出できる。 単語領域が抽出されると次は、抽出した単語内の一文字
一文字の文字を抽出しながら認識を行う0本発明におい
ては、抽出された文字の認識は、抽出文字の外接矩形の
各辺の分割辺から文字までの距離を特徴とする特許 う.今、前記抽出単語が第1図に示す101であった場
合について考える.該抽出単語101は。 recognitionという単語であり、ゴシック体
で描かれている.該文字フォントは、画像101を見て
わかる様にrとtが非常に良く似ている.さらに前記文
字を周辺特徴により分類しようとした場合、前記2つの
文字の値は殆んど差が無い.従って,画像101の一番
最初の文字rを認識させた場合候補文字としてr105
とtl。 6が上がり、前記2つの文字の一致度には殆んど差が見
られず、ちょっとした画像の位置ずれ等で一致度が逆転
する.こうした状態で強引に認識しようとした場合、偶
然に正しく認識するかもしれないが非常に危険性が大き
い.そこで本発明においては,認識結果としては,候補
文字を絞れなかったという意味の?マーク103を返し
、別の領域に前記候補文字rl05とt106を格納し
、次の文字の認識を行う.こうして抽出単語内のすべて
の文字の認識を終了すると、認識結果として?ecog
ni?ionl02を得る.該結果l02は、8番目の
文字も?104となって候補文字を絞り切れていない.
認識が終了すると従来はここで認識結果を出力するわけ
であるが、本発明は、未だ不確定な文字が存在するので
、次に不確定文字を確定させる.まず認識結果102の
不確定文字103及び104に候補文字105及び10
6、107及び108を挿入して単語を作成する。その
結果、単語recognr i on 1 09、te
cognirionl 10、recOgnition
lll及びtecogn it ion112を得る.
次に前記4つの単語と、ROM204中の単語データ辞
書と比較して単語の決定を行う.単語の決定は、第3図
に示す様に、単語データ辞書305と、候補単語301
〜304とを比較し、該当する単語が存在するがどうか
によって行う.候補単語が,301〜304の場合、単
語データ辞書305と比較した結果、recogn i
 t i on303のみが該当する。従って前記認識
単語101(7)??−り1 0 3ハr 1 0 5
t’。 ?マーク104はttosであると決定でき、該単語を
認識結果として出力することにより認識の全ての工程は
終了する.また、候補単語が複数個存在した場合には、
認識時の一致度の最も高い単語を出力することにより、
誤る危険性を小さ《する。 以上述べた様に本発明によれば,認識に用いる方法の特
徴においては殆んど区別できない様な文字が存在した場
合、一担候補文字を別の領域に格納した後、単語データ
辞書と比較し決定するので,性格な文字の認識が可能と
なる.よって該方法を構成要素に用いる文字認識装置の
信頼性を大幅に向上させることが可能となる。
【発明の効果】
以上述べた様に本発明は文字認識時において、どうして
も候補文字を絞ることのできなかった場合には、それら
の候補文字を別の領域に格納し。 すべての文字の認識が終了した時点でROM中の単語デ
ータ辞書と比較し決定するので、今まで強引に一つに絞
ったために誤って認識していた文字においても正確に認
識することが可能となる。その結果、今まで以上に文字
の認識率を向上させ、また、文字認識装置の信頼性を多
いに向上させるという効果を有する。
【図面の簡単な説明】
第1図及び第3図に本発明の文字認識装置の文字認識方
法を示した図、 第2図に本発明の文字認識装置のブロック図、第4図に
本発明の文字認識装置のフローチャートを示す。 101・・・・・・抽出単語 102・・・・・・認識結果 105.106・・103の候補文字 107.108・・104の候補文字 109〜112・・候補単語 201  ・ ・ ・ ・ ・ ・ CPU202・・
・・・・画像入力装置 203・・・・・・文字表示装置 204・・・・・・ROM 205・・・・・・RAM 301〜304・・候補単語 305・・・・・・単語データ辞書 以

Claims (1)

    【特許請求の範囲】
  1. (1)紙面等の反射光を光電変換して文書画像を入力す
    る光学的画像入力手段と、 前記入力画像から文字行及び単語の位置を検知して一単
    語一単語を抽出する手段と、 前記抽出単語から一文字一文字を抽出し、あらかじめ所
    有している文字データ辞書との比較を行いながら文字コ
    ードに変換する文字認識手段と、単語データ辞書とを具
    備し、 前記単語の認識時において、認識文字の候補文字が複数
    個存在し、どうしても一つに絞ることのできない場合は
    、前記候補文字を認識単語とは別の領域に格納し、認識
    単語には前記文字の該当する位置に別の記号を設け、認
    識結果出力前に候補文字を組み入れて単語を作成し、単
    語辞書データと比較して該当単語を出力することを特徴
    とする文字認識装置。(2)前記候補文字を組み入れて
    単語データ辞書と比較した結果、複数の単語において該
    当単語が存在した場合には、認識時の一致度の大きい方
    の文字を組み入れた単語を該当単語とすることを特徴と
    する請求項1記載の文字認識装置。
JP1185377A 1989-07-18 1989-07-18 文字認識装置 Pending JPH0350692A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1185377A JPH0350692A (ja) 1989-07-18 1989-07-18 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1185377A JPH0350692A (ja) 1989-07-18 1989-07-18 文字認識装置

Publications (1)

Publication Number Publication Date
JPH0350692A true JPH0350692A (ja) 1991-03-05

Family

ID=16169737

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1185377A Pending JPH0350692A (ja) 1989-07-18 1989-07-18 文字認識装置

Country Status (1)

Country Link
JP (1) JPH0350692A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06223121A (ja) * 1993-01-22 1994-08-12 Nec Corp 情報検索装置
US9163688B2 (en) 2009-05-20 2015-10-20 Sp1ke, Inc. Energy absorption and distribution material
US9194136B2 (en) 2013-04-18 2015-11-24 Viconic Defense Inc. Recoiling energy absorbing system
US9279258B2 (en) 2013-04-18 2016-03-08 Viconic Defense Inc. Recoiling energy absorbing system with lateral stabilizer
US9415708B2 (en) 2014-02-18 2016-08-16 Oakwood Energy Management, Inc. Conformable energy absorber
US9528280B2 (en) 2013-04-18 2016-12-27 Viconic Sporting Llc Surface underlayment system with interlocking resilient anti-slip shock tiles

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06223121A (ja) * 1993-01-22 1994-08-12 Nec Corp 情報検索装置
US9163688B2 (en) 2009-05-20 2015-10-20 Sp1ke, Inc. Energy absorption and distribution material
US9194136B2 (en) 2013-04-18 2015-11-24 Viconic Defense Inc. Recoiling energy absorbing system
US9279258B2 (en) 2013-04-18 2016-03-08 Viconic Defense Inc. Recoiling energy absorbing system with lateral stabilizer
US9528280B2 (en) 2013-04-18 2016-12-27 Viconic Sporting Llc Surface underlayment system with interlocking resilient anti-slip shock tiles
US9415708B2 (en) 2014-02-18 2016-08-16 Oakwood Energy Management, Inc. Conformable energy absorber

Similar Documents

Publication Publication Date Title
US8059868B2 (en) License plate recognition apparatus, license plate recognition method, and computer-readable storage medium
JP3343864B2 (ja) 語体の分離方法
US5410611A (en) Method for identifying word bounding boxes in text
JP3345224B2 (ja) パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置
JPH0721319A (ja) 自動アジア言語決定装置
JPH09179942A (ja) Ocrを利用しない文書画像中のドロップワードの自動認識方法
US8787702B1 (en) Methods and apparatus for determining and/or modifying image orientation
CN113610068B (zh) 基于试卷图像的试题拆解方法、系统、存储介质及设备
JPH0350692A (ja) 文字認識装置
JP5414631B2 (ja) 文字列探索方法、文字列探索装置、記録媒体
JPH08320914A (ja) 表認識方法および装置
JP2976445B2 (ja) 文字認識装置
JPH1166230A (ja) 文書認識装置、文書認識方法及び媒体
JPH0728935A (ja) 文書画像処理装置
JP2902097B2 (ja) 情報処理装置及び文字認識装置
JPH0351981A (ja) 文字認識装置
JPH0353392A (ja) 文字認識装置
JP3100825B2 (ja) 線認識方法
JPH0262682A (ja) 文字認識方法
JP2977244B2 (ja) 文字認識方法及び文字認識装置
JPH04260980A (ja) 図形認識装置
Saeed et al. Intelligent feature extract system for cursive-script recognition
JPH04130979A (ja) 文字画像切出し方法
JP2988697B2 (ja) 図形認識方式
JP2987462B2 (ja) 文字方向判定装置及び文字方向判定方法