JPH0520489A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0520489A
JPH0520489A JP3175291A JP17529191A JPH0520489A JP H0520489 A JPH0520489 A JP H0520489A JP 3175291 A JP3175291 A JP 3175291A JP 17529191 A JP17529191 A JP 17529191A JP H0520489 A JPH0520489 A JP H0520489A
Authority
JP
Japan
Prior art keywords
character
candidate
recognition
output
candidate characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3175291A
Other languages
English (en)
Inventor
Hiroyasu Miyahara
景泰 宮原
Yasuhiro Okada
康裕 岡田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP3175291A priority Critical patent/JPH0520489A/ja
Publication of JPH0520489A publication Critical patent/JPH0520489A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 複数ユーザによる文字認識装置の共有を効率
的に行うことができ、さらにワードプロセッサ上で候補
文字を使って修正できるような認識結果を出す文字認識
装置を実現する。 【構成】 文書を光学的に走査して光電変換し画像パタ
ーンを得る走査手段1と、画像パターンから個々の文字
パターンを切り出す文字切り出し手段2と、文字パター
ンを認識して複数の候補文字と類似度を出力する文字認
識手段3と、類似度を基に認識結果として複数の候補文
字を出力する出力文字決定手段4と、認識結果を記憶媒
体に記憶させる記憶手段5から構成されている。 【効果】 複数の候補文字を認識結果として出力するよ
うにしたため、ワードプロセッサ上で候補文字を用いた
効率的な修正作業が行え、同時に文字認識装置を効率的
に共有できるという効果がある。認識結果修正手段が無
いため従来に比べて装置が安価にできる効果もある。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は文字認識装置に関する
ものであり、さらに詳しくは文書をワードプロセッサ等
の文書処理装置に入力するために用いられる文字認識装
置に関するものである。
【0002】
【従来の技術】図2は従来の文字認識装置を示すブロッ
ク図であり、1は文書を光学的に走査して光電変換する
走査手段であり、2は走査手段1により得られた画像パ
ターンから個々の文字パターンを切り出す文字切り出し
手段、3は文字パターンを認識して複数の候補文字を出
力する文字認識手段、6は複数の候補文字からユーザが
正解を選択できる認識結果修正手段、5は修正された認
識結果を記憶媒体に記憶させる記憶手段である。なお、
関連資料として製品カタログ「xp−50s」(日商エ
レクトロニクス株式会社発行)などがある。
【0003】次に動作について説明する。走査手段1は
文書を走査、光電変換し画像パターンを得る。文字切り
出し手段2は得られた画像パターンから個々の文字パタ
ーンを切り出す。文字認識手段3は文字切り出し手段2
によって切り出された文字パターンを認識し、複数の候
補文字と各候補文字の類似度を得る。
【0004】認識結果修正手段6はまず文字認識手段3
による認識結果をユーザに表示する。次にユーザが修正
の対象となる文字を指定すると、その文字に対応する複
数の候補文字を表示する。ユーザがその候補文字の中か
ら正解を選ぶことによって、認識結果が修正される。
【0005】記憶手段5は修正済みの認識結果を文字コ
ードとしてフロッピー・ディスク等の記憶媒体に記憶さ
せる。記憶媒体に記憶される認識結果は1つの文字パタ
ーンに1つの文字コードが対応し、修正の対象にならな
かったものは1位の候補文字であり、修正されたものは
ユーザの指定した文字である。その認識結果は記憶媒体
を経由してワードプロセッサ等の文書処理装置に入力さ
せることができる。
【0006】
【発明が解決しようとする課題】従来の文字認識装置は
以上のように構成されているので、特に複数のユーザが
が一つの文字認識装置を共有する場合、ユーザの介在す
る認識結果の修正処理に時間がかかり、効率的な運用が
できないという問題点があった。ワードプロセッサへの
入力用に文字認識装置を用いる時は、各人がワードプロ
セッサ上で修正できるため文字認識装置で修正を行わず
文字認識手段での1位候補文字をそのまま出力させるこ
とにより時間の大幅な節約ができる。しかし、このよう
にした場合も2位以下の候補文字を捨て去ることになっ
てしまい、ワードプロセッサで新たに文字を入力しなけ
ればならないため、修正の効率が悪くなるという問題点
があった。
【0007】この発明は上記のような問題点を解消する
ためになされたもので、複数ユーザによる文字認識装置
の共有を効率的に行うことができ、さらに複数の候補文
字を使用した効率的な修正がワードプロセッサ上で行え
るような認識結果を出力できる文字認識装置を得ること
を目的としている。
【0008】
【課題を解決するための手段】この発明に係る文字認識
装置は、文字認識手段の出力した候補文字と類似度を基
に、認識結果として出力すべき候補文字を複数決定する
出力文字決定手段を備えたものである。
【0009】
【作用】この発明における出力文字決定手段は、文字認
識手段から候補文字と類似度を入力し、候補文字の類似
度が特定の条件に当てはまる場合は複数の候補文字を、
それ以外の時は1位の候補文字のみを認識結果として出
力する。
【0010】
【実施例】
実施例1.以下、この発明の一実施例を図について説明
する。図1において、1は文書を光学的に走査して光電
変換し画像パターンを得る走査手段であり、2は得られ
た画像パターンから個々の文字パターンを切り出す文字
切り出し手段、3は文字パターンを認識して複数の候補
文字と類似度を出力する文字認識手段、4は類似度を基
に認識結果として出力する候補文字を決定する出力文字
決定手段、5は認識結果を記憶媒体に記憶させる記憶手
段である。
【0011】次に動作を説明する。走査手段1は文書を
走査、光電変換し画像パターンを得る。文字切り出し手
段2は得られた画像パターンから個々の文字パターンを
切り出し、文字認識手段3に出力する。文字認識手段3
は文字パターンを認識し、複数の候補文字と各候補文字
の類似度を得て、出力文字決定手段4に出力する。
【0012】出力文字決定手段4は各候補文字の類似度
を調べ、2位以下の候補文字のうち正解である確率の高
いものがないか確認する。その条件は例えば次の算式で
表される。
【0013】Sn >TH1 1 −Sn <TH2 ただし、S1 :1位の候補文字の類似度 Sn :n位の候補文字の類似度(nは1より大) TH1 ,TH2 :閾値
【0014】この算式が成立するものに対しては認識結
果としてこの算式の成り立つ全ての候補文字を1位の候
補文字に連続して出力し、そうでない場合は1位の候補
文字のみを出力する。
【0015】その例を図3に示す。同図において、7は
文書上に記入された文字列であり、8は“雪”という文
字、9は“が”という文字、10は“降”という文字、
11は“る”という文字である。また12は“雪”8に
対する候補文字と類似度、13は“が”9に対する候補
文字と類似度、14は“降”10に対する候補文字と類
似度、15は“る”11に対する候補文字と類似度であ
り、16が出力文字決定手段4による出力である。文字
列7に対して文字認識手段3が候補文字と類似度を出力
すると、出力文字決定手段4はまず各々について上記算
式が成り立つかどうかを調べる。ここでは説明のため上
記算式でのTH1 を80、TH2 を10とする。“雪”
8に対する候補文字と類似度12を見ると、2位候補文
字“雪”については、その類似度(S2 )が90で1位
候補文字“電”の類似度(S1 )が95のため、S2
80かつS1 −S2 <10で上記算式が成り立つが、3
位候補文字“雲”は類似度(S3 )70のため算式は成
り立たない。従って出力文字決定手段4は“雪”8に対
する認識結果として“電”と“雪”を連続して出力す
る。“が”9に対する候補文字と類似度13については
2 が70のため算式が成立せず、出力文字決定手段4
は1位候補文字“が”のみを出力する。“降”10に対
する候補文字と類似度14ではS2が85、S1 が92
で“降”は算式が成り立ち、出力文字決定手段4は
“隆”と“降”を連続して出力する。“る”11に対す
る候補文字と類似度15に関してはS2 が75で算式は
成り立たず、出力文字決定手段4は1位候補文字“る”
のみを出力する。以上のようにして最終的な認識結果は
「電雪が隆降る」16となる。
【0016】記憶手段5は出力文字決定手段4の出力し
た認識結果を文字コードとして記憶媒体に記憶させる。
認識結果は記憶媒体を経由してワードプロセッサ等の文
書処理装置に入力することができ、その文書処理装置上
で修正を行うことができる。図3の例では「電雪が隆降
る」16という文が文書処理装置に入力されてくること
になるが、“電”と“隆”の2文字を消去するだけで修
正できる。
【0017】
【発明の効果】以上のように、この発明によれば出力文
字決定手段が複数の候補文字を認識結果として出力する
ようにしたので、ワードプロセッサ等の文書処理装置上
で候補文字を用いた効率的な修正作業が行え、同時に文
字認識装置を効率的に共有できるという効果がある。ま
た従来の文字認識装置の構成要素の一つである認識結果
修正手段が必要ないため、文字認識装置が安価にできる
という効果もある。
【図面の簡単な説明】
【図1】本発明の構成を示すブロック図。
【図2】従来の文字認識装置を示すブロック図
【図3】本発明の出力文字決定手段の入力と出力を示す
図。
【符号の説明】
1 走査手段 2 文字切り出し手段 3 文字認識手段 4 出力文字決定手段 5 記憶手段

Claims (1)

  1. 【特許請求の範囲】 【請求項1】 文書を光学的に走査して光電変換し画像
    パターンを得る走査手段と、画像パターンから個々の文
    字パターンを切り出す文字切り出し手段と、切り出され
    た文字パターンを認識して複数の候補文字と類似度を出
    力する文字認識手段と、類似度を基に認識結果として出
    力する候補文字を決定する出力文字決定手段と、認識結
    果を記憶媒体に記憶させる記憶手段を具備し、出力文字
    決定手段が認識結果として1位の候補文字に連続してそ
    れ以外の候補文字を出力することを特徴とする文字認識
    装置。
JP3175291A 1991-07-16 1991-07-16 文字認識装置 Pending JPH0520489A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3175291A JPH0520489A (ja) 1991-07-16 1991-07-16 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3175291A JPH0520489A (ja) 1991-07-16 1991-07-16 文字認識装置

Publications (1)

Publication Number Publication Date
JPH0520489A true JPH0520489A (ja) 1993-01-29

Family

ID=15993549

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3175291A Pending JPH0520489A (ja) 1991-07-16 1991-07-16 文字認識装置

Country Status (1)

Country Link
JP (1) JPH0520489A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7778447B2 (en) 2004-01-29 2010-08-17 Fujitsu Limited Method and device for mobile object information management, and computer product
US8363963B2 (en) 2008-12-17 2013-01-29 Sharp Kabushiki Kaisha Apparatus, method and computer readable medium that associates a plurality of possible word recognition results with an image

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7778447B2 (en) 2004-01-29 2010-08-17 Fujitsu Limited Method and device for mobile object information management, and computer product
US8363963B2 (en) 2008-12-17 2013-01-29 Sharp Kabushiki Kaisha Apparatus, method and computer readable medium that associates a plurality of possible word recognition results with an image

Similar Documents

Publication Publication Date Title
US6347156B1 (en) Device, method and storage medium for recognizing a document image
JPS6279582A (ja) 文字認識用辞書作成方式
JP2003323617A (ja) クラスタリング
JP2006031546A (ja) 文字方向識別装置、文書処理装置及びプログラム並びに記憶媒体
JPH01279368A (ja) キャラクタデータの転送方式
EP3553702A1 (en) Image recognition-based communication method and device
JPH0520489A (ja) 文字認識装置
JP7320985B2 (ja) 情報処理装置、制御方法及び制御プログラム
KR20200003667A (ko) 광학 문자 인식의 후처리 방법 및 이를 이용한 광학 문자 인식 장치
JP2006163656A (ja) 文字認識システム
US7289668B2 (en) Document image decoding systems and methods using modified stack algorithm
JP2020087320A (ja) 画像処理装置、画像処理方法、及びプログラム
JP2004206521A (ja) 文書検索装置および文書検索プログラム
JP2936426B2 (ja) 英文字認識装置
KR100334624B1 (ko) 클러스터링기반문서영상분할방법
JPH0492973A (ja) イメージ情報登録検索装置
US7167588B2 (en) Document image decoding systems and methods using modified stack algorithm
JP2001338263A (ja) 画像処理装置及び画像処理方法並びに記憶媒体
JPS6343788B2 (ja)
JP2000123116A (ja) 文字認識結果修正方法
JP3226355B2 (ja) 認識結果評価方法
JPH05174195A (ja) 英文字認識装置
JPH03217993A (ja) 文字サイズ認識装置
JPH0417086A (ja) 文字切り出し方法
JPS60110089A (ja) 文字認識装置