JPS6139175A - 光学的文字読取装置 - Google Patents

光学的文字読取装置

Info

Publication number
JPS6139175A
JPS6139175A JP16056784A JP16056784A JPS6139175A JP S6139175 A JPS6139175 A JP S6139175A JP 16056784 A JP16056784 A JP 16056784A JP 16056784 A JP16056784 A JP 16056784A JP S6139175 A JPS6139175 A JP S6139175A
Authority
JP
Japan
Prior art keywords
character
result
recognition
similar
recognition result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP16056784A
Other languages
English (en)
Other versions
JPH0475557B2 (ja
Inventor
Kenji Hasegawa
健治 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP16056784A priority Critical patent/JPS6139175A/ja
Publication of JPS6139175A publication Critical patent/JPS6139175A/ja
Publication of JPH0475557B2 publication Critical patent/JPH0475557B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の技術分野] 本発明は、類似文字群の文字認識処理を行なうことがで
きる光学的文字読取装置に関する。
[発明の技術的背景とその問題点] 近年、光学的文字読取装置(OCR)では、認識対象の
文字種が英数字1片板名文字、平板名文字及び漢字のよ
うに広範囲になりつつある。このようなOCRでは、例
えば数字のrOJと英字のrOJまたは数字の「5」と
英字の「S」のような類似文字の認識が困難である。
従来、上記のような類似文字には、用紙に記入する際に
例えば英字のrOJの上にラインを付加したり、英字の
「S」の左下部にセリフ(serif)を付加するよう
なことが行われている。これにより、類似文字に対する
認識率を向上することができるが、認識対象文字の中に
漢字が含まれると、類似文字の数は飛躍的に増大する。
このため、用紙に記入する際に、類似文字間を区別する
ように記入することは実際上困難である。このため、従
来のOCRでは、漢字を含む類似文字を確実に認識する
ことは極めて困難であった。
[発明の目的] 本発明は上記の点に鑑みてなされたもので、その目的は
、漢字を含む類似文字の認識を確実に実行できる光学的
文字読取装置を提供することにある。
[発明の概要] 本発明は、文字認識手段の認識結果が類似文字種である
か否かを判定する類似文字判定手段を備えている。この
判定結果により認識結果が類似文字種に属する場合、文
字種判別手段により、認識結果がその前後の文字の文字
種と同一である否かが判別される。文字種が同一である
場合、上記前後の文字の文字種に対応する認識結果の文
字コードを最終的認識結果として出力する出力手段が設
けられている。また、文字種が同一でない場合、予め用
意された文字種判定テーブルにより上記認識結果の文字
種を決定する決定手段が設けられている。
このような構成により、類似文字に対する文字認識処理
を確実に実行できる。
[発明の実施例] 以下図面を参照して本発明の一実施例を説明する。第1
図は一実施例に係わるOCRの構成を示すブロック図で
ある。第1図において、文字認識部10は、光電変換さ
れた文字パターンに対する文字認識処理を実行し、認識
結果Rをバッファメモリ11に出力する。バッファメモ
、す11は、通常1行分の認識結果Rを記憶する。類似
文字判別部12は、バッファメモリ11から出力された
認識結果Rが類似文字種に属するか否かを判別する。認
識結果Rが類似文字種に属さない場合J類似文字判別部
12は認識結果Rを答出力部17に出力する。
前後文字判別部13は、類似文字種に属する認識結果R
を受信すると、バッファメモリ11からその認識結果R
の前後に存在する文字の認識結果FBを読出し、認識結
果Rが認識結果FBの文字種と同一であるか否かを判別
する。最終コード決定部14は、前後文字判別部13の
判別結果が同一である場合、認識結果FBの文字種に対
応する認識結果Rの文字コードを最終的コードとして決
定し、答出力部11に出力する。最終コード判定部15
は、前後文字判別部13の判別結果が同一でない場合、
予めテーブルメモリ16に記憶された文字種判定テーブ
ルを利用して認識結果Rの文字種を判定し、その文字種
に対応する文字コードを答出力部17に出力する。
このような構成のOCRにおいて、一実施例に係わる動
作を説明する。先ず、用紙に記録された文字が光電変換
された後に、文字認識部10に与えられる。文字認識部
10では、文字パターンに対する文字認識処理が実行さ
れる。これにより得られた認識結果Rが文字コードとし
てバッフ1メモリ11に格納される。このとき、認識対
象の文字が類似文字種である場合、漢字等に対応する文
字コードが取敢えずバッフてメモリ11に格納される。
例えば認識結果Rが「−」である場合、長音を示す文字
コードがバッフ7メモリ11に格納される。類似文字判
別部12では、バッファメモリ11からの認識結果Rが
類似文字種であるか否かの判別がなされる。ここで、類
似文字判別部12は、予め例えば第2図に示すような類
似文字群(第1水準の漢字を含む)からなるテーブルを
記憶している。認識結果Rが第2図の類似文字群に属し
ていなければ、認識結果Rはそのままの文字コードで答
出力部17に出力される。
一方、認識結果Rが類似文字群に属する場合、前後文字
判別部13では認識結果Rの該当文字の前後の文字の文
字種が判別される。この場合、前後文字判別部13はバ
ッフ7メモリ11から前後の文字に対応する認識結果F
Bを読出し、文字種の判別を実行する。この判別結果に
おいて、同一文字種である場合にはその文字種に対応す
る認識結果Rの文字コードが最終コード決定部14に出
力される。
例えば、認識結果Rが「ハ」のとき、前後の認識結果F
Bが片仮名文字であれば、片仮名文字の「ハ」に対応す
る文字]−ドが最終コード決定部14に出力される。最
終コード決定部14では前後文字判別部13から出力さ
れた文字コードを最終的な文字コマドとして決定され、
その文字コードが答出力部17に出力される。
また、認識結果Rの文字種が前後の文字の場合と異なる
とき、最終コード判定部15において認識結果Rの文字
コードが判定される。最終コード判定部15では、例え
ば第3図に示すような文字種判定テーブルを利用して、
文字コードの判定が実行される。ここで、第3図におい
て、長は長音、ダはダッシュ、−は漢数字、マはマイナ
ス、?は判定不能を示すものとする。例えば、認識結果
Rが未知なる「−」である場合、前後文字判別部13の
判別結果により前後の文字がそれぞれ漢字であるとする
。この場合には、第3図のテーブルにより、認識結果R
は漢数字の「−」であると判定される。
そして、最終コード判定部15で判定された文字コード
が、認識結果Rの最終的コードとして答出力部17に出
力される。尚、最終コード判定部15において、判定結
果が「?」の場合には、文字種候補が2種以上かまたは
頻度が希の場合と判定し、判定多能としてリジェクトさ
れる。
このようにして、認識対象の文字が類似文字群に属する
場合、その文字の前後の文字の文字種に基づいて文字種
を判定する。この判定結果により、決定された文字種に
対応する文字コードを最終的文字認識結果として出力す
る。したがって、用紙に予め類似文字間を区別する記入
をする必要がなく、漢字を含む類似文字の認識を確実に
行なうことができる。
[発明の効果コ 以上詳述したように本発明によれば、漢字を含む類似文
字の認識を、簡単な構成で確実に行なうことができる。
したがって、広い範囲の文字種に属する認識対象文字に
対する認識率を大幅に向上することができるものである
【図面の簡単な説明】
第1図は本発明の一実施例に係わるOCRの構成を示す
ブロック図、第2図は第1図の類似文字判別部に記憶さ
れたテーブルの一例を示す図、第3図は第1図のテーブ
ルメモリに記憶された文字種判定テーブルの一例を示す
図である。 10・・・文字認識部、12・・・類似文字判別部、1
3・・・前後文字判別部、14・・・最終コード決定部
、15・・・最終コード判定部、16・・・テーブルメ
モリ。 出願人代理人 弁理士 鈴江武彦 第1図

Claims (1)

    【特許請求の範囲】
  1. 光電変換された文字パターンに対する文字認識処理を行
    なう文字認識手段と、この文字認識手段による認識結果
    が類似文字群に属するか否かを判定する類似文字判定手
    段と、この類似文字判定手段の判定結果により上記認識
    結果が類似文字群に属する場合上記認識結果の前後に存
    在する文字の文字種を判別する文字種判別手段と、この
    文字種判別手段の判別結果により上記認識結果が上記前
    後の文字と同一の文字種の場合その文字種に対応する認
    識結果の文字コードを最終的文字認識結果として出力す
    る最終的出力手段と、上記文字種判別手段の判別結果に
    より上記認識結果が前後の文字と異なる場合予め設定さ
    れた文字種判定テーブルを利用して上記認識結果の文字
    種を決定する文字種決定手段とを具備したことを特徴と
    する光学的文字読取装置。
JP16056784A 1984-07-31 1984-07-31 光学的文字読取装置 Granted JPS6139175A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP16056784A JPS6139175A (ja) 1984-07-31 1984-07-31 光学的文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP16056784A JPS6139175A (ja) 1984-07-31 1984-07-31 光学的文字読取装置

Publications (2)

Publication Number Publication Date
JPS6139175A true JPS6139175A (ja) 1986-02-25
JPH0475557B2 JPH0475557B2 (ja) 1992-12-01

Family

ID=15717764

Family Applications (1)

Application Number Title Priority Date Filing Date
JP16056784A Granted JPS6139175A (ja) 1984-07-31 1984-07-31 光学的文字読取装置

Country Status (1)

Country Link
JP (1) JPS6139175A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6330991A (ja) * 1986-07-25 1988-02-09 Matsushita Electric Ind Co Ltd 文字認識装置
JPH0290384A (ja) * 1988-09-28 1990-03-29 Ricoh Co Ltd 文字認識装置の後処理方式
US5048113A (en) * 1989-02-23 1991-09-10 Ricoh Company, Ltd. Character recognition post-processing method

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5927381A (ja) * 1982-08-07 1984-02-13 Fujitsu Ltd 文字認識方式

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5927381A (ja) * 1982-08-07 1984-02-13 Fujitsu Ltd 文字認識方式

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6330991A (ja) * 1986-07-25 1988-02-09 Matsushita Electric Ind Co Ltd 文字認識装置
JPH0290384A (ja) * 1988-09-28 1990-03-29 Ricoh Co Ltd 文字認識装置の後処理方式
US5048113A (en) * 1989-02-23 1991-09-10 Ricoh Company, Ltd. Character recognition post-processing method

Also Published As

Publication number Publication date
JPH0475557B2 (ja) 1992-12-01

Similar Documents

Publication Publication Date Title
JPS6139175A (ja) 光学的文字読取装置
JPS56149676A (en) Pattern recognizer
JPS59158482A (ja) 文字認識装置
JPS592191A (ja) 手書き日本語文の認識処理方式
JPS61114388A (ja) 文字入力装置
JPS6336389A (ja) 文字読取装置
JPH03212779A (ja) 文字認識装置
JP2686745B2 (ja) 文字読取装置
JPS60110089A (ja) 文字認識装置
JPS59112367A (ja) 文字読取方式
JPS5927381A (ja) 文字認識方式
JPS629958B2 (ja)
JPS59128682A (ja) 文字読取り装置
JPH0223906B2 (ja)
JPS6095689A (ja) 光学的文字読取装置
JPS6019550B2 (ja) 図形認識装置
JPH07104911B2 (ja) パタ−ン認識装置
JPH0426153B2 (ja)
JPS60160481A (ja) 文字読取装置
JPS5854431B2 (ja) 文字認識装置の誤読検出方式
JPS5897783A (ja) 光学的文字読取装置
JPS61153781A (ja) 光学的文字読取装置
JPH09171539A (ja) 文字認識装置
JPS5941232B2 (ja) 文字認識装置
JPH02181286A (ja) 単語検索方式

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term