JPS60254388A - 光学的文字読取装置 - Google Patents

光学的文字読取装置

Info

Publication number
JPS60254388A
JPS60254388A JP59111896A JP11189684A JPS60254388A JP S60254388 A JPS60254388 A JP S60254388A JP 59111896 A JP59111896 A JP 59111896A JP 11189684 A JP11189684 A JP 11189684A JP S60254388 A JPS60254388 A JP S60254388A
Authority
JP
Japan
Prior art keywords
character
kanji
characters
recognition
kana
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59111896A
Other languages
English (en)
Inventor
Hiroyuki Harashima
原島 裕之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP59111896A priority Critical patent/JPS60254388A/ja
Publication of JPS60254388A publication Critical patent/JPS60254388A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の技術分野] 本発明は、漢字文字の読取機能を備えた光学的文字読取
装置に関する。
[発明の技術的背景とその問題点] 従来、光学的文字読取装置(C)CR)において、漢字
文字以外の英数字及び仮名文字を読取るOCRの基本的
構成は第7図に示すように成っている。
即ち、用紙に記録された゛文字は、光電変換部(図示せ
ず)により電気信号である文字パターンPに変換される
。この文字パターンPは、前処理部10で2値化、正規
化等の前処理後に文字認識部11に送られる。文字認識
部11は、予め認識用辞書を備えており、この辞書に基
づいて文字パターンPに対する認識処理を実行する。文
字認識部11は、認識処理後に複数の認識結果を後処理
部12に出力する。この後処理部12は、複数の認識結
果の中から最も妥当性の高い認識結果を答えとして出力
する。
尚、制御部13は、OCR全体の動作を制御する回路で
ある。
ところで、近年では、上記のようなOCRの機能に漢字
文字読取機能を付加した漢字OCRの開発が行われてい
る。この漢字OCRは、第8図に示すように、大分類部
20を備えており、この大分類部20により数千種の漢
字の中から文字パターンPに対応する漢字候補文字Kを
選択する。この漢字候補文字には、文字パターンPに対
して比較的文字線分構成が類似した複数の候補文字から
なる。
文字認識部21は、大分類部20からの漢字候補文字に
の範囲に認識対象文字を限定し、文字パターンPに対す
る認識結果を予め備えた辞書に基づいて出力する。
このような漢字OCRにより、漢字文字の読取処理を実
行することができる。しかしながら、上記のような漢字
OCRでは、文字認識部21で必要な認識用辞書は数千
種の漢字文字に相当する標準パターンからなる。このた
め、辞書メモリは大容量となり、OCRは装置自体が大
型化し、コスト的にも多大となる問題があった。
[発明の目的コ 本発明は上記の点に鑑みてなされたもので、その目的は
、文字認識用の辞書メモリの容量を減少させた簡単な構
成で、漢字文字の読取機能を実現できる光学的文字読取
装置を提供することにある。
[発明の概要] 本発明は、用紙に記録された漢字文字に対応する振り仮
名文字の認識結果を利用して、漢字文字の認識処理を実
行するように構成されたOCRである。即ち、文字認識
部では、用紙に記録された仮名文字に対する認識処理が
実行される。一方、大分類部では、漢字パターンに対し
て複数の候補文字が選択されて出力される。′文字!1
部及び大分類部の各出力が、認識用辞書を備えた判定部
に送られる。この判定部は、仮名文字認識結果に応じた
漢字候補文字を認識用辞書から選択し、この漢字候補文
字と大分類部からの候補文字とのマツチング処理を実行
する。このマツチング処理により、整合した漢字文字が
最終的答として出力されるように構成されている。
このような構成により、文字認識用の辞書メモリの容量
を大幅に減少することができる。
[発明の実施例] 以下図面を参照して本発明の一実施例を説明づる。第1
図は一実施例に係わるOCRの構成を示すブロック図で
ある。第1図において、文字認識部11は、前処理部1
0から送られる文字パターンPの中で英数字及び仮名文
字に対する認識処理を実行する。大分類部20は、前処
理部10からの文字パターンPの中で漢字文字に相当す
る漢字候補文字Kを選択して後処理部30に出力する。
この後処理部30は、予め文字認識部11の仮名文字の
認識結果に応じた漢字候補文字を選択するための漢字認
識用辞書メモリを備えている。さらに、後処理部30は
、上記漢字認識用辞書メモリから選択した漢字候補文字
と大分類部20からの漢字候補文字にとのマツチング処
理を実行し、このマツチング処理により整合した漢字文
字を最終的答として出力するように構成されている。
このような構成のOCRにおいて、一実施例に係わる動
作を説明する。先ず、例えば第2図に示すような帳票3
1が図示しない光電変換部により走査され、帳票31に
記録された漢字32及び仮名文字33が電気信号である
文字パターンPに変換される。
この文字パターンPは、前処理部10により2値化。
正規化等の前処理後に文字認識部11及び大分類部20
に出力される。このとき、制御部13は、予め記憶した
フォーマットコントロール情報に基づいて、文字パター
ンPのうち仮名文字に対応するパターンを文字認識部1
1に送るように制御する。同様に、制御部13は、文字
パターンPのうち漢字に対応するパターンを大分類部2
0に送るように制御する。
文字認識部11は、前処理部10からの文字パターンP
に対して文字認識処理を実行し、第3図に示すような仮
名文字認識結果を後処理部30に出力する。一方、大分
類部20では、第4図に示すように、文字パターンPの
各漢字パターンに対応する各候補文字群41〜44が図
示しない大分類用の辞書メモリから選択される。この各
候補文字群41〜44からなる漢字候補文字には、後処
理部30に送られる。
後処理部30は、予め用意された仮名文字表記に応じた
漢字認識用辞書メモリを利用して、第5図に示すように
、文字認識部11の仮名文字認識結果45〜48に対応
する各漢字候補文字群49〜52を選択する。ここで、
漢字認識用辞書メモリには、予め複数の漢字パターンが
仮名文字表記に応じて分類された状態で記憶されている
。そして、後処理部30は、選択した各漢字候補文字群
49〜52と上記大分類部20からの漢字候補文字K(
第4図の各候補文字群41〜44)とのマツチング処理
を実行する。
このマツチング処理により、整合した漢字文字(第6図
)を最終的な答として出力する。
このようにして、帳票31に記録された漢字文字32を
読取ることができる。この場合、上記のように漢字文字
に対応する振り仮名文字33の認識結果を利用して、文
字パターンPに相当する漢字文字を漢字認識用辞書メモ
リから選択し、答を出力することができる。後処理部3
0では、上記のように仮名文字認識結果に対応する候補
文字群49〜52を予め記憶する漢字認識用辞書メモリ
が設けられている。この漢字認識用辞書メモリは、上記
のように予め仮名文字表記に応じた漢字文字群を記憶し
ており、比較的小容量の辞書メモリである。したかって
、従来の漢字OCRに必要な大容量の認識用辞書メモリ
を不要にすることができる。即ち、従来のOCRは、数
千種の漢字パターンに相当する標準パターンを記憶する
認識用辞書メモリを必要とする。これに対して、上記漢
字認識用辞書メモリは、仮名文字表記に応じた漢字パタ
ーンを記憶しているだけであるため、比較的記憶容量は
小さくなる。したがって、従来の漢字OCRに対して、
簡単な構成で低コストのOCRを実現できる。
[発明の効果] 以上詳述したように本発明に−よれば、漢字読取機能を
備えたOCRにおいて、漢字認識用辞書メモリの容量を
大幅に減、少させることができる。したがって、簡単な
構成で低コストのOCRを実現できるものである。
【図面の簡単な説明】
第1図は本発明の一実施例に係わる光学的文字読取装置
の構成を示すブロック図、第2図は帳票の一例を示す図
、第3図は第1図の文字認識部の認識結果の一例を示す
図、第4図は第1図の大分類部の出力結果の一例を示す
図、第5図は後処理部の漢字認識用辞書メモリの記憶内
容の一例を示す図、第6図は後処理部の答えの一例を示
す図、第7図及び第8図はそれぞれ従来の光学的1文字
読取装置の構成を示すブロック図である。 11・・・文字認識部、12.30・・・後処理部、1
3・・・制一部、20・・・大分類部。 出願人代理人 弁理士 鈴江武彦 第1図 第2図 第3図 第4図 第5図

Claims (1)

    【特許請求の範囲】
  1. 用紙に記録された文字を光電変換して得られる文字パタ
    ーンを出力する光電変換手段と、この光電変換手段から
    出力される文字パターンの中で英数字及び仮名文字の文
    字認識処理を実行する文字認識手段と、上記光電変換手
    段から出力される文字パターンの中で漢字文字に対する
    大分類処理を実行し複数の候補文字を出力する大分類手
    段と、上記文字認識手段の認識結果の中で仮名文字認識
    結果に応じた漢字候補文字を予め備えた認識用辞書から
    選択しこの選択された漢字候補文字と上記大分類手段か
    らの候補文字間のマツチング処理を実行しその整合した
    漢字文字を答えとして出力する判定手段とを具備してな
    ることを特徴とする光学的文字読取装置。
JP59111896A 1984-05-31 1984-05-31 光学的文字読取装置 Pending JPS60254388A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59111896A JPS60254388A (ja) 1984-05-31 1984-05-31 光学的文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59111896A JPS60254388A (ja) 1984-05-31 1984-05-31 光学的文字読取装置

Publications (1)

Publication Number Publication Date
JPS60254388A true JPS60254388A (ja) 1985-12-16

Family

ID=14572848

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59111896A Pending JPS60254388A (ja) 1984-05-31 1984-05-31 光学的文字読取装置

Country Status (1)

Country Link
JP (1) JPS60254388A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6795579B2 (en) 1998-04-16 2004-09-21 International Business Machines Corporation Method and apparatus for recognizing handwritten chinese characters

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6795579B2 (en) 1998-04-16 2004-09-21 International Business Machines Corporation Method and apparatus for recognizing handwritten chinese characters

Similar Documents

Publication Publication Date Title
JP2553608B2 (ja) 光学文字読取装置
JPS62221088A (ja) 光学式文字読取装置
JPS60254388A (ja) 光学的文字読取装置
JPS6336389A (ja) 文字読取装置
JPS6115288A (ja) 光学的文字読取装置
JPS6095689A (ja) 光学的文字読取装置
JPH0475557B2 (ja)
JPS63263588A (ja) 文字読取装置
JP2615834B2 (ja) 単語読取装置
JPH01311390A (ja) 文字置換制御方式
JPS59149569A (ja) 光学的文字読取装置
JPS5914078A (ja) 帳票読取装置
JPS61153781A (ja) 光学的文字読取装置
JPS5931105B2 (ja) 文字読取装置
JPS59121476A (ja) 光学的文字読取装置
Amin et al. Recognition of hand-printed characters using induct machine learning
JPS62140188A (ja) 文字認識後処理方式
JPH03228195A (ja) 光学的文字認識装置
JPS59188783A (ja) 文字判定処理方式
JPS62281089A (ja) 画像処理方法
JPS61148585A (ja) 文字認識装置
JPS61107485A (ja) 光学的文字読取装置
JPH04205686A (ja) 郵便物宛名読取装置
JPH08190607A (ja) 光学式文字読取装置
JPS59197969A (ja) 光学的文字読取装置