JPS6115288A - 光学的文字読取装置 - Google Patents

光学的文字読取装置

Info

Publication number
JPS6115288A
JPS6115288A JP59134856A JP13485684A JPS6115288A JP S6115288 A JPS6115288 A JP S6115288A JP 59134856 A JP59134856 A JP 59134856A JP 13485684 A JP13485684 A JP 13485684A JP S6115288 A JPS6115288 A JP S6115288A
Authority
JP
Japan
Prior art keywords
kanji
recognition
characters
furigana
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59134856A
Other languages
English (en)
Inventor
Toyoshi Sato
佐藤 豊志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP59134856A priority Critical patent/JPS6115288A/ja
Publication of JPS6115288A publication Critical patent/JPS6115288A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の技術分野] 本発明は、漢字文字を高精度に読取ることができる光学
的文字読取装置に関する。
[発明の技術的背景とその問題点] 近年、光学的文字読取装置(OCR)には、英数字、平
仮名文字等だけでなく、漢字文字の読取処理が可能な装
置が開発されている。しかしながら、漢字文字の認識に
は他の文字の場合と比較すると、極めて複雑な処理を必
要とする。漢字文字の認識が可能な漢字OCRを実用化
するためには、漢字文字に対する誤読率を大幅に低下す
ることが要求される。
[発明の目的] 本発明の目的は、漢字文字に対する誤読率を大幅に低下
できるようにして、漢字文字を含む文字の認識処理の実
用化を可能とする光学的文字読取装置を提供することに
ある。
[発明の概要] 本発明は、漢字文字を含む文字が記録された帳票におい
て、漢字文字には対応する振り仮名文字が記録された帳
票を使用する。帳票は光電変換部により走査された後、
漢字文字を含む文字群は日本1i認識手段で認識され、
認識結果である認識コードが出力される。一方、振り仮
名文字は振り仮名文字認識手段によりii!!識され、
その認識結果が出力される。各認識コードは判定手段に
送られ、漢字文字に対する最終的認識処理が実行される
判定手段は、予め記憶した漢字文字、振り仮名文字対応
テーブルを利用して、上記各認識コードの一致性を判定
し、一致した漢字認識コードを帳票上の漢字文字の最終
的認識結果として出力するように構成されている。
このような構成により、振り仮名文字を利用して、漢字
文字に対する認識処理を確実に実行することができる。
[発明の実施例] 以下図面を参照して本発明の一実施例を説明する。第1
図は一実施例に係わる光学的文字読取装置の部分的構成
を示すブロック図である。第1図において、光電変換部
10は、例えば第2図に示すような帳票20上を走査し
、帳票20に記録された文字群を光電変換して得られる
文字パターンを出力する。この光電変換部10から出力
される文字パターンは、図示しない制御部(OCR全体
の動作を制御する制御部)により、漢字文字を含む文字
群の文字パターンP1の場合には日本III識部11へ
送られる。一方、帳票20上の振り仮名文字に対応する
文字パターンP2は、上記制御部により、振り仮名文字
認識部12へ送られる。
日本語認識部11は、漢字文字を含む英数字、平仮名文
字等の文字に対する認識処理を実行し、認識結果である
認識コードを出力する。振り仮名文字認識部12は、振
り仮名文字を認識し、対応する漢字文字弁に相当する振
り仮名認識コードを出力する。判定部13は、日本語認
識部11から出力される認識コードのうち漢字認識コー
ド以外のものはそのまま認識結果として出力する。さら
に、判定部13は、漢字認識コードの場合には振り仮名
文字認識部12から出力される振り仮名認識コードとの
一致性を、予め記憶したテーブル(第3図の30)を参
照して判定し、一致した漢字認識コードを漢字文字に対
する最終的認識結果として出力する。
この場合、テーブル30は、第3図に示すように、漢字
文字と賑り仮名文字が対応してなるテーブルであり、メ
モリ(例えばRAM)14に予め記憶されている。
このような構成のOCRにおいて、一実施例に係わる動
作を説明する。先ず、第2図に示すような帳票20が光
電変換部10により走査されて、帳票20上に記録され
た文字群は2値化信号の文字パターンに光電変換された
後出力される。このとき、帳票20に記録された漢字文
字を含む文字群21は、文字パターンP1として日本g
[lE部11に出力される。また、帳票20上の漢字文
字に対応する振り仮名文字は、文字パターンP2として
振り仮名文字認識部12に出力されるものとする。この
場合、各文字パターンP1.P2は、上記のように図示
しないυ11111部により、予め記憶された)t−マ
ッドコントロール情報に基づいて選択的に制御され、そ
れぞれの対応する認識部に出力される。
日本語認識部11では、漢字文字及び平仮名文字等の文
字パターンP1に対して、認識処理が実行されて、各認
識結果である認識コードが判定部13に出力される。判
定部13は、与えられた認識コードが漢字認識コード以
外の認識コード(例えば英数字、平仮名文字等の認識コ
ード)であれば、その認識コードを認識結果として出力
する。また、判定部13は、与えられた認識コードが漢
字認識コードであれば、一時レジスタ等に配憶する。一
方、振り仮名文字n部12では、文字パターンP2に対
する認識処理が実行されて、漢字文字に対応する振り仮
名文字の振り仮名認識コードが判定部13に出力される
判定部13は、振り仮名認識コードを受信すると、この
振り仮名認識コードと上記漢字認識コードとの一致性を
判定する。即ち、判定部13は、予めメモリ14に記憶
された漢字文字、振り仮名文字対応テーブルを利用して
、漢字認識コードと振り仮名認IK :]−ドが対応し
ているか否かを判定する。メモリ14内のテーブルは、
例えば第3図に示すような構成のテーブルからなる。こ
こで、例えば帳票20の漢字文字「学」の漢字認識コー
ドが「3358」であり、撮り仮名文字「がっ」の振り
仮名認識コードがr242C,2444Jであるとする
判定部13は、第3図のテーブルを参照して、漢字認識
」−ドr 3358 jと振り仮名認識」−ドr242
C,2444Jとが対応していることを確認すると、そ
の漢字認識コードr3358Jを認識結果として出力す
ることになる。判定部13は、次の漢字文字「校」につ
いても上記と同様に第3図のテーブルを参照して、振り
仮名認識コードとの一致性を判定する。このとき、例え
ば漢字文字1校」が日本tfftu部11でリジェクト
された場合、リジIり1〜コードが判定部13に出力さ
れる。判定部13は、テーブルを参照し、リジェクトコ
ードが漢字」−ドとして登録されていないと確認すると
、そのリジェクトコードをそのまま出力する。また、平
仮名文字「に」及びr<Jの各認識」−ドも第3図のテ
ーブルには登録されていないため、判定部13は「に」
の認識コードr244BJ及び「り」の認識コードr2
42FJを認識結果として出力する。さらに、漢字0!
識コードと振り仮名認識コードとの一致性がない場合に
は、判定部13はリジェクトコードを出力することにな
る。
このようにして、帳票20上に漢字文字に対応する振り
仮名文字を記録することにより、漢字文字及び振り仮名
文字の各認識コードの一致性を予め用意されたテーブル
に基づいて判定する。そして、判定結果により、一致し
ていれば、その漢字0!識コードを認識結果として出力
することになる。このため、漢字文字に対してマツチン
グHlffi処唾等の認識処理だけでなく、振り仮名文
字の認識結果を利用したUt識処理を行なうことで、漢
字文字の認識精度を大幅に高めることができる。ここで
、振り仮名文字の場合、漢字文字に比較して、認識精度
は通常高いため、それほど問題はない。したがって、漢
字文字に対する誤読率を大幅に低下することができる。
[発明の効果] 以上詳述したように本発明によれば、漢字文字に対する
認識精度を大幅に高めることができる。
したがって、本発明を漢字OCRに適用すれば、漢字文
字の誤読率を大幅に低下させることができるため、漢字
文字を含む日本語文字の読取りを確実に実行できる実用
的な漢字OCRを提供することができるものである。
【図面の簡単な説明】
第1図は本発明の一実施例に係わる光学的文字読取装置
の構成を示すブロック図、第2図は同実施例の帳票の一
例を示す図、第3図は同実施例の漢字文字5振り仮名文
字対応テーブルの一例を示す図である。 10・・・光電変換部、11・・・日本語ii!識部、
12・・・振り仮名文字認識部、13・・・判定部13
.14・・・メモリ。

Claims (1)

    【特許請求の範囲】
  1. 漢字文字を含む文字群とその漢字文字に対応する振り仮
    名文字が記録された帳票上を走査し光電変換して得られ
    る文字パターンを出力する光電変換手段と、この光電変
    換手段から出力される文字パターンにおいて上記漢字文
    字を含む文字群を認識しその認識結果である認識コード
    を出力する日本語認識手段と、上記光電変換手段から出
    力される文字パターンにおいて上記振り仮名文字を認識
    しその認識結果である振り仮名認識コードを出力する振
    り仮名文字認識手段と、予め記憶した漢字文字と振り仮
    名文字との対応テーブルを参照して上記日本語認識手段
    からの漢字文字の漢字認識コードと上記振り仮名文字認
    識手段からの振り仮名認識コードとの一致性を判定し一
    致した漢字認識コードを上記漢字文字の最終的認識結果
    として出力する判定手段とを具備してなることを特徴と
    する光学的文字読取装置。
JP59134856A 1984-06-29 1984-06-29 光学的文字読取装置 Pending JPS6115288A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59134856A JPS6115288A (ja) 1984-06-29 1984-06-29 光学的文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59134856A JPS6115288A (ja) 1984-06-29 1984-06-29 光学的文字読取装置

Publications (1)

Publication Number Publication Date
JPS6115288A true JPS6115288A (ja) 1986-01-23

Family

ID=15138063

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59134856A Pending JPS6115288A (ja) 1984-06-29 1984-06-29 光学的文字読取装置

Country Status (1)

Country Link
JP (1) JPS6115288A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01231185A (ja) * 1988-03-11 1989-09-14 Toshiba Corp 文字認識装置
JPH02125849U (ja) * 1989-03-28 1990-10-17

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS592191B2 (ja) * 1974-05-11 1984-01-17 松下電子工業株式会社 半導体装置用電極の製造方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS592191B2 (ja) * 1974-05-11 1984-01-17 松下電子工業株式会社 半導体装置用電極の製造方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01231185A (ja) * 1988-03-11 1989-09-14 Toshiba Corp 文字認識装置
JPH02125849U (ja) * 1989-03-28 1990-10-17

Similar Documents

Publication Publication Date Title
US4075605A (en) Character recognition unit
JPH07121664A (ja) 自動ヨーロッパ言語決定装置
JPS62221088A (ja) 光学式文字読取装置
JPS6115288A (ja) 光学的文字読取装置
JPS6336389A (ja) 文字読取装置
JPH0157837B2 (ja)
JPS6095689A (ja) 光学的文字読取装置
JPS60254388A (ja) 光学的文字読取装置
JPS61153781A (ja) 光学的文字読取装置
JPS59188783A (ja) 文字判定処理方式
JPS6139175A (ja) 光学的文字読取装置
JPH0758499B2 (ja) 文字認識装置
JPS60110089A (ja) 文字認識装置
JPH0475556B2 (ja)
JPS61114388A (ja) 文字入力装置
JPH05282484A (ja) 光学的文字読取り装置
JPH03123989A (ja) 文字認識装置
JPS5914078A (ja) 帳票読取装置
JPS60207983A (ja) 文字認識用辞書作成方式
JPS5960690A (ja) 2値化装置
JPS6336487A (ja) 文字読取方式
JPS63143683A (ja) 光学的文字読取り装置
JPS60138689A (ja) 文字認識方法
JPS62169289A (ja) 光学文字読取装置
JPS63159900A (ja) 音声情報入力方式