JPS6095689A - 光学的文字読取装置 - Google Patents

光学的文字読取装置

Info

Publication number
JPS6095689A
JPS6095689A JP58203843A JP20384383A JPS6095689A JP S6095689 A JPS6095689 A JP S6095689A JP 58203843 A JP58203843 A JP 58203843A JP 20384383 A JP20384383 A JP 20384383A JP S6095689 A JPS6095689 A JP S6095689A
Authority
JP
Japan
Prior art keywords
kanji
recognition
character
word
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58203843A
Other languages
English (en)
Other versions
JPH0319589B2 (ja
Inventor
Hiroyuki Harashima
原島 裕之
Kunio Sakai
坂井 邦夫
Yoshiaki Kurosawa
由明 黒沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP58203843A priority Critical patent/JPS6095689A/ja
Publication of JPS6095689A publication Critical patent/JPS6095689A/ja
Publication of JPH0319589B2 publication Critical patent/JPH0319589B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は、特に手書き漢字を認識するための光学的文字
読取装置に関する。
〔発明の技術的背景とその問題点〕
近年、手書き漢字認識用の光学的文字読取装置(0,0
R)には、認識精度を向上させるために手書き漢字に対
応する振シ仮名文字(通常片仮名文字)の読取結果をガ
イドとして、漢字の認識処理を行なう方式のものが開発
されている(特願照56−99573)。
この方式のOCRでは、帳票上に予め漢字に対応する振
シ仮名文字が記入されておシ、この振9仮名文字の読取
結果に基づいて漢字の認識結果から得られる複数の候補
文字から答となる認識結果が選択されるように構成され
ている。
しかしながら上記のような方式のOCRは、漢字の認識
精度が振シ仮名文字(片仮名文字)の認識結果に依存し
ており、振9仮名文字の認識処理が高精度で行なわれる
ことによシ有効となる方式である。このため、例えば月
見里(ヤマナシ)、五月雨(す之ダレ)などのように特
殊な読み方の漢字には予め正しい振シ仮名を付すことが
困難であるため、上記のような方式のOCRでは読取ミ
スが生ずることがある。また、通常の漢字の場合でも、
振シ仮名文字である片仮名文字を完全に認識することは
不可能であるため、高い精度で漢字を読取ることは困難
である。
〔発明の目的〕
本発明は上記の事情に鑑みてなされたもので、その目的
は、振シ仮名文字の認識結果を参照して漢字の認識を行
なう方式のOCRにおいて、高い精度で漢字の認識を行
なうことができる光学的文字読取装置を提供することに
ある。
〔発明の概要〕
本発明では、漢字及びその漢字に対応する振り仮名文字
が記録された帳票に対して、各文字を文字単位で認識す
る文字認識手段が設けられる。この文字認識手段の文字
単位の各認識結果に基づいて、漢字及び振シ仮名のそれ
ぞれからなる単語が単語認識手段によシ認識される。単
語認識手段は、予め用意されている単語認識用テーブル
を参照して各単語単位の認識処理全行なう。
制御手段は、単語認識手段からの各単語単位の認識結果
を照合し、その照合結果が漢字および振シ仮名文字の各
単語単位の認識結果が相互に対応する場合にその各認識
結果を最終的答として出力するように構成されている。
これによシ、漢字及び振力仮名の各文字を同時にしかも
正確に認識でき、結果的に高い精度で漢字を読取ること
ができるものである。
〔発明の実施例〕
以下図面を参照して本発明の一実施例について説明する
。第1図は一実施例に係わるOCRの部分的構成を示す
ブロック図である。第1図において、走査部10は帳票
(第2図に示す)上を走査してその帳票に記録された漢
字及び振り仮名用片仮名文字のそれぞれを光電変換し、
各量子化パターン(2値化信号からなる文字パターン)
を文字認識部ノーへ出力する。この文字認識部11は、
走査部10から送られる量子化パターンに基づいて帳票
上の、漢字及び振り仮名用片仮名文字の認識処理を文字
単位で行なう。
単語認識部12=)−は、文字認識部11から出力され
る漢字及び片仮名文字の各認識結果(文字単位)に基づ
いて、それぞれの文字からなる各単語を認識する。単語
認識部12≠は、予め漢字及び片仮名文字のそれぞれに
ついて単語単位の認識用テーブル(辞書)を記憶してい
る。
制御部13主は、単語認識部12から出力される漢字及
び片仮名文字の各単語単位の認識結果を照合し、その照
合結果にセいて各単語単位♀認識結果が相互に対応する
場合にその各認識結果を最終的答として出力する。また
、制御部ρ召 13≠は走査部10、文字認識部11及び単峰認識部1
2の各動作を制御する。
上記のような構成のOCRにおいて、その動作を説明す
る。先ず、第2図に示すような帳票が走査部10によ多
走査されて、その帳票上に記録された漢字及びその振巾
仮名用片仮名がそれぞれ量子化パターンに変換されて文
字認識部11に送られる。ここで、帳票には第2図に示
すように漢字20が記入される文字エリア2ノ及びその
漢字20に対応する振り仮名用片仮名文字(以下単にカ
タカナと称する)22が記入される文字エリア23が予
め設けられている。
走査部lOからは、帳票上の漢字2o及びカタカナ22
に対応する各量子化ノやターンが文字認識部11へ送ら
れる。文字認識部11″cは、走査部10からの各量子
化i4ターンに基づいて漢字20及びカタカナ22に対
する文字単位の認識処理が行なわれる。
文字認識部11で認識された文字単位の各認識結果は、
順次単語認識部12へ送られる。単語認識部12は、文
字単位の各認識結果を例えばバッファメモリ内に単語単
位毎に格納する。
この場合、制御部13によシ予め用意されているフォー
マットテーブル(帳票上に記入される文字20.22の
位置を指示する情報等が記憶されている)に基づいて、
単語単位毎に上記各認識結果が単語認識部12に送られ
る。これによシ、単語認識部12では単語単位(即ち例
えば名字と名前毎の単語)の認識処理が行なわれるO ところで、例えば第3図に示すように文字認識部11で
のカタカナに対する認識結果において、名字の1文字3
0及び名前の1文字31がそれぞれ特定できないとする
。このときの各認識結果30・31の候補文字32.3
3は、それぞれ2文字づつとする。また例えば第4図に
示すように文字認識部11での漢字に対する認識結果に
おいて、名字の1文字40及び名前の1文字4ノがそれ
ぞれ特定できないとする。このときの各認識結果40.
41の候補文字42゜43は、それぞれ2文字づつとす
る。単語認識部12では、上記のような単語単位のカタ
カナ(第3図)及び漢字(第4図)に対して、第5図及
び第6図に示す単語認識用テーブル(以下単語辞書と称
する)に基づいて単語単位の認識処理が行なわれる。即
ち、第3図に示すカタカナに対する認識処理では、第5
図に示す単語辞書に基づいて、単@認識が行なわれる。
名字の「サカク」および名前の「ケニオ」の各単語は単
語辞書に存在しないため除去される。これによシ、名字
及び名前の各カタカナの単語認識結果として、第7図に
示す単語「サカイ」及び「クニオ」の両者が単語認識部
12から制御部13へ送られる。このとき、「ザカイ」
及び「クニオ」の各振シ仮名に対応する複数の漢字70
.71が共に制御部13へ送られる。
1だ、第4図に示す漢字に対する単語認識部12の認識
処理では、第6図に示す単語辞書に基づいて検索され、
上記第3図のカタカナの認識結果(サカ及びニオ)及び
第4図の候補文字42.43に応じた漢字「板弁」及び
「邦夫」の両者が選択される。これにより、単語認識部
12からは、第8図に示す認識結果(板弁及び邦夫)が
各対応するカタカナgO,81と共に制御部13へ送ら
れる。
制御部13では、単語認識部12から送られる第7図及
び第8図に示す各認識結果が照合される。そして、単語
単位のカタカナ及び漢字の両者が相互に対応する認識結
果がそれぞれ最終的答として出力される。即ち、この場
合には第9図に示すよう々答が制御部13から出力され
る。制御部13での照合処理の結果において、相互に対
応するカタカナ及び漢字の各認識結果が存在しない場合
にはリジェクト処理となるQこのようにして、帳票上に
記入された単語単位の漢字及びその振シ仮名となるカタ
カナをそれぞれ認識処理し、その各認識結果を照合する
これによシ、単語単位の漢字及びカタカナがそれぞれ相
互に対応するような組合せ結果を最終的答として出力す
ることができる。したがって1振)仮名であるカタカナ
の文字単位の認識結果カタカナの相互に対応する紹合せ
結果として答を出力するため、漢字の誤読率を大幅に低
下させることができる。また、上記のように単語単位に
よる認識処理が行なわれるため、特別な読み方をする漢
字(例えば月見里、五月雨)に対する読取処理にも有効
となる。
〔発明の効果〕
以上詳述したように本発明によれば、振り仮名文字及び
漢字の各単語単位の認識結果を照合し、相互に対応する
振シ仮名文字と漢字の組合せ結果を最終的答として出力
することにより、振シ仮名文字の文字単位の認識結果が
不完全の場合でも、漢字に対する誤読率を大幅に低下さ
せることができる。したがって、結果的に高い精度で漢
字の認識を行なうことができるものである。
【図面の簡単な説明】
第1図は本発明の一実施例に係わる光学的文字読取装置
の構成を示すブロック図、第2図は幅患の一例を示す図
、筑3図乃rメ筺4M昼千れぞれ第1図の文字認識部の
認識結果の一例を示す図、第5図及び第6図はそれぞれ
第1図の単語認識部に用意される単語認識用テーブルの
一例を示す図、第7図及び第8図はそれぞれ第1図の単
語認識部の認識結果の一例を示す図、第9図は第1図の
制御部の最終的答の一例を示す図である。 10・・・走査部、11・・・文字認識部、12・・・
単語認識部、13・・・制御部。 出願人代理人 弁理士 鈴 江 武 彦第1図 第2図 第3図 第4図 第5図 第6図 第7図 1 第8図 1 第9図

Claims (1)

  1. 【特許請求の範囲】 漢字を記録するための文字エリアおよびその漢字に対応
    する振シ仮名文字を記録するための文字エリアを有する
    帳票と、この帳票に記録された上記漢字および振シ仮名
    文字を光電変換して量子化パターンを出力する走査部と
    、この走査部から出力される量子化パターンに基づいて
    上記漢字および振シ仮名文字のそれぞれを文字単位で認
    識する文字認識手段と、この文字認識手段から出力され
    る文字単位の認嘩結果に基づいて上記漢字および振シ仮
    名文字のそれぞれからなる単語を予め用意されている単
    語認識用テーブルを参照して認識する単語認識手段と、
    この単語認識手段から出力される各単語単位の認□ 識結果を照合しその照合結果において漢字および振シ仮
    名文字の各単語単位の認識結果が相互に対応する場合に
    その各認識結果を最終的答として出力する制御手段とを
    具備してなることを特徴とする光学的文字読取装置。
JP58203843A 1983-10-31 1983-10-31 光学的文字読取装置 Granted JPS6095689A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58203843A JPS6095689A (ja) 1983-10-31 1983-10-31 光学的文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58203843A JPS6095689A (ja) 1983-10-31 1983-10-31 光学的文字読取装置

Publications (2)

Publication Number Publication Date
JPS6095689A true JPS6095689A (ja) 1985-05-29
JPH0319589B2 JPH0319589B2 (ja) 1991-03-15

Family

ID=16480613

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58203843A Granted JPS6095689A (ja) 1983-10-31 1983-10-31 光学的文字読取装置

Country Status (1)

Country Link
JP (1) JPS6095689A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01231185A (ja) * 1988-03-11 1989-09-14 Toshiba Corp 文字認識装置
JPH01316889A (ja) * 1988-06-17 1989-12-21 Fujitsu Ltd 手書き文字認識方式
JPH0546806A (ja) * 1991-08-20 1993-02-26 Oki Electric Ind Co Ltd 文字認識方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01231185A (ja) * 1988-03-11 1989-09-14 Toshiba Corp 文字認識装置
JPH01316889A (ja) * 1988-06-17 1989-12-21 Fujitsu Ltd 手書き文字認識方式
JPH0546806A (ja) * 1991-08-20 1993-02-26 Oki Electric Ind Co Ltd 文字認識方法

Also Published As

Publication number Publication date
JPH0319589B2 (ja) 1991-03-15

Similar Documents

Publication Publication Date Title
JPS63182793A (ja) 文字切り出し方式
JPS6095689A (ja) 光学的文字読取装置
JPS61114388A (ja) 文字入力装置
JPS6336389A (ja) 文字読取装置
JPS5842904B2 (ja) 手書きカナ・漢字の文字認識装置
JPH0223490A (ja) 文字読取システム
JPS6115288A (ja) 光学的文字読取装置
JPS6160189A (ja) 光学的文字読取装置
JPS59188783A (ja) 文字判定処理方式
JPH0514952B2 (ja)
JPS5816375A (ja) 光学的読取装置
JP2529421B2 (ja) 文字認識装置
JP2615834B2 (ja) 単語読取装置
JPH03123989A (ja) 文字認識装置
JP2784004B2 (ja) 文字認識装置
JPH0484380A (ja) 文字認識装置
JPH0426153B2 (ja)
JPS6327992A (ja) 個人用辞書作成方法
JPS5851390A (ja) 活字文字認識装置
JPS6227874A (ja) 文字認識装置
JPS61226883A (ja) 文字認識装置
JPS60254388A (ja) 光学的文字読取装置
JPS61107485A (ja) 光学的文字読取装置
JPH05282484A (ja) 光学的文字読取り装置
JPS5914078A (ja) 帳票読取装置