JPH0922441A - 光学文字読取装置 - Google Patents

光学文字読取装置

Info

Publication number
JPH0922441A
JPH0922441A JP7170991A JP17099195A JPH0922441A JP H0922441 A JPH0922441 A JP H0922441A JP 7170991 A JP7170991 A JP 7170991A JP 17099195 A JP17099195 A JP 17099195A JP H0922441 A JPH0922441 A JP H0922441A
Authority
JP
Japan
Prior art keywords
kanji
candidate
word
unit
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7170991A
Other languages
English (en)
Inventor
Keiichi Inoue
恵一 井上
Toshiyuki Araya
俊之 荒谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP7170991A priority Critical patent/JPH0922441A/ja
Publication of JPH0922441A publication Critical patent/JPH0922441A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 フリガナを有する漢字を読取るのに、特別な
濁点、半濁点認識処理を行うことなく同一枠に記入され
た濁点、半濁点を有するフリガナがあっても精度よく漢
字の照合が可能である光学文字読取装置を提供する。 【解決手段】 帳票上の所定位置に記入された漢字文字
と対応するフリガナ文字とを走査する光学走査部と、漢
字を認識する漢字認識部と、漢字認識部から得られる漢
字候補文字と漢字単語辞書部のデータとを比較して候補
漢字単語を抽出する漢字単語抽出部と、候補漢字単語に
対応するフリガナ単語から濁点、半濁点を取ったフリガ
ナ単語を作成する濁点・半濁点除去部と、漢字単語抽出
部から得られた順位付候補漢字単語と濁点・半濁点除去
部から得られたフリガナ単語とフリガナ認識部から得ら
れた順位付候補フリガナ文字とを照合して、切り出した
候補漢字単語中から走査した漢字文字に対応する漢字単
語を判定する候補単語判定部とを有している。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は光学文字読取装置に
関し、特に漢字と対応する濁点、半濁点付きのフリガナ
を有している場合にも精度よく照合して漢字の判定を行
う光学文字読装置に関する。
【0002】
【従来の技術】従来、フリガナを漢字に付することによ
り漢字単語の読み取り精度を高める場合は、フリガナの
濁点と半濁点はそれぞれ1バイトの文字コードを必要と
するため別枠に1文字として記入して、フリガナ本体文
字と併せて2枠を使用していた。そこで、光学走査部に
より帳票の所定位置にある文字を走査し、走査した漢字
を漢字認識部により1文字毎に認識して漢字候補文字を
作成し、漢字単語抽出部がこの漢字候補文字を漢字単語
辞書部に登録されているフリガナ付き漢字単語と比較し
て候補漢字単語とそのフリガナ単語を抽出する。一方、
フリガナ認識部は走査されたフリガナ文字を1文字毎に
認識して候補フリガナ文字を作成し、候補単語判定部が
この候補フリガナ文字を漢字単語辞書部から抽出された
候補漢字単語のフリガナと照合することにより、漢字読
み取りの精度を高めていた。
【0003】一方、特開昭61−229177号公報に
同一枠に記入された濁点、半濁点付き文字を認識する方
式が開示されている。
【0004】
【発明が解決しようとする課題】上述した従来の濁点、
半濁点付きフリガナを2枠を用いて記入させる文字読取
装置では、通常の書体で1枠に記入されている濁点、半
濁点付きフリガナ文字の認識ができず、またその記入方
式もユーザにとって不便であるという欠点がある。ま
た、特開昭61−229177号の方式では、その濁
点、半濁点付き文字の認識精度が高ければこの文字を1
文字枠に記入されたものを正しく認識することができる
が、濁点か半濁点かが正常に認識できない場合は濁点、
半濁点付き文字を正確に照合することが困難となる。
【0005】本発明の目的は、漢字に対応するフリガナ
を使用して漢字の読取精度を向上させる光学文字読取装
置において、特別な濁点、半濁点認識処理を行うことも
なく同一枠に記入された濁点、半濁点を有するフリガナ
であっても精度よく漢字の照合が可能である光学文字読
取装置を提供することである。
【0006】
【課題を解決するための手段】本発明の光学文字読取装
置は、光学的に帳票を走査して得られた帳票のイメージ
のうち、漢字文字とそれに対応するフリガナ文字とを予
め与えられた帳票上の位置情報に従って個別に切り出し
認識する光学文字読取装置であって、帳票上の所定位置
に記入された漢字文字とこれに対応するフリガナ文字と
を走査する光学走査部と、漢字文字を1文字毎に認識し
て確かさの順位とともに漢字候補文字を作成する漢字認
識部と、複数の漢字単語と対応するフリガナ単語とが登
録されて格納されている漢字単語辞書部と、漢字認識部
が作成した漢字候補文字を漢字単語辞書部に登録された
漢字単語と比較して、候補漢字単語と対応するフリガナ
単語とを抽出する漢字単語抽出部と、漢字単語抽出部に
より得られた候補漢字単語に対応するフリガナ単語が濁
点、半濁点を有するとき、該濁点、半濁点を除去したフ
リガナ単語を作成する濁点・半濁点除去部と、漢字文字
に付されたフリガナ文字を1文字毎に認識して確かさの
順位とともに候補フリガナ文字を作成するフリガナ認識
部と、漢字単語抽出部から得られた順位付候補漢字単語
と、濁点・半濁点除去部から得られたフリガナ単語と、
フリガナ認識部から得られた候補フリガナ文字とを照合
して、抽出した候補漢字単語中から走査した漢字文字に
対応する漢字単語を判定する候補単語判定部とを有して
いる。また、上述した候補単語判定部による判定は、漢
字単語辞書部から得られたフリガナ単語および濁点・半
濁点除去部より得られたフリガナ単語それぞれと、フリ
ガナ認識部より得られた候補フリガナ単語とを照合し
て、一致度の最も高い組合わせの候補漢字単語を選定
し、一致度が同一のときは順位の高い候補漢字単語を選
定し、あるいは、漢字単語抽出部より得られた候補漢字
単語の順位と、フリガナ認識部より得られた候補フリガ
ナ文字の順位とをそれぞれ数値化して、これらの数値の
合計値に従い候補漢字単語を選定するものである。
【0007】
【発明の実施の形態】本発明の実施の形態を図面を参照
して説明する。
【0008】図1は、本発明の光学文字読取装置の基本
的な構成を示すブロック図である。
【0009】帳票(不図示)には所定形式の欄に文字が
記入されており、本発明の光学文字読取装置(以下、装
置と称する。)はこれらの文字を記入された欄の位置情
報に従って光学的に走査して、記入された文字を順に読
み取る。
【0010】漢字認識部2は光学走査部1で走査された
漢字を入力して1文字毎に認識して、内蔵している漢字
表から対応する漢字を選定して少なくとも1組の漢字候
補文字を作成し、かつ、その候補順位を示すランクを指
定する。漢字単語辞書部3は登録された多数の漢字単語
とそれぞれの漢字単語に対応するフリガナ単語を格納し
ている。漢字単語抽出部4は漢字認識部2から選出され
た漢字候補文字(ランク付)をもとに漢字単語辞書部3
を参照して、候補となり得る漢字単語とそれに対応する
フリガナ単語とを抽出する。濁点・半濁点除去部5は漢
字単語辞書部3から抽出されたフリガナ単語が濁点また
は半濁点を有しておれば、濁点、半濁点を除去したフリ
ガナ単語を作成する。フリガナ認識部6は光学走査部1
から入力されたフリガナを1文字毎に入力して候補フリ
ガナ文字を作成し、かつ、その候補順位を示すランクを
指定する。候補単語判定部7は、漢字単語抽出部4から
得られたランク付候補漢字単語と、濁点・半濁点除去部
5から得られた対応する濁点、半濁点を除去したフリガ
ナ単語と、フリガナ認識部6から得られるランク付候補
フリガナ文字を入力し、漢字単語と対応するフリガナ文
字の組合せ中から、漢字単語のランクとフリガナ単語の
ランクとに基づいて目的とする漢字単語を判定する。
【0011】
【実施例】次に、上述した装置の動作を具体的に示す実
施例について図2を参照して説明する。図2は本実施例
の各構成要素がそれぞれ入出力するデータの内容を示し
ている。
【0012】まず、図aに示すように帳票の所定の名前
欄に漢字「和子」および対応するフリガナ「カズコ」が
記入されているものとする。この場合、濁点が「ス」と
同一枠中に記入されている。光学走査部1はこの名前欄
を走査し、漢字認識部2は漢字欄の1文字毎にその特徴
を調べて最も確からしい文字の順に「和」「子」のコー
ドを生成する。以下、第2位として「細」「承」を、ま
た第3位として「組」「了」をそれぞれ認識し、以下同
様にして可能な漢字候補文字を選定する(図b)。漢字
単語辞書部3には図cに示すように名前その他の漢字単
語が対応するフリガナとともに登録されている(図
c)。漢字単語抽出部4は漢字認識部2から得た候補の
名前文字に基づいて、この漢字単語辞書部3を参照し、
認識した特徴コードから第1位として漢字「和子」と4
枠のフリガナ「カス゛コ」、第2位として漢字「細子」
とフリガナ「サイコ」を取り出す(図d)。次に濁点・
半濁点除去部6は抽出された4枠の濁点付フリガナ「カ
ス゛コ」の濁点を除去して「カスコ」と3枠として出力
する(図e)。一方、フリガナ認識部6は光学走査部1
により走査されたフリガナを1文字毎に調べて第1位と
して「カ」「?」「コ」を、また第2位として「サ」
「?」「ロ」を候補フリガナ文字として認識する(図
f)。この場合、第2文字?は帳票フリガナ欄の第2文
字「ズ」が判定困難であったことを示す。最後に、候補
単語判定部7は、漢字単語辞書部3から抽出された「和
子カズコ」および「細子サイコ」それぞれとフリガナ認
識部5の得た第1順位の候補フリガナ文字「カ」「?」
「コ」および「サ」「?」「コ」それぞれとの組合わせ
(図イおよび図ロ)ならびに濁点・半濁点除去部5から
得られた「和子カスコ」の組合わせ(図ハ)のうち、一
致度と順位が最も高い図ハを選定して、読み出した漢字
は「和子」であると判定する。
【0013】この候補単語判定部7による判定に当たっ
ては、例えば、漢字候補単語それぞれの順位とフリガナ
候補単語それぞれの順位とに、それぞれ適当な数値を配
分して、これらの数値の合計値を比較することにより容
易に判定が可能である。例えば、漢字認識部から得られ
る漢字候補文字の確からしさの一致を1位1点、2位2
点と点数づけし、フリガナ認識部6から得られる候補フ
リガナ文字の確からしさとの一致を1位1点、2位2
点、不一致は10点と点数づける。
【0014】「和子」の漢字単語はそれぞれ1位である
ため2点、「細子」の漢字単語は「細」が2位であるた
め3点、「和子・カス゛コ」は「カ」はフリガナ1文字
目で1位であるので1点であるが、「ス」、「゛」、
「コ」はフリガナ認識部6からの結果と一致しないでそ
れぞれ10点となるため、「カス゛コ」の一致点数は3
1点となる。したがって「和子・カス゛コ」は33点と
なる。「細子・サイコ」は「サ」はフリガナ1文字目で
2位、「イ」は2文字目で不一致、「コ」は3文字目で
1位であるため「細子」は13点となる。したがって、
「細子・サイコ」は16点となる。
【0015】「和子・カスコ」は「カ」と「コ」が1位
であり、「ス」が不一致のため12点、「和子・カス
コ」は14点の点数となり「和子・カスコ」が一番点数
が少ないため選択される。
【0016】
【発明の効果】以上説明したように本発明は、漢字単語
辞書部から抽出した候補漢字単語のフリガナが濁点、半
濁点を有している場合、この濁点、半濁点を除外するこ
とにより、読み取ったフリガナの同一枠中に濁点、半濁
点が付加されていても漢字単語辞書の構造を変更するこ
となく、また、特別な濁点、半濁点の認識を行うことも
なくフリガナ照合が可能となり、漢字読み取りの精度を
高めることができる効果がある。
【図面の簡単な説明】
【図1】本発明の光学文字読取装置の基本的な構成を示
す1実施例のブロック図である。
【図2】図aないしgは図1の実施例の各構成要素に入
出力されるデータ例を説明するための図である。
【符号の説明】
1 光学走査部 2 漢字認識部 3 漢字単語辞書部 4 漢字単語抽出部 5 濁点・半濁点除去部 6 フリガナ認識部 7 候補単語判定部

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 光学的に帳票を走査して得られた帳票の
    イメージのうち、漢字文字とそれに対応するフリガナ文
    字とを予め与えられた帳票上の位置情報に従って個別に
    切り出し認識する光学文字読取装置であって、 帳票上の所定位置に記入された漢字文字とこれに対応す
    るフリガナ文字とを走査する光学走査部と、 漢字文字を1文字毎に認識して確かさの順位とともに漢
    字候補文字を作成する漢字認識部と、 複数の漢字単語と対応するフリガナ単語とが登録されて
    格納されている漢字単語辞書部と、 前記漢字認識部が作成した漢字候補文字を前記漢字単語
    辞書部に登録された漢字単語と比較して、候補漢字単語
    と対応するフリガナ単語とを抽出する漢字単語抽出部
    と、 前記漢字単語抽出部により得られた候補漢字単語に対応
    するフリガナ単語が濁点、半濁点を有するとき、該濁
    点、半濁点を除去したフリガナ単語を作成する濁点・半
    濁点除去部と、 前記漢字文字に付されたフリガナ文字を1文字毎に認識
    して確かさの順位とともに候補フリガナ文字を作成する
    フリガナ認識部と、 前記漢字単語抽出部から得られた順位付候補漢字単語
    と、前記濁点・半濁点除去部から得られたフリガナ単語
    と、前記フリガナ認識部から得られた候補フリガナ文字
    とを照合して、抽出した候補漢字単語中から走査した漢
    字文字に対応する漢字単語を判定する候補単語判定部と
    よりなる光学文字読取装置。
  2. 【請求項2】 前記候補単語判定部による判定は、前記
    漢字単語辞書部から得られたフリガナ単語および前記濁
    点・半濁点除去部より得られたフリガナ単語それぞれ
    と、前記フリガナ認識部より得られた候補フリガナ文字
    とを照合して、一致度の最も高い組合わせの候補漢字単
    語を選定し、一致度が同一のときは順位の高い候補漢字
    単語を選定する請求項1記載の光学文字読取装置。
  3. 【請求項3】 前記候補単語判定部による判定は、前記
    漢字単語抽出部より得られた候補漢字単語の順位と、前
    記フリガナ認識部より得られた候補フリガナ文字の順位
    とをそれぞれ数値化して、これらの数値の合計値に従い
    候補漢字単語を選定する請求項1記載の光学文字読取装
    置。
JP7170991A 1995-07-06 1995-07-06 光学文字読取装置 Pending JPH0922441A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7170991A JPH0922441A (ja) 1995-07-06 1995-07-06 光学文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7170991A JPH0922441A (ja) 1995-07-06 1995-07-06 光学文字読取装置

Publications (1)

Publication Number Publication Date
JPH0922441A true JPH0922441A (ja) 1997-01-21

Family

ID=15915101

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7170991A Pending JPH0922441A (ja) 1995-07-06 1995-07-06 光学文字読取装置

Country Status (1)

Country Link
JP (1) JPH0922441A (ja)

Similar Documents

Publication Publication Date Title
KR19990078364A (ko) 문서처리장치 및 그의 방법
US5890182A (en) Sentence processing method and apparatus
JPH0682403B2 (ja) 光学式文字読取装置
JPH08263478A (ja) 中国語簡繁体字文書変換装置
JP3975825B2 (ja) 文字認識誤り訂正方法、装置及びプログラム
JP3727422B2 (ja) 文字認識装置及びその方法
JPH0922441A (ja) 光学文字読取装置
JPS592191A (ja) 手書き日本語文の認識処理方式
JP3470927B2 (ja) 自然語解析方法及び装置
JP2538543B2 (ja) 文字情報認識装置
JP2004206659A (ja) 読み情報決定方法及び装置及びプログラム
JP2939945B2 (ja) ローマ字住所認識装置
JP2827066B2 (ja) 数字列混在文書の文字認識の後処理方法
JPS63163956A (ja) 文書作成・校正支援装置
JPH11120294A (ja) 文字認識装置および媒体
JPS62180462A (ja) 音声入力かな漢字変換装置
JP2886690B2 (ja) 光学的文字読取装置における文字認識方法
JPS60134992A (ja) 文字入力装置
JP3084864B2 (ja) 文章入力装置
JPH0262659A (ja) 日本文訂正候補文字抽出装置
JPS63188284A (ja) 文字読取装置
JPH05108703A (ja) 機械翻訳機
JPS63268082A (ja) パタ−ン認識装置
JPH0612417A (ja) 符号変換方式
JPH07120396B2 (ja) 文書読み取り装置