JP2942375B2 - 文字読取装置 - Google Patents

文字読取装置

Info

Publication number
JP2942375B2
JP2942375B2 JP3097798A JP9779891A JP2942375B2 JP 2942375 B2 JP2942375 B2 JP 2942375B2 JP 3097798 A JP3097798 A JP 3097798A JP 9779891 A JP9779891 A JP 9779891A JP 2942375 B2 JP2942375 B2 JP 2942375B2
Authority
JP
Japan
Prior art keywords
character
candidate
character information
word
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP3097798A
Other languages
English (en)
Other versions
JPH04328692A (ja
Inventor
建行 杉本
宏明 下川部
春雄 近藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP3097798A priority Critical patent/JP2942375B2/ja
Publication of JPH04328692A publication Critical patent/JPH04328692A/ja
Application granted granted Critical
Publication of JP2942375B2 publication Critical patent/JP2942375B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字読取技術に関し、
特に、互いに対応関係にある文字情報の読み取り技術に
適用して有効な技術に関する。
【0002】
【従来の技術】たとえば、データベースの構築に際して
のデータ入力の自動化や、帳票などの仕分けの自動化な
どの目的で、文字読取装置によって対象の帳票に記載さ
れている文字列を読み取り、読み取り結果を予め単語辞
書内に登録されている単語群と照合し、読み取り率の向
上を図ることが行われている。
【0003】また、単語数の増加や類似単語の存在によ
る照合精度や速度の低下を回避する方式として、たとえ
ば特開昭63−131288号公報に開示される技術が
知られている。すなわち、目的の単語および当該単語に
対応するコードデータを含む文字列の読み取り結果を辞
書内の単語データと照合する単語照合装置において、前
記辞書内に単語データと対応するコードデータとを併せ
て格納し、コードデータの読み取り結果に基づいて、照
合すべき単語データを限定するものである。
【0004】
【発明が解決しようとする課題】ところが、上記の従来
技術においては、コードデータ部分を誤って読み取った
場合には、正しい単語が単語データに対する照合処理の
対象外となり、誤った照合結果が出力される、という問
題がある。
【0005】本発明の目的は、上記従来技術の問題点に
鑑み、読み取り結果の誤りを、効率良く修正することが
可能な文字読取技術を提供することにある。
【0006】本発明の他の目的は、辞書データが格納さ
れる記録媒体の容量を削減することが可能な文字読取技
術を提供することにある。
【0007】本発明の上記ならびにその他の目的と新規
な特徴は、本明細書の記述および添付図面から明らかに
なるであろう。
【0008】
【課題を解決するための手段】本願に於いて開示される
発明のうち、代表的なものの概要を簡単に説明すれば、
下記の通りである。
【0009】すなわち、本発明の文字読取装置は、読み
取り対象物に記載された互いに対応関係を有する第1お
よび第2の文字情報を認識する文字認識部と、第1およ
び第2の文字情報を関連付けて保持する辞書部と、文字
認識部において得られた第1および第2の文字情報の各
々に関する認識結果と辞書部とを照合し、得られた第1
および第2の文字情報の各々に関する第1および第2の
候補文字情報群に候補順位を付与して候補単語テーブル
に格納する照合部と、候補順位が第1位の第1および第
2の候補文字情報の正誤を判定し、第1および第2の候
補文字情報の一方を修正する時、候補単語テーブルを参
照して、他方も自動的に修正する結果修正部とを備えた
ものである。
【0010】また、本発明の文字読取装置は、照合部
が、第1および第2の文字情報を構成する個々の文字毎
に認識部において選出された候補文字の有力度順に付与
された重み情報の和の大小に基づいて、第1および第2
の候補文字情報群に対する候補順位の決定を行うように
したものである。
【0011】また、本発明の文字読取装置は、第1の文
字情報と第2の文字情報とを、所望の記録媒体内におけ
る相互の格納位置を示すポインタによって対応つけて格
納することにより辞書部を構築するようにしたものであ
る。
【0012】また、本発明の文字読取装置は、漢字単語
とこの漢字単語に対応したフリガナの読み取り処理を行
うものである。
【0013】また、本発明の文字読取装置は、郵便番号
と、この郵便番号に対応した住所の読み取り処理を行う
ものである。
【0014】
【作用】上記した本発明の文字読取装置によれば、第1
および第2の文字情報を構成する個々の文字の、文字認
識部における有力度を反映した候補順位で、辞書から得
られた第1および第2の文字情報に関する第1および第
2の候補文字情報群を候補単語テーブルに格納し、第1
および第2の候補文字情報群の最上位のものを照合結果
として出力するとともに、出力された第1および第2の
候補文字情報の一方の誤りを修正する時に、その修正結
果に基づいて候補単語テーブルを参照することにより、
他方の修正を自動的に行うことができる。
【0015】
【実施例】以下、図面を参照しながら本発明の一実施例
である文字読取装置について詳細に説明する。
【0016】図1は、本実施例の文字読取装置の構成の
一例を示すブロック図であり、図2は、読み取り対象の
帳票の一例を示す図、図3は、本実施例の文字読取装置
の修正動作における画面遷移を順に示す説明図、図4
は、その作用の一例を示す流れ図、図5は、照合処理の
作用の一例を示す説明図、図6は、辞書の構築例を示す
説明図である。
【0017】本実施例の文字読取装置は、文字認識部1
1,単語照合部12,単語辞書部13,結果修正部14
から構成されている。文字認識部11は、図2に例示さ
れる帳票21に記載されている漢字データ(第1の情
報)23およびそれに対応して記載されたフリガナデー
タ(第2の情報)22を、たとえば光学文字認識技術な
どによって読み取り、各々の認識結果43,認識結果4
1および候補文字44および候補文字42を、有力度順
に出力する。
【0018】単語辞書部13は、漢字単語51bとこれ
に対応するフリガナ単語51aとを対応付けた単語デー
タ51で構築されている。
【0019】単語照合部12は、文字認識部11から出
力された認識結果41,43および候補文字42,44
と、単語辞書部13に登録されている単語データ51と
を照合し、照合結果61を画面71に出力するととも
に、候補単語群62を候補単語テーブル62aに出力す
る。
【0020】結果修正部14は、漢字データ23および
フリガナデータ22の照合結果61を操作者が画面71
上で修正する時、後述のように、一方の修正結果に基づ
いて、照合結果61および候補単語テーブル62a上の
候補単語群62を参照して他方を修正する動作を自動的
に行う。
【0021】以下、本実施例の文字読取装置における作
用の一例を説明する。
【0022】本実施例の場合には、帳票21上に記載さ
れた氏名などの漢字データ23と、それに対応するフリ
ガナデータ22とを読み取る場合について説明する。
【0023】文字認識部11は、帳票21上の漢字デー
タ23およびフリガナデータ22を認識し、それぞれに
関する認識結果41,43および候補文字42,44
を、単語照合部12に出力する。
【0024】これを受けた単語照合部12は、候補文字
42,44と、単語辞書部13内の単語データ51と
を、後述する照合方法によって照合し、照合結果61お
よび候補単語群62を候補単語テーブル62aに出力す
る。結果修正部14は、照合結果を画面71に出力する
とともに、操作者からの修正指示を待つ。
【0025】本実施例の場合、フリガナデータ22の”
ワ”が”ク”と誤読され、かつ、漢字データ23の中
の”河”が候補文字44にないため、”カクタ”と”角
田”のように誤って照合された例を示している。
【0026】このとき、操作者は、フリガナデータ22
の”ク”の所にカーソル70を位置付け、”ワ”に訂正
した後、予め定められた図示しない確定キーを押す(画
面72)。これにより、結果修正部14は、確定キーが
押された時のカーソル70がフリガナデータ22の所に
あるため、当該フリガナデータ22が訂正されたと判断
し、修正後のフリガナデータ22である”カワタ”と、
候補単語テーブル62aに格納されている候補単語群6
2のフリガナ単語51aとの比較を候補順位順に行い、
最初に一致するフリガナ単語51aである”カワタ”お
よび当該カワタ”に対応する漢字単語51bである”河
田”の組み合わせを読み出し、漢字データ23とし
て、”角田”の代わりに”河田”を表示(出力)する
(画面73)。
【0027】以上の説明では、フリガナデータ22の側
を訂正し、その訂正結果に応じて漢字データ23の側を
自動的に訂正する場合について説明したが、逆の場合も
同様である。
【0028】次に、前述した単語照合部12における照
合方法の一例について、図5などを参照しながら、具体
的に説明する。
【0029】まず、単語辞書部13にフリガナ単語51
aと漢字単語51bとを対応付けて構成されている単語
データ51群のうち、文字認識部11での候補文字42
を含む単語データ51を選出し、その各々について、フ
リガナデータ22を構成する各文字が、候補文字42に
おける有力度順位の第何位にあるかによって得点(重み
情報)を付与する。たとえば、本実施例では、第1位に
あれば10点,第2位にあれば9点,候補文字42にな
い場合には0点とする。対応する漢字データ23につい
ても同様にして得点を付与する。
【0030】たとえば、単語辞書部13中の”カクタ”
を構成する”カ”,”ク”,”タ”の各々に着目する
と、いずれも、候補文字42の有力度順位が第1位にあ
り、各々の得点は10点であり、フリガナデータ部分の
得点63は30点となる。
【0031】また、対応する漢字データである”角田”
を構成する”角”,”田”の各々について見ると、”
角”は候補文字44の中に含まれていないため得点は0
点であり、”田”は有力度順位が第1位にあるため得点
は10点となり、漢字データの”角田”に関する得点6
4は0+10=10点となる。
【0032】したがって、”カクタ”,”角田”の組み
合わせからなる辞書単語の合計点は40点となり、同様
にして、他の辞書単語に関する合計点65を計算し、当
該合計点65の順(候補順位順)に、候補単語テーブル
62aに対して格納する。
【0033】そして、前述のような、訂正に際しては、
訂正後のフリガナデータ22または漢字データ23によ
って、候補単語テーブル62aを候補順位順に探索し、
最初に一致するもの(この場合”河田”)を採用するこ
とにより、フリガナデータ22あるいは漢字データ23
の一方の訂正結果から他方を自動的に訂正するという前
述のような動作を的確に行うことができる。
【0034】一方、本実施例の場合、単語辞書部13の
実現方法としては、たとえば、図6に例示されるよう
に、フリガナ単語51aと、漢字単語51bとが1対1
に対応する単語データ群13aから、当該フリガナデー
タと漢字データとをポインタで多対多に対応付けて格納
することにより、単語辞書部13b(13)を構築す
る。ポインタは、単語辞書部13bが実現される半導体
メモリやディスク装置などの記録媒体上における各々の
アドレスである。
【0035】これにより、データの重複登録が回避さ
れ、単語辞書部13bが実現される記録媒体の所要容量
を大幅に削減することができる。
【0036】なお、上述の一連の説明では、対応するデ
ータの一例として、氏名とそれに対するフリガナの場合
について説明したが、郵便番号と対応する住所の場合に
も、前記フリガナデータ22を郵便番号に、漢字データ
23を住所に置き換えることにより、同様の効果を得る
ことができる。
【0037】以上説明したように、本実施例の文字読取
装置によれば、フリガナデータ22と対応する漢字デー
タ23などのような情報を所望の帳票21から読み取る
場合に、誤りが発生した時、一方の訂正によって他方を
自動的に的確に修正することが可能となる。この結果、
文字読取装置における操作性が大幅に向上する。
【0038】また、単語辞書部13bの構築に際して、
ポインタによって対応する氏名とフリガナや、郵便番号
と住所などのデータを対応つけて格納することにより、
単語辞書部13bが格納される記録媒体の容量を大幅に
削減することができる。
【0039】以上、本発明者によってなされた発明を実
地例を基に具体的に説明したが、本発明は、前記実地例
に限定されるものではなく、その趣旨を逸脱しない範囲
で種々変更可能であることはいうまでもない。
【0040】
【発明の効果】本願において開示される発明のうち、代
表的なものによって得られる効果を簡単に説明すれば、
以下のとおりである。
【0041】すなわち、本発明の文字読取装置によれ
ば、たとえば、氏名とフリガナや、郵便番号と住所など
のような対応関係にある情報の読み取り結果の誤りを、
効率良く修正することができるという効果が得られる。
【0042】また、本発明の文字読取装置によれば、辞
書データが格納される記録媒体の容量を削減することが
できるという効果が得られる。
【図面の簡単な説明】
【図1】本発明の一実施例である文字読取装置の構成の
一例を示すブロック図である。
【図2】読み取り対象の帳票の一例を示す図である。
【図3】本発明の一実施例である文字読取装置の修正動
作における画面遷移を順に示す説明図である。
【図4】その作用の一例を示す流れ図である。
【図5】照合処理の作用の一例を示す説明図である。
【図6】本発明の一実施例である文字読取装置における
辞書の構築例を示す説明図である。
【符号の説明】
11 文字認識部 12 単語照合部 13 単語辞書部 13a 単語データ群 13b 単語辞書部 14 結果修正部 21 帳票 22 フリガナデータ(第2の情報) 23 漢字データ(第1の情報) 41 認識結果 42 候補文字 43 認識結果 44 候補文字 51 単語データ 51a フリガナ単語 51b 漢字単語 61 照合結果 62 候補単語群 62a 候補単語テーブル 63 フリガナ単語の得点 64 漢字単語の得点 65 合計点 70 カーソル 71 画面 72 画面 73 画面
フロントページの続き (56)参考文献 特開 平1−231185(JP,A) 特開 平3−40079(JP,A) 特開 昭63−268082(JP,A) 特開 昭63−131288(JP,A) (58)調査した分野(Int.Cl.6,DB名) G06K 9/00 - 9/82

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】 読み取り対象物に記載された互いに対応
    関係を有する第1および第2の文字情報を認識する文字
    認識部と、前記第1および第2の文字情報を関連付けて
    保持する辞書部と、前記文字認識部において得られた前
    記第1および第2の文字情報の各々に関する認識結果と
    前記辞書部とを照合し、得られた前記第1および第2の
    文字情報の各々に関する第1および第2の候補文字情報
    群に候補順位を付与して候補単語テーブルに格納する照
    合部と、前記候補順位が第1位の前記第1および第2の
    候補文字情報の正誤を判定し、前記第1および第2の候
    補文字情報の一方を修正する時、前記候補単語テーブル
    を参照して、他方も自動的に修正する結果修正部とを備
    えてなることを特徴とする文字読取装置。
  2. 【請求項2】 前記照合部は、前記第1および第2の文
    字情報を構成する個々の文字毎に前記認識部において選
    出された候補文字の有力度順に付与された重み情報の和
    の大小に基づいて、第1および第2の候補文字情報群に
    対する前記候補順位の決定を行うことを特徴とする請求
    項1記載の文字読取装置。
  3. 【請求項3】 前記辞書部は、前記第1の文字情報と前
    記第2の文字情報とを、所望の記録媒体内における相互
    の格納位置を示すポインタによって対応つけて格納する
    ことを特徴とする請求項1または2記載の文字読取装
    置。
  4. 【請求項4】 前記第1の文字情報は漢字単語であり、
    前記第2の文字情報は、前記漢字単語に対応したフリガ
    ナであることを特徴とする請求項1,2または3記載の
    文字読取装置。
  5. 【請求項5】 前記第1の文字情報は郵便番号であり、
    前記第2の文字情報は、前記郵便番号に対応した住所で
    あることを特徴とする請求項1,2または3記載の文字
    読取装置。
JP3097798A 1991-04-30 1991-04-30 文字読取装置 Expired - Lifetime JP2942375B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3097798A JP2942375B2 (ja) 1991-04-30 1991-04-30 文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3097798A JP2942375B2 (ja) 1991-04-30 1991-04-30 文字読取装置

Publications (2)

Publication Number Publication Date
JPH04328692A JPH04328692A (ja) 1992-11-17
JP2942375B2 true JP2942375B2 (ja) 1999-08-30

Family

ID=14201816

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3097798A Expired - Lifetime JP2942375B2 (ja) 1991-04-30 1991-04-30 文字読取装置

Country Status (1)

Country Link
JP (1) JP2942375B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1011434A (ja) * 1996-06-21 1998-01-16 Nec Corp 情報認識装置

Also Published As

Publication number Publication date
JPH04328692A (ja) 1992-11-17

Similar Documents

Publication Publication Date Title
US4771385A (en) Word recognition processing time reduction system using word length and hash technique involving head letters
JP2847715B2 (ja) 文字認識装置及び文字認識方法
JP2942375B2 (ja) 文字読取装置
JPS6262388B2 (ja)
JPH07271920A (ja) 文字認識装置
JP2795003B2 (ja) 文字認識処理装置
JP3071745B2 (ja) 文字認識結果の後処理方法
JPS63268082A (ja) パタ−ン認識装置
JP2000132635A (ja) 認識データ確認方法
JPH04232570A (ja) キーワード検索方法
JP3419425B2 (ja) 認識文字補正装置
JP2784004B2 (ja) 文字認識装置
JP2839515B2 (ja) 文字読取システム
JP3058706B2 (ja) 住所カナの漢字変換方法
JP2865443B2 (ja) カナ氏名もしくはカナ法人名表記の漢字変換装置
JPS646514B2 (ja)
JPS61133487A (ja) 文字認識装置
JPH0355874B2 (ja)
JP2639314B2 (ja) 文字認識方式
JPH0520490A (ja) 光学的文字読取修正システム
JP2874199B2 (ja) 単語辞書照合装置
JP3476872B2 (ja) 文字認識装置
JPS5820075B2 (ja) パタ−ン認識装置
JPH0528132A (ja) 単語辞書照合装置
JPH05298489A (ja) 文字認識方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080618

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080618

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090618

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100618

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100618

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110618

Year of fee payment: 12

EXPY Cancellation because of completion of term