JP2942375B2 - 文字読取装置 - Google Patents
文字読取装置Info
- Publication number
- JP2942375B2 JP2942375B2 JP3097798A JP9779891A JP2942375B2 JP 2942375 B2 JP2942375 B2 JP 2942375B2 JP 3097798 A JP3097798 A JP 3097798A JP 9779891 A JP9779891 A JP 9779891A JP 2942375 B2 JP2942375 B2 JP 2942375B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- candidate
- character information
- word
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Character Discrimination (AREA)
Description
特に、互いに対応関係にある文字情報の読み取り技術に
適用して有効な技術に関する。
のデータ入力の自動化や、帳票などの仕分けの自動化な
どの目的で、文字読取装置によって対象の帳票に記載さ
れている文字列を読み取り、読み取り結果を予め単語辞
書内に登録されている単語群と照合し、読み取り率の向
上を図ることが行われている。
る照合精度や速度の低下を回避する方式として、たとえ
ば特開昭63−131288号公報に開示される技術が
知られている。すなわち、目的の単語および当該単語に
対応するコードデータを含む文字列の読み取り結果を辞
書内の単語データと照合する単語照合装置において、前
記辞書内に単語データと対応するコードデータとを併せ
て格納し、コードデータの読み取り結果に基づいて、照
合すべき単語データを限定するものである。
技術においては、コードデータ部分を誤って読み取った
場合には、正しい単語が単語データに対する照合処理の
対象外となり、誤った照合結果が出力される、という問
題がある。
鑑み、読み取り結果の誤りを、効率良く修正することが
可能な文字読取技術を提供することにある。
れる記録媒体の容量を削減することが可能な文字読取技
術を提供することにある。
な特徴は、本明細書の記述および添付図面から明らかに
なるであろう。
発明のうち、代表的なものの概要を簡単に説明すれば、
下記の通りである。
取り対象物に記載された互いに対応関係を有する第1お
よび第2の文字情報を認識する文字認識部と、第1およ
び第2の文字情報を関連付けて保持する辞書部と、文字
認識部において得られた第1および第2の文字情報の各
々に関する認識結果と辞書部とを照合し、得られた第1
および第2の文字情報の各々に関する第1および第2の
候補文字情報群に候補順位を付与して候補単語テーブル
に格納する照合部と、候補順位が第1位の第1および第
2の候補文字情報の正誤を判定し、第1および第2の候
補文字情報の一方を修正する時、候補単語テーブルを参
照して、他方も自動的に修正する結果修正部とを備えた
ものである。
が、第1および第2の文字情報を構成する個々の文字毎
に認識部において選出された候補文字の有力度順に付与
された重み情報の和の大小に基づいて、第1および第2
の候補文字情報群に対する候補順位の決定を行うように
したものである。
字情報と第2の文字情報とを、所望の記録媒体内におけ
る相互の格納位置を示すポインタによって対応つけて格
納することにより辞書部を構築するようにしたものであ
る。
とこの漢字単語に対応したフリガナの読み取り処理を行
うものである。
と、この郵便番号に対応した住所の読み取り処理を行う
ものである。
および第2の文字情報を構成する個々の文字の、文字認
識部における有力度を反映した候補順位で、辞書から得
られた第1および第2の文字情報に関する第1および第
2の候補文字情報群を候補単語テーブルに格納し、第1
および第2の候補文字情報群の最上位のものを照合結果
として出力するとともに、出力された第1および第2の
候補文字情報の一方の誤りを修正する時に、その修正結
果に基づいて候補単語テーブルを参照することにより、
他方の修正を自動的に行うことができる。
である文字読取装置について詳細に説明する。
一例を示すブロック図であり、図2は、読み取り対象の
帳票の一例を示す図、図3は、本実施例の文字読取装置
の修正動作における画面遷移を順に示す説明図、図4
は、その作用の一例を示す流れ図、図5は、照合処理の
作用の一例を示す説明図、図6は、辞書の構築例を示す
説明図である。
1,単語照合部12,単語辞書部13,結果修正部14
から構成されている。文字認識部11は、図2に例示さ
れる帳票21に記載されている漢字データ(第1の情
報)23およびそれに対応して記載されたフリガナデー
タ(第2の情報)22を、たとえば光学文字認識技術な
どによって読み取り、各々の認識結果43,認識結果4
1および候補文字44および候補文字42を、有力度順
に出力する。
に対応するフリガナ単語51aとを対応付けた単語デー
タ51で構築されている。
力された認識結果41,43および候補文字42,44
と、単語辞書部13に登録されている単語データ51と
を照合し、照合結果61を画面71に出力するととも
に、候補単語群62を候補単語テーブル62aに出力す
る。
フリガナデータ22の照合結果61を操作者が画面71
上で修正する時、後述のように、一方の修正結果に基づ
いて、照合結果61および候補単語テーブル62a上の
候補単語群62を参照して他方を修正する動作を自動的
に行う。
用の一例を説明する。
れた氏名などの漢字データ23と、それに対応するフリ
ガナデータ22とを読み取る場合について説明する。
タ23およびフリガナデータ22を認識し、それぞれに
関する認識結果41,43および候補文字42,44
を、単語照合部12に出力する。
42,44と、単語辞書部13内の単語データ51と
を、後述する照合方法によって照合し、照合結果61お
よび候補単語群62を候補単語テーブル62aに出力す
る。結果修正部14は、照合結果を画面71に出力する
とともに、操作者からの修正指示を待つ。
ワ”が”ク”と誤読され、かつ、漢字データ23の中
の”河”が候補文字44にないため、”カクタ”と”角
田”のように誤って照合された例を示している。
の”ク”の所にカーソル70を位置付け、”ワ”に訂正
した後、予め定められた図示しない確定キーを押す(画
面72)。これにより、結果修正部14は、確定キーが
押された時のカーソル70がフリガナデータ22の所に
あるため、当該フリガナデータ22が訂正されたと判断
し、修正後のフリガナデータ22である”カワタ”と、
候補単語テーブル62aに格納されている候補単語群6
2のフリガナ単語51aとの比較を候補順位順に行い、
最初に一致するフリガナ単語51aである”カワタ”お
よび当該カワタ”に対応する漢字単語51bである”河
田”の組み合わせを読み出し、漢字データ23とし
て、”角田”の代わりに”河田”を表示(出力)する
(画面73)。
を訂正し、その訂正結果に応じて漢字データ23の側を
自動的に訂正する場合について説明したが、逆の場合も
同様である。
合方法の一例について、図5などを参照しながら、具体
的に説明する。
aと漢字単語51bとを対応付けて構成されている単語
データ51群のうち、文字認識部11での候補文字42
を含む単語データ51を選出し、その各々について、フ
リガナデータ22を構成する各文字が、候補文字42に
おける有力度順位の第何位にあるかによって得点(重み
情報)を付与する。たとえば、本実施例では、第1位に
あれば10点,第2位にあれば9点,候補文字42にな
い場合には0点とする。対応する漢字データ23につい
ても同様にして得点を付与する。
を構成する”カ”,”ク”,”タ”の各々に着目する
と、いずれも、候補文字42の有力度順位が第1位にあ
り、各々の得点は10点であり、フリガナデータ部分の
得点63は30点となる。
を構成する”角”,”田”の各々について見ると、”
角”は候補文字44の中に含まれていないため得点は0
点であり、”田”は有力度順位が第1位にあるため得点
は10点となり、漢字データの”角田”に関する得点6
4は0+10=10点となる。
合わせからなる辞書単語の合計点は40点となり、同様
にして、他の辞書単語に関する合計点65を計算し、当
該合計点65の順(候補順位順)に、候補単語テーブル
62aに対して格納する。
訂正後のフリガナデータ22または漢字データ23によ
って、候補単語テーブル62aを候補順位順に探索し、
最初に一致するもの(この場合”河田”)を採用するこ
とにより、フリガナデータ22あるいは漢字データ23
の一方の訂正結果から他方を自動的に訂正するという前
述のような動作を的確に行うことができる。
実現方法としては、たとえば、図6に例示されるよう
に、フリガナ単語51aと、漢字単語51bとが1対1
に対応する単語データ群13aから、当該フリガナデー
タと漢字データとをポインタで多対多に対応付けて格納
することにより、単語辞書部13b(13)を構築す
る。ポインタは、単語辞書部13bが実現される半導体
メモリやディスク装置などの記録媒体上における各々の
アドレスである。
れ、単語辞書部13bが実現される記録媒体の所要容量
を大幅に削減することができる。
ータの一例として、氏名とそれに対するフリガナの場合
について説明したが、郵便番号と対応する住所の場合に
も、前記フリガナデータ22を郵便番号に、漢字データ
23を住所に置き換えることにより、同様の効果を得る
ことができる。
装置によれば、フリガナデータ22と対応する漢字デー
タ23などのような情報を所望の帳票21から読み取る
場合に、誤りが発生した時、一方の訂正によって他方を
自動的に的確に修正することが可能となる。この結果、
文字読取装置における操作性が大幅に向上する。
ポインタによって対応する氏名とフリガナや、郵便番号
と住所などのデータを対応つけて格納することにより、
単語辞書部13bが格納される記録媒体の容量を大幅に
削減することができる。
地例を基に具体的に説明したが、本発明は、前記実地例
に限定されるものではなく、その趣旨を逸脱しない範囲
で種々変更可能であることはいうまでもない。
表的なものによって得られる効果を簡単に説明すれば、
以下のとおりである。
ば、たとえば、氏名とフリガナや、郵便番号と住所など
のような対応関係にある情報の読み取り結果の誤りを、
効率良く修正することができるという効果が得られる。
書データが格納される記録媒体の容量を削減することが
できるという効果が得られる。
一例を示すブロック図である。
作における画面遷移を順に示す説明図である。
辞書の構築例を示す説明図である。
Claims (5)
- 【請求項1】 読み取り対象物に記載された互いに対応
関係を有する第1および第2の文字情報を認識する文字
認識部と、前記第1および第2の文字情報を関連付けて
保持する辞書部と、前記文字認識部において得られた前
記第1および第2の文字情報の各々に関する認識結果と
前記辞書部とを照合し、得られた前記第1および第2の
文字情報の各々に関する第1および第2の候補文字情報
群に候補順位を付与して候補単語テーブルに格納する照
合部と、前記候補順位が第1位の前記第1および第2の
候補文字情報の正誤を判定し、前記第1および第2の候
補文字情報の一方を修正する時、前記候補単語テーブル
を参照して、他方も自動的に修正する結果修正部とを備
えてなることを特徴とする文字読取装置。 - 【請求項2】 前記照合部は、前記第1および第2の文
字情報を構成する個々の文字毎に前記認識部において選
出された候補文字の有力度順に付与された重み情報の和
の大小に基づいて、第1および第2の候補文字情報群に
対する前記候補順位の決定を行うことを特徴とする請求
項1記載の文字読取装置。 - 【請求項3】 前記辞書部は、前記第1の文字情報と前
記第2の文字情報とを、所望の記録媒体内における相互
の格納位置を示すポインタによって対応つけて格納する
ことを特徴とする請求項1または2記載の文字読取装
置。 - 【請求項4】 前記第1の文字情報は漢字単語であり、
前記第2の文字情報は、前記漢字単語に対応したフリガ
ナであることを特徴とする請求項1,2または3記載の
文字読取装置。 - 【請求項5】 前記第1の文字情報は郵便番号であり、
前記第2の文字情報は、前記郵便番号に対応した住所で
あることを特徴とする請求項1,2または3記載の文字
読取装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3097798A JP2942375B2 (ja) | 1991-04-30 | 1991-04-30 | 文字読取装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3097798A JP2942375B2 (ja) | 1991-04-30 | 1991-04-30 | 文字読取装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH04328692A JPH04328692A (ja) | 1992-11-17 |
JP2942375B2 true JP2942375B2 (ja) | 1999-08-30 |
Family
ID=14201816
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3097798A Expired - Lifetime JP2942375B2 (ja) | 1991-04-30 | 1991-04-30 | 文字読取装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2942375B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1011434A (ja) * | 1996-06-21 | 1998-01-16 | Nec Corp | 情報認識装置 |
-
1991
- 1991-04-30 JP JP3097798A patent/JP2942375B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH04328692A (ja) | 1992-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4771385A (en) | Word recognition processing time reduction system using word length and hash technique involving head letters | |
JP2847715B2 (ja) | 文字認識装置及び文字認識方法 | |
JP2942375B2 (ja) | 文字読取装置 | |
JPS6262388B2 (ja) | ||
JPH07271920A (ja) | 文字認識装置 | |
JP2795003B2 (ja) | 文字認識処理装置 | |
JP3071745B2 (ja) | 文字認識結果の後処理方法 | |
JPS63268082A (ja) | パタ−ン認識装置 | |
JP2000132635A (ja) | 認識データ確認方法 | |
JPH04232570A (ja) | キーワード検索方法 | |
JP3419425B2 (ja) | 認識文字補正装置 | |
JP2784004B2 (ja) | 文字認識装置 | |
JP2839515B2 (ja) | 文字読取システム | |
JP3058706B2 (ja) | 住所カナの漢字変換方法 | |
JP2865443B2 (ja) | カナ氏名もしくはカナ法人名表記の漢字変換装置 | |
JPS646514B2 (ja) | ||
JPS61133487A (ja) | 文字認識装置 | |
JPH0355874B2 (ja) | ||
JP2639314B2 (ja) | 文字認識方式 | |
JPH0520490A (ja) | 光学的文字読取修正システム | |
JP2874199B2 (ja) | 単語辞書照合装置 | |
JP3476872B2 (ja) | 文字認識装置 | |
JPS5820075B2 (ja) | パタ−ン認識装置 | |
JPH0528132A (ja) | 単語辞書照合装置 | |
JPH05298489A (ja) | 文字認識方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080618 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080618 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090618 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100618 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100618 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110618 Year of fee payment: 12 |
|
EXPY | Cancellation because of completion of term |