JP3361258B2 - 文字読取装置 - Google Patents

文字読取装置

Info

Publication number
JP3361258B2
JP3361258B2 JP30819397A JP30819397A JP3361258B2 JP 3361258 B2 JP3361258 B2 JP 3361258B2 JP 30819397 A JP30819397 A JP 30819397A JP 30819397 A JP30819397 A JP 30819397A JP 3361258 B2 JP3361258 B2 JP 3361258B2
Authority
JP
Japan
Prior art keywords
address
character
postal code
degree
character recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP30819397A
Other languages
English (en)
Other versions
JPH11143984A (ja
Inventor
由紀子 千葉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP30819397A priority Critical patent/JP3361258B2/ja
Publication of JPH11143984A publication Critical patent/JPH11143984A/ja
Application granted granted Critical
Publication of JP3361258B2 publication Critical patent/JP3361258B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、例えば光学式文字
読取装置(OCR;Optical Character Reader)のよう
な文字読取装置に係わり、特に帳票に記載された郵便番
号および住所を読み取って認識する文字読取装置に関す
るものである。
【0002】
【従来の技術】従来、文字読取装置の1つとして、帳票
に記載された郵便番号および住所を読み取って認識する
ものが広く知られている。このような文字読取装置に
は、郵便番号および住所に対する高精度の文字認識を行
うことが要求されるため、予め住所辞書を有しているも
のや、階層的な単語照合を行うものがある。
【0003】住所辞書を有する文字読取装置は、全国の
郵便番号とこれに対応する住所に関する情報を予めデー
タベース化して保持しているものであり、帳票上に記載
された郵便番号を読み取ると、これに対応する住所をデ
ータベース(住所辞書)内から検索して出力することに
より、住所についての誤認識等を防いでその認識精度を
向上させるものである。これは、数字で表される郵便番
号のほうが、漢字で表される住所よりも、その認識率が
高いことを利用したものである。
【0004】また、階層的な単語照合を行う文字読取装
置は、住所に対する読み取り結果を「都」、「道」、
「府」、「県」、「市」、「区」、「町」、「村」とい
った区切り文字を手掛かりに階層的に区切り、上位の階
層から順に単語照合を行って、各階層毎に最も確からし
い単語(地名)を解析することにより、住所についての
認識精度を向上させるものもある。これは、階層を利用
することで、照合対象となる単語の文字数を絞り、単語
照合の成功率を上げることを目的としたものである。
【0005】
【発明が解決しようとする課題】しかしながら、上述し
た従来の文字読取装置では、以下に説明するような場合
に、帳票上に記載された郵便番号および住所を正しく認
識することができず、結果として住所についての認識精
度の向上を実現できなくなってしまう。
【0006】住所辞書を利用する文字読取装置では、帳
票に郵便番号が誤って記載されていたり、正しく記載さ
れていてもこれを誤って認識した場合には、その誤った
郵便番号に対応する住所を出力してしまう。したがっ
て、郵便番号のみから完全に正しい住所を出力すること
は困難である。例えば、図6(a)に示すように、正し
い郵便番号は「3300013 」であるが誤記入あるいは誤認
識のため「3500013 」と判断した場合には、図6(b)
に示すように「3500013 」に対応する「埼玉県川越市渋
井」という住所を出力することとなり、結果として帳票
上に記載されたものとは異なる住所を出力することにな
ってしまう。
【0007】また、階層的な単語照合を行う文字読取装
置では、住所の階層を捉えることができなかったり、あ
る階層で単語照合に失敗すると、その次の階層における
単語の照合を続行することが困難であり、目的とする正
しい住所を取得できない場合がある。例えば、図7
(a)に示すように、都道府県レベルである「埼玉県」
は決定できたものの、市区群レベルの読み取り結果が不
明瞭で解析不能である場合には、図7(b)に示すよう
に、市区群レベルにおいて「埼玉県川越市」であるか
「埼玉県川口市」であるかが判断できず、それ以降の照
合を続けることができなくなり、正しい住所を出力する
ことができなくなってしまう。
【0008】そこで、本発明は、郵便番号の誤記入ある
いは誤認識があったり、住所の記載に解析不能文字があ
るような場合であっても、帳票上に記載された郵便番号
および住所を正しく認識することができ、その認識精度
の向上を実現することのできる文字認識装置を提供する
ことを目的とする。
【0009】
【課題を解決するための手段】本発明は、上記目的を達
成するために案出された文字読取装置で、郵便番号およ
び住所が記載された帳票からこれらを読み取って認識す
る文字認識手段と、予め郵便番号および住所に関する情
報を互いに対応付けて郵便番号情報および住所情報とし
て記憶している情報記憶手段と、前記文字認識手段での
郵便番号についての認識結果に対応する住所情報を前記
情報記憶手段から取り出す住所取出手段と、前記文字認
識手段での住所についての認識結果と前記住所取出手段
が取り出した住所情報とを比較して、これらの間におけ
る文字の一致度を算出する一致度算出手段と、前記一致
度算出手段により算出された一致度が予め設定された基
準値より大きければ、前記住所取出手段が取り出した住
所情報を前記帳票に記載された住所として出力し、前記
一致度が前記基準値より小さければ、前記文字認識手段
での住所についての認識結果を前記帳票に記載された住
所として出力する住所出力手段とを備えてなり、前記住
所出力手段は、1つの帳票の複数箇所に郵便番号および
住所が記載されている場合に、予め設定された複数の基
準値に従って、各箇所での文字の一致度の大小を判断す
るものであり、前記複数の基準値は、前記各箇所におけ
る記載内容に応じて異なる値が設定されていることを特
徴とするものである。
【0010】上記構成の文字読取装置によれば、文字認
識手段が帳票から郵便番号および住所を読み取って認識
すると、続いて住所取出手段は、その郵便番号について
の認識結果に対応する住所情報を情報記憶手段の中から
取り出す。そして、一致度算出手段は、文字認識手段で
の住所についての認識結果と、住所取出手段が取り出し
た住所情報とを比較して、これらの間における文字の一
致度を算出する。このとき、算出された一致度が予め設
定された基準値より大きければ、住所出力手段は、帳票
から読み取って認識した郵便番号が正しいと判断し、そ
の郵便番号に基づいて住所取出手段が取り出した住所情
報を、帳票に記載された住所として出力する。したがっ
て、帳票上の住所に誤記入、誤認識、あるいは認識不能
文字等があっても、正確な住所が出力されることとな
る。一方、算出された一致度が基準値より小さければ、
住所出力手段は、帳票から読み取って認識した郵便番号
が正しくないと判断し、文字認識手段での住所について
の認識結果を、帳票に記載された住所として出力する。
したがって、帳票上の郵便番号に誤記入や誤認識等があ
っても、誤った住所が出力されてしまうことがない。
た、1つの帳票の複数箇所に郵便番号および住所が記載
されていても、各箇所における記載内容に応じて異なる
値が設定された複数の基準値に従って、各箇所での文字
の一致度の大小を判断することから、例えば記入者本人
の郵便番号であるか否かといった記載内容を考慮して郵
便番号および住所に対する文字認識を行うことが可能と
なるので、更なる認識精度の向上が期待できる。
【0011】
【発明の実施の形態】以下、図面に基づき本発明に係わ
る文字読取装置について説明する。図1は、本実施の形
態の文字読取装置を用いて帳票上の郵便番号および住所
を読み取る場合の処理動作例を示すフローチャートであ
り、図2は、本実施の形態の文字読取装置における概略
構成を示すブロック図である。
【0012】本実施の形態の文字読み取り装置は、図2
に示すように、画像入力部1と、レイアウト解析部2
と、文字認識部3と、住所辞書部4と、後処理部5と、
出力形成部6とを備えてなるものである。なお、これら
のうち、レイアウト解析部2、文字認識部3および後処
理部5は、マイクロプロセッサおよびこのマイクロプロ
セッサで実行される所定プログラムによって実現される
ものとする。
【0013】画像入力部1は、スキャナ等の読取装置か
らなるものであり、読み取り対象である帳票7からその
記載内容を画像データとして読み取るものである。な
お、読み取り対象となる帳票7には、この帳票7上の所
定領域(郵便番号フィールドおよび住所フィールド)
に、郵便番号および住所が記載されているものとする。
【0014】レイアウト解析部2は、画像入力部1が読
み取った画像データを文字,表,罫線,図および写真の
領域に分解して、郵便番号フィールドおよび住所フィー
ルドに該当する領域内の画像データのみを取り出すもの
である。
【0015】文字認識部3は、レイアウト解析部2が取
り出した画像データに対して文字認識を行うものであ
る。この文字認識は、認識対象となる画像データを、予
め記憶している文字パターン(文字標準形状)と比較し
て、その中から形状の似ている文字パターンを選択し、
これを認識対象についての候補文字とすることによって
行う。
【0016】住所辞書部4は、ハードディスク装置等の
記憶装置からなるものであり、予め住所辞書を記憶して
いるものである。住所辞書とは、全国の郵便番号および
これに対応する住所に関する情報をデータベース化して
郵便番号情報および住所情報として保持しているもので
ある。なお、住所情報には、都道府県名、市区群名、町
村名、字(あざ)名の全てが含まれているものとする。
【0017】後処理部5は、文字認識部3での文字認識
結果に対して、住所辞書部4が記憶している住所辞書の
内容を参照して、詳細を後述する後処理を行い、この後
処理によって形成した文字列を、帳票7上の郵便番号フ
ィールドおよび住所フィールドに記載された郵便番号お
よび住所として決定するものである。
【0018】出力形成部6は、図示しない外部装置との
間のインタフェース等からなるものであり、後処理部5
が形成した文字列を外部装置に出力するものである。
【0019】次に、以上のように構成された文字読取装
置を用いて帳票7上の郵便番号および住所を読み取る場
合の処理動作例、特に後処理部5が行う後処理につい
て、図1のフローチャートおよび図3ならびに図4に示
す処理具体例を参照しながら、詳細に説明する。
【0020】図1に示すように、この文字読取装置で
は、帳票7上の郵便番号および住所を読み取るのに先立
ち、先ず、後処理部5が一致度比較の基準値を取得する
(ステップ1、以下ステップをSと略す)。一致度比較
の基準値は、詳細を後述するように、後処理部5が後処
理を行う際に必要なものであり、予め文字読取装置内の
図示しないメモリ等に格納されているものである。
【0021】その後、文字読取装置では、帳票7上の郵
便番号および住所の読み取りを開始する。つまり、画像
入力部1が帳票7上の記載内容を画像データとして読み
取ると、レイアウト解析部2は、その中から郵便番号フ
ィールドおよび住所フィールドに該当する領域内の画像
データのみを取り出す。そして、文字認識部3は、レイ
アウト解析部2が取り出した画像データ、すなわち帳票
7上に記載された郵便番号および住所に対して文字認識
を行う(S2)。
【0022】例えば、文字認識部3では、帳票7上に記
載された住所に対する文字認識を、以下のように行う。
図3に示すように、帳票7上の住所フィールドに「埼玉
県大宮市新提」という住所が記載されている場合に、文
字認識部3は、その住所フィールド内の各文字につい
て、予め定められている判断基準に従って、形状の似て
いる文字パターンを認識対象についての候補文字7aと
して抽出する。具体的には、住所フィールド内の「埼」
という文字については、「埼」および「崎」を候補文字
として抽出する。そして、このような抽出を住所フィー
ルド内の各文字について行う。
【0023】文字認識部3が郵便番号および住所に対す
る文字認識を行うと、続いて、後処理部5は、図1に示
すように、認識された郵便番号に対応する住所情報を住
所辞書部4から取り出して取得する(S3)。
【0024】例えば、図3のように、帳票7上の郵便番
号フィールドに「3500013 」という郵便番号が記載され
ていると認識された場合に、後処理部5は、住所辞書部
4内の住所辞書を検索して、これに対応する住所情報か
ら「埼玉県川越市渋井」という文字列7bを得る。
【0025】次いで、図1に示すように、後処理部5
は、文字認識部3での文字認識によって抽出された候補
文字7aと、住所辞書部4から取得した文字列7bとを
比較して、この文字列7bを構成する各文字が、抽出さ
れた候補文字7aの中に含まれているか否かをチェック
する(S4)。そして、後処理部5は、候補文字7aと
文字列7bとの比較の結果から、これらの間における文
字の一致度を算出する(S5)。文字の一致度とは、候
補文字7aと文字列7bとの間で文字が一致する度合い
をいい、具体的には文字列7bの全文字数中における一
致文字の割合(%)や、一致する文字の個数等が考えら
れる。
【0026】文字の一致度を算出すると、後処理部5
は、その算出値を、先に取得した一致度比較の基準値
(S1)と比較して、算出した文字の一致度が一致度比
較の基準値より大きいか小さいかを判断する(S6)。
なお、一致度比較の基準値は、後処理部5が算出する文
字の一致度に対応して、パーセントあるいは個数を表す
数値にて設定されているものとする。
【0027】この比較の結果、算出した文字の一致度が
一致度比較の基準値以下であれば、後処理部5は、帳票
7上の郵便番号フィールドに記載された郵便番号と、住
所フィールドに記載された住所とが正しく対応しておら
ず、郵便番号フィールドの郵便番号に誤記入または誤認
識があったと判断する。そして、文字認識部3による住
所についての文字認識結果に対して、従来と同様に階層
的な単語照合を行って、その文字認識結果を補正する
(S7)。
【0028】例えば、一致度比較の基準値が「全文字数
の50%」と設定されている場合に、図3に示すよう
に、候補文字7aと文字列7bとの間において「埼」,
「玉」,「県」,「市」の4文字のみが一致し、その一
致度が全文字数の50%を超えていなければ、後処理部
5は、文字認識部3での住所についての文字認識結果
に、階層的な単語照合による補正を行って、「埼玉県大
宮市新提」という文字列7cを形成する。
【0029】文字列7cを形成すると、続いて、図1に
示すように、後処理部5は、その文字列7cに対応する
住所情報を、住所辞書部4内の住所辞書から検索する。
すなわち、後処理部5は、文字列7cと合致する住所情
報、若しくは、文字列7cと最も文字の一致度の高い住
所情報を検索する。そして、後処理部5は、検索した住
所情報に対応する郵便番号情報を住所辞書部4から取得
し(S8)、その郵便番号情報に基づいて文字認識部3
での郵便番号についての文字認識結果を補正する(S
9)。
【0030】この郵便番号についての文字認識結果の補
正によって、後処理部5では、図3のように、文字認識
部3が「3500013 」という文字認識結果を得た場合であ
っても、「3300013 」という文字列7cを形成する。そ
して、後処理部5が郵便番号および住所についての文字
列7cを形成すると、出力形成部6は、その文字列7c
を外部装置に出力する。
【0031】一方、算出した文字の一致度が一致度比較
の基準値を超えていれば、後処理部5は、帳票7上の郵
便番号フィールドに記載された郵便番号と住所フィール
ドに記載された住所とが正しく対応しており、郵便番号
フィールドの郵便番号に誤記入または誤認識がないと判
断する。そして、既に住所辞書部4から取得している文
字列7bを用いて、住所フィールドの認識結果を補正す
る(S10)。
【0032】例えば、一致度比較の基準値が「全候補文
字に対して50%」と設定されている場合に、図4に示
すように、候補文字7aと文字列7bとの間において
「埼」,「玉」,「県」,「川」,「市」,「井」の各
文字が一致し、その一致度が全文字数の50%を超える
と、後処理部5は、住所辞書部4から取得した文字列7
bを用いて、住所フィールドの認識結果を補正する。こ
の補正によって、後処理部5では、文字認識部3が「埼
玉県川?市?井」という文字認識結果を得た場合、すな
わち認識不能な文字があった場合でも、「埼玉県川越市
渋井」という文字列7cを形成することとなる。また、
このとき、郵便番号の誤記入または誤認識はないので、
文字認識部3での文字認識結果に従って「3500013 」と
いう文字列7cを形成する。そして、後処理部5が郵便
番号および住所についての文字列7cを形成すると、出
力形成部6は、その文字列7cを外部装置に出力する。
【0033】以上のように、本実施の形態の文字読取装
置では、文字認識部3での文字認識結果に対して、後処
理部5が後処理を行うようになっている。すなわち、後
処理部5は、文字認識部3が抽出した候補文字7aと住
所辞書部4から取得した文字列7bとを比較して、これ
らの間における文字の一致度を算出するとともに、その
算出結果と一致度比較の基準値との間の大小を判断す
る。
【0034】そして、文字の一致度が一致度比較の基準
値より大きいければ、後処理部5は、住所辞書部4から
取得した文字列7bを住所フィールドに記載された住所
とする。よって、帳票上の住所に誤記入、誤認識、ある
いは認識不能文字等があっても、正確な住所が出力され
ることとなる。また、文字の一致度が一致度比較の基準
値より小さければ、後処理部5は、文字認識部3での文
字認識結果に対して階層的な単語照合を行ってその結果
を住所フィールドに記載された住所とする。よって、帳
票上の郵便番号に誤記入や誤認識等があっても、誤った
住所が出力されてしまうことがない。
【0035】つまり、この文字読取装置では、候補文字
7aと文字列7bとの間の文字の一致度と一致度比較の
基準値との大小を判断することによって、帳票7上に記
載された郵便番号に誤記入または誤認識があったか否か
を判断することができるようになる。これにより、帳票
7上の郵便番号が正しければ住所辞書部4内の住所辞書
を利用した文字認識を行い、また、帳票7上の郵便番号
が正しくなければ階層的な単語照合により帳票7上の住
所の文字認識を行うといったように、郵便番号および住
所を読み取る際の処理動作を切り替えることが可能にな
る。
【0036】したがって、この文字読取装置を用いて読
み取りを行えば、従来に比べて、帳票上に記載された郵
便番号および住所を正しく認識することができ、結果と
して郵便番号および住所についての認識精度の向上を図
ることができるようになる。
【0037】また、本実施の形態の文字読取装置では、
候補文字7aと文字列7bとの間の文字の一致度が一致
度比較の基準値より小さければ、階層的な単語照合によ
り帳票7上の住所の文字認識を行うとともに、その文字
認識結果に対応する郵便番号情報を住所辞書部4から取
り出して、これを帳票7上に記載された郵便番号として
出力するようになっている。したがって、文字の一致度
が一致度比較の基準値より小さく、帳票7上の郵便番号
が正しくないと判断した場合であっても、住所辞書部4
内の住所辞書に基づいて正しい郵便番号を出力すること
ができる。これにより、郵便番号および住所についての
出力結果が互いに対応していないものになってしまうこ
とがなくなり、より一層の認識精度の向上を図ることが
できるようになる。
【0038】なお、本実施の形態においては、候補文字
7aと文字列7bとの間の文字の一致度を、1つの一致
度比較の基準値と比べる場合を例に挙げて説明したが、
本発明は、これに限定されるものではない。すなわち、
一致度比較の基準値は、1つではなく、複数の値が設定
されているものであってもよい。
【0039】これは、一般的に、記入者本人の郵便番号
は誤記入が少なく、記入者本人以外の郵便番号は誤記入
が多い傾向にあるためである。つまり、郵便番号フィー
ルドに誤記入が発生し易いか否かは帳票の記載内容に関
係し得るものであり、予め複数種類の一致度比較の基準
値を設定しておくとともに、記入者本人の郵便番号であ
るか否かといった記載内容に応じて、異なる一致度比較
の基準値を適用することも考えられる。
【0040】例えば、図5に示すように、1つの帳票7
上の複数箇所のそれぞれに郵便番号フィールドと住所フ
ィールドとが設けられており、そのうちの一方が「お届
け先」に係る郵便番号および住所を記載するためのもの
であり、他方が「ご依頼人」に係る郵便番号および住所
を記載するためのものである場合には、通常、「お届け
先」欄の郵便番号のほうが「ご依頼人」欄の郵便番号よ
りも誤記入が発生し易い。
【0041】そこで、後処理部5は、「お届け先」の読
み取り結果について後処理を行うときに、郵便番号フィ
ールドよりも住所フィールドの文字認識結果が優先され
るように、例えば「全文字数の75%」と高く設定され
た一致度比較の基準値に従って、文字の一致度の大小を
判断する。また、「ご依頼人」の読み取り結果について
後処理を行うときは、住所フィールドよりも郵便番号フ
ィールドの文字認識結果が優先されるように、例えば
「全文字数の50%」と低く設定された一致度比較の基
準値に従って、文字の一致度の大小を判断する。
【0042】このように、予め複数種類の一致度比較の
基準値を設定しておけば、帳票の記載内容を考慮して郵
便番号および住所に対する文字認識を行うことが可能と
なるので、更なる認識精度の向上が期待できる。
【0043】また、本実施の形態では、一致度比較の基
準値が予めメモリ等に格納されている場合を例に挙げて
説明したが、本発明は、これに限定されるものではな
い。例えば、キーボード等の操作部を後処理部5に接続
することにより、文字読取装置の利用者等が一致度比較
の基準値を設定により変更し得るようにしてもよい。こ
の場合には、読み取り対象となる帳票のロット毎に一致
度比較の基準値を変更することが可能となるので、認識
精度の向上を図りつつ、帳票の種類や記載形態に柔軟に
対応することができるようになる。さらには、これと同
様に、帳票の読み取り形態に応じて一致度比較の基準値
を変更することもできる。なお、ここでいう帳票の読み
取り形態とは、文字認識部3が受け取る画像データの入
力形態を意味するものであり、具体的には画像入力部1
が帳票7の記載内容を直接読み取るものであるか、ある
いは電話回線等の通信回線を介して画像データを受け取
るものであるか等の相違による。
【0044】さらに、本実施の形態では、後処理部5
が、住所辞書部4から取得した文字列7bを、候補文字
7aとして挙げられた全ての文字と比較する場合を例に
挙げたが、例えば文字認識部3による文字認識結果が第
一位の文字を並べた文字列(図3,4中における候補文
字7aの中の最上段の文字列)のみと比較するようにし
てもよく、この場合には比較処理の迅速化が期待でき
る。また、文字列7bを、文字認識部3による文字認識
結果に対して階層的な単語照合を行った後のものと比較
するようにしてもよく、この場合には認識精度の向上に
有効となる。
【0045】
【発明の効果】以上に説明したように、本発明の文字読
取装置は、文字認識手段での住所についての認識結果と
情報記憶手段から取り出した住所情報とを比較して、こ
れらの間における文字の一致度を算出するとともに、そ
の算出結果と所定の基準値との間の大小を判断するよう
になっている。そして、算出した一致度が基準値より大
きければ、情報記憶手段から取り出した住所情報を、帳
票に記載された住所として出力するので、帳票上の住所
に誤記入、誤認識、あるいは認識不能文字等があって
も、正確な住所が出力されることとなる。一方、算出し
た一致度が基準値より小さければ、文字認識手段での住
所についての認識結果を、帳票に記載された住所として
出力するので、帳票上の郵便番号に誤記入や誤認識等が
あっても、誤った住所が出力されてしまうことがない。
したがって、この文字読取装置を用いて読み取りを行え
ば、従来に比べて、帳票上に記載された郵便番号および
住所を正しく認識することができ、結果として郵便番号
および住所についての認識精度の向上を図ることができ
るようになる。
【図面の簡単な説明】
【図1】本発明に係わる文字読取装置を用いて帳票上の
郵便番号および住所を読み取る場合の処理動作の一例を
示すフローチャートである。
【図2】本発明に係わる文字読取装置の一例の概略構成
を示すブロック図である。
【図3】本発明に係わる文字読取装置により帳票上の郵
便番号および住所を読み取って認識した場合の具体例を
示す説明図(その1)である。
【図4】本発明に係わる文字読取装置により帳票上の郵
便番号および住所を読み取って認識した場合の具体例を
示す説明図(その2)である。
【図5】本発明に係わる文字読取装置で読み取り可能な
帳票の一例を示す説明図である。
【図6】従来の住所辞書を利用した文字読取装置による
帳票読み取りの具体例を示す説明図であり、(a)は文
字認識結果の具体例を示す図、(b)は出力結果の具体
例を示す図である。
【図7】従来の階層的な単語照合を行う文字読取装置に
よる帳票読み取りの具体例を示す説明図であり、(a)
は文字認識結果の具体例を示す図、(b)は出力結果の
具体例を示す図である。
【符号の説明】
1 画像入力部 3 文字認識部 4 住所辞書部 5 後処理部 7 帳票
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平9−265509(JP,A) 特開 平6−180767(JP,A) 特開 平4−328692(JP,A) 特開 平6−325215(JP,A) 特開 平5−217015(JP,A) 特開 平4−280394(JP,A) 特開 平2−242389(JP,A) 特開 平11−143985(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/00 - 9/82

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 郵便番号および住所が記載された帳票か
    らこれらを読み取って認識する文字認識手段と、 予め郵便番号および住所に関する情報を互いに対応付け
    て郵便番号情報および住所情報として記憶している情報
    記憶手段と、 前記文字認識手段での郵便番号についての認識結果に対
    応する住所情報を前記情報記憶手段から取り出す住所取
    出手段と、 前記文字認識手段での住所についての認識結果と前記住
    所取出手段が取り出した住所情報とを比較して、これら
    の間における文字の一致度を算出する一致度算出手段
    と、 前記一致度算出手段が算出した一致度が所定の基準値よ
    り大きければ、前記住所取出手段が取り出した住所情報
    を前記帳票に記載された住所として出力し、前記一致度
    が前記基準値より小さければ、前記文字認識手段での住
    所についての認識結果を前記帳票に記載された住所とし
    て出力する住所出力手段とを備えてなり、 前記住所出力手段は、1つの帳票の複数箇所に郵便番号
    および住所が記載されている場合に、予め設定された複
    数の基準値に従って、各箇所での文字の一致度の大小を
    判断するものであり、 前記複数の基準値は、前記各箇所における記載内容に応
    じて異なる値が設定されている ことを特徴とする文字読
    取装置。
  2. 【請求項2】 前記一致度が前記基準値より小さい場合
    に、前記文字認識手段での住所についての認識結果に対
    応する住所情報を前記情報記憶手段内から検索する住所
    検索手段と、 前記住所検索手段が検索した住所情報に対応する郵便番
    号情報を前記情報記憶手段から取り出して、前記帳票に
    記載された郵便番号として出力する郵便番号出力手段
    と、 が設けられたことを特徴とする請求項1記載の文字読取
    装置。
  3. 【請求項3】 前記住所出力手段は、前記文字認識手段
    が認識対象とする帳票の種類、または、前記文字認識手
    段における帳票の認識形態に応じて、前記基準値を変更
    し得るものであることを特徴とする請求項1または2
    載の文字読取装置。
JP30819397A 1997-11-11 1997-11-11 文字読取装置 Expired - Fee Related JP3361258B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP30819397A JP3361258B2 (ja) 1997-11-11 1997-11-11 文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP30819397A JP3361258B2 (ja) 1997-11-11 1997-11-11 文字読取装置

Publications (2)

Publication Number Publication Date
JPH11143984A JPH11143984A (ja) 1999-05-28
JP3361258B2 true JP3361258B2 (ja) 2003-01-07

Family

ID=17978046

Family Applications (1)

Application Number Title Priority Date Filing Date
JP30819397A Expired - Fee Related JP3361258B2 (ja) 1997-11-11 1997-11-11 文字読取装置

Country Status (1)

Country Link
JP (1) JP3361258B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4574823B2 (ja) * 2000-09-21 2010-11-04 株式会社東芝 配達物処理装置と配達物処理方法
JP4913115B2 (ja) * 2008-12-08 2012-04-11 株式会社東芝 データベース合成装置、文字認識支援システム、及びデータベースの合成方法
JP5189056B2 (ja) * 2009-09-30 2013-04-24 富士通フロンテック株式会社 マーク項目認識装置、マーク項目認識方法及びマーク項目認識プログラム

Also Published As

Publication number Publication date
JPH11143984A (ja) 1999-05-28

Similar Documents

Publication Publication Date Title
US9058543B2 (en) Defined data patterns for object handling
US5787197A (en) Post-processing error correction scheme using a dictionary for on-line handwriting recognition
JPS6262387B2 (ja)
JP2002216076A (ja) 文字列認識装置
JP3361258B2 (ja) 文字読取装置
JP2998054B2 (ja) 文字認識方法及び文字認識装置
JP3812719B2 (ja) 文書検索装置
JP3985926B2 (ja) 文字認識方法、文字認識装置、文書画像処理システム及び記録媒体
JPH08287188A (ja) 文字列認識装置
JPH0256086A (ja) 文字認識の後処理方法
JP3280577B2 (ja) 文字認識装置
JP2002207960A (ja) 認識文字修正方法及び認識文字修正プログラム
JP2000298701A (ja) 宛先特定装置
JP2851865B2 (ja) 文字認識装置
JP3151866B2 (ja) 英文字認識方法
JPH05135212A (ja) 住所単語照合方法
JPH06103404A (ja) 名刺認識装置
JPH09161014A (ja) 文字認識装置
JPH06111079A (ja) 単語読み取り装置
JPS60138689A (ja) 文字認識方法
JP3481850B2 (ja) 文字認識装置
JPH04191992A (ja) 情報処理装置
JP2000215273A (ja) オンライン手書き文字認識装置及びコンピュ―タ読み取り可能な記録媒体
JPH03156589A (ja) 誤読文字の検出,修正方法
JPH0496882A (ja) 全角/半角判定方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081018

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081018

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091018

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees