JP4649017B2 - 文字認識装置及び文字認識方法 - Google Patents

文字認識装置及び文字認識方法 Download PDF

Info

Publication number
JP4649017B2
JP4649017B2 JP2000229156A JP2000229156A JP4649017B2 JP 4649017 B2 JP4649017 B2 JP 4649017B2 JP 2000229156 A JP2000229156 A JP 2000229156A JP 2000229156 A JP2000229156 A JP 2000229156A JP 4649017 B2 JP4649017 B2 JP 4649017B2
Authority
JP
Japan
Prior art keywords
character
predetermined
index
address
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000229156A
Other languages
English (en)
Other versions
JP2002042056A (ja
Inventor
一之 濱名
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2000229156A priority Critical patent/JP4649017B2/ja
Publication of JP2002042056A publication Critical patent/JP2002042056A/ja
Application granted granted Critical
Publication of JP4649017B2 publication Critical patent/JP4649017B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Sorting Of Articles (AREA)
  • Character Discrimination (AREA)

Description

【0001】
【発明の属する技術分野】
この発明は、封書、葉書、及び各種伝票等の紙葉類に記された特定文字情報を読み取り認識する文字認識装置及び文字認識方法に関する。特に、文字辞書のデータ構造の改良に関する。
【0002】
【従来の技術】
紙葉類には、例えば、番号情報(郵便番号)及び特定文字情報が記されている。特定文字情報には、第1カテゴリ情報(市区群名)、第2カテゴリ情報(町村名)などが含まれる。
【0003】
文字認識装置は、ブロック(局)毎に用意された文字辞書を用いて、ブロック毎に区分された紙葉類に記された特定文字情報を認識する。具体的に説明すると、文字認識装置は、所定ブロックに区分された紙葉類の所定領域の画像を読み取り、この所定領域から読み取られた画像データから文字列を検出して切り出す。さらに、切り出された文字列を量子化し、量子化された文字列から文字候補を検出して切り出す。さらに、この切り出された文字候補を所定ブロックの文字辞書の文字と比較して、切り出された文字候補を認識する。
【0004】
文字辞書は、図7に示すようなデータ構造を有している。つまり、上記したように、ブロック毎に文字辞書が用意されている。ブロック毎に区分された紙葉類に記される特定文字情報は、ある程度限定される。このため、ブロック毎に文字辞書を用意し、所定ブロックに区分された紙葉類に記された特定文字情報の認識には、所定ブロックの文字辞書を用いる。これにより、文字認識精度の向上を図ることができる。
【0005】
【発明が解決しようとする課題】
しかし、上記したように、ブロック毎に文字辞書を用意した場合、ブロック数の増加に伴い、文字辞書も増加するという問題があった。一つの文字辞書の容量は、決して小さいものではなく、極端にブロック数が増加すると、メモリオーバーになることも考えられる。
【0006】
また、上記した従来の文字認識装置は、図10に示すようなデータ構造の連続した辞書のみアクセス可能であるため、あるブロックにおいて文字種を追加するような場合には、そのブロックだけでなく、全ブロックの文字辞書を再構成しなければならないという問題もあった。
【0007】
この発明の目的は、上記したような事情に鑑み成されたものであって、下記の文字認識装置及び文字認識方法を提供することにある。
【0008】
(1)ブロック毎に文字辞書を用意しつつ、文字辞書全体の容量を抑えることが可能な文字認識装置及び文字認識方法。
【0009】
(2)ブロック毎に文字辞書を用意しつつ、各ブロックの文字辞書に対して容易に文字種を追加することが可能な文字認識装置。
【0010】
(3)文字認識速度の向上を図ることが可能な文字認識装置及び文字認識方法。
【0011】
【課題を解決するための手段】
上記課題を解決し目的を達成するために、この発明の文字認識装置及び文字認識方法は、以下のように構成されている。
【0012】
(1)この発明の文字認識装置は、複数の文字を格納した第1のメモリと、前記第1のメモリに格納された複数の文字のうち、いくつかの文字の格納先を示すアドレス群を保持したインデックスを複数格納した第2のメモリと、紙葉類の所定領域の画像を読み取る読取手段と、前記読取手段により読み取られた画像データから番号情報及び特定文字情報を検出し切り出す検切手段と、前記番号情報を認識する番号認識手段と、前記番号認識手段による番号認識結果に基づき、前記第2のメモリに格納された複数のインデックスから、前記紙葉類が該当する特定のインデックスを選択し、この特定のインデックスに保持されたアドレス群により示される格納先のいくつかの文字を文字辞書として設定し、この文字辞書に基づき前記特定文字情報を認識する文字認識手段とを備えている。
【0013】
(2)この発明の文字認識装置は、複数の文字を格納した第1のメモリと、前記第1のメモリに格納された複数の文字のうち、いくつかの文字の格納先を示すアドレス群、及びこれらアドレス群夫々に設定された認識精度許容レベルを保持したインデックスを複数格納した第2のメモリと、紙葉類の所定領域の画像を読み取る読取手段と、前記読取手段により読み取られた画像データから番号情報及び特定文字情報を検出し切り出す検切手段と、前記番号情報を認識する番号認識手段と、前記番号認識手段による番号認識結果に基づき、前記第2のメモリに格納された複数のインデックスから、前記紙葉類が該当する特定のインデックスを選択し、この特定のインデックスに保持されたアドレス群により示される格納先のいくつかの文字を文字辞書として設定し、この文字辞書に含まれる文字夫々に対して間接的に設定された認識精度許容レベルに基づき、前記特定文字情報の候補を絞り込み、前記特定文字情報を認識する文字認識手段とを備えている。
【0014】
(3)この発明の文字認識方法は、紙葉類の所定領域の画像を読み取る工程と、読み取られた画像データから番号情報及び特定文字情報を検出し切り出す工程と、前記番号情報を認識する工程と、複数の文字を格納した第1のメモリと、この第1のメモリに格納された複数の文字のうち、いくつかの文字の格納先を示すアドレス群を保持したインデックスを複数格納した第2のメモリとを有し、前記番号情報の認識結果に基づき、前記第2のメモリに格納された複数のインデックスから、前記紙葉類が該当する特定のインデックスを選択する工程と、特定のインデックスに保持されたアドレス群により示される格納先のいくつかの文字を文字辞書として設定する工程と、設定された文字辞書に基づき、前記特定文字情報を認識する工程とを備えている。
【0015】
(4)この発明の文字認識方法は、紙葉類の所定領域の画像を読み取る工程と、読み取られた画像データから番号情報及び特定文字情報を検出し切り出す工程と、前記番号情報を認識する工程と、複数の文字を格納した第1のメモリと、この第1のメモリに格納された複数の文字のうち、いくつかの文字の格納先を示すアドレス群、及びこれらアドレス群夫々に設定された認識精度許容レベルを保持したインデックスを複数格納した第2のメモリとを有し、前記番号情報の認識結果に基づき、前記第2のメモリに格納された複数のインデックスから、前記紙葉類が該当する特定のインデックスを選択する工程と、特定のインデックスに保持されたアドレス群により示される格納先のいくつかの文字を文字辞書として設定する工程と、設定された文字辞書に含まれる文字夫々に対して間接的に設定された認識精度許容レベルに基づき、前記特定文字情報の候補を絞り込み、前記特定文字情報を認識する工程とを備えている。
【0016】
【発明の実施の形態】
以下、この発明の実施の形態について図面を参照して説明する。
【0017】
紙葉類を区分する区分機は、紙葉類に記された番号情報及び特定文字情報を読み取り認識する文字認識装置を備えている。番号情報とは、例えば、7桁の数字列である。特定文字情報とは、例えば、n行の文字列であり、第1カテゴリ情報(市区群名)、第2カテゴリ情報(町村名)、第3カテゴリ情報(大口・集合住宅名)、及び第4カテゴリ情報(街区数字)などが含まれる。
【0018】
図1に示すように、この文字認識装置1は、読取部10と、制御モジュール11とを備えている。読取部10は、紙葉類の所定領域に記録された番号情報及び特定文字情報を光学的に読み取る。制御モジュール11は、読取部10で読み取られた読取結果に対応する多値画像データに基づいて、番号情報及び特定文字情報を認識し、さらには紙葉類を区分する。
【0019】
この制御モジュール11には、領域検知・行検切モジュール12と、量子化モジュール13と、文字検切モジュール14と、番号検切モジュール15と、番号認識モジュール16と、第1カテゴリ情報認識モジュール17と、第2カテゴリ情報認識モジュール18と、第3カテゴリ情報の文字認識モジュール19と、カテゴリ情報の単語認識モジュール20と、第4カテゴリ情報検切モジュール21と、第4カテゴリ情報認識モジュール22と、答編集モジュール23と、ポケット検索モジュール24と、VCS補助情報作成モジュール25と、読取結果CRT表示コントロールモジュール26と、がそれぞれ接続されている。
【0020】
領域検知・行検切モジュール12は、読取部10で読み取られた読取結果に対応する多値画像データから特定文字情報及び番号情報が記載された領域を検知して、文字列及び数字列を切り出す。量子化モジュール13は、領域検知・行検切モジュール12によって切り出された文字列及び数字列の多値画像データを2値画像データに変換する。
【0021】
文字検切モジュール14は、量子化モジュール13で変換された1行単位の2値画像データを、1文字単位に切り出す。番号検切モジュール15は、量子化モジュール13で変換された1列の2値画像データを、1桁数字単位に切り出す。
【0022】
番号認識モジュール16は、番号検切モジュール15によって切り出された番号情報を認識する。第1カテゴリ情報の文字認識モジュール17は、文字検切モジュール14によって切り出された第1カテゴリ情報の文字パターンと、文字辞書WDとのパターンマッチングにより1文字単位の文字識別を行う。第2カテゴリ情報の文字認識モジュール18は、文字検切モジュール14によって切り出された第2カテゴリ情報の文字パターンと、文字辞書WDとのパターンマッチングにより1文字単位の文字識別を行う。第3カテゴリ情報の文字識別モジュール19は、第2カテゴリ情報に続いて第3カテゴリ情報が記載されている場合に、文字検切モジュール14によって切り出された第3カテゴリ情報の文字パターンと、文字辞書WDとのパターンマッチングにより1文字単位の文字識別を行う。なお、文字辞書WDに格納されている文字辞書のデータ構造、及び文字辞書WDに格納されている文字辞書のうちのどのデータを文字認識に用いるのか等は、後に詳しく説明する。
【0023】
カテゴリ情報の単語認識モジュール20は、第1カテゴリ情報の文字認識モジュール17によって識別された文字を組み合わせ、カテゴリ情報データベースDBに登録された第1カテゴリ情報の単語と照合することで第1カテゴリ情報を識別する。また、カテゴリ情報の単語認識モジュール20は、第2カテゴリ情報の文字認識モジュール18によって識別された文字を組み合わせ、カテゴリ情報データベースDBに登録された第2カテゴリ情報の単語と照合することで第2カテゴリ情報を識別する。さらに、カテゴリ情報の単語認識モジュール20は、第3カテゴリ情報の文字識別モジュール19によって識別された文字を組み合わせ、カテゴリ情報データベースDBに登録された第3カテゴリ情報の単語と照合することで第3カテゴリ情報を識別する。
【0024】
第4カテゴリ情報検切モジュール21は、第2カテゴリ情報に続く第4カテゴリ情報の認識用の文字検切を行う。第4カテゴリ情報認識モジュール22は、第4カテゴリ情報検切モジュール21によって得られた画像データに対し、1文字単位の文字識別を行う。
【0025】
答編集モジュール23は、カテゴリ情報の単語認識モジュール20、第4カテゴリ情報認識モジュール22などを統括し、各識別結果の編集を行う。
【0026】
ポケット検索モジュール24は、答編集モジュール24によって作成された識別結果に基づいて区分すべきポケットを最終決定する。
【0027】
次に、この発明の特徴である、文字辞書WDに格納された文字辞書のデータ構造について説明する。図3は、文字辞書WDに格納された文字辞書のデータ構造を概略的に示す図である。図3に示す辞書メモリは、図2に示すTRIXの一部を構成するものである。図3に示すように、文字辞書WDは、辞書メモリM1及びインデックスメモリM2を備えている。
【0028】
辞書メモリM1には、全ての文字種が格納される。これに対して、インデックスメモリM2には、ブロック1〜nまでの複数のインデックスが格納されており、さらに各インデックスには辞書メモリM1の複数のアドレスが格納されている。各インデックスに格納された複数のアドレス夫々は、辞書メモリM1に格納された各文字の先頭アドレスに対応している。なお、ブロック1は例えば川崎中央郵便局に対応し、ブロック2は例えば中原郵便局に対応し、ブロックnは例えば甲府中央郵便局に対応する。
【0029】
辞書メモリM1に、例えば、「町」、「柳」、「幸」、「区」、…という文字種が格納されているとする。「町」の格納先を示す先頭アドレスはアドレス1、「柳」の格納先を示す先頭アドレスはアドレス3、「幸」の格納先を示す先頭アドレスはアドレス2、「区」の格納先を示す先頭アドレスはアドレス4であるとする。
【0030】
ブロック1のインデックスに、「町」、「柳」、「幸」の文字種を格納させたい場合には、ブロック1のインデックスにアドレス1、2、3を格納する。ブロック2のインデックスに、「町」の文字種を格納させたい場合には、ブロック2のインデックスにアドレス1を格納する。ブロックnのインデックスに、「区」の文字種を格納させたい場合には、ブロックnのインデックスにアドレス4を格納する。
【0031】
上記したように、各ブロックのインデックスに、必要とする文字種の格納先を示すアドレスを持たせ、各ブロックの文字辞書を構成する。このように、各ブロックの文字辞書を構成することにより、各ブロックの文字辞書の容量を極めて小さくすることができる。さらに、このように、各ブロックの文字辞書を構成することにより、各ブロックの文字辞書に対して容易に文字種を追加したり、各ブロックの文字辞書から容易に文字種を削除したりすることができる。言い換えれば、全てのブロックのデータを再編成することなく、文字種の追加及び削除が可能となる。
【0032】
また、インデックスメモリM2を図4に示すように構成してもよい。つまり、図4に示すように、インデックスメモリM2には、ブロック1〜nまでの複数のインデックスが格納されており、各インデックスには辞書メモリM1の複数のアドレスが格納されており、さらに複数のアドレス夫々にレベルフラグが設定されている。このレベルフラグは、外部のパラメータファイルから読み込まれる文字情報によりセットされる。図5は、文字情報の構成を示す図である。
【0033】
レベルフラグとは、認識精度許容レベルを示すフラグである。レベルフラグには、例えば、レベルフラグ0、レベルフラグ1、レベルフラグ2、レベルフラグ3がある。レベルフラグ0が最も低い認識精度を許容し、レベルフラグ3が最も高い認識精度を要求するものとする。レベルフラグ0が設定されたアドレスに対応する文字種、つまりレベルフラグ0が間接的に設定された文字種は、ある程度認識精度が低くても認識されたものと見なす。反対に、レベルフラグ3が設定されたアドレスに対応する文字種、つまりレベルフラグ3が間接的に設定された文字種は、非常に高い認識精度を要求し、十分な認識精度が得られなければ認識されたものと見なさない。このような働きをするレベルフラグを設けることにより、文字認識時間を短縮することができ、結果的に文字認識速度を向上させることができる。
【0034】
次に、図6に示すフローチャートを参照して、図4に示すデータ構造を有する文字辞書WDによる文字認識についてまとめる。
【0035】
まず、読取部10により紙葉類の所定領域の画像が読み取られる(ST1)。文字検切モジュール14及び番号検切モジュール15により、読み取られた画像データから番号情報及び特定文字情報が検出され切り出される(ST2)。番号認識モジュール16により、切り出された番号情報が認識される(ST3)。この番号情報の認識結果に基づき、紙葉類が該当するブロックが判定される。これに伴い、インデックスメモリM2に格納された複数のブロックのインデックスから、紙葉類が該当する特定のブロックのインデックスが選択される(ST4)。特定のブロックのインデックスに保持されたアドレス群により示される格納先(辞書メモリM1の格納先)のいくつかの文字がこの特定のブロックの文字辞書として設定される(ST5)。設定された文字辞書に含まれる文字夫々に対して間接的に設定されたレベルフラグに基づき、紙葉類から切り出された特定文字情報の候補が絞り込まれ、特定文字情報が認識される(ST6)。具体的に説明すると、紙葉類から切り出された特定文字情報と、設定された文字辞書に含まれる文字とが照合される。照合の際には、類似度が計算され点数化される。特定文字情報と比較して最も類似度が高い文字、つまり最も得点が高い文字が特定文字情報の認識結果として採用される。
【0036】
なお、本願発明は、上記実施形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で種々に変形することが可能である。また、各実施形態は可能な限り適宜組み合わせて実施してもよく、その場合組み合わせた効果が得られる。更に、上記実施形態には種々の段階の発明が含まれており、開示される複数の構成要件における適当な組み合わせにより種々の発明が抽出され得る。例えば、実施形態に示される全構成要件からいくつかの構成要件が削除されても、発明が解決しようとする課題の欄で述べた課題が解決でき、発明の効果の欄で述べられている効果が得られる場合には、この構成要件が削除された構成が発明として抽出され得る。
【0037】
【発明の効果】
この発明によれば下記の文字認識装置及び文字認識方法を提供できる。
【0038】
(1)ブロック毎に文字辞書を用意しつつ、文字辞書全体の容量を抑えることが可能な文字認識装置及び文字認識方法。
【0039】
(2)ブロック毎に文字辞書を用意しつつ、各ブロックの文字辞書に対して容易に文字種を追加することが可能な文字認識装置。
【0040】
(3)文字認識速度の向上を図ることが可能な文字認識装置及び文字認識方法。
【図面の簡単な説明】
【図1】この発明の一例に係る文字認識装置の概略構成を示す図である。
【図2】TRIXの構成を示す概要図である。
【図3】図1に示す文字認識装置の文字辞書内の辞書メモリ及びインデックスメモリのデータ構造を示す図である。
【図4】レベルフラグ付きのインデックスメモリのデータ構造を示す図である。
【図5】文字情報の構成を示す図である。
【図6】この発明の一例に係る文字認識方法を説明するフローチャートである。
【図7】従来の文字認識装置の文字辞書内のデータ構造を示す図である。
【符号の説明】
1…文字認識装置
10…読取部
11…制御モジュール
12…領域検知・行検切モジュール
13…量子化モジュール
14…文字検切モジュール
15…番号検切モジュール
16…番号認識モジュール
17…第1カテゴリ情報認識モジュール
18…第2カテゴリ情報認識モジュール
19…第3カテゴリ情報の文字認識モジュール
20…カテゴリ情報の単語認識モジュール
21…第4カテゴリ情報検切モジュール
22…第4カテゴリ情報認識モジュール
23…答編集モジュール
24…ポケット検索モジュール
WD…文字辞書
M1…辞書メモリ
M2…インデックスメモリ

Claims (8)

  1. 複数の文字を格納した第1のメモリと、
    前記第1のメモリに格納された複数の文字のうち、所定文字の格納先を示す所定アドレスを含む第1のアドレス群、及び前記第1のアドレス群に含まれた前記所定アドレスに設定された第1の認識精度許容レベルを保持した第1のインデックスと、前記第1のメモリに格納された複数の文字のうち、前記所定文字の格納先を示す前記所定アドレスを含む第2のアドレス群、及び前記第2のアドレス群に含まれた前記所定アドレスに設定された第2の認識精度許容レベルを保持した第2のインデックスとを格納した第2のメモリと、
    前記第2のメモリに格納された前記第1及び第2のインデックスのうち、前記第1のインデックスを選択した場合、前記第1のインデックスに保持された前記第1のアドレス群により示される前記所定文字を含む文字辞書を設定し、この文字辞書とこの文字辞書に含まれる前記所定アドレスに設定された前記第1の認識精度許容レベルとに基づき文字を認識し、また、前記第2のインデックスを選択した場合、前記第2のインデックスに保持された前記第2のアドレス群により示される前記所定文字を含む文字辞書を設定し、この文字辞書とこの文字辞書に含まれる前記所定アドレスに設定された前記第2の認識精度許容レベルに基づき文字を認識する文字認識手段と、
    を備えたことを特徴とする文字認識装置。
  2. 複数の文字を格納した第1のメモリと、
    前記第1のメモリに格納された複数の文字のうち、所定文字の格納先を示す所定アドレスを含む第1のアドレス群、及び前記第1のアドレス群に含まれた前記所定アドレスに設定された第1の認識精度許容レベルを保持した第1のインデックスと、前記第1のメモリに格納された複数の文字のうち、前記所定文字の格納先を示す前記所定アドレスを含む第2のアドレス群、及び前記第2のアドレス群に含まれた前記所定アドレスに設定された第2の認識精度許容レベルを保持した第2のインデックスとを格納した第2のメモリと、
    紙葉類の所定領域の画像を読み取る読取手段と、
    前記読取手段により読み取られた画像データから番号情報及び特定文字情報を検出し切り出す検切手段と、
    前記番号情報を認識する番号認識手段と、
    前記番号認識手段による番号認識結果に基づき、前記第2のメモリに格納された前記第1及び第2のインデックスのうち、前記紙葉類が該当する前記第1のインデックスを選択した場合、前記第1のインデックスに保持された前記第1のアドレス群により示される前記所定文字を含む文字辞書を設定し、この文字辞書とこの文字辞書に含まれる前記所定アドレスに設定された前記第1の認識精度許容レベルとに基づき文字を認識し、また、前記紙葉類が該当する前記第2のインデックスを選択した場合、前記第2のインデックスに保持された前記第2のアドレス群により示される前記所定文字を含む文字辞書を設定し、この文字辞書とこの文字辞書に含まれる前記所定アドレスに設定された前記第2の認識精度許容レベルに基づき文字を認識する文字認識手段と、
    を備えたことを特徴とする文字認識装置。
  3. 複数の文字を格納した第1のメモリと、
    前記第1のメモリに格納された複数の文字のうち、所定文字の格納先を示す所定アドレスを含む第1のアドレス群、及び前記第1のアドレス群に含まれた前記所定アドレスに設定された第1の認識精度許容レベルを保持した第1のインデックスと、前記第1のメモリに格納された複数の文字のうち、前記所定文字の格納先を示す前記所定アドレスを含む第2のアドレス群、及び前記第2のアドレス群に含まれた前記所定アドレスに設定された第2の認識精度許容レベルを保持した第2のインデックスとを格納した第2のメモリと、
    前記第2のメモリに格納された前記第1及び第2のインデックスのうち、前記第1のインデックスを選択した場合、前記第1のインデックスに保持された前記第1のアドレス群により示される前記所定文字を含む文字辞書を設定し、この文字辞書に基づき文字の候補を絞り込み、この文字辞書に含まれる前記所定アドレスに設定された前記第1の認識精度許容レベル応じた認識精度が得られることを条件として文字を認識し、また、前記第2のインデックスを選択した場合、前記第2のインデックスに保持された前記第2のアドレス群により示される前記所定文字を含む文字辞書を設定し、この文字辞書に基づき文字の候補を絞り込み、この文字辞書に含まれる前記所定アドレスに設定された前記第2の認識精度許容レベル応じた認識精度が得られることを条件として文字を認識する文字認識手段と、
    を備えたことを特徴とする文字認識装置。
  4. 複数の文字を格納した第1のメモリと、
    前記第1のメモリに格納された複数の文字のうち、所定文字の格納先を示す所定アドレスを含む第1のアドレス群、及び前記第1のアドレス群に含まれた前記所定アドレスに設定された第1の認識精度許容レベルを保持した第1のインデックスと、前記第1のメモリに格納された複数の文字のうち、前記所定文字の格納先を示す前記所定アドレスを含む第2のアドレス群、及び前記第2のアドレス群に含まれた前記所定アドレスに設定された第2の認識精度許容レベルを保持した第2のインデックスとを格納した第2のメモリと、
    紙葉類の所定領域の画像を読み取る読取手段と、
    前記読取手段により読み取られた画像データから番号情報及び特定文字情報を検出し切り出す検切手段と、
    前記番号情報を認識する番号認識手段と、
    前記番号認識手段による番号認識結果に基づき、前記第2のメモリに格納された前記第1及び第2のインデックスのうち、前記紙葉類が該当する前記第1のインデックスを選択した場合、前記第1のインデックスに保持された前記第1のアドレス群により示される前記所定文字を含む文字辞書を設定し、この文字辞書に基づき前記特定文字情報の候補を絞り込み、この文字辞書に含まれる前記所定アドレスに設定された前記第1の認識精度許容レベルに応じた認識精度が得られることを条件として前記特定文字情報を認識し、また、前記紙葉類が該当する前記第2のインデックスを選択した場合、前記第2のインデックスに保持された前記第2のアドレス群により示される前記所定文字を含む文字辞書を設定し、この文字辞書に基づき前記特定文字情報の候補を絞り込み、この文字辞書に含まれる前記所定アドレスに設定された前記第2の認識精度許容レベルに応じた認識精度が得られることを条件として前記特定文字情報を認識する文字認識手段と、
    を備えたことを特徴とする文字認識装置。
  5. 複数の文字を格納した第1のメモリと、この第1のメモリに格納された複数の文字のうち、所定文字の格納先を示す所定アドレスを含む第1のアドレス群、及び前記第1のアドレス群に含まれた前記所定アドレスに設定された第1の認識精度許容レベルを保持した第1のインデックスと、前記第1のメモリに格納された複数の文字のうち、前記所定文字の格納先を示す前記所定アドレスを含む第2のアドレス群、及び前記第2のアドレス群に含まれた前記所定アドレスに設定された第2の認識精度許容レベルを保持した第2のインデックスとを格納した第2のメモリとを有し、この第2のメモリから前記第1又は第2のインデックスを選択する工程と、
    前記第1のインデックスを選択した場合、前記第1のインデックスに保持された前記第1のアドレス群により示される前記所定文字を含む文字辞書を設定し、この文字辞書とこの文字辞書に含まれる前記所定アドレスに設定された前記第1の認識精度許容レベルとに基づき文字を認識し、また、前記第2のインデックスを選択した場合、前記第2のインデックスに保持された前記第2のアドレス群により示される前記所定文字を含む文字辞書を設定し、この文字辞書とこの文字辞書に含まれる前記所定アドレスに設定された前記第2の認識精度許容レベルに基づき文字を認識する工程と、
    を備えたことを特徴とする文字認識方法。
  6. 紙葉類の所定領域の画像を読み取る工程と、
    読み取られた画像データから番号情報及び特定文字情報を検出し切り出す工程と、
    前記番号情報を認識する工程と、
    複数の文字を格納した第1のメモリと、この第1のメモリに格納された複数の文字のうち、所定文字の格納先を示す所定アドレスを含む第1のアドレス群、及び前記第1のアドレス群に含まれた前記所定アドレスに設定された第1の認識精度許容レベルを保持した第1のインデックスと、前記第1のメモリに格納された複数の文字のうち、前記所定文字の格納先を示す前記所定アドレスを含む第2のアドレス群、及び前記第2のアドレス群に含まれた前記所定アドレスに設定された第2の認識精度許容レベルを保持した第2のインデックスとを格納した第2のメモリとを有し、前記番号情報の認識結果に基づき、前記第2のメモリから前記紙葉類が該当する前記第1又は第2のインデックスを選択する工程と、
    前記第1のインデックスを選択した場合、前記第1のインデックスに保持された前記第1のアドレス群により示される前記所定文字を含む文字辞書を設定し、この文字辞書とこの文字辞書に含まれる前記所定アドレスに設定された前記第1の認識精度許容レベルとに基づき文字を認識し、また、前記第2のインデックスを選択した場合、前記第2のインデックスに保持された前記第2のアドレス群により示される前記所定文字を含む文字辞書を設定し、この文字辞書とこの文字辞書に含まれる前記所定アドレスに設定された前記第2の認識精度許容レベルに基づき文字を認識する工程と、
    を備えたことを特徴とする文字認識方法。
  7. 複数の文字を格納した第1のメモリと、この第1のメモリに格納された複数の文字のうち、所定文字の格納先を示す所定アドレスを含む第1のアドレス群、及び前記第1のアドレス群に含まれた前記所定アドレスに設定された第1の認識精度許容レベルを保持した第1のインデックスと、前記第1のメモリに格納された複数の文字のうち、前記所定文字の格納先を示す前記所定アドレスを含む第2のアドレス群、及び前記第2のアドレス群に含まれた前記所定アドレスに設定された第2の認識精度許容レベルを保持した第2のインデックスとを格納した第2のメモリとを有し、この第2のメモリから前記第1又は第2のインデックスを選択する工程と、
    前記第1のインデックスを選択した場合、前記第1のインデックスに保持された前記第1のアドレス群により示される前記所定文字を含む文字辞書を設定し、この文字辞書に基づき文字の候補を絞り込み、この文字辞書に含まれる前記所定アドレスに設定された前記第1の認識精度許容レベル応じた認識精度が得られることを条件として文字を認識し、また、前記第2のインデックスを選択した場合、前記第2のインデックスに保持された前記第2のアドレス群により示される前記所定文字を含む文字辞書を設定し、この文字辞書に基づき文字の候補を絞り込み、この文字辞書に含まれる前記所定アドレスに設定された前記第2の認識精度許容レベル応じた認識精度が得られることを条件として文字を認識する工程と、
    を備えたことを特徴とする文字認識方法。
  8. 紙葉類の所定領域の画像を読み取る工程と、
    読み取られた画像データから番号情報及び特定文字情報を検出し切り出す工程と、
    前記番号情報を認識する工程と、
    複数の文字を格納した第1のメモリと、この第1のメモリに格納された複数の文字のうち、所定文字の格納先を示す所定アドレスを含む第1のアドレス群、及び前記第1のアドレス群に含まれた前記所定アドレスに設定された第1の認識精度許容レベルを保持した第1のインデックスと、前記第1のメモリに格納された複数の文字のうち、前記所定文字の格納先を示す前記所定アドレスを含む第2のアドレス群、及び前記第2のアドレス群に含まれた前記所定アドレスに設定された第2の認識精度許容レベルを保持した第2のインデックスとを格納した第2のメモリとを有し、前記番号情報の認識結果に基づき、前記第2のメモリから前記紙葉類が該当する前記第1又は第2のインデックスを選択する工程と、
    前記第1のインデックスを選択した場合、前記第1のインデックスに保持された前記第1のアドレス群により示される前記所定文字を含む文字辞書を設定し、この文字辞書に基づき前記特定文字情報の候補を絞り込み、この文字辞書に含まれる前記所定アドレスに設定された前記第1の認識精度許容レベルに応じた認識精度が得られることを条件として前記特定文字情報を認識し、また、前記紙葉類が該当する前記第2のインデックスを選択した場合、前記第2のインデックスに保持された前記第2のアドレス群により示される前記所定文字を含む文字辞書を設定し、この文字辞書に基づき前記特定文字情報の候補を絞り込み、この文字辞書に含まれる前記所定アドレスに設定された前記第2の認識精度許容レベルに応じた認識精度が得られることを条件として前記特定文字情報を認識する工程と、
    を備えたことを特徴とする文字認識方法。
JP2000229156A 2000-07-28 2000-07-28 文字認識装置及び文字認識方法 Expired - Fee Related JP4649017B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000229156A JP4649017B2 (ja) 2000-07-28 2000-07-28 文字認識装置及び文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000229156A JP4649017B2 (ja) 2000-07-28 2000-07-28 文字認識装置及び文字認識方法

Publications (2)

Publication Number Publication Date
JP2002042056A JP2002042056A (ja) 2002-02-08
JP4649017B2 true JP4649017B2 (ja) 2011-03-09

Family

ID=18722325

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000229156A Expired - Fee Related JP4649017B2 (ja) 2000-07-28 2000-07-28 文字認識装置及び文字認識方法

Country Status (1)

Country Link
JP (1) JP4649017B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2844618B1 (fr) * 2002-09-16 2006-06-23 Solystic Procede pour le codage video d'images comportant une information d'adresse
CN1300739C (zh) * 2005-01-25 2007-02-14 邮政科学上海研究所 信函校验识别方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59205681A (ja) * 1983-03-30 1984-11-21 Comput Basic Mach Technol Res Assoc 文字読取装置
JPH11226515A (ja) * 1998-02-18 1999-08-24 Toshiba Corp 郵便物宛先読取装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59205681A (ja) * 1983-03-30 1984-11-21 Comput Basic Mach Technol Res Assoc 文字読取装置
JPH11226515A (ja) * 1998-02-18 1999-08-24 Toshiba Corp 郵便物宛先読取装置

Also Published As

Publication number Publication date
JP2002042056A (ja) 2002-02-08

Similar Documents

Publication Publication Date Title
KR100401685B1 (ko) 소재정보의 인식장치, 소재정보의 인식방법 및 기록매체
US7693853B2 (en) Method and apparatus for retrieving data representing a postal address from a plurality of postal addresses
JPS6262387B2 (ja)
JP3106994B2 (ja) 住所読み取り装置
JP4649017B2 (ja) 文字認識装置及び文字認識方法
KR100336719B1 (ko) 우편물 배달정보 생성 시스템 및 그 방법
JP3201207B2 (ja) 住所読取装置及び方法
JP2671311B2 (ja) 住所読取装置
JPS5853393B2 (ja) モジヨミトリソウチ
JP2991594B2 (ja) 郵便物の宛名読取装置
JP3217442B2 (ja) 光学的文字読み取り装置
JPH09114856A (ja) 検索用索引生成装置
JP3088036B2 (ja) 宛名読取区分機
JPH02148174A (ja) Ocrによる住所データベース検索装置
JPH1196307A (ja) 単語認識装置
JPS6121581A (ja) 文字認識装置
JPH07116606A (ja) 郵便物あて名認識装置及びあて名認識方法
JPH0793467A (ja) 住所読取システム
JP2001014422A (ja) 読取装置及び読取方法
JPH05242303A (ja) 宛名読取装置
JPH10165897A (ja) 住所読取装置
JPH09190507A (ja) 住所読取装置
JPS63303481A (ja) 住所読取装置
JPH06103404A (ja) 名刺認識装置
JPH0338786A (ja) 文字認識処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070713

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100601

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100802

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100824

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101022

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101116

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101213

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131217

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131217

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees