JP2007004584A

JP2007004584A - 情報処理装置

Info

Publication number: JP2007004584A
Application number: JP2005185178A
Authority: JP
Inventors: Akihiko Nakao; 昭彦中尾; Bunpei Irie; 文平入江; Shunji Ariyoshi; 俊二有吉; Hideo Horiuchi; 秀雄堀内; Takuma Akagi; 琢磨赤木; Yasuhiro Aoki; 泰浩青木; Tomoyuki Hamamura; 倫行浜村; Masaya Maeda; 匡哉前田
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 2005-06-24
Filing date: 2005-06-24
Publication date: 2007-01-11
Also published as: KR20060135487A; US20060291692A1; EP1736913A1

Abstract

【課題】オペレータの負担を軽減しつつ高性能な認識処理を実現できるようにする。
【解決手段】データベース検索処理部１０２は、オペレータが入力装置１３を通じて入力する郵便番号等に相当する第１の文字列を検索キーとして、住所データベースに記憶されている情報の中から住所に相当する第２の文字列を検索する。文字認識処理部１０４は、文字辞書記憶部１０３に記憶されている文字辞書を用いて、書状画像の中の所定の領域に対する文字認識を行い、氏名もしくは名称、電話番号、郵便番号、住所などを含む文字列の候補をそれぞれ生成する。文字画像選択処理部１０５は、生成された候補の中から、データベース検索処理部１０２によって検索された第２の文字列に該当する文字列を選択する。文字画像記憶部１０６は、選択された文字列を構成する個々の文字とその文字画像との対応関係を記憶する。文字辞書学習処理部１０７は、記憶された個々の文字とその文字画像との対応関係を用いて、文字辞書に対する学習処理を実行する。
【選択図】図３

Description

本発明は、住所情報が記載された書状の画像を取り込んで文字認識処理を行う情報処理装置に関し、特に、文字認識処理に使用される文字辞書等の学習を行うことが可能な情報処理装置に関する。

郵便物などの書状上に記載された文字の認識を行う文字認識処理においては、一般に、画像から切り出した文字パターンを予め用意した文字辞書と照合し、文字辞書に登録されている文字のうち最も可能性の高いものを文字認識結果として得る。

文字辞書を作成するためには、各文字に対して１つまたは複数個の文字画像を用意し、それを用いて辞書学習を行う。各文字に対して用意する文字画像の数が多ければ、より高性能な文字辞書を作成することが可能となる。文字辞書の改良を行う場合は、新たな文字画像を追加するか、もしくは一部の文字画像を差し替えてから辞書学習をやり直す。

また、文字画像を作成するためには、文字列を含んでいる画像に対してオペレータが１文字ずつ手で文字領域を指定してその部分の画像を文字画像として保存することを繰り返す必要がある。ある程度文字認識処理技術が発達してからは、ツールを用いることにより、画像から文字を自動的に切り出して、モニタ画面上に各文字画像を表示し、オペレータが各文字画像に対応する文字列を指定する方法も採られるようになった。

例えば、特許文献１には、リジェクトされた書状に記載された文字パターンに対し、オペレータが文字入力を行った後、文字パターンと正解文字コードとの対応関係に基づき、文字辞書の更新を行うことが開示されている。また、特許文献２には、リジェクトされた書状に記載された宛名の文字パターンに対し、オペレータが文字入力を行った後、宛名の文字パターンと正解宛名コードとの対応関係に基づき、宛名の知識データベースの更新を行うことが開示されている。
特開平９−５７２０３号公報特開平９−５７２０４号公報

しかしながら、文字認識に使用される文字辞書を作成するためには、従来、書状の画像から複数の文字画像を切り出した後、オペレータは文字画像毎に正しい文字列を逐一入力しなければならない。このため、オペレータの負担は大きく、作業にかかる時間やコストも大きい。また、オペレータが入力した情報を元に学習処理を行っただけでは、文字辞書や知識データベースの性能を向上させることは難しい。

本発明は上記実情に鑑みてなされたものであり、オペレータの負担を軽減しつつ高性能な認識処理を実現する情報処理装置を提供することを目的とする。

本発明に係る情報処理装置は、住所情報が記載された書状の画像を取り込んで文字認識処理を行う情報処理装置であって、書状の記載に使用される個々の住所に関する情報を記憶する住所情報記憶手段と、第１の文字列を検索キーとして、前記住所情報記憶手段に記憶されている情報の中から住所に相当する第２の文字列を検索する検索処理手段と、前記書状の記載に使用される個々の文字とその画像である文字画像との対応関係を示す文字辞書を記憶する文字辞書記憶手段と、前記文字辞書記憶手段に記憶されている前記文字辞書を用いて、前記画像の中の所定の領域に対する文字認識を行い、少なくとも住所を含む文字列の候補を生成する文字認識処理手段と、前記文字認識処理手段により生成された候補の中から、前記検索処理手段によって検索された前記第２の文字列に該当する文字列を選択する文字画像選択処理手段と、前記文字画像選択処理手段により選択された前記文字列を構成する個々の文字とその文字画像との対応関係を用いて、前記文字辞書記憶手段に記憶されている前記文字辞書に対する学習処理を実行する文字辞書学習処理手段とを具備することを特徴とする。

本発明によれば、オペレータの負担を軽減しつつ高性能な認識処理を実現することができる。

この発明の実施の形態を図面に基づいて詳細に説明する。
図１は、この発明の各実施形態に共通して使用される区分機１を示す外観図であり、図２は区分機１の概略構成を示す図である。この区分機１は、大型の箱型状の区分機本体１ａを有している。この区分機１は、郵便物（書状）Ｐの情報を読取り、その読取内容から宛名領域や貼付シールの領域などを認識し、この認識結果に基づいて該当する区分先に郵便物Ｐを区分するものである。
上記区分機本体１ａには、供給部２と、スキャナ部３と、搬送部４と、区分部５と、収納部６とが設けられている。この供給部２からの郵便物Ｐが搬送路によって搬送されることにより、搬送部４、区分部５を順次介して収納部６に導かれる。

上記供給部２は、郵便物Ｐを載置する載置台７と、この載置台７から郵便物Ｐを一通ずつ取り出して搬送路に送る取出し部８とを有している。上記スキャナ部３は、搬送路によって搬送される１通ずつの郵便物Ｐ上の全体の画像を光学的に読取って画像情報を生成する。上記搬送部４は、スキャナ部３を通過してきた郵便物Ｐを区分部５へ搬送する。上記収納部６は、郵便物Ｐを区分収納する多数の収納ポケット６ａを有している。上記区分部５は、搬送部４から送られてくる郵便物Ｐをスキャナ部３からの画像情報に対する後述する認識結果に基づいて収納ポケット６ａ、…のいずれかに振り分ける。

上記スキャナ部３は、郵便物Ｐ上を光学的に走査して光電変換することによりパターン信号として紙葉類上の情報を読取る読取手段であり、たとえば郵便物Ｐ上に光を照射する光源、およびその反射光を受けて電気信号に変換する自己走査形のＣＣＤイメージセンサ等によって構成される。上記スキャナ部３の出力は情報処理部１０中の認識部に供給される。

上記区分機１において、上記供給部２、スキャナ部３、搬送部４、区分部５、情報処理部１０は、制御部１１に接続されている。この制御部１１は、区分機１の全体の動作を制御する。たとえば、制御部１１は図示しないメモリに記憶されている区分指定テーブルを用いて、上記情報処理部１０での認識結果（もしくは判定結果）に対応する区分指定データを読出し、この読出した区分指定データ（収納ポケット６ａ、…のアドレス）に対応する収納ポケット６ａ、…に上記郵便物Ｐを搬送せしめるものである。
さらに、上記制御部１１はドライバ（図示せず）により上記搬送路等の搬送機構部（図示せず）を駆動することにより、搬送系全体の制御を行うようになっている。

以下の各実施形態では、上記情報処理部１０に設けられる文字辞書等に対する効率的な学習処理を実現するための構成および動作の詳細について説明する。

＜第１の実施形態＞
まず、本発明の第１の実施形態について説明する。

図３は、この発明の第１の実施形態に係わる、オペレータが入力した文字列を元に郵便物に記載された宛先情報を認識するための文字辞書を自動学習させるシステムの構成を示すブロック図である。

このシステムは、郵便物Ｐの書状画像を取り込むためのスキャナ部３と、取り込んだ画像を表示するためのディスプレイ１２と、オペレータが入力作業を行うための入力装置１３と、学習処理部１００とを含んでいる。

学習処理部１００は、前述の情報処理部１０により実現され、住所データベース１０１、データベース検索処理部１０２、文字辞書記憶部１０３、文字認識処理部１０４、文字画像選択処理部１０５、文字画像記憶部１０６、および文字辞書学習処理部１０７を有する。

住所データベース１０１は、郵便物Ｐの記載に使用される個々の住所に関する情報を記憶するものである。

データベース検索処理部１０２は、入力装置１３を通じて入力される第１の文字列（氏名もしくは名称、電話番号、又は郵便番号など）を検索キーとして、住所データベース１０１に記憶されている情報の中から住所に相当する第２の文字列を検索するものである。

文字辞書記憶部１０３は、郵便物Ｐの記載に使用される個々の文字とその画像である文字画像との対応関係を示す文字辞書を記憶するものである。この文字辞書には、一つの文字に対して複数の異なる種類の文字画像を対応付けて登録することが可能である。

文字認識処理部１０４は、文字辞書記憶部１０３に記憶されている文字辞書を用いて、画像の中の所定の領域に対する文字認識を行い、氏名もしくは名称、電話番号、郵便番号、住所などに相当する文字列の候補をそれぞれ生成するものである。

文字画像選択処理部１０５は、文字認識処理部１０４により生成された候補の中から、データベース検索処理部１０２によって検索された第２の文字列に該当する文字列を選択するものである。具体的には、この文字画像選択処理部１０５は、文字認識処理部１０４により生成された候補の中から、入力装置１３を通じて入力された第１の文字列に該当する文字列を選択し、この選択した文字列が画像の中で位置している行に隣接する行の文字列の候補の中から、上記第２の文字列に該当する文字列を選択する。

文字画像記憶部１０６は、文字画像選択処理部１０５によって選択された文字列を構成する個々の文字とその文字画像とを対応付けて記憶するものである。

文字辞書学習処理部１０７は、文字画像記憶部１０６に記憶された個々の文字とその文字画像との対応関係を用いて、文字辞書記憶部１０３に記憶されている文字辞書に対する学習処理を実行するものである。

次に、このような機能を備えたシステムにおける具体的な処理について説明する。

スキャナ部３によって取り込まれた書状画像は、必要なデータ処理が施された後、ディスプレイ１２の画面上に表示される。

オペレータは、入力装置１３から書状画像中に記載されている宛先情報の一部、例えば郵便番号情報を入力する。入力された情報は、学習処理部１００内のデータベース検索処理部１０２に渡され、データベース検索処理部１０２は、その情報を検索キーとして住所データベース１０１を検索する。

住所データベースに登録されている情報の例を図４および図５に示す。図４の例では、各郵便番号に対応する住所情報が登録されている。郵便番号に対応している住所情報は県名から町名までをひと固まりのデータとして扱う。また宛先住所が県名から書かれている場合と、県名が省略されて市町村名から記述されている場合の両方に対応する場合には、図５のように県名情報と市町村名情報とを別データとして扱っていてもよい。その場合には、例えば郵便番号情報として「２１２８５０１」を入力した時にデータベース検索結果として、「神奈川県川崎市幸区柳町」と「川崎市幸区柳町」の２つを返す。

一方、文字認識処理部１０４は、スキャナ部３によって取り込まれた書状画像から、画像中から文字行および文字候補を切り出し、各文字候補をあらかじめ用意してある文字辞書記憶部１０３内の文字辞書を用いて認識する。書状画像の一例を図６に示す。

文字認識処理部１０４では、図７の例に示すように１行につき複数通りの文字切り出し候補が発生する。しかし、オペレータが入力装置１３から入力した情報は必ず画像中のどこかに記載されているので、入力情報と同一の認識結果を持つ文字行が存在するはずである。例えば図６に示した書状画像を見て、オペレータは宛先郵便番号「２１２−８５０１」を入力装置１３から入力する。この時、文字認識処理部１０４は、書状画像から文字行を６行検出し、各文字行に対して文字切り出しおよび文字認識処理を実行する。文字切り出し候補の中に正しく切り出された文字画像が確実に含まれるようにするため、文字切り出し候補を１行に１通りしか生成するのではなく、切り出しアルゴリズムやパラメータを切り替えることによって複数組の文字切り出し候補を生成するようにすることが望ましい。本実施形態では、宛先郵便番号行「２１２−８５０１」に対し図７のように３通りの文字切り出し候補が作成されたものとする。

文字画像選択処理部１０５は、文字切り出し候補の中から入力装置１３から入力した情報と一致するものを検索し、見つかった文字切り出し候補の各画像とその文字種（文字コード等）とを文字画像記憶部１０６に記憶する。入力情報「２１２−８５０１」と一致する認識結果が得られるのは、宛先郵便番号行に対して文字切り出しおよび文字認識処理した結果得られた図７の３候補のうち一番上の候補だけなので、これらの文字画像および文字認識結果が文字画像記憶部１０６に記憶される。

宛先住所郵便番号として「２１２−８５０１」が記載されていた場合、宛先郵便番号のすぐそばに記載されている宛先住所情報は住所データベース１０１で検索して得られた住所情報と一致しているはずである。よって宛先郵便番号行付近の行の文字切り出し結果および文字認識結果を「神奈川県川崎市幸区柳町」または「川崎市幸区柳町」と照合する。文字認識処理部１０４において宛先住所行を処理した時の文字切り出し候補および文字認識結果の一例を図８に示す。図８の例の場合、上から２番目の文字切り出し候補の認識結果が住所データベース１０１から郵便番号「２１２−８５０１」に対応する住所情報として検索した結果「神奈川県川崎市幸区柳町」と一致するので、これらの文字画像および文字認識結果を文字画像記憶部１０６に記憶する。

このように、１枚の書状画像を見てオペレータが宛先郵便番号を入力するだけで、宛先郵便番号行および宛先住所行を構成していた個々の文字画像とその文字種の情報を取得することができた。この作業を複数枚の書状画像について繰り返し、それぞれの郵便番号行および宛先住所行を構成する文字画像およびその文字種の情報を文字画像記憶部１０６に記憶する。

こうして文字画像記憶部１０６に蓄積された文字画像情報は、オペレータが答え教え作業を実施していない時間帯に、文字辞書学習処理部１０７により処理される。文字辞書学習処理部１０７では、各文字画像は文字の種類ごとに分類され、文字辞書記憶部１０３内の文字辞書の学習処理に使用される。学習処理完了後は、例えば、更新された文字辞書で従来の文字辞書を置き換える。

なお、郵便物には明朝体などの活字が印刷される場合もあれば、草書体やペン字で手書き文字が書かれている場合もある。このため、文字画像記憶部１０６に記憶される文字の中には、例えば同じ「朝」を表す文字であっても、種々なカテゴリの文字が記憶されることがあり得る。文字画像記憶部１０６の中に、文字辞書としてまだ登録されていない種類の文字に相当する文字画像がある場合には、その文字画像と該当する文字との対応付けが文字辞書に追加登録されることになる。例えば、図９に示すように、文字辞書において「朝」の文字コード０３６１１に対し明朝体に相当する文字画像を対応付ける登録が済んでいる状態で、明朝体とはカテゴリが異なる草書体やペン字に該当する文字画像が文字画像記憶部１０６に記憶された場合には、当該画像も「朝」の文字コード０３６１１に対応するものとして追加登録されることになる。

次に、図１０のフローチャートを参照して、本実施形態におけるシステムの動作について説明する。

書状画像がスキャナ部３を通じて取り込まれると、その画像に必要な処理が施された後、ディスプレイ１２の画面上に表示される（ステップＳ１１）。

ディスプレイに表示される書状画像を見たオペレータが第１の文字列（郵便番号等）を入力すると、データベース検索処理部１０２がその文字列を取得する（ステップＳ１２）。

データベース検索処理部１０２においては、第１の文字列を検索キーとして、住所データベース１０１から、住所を示す第２の文字列が検索される（ステップＳ１３）。

一方、文字認識処理部１０４においては、画像からの文字の切り出し、文字辞書を用いた文字認識、文字列の候補の生成が行われる（ステップＳ１４）。

文字画像選択処理部１０５においては、文字認識処理部１０４にて生成された文字列の候補の中から、第１の文字列に該当する文字列が選択され（ステップＳ１５）、次いで、選択された文字列が画像の中で位置している行に隣接する行の文字列の候補の中から、データベース検索処理部１０２で得られた第２の文字列に該当する文字列が選択される（ステップＳ１６）。

文字画像記憶部１０６においては、文字画像選択処理部１０５で選択された各文字列を構成する個々の文字とその文字画像とが記憶される（ステップＳ１７）。

文字辞書学習処理部１０７においては、文字画像記憶部１０６に記憶された個々の文字とその文字画像との関係を用いた文字辞書学習が実行される（ステップＳ１８）。

次に、図１１のフローチャートを参照して、図１０中のステップＳ１８（文字学習処理）における詳細な処理を説明する。

文字画像記憶部１０６に記憶されたｎ個の文字（ｉ＝１〜ｎ）とその文字画像が順次読み出され（ステップＳ１）、１文字単位で、順番に以下のような処理が行われる。

所定の記憶領域を使用して、検討対象の文字の番号を表す変数ｉを１にセットする（ステップＳ２）。

変数ｉがｎを超えているか、即ち、全ての文字に対する検討が完了しているか否かが判別される（ステップＳ３）。完了していなければ（ステップＳ３のＮｏ）、検討対象であるｉ番目の文字及びその文字画像と、文字辞書との比較が行われ（ステップＳ４）、該当する文字が文字辞書に存在するか否かが判別される（ステップＳ５）。該当する文字が存在しなければ（ステップＳ５のＮｏ）、検討対象であるｉ番目の文字とその文字画像との組合せが新規なものとして、文字辞書に登録される（ステップＳ６）。そして、所定の記憶領域上の変数ｉに１が加算され、ステップＳ３からの処理が繰り返される。

一方、ステップＳ５において該当する文字が存在していれば（ステップＳ５のＹｅｓ）、その文字と類似した文字画像も文字辞書に存在しているか否かが判別される（ステップＳ７）。文字画像も存在していれば、登録済みであるため、新規登録は行われない。そして、所定の記憶領域上の変数ｉに１が加算され、ステップＳ３からの処理が繰り返される。

また、ステップＳ５において該当する文字が存在し（ステップＳ５のＹｅｓ）、且つ、ステップＳ７において類似する文字画像が存在しない場合には（ステップＳ７のＮｏ）、登録済みの文字画像とはカテゴリが違う文字画像であるものとみなされ、検討対象であるｉ番目の文字とその文字画像との組合せが新規なものとして、文字辞書に追加登録される（ステップＳ８）。なお、同じ文字に対応する登録済みの方の文字画像が不要となる場合には、この文字画像に対して新規な文字画像を上書きする更新処理を行うようにしてもよい。そして、所定の記憶領域上の変数ｉに１が加算され、ステップＳ３からの処理が繰り返される。

なお、図１１で説明した処理は、後述する他の実施形態にも適用できるものである。

このように第１の実施形態によれば、オペレータが入力した文字列をキーワードとして住所データベースを検索し、それに該当する住所情報を取り出し、その住所情報と一致する文字認識結果を選択して、そのときの各文字候補の記載位置から文字パターンの切り出しを行って、その結果を文字辞書学習に使用している。また、オペレータが入力しなかった文字についても文字辞書学習を行っており、かつ、オペレータが入力した情報を元に文字切り出し位置を特定している。これにより、文字切り出し作業および文字辞書学習を自動化することができ、高性能な文字辞書を容易に形成することができる。

＜第２の実施形態＞
次に、本発明の第２の実施形態について説明する。

図１２は、この発明の第２の実施形態に係わる、オペレータが答え教えすることなく、郵便物に記載された宛先情報を認識するための文字辞書を自動学習させるシステムの構成を示すブロック図である。

このシステムは、郵便物Ｐの書状画像を取り込むためのスキャナ部３と、学習処理部２００とを含んでいる。本実施形態でも、図６に示した郵便画像が入力された場合を例にとって説明する。

学習処理部２００は、前述の情報処理部１０により実現され、住所データベース２０１、文字辞書記憶部２０２、文字認識処理部（Ａ）２０３、文字認識処理部（Ｂ）２０４、データベース検索処理部２０５、文字画像選択処理部２０６、文字画像記憶部２０７、および文字辞書学習処理部２０８を有する。

住所データベース２０１は、郵便物Ｐの記載に使用される個々の住所に関する情報を記憶するものである。

文字辞書記憶部２０２は、郵便物Ｐの記載に使用される個々の文字とその画像である文字画像との対応関係を示す文字辞書を記憶するものである。この文字辞書には、一つの文字に対して複数の異なる種類の文字画像を対応付けて登録することが可能である。

文字認識処理部（Ａ）２０３は、文字辞書記憶部２０２に記憶されている文字辞書を用いて、画像の中の所定の領域に対する文字認識を行い、第１の文字列（氏名もしくは名称、電話番号、又は郵便番号など）の候補を生成するものである。

文字認識処理部（Ｂ）２０４は、上記第１の文字列の画像上で位置する行に隣接する行から、住所に相当する第２の文字列の候補をそれぞれ生成するものである。

データベース検索処理部２０５は、文字認識処理部（Ａ）２０３により生成された第１の文字列（氏名もしくは名称、電話番号、又は郵便番号など）を検索キーとして、住所データベース１０１に記憶されている情報の中から住所に相当する第２の文字列を検索するものである。

文字画像選択処理部２０６は、文字認識処理部（Ｂ）２０４により生成された候補の中から、データベース検索処理部２０５によって検索された第２の文字列に該当する文字列を選択するものである。

文字画像記憶部２０７は、文字画像選択処理部２０６によって選択された文字列を構成する個々の文字とその文字画像とを対応付けて記憶するものである。

文字辞書学習処理部２０８は、文字画像記憶部２０７に記憶された個々の文字とその文字画像との対応関係を用いて、文字辞書記憶部２０２に記憶されている文字辞書に対する学習処理を実行するものである。

文字認識処理部（Ａ）２０３は、スキャナ部３によって取り込まれた書状画像から、文字行および文字候補を切り出し、各文字候補をあらかじめ用意してある文字辞書記憶部２０２内の文字辞書を用いて認識する。そして特定の特徴を持つ文字列を検出する。特定の特徴を持つ文字列としては、例えば郵便番号を使用する。郵便番号を使用する場合は、７桁の数字が並んでいる文字行を画像上から検出する。図６の書状画像の場合、行「２１２−８５０１」と行「００１−００００」が検出される。

文字認識処理部（Ａ）２０３によって検出された文字列は、データベース検索処理部２０５に渡される。データベース検索処理部２０５は、その情報を検索キーとして住所データベース２０１を検索する。住所データベース２０１に登録されている情報が図４に示したものであった場合、「２１２−８５０１」に対する検索結果は「神奈川県川崎市幸区柳町」、「００１−００００」に対する検索結果は「北海道札幌市北区」となる。

郵便番号として認識できない行や、郵便番号として読めても住所データベース２０１に登録されていなかった行は郵便番号行ではなかったと判断する。

郵便番号行が見つかった場合は、その郵便番号行に隣接する行を文字認識処理部（Ｂ）２０４で処理する。文字認識処理部（Ｂ）２０４では、文字候補を切り出し、各文字候補をあらかじめ用意してある文字辞書記憶部２０２内の文字辞書を用いて認識する。

文字画像選択処理部２０６では、文字認識処理部（Ｂ）２０４で検出した文字切り出し候補の中から住所データベース１０１で検索して得られた住所情報と一致する結果がないかを調べる。例えば郵便番号行として「２１２−８５０１」を文字認識処理部（Ａ）２０３が検出した場合、図４に示したデータベースから住所情報「神奈川県川崎市幸区柳町」を取得し、文字認識処理部（Ｂ）２０４の文字切り出しおよび文字認識結果の中にこれと一致するものがないかを照合する。文字認識処理部（Ｂ）２０４の処理結果が図８に示したものであった場合、照合の結果上から２番目の文字切り出しおよび文字認識結果が選択され、これらの文字画像および文字認識結果が文字画像記憶部２０７に記憶される。

このように、１枚の書状画像に必ず記載されている情報、例えば郵便番号を検出することで、郵便番号行および住所行を構成していた個々の文字画像とその文字種の情報を取得することができた。この作業を複数枚の書状画像について繰り返し、それぞれの郵便番号行および住所行を構成する文字画像およびその文字種の情報を文字画像記憶部２０７に記憶する。

こうして文字画像記憶部２０７に蓄積された文字画像情報は、書状画像認識処理を実施していない時間帯に、文字辞書学習処理部２０８により処理される。文字辞書学習処理部２０８では、各文字画像は文字の種類ごとに分類され、文字辞書記憶部２０２内の文字辞書の学習処理に使用される。学習処理完了後は、例えば、更新された文字辞書で従来の文字辞書を置き換える。

上記の説明では、検索キーとして郵便番号を用いて住所検索を行える情報を有する住所データベースの例を取り上げたが、代わりに、図１３のように、検索キーとして氏名を用いて住所検索を行える情報を有する住所データベースを採用してもよいし、あるいは、図１４のように、検索キーとして電話番号を用いて住所検索を行える情報を有する住所データベースを採用してもよい。

次に、図１５のフローチャートを参照して、本実施形態におけるシステムの動作について説明する。

書状画像がスキャナ部３を通じて取り込まれると（ステップＳ２１）、文字認識処理部（Ａ）２０３において、画像からの文字の切り出し、文字辞書を用いた文字認識、文字列の候補の生成が行われ、特に、第１の文字列（郵便番号等）の候補が生成される（ステップＳ２２）。

一方、データベース検索処理部２０５においては、文字認識処理部（Ａ）２０３で生成された第１の文字列を検索キーとして、住所を示す第２の文字列が検索される（ステップＳ２３）。

文字認識処理部（Ｂ）２０４においては、文字認識処理部（Ａ）２０３で生成された第１の文字列が画像の中で位置している行に隣接する行の文字列が認識され、その文字列の候補が生成される。次いで、文字画像選択処理部２０６において、その生成された候補の中から、データベース検索処理部２０５で得られた第２の文字列に該当する文字列が選択される（ステップＳ２４）。

文字画像記憶部２０７においては、文字画像選択処理部２０６で選択された各文字列を構成する個々の文字とその文字画像とが記憶される（ステップＳ２５）。

文字辞書学習処理部２０８においては、文字画像記憶部２０７に記憶された個々の文字とその文字画像との関係を用いた文字辞書学習が実行される（ステップＳ２６）。

このように第２の実施形態によれば、オペレータが入力装置から郵便番号情報などを入力しなくても、郵便物の記載内容などに基づいて自動的に学習処理が行われるため、オペレータに手間をかけることなく、高性能な文字辞書を容易に形成することができる。

なお、ここまで説明した第１の実施形態における文字辞書の学習処理のための構成および動作、もしくは第２の実施形態における文字辞書の学習処理のための構成および動作は、後述する第３の実施形態や第４の実施形態にも適用することができる。

＜第３の実施形態＞
次に、本発明の第３の実施形態について説明する。

図１６は、この発明の第３の実施形態に係わる、オペレータが入力した文字列を元に郵便物に記載された宛先情報記載領域の標準位置を自動学習させるシステムの構成を示すブロック図である。

このシステムは、郵便物Ｐの書状画像を取り込むためのスキャナ部３と、取り込んだ画像を表示するためのディスプレイ１２と、オペレータが入力作業を行うための入力装置１３と、学習処理部３００とを含んでいる。

学習処理部３００は、前述の情報処理部１０により実現され、住所データベース３０１、データベース検索処理部３０２、文字辞書記憶部３０３、宛先住所領域パラメータ記憶部３０４、宛先住所領域判定処理部３０５、文字認識処理部３０６、文字画像選択処理部３０７、宛先住所領域情報記憶部３０８、および宛先住所領域パラメータ学習処理部３０９を有する。

住所データベース３０１は、郵便物Ｐの記載に使用される個々の住所に関する情報を記憶するものである。

データベース検索処理部３０２は、入力装置１３を通じて入力される第１の文字列（氏名もしくは名称、電話番号、又は郵便番号など）を検索キーとして、住所データベース３０１に記憶されている情報の中から住所に相当する第２の文字列を検索するものである。

文字辞書記憶部３０３は、郵便物Ｐの記載に使用される個々の文字とその画像である文字画像との対応関係を示す文字辞書を記憶するものである。この文字辞書には、一つの文字に対して複数の異なる種類の文字画像を対応付けて登録することが可能である。

宛先住所領域パラメータ記憶部３０４は、画像の中の宛先住所の領域を示す宛先住所領域情報（パラメータ）を記憶するものである。

宛先住所領域判定処理部３０５は、宛先住所領域パラメータ記憶部３０４に記憶されている宛先住所領域情報（パラメータ）に基づいて、文字認識処理部３０６が文字認識を行うべき領域を判定するものである。

文字認識処理部３０６は、文字辞書記憶部３０３に記憶されている文字辞書を用いて、宛先住所領域判定処理部３０５によって判定された領域に対する文字認識を行い、氏名もしくは名称、電話番号、郵便番号、住所などに相当する文字列の候補をそれぞれ生成するものである。

文字画像選択処理部３０７は、文字認識処理部３０６により生成された候補の中から、データベース検索処理部３０２によって検索された第２の文字列に該当する文字列を選択するものである。具体的には、この文字画像選択処理部３０７は、文字認識処理部３０６により生成された候補の中から、入力装置１３を通じて入力された第１の文字列に該当する文字列を選択し、この選択した文字列が画像の中で位置している行に隣接する行の文字列の候補の中から、上記第２の文字列に該当する文字列を選択する。

宛先住所領域情報記憶部３０８は、文字画像選択処理部３０７によって選択された第１の文字列及び第２の文字列の画像上の各領域を示す情報（パラメータ）を記憶するものである。

宛先住所領域パラメータ学習処理部３０９は、宛先住所領域情報記憶部３０８に記憶された各領域を示す情報（パラメータ）に基づいて、宛先住所領域パラメータ記憶部３０４に記憶されている宛先住所領域情報（パラメータ）に対する学習処理を実行するものである。

オペレータは、入力装置１３から書状画像中に記載されている宛先情報の一部、例えば郵便番号情報を入力する。入力された情報は、学習処理部３００内のデータベース検索処理部３０２に渡され、データベース検索処理部３０２は、その情報を検索キーとして住所データベース３０１を検索する。

一方、宛先住所領域判定処理部３０５は、スキャナ部３によって取り込まれた書状画像から、宛先住所領域パラメータ記憶部３０４に記憶されている宛先情報領域に関する各種パラメータを元に、書状画像中の宛名記載範囲を推定する。図１７に宛名記載範囲推定処理の一例を示す。図１７の（ａ）に示した書状画像に対し、宛先住所領域パラメータ記憶部３０４に記憶されているパラメータ情報を元に推定した宛名記載範囲が、図１７の（ｂ）の破線枠で囲んで領域である。

文字認識処理部３０６は、書状画像の宛名記載範囲と推定した範囲（図１７の（ｂ））から、文字行および文字候補を切り出し、各文字候補をあらかじめ用意してある文字辞書記憶部３０３内の文字辞書を用いて認識する。図１７の（ｃ）は、宛名記載範囲内から行を切り出した状態の例である。そしてオペレータが入力装置１３から入力した文字列、例えば宛先郵便番号と一致する文字列を検出する。図１７の（ｃ）の書状画像の場合、行「２１２−８５０１」が検出される。

宛先住所郵便番号として「２１２−８５０１」を検出した時、宛先郵便番号のすぐそばに記載されている宛先住所情報は住所データベース３０１で検索して得られた住所情報と一致しているはずである。よって文字画像選択処理部３０７において、宛先郵便番号行付近の行の文字切り出し結果および文字認識結果を「神奈川県川崎市幸区柳町」または「川崎市幸区柳町」と照合する。文字認識処理部３０６で宛先住所行を処理した時の文字切り出し候補および文字認識結果の一例を図８に示す。図８の例の場合、上から２番目の文字切り出し候補の認識結果が住所データベース３０１から郵便番号「２１２−８５０１」に対応する住所情報として検索した結果「神奈川県川崎市幸区柳町」と一致するので、この行が宛先住所行であることが判明する。

こうして宛先郵便番号行および宛先住所行の記載位置が検出されると、宛先住所領域情報記憶部３０８は、その書状における宛先情報記載領域に関する情報を記憶する。宛先情報記載領域を検出する方法としては、例えば図１８に示すように、検出した宛先郵便番号行と宛先住所行の領域を統合することで宛先情報記載領域を検出する。

このように、１枚の書状画像を見てオペレータが宛先郵便番号を入力するだけで、宛先住所情報が記載されている領域に関する情報を取得することができた。この作業を複数枚の書状画像について繰り返し、各書状の宛先情報記載領域の情報を宛先住所領域情報記憶部３０８に記憶する。

こうして宛先住所領域情報記憶部３０８に蓄積された宛先情報領域に関する各種情報は、オペレータが答え教え作業を実施していない時間帯に、宛先住所領域パラメータ学習処理部３０９により処理される。宛先住所領域パラメータ学習処理部３０９では、宛先住所領域情報記憶部３０８に記憶された情報を元に、宛先情報の標準記載位置やサイズに関する情報を学習する。学習処理完了後は、更新されたパラメータで宛先住所領域パラメータ記憶部３０４に記憶されている内容を更新する。

次に、図１９のフローチャートを参照して、本実施形態におけるシステムの動作について説明する。

書状画像がスキャナ部３を通じて取り込まれると（ステップＳ３１）、宛名住所領域判定処理部３０５において、宛名住所領域情報（パラメータ）に基づく宛名住所領域の判定が行われる（ステップＳ３２）。

この後、宛名住所領域判定処理部３０５で判定された宛名住所領域に対し、前述の図１０で説明したステップＳ１２〜Ｓ１６と同様の処理が、文字認識処理部３０６や文字画像選択処理部３０７などにおいて行われる。

宛先住所領域情報記憶部３０８においては、文字画像選択処理部３０７で選択された各文字列の領域を統合した宛先住所領域の情報（パラメータ）が記憶される（ステップＳ３３）。

宛先住所領域パラメータ学習処理部３０９においては、宛先住所領域情報記憶部３０８に記憶された宛先住所領域の情報（パラメータ）を用いた宛先住所領域の標準位置の学習が実行される（ステップＳ３４）。

このように第３の実施形態によれば、文字辞書学習だけでなく、宛先住所領域の標準位置の学習に関しても自動化することができ、高精度な宛先住所領域情報を容易に形成することができる。

＜第４の実施形態＞
次に、本発明の第４の実施形態について説明する。

図２０は、この発明の第４の実施形態に係わる、オペレータが入力した文字列を元に郵便物に記載された差出人ごとに差出人住所情報記載領域と宛先情報記載領域の標準位置を自動学習させるシステムの構成を示すブロック図である。

このシステムは、郵便物Ｐの書状画像を取り込むためのスキャナ部３と、取り込んだ画像を表示するためのディスプレイ１２と、オペレータが入力作業を行うための入力装置１３と、学習処理部４００とを含んでいる。

学習処理部４００は、前述の情報処理部１０により実現され、住所データベース４０１、データベース検索処理部４０２、文字辞書記憶部４０３、差出人別書状書式情報記憶部４０４、宛先住所領域判定処理部４０５、文字認識処理部（Ａ）４０６、文字画像選択処理部（Ａ）４０７、宛先住所領域情報記憶部４０８、差出人住所領域判定処理部４０９、文字認識処理部（Ｂ）４１０、文字画像選択処理部（Ｂ）４１１、差出人住所領域情報記憶部４１２、および差出人別書状書式学習処理部４１３を有する。

住所データベース４０１は、郵便物Ｐの記載に使用される個々の住所に関する情報を記憶するものである。

データベース検索処理部４０２は、入力装置１３を通じて入力される第１の文字列（氏名もしくは名称、電話番号、又は郵便番号など）を検索キーとして、住所データベース４０１に記憶されている情報の中から住所に相当する第２の文字列を検索するものである。

文字辞書記憶部４０３は、郵便物Ｐの記載に使用される個々の文字とその画像である文字画像との対応関係を示す文字辞書を記憶するものである。この文字辞書には、一つの文字に対して複数の異なる種類の文字画像を対応付けて登録することが可能である。

差出人別書状書式情報記憶部４０４は、差出人別に書状の書式が定義された差出人別書状書式情報を記憶するものである。

宛先住所領域判定処理部４０５は、差出人別書状書式情報記憶部４０４に記憶されている差出人別書状書式情報に基づいて、文字認識処理部（Ａ）４０６が文字認識を行うべき領域（宛先住所領域）を判定するものである。

文字認識処理部（Ａ）４０６は、文字辞書記憶部４０３に記憶されている文字辞書を用いて、宛先住所領域判定処理部４０５によって判定された領域（宛先住所領域）に対する文字認識を行い、氏名もしくは名称、電話番号、郵便番号、住所などに相当する文字列の候補をそれぞれ生成するものである。

文字画像選択処理部（Ａ）４０７は、文字認識処理部（Ａ）４０６により生成された候補の中から、データベース検索処理部４０２によって検索された第２の文字列に該当する文字列を選択するものである。具体的には、この文字画像選択処理部（Ａ）４０７は、文字認識処理部（Ａ）４０６により生成された候補の中から、入力装置１３を通じて入力された第１の文字列に該当する文字列を選択し、この選択した文字列が画像の中で位置している行に隣接する行の文字列の候補の中から、上記第２の文字列に該当する文字列を選択する。

宛先住所領域情報記憶部４０８は、文字画像選択処理部（Ａ）４０７によって選択された第１の文字列及び第２の文字列の画像上の各領域を示す情報を記憶するものである。

差出人住所領域判定処理部４０９は、差出人別書状書式情報記憶部４０４に記憶されている差出人別書状書式情報に基づいて、文字認識処理部（Ｂ）４１０が文字認識を行うべき領域（差出人住所領域）を判定するものである。

文字認識処理部（Ｂ）４１０は、文字辞書記憶部４０３に記憶されている文字辞書を用いて、差出人住所領域判定処理部４０９によって判定された領域（差出人住所領域）に対する文字認識を行い、氏名もしくは名称、電話番号、郵便番号、住所などに相当する文字列の候補をそれぞれ生成するものである。

文字画像選択処理部（Ｂ）４１１は、文字認識処理部（Ｂ）４１０により生成された候補の中から、データベース検索処理部４０２によって検索された第２の文字列に該当する文字列を選択するものである。具体的には、この文字画像選択処理部（Ｂ）４１１は、文字認識処理部（Ｂ）４１０により生成された候補の中から、入力装置１３を通じて入力された第１の文字列に該当する文字列を選択し、この選択した文字列が画像の中で位置している行に隣接する行の文字列の候補の中から、上記第２の文字列に該当する文字列を選択する。

差出人住所領域情報記憶部４１２は、文字画像選択処理部（Ｂ）４１１によって選択された第１の文字列及び第２の文字列の画像上の各領域を示す情報を記憶するものである。

差出人別書状書式学習処理部４１３は、宛先住所領域情報記憶部４０８に記憶された第１の文字列及び第２の文字列の画像上の各領域を示す情報、および、差出人住所領域情報記憶部４１２に記憶された第１の文字列及び第２の文字列の画像上の各領域を示す情報に基づいて、差出人別書状書式情報記憶部４０４に記憶されている差出人別書状書式情報に対する学習処理を実行するものである。

オペレータは、入力装置１３から書状画像中に記載されている差出人情報の一部および宛先情報の一部、例えば郵便番号情報を入力する。入力された情報は学習処理部４００内のデータベース検索処理部４０２に渡され、データベース検索処理部４０２は入力された差出人に関する入力情報を検索キーとして住所データベース４０１を検索し、差出人の住所情報を取得する。同様に、入力された受取人に関する入力情報を検索キーとして住所データベース４０１を検索し、受取人の住所情報を取得する。

大量のダイレクトメールを発送したり、逆に大量のメールを受け取ったりする会社および個人に対しては専用の郵便番号が割り振られている場合がある。図２１に特定の会社に対して固有の郵便番号が割り振られている例を示す。図２１の例では、「××商事」に対して「１００９９９９」という郵便番号が割り振られている。

図２０では差出人の住所情報検索と受取人の住所情報検索とで同一の住所データベースを使用しているが、別々の住所データベースを使用してもよい。例えば受取人については郵便番号で検索し、差出人については図２２に示すような差出人名を検索キーとして住所データベースを使用する場合が考えられる。

以下の説明では、差出人・受取人共に郵便番号を検索キーとして住所情報を検索する場合について述べることにする。

図２３に、オペレータが入力した差出人および受取人の郵便番号情報を元に住所データベース４０１を検索して住所情報を取得する流れを示す。オペレータは差出人の郵便番号と受取人の郵便番号とを入力装置１３から入力する。しかし、同じ差出人からの大量のダイレクトメールを処理する場合には、差出人郵便番号情報は毎回入力する必要はない。そのような場合は、書状画像１枚分の処理が終わって次の書状画像を処理する際に、前に入力した差出人郵便番号の情報はクリアせずに残しておくと、受取人郵便番号を入力するだけで認識処理が開始できるので、効率が良くなる。

差出人に関する入力情報は、差出人別書状書式情報記憶部４０４に渡される。差出人別書状書式情報記憶部４０４には、図２４に示されるように、オペレータが差出人に関して入力した情報や、郵便番号を検索キーとして得られた差出人および受取人の住所情報が記載されている書状画像中の標準位置が記憶されている。スキャナ部３によって取り込まれた書状画像は宛先住所領域判定処理部４０５に送られる。宛先住所領域判定処理部４０５は、差出人別書状書式情報記憶部３０４に登録されている宛先領域情報のうち、オペレータが入力した差出人の郵便番号用に用意されている各種パラメータを元に、書状画像中の宛名記載範囲を推定する。

書状画像の宛名記載範囲と推定した範囲から、文字認識処理部（Ａ）４０６は文字行および文字候補を切り出し、各文字候補をあらかじめ用意してある文字辞書記憶部４０３内の文字辞書を用いて認識する。図１７の（ｃ）は宛名記載範囲内から行を切り出した状態の例である。そしてオペレータが入力装置１３から入力した文字列、例えば宛先郵便番号と一致する文字列を検出する。図１７の（ｃ）の書状画像の場合、行「２１２−８５０１」が検出される。

宛先住所郵便番号として「２１２−８５０１」を検出した時、宛先郵便番号のすぐそばに記載されている宛先住所情報は住所データベース４０１で検索して得られた住所情報と一致しているはずである。よって文字画像選択処理部（Ａ）４０７で宛先郵便番号行付近の行の文字切り出し結果および文字認識結果を「神奈川県川崎市幸区柳町」または「川崎市幸区柳町」と照合する。認識結果と住所情報が一致した場合、この行が宛先住所行であることが判明する。

こうして宛先郵便番号行および宛先住所行の記載位置が検出されると、宛先住所領域情報記憶部４０８でその書状における宛先情報記載領域に関する情報を記憶する。宛先情報記載領域を検出する方法としては、例えば図２５に示すように、検出した宛先郵便番号行と宛先住所行の領域を統合することで宛先情報記載領域を検出する。

同様の手順で、差出人住所領域判定処理部４０９で差出人住所情報記載範囲を推定し、文字認識処理部（Ｂ）４１０はその範囲の中から文字候補を切り出して個々の文字候補を認識し、文字画像選択処理部（Ｂ）４１１で差出人住所行を検出する。そして差出人住所領域情報記憶部４１２では図２５に示すように、検出した差出人郵便番号行と差出人住所行の領域を統合することで差出人情報記載領域を検出する。

このように、１枚の書状画像を見てオペレータが差出人および受取人の宛先郵便番号を入力するだけで、差出人および受取人の住所情報が記載されている領域に関する情報を取得することができた。この作業を複数枚の書状画像について繰り返し、差出人および受取人情報記載領域に関する情報を差出人ごとに分類して差出人別書状書式学習処理部４１３に記憶する。

こうして宛先住所領域情報記憶部４０８および差出人住所領域情報記憶部４１２に蓄積された各種情報は、オペレータが答え教え作業を実施していない時間帯に、差出人別書状書式学習処理部４１３により、差出人ごとの書状書式に関する学習を行うために使用される。学習処理完了後は、更新されたパラメータで差出人別書状書式情報記憶部４０４に記憶されている内容を更新する。

次に、図２６のフローチャートを参照して、本実施形態におけるシステムの動作について説明する。

書状画像がスキャナ部３を通じて取り込まれると（ステップＳ３１）、以下のような処理が行われる。

宛名住所領域判定処理部４０５において、差出人別書状書式情報の中の宛先住所領域情報（パラメータ）に基づく宛先住所領域の判定が行われる（ステップＳ４２Ａ）。

この後、宛名住所領域判定処理部４０５で判定された宛先住所領域に対し、前述の図１０で説明したステップＳ１２〜Ｓ１６と同様の処理が、文字認識処理部（Ａ）４０６や文字画像選択処理部（Ａ）４０７などにおいて行われる。

宛先住所領域情報記憶部４０８においては、文字画像選択処理部（Ａ）４０７で選択された各文字列の領域を統合した宛先住所領域の情報（パラメータ）が記憶される（ステップＳ４３Ａ）。

一方、差出人住所領域判定処理部４０９において、差出人別書状書式情報の中の差出人住所領域情報（パラメータ）に基づく差出人住所領域の判定が行われる（ステップＳ４２Ｂ）。

この後、差出人住所領域判定処理部４０９で判定された差出人住所領域に対し、前述の図１０で説明したステップＳ１２〜Ｓ１６と同様の処理が、文字認識処理部（Ｂ）４１０や文字画像選択処理部（Ｂ）４１１などにおいて行われる。

差出人住所領域情報記憶部４１２においては、文字画像選択処理部（Ｂ）４１１で選択された各文字列の領域を統合した差出人住所領域の情報（パラメータ）が記憶される（ステップＳ４３Ｂ）。

差出人別書状書式学習処理部４１３においては、宛先住所領域情報記憶部４０８に記憶された宛先住所領域の情報（パラメータ）および差出人住所領域情報記憶部４１２に記憶された差出人住所領域の情報（パラメータ）を用いた、差出人別書状書式中の宛先住所領域の標準位置および差出人住所領域の標準位置の学習が実行される（ステップＳ４４）。

このように第４の実施形態によれば、文字辞書学習や、宛先住所領域の標準位置の学習だけでなく、差出人住所領域の標準位置の学習に関しても自動化することができ、高精度な差出人別書状書式情報を容易に形成することができる。

上述した各実施形態で述べた各種の処理手順は、コンピュータプログラムとして、コンピュータにより読み取り可能な記憶媒体（例えば磁気ディスク，光ディスク，半導体メモリ）に記憶させておき、必要に応じてそれをプロセッサにより読み出して実行するようにしてもよい。また、このようなコンピュータプログラムは、通信媒体を介してあるコンピュータから他のコンピュータに伝送することにより配布することも可能である。

本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。

この発明の各実施形態に共通して使用される区分機を示す外観図。図１に示される区分機の概略構成を示す図。この発明の第１の実施形態に係わる、オペレータが入力した文字列を元に郵便物に記載された宛先情報を認識するための文字辞書を自動学習させるシステムの構成を示すブロック図。住所データベースに登録されている情報の第１の例。住所データベースに登録されている情報の第２の例。書状画像の一例を示す図。１行につき複数通りの文字切り出し候補が発生することを示す図。文字認識処理部において宛先住所行を処理した時の文字切り出し候補および文字認識結果の一例を示す図。異なるカテゴリに相当する複数の文字画像が一つの文字コードに対応付けられて文字辞書に登録されることを示す図。この発明の第１の実施形態におけるシステムの動作を示すフローチャート。図１０中のステップＳ１８（文字学習処理）における詳細な処理を示すフローチャート。この発明の第２の実施形態に係わる、オペレータが答え教えすることなく、郵便物に記載された宛先情報を認識するための文字辞書を自動学習させるシステムの構成を示すブロック図。検索キーとして氏名を用いて住所検索を行える住所データベースの例を示す図。検索キーとして電話番号を用いて住所検索を行える住所データベースの例を示す図。この発明の第２の実施形態におけるシステムの動作を示すフローチャート。この発明の第３の実施形態に係わる、オペレータが入力した文字列を元に郵便物に記載された宛先情報記載領域の標準位置を自動学習させるシステムの構成を示すブロック図。宛名記載範囲推定処理の一例を示す図。宛先郵便番号行と宛先住所行の領域を統合することで宛先情報記載領域を検出することを示す図。この発明の第３の実施形態におけるシステムの動作を示すフローチャート。この発明の第４の実施形態に係わる、オペレータが入力した文字列を元に郵便物に記載された差出人ごとに差出人住所情報記載領域と宛先情報記載領域の標準位置を自動学習させるシステムの構成を示すブロック図。特定の会社に対して固有の郵便番号が割り振られている例を示す図。差出人名を検索キーとして住所データベースを使用することを示す図。オペレータが入力した差出人および受取人の郵便番号情報を元に住所データベースを検索して住所情報を取得する流れを示す図。差出人別書状書式情報記憶部に記憶される各種の情報を示す図。宛先郵便番号行と宛先住所行の領域を統合することで宛先情報記載領域を検出することを示す図。この発明の第４の実施形態におけるシステムの動作を示すフローチャート。

符号の説明

１…区分機、２…供給部、３…スキャナ部、４…、５…区分部、６…収納部、７…載置台、８…取出し部、１０…情報処理部、１１…制御部、１２…ディスプレイ、１３…入力装置、１００，２００…辞書学習処理部、３００…宛先情報領域学習処理部、４００…差出人別書状書式学習処理部。

Claims

住所情報が記載された書状の画像を取り込んで文字認識処理を行う情報処理装置であって、
書状の記載に使用される個々の住所に関する情報を記憶する住所情報記憶手段と、
第１の文字列を検索キーとして、前記住所情報記憶手段に記憶されている情報の中から住所に相当する第２の文字列を検索する検索処理手段と、
前記書状の記載に使用される個々の文字とその画像である文字画像との対応関係を示す文字辞書を記憶する文字辞書記憶手段と、
前記文字辞書記憶手段に記憶されている前記文字辞書を用いて、前記画像の中の所定の領域に対する文字認識を行い、少なくとも住所を含む文字列の候補を生成する文字認識処理手段と、
前記文字認識処理手段により生成された候補の中から、前記検索処理手段によって検索された前記第２の文字列に該当する文字列を選択する文字画像選択処理手段と、
前記文字画像選択処理手段により選択された前記文字列を構成する個々の文字とその文字画像との対応関係を用いて、前記文字辞書記憶手段に記憶されている前記文字辞書に対する学習処理を実行する文字辞書学習処理手段と、
を具備することを特徴とする情報処理装置。
文字辞書記憶手段に記憶されている前記文字辞書は、一つの文字に対して複数の異なる種類の文字画像を対応付けて登録することが可能であることを特徴とする請求項１記載の情報処理装置。
前記第１の文字列は、郵便番号に相当するものであることを特徴とする請求項１記載の情報処理装置。
前記第１の文字列は、氏名もしくは名称に相当するものであることを特徴とする請求項１記載の情報処理装置。
前記第１の文字列は、電話番号に相当するものであることを特徴とする請求項１記載の情報処理装置。
前記第１の文字列は、入力装置を通じて入力されるものであることを特徴とする請求項１記載の情報処理装置。
前記文字画像選択処理手段は、前記文字認識処理手段により生成された候補の中から、前記入力装置を通じて入力された前記第１の文字列に該当する文字列を選択し、この選択した文字列が前記画像の中で位置している行に隣接する行の文字列の候補の中から、前記第２の文字列に該当する文字列を選択することを特徴とする請求項６記載の情報処理装置。
前記文字認識処理手段は、前記画像の中の所定の領域に対する文字認識を行って、前記検索キーとして使用される前記第１の文字列の候補を生成する第１の認識処理手段と、この第１の文字列の前記画像上で位置する行に隣接する行から前記第２の文字列の候補を生成する第２の認識処理手段とを含むことを特徴とする請求項１記載の情報処理装置。
前記画像の中の宛先住所の領域を示す宛先住所領域情報を記憶する宛先住所領域情報記憶手段と、
前記宛先住所領域情報記憶手段に記憶されている前記宛先住所領域情報に基づいて、前記文字認識処理手段が文字認識を行うべき領域を判定する宛先住所領域判定手段と、
前記文字画像選択処理手段により選択された前記第１の文字列及び第２の文字列の前記画像上の各領域に基づいて、前記宛先住所領域情報記憶手段に記憶されている前記宛先住所領域情報に対する学習処理を実行する宛先住所領域情報学習処理手段と、
を更に具備することを特徴とする請求項７記載の情報処理装置。
差出人別に書状の書式が定義された差出人別書状書式情報を記憶する差出人別書状書式情報記憶手段と、
前記差出人別書状書式情報記憶手段に記憶されている前記差出人別書状書式情報に基づいて、前記文字認識処理手段が文字認識を行うべき領域の中の宛先住所領域を判定する宛先住所領域判定手段と、
前記差出人別書状書式情報記憶手段に記憶されている前記差出人別書状書式情報に基づいて、前記文字認識処理手段が文字認識を行うべき領域の中の差出人住所領域を判定する差出人住所領域判定手段と、
前記文字画像選択処理手段によって前記宛先住所領域および前記差出人住所領域の各々に関して選択される前記第１の文字列及び第２の文字列の前記画像上の各領域に基づいて、前記差出人別書状書式情報記憶手段に記憶されている前記差出人別書状書式情報に対する学習処理を実行する宛先住所領域情報学習処理手段と、
を更に具備することを特徴とする請求項７記載の情報処理装置。