JP5107157B2

JP5107157B2 - 文字認識プログラム、文字認識装置および文字認識方法

Info

Publication number: JP5107157B2
Application number: JP2008169844A
Authority: JP
Inventors: 健一廣岡; 稔福田
Original assignee: Fujitsu Frontech Ltd
Current assignee: Fujitsu Frontech Ltd
Priority date: 2008-06-30
Filing date: 2008-06-30
Publication date: 2012-12-26
Anticipated expiration: 2028-06-30
Also published as: JP2010009440A

Description

本発明は、文字認識プログラム、文字認識装置および文字認識方法に関し、特に、画像情報に含まれる文字列を特定する文字認識プログラム、文字認識装置および文字認識方法に関する。

従来、帳票等に記入された１文字以上の文字列を画像情報として読み込んで、読み込んだ画像情報から記入された文字列を認識する文字認識システムが用いられている。このシステムは、例えば、画像読込装置と画像読込装置に接続されたコンピュータを有している。画像読込装置は、帳票等の画像情報を読み込む。画像読込装置は、例えば、イメージスキャナである。そして、コンピュータが、画像読込装置から画像情報を取得し、画像情報に含まれる文字列に対応する文字列画像を認識する。更に、コンピュータが、文字列画像に対応する文字列を、コンピュータで処理可能な、この文字列に対応する所定の文字コード列として特定する。

コンピュータにおいて、このような処理を実現するアプリケーションソフトウェアは、光学文字認識（ＯＣＲ：Optical Character Recognition）ソフトと呼ばれる。また、このようなシステムを実現する装置全体を光学文字読取装置（ＯＣＲ：Optical Character Reader）と呼ぶこともある。以下では、ＯＣＲという場合、前者のＯＣＲソフトを指すものとする。

ここで、文字認識システムでは、認識する文字列画像に記入者の筆跡の違い等による揺らぎが含まれる。この揺らぎは、文字コード列の特定精度を低下させる原因となり、文字コード列が一意に特定されない場合もある。このため、文字認識システムでは、文字コード列の特定精度を向上することが課題となる。特定精度が高いとは、すなわち、少数の候補に正確に絞り込むことができることを意味する。

この課題に対し、画像情報の所定範囲内での文字パターン（文字形状の特徴）の出現頻度情報を保持し、この頻度情報に基づいて、文字列画像の認識結果を絞り込む技術が知られている（例えば、特許文献１参照）。また、文字列画像として認識され得る文字コード列を予め限定しておき、その他の文字コード列が得られた場合には、これを特定結果から除外する技術も知られている（例えば、特許文献２参照）。更に、得られた文字コード列の前回までの取得頻度を保持し、この取得頻度に基づいて文字コード列の特定結果を絞り込む技術も知られている（例えば、特許文献３参照）。
特開平５−２９８４８９号公報特開平６−０９６２８７号公報特開平８−０１６７３０号公報

しかし、上記特許文献１，３に記載の方法では、頻度情報を文字列認識の実行のたびに更新する必要がある。このため、文字列認識の処理実行時にコンピュータに余計な負荷が生じるという課題がある。

また、上記特許文献２に記載の方法では、利用され得る文字列が多数存在する場合には、精度良く少数の候補に絞り込むことが困難となるという課題がある。
本発明はこのような点に鑑みてなされたものであり、低負荷の処理で文字列を精度良く認識することが可能な文字認識プログラム、文字認識装置および文字認識方法を提供することを目的とする。

上記課題を解決するために、画像情報に含まれる文字列を認識する文字認識プログラムが提供される。この文字認識プログラムを実行するコンピュータは、文字推定手段、候補文字列生成手段および文字列特定手段として機能する。文字推定手段は、画像情報を基に文字列の各文字を推定し、その推定結果の候補としての１つ以上の候補文字を文字列内の各文字について出力する。候補文字列生成手段は、複数の単語が登録された単語登録情報に含まれる文字の出現回数を文字ごとに対応付けた重み付け情報に基づき、文字推定手段が出力した文字列内の各文字に対応する候補文字を出現回数が多い順に１つずつ抽出して組み合わせることで、文字列の候補としての１つ以上の候補文字列を順次生成する。文字列特定手段は、候補文字列をその生成順に単語登録情報内の単語と照合し、その照合結果から文字列に対応する単語を特定する。

このような文字認識プログラムによれば、文字推定手段により、画像情報を基に文字列の各文字が推定され、その推定結果の候補として１つ以上の候補文字が文字列内の各文字について出力される。次に、候補文字列生成手段により、複数の単語が登録された単語登録情報に含まれる文字の出現回数を文字ごとに対応付けた重み付け情報に基づき、文字推定手段が出力した文字列内の各文字に対応する候補文字が出現回数の多い順に１つずつ抽出されて組み合わされることで、文字列の候補としての１つ以上の候補文字列が順次生成される。そして、文字列特定手段により、候補文字列がその生成順に単語登録情報内の単語と照合され、その照合結果から文字列に対応する単語が特定される。

また、上記課題を解決するために、画像情報に含まれる第１の文字列と第２の文字列とを認識する文字認識プログラムが提供される。この文字認識プログラムを実行するコンピュータは、文字推定手段、第１の候補文字列生成手段、第１の文字列特定手段、第２の候補文字列生成手段および第２の文字列特定手段として機能する。文字推定手段は、画像情報を基に第１の文字列および第２の文字列の各文字を推定し、その推定結果の候補として、第１の文字列の各文字に対応する第１の候補文字と、第２の文字列の各文字に対応する第２の候補文字とを、それぞれ１つ以上出力する。第１の候補文字列生成手段は、複数の単語が登録された第１の単語登録情報に含まれる文字の出現回数を文字ごとに対応付けた第１の重み付け情報に基づき、文字推定手段が出力した第１の文字列内の各文字に対応する第１の候補文字を第１の単語登録情報における出現回数が多い順に１つずつ抽出して組み合わせることで、第１の文字列の候補としての１つ以上の第１の候補文字列を順次生成する。第１の文字列特定手段は、第１の候補文字列をその生成順に第１の単語登録情報内の単語と照合し、その照合結果から第１の文字列と一致すると推定される単語を示す第１の候補単語を複数選択して出力する。第２の候補文字列生成手段は、複数の単語がそれぞれ登録された複数の第２の単語登録情報の中から、第１の候補単語から特定される第２の単語登録情報を第１の候補単語ごとに選択し、選択した第２の単語登録情報のそれぞれに含まれる文字の出現回数を文字ごとに対応付けた複数の第２の重み付け情報に基づき、文字推定手段が出力した第２の文字列内の各文字に対応する第２の候補文字を第２の単語登録情報における出現回数が多い順に１つずつ組み合わせることで、第２の文字列の候補としての１つ以上の第２の候補文字列を第１の候補単語ごとにそれぞれ順に生成する。第２の文字列特定手段は、第２の候補文字列をその生成順に対応する第２の単語登録情報内の単語と照合し、その照合結果から第２の文字列と一致すると推定される単語を示す第２の候補単語を、いずれかの第２の単語登録情報から選択して出力するとともに、第２の候補単語に対応する第１の候補単語を第１の文字列と一致する単語として確定する。

このような文字認識プログラムを実行するコンピュータによれば、文字推定手段により、画像情報を基に第１の文字列および第２の文字列の各文字が推定され、その推定結果の候補として、第１の文字列の各文字に対応する第１の候補文字と、第２の文字列の各文字に対応する第２の候補文字とが、それぞれ１つ以上出力される。次に、第１の候補文字列生成手段により、複数の単語が登録された第１の単語登録情報に含まれる文字の出現回数を文字ごとに対応付けた第１の重み付け情報に基づき、文字推定手段が出力した第１の文字列内の各文字に対応する第１の候補文字が第１の単語登録情報における出現回数が多い順に１つずつ抽出されて組み合わされることで、第１の文字列の候補としての１つ以上の第１の候補文字列が順次生成される。そして、第１の文字列特定手段により、第１の候補文字列がその生成順に第１の単語登録情報内の単語と照合され、その照合結果から第１の文字列と一致すると推定される単語を示す第１の候補単語が複数選択されて出力される。更に、第２の候補文字列生成手段により、複数の単語がそれぞれ登録された複数の第２の単語登録情報の中から、第１の候補単語から特定される第２の単語登録情報を第１の候補単語ごとに選択し、選択した第２の単語登録情報のそれぞれに含まれる文字の出現回数を文字ごとに対応付けた複数の第２の重み付け情報に基づき、文字推定手段が出力した第２の文字列内の各文字に対応する第２の候補文字が第２の単語登録情報における出現回数が多い順に１つずつ組み合わされることで、第２の文字列の候補としての１つ以上の第２の候補文字列が第１の候補単語ごとにそれぞれ順に生成される。そして、第２の文字列特定手段により、第２の候補文字列がその生成順に対応する第２の単語登録情報内の単語と照合され、その照合結果から第２の文字列と一致すると推定される単語を示す第２の候補単語がいずれかの第２の単語登録情報から選択して出力されるとともに、第２の候補単語に対応する第１の候補単語が第１の文字列と一致する単語として確定される。

また、上記課題を解決するために、上記文字認識プログラムを実行するコンピュータと同様の処理を行う文字認識装置および文字認識方法が提供される。

上記文字認識プログラム、文字認識装置および文字認識方法によれば、低負荷の処理で文字列を精度良く認識することが可能となる。

以下、本実施の形態を図面を参照して詳細に説明する。
図１は、文字認識システムの概要を示す図である。この文字認識システムは、コンピュータ１および画像情報取込装置２を有する。コンピュータ１と画像情報取込装置２とは、所定のインタフェースによって接続されており、相互にデータ通信が可能である。コンピュータ１は、画像情報取込装置２から画像情報を取得する。そして、コンピュータ１は、画像情報に含まれる１文字以上の文字列を、その文字列に対応する文字コード列として特定する。ここで、以降の説明では、文字列を特定することと文字コード列を特定することとは同義であるものとする。コンピュータ１は、このような文字列の特定処理を行う文字認識プログラムを実行している。このコンピュータ１は、文字認識プログラムを実行することにより、単語登録情報記憶手段１ａ、重み付け情報記憶手段１ｂ、画像情報入力手段１ｃ、文字推定手段１ｄ、候補文字列生成手段１ｅおよび文字列特定手段１ｆとして機能する。

単語登録情報記憶手段１ａは、複数の所定の単語を登録した単語登録情報を記憶する。
重み付け情報記憶手段１ｂは、単語登録情報記憶手段１ａに記憶された単語登録情報に含まれる文字の出現回数を各文字に対応付けた重み付け情報を記憶する。

画像情報入力手段１ｃは、画像情報取込装置２から取得する画像情報を文字推定手段１ｄに出力する。
文字推定手段１ｄは、画像情報入力手段１ｃから画像情報を取得すると、画像情報に含まれる複数の文字を推定し、推定した複数の文字それぞれに対する複数の候補文字を生成する。そして、文字推定手段１ｄは、生成した複数の候補文字を候補文字列生成手段１ｅに出力する。

候補文字列生成手段１ｅは、重み付け情報記憶手段１ｂに記憶された重み付け情報および文字推定手段１ｄが生成した複数の候補文字に基づいて、画像情報に含まれる文字列に対する複数の候補文字列を生成する。このとき候補文字列生成手段１ｅは、この複数の候補文字列それぞれに、重み付け情報に基づいて優先順位を付与する。そして、候補文字列生成手段１ｅは、生成した複数の候補文字列を文字列特定手段１ｆに出力する。

文字列特定手段１ｆは、単語登録情報記憶手段１ａに記憶された単語登録情報に基づいて、候補文字列生成手段１ｅが生成した複数の候補文字列から画像情報に含まれる文字列を特定する。特定方法としては、例えば、複数の候補文字列それぞれと単語登録情報に含まれる複数の単語それぞれとの一致の度合い（一致率）に基づく方法が考えられる。このとき、文字列特定手段１ｆは、上記の優先順位の高い順に一致率を判定する。

画像情報取込装置２は、文字列が記入された紙面の情報を画像情報として取り込む。画像情報取込装置２は、取り込んだ画像情報をコンピュータ１に出力する。画像情報取込装置２は、例えば、イメージスキャナ（以下、単にスキャナという）である。

このような文字認識システムによれば、所定の文字列情報に含まれる文字の出現回数が重み付け値として各文字に予め対応付けられ、重み付け情報として保持される。そして、この重み付け情報に基づいて、候補文字列が優先順位を付与されて、生成される。更に、生成された候補文字列、候補文字列に付与された優先順位および単語登録情報に基づいて、画像情報に含まれる文字列が特定される。

このように、予め単語登録情報に基づいて各文字に重み付けを付与しておくことで、文字の特定精度を向上することができる。また、優先順位の高い順に候補文字列の一致率判定処理等を行うことにより、文字列を短時間に特定できるようになる。更に、優先順位の低い候補文字列の一致率判定を省略することができるため、認識処理の負荷を低減することができる。すなわち、低負荷の処理で文字列を精度良く認識することが可能となる。

ところで、図１に示した文字認識システムは、例えば、金融機関の業務において紙帳票に記入された文字列を特定し、それに基づいて業務処理を行う場合に有用である。そこで、このような文字認識システムを銀行業務に関連付けた場合を例に挙げ、実施の形態を図面を参照して詳細に説明する。

図２は、本実施の形態のコンピュータのハードウェア構成を示す図である。コンピュータ１００は、本実施の形態の文字認識プログラムを実行しており、所定の帳票の画像情報に含まれる金融機関の名称を特定する。コンピュータ１００は、ＣＰＵ（Central Processing Unit）１０１によって装置全体が制御されている。ＣＰＵ１０１には、バス１０８を介してＲＡＭ（Random Access Memory）１０２、ＨＤＤ（Hard Disk Drive）１０３、グラフィック処理装置１０４、入力インタフェース１０５，１０６および通信インタフェース１０７が接続されている。

ＲＡＭ１０２には、ＣＰＵ１０１に実行させるＯＳ（Operating System）のプログラムやアプリケーションソフト（以下、アプリケーションという）のプログラムの少なくとも一部が一時的に格納される。また、ＲＡＭ１０２には、ＣＰＵ１０１による処理に必要な各種データが格納される。

ＨＤＤ１０３は、データを記憶するためのディスク装置である。ＨＤＤ１０３には、ＯＳのプログラムやアプリケーションのプログラムが格納される。また、ＨＤＤ１０３には、ＣＰＵ１０１による処理に必要な各種データが格納される。

グラフィック処理装置１０４には、モニタ１１が接続されている。グラフィック処理装置１０４は、ＣＰＵ１０１からの命令に従って、画像をモニタ１１の画面に表示させる。
入力インタフェース１０５，１０６は、外部装置からのデータの入力を受け付けるインタフェースである。入力インタフェース１０５には、キーボード１２とマウス１３とが接続されている。入力インタフェース１０５は、キーボード１２やマウス１３から送られてくる信号を、バス１０８を介してＣＰＵ１０１に送信する。入力インタフェース１０６には、スキャナ１４が接続されている。入力インタフェース１０６は、スキャナ１４から送られてくる所定の帳票の画像情報に対応する信号をバス１０８を介してＣＰＵ１０１に送信する。また、入力インタフェース１０６は、入力インタフェース１０６の有するＤＭＡ（Direct Memory Access）機能により取得する画像情報をバス１０８を介して直接ＲＡＭ１０２に格納することもある。

通信インタフェース１０７は、ネットワーク１０に接続されている。通信インタフェース１０７は、ネットワーク１０を介して、他の情報処理装置との間でデータの送受信を行う。

図３は、本実施の形態のコンピュータの機能を示すブロック図である。コンピュータ１００は、文字コード記憶部１１０、金融機関辞書記憶部１２０、重み付け情報記憶部１３０、更新情報入力部１４０、重み付け処理部１４５、画像情報入力部１５０、文字識別部１６０、候補文字除外部１７０、候補名称生成部１８０および名称特定部１９０を有する。

文字コード記憶部１１０は、コンピュータ１００で使用可能な文字を文字コードに対応付けた文字コード対応テーブルを記憶する。
金融機関辞書記憶部１２０は、金融機関名を登録した金融機関名テーブルを記憶する。また、金融機関辞書記憶部１２０は、各金融機関の支店名を各金融機関名に対応付けて登録した、支店名テーブル群を記憶する。なお、金融機関名テーブルおよび支店名テーブル群を含む情報を金融機関辞書と呼ぶこととする。

重み付け情報記憶部１３０は、金融機関辞書に含まれる金融機関名で使用される文字の出現回数を上記の文字コードに対応付けた金融機関名用重み付けテーブルを記憶する。また、重み付け情報記憶部１３０は、各金融機関の支店名で使用される文字の出現回数を上記の文字コードに対応付けた支店名用重み付けテーブルを各金融機関名に対応付けて記憶する。

更新情報入力部１４０は、金融機関辞書に対する更新情報を取得する。更新情報には、金融機関名や各金融機関の支店名の変更が含まれる。更新情報は、例えば、オペレータにより定期的に入力されたり、ネットワーク等を介して定期的に配信されたりする。更新情報入力部１４０は、更新情報を取得すると金融機関辞書記憶部１２０に記憶された金融機関辞書を更新情報に応じて更新する。

重み付け処理部１４５は、金融機関辞書記憶部１２０に記憶された金融機関辞書が更新されたことを検知すると、金融機関名テーブルに含まれる文字の出現回数を算出し、各文字に対応付けて金融機関名用重み付けテーブルを生成する。重み付け処理部１４５は、生成した金融機関名用重み付けテーブルを重み付け情報記憶部１３０に格納する。

また、重み付け処理部１４５は、名称特定部１９０の指示に基づいて、金融機関辞書記憶部１２０に記憶された支店名テーブルを参照して、支店名テーブルに含まれる文字の出現回数を算出し、各文字に対応付けて支店名用重み付けテーブルを生成する。重み付け処理部１４５は、生成した支店名用重み付けテーブルを重み付け情報記憶部１３０に格納する。

画像情報入力部１５０は、スキャナ１４から取得する画像情報を文字識別部１６０に出力する。
文字識別部１６０は、画像情報入力部１５０から画像情報を取得すると、画像情報に含まれる文字画像を抽出する。文字識別部１６０は、抽出した文字画像に所定の画像識別処理を行う。ここで、文字識別部１６０が抽出する文字画像には、金融機関名および各金融機関の支店名が含まれる。金融機関名や各金融機関の支店名といった名称の種別は、例えば、記入された画像上の領域によって区別される。そして、文字識別部１６０は、文字コード記憶部１１０に記憶された文字コード対応テーブルに基づいて、各文字の形状に対応する文字コードを取得する。

ここで、文字識別部１６０による文字画像の識別結果は、帳票に記入された文字の筆跡の違い等により一意に定まる可能性は小さい。このため、文字識別部１６０は、識別結果の尤度（確からしさ）等に基づいて、その尤度の優位な識別結果から順に複数の候補文字を特定する。すなわち、文字識別部１６０は、複数の候補文字に対応する複数の候補文字コードを確からしいものから順に取得する。文字識別部１６０は、取得した複数の候補文字コードを金融機関名用および支店名用を区別して候補文字除外部１７０に出力する。なお、以下では、候補文字という場合、候補文字に対応する候補文字コードを示すものとする。

候補文字除外部１７０は、文字識別部１６０から金融機関名用の候補文字および支店名用の候補文字を取得する。候補文字除外部１７０は、金融機関名用の候補文字に関して、重み付け情報記憶部１３０に記憶された金融機関名用重み付けテーブルで重み付け値が０である候補文字を候補から除外する。候補文字除外部１７０は、この除外処理の結果、残った金融機関名用の候補文字を候補名称生成部１８０に出力する。

また、候補文字除外部１７０は、名称特定部１９０の指示に基づいて、支店名用の候補文字に対し、重み付け情報記憶部１３０に記憶された支店名用重み付けテーブルで重み付け値が０である候補文字を候補から除外する。候補文字除外部１７０は、この除外処理の結果、残った支店名用の候補文字を候補名称生成部１８０に出力する。

候補名称生成部１８０は、候補文字除外部１７０から候補除外処理後の金融機関名用の候補文字および支店名用の候補文字を取得する。候補名称生成部１８０は、取得した金融機関名用の候補文字を用いて、重み付け情報記憶部１３０に記憶された金融機関名用重み付けテーブルに基づき、複数の候補金融機関名を生成する。このとき、候補名称生成部１８０は、金融機関名用重み付けテーブルの重み付け値に基づいて、候補金融機関名に優先順位を付与する。例えば、重み付け値が大きい候補文字同士を組み合わせて生成された候補金融機関名は、重み付け値が小さい候補文字同士で組み合わせて生成された候補金融機関名に比べて優先順位が高くなるようにする。候補名称生成部１８０は、このように優先順位を付与して生成した複数の候補金融機関名を名称特定部１９０に出力する。

また、候補名称生成部１８０は、候補文字除外部１７０から取得する支店名用の候補文字を用いて、重み付け情報記憶部１３０に記憶された支店名用重み付けテーブルに基づき、複数の候補支店名を生成する。このとき、候補名称生成部１８０は、支店名用重み付けテーブルの重み付け値に基づいて、候補支店名に優先順位を付与する。優先順位の付与の方法は、候補金融機関名の生成の際と同様の方法が考えられる。候補名称生成部１８０は、生成した複数の候補支店名を名称特定部１９０に出力する。

名称特定部１９０は、候補名称生成部１８０から複数の候補金融機関名を取得する。名称特定部１９０は、金融機関辞書記憶部１２０に記憶された金融機関名テーブルに、取得した複数の候補金融機関名それぞれに対応する金融機関名が存在するか否かを判定する。このとき、名称特定部１９０は、付与された優先順位の高い候補金融機関名から順に判定を行う。名称特定部１９０の上記判定の方法としては、例えば、双方の文字列を比較して、同じ文字である割合を示す一致率を算出する方法を用い、一致率の大きいものを優先的に判定結果として採用する。

その後、名称特定部１９０は、判定の結果得られた金融機関名に対応する支店名用重み付けテーブルの生成を、重み付け処理部１４５に指示する。名称特定部１９０は、支店名用重み付けテーブルの生成処理が完了すると、候補文字除外部１７０に候補支店名に対する処理を指示する。そして、名称特定部１９０は、候補名称生成部１８０から候補支店名を取得すると、金融機関辞書記憶部１２０に記憶された支店名テーブルに、取得した複数の候補支店名それぞれに対応する支店名が存在するか否かを判定する。このとき、名称特定部１９０は、金融機関名の特定の場合と同様に、付与された優先順位の高い候補支店名から順に判定を行う。この判定の方法には、金融機関名の判定を行う場合と同様に一致率を算出する方法を用いる。このとき、名称特定部１９０は、金融機関名の特定の結果で金融機関名が一意に特定されていない場合には、特定した支店名に基づいて金融機関名の特定を行う。

図４は、文字コード記憶部に記憶されるテーブルを示す図である。文字コード記憶部１１０には、文字コード対応テーブル１１１が記憶される。文字コード対応テーブル１１１は、文字画像に含まれる文字とその文字に対応する文字コードを対応付けた情報である。

図５は、文字コード対応テーブルのデータ構造例を示す図である。文字コード対応テーブル１１１には、Ｎｏ．を示す項目、文字コードを示す項目および文字を示す項目が設けられている。各項目の横方向に関連付けられた情報同士が１つの文字コードに関する情報を構成する。

Ｎｏ．を示す項目には、項目の番号を示す値が設定される。文字コードを示す項目には、コンピュータ１００で認識可能なコードが設定される。文字を示す項目には、文字コードに対応付けられる文字が設定される。

文字コード対応テーブル１１１には、例えば、Ｎｏ．が“１２３０６”、文字コードが“０ｘ３０１２”、文字が“東”という情報が設定される。これは、項目番号“１２３０６”番目の文字コードとして“０ｘ３０１２”が定められており、この文字コードに対応する文字が“東”であることを示している。すなわち、文字識別部１６０は、文字として“東”を認識すると、これに対する文字コード“０ｘ３０１２”を取得する。

なお、“ｎｕｌｌ”は、文字コードに対応する文字が定義されていないことを示す。
文字コード対応テーブル１１１のコード体系としては、例えば、ＵｎｉｃｏｄｅやＪＩＳ（Japanese Industrial Standards）コード等を用いることができる。

図６は、金融機関辞書記憶部に記憶されるテーブルを示す図である。金融機関辞書記憶部１２０には、金融機関名テーブル１２１および支店名テーブル群１２２が記憶される。金融機関名テーブル１２１は、業務処理システムで利用する金融機関名を登録したテーブルである。支店名テーブル群１２２は、各金融機関に対応付けられた支店名を登録するテーブルの集合である。支店名テーブル群１２２は、支店名テーブル１２２ａ，１２２ｂ，１２２ｃを含む。支店名テーブル１２２ａ，１２２ｂ，１２２ｃは、金融機関名テーブル１２１に登録された各金融機関の支店名を各金融機関に対応付けて登録したテーブルである。なお、金融機関名および支店名は、文字コード列の情報として登録される。

図７は、金融機関名テーブルのデータ構造例を示す図である。金融機関名テーブル１２１には、Ｎｏ．を示す項目、金融機関名を示す項目が設けられている。
Ｎｏ．を示す項目には、項目の番号を示す値が設定される。金融機関名を示す項目には、金融機関の名称を示す情報が設定される。

金融機関名テーブル１２１には、例えば、Ｎｏ．が“１”、金融機関名が“東京ＡＢＣ銀行”という情報が設定される。
図８は、支店名テーブルのデータ構造例を示す図である。支店名テーブル１２２ａ，１２２ｂ，１２２ｃには、Ｎｏ．を示す項目、支店名を示す項目が設けられている。ここでは、金融機関名“東京ＡＢＣ銀行”の支店名を登録したテーブルである支店名テーブル１２２ａに関して説明するが、支店名テーブル１２２ｂ，１２２ｃに関しても同様である。

Ｎｏ．を示す項目には、項目の番号を示す値が設定される。支店名を示す項目には、支店の名称を示す情報が設定される。
支店名テーブル１２２ａには、例えば、Ｎｏ．が“１”、支店名が“本店”という情報が設定される。同様にして支店名テーブル１２２ｂ，１２２ｃに関しても他の金融機関の各支店名が登録される。

図９は、重み付け情報記憶部に記憶されるテーブルを示す図である。重み付け情報記憶部１３０には、金融機関名用重み付けテーブル１３１および支店名用重み付けテーブル群１３２が記憶される。金融機関名用重み付けテーブル１３１は、金融機関名テーブル１２１に登録された金融機関名に含まれる各文字コードの出現回数を、各文字コードに対応付けたテーブルである。支店名用重み付けテーブル群１３２は、各金融機関に対応付けられた支店名に含まれる各文字コードの出現回数を、各文字コードに対応付けたテーブルの集合である。支店名用重み付けテーブル群１３２は、支店名用重み付けテーブル１３２ａ，１３２ｂ，１３２ｃを含む。支店名用重み付けテーブル１３２ａ，１３２ｂ，１３２ｃは、それぞれ支店名テーブル１２２ａ，１２２ｂ，１２２ｃに登録された金融機関の支店名に含まれる各文字コードの出現回数を、各文字コードに対応付けたテーブルである。

ここで、金融機関名用重み付けテーブル１３１と支店名用重み付けテーブル群１３２は、同時に重み付け情報記憶部１３０に記憶されている必要はない。本実施の形態では、重み付け処理部１４５は、金融機関名用重み付けテーブル１３１に関しては、システムの起動時や金融機関名テーブルの更新時に一度だけ重み付け処理を行って生成して重み付け情報記憶部１３０に格納する。一方、支店名の重み付け処理に関しては、その処理負荷が小さい場合も多いため、重み付け処理部１４５は、必要に応じて重み付け処理を行い重み付け情報記憶部１３０に登録する。このようにすることで、コンピュータ１００が利用可能なメモリリソースを効率良く利用することができる。

なお、支店名用重み付けテーブル群１３２も金融機関名用重み付けテーブル１３１と同様にシステムの起動時や金融機関名テーブル１２１の更新時に一度だけ重み付け処理を行い、重み付け情報記憶部１３０に格納するようにしてもよい。

また、支店名用重み付けテーブル群１３２に含まれる支店名用重み付けテーブルの数は、図９のように複数の場合もあるし、単数の場合もある。
図１０は、金融機関名用重み付けテーブルのデータ構造例を示す図である。金融機関名用重み付けテーブル１３１には、Ｎｏ．を示す項目、文字コードを示す項目、重み付け値を示す項目が設けられている。各項目の横方向に関連付けられた情報同士が１つの文字コードに関する情報を構成する。

Ｎｏ．を示す項目には、項目の番号を示す値が設定される。文字コードを示す項目には、コンピュータ１００で使用可能な文字コードが設定される。重み付け値を示す項目には、対応する文字コードの、金融機関名テーブル１２１に登録された金融機関名における出現回数が設定される。

金融機関名用重み付けテーブル１３１には、例えば、Ｎｏ．が“１２３０６”、文字コードが“０ｘ３０１２（東）”、重み付け値が“５”という情報が設定される。これは、文字コード“０ｘ３０１２（東）”が、金融機関名テーブル１２１に登録された金融機関名に５回出現することを示している。

図１１は、支店名用重み付けテーブルのデータ構造例を示す図である。支店名用重み付けテーブル１３２ａ，１３２ｂ，１３２ｃには、Ｎｏ．を示す項目、文字コードを示す項目、重み付け値を示す項目が設けられている。ここでは、金融機関名“東京ＡＢＣ銀行”の支店名を登録したテーブルである支店名用重み付けテーブル１３２ａに関して説明するが、支店名テーブル１３２ｂ，１３２ｃに関しても同様である。各項目の横方向に関連付けられた情報同士が１つの文字コードに関する情報を構成する。

Ｎｏ．を示す項目には、項目の番号を示す値が設定される。文字コードを示す項目には、コンピュータ１００で使用可能な文字コードが設定される。重み付け値を示す項目には、対応する文字コードの、支店名テーブル１２２ａに登録された支店名における出現回数が設定される。

支店名用重み付けテーブル１３２ａには、例えば、Ｎｏ．が“３３４４６”、文字コードが“０ｘ８２Ａ６（新）”という情報が設定される。これは、文字コード“０ｘ８２Ａ６（新）”が、“東京ＡＢＣ銀行”の支店名テーブル１２２ａに登録された支店名に４回出現することを示している。

次に、以上のような構成を備えるコンピュータ１００において実行される処理の詳細を説明する。
図１２は、金融機関名に対する重み付け処理の手順を示すフローチャートである。以下、図１２に示す処理をステップ番号に沿って説明する。

［ステップＳ１１］更新情報入力部１４０は、オペレータの入力やネットワーク等による配信により取得する更新情報に基づいて、金融機関辞書記憶部１２０に記憶された金融機関名テーブル１２１および支店名テーブル群１２２を更新する。

［ステップＳ１２］重み付け処理部１４５は、金融機関辞書記憶部１２０に記憶された金融機関名テーブル１２１が更新されたことを検知すると、金融機関名テーブル１２１に含まれる各文字の出現回数を算出する。重み付け処理部１４５は、算出した出現回数を重み付け値として、該当の文字に対応付けた金融機関名用重み付けテーブル１３１を生成する。

［ステップＳ１３］重み付け処理部１４５は、生成した金融機関名用重み付けテーブル１３１を重み付け情報記憶部１３０に格納する。
このように、コンピュータ１００は、更新情報を取得すると、更新後の金融機関名テーブル１２１に基づいて金融機関名用重み付けテーブル１３１を更新する。

なお、重み付け処理部１４５が、金融機関名テーブル１２１の更新を検知する方法としては、例えば、更新情報入力部１４０からその旨の通知を受けたり、金融機関名テーブル１２１を所定の間隔で監視したりする方法が考えられる。

これにより、金融機関辞書の更新が発生した場合にも、金融機関名テーブル１２１と金融機関名用重み付けテーブル１３１とを適正に同期することができる。
図１３は、金融機関名・支店名の特定処理の手順を示すフローチャートである。以下、図１３に示す処理をステップ番号に沿って説明する。

［ステップＳ２１］画像情報入力部１５０は、スキャナ１４から帳票に対応する画像情報を取得する。画像情報入力部１５０は、取得した画像情報を文字識別部１６０に出力する。

［ステップＳ２２］文字識別部１６０は、画像情報に含まれる金融機関名用の文字およびこの金融機関の支店名用の文字を識別する。そして、識別結果および文字コード記憶部１１０に記憶された文字コード対応テーブル１１１に基づいて金融機関名用の候補文字および支店名用の候補文字を取得し、候補文字除外部１７０に出力する。

［ステップＳ２３］候補文字除外部１７０は、文字識別部１６０より取得した金融機関名用の候補文字に対し、重み付け情報記憶部１３０に記憶された金融機関名用重み付けテーブル１３１で重み付け値が０である候補文字を候補から除外する。候補文字除外部１７０は、除外処理後の金融機関名用の候補文字を候補名称生成部１８０に出力する。また、候補文字除外部１７０は、文字識別部１６０より支店名用の候補文字を取得する。この支店名用の候補文字は、金融機関名の特定処理が完了するまで、候補文字除外部１７０が利用可能な記憶領域に保持される。

［ステップＳ２４］候補名称生成部１８０は、候補文字除外部１７０から金融機関名用の候補文字を取得する。候補名称生成部１８０は、取得した金融機関名用の候補文字を用いて、重み付け情報記憶部１３０に記憶された金融機関名用重み付けテーブル１３１に基づき、複数の候補金融機関名を優先順位を付与しながら生成する。候補名称生成部１８０は、生成した複数の候補金融機関名を名称特定部１９０に出力する。

［ステップＳ２５］名称特定部１９０は、候補名称生成部１８０から複数の候補金融機関名を取得する。名称特定部１９０は、金融機関辞書記憶部１２０に記憶された金融機関名テーブル１２１に、取得した複数の候補金融機関名それぞれに対応する金融機関名が存在するか否かを優先順位の高い順に判定し、その金融機関名を特定する。ここでは、特定された金融機関名に“東京ＡＢＣ銀行”が含まれるものとする。なお、上記の特定処理は、候補金融機関名と金融機関名テーブル１２１に存在する金融機関名との一致率を算出し、一致率の高いものを選択する方法で行われる。

［ステップＳ２６］名称特定部１９０は、上記ステップＳ２５の特定の結果が一意であるか否かを判定する。一意である場合、名称特定部１９０は、重み付け処理部１４５に特定した金融機関の支店名に対する重み付け処理を実行するよう指示して、処理がステップＳ２７に移される。一意でない場合、名称特定部１９０は、重み付け処理部１４５に特定した複数の金融機関の支店名に対する重み付け処理を実行するよう指示して、処理がステップＳ３１に移される。

［ステップＳ２７］重み付け処理部１４５は、金融機関辞書記憶部１２０に記憶された該当の金融機関の支店名テーブル１２２ａに含まれる各文字の出現回数を算出して支店名用重み付けテーブル１３２ａを生成し、重み付け情報記憶部１３０に格納する。そして、重み付け処理部１４５は、名称特定部１９０に重み付け処理が完了したことを通知する。名称特定部１９０は、重み付け処理部１４５から重み付け処理が完了した旨の通知を取得すると、候補文字除外部１７０に支店名用の候補文字に関する処理を実行するよう指示する。

［ステップＳ２８］候補文字除外部１７０は、名称特定部１９０からの指示に基づいて、取得した支店名用の候補文字に対し、重み付け情報記憶部１３０に記憶された支店名用重み付けテーブル１３２ａで重み付け値が０である候補文字を候補から除外する。そして、候補文字除外部１７０は、除外処理後の支店名用の候補文字を候補名称生成部１８０に出力する。

［ステップＳ２９］候補名称生成部１８０は、候補文字除外部１７０から支店名用の候補文字を取得する。候補名称生成部１８０は、取得した支店名用の候補文字を用いて、重み付け情報記憶部１３０に記憶された支店名用重み付けテーブル１３２ａに基づき、複数の候補支店名を優先順位を付与しながら生成する。候補名称生成部１８０は、生成した複数の候補支店名を名称特定部１９０に出力する。

［ステップＳ３０］名称特定部１９０は、候補名称生成部１８０から複数の候補支店名を取得する。名称特定部１９０は、金融機関辞書記憶部１２０に記憶された支店名テーブル１２２ａに、取得した複数の候補支店名それぞれに対応する支店名が存在するか否かを優先順位の高い順に判定し、その支店名を特定する。なお、上記の特定処理は、候補支店名と支店名テーブル１２２ａに存在する支店名との一致率を算出し、一致率の高いものを選択する方法で行われる。

［ステップＳ３１］重み付け処理部１４５は、金融機関辞書記憶部１２０に記憶された上記ステップＳ２６で特定された複数の金融機関の支店名テーブルに含まれる各文字の出現回数を算出して、金融機関ごとの支店名用重み付けテーブルを生成する。重み付け処理部１４５は、生成した複数の支店名用重み付けテーブルを重み付け情報記憶部１３０に格納する。そして、重み付け処理部１４５は、名称特定部１９０に重み付け処理が完了したことを通知する。名称特定部１９０は、重み付け処理部１４５から重み付け処理が完了した旨の通知を取得すると、候補文字除外部１７０に支店名用の候補文字に関する処理を複数の支店名用重み付けテーブルそれぞれを用いて実行するよう指示する。

［ステップＳ３２］候補文字除外部１７０は、名称特定部１９０からの指示に基づいて、支店名用の候補文字に対し、重み付け情報記憶部１３０に記憶された複数の支店名用重み付けテーブルそれぞれについて、重み付け値が０である候補文字を候補から除外して、金融機関ごとに候補文字を生成する。そして、候補文字除外部１７０は、除外処理後の金融機関ごとの支店名用の候補文字を候補名称生成部１８０に出力する。

［ステップＳ３３］候補名称生成部１８０は、候補文字除外部１７０から金融機関ごとの支店名用の候補文字を取得する。候補名称生成部１８０は、取得した支店名用の候補文字を用いて、重み付け情報記憶部１３０に記憶された支店名用重み付けテーブルに基づき、金融機関毎に複数の候補支店名を優先順位を付与しながら生成する。候補名称生成部１８０は、生成した金融機関ごとの候補支店名を名称特定部１９０に出力する。

［ステップＳ３４］名称特定部１９０は、候補名称生成部１８０から金融機関ごとの複数の候補支店名を取得する。名称特定部１９０は、金融機関辞書記憶部１２０に記憶された金融機関ごとの支店名テーブルに、取得した複数の候補支店名それぞれに対応する支店名が存在するか否かを優先順位の高い順に判定し、その支店名を特定する。なお、上記の特定処理は、金融機関ごとに、候補支店名と支店名テーブルに存在する支店名との一致率を算出し、一致率の高いものを選択する方法で行われる。そして、名称特定部１９０は、一致率の最も高い支店名を有する金融機関名を特定する。

［ステップＳ３５］名称特定部１９０は、特定した金融機関名および支店名を必要に応じて他の業務システムに出力する。
このようにして、コンピュータ１００は取得した画像情報に含まれる金融機関名および支店名を特定することができる。予め算出した重み付け値により、候補となる名称に優先順位を付与し、この優先順位の高いものから判定処理を実行することで、特定結果の確からしさの高いものから順に処理が完了する。すなわち、優先順位の低いものに対する判定処理を省略することもでき、特定処理の精度を維持しつつ、コンピュータ１００の処理負荷を低減することができる。

次に、以上の処理の流れを更に具体的に説明する。
図１４は、帳票の記入例を示す図である。帳票には、金融機関名を記入する欄２０１および支店名を記入する欄２０２が設けられている。金融機関名を記入する欄２０１には、記入者により、金融機関の名称が記入される。支店名を記入する欄２０２には、記入者により、記入した金融機関の支店の名称が記入される。このような情報は、例えば、業務システムにおいて銀行口座を特定するための情報として用いられる。

そして、金融機関名および支店名が記入された帳票は、スキャナ１４によって画像情報として取り込まれる。コンピュータ１００は、スキャナ１４が取り込んだ画像情報を取得する。

図１５は、名称特定処理の流れを示す第１の模式図である。以下、図１５に示す処理をステップ番号に沿って説明する。
［ステップＳＴ１］文字識別部１６０は、図１４の帳票に記入された金融機関名に対する文字識別部１６０の文字識別処理の結果、候補文字リスト３０１を取得する。これらの候補文字は、文字識別部１６０による識別処理の結果の確からしさ等による順序で並んでおり、その順序に特に意味はない。

［ステップＳＴ２］候補文字除外部１７０は、候補文字リスト３０１に含まれる文字のうち、金融機関名用重み付けテーブル１３１において重み付け値が０である“糸”、“余”、“令”、“Ｐ”、“及”、“て”および“Ｏ”の文字を候補から除外する。更に、候補文字除外部１７０は、残った文字の重み付け値に基づいて優先順位の高い文字から第１候補、第２の候補、・・・とし、候補文字リスト３０２を取得する。

ここで候補文字リスト３０２において“−（ハイフン）”で示される欄は、該当候補となる文字が存在しないことを意味する。例えば、“３文字目”に該当する候補文字は、第４候補以降には、存在しないことを示している。また、“４文字目”および“５文字目”に該当する候補文字は、ともに第３候補以降には、存在しないことを示している。

このように明らかに入力として有り得ない文字を候補から除外することで、以降の処理で不要なステップが発生するのを防止することができる。
図１６は、名称特定処理の流れを示す第２の模式図である。以下、図１６に示す処理をステップ番号に沿って説明する。なお、図１６に示す処理は、図１５に示すステップＳＴ２の後に実行される。

［ステップＳＴ３］候補名称生成部１８０は、候補文字リスト３０２に含まれる文字を組み合わせて、候補名称リスト３０３を取得する。候補名称リスト３０３では、各候補文字の重み付け値の大きい文字の組み合わせが優先順位の高い候補となる。例えば、金融機関名用重み付けテーブル１３１において、“東”は、重み付け値が“５”であり、“束”は重み付け値が“４”である。このため、１文字目として識別された候補文字のうち、“束”よりも“東”を用いて生成された候補金融機関名の方が、優先順位が高くなる。２文字目以降の候補文字に関しても同様である。候補名称生成部１８０は、生成した候補金融機関名のうち、優先順位の高いもの（例えば、第１候補から第５候補）を名称特定部１９０に出力する。

このようにすると、名称特定部１９０における特定処理の負荷を軽減することができる。また、候補金融機関名の作成に利用する候補文字を、重み付け値による優先順位が高いものから利用することで候補の作成精度を向上することができる。

図１７は、名称特定処理の流れを示す第３の模式図である。以下、図１７に示す処理をステップ番号に沿って説明する。なお、図１７に示す処理は、図１６に示すステップＳＴ３の後に実行される。

［ステップＳＴ４］名称特定部１９０は、候補名称生成部１８０から取得する各候補金融機関名を、金融機関辞書記憶部１２０に記憶された金融機関名テーブル１２１の金融機関名と比較して一致率を算出し、候補名称リスト３０４を取得する。そして、候補名称リスト３０４に含まれる候補金融機関名のうち、一致率の最も高いものを金融機関名テーブル１２１から特定する。一致率の最も高い金融機関が１つであった場合、処理がステップＳＴ５ａに移される。また、一致率の最も高い金融機関が複数であった場合、処理がステップＳＴ５ｂに移される。

［ステップＳＴ５ａ］特定結果リスト３０５ａは、一致率の最も高い金融機関が１つであった場合、すなわち、金融機関名を一意に特定できた場合を示している。ここでは、第１候補であった“東京ＡＢＣ銀行”が金融機関名テーブル１２１に含まれる“東京ＡＢＣ銀行”と一致率１００％で一致し、他の候補がそれよりも低い一致率である場合である。この場合、名称特定部１９０は、“東京ＡＢＣ銀行”を帳票に記入された金融機関名として一意に特定する。そして、“東京ＡＢＣ銀行”の支店名として帳票に記入された“新宿西支店”を特定するために、再度、図１５〜１７のステップＳＴ１〜ステップＳＴ４迄の処理が実行される。

［ステップＳＴ５ｂ］特定結果リスト３０５ｂは、一致率の最も高い金融機関が２つであった場合、すなわち、金融機関名を一意に特定できなかった場合を示している。名称特定部１９０は、例えば、第１候補であった“東京ＡＢＣ銀行”が金融機関名テーブル１２１に含まれる“東京ＡＢＣ銀行”と一致率１００％であると判定する。また、名称特定部１９０は、例えば、第５候補であった“東西ＡＢＣ銀行”が金融機関名テーブル１２１に含まれる“東西ＡＢＣ銀行”と一致率１００％であると判定する。この場合、名称特定部１９０の特定結果は、一意に定まらず、“東京ＡＢＣ銀行”および“東西ＡＢＣ銀行”となる。この場合、２つの金融機関名のうちのいずれかを更に特定するために、支店名の特定結果を用いる。

なお、上記の説明では、一致率が同じとなった金融機関名が複数存在した場合にステップＳＴ５ｂのように判定しているが、他に例えば、算出された一致率が所定の範囲内（例えば、９０％〜１００％）となったすべての金融機関名を候補として、次に示すステップＳＴ６のような処理を行うようにしてもよい。このとき、一致率の判定範囲を、算出された一致率の最大値を基準とした範囲（例えば、所定の割合の範囲、あるいは所定の数値範囲）としてもよい。また、別の例としては、算出された一致率が大きい順に所定数の金融機関名を抽出して候補としてもよい。

図１８は、名称特定処理の流れを示す第４の模式図である。以下、図１８に示す処理をステップ番号に沿って説明する。なお、図１８に示す処理は、図１７に示したステップＳＴ５ｂの後に実行される。

［ステップＳＴ６］名称特定部１９０は、候補名称生成部１８０から“東京ＡＢＣ銀行”および“東西ＡＢＣ銀行”の候補支店名を取得する。次に、名称特定部１９０は、“東京ＡＢＣ銀行”の各候補支店名について、支店名テーブル１２２ａの支店名と比較する。そして、各候補に対する文字の一致率を算出し、候補名称リスト３０６ａを取得する。更に、名称特定部１９０は、“東西ＡＢＣ銀行”の各候補支店名について、“東西ＡＢＣ銀行”の支店名テーブルに含まれる支店名と比較する。そして、各候補に対する文字の一致率を算出し、候補名称リスト３０６ｂを取得する。

そして、名称特定部１９０は、候補名称リスト３０６ａ，３０６ｂに基づいて、最も一致率の高い候補支店名を特定する。候補名称リスト３０６ａでは、“東京ＡＢＣ銀行”の支店名“新宿西支店”が、支店名テーブル１２２ａに含まれる“新宿西支店”と一致率１００％である場合を示している。この一致率は、候補名称リスト３０６ａ，３０６ｂに含まれる候補支店名の中で最も大きい。

［ステップＳＴ７］名称特定部１９０は、帳票に記入された支店名を“新宿西支店”と特定すると同時に、帳票に記入された金融機関名を“東京ＡＢＣ銀行”と特定し、特定結果３０７を取得する。

なお、候補支店名に関して最も高い一致率となる支店名が、“東京ＡＢＣ銀行”と“東西ＡＢＣ銀行”との双方に存在する場合も考えられる。例えば、上記ステップＳＴ６において、“新宿西支店”という名称の支店が双方の金融機関に存在する場合である。この場合、双方に一致率１００％となる支店名が存在することになる。この場合には、例えば、図１６の候補名称リスト３０３において、優先順位の高い候補金融機関名として生成された方を採用する。すなわち、第１候補である“東京ＡＢＣ銀行”を採用する。このようにすることで、確からしさにおいて優位な名称を優先的に選択することができ、特定精度を向上することができる。

本実施の形態の説明では、金融機関の業務を想定した例を挙げて説明したが、特定対象とする文字列は、銀行名や支店名に限らない。例えば、紙面等に記入された住所の特定に用いることもできる。そして、２段階で特定する方法は、県名および市町村名の対応等、階層的に管理される情報を特定する場合に適用することができる。

以上説明したように、予め金融機関辞書に基づいて各文字に重み付けを付与しておくことで、文字の特定精度を向上することができる。また、優先順位の高い順に候補文字列の一致率判定処理等を行うことにより、文字列を短時間に特定できるようになる。更に、優先順位の低い候補文字列の一致率判定を省略することができるため、認識処理の負荷を低減することができる。すなわち、低負荷の処理で文字列を精度良く認識することが可能となる。

なお、図１や図３に示した処理機能の少なくとも一部は、コンピュータによって実現することができる。その場合には、これらの処理機能の処理内容を記述したプログラムが提供される。そして、そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリなどがある。

プログラムを流通させる場合には、例えば、そのプログラムが記録された光ディスクなどの可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、そのプログラムを、サーバコンピュータからネットワークを介して他のコンピュータに転送することもできる。

プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラムまたはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、そのプログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送されるごとに、逐次、受け取ったプログラムに従った処理を実行することもできる。

以上、本発明の文字認識プログラム、文字認識装置および文字認識方法を図示の実施の形態に基づいて説明したが、これらに限定されるものではなく、各部の構成は同様の機能を有する任意の構成のものに置換することができる。また、他の任意の構成物や工程が付加されてもよい。また、本発明は前述した実施の形態のうちの任意の２以上の構成（特徴）を組み合わせたものであってもよい。

文字認識システムの概要を示す図である。本実施の形態のコンピュータのハードウェア構成を示す図である。本実施の形態のコンピュータの機能を示すブロック図である。文字コード記憶部に記憶されるテーブルを示す図である。文字コード対応テーブルのデータ構造例を示す図である。金融機関辞書記憶部に記憶されるテーブルを示す図である。金融機関名テーブルのデータ構造例を示す図である。支店名テーブルのデータ構造例を示す図である。重み付け情報記憶部に記憶されるテーブルを示す図である。金融機関名用重み付けテーブルのデータ構造例を示す図である。支店名用重み付けテーブルのデータ構造例を示す図である。金融機関名に対する重み付け処理の手順を示すフローチャートである。金融機関名・支店名の特定処理の手順を示すフローチャートである。帳票の記入例を示す図である。名称特定処理の流れを示す第１の模式図である。名称特定処理の流れを示す第２の模式図である。名称特定処理の流れを示す第３の模式図である。名称特定処理の流れを示す第４の模式図である。

符号の説明

１コンピュータ
１ａ単語登録情報記憶手段
１ｂ重み付け情報記憶手段
１ｃ画像情報入力手段
１ｄ文字推定手段
１ｅ候補文字列生成手段
１ｆ文字列特定手段
２画像情報取込装置

Claims

画像情報に含まれる文字列を認識する文字認識プログラムにおいて、
コンピュータを、
前記画像情報を基に前記文字列の各文字を推定し、その推定結果の候補としての１つ以上の候補文字を前記文字列内の各文字について出力する文字推定手段、
複数の単語が登録された単語登録情報に含まれる文字の出現回数を文字ごとに対応付けた重み付け情報に基づき、前記文字推定手段が出力した前記文字列内の各文字に対応する前記候補文字を前記出現回数が多い順に１つずつ抽出して組み合わせることで、前記文字列の候補としての１つ以上の候補文字列を順次生成する候補文字列生成手段、
前記候補文字列をその生成順に前記単語登録情報内の単語と照合し、その照合結果から前記文字列に対応する単語を特定する文字列特定手段、
として機能させることを特徴とする文字認識プログラム。
前記候補文字列生成手段は、前記文字推定手段が出力した前記候補文字のうち、前記単語登録情報に含まれない文字を除外して、前記候補文字列を生成することを特徴とする請求項１記載の文字認識プログラム。
前記文字列特定手段は、前記候補文字列と前記単語登録情報内の単語との文字の一致率に基づいて、前記文字列に対応する単語を特定することを特徴とする請求項１または２に記載の文字認識プログラム。
前記コンピュータを、更に、
前記単語登録情報に含まれる文字の出現回数を算出して前記重み付け情報を生成する重み付け処理手段、
として機能させることを特徴とする請求項１乃至３のいずれか１項記載の文字認識プログラム。
画像情報に含まれる第１の文字列と第２の文字列とを認識する文字認識プログラムにおいて、
コンピュータを、
前記画像情報を基に前記第１の文字列および前記第２の文字列の各文字を推定し、その推定結果の候補として、前記第１の文字列の各文字に対応する第１の候補文字と、前記第２の文字列の各文字に対応する第２の候補文字とを、それぞれ１つ以上出力する文字推定手段、
複数の単語が登録された第１の単語登録情報に含まれる文字の出現回数を文字ごとに対応付けた第１の重み付け情報に基づき、前記文字推定手段が出力した前記第１の文字列内の各文字に対応する前記第１の候補文字を前記第１の単語登録情報における出現回数が多い順に１つずつ抽出して組み合わせることで、前記第１の文字列の候補としての１つ以上の第１の候補文字列を順次生成する第１の候補文字列生成手段、
前記第１の候補文字列をその生成順に前記第１の単語登録情報内の単語と照合し、その照合結果から前記第１の文字列と一致すると推定される単語を示す第１の候補単語を複数選択して出力する第１の文字列特定手段、
複数の単語がそれぞれ登録された複数の第２の単語登録情報の中から、前記第１の候補単語から特定される前記第２の単語登録情報を前記第１の候補単語ごとに選択し、選択した前記第２の単語登録情報のそれぞれに含まれる文字の出現回数を文字ごとに対応付けた複数の第２の重み付け情報に基づき、前記文字推定手段が出力した前記第２の文字列内の各文字に対応する前記第２の候補文字を前記第２の単語登録情報における出現回数が多い順に１つずつ組み合わせることで、前記第２の文字列の候補としての１つ以上の第２の候補文字列を前記第１の候補単語ごとにそれぞれ順に生成する第２の候補文字列生成手段、
前記第２の候補文字列をその生成順に対応する前記第２の単語登録情報内の単語と照合し、その照合結果から前記第２の文字列と一致すると推定される単語を示す第２の候補単語を、いずれかの前記第２の単語登録情報から選択して出力するとともに、前記第２の候補単語に対応する前記第１の候補単語を、前記第１の文字列と一致する単語として確定する第２の文字列特定手段、
として機能させることを特徴とする文字認識プログラム。
前記第２の文字列特定手段は、前記第２の候補文字列と照合されたすべての単語の中で、照合対象の前記第２の候補文字列との一致率が最も高かった単語を、前記第２の候補単語として選択することを特徴とする請求項５記載の文字認識プログラム。
前記第１の文字列特定手段は、前記第１の候補文字列と前記第１の単語登録情報内の単語との一致率に基づいて、前記第１の文字列と一致すると推定される単語を１つに確定できるか否かを判定し、
１つに確定できなかった場合には、複数の前記第１の候補単語を選択して前記第２の文字列特定手段に出力し、
１つに確定できた場合には、確定した単語を唯一の前記第１の候補単語として前記第２の文字列特定手段に出力して、当該第１の候補単語から特定される１つの前記第２の重み付け情報に基づいて前記第２の候補文字列を生成させ、生成された前記第２の候補文字列を用いて前記第２の文字列特定手段に照合処理を実行させる、
ことを特徴とする請求項５または６に記載の文字認識プログラム。
前記第１の文字列特定手段は、算出された前記一致率のうちの最大値から所定の割合の範囲または所定の数値の範囲に複数の算出値が存在するか、または１つの算出値のみ存在するかによって、前記第１の文字列と一致すると推定される単語を１つに確定できるか否かを判定することを特徴とする請求項７記載の文字認識プログラム。
前記コンピュータを、更に、
前記第１の単語登録情報に含まれる文字の出現回数を算出して前記第１の重み付け情報を生成し、複数の前記第２の単語登録情報のそれぞれに含まれる文字の出現回数を算出して前記第２の単語登録情報ごとに対応付けた複数の前記第２の重み付け情報を生成する重み付け処理手段、
として機能させることを特徴とする請求項５乃至８のいずれか１項記載の文字認識プログラム。
前記第１の文字列は、金融機関の名称であり、
前記第２の文字列は、前記金融機関の支店の名称である、
ことを特徴とする請求項５乃至９のいずれか１項記載の文字認識プログラム。
画像情報に含まれる文字列を認識する文字認識装置において、
前記画像情報を基に前記文字列の各文字を推定し、その推定結果の候補としての１つ以上の候補文字を前記文字列内の各文字について出力する文字推定手段と、
複数の単語が登録された単語登録情報に含まれる文字の出現回数を文字ごとに対応付けた重み付け情報に基づき、前記文字推定手段が出力した前記文字列内の各文字に対応する前記候補文字を前記出現回数が多い順に１つずつ抽出して組み合わせることで、前記文字列の候補としての１つ以上の候補文字列を順次生成する候補文字列生成手段と、
前記候補文字列をその生成順に前記単語登録情報内の単語と照合し、その照合結果から前記文字列に対応する単語を特定する文字列特定手段と、
を有することを特徴とする文字認識装置。
前記候補文字列生成手段は、前記文字推定手段が出力した前記候補文字のうち、前記単語登録情報に含まれない文字を除外して、前記候補文字列を生成することを特徴とする請求項１１記載の文字認識装置。
前記文字列特定手段は、前記候補文字列と前記単語登録情報内の単語との文字の一致率に基づいて、前記文字列に対応する単語を特定することを特徴とする請求項１１または１２に記載の文字認識装置。
前記単語登録情報に含まれる文字の出現回数を算出して前記重み付け情報を生成する重み付け処理手段を更に有することを特徴とする請求項１１乃至１３のいずれか１項記載の文字認識装置。
画像情報に含まれる文字列を認識する文字認識装置の文字認識方法において、
文字推定手段が、前記画像情報を基に前記文字列の各文字を推定し、その推定結果の候補としての１つ以上の候補文字を前記文字列内の各文字について出力し、
候補文字列生成手段が、複数の単語が登録された単語登録情報に含まれる文字の出現回数を文字ごとに対応付けた重み付け情報に基づき、前記文字推定手段が出力した前記文字列内の各文字に対応する前記候補文字を前記出現回数が多い順に１つずつ抽出して組み合わせることで、前記文字列の候補としての１つ以上の候補文字列を順次生成し、
文字列特定手段が、前記候補文字列をその生成順に前記単語登録情報内の単語と照合し、その照合結果から前記文字列に対応する単語を特定する、
ことを特徴とする文字認識方法。