JP4347675B2 - 帳票ocrプログラム、方法及び装置 - Google Patents

帳票ocrプログラム、方法及び装置 Download PDF

Info

Publication number
JP4347675B2
JP4347675B2 JP2003407836A JP2003407836A JP4347675B2 JP 4347675 B2 JP4347675 B2 JP 4347675B2 JP 2003407836 A JP2003407836 A JP 2003407836A JP 2003407836 A JP2003407836 A JP 2003407836A JP 4347675 B2 JP4347675 B2 JP 4347675B2
Authority
JP
Japan
Prior art keywords
item name
item
frame
ocr
recognized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003407836A
Other languages
English (en)
Other versions
JP2005165978A (ja
Inventor
雅健 栗原
正博 上野
昭夫 安達
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Corp
Original Assignee
Fujifilm Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Corp filed Critical Fujifilm Corp
Priority to JP2003407836A priority Critical patent/JP4347675B2/ja
Publication of JP2005165978A publication Critical patent/JP2005165978A/ja
Application granted granted Critical
Publication of JP4347675B2 publication Critical patent/JP4347675B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

本発明は、帳票などの文書を光学的にイメージデータとして読み取り、読み取ったイメージデータから文字認識を行う帳票OCRプログラム、方法及び装置に関するものである。
伝票や給与報告書などの帳票を、光学的にイメージデータとして読み取り、読み取ったイメージデータから帳票に記載された文字を認識するOCR(Optical Characterize Recognition)装置(例えば、下記特許文献1参照)が知られている。ここで、文字には、数字や記号も含まれる。帳票には、氏名,受給者番号,給与所得の額などの複数の項目に関して、それぞれの項目の個別具体的な文字が記入される記入欄が設けられており、この記入欄の近傍には、それぞれの項目の名称(項目名)が予めプリント(プレプリント)されている。記入欄や項目名は、それぞれ罫線によって構成された枠によって区画されて配列されている。OCR装置によって最終的に抽出したい情報は、記入欄内に記入された文字であり、OCR装置においては、この記入欄を特定しその欄内の文字を精度良く読み取ることが主要な課題となっている。
特許文献1記載のOCR装置は、予め帳票の種類毎に、前記項目名と前記記入欄との相対的な位置関係を示す論理レイアウト情報を用意しておき、帳票種別コードによって所望の帳票に対応する論理レイアウト情報を選択し、選択された論理レイアウト情報を参照しながら記入欄内の文字を認識する。論理レイアウト情報は、帳票上の項目名及び記入欄のレイアウトをテキストデータで表現したものであり、項目名と記入欄との相対的な位置関係は、各項目名を取り囲む項目名枠と記入欄とを表すテキストの記述順序によって示される。
例えば、帳票上、項目名「氏名」の右隣に記入欄がある場合には、ファイルには、”項目名「氏名」&記入欄”というように、氏名の項目名枠の右隣に&記号を挟んで記述される。この記述順序により項目名枠の右には記入欄があることが示される。また、項目名枠の下に記入欄がある場合には、1行目に”項目名「氏名」”を記述し、改行して項目名「氏名」の下に”記入欄”と記述することで、項目名枠の下に記入欄があることが示される。論理レイアウト情報には、こうした情報が帳票の全項目分収録される。
前記OCR装置は、記入欄の特定に先立って、項目名枠を特定する。この装置では、帳票の一番左上の枠は項目名枠であることを前提としているので、まず、帳票の一番左上の枠を認識して、その枠が論理レイアウト情報の先頭に記述されている項目名枠であると特定する。このように、基本的には枠の位置のみでそれが所望の項目名枠を特定するが、より枠の特定を確実にするために、その枠内の文字を認識し、認識された文字と、予め定義された項目名とを照合している。この文字照合で一致が得られれば、当該枠が所望の項目名枠であることが確認される。他方、不一致の場合には、当該枠が所望の項目名枠ではないことになる。
さらに、前記OCR装置では、不一致の場合には、最初に認識した枠に隣接する枠内の文字との照合が行われる。これにより、枠の位置がズレていたような場合でも、所望の項目名枠を特定できるようにしている。そして、項目名枠を特定した後、論理レイアウト情報に基づいて記入欄の位置を特定し、その欄内の文字認識を行う。こうした手順を繰り返すことで、全項目分の記入欄の文字認識が行われる。
特開平10−207981号公報
しかしながら、上記OCR装置では、論理レイアウト情報に基づいて項目名枠を特定しているので、ある項目名枠の特定が不能である場合には、それ以降の項目名枠の特定も不能になってしまう。極端な例で言えば、最初に認識した枠の特定が不能な場合には、全項目の特定が不可能となってしまう。項目名枠が特定ができないと、記入欄も特定できないため、記入欄の認識率は低下し、同時に文字認識率も低下することになる。OCR装置で文字認識が不能な場合には、オペレータが帳票を読み取りマニュアルで入力作業を行わなければならない。こうした作業は、多大なコスト負担増を招くため、少しでも軽減したいという強い要望がある。
本発明は、帳票の記入欄の認識率が高い帳票OCRプログラム、方法及び装置を提供することを目的とする。
本発明の帳票OCRプログラムは、複数の項目に関して、その記入欄と予めプリントされた項目名とが配列され、前記記入欄と項目名とがそれぞれ罫線によって区画された帳票を読み取った帳票イメージから、その記入欄内の文字を認識する帳票OCR処理をコンピュータに実行させる帳票OCRプログラムにおいて、予め項目名を定義した項目定義データから所望の第1項目名を読み出し、読み出された第1項目名と、前記帳票イメージから認識した認識文字とを照合することにより、前記第1項目名を取り囲む前記第1項目名枠を特定する項目名枠特定処理ステップと、この後、特定された項目名枠からそれに対応する記入欄の位置を特定する記入欄特定処理ステップとからなり、前記項目名枠特定処理ステップは、前記第1項目名と一致する認識文字が無い場合に、予め前記項目定義データとして定義された前記第1項目名の近傍の項目名との相対位置情報を参照して、前記第1項目名の近傍の項目名である第2項目名と一致する認識文字を調べることにより第2項目名の第2項目名枠を特定し、前記相対位置情報に基づいて、特定された第2項目名枠の位置から前記第1項目名枠を推定するサブステップを含むことを特徴とする。
前記第1項目名の推定に使用される前記第2項目名の範囲は、帳票の全面を分割した複数のエリアのうち特定のエリアに含まれる項目名に限定されることが好ましい。
前記各エリアは、帳票の筆記方向に沿って分割されることが好ましい。また、前記エリアは、各エリアに含まれる項目名によって論理的に定義されることが好ましい。
また、本発明の帳票OCR方法は、複数の項目に関して、その記入欄と予めプリントされた項目名とが配列され、前記記入欄と項目名とがそれぞれ罫線によって区画された帳票を読み取った帳票イメージから、その記入欄内の文字を認識する帳票OCR方法において、予め項目名を定義した項目定義データから所望の第1項目名を読み出し、読み出された第1項目名と、前記帳票イメージから認識した認識文字とを照合することにより、前記第1項目名を取り囲む前記第1項目名枠を特定する項目名枠特定処理ステップと、この後、特定された項目名枠からそれに対応する記入欄の位置を特定する記入欄特定処理ステップとからなり、前記項目名枠特定処理ステップは、前記第1項目名と一致する認識文字が無い場合に、予め前記項目定義データとして定義された前記第1項目名の近傍の項目名との相対位置情報を参照して、前記第1項目名の近傍の項目名である第2項目名と一致する認識文字を調べることにより第2項目名の第2項目名枠を特定し、前記相対位置情報に基づいて、特定された第2項目名枠の位置から前記第1項目名枠を推定するサブステップを含むことを特徴とする。
前記第1項目名の推定に使用される前記第2項目名の範囲は、帳票の全面を分割した複数のエリアのうち特定のエリアに含まれる項目名に限定されることが好ましい。
前記各エリアは、帳票の筆記方向に沿って分割されることが好ましい。また、前記エリアは、各エリアに含まれる項目名によって論理的に定義されることが好ましい。
本発明の帳票OCR装置は、複数の項目に関して、その記入欄と予めプリントされた項目名とが配列され、前記記入欄と項目名とがそれぞれ罫線によって区画された帳票を読み取った帳票イメージから、その記入欄内の文字を認識する帳票OCR装置において、予め項目名を定義した項目定義データから所望の第1項目名を読み出し、読み出された第1項目名と、前記帳票イメージから認識した認識文字とを照合することにより、前記第1項目名を取り囲む前記第1項目名枠を特定する項目名枠特定処理部と、前記項目名枠特定処理部によって特定された項目名枠からそれに対応する記入欄の位置を特定する記入欄特定処理部とからなり、前記項目名枠特定処理部は、前記第1項目名と一致する認識文字が無い場合に、予め前記項目定義データとして定義された前記第1項目名の近傍の項目名との相対位置情報を参照して、前記第1項目名の近傍の項目名である第2項目名と一致する認識文字を調べることにより第2項目名の第2項目名枠を特定し、前記相対位置情報に基づいて、特定された第2項目名枠の位置から前記第1項目名枠を推定することを特徴とする。
前記第1項目名の推定に使用される前記第2項目名の範囲は、帳票の全面を分割した複数のエリアのうち特定のエリアに含まれる項目名に限定されることが好ましい。
前記各エリアは、帳票の筆記方向に沿って分割されることが好ましい。また、前記エリアは、各エリアに含まれる項目名によって論理的に定義されることが好ましい。
本発明のOCR装置は、複数の項目に関して、その記入欄と予めプリントされた項目名とが配列され、前記記入欄と項目名とがそれぞれ罫線によって区画された帳票を読み取った帳票イメージから、その記入欄内の文字を認識する帳票OCR方法において、予め項目名を定義した項目定義データから所望の第1項目名を読み出し、読み出された第1項目名と、前記帳票イメージから認識した認識文字とを照合することにより、前記第1項目名を取り囲む前記第1項目名枠を特定する項目名枠特定処理ステップと、この後、特定された項目名枠からそれに対応する記入欄の位置を特定する記入欄特定処理ステップとからなり、前記項目名枠特定処理ステップは、前記第1項目名と一致する認識文字が無い場合に、予め前記項目定義データとして定義された前記第1項目名の近傍の項目名との相対位置情報を参照して、前記第1項目名の近傍の項目名である第2項目名と一致する認識文字を調べることにより第2項目名の第2項目名枠を特定し、前記相対位置情報に基づいて、特定された第2項目名枠の位置から前記第1項目名枠を推定するサブステップを含むようにしたから、帳票の記入欄の認識率を向上させることができる。
図1に示す帳票OCRシステム10は、メインユニット11,イメージスキャナ12,イメージデータサーバ13とからなり、これらは、例えば、LAN14などの通信ネットワーク14によって接続されている。イメージスキャナ12の給紙トレイ12aには、例えば、数百枚という単位で給与報告書などの帳票16がセットされる。イメージスキャナ12は、これらの帳票16をCCDイメージセンサでスキャンして、1枚の帳票に対して1つの帳票イメージデータ35(図2参照)を出力する。帳票イメージデータ35は、画素データの集合であるビットマップデータとして生成される。イメージデータサーバ13は、HDD(ハードディスクドライブ)などのデータストレージデバイスを備えており、イメージスキャナ12から出力された数千枚分の帳票イメージデータを蓄積する。
メインユニット11は、イメージデータサーバ13にアクセスして、帳票イメージデータ35を1つずつ読み取り、読み取った帳票イメージデータ35に対してOCR処理を施す。メインユニット11が認識した文字のデータは、例えば、課税計算システム等に引き渡されて処理される。
メインユニット11は、例えば、パーソナルコンピュータやワークステーションをベースにして、これに帳票OCRプログラム28をインストールしたものであり、CPU21,RAM22,操作部24,ディスプレイ26,ハードディスクドライブ(HDD)27からなる。これらメインユニット11の各部は、データバス23によって接続されている。
CPU21は、オペレーティングシステムを実行してメインユニット11の各部を制御するとともに、帳票OCRプログラム28を実行する。RAM22は、CPU21がプログラムを実行する際に使用される作業用メモリである。帳票OCRプログラム28が実行される際には、RAM22に帳票OCRプログラム28や定義データなどがロードされる。操作部24は、キーボードやマウスなどの入力デバイスからなり、CPU21に対してコマンドを入力したり、処理条件の入力を行う。ディスプレイ26には、帳票OCRプログラム28の操作画面が表示される。HDD27は、データストレージデバイスであり、オペレーティングシステム,帳票OCRプログラム28の他、後述する各種の定義データ29,OCR処理で参照する辞書データなどを記憶する。
図2は、帳票16の説明図である。本例においては、給与所得報告書を帳票16の具体例として説明する。帳票16は、外枠31内に、「支払を受ける者」,「住所」,「氏名」,「受給者番号」,「フリガナ」などといった項目名がプレプリントされており、各項目名の近傍には、記入欄が設けられている。各項目名及び記入欄は、罫線によって区画されている。例えば、「受給者番号」や「支払金額」という項目名は、それぞれ枠32a,33aによって区画されており、「受給者番号」の項目名枠32aの右隣に隣接する枠32bは、受給者番号そのものが記入される記入欄を構成する記入枠であり、「支払金額」の項目名枠33aの下に隣接する記入欄も枠33bによって区画されている。
図3は、帳票OCRプログラム28の帳票OCR処理手順の全体を示すフローチャートである。帳票OCRプログラム28の処理ステップは、帳票イメージ取り込み処理,全面OCR処理,記入欄特定処理,部分OCR処理からなる。記入欄特定処理は、項目名枠特定処理と再OCRエリア設定処理からなる。
帳票イメージ取り込み処理は、イメージデータサーバ13から、帳票イメージデータ35を1帳票分ずつ読み出す。この帳票イメージデータ35に対して全面OCR処理が実行される。
全面OCR処理は、帳票16の全面に対してOCR処理を実行するとともに、外枠31内に存在するすべての項目名枠と記入枠とを認識するとともに、各項目の項目名や記入欄内の文字列を認識する。認識された枠は、座標情報で表現されるベクトルデータに変換され、文字は、テキストデータに変換される。
図4は、全面OCR処理の手順を示すフローチャートである。全面OCR処理は、外枠31の左上に設定された原点Oを起点として、左端から右端に向かって順に行われ、最終的に右下の頂点に至る。全画面OCR処理では、1つの枠を検出すると、その枠情報,枠内の行情報,枠内の文字情報を認識する。
図5(A)に示すように、これら認識した情報は、枠毎に1つの認識情報レコードとしてまとめられ、当該認識情報レコードには、枠番号として、認識した順序でシーケンス番号が付与される。行情報には、枠内の文字が記入される行数及びその行の座標情報が含まれる。枠内の文字情報には、各行毎の文字数や、認識した文字そのもの、各文字の座標情報が含まれる。そして、全面分の認識情報レコードをまとめて、全面OCR結果ファイル36として出力する。出力された全面OCR結果ファイル36は、RAM22や、HDD27に設定されたワーク領域に一時的に記憶される。
図5(B)は、全面OCR結果ファイル36の内容のより具体的な説明図である。帳票16において、一番左上の枠は最初に認識されるので、枠番号として「1」が付与される。その枠には、「支払を受ける者」という文字がプレプリントされており、このプレプリントされた文字を認識した文字情報が、正確に認識されると「支払を受ける者」という認識文字となる。文字認識率は100%ではないので、正確に認識できない場合もある。その場合には、誤認識した文字情報が、そのまま認識文字となる。また、この枠内の行数は、1行目が「支払」,2行目が「を受け」,3行目が「る者」というように、3行に渡っているので、枠内の行数は「3」となる。各文字の座標は、1文字毎にその左上と右下のそれぞれのXY座標が抽出される。
帳票OCRプログラム28は、辞書データ30(図1参照)を参照してOCR処理を実行する。この辞書データ30には、システム辞書とユーザー辞書とがある。システム辞書は、英数字,記号,かな,カタカナ,漢字など複数の文字の属性に関わらず汎用的に使用される辞書であるのに対して、ユーザー辞書は、文字の各属性に特化した専用の辞書であり、英数字用のユーザー辞書,記号用のユーザー辞書など、各属性毎に複数の種類がある。ユーザー辞書は、該当する属性の文字認識率は、システム辞書に比較してはるかに高いが、他の属性の文字認識には使用できない。これらシステム辞書とユーザー辞書とは、HDD27に記憶されており、CPU21が帳票OCRプログラム27を実行する際に適宜使用される。全面OCR処理においては、異なる属性の項目が複数混在する全面がOCR対象エリアなので、システム辞書が選択される。
全面OCR処理が終了すると、項目名枠特定処理が実行される。項目名枠特定処理は、項目定義ファイル37に基づいて、全面OCR結果ファイル36内のすべての認識情報レコードのうち、項目名枠の認識情報レコードを特定する。
図6(A)に示すように、項目定義ファイル37は、帳票16に記載される項目名毎の複数の定義レコードからなり、各定義レコードには、項目名と、各項目名毎に再OCRが必要か否かを指定する再OCR指定情報と、各項目名とそれらに対応する記入欄との相対的な位置関係を示す記入欄の位置情報と、各項目名の近傍の項目名との相対位置情報とが含まれている。また、図示しないが、この項目定義ファイル37には、後述するように、再度OCR処理を実行するエリアの項目番号である再OCR項目番号が含まれている。
記入欄の位置情報は、各項目名のどの方向に隣接して記入欄が存在するかを示す情報である。この記入欄の位置情報は、数字で規定されており、それぞれの数字には、図6(B)に示すように、「1」は、「項目名の右に位置する枠が記入欄」、「2」は、「項目名の下に位置する枠が記入欄」というように、それぞれの意味が定義されている。例えば、支払金額の項目は、その項目名の下に記入欄が位置するので、記入欄の位置情報は、「2」と指定される。
近傍の項目名との相対位置情報は、具体的には、「受給者番号」という項目名の左には「氏名」という項目名があり、下には「フリガナ」という項目名があるという形で記述される。この近傍の項目名との相対位置情報は、後述するように、項目名枠特定処理において、ある項目名をキーに、それに対応する項目名枠を特定できなかった場合に使用される。
図7に示すフローチャートは、項目名枠特定処理の具体的な手順を示す。まず、項目定義ファイル37から項目名枠を特定すべき1つの項目名を読み出し、その項目名と、全面OCR結果ファイル36に含まれる認識文字とを照合することにより、前記項目名に対応する項目名枠の枠番号をサーチする。そして、認識文字と項目名とが一致した場合には、図8に示すように、全面OCR結果ファイル36からその枠番号を読み出し、これを項目定義ファイル37の対応する項目名のレコードに追加して、項目名枠特定データファイル38を生成する。
例えば、「受給者番号」の項目名枠を特定する場合には、項目定義ファイル37から、「受給者番号」を読み出し、この「受給者番号」をキーに、全面OCR結果データファイル36内の認識文字と照合を行うことにより、特定対象となる項目名枠の枠番号をサーチする。サーチできた場合、すなわち、全面OCR結果データファイル36内に「受給者番号」という文字列が存在した場合には、その認識文字に対応する枠番号を項目定義ファイル36の受給者番号のレコードに追加して、項目名枠特定データファイル38を作成する。
しかし、全面OCR処理において、文字列を誤認識していたり認識不能だった場合には、当然ながら全面OCR結果ファイル36内に「受給者番号」という文字列は存在しない。このように特定すべき項目名枠の枠番号をサーチできなかった場合には、特定すべき項目名の近傍に位置する項目名をキーにサーチ処理を実行する。例えば、「受給者番号」という文字列が存在しない場合には、項目定義データファイル37内の相対位置情報を参照して、「氏名」や「フリガナ」といった、「受給者番号」の近傍に位置する項目名を調べ、その項目名をキーにサーチ処理を実行する。そして、全面OCR結果データファイル36内に「氏名」という文字列が見つかった場合には、前記相対位置情報(「氏名」の右側に「受給者番号」が存在する)に基づいて、「受給者番号」の項目名枠の枠番号を推定する。この推定した枠番号を、検索対象となる項目名枠の枠番号として項目定義データに追加する。
このように、所望の項目名をキーにそれに対応する項目名枠の特定ができなかった場合に、所望の項目名の近傍に位置する項目名をキーに前記項目名枠を推定することにより、全面OCR処理において文字列を誤認識したり認識不能であった場合でも、所望の項目名枠を特定することが可能になる。
こうした近傍の項目名によるサーチは、全面OCR結果ファイル36の全データに渡って実行してもよい。例えば、「受給者番号」の項目名枠を特定する際に、まずはじめに、「受給者番号」をキーにサーチを行い、それでサーチが不能な場合には、その近傍にある「氏名」や「フリガナ」といった項目名がサーチキーとして使用され、それでも見つからない場合には、「氏名」や「フリガナ」の近傍の項目名をキーにサーチを行うというように、全データに渡ってサーチを実行することも可能である。しかし、こうすると、サーチ処理の負荷が増大して、サーチ時間も非常に大きくなる。
そこで、帳票OCRプログラム28では、推定処理の際のサーチ範囲を規定することで、サーチ範囲を限定している。図2に示すバンド(バンド1〜5)とは、それぞれサーチ範囲を示し、項目定義ファイル37(図6参照)にはそれぞれの項目がどのバンドに属するかを示すバンドNoが含まれている。バンドは、帳票16の筆記方向、すなわち本例においては帳票16は横書きなので、横方向に延びた帯状のエリアとして定義される。本例では、1番左上の「支払を受ける者」の項目の幅をバンド1とし、「種別」,「支払金額」,「給与所得控除後の金額」,「所得控除の額の合計額」,「源泉徴収額」の各項目が並ぶ幅をバンド2というようにバンドを定義している。このバンドの定義は、座標情報などの物理的な位置情報によってなされるのではなく、項目名によって論理的に定義される。すなわち、バンド1の定義は、バンド1の範囲を座標情報によって定義するのではなく、バンド1内に含まれる複数の項目名(氏名,フリガナなど)を記述することによって行われる。
このように、サーチ範囲を限定したことで、例えば、「種別」という項目名枠を特定する場合には、推定処理に使用されるサーチキーが、「支払金額」,「給与所得控除後の金額」,「所得控除の額の合計額」,「源泉徴収額」の4つの項目名に限定される。これにより、サーチ処理の負荷が軽減されサーチ時間が短くなる。
また、近傍の項目名をキーにサーチ処理を実行しても、所望の項目名枠を特定できない場合にはエラーとする。エラーの場合には、項目名枠特定データファイル38の枠番号欄は空白となる。こうした項目名枠特定処理によって、項目定義ファイル37の各項目名のレコードと、全面OCR結果ファイル36の各レコードとが対応付けられる。
項目名枠特定処理の後には、再OCRエリア設定処理が実行される。再OCRエリア設定処理は、項目名枠特定データファイル38と、再OCR項目定義ファイル39とに基づいて、再OCRすべきエリアを指定する再OCRエリアデータファイル41を出力する。
図9に示すように、再OCR項目定義ファイル39は、再度OCRすべき項目の記入欄に関する情報を、項目毎に定義したファイルである。再OCR項目は、例えば、「受給者番号」,「フリガナ」,「種別」,「支払金額」,「給与所得控除後の金額」,「所得控除の額の合計額」,「源泉徴収額」などである。これらの項目は、項目定義ファイル37において、再OCR指定がなされる。再OCR項目定義ファイル39は、各項目毎に、再OCR項目番号,項目名,属性とを含む情報が1レコードになっている。属性情報は、英字,数字,カナ,かな漢字など記入される項目の文字属性の情報である。再OCR処理をする際には、この属性情報に基づいて、属性に適合するユーザー辞書が選択される。
図10は、再OCRエリア設定処理の手順を示すフローチャートである。再OCRエリア設定処理では、まず、項目名枠特定データファイル38から、再OCR指定がなされている項目名枠のレコードを1つ読み出す。そして、当該項目名枠に対応する記入欄の位置情報に基づいて、全面OCR結果ファイル36内の各認識情報レコードの中から、記入欄の認識情報レコードを特定し、抽出する。
そして、再OCR項目定義ファイル39から該当する項目の属性情報を読み出し、その属性情報に基づいて、記入欄内の不要な認識文字の情報を除去する。例えば、図11に示すように、支払金額の記入欄46には、その欄内に、金額を示す文字列「5,600,000」の他、その上の行に、「内」,「円」といった文字列がプレプリントされている。全面OCR結果ファイル36の認識情報レコードには、記入欄46の枠情報とその枠内の行情報や文字情報がすべて格納されている。
再OCR処理をすべきエリアは、記入欄46内のうち、金額そのもの(「5,600,000」)が記述されたエリアのみでよい。その他の文字列は、認識不要であるばかりでなく、必要な文字列を認識する際のノイズになるおそれもある。このため、帳票OCRプログラム28では、再OCRエリア設定処理において、前記認識情報レコードから、こうした不要文字に関する情報を除去している。不要文字か否かの判断は、属性情報に基づいて行われる。例えば、支払金額の属性は数字であるので、文字列の中から数字以外のものが不要文字と判断される。不要文字が除去されると、認識情報レコードには、記入欄46の枠情報と、その欄内の金額の位置を示す文字座標46aとが残る。
こうして不要な認識文字情報が除去された認識情報レコードと、その記入欄の属性情報とを結合したデータが、再OCRエリアデータとして出力される。こうした処理が、再OCR処理を実行する全項目に対して行われ、全項目分のデータをまとめた再OCRエリアデータファイル41が生成される。
このように、項目枠特定処理と再OCRエリア設定処理とを行うことにより、再度OCRすべき記入欄の特定が行われる。
部分OCR処理は、再OCRエリアデータファイル41を参照して、帳票イメージの再OCR指定されたエリアに対して部分的にOCR処理を実行する。まず、再OCRエリアデータファイル41から、記入欄のエリア情報を1項目分読み出す。次に、読み出した項目の属性に対応するユーザー辞書を設定する。例えば、支払金額の記入欄の場合には、属性が数字であるので、数字用のユーザー辞書を設定する。そして、エリア情報の座標情報から、再OCRエリアを特定し、そのエリアのOCR処理を実行する。こうした処理を全項目分繰り返す。認識された文字列は、再OCR項目番号,項目名とともに、部分OCR結果ファイル42に出力される。このように、文字属性に応じたユーザー辞書を使用して部分OCR処理が行われるので、精度が高い文字認識を行うことができる。
以下、上記構成による作用について説明する。オペレータが、イメージスキャナ12に帳票16をセットして、読み取り指示を与えると、イメージスキャナ12が帳票16をイメージデータに変換し、そのイメージデータがイメージデータサーバ13に蓄積される。次に、オペレータがメインユニット11から、帳票OCR処理実行指示を与えると、帳票OCRプログラム28が起動する。帳票OCRプログラムは、イメージデータサーバ13から帳票イメージデータを1ファイルずつ取り込み、帳票OCR処理を実行する。
まず、全面OCR処理が実行されて、外枠31内の全項目分の項目名枠,記入枠及び枠内の文字列が認識され、これらの認識情報が枠毎に認識情報レコードとしてまとめられ、全面OCR結果ファイル36として出力される。この全面OCR処理により、帳票16の各項目の枠のレイアウトが認識される。
次に、この全面OCR結果ファイル36と、項目定義ファイル37とに基づいて、項目名枠特定処理が実行されて、項目名枠が特定される。この項目名枠特定処理においては、所望の項目名をキーに、対応する項目名枠が特定されるが、その項目名で特定ができない場合には、近傍の項目名をキーとして、所望の項目名枠が推定される。このため、全面OCR処理において、所望の項目名を誤認識していたり、認識不能であった場合でも、項目名枠の特定が可能になるので、記入欄の特定率が向上する。項目名枠特定処理の結果は、項目名枠特定データファイル38として出力される。
この前記項目名枠特定データファイル38と再OCR項目定義ファイル39とに基づいて、再OCRエリア設定処理が実行されて、再OCRエリア(再度OCRすべき記入欄)が特定される。この再OCRエリア設定処理によって、記入欄の位置及びその属性の特定,及び不要文字情報の除去が行われ、その結果情報として再OCRエリアデータファイル41が出力される。
部分OCR処理は、この再OCRエリアデータファイル41に基づいて、指定された記入欄に対して再度OCR処理を実行する。この部分OCR処理では、属性情報に基づいて、対象となる記入欄に適合したユーザー辞書が選択されるから、精度の高い文字認識が可能となる。
このように、帳票OCRプログラム28は、まず、全面OCR処理により、帳票16の各項目のレイアウトを認識した後、その結果情報と項目定義データに基づいて記入欄を特定している。このため、項目のレイアウトが異なる場合でも、予め帳票毎のレイアウト情報を準備することなく、必要な項目名を含む項目定義データを準備するだけで済むので、柔軟な対応が可能となり、認識精度の低下がなくなる。
上記実施形態では、帳票OCRシステムのメインユニットとして、汎用的なパーソナルコンピュータやワークステーションをベースに帳票OCRプログラムをインストールした形態の帳票OCR装置を使用し、各処理ステップのすべてをコンピュータがソフトウエアを実行することにより実現する例で説明しているが、もちろん、メインユニットとしては、各処理ステップのうち少なくとも一部を専用のハードウエアによって実行する処理部を備えた専用の帳票OCR装置を使用してもよい。
帳票OCRシステムの全体構成図である。 帳票の説明図である。 帳票OCR処理の全体の手順を示すフローチャートである。 全面OCR処理の手順を示すフローチャートである。 全面OCR結果ファイルの説明図である。 項目定義ファイルの説明図である。 項目名枠特定処理の手順を示すフローチャートである。 項目名枠特定処理の説明図である。 再OCRエリア設定処理の説明図である。 再OCRエリア設定処理の手順を示すフローチャートである。 不要文字除去処理の説明図である。 部分OCR処理の手順を示すフローチャートである。
符号の説明
10 帳票OCRシステム
11 メインユニット
16 帳票
21 CPU
22 RAM
27 HDD
35 帳票イメージデータ
36 全面OCR結果ファイル
37 項目定義ファイル
38 項目名枠特定データファイル
39 再OCR項目定義ファイル
41 再OCRエリアデータファイル
42 部分OCR結果ファイル

Claims (12)

  1. 複数の項目に関して、その記入欄と予めプリントされた項目名とが配列され、前記記入欄と項目名とがそれぞれ罫線によって区画された帳票を読み取った帳票イメージから、その記入欄内の文字を認識する帳票OCR処理をコンピュータに実行させる帳票OCRプログラムにおいて、
    予め項目名を定義した項目定義データから所望の第1項目名を読み出し、読み出された第1項目名と、前記帳票イメージから認識した認識文字とを照合することにより、前記第1項目名を取り囲む前記第1項目名枠を特定する項目名枠特定処理ステップと、
    この後、特定された項目名枠からそれに対応する記入欄の位置を特定する記入欄特定処理ステップとからなり、
    前記項目名枠特定処理ステップは、前記第1項目名と一致する認識文字が無い場合に、予め前記項目定義データとして定義された前記第1項目名の近傍の項目名との相対位置情報を参照して、前記第1項目名の近傍の項目名である第2項目名と一致する認識文字を調べることにより第2項目名の第2項目名枠を特定し、前記相対位置情報に基づいて、特定された第2項目名枠の位置から前記第1項目名枠を推定するサブステップを含むことを特徴とする帳票OCRプログラム。
  2. 前記第1項目名の推定に使用される前記第2項目名の範囲は、帳票の全面を分割した複数のエリアのうち特定のエリアに含まれる項目名に限定されることを特徴とする請求項1記載の帳票OCRプログラム。
  3. 前記各エリアは、帳票の筆記方向に沿って分割されることを特徴とする請求項2記載の帳票OCRプログラム。
  4. 前記エリアは、各エリアに含まれる項目名によって論理的に定義されることを特徴とする請求項2又は3記載の帳票OCRプログラム。
  5. 複数の項目に関して、その記入欄と予めプリントされた項目名とが配列され、前記記入欄と項目名とがそれぞれ罫線によって区画された帳票を読み取った帳票イメージから、その記入欄内の文字を認識する帳票OCR方法において、
    予め項目名を定義した項目定義データから所望の第1項目名を読み出し、読み出された第1項目名と、前記帳票イメージから認識した認識文字とを照合することにより、前記第1項目名を取り囲む前記第1項目名枠を特定する項目名枠特定処理ステップと、
    この後、特定された項目名枠からそれに対応する記入欄の位置を特定する記入欄特定処理ステップとからなり、
    前記項目名枠特定処理ステップは、前記第1項目名と一致する認識文字が無い場合に、予め前記項目定義データとして定義された前記第1項目名の近傍の項目名との相対位置情報を参照して、前記第1項目名の近傍の項目名である第2項目名と一致する認識文字を調べることにより第2項目名の第2項目名枠を特定し、前記相対位置情報に基づいて、特定された第2項目名枠の位置から前記第1項目名枠を推定するサブステップを含むことを特徴とする帳票OCR方法。
  6. 前記第1項目名の推定に使用される前記第2項目名の範囲は、帳票の全面を分割した複数のエリアのうち特定のエリアに含まれる項目名に限定されることを特徴とする請求項5記載の帳票OCR方法。
  7. 前記各エリアは、帳票の筆記方向に沿って分割されることを特徴とする請求項6記載の帳票OCR方法。
  8. 前記エリアは、各エリアに含まれる項目名によって論理的に定義されることを特徴とする請求項6又は7記載の帳票OCR方法。
  9. 複数の項目に関して、その記入欄と予めプリントされた項目名とが配列され、前記記入欄と項目名とがそれぞれ罫線によって区画された帳票を読み取った帳票イメージから、その記入欄内の文字を認識する帳票OCR装置において、
    予め項目名を定義した項目定義データから所望の第1項目名を読み出し、読み出された第1項目名と、前記帳票イメージから認識した認識文字とを照合することにより、前記第1項目名を取り囲む前記第1項目名枠を特定する項目名枠特定処理部と、
    前記項目名枠特定処理部によって特定された項目名枠からそれに対応する記入欄の位置を特定する記入欄特定処理部とからなり、
    前記項目名枠特定処理部は、前記第1項目名と一致する認識文字が無い場合に、予め前記項目定義データとして定義された前記第1項目名の近傍の項目名との相対位置情報を参照して、前記第1項目名の近傍の項目名である第2項目名と一致する認識文字を調べることにより第2項目名の第2項目名枠を特定し、前記相対位置情報に基づいて、特定された第2項目名枠の位置から前記第1項目名枠を推定することを特徴とする帳票OCR装置。
  10. 前記第1項目名の推定に使用される前記第2項目名の範囲は、帳票の全面を分割した複数のエリアのうち特定のエリアに含まれる項目名に限定されることを特徴とする請求項9記載の帳票OCR装置。
  11. 前記各エリアは、帳票の筆記方向に沿って分割されることを特徴とする請求項10記載の帳票OCR装置。
  12. 前記エリアは、各エリアに含まれる項目名によって論理的に定義されることを特徴とする請求項10又は11記載の帳票OCR装置。
JP2003407836A 2003-12-05 2003-12-05 帳票ocrプログラム、方法及び装置 Expired - Fee Related JP4347675B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003407836A JP4347675B2 (ja) 2003-12-05 2003-12-05 帳票ocrプログラム、方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003407836A JP4347675B2 (ja) 2003-12-05 2003-12-05 帳票ocrプログラム、方法及び装置

Publications (2)

Publication Number Publication Date
JP2005165978A JP2005165978A (ja) 2005-06-23
JP4347675B2 true JP4347675B2 (ja) 2009-10-21

Family

ID=34729760

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003407836A Expired - Fee Related JP4347675B2 (ja) 2003-12-05 2003-12-05 帳票ocrプログラム、方法及び装置

Country Status (1)

Country Link
JP (1) JP4347675B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4754889B2 (ja) * 2005-07-01 2011-08-24 株式会社日立エンジニアリング・アンド・サービス 文字列抽出方法および装置
JP5810568B2 (ja) * 2011-03-17 2015-11-11 富士通株式会社 情報処理装置、プログラム、およびデータの抽出方法
JP5003837B2 (ja) * 2011-08-26 2012-08-15 富士ゼロックス株式会社 画像処理装置及びプログラム
JP6247103B2 (ja) * 2014-01-16 2017-12-13 グローリー株式会社 帳票項目認識方法、帳票項目認識装置及び帳票項目認識プログラム
JP6303531B2 (ja) * 2014-01-22 2018-04-04 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP7452809B1 (ja) 2023-08-09 2024-03-19 ファーストアカウンティング株式会社 情報処理装置、情報処理方法及びプログラム

Also Published As

Publication number Publication date
JP2005165978A (ja) 2005-06-23

Similar Documents

Publication Publication Date Title
JP4347677B2 (ja) 帳票ocrプログラム、方法及び装置
US9613267B2 (en) Method and system of extracting label:value data from a document
US6782144B2 (en) Document scanner, system and method
US8467614B2 (en) Method for processing optical character recognition (OCR) data, wherein the output comprises visually impaired character images
US6600834B1 (en) Handwriting information processing system with character segmentation user interface
JP4996940B2 (ja) 帳票認識装置およびそのプログラム
KR100412317B1 (ko) 문자인식/수정방법및장치
US8208737B1 (en) Methods and systems for identifying captions in media material
US20120170829A1 (en) Check Boundary Detection by String Literal Analysis
CN102289667A (zh) 对经历光学字符识别(ocr)过程的文本文档中出现的错误的用户纠正
WO2007117334A2 (en) Document analysis system for integration of paper records into a searchable electronic database
JP2004139484A (ja) 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム
JP2003308480A (ja) オンライン手書き文字パターン認識編集装置及び方法並びに当該方法を実現するコンピュータ実行可能なプログラム
US11475688B2 (en) Information processing apparatus and information processing method for extracting information from document image
CN112084748A (zh) 一种文本比对方法
JP2008021068A (ja) 帳票認識装置及び帳票認識プログラム
JP4347675B2 (ja) 帳票ocrプログラム、方法及び装置
WO2007070010A1 (en) Improvements in electronic document analysis
JP2009093305A (ja) 帳票認識装置
JP4983464B2 (ja) 帳票画像処理装置及び帳票画像処理プログラム
JP2012181653A (ja) 採点方法、採点方法のプログラム及び採点システム
JPH08320914A (ja) 表認識方法および装置
JP5134383B2 (ja) Ocr装置、証跡管理装置及び証跡管理システム
JP3435374B2 (ja) 文字読取装置および文字認識方法
US7133556B1 (en) Character recognition device and method for detecting erroneously read characters, and computer readable medium to implement character recognition

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060413

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20061220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090128

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090323

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090422

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090608

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090708

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090716

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120724

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120724

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130724

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees