JP4347677B2 - Form OCR program, method and apparatus - Google Patents
Form OCR program, method and apparatus Download PDFInfo
- Publication number
- JP4347677B2 JP4347677B2 JP2003409481A JP2003409481A JP4347677B2 JP 4347677 B2 JP4347677 B2 JP 4347677B2 JP 2003409481 A JP2003409481 A JP 2003409481A JP 2003409481 A JP2003409481 A JP 2003409481A JP 4347677 B2 JP4347677 B2 JP 4347677B2
- Authority
- JP
- Japan
- Prior art keywords
- ocr
- item name
- entry field
- item
- entry
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Description
本発明は、帳票などの文書を光学的にイメージデータとして読み取り、読み取ったイメージデータから文字認識を行う帳票OCRプログラム、方法及び装置に関するものである。 The present invention relates to a form OCR program, method and apparatus for optically reading a document such as a form as image data and performing character recognition from the read image data.
伝票や給与報告書などの帳票を、光学的にイメージデータとして読み取り、読み取ったイメージデータから帳票に記載された文字を認識するOCR(Optical Characterize Recognition)装置(例えば、下記特許文献1参照)が知られている。ここで、文字には、数字や記号も含まれる。帳票には、氏名,受給者番号,給与所得の額などの複数の項目に関して、それぞれの項目の個別具体的な文字が記入される記入欄が設けられており、この記入欄の近傍には、それぞれの項目の名称(項目名)が予めプリント(プレプリント)されている。記入欄や項目名は、それぞれ罫線によって構成された枠によって区画されて配列されている。OCR装置によって最終的に抽出したい情報は、記入欄内に記入された文字であり、OCR装置においては、この記入欄を特定しその欄内の文字を精度良く読み取ることが主要な課題となっている。
An OCR (Optical Characterize Recognition) device that optically reads a form such as a slip or a salary report as image data and recognizes characters written on the form from the read image data (for example, see
特許文献1記載のOCR装置は、予め帳票の種類毎に、前記項目名と前記記入欄との相対的な位置関係を示す論理レイアウト情報を用意しておき、帳票種別コードによって所望の帳票に対応する論理レイアウト情報を選択し、選択された論理レイアウト情報を参照しながら記入欄内の文字を認識する。論理レイアウト情報は、帳票上の項目名及び記入欄のレイアウトをテキストデータで表現したものであり、項目名と記入欄との相対的な位置関係は、各項目名を取り囲む項目名枠と記入欄とを表すテキストの記述順序によって示される。
The OCR device described in
例えば、帳票上、項目名「氏名」の右隣に記入欄がある場合には、ファイルには、”項目名「氏名」&記入欄”というように、氏名の項目名枠の右隣に&記号を挟んで記述される。この記述順序により項目名枠の右には記入欄があることが示される。また、項目名枠の下に記入欄がある場合には、1行目に”項目名「氏名」”を記述し、改行して項目名「氏名」の下に”記入欄”と記述することで、項目名枠の下に記入欄があることが示される。論理レイアウト情報には、こうした情報が帳票の全項目分収録される。 For example, if there is an entry field to the right of the item name “Name” on the form, the file will have an entry field to the right of the item name box of “Name” “Name” & entry field ”. The description order indicates that there is an entry field to the right of the item name frame, and if there is an entry field below the item name frame, By describing the name “name” and then writing “entry column” under the item name “name” after a line break, it is indicated that there is an entry column below the item name frame. Such information is recorded in the logical layout information for all items of the form.
論理レイアウト情報は、絶対的な座標位置によって記入欄や項目名枠の位置を記述するものではなく、両者の相対的位置関係のみを記述したものである。このため、論理レイアウト情報を記入欄の特定に使用することにより、帳票をイメージデータ化する際の読み取り倍率を正確に合わせる必要もなく、帳票イメージデータの基準位置が基準座標位置からずれているといった場合でも、記入欄が特定不能になるということがなくなるので、記入欄の認識率が向上し、その結果文字認識率も向上する。 The logical layout information does not describe the position of the entry field or the item name frame by the absolute coordinate position, but describes only the relative positional relationship between the two. For this reason, by using the logical layout information for specifying the entry field, it is not necessary to accurately adjust the reading magnification when converting the form into image data, and the reference position of the form image data is deviated from the reference coordinate position. Even in this case, the entry column is not unspecified, so the recognition rate of the entry column is improved, and as a result, the character recognition rate is also improved.
しかしながら、例えば、給与支払報告書など、公的な機関によって記入項目が規定されている帳票でも、その帳票を作成するメーカーによって、記入欄や項目名のレイアウトは異なる。上記特許文献1記載のOCR装置では、項目のレイアウトが異なる場合には、認識精度が著しく低下してしまうという問題がある。もちろん、レイアウトが異なる帳票毎に論理レイアウト情報を予め作成し、これを登録しておけば、認識精度の低下を防止することはできる。しかし、レイアウトが異なる帳票の数は膨大であるため、すべての帳票の論理レイアウト情報を用意することは事実上不可能に近い。
However, even for a form whose entry items are regulated by a public institution such as a salary payment report, the layout of entry fields and item names differs depending on the manufacturer that creates the form. The OCR device described in
本発明は、項目のレイアウトが異なる帳票に対して柔軟に対応して認識精度の低下を防止することができる帳票OCRプログラム、方法及び装置を提供することを目的とする。 An object of the present invention is to provide a form OCR program, method, and apparatus that can flexibly cope with forms having different item layouts and prevent a reduction in recognition accuracy.
本発明の帳票OCRプログラムは、複数の項目に関して、その記入欄と予めプリントされた項目名とが配列され、前記記入欄と項目名とがそれぞれ罫線によって区画された帳票を読み取った帳票イメージから、前記記入欄内の文字を認識する帳票OCR処理をコンピュータに実行させる帳票OCRプログラムにおいて、前記帳票イメージの全面に対してOCR処理を実行し、前記記入欄を区画する記入枠の位置,前記項目名を取り囲む項目名枠の位置,及びこれらの枠内の文字列を認識するとともに、認識した情報を枠毎に1つのレコードとしてまとめる全面OCR処理ステップと、各項目名毎に再度OCR処理が必要か否かを予め定義した再OCR指定情報を参照して、再度OCR処理が必要な項目名に対応する前記レコードを読み出すとともに、各項目名毎に対応する記入欄との相対的な位置関係を予め定義した記入欄の位置情報を参照して、読み出した前記レコードに含まれる項目名枠の位置から再度OCR処理をすべき記入欄を特定する記入欄特定処理ステップと、予め定義された各項目の文字属性情報に基づいて、対象となる記入欄の属性に適合した辞書データを使用し、前記記入欄特定処理ステップで特定された記入欄に対して部分的にOCR処理を実行する部分OCR処理ステップとからなることを特徴とする。 In the form OCR program of the present invention, for a plurality of items, entry fields and pre-printed item names are arranged, and from the form image obtained by reading the form in which the entry field and the item names are partitioned by ruled lines, In a form OCR program that causes a computer to execute a form OCR process for recognizing characters in the entry field, the OCR process is performed on the entire surface of the form image, and the position of the entry frame that defines the entry field, the item name Recognize the position of the item name frame that surrounds and the character string in these frames, and collect the recognized information as one record for each frame, and whether OCR processing is required again for each item name When the record corresponding to the item name that needs OCR processing again is read with reference to the re-OCR designation information that defines whether or not In addition, the OCR process is performed again from the position of the item name frame included in the read record by referring to the position information of the entry field in which the relative positional relationship with the entry field corresponding to each item name is defined in advance. An entry field specifying process step for specifying an entry field to be used, and using the dictionary data suitable for the attribute of the entry field based on the character attribute information of each item defined in advance, the entry field specifying process step And a partial OCR processing step for partially executing the OCR processing on the entry field specified in (1).
また、本発明の帳票OCR方法は、複数の項目に関して、その記入欄と予めプリントされた項目名とが配列され、前記記入欄と項目名とがそれぞれ罫線によって区画された帳票を読み取った帳票イメージから、前記記入欄内の文字を認識する帳票OCR方法において、前記帳票イメージの全面に対してOCR処理を実行し、前記記入欄を区画する記入枠の位置,前記項目名を取り囲む項目名枠の位置,及びこれらの枠内の文字列を認識するとともに、認識した情報を枠毎に1つのレコードとしてまとめる全面OCR処理ステップと、各項目名毎に再度OCR処理が必要か否かを予め定義した再OCR指定情報を参照して、再度OCR処理が必要な項目名に対応する前記レコードを読み出すとともに、各項目名毎に対応する記入欄との相対的な位置関係を予め定義した記入欄の位置情報を参照して、読み出した前記レコードに含まれる項目名枠の位置から再度OCR処理をすべき記入欄を特定する記入欄特定処理ステップと、予め定義された各項目の文字属性情報に基づいて、対象となる記入欄の属性に適合した辞書データを使用し、前記記入欄特定処理ステップで特定された記入欄に対して部分的にOCR処理を実行する部分OCR処理ステップとからなることを特徴とする。 In the form OCR method of the present invention, a form image obtained by reading a form in which entry fields and pre-printed item names are arranged for a plurality of items, and the entry field and the item names are partitioned by ruled lines, respectively. In the form OCR method for recognizing characters in the entry field, OCR processing is performed on the entire surface of the form image, and the position of the entry frame that divides the entry field, the item name frame surrounding the item name, Recognize positions and character strings in these frames, and pre-define whether or not OCR processing is necessary again for each item name, and the entire OCR processing step for collecting the recognized information as one record for each frame With reference to the re-OCR designation information, the record corresponding to the item name that needs the OCR processing again is read out, and relative to the entry field corresponding to each item name While referring to the positional information of the entry fields that predefined location relationship, the entry column specifying process step of identifying the answer column should again OCR processing from the position of the item name frame included in the record read out, predefined Based on the character attribute information of each item, the dictionary data suitable for the attribute of the target entry field is used , and the OCR process is partially executed on the entry field specified in the entry field specifying process step. It consists of a partial OCR processing step.
また、本発明の帳票OCR装置は、複数の項目に関して、その記入欄と予めプリントされた項目名とが配列され、前記記入欄と項目名とがそれぞれ罫線によって区画された帳票を読み取った帳票イメージから、前記記入欄内の文字を認識する帳票OCR装置において、前記帳票イメージの全面に対してOCR処理を実行し、前記記入欄を区画する記入枠の位置,前記項目名を取り囲む項目名枠の位置,及びこれらの枠内の文字列を認識するとともに、認識した情報を枠毎に1つのレコードとしてまとめる全面OCR処理部と、各項目名毎に再度OCR処理が必要か否かを予め定義した再OCR指定情報を参照して、再度OCR処理が必要な項目名に対応する前記レコードを読み出すとともに、各項目名毎に対応する記入欄との相対的な位置関係を予め定義した記入欄の位置情報を参照して、読み出した前記レコードに含まれる項目名枠の位置から再度OCR処理をすべき記入欄を特定する記入欄特定処理部と、予め定義された各項目の文字属性情報に基づいて、対象となる記入欄の属性に適合した辞書データを使用し、前記記入欄特定処理部で特定された記入欄に対して部分的にOCR処理を実行する部分OCR処理部とを備えたことを特徴とする帳票OCR装置。 Further, the form OCR device of the present invention has a form image obtained by reading a form in which entry fields and pre-printed item names are arranged for a plurality of items, and the entry field and the item names are partitioned by ruled lines, respectively. In the form OCR device for recognizing characters in the entry field, the OCR process is executed on the entire surface of the form image, and the position of the entry frame that divides the entry field, the item name frame surrounding the item name, Recognizes the position and character strings in these frames, and pre-defines whether or not the OCR processing is necessary again for each item name, and the entire OCR processing unit that collects the recognized information as one record for each frame With reference to the re-OCR designation information, the record corresponding to the item name that needs OCR processing again is read, and the relative position with the entry column corresponding to each item name is read. With reference to the predefined position information of the entry field and a entry column identifying unit for identifying the answer column to be re-OCR processing from the position of the item name frame included in the record read out, the predefined Partial OCR that partially executes OCR processing on the entry field specified by the entry field specifying processing unit using dictionary data suitable for the attribute of the entry field to be processed based on the character attribute information of the item A form OCR apparatus comprising a processing unit.
本発明は、複数の項目に関して、その記入欄と予めプリントされた項目名とが配列され、前記記入欄と項目名とがそれぞれ罫線によって区画された帳票を読み取った帳票イメージから、前記記入欄内の文字を認識する帳票OCR処理をコンピュータに実行させる帳票OCRプログラムにおいて、前記帳票イメージの全面に対してOCR処理を実行し、前記記入欄を区画する記入枠の位置,前記項目名を取り囲む項目名枠の位置,及びこれらの枠内の文字列を認識するとともに、認識した情報を枠毎に1つのレコードとしてまとめる全面OCR処理ステップと、各項目名毎に再度OCR処理が必要か否かを予め定義した再OCR指定情報を参照して、再度OCR処理が必要な項目名に対応する前記レコードを読み出すとともに、各項目名毎に対応する記入欄との相対的な位置関係を予め定義した記入欄の位置情報を参照して、読み出した前記レコードに含まれる項目名枠の位置から再度OCR処理をすべき記入欄を特定する記入欄特定処理ステップと、予め定義された各項目の文字属性情報に基づいて、対象となる記入欄の属性に適合した辞書データを使用し、前記記入欄特定処理ステップで特定された記入欄に対して部分的にOCR処理を実行する部分OCR処理ステップとからなるので、予め帳票毎に項目のレイアウト情報を準備することなく、項目のレイアウトが異なる帳票に対して柔軟に対応することが可能となり、認識精度の低下を防止することができる。 In the present invention, for a plurality of items, the entry fields and preprinted item names are arranged, and from the form image obtained by reading the form in which the entry fields and the item names are partitioned by ruled lines, In a form OCR program that causes a computer to execute a form OCR process for recognizing the characters of the form, the OCR process is executed on the entire surface of the form image, and the position of the entry frame that divides the entry field and the item names surrounding the item names Recognize the position of the frames and the character strings in these frames, and collect the recognized information as one record for each frame, and whether or not OCR processing is necessary again for each item name in advance. With reference to the defined re-OCR designation information, the record corresponding to the item name that needs OCR processing again is read out, and for each item name, An entry field that specifies the entry field to be subjected to OCR processing again from the position of the item name frame included in the read record with reference to the position information of the entry field in which the relative positional relationship with the entry field to be defined is defined in advance Using the dictionary data suitable for the attribute of the target entry field based on the character processing information of each item defined in advance, and for the entry field identified in the entry field identification process step Since it consists of partial OCR processing steps that partially execute OCR processing, it is possible to flexibly cope with forms with different item layouts without preparing item layout information for each form in advance. A reduction in accuracy can be prevented.
図1に示す帳票OCRシステム10は、メインユニット11,イメージスキャナ12,イメージデータサーバ13とからなり、これらは、例えば、LAN14などの通信ネットワーク14によって接続されている。イメージスキャナ12の給紙トレイ12aには、例えば、数百枚という単位で給与報告書などの帳票16がセットされる。イメージスキャナ12は、これらの帳票16をCCDイメージセンサでスキャンして、1枚の帳票に対して1つの帳票イメージデータ35(図2参照)を出力する。帳票イメージデータ35は、画素データの集合であるビットマップデータとして生成される。イメージデータサーバ13は、HDD(ハードディスクドライブ)などのデータストレージデバイスを備えており、イメージスキャナ12から出力された数千枚分の帳票イメージデータを蓄積する。
A form OCR system 10 shown in FIG. 1 includes a main unit 11, an
メインユニット11は、イメージデータサーバ13にアクセスして、帳票イメージデータ35を1つずつ読み取り、読み取った帳票イメージデータ35に対してOCR処理を施す。メインユニット11が認識した文字のデータは、例えば、課税計算システム等に引き渡されて処理される。
The main unit 11 accesses the
メインユニット11は、例えば、パーソナルコンピュータやワークステーションをベースにして、これに帳票OCRプログラム28をインストールしたものであり、CPU21,RAM22,操作部24,ディスプレイ26,ハードディスクドライブ(HDD)27からなる。これらメインユニット11の各部は、データバス23によって接続されている。
The main unit 11 is based on, for example, a personal computer or a workstation and has a
CPU21は、オペレーティングシステムを実行してメインユニット11の各部を制御するとともに、帳票OCRプログラム28を実行する。RAM22は、CPU21がプログラムを実行する際に使用される作業用メモリである。帳票OCRプログラム28が実行される際には、RAM22に帳票OCRプログラム28や定義データなどがロードされる。操作部24は、キーボードやマウスなどの入力デバイスからなり、CPU21に対してコマンドを入力したり、処理条件の入力を行う。ディスプレイ26には、帳票OCRプログラム28の操作画面が表示される。HDD27は、データストレージデバイスであり、オペレーティングシステム,帳票OCRプログラム28の他、後述する各種の定義データ29,OCR処理で参照する辞書データなどを記憶する。
The
図2は、帳票16の説明図である。本例においては、給与所得報告書を帳票16の具体例として説明する。帳票16は、外枠31内に、「支払を受ける者」,「住所」,「氏名」,「受給者番号」,「フリガナ」などといった項目名がプレプリントされており、各項目名の近傍には、記入欄が設けられている。各項目名及び記入欄は、罫線によって区画されている。例えば、「受給者番号」や「支払金額」という項目名は、それぞれ枠32a,33aによって区画されており、「受給者番号」の項目名枠32aの右隣に隣接する枠32bは、受給者番号そのものが記入される記入欄を構成する記入枠であり、「支払金額」の項目名枠33aの下に隣接する記入欄も枠33bによって区画されている。
FIG. 2 is an explanatory diagram of the
図3は、帳票OCRプログラム28の帳票OCR処理手順の全体を示すフローチャートである。帳票OCRプログラム28の処理ステップは、帳票イメージ取り込み処理,全面OCR処理,記入欄特定処理,部分OCR処理からなる。記入欄特定処理は、項目名枠特定処理と再OCRエリア設定処理からなる。
FIG. 3 is a flowchart showing the overall procedure of the form OCR processing of the
帳票イメージ取り込み処理は、イメージデータサーバ13から、帳票イメージデータ35を1帳票分ずつ読み出す。この帳票イメージデータ35に対して全面OCR処理が実行される。
In the form image capturing process, the
全面OCR処理は、帳票16の全面に対してOCR処理を実行するとともに、外枠31内に存在するすべての項目名枠と記入枠とを認識するとともに、各項目の項目名や記入欄内の文字列を認識する。認識された枠は、座標情報で表現されるベクトルデータに変換され、文字は、テキストデータに変換される。
In the full OCR process, the OCR process is executed on the entire surface of the
図4は、全面OCR処理の手順を示すフローチャートである。全面OCR処理は、外枠31の左上に設定された原点Oを起点として、左端から右端に向かって順に行われ、最終的に右下の頂点に至る。全画面OCR処理では、1つの枠を検出すると、その枠情報,枠内の行情報,枠内の文字情報を認識する。 FIG. 4 is a flowchart showing the procedure of the entire OCR process. The entire OCR process is performed in order from the left end to the right end with the origin O set at the upper left of the outer frame 31 as the starting point, and finally reaches the lower right vertex. In the full screen OCR process, when one frame is detected, the frame information, line information in the frame, and character information in the frame are recognized.
図5(A)に示すように、これら認識した情報は、枠毎に1つの認識情報レコードとしてまとめられ、当該認識情報レコードには、枠番号として、認識した順序でシーケンス番号が付与される。行情報には、枠内の文字が記入される行数及びその行の座標情報が含まれる。枠内の文字情報には、各行毎の文字数や、認識した文字そのもの、各文字の座標情報が含まれる。そして、全面分の認識情報レコードをまとめて、全面OCR結果ファイル36として出力する。出力された全面OCR結果ファイル36は、RAM22や、HDD27に設定されたワーク領域に一時的に記憶される。
As shown in FIG. 5A, the recognized information is collected as one recognition information record for each frame, and sequence numbers are assigned to the recognition information records in the order of recognition as frame numbers. The line information includes the number of lines in which characters in the frame are entered and the coordinate information of the lines. The character information in the frame includes the number of characters for each line, the recognized character itself, and the coordinate information of each character. Then, the recognition information records for the entire surface are collected and output as the entire
図5(B)は、全面OCR結果ファイル36の内容のより具体的な説明図である。帳票16において、一番左上の枠は最初に認識されるので、枠番号として「1」が付与される。その枠には、「支払を受ける者」という文字がプレプリントされており、このプレプリントされた文字を認識した文字情報が、正確に認識されると「支払を受ける者」という認識文字となる。文字認識率は100%ではないので、正確に認識できない場合もある。その場合には、誤認識した文字情報が、そのまま認識文字となる。また、この枠内の行数は、1行目が「支払」,2行目が「を受け」,3行目が「る者」というように、3行に渡っているので、枠内の行数は「3」となる。各文字の座標は、1文字毎にその左上と右下のそれぞれのXY座標が抽出される。
FIG. 5B is a more specific explanatory diagram of the contents of the entire
帳票OCRプログラム28は、辞書データ30(図1参照)を参照してOCR処理を実行する。この辞書データ30には、システム辞書とユーザー辞書とがある。システム辞書は、英数字,記号,かな,カタカナ,漢字など複数の文字の属性に関わらず汎用的に使用される辞書であるのに対して、ユーザー辞書は、文字の各属性に特化した専用の辞書であり、英数字用のユーザー辞書,記号用のユーザー辞書など、各属性毎に複数の種類がある。ユーザー辞書は、該当する属性の文字認識率は、システム辞書に比較してはるかに高いが、他の属性の文字認識には使用できない。これらシステム辞書とユーザー辞書とは、HDD27に記憶されており、CPU21が帳票OCRプログラム27を実行する際に適宜使用される。全面OCR処理においては、異なる属性の項目が複数混在する全面がOCR対象エリアなので、システム辞書が選択される。
The
全面OCR処理が終了すると、項目名枠特定処理が実行される。項目名枠特定処理は、項目定義ファイル37に基づいて、全面OCR結果ファイル36内のすべての認識情報レコードのうち、項目名枠の認識情報レコードを特定する。
When the entire OCR process is completed, an item name frame specifying process is executed. In the item name frame specifying process, the recognition information record of the item name frame is specified among all the recognition information records in the entire
図6(A)に示すように、項目定義ファイル37は、帳票16に記載される項目名毎の複数の定義レコードからなり、各定義レコードには、項目名と、各項目名毎に再OCRが必要か否かを指定する再OCR指定情報と、各項目名とそれらに対応する記入欄との相対的な位置関係を示す記入欄の位置情報と、各項目名の近傍の項目名との相対位置情報とが含まれている。また、図示しないが、この項目定義ファイル37には、後述するように、再度OCR処理を実行するエリアの項目番号である再OCR項目番号が含まれている。
As shown in FIG. 6A, the
記入欄の位置情報は、各項目名のどの方向に隣接して記入欄が存在するかを示す情報である。この記入欄の位置情報は、数字で規定されており、それぞれの数字には、図6(B)に示すように、「1」は、「項目名の右に位置する枠が記入欄」、「2」は、「項目名の下に位置する枠が記入欄」というように、それぞれの意味が定義されている。例えば、支払金額の項目は、その項目名の下に記入欄が位置するので、記入欄の位置情報は、「2」と指定される。 The position information of the entry column is information indicating in which direction of each item name the entry column is adjacent. The position information in this entry field is defined by numbers. As shown in FIG. 6 (B), “1” is “the box located to the right of the item name is the entry field”, The meaning of “2” is defined as “the frame positioned under the item name is an entry field”. For example, since an entry column is located under the item name for the item of payment amount, the position information of the entry column is designated as “2”.
近傍の項目名との相対位置情報は、具体的には、「受給者番号」という項目名の左には「氏名」という項目名があり、下には「フリガナ」という項目名があるという形で記述される。この近傍の項目名との相対位置情報は、後述するように、項目名枠特定処理において、ある項目名をキーに、それに対応する項目名枠を特定できなかった場合に使用される。 Specifically, the relative position information with the nearby item name is such that the item name “name” is on the left of the item name “recipient number”, and the item name “phonetic” is below. It is described by. The relative position information with the neighboring item names is used when an item name frame corresponding to a certain item name cannot be specified in the item name frame specifying process as described later.
図7に示すフローチャートは、項目名枠特定処理の具体的な手順を示す。まず、項目定義ファイル37から項目名枠を特定すべき1つの項目名を読み出し、その項目名と、全面OCR結果ファイル36に含まれる認識文字とを照合することにより、前記項目名に対応する項目名枠の枠番号をサーチする。そして、認識文字と項目名とが一致した場合には、図8に示すように、全面OCR結果ファイル36からその枠番号を読み出し、これを項目定義ファイル37の対応する項目名のレコードに追加して、項目名枠特定データファイル38を生成する。
The flowchart shown in FIG. 7 shows a specific procedure of the item name frame specifying process. First, one item name for which the item name frame is to be specified is read from the
例えば、「受給者番号」の項目名枠を特定する場合には、項目定義ファイル37から、「受給者番号」を読み出し、この「受給者番号」をキーに、全面OCR結果データファイル36内の認識文字と照合を行うことにより、特定対象となる項目名枠の枠番号をサーチする。サーチできた場合、すなわち、全面OCR結果データファイル36内に「受給者番号」という文字列が存在した場合には、その認識文字に対応する枠番号を項目定義ファイル36の受給者番号のレコードに追加して、項目名枠特定データファイル38を作成する。
For example, when the item name frame of “recipient number” is specified, “recipient number” is read from the
しかし、全面OCR処理において、文字列を誤認識していたり認識不能だった場合には、当然ながら全面OCR結果ファイル36内に「受給者番号」という文字列は存在しない。このように特定すべき項目名枠の枠番号をサーチできなかった場合には、特定すべき項目名の近傍に位置する項目名をキーにサーチ処理を実行する。例えば、「受給者番号」という文字列が存在しない場合には、項目定義データファイル37内の相対位置情報を参照して、「氏名」や「フリガナ」といった、「受給者番号」の近傍に位置する項目名を調べ、その項目名をキーにサーチ処理を実行する。そして、全面OCR結果データファイル36内に「氏名」という文字列が見つかった場合には、前記相対位置情報(「氏名」の右側に「受給者番号」が存在する)に基づいて、「受給者番号」の項目名枠の枠番号を推定する。この推定した枠番号を、検索対象となる項目名枠の枠番号として項目定義データに追加する。
However, if the character string is misrecognized or cannot be recognized in the full OCR process, the character string “recipient number” does not exist in the full
このように、所望の項目名をキーにそれに対応する項目名枠の特定ができなかった場合に、所望の項目名の近傍に位置する項目名をキーに前記項目名枠を推定することにより、全面OCR処理において文字列を誤認識したり認識不能であった場合でも、所望の項目名枠を特定することが可能になる。 As described above, when the item name frame corresponding to the desired item name cannot be specified, the item name frame is estimated using the item name located in the vicinity of the desired item name as a key, Even when the character string is misrecognized or cannot be recognized in the entire OCR process, a desired item name frame can be specified.
こうした近傍の項目名によるサーチは、全面OCR結果ファイル36の全データに渡って実行してもよい。例えば、「受給者番号」の項目名枠を特定する際に、まずはじめに、「受給者番号」をキーにサーチを行い、それでサーチが不能な場合には、その近傍にある「氏名」や「フリガナ」といった項目名がサーチキーとして使用され、それでも見つからない場合には、「氏名」や「フリガナ」の近傍の項目名をキーにサーチを行うというように、全データに渡ってサーチを実行することも可能である。しかし、こうすると、サーチ処理の負荷が増大して、サーチ時間も非常に大きくなる。
Such a search based on item names in the vicinity may be executed over all data in the full
そこで、帳票OCRプログラム28では、推定処理の際のサーチ範囲を規定することで、サーチ範囲を限定している。図2に示すバンド(バンド1〜5)とは、それぞれサーチ範囲を示し、項目定義ファイル37(図6参照)にはそれぞれの項目がどのバンドに属するかを示すバンドNoが含まれている。バンドは、帳票16の筆記方向、すなわち本例においては帳票16は横書きなので、横方向に延びた帯状のエリアとして定義される。本例では、1番左上の「支払を受ける者」の項目の幅をバンド1とし、「種別」,「支払金額」,「給与所得控除後の金額」,「所得控除の額の合計額」,「源泉徴収額」の各項目が並ぶ幅をバンド2というようにバンドを定義している。このバンドの定義は、座標情報などの物理的な位置情報によってなされるのではなく、項目名によって論理的に定義される。すなわち、バンド1の定義は、バンド1の範囲を座標情報によって定義するのではなく、バンド1内に含まれる複数の項目名(氏名,フリガナなど)を記述することによって行われる。
Therefore, the
このように、サーチ範囲を限定したことで、例えば、「種別」という項目名枠を特定する場合には、推定処理に使用されるサーチキーが、「支払金額」,「給与所得控除後の金額」,「所得控除の額の合計額」,「源泉徴収額」の4つの項目名に限定される。これにより、サーチ処理の負荷が軽減されサーチ時間が短くなる。 In this way, by limiting the search range, for example, when specifying the item name frame “type”, the search key used for the estimation process is “payment amount”, “amount after deduction of salary income” ”,“ Total amount of deduction for income ”, and“ Withholding amount ”. This reduces the load of search processing and shortens the search time.
また、近傍の項目名をキーにサーチ処理を実行しても、所望の項目名枠を特定できない場合にはエラーとする。エラーの場合には、項目名枠特定データファイル38の枠番号欄は空白となる。こうした項目名枠特定処理によって、項目定義ファイル37の各項目名のレコードと、全面OCR結果ファイル36の各レコードとが対応付けられる。
Further, if a desired item name frame cannot be specified even if the search process is executed using a nearby item name as a key, an error occurs. In the case of an error, the frame number field of the item name frame specifying data file 38 is blank. By such an item name frame specifying process, the record of each item name in the
項目名枠特定処理の後には、再OCRエリア設定処理が実行される。再OCRエリア設定処理は、項目名枠特定データファイル38と、再OCR項目定義ファイル39とに基づいて、再OCRすべきエリアを指定する再OCRエリアデータファイル41を出力する。
After the item name frame specifying process, a re-OCR area setting process is executed. The re-OCR area setting process outputs a re-OCR area data file 41 for designating an area to be re-OCR based on the item name frame specifying
図9に示すように、再OCR項目定義ファイル39は、再度OCRすべき項目の記入欄に関する情報を、項目毎に定義したファイルである。再OCR項目は、例えば、「受給者番号」,「フリガナ」,「種別」,「支払金額」,「給与所得控除後の金額」,「所得控除の額の合計額」,「源泉徴収額」などである。これらの項目は、項目定義ファイル37において、再OCR指定がなされる。再OCR項目定義ファイル39は、各項目毎に、再OCR項目番号,項目名,属性とを含む情報が1レコードになっている。属性情報は、英字,数字,カナ,かな漢字など記入される項目の文字属性の情報である。再OCR処理をする際には、この属性情報に基づいて、属性に適合するユーザー辞書が選択される。
As shown in FIG. 9, the re-OCR
図10は、再OCRエリア設定処理の手順を示すフローチャートである。再OCRエリア設定処理では、まず、項目名枠特定データファイル38から、再OCR指定がなされている項目名枠のレコードを1つ読み出す。そして、当該項目名枠に対応する記入欄の位置情報に基づいて、全面OCR結果ファイル36内の各認識情報レコードの中から、記入欄の認識情報レコードを特定し、抽出する。
FIG. 10 is a flowchart showing the procedure of the re-OCR area setting process. In the re-OCR area setting process, first, one item name frame record for which re-OCR is specified is read from the item name frame specifying
そして、再OCR項目定義ファイル39から該当する項目の属性情報を読み出し、その属性情報に基づいて、記入欄内の不要な認識文字の情報を除去する。例えば、図11に示すように、支払金額の記入欄46には、その欄内に、金額を示す文字列「5,600,000」の他、その上の行に、「内」,「円」といった文字列がプレプリントされている。全面OCR結果ファイル36の認識情報レコードには、記入欄46の枠情報とその枠内の行情報や文字情報がすべて格納されている。
Then, the attribute information of the corresponding item is read from the re-OCR
再OCR処理をすべきエリアは、記入欄46内のうち、金額そのもの(「5,600,000」)が記述されたエリアのみでよい。その他の文字列は、認識不要であるばかりでなく、必要な文字列を認識する際のノイズになるおそれもある。このため、帳票OCRプログラム28では、再OCRエリア設定処理において、前記認識情報レコードから、こうした不要文字に関する情報を除去している。不要文字か否かの判断は、属性情報に基づいて行われる。例えば、支払金額の属性は数字であるので、文字列の中から数字以外のものが不要文字と判断される。不要文字が除去されると、認識情報レコードには、記入欄46の枠情報と、その欄内の金額の位置を示す文字座標46aとが残る。
The area where the re-OCR processing is to be performed is only the area in which the amount of money (“5,600,000”) is described in the entry field 46. Other character strings need not be recognized, but may cause noise when recognizing necessary character strings. For this reason, the
こうして不要な認識文字情報が除去された認識情報レコードと、その記入欄の属性情報とを結合したデータが、再OCRエリアデータとして出力される。こうした処理が、再OCR処理を実行する全項目に対して行われ、全項目分のデータをまとめた再OCRエリアデータファイル41が生成される。 Data obtained by combining the recognition information record from which unnecessary recognition character information is removed in this way and the attribute information in the entry column is output as re-OCR area data. Such processing is performed for all items for which re-OCR processing is executed, and a re-OCR area data file 41 in which data for all items are collected is generated.
このように、項目枠特定処理と再OCRエリア設定処理とを行うことにより、再度OCRすべき記入欄の特定が行われる。 In this way, by performing the item frame specifying process and the re-OCR area setting process, the entry field to be OCR again is specified.
部分OCR処理は、再OCRエリアデータファイル41を参照して、帳票イメージの再OCR指定されたエリアに対して部分的にOCR処理を実行する。まず、再OCRエリアデータファイル41から、記入欄のエリア情報を1項目分読み出す。次に、読み出した項目の属性に対応するユーザー辞書を設定する。例えば、支払金額の記入欄の場合には、属性が数字であるので、数字用のユーザー辞書を設定する。そして、エリア情報の座標情報から、再OCRエリアを特定し、そのエリアのOCR処理を実行する。こうした処理を全項目分繰り返す。認識された文字列は、再OCR項目番号,項目名とともに、部分OCR結果ファイル42に出力される。このように、文字属性に応じたユーザー辞書を使用して部分OCR処理が行われるので、精度が高い文字認識を行うことができる。
The partial OCR process refers to the re-OCR area data file 41 and partially executes the OCR process for the area of the form image designated as re-OCR. First, one item of area information in the entry column is read from the re-OCR area data file 41. Next, a user dictionary corresponding to the attribute of the read item is set. For example, in the payment amount entry field, the attribute is a number, so a user dictionary for numbers is set. Then, the re-OCR area is identified from the coordinate information of the area information, and the OCR process for that area is executed. This process is repeated for all items. The recognized character string is output to the partial
以下、上記構成による作用について説明する。オペレータが、イメージスキャナ12に帳票16をセットして、読み取り指示を与えると、イメージスキャナ12が帳票16をイメージデータに変換し、そのイメージデータがイメージデータサーバ13に蓄積される。次に、オペレータがメインユニット11から、帳票OCR処理実行指示を与えると、帳票OCRプログラム28が起動する。帳票OCRプログラムは、イメージデータサーバ13から帳票イメージデータを1ファイルずつ取り込み、帳票OCR処理を実行する。
Hereinafter, the operation of the above configuration will be described. When the operator sets the
まず、全面OCR処理が実行されて、外枠31内の全項目分の項目名枠,記入枠及び枠内の文字列が認識され、これらの認識情報が枠毎に認識情報レコードとしてまとめられ、全面OCR結果ファイル36として出力される。この全面OCR処理により、帳票16の各項目の枠のレイアウトが認識される。
First, the entire OCR process is executed to recognize item name frames, entry frames, and character strings in the frames for all items in the outer frame 31, and these recognition information are grouped into recognition information records for each frame. The entire
次に、この全面OCR結果ファイル36と、項目定義ファイル37とに基づいて、項目名枠特定処理が実行されて、項目名枠が特定される。この項目名枠特定処理においては、所望の項目名をキーに、対応する項目名枠が特定されるが、その項目名で特定ができない場合には、近傍の項目名をキーとして、所望の項目名枠が推定される。このため、全面OCR処理において、所望の項目名を誤認識していたり、認識不能であった場合でも、項目名枠の特定が可能になるので、記入欄の特定率が向上する。項目名枠特定処理の結果は、項目名枠特定データファイル38として出力される。
Next, an item name frame specifying process is executed based on the entire
この前記項目名枠特定データファイル38と再OCR項目定義ファイル39とに基づいて、再OCRエリア設定処理が実行されて、再OCRエリア(再度OCRすべき記入欄)が特定される。この再OCRエリア設定処理によって、記入欄の位置及びその属性の特定,及び不要文字情報の除去が行われ、その結果情報として再OCRエリアデータファイル41が出力される。
Based on the item name frame specifying
部分OCR処理は、この再OCRエリアデータファイル41に基づいて、指定された記入欄に対して再度OCR処理を実行する。この部分OCR処理では、属性情報に基づいて、対象となる記入欄に適合したユーザー辞書が選択されるから、精度の高い文字認識が可能となる。 In the partial OCR process, based on the re-OCR area data file 41, the OCR process is executed again for the designated entry field. In this partial OCR process, a user dictionary suitable for the target entry field is selected based on the attribute information, so that highly accurate character recognition is possible.
このように、帳票OCRプログラム28は、まず、全面OCR処理により、帳票16の各項目のレイアウトを認識した後、その結果情報と項目定義データに基づいて記入欄を特定している。このため、項目のレイアウトが異なる場合でも、予め帳票毎のレイアウト情報を準備することなく、必要な項目名を含む項目定義データを準備するだけで済むので、柔軟な対応が可能となり、認識精度の低下がなくなる。
As described above, the
上記実施形態では、帳票OCRシステムのメインユニットとして、汎用的なパーソナルコンピュータやワークステーションをベースに帳票OCRプログラムをインストールした形態の帳票OCR装置を使用し、各処理ステップのすべてをコンピュータがソフトウエアを実行することにより実現する例で説明しているが、もちろん、メインユニットとしては、各処理ステップのうち少なくとも一部を専用のハードウエアによって実行する処理部を備えた専用の帳票OCR装置を使用してもよい。 In the above-described embodiment, a form OCR apparatus in which a form OCR program is installed on the basis of a general-purpose personal computer or workstation is used as the main unit of the form OCR system. Although explained in the example realized by executing, of course, as the main unit, a dedicated form OCR device having a processing unit for executing at least a part of each processing step by dedicated hardware is used. May be.
10 帳票OCRシステム
11 メインユニット
16 帳票
21 CPU
22 RAM
27 HDD
35 帳票イメージデータ
36 全面OCR結果ファイル
37 項目定義ファイル
38 項目名枠特定データファイル
39 再OCR項目定義ファイル
41 再OCRエリアデータファイル
42 部分OCR結果ファイル
10 Form OCR system 11
22 RAM
27 HDD
35
Claims (3)
前記帳票イメージの全面に対してOCR処理を実行し、前記記入欄を区画する記入枠の位置,前記項目名を取り囲む項目名枠の位置,及びこれらの枠内の文字列を認識するとともに、認識した情報を枠毎に1つのレコードとしてまとめる全面OCR処理ステップと、
各項目名毎に再度OCR処理が必要か否かを予め定義した再OCR指定情報を参照して、再度OCR処理が必要な項目名に対応する前記レコードを読み出すとともに、各項目名毎に対応する記入欄との相対的な位置関係を予め定義した記入欄の位置情報を参照して、読み出した前記レコードに含まれる項目名枠の位置から再度OCR処理をすべき記入欄を特定する記入欄特定処理ステップと、
予め定義された各項目の文字属性情報に基づいて、対象となる記入欄の属性に適合した辞書データを使用し、前記記入欄特定処理ステップで特定された記入欄に対して部分的にOCR処理を実行する部分OCR処理ステップとからなることを特徴とする帳票OCRプログラム。 For a plurality of items, the entry fields and preprinted item names are arranged, and characters in the entry fields are recognized from a form image obtained by reading a form in which the entry fields and the item names are partitioned by ruled lines. In a form OCR program that causes a computer to execute form OCR processing
OCR processing is performed on the entire surface of the form image to recognize the position of the entry frame that divides the entry field, the position of the item name frame surrounding the item name, and the character string in these frames. Complete OCR processing step to collect the information as one record per frame,
With reference to re-OCR designation information that defines in advance whether or not OCR processing is necessary again for each item name, the record corresponding to the item name that requires OCR processing is read out again, and corresponding to each item name Specify the entry field to identify the entry field to be subjected to the OCR process again from the position of the item name frame included in the read record with reference to the position information of the entry field in which the relative positional relationship with the entry field is defined in advance. Processing steps;
Based on the character attribute information of each item defined in advance, the dictionary data suitable for the attribute of the target entry field is used , and the OCR process is partially performed on the entry field specified in the entry field specifying process step. A form OCR program characterized by comprising a partial OCR processing step for executing.
前記帳票イメージの全面に対してOCR処理を実行し、前記記入欄を区画する記入枠の位置,前記項目名を取り囲む項目名枠の位置,及びこれらの枠内の文字列を認識するとともに、認識した情報を枠毎に1つのレコードとしてまとめる全面OCR処理ステップと、
各項目名毎に再度OCR処理が必要か否かを予め定義した再OCR指定情報を参照して、再度OCR処理が必要な項目名に対応する前記レコードを読み出すとともに、各項目名毎に対応する記入欄との相対的な位置関係を予め定義した記入欄の位置情報を参照して、読み出した前記レコードに含まれる項目名枠の位置から再度OCR処理をすべき記入欄を特定する記入欄特定処理ステップと、
予め定義された各項目の文字属性情報に基づいて、対象となる記入欄の属性に適合した辞書データを使用し、前記記入欄特定処理ステップで特定された記入欄に対して部分的にOCR処理を実行する部分OCR処理ステップとからなることを特徴とする帳票OCR方法。 For a plurality of items, the entry fields and preprinted item names are arranged, and characters in the entry fields are recognized from a form image obtained by reading a form in which the entry fields and the item names are partitioned by ruled lines. In the form OCR method
OCR processing is performed on the entire surface of the form image to recognize the position of the entry frame that divides the entry field, the position of the item name frame surrounding the item name, and the character string in these frames. Complete OCR processing step to collect the information as one record per frame,
With reference to re-OCR designation information that defines in advance whether or not OCR processing is necessary again for each item name, the record corresponding to the item name that requires OCR processing is read out again, and corresponding to each item name Specify the entry field to identify the entry field to be subjected to the OCR process again from the position of the item name frame included in the read record with reference to the position information of the entry field in which the relative positional relationship with the entry field is defined in advance. Processing steps;
Based on the character attribute information of each item defined in advance, the dictionary data suitable for the attribute of the target entry field is used , and the OCR process is partially performed on the entry field specified in the entry field specifying process step. A form OCR method characterized by comprising: a partial OCR processing step for executing
前記帳票イメージの全面に対してOCR処理を実行し、前記記入欄を区画する記入枠の位置,前記項目名を取り囲む項目名枠の位置,及びこれらの枠内の文字列を認識するとともに、認識した情報を枠毎に1つのレコードとしてまとめる全面OCR処理部と、
各項目名毎に再度OCR処理が必要か否かを予め定義した再OCR指定情報を参照して、再度OCR処理が必要な項目名に対応する前記レコードを読み出すとともに、各項目名毎に対応する記入欄との相対的な位置関係を予め定義した記入欄の位置情報を参照して、読み出した前記レコードに含まれる項目名枠の位置から再度OCR処理をすべき記入欄を特定する記入欄特定処理部と、
予め定義された各項目の文字属性情報に基づいて、対象となる記入欄の属性に適合した辞書データを使用し、前記記入欄特定処理部で特定された記入欄に対して部分的にOCR処理を実行する部分OCR処理部とを備えたことを特徴とする帳票OCR装置。 For a plurality of items, the entry fields and preprinted item names are arranged, and characters in the entry fields are recognized from a form image obtained by reading a form in which the entry fields and the item names are partitioned by ruled lines. In the form OCR device
OCR processing is performed on the entire surface of the form image to recognize the position of the entry frame that divides the entry field, the position of the item name frame surrounding the item name, and the character string in these frames. A full-screen OCR processing unit that collects the information as one record for each frame,
With reference to re-OCR designation information that defines in advance whether or not OCR processing is necessary again for each item name, the record corresponding to the item name that requires OCR processing is read again, and corresponding to each item name Specify the entry field to identify the entry field to be subjected to the OCR process again from the position of the item name frame included in the read record with reference to the position information of the entry field in which the relative positional relationship with the entry field is defined in advance. A processing unit;
Based on the character attribute information of each item defined in advance, the dictionary data suitable for the attribute of the target entry field is used , and the OCR process is partially performed on the entry field specified by the entry field specifying processing unit. A form OCR apparatus comprising a partial OCR processing unit for executing
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003409481A JP4347677B2 (en) | 2003-12-08 | 2003-12-08 | Form OCR program, method and apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003409481A JP4347677B2 (en) | 2003-12-08 | 2003-12-08 | Form OCR program, method and apparatus |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005173730A JP2005173730A (en) | 2005-06-30 |
JP4347677B2 true JP4347677B2 (en) | 2009-10-21 |
Family
ID=34730855
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003409481A Expired - Fee Related JP4347677B2 (en) | 2003-12-08 | 2003-12-08 | Form OCR program, method and apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4347677B2 (en) |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9769354B2 (en) | 2005-03-24 | 2017-09-19 | Kofax, Inc. | Systems and methods of processing scanned data |
US9137417B2 (en) | 2005-03-24 | 2015-09-15 | Kofax, Inc. | Systems and methods for processing video data |
JP4733577B2 (en) * | 2006-07-12 | 2011-07-27 | 日立コンピュータ機器株式会社 | Form recognition device and form recognition program |
JP4940973B2 (en) | 2007-02-02 | 2012-05-30 | 富士通株式会社 | Logical structure recognition processing program, logical structure recognition processing method, and logical structure recognition processing apparatus |
US8958605B2 (en) | 2009-02-10 | 2015-02-17 | Kofax, Inc. | Systems, methods and computer program products for determining document validity |
US9576272B2 (en) | 2009-02-10 | 2017-02-21 | Kofax, Inc. | Systems, methods and computer program products for determining document validity |
US8774516B2 (en) | 2009-02-10 | 2014-07-08 | Kofax, Inc. | Systems, methods and computer program products for determining document validity |
US8879846B2 (en) | 2009-02-10 | 2014-11-04 | Kofax, Inc. | Systems, methods and computer program products for processing financial documents |
US9767354B2 (en) | 2009-02-10 | 2017-09-19 | Kofax, Inc. | Global geographic information retrieval, validation, and normalization |
US8345981B2 (en) * | 2009-02-10 | 2013-01-01 | Kofax, Inc. | Systems, methods, and computer program products for determining document validity |
US9349046B2 (en) | 2009-02-10 | 2016-05-24 | Kofax, Inc. | Smart optical input/output (I/O) extension for context-dependent workflows |
US9058515B1 (en) | 2012-01-12 | 2015-06-16 | Kofax, Inc. | Systems and methods for identification document processing and business workflow integration |
US9058580B1 (en) | 2012-01-12 | 2015-06-16 | Kofax, Inc. | Systems and methods for identification document processing and business workflow integration |
US8855375B2 (en) | 2012-01-12 | 2014-10-07 | Kofax, Inc. | Systems and methods for mobile image capture and processing |
US9483794B2 (en) | 2012-01-12 | 2016-11-01 | Kofax, Inc. | Systems and methods for identification document processing and business workflow integration |
US10146795B2 (en) | 2012-01-12 | 2018-12-04 | Kofax, Inc. | Systems and methods for mobile image capture and processing |
US9355312B2 (en) | 2013-03-13 | 2016-05-31 | Kofax, Inc. | Systems and methods for classifying objects in digital images captured using mobile devices |
WO2014160426A1 (en) | 2013-03-13 | 2014-10-02 | Kofax, Inc. | Classifying objects in digital images captured using mobile devices |
US9208536B2 (en) | 2013-09-27 | 2015-12-08 | Kofax, Inc. | Systems and methods for three dimensional geometric reconstruction of captured image data |
US20140316841A1 (en) | 2013-04-23 | 2014-10-23 | Kofax, Inc. | Location-based workflows and services |
JP2016518790A (en) | 2013-05-03 | 2016-06-23 | コファックス, インコーポレイテッド | System and method for detecting and classifying objects in video captured using a mobile device |
WO2015073920A1 (en) | 2013-11-15 | 2015-05-21 | Kofax, Inc. | Systems and methods for generating composite images of long documents using mobile video data |
US9760788B2 (en) | 2014-10-30 | 2017-09-12 | Kofax, Inc. | Mobile document detection and orientation based on reference object characteristics |
US10242285B2 (en) | 2015-07-20 | 2019-03-26 | Kofax, Inc. | Iterative recognition-guided thresholding and data extraction |
US9779296B1 (en) | 2016-04-01 | 2017-10-03 | Kofax, Inc. | Content-based detection and three dimensional geometric reconstruction of objects in image and video data |
US10803350B2 (en) | 2017-11-30 | 2020-10-13 | Kofax, Inc. | Object detection and image cropping using a multi-detector approach |
JP7342472B2 (en) * | 2019-07-11 | 2023-09-12 | 株式会社リコー | Information processing system, information processing method |
JP7468004B2 (en) * | 2020-03-11 | 2024-04-16 | 富士フイルムビジネスイノベーション株式会社 | Document processing device and program |
JP7504674B2 (en) | 2020-06-16 | 2024-06-24 | 株式会社プリマジェスト | Information processing device, information processing method, and program |
-
2003
- 2003-12-08 JP JP2003409481A patent/JP4347677B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2005173730A (en) | 2005-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4347677B2 (en) | Form OCR program, method and apparatus | |
US11182604B1 (en) | Computerized recognition and extraction of tables in digitized documents | |
US9613267B2 (en) | Method and system of extracting label:value data from a document | |
US6400845B1 (en) | System and method for data extraction from digital images | |
KR100412317B1 (en) | Character recognizing/correcting system | |
US8605982B2 (en) | Check boundary detection by string literal analysis | |
JP4996940B2 (en) | Form recognition device and program thereof | |
US8467614B2 (en) | Method for processing optical character recognition (OCR) data, wherein the output comprises visually impaired character images | |
KR101769918B1 (en) | Recognition device based deep learning for extracting text from images | |
JP2004139484A (en) | Form processing device, program for implementing it, and program for creating form format | |
US11475688B2 (en) | Information processing apparatus and information processing method for extracting information from document image | |
JP2007058605A (en) | Document management system | |
CN112084748A (en) | Text comparison method | |
JP2008021068A (en) | Business form recognition apparatus and business form recognition program | |
CN113806472A (en) | Method and equipment for realizing full-text retrieval of character, picture and image type scanning piece | |
JP4347675B2 (en) | Form OCR program, method and apparatus | |
WO2014068770A1 (en) | Data extraction method, data extraction device, and program thereof | |
JP2019057311A (en) | Ledger sheet information recognition device and ledger sheet information recognition method | |
JP2009093305A (en) | Business form recognition system | |
WO2007070010A1 (en) | Improvements in electronic document analysis | |
JP4983464B2 (en) | Form image processing apparatus and form image processing program | |
CN115661183B (en) | Intelligent scanning management system and method based on edge calculation | |
KR20180126352A (en) | Recognition device based deep learning for extracting text from images | |
JP5134383B2 (en) | OCR device, trail management device and trail management system | |
JPH08320914A (en) | Table recognition method and device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060413 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20061220 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090128 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090323 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090422 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090608 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090708 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090716 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120724 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120724 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130724 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |