JP2004199529A - Business form recognition device and business form recognition method - Google Patents

Business form recognition device and business form recognition method Download PDF

Info

Publication number
JP2004199529A
JP2004199529A JP2002369126A JP2002369126A JP2004199529A JP 2004199529 A JP2004199529 A JP 2004199529A JP 2002369126 A JP2002369126 A JP 2002369126A JP 2002369126 A JP2002369126 A JP 2002369126A JP 2004199529 A JP2004199529 A JP 2004199529A
Authority
JP
Japan
Prior art keywords
character recognition
character
information
recognition
item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002369126A
Other languages
Japanese (ja)
Other versions
JP4566510B2 (en
Inventor
Katsutoshi Obara
勝利 小原
Shinichi Eguchi
真一 江口
Koichi Kanemoto
浩一 金元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Fujitsu Frontech Ltd
Original Assignee
Fujitsu Ltd
Fujitsu Frontech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd, Fujitsu Frontech Ltd filed Critical Fujitsu Ltd
Priority to JP2002369126A priority Critical patent/JP4566510B2/en
Publication of JP2004199529A publication Critical patent/JP2004199529A/en
Application granted granted Critical
Publication of JP4566510B2 publication Critical patent/JP4566510B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To easily respond to an addition or change in kind of business forms. <P>SOLUTION: A character recognition information storage means 1 preliminarily stores character recognition information including the position designation of an object range on a business form which is subjected to character recognition. A syntax rule information storage means 2 similarly stores syntax rule information including a character recognition item represented by a character string in the object range and a rule for the character string of the object range. A character recognition means 3 inputs the image information of the business form optically read by an image scanner, and extracts the image information of the object range on the basis of the character recognition information read from the storage means 1 to perform the character recognition. The result of character recognition is transmitted to a syntax analysis means 4. The syntax analysis means 4 analyzes the character string of the object range that is the character recognition result on the basis of syntax rule information to perform its matching with the character recognition item. <P>COPYRIGHT: (C)2004,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
本発明は帳票認識装置および帳票認識方法に関し、特に光学的に読み取った帳票のイメージ情報から所定の文字認識項目の文字認識を行なう帳票認識装置および帳票認識方法に関する。
【0002】
【従来の技術】
従来、帳票処理業務の効率化のため、帳票上に印字された情報を光学的にイメージ情報として読み取り、読み取ったイメージ情報を画像処理して帳票上に印字された文字の認識を行なう帳票認識装置が利用されている。
【0003】
このような帳票認識装置は、同一種類の帳票を多量に処理するばかりでなく、多種多様なフォーマットの帳票を処理することが要求されている。このため、例えば、帳票に印刷された罫線や、帳票識別コード等によって帳票を識別し、印字された文字の認識処理を行なっている。さらに、複数の帳票の特徴を示す図形が登録された図形データベースと、同様に複数の帳票の特徴をそれぞれ示す文字が登録された識別コードデータベースとを用いて、図形と文字の両方で照合して帳票を識別することにより、識別精度を向上させた帳票識別装置がある(例えば、特許文献1参照)。
【0004】
従来の帳票の識別処理および文字の認識処理は、帳票の特徴が定義された定義体に基づいて実施される。図9は、帳票と帳票の特徴を示した定義体の一例を示した図である。図9の例では、帳票1000は、帳票識別コード1001が帳票の左上から横軸方向にx、縦軸方向にy離れた座標(x、y)から印字されており、帳票識別コード1001により帳票の種類を識別することができる。
【0005】
定義体とは、このような帳票の種別を特定するための情報や、文字認識を行なうための規定などについてなされた定義を言い、帳票認識装置内に組み込まれる。例えば、帳票の特徴を示す罫線、図形などについての定義や、文字の桁数や特徴(数字のみであるなど)が定義されている。図9の例では、定義体1003は、帳票識別コード1001のコードが開始される左上の座標、識別コード、および識別コードに対応する帳票IDなどが含まれる。
【0006】
このような帳票認識装置では、定義体1003に基づいて帳票認識および文字認識処理を行なうプログラムが作成され、装置内に格納される。また、定義体の一部がデータベースとして装置内の記憶装置に格納され、プログラムが適宜参照する場合もある。これらのプログラムをコンピュータで実行することにより、帳票認識処理および文字認識処理が実現される。
【0007】
【特許文献1】
特開2001−175862号公報
【0008】
【発明が解決しようとする課題】
しかし、従来の帳票認識装置および帳票認識方法では、帳票ごとに定義体を作成しなければならないという問題がある。
【0009】
上記の説明のように、従来の帳票認識装置およびその帳票認識方法は、帳票ごとの特徴を示す定義体に基づいて作成されたプログラムがコンピュータで実行されることにより処理機能が実現される。このため、読み取る帳票の種類が増えると、定義体作成の作業量が膨大に膨れてしまうという問題があった。近年、帳票形式の共通化が図られており、類似する形式の帳票が多数存在するが、類似する全ての帳票について定義体を作成する必要があった。例えば、同一項目が記載される複数の帳票を処理する場合、その項目の印字される位置が帳票ごとに若干異なっていれば、それぞれの帳票について定義体を作成しなければならなかった。このように、定義体作成に多大な労力が必要となることが、認識する帳票数を増やす際の障害となっていた。
【0010】
また、帳票認識装置において帳票認識および文字認識処理を実現するためのプログラムは、定義体に基づいて作成されるため、定義体によって定義された規定が制御文に組み込まれてしまっている場合がある。図9の定義体1003の例では、識別コードが印字されている座標が同一であるので、識別コードの読み込みを制御する制御文に、「座標(x1、y1)から識別コード読み込み」と組み込むことができる。このような場合、座標が若干異なる帳票を追加する場合には、制御文まで変更する必要が生じる。このように、定義体作成の作業ばかりでなく、定義体の作成に伴ってプログラムの修正をしなければならないなど、煩雑な作業をしなければならなかった。
【0011】
本発明はこのような点に鑑みてなされたものであり、帳票の種類の追加や変更に容易に対応することが可能な帳票認識装置および帳票認識方法を提供することを目的とする。
【0012】
【課題を解決するための手段】
本発明では上記課題を解決するために、図1に示すような帳票認識装置が提供される。本発明に係る帳票認識装置では、文字認識情報記憶手段1に文字認識を行なう帳票上の対象範囲の位置指定を含む文字認識情報が格納され、構文ルール情報記憶手段2に対象範囲の文字列によって表される文字認識項目と対象範囲の文字列より成る構文についての規定を含む構文ルール情報が格納されている。文字認識手段3は、イメージスキャナによって光学的に読み取られた帳票のイメージ情報を入力し、文字認識情報記憶手段1から読み出した文字認識情報に基づき、対象範囲のイメージ情報を抽出して文字認識を行なう。文字認識された結果は、構文解析手段4に送られる。構文解析手段4は、文字認識結果である対象範囲の文字列を構文ルール情報に基づいて解析し、文字認識項目との対応付けを行なう。このように、文字認識された構文と文字認識項目とを構文ルール情報に基づいて対応付けることにより、所定の文字認識項目に関する文字認識を行ない、これによって帳票認識を行なう。
【0013】
また、上記課題を解決するために、文字認識情報と構文ルール情報とを予め設定しておき、取得したイメージ情報の対象範囲の情報を抽出して文字認識情報を用いて文字認識を行ない、構文ルール情報を用いて文字認識された文字列と文字認識項目とを対応付けることにより、所定の文字認識項目の文字認識を行なう帳票認識方法が提供される。
【0014】
【発明の実施の形態】
以下、本発明の実施の形態を図面を参照して説明する。まず、実施の形態に適用される発明の概念について説明し、続いて本発明が適用される実施の形態について説明する。
【0015】
図1は、本発明の実施の形態に適用される発明の概念図である。
本発明に係る帳票認識装置は、文字認識に用いる文字認識情報を記憶した文字認識情報記憶手段1、文字列より成る構文についての構文ルール情報を格納する構文ルール情報記憶手段2、イメージ情報から帳票の文字認識を行なう文字認識手段3および文字認識された文字列と文字認識項目との対応付けを行なう構文解析手段4を具備する。
【0016】
文字認識情報記憶手段1は、文字認識のために必要な情報を格納する記憶手段である。例えば、文字認識を行なう対象範囲の位置を指定する位置情報、文字認識時に参照する文字認識辞書などが格納されている。さらに必要に応じて、文字認識の精度を上げるために文字種や字体などの文字情報などが格納されている。
【0017】
構文ルール情報記憶手段2は、文字認識された対象範囲の文字列より成る構文についてのルール情報を格納する記憶手段である。例えば、文字認識が行なわれた構文が表す文字認識項目、文字列についての規定などが格納されている。文字列についての規定には、その文字列の桁数や文字種などがある。さらに必要に応じて、文字認識項目間の位置関係を規定する項目間位置関係ルール情報が格納される。
【0018】
文字認識手段3は、文字認識情報記憶手段1に記憶された文字認識情報を用いて、所定の文字認識の対象範囲に相当するイメージ情報を抽出し、そこに含まれる文字が何であるかを判別する。このようにして得られた文字認識の結果は、認識文字情報として構文解析手段4に送られる。
【0019】
構文解析手段4は、認識文字情報を入力し、文字認識手段3によって文字認識された対象範囲の文字列より成る構文について、構文ルール情報記憶手段2に格納された構文ルールを用いてその文字認識項目との対応付けを行なう。このとき、文字列に関するルールや項目間位置関係ルール情報を用いて、対応付けの精度を上げる。
【0020】
このような構成の帳票認識装置の動作および帳票認識方法について説明する。
予め、文字認識情報記憶手段1には、対象の帳票の文字認識を行なうために必要な文字認識情報が格納される。同様に、構文ルール情報記憶手段2に、文字認識された文字列と文字認識項目との対応付けを行なうために必要な構文ルール情報が格納される。
【0021】
文字認識手段3は、対象となる帳票のイメージ情報を入力すると、文字認識情報記憶手段1に格納された文字認識情報を用いて文字認識を行なう。文字認識情報に含まれる対象範囲の位置を指定する位置情報に基づいて、対象範囲のイメージ情報を取り出し、文字認識辞書を参照して対象範囲の文字を特定する。このとき、文字種や字形などの文字情報が参照される。文字認識された認識文字情報は構文解析手段4に送られる。構文解析手段4は、認識文字情報を取得し、構文ルール情報記憶手段2に格納された構文ルール情報を用いて文字認識された対象範囲の文字列と文字認識項目との対応付けを行なう。対応付けは、登録された構文ルール情報のうち適用可能なルールを用いて、対象範囲の文字列に対応する文字認識項目を推定していく。このとき、例えば、文字認識項目の位置を示す座標、文字認識項目の特徴を表す桁数、あるいは他の文字認識項目との位置関係などを文字列ルールとして登録し、これらを用いて対応付けを行なう。
【0022】
このようにして、帳票の文字認識項目と文字認識された認識文字情報とが結び付けられて、帳票認識処理が終了する。
従来の定義体を用いた手法では、定義体によって定義された対象範囲の位置を指定する座標によって文字認識項目との対応付けが行なわれる。このため、全ての文字認識項目について座標の設定を行なわなければならなかった。例えば、類似する帳票であって印字される位置が若干異なる場合であっても、それぞれに定義体を設定しなければならなかった。本発明では、文字認識項目の特徴を表すルールによって、読み取られた認識文字情報と文字認識項目とを対応付けることができるため、特徴が同じ類似する帳票であれば、同一の構文ルール情報によって処理することが可能となる。このように、帳票ごとに定義体を作成する必要がないため、帳票の種類の追加や変更に容易に対応することができる。
【0023】
次に、本発明が適用される実施の形態について説明する。図2は、本発明の実施の形態の構成図である。
本発明に係る帳票認識装置100は、入力帳票300のイメージ情報を取得するイメージ読取部150、取得したイメージ情報の文字認識を行なう文字認識処理部130、認識された文字列の構文解析を行なう構文解析処理部140、解析された構文をチェックして確定させる項目確定処理部180および認識された結果を表示する認識結果表示部190を具備する。また、文字認識に用いる文字認識情報として、文字認識辞書を記憶する文字認識辞書データベース(以下、DBとする)111、文字認識を行なう範囲を指定する文字認識位置を記憶する文字認識位置テーブルDB112および文字データに関する文字認識カテゴリを記憶する文字認識カテゴリテーブルDB113を具備する。同様に、構文ルール情報として、文字認識項目を記憶する文字認識項目テーブルDB121、文字列に関する規定を記憶した文字列ルールテーブルDB122及び項目間の位置関係の規定を記憶した項目間位置関係テーブルDB123を備え、項目確定のためのチェックデータに関するデータチェック情報を記憶するデータチェックテーブルDB171を具備する。さらに、取得したイメージ情報を一時格納するイメージ格納メモリ161と、文字認識された結果を一時格納する認識結果格納メモリ162を具備する。
【0024】
文字認識辞書DB111に格納される文字認識辞書は、認識しようとしている文字との比較に用いる辞書データである。帳票の種類が限定される場合、その帳票で使用可能な文字のみが登録されていればよい。また、文字認識位置テーブルDB112に格納される文字認識位置テーブルは、イメージ情報上で文字認識を行なう箇所を、開始の座標と終了の座標の2点示される矩形で指定する。例えば、矩形の左上のX,Y座標と、右下のX,Y座標とを指定する。文字認識カテゴリテーブルDB113に格納される文字認識カテゴリテーブルは、文字認識位置テーブルで指定した矩形ごとに、文字認識を行なう際のカテゴリを指定する。カテゴリは、文字の特徴を表す情報で、認識される文字の文字種(数字、記号、英字など)や、フォント(ゴシック体、明朝体)などを表す。1つの文字認識領域で数字、記号、英字などを組み合わせて指定することもできる。さらに、1文字種ごとに認識結果として有効か無効かを指定することができる。例えば、記号としては、「*」のみが有効であり、他の記号と認識された場合は無効であるなどの指定が可能である。
【0025】
文字認識項目テーブルDB121に格納される文字認識項目テーブルは、文字認識対象の項目を指定するテーブルである。文字認識項目を数字などのIDに対応付けて、IDにて指定することもできる。文字列ルールテーブルDB122に格納される文字列ルールテーブルは、文字認識項目を表す文字列の特徴をルール化したもので、文字認識項目ごとに文字認識項目の桁数、カテゴリ、該当項目が印字される位置などを指定する。項目間位置関係テーブルDB123に格納される項目間位置関係テーブルは、文字認識項目が複数存在するとき、帳票上に並ぶ順などの項目間に位置関係を指定する。例えば、項目A、B、Cが存在するとき、帳票上には、A→B→Cの順に並ぶことがルール化されている。また、項目の並びは縦または横の指定が可能である。
【0026】
文字認識処理部130は、イメージ格納メモリ161に格納されたイメージ情報を取り出し、文字認識位置テーブルDB112から文字認識位置座標及び文字認識カテゴリテーブルDB113から文字認識する際のカテゴリ情報を取り出し、イメージ情報上で文字認識位置に該当する部分をカテゴリ情報に従って文字認識を行なう。このとき、文字認識辞書DB111が参照される。文字認識の結果である認識文字情報は、認識結果格納メモリ162に格納する。
【0027】
構文解析処理部140は、認識結果格納メモリ162に格納された認識文字情報を取り出し、文字認識項目テーブルDB121、文字列ルールテーブルDB122および項目間位置関係テーブルDB123を用いて、文字認識された文字列と文字認識項目とを対応付ける。このとき、1つの項目に複数の認識結果が対応する場合、対応する全てを候補としてあげる。
【0028】
イメージ読取部150は、イメージリーダ200が光学的手段を用いて生成した入力帳票300のイメージ情報を読み取り、イメージ格納メモリ161に格納する。
【0029】
イメージ格納メモリ161および認識結果格納メモリ162は、帳票認識装置100が生成する情報データを一時保存するための記憶手段である。イメージ格納メモリ161は、イメージ読取部150が取得した帳票のイメージ情報を格納する。また、認識結果格納メモリ162は、文字認識処理部130が文字認識を行なって生成された認識文字情報を格納する。
【0030】
データチェックテーブルDB171に格納されたデータチェックテーブルは、文字認識された文字列の確認のため照合する照合データの位置を含むデータチェック情報である。例えば、同一項目の内容を印字したエリアが帳票上の別の位置に存在する場合は、データチェック用としてその位置を指定する。
【0031】
項目確定処理部180は、帳票上に確認用として同一項目の内容が印字されている場合、データチェックテーブルDB171からデータチェック情報を取り出し、データチェック情報の指定するデータと文字認識情報とを照合することにより、文字認識および項目設定が正しいかどうかを確認する。また、1つの項目に複数の認識結果が対応付けられているような場合、最も確からしいものを選択し、対応を確定させる。
【0032】
認識結果表示部190は、認識結果を画面に表示してオペレータに通知する。必要であれば、オペレータがキーボードあるいはマウスにてデータの修正を行なえるようにする。また、文字認識結果をそのまま表示するより、日本語項目等に変換したほうがオペレータの視認性が高まる場合には、変換テーブルを設けて認識結果を変換してもよい。
【0033】
このような構成の帳票認識装置の動作について、マルチペイメントネットワーク(MulitiPayment Network:以下MPNとする)帳票の認識処理を行なう場合で説明する。MPNとは、諸税/公共料金の支払いにおいて、収納機関と金融機関をネットワークで結び、納付者はATM、電話、パソコンなどのチャネルで支払いができ、即時の消込み情報が収納機関に通知されるネットワークを指す。MPN帳票とは、この支払いで必要な情報が印字された帳票をいう。MPN帳票は、帳票設計上の規約に従って作成されており、決済するための情報が印字される領域および印字される文字の種類や項目の配置順など決められている。
【0034】
図3は、MPN帳票の一例である。図3の例のMPN帳票301では、文字認識領域310内に、決済するための情報として、「ご請求金額」欄311、「収納機関番号」欄312、「お客様番号」欄313、「確認番号」欄314などの項目が設けられている。また、帳票には、帳票を発行した収納機関が、発行した帳票による請求に対する支払いが行なわれたかを各社システムでチェック(消込み)するためのOCR文字列、あるいはコンビニエンスストアなどの店舗で支払いを行なうためのバーコードが印刷されているものもある。図3の例では、OCR文字列が文字認識領域310の下に設定されており、OCR文字列の所定の位置に「収納機関番号」確認用のチェックコード321と「ご請求金額」確認用のチェックコード322が印字されている。チェックコードには、対応する項目と同じデータが印字されている。これらの情報は、例えば、次のように規約化されている。
(1)「ご請求金額」は、設定可能な場所が規定されている。
(2)「収納機関番号」は、5桁固定で印字データの種類は規定されている。
(3)「収納機関番号」、「お客様番号」、「確認番号」の順番で設定される。
(4)「確認番号」は、4桁から6桁の数字で印字される。
(5)「ご請求金額」は、1番目のOCR文字列の決まった位置に同じデータが印字される。
【0035】
上記規約の(1)、(2)および(4)は、文字列に関する規約であり、規約はルール化されて、文字列ルールテーブルDB122に登録される。また、規約(3)は、項目間の位置関係に関する規約であり、規約はルール化されて、項目間位置関係テーブルDB123に登録される。さらに、(5)は、データチェック情報であり、データチェックテーブルDB171に登録される。
【0036】
ここで、このようなMPN帳票301について作成される文字認識情報と構文ルール情報およびデータチェック情報について説明する。
図4は、本発明の実施の形態における文字認識情報の一例を示した図である。(A)は文字認識位置テーブル、(B)は文字認識カテゴリテーブルである。
【0037】
(A)文字認識位置テーブルは、文字認識を行なう対象範囲を左上と右下の2座標で表される矩形で指定している。図4の例では、4箇所の対象範囲を示す座標が登録されている。
【0038】
(B)文字認識カテゴリテーブルは、それぞれの対象範囲に印字される文字の特徴より指定される文字種やフォントなどの文字カテゴリが指定される。図4の例では、1は文字種が「数字」で、フォントは「OCR−B」であると指定されている。この指定は、いずれか一方でもよい。例えば、図3に示したMPN帳票301の「ご請求金額」欄311は、文字カテゴリとして、「数字と記号」が指定される。
【0039】
図5は、本発明の実施の形態における構文ルール情報の一例を示した図である。(C)は文字認識項目テーブル、(D)は文字列ルールテーブル、(E)は項目間位置関係テーブルである。
【0040】
(C)文字認識項目テーブルは、帳票上で文字認識を行なう文字認識項目が登録されている。図5の例では、文字認識項目とそのIDが登録されている。例えば、「ご請求金額」にはIDとして10が割り振られている。「収納機関番号」、「お客様番号」および「確認番号」にも同様にIDが割り振られて登録されている。
【0041】
(D)文字列ルールテーブルは、各文字認識項目に設定される文字列ルールが登録されている。図5の例では、「ご請求金額」は、設定される位置が決められており、その位置を指定する座標が登録されている。「収納機関番号」は、5桁固定で印字データの種類が規定されている。また、「確認番号」は、4から6桁に決められている。
【0042】
(E)項目間位置関係テーブルは、各文字認識項目と他の項目との位置関係が登録されている。図5の例では、「収納機関番号」、「お客様番号」および「確認番号」は、右から順に配置されることが示されている。
【0043】
データチェックは、ここではMPM帳票301のOCR文字列およびバーコードを用いて行なうとし、OCR文字列とバーコードの規定に基づいてデータチェック情報を生成する。例えば、OCR文字列の場合は、該当するのは何番目のOCR文字列か、何桁目か、右詰か左詰か、ゼロサプレスはあるかなどが指定される。また、バーコードの場合は、何番目のバーコードか、何桁目か、右詰か左詰か、ゼロサプレスはあるかなどが指定される。
【0044】
このようなMPM帳票301の文字認識処理の動作について説明する。
イメージ読取部150は、イメージリーダ200を用いてMPN帳票301の読み取りを行ない、イメージリーダ200によって生成されたイメージ情報を取り込み、イメージ格納メモリ161に格納する。
【0045】
文字認識処理部130は、イメージ格納メモリ161からイメージ情報を、文字認識位置テーブルDB112から文字認識位置座標を、文字認識カテゴリテーブルDB113から文字認識する際のカテゴリ情報を取り出し、イメージ上で文字認識位置座標に該当する部分をカテゴリ情報(ここでは、数字と記号とする)に従って文字認識する。文字認識された結果であるコードと位置座標から成る認識文字情報は認識結果格納メモリ162に格納される。
【0046】
図6は、本発明の実施の形態における認識文字情報を示した図である。図6の例では、文字認識領域310の範囲内の文字認識結果として、1に「ご請求金額」欄311の「9989」と、印字された位置を示す左上座標と右下座標が登録されている。同様に、2に「収納機関番号」欄312の「50003」、3に「お客様番号」欄313の「98−76543−21098−7」、4に「確認番号」欄314の「128891」が位置座標とともに登録されている。さらに、5に「ご使用月」欄の14と8が、6に「お支払期限」欄の14と10と11が登録されている。カテゴリ情報として数字と記号に限定されているため、数字と記号のみが文字認識される。
【0047】
続いて、構文解析処理部140は、文字認識項目テーブルの各項目と認識結果とを対応付ける処理を行なう。まず、認識結果格納メモリ162から認識文字情報である認識結果のコードと位置座標を1組ずつ取り出し、構文ルール情報を用いて対応する項目を推定する。このとき、1つの項目に複数の認識結果が対応する場合、対応する全てを候補としてあげる。
【0048】
例えば、1の認識文字情報であるコード「9989」と位置座標を文字列ルールテーブルと照合すると、「9989」は「ご請求金額」のルールとして設定された位置範囲と一致するので、「9989」は「ご請求金額」の候補とする。
【0049】
2の認識文字情報であるコード「50003」と位置座標を文字列ルールテーブルと照合すると、これは「収納機関番号」のルールである5桁と一致するので、「50003」は「収納機関番号」の候補とする。さらに、ここで収納機関番号の一覧を示すテーブルが登録されているとする。図7は、本発明の実施の形態における収納機関番号の一覧を示している。「収納機関番号」の候補となった場合、「50003」を収納機関番号の一覧と照合し、一致するものがあるかどうかを判定する。この場合、一致するのものがあるので、「収納機関番号」の候補を継続する。
【0050】
3の認識文字情報であるコード「98−76543−21098−7」と位置座標を文字列ルールテーブルと照合するが、一致するものはない。そこで、さらに、項目間位置関係テーブルを参照すると、「収納機関番号」の右には「お客様番号」が配置されることが規定されている。そこで、「98−76543−21098−7」は「お客様番号」の候補とする。
【0051】
4の認識文字情報であるコード「128891」と位置座標を文字列ルールテーブルと照合すると、これは「確認番号」のルールと一致するので、「128891」は「確認番号」の候補とする。
【0052】
5の認識文字情報であるコード「14と8」と位置座標および6の認識文字情報であるコード「14と10と11」と位置座標は、文字列ルールテーブルと照合しても該当するものがない。また、項目間位置関係テーブルを参照しても定義がないため、どの候補にも該当しない。
【0053】
ここまでの処理により、文字認識された文字列に対応する認識文字項目の候補が設定される。
さらに、項目確定処理部180では、構文ルール情報およびデータチェック情報とを用いて項目の確定を行なう。例えば、「ご請求金額」は、確認用データとして、1番目のOCR文字列の決まった位置に同じデータが印字される。そこで、データチェック情報を参照し、OCR文字列の固定場所のチェックコード322の値と、これまでの「ご請求金額」の候補である「9989」とを比較する。この場合、数値が一致するので、「9989」が「ご請求金額」であると確定させる。
【0054】
また、「収納機関番号」も同様に、チェックコードがOCR文字列の決まった位置に同じデータが印字されるので、OCR文字列の固定場所のチェックコード321とこれまでの「収納機関番号」の候補である「50003」とを比較する。この場合にも、数値が一致するので、「50003」が「収納機関番号」であることを確定させる。さらに、「収納機関番号」が確定したことにより、その右隣に順に並ぶ「お客様番号」と「確認番号」とを確定させる。
【0055】
以上のような手順により、「ご請求金額」、「収納機関番号」、「お客様番号」および「確認番号」が確定する。
上記の説明では、文字認識処理、構文解析処理および項目確定処理を帳票単位で順次行なうとしたが、文字認識領域単位で処理を順次行なうようにすることもできる。
【0056】
次に、本発明の帳票認識方法について説明する。図8は、本発明の実施の形態である帳票認識方法の手順を示したフローチャートである。図2と同じものには同じ番号を付し、説明は省略する。
【0057】
帳票のイメージ情報が生成され、処理が開始される。
[ステップS101] 文字認識位置テーブルDB112の文字認識位置情報を参照して、イメージ情報の指定座標(x、y)から文字列を読み込む。
【0058】
[ステップS102] 文字認識処理を行なう。文字認識カテゴリテーブルDB113および文字認識辞書DB111の情報を参照して、読み込まれた文字列の文字認識を行なう。文字認識されたコードと位置座標を認識文字情報として生成する。
【0059】
[ステップS103] 構文解析処理を行なう。認識文字情報を取り込み、文字認識項目テーブルDB121、文字列ルールテーブルDB122および項目間位置関係テーブルDB123の情報を参照して文字認識項目との対応付けを行なう。
【0060】
[ステップS104] 項目確定処理を行なう。ステップS103の処理により対応付けられた文字認識されたコードと文字認識項目との対応関係をデータチェックテーブルDB171の情報を用いて確認し、対応関係を確定させる。このとき、必要に応じて、項目間位置関係テーブルDB123および文字列ルールテーブルDB123の情報を参照する。ステップS103の処理により1つのコードに対して複数の文字認識項目が対応付けられた場合には、チェック処理を行なって最も確からしい項目を選択する。
【0061】
[ステップS105] 全体対象範囲の処理が終了したかどうかを判定する。終了している場合には処理を終了し、終了していない場合には、ステップS101に戻って、次の座標の文字列読み込みからの処理を行なう。
【0062】
このように、構文ルール情報やデータチェック情報を用いて文字認識項目を推定し、最も確からしい項目を選択するため、認識不能な項目を減らすことができる。例えば、文字認識処理の認識結果に認識できない文字が存在する場合であっても、適用可能なルールのみを適用して文字認識項目を推定し、項目を確定させることができる。
【0063】
なお、上記の処理機能は、コンピュータによって実現することができる。その場合、帳票認識装置が有すべき機能の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリなどがある。磁気記録装置には、ハードディスク装置(HDD)、フレキシブルディスク(FD)、磁気テープなどがある。光ディスクには、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)などがある。光磁気記録媒体には、MO(Magneto-Optical disk)などがある。
【0064】
プログラムを流通させる場合には、たとえば、そのプログラムが記録されたDVD、CD−ROMなどの可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。
【0065】
プログラムを実行するコンピュータは、たとえば、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送される毎に、逐次、受け取ったプログラムに従った処理を実行することもできる。
【0066】
(付記1) 光学的に読み取った帳票のイメージ情報から所定の文字認識項目の文字認識を行なう帳票認識装置において、
前記帳票における文字認識の対象範囲の位置指定を含む文字認識情報を記憶する文字認識情報記憶手段と、
前記イメージ情報を取得し、前記文字認識情報に基づいて前記イメージ情報から前記文字認識の対象範囲の情報を抽出して文字認識を行なう文字認識手段と、
前記文字認識の対象範囲の文字列によって表される文字認識項目および前記対象範囲の文字列より成る構文についての規定を含む構文ルール情報を記憶する構文ルール情報記憶手段と、
前記構文ルール情報に基づいて前記文字認識手段によって認識された文字列より成る構文を解析し、前記文字認識項目との対応付けを行なう構文解析手段と、
を具備することを特徴とする帳票認識装置。
【0067】
(付記2) 前記文字認識情報記憶手段は、前記文字認識情報として前記文字認識の対象範囲にある文字を規定する文字認識カテゴリ情報を含み、
前記文字認識手段は、前記文字認識カテゴリ情報を用いて前記文字認識の対象範囲にある文字を特定することを特徴とする付記1記載の帳票認識装置。
【0068】
(付記3) 前記構文ルール情報記憶手段は、前記構文ルール情報として前記文字認識項目間の位置関係を規定する項目間位置関係ルールを含み、
前記構文解析手段は、前記項目間位置関係ルールに基づいて前記構文を解析し、前記文字認識項目との対応付けを行なうことを特徴とする付記1記載の帳票認識装置。
【0069】
(付記4) 前記構文解析手段は、前記構文ルール情報のうち適用可能なもののみを適用して前記文字認識項目との対応付けを行なうことを特徴とする付記1記載の帳票認識装置。
【0070】
(付記5) 前記文字認識項目ごとに前記文字認識手段により得られた前記文字認識結果と照合する照合データの位置を含むデータチェック情報を記憶するデータチェック情報記憶手段と、
前記データチェック情報を用いて前記文字認識手段により特定された前記文字認識結果を確認し、前記文字認識項目の前記文字認識の結果を確定する項目確定手段と、
を具備することを特徴とする付記1記載の帳票認識装置。
【0071】
(付記6) 光学的に読み取った帳票のイメージ情報から所定の文字認識項目の文字認識を行なう帳票認識方法において、
予め前記帳票における文字認識の対象範囲の位置指定を含む文字認識情報と、前記文字認識の対象範囲の文字列によって表される文字認識項目および前記対象範囲の文字列より成る構文についての規定を含む構文ルール情報と、を記憶するステップと、
前記イメージ情報を取得し、前記文字認識情報に基づいて前記イメージ情報から前記文字認識の対象範囲の情報を抽出して文字認識を行なうステップと、
前記文字認識が行なわれた前記文字認識の対象範囲の文字列より成る構文を前記構文ルール情報に基づいて解析し、前記文字認識項目との対応付けを行なうステップと、
を具備することを特徴とする帳票認識方法。
【0072】
(付記7) コンピュータによって光学的に読み取った帳票のイメージ情報から所定の文字認識項目の文字認識を行なうためのプログラムであって、
コンピュータに、
予め前記帳票における文字認識の対象範囲の位置指定を含む文字認識情報と、前記文字認識の対象範囲の文字列によって表される文字認識項目および前記対象範囲の文字列より成る構文についての規定を含む構文ルール情報と、を記憶するステップと、
前記イメージ情報を取得し、前記文字認識情報に基づいて前記イメージ情報から前記文字認識の対象範囲の情報を抽出して文字認識を行なうステップと、
前記文字認識が行なわれた前記文字認識の対象範囲の文字列より成る構文を前記構文ルール情報に基づいて解析し、前記文字認識項目との対応付けを行なうステップと、
を実行させることを特徴とするプログラム。
【0073】
【発明の効果】
以上説明したように本発明では、帳票の対象範囲の文字認識に用いる文字認識情報と、構文ルール情報とを用いて所定の文字認識項目の文字認識を行なう。構文ルール情報と文字認識情報は、所定の記憶手段に格納されており、容易に変更が可能である。このため、読み取る帳票数が増える場合の情報変更にも容易に対応することができる。また、文字認識情報と構文ルール情報とは、定義体のように帳票ごとに用意する必要がない等の利点もある。
【図面の簡単な説明】
【図1】本発明の概要を示した構成図である。
【図2】本発明の実施の形態の構成図である。
【図3】MPN帳票の一例である。
【図4】本発明の実施の形態における文字認識情報の一例を示した図である。
【図5】本発明の実施の形態における構文ルール情報の一例を示した図である。
【図6】本発明の実施の形態における認識文字情報を示した図である。
【図7】本発明の実施の形態における収納機関番号の一覧を示している。
【図8】本発明の実施の形態である帳票認識方法の手順を示したフローチャートである。
【図9】帳票と帳票の特徴を示した定義体の一例を示した図である。
【符号の説明】
1 文字認識情報記憶手段
2 構文ルール情報記憶手段
3 文字認識手段
4 構文解析手段
100 帳票認識装置
111 文字認識辞書DB
112 文字認識位置テーブルDB
113 文字認識カテゴリテーブルDB
121 文字認識項目テーブルDB
122 文字列ルールテーブルDB
123 項目間位置関係テーブルDB
130 文字認識処理部
140 構文解析処理部
150 イメージ読取部
161 イメージ格納メモリ
162 認識結果格納メモリ
171 データチェックテーブルDB
180 項目確定処理部
190 認識結果表示部
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a form recognition apparatus and a form recognition method, and more particularly to a form recognition apparatus and a form recognition method for performing character recognition of a predetermined character recognition item from image information of a form optically read.
[0002]
[Prior art]
Conventionally, a form recognition device that optically reads information printed on a form as image information and processes the read image information to recognize characters printed on the form to improve efficiency of the form processing operation. Is used.
[0003]
Such a form recognition apparatus is required not only to process a large number of forms of the same type but also to process forms of various formats. For this reason, for example, a form is identified by a ruled line printed on the form, a form identification code, and the like, and recognition processing of the printed characters is performed. Furthermore, using a figure database in which figures indicating the characteristics of a plurality of forms are registered, and an identification code database in which characters indicating the characteristics of a plurality of forms are registered, both the figures and the characters are collated. There is a form identification device that improves identification accuracy by identifying forms (for example, see Patent Document 1).
[0004]
Conventional form identification processing and character recognition processing are performed based on a definition body in which the characteristics of the form are defined. FIG. 9 is a diagram illustrating an example of a form and a definition body indicating the characteristics of the form. In the example of FIG. 9, the form 1000 has a form identification code 1001 printed at coordinates (x, y) apart from the upper left of the form by x in the horizontal axis direction and y in the vertical axis direction. Can be identified.
[0005]
The term "definition" refers to a definition of information for specifying the type of a form, a rule for performing character recognition, and the like, and is incorporated in the form recognition device. For example, the definition of ruled lines, figures, and the like indicating the characteristics of a form, the number of digits of characters, and characteristics (only numbers, etc.) are defined. In the example of FIG. 9, the definition body 1003 includes upper left coordinates at which the code of the form identification code 1001 starts, an identification code, a form ID corresponding to the identification code, and the like.
[0006]
In such a form recognition apparatus, a program for performing form recognition and character recognition processing based on the definition body 1003 is created and stored in the apparatus. Further, a part of the definition body may be stored as a database in a storage device in the device, and the program may refer to the definition as appropriate. By executing these programs on a computer, a form recognition process and a character recognition process are realized.
[0007]
[Patent Document 1]
JP 2001-175882 A
[0008]
[Problems to be solved by the invention]
However, the conventional form recognition device and form recognition method have a problem that a definition body must be created for each form.
[0009]
As described above, in the conventional form recognition apparatus and its form recognition method, the processing functions are realized by executing, on a computer, a program created based on a definition body indicating the characteristics of each form. For this reason, there has been a problem that when the types of forms to be read are increased, the amount of work for creating the definition body is greatly increased. In recent years, the form format has been standardized, and there are many forms in a similar format. However, it is necessary to create a definition body for all similar forms. For example, when processing a plurality of forms in which the same item is described, if the printing position of the item is slightly different for each form, a definition body has to be created for each form. As described above, a large amount of labor is required for creating a definition body, which has been an obstacle in increasing the number of forms to be recognized.
[0010]
Further, since the program for realizing the form recognition and the character recognition processing in the form recognition device is created based on the definition body, the definition defined by the definition body may be incorporated in the control statement. . In the example of the definition body 1003 in FIG. 9, since the coordinates on which the identification code is printed are the same, “read the identification code from the coordinates (x1, y1)” is incorporated in the control statement for controlling the reading of the identification code. Can be. In such a case, when adding a form having slightly different coordinates, it is necessary to change the control statement. As described above, not only the work of creating the definition body, but also a complicated work such as the need to modify the program accompanying the creation of the definition body has to be performed.
[0011]
The present invention has been made in view of such a point, and an object of the present invention is to provide a form recognition apparatus and a form recognition method that can easily cope with addition or change of a form type.
[0012]
[Means for Solving the Problems]
In the present invention, in order to solve the above problems, a form recognition device as shown in FIG. 1 is provided. In the form recognition apparatus according to the present invention, the character recognition information storage means 1 stores character recognition information including the position designation of a target range on a form for performing character recognition, and the syntax rule information storage means 2 stores a character string of the target range by a character string of the target range. It stores syntax rule information including a rule on a syntax composed of a character recognition item to be represented and a character string in a target range. The character recognition means 3 inputs image information of a form optically read by an image scanner, extracts image information of a target range based on the character recognition information read from the character recognition information storage means 1, and performs character recognition. Do. The result of the character recognition is sent to the parsing means 4. The syntax analysis unit 4 analyzes the character string in the target range as the character recognition result based on the syntax rule information, and associates the character string with the character recognition item. In this way, by associating the character-recognized syntax with the character recognition item based on the syntax rule information, character recognition relating to a predetermined character recognition item is performed, thereby performing form recognition.
[0013]
Further, in order to solve the above-mentioned problem, character recognition information and syntax rule information are set in advance, information of a target range of the acquired image information is extracted, and character recognition is performed using the character recognition information, and syntax By associating a character string that has been character-recognized using rule information with a character recognition item, a form recognition method for performing character recognition of a predetermined character recognition item is provided.
[0014]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings. First, the concept of the invention applied to the embodiments will be described, and then the embodiments to which the invention is applied will be described.
[0015]
FIG. 1 is a conceptual diagram of the invention applied to the embodiment of the present invention.
A form recognition apparatus according to the present invention includes: a character recognition information storage unit that stores character recognition information used for character recognition; a syntax rule information storage unit that stores syntax rule information for a syntax composed of a character string; And a syntax analysis unit 4 for associating a character string whose character has been recognized with a character recognition item.
[0016]
The character recognition information storage unit 1 is a storage unit that stores information necessary for character recognition. For example, position information specifying the position of a target range for performing character recognition, a character recognition dictionary referred to during character recognition, and the like are stored. Further, character information such as a character type and a font is stored as needed to improve the accuracy of character recognition.
[0017]
The syntax rule information storage means 2 is a storage means for storing rule information on a syntax composed of a character string in a target range in which a character is recognized. For example, it stores a character recognition item represented by a syntax in which character recognition has been performed, a rule on a character string, and the like. The rules for character strings include the number of digits and character type of the character string. Further, if necessary, information on inter-item positional relation rules defining the positional relation between the character recognition items is stored.
[0018]
The character recognizing means 3 extracts image information corresponding to a predetermined character recognition target range using the character recognizing information stored in the character recognizing information storing means 1 and determines what characters are contained therein. I do. The result of the character recognition obtained in this way is sent to the syntax analysis means 4 as recognized character information.
[0019]
The syntax analysis unit 4 inputs recognition character information, and recognizes a character string in the target range recognized by the character recognition unit 3 using the syntax rules stored in the syntax rule information storage unit 2. Make correspondence with items. At this time, the accuracy of the association is increased by using the rule regarding the character string and the information on the positional relationship between items.
[0020]
The operation of the form recognition device having such a configuration and the form recognition method will be described.
In advance, the character recognition information storage means 1 stores character recognition information necessary for performing character recognition of a target form. Similarly, the syntax rule information storage means 2 stores syntax rule information necessary for associating a character string whose character has been recognized with a character recognition item.
[0021]
When the image information of the target form is input, the character recognition means 3 performs character recognition using the character recognition information stored in the character recognition information storage means 1. Based on the position information specifying the position of the target range included in the character recognition information, the image information of the target range is extracted, and the characters in the target range are specified by referring to the character recognition dictionary. At this time, character information such as a character type and a character shape is referred to. Recognized character information obtained by character recognition is sent to the syntax analysis means 4. The syntax analysis unit 4 acquires the recognition character information, and uses the syntax rule information stored in the syntax rule information storage unit 2 to associate the character string of the target range in which the character is recognized with the character recognition item. In the association, the character recognition item corresponding to the character string in the target range is estimated using an applicable rule among the registered syntax rule information. At this time, for example, coordinates indicating the position of the character recognition item, the number of digits representing the characteristics of the character recognition item, or the positional relationship with other character recognition items are registered as a character string rule, and association is performed using these. Do.
[0022]
In this way, the character recognition item of the form is linked with the recognized character information of the recognized character, and the form recognition process ends.
In a conventional method using a definition body, correspondence with a character recognition item is performed by coordinates specifying a position of a target range defined by the definition body. For this reason, coordinates must be set for all character recognition items. For example, even when similar forms are printed at slightly different positions, a definition body has to be set for each of them. According to the present invention, the read recognition character information and the character recognition item can be associated with each other by the rules representing the characteristics of the character recognition items. It becomes possible. As described above, since it is not necessary to create a definition body for each form, it is possible to easily cope with addition or change of the form type.
[0023]
Next, an embodiment to which the present invention is applied will be described. FIG. 2 is a configuration diagram of the embodiment of the present invention.
The form recognition apparatus 100 according to the present invention includes an image reading unit 150 that obtains image information of an input form 300, a character recognition processing unit 130 that performs character recognition of the obtained image information, and a syntax that performs syntax analysis of the recognized character string. The system includes an analysis processing unit 140, an item determination processing unit 180 for checking and determining the analyzed syntax, and a recognition result display unit 190 for displaying a recognized result. Further, as character recognition information used for character recognition, a character recognition dictionary database (hereinafter, referred to as DB) 111 for storing a character recognition dictionary, a character recognition position table DB 112 for storing a character recognition position for designating a character recognition range, and A character recognition category table DB 113 that stores character recognition categories related to character data is provided. Similarly, as syntax rule information, a character recognition item table DB 121 storing character recognition items, a character string rule table DB 122 storing rules related to character strings, and an inter-item positional relationship table DB 123 storing rules for positional relationships between items are included. And a data check table DB 171 for storing data check information on check data for item confirmation. The image processing apparatus further includes an image storage memory 161 for temporarily storing the acquired image information and a recognition result storage memory 162 for temporarily storing the result of character recognition.
[0024]
The character recognition dictionary stored in the character recognition dictionary DB 111 is dictionary data used for comparison with the character to be recognized. When the type of the form is limited, only characters that can be used in the form need be registered. Further, the character recognition position table stored in the character recognition position table DB 112 specifies a position where character recognition is to be performed on the image information by a rectangle indicated by two points of start coordinates and end coordinates. For example, the upper left X and Y coordinates of the rectangle and the lower right X and Y coordinates are specified. The character recognition category table stored in the character recognition category table DB 113 specifies a category for performing character recognition for each rectangle specified in the character recognition position table. The category is information indicating the characteristics of the character, and represents the character type (number, symbol, alphabet, etc.) of the recognized character, font (Gothic, Mincho), and the like. It is also possible to specify a combination of numbers, symbols, alphabetic characters, etc. in one character recognition area. Further, it is possible to specify whether the recognition result is valid or invalid for each character type. For example, it is possible to specify that only “*” is valid as a symbol, and invalid if recognized as another symbol.
[0025]
The character recognition item table stored in the character recognition item table DB 121 is a table that specifies items to be recognized. Character recognition items can be specified by IDs in association with IDs such as numbers. The character string rule table stored in the character string rule table DB 122 is a rule of a character string representing a character recognition item, and the number of digits of the character recognition item, the category, and the corresponding item are printed for each character recognition item. Specify the location to be used. The inter-item positional relationship table stored in the inter-item positional relationship table DB 123 specifies the positional relationship between items such as the order in which they are arranged on a form when there are a plurality of character recognition items. For example, when the items A, B, and C exist, it is ruled that the order is A → B → C on the form. The arrangement of the items can be specified vertically or horizontally.
[0026]
The character recognition processing unit 130 extracts the image information stored in the image storage memory 161, extracts the character recognition position coordinates from the character recognition position table DB 112 and the category information for character recognition from the character recognition category table DB 113, Performs character recognition on the portion corresponding to the character recognition position according to the category information. At this time, the character recognition dictionary DB 111 is referred. Recognized character information as a result of character recognition is stored in a recognition result storage memory 162.
[0027]
The syntactic analysis processing unit 140 extracts the recognized character information stored in the recognition result storage memory 162, and uses the character recognition item table DB121, the character string rule table DB 122, and the inter-item positional relationship table DB 123 to execute the character recognition on the character string. Is associated with the character recognition item. At this time, when a plurality of recognition results correspond to one item, all corresponding items are given as candidates.
[0028]
The image reading unit 150 reads the image information of the input form 300 generated by the image reader 200 using optical means, and stores the image information in the image storage memory 161.
[0029]
The image storage memory 161 and the recognition result storage memory 162 are storage means for temporarily storing information data generated by the form recognition device 100. The image storage memory 161 stores the image information of the form acquired by the image reading unit 150. The recognition result storage memory 162 stores recognition character information generated by the character recognition processing unit 130 performing character recognition.
[0030]
The data check table stored in the data check table DB 171 is data check information including the position of collation data to be collated for confirmation of a character string whose character has been recognized. For example, when the area where the contents of the same item are printed exists at another position on the form, the position is designated for data check.
[0031]
When the contents of the same item are printed on the form for confirmation, the item confirmation processing unit 180 extracts the data check information from the data check table DB 171 and compares the data specified by the data check information with the character recognition information. This confirms whether character recognition and item settings are correct. When a plurality of recognition results are associated with one item, the most likely one is selected and the correspondence is determined.
[0032]
The recognition result display section 190 displays the recognition result on the screen and notifies the operator. If necessary, allow the operator to modify the data with the keyboard or mouse. In addition, when the visibility of the operator is improved by converting to a Japanese item or the like rather than displaying the character recognition result as it is, a recognition table may be provided to convert the recognition result.
[0033]
The operation of the form recognition apparatus having such a configuration will be described in the case of performing recognition processing of a multi-payment network (MulitiPayment Network: hereinafter referred to as MPN) form. MPN is a network that connects the depository and the financial institution for payment of taxes / utilities via a network, allows the payer to make payments via channels such as ATMs, telephones, and personal computers, and notifies the depository of immediate application information. Refers to the network. The MPN form is a form on which information necessary for this payment is printed. The MPN form is created in accordance with the form design rules, and the area in which information for settlement is printed, the type of characters to be printed, and the arrangement order of items are determined.
[0034]
FIG. 3 is an example of an MPN form. In the MPN form 301 in the example of FIG. 3, in the character recognition area 310, as information for settlement, a “bill amount” column 311, a “storage institution number” column 312, a “customer number” column 313, a “confirmation number” Column 314 and the like are provided. Also, the form may include an OCR character string for the storage organization that issued the form to check (apply) in the system of each company whether payment for the issued form has been made, or a payment at a store such as a convenience store. Some are printed with a barcode to do so. In the example of FIG. 3, the OCR character string is set below the character recognition area 310, and a check code 321 for confirming a "storage institution number" and a check code 321 for confirming a "billed amount" are provided at predetermined positions of the OCR character string. The check code 322 is printed. The same data as the corresponding item is printed on the check code. These pieces of information are standardized as follows, for example.
(1) The place where the "billing amount" can be set is specified.
(2) The “storage institution number” is fixed at 5 digits, and the type of print data is specified.
(3) The numbers are set in the order of “storage institution number”, “customer number”, and “confirmation number”.
(4) The “confirmation number” is printed with four to six digits.
(5) The same data is printed at the determined position of the first OCR character string for the “billing amount”.
[0035]
The above rules (1), (2) and (4) are rules relating to character strings. The rules are formed into rules and registered in the character string rule table DB 122. The rule (3) is a rule relating to a positional relationship between items. The rule is made into a rule and registered in the inter-item positional relationship table DB123. Further, (5) is data check information, which is registered in the data check table DB 171.
[0036]
Here, character recognition information, syntax rule information, and data check information created for such an MPN form 301 will be described.
FIG. 4 is a diagram illustrating an example of the character recognition information according to the embodiment of the present invention. (A) is a character recognition position table, and (B) is a character recognition category table.
[0037]
(A) In the character recognition position table, a target range for performing character recognition is specified by a rectangle represented by two coordinates of upper left and lower right. In the example of FIG. 4, coordinates indicating four target ranges are registered.
[0038]
(B) In the character recognition category table, character categories such as character types and fonts specified by the characteristics of characters printed in each target range are specified. In the example of FIG. 4, 1 designates that the character type is “numeric” and the font is “OCR-B”. This designation may be made for either one. For example, in the “billed amount” column 311 of the MPN form 301 shown in FIG. 3, “numbers and symbols” are designated as character categories.
[0039]
FIG. 5 is a diagram showing an example of syntax rule information according to the embodiment of the present invention. (C) is a character recognition item table, (D) is a character string rule table, and (E) is an item positional relationship table.
[0040]
(C) In the character recognition item table, character recognition items for performing character recognition on a form are registered. In the example of FIG. 5, character recognition items and their IDs are registered. For example, 10 is assigned to “Billing amount” as an ID. Similarly, IDs are assigned to “storage organization number”, “customer number” and “confirmation number” and registered.
[0041]
(D) The character string rule table registers character string rules set for each character recognition item. In the example of FIG. 5, the position to be set for “bill amount” is determined, and coordinates specifying the position are registered. The “storage institution number” is fixed at five digits and defines the type of print data. The “confirmation number” is determined from 4 to 6 digits.
[0042]
(E) The positional relationship between items stores the positional relationship between each character recognition item and other items. In the example of FIG. 5, “storage institution number”, “customer number”, and “confirmation number” are shown to be arranged in order from the right.
[0043]
Here, the data check is performed using the OCR character string and the barcode of the MPM form 301, and the data check information is generated based on the OCR character string and the barcode. For example, in the case of an OCR character string, the number of the corresponding OCR character string, the number of digits, right-justified or left-justified, and whether or not there is zero suppression are specified. In the case of a barcode, the number of the barcode, the number of the digit, whether the barcode is right-justified or left-justified, whether there is zero suppression, and the like are specified.
[0044]
The operation of such a character recognition process of the MPM form 301 will be described.
The image reading unit 150 uses the image reader 200 to read the MPN form 301, takes in the image information generated by the image reader 200, and stores the image information in the image storage memory 161.
[0045]
The character recognition processing unit 130 extracts image information from the image storage memory 161, character recognition position coordinates from the character recognition position table DB 112, and category information for character recognition from the character recognition category table DB 113. The character corresponding to the coordinates is recognized according to the category information (here, numbers and symbols). Recognition character information including a code and position coordinates as a result of character recognition is stored in a recognition result storage memory 162.
[0046]
FIG. 6 is a diagram showing recognized character information according to the embodiment of the present invention. In the example of FIG. 6, “9989” in the “billing amount” column 311 and upper left coordinates and lower right coordinates indicating the printed position are registered as 1 as a character recognition result within the range of the character recognition area 310. I have. Similarly, “50003” in the “storage institution number” column 312 is located at 2, “98-76543-21098-7” is located at the “customer number” column 313, “1288891” is located at the “confirmation number” column 314 is located at 4, It is registered with the coordinates. Further, 14 and 8 in the “month of use” column are registered in 5, and 14, 10 and 11 in the “payment date” column are registered in 6. Since the category information is limited to numbers and symbols, only the numbers and symbols are recognized.
[0047]
Subsequently, the syntax analysis processing unit 140 performs a process of associating each item of the character recognition item table with the recognition result. First, a set of a code and a position coordinate of a recognition result, which is recognition character information, are extracted from the recognition result storage memory 162, and a corresponding item is estimated using syntax rule information. At this time, when a plurality of recognition results correspond to one item, all corresponding items are given as candidates.
[0048]
For example, when the code “9989”, which is the recognition character information of 1, and the position coordinates are compared with the character string rule table, “9989” matches the position range set as the rule of “bill amount”. Is a candidate for the “billing amount”.
[0049]
When the code "50003" which is the recognition character information of No. 2 and the position coordinates are compared with the character string rule table, this matches the five digits which are the rule of "storage institution number", so "50003" is "storage institution number" As a candidate. Further, it is assumed that a table showing a list of storage organization numbers is registered here. FIG. 7 shows a list of storage organization numbers in the embodiment of the present invention. When the candidate of “storage institution number” becomes a candidate, “50003” is collated with the list of storage institution numbers, and it is determined whether or not there is a match. In this case, since there is a match, the candidate of “storage institution number” is continued.
[0050]
The position coordinates are compared with the code "98-76543-21098-7", which is the recognized character information of No. 3, with the character string rule table, but there is no match. Therefore, referring to the inter-item positional relationship table, it is specified that the "customer number" is arranged to the right of the "storage institution number". Therefore, “98-76543-21098-7” is a candidate for the “customer number”.
[0051]
When the code "128891", which is the recognition character information of No. 4, and the position coordinates are compared with the character string rule table, this matches the rule of "confirmation number", so "128891" is a candidate for "confirmation number".
[0052]
The codes “14 and 8” and the position coordinates, which are the recognized character information of 5, and the codes “14, 10, and 11” and the position coordinates, which are the recognized character information of 6, are the same even if they are matched with the character string rule table Absent. In addition, since there is no definition even when referring to the inter-item positional relationship table, it does not correspond to any candidate.
[0053]
By the processing up to this point, a candidate for a recognized character item corresponding to the character string whose character has been recognized is set.
Further, the item determination processing unit 180 determines the item using the syntax rule information and the data check information. For example, the same billing amount is printed at the determined position of the first OCR character string as confirmation data. Therefore, the value of the check code 322 at the fixed location of the OCR character string is compared with “9989”, which is a candidate for the “billed amount”, by referring to the data check information. In this case, since the numerical values match, "9989" is determined to be the "billed amount".
[0054]
Similarly, the same data is printed for the “storage institution number” at the determined position of the OCR character string as the check code, so that the check code 321 at the fixed location of the OCR character string and the “storage institution number” so far are stored. The candidate “50003” is compared. Also in this case, since the numerical values match, it is determined that “50003” is the “housing institution number”. Further, when the “storage institution number” is determined, the “customer number” and the “confirmation number” arranged in order on the right side thereof are determined.
[0055]
According to the above procedure, the “billing amount”, “storage institution number”, “customer number”, and “confirmation number” are determined.
In the above description, the character recognition processing, the syntax analysis processing, and the item determination processing are sequentially performed in units of a form. However, the processing may be sequentially performed in units of a character recognition area.
[0056]
Next, the form recognition method of the present invention will be described. FIG. 8 is a flowchart showing the procedure of the form recognition method according to the embodiment of the present invention. The same components as those in FIG. 2 are denoted by the same reference numerals, and description thereof is omitted.
[0057]
The image information of the form is generated, and the process is started.
[Step S101] Referring to the character recognition position information in the character recognition position table DB 112, a character string is read from the designated coordinates (x, y) of the image information.
[0058]
[Step S102] Character recognition processing is performed. With reference to information in the character recognition category table DB 113 and the character recognition dictionary DB 111, character recognition of the read character string is performed. The character recognition code and position coordinates are generated as recognition character information.
[0059]
[Step S103] A syntax analysis process is performed. Recognition character information is fetched, and it is associated with a character recognition item by referring to information in a character recognition item table DB 121, a character string rule table DB 122, and an inter-item positional relationship table DB 123.
[0060]
[Step S104] An item confirmation process is performed. The correspondence between the character-recognized code and the character recognition item associated by the processing in step S103 is confirmed using the information of the data check table DB 171 to determine the correspondence. At this time, information of the item positional relationship table DB 123 and the character string rule table DB 123 is referred to as necessary. If a plurality of character recognition items are associated with one code by the process of step S103, a check process is performed to select the most likely item.
[0061]
[Step S105] It is determined whether the processing of the entire target range has been completed. If the processing has been completed, the processing is terminated. If the processing has not been completed, the flow returns to step S101 to perform processing from reading the character string at the next coordinate.
[0062]
As described above, the character recognition items are estimated using the syntax rule information and the data check information, and the most probable item is selected, so that the number of unrecognizable items can be reduced. For example, even when there is an unrecognizable character in the recognition result of the character recognition processing, the character recognition item can be estimated by applying only applicable rules, and the item can be fixed.
[0063]
Note that the above processing functions can be realized by a computer. In this case, a program is provided that describes the processing contents of the functions that the form recognition device should have. By executing the program on a computer, the above processing functions are realized on the computer. The program describing the processing content can be recorded on a computer-readable recording medium. Computer-readable recording media include magnetic recording devices, optical disks, magneto-optical recording media, and semiconductor memories. The magnetic recording device includes a hard disk device (HDD), a flexible disk (FD), a magnetic tape, and the like. The optical disc includes a DVD (Digital Versatile Disc), a DVD-RAM (Random Access Memory), a CD-ROM (Compact Disc Read Only Memory), and a CD-R (Recordable) / RW (ReWritable). The magneto-optical recording medium includes an MO (Magneto-Optical disk) and the like.
[0064]
When distributing the program, for example, portable recording media such as DVDs and CD-ROMs on which the program is recorded are sold. Alternatively, the program may be stored in a storage device of a server computer, and the program may be transferred from the server computer to another computer via a network.
[0065]
The computer that executes the program stores, for example, the program recorded on the portable recording medium or the program transferred from the server computer in its own storage device. Then, the computer reads the program from its own storage device and executes processing according to the program. The computer can also read the program directly from the portable recording medium and execute processing according to the program. Further, the computer may execute the processing according to the received program each time the program is transferred from the server computer.
[0066]
(Supplementary Note 1) In a form recognition device for performing character recognition of a predetermined character recognition item from image information of a form optically read,
Character recognition information storage means for storing character recognition information including a position designation of a target range of character recognition in the form,
Character recognition means for acquiring the image information, extracting character information of the target range of the character recognition from the image information based on the character recognition information, and performing character recognition,
Syntax rule information storage means for storing syntax rule information including a character recognition item represented by a character string in the target range of the character recognition and a syntax comprising a character string in the target range,
Syntax analysis means for analyzing a syntax consisting of a character string recognized by the character recognition means based on the syntax rule information, and associating the syntax with the character recognition item;
A form recognition device comprising:
[0067]
(Supplementary Note 2) The character recognition information storage unit includes, as the character recognition information, character recognition category information that specifies a character in a target range of the character recognition,
2. The form recognition apparatus according to claim 1, wherein the character recognizing means specifies a character in a target range of the character recognition using the character recognition category information.
[0068]
(Supplementary Note 3) The syntax rule information storage unit includes, as the syntax rule information, an inter-item positional relationship rule that defines a positional relationship between the character recognition items,
2. The form recognition apparatus according to claim 1, wherein the syntax analysis means analyzes the syntax based on the inter-item positional relationship rule and associates the syntax with the character recognition item.
[0069]
(Supplementary Note 4) The form recognition apparatus according to Supplementary Note 1, wherein the syntax analysis unit performs correspondence with the character recognition item by applying only applicable syntax rules information.
[0070]
(Supplementary Note 5) Data check information storage means for storing data check information including a position of collation data to be collated with the character recognition result obtained by the character recognition means for each of the character recognition items;
Item confirmation means for confirming the character recognition result specified by the character recognition means using the data check information, and for confirming the character recognition result of the character recognition item,
2. The form recognition device according to claim 1, further comprising:
[0071]
(Supplementary Note 6) In a form recognition method for performing character recognition of a predetermined character recognition item from image information of a form optically read,
Character recognition information including a position designation of a target range of the character recognition in the form in advance, and a specification of a character recognition item represented by a character string of the target range of the character recognition and a syntax including a character string of the target range are included. Storing syntax rule information;
Obtaining the image information, performing character recognition by extracting information of a target range of the character recognition from the image information based on the character recognition information,
Analyzing the syntax composed of the character strings in the target range of the character recognition in which the character recognition is performed based on the syntax rule information, and associating the syntax with the character recognition item;
A form recognition method comprising:
[0072]
(Supplementary Note 7) A program for performing character recognition of a predetermined character recognition item from image information of a form optically read by a computer,
On the computer,
Character recognition information including a position designation of a target range of the character recognition in the form in advance, and a specification of a character recognition item represented by a character string of the target range of the character recognition and a syntax including a character string of the target range are included. Storing syntax rule information;
Obtaining the image information, performing character recognition by extracting information of a target range of the character recognition from the image information based on the character recognition information,
Analyzing the syntax composed of the character strings in the target range of the character recognition in which the character recognition is performed based on the syntax rule information, and associating the syntax with the character recognition item;
A program characterized by executing
[0073]
【The invention's effect】
As described above, in the present invention, character recognition of a predetermined character recognition item is performed using character recognition information used for character recognition of a target range of a form and syntax rule information. The syntax rule information and the character recognition information are stored in a predetermined storage means, and can be easily changed. Therefore, it is possible to easily cope with information change when the number of forms to be read increases. In addition, there is an advantage that the character recognition information and the syntax rule information do not need to be prepared for each form as in a definition body.
[Brief description of the drawings]
FIG. 1 is a configuration diagram showing an outline of the present invention.
FIG. 2 is a configuration diagram of an embodiment of the present invention.
FIG. 3 is an example of an MPN form.
FIG. 4 is a diagram showing an example of character recognition information according to the embodiment of the present invention.
FIG. 5 is a diagram showing an example of syntax rule information according to the embodiment of the present invention.
FIG. 6 is a diagram showing recognized character information according to the embodiment of the present invention.
FIG. 7 shows a list of storage organization numbers in the embodiment of the present invention.
FIG. 8 is a flowchart showing a procedure of a form recognition method according to an embodiment of the present invention.
FIG. 9 is a diagram illustrating an example of a form and a definition body indicating characteristics of the form.
[Explanation of symbols]
1 Character recognition information storage means
2 Syntax rule information storage means
3 Character recognition means
4 Syntax analysis means
100 form recognition device
111 Character Recognition Dictionary DB
112 Character Recognition Position Table DB
113 Character Recognition Category Table DB
121 Character Recognition Item Table DB
122 Character string rule table DB
123 item positional relationship table DB
130 Character recognition processing unit
140 syntax analysis unit
150 Image reading unit
161 Image storage memory
162 recognition result storage memory
171 Data Check Table DB
180 Item confirmation processing section
190 Recognition result display

Claims (3)

光学的に読み取った帳票のイメージ情報から所定の文字認識項目の文字認識を行なう帳票認識装置において、
前記帳票における文字認識の対象範囲の位置指定を含む文字認識情報を記憶する文字認識情報記憶手段と、
前記イメージ情報を取得し、前記文字認識情報に基づいて前記イメージ情報から前記文字認識の対象範囲の情報を抽出して文字認識を行なう文字認識手段と、
前記文字認識の対象範囲の文字列によって表される文字認識項目および前記対象範囲の文字列より成る構文についての規定を含む構文ルール情報を記憶する構文ルール情報記憶手段と、
前記構文ルール情報に基づいて前記文字認識手段によって認識された文字列より成る構文を解析し、前記文字認識項目との対応付けを行なう構文解析手段と、
を具備することを特徴とする帳票認識装置。
In a form recognition apparatus for performing character recognition of a predetermined character recognition item from image information of a form optically read,
Character recognition information storage means for storing character recognition information including a position designation of a target range of character recognition in the form,
Character recognition means for acquiring the image information, extracting character information of the target range of the character recognition from the image information based on the character recognition information, and performing character recognition,
Syntax rule information storage means for storing syntax rule information including a character recognition item represented by a character string in the target range of the character recognition and a syntax comprising a character string in the target range,
Syntax analysis means for analyzing a syntax consisting of a character string recognized by the character recognition means based on the syntax rule information, and associating the syntax with the character recognition item;
A form recognition device comprising:
前記文字認識項目ごとに前記文字認識手段により得られた前記文字認識結果と照合する照合データの位置を含むデータチェック情報を記憶するデータチェック情報記憶手段と、
前記データチェック情報を用いて前記文字認識手段により特定された前記文字認識結果を確認し、前記文字認識項目の前記文字認識の結果を確定する項目確定手段と、
を具備することを特徴とする請求項1記載の帳票認識装置。
Data check information storage means for storing data check information including a position of collation data to be collated with the character recognition result obtained by the character recognition means for each of the character recognition items;
Item confirmation means for confirming the character recognition result specified by the character recognition means using the data check information, and for confirming the character recognition result of the character recognition item,
2. The form recognition device according to claim 1, comprising:
光学的に読み取った帳票のイメージ情報から所定の文字認識項目の文字認識を行なう帳票認識方法において、
予め前記帳票における文字認識の対象範囲の位置指定を含む文字認識情報と、前記文字認識の対象範囲の文字列によって表される文字認識項目および前記対象範囲の文字列より成る構文についての規定を含む構文ルール情報と、を記憶するステップと、
前記イメージ情報を取得し、前記文字認識情報に基づいて前記イメージ情報から前記文字認識の対象範囲の情報を抽出して文字認識を行なうステップと、
前記文字認識が行なわれた前記文字認識の対象範囲の文字列より成る構文を前記構文ルール情報に基づいて解析し、前記文字認識項目との対応付けを行なうステップと、
を具備することを特徴とする帳票認識方法。
In a form recognition method for performing character recognition of a predetermined character recognition item from image information of a form optically read,
Character recognition information including a position designation of a target range of the character recognition in the form in advance, and a specification of a character recognition item represented by a character string of the target range of the character recognition and a syntax including a character string of the target range are included. Storing syntax rule information;
Obtaining the image information, performing character recognition by extracting information of a target range of the character recognition from the image information based on the character recognition information,
Analyzing the syntax composed of the character strings in the target range of the character recognition in which the character recognition is performed based on the syntax rule information, and associating the syntax with the character recognition item;
A form recognition method comprising:
JP2002369126A 2002-12-20 2002-12-20 Form recognition device and form recognition method Expired - Fee Related JP4566510B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002369126A JP4566510B2 (en) 2002-12-20 2002-12-20 Form recognition device and form recognition method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002369126A JP4566510B2 (en) 2002-12-20 2002-12-20 Form recognition device and form recognition method

Publications (2)

Publication Number Publication Date
JP2004199529A true JP2004199529A (en) 2004-07-15
JP4566510B2 JP4566510B2 (en) 2010-10-20

Family

ID=32765441

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002369126A Expired - Fee Related JP4566510B2 (en) 2002-12-20 2002-12-20 Form recognition device and form recognition method

Country Status (1)

Country Link
JP (1) JP4566510B2 (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100447805C (en) * 2004-09-17 2008-12-31 富士施乐株式会社 Document processing device, document processing method, and storage medium recording program therefor
JP2009169844A (en) * 2008-01-18 2009-07-30 Hitachi Software Eng Co Ltd Table recognition method and table recognition device
JP2013030040A (en) * 2011-07-29 2013-02-07 Fujitsu Frontech Ltd Information processing program, information processor, and character recognition method
JP2014021658A (en) * 2012-07-17 2014-02-03 Mitsubishi Electric Corp Ledger management system
JP2019095858A (en) * 2017-11-17 2019-06-20 グローリー株式会社 Slip image processing device, slip image processing system, slip image processing method, and program
US11699296B2 (en) 2020-12-09 2023-07-11 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium
US11756321B2 (en) 2020-12-16 2023-09-12 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100447805C (en) * 2004-09-17 2008-12-31 富士施乐株式会社 Document processing device, document processing method, and storage medium recording program therefor
JP2009169844A (en) * 2008-01-18 2009-07-30 Hitachi Software Eng Co Ltd Table recognition method and table recognition device
JP2013030040A (en) * 2011-07-29 2013-02-07 Fujitsu Frontech Ltd Information processing program, information processor, and character recognition method
JP2014021658A (en) * 2012-07-17 2014-02-03 Mitsubishi Electric Corp Ledger management system
JP2019095858A (en) * 2017-11-17 2019-06-20 グローリー株式会社 Slip image processing device, slip image processing system, slip image processing method, and program
US11699296B2 (en) 2020-12-09 2023-07-11 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium
US11756321B2 (en) 2020-12-16 2023-09-12 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium

Also Published As

Publication number Publication date
JP4566510B2 (en) 2010-10-20

Similar Documents

Publication Publication Date Title
US5251273A (en) Data processing system and method for sequentially repairing character recognition errors for scanned images of document forms
JP3469345B2 (en) Image filing apparatus and filing method
JP4996940B2 (en) Form recognition device and program thereof
JP4078009B2 (en) CHARACTERISTIC RECORDING AREA DETECTION DEVICE FOR FORM, CHARACTER RECORDING AREA DETECTION METHOD FOR FORM, STORAGE MEDIUM, AND FORM FORMAT CREATION DEVICE
US20160379186A1 (en) Element level confidence scoring of elements of a payment instrument for exceptions processing
JPH11282955A (en) Character recognition device, its method and computer readable storage medium recording program for computer to execute the method
JP2007179395A (en) Medium processing apparatus, method and system, and computer readable recording medium for recording medium processing program
JP2021043478A (en) Information processing device, control method thereof and program
JP4566510B2 (en) Form recognition device and form recognition method
JPH0581473A (en) Method for generating program
JP2006065477A (en) Character recognition device
JP2009093305A (en) Business form recognition system
JP5481965B2 (en) Information processing apparatus and information processing program
JP4430490B2 (en) Data entry device, control method therefor, and program
JPH1173472A (en) Format information registering method and ocr system
JP5243228B2 (en) Character recognition device and method for generating confirmation screen of character recognition device
JPH11219394A (en) Automatic various financial chart input device
JP3946043B2 (en) Form identification device and identification method
JP2002032704A (en) System and method for document processing, storage medium, and document
JP2002358521A (en) Device, method and program for registering and identifying document format
JP7201545B2 (en) FORM PROCESSING PROGRAM, FORM PROCESSING METHOD, AND FORM PROCESSING APPARATUS
JP4418823B2 (en) Form identification device and identification method thereof
JP2003006712A (en) Business office terminal equipment for financial institution
JP2000132635A (en) Recognizing data confirming method
JP2023057446A (en) Document recognition apparatus and document recognition method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050817

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080417

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080422

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080623

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080805

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080925

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20081015

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20081107

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100412

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100708

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100804

R150 Certificate of patent or registration of utility model

Ref document number: 4566510

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130813

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees