JP2014016762A - Form recognition apparatus and form recognition method - Google Patents

Form recognition apparatus and form recognition method Download PDF

Info

Publication number
JP2014016762A
JP2014016762A JP2012153331A JP2012153331A JP2014016762A JP 2014016762 A JP2014016762 A JP 2014016762A JP 2012153331 A JP2012153331 A JP 2012153331A JP 2012153331 A JP2012153331 A JP 2012153331A JP 2014016762 A JP2014016762 A JP 2014016762A
Authority
JP
Japan
Prior art keywords
recognition
established
item
character string
determined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012153331A
Other languages
Japanese (ja)
Inventor
Kokorou Tanabe
心有 田部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Omron Terminal Solutions Corp
Original Assignee
Hitachi Omron Terminal Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Omron Terminal Solutions Corp filed Critical Hitachi Omron Terminal Solutions Corp
Priority to JP2012153331A priority Critical patent/JP2014016762A/en
Publication of JP2014016762A publication Critical patent/JP2014016762A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a form recognition apparatus capable of recognizing a character string recorded in a non-standardized form with high recognition accuracy while reducing processing time.SOLUTION: The form recognition apparatus obtains an image in a form, picks up and recognizes a piece of keyword information for identifying the form from the image and collates the keyword information with pieces of keyword information of records in a table data to determine which non-standardized form agrees with the form. When the keyword information is determined as not agree, the form recognition apparatus performs a predetermined recognition processing on the entire image and outputs an item name and an item value recorded in the form. When the keyword information is determined as agrees with any non-standardized form, the form recognition apparatus obtains a piece of area information from a record corresponding to the non-standardized form determined as agree and performs a predetermined recognition processing on the region determined by the area information to output the item name and the item value recorded in the form as a recognition result.

Description

本発明は、帳票に記載された文字列を認識する技術に関する。   The present invention relates to a technique for recognizing a character string described in a form.

帳票は、文字認識の帳票規格を満たす制定帳票と、それを満たさない非制定帳票とに分類される。制定帳票の場合、読取対象となる文字列の帳票画像上での記載位置とその属性を事前に装置に登録しておく「帳票定義」により、文字列の認識を高精度に行うことができる。一方、非制定帳票には、制定帳票のような厳格な規格がないため、運用前に記載位置(読取領域とも呼ぶ)を設定する際、使用する帳票と運用で使われる帳票との間に印刷誤差や裁断誤差などによる差異がある場合が多い。帳票に差異があると、予め設定した読取領域と実際の帳票上の位置にズレが生じ、高精度の文字認識が困難であった。   The forms are classified into enacted forms that satisfy the form standard for character recognition and non-enacted forms that do not satisfy them. In the case of an enacted form, the character string can be recognized with high accuracy by “form definition” in which the description position of the character string to be read on the form image and its attribute are registered in the apparatus in advance. On the other hand, non-established forms do not have strict standards like established forms, so when setting a description position (also called a reading area) before operation, printing is performed between the form used and the form used in operation. There are often differences due to errors or cutting errors. If there is a difference between the forms, there is a difference between the preset reading area and the actual position on the form, which makes it difficult to recognize characters with high accuracy.

そこで、帳票定義を用いずに非制定帳票を認識可能とする技術が、本出願人により提案された(特許文献1参照)。この技術は、帳票画像の全体から文字列を検出し、項目名らしさと項目値らしさを全文字列に対して計算し、前記検出された文字列の組合せからなる文字列ペアに対して配置関係の項目名−項目値関係の妥当性を計算することで、項目名と項目値を抽出しており、非制定帳票を高精度に認識することが可能となった。   Therefore, a technique that enables recognition of a non-established form without using a form definition has been proposed by the present applicant (see Patent Document 1). This technique detects a character string from the entire form image, calculates the item name likelihood and the item value likelihood for all character strings, and arranges the relationship with respect to a character string pair composed of the detected character string combinations. By calculating the validity of the item name-item value relationship, item names and item values are extracted, making it possible to recognize non-established forms with high accuracy.

特開2011−248609号公報JP 2011-248609 A

特許文献1の技術では、前述したように高精度な認識が可能となっているが、さらに、処理時間を短縮することと認識精度をより一層向上することの要望があった。なお、このような要望は、特許文献1の技術に限らず、文字列の内容を分析することを伴う技術に共通する問題であった。   In the technique of Patent Document 1, high-accuracy recognition is possible as described above. However, there is a demand for further shortening the processing time and further improving the recognition accuracy. Such a request is not limited to the technique of Patent Document 1, and is a problem common to techniques involving analysis of the contents of character strings.

本発明は、前記の課題を解決するためになされたものであり、非制定帳票に記載された文字列の認識について、処理時間を短縮し、認識精度を向上することを目的とする。   The present invention has been made to solve the above-described problems, and has as its object to reduce the processing time and improve the recognition accuracy for the recognition of character strings described in non-established forms.

本発明は、上述の課題の少なくとも一部を解決するためになされたものであり、以下の構成として実現することが可能である。すなわち、本発明は、
帳票に記載された文字列を認識する帳票認識装置であって、
前記帳票の画像を取得する帳票画像取得部と、
前記取得した画像から前記帳票を特定するキーワード情報を切り出して認識するキーワード情報認識部と、
非制定帳票を分類するための表形式のデータであって、レコード毎に、前記非制定帳票を識別するためのキーワード情報と、前記非制定帳票における前記認識の対象となる文字列を含む領域を示すエリア情報とを備えるテーブルデータを記憶する記憶部と、
前記キーワード情報認識部によって得られたキーワード情報を前記テーブルデータ内の各レコードのキーワード情報と照合することによって、前記帳票がいずれの非制定帳票に該当するかを判定する帳票分類判定部と、
前記帳票分類判定部によって前記テーブルデータに記録されたいずれの非制定帳票にも該当しないと判定されたときに、前記帳票画像取得部によって取得した画像の全体に対して所定の認識処理を施すことによって、前記帳票に記載された項目名と項目値を認識結果として出力する第1認識処理部と、
前記帳票分類判定部によって前記テーブルデータに記録されたいずれかの非制定帳票に該当すると判定されたときに、前記該当すると判定された非制定帳票に対応するレコードから前記エリア情報を取得し、前記エリア情報によって定まる前記領域に対して前記所定の認識処理を施すことによって、前記帳票に記載された項目名と項目値を認識結果として出力する第2認識処理部と
を備える。
SUMMARY An advantage of some aspects of the invention is to solve at least a part of the problems described above, and the invention can be implemented as the following configurations. That is, the present invention
A form recognition device for recognizing a character string described in a form,
A form image acquisition unit for acquiring an image of the form;
A keyword information recognition unit for recognizing and recognizing keyword information for identifying the form from the acquired image;
It is tabular data for classifying non-established forms, and for each record, includes keyword information for identifying the non-established form, and an area including a character string to be recognized in the non-established form A storage unit for storing table data including area information to be shown;
A form classification determination unit that determines which non-established form the form corresponds to by comparing the keyword information obtained by the keyword information recognition unit with the keyword information of each record in the table data;
When it is determined by the form classification determination unit that it does not correspond to any non-established form recorded in the table data, a predetermined recognition process is performed on the entire image acquired by the form image acquisition unit A first recognition processing unit that outputs the item name and item value described in the form as a recognition result,
When it is determined by the form classification determination unit that any non-established form recorded in the table data is acquired from the record corresponding to the non-established form determined to be applicable, the area information, A second recognition processing unit that outputs the item name and the item value described in the form as a recognition result by performing the predetermined recognition process on the area determined by the area information.

上記構成の帳票認識装置によれば、テーブルデータに記録された非制定帳票については、テーブルデータに含まれるエリア情報によって定まる領域に対して所定の認識処理を施すだけで済む。このために、非制定帳票に記載された文字列の認識についての処理時間を短縮することができ、また、認識精度を向上することができる。   According to the form recognizing apparatus having the above-described configuration, the non-established form recorded in the table data only needs to be subjected to a predetermined recognition process on the area determined by the area information included in the table data. For this reason, the processing time for the recognition of the character string described in the non-established form can be shortened, and the recognition accuracy can be improved.

本発明の一実施例の帳票認識システムの構成を示す説明図である。It is explanatory drawing which shows the structure of the form recognition system of one Example of this invention. 非制定帳票を例示する説明図である。It is explanatory drawing which illustrates a non-established form. 帳票分類テーブル30を模式的に示す説明図である。It is explanatory drawing which shows the form classification table 30 typically. 認識項目テーブル26の説明図である。It is explanatory drawing of the recognition item table. イメージ処理ソフトウェア20に含まれる非制定帳票認識ルーチンを示すフローチャートである。4 is a flowchart showing a non-enacted form recognition routine included in the image processing software 20. 上側領域UAの一例を示す説明図である。It is explanatory drawing which shows an example of the upper area | region UA. ステップS150における帳票定義レス認識処理の概容を示す説明図である。It is explanatory drawing which shows the outline | summary of the form definition less recognition process in step S150. ステップS160における帳票定義レス認識処理の概容を示す説明図である。It is explanatory drawing which shows the outline | summary of the form definition less recognition process in step S160. ステップS160における帳票定義レス認識処理の概容の他の例を示す説明図である。It is explanatory drawing which shows the other example of the outline | summary of the form definition less recognition process in step S160.

以下、本発明の実施の形態を実施例に基づいて、下記の順序に従って説明する。
A.実施例:
A1.帳票認識システムの構成:
A2.非制定帳票とテーブルの構成:
A3.非制定帳票認識ルーチン:
A4.実施例効果:
B.変形例:
Embodiments of the present invention will be described below in the following order based on examples.
A. Example:
A1. Form recognition system configuration:
A2. Non-enacted forms and table structure:
A3. Non-enacted form recognition routine:
A4. Example effect:
B. Variations:

A.実施例:
A1.帳票認識システムの構成:
図1は、本発明の一実施例の帳票認識システムの構成を示す説明図である。帳票認識システムは、帳票の認識をおこなうためのコンピューター100と、認識結果を表示するディスプレイ200と、帳票の画像を読み取るスキャナ300と、各種の情報を入力するためのキーボード400と、を備えている。コンピューター100は、回線500を介して図示しないホストコンピューターと接続可能となっている。
A. Example:
A1. Form recognition system configuration:
FIG. 1 is an explanatory diagram showing the configuration of a form recognition system according to an embodiment of the present invention. The form recognition system includes a computer 100 for recognizing a form, a display 200 for displaying a recognition result, a scanner 300 for reading a form image, and a keyboard 400 for inputting various types of information. . The computer 100 can be connected to a host computer (not shown) via a line 500.

コンピューター100は、制御部110と、出力インターフェイス120と、入力インターフェイス140と、ネットワークインターフェイス150と、を備えている。   The computer 100 includes a control unit 110, an output interface 120, an input interface 140, and a network interface 150.

制御部110は、ROMやRAM等のメモリ111と、中央演算装置であるCPU112とにより構成されている。メモリ111には、イメージ処理ソフトウェア20と、帳票分類テーブル30とが記憶されている。   The control unit 110 includes a memory 111 such as a ROM or a RAM, and a CPU 112 that is a central processing unit. The memory 111 stores image processing software 20 and a form classification table 30.

イメージ処理ソフトウェア20は、スキャナ300にて読み取った帳票の画像を処理するためのプログラムで、画像から帳票のサイズに画像を切り出したり、帳票に記載されている枠線情報を抽出したり、帳票に記載されている文字列を認識したりする。イメージ処理ソフトウェア20は、文字列を認識する帳票としては、制定帳票、非制定帳票の双方に対応可能であり、特に、帳票画像取得部21と、キーワード情報認識部22と、帳票分類判定部23と、第1認識処理部24と、第2認識処理部25と、を機能として実現することで、非制定帳票に記載された文字列を認識可能としている。また、イメージ処理ソフトウェア20は、認識項目テーブル26を含む。認識項目テーブル26は、表形式のデータであって、イメージ処理ソフトウェア20によって帳票の文字列を認識処理する際に、項目名や項目名条件、項目値条件を参照するために使用される。   The image processing software 20 is a program for processing an image of a form read by the scanner 300. The image processing software 20 cuts out an image from the image to the size of the form, extracts the frame line information described in the form, Recognize the character string described. The image processing software 20 can handle both enacted forms and non-established forms as forms for recognizing character strings. In particular, the form image acquisition unit 21, the keyword information recognition unit 22, and the form classification determination unit 23 And the 1st recognition process part 24 and the 2nd recognition process part 25 are implement | achieved as a function, The character string described in the non-established form is made recognizable. The image processing software 20 includes a recognition item table 26. The recognition item table 26 is tabular data, and is used to refer to the item name, item name condition, and item value condition when the image processing software 20 recognizes the character string of the form.

帳票分類テーブル30は、表形式のデータであって、イメージ処理ソフトウェア20によって帳票の文字列を認識処理する際に、帳票の分類毎に認識処理を変更するために使用される。   The form classification table 30 is tabular data, and is used to change the recognition process for each form classification when the image processing software 20 recognizes the character string of the form.

制御部110では、イメージ処理ソフトウェア20をCPU112が実行することによって、前記各部21〜25に対応した機能を始めとした、帳票についての処理のために必要な制御が行われる。なお、各機能は、本実施例においてソフトウェア的に構成されているが、集積回路などを用いて、ハードウェア的に構成することも可能である。   In the control unit 110, when the CPU 112 executes the image processing software 20, control necessary for processing of the form including functions corresponding to the respective units 21 to 25 is performed. Each function is configured as software in the present embodiment, but may be configured as hardware using an integrated circuit or the like.

なお、イメージ処理ソフトウェア20は、図示しないハードディスク装置(HDD)に記憶されており、所定の起動命令を受けたときに、メモリ111の所定の領域にロードされる。帳票分類テーブル30についても、同様にHDDからメモリ111にロードされる構成とすることができる。イメージ処理ソフトウェア20は、CD−ROMやDVD−ROMなどの記録媒体(コンピューターが読み取り可能な記録媒体)に記録されていたり、インターネットを介してコンピューターにダウンロード可能であったりすることができる。同様に、帳票分類テーブル30についても記録媒体に記録されていたり、インターネットを介してコンピューターにダウンロード可能であったりすることができる。   The image processing software 20 is stored in a hard disk device (HDD) (not shown), and is loaded into a predetermined area of the memory 111 when a predetermined activation command is received. The form classification table 30 can be similarly loaded from the HDD into the memory 111. The image processing software 20 can be recorded on a recording medium (computer-readable recording medium) such as a CD-ROM or DVD-ROM, or can be downloaded to a computer via the Internet. Similarly, the form classification table 30 can also be recorded on a recording medium or downloaded to a computer via the Internet.

ディスプレイ200は、出力インターフェイス120を介してコンピューター100と接続されている。ディスプレイ200は、コンピューター100から表示する画面についての情報を受け、画面を表示することでオペレータに帳票認識の結果を提供する。   The display 200 is connected to the computer 100 via the output interface 120. The display 200 receives information about the screen to be displayed from the computer 100 and displays the screen to provide the operator with the result of form recognition.

スキャナ300とキーボード400は、入力インターフェイス140を介してコンピューター100と接続され、情報をコンピューター100に送信する。スキャナ300は、帳票の画像を取得するための装置であり、非接触式スキャナやフラットベットスキャナ等が該当する。キーボード400は、オペレータの要求をコンピューター100に伝える装置であり、マウスなど、同じ機能を有する装置でもよい。コンピューター100は、ネットワークインターフェイス150に接続された回線500を介してホストコンピューターと接続され、各種の情報のやりとりをおこなう。   The scanner 300 and the keyboard 400 are connected to the computer 100 via the input interface 140 and transmit information to the computer 100. The scanner 300 is a device for acquiring a form image, and corresponds to a non-contact scanner, a flat bed scanner, or the like. The keyboard 400 is a device that transmits an operator's request to the computer 100, and may be a device having the same function, such as a mouse. The computer 100 is connected to a host computer via a line 500 connected to the network interface 150, and exchanges various types of information.

A2.非制定帳票とテーブルの構成:
図2は、非制定帳票を例示する説明図である。非制定帳票とは、自行(自身の銀行)が制定したフォーマットの帳票である制定帳票以外の帳票であって、多種多様のフォーマットを取りうる。図2(a)から(c)に示すように、非制定帳票の一例として、市民税や自動車税、あるいは電気料金などの税公金帳票がある。これらから分かるように、非制定帳票は、サイズやレイアウト、項目名、項目値など多種多様である。「項目名」とは帳票に記載される項目の名称であり、「項目値」とは項目についての値である。例えば、図2(b)においては、"振込先口座"、"振込金額"、"振込期限"が項目名に該当し、"123−456"、"10,000円"、"平成23年12月31日"が項目値に該当する。
A2. Non-enacted forms and table structure:
FIG. 2 is an explanatory diagram illustrating a non-enacted form. A non-enacted form is a form other than an enacted form that is a form of a form established by the bank (own bank), and can take a wide variety of formats. As shown in FIGS. 2A to 2C, examples of non-established forms include a public tax form such as a municipal tax, an automobile tax, or an electric bill. As can be seen from these, non-established forms have a wide variety of sizes, layouts, item names, item values, and the like. “Item name” is the name of the item described in the form, and “Item value” is the value for the item. For example, in FIG. 2B, “transfer account”, “transfer amount”, and “transfer deadline” correspond to the item names, “123-456”, “10,000 yen”, “2011 12 “Month 31” corresponds to the item value.

図3は、帳票分類テーブル30を模式的に示す説明図である。図中の(a)に帳票分類テーブル30のデータ構成を示した。帳票分類テーブル30は、「分類名」、「帳票種」、「帳票サイズ情報」、「キーワード情報」、「エリア情報」の各フィールド611〜615を1レコードとして格納している。一レコードが、帳票の一分類に相当する。「分類名」のフィールド611には帳票を分類するための分類名が記録され、「帳票種」のフィールド612には帳票の種類が記録され、「帳票サイズ情報」のフィールド613には帳票のサイズが記録される。「キーワード情報」のフィールド614には、帳票に記載された帳票を特定するキーワード情報が記録される。「エリア情報」のフィールド615には、帳票に記載された項目の名称と、その項目が記載された領域の位置(サイズも含む)を示す位置情報とが記録される。   FIG. 3 is an explanatory diagram schematically showing the form classification table 30. The data structure of the form classification table 30 is shown in FIG. The form classification table 30 stores fields 611 to 615 of “classification name”, “form type”, “form size information”, “keyword information”, and “area information” as one record. One record corresponds to one classification of the form. The “category name” field 611 records a classification name for classifying the form, the “form type” field 612 records the form type, and the “form size information” field 613 records the form size. Is recorded. In the “keyword information” field 614, keyword information for specifying the form described in the form is recorded. In the “area information” field 615, the name of the item described in the form and the position information indicating the position (including size) of the area in which the item is described are recorded.

図3の(b)に帳票分類テーブル30に格納されるデータの具体例を示した。第1レコードR1が図2の(b)に示した非制定帳票についてのものであり、第2レコードR1が図2の(b)に示した非制定帳票についてのものである。第1レコードR1には、分類名として”分類1”が記録され、帳票種として”市民税”が記録され、帳票サイズ情報として”A5サイズ(x:210,y:148)”が記録され、キーワード情報として”名古屋市”と”市民税”とが記録され、エリア情報として項目名である”口座番号”と位置情報である”(x:20−180,y:40−100)”が記録されている。第2レコードR2には、分類名として”分類2”が記録され、帳票種として”自動車税”が記録され、帳票サイズ情報として”A4サイズ(x:210,y:297)”が記録され、キーワード情報として”愛知県”と”自動車税”とが記録され、エリア情報として項目名である”金額”と位置情報である”(x:100−180,y:80−280)”が記録されている。   A specific example of the data stored in the form classification table 30 is shown in FIG. The first record R1 is for the non-established form shown in FIG. 2B, and the second record R1 is for the non-established form shown in FIG. In the first record R1, “Category 1” is recorded as the classification name, “Citizen tax” is recorded as the form type, “A5 size (x: 210, y: 148)” is recorded as the form size information, “Nagoya City” and “citizen tax” are recorded as keyword information, and “account number” which is an item name and position information “(x: 20-180, y: 40-100)” are recorded as area information. Has been. In the second record R2, “Class 2” is recorded as the classification name, “Automobile tax” is recorded as the form type, “A4 size (x: 210, y: 297)” is recorded as the form size information, “Aichi Prefecture” and “automobile tax” are recorded as keyword information, and “amount” as item name and position information “(x: 100-180, y: 80-280)” are recorded as area information. ing.

なお、帳票分類テーブル30には、”分類1”、”分類2”のレコード以外にも”分類3”等のレコードが記録されているが、図2の(a)に示した非制定帳票については記録されていないものとして以下の説明を行う。   In addition to the “class 1” and “class 2” records, records such as “class 3” are recorded in the form classification table 30, but the non-established form shown in FIG. The following description will be given assuming that is not recorded.

図4は、認識項目テーブル26の説明図である。図中の(a)に認識項目テーブル26のデータ構成を示した。認識項目テーブル26は、「項目名」、「項目名条件」、「項目値条件」の各フィールド621〜623を1レコードとして格納している。一レコードが一種類の項目に相当する。すなわち、認識項目テーブル26では、項目の種類単位で、「項目名」、「項目名条件」、「項目値条件」が対応づけて記録される。そして、「項目名」のフィールド621には項目名が記録され、「項目名条件」のフィールド622には同種の項目名の別記載として取り得る条件が記録され、「項目値条件」のフィールド623には同種の項目値の別記載として取り得る条件が記録される。   FIG. 4 is an explanatory diagram of the recognition item table 26. The data structure of the recognition item table 26 is shown in FIG. The recognition item table 26 stores the fields 621 to 623 of “item name”, “item name condition”, and “item value condition” as one record. One record corresponds to one type of item. That is, in the recognized item table 26, “item name”, “item name condition”, and “item value condition” are recorded in association with each other in the type of item. An item name is recorded in the “item name” field 621, a condition that can be taken as another description of the same item name is recorded in the “item name condition” field 622, and a field 623 of “item value condition”. In, conditions that can be taken as separate descriptions of the same type of item values are recorded.

図4の(b)に認識項目テーブル26に格納されるデータの具体例を示した。第1レコードR11には、項目名として”金額”が記録され、項目名条件として”金額”、”振込金額”、”合計額”、”税額”が記録されている。すなわち、”金額”、”振込金額”、”合計額”、”税額”のいずれか一つを満たすことが項目名条件として記録されている。項目値条件としては、数字9桁、”¥”、”円”が記録されている。すなわち、数字9桁以内であること、”¥”を含むこと、”円”を含むことのいずれか一つを満たすことが項目値条件として記録されている。   A specific example of data stored in the recognition item table 26 is shown in FIG. In the first record R11, “amount” is recorded as an item name, and “amount”, “transfer amount”, “total amount”, and “tax amount” are recorded as item name conditions. That is, it is recorded as the item name condition that any one of “amount”, “transfer amount”, “total amount”, and “tax amount” is satisfied. As the item value condition, 9 digits, “¥” and “yen” are recorded. That is, it is recorded as the item value condition that any one of 9 digits or less, including “¥”, or including “yen” is satisfied.

第2レコードR12には、項目名として”口座番号”が記録され、項目名条件として”口座番号”、”口座”、”振込先口座”が記録され、項目値条件として数字9桁、”¥”、”円”が記録されている。第3レコードR13には、項目名として”期限”が記録され、項目名条件として”期限”、”締切日”、”振込期限”が記録されている。項目値条件としては、日付(和暦)、日付(西暦)、”年”、”月” 、”日”が記録されている。すなわち、和暦の日付であること、西暦の日付であること、”年”を含むこと、”月”を含むこと、”日”を含むことのいずれか一つを満たすことが項目名条件として記録されている。   In the second record R12, “account number” is recorded as the item name, “account number”, “account”, and “transfer account” are recorded as the item name condition, and 9 digits of the item value condition, “¥ "," Yen "is recorded. In the third record R13, “expiration date” is recorded as an item name, and “expiration date”, “deadline date”, and “transfer due date” are recorded as item name conditions. As item value conditions, date (Japanese calendar), date (Western calendar), “year”, “month”, and “day” are recorded. In other words, the item name condition is to satisfy any one of the date of the Japanese calendar, the date of the Western calendar, the "year", the "month", and the "day". It is recorded.

A3.非制定帳票認識ルーチン:
図5は、イメージ処理ソフトウェア20に含まれる非制定帳票認識ルーチンを示すフローチャートである。この非制定帳票認識ルーチンは、CPU112によって実行されるもので、認識対象の帳票が制定帳票でないときに実行開始される。認識対象の帳票が制定帳票であるときには、帳票定義によって登録された定義データを使用して帳票を認識する処理が実行され、認識対象の帳票が制定帳票でないときに、この非制定帳票認識ルーチンが実行されることになる。
A3. Non-enacted form recognition routine:
FIG. 5 is a flowchart showing a non-established form recognition routine included in the image processing software 20. This non-established form recognition routine is executed by the CPU 112, and is started when the form to be recognized is not an established form. When the form to be recognized is an enacted form, the process for recognizing the form is executed using the definition data registered by the form definition. When the form to be recognized is not the enacted form, Will be executed.

処理が開始されると、CPU112は、まず、スキャナ300にて読み取った帳票の画像を取得する(ステップS110)。次いで、CPU112は、取得した画像から帳票サイズを算出する(ステップS120)。ここで、帳票サイズとは、「A5サイズ」、「A4サイズ」等の規格によって規定されたサイズである。続いて、CPU112は、前記画像から上側領域を選択し、この上側領域から文字列を切り出して認識する(ステップS130)。   When the process is started, the CPU 112 first acquires a form image read by the scanner 300 (step S110). Next, the CPU 112 calculates a form size from the acquired image (step S120). Here, the form size is a size defined by standards such as “A5 size” and “A4 size”. Subsequently, the CPU 112 selects an upper area from the image and cuts out and recognizes a character string from the upper area (step S130).

図6は、上側領域UAの一例を示す説明図である。帳票FRには、例えば「大阪府 法人府民税」等の帳票名が記載されている。帳票名は、一般的には、帳票の上部に記載されている。そこで、ステップS130では、ステップS120によって得られた帳票サイズに基づいて帳票の上側領域UAを求めて、上側領域から文字列を切り出して認識する処理を行う。上側領域UAの求め方は、帳票サイズの縦長のn分の1(nは2以上の整数)の長さを高さとし、帳票サイズの横長を幅として求める。なお、ここでは、上側領域UAとしていたが、必ずしも上側領域UAに限る必要がなく、例えば帳票の左側領域に帳票名が記載されているような帳票を多く扱うような場合には、左側領域とすることもできる。要は、予め定められた所定の領域を選択する構成とすることができる。ステップS130では、上側領域UAの選択後、上側領域UAから文字列を抽出する。文字列の切り出しおよび認識は、画像領域から文字列を切り出し認識する周知の方法を用いて行う。   FIG. 6 is an explanatory diagram illustrating an example of the upper area UA. In the form FR, for example, a form name such as “Osaka Prefecture Corporate Tax” is written. The form name is generally written at the top of the form. In step S130, the upper area UA of the form is obtained based on the form size obtained in step S120, and the character string is cut out from the upper area and recognized. The upper area UA is obtained by setting the length of 1 / n (n is an integer of 2 or more) of the vertical length of the form size as the height and the horizontal length of the form size as the width. Although the upper area UA is used here, it is not necessarily limited to the upper area UA. For example, when a lot of forms whose form names are described in the left area of the form are handled, You can also In short, it can be configured to select a predetermined area. In step S130, after selecting the upper area UA, a character string is extracted from the upper area UA. The character string is cut out and recognized using a known method for cutting out and recognizing a character string from an image area.

図5に戻って、ステップS130の実行後、CPU112は、ステップS120およびS130で得られた帳票サイズと文字列を帳票分類テーブル30と照合することによって、帳票画像の帳票は、帳票分類テーブル30に記録されている分類に該当するか否かを判定する(ステップS140)。前記照合は、ステップS120およびS130で得られた帳票サイズと文字列を、帳票分類テーブル30に記録されたレコード毎の帳票サイズ情報およびキーワード情報に対して順に一致しているかをチェックすることで行う。ステップS120およびS130で得られた帳票サイズと文字列の双方が、帳票分類テーブル30に記録されたいずれかのレコードの帳票サイズ情報およびキーワード情報と一致する場合に、帳票画像の帳票は、帳票分類テーブル30に記録されている分類に該当すると判定する。一方、帳票サイズと文字列の双方が一致するレコードがない場合に、帳票画像の帳票は、帳票分類テーブル30に記録されている分類に該当しないと判定する。   Returning to FIG. 5, after executing step S <b> 130, the CPU 112 collates the form size and character string obtained in steps S <b> 120 and S <b> 130 with the form classification table 30, so that the form image form is stored in the form classification table 30. It is determined whether or not the classification is recorded (step S140). The collation is performed by checking whether the form size and the character string obtained in steps S120 and S130 are sequentially matched with the form size information and the keyword information for each record recorded in the form classification table 30. . If both the form size and the character string obtained in steps S120 and S130 match the form size information and the keyword information of any record recorded in the form classification table 30, the form image form is classified into the form classification. It is determined that the classification is recorded in the table 30. On the other hand, if there is no record in which both the form size and the character string match, it is determined that the form image form does not correspond to the classification recorded in the form classification table 30.

ステップS140によって「NO」、すなわち、帳票は帳票分類テーブル30に記録されている分類に該当しないと判定された場合には、CPU112は、帳票画像の全体を対象とした帳票定義レス認識処理を実行する(ステップS150)。この帳票定義レス認識処理は、帳票定義を用いずに非制定帳票を認識するものであり、本出願人により開示された特開2011−248609号公報に記載の技術を用いて、項目名と項目値とを求めるものである。   If “NO” in step S140, that is, if it is determined that the form does not correspond to the classification recorded in the form classification table 30, the CPU 112 executes a form definition-less recognition process for the entire form image. (Step S150). This form definition-less recognition process recognizes a non-established form without using a form definition, and uses the technique described in Japanese Patent Application Laid-Open No. 2011-248609 disclosed by the applicant of the present invention. Value.

図7は、ステップS150における帳票定義レス認識処理の概容を示す説明図である。図示において、帳票FRは、図2(a)に示した「大阪府 法人府民税」の帳票であり、帳票分類テーブル30に記録されている分類の帳票でないことから、ステップS150による帳票定義レス認識処理が実行されることになる。この帳票定義レス認識処理は、詳しくは、以下の順序により行う。   FIG. 7 is an explanatory diagram showing an outline of the form definition-less recognition process in step S150. In the figure, the form FR is the form of “Osaka Prefecture Corporate Tax” shown in FIG. 2A and is not the form of the classification recorded in the form classification table 30. Processing will be executed. Specifically, the form definition-less recognition process is performed in the following order.

(1).帳票画像の全体P0を読取対象として文字列の検索を行う(図7(a)参照)。
(2).(1)で得られた各文字列を、認識項目テーブル26(図4)に記憶された項目名条件と照合することによって、各文字列についての項目名らしさを表す項目名尤度を計算する(図7(b)参照)。
(3).(1)で得られた各文字列を、認識項目テーブル26(図4)に記憶された項目値条件と照合することによって、各文字列についての項目値らしさを表す項目値尤度を計算する(図7(b)参照)。
(4).(1)で得られた文字列の2つの組合せからなる全ての文字列ペアに対し、前記文字列ペアの配置関係の項目名−項目値関係としての妥当さを表す配置尤度を計算する(図7(b)参照)。
(5).(2)〜(4)で求められた項目名尤度、項目値尤度、配置尤度に基づいて、帳票画像内の全ての文字列ペアに対して、当該文字列ペアが項目名−項目値関係にあるかを表す評価値を計算し、前記評価値に基づいて項目名および項目値を決定する(図7(c)参照)。
(1). Character strings are searched for the entire form image P0 as a reading target (see FIG. 7A).
(2). By comparing each character string obtained in (1) with the item name condition stored in the recognition item table 26 (FIG. 4), an item name likelihood representing the item name likelihood for each character string is calculated. (Refer FIG.7 (b)).
(3). By comparing each character string obtained in (1) with the item value condition stored in the recognition item table 26 (FIG. 4), the item value likelihood representing the item value likelihood for each character string is calculated. (Refer FIG.7 (b)).
(4). For all the character string pairs formed of the two combinations of the character strings obtained in (1), an arrangement likelihood representing the validity as the item name-item value relation of the arrangement relation of the character string pair is calculated ( (Refer FIG.7 (b)).
(5). Based on the item name likelihood, the item value likelihood, and the placement likelihood obtained in (2) to (4), the character string pair is item name-item for all character string pairs in the form image. An evaluation value indicating whether or not there is a value relationship is calculated, and an item name and an item value are determined based on the evaluation value (see FIG. 7C).

ステップS150による帳票定義レス認識処理の結果、下記の3つの項目が得られる。
・項目名が「口座番号」で、項目値が「987−6−54321」
・項目名が「金額」で、項目値が「50、000円」
・項目名が「期限」で、項目値が「平成24年3月31日」
ここで、項目名としては、文字認識によって帳票記載の内容ではなく、認識項目テーブル26の「項目名」のフィールド621に記録された内容が項目名として採用される。
As a result of the form definition-less recognition process in step S150, the following three items are obtained.
-The item name is “account number” and the item value is “987-6-54321”
-The item name is "Amount" and the item value is "50,000 yen"
-The item name is "Deadline" and the item value is "March 31, 2012"
Here, as the item name, the content recorded in the “item name” field 621 of the recognized item table 26 is adopted as the item name, not the content described in the form by character recognition.

ステップS150の実行後、CPU112は、ステップS150によって得られた認識結果をディスプレイ200に表示し(ステップS170)、その後、この非制定帳票認識処理ルーチンを終了する。   After executing step S150, the CPU 112 displays the recognition result obtained in step S150 on the display 200 (step S170), and then ends the non-enacted form recognition processing routine.

一方、ステップS140によって「YES」、すなわち、帳票は帳票分類テーブル30に記録されている分類に該当すると判定された場合には、CPU112は、帳票画像の部分領域を対象とした帳票定義レス認識処理を実行する(ステップS160)。ステップS150では、帳票画像の全体P0に対して帳票定義レス認識処理を行っていたが、これに替えて、ステップS160では、帳票分類テーブル30の「エリア情報」のフィールド615に記録された領域を部分領域として、部分領域に対して帳票定義レス認識処理を行うようにする。すなわち、CPU112は、ステップS140で帳票サイズと文字列が一致すると判断された分類についての「エリア情報」のフィールド615に記録された位置情報を読み出して、この位置情報によって示される領域を部分領域として、部分領域に対して帳票定義レス認識処理を行うようにする。   On the other hand, if “YES” is determined in the step S140, that is, the form is determined to correspond to the classification recorded in the form classification table 30, the CPU 112 recognizes the form definition-less recognition process for a partial area of the form image. Is executed (step S160). In step S150, the form definition-less recognition process is performed on the entire form image P0. Instead, in step S160, the area recorded in the “area information” field 615 of the form classification table 30 is stored. As a partial area, a form definition-less recognition process is performed on the partial area. That is, the CPU 112 reads the position information recorded in the “area information” field 615 for the classification for which the form size and the character string are determined to match in step S140, and uses the area indicated by the position information as a partial area. The form definition-less recognition process is performed on the partial area.

図8は、ステップS160における帳票定義レス認識処理の概容を示す説明図である。図示において、帳票FRは、図2(b)に示した「名古屋市 市民税」の帳票であり、帳票分類テーブル30に記録されている分類の帳票であることから、ステップS160による帳票定義レス認識処理が実行されることになる。この帳票定義レス認識処理は、詳しくは、下記の(i)〜(v)の順序により行う。   FIG. 8 is an explanatory diagram showing an outline of the form definition-less recognition process in step S160. In the figure, the form FR is a form of “Nagoya City Citizen Tax” shown in FIG. 2B, and is a form with a classification recorded in the form classification table 30. Therefore, the form definition is not recognized in step S160. Processing will be executed. More specifically, this form definition-less recognition process is performed in the following order (i) to (v).

(i).帳票画像の部分領域P1を読取対象として文字列の検索を行う(図8(a)参照)。ここで、部分領域P1は、ステップS140で帳票サイズと文字列が一致すると判断されたレコード(分類)についての「エリア情報」のフィールド615(図3(b))に記録された位置情報によって示されるものである。すなわち、部分領域P1は、帳票分類テーブル30の第1レコードR1の「エリア情報」のフィールド615に記録された位置情報(x:20−180、y:40−100)で示される領域となる。
(ii).(i)で得られた各文字列を、認識項目テーブル26(図4)に記憶された項目名条件と照合することによって、各文字列についての項目名らしさを表す項目名尤度を計算する(図8(b)参照)。
(iii).(i)で得られた各文字列を、認識項目テーブル26(図4)に記憶された項目値条件と照合することによって、各文字列についての項目値らしさを表す項目値尤度を計算する(図8(b)参照)。
(iv).(i)で得られた文字列の2つの組合せからなる全ての文字列ペアに対し、前記文字列ペアの配置関係の項目名−項目値関係としての妥当さを表す配置尤度を計算する(図8(b)参照)。
(v).(ii)〜(iv)で求められた項目名尤度、項目値尤度、配置尤度に基づいて、部分領域P1内の全ての文字列ペアに対して、当該文字列ペアが項目名−項目値関係にあるかを表す評価値を計算し、前記評価値に基づいて項目名および項目値を決定する(図8(c)参照)。
(I). A character string is searched for the partial area P1 of the form image as a reading target (see FIG. 8A). Here, the partial area P1 is indicated by the position information recorded in the “area information” field 615 (FIG. 3B) for the record (classification) for which the form size and the character string are determined to match in step S140. It is what That is, the partial area P1 is an area indicated by the position information (x: 20-180, y: 40-100) recorded in the “area information” field 615 of the first record R1 of the form classification table 30.
(Ii). By comparing each character string obtained in (i) with the item name condition stored in the recognition item table 26 (FIG. 4), the item name likelihood representing the item name likelihood for each character string is calculated. (See FIG. 8 (b)).
(Iii). By comparing each character string obtained in (i) with the item value condition stored in the recognition item table 26 (FIG. 4), an item value likelihood representing the item value likelihood for each character string is calculated. (See FIG. 8 (b)).
(Iv). For all the character string pairs composed of the two combinations of character strings obtained in (i), an arrangement likelihood representing the validity of the item name-item value relation of the arrangement relation of the character string pair is calculated ( (Refer FIG.8 (b)).
(V). Based on the item name likelihood, the item value likelihood, and the arrangement likelihood obtained in (ii) to (iv), the character string pair is an item name− for all the character string pairs in the partial region P1. An evaluation value indicating whether the item value is related is calculated, and an item name and an item value are determined based on the evaluation value (see FIG. 8C).

ステップS160による帳票定義レス認識処理の結果、下記の項目が得られる。
・項目名が「口座番号」で、項目値が「123−456」
ここで、項目名としては、文字認識によって帳票記載の内容ではなく、認識項目テーブル26の「項目名」のフィールド621に記録された内容が項目名として採用される。前記帳票定義レス認識処理によれば、非制定帳票を誤り少なく認識することができる。
As a result of the form definition-less recognition process in step S160, the following items are obtained.
-Item name is "Account Number" and item value is "123-456"
Here, as the item name, the content recorded in the “item name” field 621 of the recognized item table 26 is adopted as the item name, not the content described in the form by character recognition. According to the form definition-less recognition process, a non-established form can be recognized with few errors.

ステップS160の実行後、CPU112は、ステップS170に処理を進めて、ステップS160によって得られた認識結果をディスプレイ200に表示する。ステップS170の実行後、「リターン」に抜けて、この非制定帳票認識ルーチンを終了する。   After executing step S160, the CPU 112 advances the process to step S170 and displays the recognition result obtained in step S160 on the display 200. After execution of step S170, the process returns to “return” to end the non-established form recognition routine.

図9は、ステップS160における帳票定義レス認識処理の概容の他の例示を示す説明図である。図示において、帳票FRは、図2(c)に示した「愛知県 自動車税」の帳票であり、この場合にも、「名古屋市 市民税」の帳票と同様に、ステップS160による帳票定義レス認識処理が実行されることになる。すなわち、帳票分類テーブル30(図3(b))の第2レコードR2の「エリア情報」のフィールド615に記録された位置情報(x:100−180、y:82−280)で示される部分領域P2に対して帳票定義レス認識処理が実行されることになる。この結果、下記の項目が得られる。
・項目名が「金額」で、項目値が「25、500円」
FIG. 9 is an explanatory diagram showing another example of the outline of the form definition-less recognition process in step S160. In the figure, the form FR is the form of “Aichi prefecture automobile tax” shown in FIG. 2C. In this case as well, the form definition-less recognition in step S160 is performed in the same manner as the form of “Nagoya City municipal tax”. Processing will be executed. That is, the partial area indicated by the position information (x: 100-180, y: 82-280) recorded in the “area information” field 615 of the second record R2 of the form classification table 30 (FIG. 3B). The form definition-less recognition process is executed for P2. As a result, the following items are obtained.
・ The item name is "Amount" and the item value is "25,500 yen"

A4.実施例効果:
以上詳述したように、本実施例の帳票認識システムによれば、帳票分類テーブル30に記録された分類の非制定帳票については、帳票分類テーブル30に含まれるエリア情報によって定まる部分領域に対して帳票定義レス認識処理を施すだけで済む。従来、非制定帳票については、帳票画像の全体を読取対象として得られた文字列の全てに対して項目名尤度、項目値尤度を計算し、全ての文字列ペアに対して配置尤度を計算する必要がある。例えば図2(b)に示した「名古屋市 市民税」の非制定帳票を従来例で認識した場合、「名古屋」の文字列、「市民税」の文字列にそれぞれ項目名尤度、項目値尤度の計算をし、さらに両文字列を含めた組合せの配置尤度を計算する必要がある。例えば図2(c)に示した「愛知県 自動車税」の非制定帳票を従来例で認識した場合、「愛知県」の文字列、「自動車税」の文字列に含めて、さらに、「内訳金額」の文字列、「手数料」の文字列等も部分領域外に存在するため、よりたくさんの項目名尤度、項目値尤度、配置尤度を計算する必要がある。これに対して、図8、図9で説明したように、帳票定義レス認識処理の対象となるのは部分領域P1,P2だけで済む。このために、本実施例の帳票認識システムによれば、非制定帳票に記載された文字列の認識についての処理時間を短縮することができ、また、認識精度を向上することができるという効果を奏する。
A4. Example effect:
As described above in detail, according to the form recognition system of the present embodiment, the non-established form recorded in the form classification table 30 is compared with the partial area determined by the area information included in the form classification table 30. All you need to do is a form definition-less recognition process. Conventionally, for non-established forms, item name likelihoods and item value likelihoods are calculated for all character strings obtained by reading the entire form image, and placement likelihoods for all character string pairs. Need to be calculated. For example, when the non-established form of “Nagoya City Municipal Tax” shown in FIG. 2B is recognized in the conventional example, the item name likelihood and the item value are respectively added to the character string “Nagoya” and the character string “Citizen Tax”. It is necessary to calculate the likelihood and further calculate the arrangement likelihood of the combination including both character strings. For example, when the non-established form of “Aichi Prefecture Automobile Tax” shown in FIG. 2C is recognized in the conventional example, it is included in the character string “Aichi Prefecture” and the character string “Automobile Tax”, Since the character string of “money”, the character string of “fee”, and the like exist outside the partial area, it is necessary to calculate more item name likelihoods, item value likelihoods, and placement likelihoods. On the other hand, as described with reference to FIGS. 8 and 9, only the partial areas P1 and P2 are the targets of the form definition-less recognition process. For this reason, according to the form recognition system of the present embodiment, it is possible to shorten the processing time for the recognition of the character string described in the non-established form, and to improve the recognition accuracy. Play.

また、本実施例では、帳票画像の帳票が帳票分類テーブル30に記録されている分類に該当するか否かの判定を、帳票サイズ情報とキーワード情報の双方に基づいて行うように構成されている。このために、帳票が帳票分類テーブル30に登録の判定を高精度に行うことができる。   Further, in this embodiment, it is configured to determine whether or not the form image form corresponds to the classification recorded in the form classification table 30 based on both the form size information and the keyword information. . For this reason, it is possible to determine whether a form is registered in the form classification table 30 with high accuracy.

B.変形例:
この発明は前記実施例やその変形例に限られるものではなく、その要旨を逸脱しない範囲において種々の態様において実施することが可能であり、例えば、次のような変形も可能である。
B. Variations:
The present invention is not limited to the above-described embodiments and modifications thereof, and can be carried out in various modes without departing from the gist thereof. For example, the following modifications are possible.

・変形例1:
前記実施例では、帳票分類テーブル30は予め用意した固定のものとしたが、キーボード400等を操作して、帳票分類テーブル30に対して新しい分類のレコードを順次追加可能とすることができる。
・ Modification 1:
In the above embodiment, the form classification table 30 is a fixed one prepared in advance. However, it is possible to sequentially add new classification records to the form classification table 30 by operating the keyboard 400 or the like.

・変形例2:
前記実施例では、帳票定義レス認識処理の構成を、項目名尤度、項目値尤度、配置尤度をそれぞれ計算し、これらの尤度に基づいて項目を認識するものとしたが、本発明ではこれに限られない。帳票定義を用いずに文字列の内容を分析することによって認識を行う技術であれば、いずれの帳票定義レス認識処理の構成とすることもできる。
Modification 2
In the above embodiment, the form definition-less recognition process is configured such that the item name likelihood, the item value likelihood, and the placement likelihood are calculated, and the item is recognized based on these likelihoods. But it is not limited to this. Any form definition-less recognition process can be used as long as the technique recognizes the contents by analyzing the contents of the character string without using the form definition.

・変形例3:
前記実施例では、コンピューター100とディスプレイ200とスキャナ300とキーボード400とを全て個別の装置であるものとしたが、これらを全て備える専用機として構成するものとしてもよい。こうすることにより、単一の装置で精度良く帳票の認識を行うことができる。
・ Modification 3:
In the above-described embodiment, the computer 100, the display 200, the scanner 300, and the keyboard 400 are all separate devices. However, the computer 100, the display 200, the scanner 300, and the keyboard 400 may all be configured as dedicated machines. By doing so, it is possible to recognize the form with high accuracy by a single device.

本発明は、特許請求の範囲に記載した形態以外の種々の形態で実現することも可能であり、例えば、帳票認識装置を含む帳票処理システム、帳票認識方法に含まれる各工程を機能として実現するコンピュータープログラムとしての形態、このコンピュータープログラムやこのコンピュータープログラムを記録した印刷媒体等の形態等で実現することが可能である。   The present invention can be realized in various forms other than the forms described in the claims. For example, each process included in the form processing system including the form recognition apparatus and the form recognition method is realized as a function. The present invention can be realized in the form of a computer program, the form of the computer program, a print medium on which the computer program is recorded, or the like.

なお、前述した各実施例および各変形例における構成要素の中の、独立請求項で記載された要素以外の要素は、付加的な要素であり、適宜省略可能である。   It should be noted that elements other than those described in the independent claims among the constituent elements in each of the above-described embodiments and modifications are additional elements and can be omitted as appropriate.

20…イメージ処理ソフトウェア
21…帳票画像取得部
22…キーワード情報認識部
23…帳票分類判定部
24…第1認識処理部
25…第2認識処理部
26…認識項目テーブル
30…帳票分類テーブル
100…コンピューター
110…制御部
111…メモリ
112…CPU
120…出力インターフェイス
140…入力インターフェイス
150…ネットワークインターフェイス
200…ディスプレイ
300…スキャナ
400…キーボード
500…回線
DESCRIPTION OF SYMBOLS 20 ... Image processing software 21 ... Form image acquisition part 22 ... Keyword information recognition part 23 ... Form classification | category determination part 24 ... 1st recognition processing part 25 ... 2nd recognition processing part 26 ... Recognition item table 30 ... Form classification table 100 ... Computer 110 ... Control unit 111 ... Memory 112 ... CPU
120 ... Output interface 140 ... Input interface 150 ... Network interface 200 ... Display 300 ... Scanner 400 ... Keyboard 500 ... Line

Claims (5)

帳票に記載された文字列を認識する帳票認識装置であって、
前記帳票の画像を取得する帳票画像取得部と、
前記取得した画像から前記帳票を特定するキーワード情報を切り出して認識するキーワード情報認識部と、
非制定帳票を分類するための表形式のデータであって、レコード毎に、前記非制定帳票を識別するためのキーワード情報と、前記非制定帳票における前記認識の対象となる文字列を含む領域を示すエリア情報とを備えるテーブルデータを記憶する記憶部と、
前記キーワード情報認識部によって得られたキーワード情報を前記テーブルデータ内の各レコードのキーワード情報と照合することによって、前記帳票がいずれの非制定帳票に該当するかを判定する帳票分類判定部と、
前記帳票分類判定部によって前記テーブルデータに記録されたいずれの非制定帳票にも該当しないと判定されたときに、前記帳票画像取得部によって取得した画像の全体に対して所定の認識処理を施すことによって、前記帳票に記載された項目名と項目値を認識結果として出力する第1認識処理部と、
前記帳票分類判定部によって前記テーブルデータに記録されたいずれかの非制定帳票に該当すると判定されたときに、前記該当すると判定された非制定帳票に対応するレコードから前記エリア情報を取得し、前記エリア情報によって定まる前記領域に対して前記所定の認識処理を施すことによって、前記帳票に記載された項目名と項目値を認識結果として出力する第2認識処理部と
を備える帳票認識装置。
A form recognition device for recognizing a character string described in a form,
A form image acquisition unit for acquiring an image of the form;
A keyword information recognition unit for recognizing and recognizing keyword information for identifying the form from the acquired image;
It is tabular data for classifying non-established forms, and for each record, includes keyword information for identifying the non-established form, and an area including a character string to be recognized in the non-established form A storage unit for storing table data including area information to be shown;
A form classification determination unit that determines which non-established form the form corresponds to by comparing the keyword information obtained by the keyword information recognition unit with the keyword information of each record in the table data;
When it is determined by the form classification determination unit that it does not correspond to any non-established form recorded in the table data, a predetermined recognition process is performed on the entire image acquired by the form image acquisition unit A first recognition processing unit that outputs the item name and item value described in the form as a recognition result,
When it is determined by the form classification determination unit that any non-established form recorded in the table data is acquired from the record corresponding to the non-established form determined to be applicable, the area information, A form recognition apparatus comprising: a second recognition processing unit that outputs an item name and an item value described in the form as a recognition result by performing the predetermined recognition process on the area determined by area information.
請求項1に記載の帳票認識装置であって、
前記テーブルデータは、
前記非制定帳票のサイズを示す帳票サイズ情報を備え、
前記帳票認識装置は、
前記取得した画像から前記帳票のサイズを算出する帳票サイズ算出部をさらに備え、
前記帳票分類判定部は、
前記帳票サイズ算出部によって得られた帳票サイズを、前記キーワード情報と併せて、前記テーブルデータ内の各レコードの帳票サイズ情報と照合することによって、前記帳票がいずれの非制定帳票に該当するかを判定する、帳票認識装置。
The form recognition device according to claim 1,
The table data is
Provided with form size information indicating the size of the non-enacted form,
The form recognition device
Further comprising a form size calculation unit for calculating the size of the form from the acquired image,
The form classification determination unit
By comparing the form size obtained by the form size calculation unit with the form size information of each record in the table data, together with the keyword information, which non-established form corresponds to the form A form recognition device for judging.
請求項1または2に記載の帳票認識装置であって、
前記所定の認識処理は、
認識対象となる画像から文字列切り出して認識し、
前記各文字列についての項目名らしさを表す項目名尤度を計算し、
前記各文字列についての項目値らしさを表す項目値尤度を計算し、
前記文字列についての文字列ペアに対し、当該文字列ペアの配置関係が項目名−項目値関係として妥当であるかを表す配置尤度を計算し、
前記項目名尤度、項目値尤度、配置尤度に基づいて項目名と項目値を決定する、帳票認識装置。
The form recognition device according to claim 1 or 2,
The predetermined recognition process is:
Recognize by cutting out the character string from the image to be recognized,
Calculate the item name likelihood representing the item name likelihood for each of the character strings,
Calculate the item value likelihood representing the likelihood of the item value for each character string,
For the character string pair for the character string, calculate an arrangement likelihood indicating whether the arrangement relationship of the character string pair is valid as the item name-item value relationship,
A form recognition apparatus that determines an item name and an item value based on the item name likelihood, the item value likelihood, and the placement likelihood.
帳票に記載された文字列を認識する帳票認識方法であって、
非制定帳票を分類するための表形式のデータであって、レコード毎に、前記非制定帳票を識別するためのキーワード情報と、前記非制定帳票における前記認識の対象となる文字列を含む領域を示すエリア情報とを備えるテーブルデータを用意し、
前記帳票の画像を取得し、
前記取得した画像から前記帳票を特定するキーワード情報を切り出して認識し、
前記得られたキーワード情報を前記テーブルデータ内の各レコードのキーワード情報と照合することによって、前記帳票がいずれの非制定帳票に該当するかを判定し、
前記いずれの非制定帳票にも該当しないと判定されたときに、前記取得した画像の全体に対して所定の認識処理を施すことによって、前記帳票に記載された項目名と項目値を認識結果として出力し、
前記いずれかの非制定帳票に該当すると判定されたときに、前記該当すると判定された非制定帳票に対応するレコードから前記エリア情報を取得し、前記エリア情報によって定まる前記領域に対して前記所定の認識処理を施すことによって、前記帳票に記載された項目名と項目値を認識結果として出力する、帳票認識方法。
A form recognition method for recognizing a character string described in a form,
It is tabular data for classifying non-established forms, and for each record, includes keyword information for identifying the non-established form, and an area including a character string to be recognized in the non-established form Prepare table data with area information to show,
Obtain an image of the form,
Extract and recognize keyword information that identifies the form from the acquired image,
By comparing the obtained keyword information with the keyword information of each record in the table data, it is determined which non-enacted form the form corresponds to,
When it is determined that it does not correspond to any of the non-established forms, by performing a predetermined recognition process on the entire acquired image, the item name and item value described in the form are recognized as a recognition result. Output,
When it is determined that one of the non-established forms is determined, the area information is acquired from a record corresponding to the non-established form determined to be applicable, and the predetermined area is determined for the area determined by the area information. A form recognition method for outputting an item name and an item value described in the form as a recognition result by performing a recognition process.
請求項4に記載の帳票認識方法であって、
前記取得した画像が、制定帳票のものであるか否かを判定し、
前記制定帳票のものでないときに、前記キーワード情報の切り出し以後の工程を実行する、帳票認識方法。
The form recognition method according to claim 4,
Determining whether the acquired image is that of the enacted form,
A form recognition method for executing a process after the extraction of the keyword information when it is not of the established form.
JP2012153331A 2012-07-09 2012-07-09 Form recognition apparatus and form recognition method Pending JP2014016762A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012153331A JP2014016762A (en) 2012-07-09 2012-07-09 Form recognition apparatus and form recognition method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012153331A JP2014016762A (en) 2012-07-09 2012-07-09 Form recognition apparatus and form recognition method

Publications (1)

Publication Number Publication Date
JP2014016762A true JP2014016762A (en) 2014-01-30

Family

ID=50111405

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012153331A Pending JP2014016762A (en) 2012-07-09 2012-07-09 Form recognition apparatus and form recognition method

Country Status (1)

Country Link
JP (1) JP2014016762A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018055578A (en) * 2016-09-30 2018-04-05 富士通フロンテック株式会社 Document classification program, document classification apparatus, and document classification method
JP2020021461A (en) * 2018-07-20 2020-02-06 株式会社リコー Information processing apparatus, information processing method, and information processing program
JP2021064209A (en) * 2019-10-15 2021-04-22 富士ゼロックス株式会社 Information processor and information processing program
JP7439435B2 (en) 2019-09-30 2024-02-28 富士フイルムビジネスイノベーション株式会社 Information processing device and program
JP7456131B2 (en) 2019-11-29 2024-03-27 株式会社リコー Information processing system, information processing method and program

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003263608A (en) * 2003-03-05 2003-09-19 Hitachi Ltd Slip processing method and system
JP2007193678A (en) * 2006-01-20 2007-08-02 Fujitsu Ltd Medium distinction information database production device and medium distinction information database management device
JP2011248609A (en) * 2010-05-26 2011-12-08 Hitachi Omron Terminal Solutions Corp Form recognition device and form recognition method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003263608A (en) * 2003-03-05 2003-09-19 Hitachi Ltd Slip processing method and system
JP2007193678A (en) * 2006-01-20 2007-08-02 Fujitsu Ltd Medium distinction information database production device and medium distinction information database management device
JP2011248609A (en) * 2010-05-26 2011-12-08 Hitachi Omron Terminal Solutions Corp Form recognition device and form recognition method

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018055578A (en) * 2016-09-30 2018-04-05 富士通フロンテック株式会社 Document classification program, document classification apparatus, and document classification method
JP2020021461A (en) * 2018-07-20 2020-02-06 株式会社リコー Information processing apparatus, information processing method, and information processing program
JP7131488B2 (en) 2018-07-20 2022-09-06 株式会社リコー Information processing device, information processing method and information processing program
JP7439435B2 (en) 2019-09-30 2024-02-28 富士フイルムビジネスイノベーション株式会社 Information processing device and program
JP2021064209A (en) * 2019-10-15 2021-04-22 富士ゼロックス株式会社 Information processor and information processing program
JP7456131B2 (en) 2019-11-29 2024-03-27 株式会社リコー Information processing system, information processing method and program

Similar Documents

Publication Publication Date Title
JP5204208B2 (en) Receipt data collation support device and receipt data collation support program
US20210026823A1 (en) Systems and methods for enhanced mapping and classification of data
RU2679209C2 (en) Processing of electronic documents for invoices recognition
JP5494675B2 (en) Analysis method, analysis apparatus, and analysis program
US9824270B1 (en) Self-learning receipt optical character recognition engine
JP2014016762A (en) Form recognition apparatus and form recognition method
US20170337443A1 (en) Location based optical character recognition (ocr)
JP5670787B2 (en) Information processing apparatus, form type estimation method, and form type estimation program
US9286526B1 (en) Cohort-based learning from user edits
WO2019194051A1 (en) Image processing device, image processing method, and storage medium storing program
JPWO2019008766A1 (en) Voucher processing system and voucher processing program
JP2021043775A (en) Information processing device and program
JP2022125220A (en) Image processing apparatus, image processing method, and program
JP2015005100A (en) Information processor, template generation method, and program
JP6019187B1 (en) Company information matching apparatus and company information matching program
JP6507459B2 (en) Accounting system
CN114943219A (en) Method, device and equipment for generating bill of material test data and storage medium
CN110570207A (en) commodity tracing method and device
CN115374082A (en) Tax-related database analysis method, equipment and storage medium
US11170019B1 (en) Data field transaction repair interface
JP2021152696A (en) Information processor and program
JP2010026750A (en) Automatic definition system for data retrieval item information in electronic business form system
WO2023021636A1 (en) Data processing device, data processing method, and program
Niemir et al. Monitoring and improvement of data quality in product catalogs using defined normalizers and validation patterns
JP2019164557A (en) Retrieval system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150309

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151215

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20160517