JP2023081132A - Information processing system, form recognition method, program, form recognition system - Google Patents

Information processing system, form recognition method, program, form recognition system Download PDF

Info

Publication number
JP2023081132A
JP2023081132A JP2021194851A JP2021194851A JP2023081132A JP 2023081132 A JP2023081132 A JP 2023081132A JP 2021194851 A JP2021194851 A JP 2021194851A JP 2021194851 A JP2021194851 A JP 2021194851A JP 2023081132 A JP2023081132 A JP 2023081132A
Authority
JP
Japan
Prior art keywords
row
item
form recognition
unit
line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021194851A
Other languages
Japanese (ja)
Inventor
遼 岩崎
Ryo Iwasaki
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2021194851A priority Critical patent/JP2023081132A/en
Publication of JP2023081132A publication Critical patent/JP2023081132A/en
Pending legal-status Critical Current

Links

Images

Abstract

To provide an information processing system, a form recognition system, a form recognition method, and a program for more appropriately extracting item values written in a plurality of lines.SOLUTION: In a form recognition system 100, a server apparatus 200 provides a terminal apparatus 400 with recognition results obtained by recognizing character strings from image data in a tabular format having rows and columns. The server apparatus 200 comprises a form recognition processing unit 220 for concatenating item values of a first row that contains values in the preset column heading column and the item values of a second row that does not contain preset exclusion terms and is not blank, and a display screen generation unit for providing the terminal apparatus 400 with the item values of the first row and the second row that are concatenated by the form recognition processing unit 220.SELECTED DRAWING: Figure 1

Description

本発明は、情報処理システム、帳票認識方法、プログラム、及び、帳票認識システムに関する。 The present invention relates to an information processing system, a form recognition method, a program, and a form recognition system.

項目名とその項目値が表形式に配置された帳票をスキャンして、テキストデータに変換する技術が知られている。各企業は業務に合わせて帳票を作成するため、帳票の形式は企業によって様々である。このため、帳票が正しく認識されなかった場合、ユーザーが直接、項目値を抽出する領域を指定することが行われている。 A technique is known that scans a form in which item names and their item values are arranged in a tabular format and converts it into text data. Since each company creates a form according to its business, the format of the form varies depending on the company. Therefore, when the form is not recognized correctly, the user directly designates the area from which the item value is to be extracted.

簡易な操作で所定の項目値に対応する領域を設定する技術が知られている(例えば、特許文献1参照。)。特許文献1には、表形式の画像に抽出ガイドを表示し、抽出ガイドの位置の設定を受け付けることで、抽出領域を指定する情報処理システムが開示されている。 A technique for setting an area corresponding to a predetermined item value with a simple operation is known (see Patent Document 1, for example). Patent Literature 1 discloses an information processing system that designates an extraction region by displaying an extraction guide in a table-format image and accepting the setting of the position of the extraction guide.

しかしながら、従来の技術では、複数の行に記載された項目値が適切に抽出されないという問題がある。例えば、記載内容が複数の行にまたがる場合、行の区切りを適切に認識しないと記載内容が分断して抽出される。 However, the conventional technique has a problem that item values described in multiple lines are not properly extracted. For example, when the written content spans a plurality of lines, the written content will be divided and extracted if line delimiters are not properly recognized.

本発明は、上記課題に鑑み、複数の行に記載された項目値がより適切に抽出される情報処理システムを提供することを目的とする。 SUMMARY OF THE INVENTION It is an object of the present invention to provide an information processing system that more appropriately extracts item values described in multiple lines.

上記課題に鑑み、本発明は、行と列を有する表形式の画像データから文字を認識した認識結果を端末装置に提供する情報処理システムであって、前記認識結果から、予め設定されている列見出しの列に値を有する第一の行の項目値と、予め設定されている除外用語を含まず空白行でない第二の行の項目値を連結する帳票認識部と、前記帳票認識部により連結された前記第一の行と前記第二の行の項目値を前記端末装置に提供する表示画面生成部と、を有することを特徴とする。 In view of the above problems, the present invention provides an information processing system for providing a terminal device with a recognition result obtained by recognizing characters from table-format image data having rows and columns, wherein predetermined columns are obtained from the recognition result. a form recognition unit that concatenates the item values of the first row that have values in the heading column and the item values of the second row that does not contain preset exclusion terms and is not blank, and the form recognition unit concatenates and a display screen generator that provides the terminal device with the item values of the first row and the second row that have been generated.

複数の行に記載された項目値がより適切に抽出される情報処理システムを提供することができる。 It is possible to provide an information processing system that more appropriately extracts item values described in multiple lines.

帳票認識システムのシステム構成の一例を示す図である。It is a figure which shows an example of the system configuration|structure of a form recognition system. サーバ装置のハードウェア構成の一例を示す図である。It is a figure which shows an example of the hardware constitutions of a server apparatus. 端末装置のハードウェア構成の一例を示す図である。It is a figure which shows an example of the hardware constitutions of a terminal device. 業種判定データベースの一例を示す図である。It is a figure which shows an example of an industry determination database. 明細定義データベースに格納される明細定義情報の種類を示す図である。It is a figure which shows the kind of the specification definition information stored in a specification definition database. 汎用明細定義情報の一例を示す図である。It is a figure which shows an example of general-purpose specification definition information. 業種明細定義情報の一例を示す図である。It is a figure which shows an example of industry specification definition information. 個社明細定義情報の一例を示す図である。It is a figure which shows an example of individual company specification definition information. サーバ装置の機能を説明する図である。It is a figure explaining the function of a server apparatus. 端末装置の機能を説明する図である。It is a figure explaining the function of a terminal device. 帳票認識システムの動作を説明するシーケンス図の一例である(その1)。FIG. 11 is an example of a sequence diagram explaining the operation of the form recognition system (No. 1); 帳票認識システムの動作を説明するシーケンス図の一例である(その2)。FIG. 11 is an example of a sequence diagram explaining the operation of the form recognition system (No. 2); ジョブリストの一例を示す図である。FIG. 10 is a diagram showing an example of a job list; FIG. 帳票認識部の処理を説明する第一のフローチャート図の一例である。FIG. 10 is an example of a first flowchart for explaining processing of a form recognition unit; 帳票認識部の処理を説明する第二のフローチャート図の一例である。FIG. 10 is an example of a second flowchart for explaining the processing of the form recognition unit; 帳票認識部の処理を説明する第三のフローチャート図の一例である。FIG. 11 is an example of a third flowchart illustrating processing of the form recognition unit; 帳票画像データを説明する第一の図である。FIG. 4 is a first diagram for explaining form image data; 明細情報の抽出を説明する第二の図である。FIG. 10 is a second diagram for explaining extraction of detailed information; 読取結果データに基づき生成された明細部の明細情報を説明する第三の図である。FIG. 11 is a third diagram for explaining detailed information of a detailed part generated based on reading result data; 認識結果確認画面の一例を示す図である。It is a figure which shows an example of a recognition result confirmation screen. 認識結果における行の区切りの調整例を示す図である。FIG. 10 is a diagram illustrating an example of adjusting line breaks in a recognition result; 帳票認識部が複数の行を連結する手順を説明するフローチャート図の一例である。FIG. 10 is an example of a flowchart illustrating a procedure for a form recognition unit to concatenate a plurality of lines; ラベルAとラベルDの行の連結を模式的に説明する図である。FIG. 10 is a diagram schematically illustrating connection of rows of labels A and D; ラベルAとDの行の連結例を示す図である。FIG. 10 is a diagram showing an example of concatenation of rows labeled A and D; 図21の連結処理により帳票画像データの各行に設定されたラベルA~Dを示す図である。FIG. 22 is a diagram showing labels A to D set in each row of form image data by the linking process of FIG. 21; 図21の連結処理により連結された品名を説明する図である。21. It is a figure explaining the product name connected by the connection process of FIG. 比較される行の区切りの認識方法を示す図である。FIG. 4 is a diagram illustrating a method of recognizing line breaks to be compared; 行の区切りの認識方法の概略を示す図である。FIG. 4 is a diagram showing an outline of a method for recognizing line breaks; 帳票認識システムの動作を説明するシーケンス図の一例である(実施例2)。FIG. 11 is an example of a sequence diagram for explaining the operation of the form recognition system (second embodiment); 図28の連結処理により連結された品名を説明する図である(実施例2)。FIG. 29 is a diagram illustrating product names linked by the linking process of FIG. 28 (Example 2); 金額の列に消費税も表示される段組み帳票の一部を示す図である(実施例2)。FIG. 12 is a diagram showing a part of a multi-column form in which a consumption tax is also displayed in the amount column (Example 2). ユーザーが論理罫線の行の区切りを「金額」の列、1行飛ばしを指定した場合の段組み帳票の論理罫線の描画例を示す図である(実施例2)。FIG. 12 is a diagram showing a rendering example of logical ruled lines in a multi-column form when the user designates the column of “money” and skips one line as the line break of the logical ruled lines (Embodiment 2).

以下、本発明を実施するための形態の一例として、情報処理システムと情報処理システムが行う帳票認識方法について図面を参照しながら説明する。 An information processing system and a form recognition method performed by the information processing system will be described below as an example of embodiments of the present invention with reference to the drawings.

<用語について>
本実施形態におけるユーザーとは、例えば、帳票認識システムが提供するサービスを利用するための契約を締結している事業所や企業、団体等、及び、その社員や職員等である。
<Terms>
The user in the present embodiment is, for example, a business office, company, organization, etc., and its employees, employees, etc. who have concluded a contract for using the service provided by the form recognition system.

ユーザーは、取引先である帳票の発行元から帳票を入手し、経理処理などのために帳票認識システムを使用して帳票認識を行う。 A user obtains a form from a form issuer, who is a business partner, and uses a form recognition system for accounting processing or the like to recognize the form.

行とは、文字などの横の並びをいい、列とは、文字などの縦の並びをいう。表とは、少なくとも一部に行と列を有して、事柄を見やすいように配列したものである。このように事柄が配列された表示方法を表形式という。行が罫線で区切られていた場合、1行は罫線と罫線の間をいい、罫線で区切られていない場合、1行は文字列が横に並んでいる領域を含む表の端から端までである。空白行はおよそ一文字分の高さの行である。空白行には単なる記号の羅列(例えば、―――――、******など)が含まれてもよい。 A row refers to a horizontal arrangement of characters and the like, and a column refers to a vertical arrangement of characters and the like. A table is at least partially arranged in rows and columns so that things can be easily viewed. A display method in which items are arranged in this way is called a tabular format. If the rows are separated by ruled lines, one row is the space between the ruled lines; if not separated by ruled lines, one row is the edge-to-edge of the table that contains the horizontal text area. be. A blank line is a line approximately one character high. A blank line may contain a simple list of symbols (eg ----, ****, etc.).

列が縦罫で区切られていた場合、1列は縦罫と縦罫の間をいい、縦罫で区切られていない場合、1列は左右がスペースで区切られた表の先頭の文字列(列見出し)の長さを横幅とし、この文字列の下に縦方向に存在する最下部の文字列までを高さとする。 If the columns are separated by vertical ruled lines, one column is the space between the vertical ruled lines. The width is the length of the column heading), and the height is the bottommost character string that exists vertically under this character string.

帳票における正しい行の区切りとは、帳票の発行元が意図した行の区切りをいう。つまり、帳票における正しい行の区切りとは、帳票の記載内容が複数行にわたる場合に、どの行からどの行までを連結するべきか判断することをいう。当然ながら、発行元が意図した行の区切りは、ユーザーにとっても正しい行の区切りである。
本実施形態における文字列とは、英数字、かな文字、漢字、各種記号(!$%等)などをいい、項目名に対する項目値が文字列であるとして説明する。帳票によっては、文字列は、当該企業でのみ通用するマークやコードなども含む。
A correct line break in a form means a line break intended by the issuer of the form. In other words, correct line delimiting in a form means determining from which line to which line should be concatenated when the description content of the form extends over multiple lines. Of course, the line breaks intended by the publisher are also the correct line breaks for the user.
A character string in this embodiment refers to alphanumeric characters, kana characters, kanji characters, various symbols (!$%, etc.), etc., and it is assumed that an item value for an item name is a character string. Depending on the form, the character string may include marks and codes that are used only by the company.

<システム構成例>
図1は、帳票認識システムのシステム構成の一例を示す図である。本実施形態の帳票認識システム100は、サーバ装置200、画像形成装置300、端末装置400を有する。本実施形態の帳票認識システム100において、サーバ装置200と、画像形成装置300と、端末装置400とは、ネットワークを介して接続される。本実施形態のサーバ装置200は、情報処理システムの一例である。
<System configuration example>
FIG. 1 is a diagram showing an example of the system configuration of a form recognition system. A form recognition system 100 of this embodiment has a server device 200 , an image forming device 300 and a terminal device 400 . In the form recognition system 100 of this embodiment, the server device 200, the image forming device 300, and the terminal device 400 are connected via a network. The server device 200 of this embodiment is an example of an information processing system.

また、サーバ装置200は、例えば、ネットワークを介して基幹システム500と接続される。基幹システム500とは、例えば、本実施形態の帳票認識システム100において帳票を認識した結果を用いて、特定の処理を行うシステムである。具体的には、例えば、基幹システム500は、会計システムや、見積もり作成システム等であっても良い。 Also, the server device 200 is connected to the core system 500 via a network, for example. The core system 500 is, for example, a system that performs specific processing using the result of recognition of a form by the form recognition system 100 of this embodiment. Specifically, for example, the core system 500 may be an accounting system, an estimate creation system, or the like.

本実施形態の帳票認識システム100において、サーバ装置200は、画像形成装置300のスキャナ機能によって読み取られた帳票の画像データから、帳票に含まれる項目と項目値とを抽出し、項目と項目値とを対応付けたテキストデータに変換する。 In the form recognition system 100 of the present embodiment, the server device 200 extracts items and item values included in the form from the image data of the form read by the scanner function of the image forming apparatus 300, and extracts the items and item values. to text data associated with

サーバ装置200はインターネット上に存在してもよいし、オンプレミスに存在してもよい。インターネット上に存在する場合はクラウドコンピューティングに対応しているとよい。クラウドとは、特定のハードウェア資源を意図しない場合に用いられる用語である。 The server device 200 may exist on the Internet or may exist on-premises. If it exists on the Internet, it should be compatible with cloud computing. Cloud is a term used when not referring to specific hardware resources.

以下の説明では、画像形成装置300のスキャナ機能によって読み取られた帳票の画像又は画像データを帳票画像又は帳票画像データと呼ぶ。 In the following description, a form image or image data read by the scanner function of the image forming apparatus 300 is referred to as a form image or form image data.

また、以下の説明では、帳票画像に含まれる項目と、この項目値とを抽出し、項目と項目値とをテキストデータに変換して対応付けることを、帳票認識と呼ぶ。 In the following description, extracting items included in a form image and their item values, converting the items and item values into text data, and associating them with each other will be referred to as form recognition.

本実施形態のサーバ装置200は、記憶部210と、帳票認識処理部220とを有する。記憶部210には、帳票画像データベース230、業種判定データベース240、明細定義データベース250、認識結果データベース260が設けられている。 The server device 200 of this embodiment has a storage unit 210 and a form recognition processing unit 220 . The storage unit 210 is provided with a form image database 230 , an industry determination database 240 , a statement definition database 250 and a recognition result database 260 .

帳票画像データベース230は、帳票画像データが格納される。業種判定データベース240は、帳票の発行元の業種を判別する際に参照される情報が格納される。明細定義データベース250は、帳票認識処理部220による帳票認識を行う際に参照される明細定義情報が格納される。認識結果データベース260は、帳票認識処理部220による帳票認識の結果を示す情報である認識結果データが格納される。 The form image database 230 stores form image data. The industry determination database 240 stores information referred to when determining the industry of the issuer of the form. The statement definition database 250 stores statement definition information that is referred to when the form recognition processing unit 220 performs form recognition. The recognition result database 260 stores recognition result data, which is information indicating the result of form recognition by the form recognition processing unit 220 .

本実施形態の帳票認識処理部220は、帳票画像データベース230に格納された帳票画像データを取得し、業種判定データベース240を参照して帳票の発行元の業種の判定と、参照すべき明細定義情報の特定を行う。そして、帳票認識処理部220は、明細定義データベース250において、特定された明細定義情報を用いて帳票認識を行い、その結果を認識結果データベース260へ格納する。明細定義情報とは、帳票に含まれる明細項目の項目名と項目名の記載位置を示す情報と、を含む。 The form recognition processing unit 220 of the present embodiment acquires the form image data stored in the form image database 230, refers to the business type determination database 240, determines the business type of the issuer of the form, and specifies the specification definition information to be referred to. identification. Then, the form recognition processing unit 220 performs form recognition using the specified detailed definition information in the detailed definition database 250 and stores the result in the recognition result database 260 . The detail definition information includes the item names of the detail items included in the form and information indicating the description positions of the item names.

ここで、本実施形態の帳票認識処理部220は、帳票認識を行う際に、明細定義データベース250に格納された、個社明細定義情報と、業種明細定義情報と、汎用明細定義情報と、を参照する。 Here, the form recognition processing unit 220 of the present embodiment recognizes the individual company statement definition information, the industry statement definition information, and the general statement definition information stored in the statement definition database 250 when performing the form recognition. refer.

本実施形態の汎用明細定義情報とは、一般的な帳票における明細項目名に対応する単語を定義した情報である。業種明細定義情報は、業種毎の帳票における明細項目名に対応する単語を定義した情報である。個社明細定義情報とは、帳票認識システム100を利用するユーザー固有の帳票における明細項目名に対応する単語と帳票画像から抽出する情報を定義した情報である。業種判定データベース240と、明細定義データベース250の詳細は後述する。 The general-purpose specification definition information of this embodiment is information defining words corresponding to specification item names in general forms. The industry detail definition information is information defining words corresponding to the detail item names in the form for each industry. Individual company statement definition information is information that defines information extracted from a word corresponding to a statement item name and a form image in a form specific to a user who uses the form recognition system 100 . Details of the business category determination database 240 and the specification definition database 250 will be described later.

本実施形態では、このように、帳票認識の際に、3種類の明細定義情報を用いることで、汎用的な帳票に加えて、帳票の明細部を認識することができ、帳票の認識の精度を向上させることができる。 In this embodiment, by using three types of detail definition information when recognizing a form, the detailed part of the form can be recognized in addition to the general-purpose form. can be improved.

帳票における明細部について簡単に説明する。帳票の明細部は、データの集計結果等を示す部分であり、明細項目毎に、同じ形式のデータが縦方向に繰り返し印刷された部分である。明細項目とは、明細部で集計されるデータの項目である。一般的な明細項目としては、商品名、数量、単価、金額等が含まれる。明細部の具体的例は後述する。 A brief description will be given of the detail part of the form. The detail part of the form is a part showing the result of totaling data and the like, and is a part in which data of the same format is repeatedly printed in the vertical direction for each detail item. A detail item is an item of data that is aggregated in the detail part. Common detail items include product name, quantity, unit price, price, and the like. A specific example of the specification part will be described later.

本実施形態の帳票認識システム100において、画像形成装置300は、スキャナ機能を有する複合機である。画像形成装置300は、コピー機能、FAX機能、スキャナ機能等を実現するためのアプリケーションが搭載されており、各機能と対応するアプリケーションを選択することで、これらの機能が実現される。画像形成装置300は、カメラを備えた例えば、スマートフォン、書画カメラ、タブレット端末等の情報処理装置でもよい。これらの情報処理装置ではOCRアプリが動作して、単体で又はサーバ装置200と連携して本実施形態と同様の処理を行うことができる。また、スキャナ装置など単体の読み取り機能とOCRアプリを搭載した情報処理装置とがネットワークを介してつながる形態やOCR機能をサーバ装置に備える形式でもよい。 In the form recognition system 100 of this embodiment, the image forming apparatus 300 is a multifunction machine having a scanner function. The image forming apparatus 300 is equipped with applications for realizing a copy function, a FAX function, a scanner function, etc. By selecting an application corresponding to each function, these functions are realized. The image forming apparatus 300 may be an information processing apparatus including a camera, such as a smartphone, document camera, tablet terminal, or the like. An OCR application operates in these information processing apparatuses, and the same processing as in the present embodiment can be performed independently or in cooperation with the server apparatus 200 . Alternatively, a form in which a standalone reading function such as a scanner device and an information processing device equipped with an OCR application are connected via a network, or a form in which the OCR function is provided in a server device may be employed.

本実施形態の端末装置400は、帳票認識システム100を利用するユーザーによって使用される。また、端末装置400には、サーバ装置200による帳票認識の結果が表示されても良い。 The terminal device 400 of this embodiment is used by a user who uses the form recognition system 100 . Further, the terminal device 400 may display the result of form recognition by the server device 200 .

また、図1の例では、サーバ装置200は、記憶部210内に4つのデータベースを有する構成としたが、これに限定されない。各データベースは、一部がサーバ装置200の外部装置に設けられていても良いし、各データベース全てが外部装置に設けられていても良い。 In addition, in the example of FIG. 1, the server device 200 is configured to have four databases in the storage unit 210, but the present invention is not limited to this. A part of each database may be provided in an external device of the server device 200, or all of the databases may be provided in an external device.

また、図1の例では、サーバ装置200が帳票認識処理部220を実現するものとしたが、これに限定されない。帳票認識処理部220は、複数の情報処理装置によって実現されても良い。 Also, in the example of FIG. 1, the server apparatus 200 implements the form recognition processing unit 220, but the present invention is not limited to this. The form recognition processing unit 220 may be realized by a plurality of information processing devices.

また、図1の例では、帳票認識システム100に含まれる画像形成装置300と端末装置400とは、それぞれ1台としているが、帳票認識システム100に含まれる画像形成装置300と端末装置400の台数は、任意の数であって良い。 In the example of FIG. 1, one image forming device 300 and one terminal device 400 are included in the form recognition system 100. However, the number of image forming devices 300 and terminal devices 400 included in the form recognition system 100 is can be any number.

次に、図2を参照して、本実施形態のサーバ装置200のハードウェア構成について説明する。図2は、サーバ装置200のハードウェア構成の一例を示す図である。 Next, with reference to FIG. 2, the hardware configuration of the server device 200 of this embodiment will be described. FIG. 2 is a diagram showing an example of the hardware configuration of the server device 200. As shown in FIG.

本実施形態のサーバ装置200は、コンピュータによって構築されており、図2に示されているように、CPU201、ROM202、RAM203、HD204、HDD(Hard Disk Drive)コントローラ205、ディスプレイ206、外部機器接続I/F(Interface)208、ネットワークI/F209、データバスB、キーボード211、ポインティングデバイス212、光学ドライブ214、メディアI/F216を備えている。 The server device 200 of this embodiment is constructed by a computer, and as shown in FIG. /F (Interface) 208 , network I/F 209 , data bus B, keyboard 211 , pointing device 212 , optical drive 214 and media I/F 216 .

これらのうち、CPU201は、サーバ装置200全体の動作を制御する。ROM202は、IPL等のCPU201の駆動に用いられるプログラムを記憶する。RAM203は、CPU201のワークエリアとして使用される。HD204は、プログラム等の各種データを記憶する。HDDコントローラ205は、CPU201の制御にしたがってHD204に対する各種データの読み出し又は書き込みを制御する。ディスプレイ206は、カーソル、メニュー、ウィンドウ、文字、又は画像などの各種情報を表示する表示部である。 Among these, the CPU 201 controls the operation of the server apparatus 200 as a whole. The ROM 202 stores programs used to drive the CPU 201, such as IPL. A RAM 203 is used as a work area for the CPU 201 . The HD 204 stores various data such as programs. The HDD controller 205 controls reading or writing of various data to/from the HD 204 under the control of the CPU 201 . A display 206 is a display unit that displays various types of information such as a cursor, menus, windows, characters, and images.

外部機器接続I/F208は、各種の外部機器を接続するためのインターフェースである。この場合の外部機器は、例えば、USB(Universal Serial Bus)メモリやプリンタ等である。ネットワークI/F209は、通信ネットワークNを利用してデータ通信をするためのインターフェースである。データバスBは、図2に示されているCPU201等の各構成要素を電気的に接続するためのアドレスバスやデータバス等である。 The external device connection I/F 208 is an interface for connecting various external devices. The external device in this case is, for example, a USB (Universal Serial Bus) memory, a printer, or the like. A network I/F 209 is an interface for data communication using the communication network N. FIG. The data bus B is an address bus, a data bus, etc. for electrically connecting each component such as the CPU 201 shown in FIG.

また、キーボード211は、文字、数値、各種指示などの入力のための複数のキーを備えた入力手段の一種である。ポインティングデバイス212は、各種指示の選択や実行、処理対象の選択、カーソルの移動などを行う入力手段の一種である。光学ドライブ214は、着脱可能な記録媒体の一例としての光記憶媒体213に対する各種データの読み出し又は書き込みを制御する。なお、光記憶媒体213は、CD、DVD、Blu-ray(登録商標)等でよい。メディアI/F216は、フラッシュメモリ等の記録メディア215に対するデータの読み出し又は書き込み(記憶)を制御する。 Also, the keyboard 211 is a kind of input means having a plurality of keys for inputting characters, numerical values, various instructions, and the like. The pointing device 212 is a kind of input means for selecting and executing various instructions, selecting a processing target, moving a cursor, and the like. The optical drive 214 controls reading and writing of various data to and from an optical storage medium 213, which is an example of a removable recording medium. Note that the optical storage medium 213 may be a CD, DVD, Blu-ray (registered trademark), or the like. A media I/F 216 controls reading or writing (storage) of data to a recording medium 215 such as a flash memory.

本実施形態のサーバ装置200は、例えば、スマートフォン、タブレット端末、PDA
(Personal Digital Assistant)、ウェアラブルPC等であっても良い。
The server device 200 of this embodiment is, for example, a smartphone, a tablet terminal, a PDA
(Personal Digital Assistant), a wearable PC, or the like.

本実施形態の端末装置400は、演算処理装置と記憶装置とを有するコンピュータであり、例えば、PC(Personal Computer)、タブレット端末、スマートフォン等であっても良い。図3は、端末装置400のハードウェア構成の一例を示す図である。 The terminal device 400 of this embodiment is a computer having an arithmetic processing device and a storage device, and may be, for example, a PC (Personal Computer), a tablet terminal, a smartphone, or the like. FIG. 3 is a diagram showing an example of the hardware configuration of the terminal device 400. As shown in FIG.

本実施形態の端末装置400は、CPU401、ROM402、RAM403、EEPROM404、CMOSセンサ405、撮像素子I/F406、加速度・方位センサ407、メディアI/F409、GPS受信部411を備えている。 The terminal device 400 of this embodiment includes a CPU 401 , a ROM 402 , a RAM 403 , an EEPROM 404 , a CMOS sensor 405 , an image sensor I/F 406 , an acceleration/direction sensor 407 , a media I/F 409 and a GPS receiver 411 .

これらのうち、CPU401は、端末装置400全体の動作を制御する演算処理装置である。ROM402は、CPU401やIPL等のCPU401の駆動に用いられるプログラムを記憶する。RAM403は、CPU401のワークエリアとして使用される。EEPROM404は、CPU401の制御にしたがって、スマートフォン用プログラム等の各種データの読み出し又は書き込みを行う。ROM402、RAM403、EEPROM404は、端末装置400の記憶装置の一例である。 Among these, the CPU 401 is an arithmetic processing unit that controls the operation of the terminal device 400 as a whole. The ROM 402 stores programs used to drive the CPU 401 such as the CPU 401 and IPL. A RAM 403 is used as a work area for the CPU 401 . The EEPROM 404 reads or writes various data such as smartphone programs under the control of the CPU 401 . The ROM 402 , RAM 403 and EEPROM 404 are examples of storage devices of the terminal device 400 .

CMOS(Complementary Metal Oxide Semiconductor)センサ405は、CPU401の制御にしたがって被写体(主に自画像)を撮像して画像データを得る内蔵型の撮像手段の一種である。なお、CMOSセンサは、CCD(Charge Coupled Device)センサ等の撮像手段であってもよい。 A CMOS (Complementary Metal Oxide Semiconductor) sensor 405 is a type of built-in imaging means for capturing an object (mainly a self-portrait) and obtaining image data under the control of the CPU 401 . The CMOS sensor may be imaging means such as a CCD (Charge Coupled Device) sensor.

撮像素子I/F406は、CMOSセンサ305の駆動を制御する回路である。加速度・方位センサ407は、地磁気を検知する電子磁気コンパスやジャイロコンパス、加速度センサ等の各種センサである。メディアI/F409は、フラッシュメモリ等の記録メディア408に対するデータの読み出し又は書き込み(記憶)を制御する。GPS受信部411は、GPS衛星からGPS信号を受信する。 An imaging device I/F 406 is a circuit that controls driving of the CMOS sensor 305 . The acceleration/direction sensor 407 is various sensors such as an electronic magnetic compass, a gyro compass, and an acceleration sensor for detecting geomagnetism. A media I/F 409 controls reading or writing (storage) of data to a recording medium 408 such as a flash memory. The GPS receiver 411 receives GPS signals from GPS satellites.

また、端末装置400は、遠距離通信回路412、遠距離通信回路412のアンテナ412a、マイク415、スピーカ416、音入出力I/F417、ディスプレイ418、外部機器接続I/F(Interface)419、近距離通信回路420、近距離通信回路420のアンテナ420a、及びタッチパネル421を備えている。 The terminal device 400 also includes a long-distance communication circuit 412, an antenna 412a of the long-distance communication circuit 412, a microphone 415, a speaker 416, a sound input/output I/F 417, a display 418, an external device connection I/F (Interface) 419, a near A distance communication circuit 420, an antenna 420a of the short distance communication circuit 420, and a touch panel 421 are provided.

これらのうち、遠距離通信回路412は、通信ネットワークを介して、他の機器と通信する回路である。マイク415は、音を電気信号に変える内蔵型の回路である。スピーカ416は、電気信号を物理振動に変えて音楽や音声などの音を生み出す内蔵型の回路である。音入出力I/F417は、CPU401の制御にしたがってマイク415及びスピーカ416との間で音信号の入出力を処理する回路である。 Among these, the telecommunications circuit 412 is a circuit that communicates with other devices over a communication network. Microphone 415 is a built-in circuit that converts sound into an electrical signal. The speaker 416 is a built-in circuit that converts electrical signals into physical vibrations to produce sounds such as music and voice. A sound input/output I/F 417 is a circuit for processing input/output of sound signals between the microphone 415 and the speaker 416 under the control of the CPU 401 .

ディスプレイ418は、被写体の画像や各種アイコン等を表示する液晶や有機EL(Electro Luminescence)などの表示手段の一種である。外部機器接続I/F419は、各種の外部機器を接続するためのインターフェースである。近距離通信回路420は、NFC(Near Field Communication)やBluetooth(登録商標)等の通信回路である。タッチパネル421は、ユーザーがディスプレイ418を押下することで、端末装置400を操作する入力手段の一種である。ディスプレイ418は、端末装置400の有する表示部の一例である。 A display 418 is a kind of display means such as liquid crystal or organic EL (Electro Luminescence) that displays an image of a subject, various icons, and the like. The external device connection I/F 419 is an interface for connecting various external devices. The short-range communication circuit 420 is a communication circuit such as NFC (Near Field Communication) or Bluetooth (registered trademark). The touch panel 421 is a kind of input means for operating the terminal device 400 by the user pressing the display 418 . A display 418 is an example of a display unit included in the terminal device 400 .

<データベースの構成例>
次に、本実施形態のサーバ装置200の有する業種判定データベース240と明細定義データベース250について説明する。
<Database configuration example>
Next, the business category determination database 240 and the specification definition database 250 of the server device 200 of this embodiment will be described.

図4は、業種判定データベースの一例を示す図である。本実施形態の業種判定データベース240は、各種の業種毎に設けられる。 FIG. 4 is a diagram showing an example of a business category determination database. The business type determination database 240 of this embodiment is provided for each type of business type.

業種判定データベース240では、業種と、帳票の発行元とが対応付けられている。図3の例では、業種「小売り」と、A社、B社、C社とが対応付けられている。したがって、A社、B社、C社は、小売り業を行っている組織であることがわかる。 In the business type determination database 240, the business type is associated with the issuer of the form. In the example of FIG. 3, the business type "retail" is associated with A company, B company, and C company. Therefore, it can be seen that Company A, Company B, and Company C are organizations engaged in retail business.

次に、図5乃至図8を参照して、本実施形態の明細定義データベース250について説明する。図5は、明細定義データベースに格納される明細定義情報の種類を示す図である。 Next, the specification definition database 250 of this embodiment will be described with reference to FIGS. 5 to 8. FIG. FIG. 5 is a diagram showing types of specification definition information stored in the specification definition database.

本実施形態の明細定義データベース250には、個社明細定義情報251と、業種明細定義情報252と、汎用明細定義情報253と、が格納されている。個社明細定義情報251とは、帳票の中でも、発行元が独自に設計した(あるいは発行元が独自で管理している管理システム等で使われている)帳票に含まれる明細項目名と記載位置を定義した明細定義情報であり、発行元専用の明細定義情報である。個社明細定義情報251は、3つの明細定義情報のうち、最も尊重されるべき定義であり、最も優先度が高い明細定義情報である。 In the specification definition database 250 of this embodiment, individual company specification definition information 251, industry specification definition information 252, and general specification definition information 253 are stored. The individual company detail definition information 251 is the detail item name and description position included in the form originally designed by the issuer (or used in a management system etc. independently managed by the issuer) among the forms. , and is the issuer-specific specification definition information. The individual company specification definition information 251 is the definition that should be respected the most among the three specification definition information, and is the specification definition information with the highest priority.

本実施形態の業種明細定義情報252は、帳票の中でも、各業界において一般的に利用される帳票に含まれる明細項目名と記載位置を定義した明細定義情報である。業種明細定義情報252の優先度は、3つの明細定義情報のうちの中間となる。 The industry specification definition information 252 of the present embodiment is specification definition information that defines the specification item names and description positions included in the forms generally used in each industry among the forms. The priority of the industry specification definition information 252 is intermediate among the three specification definition information.

本実施形態の汎用明細定義情報253とは、帳票の中でも、複数のユーザーにより利用される汎用性の高い帳票に含まれる明細項目名と記載位置を定義した明細定義情報である。汎用明細定義情報253は、3つの明細定義情報のうち、最も優先度の低い明細定義情報である。 The general-purpose specification definition information 253 of this embodiment is specification definition information that defines specification item names and description positions included in a highly versatile form that is used by a plurality of users. The general-purpose specification definition information 253 is specification definition information with the lowest priority among the three specification definition information.

本実施形態の帳票認識処理部220は、この3つの明細定義情報を参照して、帳票画像データの認識を行う。したがって、本実施形態では、例えば、帳票画像データが、個社明細定義情報251において定義されていない明細項目名を含む帳票のものであった場合でも、業種明細定義情報252や汎用明細定義情報253で定義されていれば、この帳票画像データを認識できる。 The form recognition processing unit 220 of this embodiment refers to these three items of specification definition information to recognize form image data. Therefore, in this embodiment, for example, even if the form image data is for a form that includes a detail item name that is not defined in the individual company detail definition information 251, the industry detail definition information 252 and the general detail definition information 253 , the form image data can be recognized.

なお、以下の説明では、請求書を帳票の一例として説明する。なお、帳票は、明細部を含むものであれば、どのような帳票であっても良い。具体的には、例えば、帳票は、納品書や見積書、仕入れ伝票等であっても良い。 In the following description, a bill is used as an example of a form. Note that the form may be any form as long as it includes a detail part. Specifically, for example, the form may be a statement of delivery, an estimate, a purchase slip, or the like.

帳票が納品書である場合には、発行元は納品書を発行した納品元となり、帳票が仕入れ伝票の場合には、発行元は仕入れ伝票を発行した仕入れ元となる。 If the form is a statement of delivery, the issuer is the delivery source that issued the statement of delivery, and if the form is a purchase slip, the issuer is the purchaser that issued the purchase slip.

図6は、汎用明細定義情報の一例を示す図である。汎用明細定義情報253は、一般的な請求書の明細部で採用される明細項目名を定義するものであり、汎用明細定義情報253は、情報の項目として、明細項目名と、キーワードとを有し、両者は対応付けられている。 FIG. 6 is a diagram showing an example of general-purpose specification definition information. The general-purpose specification definition information 253 defines the specification item names adopted in the specification of a general bill, and the general-purpose specification definition information 253 has specification item names and keywords as information items. and both are associated.

項目「明細項目名」の値は、請求書の明細部で用いられる明細項目の名称を示す。項目「キーワード」の値は、明細部の明細項目名と同義と見なされるキーワード(単語)を示す。 The value of the item "description item name" indicates the name of the detail item used in the description part of the invoice. The value of the item "keyword" indicates a keyword (word) that is considered synonymous with the description item name of the description part.

つまり、汎用明細定義情報253は、一般的な帳票で用いられる明細項目、帳票から明細項目として抽出するキーワードと、を定義した情報である。 That is, the general-purpose specification definition information 253 is information that defines specification items used in general forms and keywords extracted as specification items from the forms.

図6の例では、明細項目名「商品名」は、「商品」、「製品」、「品名」等のキーワードと同義として扱われることを示している。また、図6の例では、明細項目名「金額」は、「金額」、「総額」、「合計」等のキーワードと同義として扱われることを示している。 The example of FIG. 6 indicates that the item name "product name" is treated as synonymous with keywords such as "product", "product", and "product name". In the example of FIG. 6, the detail item name "amount" is treated as being synonymous with keywords such as "amount", "total amount", and "total".

また、図6の例では、明細項目名「注文番号」は、「注文No.」、「伝票番号」等のキーワードと同義として扱われることを示している。また、図6の例では、明細項目名「商品コード」は、「商品No.」、「商品番号」等のキーワードと同義として扱われることを示している。 In the example of FIG. 6, the item name "order number" is treated as being synonymous with keywords such as "order number" and "slip number". In addition, the example of FIG. 6 indicates that the item name "product code" is treated synonymously with keywords such as "product No." and "product number".

図7は、業種明細定義情報の一例を示す図である。業種明細定義情報252は、業種毎に設けられる情報であり、業種が示す業界における一般的な請求書の明細部で採用される項目名を定義するものである。 FIG. 7 is a diagram showing an example of industry specification definition information. The industry specification definition information 252 is information provided for each industry, and defines item names adopted in general invoice details in the industry indicated by the industry.

業種明細定義情報252は、業種を特定する情報と、項目「明細項目名」と、項目「キーワード」とを有し、両者は対応付けられている。図7の例では、業種が「小売り業」であることを示している。 The business type specification definition information 252 has information specifying the business type, an item "specification item name", and an item "keyword", and both are associated with each other. The example of FIG. 7 indicates that the business type is "retail business".

項目「明細項目名」の値は、一般的な請求書の明細部で用いられる明細項目の名称を示す。項目「キーワード」の値は、請求元が小売り業の請求書において、一般的な明細項目名に相当するキーワード(単語)を示す。 The value of the item "description item name" indicates the name of the detail item used in the description part of a general invoice. The value of the item "keyword" indicates a keyword (word) corresponding to a general detail item name in an invoice for which the billing source is a retail business.

つまり、業種明細定義情報252は、業種と、帳票で用いられる明細項目、帳票から明細項目として抽出するキーワードと、を定義した情報である。 That is, the industry specification definition information 252 is information that defines the industry, specification items used in the form, and keywords extracted as the specification items from the form.

図7の例では、一般的な帳票の明細項目名「商品名」は、発行元が小売り業の請求書の明細部では、「品名」、「製品名」等のキーワードに置き換えられる場合があることを示している。 In the example of FIG. 7, the item name "product name" of general forms may be replaced with keywords such as "product name" and "product name" in the details of invoices issued by retailers. It is shown that.

図8は、個社明細定義情報の一例を示す図である。本実施形態の個社明細定義情報251は、発行元ごとにユーザー側で登録されるものである。発行元が同じでもユーザーによって個社明細定義情報251が異なる場合はある。 FIG. 8 is a diagram showing an example of individual company specification definition information. The individual company statement definition information 251 of this embodiment is registered by the user for each issuer. Even if the issuer is the same, the individual company statement definition information 251 may differ depending on the user.

個社明細定義情報251では、請求元を特定する情報と、項目「明細項目名」と、項目「抽出情報」とが対応付けられている。 In the individual company statement definition information 251, the information specifying the invoicing party, the item "description item name", and the item "extraction information" are associated with each other.

請求元を特定する情報とは、請求元の名称、電話番号、口座番号等を含む。なお、図8の例では、請求元を特定する情報に、請求元の名称、電話番号、口座番号が含まれるものとしたが、請求元を特定する情報は、これらの情報のうちいずれか1つであっても良い。 The information identifying the invoicing party includes the invoicing party's name, telephone number, account number, and the like. In the example of FIG. 8, the information identifying the invoicing party includes the name, telephone number, and account number of the invoicing party. can be one.

項目「明細項目名」の値は、一般的な請求書の明細部で用いられる明細項目の名称を示す。言い換えれば、個社明細定義情報251における明細項目名とは、帳票で用いられる明細項目を示す。 The value of the item "description item name" indicates the name of the detail item used in the description part of a general invoice. In other words, the detail item name in the individual company detail definition information 251 indicates the detail item used in the form.

項目「抽出情報」の値は、請求元から発行される請求書において、一般的な明細項目に相当するキーワード(単語)として抽出するキーワードと、請求書を示す帳票画像において、このキーワードが記載されている位置を示す情報とを含む。 The value of the item "extracted information" is a keyword (word) extracted as a keyword (word) corresponding to a general detailed item in the invoice issued by the invoice source, and this keyword is described in the form image showing the invoice. and information indicating the location of the

つまり、個社明細定義情報251における抽出情報は、帳票から明細項目として抽出するキーワードと、帳票におけるキーワードの位置を示す情報とを含む。したがって、個社明細定義情報251は、帳票で用いられる明細項目と、明細項目として抽出するキーワードと、帳票におけるキーワードの位置を示す情報とを定義した情報である。 That is, the extraction information in the individual company specification definition information 251 includes keywords extracted as specification items from the form and information indicating the position of the keyword in the form. Therefore, the individual company specification definition information 251 is information that defines specification items used in the form, keywords to be extracted as the specification items, and information indicating the position of the keyword in the form.

図8の例では、一般的な帳票の明細項目名「商品名」は、請求元がA社である請求書の明細部では、「品名」、等のキーワードに置き換えられる場合があることを示している。 The example in FIG. 8 shows that the item name "product name" of a general form may be replaced with a keyword such as "product name" in the details of an invoice from Company A. ing.

また、図8の例では、請求元がA社である請求書を示す帳票画像におけるキーワード「品名」の位置を示す情報として、キーワードの座標を示すキーワード座標、キーワード「品名」が記入されたセルの座標を示すセル座標、キーワード「品名」が記入された列の座標を示す列座標が抽出されることを示している。 Further, in the example of FIG. 8, as information indicating the position of the keyword "product name" in the form image showing the invoice for which the invoice is made by Company A, a cell in which the keyword coordinates indicating the coordinates of the keyword and the keyword "product name" are entered. and column coordinates indicating the coordinates of the column in which the keyword "product name" is entered are extracted.

なお、請求書を示す帳票画像において、キーワードが記載されている位置を示す情報とは、キーワード座標でよい。キーワード座標は、キーワードに外接する矩形において対角線上にある2点の座標である。この座標から、キーワードに外接する矩形の幅と高さがわかる。同様にセル座標は、キーワードの直下のセルにおける文字列に外接する矩形において対角線上にある2点の座標である。なお、同じ列にあるセルの幅と高さは同じとする。列座標は、キーワードの直下のセルの文字列から最下部のセルの文字列に外接する矩形において対角線上にある2点の座標である。 Note that the information indicating the position where the keyword is written in the form image indicating the invoice may be keyword coordinates. The keyword coordinates are coordinates of two diagonal points in a rectangle circumscribing the keyword. From these coordinates, the width and height of the circumscribing rectangle of the keyword can be found. Similarly, the cell coordinates are coordinates of two diagonal points in a rectangle circumscribing the character string in the cell immediately below the keyword. Assume that cells in the same column have the same width and height. The column coordinates are the coordinates of two diagonal points in a rectangle that circumscribes the character string in the cell immediately below the keyword and the character string in the lowest cell.

<サーバ装置の機能>
次に、図9を参照して、本実施形態のサーバ装置200の機能について説明する。図9は、サーバ装置200の機能を説明する図である。
<Server device functions>
Next, with reference to FIG. 9, functions of the server device 200 of this embodiment will be described. FIG. 9 is a diagram for explaining the functions of the server device 200. As shown in FIG.

本実施形態のサーバ装置200では、例えば、HD204やRAM203等に格納された情報処理プログラムをCPU201が読み出して実行することで、後述する各部の機能が実現される。 In the server apparatus 200 of this embodiment, for example, the CPU 201 reads out and executes an information processing program stored in the HD 204, the RAM 203, etc., thereby realizing the functions of each unit described later.

本実施形態のサーバ装置200は、帳票認識処理部220、定義登録部290、通信部298を有する。帳票認識処理部220は、入力受付部221、認証処理部222、帳票認識部270を有する。 The server device 200 of this embodiment has a form recognition processing unit 220 , a definition registration unit 290 and a communication unit 298 . The form recognition processing section 220 has an input reception section 221 , an authentication processing section 222 and a form recognition section 270 .

入力受付部221は、サーバ装置200に対する各種の入力を受け付ける。具体的には、入力受付部221は、帳票認識システム100にログインするための認証情報の入力を受け付ける。認証情報とは、例えば、ユーザーIDとパスワード等である。また、入力受付部221は、例えば、画像形成装置300から送信された帳票画像データの入力を受け付ける。入力受付部221は、通信部298を介してサーバ装置200に対する入力を受け付けて良いし、サーバ装置200に対して直接行われた入力を受け付けても良い。 The input reception unit 221 receives various inputs to the server device 200 . Specifically, the input reception unit 221 receives input of authentication information for logging into the form recognition system 100 . Authentication information is, for example, a user ID and a password. The input reception unit 221 also receives input of form image data transmitted from the image forming apparatus 300, for example. The input reception unit 221 may receive an input to the server device 200 via the communication unit 298 or may receive an input made directly to the server device 200 .

認証処理部222は、入力受付部221が入力を受け付けた認証情報に基づき、認証を行う。なお、認証処理部222は、例えば、サーバ装置200の外部に設けられた認証サーバに対して、入力された認証情報を送信し、認証サーバによる認証の結果を取得しても良い。認証処理部222は、ユーザーが認証されると、入力受付部221が受け付けた帳票画像データを帳票認識部270に渡しても良い。 The authentication processing unit 222 performs authentication based on the authentication information received by the input receiving unit 221 . Note that the authentication processing unit 222 may, for example, transmit the input authentication information to an authentication server provided outside the server device 200 and acquire the result of authentication by the authentication server. The authentication processing unit 222 may pass the form image data received by the input receiving unit 221 to the form recognition unit 270 when the user is authenticated.

本実施形態の帳票認識部270は、画像データ格納部271、ジョブリスト生成部272、画像データ取得部273、前処理部274、文字認識部275、定義特定部276、項目抽出部277、表示画面生成部278、出力部279を有する。 The form recognition unit 270 of this embodiment includes an image data storage unit 271, a job list generation unit 272, an image data acquisition unit 273, a preprocessing unit 274, a character recognition unit 275, a definition identification unit 276, an item extraction unit 277, and a display screen. It has a generation unit 278 and an output unit 279 .

画像データ格納部271は、入力受付部221が、画像形成装置300から通信部298を介して帳票画像データを受信すると、帳票画像データベース230に格納する。 When the input reception unit 221 receives form image data from the image forming apparatus 300 via the communication unit 298 , the image data storage unit 271 stores the data in the form image database 230 .

ジョブリスト生成部272は、入力受付部221が、通信部298を介して画像形成装置300から帳票画像データの入力を受け付けると、ジョブリストにジョブを登録し、ジョブリストを管理する。ジョブリストの詳細は後述する。 When input receiving portion 221 receives input of form image data from image forming apparatus 300 via communication portion 298, job list generating portion 272 registers a job in the job list and manages the job list. Details of the job list will be described later.

画像データ取得部273は、帳票画像データベース230に格納された帳票画像データを取得する。前処理部274は、画像データ取得部273が取得した帳票画像データに対して、帳票認識を行うための前処理を行う。 The image data acquisition unit 273 acquires form image data stored in the form image database 230 . The preprocessing unit 274 performs preprocessing for form recognition on the form image data acquired by the image data acquiring unit 273 .

文字認識部275は、帳票画像データから、文字列と、文字列が配置された位置を示す情報とを抽出し、読取結果データとして保持する。読取結果データの詳細は後述する。 The character recognition unit 275 extracts a character string and information indicating the position where the character string is arranged from the form image data, and holds it as reading result data. Details of the read result data will be described later.

定義特定部276は、読取結果データに含まれる文字列に基づき、帳票認識の際に参照する明細定義情報を特定し、特定した明細定義情報を明細定義データベース250から取得する取得部である。 The definition identification unit 276 is an acquisition unit that identifies the specification definition information to be referred to when recognizing the form based on the character string included in the read result data, and acquires the specified specification definition information from the specification definition database 250 .

項目抽出部277は、読取結果データに基づき、帳票画像データに含まれる項目と、項目値とを抽出して対応付けを行った認識結果データを生成し、認識結果データベース260へ格納する。 The item extraction unit 277 extracts the items included in the form image data and the item values based on the read result data, generates recognition result data in association with each other, and stores the recognition result data in the recognition result database 260 .

このとき、項目抽出部277は、定義特定部276により特定された明細定義情報を参照し、帳票の明細部に記載された明細項目名と、明細項目の項目値とを対応付けて抽出する。 At this time, the item extraction unit 277 refers to the specification definition information specified by the definition specification unit 276, and extracts the specification item names described in the specification part of the form in association with the item values of the specification items.

以下の説明では、帳票の明細部に記載された明細項目名と、明細項目の項目値とを対応付けた情報を明細情報と呼ぶ場合がある。本実施形態の明細情報は、認識結果データに含まれる情報であり、認識結果データの一部である。 In the following description, the information that associates the detail item name written in the detail part of the form with the item value of the detail item may be referred to as detail information. The detailed information of this embodiment is information included in the recognition result data, and is a part of the recognition result data.

また、本実施形態の認識結果データは、帳票に記載された帳票の発行元を示す情報(発行元情報)等を含む。つまり、認識結果データには、帳票に記載された全ての文字列が含まれてよい。 Further, the recognition result data of the present embodiment includes information (issuer information) indicating the issuer of the form described in the form. That is, the recognition result data may include all character strings written on the form.

表示画面生成部278は、認識結果データベース260に格納された認識結果データを用いて、認識結果確認画面を生成する。表示画面生成部278は、通信部298を介して、端末装置400に対する画面の表示を指示する。具体的には、表示画面生成部278は、個社明細定義情報を生成するための画面を端末装置400に表示させる。また、表示画面生成部278は、画面を表示させるためのXML形式のファイルを生成し、通信部298を介して端末装置400のWebブラウザ上に入力画面を表示させる。 The display screen generator 278 uses the recognition result data stored in the recognition result database 260 to generate a recognition result confirmation screen. The display screen generation unit 278 instructs the terminal device 400 to display a screen via the communication unit 298 . Specifically, the display screen generation unit 278 causes the terminal device 400 to display a screen for generating individual company specification definition information. The display screen generation unit 278 also generates an XML file for displaying the screen, and displays the input screen on the web browser of the terminal device 400 via the communication unit 298 .

なお、本実施形態では、表示画面生成部278は、個社明細定義情報251を生成するための画面を端末装置400に表示させるものとしたが、これに限定されない。表示画面生成部278が画面を表示させる装置は、サーバ装置200であっても良いし、端末装置400以外の装置あっても良く、表示機能を有する表示装置であれば良い。 In this embodiment, the display screen generation unit 278 causes the terminal device 400 to display a screen for generating the individual company specification definition information 251, but the present invention is not limited to this. A device on which the display screen generation unit 278 displays a screen may be the server device 200 or a device other than the terminal device 400, as long as it has a display function.

出力部279は、表示画面生成部278が生成した認識結果確認画面を、通信部298を介して出力する。言い換えれば、出力部279は、表示画面生成部278が生成した認識結果確認画面を、通信部298を介して端末装置400のWebブラウザ上で表示させる。 The output unit 279 outputs the recognition result confirmation screen generated by the display screen generation unit 278 via the communication unit 298 . In other words, the output unit 279 causes the recognition result confirmation screen generated by the display screen generation unit 278 to be displayed on the web browser of the terminal device 400 via the communication unit 298 .

本実施形態の定義登録部290は、操作内容取得部291、定義生成部293、定義更新部294を有する。 The definition registration unit 290 of this embodiment has an operation content acquisition unit 291 , a definition generation unit 293 and a definition update unit 294 .

操作内容取得部291は、通信部298を介して、端末装置400のWebブラウザ上に表示された画面に対して入力された操作を受け付ける。より具体的には、本実施形態では、通信部298が端末装置400から操作を示す情報を受信し、操作内容取得部291が、通信部298が受信した情報の入力を受け付ける。 The operation content acquisition unit 291 receives an operation input to the screen displayed on the web browser of the terminal device 400 via the communication unit 298 . More specifically, in this embodiment, the communication unit 298 receives information indicating an operation from the terminal device 400, and the operation content acquisition unit 291 receives input of information received by the communication unit 298. FIG.

定義生成部293は、入力画面に対して端末装置400から入力された情報に基づき、個社明細定義情報を生成して明細定義データベース250へ格納する。 The definition generation unit 293 generates individual company statement definition information based on the information input from the terminal device 400 to the input screen and stores it in the statement definition database 250 .

定義更新部294は、既に明細定義データベース250に登録された個社明細定義情報に対する修正を反映させて、個社明細定義情報を更新する。 The definition update unit 294 updates individual company specification definition information by reflecting corrections to the individual company specification definition information already registered in the specification definition database 250 .

本実施形態の通信部298は、例えば、ネットワークI/F209等によって実現される機能であり、サーバ装置200と外部装置との間でデータの送受信を行う。具体的には、例えば、通信部298は、表示画面生成部278に制御に応じて、端末装置400に対して、画面の表示を指示する通知を送信する。 The communication unit 298 of this embodiment is, for example, a function realized by the network I/F 209 or the like, and transmits and receives data between the server device 200 and an external device. Specifically, for example, the communication unit 298 transmits a notification for instructing display of a screen to the terminal device 400 according to the control of the display screen generation unit 278 .

<端末装置の機能>
次に、図10を参照して、本実施形態の端末装置400の機能について説明する。図10は、端末装置400の機能を説明する図である。
<Terminal device functions>
Next, with reference to FIG. 10, functions of the terminal device 400 of this embodiment will be described. FIG. 10 is a diagram explaining the functions of the terminal device 400. As shown in FIG.

後述する各部の機能は、端末装置400の有するCPU401が、EEPROM404やROM402等に格納されたプログラムを読み出して実行することで実現される。 The functions of each unit described later are realized by the CPU 401 of the terminal device 400 reading and executing programs stored in the EEPROM 404, the ROM 402, and the like.

本実施形態の端末装置400は、操作受付部431、表示制御部432、通信部433を有している。操作受付部431は、表示制御部432によって端末装置400のWebブラウザ上に表示された画面に対する入力を受け付ける。 The terminal device 400 of this embodiment has an operation reception unit 431 , a display control unit 432 and a communication unit 433 . The operation reception unit 431 receives an input to the screen displayed on the web browser of the terminal device 400 by the display control unit 432 .

表示制御部432は、端末装置400のディスプレイ418の表示を制御する。具体的には、表示制御部432は、サーバ装置200からの指示に応じた画面をディスプレイ418に表示させる。 The display control unit 432 controls display on the display 418 of the terminal device 400 . Specifically, display control unit 432 causes display 418 to display a screen corresponding to an instruction from server device 200 .

通信部433は、遠距離通信回路412、遠距離通信回路412のアンテナ412a等によって実現される機能であり、端末装置400と他の装置との間でデータの送受信を行う。 The communication unit 433 is a function realized by the long-distance communication circuit 412, the antenna 412a of the long-distance communication circuit 412, etc., and transmits and receives data between the terminal device 400 and another device.

<動作又は処理>
次に、図11A,図11Bを参照して、本実施形態の帳票認識システム100の動作について説明する。図11A、図11Bは、帳票認識システムの動作を説明するシーケンス図である。
<Operation or processing>
Next, the operation of the form recognition system 100 of this embodiment will be described with reference to FIGS. 11A and 11B. 11A and 11B are sequence diagrams illustrating the operation of the form recognition system.

帳票認識システム100において、画像形成装置300は、ユーザーから帳票認識を行うためのアプリケーションの起動要求を受け付けると(ステップS1101)、このアプリケーションを起動させる(ステップS1102)。 In the form recognition system 100, when the image forming apparatus 300 receives a request to start an application for performing form recognition from a user (step S1101), this application is started (step S1102).

続いて、画像形成装置300は、ユーザーから認証情報の入力を受け付けると(ステップS1103)、この認証情報をサーバ装置200へ送信し、認証要求を行う(ステップS1104)。 Subsequently, when the image forming apparatus 300 accepts input of authentication information from the user (step S1103), the image forming apparatus 300 transmits this authentication information to the server apparatus 200 and requests authentication (step S1104).

サーバ装置200の通信部298は認証要求を受信し、認証処理部222により認証を行い、その結果を画像形成装置300へ通知する(ステップS1105)。なお、ここでは、ユーザーの認証が成功した場合の動作を示している。 The communication unit 298 of the server apparatus 200 receives the authentication request, performs authentication by the authentication processing unit 222, and notifies the result to the image forming apparatus 300 (step S1105). Note that here, the operation when the user authentication is successful is shown.

続いて、画像形成装置300は、帳票のスキャン指示を受け付け(ステップS1106)、帳票のスキャンを行い、帳票画像データを取得する(ステップS1107)。続いて、画像形成装置300は、帳票画像データをサーバ装置200へ送信する(ステップS1108)。 Subsequently, the image forming apparatus 300 receives an instruction to scan a form (step S1106), scans the form, and acquires form image data (step S1107). Subsequently, the image forming apparatus 300 transmits the form image data to the server apparatus 200 (step S1108).

サーバ装置200の入力受付部221が通信部298を介して帳票画像データの入力を受け付けると、認証処理部222がこの帳票画像データを帳票認識部270へ渡す(ステップS1109)。なお、図11Aの例では、認証処理部222を介して帳票画像データが帳票認識部270へ渡されるものとしたが、これに限定されない。帳票画像データは、認証処理部222を介さずに帳票認識部270に渡されても良い。 When the input reception unit 221 of the server device 200 receives the input of the form image data via the communication unit 298, the authentication processing unit 222 passes the form image data to the form recognition unit 270 (step S1109). In the example of FIG. 11A, the form image data is passed to the form recognition section 270 via the authentication processing section 222, but the present invention is not limited to this. The form image data may be passed to the form recognition section 270 without going through the authentication processing section 222 .

サーバ装置200の帳票認識部270は、帳票画像データを受け取ると、ジョブリスト生成部272により、ジョブリストにジョブを登録する(ステップS1110)。続いて、帳票認識部270は、画像データ格納部271により、帳票画像データを帳票画像データベース230へ格納する(ステップS1111)。 When the form recognition unit 270 of the server device 200 receives the form image data, the job list generation unit 272 registers the job in the job list (step S1110). Subsequently, the form recognition unit 270 causes the image data storage unit 271 to store the form image data in the form image database 230 (step S1111).

続いて、帳票認識部270は、画像データ取得部273により、帳票画像データベース230から認識する対象となる帳票画像データを取得し(ステップS1112)、帳票画像を認識する処理を実行する(ステップS1113)。ステップS1113の処理の詳細は後述する。 Subsequently, the form recognition unit 270 acquires form image data to be recognized from the form image database 230 by the image data acquisition unit 273 (step S1112), and executes processing for recognizing the form image (step S1113). . Details of the processing in step S1113 will be described later.

続いて、帳票認識部270は、項目抽出部277が生成した認識結果データを認識結果データベース260に格納する(ステップS1114)。 Subsequently, the form recognition unit 270 stores the recognition result data generated by the item extraction unit 277 in the recognition result database 260 (step S1114).

帳票認識システム100において、端末装置400は、操作受付部431により、ユーザーからのブラウザの表示指示の入力を受け付けると(ステップS1115)、通信部433を介して、サーバ装置200に対して認識結果データを表示させるブラウザの表示要求を行う(ステップS1116)。 In the form recognition system 100, when the terminal device 400 receives an input of a browser display instruction from the user through the operation reception unit 431 (step S1115), the terminal device 400 transmits recognition result data to the server device 200 via the communication unit 433. is requested to display the browser (step S1116).

また、端末装置400は、操作受付部431により、ユーザーから認証情報の入力を受け付けて(ステップS1117)、通信部433により、この認証情報をサーバ装置200へ送信する(ステップS1118)。 Further, the terminal device 400 receives input of authentication information from the user through the operation reception unit 431 (step S1117), and transmits this authentication information to the server device 200 through the communication unit 433 (step S1118).

サーバ装置200の通信部298は認証要求を受信し、認証処理部222がユーザーの認証を行う(ステップS1119)。通信部298は認証結果とジョブリストの一覧を端末装置400に送信する(ステップS1120)。端末装置400の通信部433が認識結果とジョブリストを受信して、表示制御部432がブラウザ上に表示する。なお、ここでは、ユーザーの認証が成功した場合の処理を示す。 The communication unit 298 of the server device 200 receives the authentication request, and the authentication processing unit 222 authenticates the user (step S1119). The communication unit 298 transmits the authentication result and the job list to the terminal device 400 (step S1120). The communication unit 433 of the terminal device 400 receives the recognition result and the job list, and the display control unit 432 displays them on the browser. Here, processing when user authentication is successful is shown.

続いて、端末装置400は、操作受付部431により、ジョブリストの一覧からジョブの選択を受け付けると(ステップS1121)、この選択を、帳票画像の認識結果の閲覧指示として、通信部433により、サーバ装置200に対して閲覧要求を行う(ステップS1122)。 Subsequently, when the terminal device 400 accepts selection of a job from the list of job lists by the operation accepting unit 431 (step S1121), the communication unit 433 transmits the selection to the server as an instruction to view the recognition result of the form image. A browsing request is issued to the device 200 (step S1122).

サーバ装置200の通信部298は閲覧要求を受信し、表示画面生成部278が認識結果データベース260に格納されている認識結果データを取得し(ステップS1123)、認識結果確認画面を生成する。通信部298は認識結果確認画面の画面情報を端末装置400に送信する。端末装置400の通信部433が認識結果確認画面の画面情報を受信して、表示制御部432がブラウザ上に表示する(ステップS1124)。ユーザーは、表示された認識結果確認画面で認識結果を確認できる。 The communication unit 298 of the server device 200 receives the browsing request, the display screen generation unit 278 acquires recognition result data stored in the recognition result database 260 (step S1123), and generates a recognition result confirmation screen. The communication unit 298 transmits screen information of the recognition result confirmation screen to the terminal device 400 . The communication unit 433 of the terminal device 400 receives the screen information of the recognition result confirmation screen, and the display control unit 432 displays it on the browser (step S1124). The user can confirm the recognition result on the displayed recognition result confirmation screen.

続いて、図11Bを参照して説明する。一般に、業種明細定義情報252又は汎用明細定義情報253を使用した認識結果は、帳票における行や列の区切りを正しく反映していない。これは、個社明細定義情報251が使用された場合も同様で、帳票の記載内容(品名が長いなど)により、行の高さが変わり、認識結果が帳票における行の区切りを正しく反映していない場合が生じうる。このため、ユーザーは、端末装置400を操作して認識結果に対し行や列の位置を調整する(S1125)。端末装置400の操作受付部431はユーザー操作を受け付け、表示制御部432がユーザー操作に応じた行や列の調整結果を表示する(S1126)。行の調整時の画面については図19にて説明する。なお、調整結果とは本実施形態では、行の新しい区切りであるが、ユーザーは列の位置も同様に調整できる。したがって、調整結果には、帳票の行と列の位置情報が含まれる。 Next, description will be made with reference to FIG. 11B. In general, recognition results using the industry specification definition information 252 or the general specification definition information 253 do not correctly reflect the delimiters of rows and columns in a form. This is the same when the individual company detail definition information 251 is used, and the height of the line changes depending on the contents of the form (long product name, etc.), and the recognition result correctly reflects the line separation in the form. There may be cases where there is no For this reason, the user operates the terminal device 400 to adjust the positions of rows and columns with respect to the recognition result (S1125). The operation reception unit 431 of the terminal device 400 receives the user's operation, and the display control unit 432 displays the row and column adjustment results according to the user's operation (S1126). The screen for row adjustment will be described with reference to FIG. In this embodiment, the adjustment result is a new line break, but the user can similarly adjust the column position. Therefore, the adjustment result includes the row and column position information of the form.

本実施形態では、後述する行の連結処理により行が連結されるので、ユーザーは帳票画像データを等間隔の行に区切る程度の調整を行えばよい。また、帳票認識部270が帳票画像データを等間隔の行に区切っている場合、ユーザーの調整はなくてもよい。 In the present embodiment, lines are connected by a line connection process, which will be described later. Therefore, the user only has to make an adjustment to the extent that the form image data is divided into lines at equal intervals. Also, if the form recognition unit 270 divides the form image data into lines at equal intervals, the user's adjustment may not be necessary.

ユーザーは調整が終わると、行の連結を含む帳票認識を端末装置400に指示する(S1127)。すでに帳票認識はステップS1113で終了しているので、再度、帳票認識が行われる。操作受付部431が指示を受け付け、通信部433がユーザーによる調整結果(行と列の位置情報)を含む帳票認識要求をサーバ装置200に送信する(S1128)。 After finishing the adjustment, the user instructs the terminal device 400 to recognize the form including line connection (S1127). Since form recognition has already ended in step S1113, form recognition is performed again. The operation reception unit 431 receives the instruction, and the communication unit 433 transmits a form recognition request including the user's adjustment result (row and column position information) to the server apparatus 200 (S1128).

サーバ装置200の通信部298は帳票認識要求を受信し、帳票認識部270が行の連結を含む帳票認識を行う(S1129)。ステップS1129の処理の詳細を図21にて説明する。 The communication unit 298 of the server apparatus 200 receives the form recognition request, and the form recognition unit 270 performs form recognition including line concatenation (S1129). Details of the processing in step S1129 will be described with reference to FIG.

サーバ装置200の通信部298は行の連結結果を含む認識結果データを、帳票認識部が端末装置400に送信する(S1130)。 In the communication unit 298 of the server device 200, the form recognition unit transmits the recognition result data including the line connection result to the terminal device 400 (S1130).

端末装置400の通信部433が認識結果データを受信し、表示制御部432が行の連結結果を含む認識結果を表示する(S1131)。 The communication unit 433 of the terminal device 400 receives the recognition result data, and the display control unit 432 displays the recognition result including the line connection result (S1131).

これにより、行の高さによって異なる行として認識されていた行が、連結して認識された明細が表示される。 As a result, lines that have been recognized as different lines depending on the height of the line are displayed as recognized details that are connected.

ユーザーが端末装置400に個社明細定義情報の登録指示の入力を指示する。端末装置400は、操作受付部431により、個社明細定義情報の登録指示の入力を受け付けると(ステップS1132)、通信部433を介して、個社明細定義情報の登録要求をサーバ装置200へ送信する(ステップS1133)。 The user instructs the terminal device 400 to input an instruction to register individual company statement definition information. When the terminal device 400 receives the input of the registration instruction of the individual company specification definition information by the operation reception unit 431 (step S1132), the terminal device 400 transmits the registration request of the individual company specification definition information to the server device 200 via the communication unit 433. (step S1133).

サーバ装置200の通信部298がこの登録要求を受信すると、表示画面生成部278が個社明細定義情報の登録画面を生成する。通信部298は個社明細定義情報の登録画面の画面情報を端末装置400に送信する。端末装置400の通信部433が個社明細定義情報の登録画面の画面情報を受信して、表示制御部432がブラウザ上に表示する(ステップS1134)。 When the communication unit 298 of the server device 200 receives this registration request, the display screen generation unit 278 generates a registration screen for individual company specification definition information. The communication unit 298 transmits the screen information of the registration screen of the individual company specification definition information to the terminal device 400 . The communication unit 433 of the terminal device 400 receives the screen information of the individual company specification definition information registration screen, and the display control unit 432 displays it on the browser (step S1134).

続いて、端末装置400の操作受付部431が個社明細定義情報の入力を受け付けると(ステップS1135)、通信部433が入力された情報をサーバ装置200へ送信する(ステップS1136)。サーバ装置200の通信部298が入力された情報を受信し、定義生成部293が端末装置400から送信された情報に基づき、個社明細定義情報を生成し(ステップS1137)、明細定義データベース250に格納して(ステップS1138)、処理を終了する。 Subsequently, when the operation reception unit 431 of the terminal device 400 receives input of individual company specification definition information (step S1135), the communication unit 433 transmits the input information to the server device 200 (step S1136). The communication unit 298 of the server device 200 receives the input information, and the definition generation unit 293 generates individual company statement definition information based on the information transmitted from the terminal device 400 (step S1137). Store (step S1138) and terminate the process.

<ジョブリスト>
次に、図12を参照して、本実施形態のジョブリスト生成部272により生成されるジョブリストについて説明する。図12は、ジョブリストの一例を示す図である。
<Job List>
Next, a job list generated by the job list generation unit 272 of this embodiment will be described with reference to FIG. FIG. 12 is a diagram showing an example of a job list.

本実施形態のサーバ装置200は、画像形成装置300から帳票画像データが入力されると、ジョブリスト生成部272により、帳票画像データとジョブIDとを対応付けたジョブリストとして保持する。 When the form image data is input from the image forming apparatus 300, the server apparatus 200 of the present embodiment holds the form image data and the job ID as a job list in which the form image data and the job ID are associated with each other.

本実施形態のジョブリスト101は、情報の項目として、ジョブID、請求元、帳票画像ファイルパス、認識結果ファイルパス、ステータス、ユーザーIDを有する。 The job list 101 of this embodiment has, as information items, a job ID, an invoicing party, a form image file path, a recognition result file path, a status, and a user ID.

項目「ジョブID」の値は、ジョブを特定する識別情報である。言い換えれば、項目「ジョブID」の値は、画像形成装置300から受信した帳票画像データを特定するための識別情報である。 The value of the item "job ID" is identification information that identifies a job. In other words, the value of the item “job ID” is identification information for specifying form image data received from the image forming apparatus 300 .

項目「請求元」は、帳票の発行元の社名等である。ジョブ登録時には請求元は不明なので、帳票認識後に設定されてよい。 The item "claimer" is the company name of the issuer of the form. Since the invoicing party is unknown at the time of job registration, it may be set after form recognition.

項目「画像ファイルパス」の値は、帳票画像データが格納されている場所を示す情報である。項目「認識結果ファイルパス」の値は、帳票画像を認識した結果の認識結果データが格納されている場所を示す情報である。 The value of the item "image file path" is information indicating the location where the form image data is stored. The value of the item "recognition result file path" is information indicating the location where the recognition result data obtained by recognizing the form image is stored.

項目「ステータス」の値は、帳票画像の認識の進捗を示す。言い換えれば、項目「ステータス」の値は、ジョブの状態を示す。本実施形態では、項目「ステータス」の値として、未処理状態、下書き保存状態、確定済み状態、外部出力済み状態の4つを例示しているが、これに限定されるものではない。各状態は、以下の通りである。 The value of the item "status" indicates the progress of recognition of the form image. In other words, the value of the item "status" indicates the status of the job. In this embodiment, the four values of the item "status" are exemplified as the unprocessed state, the draft save state, the finalized state, and the externally output state, but the present invention is not limited to these. Each state is as follows.

・未処理状態(状態1)は、帳票認識によって認識結果データが取得された直後であり、認識結果の確認等が行われていない状態である。 The unprocessed state (state 1) is a state immediately after the recognition result data is acquired by form recognition, and confirmation of the recognition result is not performed.

・下書き保存状態(状態2)は、認識結果データの確認等の作業の途中等であり、認識結果データが確定される前の状態である。 The draft storage state (state 2) is a state in which work such as recognition result data confirmation is in progress, and the recognition result data is in a state before finalization.

・確定済み状態(状態3)は、認識結果データの確認等の作業が完了し、確定された情報として認識結果データベース260へ格納された状態である。 The finalized state (state 3) is a state in which work such as confirmation of recognition result data is completed and stored in the recognition result database 260 as finalized information.

・外部出力済み状態(状態4)は、帳票認識システム100と連携する会計システム等への認識結果データの出力が完了した状態。 The external output completed state (state 4) is a state in which output of recognition result data to an accounting system or the like that cooperates with the form recognition system 100 has been completed.

項目「ユーザーID」の値は、帳票認識システム100にログインしたユーザーを特定するための識別情報である。 The value of the item “user ID” is identification information for specifying a user who has logged in to the form recognition system 100 .

本実施形態のサーバ装置200は、画像形成装置300から帳票画像データを受信すると、ジョブリスト生成部272により、ジョブIDを付与し、認証情報として取得したユーザーIDを対応付けて、ジョブリスト101にレコードを追加する。そして、ジョブリスト生成部272は、帳票画像データが帳票画像データベース230に格納されると、この格納先を示す情報を項目「画像ファイルパス」の値として、追加する。 When the server apparatus 200 of the present embodiment receives the form image data from the image forming apparatus 300, the job list generation unit 272 assigns a job ID, associates the user ID obtained as the authentication information, and creates the job list 101. Add records. Then, when the form image data is stored in the form image database 230, the job list generation unit 272 adds information indicating the storage destination as the value of the item "image file path".

更に、ジョブリスト生成部272は、認識結果データが認識結果データベース260に格納されると、項目「請求元」に発行元を追加し、この格納先を示す情報を項目「認識結果ファイルパス」の値として追加し、項目「ステータス」の値を確定済み状態とする。 Further, when the recognition result data is stored in the recognition result database 260, the job list generation unit 272 adds the issuer to the item "billing party", and adds the information indicating the storage destination to the item "recognition result file path". Add it as a value and set the value of the item "Status" to the finalized state.

本実施形態では、端末装置400が、例えば、ジョブリスト生成部272によって生成されたジョブリストを表示しても良い。この場合、ユーザーは、ジョブリストに基づいて表示されたジョブリスト画面を介して、帳票画像の認識の進捗を確認することができる。 In this embodiment, the terminal device 400 may display the job list generated by the job list generation unit 272, for example. In this case, the user can check the progress of recognition of the form image through the job list screen displayed based on the job list.

<帳票の認識>
次に、図13を参照して、本実施形態の帳票認識部270の処理について説明する。図13は、帳票認識部270の処理を説明する第一のフローチャートである。図13は、図11AのステップS1113の処理の詳細を示している。また、図13は、複数の帳票画像データを画像形成装置300から受け取った場合の処理を示している。
<Recognition of forms>
Next, referring to FIG. 13, processing of the form recognition unit 270 of this embodiment will be described. FIG. 13 is a first flowchart for explaining the processing of the form recognition unit 270. As shown in FIG. FIG. 13 shows details of the processing in step S1113 of FIG. 11A. 13 shows processing when a plurality of form image data are received from the image forming apparatus 300. FIG.

画像データ取得部273は帳票の認識結果データが生成されていない帳票画像データを帳票画像データベース230から取得する(S1300)。 The image data acquiring unit 273 acquires the form image data for which the form recognition result data is not generated from the form image database 230 (S1300).

前処理部274は、画像データ取得部273が取得した帳票画像データに対して、行と列を認識する処理を行う(S1301)。ここでの認識は、横線と縦線、色の違う領域等に基づくラフなものでよい。 The preprocessing unit 274 performs processing for recognizing rows and columns for the form image data acquired by the image data acquiring unit 273 (S1301). Recognition here may be rough based on horizontal and vertical lines, regions with different colors, and the like.

前処理部274は、画像データ取得部273が取得した帳票画像データに対して、帳票認識を行うための前処理を行う(ステップS1302)。前処理とは、具体的には、例えば、二値化、ノイズ除去、帳票画像の向きの天地合わせ、等の補正処理である。 The preprocessing unit 274 performs preprocessing for form recognition on the form image data acquired by the image data acquiring unit 273 (step S1302). Specifically, the pre-processing is, for example, correction processing such as binarization, noise removal, and top-bottom alignment of the form image.

続いて、帳票認識部270は、文字認識部275により、帳票画像から、文字が形成されている領域(以下、文字フィールド)の中の文字を切り取り、文字認識する(ステップS1303)。このとき、文字認識部275は、切り出した文字の位置を示す座標も取得する。 Subsequently, the form recognition unit 270 uses the character recognition unit 275 to cut out characters in an area in which characters are formed (hereinafter referred to as a character field) from the form image and recognize the characters (step S1303). At this time, the character recognition unit 275 also acquires coordinates indicating the position of the extracted character.

続いて、帳票認識部270は、文字認識部275により認識された各文字列の位置関係に基づいて読取結果データを生成して、保持する(ステップS1304)。具体的に、帳票認識部270は、認識された各文字の座標に基づいて、互いの距離が予め設定された閾値以内の文字を1つの文字列として認識し、文字列と、文字列が形成された領域の位置を示す座標などの情報とを対応付けて読取結果データを生成する。 Subsequently, the form recognition unit 270 generates and stores reading result data based on the positional relationship of each character string recognized by the character recognition unit 275 (step S1304). Specifically, based on the coordinates of each recognized character, the form recognition unit 270 recognizes characters whose distance from each other is within a preset threshold value as one character string, and forms character strings. The reading result data is generated in association with information such as coordinates indicating the position of the marked area.

続いて、帳票認識部270は、定義特定部276により、読取結果データに含まれる請求元を特定する情報(以下、請求元情報)と、業種判定データベース240とを参照し、請求元の業種を特定する(ステップS1305)。 Subsequently, the form recognition unit 270 causes the definition identification unit 276 to refer to the information for identifying the billing party (hereinafter referred to as billing party information) included in the read result data and the industry determination database 240, and identify the business type of the billing party. Identify (step S1305).

続いて、帳票認識部270は、定義特定部276により、明細定義データベース250に、請求元情報と対応する個社明細定義情報251が存在するか否かを判定する(ステップS1306)。 Subsequently, the form recognition unit 270 determines whether or not individual company statement definition information 251 corresponding to the claimant information exists in the statement definition database 250 by means of the definition identification unit 276 (step S1306).

ステップS1306において、個社明細定義情報251が存在する場合、帳票認識部270は、項目抽出部277により、個社明細定義情報251に基づき明細情報を抽出し(ステップS1307)、後述するステップS1311へ進む。ステップS1307の処理の詳細は後述する。 In step S1306, if the individual company specification definition information 251 exists, the form recognition unit 270 causes the item extraction unit 277 to extract the specification information based on the individual company specification definition information 251 (step S1307). move on. Details of the processing in step S1307 will be described later.

ステップS1306において、個社明細定義情報251が存在しない場合、定義特定部276は、明細定義データベース250に、ステップS1305で特定された業種と対応する業種明細定義情報252が存在するか否かを判定する(ステップS1308)。 In step S1306, if the individual company specification definition information 251 does not exist, the definition identification unit 276 determines whether or not the specification definition database 250 contains the industry specification definition information 252 corresponding to the industry identified in step S1305. (step S1308).

ステップS1307において、業種明細定義情報252が存在する場合、帳票認識部270は、項目抽出部277により、業種明細定義情報252に基づき明細情報を抽出し(ステップS1309)、後述するステップS1311へ進む。ステップS1309の処理の詳細は後述する。 In step S1307, if the industry specification definition information 252 exists, the form recognition unit 270 causes the item extraction unit 277 to extract the specification information based on the industry specification definition information 252 (step S1309), and proceeds to step S1311, which will be described later. Details of the processing in step S1309 will be described later.

ステップS1308において、業種明細定義情報252が存在しない場合、帳票認識部270は、項目抽出部277により、汎用明細定義情報253に基づき明細情報を抽出し(ステップS1310)、後述するステップS1311へ進む。ステップS1310の処理の詳細は後述する。 In step S1308, if the industry specification definition information 252 does not exist, the form recognition unit 270 causes the item extraction unit 277 to extract the specification information based on the general-purpose specification definition information 253 (step S1310), and proceeds to step S1311 to be described later. Details of the processing in step S1310 will be described later.

帳票認識部270は、明細情報の抽出に成功したか否かを判定する(ステップS1311)。具体的には、帳票認識部270は、ステップS1307、ステップS1309、ステップS1310のいずれかの処理で抽出された明細情報が存在するか否かを判定している。 The form recognition unit 270 determines whether or not the detailed information has been successfully extracted (step S1311). Specifically, the form recognition unit 270 determines whether or not there is detailed information extracted in any one of steps S1307, S1309, and S1310.

ステップS1311において、明細情報の抽出に失敗した場合、帳票認識部270は、端末装置400又は画像形成装置300に対してエラーを通知し(ステップS1312)、処理を終了する。 In step S1311, if the extraction of the detailed information fails, the form recognition unit 270 notifies the terminal device 400 or the image forming apparatus 300 of an error (step S1312), and terminates the process.

ステップS1311において、明細情報の抽出に成功した場合、帳票認識部270は、項目抽出部277により、抽出された明細情報をマージした認識結果データを生成し、認識結果データベース260に格納する(ステップS1313)。 In step S1311, if the detailed information is successfully extracted, the form recognition unit 270 causes the item extraction unit 277 to generate recognition result data by merging the extracted detailed information, and stores the data in the recognition result database 260 (step S1313). ).

続いて、帳票認識部270は、ジョブリスト生成部272により、認識結果データの格納先をジョブリスト101に登録する(ステップS1314)。 Subsequently, the form recognition unit 270 registers the storage destination of the recognition result data in the job list 101 by the job list generation unit 272 (step S1314).

続いて、帳票認識部270は、表示画面生成部278により、認識結果データを用いて生成された認識結果確認画面を作成する。端末装置400の通信部433が認識結果確認画面の画面情報を受信し、表示制御部432が認識結果確認画面を表示し(ステップS1315)、処理を終了する。 Subsequently, the form recognition unit 270 causes the display screen generation unit 278 to generate a recognition result confirmation screen generated using the recognition result data. The communication unit 433 of the terminal device 400 receives the screen information of the recognition result confirmation screen, the display control unit 432 displays the recognition result confirmation screen (step S1315), and the process ends.

なお、図13の例では、認識結果データを表示させる処理までを一連の動作として説明したが、これに限定されない。帳票認識部270は、端末装置400から、認識結果データの閲覧要求を受け付けてから、認識結果データを表示させても良い。 In addition, in the example of FIG. 13, the process up to the process of displaying the recognition result data has been described as a series of operations, but the present invention is not limited to this. The form recognition unit 270 may display the recognition result data after accepting a request for viewing the recognition result data from the terminal device 400 .

<明細情報の抽出>
次に、図14と図15を参照して、本実施形態の項目抽出部277による明細情報の抽出について説明する。図14は、帳票認識部270の処理を説明する第二のフローチャートである。図15は、図13のステップS1307の処理の詳細を示している。
<Extracting detail information>
Next, extraction of detailed information by the item extraction unit 277 of the present embodiment will be described with reference to FIGS. 14 and 15. FIG. FIG. 14 is a second flowchart for explaining the processing of the form recognition unit 270. As shown in FIG. FIG. 15 shows details of the processing in step S1307 of FIG.

本実施形態の帳票認識部270において、項目抽出部277は、読取結果データが保持されると、各文字の座標値を取得する(ステップS1401)。続いて、項目抽出部277は抽出した文字列(ステップS1304で抽出した)とその座標値を取得する(ステップS1402)。 In the form recognition unit 270 of this embodiment, the item extraction unit 277 acquires the coordinate values of each character when the reading result data is held (step S1401). Subsequently, the item extraction unit 277 acquires the extracted character string (extracted in step S1304) and its coordinate values (step S1402).

続いて、項目抽出部277は、取得した各文字列で、個社明細定義情報251に含まれる明細項目名を検索し(ステップS1403)、検索結果が存在するか否かを判定する(ステップS1404)。具体的には、項目抽出部277は、個社明細定義情報251に、文字列と一致する明細項目名又はキーワードが存在するか否かを判定している。 Next, the item extracting unit 277 searches for the item names included in the individual company item definition information 251 using the acquired character strings (step S1403), and determines whether or not there is a search result (step S1404). ). Specifically, the item extraction unit 277 determines whether or not the individual company specification definition information 251 has a specification item name or keyword that matches the character string.

ステップS1404において、該当する明細項目名又はキーワードが存在しない場合、帳票認識部270は、処理を終了する。また、ステップS1404において、該当する明細項目名又はキーワードが存在する場合、検索に適合した明細項目名又はキーワードの下に、縦方向に並ぶ列から項目値を抽出し(ステップS1405)、処理を終了する。 In step S1404, if the corresponding item name or keyword does not exist, the form recognition unit 270 terminates the process. Also, in step S1404, if there is a corresponding detail item name or keyword, the item value is extracted from the column aligned vertically under the detail item name or keyword matching the search (step S1405), and the process ends. do.

なお、図13のステップS1309の処理は、図14のステップS1403において、参照する明細定義情報が業種明細定義情報252である点以外は、図14の処理と同様であるから、説明を省略する。 Note that the processing in step S1309 in FIG. 13 is the same as the processing in FIG. 14 except that the detailed definition information to be referred to in step S1403 in FIG.

図15は、帳票認識部270の処理を説明する第三のフローチャートである。図15は、図13のステップS1310の処理の詳細を示している。言い換えれば、図15は、請求元と対応する個社明細定義情報251も業種明細定義情報252も存在しない場合に、汎用明細定義情報253を参照して明細情報を抽出する処理を示している。 FIG. 15 is a third flowchart for explaining the processing of the form recognition unit 270. As shown in FIG. FIG. 15 shows details of the processing in step S1310 of FIG. In other words, FIG. 15 shows the process of referring to the general-purpose specification definition information 253 and extracting the specification information when neither the individual company specification definition information 251 nor the industry specification definition information 252 corresponding to the invoicing party exists.

図15のステップS1501とステップS1502の処理は、図14のステップS1401とステップS1402の処理と同様であるから、説明を省略する。 The processing in steps S1501 and S1502 in FIG. 15 is the same as the processing in steps S1401 and S1402 in FIG. 14, so description thereof will be omitted.

項目抽出部277は、文字列と座標値を取得すると、帳票画像データに縦罫(縦線)が存在するか否かを判定する(ステップS1503)。ステップS1503において、縦罫が存在しない場合、項目抽出部277は、後述するステップS1510へ進む。なお、直線(縦罫)の検出方法にはハフ変換等の周知の方法がある。 After obtaining the character string and the coordinate values, the item extraction unit 277 determines whether or not there is a vertical ruled line (vertical line) in the form image data (step S1503). In step S1503, if there is no vertical ruled line, item extraction unit 277 proceeds to step S1510, which will be described later. A well-known method such as Hough transform is available as a method for detecting straight lines (vertical ruled lines).

ステップS1503において、縦罫が存在する場合、項目抽出部277は、縦罫の各セルの座標値を抽出する(ステップS1504)。なお、このとき、項目抽出部277は、各セルに、各セルを識別する識別情報(ID)を付与しても良い。また、当該識別情報は、例えば、表の列を特定する列ID及び表の行を特定する行IDとして付与されても良い。このように、列IDと行IDとを付与すれば、列IDと行IDとの組み合わせにより、セルが特定される。 In step S1503, if there is a vertical ruled line, the item extraction unit 277 extracts the coordinate values of each cell of the vertical ruled line (step S1504). At this time, the item extraction unit 277 may assign identification information (ID) for identifying each cell to each cell. Also, the identification information may be given as, for example, a column ID that identifies the columns of the table and a row ID that identifies the rows of the table. By assigning a column ID and a row ID in this way, a cell is specified by a combination of the column ID and the row ID.

続いて、項目抽出部277は、表の各セルに含まれる文字列を特定し、セルの座標値と対応付けて保持する(ステップS1505)。 Subsequently, the item extraction unit 277 identifies the character string included in each cell of the table, and stores it in association with the coordinate value of the cell (step S1505).

続いて、項目抽出部277は、表の先頭行の各セルに含まれる文字列(列見出し)を特定する(ステップS1506)。 Subsequently, the item extraction unit 277 identifies the character strings (column headings) included in each cell of the top row of the table (step S1506).

続いて、項目抽出部277は、先頭行の各セルに含まれる文字列(列見出し)で、汎用明細定義情報253を検索する(ステップS1507)。 Subsequently, the item extraction unit 277 searches the general-purpose specification definition information 253 with the character strings (column headings) included in each cell of the first row (step S1507).

続いて、項目抽出部277は、汎用明細定義情報253に、先頭行の各セルに含まれる文字列(列見出し)と一致する明細項目名又はキーワードが存在するか否かを判定する(ステップS1508)。 Subsequently, the item extracting unit 277 determines whether or not the general-purpose specification definition information 253 includes a specification item name or keyword that matches the character string (column heading) contained in each cell of the first row (step S1508). ).

ステップS1508の判断がNoの場合、項目抽出部277は、処理を終了する。 If the determination in step S1508 is No, the item extractor 277 terminates the process.

ステップS1508の判断がYesの場合、項目抽出部277は、先頭行の各セルに含まれる文字列を含む列から明細項目の項目値を抽出し(ステップS1509)、処理を終了する。 If the determination in step S1508 is Yes, the item extraction unit 277 extracts the item value of the detail item from the column containing the character string contained in each cell of the top row (step S1509), and ends the process.

ステップS1503において、縦罫が存在しない場合、帳票認識部270は帳票画像における明細部の領域を特定する(ステップS1510)。具体的には、帳票認識部270は、例えば、文字列が縦方向に並んでいる領域を、明細部の領域と特定して良い。 In step S1503, if there is no vertical ruled line, the form recognition unit 270 identifies the detail area of the form image (step S1510). Specifically, the form recognition unit 270 may, for example, identify an area in which character strings are arranged in the vertical direction as the detail area.

続いて、帳票認識部270は、項目抽出部277により、明細部に特定された領域における一行目の文字列を特定し、特定した文字列の座標値と対応付けて保持する(ステップS1511)。特定された領域における一行目の文字列とは、特定された領域において、一番上に位置する文字列である。 Subsequently, the form recognition unit 270 uses the item extraction unit 277 to identify the character string in the first line in the area identified as the detail part, and stores it in association with the coordinate values of the identified character string (step S1511). The character string on the first line in the specified area is the character string positioned at the top of the specified area.

続いて、項目抽出部277は、ステップS1511で特定した文字列で、汎用明細定義情報253を検索する(ステップS1512)。続いて、項目抽出部277は、汎用明細定義情報253に、特定した文字列と一致する明細項目名又はキーワードが存在するか否かを判定する(ステップS1513)。 Subsequently, the item extraction unit 277 searches the general-purpose specification definition information 253 with the character string specified in step S1511 (step S1512). Subsequently, the item extraction unit 277 determines whether or not the general-purpose specification definition information 253 has a specification item name or keyword that matches the specified character string (step S1513).

ステップS1513の判断がNoの場合、帳票認識部270は、処理を終了する。 If the determination in step S1513 is No, the form recognition unit 270 terminates the process.

ステップS1513の判断がYesの場合、項目抽出部277は、ステップS1511で特定した文字列の座標値から、文字列が外接する領域の幅を取得し、この幅において縦方向に並んでいる文字列を明細項目の項目値として抽出し(ステップS1514)、処理を終了する。 If the determination in step S1513 is YES, the item extraction unit 277 obtains the width of the region where the character string circumscribes from the coordinate values of the character string identified in step S1511, and extracts the character strings arranged vertically within this width. is extracted as the item value of the detail item (step S1514), and the process ends.

なお、図15の例では、帳票画像に縦罫が存在する場合には、セルの座標値を抽出するものとしたが、縦罫の代わりに罫線(横線)を用いても良い。その場合、帳票認識部270は、帳票画像に横線が存在するか否かを判定し、横線が存在する場合には、横線と横線の間に位置する文字列と、文字列の座標を特定すれば良い。 In the example of FIG. 15, when the form image has vertical lines, the coordinate values of the cells are extracted, but horizontal lines may be used instead of the vertical lines. In this case, the form recognition unit 270 determines whether or not a horizontal line exists in the form image. Good luck.

そして、帳票認識部270は、横線と横線の間の文字列のうち、一番左の文字列と一致する明細項目名又はキーワードが汎用明細定義情報253に存在する場合には、この横線と横線の間にある2番目以降の文字列を明細項目の項目値とすれば良い。 If the general-purpose specification definition information 253 contains a description item name or keyword that matches the leftmost character string among the character strings between the horizontal lines, the form recognition unit 270 recognizes the horizontal line and the horizontal line. The second and subsequent character strings between are set as the item value of the detail item.

<帳票を用いた明細情報の抽出>
次に、図16~図18を参照して、帳票認識部270の処理について更に説明する。図16は、明細情報の抽出を説明する第一の図である。
<Extracting detailed information using a form>
Next, the processing of the form recognition unit 270 will be further described with reference to FIGS. 16 to 18. FIG. FIG. 16 is a first diagram for explaining extraction of detailed information.

図16は、帳票画像データを説明する第一の図である。図16に示す請求書161には、請求元を特定する請求元情報161aと、明細項目毎に同じ形式のデータが縦方向に繰り返し印刷された明細部161bとが含まれる。図16に示す請求書161は、請求元情報161aは、請求元の名称であり、明細部161bは、表形式で記載されている。 FIG. 16 is a first diagram for explaining form image data. A bill 161 shown in FIG. 16 includes billing party information 161a that identifies the billing party, and a detailed portion 161b in which data of the same format is repeatedly printed in the vertical direction for each detailed item. In the invoice 161 shown in FIG. 16, the billing party information 161a is the name of the billing party, and the detail part 161b is described in a tabular form.

本実施形態では、請求書161を画像形成装置300で読み取って帳票画像データとし、帳票画像データに対して帳票認識部270の処理を実行することで、認識結果データが生成される。 In the present embodiment, the image forming apparatus 300 reads the invoice 161 to generate form image data, and the form recognition unit 270 processes the form image data to generate recognition result data.

図17は、明細情報の抽出を説明する第二の図である。図17に示す情報171は、請求書161を示す帳票画像データに対し、文字認識部275による文字認識を行った結果である。 FIG. 17 is a second diagram for explaining extraction of detailed information. Information 171 shown in FIG. 17 is the result of character recognition performed by the character recognition unit 275 on the form image data representing the invoice 161 .

情報171は、請求書161のうち、明細部161bから文字フィールドを切り取り、文字フィールドの中の文字を認識した結果と、文字の位置を示す座標とから抽出した例を示す。 Information 171 shows an example of extracting a character field from the specification part 161b of the invoice 161, recognizing the character in the character field, and extracting the coordinates indicating the position of the character.

本実施形態の文字認識部275は、この情報171から、隣り合う位置にある文字同士をつなげて文字列(文字列)を認識する。具体的には、文字認識部275は、文字と文字との間の距離が、所定ピクセル以内である文字の組み合わせを、1つ単語として認識しても良い。 From this information 171, the character recognition unit 275 of this embodiment recognizes a character string (character string) by connecting characters at adjacent positions. Specifically, the character recognition section 275 may recognize a combination of characters whose distance between characters is within a predetermined number of pixels as one word.

図17に示す情報172は、文字認識部275により認識された文字列と、文字列の領域とを示す情報であり、文字認識部275による帳票画像の読取結果データである。 Information 172 shown in FIG. 17 is information indicating character strings recognized by the character recognition unit 275 and areas of the character strings, and is read result data of the form image by the character recognition unit 275 .

また、文字認識部275は、帳票画像データから、縦線と横線で区切られた領域を1つのセルとして認識し、セル毎にセルを識別する識別情報(セルID)を付与する。 Further, the character recognition unit 275 recognizes a region delimited by vertical lines and horizontal lines from the form image data as one cell, and assigns identification information (cell ID) for each cell to identify the cell.

図17に示す情報173は、明細部161bから認識されたセル毎の領域とセルIDとの対応付けを示す情報である。 The information 173 shown in FIG. 17 is information indicating the correspondence between the area for each cell recognized by the specification section 161b and the cell ID.

図17では、例えば、列見出し「品名」が認識された領域は、情報172において、X座標とY座標によって示される位置を基準として、高さと幅とから特定される。 In FIG. 17, for example, the region in which the column heading “product name” is recognized is specified in the information 172 from the height and width based on the position indicated by the X and Y coordinates.

また、情報173において、列見出し「品名」が認識された領域は、セルID「2」に含まれることがわかる。したがって、列見出し「品名」は、明細部161bに含まれる列見出しとして、セルID「2」と対応付けられる。 Also, in the information 173, it can be seen that the area where the column heading "product name" is recognized is included in the cell ID "2". Therefore, the column heading "product name" is associated with the cell ID "2" as a column heading included in the detail portion 161b.

なお、情報173では、列見出し「品名」が認識された領域に対してセルIDを対応付けるものとしたが、これに限定されない。セルIDは、行見出しが縦方向に並ぶ列を特定する行IDと、列見出しが横方向に並ぶ列IDとによって特定されても良い。 In the information 173, the cell ID is associated with the region in which the column heading "product name" is recognized, but the present invention is not limited to this. A cell ID may be identified by a row ID identifying a column in which row headings are arranged vertically and a column ID in which column headings are arranged horizontally.

本実施形態の帳票認識部270は、このようにして、帳票画像データから、文字列とセルとを対応付ける。 The form recognition unit 270 of the present embodiment thus associates the character strings with the cells from the form image data.

図18に示す明細情報174は、請求書161と対応する読取結果データに基づき生成された、明細部161bの明細情報を示す第三の図である。したがって、図18に示す明細情報174は、帳票画像データ全体の認識結果データの一部である。 The detailed information 174 shown in FIG. 18 is a third diagram showing the detailed information of the detailed part 161b generated based on the reading result data corresponding to the invoice 161. FIG. Therefore, the detailed information 174 shown in FIG. 18 is part of the recognition result data of the entire form image data.

図18に示す明細情報174は、項目抽出部277によって生成されるものであり、情報の項目として、列ID、列見出し、列の座標、行ID、項目値、明細項目名とを有する。 The detail information 174 shown in FIG. 18 is generated by the item extraction unit 277, and has column IDs, column headings, column coordinates, row IDs, item values, and detail item names as information items.

項目「列ID」の値は、明細部161b(表)に含まれる列を特定する識別情報であり、項目「列見出し」の値は、表の一番上の行の各セル内の列見出しである。項目「列の座標」の値は、列の座標を示す。なお、本実施形態では、列の座標を、帳票画像における明細の列の左上の点の座標値と右下の点の座標値とする。 The value of the item "column ID" is identification information for specifying the columns included in the detail portion 161b (table), and the value of the item "column heading" is the column heading in each cell of the top row of the table. is. The value of the item "column coordinates" indicates column coordinates. In this embodiment, the column coordinates are the coordinate values of the upper left point and the lower right point of the detail column in the form image.

項目「行ID」の値は、行を特定する識別情報であり、項目「項目値」の値は、明細項目と対応する項目値を示す。 The value of the item "line ID" is identification information that identifies the line, and the value of the item "item value" indicates the item value corresponding to the detail item.

項目「明細項目名」の値は、対応する明細項目名と、項目名の位置を示す座標とが、個社明細定義情報251においてどの項目に対応付けられるかを示す。項目名の位置を示す座標とは、例えば、列の座標と行IDとの組み合わせ等によって示される。 The value of the item “description item name” indicates which item in the individual company description definition information 251 is associated with the corresponding description item name and the coordinates indicating the position of the item name. The coordinates indicating the position of the item name are indicated, for example, by a combination of column coordinates and row IDs.

明細情報174では、列見出しである「伝票日付」に項目「明細項目名」の値である「日付」が対応付けられている。また、列見出しである「伝票日付」に列の座標と行IDとが対応付けられている。 In the detail information 174, the column header "slip date" is associated with the value "date" of the item "description item name". In addition, column coordinates and row IDs are associated with the column header "slip date".

ユーザーが個社明細定義情報251を更新すると判断しその操作を行うと、「伝票日付」の列の座標、行IDに基づいて、個社明細定義情報251の「日付」に、キーワード:「伝票日付」、キーワード座標(情報172の列見出しが品名の1レコード分)、セル座標(情報173の品名に対するセルの1レコード分)、列座標(セル座標×行数分の座標)が登録される。 When the user decides to update the individual company statement definition information 251 and performs this operation, based on the column coordinates and row ID of the "document date", the keyword: date", keyword coordinates (one record of the product name in the column header of the information 172), cell coordinates (one record of the cell corresponding to the product name in the information 173), and column coordinates (cell coordinates x coordinates for the number of rows) are registered. .

なお、図18の明細情報174の例では、情報の項目として、列の座標、列ID、行IDを含むものとしたが、これに限定されない。明細情報154は、情報の項目として、明細項目名と、項目値とが含まれていれば良く、それ以外の項目は、明細情報174に含まれなくても良い。 In the example of the detailed information 174 in FIG. 18, the information items include column coordinates, column IDs, and row IDs, but the information items are not limited to these. The detailed information 154 may contain detailed item names and item values as information items, and other items may not be included in the detailed information 174 .

また、本実施形態では、認識結果確認画面に明細情報174を表示させる場合には、表示画面生成部278が明細項目名と項目値のみを表示させれば良い。 Further, in the present embodiment, when displaying the detailed information 174 on the recognition result confirmation screen, the display screen generation unit 278 may display only the detailed item names and item values.

<認識結果の表示例>
次に、図19を参照して、帳票画像データの認識結果の表示例について説明する。図19は、認識結果確認画面501を示す図である。認識結果確認画面501は、例えば、図11BのステップS1125で端末装置400に表示される。
<Display example of recognition result>
Next, a display example of recognition results of form image data will be described with reference to FIG. FIG. 19 is a diagram showing a recognition result confirmation screen 501. As shown in FIG. The recognition result confirmation screen 501 is displayed on the terminal device 400 in step S1125 of FIG. 11B, for example.

認識結果確認画面501は、表示欄502、表示欄503と、表示部品508、509とを含む。表示欄502には、帳票画像データに基づく帳票画像が表示される。図19の例では、帳票が請求書であり、帳票画像における明細部を示す領域504が含まれる。 The recognition result confirmation screen 501 includes a display column 502 , a display column 503 , and display components 508 and 509 . A display field 502 displays a form image based on the form image data. In the example of FIG. 19, the form is a bill, and the form image includes an area 504 indicating the details part.

表示欄503は、表示欄502に表示された帳票画像を示す帳票画像データに対して帳票認識部270による帳票認識を行った結果の認識結果データが表示される。 A display field 503 displays recognition result data obtained as a result of the form recognition performed by the form recognition unit 270 on the form image data representing the form image displayed in the display field 502 .

表示欄503は、表示欄505、506、507を含む。表示欄505には、ジョブリスト101の項目「ステータス」の値が表示される。表示欄506には、請求元情報が表示される。請求元情報は、認識結果データの一部である。 Display field 503 includes display fields 505 , 506 , and 507 . A display column 505 displays the value of the item “status” of the job list 101 . In a display column 506, billing party information is displayed. The billing party information is part of the recognition result data.

表示欄507は、明細情報が表示される。具体的には、表示欄507には、明細情報に含まれる明細項目の値の一覧が表示される。表示欄507は抽出された各行の明細項目を繰り返し表示する。図19では2行分が表示されているが、スクロール等で他の行の明細項目を表示できる。表示欄507は、表示欄511、513、514、515、516を含む。 A display column 507 displays detailed information. Specifically, the display column 507 displays a list of the values of the detail items included in the detail information. A display column 507 repeatedly displays the extracted detail items of each line. Although two lines are displayed in FIG. 19, detailed items of other lines can be displayed by scrolling or the like. Display column 507 includes display columns 511 , 513 , 514 , 515 , and 516 .

表示欄511は、帳票画像における明細部を示す領域504に表示された、明細項目名「品名」の明細項目の値が表示される。表示欄513は、領域504に表示された、明細項目名「金額」の明細項目の値が表示される。 A display column 511 displays the value of the detail item with the detail item name “product name” displayed in the area 504 indicating the detail part in the form image. A display column 513 displays the value of the detail item with the detail item name “amount” displayed in the area 504 .

表示欄514は、領域504に表示された、明細項目名「単価」の明細項目の値が表示される。表示欄515は、領域504に表示された、明細項目名「数量」の明細項目の値が表示される。表示欄516は、領域504に表示された、明細項目名「伝票No」の明細項目の値が表示される。 A display column 514 displays the value of the detail item with the detail item name “unit price” displayed in the area 504 . A display column 515 displays the value of the detail item with the detail item name “quantity” displayed in the area 504 . A display column 516 displays the value of the detail item with the detail item name “slip No.” displayed in the area 504 .

本実施形態では、このように、端末装置400が、帳票画像の明細部における明細項目名のそれぞれに対応する項目から項目値を抽出して、表示欄511、513、514、515、516に表示する。すなわち、これらの明細項目名に対応する項目は、抽出の対象となる項目(抽出対象項目)である。また、抽出対象項目は、固定に決められた項目であってもよいし、ユーザーにより変更できるようにしてもよい。 In this embodiment, as described above, the terminal device 400 extracts the item values from the items corresponding to the item names in the item description portion of the form image, and displays them in the display columns 511, 513, 514, 515, and 516. do. In other words, items corresponding to these detailed item names are items to be extracted (extraction target items). Also, the items to be extracted may be fixed items, or may be changed by the user.

明細抽出ボタン510は、図11BのステップS1127で、高さが異なる行を含む帳票の行区切りを正しく認識するために、ユーザーが帳票認識の要求を行うためのボタンである。 The detail extraction button 510 is a button for the user to request form recognition in order to correctly recognize line breaks in a form including lines with different heights in step S1127 of FIG. 11B.

表示部品508は、ジョブリスト101のステータスの値を、未処理状態から下書き保存状態とするための表示部品である。表示部品508が操作されると、表示欄505は、「未処理」から「下書き保存」に変化する。 A display component 508 is a display component for changing the status value of the job list 101 from an unprocessed state to a draft save state. When the display component 508 is operated, the display field 505 changes from "unprocessed" to "save draft".

表示部品509は、ジョブリスト101のステータスの値を、確定済み状態とするための表示部品である。図19の例では、帳票画像データからの認識結果データの抽出が成功したため、認識結果データの修正は行われていない。したがって、図19の例では、表示部品509が操作されると、ジョブリスト101のステータスの値が、確定済み状態とされ、個社明細定義情報251の生成は行われない。 A display component 509 is a display component for setting the status value of the job list 101 to a confirmed state. In the example of FIG. 19, the extraction of the recognition result data from the form image data is successful, so the recognition result data is not corrected. Therefore, in the example of FIG. 19, when the display component 509 is operated, the status value of the job list 101 is changed to the finalized state, and the individual company specification definition information 251 is not generated.

<認識結果の調整>
上記のように、個社明細定義情報251を使用した帳票の認識でも、行区切りを正しく認識できない場合がある。このような場合、ユーザーは行を調整して(ユーザーによる調整は必須でない)、帳票認識の指示を行う。
<Adjustment of recognition result>
As described above, even when recognizing a form using the individual company detail definition information 251, line breaks may not be recognized correctly. In such a case, the user adjusts the line (adjustment by the user is not required) to indicate form recognition.

図20は、行の誤認識が生じた認識結果の一例である。なお、説明の便宜上、図20では領域504に表示された帳票画像データのみを示す。また説明のため、右橋に行番号を示した。図20(a)では、一例として、2行ごとに行が認識されている。認識結果は、行と列の区切りが分かるように行と列の違いを色等で区別する半透明部品540が帳票画像データに重ねて提示される。図20では行と列の区切りを点線が示している。ユーザーは半透明部品540をマウス等でドラッグすることで、各行を同じ高さに揃えたり、行を追加したり、削除したりすることができる。 FIG. 20 is an example of a recognition result in which erroneous recognition of a line has occurred. For convenience of explanation, only the form image data displayed in the area 504 is shown in FIG. Also, for explanation, the line numbers are shown on the right bridge. In FIG. 20(a), as an example, every two lines are recognized. As for the recognition result, a translucent part 540 that distinguishes between rows and columns by color or the like is superimposed on the form image data so that the separation between rows and columns can be recognized. In FIG. 20, a dotted line indicates a delimiter between rows and columns. By dragging the translucent component 540 with a mouse or the like, the user can align each row at the same height, add rows, or delete rows.

ここで、ユーザーは1行目と4~8行目を1行ごとに区切りたいと考えており、2,3行目を連結したいと考えている。そこで、ユーザーは半透明部品540を操作して、図20(b)に示すように、帳票画像データを等間隔に8行に区切った。この状態であれば、サーバ装置200が2,3行目を連結できる。この処理は、図11BのステップS1129の処理に相当する。 Here, the user wants to separate the 1st line and the 4th to 8th lines, and wants to connect the 2nd and 3rd lines. Therefore, the user operated the translucent component 540 to divide the form image data into eight lines at regular intervals, as shown in FIG. 20(b). In this state, the server device 200 can connect the second and third rows. This process corresponds to the process of step S1129 in FIG. 11B.

なお、本実施形態では、列の区切りの調整について特に説明しないが、ユーザーは列についても調整できる。半透明部品540は、個社明細定義情報251、業種明細定義情報252、汎用明細定義情報253に登録されているキーワード521~526を、帳票画像データの各列に対応付けて表示する。図20(a)では、列見出しの更に上方にキーワード521~526が表示されている。表示位置は一例に過ぎない。ユーザーはキーワード521~526と列の対応が間違っている場合、半透明部品540を列ごとに移動でき、列見出しとキーワード521~526の対応を調整できる。例えば、数量というキーワード524に対し、帳票画像データの「数量」「単位」が対応しているが、「単位」を除外することができる。 In this embodiment, the adjustment of column delimiters is not particularly described, but the user can also adjust the columns. The translucent component 540 displays the keywords 521 to 526 registered in the individual company specification definition information 251, industry specification definition information 252, and general specification definition information 253 in association with each column of the form image data. In FIG. 20(a), keywords 521 to 526 are displayed above the column headings. The display position is only an example. If the correspondence between the keywords 521-526 and the columns is incorrect, the user can move the translucent part 540 for each column and adjust the correspondence between the column headings and the keywords 521-526. For example, the keyword 524 "quantity" corresponds to "quantity" and "unit" of the form image data, but "unit" can be excluded.

図21は、帳票認識部270が複数の行を連結する手順を説明するフローチャート図の一例である。 FIG. 21 is an example of a flowchart for explaining the procedure for the form recognition unit 270 to concatenate a plurality of lines.

まず、帳票認識部270は、金額の項目、又は、数量と単価の項目に項目値が入っている行を抽出してラベルAを設定する(S1129-1)。ラベルは後の処理で行を区別する必要があるために便宜上、設定される行の種類情報である。なお、ラベルAが設定された行は、第一の行の一例である。 First, the form recognition unit 270 extracts rows in which item values are entered in the item of amount or the item of quantity and unit price, and sets label A (S1129-1). The label is line type information that is set for convenience because it is necessary to distinguish lines in subsequent processing. Note that the row with label A is an example of the first row.

また、金額の項目が着目されるのは、帳票では金額が処理の対象となるためである。また、数量と単価が着目されるのは、帳票に金額が記載されていなくても、数量と単価が記載されている場合があるためである。 The reason why attention is paid to the amount item is that the amount is the object of processing in the form. The reason why the quantity and unit price are noted is that there are cases where the quantity and unit price are written on the form even if the amount is not written.

なお、金額などの項目が指定されていない場合は金額の項目に着目しない。また、金額はユーザーが設定した項目であるが、ユーザーが別の項目を設定した場合は、帳票認識部270は該項目に着目する。また、金額、数量又は単価のいずれも設定されていない場合、全ての行にラベルAを設定する。 Note that if items such as the amount are not specified, the item of the amount is not focused. The amount is an item set by the user, but if the user sets another item, the form recognition unit 270 focuses on that item. Also, if neither amount, quantity nor unit price is set, label A is set for all rows.

帳票認識部270は、ラベルAが設定された行に後述するラベルDの行を連結する。このため、帳票認識部270は、以下のように各行にラベルを設定する。
・ラベルBは、「消費税」or「小計」or「合計」or「伝票計」の文字(除外用語に対応)がいずれかの項目に入っている行である。「消費税」、「小計」、「合計」、又は「伝票計」は、品名として使用されない用語である。なお、ラベルBが設定された行は、第三の行の一例である。また、除外用語はユーザーが適宜設定でき、本実施例の除外用語は一例に過ぎない。
・ラベルCは、どの項目にも値が存在しない行である。なお、ラベルCが設定された行は、第四の行の一例である。
・ラベルDは、その他の行である。なお、ラベルDが設定された行は、第二の行の一例である。
The form recognition unit 270 connects a line labeled D to a line labeled A, which will be described later. Therefore, the form recognition unit 270 sets a label for each line as follows.
・Label B is a row in which one of the items contains the words "consumption tax" or "subtotal" or "total" or "slip total" (corresponding to exclusion terms). "Consumption tax", "subtotal", "total", or "slip total" are terms that are not used as item names. Note that the row with label B is an example of the third row. In addition, the user can appropriately set exclusion terms, and the exclusion terms in this embodiment are merely examples.
• Label C is a row in which no item has a value. Note that the row with label C is an example of a fourth row.
• Label D is the other row. Note that the row with label D is an example of the second row.

このため、帳票認識部270は、「消費税」「小計」「合計」「伝票計」のいずれかの文字が入っている行のラベルをA→Bとする(S1129-2)。 Therefore, the form recognition unit 270 changes the label of the line containing any of the characters "consumption tax", "subtotal", "total", and "slip total" from A to B (S1129-2).

帳票認識部270は、どの項目にも値が存在しない行にラベルCを設定する(S1129-3)。 The form recognition unit 270 sets a label C to a row in which no item has a value (S1129-3).

帳票認識部270は、その他の行にラベルDを設定する(S1129-4)。なお、以下の処理については、図22にて補足して説明するので参照されたい。 The form recognition unit 270 sets the label D to other rows (S1129-4). Note that the following processing will be supplemented with reference to FIG. 22, so please refer to it.

次に、帳票認識部270は、ラベルDの行の上下(双方)の行に、ラベルAが設定されているか否かを判定する(S1129-5)。ラベルDの行の上下の行に更にラベルDの行がある場合は、最も端のラベルDの行について判定する。 Next, the form recognition unit 270 determines whether or not the label A is set in the rows above and below (both of) the row with the label D (S1129-5). If there are further rows with label D above and below the row with label D, the row with label D at the farthest end is determined.

ステップS1129-5の判定がNoの場合、帳票認識部270は、ラベルDの行の上下片方の行にラベルAが設定されているか否かを判定する(S1129-6)。 If the determination in step S1129-5 is No, the form recognition unit 270 determines whether or not the label A is set in one of the rows above and below the row labeled D (S1129-6).

ステップS1129-6の判定がYesの場合、帳票認識部270は、ラベルAの行にラベルDの行を連結する(S1129-7)。ステップS1129-6の判定がNoの場合、帳票認識部270は、ラベルDをどの行にも連結しない。 If the determination in step S1129-6 is Yes, the form recognition unit 270 connects the row labeled D to the row labeled A (S1129-7). If the determination in step S1129-6 is No, the form recognition unit 270 does not connect label D to any line.

ステップS1129-5の判定がYesの場合、帳票認識部270は、帳票(明細)の中で最初に登場するラベルAの行の上の行がなし(行そのものが存在しない。帳票画像データの範囲外。)、ラベルB、又はラベルCであるか否かを判定する(S1129-8)。 If the determination in step S1129-5 is YES, the form recognition unit 270 determines that there is no line above the line of label A that appears first in the form (details) (the line itself does not exist. The range of form image data outside.), label B, or label C (S1129-8).

ステップS1129-8の判定がYesの場合、帳票認識部270は、ラベルDの行の上にあるラベルAの行を連結する(S1129-9)。 If the determination in step S1129-8 is Yes, the form recognition unit 270 connects the row labeled A above the row labeled D (S1129-9).

ステップS1129-8の判定がNoの場合、ラベルAの行の上の行がラベルDであるが、帳票認識部270は、ラベルDの行の下にあるラベルAの行にラベルDの行を連結する(S1129-10)。 If the determination in step S1129-8 is No, the line above the line with label A is labeled D, but the form recognition unit 270 recognizes the line with label D in the line with label A below the line with label D. Connect (S1129-10).

帳票認識部270は、ラベルDにラベルAを連結した結果、「数量」「単価」を複数行にあるか否かを判定する(S1129-11)。 The form recognition unit 270 determines whether or not "quantity" and "unit price" are present in multiple lines as a result of linking label A to label D (S1129-11).

帳票認識部270は、ラベルAの行に近い方の「数量」「単価」を採用する(S1129-12)。 The form recognition unit 270 adopts the "quantity" and "unit price" closer to the row of label A (S1129-12).

図22は、ラベルAとラベルDの行の連結を模式的に説明する図である。まず、図22(a)は、ラベルDの行の上下(双方)の行にラベルAの行が存在する場合を示す。この場合、図21のフローチャート図で説明したように、ラベルDの上側に隣接した行のラベルAの行の上の行が、なし、ラベルB、又はラベルCであるか否か判定される(S1129-8)。 FIG. 22 is a diagram schematically illustrating the connection of rows labeled A and D. As shown in FIG. First, FIG. 22(a) shows a case where a label A row exists in the rows above and below (both of) the label D row. In this case, as described in the flowchart of FIG. 21, it is determined whether the row above the row labeled A in the row adjacent to the upper side of label D is none, labeled B, or labeled C ( S1129-8).

図22(b)は、なしの場合を示す。この場合、帳票認識部270は、ラベルDの上側に隣接した行のラベルAとラベルDの行を連結する。 FIG. 22(b) shows the case of none. In this case, the form recognition unit 270 connects the lines of the labels A and D in the line adjacent to the upper side of the label D. FIG.

図22(c)は、ラベルDの行の上にある行がラベルDの場合を示す。この場合、帳票認識部270は、上下にラベルAがあるラベルD、ラベルDの下側に隣接した行のラベルAの行を連結する。ラベルBの行がラベルAの下にある場合、ラベルBも連結する。 FIG. 22(c) shows the case where the row above the row of label D is label D. FIG. In this case, the form recognition unit 270 connects the row of the label D, which has the label A above and below, and the row of the label A of the row adjacent to the lower side of the label D. If a row with label B is below label A, then label B is also concatenated.

なお、図23のように、ラベルDの上側にラベルDが隣接して、上下にラベルAの行が存在する場合がある。ラベルDの行の数は2つとは限らない。この場合もラベルDの行の上下(双方)の行にラベルAが設定されていると判定される。この場合、最も外側のラベルAの上側の行が、なし、ラベルB、又はラベルCであるか判定される(S1129-8)。 Note that, as shown in FIG. 23, label D may be adjacent to the upper side of label D, and label A lines may exist above and below it. The number of rows labeled D is not limited to two. In this case as well, it is determined that the label A is set in the rows above and below (both of) the row with the label D. FIG. In this case, it is determined whether the line above the outermost label A is none, label B, or label C (S1129-8).

図24は、図21の連結処理により帳票画像データの各行に設定されたラベルA~Dを示す。図24に示すように、3行目にラベルDが設定されている。ラベルDが設定された行の上の行だけラベルがAなので、帳票認識部270は、2行目と3行目を連結する。したがって、帳票認識部270は、2行に渡っている「xyzデータ移行料」と「[貴社注文No.123456789]」を1行の品名として抽出できる。 FIG. 24 shows labels A to D set for each line of the form image data by the linking process of FIG. As shown in FIG. 24, label D is set in the third row. Since only the row above the row to which label D is set has label A, the form recognition unit 270 connects the second and third rows. Therefore, the form recognition unit 270 can extract "xyz data migration fee" and "[your company's order No. 123456789]" in two lines as the product name in one line.

なお、このようなラベルAの行にラベルDの行を連結するという連結結果を、サーバ装置200は保存しない。すなわち、サーバ装置200は、個社明細定義情報251にラベルAの行とラベルDを連結した状態でセルや列の座標を保存しない。これは、ラベルDの行がどこに存在するかは帳票で決まるというよりも記載内容で決まるため、保存するメリットが少ないためである。したがって、図11BのステップS1138で登録される個社明細定義情報251は、S1126で行と列が調整された状態のものである。 Note that the server device 200 does not store the result of linking the row labeled D with the row labeled A as described above. That is, the server device 200 does not store the coordinates of the cells and columns in the individual company specification definition information 251 in a state where the row of the label A and the label D are linked. This is because the location of the row labeled D is determined not by the form but by the content of the description, so there is little merit in saving it. Therefore, the individual company specification definition information 251 registered in step S1138 of FIG. 11B is in a state in which rows and columns have been adjusted in step S1126.

図25は、図21の連結処理により連結された品名を説明する図である。なお、図25は、認識結果確認画面501のうち表示欄507を示す。図25(a)は連結処理の前の表示欄507を示し、図25(b)は連結処理の後の表示欄507を示す。連結処理の前は、表示欄511の品名が「xyzデータ移行料」と「[貴社注文No.:123456789]」に分かれているが、連結処理により、品名が「xyzデータ移行料[貴社注文No.:123456789]」に連結された。 FIG. 25 is a diagram for explaining product names linked by the linking process of FIG. 21 . 25 shows the display column 507 of the recognition result confirmation screen 501. As shown in FIG. FIG. 25(a) shows the display field 507 before the connection process, and FIG. 25(b) shows the display field 507 after the connection process. Before the consolidation process, the product name in the display field 511 is divided into "xyz data transfer fee" and "[your company's order number: 123456789]". .:123456789]”.

<主な効果>
以上説明したように、本実施形態のサーバ装置200は、高さが異なる行が存在したり、複数の行に記載されたりした項目値を連結して抽出できる。
<Main effects>
As described above, the server device 200 of the present embodiment can connect and extract item values that include rows with different heights or that are described in a plurality of rows.

本実施例では、仮想罫線と論理罫線を使用して、高さが異なる行が存在したり、複数の行に渡って項目値が記載されたりしても、帳票における行の区切りを正しく反映して行を抽出するサーバ装置200について説明する。本実施例では、帳票における行の区切りを正しく認識するので、実施例1で連結した場合と同様の結果が得られる。 In this example, virtual ruled lines and logical ruled lines are used to correctly reflect the line breaks in the form even if there are rows with different heights or item values are written across multiple lines. The server device 200 that extracts rows will be described. In this embodiment, since the line breaks in the form are correctly recognized, the same result as in the case of concatenation in the first embodiment can be obtained.

また、本実施例の行の区切りの認識処理は、実施例1とは全く独立に実施されてもよいし、実施例1の連結処理の前、又は、後に実施されてもよい。 Further, the line break recognition processing of the present embodiment may be performed completely independently of the first embodiment, or may be performed before or after the connection processing of the first embodiment.

本実施例においては、上記の実施例にて説明した図2、図3のハードウェア構成図、及び、図9,図10に示した機能ブロック図を援用できるものとして説明する。 In this embodiment, it is assumed that the hardware configuration diagrams of FIGS. 2 and 3 and the functional block diagrams of FIGS. 9 and 10 described in the above embodiment can be used.

<仮想罫線と論理罫線を使用した行の区切りの認識>
まず、図26,図27を参照して、本実施例における行の区切りの認識方法の概略を説明する。図26は、比較される行の区切りの認識方法を示し、図27は、本実施例における行の区切りの認識方法の概略を示す。
<Recognition of line breaks using virtual ruled lines and logical ruled lines>
First, with reference to FIGS. 26 and 27, the outline of the method for recognizing line breaks in this embodiment will be described. FIG. 26 shows a method for recognizing line breaks to be compared, and FIG. 27 shows an outline of a line break recognition method in this embodiment.

図26(a)の帳票Aに対する行と列の配置(ユーザーの調整があってもなくてもよい)に基づいてサーバ装置200が個社明細定義情報251を保存したとする。サーバ装置200が図26(b)の帳票Bから行を抽出すると、1つ目の商品名が「○○○△△△」、2つ目の商品名が「XXX」となってしまい、帳票における正しい行の区切りとは異なる行が抽出されてしまう。 Assume that the server device 200 saves the individual company specification definition information 251 based on the arrangement of rows and columns (with or without user adjustment) for the form A in FIG. 26(a). When the server device 200 extracts lines from the form B in FIG. A line that is different from the correct line delimiter in is extracted.

そこで、図27に示すように、サーバ装置200は、仮想罫線と論理罫線を用いて、帳票における正しい行の区切りで行を抽出する。なお、図27の帳票画像データは、認識結果確認画面501に表示されている。 Therefore, as shown in FIG. 27, the server apparatus 200 uses virtual ruled lines and logical ruled lines to extract lines at correct line breaks in the form. Note that the form image data in FIG. 27 is displayed on the recognition result confirmation screen 501 .

まず、図27(a)の帳票Aに示すように、ユーザーがどの列を行の区切りとして利用するのかを指定する。ユーザーは、例えば、マウスで列見出しの幅をドラッグする。これにより、矢印530が描画され、ユーザーが指定した列が明らかになる。ここでは行の区切りとして「金額」の列が選択されたものとする。サーバ装置200は、金額の列において、項目値の上端を行の上端として抽出する。 First, as shown in form A in FIG. 27(a), the user designates which column to use as a row separator. The user, for example, drags the width of the column headings with the mouse. This renders an arrow 530 revealing the column specified by the user. Here, it is assumed that the "money amount" column has been selected as a row delimiter. The server device 200 extracts the upper end of the item value as the upper end of the row in the money column.

図27(b)の帳票Bがスキャンされた場合も、サーバ装置200は、「金額」の列が選択されたという情報を利用して、金額の列において、項目値の上端を行の上端として抽出する。こうすることで、商品名が1行でも複数行でも行の区切りを正しく判定できる。このように抽出された罫線を「論理罫線531」という。 When the form B in FIG. 27(b) is also scanned, the server device 200 uses the information that the "amount" column has been selected to set the upper end of the item value to the upper end of the row in the "amount" column. Extract. By doing so, it is possible to correctly determine the line break whether the product name has one line or multiple lines. The ruled lines extracted in this manner are referred to as "logical ruled lines 531".

しかしながら、図27(a)、図27(b)の方法だけで行の区切りを判定すると以下のような帳票で不都合がある。 However, if line delimiters are determined only by the method of FIGS. 27A and 27B, there is a problem with the following forms.

図27(c)の帳票Cでは、1つめの金額の「1000」に対応する商品名が「△△△」のみとなってしまい、「○○○」が商品名に含まれなくなってしまう。 In the form C of FIG. 27(c), the product name corresponding to the first amount "1000" is only "△△△", and "○○○" is not included in the product name.

そこで、図27(d)に示すように、ユーザーが明細領域内を等間隔に区切った「仮想罫線532」を指定する。ユーザーが指定しなくても行が等間隔に認識される場合もある。図27(d)では、仮想罫線532が3本表示されているが、上から2本目と3本目の仮想罫線532に論理罫線531が重なっている。サーバ装置200は、論理罫線531と仮想罫線532が重なっている場合に該罫線が正しい行区切りと判定する。 Therefore, as shown in FIG. 27(d), the user designates "virtual ruled lines 532" that divide the detail area at equal intervals. Evenly spaced lines may be recognized without user specification. In FIG. 27D, three imaginary ruled lines 532 are displayed, and the logical ruled lines 531 overlap the second and third imaginary ruled lines 532 from the top. When the logical ruled line 531 and the virtual ruled line 532 overlap, the server apparatus 200 determines that the ruled line is a correct line break.

このように、本実施形態の行の認識方法では、ユーザーがどの列を行の区切りとして利用するのかという情報と、論理罫線531(第二の罫線の一例)と、仮想罫線532(第一の罫線の一例)とにより、帳票における行の区切りを正しく反映して行を抽出できる。 As described above, in the row recognition method of this embodiment, information indicating which column the user uses as a row delimiter, the logical ruled line 531 (an example of the second ruled line), and the virtual ruled line 532 (the first An example of a ruled line), it is possible to extract lines by correctly reflecting the line breaks in the form.

<帳票認識システムの動作又は処理>
続いて、図28を参照して、帳票認識システム100の動作又は処理について説明する。図28の処理は、図11BのステップS1125~S1131に代えて、又は、S1131に続いて実行される。
<Operation or processing of form recognition system>
Next, the operation or processing of the form recognition system 100 will be described with reference to FIG. The process of FIG. 28 is executed instead of steps S1125 to S1131 of FIG. 11B or after S1131.

図28は、帳票認識システムの動作を説明するシーケンス図である。 FIG. 28 is a sequence diagram for explaining the operation of the form recognition system.

ユーザーは端末装置400に表示された認識結果確認画面501が有する領域504において、半透明部品540を移動、変形等して、明細領域を指定する(S2101)。ユーザーは帳票画像データの全体を過不足なくカバーするように半透明部品540を帳票画像データに重ねる。操作受付部431が操作を受け付ける。 The user moves or transforms the translucent part 540 in the area 504 of the recognition result confirmation screen 501 displayed on the terminal device 400 to specify the detail area (S2101). The user overlays the translucent component 540 on the form image data so as to cover the entire form image data just enough. An operation accepting unit 431 accepts an operation.

次に、ユーザーは帳票画像を何行で区切るかを指定する(S2102)。ユーザーが単に数値を入力する。この行数は、空白行を含む行数でよい。操作受付部431が操作を受け付ける。あるいは、ユーザーが行数を指定しなくてもよい。図13のステップS1301で行と列が認識されているので、帳票認識部270は、これを利用して仮想罫線532を描画できる。 Next, the user designates by how many lines the form image is to be separated (S2102). User simply enters a number. This number of lines can be the number of lines including blank lines. An operation accepting unit 431 accepts an operation. Alternatively, the user does not have to specify the number of rows. Since the rows and columns have been recognized in step S1301 of FIG. 13, the form recognition unit 270 can draw virtual ruled lines 532 using them.

次に、端末装置400の通信部433が、行数を指定して仮想罫線532の表示要求をサーバ装置200に送信する(S2103)。仮想罫線532は、端末装置400が行数で帳票画像の高さを割って等間隔に表示してもよい。 Next, the communication unit 433 of the terminal device 400 specifies the number of lines and transmits a request to display the virtual ruled lines 532 to the server device 200 (S2103). The virtual ruled lines 532 may be displayed at regular intervals by the terminal device 400 dividing the height of the form image by the number of lines.

サーバ装置200の通信部298は仮想罫線532の表示要求を受信し、帳票認識部270が仮想罫線532を描画する(S2104)。描画とは帳票画像データにおける仮想罫線532の位置を決定することである。帳票認識部270は、帳票画像データの高さを行数で割って、等間隔な仮想罫線532を描画する。ユーザーが行数を指定しない場合、帳票認識部270は、図13のステップS1301で認識された行のうち最も高さが低い行の高さで、等間隔な仮想罫線532を描画する。 The communication unit 298 of the server device 200 receives the request to display the virtual ruled line 532, and the form recognition unit 270 draws the virtual ruled line 532 (S2104). Drawing is to determine the position of the virtual ruled line 532 in the form image data. The form recognition unit 270 divides the height of the form image data by the number of lines to draw virtual ruled lines 532 at regular intervals. If the user does not specify the number of lines, the form recognition unit 270 draws equally spaced imaginary ruled lines 532 with the height of the lowest line among the lines recognized in step S1301 of FIG.

サーバ装置200の298は、仮想罫線532の位置情報を端末装置400に送信する(S2105)。端末装置400の通信部433は仮想罫線532の位置情報を受信し、表示制御部432が領域504の帳票画像データに重ねて仮想罫線532を表示する(S2106)。ユーザーは、仮想罫線532に誤りがあれば適宜修正する。 298 of the server device 200 transmits the position information of the virtual ruled line 532 to the terminal device 400 (S2105). The communication unit 433 of the terminal device 400 receives the position information of the virtual ruled line 532, and the display control unit 432 displays the virtual ruled line 532 superimposed on the form image data of the area 504 (S2106). If there is an error in the virtual ruled line 532, the user corrects it as appropriate.

次に、ユーザーは、行区切りに使用する列をマウスなどで指定する(S2107)。例えば、行区切りに使用する列は金額の列である。金額で行の品名等が区切られる場合が多いためである。操作受付部431が操作を受け付ける。なお、列見出しの幅がドラッグされたことで、列ID、列名、又は、列の座標の少なくともいずれかが特定される。 Next, the user designates a column to be used as a line break with a mouse or the like (S2107). For example, the column used to separate rows is the amount column. This is because, in many cases, product names, etc. in rows are separated by amounts. An operation accepting unit 431 accepts an operation. Note that at least one of the column ID, column name, and column coordinates is specified by dragging the width of the column header.

端末装置400の通信部433が、列ID、列名、又は、列の座標などを指定して論理罫線531の表示要求をサーバ装置200に送信する(S2108)。 The communication unit 433 of the terminal device 400 specifies the column ID, column name, or column coordinates, and transmits a display request for the logical ruled line 531 to the server device 200 (S2108).

サーバ装置200の通信部298は論理罫線531の表示要求を受信し、帳票認識部270が論理罫線531を描画する(S2109)。すなわち、帳票認識部270は、指定された列にある項目値の上端に論理罫線531を描画する。 The communication unit 298 of the server apparatus 200 receives the display request for the logical ruled lines 531, and the form recognition unit 270 draws the logical ruled lines 531 (S2109). That is, the form recognition unit 270 draws the logical ruled line 531 at the upper end of the item value in the designated column.

サーバ装置200の298は、論理罫線531の位置情報を端末装置400に送信する(S2110)。端末装置400の通信部433は論理罫線531の位置情報を受信し、表示制御部432が領域504の帳票画像データに重ねて表示する(S2111)。表示制御部432は、仮想罫線532と論理罫線531の色を変えて表示するため、ユーザーは論理罫線531と仮想罫線532を区別できる。ユーザーは、論理罫線531に誤りがあれば適宜修正する。 298 of the server device 200 transmits the position information of the logical ruled line 531 to the terminal device 400 (S2110). The communication unit 433 of the terminal device 400 receives the position information of the logical ruled line 531, and the display control unit 432 superimposes it on the form image data of the area 504 and displays it (S2111). Since the display control unit 432 displays the virtual ruled lines 532 and the logical ruled lines 531 in different colors, the user can distinguish between the logical ruled lines 531 and the virtual ruled lines 532 . If there is an error in the logical ruled line 531, the user corrects it as appropriate.

次に、ユーザーは、仮想罫線532と論理罫線531に基づく帳票の認識(項目値の抽出)を端末装置400に指示する(S2112)。なお、ユーザーは、どの項目の項目値を連結するかを指示してよい。ユーザーが指示しない場合、品名が連結される。ユーザーが明細抽出ボタン510を押下する。操作受付部431が操作を受け付ける。 Next, the user instructs the terminal device 400 to recognize the form (extract the item values) based on the virtual ruled lines 532 and the logical ruled lines 531 (S2112). Note that the user may indicate which item values are to be concatenated. Unless otherwise instructed by the user, product names are concatenated. The user presses the detail extraction button 510 . An operation accepting unit 431 accepts an operation.

端末装置400の通信部433が、指定された項目、仮想罫線532、論理罫線531を指定して項目値の抽出要求をサーバ装置200に送信する(S2113)。 The communication unit 433 of the terminal device 400 specifies the specified item, the virtual ruled line 532, and the logical ruled line 531, and transmits an item value extraction request to the server device 200 (S2113).

サーバ装置200の通信部298は項目値の抽出要求を受信し、帳票認識部270が仮想罫線532と論理罫線531が重なった行区切りと行区切りの間の文字列を項目値と判定する(S2114)。 The communication unit 298 of the server apparatus 200 receives the item value extraction request, and the form recognition unit 270 determines the character string between the line breaks where the virtual ruled line 532 and the logical ruled line 531 overlap as the item value (S2114). ).

サーバ装置200の通信部298は、項目と項目値を対応付けた認識結果を端末装置400に送信する(S2115)。端末装置400の通信部433は認識結果を受信し、表示制御部432が表示欄507の明細情報に表示する(S2116)。 The communication unit 298 of the server device 200 transmits the recognition result in which the item and the item value are associated to the terminal device 400 (S2115). The communication unit 433 of the terminal device 400 receives the recognition result, and the display control unit 432 displays it in the detailed information in the display column 507 (S2116).

図29は、図28の連結処理により連結された品名を説明する図である。なお、図29では、主に図25との相違を説明する。認識結果確認画面501のうち表示欄507を示す。図29(a)は論理罫線531のみにより判断された行区切りによる表示欄507を示し、図29(b)は論理罫線531と仮想罫線532により判断された行区切りによる表示欄507を示す。論理罫線531のみでは、表示欄511の品名が「○○○」と「△△△」に分かれているが、論理罫線531と仮想罫線532により、品名が「○○○△△△」に連結された。 FIG. 29 is a diagram for explaining product names linked by the linking process of FIG. Note that FIG. 29 mainly describes differences from FIG. 25 . A display column 507 of the recognition result confirmation screen 501 is shown. FIG. 29(a) shows a display column 507 by line breaks determined only by logical ruled lines 531, and FIG. 29(b) shows a display column 507 by line breaks determined by logical ruled lines 531 and virtual ruled lines 532. With only the logical ruled line 531, the product name in the display field 511 is divided into "○○○" and "△△△", but the product name is connected to "○○○△△△" by the logical ruled line 531 and the virtual ruled line 532. was done.

このように、例えば、1行の金額に対し、品名が2行以上に渡っていても、2行以上の品名の列の文字列が連結されて、認識結果確認画面501の表示欄511(品名が表示される)に表示される。 In this way, for example, even if the product name is spread over two or more lines for one line of money, the character strings of the two or more product name columns are concatenated to form the display column 511 (product name) of the recognition result confirmation screen 501 is displayed).

<指定された項目である「金額」の列に別の文字列もある段組み帳票>
図30を参照して、指定された項目である「金額」の列に別の文字列もある段組み帳票について説明する。図30は、金額の列に消費税も表示される帳票の一部である。図30の帳票のように、「金額」の列に他の情報(例えば消費税)も記載されているような段組み帳票の場合、「金額」の列にある文字の上端で論理罫線531が描画されると、金額と消費税の行が別の行として抽出される。
<Multi-column form with another character string in the specified item "Amount"column>
With reference to FIG. 30, a multi-column form in which there is another character string in the specified item "amount" column will be described. FIG. 30 shows part of a form in which consumption tax is also displayed in the amount column. As in the form in FIG. 30, in the case of a multi-column form in which other information (for example, consumption tax) is also written in the "amount" column, the logical ruled line 531 is drawn at the upper end of the characters in the "amount" column. When rendered, the amount and tax lines are extracted as separate lines.

そこで、段組み帳票に関しては、ユーザーが行区切りに使用する列をマウスなどで指定する際、論理罫線531の描画を何行飛ばしにするか(スキップ数ごとに)を設定する。例えば、上記の列を指定する矢印530をユーザーがマウスで右クリックすると、何行飛ばしにするかを設定するダイアログが表示される。図30の例では、1行飛ばしでよいので、ユーザーが1行を入力する。 Therefore, for multi-column forms, the number of lines to be skipped in drawing the logical ruled lines 531 is set (for each skip number) when the user designates the columns used for line breaks with a mouse or the like. For example, when the user right-clicks with the mouse on the arrow 530 specifying the above columns, a dialog for setting how many lines to skip is displayed. In the example of FIG. 30, the user inputs one line because one line may be skipped.

図31は、ユーザーが論理罫線531の行の区切りを「金額」の列、1行飛ばしを指定した場合の段組み帳票の論理罫線531の描画例を示す。図31では、金額(及び消費税)と、品名とが正しく対応付けて抽出される。 FIG. 31 shows a rendering example of the logical ruled lines 531 of a multi-column form when the user designates the column of "amount" and skips one line as the line break of the logical ruled lines 531. FIG. In FIG. 31, the amount (and consumption tax) and the product name are correctly associated and extracted.

<主な効果>
本実施例によれば、ユーザーがどの列を行の区切りとして利用するのかという情報と、論理罫線531と、仮想罫線532とにより、帳票における行の区切りを正しく反映して行を抽出できる。
<Main effects>
According to this embodiment, it is possible to correctly reflect the line breaks in the form and extract the lines by using the information indicating which column the user uses as the line break, the logical ruled line 531 and the virtual ruled line 532 .

<その他の適用例>
以上、本発明を実施するための最良の形態について実施例を用いて説明したが、本発明はこうした実施例に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
<Other application examples>
Although the best mode for carrying out the present invention has been described above using examples, the present invention is by no means limited to such examples, and various modifications can be made without departing from the scope of the present invention. and substitutions can be added.

例えば、本実施形態では、画像形成装置300とサーバ装置200とが通信して、サーバ装置200が帳票認識を行ったが、画像形成装置300が単体で帳票認識を行ってもよい。また、本実施形態では、サーバ装置200が帳票認識を行った後、端末装置400が認識結果確認画面501を表示したが、画像形成装置300が認識結果確認画面501を表示してもよい。 For example, in the present embodiment, the image forming apparatus 300 and the server apparatus 200 communicate with each other, and the server apparatus 200 recognizes the form. However, the image forming apparatus 300 may perform the form recognition alone. In the present embodiment, the terminal device 400 displays the recognition result confirmation screen 501 after the server device 200 recognizes the form, but the image forming device 300 may display the recognition result confirmation screen 501 .

また、画像形成装置300の代わりに、PCに接続されたスキャナ装置がスキャンして、PCが帳票画像データをサーバ装置200に送信してもよい。この場合、PCが端末装置400の代わりになる。
また、本実施形態では、品名の項目値が連結されたが、どの項目の項目値を連結するかは、ユーザーが設定できてよい。また、複数の項目の項目値が連結されてもよい。
Alternatively, instead of the image forming apparatus 300 , a scanner device connected to a PC may scan, and the PC may transmit the form image data to the server device 200 . In this case, the PC replaces the terminal device 400 .
Also, in the present embodiment, the item values of the product name are linked, but the user may be able to set which item values are linked. Also, item values of a plurality of items may be concatenated.

また、図9などの構成例は、サーバ装置200による処理の理解を容易にするために、主な機能に応じて分割したものである。処理単位の分割の仕方や名称によって本願発明が制限されることはない。サーバ装置200の処理は、処理内容に応じて更に多くの処理単位に分割することもできる。また、1つの処理単位が更に多くの処理を含むように分割することもできる。 Also, the configuration examples in FIG. 9 and the like are divided according to the main functions in order to facilitate understanding of the processing by the server device 200 . The present invention is not limited by the division method or name of the unit of processing. The processing of the server device 200 can also be divided into more processing units according to the content of the processing. Also, one processing unit can be divided to include more processing.

また、実施例に記載された装置群は、本明細書に開示された実施形態を実施するための複数のコンピューティング環境のうちの1つを示すものにすぎない。ある実施形態では、サーバ装置200は、サーバクラスタといった複数のコンピューティングデバイスを含む。複数のコンピューティングデバイスは、ネットワークや共有メモリなどを含む任意のタイプの通信リンクを介して互いに通信するように構成されており、本明細書に開示された処理を実施する。 Moreover, the devices described in the examples are only representative of one of several computing environments for implementing the embodiments disclosed herein. In some embodiments, server apparatus 200 includes multiple computing devices, such as a server cluster. Multiple computing devices are configured to communicate with each other over any type of communication link, including a network, shared memory, etc., to perform the processes disclosed herein.

更に、サーバ装置200は、開示された処理ステップ、例えば図11等を様々な組み合わせで共有するように構成できる。例えば、所定のユニットによって実行されるプロセスは、サーバ装置200が有する複数の情報処理装置によって実行され得る。また、サーバ装置200は、1つのサーバ装置にまとめられていても良いし、複数の装置に分けられていても良い。 Further, the server device 200 can be configured to share the disclosed processing steps, such as FIG. 11, in various combinations. For example, a process executed by a predetermined unit can be executed by multiple information processing devices included in server device 200 . Also, the server device 200 may be integrated into one server device, or may be divided into a plurality of devices.

上記で説明した実施形態の各機能は、一又は複数の処理回路によって実現することが可能である。ここで、本明細書における「処理回路」は、電子回路により実装されるプロセッサのようにソフトウェアによって各機能を実行するようプログラミングされたプロセッサや、上記で説明した各機能を実行するよう設計されたASIC(Application Specific Integrated Circuit)、DSP(Digital Signal Processor)、FPGA(Field Programmable Gate Array)、及び、従来の回路モジュール等のデバイスを含む。 Each function of the embodiments described above may be implemented by one or more processing circuits. Here, "processing circuitry" as used herein refers to processors programmed by software to perform the functions, such as processors implemented by electronic circuitry, or processors designed to perform the functions described above. It includes devices such as ASICs (Application Specific Integrated Circuits), DSPs (Digital Signal Processors), FPGAs (Field Programmable Gate Arrays), and conventional circuit modules.

100 帳票認識システム
200 サーバ装置
400 端末装置
100 form recognition system 200 server device 400 terminal device

特開2021-140788号公報Japanese Patent Application Laid-Open No. 2021-140788

Claims (22)

行と列を有する表形式の画像データから文字列を認識した認識結果を端末装置に提供する情報処理システムであって、
前記認識結果から、予め設定されている列見出しの列に値を有する第一の行の項目値と、予め設定されている除外用語を含まず空白行でない第二の行の項目値を連結する帳票認識部と、
前記帳票認識部により連結された前記第一の行と前記第二の行の項目値を前記端末装置に提供する表示画面生成部と、
を有することを特徴とする情報処理システム。
An information processing system for providing a terminal device with a recognition result obtained by recognizing a character string from tabular image data having rows and columns,
From the recognition result, concatenate the item value of the first row that has a value in the preset column heading column and the item value of the second row that does not contain the preset exclusion term and is not blank. a form recognition unit;
a display screen generation unit that provides the terminal device with the item values of the first row and the second row that are linked by the form recognition unit;
An information processing system characterized by having:
連結された前記第一の行と前記第二の行の項目値は、列見出しが品名の列における項目値であり、
前記除外用語は、品名として使用されない用語であることを特徴とする請求項1に記載の情報処理システム。
The item values of the first row and the second row that are concatenated are the item values in the column whose column heading is the item name,
2. The information processing system according to claim 1, wherein said exclusion term is a term not used as a product name.
前記除外用語は、消費税、小計、合計、又は、伝票計であることを特徴とする請求項2に記載の情報処理システム。 3. The information processing system according to claim 2, wherein said exclusion term is consumption tax, subtotal, total, or slip total. 予め設定されている前記列見出しは、金額、又は、数量及び単価であることを特徴とする請求項3に記載の情報処理システム。 4. The information processing system according to claim 3, wherein the preset column headings are price or quantity and unit price. 前記第二の行に隣接した上の行、又は、下の行のいずれかのみが、前記第一の行の場合、前記帳票認識部は、前記第二の行に隣接した前記第一の行の項目値と前記第二の行の項目値を連結することを特徴とする請求項4に記載の情報処理システム。 When either the upper row or the lower row adjacent to the second row is the first row, the form recognition unit selects the first row adjacent to the second row 5. The information processing system according to claim 4, wherein the item value of and the item value of the second row are concatenated. 前記除外用語を含む行を第三の行、すべての列に値が存在しない行を第四の行とし、
前記第二の行に隣接した上の行、及び、下の行の双方が、前記第一の行の場合、
前記帳票認識部は、表形式の画像データの中で最初に登場する第一の行の上の行が、前記第三の行、前記第四の行、又は、存在しない場合、
前記第二の行の上に隣接した前記第一の行の項目値と前記第二の行の項目値を連結することを特徴とする請求項4に記載の情報処理システム。
The row containing the excluded term is the third row, and the row without values in all columns is the fourth row,
When both the upper row and the lower row adjacent to the second row are the first row,
If the row above the first row that first appears in the tabular image data is the third row, the fourth row, or does not exist,
5. The information processing system according to claim 4, wherein the item value of said first row and the item value of said second row adjacent above said second row are concatenated.
前記除外用語を含む行を第三の行、すべての列に値が存在しない行を第四の行とし、
前記第二の行に隣接した上の行、及び、下の行の双方が、前記第一の行の場合、
前記帳票認識部は、表形式の画像データの中で最初に登場する第一の行の上の行が、前記第二の行の場合、
前記第二の行の下に隣接した前記第一の行の項目値と前記第二の行の項目値を連結することを特徴とする請求項4に記載の情報処理システム。
The row containing the excluded term is the third row, and the row without values in all columns is the fourth row,
When both the upper row and the lower row adjacent to the second row are the first row,
When the row above the first row that first appears in the tabular image data is the second row, the form recognition unit
5. The information processing system according to claim 4, wherein the item values of said first row and the item values of said second row adjacent below said second row are concatenated.
行と列を有する表形式の画像データから文字列を認識した認識結果を端末装置に提供する情報処理システムであって、
前記行の区切りに第一の罫線を設定し、予め設定されている列見出しの列の項目値の上端に第二の罫線を設定し、前記第一の罫線と前記第二の罫線に基づいて、行区切りを決定する帳票認識部と、
前記帳票認識部により決定された行区切りに基づいて抽出した項目値を前記端末装置に提供する表示画面生成部と、
を有することを特徴とする情報処理システム。
An information processing system for providing a terminal device with a recognition result obtained by recognizing a character string from tabular image data having rows and columns,
set a first ruled line at the row delimiter, set a second ruled line at the top of the column heading column item value set in advance, and set the second ruled line based on the first ruled line and the second ruled line , a form recognition unit that determines line breaks;
a display screen generation unit that provides the terminal device with item values extracted based on the line breaks determined by the form recognition unit;
An information processing system characterized by having:
前記帳票認識部は、前記第一の罫線と重なっている前記第二の罫線を前記行区切りに決定することを特徴とする請求項8に記載の情報処理システム。 9. The information processing system according to claim 8, wherein the form recognition unit determines the second ruled line overlapping the first ruled line as the line break. 前記第一の罫線は前記画像データを等間隔に区切るように決定されており、
前記帳票認識部は、指定されたスキップ数ごとに前記第一の罫線を描画することを特徴とする請求項8又は9に記載の情報処理システム。
the first ruled lines are determined to divide the image data at equal intervals;
10. The information processing system according to claim 8, wherein the form recognition unit draws the first ruled line for each specified number of skips.
行と列を有する表形式の画像データから文字列を認識した認識結果を端末装置に提供する情報処理システムが行う帳票認識方法であって、
帳票認識部が、前記認識結果から、予め設定されている列見出しの列に値を有する第一の行の項目値と、予め設定されている除外用語を含まず空白行でない第二の行の項目値を連結するステップと、
表示画面生成部が、前記帳票認識部により連結された前記第一の行と前記第二の行の項目値を前記端末装置に提供するステップと、
を有することを特徴とする帳票認識方法。
A form recognition method performed by an information processing system for providing a terminal device with recognition results obtained by recognizing a character string from image data in a tabular format having rows and columns,
The form recognition unit determines, from the recognition result, the item values of the first row that have values in the columns of the preset column headings, and the second rows that do not contain preset exclusion terms and are not blank rows. concatenating field values;
a step in which the display screen generation unit provides the terminal device with the item values of the first row and the second row linked by the form recognition unit;
A form recognition method characterized by comprising:
連結された前記第一の行と前記第二の行の項目値は、列見出しが品名の列における項目値であり、
前記除外用語は、品名として使用されない用語であることを特徴とする請求項11に記載の帳票認識方法。
The item values of the first row and the second row that are concatenated are the item values in the column whose column heading is the item name,
12. The form recognition method according to claim 11, wherein said excluded term is a term that is not used as a product name.
前記除外用語は、消費税、小計、合計、又は、伝票計であることを特徴とする請求項12に記載の帳票認識方法。 13. The form recognition method according to claim 12, wherein the exclusion terms are consumption tax, subtotal, total, or slip total. 予め設定されている前記列見出しは、金額、又は、数量及び単価であることを特徴とする請求項13に記載の帳票認識方法。 14. The form recognition method according to claim 13, wherein the preset column headings are amounts or quantities and unit prices. 前記第二の行に隣接した上の行、又は、下の行のいずれかのみが、前記第一の行の場合、前記帳票認識部は、前記第二の行に隣接した前記第一の行の項目値と前記第二の行の項目値を連結することを特徴とする請求項14に記載の帳票認識方法。 When either the upper row or the lower row adjacent to the second row is the first row, the form recognition unit selects the first row adjacent to the second row 15. The form recognition method according to claim 14, further comprising concatenating the item value of the second row with the item value of the second row. 前記除外用語を含む行を第三の行、すべての列に値が存在しない行を第四の行とし、
前記第二の行に隣接した上の行、及び、下の行の双方が、前記第一の行の場合、
前記帳票認識部は、表形式の画像データの中で最初に登場する第一の行の上の行が、前記第三の行、前記第四の行、又は、存在しない場合、
前記第二の行の上に隣接した前記第一の行の項目値と前記第二の行の項目値を連結することを特徴とする請求項14に記載の帳票認識方法。
The row containing the excluded term is the third row, and the row without values in all columns is the fourth row,
When both the upper row and the lower row adjacent to the second row are the first row,
If the row above the first row that first appears in the tabular image data is the third row, the fourth row, or does not exist,
15. The form recognition method according to claim 14, wherein the item value of said first line and the item value of said second line adjacent above said second line are concatenated.
前記除外用語を含む行を第三の行、すべての列に値が存在しない行を第四の行とし、
前記第二の行に隣接した上の行、及び、下の行の双方が、前記第一の行の場合、
前記帳票認識部は、表形式の画像データの中で最初に登場する第一の行の上の行が、前記第二の行の場合、
前記第二の行の下に隣接した前記第一の行の項目値と前記第二の行の項目値を連結することを特徴とする請求項14に記載の帳票認識方法。
The row containing the excluded term is the third row, and the row without values in all columns is the fourth row,
When both the upper row and the lower row adjacent to the second row are the first row,
When the row above the first row that first appears in the tabular image data is the second row, the form recognition unit
15. The form recognition method according to claim 14, wherein the item values of said first line and the item values of said second line adjacent below said second line are concatenated.
行と列を有する表形式の画像データから文字列を認識した認識結果を端末装置に提供する情報処理システムが行う帳票認識方法であって、
前記行の区切りに第一の罫線を設定し、予め設定されている列見出しの列の項目値の上端に第二の罫線を設定し、前記第一の罫線と前記第二の罫線に基づいて、行区切りを決定する帳票認識部と、
前記帳票認識部により決定された行区切りに基づいて抽出した項目値を前記端末装置に提供する表示画面生成部と、
を有することを特徴とする帳票認識方法。
A form recognition method performed by an information processing system for providing a terminal device with recognition results obtained by recognizing a character string from image data in a tabular format having rows and columns,
set a first ruled line at the row delimiter, set a second ruled line at the top of the column heading column item value set in advance, and set the second ruled line based on the first ruled line and the second ruled line , a form recognition unit that determines line breaks;
a display screen generation unit that provides the terminal device with item values extracted based on the line breaks determined by the form recognition unit;
A form recognition method characterized by comprising:
前記帳票認識部は、前記第一の罫線と重なっている前記第二の罫線を前記行区切りに決定することを特徴とする請求項18に記載の帳票認識方法。 19. The form recognition method according to claim 18, wherein said form recognition unit determines said second ruled line overlapping said first ruled line as said line break. 前記第一の罫線は前記画像データを等間隔に区切るように決定されており、
前記帳票認識部は、指定されたスキップ数ごとに前記第一の罫線を描画することを特徴とする請求項18又は19に記載の帳票認識方法。
the first ruled lines are determined to divide the image data at equal intervals;
20. The form recognition method according to claim 18, wherein the form recognition unit draws the first ruled line for each specified number of skips.
行と列を有する表形式の画像データから文字列を認識した認識結果を端末装置に提供する情報処理システムを、
前記認識結果から、予め設定されている列見出しの列に値を有する第一の行の項目値と、予め設定されている除外用語を含まず空白行でない第二の行の項目値を連結する帳票認識部と、
前記帳票認識部により連結された前記第一の行と前記第二の行の項目値を前記端末装置に提供する表示画面生成部、
として機能させるためのプログラム。
An information processing system that provides terminal devices with recognition results obtained by recognizing character strings from tabular image data having rows and columns,
From the recognition result, concatenate the item value of the first row that has a value in the preset column heading column and the item value of the second row that does not contain the preset exclusion term and is not blank. a form recognition unit;
a display screen generation unit that provides the terminal device with the item values of the first row and the second row that are linked by the form recognition unit;
A program to function as
行と列を有する表形式の画像データから文字列を認識した認識結果を端末装置に提供する情報処理システムと、前記認識結果を表示する端末装置とを有する帳票認識システムであって、
前記情報処理システムは、
前記認識結果から、予め設定されている列見出しの列に値を有する第一の行の項目値と、予め設定されている除外用語を含まず空白行でない第二の行の項目値を連結する帳票認識部と、
前記帳票認識部により連結された前記第一の行と前記第二の行の項目値を前記端末装置に提供する表示画面生成部と、を有し、
前記端末装置は、
前記認識結果を表示する表示制御部を有することを特徴とする帳票認識システム。
A form recognition system comprising: an information processing system for providing a terminal device with recognition results obtained by recognizing character strings from tabular image data having rows and columns; and a terminal device for displaying the recognition results,
The information processing system is
From the recognition result, concatenate the item value of the first row that has a value in the preset column heading column and the item value of the second row that does not contain the preset exclusion term and is not blank. a form recognition unit;
a display screen generation unit that provides the terminal device with item values of the first row and the second row linked by the form recognition unit;
The terminal device
A form recognition system comprising a display control section for displaying the recognition result.
JP2021194851A 2021-11-30 2021-11-30 Information processing system, form recognition method, program, form recognition system Pending JP2023081132A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021194851A JP2023081132A (en) 2021-11-30 2021-11-30 Information processing system, form recognition method, program, form recognition system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021194851A JP2023081132A (en) 2021-11-30 2021-11-30 Information processing system, form recognition method, program, form recognition system

Publications (1)

Publication Number Publication Date
JP2023081132A true JP2023081132A (en) 2023-06-09

Family

ID=86656871

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021194851A Pending JP2023081132A (en) 2021-11-30 2021-11-30 Information processing system, form recognition method, program, form recognition system

Country Status (1)

Country Link
JP (1) JP2023081132A (en)

Similar Documents

Publication Publication Date Title
US8792141B2 (en) Embedded form extraction definition to enable automatic workflow configuration
US10742844B2 (en) Hiding sensitive data
US11303769B2 (en) Image processing system that computerizes documents with notification of labeled items, control method thereof, and storage medium
CN102694940B (en) Information processor and control method thereof
JP2010086151A (en) Data generation device, scanner, and computer program
JP7131488B2 (en) Information processing device, information processing method and information processing program
JP2021140788A (en) Information processing system, information processing method and program
US20210166284A1 (en) Information processing system, information processing method, and non-transitory recording medium
JP7346931B2 (en) Information processing device, information processing method, and information processing program
JP2022017751A (en) Information processing device, information processing method, information processing program and information processing system
JP2015187846A (en) Document processing system and document processor
JP2023081132A (en) Information processing system, form recognition method, program, form recognition system
US11620434B2 (en) Information processing apparatus, information processing method, and storage medium that provide a highlighting feature of highlighting a displayed character recognition area
US11588945B2 (en) Data input support apparatus that displays a window with an item value display area, an overview image display area, and an enlarged image display area
JP7447928B2 (en) Information processing device, program, information processing system, information processing method
JP2021140831A (en) Document image processing system, document image processing method, and document image processing program
JP7211276B2 (en) Information processing device, information processing method and information processing program
JP5788736B2 (en) Image distribution server, image distribution system, image distribution method and program
JP7456131B2 (en) Information processing system, information processing method and program
JP7380653B2 (en) Information processing device, information processing method, information processing program, information processing system
JP6657799B2 (en) Graphic processing apparatus, graphic processing method, and graphic processing program
JP7404943B2 (en) Information processing device and information processing program
JP7147334B2 (en) Shared terminal, communication system, display method, and program
US20230368555A1 (en) Information processing apparatus, information processing method, and storage medium
WO2021117128A1 (en) Form image processing system