JP7447928B2 - Information processing device, program, information processing system, information processing method - Google Patents

Information processing device, program, information processing system, information processing method Download PDF

Info

Publication number
JP7447928B2
JP7447928B2 JP2022064588A JP2022064588A JP7447928B2 JP 7447928 B2 JP7447928 B2 JP 7447928B2 JP 2022064588 A JP2022064588 A JP 2022064588A JP 2022064588 A JP2022064588 A JP 2022064588A JP 7447928 B2 JP7447928 B2 JP 7447928B2
Authority
JP
Japan
Prior art keywords
item
definition information
value
form definition
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022064588A
Other languages
Japanese (ja)
Other versions
JP2023154935A (en
Inventor
遼 岩崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2022064588A priority Critical patent/JP7447928B2/en
Publication of JP2023154935A publication Critical patent/JP2023154935A/en
Application granted granted Critical
Publication of JP7447928B2 publication Critical patent/JP7447928B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、情報処理装置、プログラム、情報処理システム、情報処理方法に関する。 The present invention relates to an information processing device, a program, an information processing system, and an information processing method.

従来から、帳票画像に含まれる項目名と項目値とを抽出して対応付ける帳票認識の技術が知られている。また、帳票画像上における読取対象文字列の記載位置等を登録した帳票定義を予め作成しておき、帳票のレイアウトに応じた帳票定義を用いて、帳票認識を行うこともできる。 2. Description of the Related Art Conventionally, form recognition techniques have been known in which item names and item values included in a form image are extracted and associated with each other. Further, it is also possible to create a form definition in advance in which the written position of the character string to be read on the form image is registered, and perform form recognition using the form definition according to the layout of the form.

しかしながら、従来の技術では、帳票認識に用いる帳票定義の特定の仕方によっては、帳票の誤認識が生じる可能性がある。 However, with the conventional technology, there is a possibility that misrecognition of a form may occur depending on the specific method of form definition used for form recognition.

開示の技術は、上記事情に鑑みて成されたものであり、帳票認識の精度をより向上させることを目的としている。 The disclosed technology has been developed in view of the above circumstances, and aims to further improve the accuracy of form recognition.

開示の技術は、帳票画像データの入力を受け付けて、帳票に含まれる項目名及び項目値の位置関係を定義した帳票定義情報が複数格納された記憶部を参照し、帳票認識に用いる帳票定義情報を特定する特定部と、前記特定部による前記帳票定義情報の特定の仕方に応じて、前記帳票画像データの元となる帳票に含まれる項目名のうち、特定の項目名の項目値を決定する項目値決定部と、を有し、前記帳票定義情報は、第一の帳票定義情報と、前記第一の帳票定義情報よりも優先度が高い、利用者固有の帳票の項目名及び項目値の位置関係を定義した第二の帳票定義情報と、を含み、前記項目値決定部は、前記特定部による前記第二の帳票定義情報の特定の仕方に応じて、前記特定の項目名の項目値を決定し、前記項目値決定部は、前記第二の帳票定義情報が、前記帳票画像データが示す帳票画像に含まれる文字列に応じて特定された場合に、前記特定の項目名の項目値を、前記第二の帳票定義情報に基づき抽出された値に決定し、前記帳票画像データの元となる帳票のフォーマットに応じて特定された場合に、前記特定の項目名の項目値を、前記第一の帳票定義情報に基づき抽出された値に決定する、情報処理装置である。

The disclosed technology receives input of form image data, refers to a storage unit storing a plurality of form definition information that defines the positional relationships of item names and item values included in the form, and generates form definition information used for form recognition. and determining the item value of a specific item name among the item names included in the form that is the source of the form image data, according to a specifying unit that specifies the form definition information, and a method of specifying the form definition information by the specifying unit. an item value determination unit , the form definition information includes first form definition information and item names and item values of a user-specific form that have a higher priority than the first form definition information. second form definition information defining a positional relationship, and the item value determining unit determines the item value of the specific item name according to how the specifying unit specifies the second form definition information. and the item value determination unit determines the item value of the specific item name when the second form definition information is specified according to a character string included in the form image indicated by the form image data. is determined to be a value extracted based on the second form definition information, and when specified according to the format of the form that is the source of the form image data, the item value of the specific item name is determined as the value extracted from the second form definition information. The information processing device determines the extracted value based on the first form definition information .

開示の技術によれば、帳票認識の精度をより向上させることができる。 According to the disclosed technology, the accuracy of form recognition can be further improved.

帳票認識システムのシステム構成の一例を示す図である。1 is a diagram showing an example of a system configuration of a form recognition system. サーバ装置のハードウェア構成の一例を示す図である。It is a diagram showing an example of the hardware configuration of a server device. 端末装置のハードウェア構成の一例を示す図である。It is a diagram showing an example of the hardware configuration of a terminal device. 種別判定データベースの一例を示す図である。FIG. 3 is a diagram showing an example of a type determination database. 帳票定義データベースに格納される帳票定義情報の種類を示す図である。FIG. 3 is a diagram showing types of form definition information stored in a form definition database. 汎用定義情報の一例を示す図である。FIG. 3 is a diagram showing an example of general-purpose definition information. 個社定義情報の一例を示す図である。It is a figure showing an example of individual company definition information. フォーマット管理データベースの一例を示す図である。FIG. 3 is a diagram showing an example of a format management database. サーバ装置の機能を説明する図である。It is a figure explaining the function of a server apparatus. 端末装置の機能を説明する図である。FIG. 3 is a diagram illustrating the functions of a terminal device. 帳票認識システムの動作を説明するシーケンス図である。FIG. 2 is a sequence diagram illustrating the operation of the form recognition system. ジョブリストの一例を示す図である。FIG. 3 is a diagram showing an example of a job list. 帳票認識部の処理を説明する第一のフローチャートである。It is a first flowchart explaining the processing of a form recognition part. 帳票認識部の処理を説明する第二のフローチャートである。It is a second flowchart explaining the processing of a form recognition part. 帳票管理部の処理を説明するフローチャートである。It is a flowchart explaining the processing of a form management part. 本実施形態の効果を説明する第一の図である。FIG. 3 is a first diagram illustrating the effects of this embodiment. 本実施形態の効果を説明する第二の図である。FIG. 2 is a second diagram illustrating the effects of this embodiment.

以下に図面を参照して、実施形態について説明する。図1は、帳票認識システムのシステム構成の一例を示す図である。 Embodiments will be described below with reference to the drawings. FIG. 1 is a diagram showing an example of the system configuration of a form recognition system.

本実施形態の帳票認識システム100は、サーバ装置200、画像形成装置300、端末装置400を有する。本実施形態の帳票認識システム100において、サーバ装置200と、画像形成装置300と、端末装置400とは、ネットワークを介して接続される。本実施形態の帳票認識システム100は、情報処理システムの一例である。 The form recognition system 100 of this embodiment includes a server device 200, an image forming device 300, and a terminal device 400. In the form recognition system 100 of this embodiment, the server device 200, the image forming device 300, and the terminal device 400 are connected via a network. The form recognition system 100 of this embodiment is an example of an information processing system.

また、本実施形態の端末装置400は、例えば、ネットワークを介して基幹システム500と接続される。基幹システム500とは、例えば、本実施形態の帳票認識システム100において帳票を認識した結果を用いて、特定の処理を行うシステムである。具体的には、例えば、基幹システム500は、会計システムや、見積もり作成システム等であってもよい。 Further, the terminal device 400 of this embodiment is connected to the core system 500 via a network, for example. The core system 500 is, for example, a system that performs specific processing using the result of recognizing a form in the form recognition system 100 of this embodiment. Specifically, for example, the core system 500 may be an accounting system, an estimate creation system, or the like.

本実施形態の帳票認識システム100において、サーバ装置200は、画像形成装置300のスキャナ機能によって読み取られた帳票の画像を示す画像データから、帳票に含まれる項目名と項目値とを抽出し、項目名と項目値とを対応付けたテキストデータとする。項目名とは、帳票に含まれる項目の名称であり、項目値とは、項目の名称によって特定される項目と対応する値を示す。 In the form recognition system 100 of the present embodiment, the server device 200 extracts item names and item values included in the form from image data indicating the image of the form read by the scanner function of the image forming device 300, and extracts item names and item values included in the form. This is text data in which name and item value are associated with each other. The item name is the name of the item included in the form, and the item value represents the value corresponding to the item specified by the item name.

以下の説明では、画像形成装置300のスキャナ機能によって読み取られた帳票の画像を帳票画像と呼び、帳票画像を示す画像データを帳票画像データと呼ぶ。なお、画像形成装置300は、帳票認識システム100に含まれなくてもよい。 In the following description, the image of a form read by the scanner function of the image forming apparatus 300 will be referred to as a form image, and the image data representing the form image will be referred to as form image data. Note that the image forming apparatus 300 does not need to be included in the form recognition system 100.

また、以下の説明では、帳票画像に含まれる項目名と、この項目名と対応する項目値とを抽出し、項目名と項目値とを対応付けることを、帳票認識と呼ぶ。 Furthermore, in the following explanation, extracting an item name included in a form image and an item value corresponding to the item name, and associating the item name with the item value will be referred to as form recognition.

本実施形態のサーバ装置200は、記憶部210と、帳票認識部220と、帳票管理部290とを有する。記憶部210には、帳票画像データベース230、種別判定データベース240、帳票定義データベース250、認識結果データベース260、フォーマット管理データベース265、法人名辞書データベース267が設けられている。 The server device 200 of this embodiment includes a storage section 210, a form recognition section 220, and a form management section 290. The storage unit 210 is provided with a form image database 230, a type determination database 240, a form definition database 250, a recognition result database 260, a format management database 265, and a corporate name dictionary database 267.

帳票画像データベース230は、帳票画像データが格納される。種別判定データベース240は、帳票の種類を判別する際に参照される情報が格納される。帳票定義データベース250は、帳票認識部220による帳票認識に用いる帳票定義情報が格納される。帳票定義情報とは、帳票に含まれる項目名の記載位置と、項目名と項目値の位置関係とを定義した情報である。 The form image database 230 stores form image data. The type determination database 240 stores information that is referred to when determining the type of a form. The form definition database 250 stores form definition information used for form recognition by the form recognition unit 220. The form definition information is information that defines the position of item names included in the form and the positional relationship between the item names and item values.

認識結果データベース260は、帳票認識部220による帳票認識の結果を示す情報である帳票情報(認識結果データ)が格納される。フォーマット管理データベース265は、帳票のフォーマットを管理するためのフォーマット管理情報が格納される。法人名辞書データベース267は、法人名を含む辞書情報が格納される。法人名を含む辞書情報とは、法人の名称、法人の住所、電話番号等を含む情報であってよい。 The recognition result database 260 stores form information (recognition result data) that is information indicating the result of form recognition by the form recognition unit 220. The format management database 265 stores format management information for managing the format of forms. The corporate name dictionary database 267 stores dictionary information including corporate names. The dictionary information including a corporate name may be information including a corporate name, a corporate address, a telephone number, etc.

本実施形態の法人名辞書データベース267は、例えば、一般的に公開されているデータベースであってもよいし、帳票認識システム100の管理者によって予め作成されたものであってもよい。 The corporate name dictionary database 267 of this embodiment may be, for example, a publicly available database, or may be created in advance by the administrator of the form recognition system 100.

本実施形態の帳票認識部220は、帳票画像データベース230に格納された帳票画像データを取得し、種別判定データベース240を参照して帳票の種類を判定する。また、帳票認識部220は、帳票認識に用いる帳票定義情報の特定し、特定された帳票定義情報に基づいて、帳票に含まれる特定の項目名と対応する項目値を決定する。 The form recognition unit 220 of this embodiment acquires form image data stored in the form image database 230 and refers to the type determination database 240 to determine the type of the form. Further, the form recognition unit 220 specifies form definition information used for form recognition, and determines item values corresponding to specific item names included in the form based on the specified form definition information.

具体的には、帳票認識部220は、帳票定義データベース250に格納された帳票定義情報に含まれる、汎用定義情報(第一の帳票定義情報)と、個社定義情報(第二の帳票定義情報)とを用いる。 Specifically, the form recognition unit 220 recognizes general-purpose definition information (first form definition information) and individual company definition information (second form definition information) included in the form definition information stored in the form definition database 250. ).

本実施形態の汎用定義情報とは、一般的な帳票における項目名に対応する単語を定義した情報である。個社定義情報とは、帳票認識システム100を利用する利用者固有の帳票における項目名に対応する単語と帳票画像から抽出する情報を定義した情報である。帳票認識システム100を利用する利用者とは、帳票認識システム100が提供するサービスを利用するための契約を締結している事業者や企業、団体等である。本実施形態の以下の説明では、帳票認識システム100の利用者をテナントと表現する。 The general-purpose definition information in this embodiment is information that defines words corresponding to item names in general forms. The individual company definition information is information that defines words corresponding to item names in a form specific to the user who uses the form recognition system 100 and information to be extracted from the form image. Users who use the form recognition system 100 are businesses, companies, organizations, etc. that have concluded contracts to use the services provided by the form recognition system 100. In the following description of this embodiment, the users of the form recognition system 100 will be referred to as tenants.

本実施形態では、個社定義情報が、テナント毎に設けられており、帳票認識部220は、帳票認識に用いる個社定義情報の特定の仕方に応じて、帳票に含まれる特定の項目名の項目値を決定する。本実施形態の特定の項目名とは、例えば、帳票の発行元を示す項目名「発行元」であってよい。 In this embodiment, individual company definition information is provided for each tenant, and the form recognition unit 220 recognizes specific item names included in the form depending on how the individual company definition information used for form recognition is specified. Determine item value. The specific item name in this embodiment may be, for example, the item name "issuer" indicating the issuer of the form.

より具体的には、帳票認識部220は、個社定義情報が、帳票のフォーマットに基づき特定されたか、又は、帳票画像データに対する文字認識の結果に基づき特定されたかを判定する。そして、帳票認識部220は、この判定の結果に応じて、帳票認識の結果として出力する帳票の項目「発行元」の項目値を決定する。 More specifically, the form recognition unit 220 determines whether the individual company definition information is specified based on the format of the form or based on the result of character recognition on form image data. Then, the form recognition unit 220 determines the item value of the item "issuer" of the form to be output as the result of form recognition, according to the result of this determination.

ここで、個社定義情報を、帳票のフォーマットに基づき特定する場合と、個社定義情報を、文字認識の結果に基づき特定する場合と、について説明する。 Here, a case where the individual company definition information is specified based on the format of the form and a case where the individual company definition information is specified based on the result of character recognition will be explained.

帳票のフォーマットに基づき個社定義情報を特定する場合、個社定義情報は、帳票のフォーマットと類似したフォーマット情報と対応付けられた発行元の個社定義情報に特定される。このため、フォーマットに基づく個社定義情報の特定では、発行元が、実際の発行元と異なっていても、帳票のレイアウトが類似していれば、帳票認識に用いる個社定義情報として特定される可能性がある。 When specifying the individual company definition information based on the format of the form, the individual company definition information is specified as the individual company definition information of the issuer that is associated with format information similar to the format of the form. Therefore, when identifying company-defined information based on format, even if the issuer is different from the actual issuer, if the layout of the form is similar, it will be identified as company-defined information used for form recognition. there is a possibility.

つまり、個社定義情報を帳票のフォーマットに基づき特定した場合、特定された個社定義情報は、帳票の発行元とは異なる発行元の個社定義情報である可能性がある。 That is, when the individual company definition information is specified based on the format of the form, the identified individual company definition information may be the individual company definition information of a different issuer than the issuer of the form.

これに対し、文字認識の結果に基づき個社定義情報を特定する場合、帳票に含まれる文字列と、個社定義情報と対応付けられた発行元とが完全に一致する個社定義情報を特定する。このため、文字認識の結果に特定された個社定義情報は、帳票の発行元とは異なる発行元の個社定義情報である可能性は低い。 On the other hand, when identifying individual company-defined information based on the result of character recognition, identify individual company-defined information in which the character string included in the form and the publisher associated with the individual company-defined information completely match. do. Therefore, it is unlikely that the individual company definition information specified in the result of character recognition is the individual company definition information of a different issuer than the issuer of the form.

このことから、文字認識の結果に基づき特定された個社定義情報は、帳票のフォーマットに基づき特定された個社定義情報と比較して、信頼性が高いと言える。 From this, it can be said that the individual company definition information specified based on the result of character recognition is more reliable than the individual company definition information specified based on the format of the form.

本実施形態では、この点に着目し、個社定義情報が帳票のフォーマットによって特定された場合における、項目名「発行元」の項目値の決定の仕方を、個社定義情報が文字認識の結果によって特定された場合と異ならせる。 In this embodiment, we focus on this point and explain how to determine the item value of the item name "Publisher" when the individual company definition information is specified by the format of the form. be different from the case specified by.

このため、本実施形態では、帳票認識に用いる個社定義情報が、帳票のフォーマットに基づいて特定された場合であっても、発行元名の誤認識を抑制できる。言い換えれば、本実施形態では、帳票認識に用いる帳票定義情報の特定の仕方に起因する帳票の誤認識を抑制し、帳票認識の精度を向上させることができる。 Therefore, in this embodiment, even if the individual company definition information used for form recognition is specified based on the format of the form, misrecognition of the issuer's name can be suppressed. In other words, in this embodiment, it is possible to suppress misrecognition of a form due to the method of specifying form definition information used for form recognition, and improve the accuracy of form recognition.

本実施形態の帳票認識システム100において、画像形成装置300は、スキャナ機能を有する複合機である。画像形成装置300は、コピー機能、FAX機能、スキャナ機能等を実現するためのアプリケーションが搭載されており、各機能と対応するアプリケーションを選択することで、これらの機能が実現される。 In the form recognition system 100 of this embodiment, the image forming apparatus 300 is a multifunction device having a scanner function. The image forming apparatus 300 is loaded with applications for realizing a copy function, a FAX function, a scanner function, etc., and these functions are realized by selecting an application corresponding to each function.

本実施形態の端末装置400は、主にテナントによって使用される。また、端末装置400には、サーバ装置200による帳票認識の結果を確認させるための画面等が表示されても良い。 The terminal device 400 of this embodiment is mainly used by tenants. Furthermore, a screen or the like may be displayed on the terminal device 400 for confirming the result of form recognition by the server device 200.

なお、図1の例では、サーバ装置200は、記憶部210内に6つのデータベースを有する構成としたが、これに限定されない。各データベースは、一部がサーバ装置200の外部装置に設けられていても良いし、各データベース全てが外部装置に設けられていても良い。 In the example of FIG. 1, the server device 200 has a configuration having six databases in the storage unit 210, but the configuration is not limited to this. A part of each database may be provided in an external device of the server device 200, or all of each database may be provided in an external device.

また、図1の例では、サーバ装置200が帳票認識部220と帳票管理部290とを実現するものとしたが、これに限定されない。帳票認識部220と帳票管理部290とは、複数の情報処理装置によって実現されても良い。 Further, in the example of FIG. 1, the server device 200 implements the form recognition section 220 and the form management section 290, but the present invention is not limited to this. The form recognition unit 220 and the form management unit 290 may be realized by a plurality of information processing devices.

また、図1の例では、帳票認識システム100に含まれる画像形成装置300と端末装置400とは、それぞれ1台としているが、帳票認識システム100に含まれる画像形成装置300と端末装置400の台数は、任意の数であって良い。 In the example of FIG. 1, the number of image forming apparatuses 300 and terminal apparatuses 400 included in the form recognition system 100 is one each, but the number of image forming apparatuses 300 and terminal apparatuses 400 included in the form recognition system 100 is may be any number.

次に、図2を参照して、本実施形態のサーバ装置200のハードウェア構成について説明する。図2は、サーバ装置のハードウェア構成の一例を示す図である。 Next, with reference to FIG. 2, the hardware configuration of the server device 200 of this embodiment will be described. FIG. 2 is a diagram showing an example of the hardware configuration of the server device.

本実施形態のサーバ装置200は、コンピュータによって構築されており、図2に示されているように、CPU201、ROM202、RAM203、HD204、HDD(Hard Disk Drive)コントローラ205、ディスプレイ206、外部機器接続I/F(Interface)208、ネットワークI/F209、データバスB、キーボード211、ポインティングデバイス212、DVD-RW(Digital Versatile Disk Rewritable)ドライブ214、メディアI/F216を備えている。 The server device 200 of this embodiment is constructed by a computer, and as shown in FIG. /F (Interface) 208, network I/F 209, data bus B, keyboard 211, pointing device 212, DVD-RW (Digital Versatile Disk Rewritable) drive 214, and media I/F 216.

これらのうち、CPU201は、サーバ装置200全体の動作を制御する。ROM202は、IPL等のCPU201の駆動に用いられるプログラムを記憶する。RAM203は、CPU201のワークエリアとして使用される。HD204は、プログラム等の各種データを記憶する。HDDコントローラ205は、CPU201の制御にしたがってHD204に対する各種データの読み出し又は書き込みを制御する。ディスプレイ206は、カーソル、メニュー、ウィンドウ、文字、又は画像などの各種情報を表示する表示部である。 Among these, the CPU 201 controls the operation of the server device 200 as a whole. The ROM 202 stores programs used to drive the CPU 201, such as IPL. RAM 203 is used as a work area for CPU 201. The HD 204 stores various data such as programs. The HDD controller 205 controls reading and writing of various data to the HD 204 under the control of the CPU 201. The display 206 is a display unit that displays various information such as a cursor, menu, window, characters, or images.

外部機器接続I/F208は、各種の外部機器を接続するためのインターフェースである。この場合の外部機器は、例えば、USB(Universal Serial Bus)メモリやプリンタ等である。ネットワークI/F209は、通信ネットワークNを利用してデータ通信をするためのインターフェースである。データバスBは、図2に示されているCPU201等の各構成要素を電気的に接続するためのアドレスバスやデータバス等である。 External device connection I/F 208 is an interface for connecting various external devices. The external device in this case is, for example, a USB (Universal Serial Bus) memory, a printer, or the like. The network I/F 209 is an interface for data communication using the communication network N. The data bus B is an address bus, a data bus, etc. for electrically connecting each component such as the CPU 201 shown in FIG. 2.

また、キーボード211は、文字、数値、各種指示などの入力のための複数のキーを備えた入力手段の一種である。ポインティングデバイス212は、各種指示の選択や実行、処理対象の選択、カーソルの移動などを行う入力手段の一種である。DVD-RWドライブ214は、着脱可能な記録媒体の一例としてのDVD-RW213に対する各種データの読み出し又は書き込みを制御する。なお、DVD-RWに限らず、DVD-R等であってもよい。メディアI/F216は、フラッシュメモリ等の記録メディア215に対するデータの読み出し又は書き込み(記憶)を制御する。 Further, the keyboard 211 is a type of input means that includes a plurality of keys for inputting characters, numerical values, various instructions, and the like. The pointing device 212 is a type of input means for selecting and executing various instructions, selecting a processing target, moving a cursor, and the like. The DVD-RW drive 214 controls reading and writing of various data on the DVD-RW 213, which is an example of a removable recording medium. Note that it is not limited to DVD-RW, but may be DVD-R or the like. The media I/F 216 controls reading or writing (storage) of data to a recording medium 215 such as a flash memory.

本実施形態のサーバ装置200は、例えば、スマートフォン、タブレット端末、PDA(Personal Digital Assistant)、ウェアラブルPC等であっても良い。 The server device 200 of this embodiment may be, for example, a smartphone, a tablet terminal, a PDA (Personal Digital Assistant), a wearable PC, or the like.

本実施形態の端末装置400は、演算処理装置と記憶装置とを有するコンピュータであり、例えば、タブレット型の端末装置や、スマートフォン等であっても良い。図3は、端
本実施形態の端末装置400は、CPU401、ROM402、RAM403、EEPROM404、CMOSセンサ405、撮像素子I/F406、加速度・方位センサ407、メディアI/F409、データバス410、GPS受信部411を備えている。
The terminal device 400 of this embodiment is a computer having an arithmetic processing unit and a storage device, and may be, for example, a tablet-type terminal device, a smartphone, or the like. FIG. 3 shows the terminal device 400 of this embodiment, which includes a CPU 401, ROM 402, RAM 403, EEPROM 404, CMOS sensor 405, image sensor I/F 406, acceleration/direction sensor 407, media I/F 409, data bus 410, and GPS receiving section. 411.

これらのうち、CPU401は、端末装置400全体の動作を制御する演算処理装置である。ROM402は、CPU401やIPL等のCPU401の駆動に用いられるプログラムを記憶する。RAM303は、CPU301のワークエリアとして使用される。EEPROM404は、CPU401の制御にしたがって、スマートフォン(端末装置)用プログラム等の各種データの読み出し又は書き込みを行う。ROM402、RAM403、EEPROM404は、端末装置400の記憶装置の一例である。 Among these, the CPU 401 is an arithmetic processing unit that controls the operation of the entire terminal device 400. The ROM 402 stores the CPU 401 and programs used to drive the CPU 401 such as IPL. RAM 303 is used as a work area for CPU 301. The EEPROM 404 reads or writes various data such as a smartphone (terminal device) program under the control of the CPU 401. ROM 402, RAM 403, and EEPROM 404 are examples of storage devices of terminal device 400.

CMOS(Complementary Metal Oxide Semiconductor)センサ405は、CPU401の制御に従って被写体(主に自画像)を撮像して画像データを得る内蔵型の撮像手段の一種である。なお、CMOSセンサではなく、CCD(Charge Coupled Device)センサ等の撮像手段であってもよい。 A CMOS (Complementary Metal Oxide Semiconductor) sensor 405 is a type of built-in imaging means that images a subject (mainly a self-portrait) and obtains image data under the control of the CPU 401. Note that instead of a CMOS sensor, an imaging means such as a CCD (Charge Coupled Device) sensor may be used.

撮像素子I/F406は、CMOSセンサ305の駆動を制御する回路である。加速度・方位センサ407は、地磁気を検知する電子磁気コンパスやジャイロコンパス、加速度センサ等の各種センサである。メディアI/F409は、フラッシュメモリ等の記録メディア408に対するデータの読み出し又は書き込み(記憶)を制御する。データバス410は、図3に示されているCPU401等の各構成要素を電気的に接続するためのアドレスバスやデータバス等である。GPS受信部411は、GPS衛星からGPS信号を受信する。 The image sensor I/F 406 is a circuit that controls driving of the CMOS sensor 305. The acceleration/direction sensor 407 is a variety of sensors such as an electronic magnetic compass, a gyro compass, and an acceleration sensor that detect geomagnetism. A media I/F 409 controls reading or writing (storage) of data to a recording medium 408 such as a flash memory. The data bus 410 is an address bus, a data bus, etc. for electrically connecting each component such as the CPU 401 shown in FIG. 3. GPS receiving section 411 receives GPS signals from GPS satellites.

また、端末装置400は、遠距離通信回路412、遠距離通信回路412のアンテナ412a、マイク415、スピーカ416、音入出力I/F417、ディスプレイ(表示部)418、外部機器接続I/F(Interface)419、近距離通信回路420、近距離通信回路420のアンテナ420a、及びタッチパネル421を備えている。 The terminal device 400 also includes a long-distance communication circuit 412, an antenna 412a of the long-distance communication circuit 412, a microphone 415, a speaker 416, a sound input/output I/F 417, a display (display unit) 418, an external device connection I/F (Interface ) 419, a short-range communication circuit 420, an antenna 420a of the short-range communication circuit 420, and a touch panel 421.

これらのうち、遠距離通信回路412は、通信ネットワークを介して、他の機器と通信する回路である。マイク415は、音を電気信号に変える内蔵型の回路である。スピーカ416は、電気信号を物理振動に変えて音楽や音声などの音を生み出す内蔵型の回路である。音入出力I/F417は、CPU401の制御に従ってマイク415及びスピーカ416との間で音信号の入出力を処理する回路である。 Among these, the long distance communication circuit 412 is a circuit that communicates with other devices via a communication network. Microphone 415 is a built-in circuit that converts sound into electrical signals. The speaker 416 is a built-in circuit that converts electrical signals into physical vibrations to produce sounds such as music and voice. The sound input/output I/F 417 is a circuit that processes input/output of sound signals between the microphone 415 and the speaker 416 under the control of the CPU 401 .

ディスプレイ418は、被写体の画像や各種アイコン等を表示する液晶や有機EL(Electro Luminescence)などの表示手段の一種である。外部機器接続I/F419は、各種の外部機器を接続するためのインターフェースである。近距離通信回路420は、NFC(Near Field Communication)やBluetooth(登録商標)等の通信回路である。タッチパネル421は、利用者がディスプレイ418を押下することで、端末装置400を操作する入力手段の一種である。ディスプレイ418は、端末装置400の有する表示部の一例である。 The display 418 is a type of display means such as a liquid crystal or organic EL (Electro Luminescence) that displays images of the subject, various icons, and the like. The external device connection I/F 419 is an interface for connecting various external devices. The near field communication circuit 420 is a communication circuit such as NFC (Near Field Communication) or Bluetooth (registered trademark). The touch panel 421 is a type of input means by which the user operates the terminal device 400 by pressing the display 418. Display 418 is an example of a display unit included in terminal device 400.

次に、本実施形態のサーバ装置200の有する種別判定データベース240と帳票定義データベース250について説明する。 Next, the type determination database 240 and form definition database 250 included in the server device 200 of this embodiment will be explained.

図4は、種別判定データベースの一例を示す図である。本実施形態の種別判定データベース240は、情報の項目として、定義ID、定義種別、文書種別、識別文字列を有する。種別判定データベース240において、項目「定義ID」は、その他の項目と対応付けられており、項目「定義ID」の値と、その他の項目の値とを含む情報を、種別判定情報と呼ぶ。 FIG. 4 is a diagram showing an example of a type determination database. The type determination database 240 of this embodiment has definition ID, definition type, document type, and identification character string as information items. In the type determination database 240, the item "definition ID" is associated with other items, and information including the value of the item "definition ID" and the values of the other items is called type determination information.

項目「定義ID」の値は、帳票定義情報を特定するための識別情報を示す。項目「定義種別」の値は、帳票定義情報の種類を示す。本実施形態では、帳票定義情報の種類として、汎用定義情報と個社定義情報とを含む。 The value of the item "definition ID" indicates identification information for specifying form definition information. The value of the item "definition type" indicates the type of form definition information. In this embodiment, the types of form definition information include general definition information and individual company definition information.

項目「文書種別」の値は、帳票の種類を示す。帳票の種類とは、具体的には、例えば、請求書、見積書、注文書等である。 The value of the item "document type" indicates the type of form. Specifically, the types of forms include, for example, invoices, estimates, and order forms.

項目「識別文字列」の値は、帳票の種類を特定するための文字列を示す。具体的には、例えば、「請求書」又は「請求」という文字列を含む帳票画像は、項目「文書種別」が示す帳票の種類が「請求書」となる。 The value of the item "identification character string" indicates a character string for identifying the type of form. Specifically, for example, for a form image that includes the character string "invoice" or "request", the type of form indicated by the item "document type" is "invoice".

図4の例では、例えば、定義ID「H01」の帳票定義情報の種類は汎用定義情報であり、定義ID「H01」の汎用定義情報は、「請求書」のレイアウトを定義した情報であり、帳票画像データから「請求」又は「請求書」という文字列が抽出された場合に、参照される。 In the example of FIG. 4, for example, the type of form definition information with the definition ID "H01" is general-purpose definition information, and the general-purpose definition information with the definition ID "H01" is information that defines the layout of "invoice", It is referenced when the character string "Claim" or "Bill" is extracted from the form image data.

また、図4の例では、例えば、定義ID「A01」の帳票定義情報の種類は個社定義情報であり、定義ID「A01」の個社定義情報は、「R社用請求書」のレイアウトを定義した情報であり、帳票画像データから「請求」又は「請求書」という文字列が抽出された場合に、参照される。 In addition, in the example of FIG. 4, for example, the type of form definition information with the definition ID "A01" is individual company definition information, and the individual company definition information with the definition ID "A01" is the layout of "Invoice for Company R". This is information that defines the ``invoice'' and is referenced when the character string ``request'' or ``invoice'' is extracted from the form image data.

次に、図5乃至図7を参照して、本実施形態の帳票定義データベース250について説明する。図5は、帳票定義データベースに格納される帳票定義情報の種類を示す図である。 Next, the form definition database 250 of this embodiment will be described with reference to FIGS. 5 to 7. FIG. 5 is a diagram showing the types of form definition information stored in the form definition database.

本実施形態の帳票定義データベース250には、汎用定義情報251と、個社定義情報252と、が格納されている。 The form definition database 250 of this embodiment stores general-purpose definition information 251 and individual company definition information 252.

本実施形態の汎用定義情報251とは、帳票の中でも、複数の利用者(テナント)により利用される汎用性の高いレイアウトの帳票の帳票定義情報である。汎用定義情報251は、個社定義情報252と比較して、優先度の低い帳票定義情報である。 The general-purpose definition information 251 of this embodiment is form definition information of a form with a highly versatile layout that is used by a plurality of users (tenants) among forms. The general-purpose definition information 251 is form definition information with a lower priority than the individual company definition information 252.

本実施形態の個社定義情報252とは、帳票の中でも、利用者が独自に設計したレイアウトの帳票の帳票定義情報であり、利用者専用の帳票定義情報である。個社定義情報252は、汎用定義情報251と比較して、尊重されるべき定義であり、優先度が高い帳票定義情報である。 The individual company definition information 252 of this embodiment is form definition information of a form with a layout uniquely designed by the user among forms, and is form definition information exclusive to the user. The individual company definition information 252 is a definition that should be respected and is form definition information with a higher priority than the general purpose definition information 251.

本実施形態の帳票認識部220は、この2つの帳票定義情報を用いて(参照して)、帳票画像データの認識を行う。したがって、本実施形態では、例えば、帳票画像データが、汎用定義情報251においてレイアウトが定義されていない帳票のものであった場合でも、個社定義情報252で定義されていれば、この帳票画像データを認識できる。 The form recognition unit 220 of this embodiment uses (references to) these two pieces of form definition information to recognize form image data. Therefore, in this embodiment, for example, even if the form image data is of a form whose layout is not defined in the general-purpose definition information 251, if the layout is defined in the individual company definition information 252, the form image data can be recognized.

図6は、汎用定義情報の一例を示す図である。汎用定義情報251は、定義ID毎に生成されるものであり、情報の項目として、項目ID、項目名、方向、距離等を含む。つまり、本実施形態の汎用定義情報251は、項目「定義ID」と、その他の項目とが対応付けられており、項目「定義ID」の値と、その他の項目の値とを含む。 FIG. 6 is a diagram showing an example of general-purpose definition information. The general-purpose definition information 251 is generated for each definition ID, and includes item ID, item name, direction, distance, etc. as information items. That is, the general-purpose definition information 251 of this embodiment has the item "definition ID" associated with other items, and includes the value of the item "definition ID" and the values of the other items.

項目「項目ID」の値は、帳票に含まれる項目を特定するための識別情報である。項目「項目名」の値は、項目の名称を示す。 The value of the item "item ID" is identification information for specifying the item included in the form. The value of the item "item name" indicates the name of the item.

項目「方向」、「距離」等は、文字列を抽出する範囲を示す。例えば、項目「方向」の値が「RD」であり、項目「距離」の値が「20mm」であった場合、項目名となる文字列と外接する矩形の右下の座標から下に向かって20mm以内の範囲から、文字列を抽出することを示す。 Items such as "direction" and "distance" indicate the range from which character strings are extracted. For example, if the value of the item "Direction" is "RD" and the value of the item "Distance" is "20mm", move downward from the lower right coordinates of the rectangle circumscribing the character string that is the item name. Indicates that a character string is extracted from a range within 20 mm.

つまり、本実施形態の項目「方向」、「距離」等は、文字列を抽出する範囲を示す条件であり、この条件は、項目名と対応付けられている。なお、図5の例では、文字列を抽出する範囲を示す条件として、項目「方向」、「距離」を挙げたが、条件には、他の項目が含まれていても良い。 That is, the items "direction", "distance", etc. in this embodiment are conditions indicating the range from which character strings are extracted, and these conditions are associated with item names. In the example of FIG. 5, the items "direction" and "distance" are used as conditions indicating the range from which character strings are extracted, but the conditions may include other items.

したがって、例えば、項目ID「2」の項目名「合計」という文字列と外接する矩形の右下の座標から下に向かって20mm以内の範囲から抽出された文字列は、項目名「合計」と対応する項目値と認識される。 Therefore, for example, a character string extracted from a range within 20 mm downward from the lower right coordinates of a rectangle that circumscribes the character string "Total" as the item name of the item ID "2" is called "Total" as the item name. It is recognized as the corresponding item value.

なお、汎用定義情報251では、帳票に含まれる全ての項目に関する情報が含まれるものとした。 Note that the general-purpose definition information 251 includes information regarding all items included in the form.

図7は、個社定義情報の一例を示す図である。本実施形態の個社定義情報252は、テナントの定義ID毎に登録されるものであり、情報の項目として、定義ID、項目ID、項目名、方向、距離等を含む。 FIG. 7 is a diagram showing an example of individual company definition information. The individual company definition information 252 of this embodiment is registered for each tenant definition ID, and includes definition ID, item ID, item name, direction, distance, etc. as information items.

また、個社定義情報252は、情報の項目として、発行元、電話番号、口座番号等を含む。項目「発行元」、「電話番号」、「口座番号」等は、帳票の発行元に関する項目である。 Further, the individual company definition information 252 includes the issuer, telephone number, account number, etc. as information items. The items "issuer", "telephone number", "account number", etc. are items related to the issuer of the form.

また、項目「発行元」、「電話番号」、「口座番号」と各項目の値とを含む情報は、帳票の発行元を特定するための、発行元の識別情報である。 Further, information including the items "issuer", "telephone number", "account number" and the values of each item is issuer identification information for specifying the issuer of the form.

項目「定義ID」、「項目ID」、「項目名」、「方向」、「距離等」は、汎用定義情報251と同様であるから説明を省略する。項目「発行元」の値は、帳票の発行元(テナント)を特定する情報である。帳票の発行元は、例えば、帳票が請求書である場合には、請求書の請求元と同義となる。項目「電話番号」、「口座番号」の値は、請求元の電話番号、口座番号を示す。 The items "definition ID", "item ID", "item name", "direction", "distance, etc." are the same as those in the general-purpose definition information 251, so their explanation will be omitted. The value of the item "issuer" is information that identifies the issuer (tenant) of the form. For example, when the form is a bill, the issuer of the form is synonymous with the billing source of the bill. The values of the items "telephone number" and "account number" indicate the billing party's telephone number and account number.

なお、本実施形態では、帳票の発行元を特定する情報として、発行元の名称を利用するものとしたが、これに限定されない。帳票の発行元を特定する情報は、例えば、テナント毎に、テナントを識別するテナント識別情報(テナントID)が付与されており、テナントIDを帳票の発行元を特定する情報として用いてもよい。 Note that in this embodiment, the name of the issuer is used as information for identifying the issuer of the form, but the present invention is not limited to this. The information for specifying the issuer of the form is, for example, provided with tenant identification information (tenant ID) for identifying the tenant for each tenant, and the tenant ID may be used as information for specifying the issuer of the form.

このように、本実施形態の個社定義情報252は、帳票の発行元の識別情報と対応付けられている。 In this way, the individual company definition information 252 of this embodiment is associated with the identification information of the issuer of the form.

なお、帳票の発行元の識別情報は、例えば、テナントIDと対応付けられて、テナントを管理するためのテナントデータベースに格納されていてもよい。この場合、個社定義情報252は、テナントIDと対応付けられていればよい。 Note that the identification information of the issuer of the form may be stored in a tenant database for managing the tenant, for example, in association with the tenant ID. In this case, the individual company definition information 252 only needs to be associated with the tenant ID.

図7に示す個社定義情報252は、発行元「R社」によって特定されるテナントにより登録された、定義ID「A01」、文書種別「R社用請求書」の個社定義情報の一例である(図4参照)。したがって、個社定義情報252は、「R社用請求書」のレイアウトを定義した情報であることがわかる。 The individual company definition information 252 shown in FIG. 7 is an example of the individual company definition information with the definition ID "A01" and the document type "Invoice for Company R" registered by the tenant specified by the issuer "Company R". Yes (see Figure 4). Therefore, it can be seen that the individual company definition information 252 is information that defines the layout of the "Invoice for Company R".

次に、図8を参照して、本実施形態のフォーマット管理データベース265について説明する。図8は、フォーマット情報データベースの一例を示す図である。 Next, with reference to FIG. 8, the format management database 265 of this embodiment will be explained. FIG. 8 is a diagram showing an example of a format information database.

本実施形態のフォーマット管理データベース265は、テナント毎に設けられるものであり、情報の項目として、発行元の識別情報と、フォーマット情報とを含む。フォーマット管理データベース265において、項目「発行元の識別情報」と項目「フォーマット情報」とは対応付けられている。以下の説明では、フォーマット管理データベース265において、項目「発行元の識別情報」の値と、項目「フォーマット情報」の値と、を含む情報を、フォーマット管理情報と表現する場合がある。 The format management database 265 of this embodiment is provided for each tenant, and includes issuer identification information and format information as information items. In the format management database 265, the item "Issuer identification information" and the item "Format information" are associated. In the following description, information including the value of the item "Issuer identification information" and the value of the item "Format information" in the format management database 265 may be expressed as format management information.

項目「発行元の識別情報」は、帳票の発行元に関する項目「発行元」、「電話番号」、「口座番号」を含む。項目「フォーマット情報」の値は、帳票のフォーマットを示す情報を示し、項目「最大矩形の幅」、「罫線の色」、「文字情報」等を含む。 The item "Issuer identification information" includes the items "Issuer", "Telephone number", and "Account number" regarding the issuer of the form. The value of the item "format information" indicates information indicating the format of the form, and includes the items "maximum rectangular width", "ruled line color", "character information", etc.

このように、本実施形態のフォーマット管理情報は、発行元毎の帳票のレイアウトを示す情報と言える。 In this way, the format management information of this embodiment can be said to be information indicating the layout of forms for each issuer.

なお、フォーマット情報は、発行元の識別情報が、テナントIDと対応付けられてテナントデータベース格納されている場合には、テナントIDと対応付けられていればよい。 In addition, if the identification information of the issuer is stored in the tenant database in association with the tenant ID, the format information only needs to be associated with the tenant ID.

次に、図9を参照して、本実施形態のサーバ装置200の機能について説明する。図9は、サーバ装置の機能を説明する図である。 Next, with reference to FIG. 9, the functions of the server device 200 of this embodiment will be described. FIG. 9 is a diagram illustrating the functions of the server device.

本実施形態のサーバ装置200では、例えば、RAM203やHD204等に格納された情報処理プログラムをCPU201が読み出して実行することで、後述する各部の機能が実現される。 In the server device 200 of this embodiment, the functions of each section described below are realized by the CPU 201 reading and executing an information processing program stored in the RAM 203, HD 204, etc., for example.

本実施形態のサーバ装置200は、帳票認識部220、帳票管理部290、通信部298を有する。帳票認識部220は、入力受付部221、認証処理部222、認識処理部270を有する。帳票管理部290は、操作受付部291、表示制御部292、情報更新部293を含む。 The server device 200 of this embodiment includes a form recognition section 220, a form management section 290, and a communication section 298. The form recognition section 220 includes an input reception section 221, an authentication processing section 222, and a recognition processing section 270. The form management section 290 includes an operation reception section 291, a display control section 292, and an information update section 293.

帳票認識部220において、入力受付部221は、サーバ装置200に対する各種の入力を受け付ける。具体的には、入力受付部221は、帳票認識システム100にログインするための認証情報の入力を受け付ける。認証情報とは、例えば、テナントIDとパスワード等である。また、入力受付部221は、例えば、画像形成装置300から送信された帳票画像データの入力を受け付ける。また、入力受付部221は、端末装置400から送信される各種の要求や通知を受け付ける。入力受付部221は、通信部298を介してサーバ装置200に対する入力を受け付けて良いし、サーバ装置200に対して直接行われた入力を受け付けても良い。 In the form recognition unit 220, the input reception unit 221 receives various inputs to the server device 200. Specifically, the input accepting unit 221 accepts input of authentication information for logging into the form recognition system 100. The authentication information is, for example, a tenant ID and password. Further, the input receiving unit 221 receives input of form image data transmitted from the image forming apparatus 300, for example. In addition, the input receiving unit 221 receives various requests and notifications transmitted from the terminal device 400. The input reception unit 221 may accept input to the server device 200 via the communication unit 298, or may accept input directly made to the server device 200.

認証処理部222は、入力受付部221が入力を受け付けた認証情報に基づき、認証を行う。なお、認証処理部222は、例えば、サーバ装置200の外部に設けられた認証サーバに対して、入力された認証情報を送信し、認証サーバによる認証の結果を取得しても良い。認証処理部222は、利用者が認証されると、入力受付部221が受け付けた帳票画像データを認識処理部270に渡しても良い。 The authentication processing unit 222 performs authentication based on the authentication information input by the input reception unit 221. Note that the authentication processing unit 222 may, for example, transmit the input authentication information to an authentication server provided outside the server device 200 and obtain the result of authentication by the authentication server. When the user is authenticated, the authentication processing section 222 may pass the form image data received by the input reception section 221 to the recognition processing section 270.

本実施形態の認識処理部270は、画像データ格納部271、ジョブリスト生成部272、画像データ取得部273、前処理部274、文字認識部275、定義特定部276、項目抽出部277、項目値決定部278、表示画面生成部279、出力部280を有する。 The recognition processing unit 270 of this embodiment includes an image data storage unit 271, a job list generation unit 272, an image data acquisition unit 273, a preprocessing unit 274, a character recognition unit 275, a definition identification unit 276, an item extraction unit 277, and an item value It includes a determining section 278, a display screen generating section 279, and an output section 280.

画像データ格納部271は、入力受付部221が、画像形成装置300から通信部298を介して帳票画像データを受信すると、帳票画像データベース230に格納する。 When the input reception unit 221 receives form image data from the image forming apparatus 300 via the communication unit 298, the image data storage unit 271 stores the form image data in the form image database 230.

ジョブリスト生成部272は、入力受付部221が、通信部298を介して画像形成装置300から帳票画像データの入力を受け付けると、ジョブリストにジョブを登録し、ジョブリストを管理する。ジョブリストの詳細は後述する。 When the input reception unit 221 receives input of form image data from the image forming apparatus 300 via the communication unit 298, the job list generation unit 272 registers the job in the job list and manages the job list. Details of the job list will be described later.

画像データ取得部273は、帳票画像データベース230に格納された帳票画像データを取得する。前処理部274は、画像データ取得部273が取得した帳票画像データに対して、帳票認識を行うための前処理を行う。 The image data acquisition unit 273 acquires form image data stored in the form image database 230. The preprocessing unit 274 performs preprocessing for performing form recognition on the form image data acquired by the image data acquisition unit 273.

文字認識部275は、帳票画像データから、文字列と、文字列が配置された位置を示す情報とを抽出し、読取結果データとして保持する。読取結果データの詳細は後述する。 The character recognition unit 275 extracts a character string and information indicating the position where the character string is placed from the form image data, and holds the extracted character string as reading result data. Details of the read result data will be described later.

定義特定部276は、読取結果データに含まれる文字列に基づき、帳票認識の際に参照する帳票定義情報を特定し、特定した帳票定義情報を帳票定義データベース250から取得する。 The definition specifying unit 276 specifies form definition information to be referred to during form recognition based on the character string included in the read result data, and acquires the specified form definition information from the form definition database 250.

項目抽出部277は、読取結果データと、定義特定部276によって特定された帳票定義情報とに基づき、帳票画像データに含まれる項目名と項目値とを抽出する。 The item extracting unit 277 extracts item names and item values included in the form image data based on the reading result data and the form definition information specified by the definition specifying unit 276.

項目値決定部278は、定義特定部276による帳票定義情報の特定の仕方に応じて、項目抽出部277により抽出された項目名と対応づける項目値を決定し、項目名と、決定した項目値とを対応付ける。より具体的には、項目値決定部278は、個社定義情報の特定の仕方に応じて、帳票の発行元の項目値を決定する。 The item value determining unit 278 determines the item value to be associated with the item name extracted by the item extracting unit 277 according to the method of specifying the form definition information by the definition specifying unit 276, and extracts the item name and the determined item value. Correlate with. More specifically, the item value determination unit 278 determines the item value of the issuer of the form depending on how the individual company definition information is specified.

また、項目値決定部278は、項目名と項目値とを対応付けた認識結果データを、認識結果データベース260に格納する。なお、本実施形態の認識結果データは、帳票に記載された帳票の発行元を示す情報(発行元情報)等を含む。 Furthermore, the item value determining unit 278 stores recognition result data in which item names and item values are associated with each other in the recognition result database 260. Note that the recognition result data of this embodiment includes information indicating the issuer of the form written on the form (publisher information).

表示画面生成部279は、認識結果データベース260に格納された認識結果データを用いて、認識結果の確認画面を生成する。 The display screen generation unit 279 uses the recognition result data stored in the recognition result database 260 to generate a recognition result confirmation screen.

出力部280は、表示画面生成部279が生成した認識結果の確認画面を、通信部298を介して出力する。言い換えれば、出力部280は、表示画面生成部279が生成した認識結果の確認画面を、通信部298を介して端末装置400のウェブブラウザ上で表示させる。 The output unit 280 outputs the recognition result confirmation screen generated by the display screen generation unit 279 via the communication unit 298. In other words, the output unit 280 displays the recognition result confirmation screen generated by the display screen generation unit 279 on the web browser of the terminal device 400 via the communication unit 298.

本実施形態の帳票管理部290は、操作受付部291、表示制御部292、情報更新部293を有する。 The form management section 290 of this embodiment includes an operation reception section 291, a display control section 292, and an information update section 293.

操作受付部291は、通信部298を介して、端末装置400のウェブブラウザ上に表示された画面に対して入力された操作を受け付ける。より具体的には、本実施形態では、通信部298が端末装置400から操作を示す情報を受信し、操作受付部291が、通信部298が受信した情報の入力を受け付ける。 The operation reception unit 291 receives, via the communication unit 298, an operation input on a screen displayed on the web browser of the terminal device 400. More specifically, in this embodiment, the communication unit 298 receives information indicating an operation from the terminal device 400, and the operation reception unit 291 receives input of the information received by the communication unit 298.

表示制御部292は、通信部298を介して、端末装置400に対する画面の表示を指示する。具体的には、表示制御部292は、認識結果データの確認画面や、個社定義情報を生成するための入力画面等を端末装置400に表示させる。また、表示制御部292は、画面を表示させるためのXML形式のファイルを生成し、通信部298を介して端末装置400のウェブブラウザ上に画面を表示させる。 The display control unit 292 instructs the terminal device 400 to display a screen via the communication unit 298. Specifically, the display control unit 292 causes the terminal device 400 to display a confirmation screen for recognition result data, an input screen for generating individual company definition information, and the like. Further, the display control unit 292 generates an XML format file for displaying a screen, and displays the screen on the web browser of the terminal device 400 via the communication unit 298.

なお、表示制御部292が画面を表示させる装置は、サーバ装置200であっても良いし、端末装置400以外の装置あっても良く、表示機能を有する表示装置であれば良い。 Note that the device on which the display control unit 292 displays the screen may be the server device 200 or a device other than the terminal device 400, and may be any display device that has a display function.

情報更新部293は、端末装置400から入力された情報に基づき、個社定義情報を生成して帳票定義データベース250へ格納する。 The information update unit 293 generates individual company definition information based on the information input from the terminal device 400 and stores it in the form definition database 250.

本実施形態の通信部298は、例えば、ネットワークI/F209等によって実現される機能であり、サーバ装置200と外部装置との間でデータの送受信を行う。具体的には、例えば、通信部298は、表示制御部292に制御に応じて、端末装置400に対して、画面の表示を指示する通知を送信する。 The communication unit 298 of this embodiment is a function realized by, for example, the network I/F 209, and transmits and receives data between the server device 200 and an external device. Specifically, for example, the communication unit 298 transmits a notification instructing the terminal device 400 to display the screen under the control of the display control unit 292.

次に、図10を参照して、本実施形態の端末装置400の機能について説明する。図10は、端末装置の機能を説明する図である。 Next, with reference to FIG. 10, the functions of the terminal device 400 of this embodiment will be described. FIG. 10 is a diagram illustrating the functions of the terminal device.

後述する各部の機能は、端末装置400の有するCPU401が、ROM402等に格納されたプログラムを読み出して実行することで実現される。 The functions of each section described below are realized by the CPU 401 of the terminal device 400 reading and executing a program stored in the ROM 402 or the like.

本実施形態の端末装置400は、入力受付部431、表示制御部432、通信部433を有する。 The terminal device 400 of this embodiment includes an input reception section 431, a display control section 432, and a communication section 433.

入力受付部431は、表示制御部432によって端末装置400のウェブブラウザ上に表示された画面に対する入力を受け付ける。具体的には、入力受付部431は、端末装置400のウェブブラウザ上に表示された、認識結果の確認画面に対し、認識結果を編集する操作を受け付ける。 The input receiving unit 431 receives input on the screen displayed on the web browser of the terminal device 400 by the display control unit 432. Specifically, the input receiving unit 431 receives an operation for editing the recognition result on the recognition result confirmation screen displayed on the web browser of the terminal device 400.

表示制御部432は、端末装置400のディスプレイ418の表示を制御する。具体的には、表示制御部432は、サーバ装置200からの指示に応じた画面をディスプレイ418(表示部)に表示させる。 The display control unit 432 controls the display on the display 418 of the terminal device 400. Specifically, the display control unit 432 causes the display 418 (display unit) to display a screen according to an instruction from the server device 200.

通信部433は、遠距離通信回路412、遠距離通信回路412のアンテナ412a等によって実現される機能であり、端末装置400と他の装置との間でデータの送受信を行う。 The communication unit 433 is a function realized by the long-distance communication circuit 412, the antenna 412a of the long-distance communication circuit 412, and the like, and transmits and receives data between the terminal device 400 and other devices.

以下に、図11を参照して、本実施形態の帳票認識システム100の動作について説明する。図11は、帳票認識システムの動作を説明するシーケンス図である。 The operation of the form recognition system 100 of this embodiment will be described below with reference to FIG. 11. FIG. 11 is a sequence diagram illustrating the operation of the form recognition system.

帳票認識システム100において、画像形成装置300は、利用者から帳票認識を行うためのアプリケーションの起動要求を受け付けると(ステップS1101)、このアプリケーションを起動させる(ステップS1102)。 In the form recognition system 100, when the image forming apparatus 300 receives a request from a user to start an application for performing form recognition (step S1101), it starts this application (step S1102).

続いて、画像形成装置300は、利用者から認証情報の入力を受け付けると(ステップS1103)、この認証情報をサーバ装置200へ送信し、認証要求を行う(ステップS1104)。 Subsequently, the image forming apparatus 300 receives the input of authentication information from the user (step S1103), and transmits this authentication information to the server apparatus 200 to issue an authentication request (step S1104).

サーバ装置200は、認証要求を受けて、認証処理部222により認証を行い、その結果を画像形成装置300へ通知する(ステップS1105)。なお、ここでは、利用者が認証された場合の動作を示している。 Upon receiving the authentication request, the server apparatus 200 performs authentication using the authentication processing unit 222, and notifies the image forming apparatus 300 of the result (step S1105). Note that here, the operation when the user is authenticated is shown.

続いて、画像形成装置300は、帳票のスキャン指示を受け付け(ステップS1106)、帳票のスキャンを行い、帳票画像データを取得する(ステップS1107)。続いて、画像形成装置300は、帳票画像データをサーバ装置200へ送信する(ステップS1108)。 Subsequently, the image forming apparatus 300 receives an instruction to scan the form (step S1106), scans the form, and obtains form image data (step S1107). Subsequently, the image forming apparatus 300 transmits the form image data to the server apparatus 200 (step S1108).

サーバ装置200は、入力受付部221が帳票画像データの入力を受け付けると、認証処理部222がこの帳票画像データを認識処理部270へ渡す(ステップS1109)。なお、図11の例では、認証処理部222を介して帳票画像データが認識処理部270へ渡されるものとしたが、これに限定されない。帳票画像データは、認証処理部222を介さずに認識処理部270に渡されても良い。 In the server device 200, when the input receiving unit 221 receives the input of form image data, the authentication processing unit 222 passes this form image data to the recognition processing unit 270 (step S1109). Note that in the example of FIG. 11, the form image data is passed to the recognition processing section 270 via the authentication processing section 222, but the present invention is not limited to this. The form image data may be passed to the recognition processing section 270 without going through the authentication processing section 222.

サーバ装置200の認識処理部270は、帳票画像データを受け取ると、ジョブリスト生成部272により、ジョブリストにジョブを登録する(ステップS1110)。続いて、認識処理部270は、画像データ格納部271により、帳票画像データを帳票画像データベース230へ格納する(ステップS1111)。 When the recognition processing unit 270 of the server device 200 receives the form image data, the job list generation unit 272 registers the job in the job list (step S1110). Subsequently, the recognition processing unit 270 causes the image data storage unit 271 to store the form image data in the form image database 230 (step S1111).

続いて、認識処理部270は、画像データ取得部273により、帳票画像データベース230から認識する対象となる帳票画像データを取得し(ステップS1112)、帳票画像を認識する処理(帳票認識)を実行する(ステップS1113)。ステップS1113の処理の詳細は後述する。 Next, the recognition processing unit 270 uses the image data acquisition unit 273 to acquire form image data to be recognized from the form image database 230 (step S1112), and executes processing to recognize the form image (form recognition). (Step S1113). Details of the process in step S1113 will be described later.

続いて、認識処理部270は、項目抽出部277が生成した認識結果データを認識結果データベース260に格納する(ステップS1114)。 Subsequently, the recognition processing unit 270 stores the recognition result data generated by the item extraction unit 277 in the recognition result database 260 (step S1114).

帳票認識システム100において、端末装置400は、入力受付部431により、利用者からのブラウザの表示指示の入力を受け付けると(ステップS1115)、通信部433を介して、サーバ装置200に対して認識結果データを表示させるブラウザの表示要求を行う(ステップS1116)。 In the form recognition system 100, when the terminal device 400 receives an input of a browser display instruction from the user through the input receiving unit 431 (step S1115), the terminal device 400 sends the recognition result to the server device 200 via the communication unit 433. A display request is made to the browser for displaying the data (step S1116).

また、端末装置400は、入力受付部431により、利用者から認証情報の入力を受け付けて(ステップS1117)、通信部433により、この認証情報をサーバ装置200へ送信する(ステップS1118)。 Furthermore, the terminal device 400 receives an input of authentication information from the user through the input reception unit 431 (step S1117), and transmits this authentication information to the server device 200 through the communication unit 433 (step S1118).

サーバ装置200は、認証処理部222により、利用者の認証を行い(ステップS1119)、その結果を端末装置400へ通知し、ジョブリストの一覧を端末装置400に表示させる(ステップS1120)。なお、ここでは、利用者が認証された場合の処理を示す。 The server device 200 authenticates the user using the authentication processing unit 222 (step S1119), notifies the terminal device 400 of the result, and causes the terminal device 400 to display a job list list (step S1120). Note that here, the processing when the user is authenticated is shown.

続いて、端末装置400は、入力受付部431により、ジョブリストの一覧からジョブの選択を受け付けると(ステップS1121)、この選択を、帳票画像の認識結果の閲覧指示として、通信部433により、サーバ装置200に対して閲覧要求を行う(ステップS1122)。 Next, when the terminal device 400 receives the selection of a job from the job list through the input reception unit 431 (step S1121), the communication unit 433 transmits the selection to the server as an instruction to view the recognition result of the form image. A viewing request is made to the device 200 (step S1122).

サーバ装置200は、閲覧要求を受けて、認識処理部270により、認識結果データベース260に格納されている認識結果データを取得し(ステップS1123)、認識結果の確認画面を生成して端末装置400のブラウザ上に表示させ(ステップS1124)、利用者に、表示された認識結果の確認画面で認識結果を確認させる。 In response to the viewing request, the server device 200 uses the recognition processing unit 270 to acquire the recognition result data stored in the recognition result database 260 (step S1123), generates a recognition result confirmation screen, and displays the recognition result data on the terminal device 400. The recognition result is displayed on the browser (step S1124), and the user is asked to confirm the recognition result on the displayed recognition result confirmation screen.

続いて、端末装置400は、入力受付部431により、個社定義情報の登録指示の入力を受け付けると(ステップS1125)、通信部433を介して、個社定義情報の登録要求をサーバ装置200へ送信する(ステップS1126)。この登録要求は、言い換えれば、個社定義情報を入力するための入力画面の表示要求である。 Subsequently, when the terminal device 400 receives an input of an instruction to register individual company definition information through the input reception unit 431 (step S1125), the terminal device 400 sends a registration request for individual company definition information to the server device 200 via the communication unit 433. Transmit (step S1126). In other words, this registration request is a request to display an input screen for inputting individual company definition information.

サーバ装置200は、入力受付部221により、この表示要求を受け付けると、帳票管理部290の表示制御部292により、端末装置400に個社定義情報の入力画面を表示させる(ステップS1127)。 When the input reception unit 221 receives this display request, the server device 200 causes the display control unit 292 of the form management unit 290 to display an input screen for individual company definition information on the terminal device 400 (step S1127).

続いて、端末装置400は、個社定義情報の入力を受け付けると(ステップS1128)、入力された情報をサーバ装置200へ送信する(ステップS1129)。サーバ装置200における帳票管理部290は、情報更新部293により、端末装置400から送信された情報に基づき、個社定義情報を生成し(ステップS1130)、帳票定義データベース250に格納して(ステップS1131)、処理を終了する。 Subsequently, when the terminal device 400 receives the input of the individual company definition information (step S1128), the terminal device 400 transmits the input information to the server device 200 (step S1129). The form management unit 290 in the server device 200 uses the information update unit 293 to generate individual company definition information based on the information transmitted from the terminal device 400 (step S1130), and stores it in the form definition database 250 (step S1131). ), the process ends.

ここで、図12を参照して、本実施形態のジョブリスト生成部272により生成されるジョブリストについて説明する。図12は、ジョブリストの一例を示す図である。 Here, with reference to FIG. 12, the job list generated by the job list generation unit 272 of this embodiment will be described. FIG. 12 is a diagram showing an example of a job list.

本実施形態のサーバ装置200は、画像形成装置300から帳票画像データが入力されると、ジョブリスト生成部272により、帳票画像データとジョブIDとを対応付けたジョブリストとして保持する。 When the server apparatus 200 of this embodiment receives form image data from the image forming apparatus 300, the job list generation unit 272 stores the form image data and job ID as a job list in association with each other.

本実施形態のジョブリスト101は、情報の項目として、ジョブID、発行元、帳票画像ファイルパス、認識結果ファイルパス、ステータス、定義ID等を有する。 The job list 101 of this embodiment has information items such as job ID, issuer, form image file path, recognition result file path, status, and definition ID.

項目「ジョブID」の値は、ジョブを特定する識別情報である。言い換えれば、項目「ジョブID」の値は、画像形成装置300から受信した帳票画像データを特定するための識別情報である。 The value of the item "Job ID" is identification information that identifies the job. In other words, the value of the item "job ID" is identification information for identifying the form image data received from the image forming apparatus 300.

項目「発行元」の値は、帳票認識システム100にログインした利用者を特定するための情報である。 The value of the item “issuer” is information for identifying the user who has logged in to the form recognition system 100.

項目「画像ファイルパス」の値は、帳票画像データが格納されている場所を示す情報である。項目「認識結果ファイルパス」の値は、帳票画像を認識した結果の認識結果データが格納されている場所を示す情報である。 The value of the item "image file path" is information indicating the location where the form image data is stored. The value of the item "recognition result file path" is information indicating the location where recognition result data resulting from recognition of a form image is stored.

項目「ステータス」の値は、帳票画像の認識の進捗を示す。言い換えれば、項目「ステータス」の値は、ジョブの状態を示す。 The value of the item "Status" indicates the progress of form image recognition. In other words, the value of the item "status" indicates the state of the job.

本実施形態では、項目「ステータス」の値として、未処理状態、下書き保存状態、確定済み状態、外部出力済み状態の4つがある。各状態は、以下の通りである。 In this embodiment, there are four values for the item "status": unprocessed state, draft saved state, confirmed state, and externally outputted state. Each state is as follows.

・未処理状態(状態1) 帳票認識によって認識結果データが取得された直後であり、認識結果の確認等が行われていない状態。 - Unprocessed state (state 1) A state in which recognition result data has just been acquired by form recognition, and the recognition results have not been confirmed.

・下書き保存状態(状態2) 認識結果データの確認等の作業の途中等であり、認識結果データが確定される前の状態。 ・Draft save state (state 2) A state in which work such as confirmation of recognition result data is in progress, and before recognition result data is finalized.

・確定済み状態(状態3) 認識結果データの確認等の作業が完了し、確定された情報として認識結果データベース260へ格納された状態。 - Confirmed state (state 3) A state in which work such as confirmation of recognition result data has been completed and it is stored in the recognition result database 260 as confirmed information.

・外部出力済み状態(状態4) 帳票認識システム100と連携する基幹システム500への認識結果データの出力が完了した状態。 - External output completed state (state 4) A state in which the output of recognition result data to the core system 500 that cooperates with the form recognition system 100 has been completed.

項目「定義ID」の値は、認識結果データの生成に用いられた帳票定義情報の定義IDを示す。言い換えれば、項目「定義ID」の値は、帳票認識に用いられた帳票定義情報を特定する識別情報である。 The value of the item "definition ID" indicates the definition ID of the form definition information used to generate the recognition result data. In other words, the value of the item "definition ID" is identification information that specifies the form definition information used for form recognition.

本実施形態のサーバ装置200は、画像形成装置300から帳票画像データを受信すると、ジョブリスト生成部272により、ジョブIDを付与し、認証情報として取得した発行元を対応付けて、ジョブリスト101にレコードを追加する。そして、ジョブリスト生成部272は、帳票画像データが帳票画像データベース230に格納されると、この格納先を示す情報を項目「画像ファイルパス」の値として、追加する。 When the server device 200 of this embodiment receives form image data from the image forming device 300, the job list generation unit 272 assigns a job ID, associates the issuer obtained as authentication information, and creates the job list 101. Add records. Then, when the form image data is stored in the form image database 230, the job list generation unit 272 adds information indicating the storage location as the value of the item "image file path".

さらに、ジョブリスト生成部272は、認識結果データが認識結果データベース260に格納されると、この格納先を示す情報を項目「認識結果ファイルパス」の値として追加し、項目「ステータス」の値を確定済み状態とする。 Furthermore, when the recognition result data is stored in the recognition result database 260, the job list generation unit 272 adds information indicating the storage location as the value of the item "recognition result file path" and changes the value of the item "status" to the value of the item "recognition result file path". Set to confirmed state.

本実施形態では、例えば、ジョブリスト生成部272によって生成されたジョブリストを表示しても良い。この場合、利用者は、ジョブリストに基づいて表示されたジョブリスト画面を介して、帳票画像の認識の進捗を確認することができる。 In this embodiment, for example, a job list generated by the job list generation unit 272 may be displayed. In this case, the user can check the progress of form image recognition via the job list screen displayed based on the job list.

次に、図13を参照して、本実施形態の認識処理部270の処理について説明する。図14は、帳票認識部の処理を説明する第一のフローチャートである。図13では、図11のステップS1113の処理の詳細を示している。また、図13では、複数の帳票画像データを画像形成装置300から受け取った場合の処理を示している。 Next, with reference to FIG. 13, the processing of the recognition processing section 270 of this embodiment will be described. FIG. 14 is a first flowchart illustrating the processing of the form recognition unit. FIG. 13 shows details of the process of step S1113 in FIG. 11. Further, FIG. 13 shows processing when a plurality of form image data is received from the image forming apparatus 300.

本実施形態の認識処理部270は、画像データ取得部273により、帳票画像データベース230から帳票画像データを取得すると(ステップS1301)、前処理部274により、帳票画像データの形式をpng形式に変換する(ステップS1302)。 In the recognition processing unit 270 of this embodiment, when the image data acquisition unit 273 acquires form image data from the form image database 230 (step S1301), the preprocessing unit 274 converts the format of the form image data into a PNG format. (Step S1302).

続いて、前処理部274は、1ページ分の帳票画像データを選択し(ステップS1303)、前処理を行う(ステップS1304)。前処理とは、具体的には、例えば、帳票画像の向きを揃える補正処理等である。 Next, the preprocessing unit 274 selects one page of form image data (step S1303) and performs preprocessing (step S1304). Specifically, the preprocessing is, for example, a correction process for aligning the orientation of the form image.

続いて、認識処理部270は、文字認識部275により、帳票画像から、文字が形成されている領域(以下、文字フィールド)を切り取る(ステップS1305)。続いて、認識処理部270は、文字認識部275により、切り取られた文字フィールドの中の文字を切り取り、文字認識する(ステップS1306)。このとき、文字認識部275は、切り出した文字の位置を示す座標も取得する。 Next, the recognition processing unit 270 uses the character recognition unit 275 to cut out an area where characters are formed (hereinafter referred to as a character field) from the form image (step S1305). Subsequently, the recognition processing unit 270 uses the character recognition unit 275 to cut out the characters in the cut out character field and perform character recognition (step S1306). At this time, the character recognition unit 275 also acquires the coordinates indicating the position of the extracted character.

続いて、認識処理部270は、文字認識部275により認識された各文字の位置関係に基づいて読取結果データを生成して、保持する(ステップS1307)。具体的に、認識処理部270は、認識された各文字の座標に基づいて、互いの距離が予め設定された閾値以内の文字を1つの文字列として認識し、文字列と、文字列が形成された領域の位置を示す座標などの情報とを対応付けて読取結果データを生成する。 Subsequently, the recognition processing unit 270 generates and holds reading result data based on the positional relationship of each character recognized by the character recognition unit 275 (step S1307). Specifically, based on the coordinates of each recognized character, the recognition processing unit 270 recognizes characters whose distance from each other is within a preset threshold as one character string, and forms a character string. The reading result data is generated by associating the data with information such as coordinates indicating the position of the area.

続いて、認識処理部270は、定義特定部276、項目抽出部277、項目値決定部278により、読取結果データから項目名と項目値とを抽出する(ステップS1308)。ステップS1308の処理の詳細は後述する。 Subsequently, the recognition processing unit 270 uses the definition specifying unit 276, the item extracting unit 277, and the item value determining unit 278 to extract the item name and item value from the reading result data (step S1308). Details of the process in step S1308 will be described later.

続いて、認識処理部270は、項目名と項目値との抽出に成功したか否かを判定する(ステップS1309)。具体的には、認識処理部270は、項目名と項目値とを対応付けたデータが一時的に保持されている場合に、項目名と項目値との抽出が成功したものと判定してもよい。 Subsequently, the recognition processing unit 270 determines whether or not the item name and item value have been successfully extracted (step S1309). Specifically, the recognition processing unit 270 determines that the extraction of the item name and item value has been successful when data that associates the item name and the item value is temporarily held. good.

ステップS1309において、項目名と項目値の抽出に失敗した場合、認識処理部270は、端末装置400又は画像形成装置300に対してエラーを通知し(ステップS1310)、後述するステップS1313へ進む。 If extraction of the item name and item value fails in step S1309, the recognition processing unit 270 notifies the terminal device 400 or the image forming apparatus 300 of the error (step S1310), and proceeds to step S1313, which will be described later.

ステップS1309において、項目名と項目値との抽出に成功すると、認識処理部270は、抽出された項目名と項目値とを対応付けてマージした認識結果データを生成する(ステップS1311)。 If the item name and item value are successfully extracted in step S1309, the recognition processing unit 270 generates recognition result data in which the extracted item name and item value are associated and merged (step S1311).

続いて、認識処理部270は、ジョブリスト生成部272により、認識結果データの生成に用いられた帳票定義情報の定義IDと、認識結果データの格納先とを、ジョブリスト101に登録する(ステップS1313)。 Next, the recognition processing unit 270 causes the job list generation unit 272 to register the definition ID of the form definition information used to generate the recognition result data and the storage location of the recognition result data in the job list 101 (step S1313).

続いて、認識処理部270は、最後のページまで処理を実行したか否かを判定する(ステップS1313)。ステップS1313において、最後のページまで処理を実行していない場合、認識処理部270は、ステップS1303へ戻る。 Subsequently, the recognition processing unit 270 determines whether the processing has been executed up to the last page (step S1313). In step S1313, if the process has not been executed up to the last page, the recognition processing unit 270 returns to step S1303.

ステップS1313において、最後のページまで処理を実行した場合、認識処理部270は、表示画面生成部279により、認識結果データを用いて生成された認識結果の確認画面を端末装置400に表示させ(ステップS1314)、処理を終了する。 In step S1313, when the process has been executed up to the last page, the recognition processing unit 270 causes the display screen generation unit 279 to display on the terminal device 400 a recognition result confirmation screen generated using the recognition result data (step S1314), the process ends.

なお、認識処理部270は、端末装置400から、認識結果データの閲覧要求を受け付けてから、認識結果データを表示させてもよい。 Note that the recognition processing unit 270 may display the recognition result data after receiving a request to view the recognition result data from the terminal device 400.

次に、図14を参照して、本実施形態の定義特定部276、項目抽出部277、項目値決定部278の処理について説明する。図14は、帳票認識部の処理を説明する第二のフローチャートである。図14は、図13のステップS1308の処理の詳細を示す。 Next, with reference to FIG. 14, the processing of the definition specifying unit 276, item extracting unit 277, and item value determining unit 278 of this embodiment will be described. FIG. 14 is a second flowchart illustrating the processing of the form recognition unit. FIG. 14 shows details of the process of step S1308 in FIG. 13.

本実施形態の認識処理部270は、定義特定部276により、文字認識の結果から、帳票定義データベース250に格納された個社定義情報のうち、帳票認識に用いる個社定義情報を特定する(ステップS1401)。 In the recognition processing unit 270 of this embodiment, the definition specifying unit 276 specifies individual company definition information to be used for form recognition from among the individual company definition information stored in the form definition database 250 from the result of character recognition (step S1401).

具体的には、定義特定部276は、帳票定義データベース250に格納された個社定義情報のうち、個社定義情報と対応付けられた発行元の識別情報の項目値の2つ以上が、読取結果データに含まれる文字列と完全に一致する個社定義情報を特定する。言い換えれば、定義特定部276は、読取結果データに含まれる文字列と、項目「発行元」、「電話番号」、「口座番号」の項目値のうち2つ以上の項目値とが、完全に一致する個社定義情報を特定する。 Specifically, the definition specifying unit 276 determines whether two or more item values of the issuer identification information associated with the individual company definition information among the individual company definition information stored in the form definition database 250 are readable. Identify individual company-defined information that completely matches the character string included in the result data. In other words, the definition specifying unit 276 makes sure that the character string included in the reading result data and the item values of two or more of the items "issuer", "telephone number", and "account number" are completely different from each other. Identify matching company definition information.

続いて、認識処理部270は、定義特定部276により、個社定義情報が特定されたか否かを判定する(ステップS1402)。ステップS1402において、個社定義情報が特定された場合、認識処理部270は、後述するステップS1408とステップS1410へ進む。このとき、認識処理部270は、文字認識の結果に基づき個社定義情報が特定されたことを示す情報を一時的に保持する。 Subsequently, the recognition processing unit 270 determines whether the definition identification unit 276 has identified individual company definition information (step S1402). If the individual company definition information is specified in step S1402, the recognition processing unit 270 proceeds to step S1408 and step S1410, which will be described later. At this time, the recognition processing unit 270 temporarily holds information indicating that the individual company definition information has been specified based on the result of character recognition.

ステップS1402において、個社定義情報が特定されない場合、認識処理部270は、定義特定部276により、帳票のフォーマットに基づいて個社定義情報を特定する(ステップS1403)。 If the individual company definition information is not specified in step S1402, the recognition processing unit 270 causes the definition identification unit 276 to specify the individual company definition information based on the format of the form (step S1403).

具体的には、定義特定部276は、フォーマット管理データベース265を参照し、最大矩形の幅、罫線の色が、読取結果データから得られる最大矩形の幅、罫線の色と一致し、且つ、文字の一致率が閾値以上となるフォーマット情報を特定する。次に、項目値決定部278は、特定されたフォーマット情報と対応する発行元の識別情報し、帳票定義データベース250を参照して、発行元の識別情報と対応付けられた個社定義情報を特定する。 Specifically, the definition specifying unit 276 refers to the format management database 265 and determines whether the width of the maximum rectangle and the color of the ruled line match the width of the maximum rectangle and the color of the ruled line obtained from the reading result data, and if the character The format information for which the matching rate of is equal to or higher than the threshold value is identified. Next, the item value determining unit 278 identifies the identification information of the issuer that corresponds to the specified format information, and refers to the form definition database 250 to identify the individual company definition information that is associated with the identification information of the issuer. do.

続いて、認識処理部270は、個社定義情報が特定されたか否かを判定する(ステップS1404)。ステップS1404において、個社定義情報が特定された場合、認識処理部270は、後述するステップS1408とステップS1410へ進む。このとき、認識処理部270は、帳票のフォーマットに基づき個社定義情報が特定されたことを示す情報を一時的に保持する。 Subsequently, the recognition processing unit 270 determines whether individual company definition information has been identified (step S1404). If the individual company definition information is specified in step S1404, the recognition processing unit 270 proceeds to step S1408 and step S1410, which will be described later. At this time, the recognition processing unit 270 temporarily holds information indicating that the individual company definition information has been specified based on the format of the form.

ステップS1404において、個社定義情報が特定されない場合、認識処理部270は、定義特定部276により、帳票定義データベース250を参照して、汎用定義情報を取得する(ステップS1405)。 If the individual company definition information is not specified in step S1404, the recognition processing unit 270 uses the definition identification unit 276 to refer to the form definition database 250 and obtains general definition information (step S1405).

具体的には、定義特定部276は、読取結果データに含まれる文字列から、帳票の文書種別を判定し、判定された文書種別と対応した汎用定義情報を帳票定義データベース250から取得する。 Specifically, the definition specifying unit 276 determines the document type of the form from the character string included in the read result data, and acquires general-purpose definition information corresponding to the determined document type from the form definition database 250.

なお、ステップS1402及びステップS1404において、個社定義情報が特定されない場合とは、対応する個社定義情報が作成されておらず、帳票定義データベース250に対応する個社定義情報が格納されていないことを示す。 Note that the case where the individual company definition information is not specified in step S1402 and step S1404 means that the corresponding individual company definition information has not been created and the corresponding individual company definition information is not stored in the form definition database 250. shows.

続いて、認識処理部270は、項目抽出部277により、ステップS1405で取得された汎用定義情報を用いて、項目名と項目値とを抽出する(ステップS1406)。続いて、認識処理部270は、抽出した項目値と項目名とを対応付けたデータを保持し(ステップS1407)、処理を終了する。 Subsequently, the recognition processing unit 270 causes the item extraction unit 277 to extract the item name and item value using the general-purpose definition information acquired in step S1405 (step S1406). Subsequently, the recognition processing unit 270 retains data in which the extracted item values and item names are associated with each other (step S1407), and ends the process.

ステップS1402又はステップS1404において、個社定義情報が特定された場合、認識処理部270は、定義特定部276により、特定された個社定義情報を帳票定義データベース250から取得する(ステップS1408)。続いて、認識処理部270は、項目抽出部277により、取得した個社定義情報を用いて、項目名「発行元」の項目値を抽出し(ステップS1409)、後述するステップS1412へ進む。 When the individual company definition information is specified in step S1402 or step S1404, the recognition processing unit 270 uses the definition specifying unit 276 to acquire the specified individual company definition information from the form definition database 250 (step S1408). Next, in the recognition processing unit 270, the item extraction unit 277 extracts the item value of the item name "Issuer" using the acquired individual company definition information (step S1409), and proceeds to step S1412, which will be described later.

また、認識処理部270は、定義特定部276により、汎用定義情報を特定し、帳票定義データベース250から取得する(ステップS1410)。続いて、認識処理部270は、項目抽出部277により、取得した汎用定義情報を用いて、項目名「発行元」の項目値を抽出し(ステップS1411)、後述するステップS1412へ進む。 Furthermore, the recognition processing unit 270 uses the definition specifying unit 276 to specify general-purpose definition information and acquires it from the form definition database 250 (step S1410). Next, in the recognition processing unit 270, the item extraction unit 277 extracts the item value of the item name "publisher" using the acquired general-purpose definition information (step S1411), and proceeds to step S1412, which will be described later.

続いて、認識処理部270は、項目値決定部278により、個社定義情報が、帳票のフォーマットに基づき特定されたものであるか否かを判定する(ステップS1412)。言い換えれば、項目値決定部278は、認識処理部270が、帳票のフォーマットに基づき個社定義情報が特定されたことを示す情報を保持しているか否かを判定する。 Subsequently, the recognition processing unit 270 determines, by the item value determination unit 278, whether the individual company definition information is specified based on the format of the form (step S1412). In other words, the item value determination unit 278 determines whether the recognition processing unit 270 holds information indicating that the individual company definition information has been specified based on the format of the form.

ステップS1412において、個社定義情報がフォーマットに基づき特定されていない場合、項目値決定部278は、項目名「発行元」の項目値を、ステップS1409で抽出した項目値に決定し、その他の項目名の項目値を、個社定義情報を用いて抽出する。そして、項目値決定部278は、項目名と項目値とを対応付けたデータを保持し(ステップS1413)、処理を終了する。 In step S1412, if the individual company definition information is not specified based on the format, the item value determining unit 278 determines the item value of the item name "Publisher" to be the item value extracted in step S1409, and other items Extract the item value of the name using the individual company definition information. The item value determining unit 278 then holds data that associates item names and item values (step S1413), and ends the process.

なお、ステップS1412において、個社定義情報がフォーマットに基づき特定されていない場合とは、個社定義情報が文字認識の結果に基づき特定された場合である。 Note that in step S1412, the case where the individual company definition information is not specified based on the format is the case where the individual company definition information is specified based on the result of character recognition.

ステップS1412において、個社定義情報がフォーマットに基づき特定された場合、認識処理部270は、項目値決定部278により、個社定義情報を用いて抽出された発行元が、法人名辞書データベース267に登録されているか否かを判定する(ステップS1414)。 In step S1412, if the individual company definition information is specified based on the format, the recognition processing unit 270 causes the item value determination unit 278 to add the publisher extracted using the individual company definition information to the corporate name dictionary database 267. It is determined whether it is registered (step S1414).

具体的には、項目値決定部278は、ステップS1409で抽出された発行元の名称と一致する法人名が、法人名辞書データベース267に格納されているか否かを判定する。 Specifically, the item value determining unit 278 determines whether a corporate name that matches the name of the issuer extracted in step S1409 is stored in the corporate name dictionary database 267.

ステップS1414において、個社定義情報を用いて抽出された発行元が、法人名辞書データベース267に格納されている場合、認識処理部270は、ステップS1413へ進む。 In step S1414, if the issuer extracted using the individual company definition information is stored in the corporate name dictionary database 267, the recognition processing unit 270 proceeds to step S1413.

個社定義情報を用いて抽出された発行元が、法人名辞書データベース267に格納されている場合、ステップS1408において特定された個社定義情報の信頼性が比較的高いことを示す。したがって、本実施形態では、この場合には、個社定義情報は、フォーマットに基づき特定されたものであるが、帳票認識に用いる際に、十分な信頼性が担保されているものとし、この個社定義情報を用いて他の項目名の項目値を抽出する。 If the issuer extracted using the individual company definition information is stored in the corporate name dictionary database 267, this indicates that the reliability of the individual company definition information identified in step S1408 is relatively high. Therefore, in this embodiment, although the individual company definition information is specified based on the format in this case, it is assumed that sufficient reliability is ensured when used for form recognition, and this individual company definition information is specified based on the format. Extract item values for other item names using company-defined information.

また、ステップS1414において、個社定義情報を用いて抽出された発行元が、法人名辞書データベース267に格納されていない場合、項目値決定部278は、項目名「発行元」の項目値を、汎用定義情報を用いて抽出した項目値に決定し、その他の項目名の項目値は、個社定義情報を用いて抽出した項目値とする。そして、項目値決定部278は、項目名と項目値とを対応付けたデータを一時的に保持し(ステップS1415)、処理を終了する。 Further, in step S1414, if the publisher extracted using the individual company definition information is not stored in the corporate name dictionary database 267, the item value determination unit 278 sets the item value of the item name "Publisher" to The item values extracted using the general-purpose definition information are determined, and the item values of other item names are determined to be the item values extracted using the individual company definition information. Then, the item value determination unit 278 temporarily holds data in which the item name and the item value are associated with each other (step S1415), and ends the process.

このように、本実施形態では、帳票認識に用いる個社定義情報が、文字認識の結果に基づき特定された場合には、項目名「発行元」の項目値を、個社定義情報に基づき抽出された項目値に決定する。また、本実施形態では、帳票認識の際に用いる個社定義情報が、フォーマットに基づき特定され、且つ、個社定義情報を用いて抽出された項目名「発行元」の項目値が、法人名辞書データベース267に格納されている場合は、項目名「発行元」の項目値を、個社定義情報に基づき抽出された項目値に決定する。 In this way, in this embodiment, when the individual company-defined information used for form recognition is specified based on the result of character recognition, the item value of the item name "Issuer" is extracted based on the individual company-defined information. The item value is determined. In addition, in this embodiment, the individual company definition information used for form recognition is specified based on the format, and the item value of the item name "Issuer" extracted using the individual company definition information is the corporate name. If it is stored in the dictionary database 267, the item value of the item name "Publisher" is determined to be the item value extracted based on the individual company definition information.

さらに、本実施形態では、帳票認識の際に用いる個社定義情報が、フォーマットに基づき特定され、且つ、個社定義情報を用いて抽出された項目名「発行元」の項目値が、法人名辞書データベース267に格納されていない場合は、項目名「発行元」の項目値を、汎用定義情報に基づき抽出された項目値に決定する。 Furthermore, in this embodiment, the individual company definition information used for form recognition is specified based on the format, and the item value of the item name "Issuer" extracted using the individual company definition information is the corporate name. If it is not stored in the dictionary database 267, the item value of the item name "Publisher" is determined to be the item value extracted based on the general-purpose definition information.

つまり、本実施形態では、特定された個社定義情報に、帳票認識に用いる際にあたり、十分な信頼性が担保されていると推定される場合に、この個社定義情報を用いて全ての項目名と項目値を抽出し、認識結果データとする。 In other words, in this embodiment, when it is estimated that the specified individual company definition information has sufficient reliability when used for form recognition, this individual company definition information is used to identify all items. The name and item value are extracted and used as recognition result data.

また、本実施形態では、特定された個社定義情報よりも、汎用定義情報の方が信頼性が高いと推定される場合には、項目「発行元」の項目値を、汎用定義情報を用いて抽出した項目値に決定する。なお、この場合、他の項目名の項目値は、汎用定義情報よりも優先度が高い個社定義情報を用いて抽出される。 In addition, in this embodiment, if the general-purpose definition information is estimated to be more reliable than the specified individual company-defined information, the item value of the item "Publisher" is changed using the general-purpose definition information. The item value is determined based on the extracted item value. Note that in this case, item values of other item names are extracted using individual company definition information that has a higher priority than general definition information.

このように、本実施形態によれば、帳票認識を行う際の個社定義情報の特定の仕方に起因した、帳票の誤認識の発生を抑制でき、帳票認識の精度を向上させることができる。 As described above, according to the present embodiment, it is possible to suppress the occurrence of misrecognition of a form due to the way in which individual company definition information is specified when performing form recognition, and it is possible to improve the accuracy of form recognition.

次に、図15を参照して、帳票管理部290による管理情報の登録について説明する。図15は、帳票管理部の処理を説明するフローチャートである。図15では、図11のステップS1121からステップS1131までの処理の詳細を示す。 Next, with reference to FIG. 15, registration of management information by the form management section 290 will be described. FIG. 15 is a flowchart illustrating the processing of the form management section. FIG. 15 shows details of the processing from step S1121 to step S1131 in FIG. 11.

本実施形態の帳票管理部290は、操作受付部291により、端末装置400からの認識結果データの閲覧指示を受け付けると、表示制御部292により、認識結果データの確認画面を端末装置400に表示させる(ステップS1501)。 When the operation reception unit 291 receives an instruction to view recognition result data from the terminal device 400, the form management unit 290 of the present embodiment causes the display control unit 292 to display a recognition result data confirmation screen on the terminal device 400. (Step S1501).

続いて、帳票管理部290は、操作受付部291により、端末装置400からの認識結果データの登録要求を受け付けたか否かを判定する(ステップS1502)。具体的には、サーバ装置200は、認識結果データベース260に対する、確認画面に表示された認識結果データの格納が指示されたか否かを判定している。 Subsequently, the form management unit 290 determines whether the operation reception unit 291 has received a registration request for recognition result data from the terminal device 400 (step S1502). Specifically, the server device 200 determines whether an instruction has been given to store the recognition result data displayed on the confirmation screen in the recognition result database 260.

ステップS1502において、登録要求を受け付けない場合、帳票管理部290は、後述するステップS1507へ進む。 In step S1502, if the registration request is not accepted, the form management unit 290 proceeds to step S1507, which will be described later.

ステップS1502において、登録要求を受け付けた場合、帳票管理部290は、認識結果データに対して修正が行われたか否かを判定する(ステップS1503)。 If the registration request is received in step S1502, the form management unit 290 determines whether or not the recognition result data has been modified (step S1503).

ステップS1503において、修正が行われていない場合、帳票管理部290は、処理を終了する。 In step S1503, if no correction has been made, the form management unit 290 ends the process.

ステップS1503において、修正が行われていた場合、帳票管理部290は、この認識結果データを生成する際に、個社定義情報252が参照されているか否かを判定する(ステップS1504)。具体的には、帳票管理部290は、読取結果データに含まれる発行元と対応付けられた個社定義情報252が存在するか否かを判定している。 If a modification has been made in step S1503, the form management unit 290 determines whether the individual company definition information 252 is referred to when generating this recognition result data (step S1504). Specifically, the form management unit 290 determines whether or not there is individual company definition information 252 associated with the issuer included in the read result data.

ステップS1504において、個社定義情報が参照されていない場合、帳票管理部290は、後述するステップS1508へ進む。 In step S1504, if the individual company definition information is not referenced, the form management unit 290 proceeds to step S1508, which will be described later.

ステップS1504において、個社定義情報が参照されている場合、帳票管理部290は、修正された箇所が発行元であるか否かを判定する(ステップS1505)。 If the individual company definition information is referenced in step S1504, the form management unit 290 determines whether the revised location is the issuer (step S1505).

ステップS1505において、修正された箇所が発行元でない場合、帳票管理部290は、情報更新部293により、個社定義情報を修正内容に合わせて更新し(ステップS1506)、処理を終了する。修正された箇所が発行元でない場合とは、例えば、認識結果データにおける明細部の修正が行われた場合等である。 In step S1505, if the revised part is not the issuer, the form management unit 290 causes the information update unit 293 to update the individual company definition information according to the revised content (step S1506), and ends the process. The case where the corrected part is not the issuer is, for example, a case where the details part in the recognition result data is corrected.

なお、本実施形態では、帳票管理部290による処理が終了した後に、認識結果データの登録を行ってもよい。具体的には、帳票管理部290は、図15の処理が終了した後に、認識結果データを認識結果データベース260に格納してもよい。 Note that in this embodiment, the recognition result data may be registered after the processing by the form management unit 290 is completed. Specifically, the form management unit 290 may store the recognition result data in the recognition result database 260 after the process of FIG. 15 is completed.

ステップS1505において、修正された箇所が発行元である場合、帳票管理部290は、表示制御部292により、発行元の識別情報の入力画面を端末装置400に表示させる(ステップS1507)。 In step S1505, if the corrected part is the issuer, the form management unit 290 causes the display control unit 292 to display an input screen for the identification information of the issuer on the terminal device 400 (step S1507).

続いて、帳票管理部290は、操作受付部291により、端末装置400に表示された入力画面に対する情報の入力を受け付ける(ステップS1508)。 Subsequently, the form management unit 290 receives input of information on the input screen displayed on the terminal device 400 through the operation reception unit 291 (step S1508).

続いて、帳票管理部290は、情報更新部293により、フォーマット管理データベース265における発行元の識別情報及び帳票定義データベース250の個社定義情報252と対応付けられた発行元の識別情報とを更新(上書き)し(ステップS1509)、処理を終了する。 Subsequently, the form management unit 290 causes the information update unit 293 to update the identification information of the issuer in the format management database 265 and the identification information of the issuer associated with the individual company definition information 252 in the form definition database 250 ( overwrite) (step S1509), and the process ends.

ステップS1502において、認識結果の登録要求を受け付けない場合、帳票管理部290は、操作受付部291により、帳票定義の登録指示を受け付けたか否かを判定する(ステップS1510)。 If the recognition result registration request is not accepted in step S1502, the form management unit 290 determines whether the operation reception unit 291 has received a form definition registration instruction (step S1510).

ステップS1510において、帳票定義の登録指示を受け付けない場合、帳票管理部290は、ステップS1501へ戻る。 In step S1510, if the instruction to register the form definition is not accepted, the form management unit 290 returns to step S1501.

ステップS1501において、帳票定義の登録指示を受け付けた場合、帳票管理部290は、表示制御部292により、個社定義情報252の入力画面を端末装置400に表示させる(ステップS1511)。 In step S1501, when an instruction to register a form definition is received, the form management unit 290 causes the display control unit 292 to display an input screen for the individual company definition information 252 on the terminal device 400 (step S1511).

続いて、帳票管理部290は、操作受付部291により、入力画面に対する個社定義情報の入力を受け付ける(ステップS1512)。 Subsequently, the form management unit 290 receives input of individual company definition information on the input screen through the operation reception unit 291 (step S1512).

続いて、帳票管理部290は、情報更新部293により、帳票定義データベース250に、入力された個社定義情報252を格納して(ステップS1513)、処理を終了する。 Subsequently, the form management section 290 causes the information update section 293 to store the input company definition information 252 in the form definition database 250 (step S1513), and ends the process.

本実施形態では、以上の処理により、新たに作成した個社定義情報を帳票定義データベース250に格納したり、発行元の識別情報の修正を行うことができる。 In this embodiment, through the above-described processing, newly created individual company definition information can be stored in the form definition database 250, and issuer identification information can be corrected.

次に、図16及び図17を参照して、本実施形態の効果について説明する。図16は、本実施形態の効果を説明する第一の図である。 Next, the effects of this embodiment will be described with reference to FIGS. 16 and 17. FIG. 16 is a first diagram illustrating the effects of this embodiment.

図16では、本実施形態が適用されておらず、帳票のフォーマットに基づいて特定された個社定義情報を用いて帳票認識を行った場合の認識結果の確認画面の一例を示す。 FIG. 16 shows an example of a recognition result confirmation screen when the present embodiment is not applied and form recognition is performed using individual company definition information specified based on the form format.

図16に示す画面501は、端末装置400に表示される認識結果の確認画面の一例である。 A screen 501 shown in FIG. 16 is an example of a recognition result confirmation screen displayed on the terminal device 400.

画面501は、表示欄502、表示欄503と、表示部品508、509とを含む。表示欄502には、帳票画像データが示す帳票画像が表示される。図16の例では、帳票が請求書であり、帳票画像における明細部を示す領域504が含まれる。 Screen 501 includes display field 502, display field 503, and display components 508 and 509. In the display field 502, a form image indicated by the form image data is displayed. In the example of FIG. 16, the form is an invoice, and includes an area 504 indicating a detailed part in the form image.

表示欄502に表示される帳票画像では、左上に、請求書No、締日、請求書合計金額、等が配置されており。右上に、請求元(発行元)を示す領域502aが配置されている。また、表示欄502では、帳票画像における明細部は、表形式で表される。 In the form image displayed in the display field 502, the invoice number, closing date, total invoice amount, etc. are arranged in the upper left. An area 502a indicating the billing source (issuer) is arranged at the upper right. Further, in the display field 502, the detailed portion of the form image is displayed in a table format.

表示欄503は、表示欄502に表示された帳票画像を示す帳票画像データに対して帳票認識部220による帳票認識を行った結果の認識結果データが表示される。 The display column 503 displays recognition result data as a result of the document recognition unit 220 performing document recognition on the document image data indicating the document image displayed in the display column 502.

表示欄503は、表示欄505、506、507を含む。表示欄505は、ジョブリスト101の項目「ステータス」の値が表示される。表示欄506は、請求元を含む請求元情報が表示される。請求元情報は、認識結果データの一部である。 Display field 503 includes display fields 505, 506, and 507. In the display column 505, the value of the item "Status" of the job list 101 is displayed. In the display column 506, billing source information including the billing source is displayed. The billing source information is part of the recognition result data.

表示欄507は、明細情報が表示される。具体的には、表示欄507には、明細情報に含まれる項目値の一覧が表示される。表示欄507は、表示欄511、512、513、514、515、516を含む。 In the display column 507, detailed information is displayed. Specifically, the display field 507 displays a list of item values included in the detailed information. Display field 507 includes display fields 511, 512, 513, 514, 515, and 516.

表示欄511は、帳票画像における明細部を示す領域504に表示された、項目名「品名」の項目値が表示される。表示欄512は、領域504に表示された、項目名「商品コード」の項目値が表示される。表示欄513は、領域504に表示された、項目名「商品金額」の項目値が表示される。 In the display column 511, the item value of the item name "product name" displayed in the area 504 indicating the detailed part in the form image is displayed. In the display column 512, the item value of the item name "product code" displayed in the area 504 is displayed. In the display field 513, the item value of the item name "Product Price" displayed in the area 504 is displayed.

表示欄514は、領域504に表示された、項目名「単価」の項目値が表示される。表示欄515は、領域504に表示された、項目名「数量」の項目値が表示される。表示欄516は、領域504に表示された、項目名「注文番号」の項目値が表示される。 In the display field 514, the item value of the item name "unit price" displayed in the area 504 is displayed. In the display field 515, the item value of the item name "Quantity" displayed in the area 504 is displayed. In the display field 516, the item value of the item name "Order Number" displayed in the area 504 is displayed.

画面501では、このように、帳票画像の明細部における項目名のそれぞれに対応する項目値を抽出して、表示欄511、512、513、514、515、516に表示する。 In this way, on the screen 501, item values corresponding to each item name in the details part of the form image are extracted and displayed in display columns 511, 512, 513, 514, 515, and 516.

表示部品508は、ジョブリスト101のステータスの値を、未処理状態から下書き保存状態とするための表示部品である。表示部品508が操作されると、表示欄505は、「未処理」から「下書き保存」に変化する。 A display component 508 is a display component for changing the status value of the job list 101 from an unprocessed state to a draft saved state. When the display component 508 is operated, the display field 505 changes from "unprocessed" to "save draft".

表示部品509は、ジョブリスト101のステータスの値を、確定済み状態とするための表示部品である。画面501では、表示部品509が操作されると、ジョブリスト101のステータスの値が、確定済み状態となる。 A display component 509 is a display component for setting the status value of the job list 101 to a confirmed state. On the screen 501, when the display component 509 is operated, the status value of the job list 101 becomes a confirmed state.

ここで、図16に示す請求元について説明する。図16に示す画面501の表示欄506は、表示欄506aを含む。 Here, the billing source shown in FIG. 16 will be explained. The display field 506 of the screen 501 shown in FIG. 16 includes a display field 506a.

表示欄506aは、表示欄502に表示された帳票画像のフォーマットに基づき特定された個社定義情報を用いて抽出された項目「請求元」の項目値が表示される。 The display field 506a displays the item value of the item "billing source" extracted using the individual company definition information specified based on the format of the form image displayed in the display field 502.

表示欄506aでは、請求元の項目値として、「A株式会社」が表示されている。これに対し、表示欄502に表示された帳票画像おける請求元を示す領域502aには、「R株式会社」と表示されており、両者が一致しない。 In the display field 506a, "A Corporation" is displayed as the item value of the billing party. On the other hand, in the area 502a indicating the billing source in the form image displayed in the display field 502, "R Corporation" is displayed, and the two do not match.

このことから、図16の例では、帳票認識において、請求元の項目値が誤認識された状態となる。 For this reason, in the example of FIG. 16, the billing source's item value is incorrectly recognized during form recognition.

この誤認識は、請求元「A株式会社」と対応するフォーマット情報が示すフォーマットが、表示欄502に表示された帳票画像のフォーマットと類似していることに起因する。 This misrecognition is due to the fact that the format indicated by the format information corresponding to the billing party "A Corporation" is similar to the format of the form image displayed in the display field 502.

言い換えれば、図16は、表示欄502に表示された帳票画像のフォーマットから請求元「A株式会社」が特定され、請求元「A株式会社」と対応する個社定義情報を用いた帳票認識が行われた結果として、請求元が誤認識された例である。 In other words, in FIG. 16, the billing party "A Corporation" is identified from the format of the form image displayed in the display field 502, and the bill is recognized using the individual company definition information corresponding to the billing party "A Corporation". This is an example in which the billing party was misrecognized as a result of this.

これに対し、図17を参照して、本実施形態を適用した場合について説明する。図17は、本実施形態の効果を説明する第二の図である。 In contrast, a case where this embodiment is applied will be described with reference to FIG. 17. FIG. 17 is a second diagram illustrating the effects of this embodiment.

図17の例においても、表示欄502に表示された帳票画像のフォーマットに基づき、発行元が「A株式会社」の個社定義情報が特定されたとする。 In the example of FIG. 17 as well, it is assumed that the individual company definition information of the issuer "A Corporation" is specified based on the format of the form image displayed in the display field 502.

この場合、本実施形態では、個社定義情報がフォーマットに基づき特定されたため、個社定義情報を用いて抽出した項目名「請求元」の項目値「A株式会社」が、法人名辞書データベース267に格納されているか否かを判定する。 In this case, in this embodiment, since the individual company definition information is specified based on the format, the item value "A Corporation" of the item name "Billing source" extracted using the individual company definition information is Determine whether it is stored in .

ここでは、法人名辞書データベース267に、項目値「A株式会社」が格納されていなかったとする。その場合、本実施形態では、個社定義情報と共に帳票定義データベース250から取得した汎用定義情報を用いて、帳票画像データから項目名「請求元」の項目値を抽出し、項目名「請求元」と対応付けて認識結果データとする。 Here, it is assumed that the item value "A Corporation" is not stored in the corporate name dictionary database 267. In that case, in this embodiment, the item value of the item name "Billing source" is extracted from the form image data using the general definition information acquired from the form definition database 250 together with the individual company definition information, and the item value of the item name "Billing source" is extracted from the form image data. This is associated with the recognition result data.

その結果、画面501Aの表示欄506bには、汎用定義情報を用いて抽出された項目値「R株式会社」が、項目名「請求元」と対応付けられて表示される。 As a result, the item value "R Corporation" extracted using the general-purpose definition information is displayed in the display field 506b of the screen 501A in association with the item name "Billing source."

本実施形態では、このように、帳票認識に用いる個社定義情報の特定の仕方に応じて、帳票の発行元の項目値を決定するため、個社定義情報の特定の仕方に起因する帳票の誤認識の発生を抑制できる。 In this embodiment, in this way, the item value of the issuer of a form is determined according to the method of specifying the individual company-defined information used for form recognition. The occurrence of misrecognition can be suppressed.

上記で説明した実施形態の各機能は、一又は複数の処理回路によって実現することが可能である。ここで、本明細書における「処理回路」とは、電子回路により実装されるプロセッサのようにソフトウェアによって各機能を実行するようプログラミングされたプロセッサや、上記で説明した各機能を実行するよう設計されたASIC(Application Specific Integrated Circuit)、DSP(digital signal processor)、FPGA(field programmable gate array)や従来の回路モジュール等のデバイスを含むものとする。 Each function of the embodiments described above can be realized by one or more processing circuits. Here, the term "processing circuit" as used herein refers to a processor programmed to execute each function by software, such as a processor implemented by an electronic circuit, or a processor designed to execute each function explained above. This includes devices such as ASICs (Application Specific Integrated Circuits), DSPs (digital signal processors), FPGAs (field programmable gate arrays), and conventional circuit modules.

また、実施形態に記載された装置群は、本明細書に開示された実施形態を実施するための複数のコンピューティング環境のうちの1つを示すものにすぎない。 Additionally, the devices described in the embodiments are merely illustrative of one of a plurality of computing environments for implementing the embodiments disclosed herein.

ある実施形態では、サーバ装置200は、サーバクラスタといった複数のコンピューティングデバイスを含む。複数のコンピューティングデバイスは、ネットワークや共有メモリなどを含む任意のタイプの通信リンクを介して互いに通信するように構成されており、本明細書に開示された処理を実施する。同様に、サーバ装置200は、互いに通信するように構成された複数のコンピューティングデバイスを含むことができる。 In some embodiments, server apparatus 200 includes multiple computing devices, such as a server cluster. The plurality of computing devices are configured to communicate with each other via any type of communication link, including a network, shared memory, etc., to perform the processes disclosed herein. Similarly, server apparatus 200 may include multiple computing devices configured to communicate with each other.

さらに、サーバ装置200は、開示された処理ステップを様々な組み合わせで共有するように構成できる。例えば、サーバ装置200によって実行されるプロセスは、他のサーバ装置によって実行され得る。同様に、サーバ装置200の機能は、他のサーバ装置によって実行することができる。また、サーバ装置と他のサーバ装置の各要素は、1つのサーバ装置にまとめられていても良いし、複数の装置に分けられていても良い。 Further, the server device 200 can be configured to share the disclosed processing steps in various combinations. For example, processes executed by server device 200 may be executed by other server devices. Similarly, the functions of server device 200 can be performed by other server devices. Further, each element of the server device and other server devices may be combined into one server device, or may be divided into a plurality of devices.

また、明細書中のデータベースは、機械学習の学習効果によって生成されたものでもよい。また、取引内容の記載に含まれうるキーワードと勘定項目とを機械学習にて分類付けすることで、対応テーブルを使用しなくてもよい。 Moreover, the database in the specification may be generated by the learning effect of machine learning. Furthermore, by using machine learning to classify keywords and account items that may be included in transaction descriptions, there is no need to use a correspondence table.

ここで、機械学習とは、コンピュータに人のような学習能力を獲得させるための技術であり、コンピュータが、データ識別等の判断に必要なアルゴリズムを、事前に取り込まれる学習データから自律的に生成し,新たなデータについてこれを適用して予測を行う技術のことをいう。機械学習のための学習方法は、教師あり学習、教師なし学習、半教師学習、強化学習、深層学習のいずれかの方法でもよく、さらに、これらの学習方法を組み合わせた学習方法でもよく、機械学習のための学習方法は問わない。 Here, machine learning is a technology that allows computers to acquire human-like learning abilities, and computers autonomously generate algorithms necessary for decisions such as data identification from learning data that has been captured in advance. This refers to a technology that applies this to new data to make predictions. The learning method for machine learning may be supervised learning, unsupervised learning, semi-supervised learning, reinforcement learning, or deep learning, or it may be a learning method that combines these learning methods. It doesn't matter what learning method you use.

以上、各実施形態に基づき本発明の説明を行ってきたが、上記実施形態に示した要件に本発明が限定されるものではない。これらの点に関しては、本発明の主旨をそこなわない範囲で変更することができ、その応用形態に応じて適切に定めることができる。 Although the present invention has been described above based on each embodiment, the present invention is not limited to the requirements shown in the above embodiments. These points can be changed without detracting from the gist of the present invention, and can be determined appropriately depending on the application thereof.

100 帳票認識システム
200 サーバ装置
210 記憶部
220 帳票認識部
230 帳票画像データベース
240 種別判定データベース
250 帳票定義データベース
260 認識結果データベース
265 フォーマット管理データベース
267 法人名辞書データベース
270 認識処理部
290 帳票管理部
300 画像形成装置
400 端末装置
500 基幹システム
100 Form recognition system 200 Server device 210 Storage unit 220 Form recognition unit 230 Form image database 240 Type determination database 250 Form definition database 260 Recognition result database 265 Format management database 267 Corporate name dictionary database 270 Recognition processing unit 290 Form management unit 300 Image formation Device 400 Terminal device 500 Core system

特開2004-158030号公報Japanese Patent Application Publication No. 2004-158030 特開2016-51339号公報Japanese Patent Application Publication No. 2016-51339

Claims (8)

帳票画像データの入力を受け付けて、帳票に含まれる項目名及び項目値の位置関係を定義した帳票定義情報が複数格納された記憶部を参照し、帳票認識に用いる帳票定義情報を特定する特定部と、
前記特定部による前記帳票定義情報の特定の仕方に応じて、前記帳票画像データの元となる帳票に含まれる項目名のうち、特定の項目名の項目値を決定する項目値決定部と、を有し、
前記帳票定義情報は、第一の帳票定義情報と、前記第一の帳票定義情報よりも優先度が高い、利用者固有の帳票の項目名及び項目値の位置関係を定義した第二の帳票定義情報と、を含み、
前記項目値決定部は、
前記特定部による前記第二の帳票定義情報の特定の仕方に応じて、前記特定の項目名の項目値を決定し、
前記項目値決定部は、
前記第二の帳票定義情報が、
前記帳票画像データが示す帳票画像に含まれる文字列に応じて特定された場合に、前記特定の項目名の項目値を、前記第二の帳票定義情報に基づき抽出された値に決定し、
前記帳票画像データの元となる帳票のフォーマットに応じて特定された場合に、前記特定の項目名の項目値を、前記第一の帳票定義情報に基づき抽出された値に決定する、情報処理装置。
A specific unit that accepts input of form image data, refers to a storage unit storing a plurality of form definition information that defines the positional relationships of item names and item values included in the form, and identifies form definition information to be used for form recognition. and,
an item value determining unit that determines an item value of a specific item name among item names included in the form that is the source of the form image data, depending on how the specifying unit specifies the form definition information; have,
The form definition information includes first form definition information and a second form definition that defines the positional relationship between item names and item values of a user-specific form, which has a higher priority than the first form definition information. including information and;
The item value determining unit is
determining the item value of the specific item name depending on how the second form definition information is specified by the specifying unit;
The item value determining unit is
The second form definition information is
determining the item value of the specific item name to be a value extracted based on the second form definition information when specified according to a character string included in a form image indicated by the form image data;
an information processing device that determines the item value of the specific item name to be a value extracted based on the first form definition information when the item value is specified according to the format of the form that is the source of the form image data; .
帳票画像データの入力を受け付けて、帳票に含まれる項目名及び項目値の位置関係を定義した帳票定義情報が複数格納された記憶部を参照し、帳票認識に用いる帳票定義情報を特定する特定部と、
前記特定部による前記帳票定義情報の特定の仕方に応じて、前記帳票画像データの元となる帳票に含まれる項目名のうち、特定の項目名の項目値を決定する項目値決定部と、を有し、
前記帳票定義情報は、第一の帳票定義情報と、前記第一の帳票定義情報よりも優先度が高い、利用者固有の帳票の項目名及び項目値の位置関係を定義した第二の帳票定義情報と、を含み、
前記項目値決定部は、
前記特定部による前記第二の帳票定義情報の特定の仕方に応じて、前記特定の項目名の項目値を決定し、
前記項目値決定部は、
前記第二の帳票定義情報が、
前記帳票画像データが示す帳票画像に含まれる文字列に応じて特定された場合に、前記特定の項目名の項目値を、前記第二の帳票定義情報に基づき抽出された値に決定し、
前記帳票画像データの元となる帳票のフォーマットに応じて特定され、且つ、前記第二の帳票定義情報に基づき抽出された前記特定の項目名の項目値が、所定の辞書データベースに格納されている場合に、前記特定の項目名の項目値を前記第二の帳票定義情報に基づき抽出された値に決定し、
前記帳票画像データの元となる帳票のフォーマットに応じて特定され、且つ、前記第二の帳票定義情報に基づき抽出された前記特定の項目名の項目値が、前記所定の辞書データベースに格納されていない場合に、前記特定の項目名の項目値を前記第一の帳票定義情報に基づき抽出された値に決定する、情報処理装置。
A specific unit that accepts input of form image data, refers to a storage unit storing a plurality of form definition information that defines the positional relationships of item names and item values included in the form, and identifies form definition information to be used for form recognition. and,
an item value determining unit that determines an item value of a specific item name among item names included in the form that is the source of the form image data, depending on how the specifying unit specifies the form definition information; have,
The form definition information includes first form definition information and a second form definition that defines the positional relationship between item names and item values of a user-specific form, which has a higher priority than the first form definition information. including information and;
The item value determining unit is
determining the item value of the specific item name depending on how the second form definition information is specified by the specifying unit;
The item value determining unit is
The second form definition information is
determining the item value of the specific item name to be a value extracted based on the second form definition information when specified according to a character string included in a form image indicated by the form image data;
The item value of the specific item name specified according to the format of the form that is the source of the form image data and extracted based on the second form definition information is stored in a predetermined dictionary database. In this case, the item value of the specific item name is determined to be a value extracted based on the second form definition information,
The item value of the specific item name specified according to the format of the form that is the source of the form image data and extracted based on the second form definition information is stored in the predetermined dictionary database. If there is no item, the information processing device determines the item value of the specific item name to be a value extracted based on the first form definition information .
帳票画像データの入力を受け付けて、帳票に含まれる項目名及び項目値の位置関係を定義した帳票定義情報が複数格納された記憶部を参照し、帳票認識に用いる帳票定義情報を特定する特定処理と、
前記特定処理による前記帳票定義情報の特定の仕方に応じて、前記帳票画像データの元となる帳票に含まれる項目名のうち、特定の項目名の項目値を決定する決定処理と、を情報処理装置に実行させるプログラムであって、
前記帳票定義情報は、第一の帳票定義情報と、前記第一の帳票定義情報よりも優先度が高い、利用者固有の帳票の項目名及び項目値の位置関係を定義した第二の帳票定義情報と、を含み、
前記決定処理は、
前記特定処理による前記第二の帳票定義情報の特定の仕方に応じて、前記特定の項目名の項目値を決定し、
前記決定処理は、
前記第二の帳票定義情報が、
前記帳票画像データが示す帳票画像に含まれる文字列に応じて特定された場合に、前記特定の項目名の項目値を、前記第二の帳票定義情報に基づき抽出された値に決定し、
前記帳票画像データの元となる帳票のフォーマットに応じて特定された場合に、前記特定の項目名の項目値を、前記第一の帳票定義情報に基づき抽出された値に決定する、プログラム。
Specific processing that accepts input of form image data, refers to a storage unit that stores multiple pieces of form definition information that defines the positional relationships of item names and item values included in the form, and identifies form definition information to be used for form recognition . and,
information processing for determining an item value of a specific item name among item names included in the form that is the source of the form image data, depending on how the form definition information is specified by the identification process; A program that is executed by a device,
The form definition information includes first form definition information and a second form definition that defines the positional relationship between item names and item values of a user-specific form, which has a higher priority than the first form definition information. including information and;
The determination process is
determining the item value of the specific item name according to how the second form definition information is specified by the specifying process;
The determination process is
The second form definition information is
determining the item value of the specific item name to be a value extracted based on the second form definition information when specified according to a character string included in a form image indicated by the form image data;
A program that determines an item value of the specific item name to a value extracted based on the first form definition information when specified according to a format of a form that is the source of the form image data.
帳票画像データの入力を受け付けて、帳票に含まれる項目名及び項目値の位置関係を定義した帳票定義情報が複数格納された記憶部を参照し、帳票認識に用いる帳票定義情報を特定する特定処理と、
前記特定処理による前記帳票定義情報の特定の仕方に応じて、前記帳票画像データの元となる帳票に含まれる項目名のうち、特定の項目名の項目値を決定する決定処理と、を情報処理装置に実行させるプログラムであって、
前記帳票定義情報は、第一の帳票定義情報と、前記第一の帳票定義情報よりも優先度が高い、利用者固有の帳票の項目名及び項目値の位置関係を定義した第二の帳票定義情報と、を含み、
前記決定処理は、
前記特定処理による前記第二の帳票定義情報の特定の仕方に応じて、前記特定の項目名の項目値を決定し、
前記決定処理は、
前記第二の帳票定義情報が、
前記帳票画像データが示す帳票画像に含まれる文字列に応じて特定された場合に、前記特定の項目名の項目値を、前記第二の帳票定義情報に基づき抽出された値に決定し、
前記帳票画像データの元となる帳票のフォーマットに応じて特定され、且つ、前記第二の帳票定義情報に基づき抽出された前記特定の項目名の項目値が、所定の辞書データベースに格納されている場合に、前記特定の項目名の項目値を前記第二の帳票定義情報に基づき抽出された値に決定し、
前記帳票画像データの元となる帳票のフォーマットに応じて特定され、且つ、前記第二の帳票定義情報に基づき抽出された前記特定の項目名の項目値が、前記所定の辞書データベースに格納されていない場合に、前記特定の項目名の項目値を前記第一の帳票定義情報に基づき抽出された値に決定する、プログラム。
Specific processing that accepts input of form image data, refers to a storage unit that stores multiple pieces of form definition information that defines the positional relationships of item names and item values included in the form, and identifies form definition information to be used for form recognition . and,
information processing for determining an item value of a specific item name among item names included in the form that is the source of the form image data, depending on how the form definition information is specified by the identification process; A program that is executed by a device,
The form definition information includes first form definition information and a second form definition that defines the positional relationship between item names and item values of a user-specific form, which has a higher priority than the first form definition information. including information and;
The determination process is
determining the item value of the specific item name according to how the second form definition information is specified by the specifying process;
The determination process is
The second form definition information is
determining the item value of the specific item name to be a value extracted based on the second form definition information when specified according to a character string included in a form image indicated by the form image data;
The item value of the specific item name specified according to the format of the form that is the source of the form image data and extracted based on the second form definition information is stored in a predetermined dictionary database. In this case, the item value of the specific item name is determined to be a value extracted based on the second form definition information,
The item value of the specific item name specified according to the format of the form that is the source of the form image data and extracted based on the second form definition information is stored in the predetermined dictionary database. If there is no item, the program determines the item value of the specific item name to a value extracted based on the first form definition information .
端末装置と情報処理装置がネットワークを介して接続された情報処理システムであって、
前記情報処理装置は、
帳票画像データの入力を受け付けて、帳票に含まれる項目名及び項目値の位置関係を定義した帳票定義情報が複数格納された記憶部を参照し、帳票認識に用いる帳票定義情報を特定する特定部と、
前記特定部による前記帳票定義情報の特定の仕方に応じて、前記帳票画像データの元となる帳票に含まれる項目名のうち、特定の項目名の項目値を決定する項目値決定部と、
前記項目値決定部により決定された前記項目名と前記項目値とを対応付けた認識結果データを前記端末装置に送信する出力部と、を有し、
前記帳票定義情報は、第一の帳票定義情報と、前記第一の帳票定義情報よりも優先度が高い、利用者固有の帳票の項目名及び項目値の位置関係を定義した第二の帳票定義情報と、を含み、
前記項目値決定部は、
前記特定部による前記第二の帳票定義情報の特定の仕方に応じて、前記特定の項目名の項目値を決定し、
前記項目値決定部は、
前記第二の帳票定義情報が、
前記帳票画像データが示す帳票画像に含まれる文字列に応じて特定された場合に、前記特定の項目名の項目値を、前記第二の帳票定義情報に基づき抽出された値に決定し、
前記帳票画像データの元となる帳票のフォーマットに応じて特定された場合に、前記特定の項目名の項目値を、前記第一の帳票定義情報に基づき抽出された値に決定し、
前記端末装置は、
前記情報処理装置から、前記認識結果データを受信する通信部と、
前記認識結果データを表示装置に表示させる表示制御部と、を有する、情報処理システム。
An information processing system in which a terminal device and an information processing device are connected via a network,
The information processing device includes:
A specific unit that accepts input of form image data, refers to a storage unit storing a plurality of form definition information that defines the positional relationships of item names and item values included in the form, and identifies form definition information to be used for form recognition. and,
an item value determining unit that determines the item value of a specific item name among item names included in the form that is the source of the form image data, depending on how the specifying unit specifies the form definition information;
an output unit that transmits recognition result data in which the item name determined by the item value determining unit and the item value are associated with each other to the terminal device;
The form definition information includes first form definition information and a second form definition that defines the positional relationship between item names and item values of a user-specific form, which has a higher priority than the first form definition information. including information and;
The item value determining unit is
determining the item value of the specific item name depending on how the second form definition information is specified by the specifying unit;
The item value determining unit is
The second form definition information is
determining the item value of the specific item name to be a value extracted based on the second form definition information when specified according to a character string included in a form image indicated by the form image data;
determining the item value of the specific item name to be a value extracted based on the first form definition information when specified according to the format of the form that is the source of the form image data;
The terminal device is
a communication unit that receives the recognition result data from the information processing device;
An information processing system, comprising: a display control unit that displays the recognition result data on a display device.
端末装置と情報処理装置がネットワークを介して接続された情報処理システムであって、
前記情報処理装置は、
帳票画像データの入力を受け付けて、帳票に含まれる項目名及び項目値の位置関係を定義した帳票定義情報が複数格納された記憶部を参照し、帳票認識に用いる帳票定義情報を特定する特定部と、
前記特定部による前記帳票定義情報の特定の仕方に応じて、前記帳票画像データの元となる帳票に含まれる項目名のうち、特定の項目名の項目値を決定する項目値決定部と、
前記項目値決定部により決定された前記項目名と前記項目値とを対応付けた認識結果データを前記端末装置に送信する出力部と、を有し、
前記帳票定義情報は、第一の帳票定義情報と、前記第一の帳票定義情報よりも優先度が高い、利用者固有の帳票の項目名及び項目値の位置関係を定義した第二の帳票定義情報と、を含み、
前記項目値決定部は、
前記特定部による前記第二の帳票定義情報の特定の仕方に応じて、前記特定の項目名の項目値を決定し、
前記項目値決定部は、
前記第二の帳票定義情報が、
前記帳票画像データが示す帳票画像に含まれる文字列に応じて特定された場合に、前記特定の項目名の項目値を、前記第二の帳票定義情報に基づき抽出された値に決定し、
前記帳票画像データの元となる帳票のフォーマットに応じて特定され、且つ、前記第二の帳票定義情報に基づき抽出された前記特定の項目名の項目値が、所定の辞書データベースに格納されている場合に、前記特定の項目名の項目値を前記第二の帳票定義情報に基づき抽出された値に決定し、
前記帳票画像データの元となる帳票のフォーマットに応じて特定され、且つ、前記第二の帳票定義情報に基づき抽出された前記特定の項目名の項目値が、前記所定の辞書データベースに格納されていない場合に、前記特定の項目名の項目値を前記第一の帳票定義情報に基づき抽出された値に決定し、
前記端末装置は、
前記情報処理装置から、前記認識結果データを受信する通信部と、
前記認識結果データを表示装置に表示させる表示制御部と、を有する、情報処理システム。
An information processing system in which a terminal device and an information processing device are connected via a network,
The information processing device includes:
A specific unit that accepts input of form image data, refers to a storage unit storing a plurality of form definition information that defines the positional relationships of item names and item values included in the form, and identifies form definition information to be used for form recognition. and,
an item value determining unit that determines the item value of a specific item name among item names included in the form that is the source of the form image data, depending on how the specifying unit specifies the form definition information;
an output unit that transmits recognition result data in which the item name determined by the item value determining unit and the item value are associated with each other to the terminal device,
The form definition information includes first form definition information and a second form definition that defines the positional relationship between item names and item values of a user-specific form, which has a higher priority than the first form definition information. including information and;
The item value determining unit is
determining the item value of the specific item name depending on how the second form definition information is specified by the specifying unit;
The item value determining unit is
The second form definition information is
determining the item value of the specific item name to be a value extracted based on the second form definition information when specified according to a character string included in a form image indicated by the form image data;
The item value of the specific item name specified according to the format of the form that is the source of the form image data and extracted based on the second form definition information is stored in a predetermined dictionary database. In this case, the item value of the specific item name is determined to be a value extracted based on the second form definition information,
The item value of the specific item name specified according to the format of the form that is the source of the form image data and extracted based on the second form definition information is stored in the predetermined dictionary database. If not, determining the item value of the specific item name to a value extracted based on the first form definition information,
The terminal device is
a communication unit that receives the recognition result data from the information processing device;
An information processing system, comprising: a display control unit that displays the recognition result data on a display device.
端末装置と情報処理装置がネットワークを介して接続された情報処理システムによる情報処理方法であって、
前記情報処理装置が、
帳票画像データの入力を受け付けて、帳票に含まれる項目名及び項目値の位置関係を定義した帳票定義情報が複数格納された記憶部を参照し、帳票認識に用いる帳票定義情報を特定する特定手順と、
前記特定手順による前記帳票定義情報の特定の仕方に応じて、前記帳票画像データの元となる帳票に含まれる項目名のうち、特定の項目名の項目値を決定する決定手順と、
決定された前記項目名と前記項目値とを対応付けた認識結果データを前記端末装置に送信する送信手順と、を実行
前記帳票定義情報は、第一の帳票定義情報と、前記第一の帳票定義情報よりも優先度が高い、利用者固有の帳票の項目名及び項目値の位置関係を定義した第二の帳票定義情報と、を含み、
前記決定手順は、
前記特定手順による前記第二の帳票定義情報の特定の仕方に応じて、前記特定の項目名の項目値を決定し、
前記決定手順は、
前記第二の帳票定義情報が、
前記帳票画像データが示す帳票画像に含まれる文字列に応じて特定された場合に、前記特定の項目名の項目値を、前記第二の帳票定義情報に基づき抽出された値に決定し、
前記帳票画像データの元となる帳票のフォーマットに応じて特定された場合に、前記特定の項目名の項目値を、前記第一の帳票定義情報に基づき抽出された値に決定し、
前記端末装置が、
前記情報処理装置から、前記認識結果データを受信し、
前記認識結果データを表示装置に表示させる、情報処理方法。
An information processing method using an information processing system in which a terminal device and an information processing device are connected via a network,
The information processing device
A specific procedure for accepting input of form image data, referring to a storage unit storing a plurality of form definition information that defines the positional relationships of item names and item values included in the form, and identifying form definition information to be used for form recognition . and,
a determining step of determining an item value of a specific item name among the item names included in the form that is the source of the form image data, depending on how the form definition information is specified by the specifying step ;
performing a transmission procedure of transmitting recognition result data in which the determined item name and the item value are associated with each other to the terminal device ;
The form definition information includes first form definition information and a second form definition that defines the positional relationship between item names and item values of a user-specific form, which has a higher priority than the first form definition information. including information and;
The determination procedure is
determining the item value of the specific item name according to how the second form definition information is specified by the specifying procedure;
The determination procedure is
The second form definition information is
determining the item value of the specific item name to be a value extracted based on the second form definition information when specified according to a character string included in a form image indicated by the form image data;
determining the item value of the specific item name to be a value extracted based on the first form definition information when specified according to the format of the form that is the source of the form image data;
The terminal device is
receiving the recognition result data from the information processing device;
An information processing method that displays the recognition result data on a display device.
端末装置と情報処理装置がネットワークを介して接続された情報処理システムによる情報処理方法であって、
前記情報処理装置が、
帳票画像データの入力を受け付けて、帳票に含まれる項目名及び項目値の位置関係を定義した帳票定義情報が複数格納された記憶部を参照し、帳票認識に用いる帳票定義情報を特定する特定手順と、
前記特定手順による前記帳票定義情報の特定の仕方に応じて、前記帳票画像データの元となる帳票に含まれる項目名のうち、特定の項目名の項目値を決定する決定手順と、
決定された前記項目名と前記項目値とを対応付けた認識結果データを前記端末装置に送信する送信手順と、を実行
前記帳票定義情報は、第一の帳票定義情報と、前記第一の帳票定義情報よりも優先度が高い、利用者固有の帳票の項目名及び項目値の位置関係を定義した第二の帳票定義情報と、を含み、
前記決定手順は、
前記特定手順による前記第二の帳票定義情報の特定の仕方に応じて、前記特定の項目名の項目値を決定し、
前記決定手順は、
前記第二の帳票定義情報が、
前記帳票画像データが示す帳票画像に含まれる文字列に応じて特定された場合に、前記特定の項目名の項目値を、前記第二の帳票定義情報に基づき抽出された値に決定し、
前記帳票画像データの元となる帳票のフォーマットに応じて特定され、且つ、前記第二の帳票定義情報に基づき抽出された前記特定の項目名の項目値が、所定の辞書データベースに格納されている場合に、前記特定の項目名の項目値を前記第二の帳票定義情報に基づき抽出された値に決定し、
前記帳票画像データの元となる帳票のフォーマットに応じて特定され、且つ、前記第二の帳票定義情報に基づき抽出された前記特定の項目名の項目値が、前記所定の辞書データベースに格納されていない場合に、前記特定の項目名の項目値を前記第一の帳票定義情報に基づき抽出された値に決定し、
前記端末装置が、
前記情報処理装置から、前記認識結果データを受信し、
前記認識結果データを表示装置に表示させる、情報処理方法。
An information processing method using an information processing system in which a terminal device and an information processing device are connected via a network,
The information processing device
A specific procedure for accepting input of form image data, referring to a storage unit storing a plurality of form definition information that defines the positional relationships of item names and item values included in the form, and identifying form definition information to be used for form recognition. and,
a determining step of determining an item value of a specific item name among the item names included in the form that is the source of the form image data, depending on how the form definition information is specified by the specifying step ;
performing a transmission procedure of transmitting recognition result data in which the determined item name and the item value are associated with each other to the terminal device ;
The form definition information includes first form definition information and a second form definition that defines the positional relationship between item names and item values of a user-specific form, which has a higher priority than the first form definition information. including information and;
The determination procedure is
determining the item value of the specific item name according to how the second form definition information is specified by the specifying procedure;
The determination procedure is
The second form definition information is
determining the item value of the specific item name to be a value extracted based on the second form definition information when specified according to a character string included in a form image indicated by the form image data;
The item value of the specific item name specified according to the format of the form that is the source of the form image data and extracted based on the second form definition information is stored in a predetermined dictionary database. In this case, the item value of the specific item name is determined to be a value extracted based on the second form definition information,
The item value of the specific item name specified according to the format of the form that is the source of the form image data and extracted based on the second form definition information is stored in the predetermined dictionary database. If not, determining the item value of the specific item name to a value extracted based on the first form definition information,
The terminal device is
receiving the recognition result data from the information processing device;
An information processing method that displays the recognition result data on a display device.
JP2022064588A 2022-04-08 2022-04-08 Information processing device, program, information processing system, information processing method Active JP7447928B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022064588A JP7447928B2 (en) 2022-04-08 2022-04-08 Information processing device, program, information processing system, information processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022064588A JP7447928B2 (en) 2022-04-08 2022-04-08 Information processing device, program, information processing system, information processing method

Publications (2)

Publication Number Publication Date
JP2023154935A JP2023154935A (en) 2023-10-20
JP7447928B2 true JP7447928B2 (en) 2024-03-12

Family

ID=88373272

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022064588A Active JP7447928B2 (en) 2022-04-08 2022-04-08 Information processing device, program, information processing system, information processing method

Country Status (1)

Country Link
JP (1) JP7447928B2 (en)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001184453A (en) 1999-12-22 2001-07-06 Hitachi Ltd Document processing system and document filing system
JP2007233913A (en) 2006-03-03 2007-09-13 Fuji Xerox Co Ltd Image processor and program
JP2016048444A (en) 2014-08-27 2016-04-07 沖電気工業株式会社 Document identification program, document identification device, document identification system, and document identification method
JP2016153949A (en) 2015-02-20 2016-08-25 沖電気工業株式会社 Information processing device, information processing system, information processing method and program
JP2020021461A (en) 2018-07-20 2020-02-06 株式会社リコー Information processing apparatus, information processing method, and information processing program
JP2021086480A (en) 2019-11-29 2021-06-03 株式会社リコー Information processing system, program, and information processing method
JP2021140788A (en) 2020-03-06 2021-09-16 株式会社リコー Information processing system, information processing method and program
JP2021149452A (en) 2020-03-18 2021-09-27 株式会社Pfu Image processing device, control method and control program

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001184453A (en) 1999-12-22 2001-07-06 Hitachi Ltd Document processing system and document filing system
JP2007233913A (en) 2006-03-03 2007-09-13 Fuji Xerox Co Ltd Image processor and program
JP2016048444A (en) 2014-08-27 2016-04-07 沖電気工業株式会社 Document identification program, document identification device, document identification system, and document identification method
JP2016153949A (en) 2015-02-20 2016-08-25 沖電気工業株式会社 Information processing device, information processing system, information processing method and program
JP2020021461A (en) 2018-07-20 2020-02-06 株式会社リコー Information processing apparatus, information processing method, and information processing program
JP2021086480A (en) 2019-11-29 2021-06-03 株式会社リコー Information processing system, program, and information processing method
JP2021140788A (en) 2020-03-06 2021-09-16 株式会社リコー Information processing system, information processing method and program
JP2021149452A (en) 2020-03-18 2021-09-27 株式会社Pfu Image processing device, control method and control program

Also Published As

Publication number Publication date
JP2023154935A (en) 2023-10-20

Similar Documents

Publication Publication Date Title
CN105308648A (en) Systems and methods to super resolve a user-selected region of interest
CN102365645A (en) Organizing digital images by correlating faces
JP7131488B2 (en) Information processing device, information processing method and information processing program
JP2021140788A (en) Information processing system, information processing method and program
US11887390B2 (en) Information processing apparatus, information processing system, information processing method, and non-transitory recording medium
US11941672B2 (en) Information processing system, information processing method, and non-transitory recording medium
US10699145B1 (en) Systems and methods for augmented reality assisted form data capture
US20220044012A1 (en) Information processing apparatus, information processing method, and computer program product
JP7447928B2 (en) Information processing device, program, information processing system, information processing method
US11188200B2 (en) Display terminal, method of controlling display of information, and storage medium
JP7346931B2 (en) Information processing device, information processing method, and information processing program
US11804055B2 (en) Information processing apparatus, information processing method, and information processing system
JP7380653B2 (en) Information processing device, information processing method, information processing program, information processing system
JP7456131B2 (en) Information processing system, information processing method and program
JP2022137608A (en) Information processing apparatus, information processing method, and program
JP7211276B2 (en) Information processing device, information processing method and information processing program
US11960949B2 (en) Information processing apparatus, information processing system, and information processing method
US20230244860A1 (en) Information processing apparatus, information processing method, and information processing system
JP2021071758A (en) Program, method, and information processing system
JP2023081132A (en) Information processing system, form recognition method, program, form recognition system
US20230169039A1 (en) Information processing apparatus, information processing method, and information processing system
JP2023006434A (en) Information processing system, information processor, information processing method, and information processing program
JP7147334B2 (en) Shared terminal, communication system, display method, and program
JP2018116520A (en) Document processing system
JP2023125761A (en) Information processing apparatus, information processing method, program, and information processing system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230119

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231121

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240118

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240130

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240212

R151 Written notification of patent or utility model registration

Ref document number: 7447928

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151