JP2021002183A - Accounting support apparatus, accounting support program, and accounting support method - Google Patents

Accounting support apparatus, accounting support program, and accounting support method Download PDF

Info

Publication number
JP2021002183A
JP2021002183A JP2019115191A JP2019115191A JP2021002183A JP 2021002183 A JP2021002183 A JP 2021002183A JP 2019115191 A JP2019115191 A JP 2019115191A JP 2019115191 A JP2019115191 A JP 2019115191A JP 2021002183 A JP2021002183 A JP 2021002183A
Authority
JP
Japan
Prior art keywords
data
frame image
image data
frame
item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019115191A
Other languages
Japanese (ja)
Other versions
JP7486112B2 (en
Inventor
上野 裕史
Yasushi Ueno
裕史 上野
良宣 西垣
Yoshinobu Nishigaki
良宣 西垣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hongo Tsuji Tax & Consulting Co
Scaru Inc
Original Assignee
Hongo Tsuji Tax & Consulting Co
Scaru Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hongo Tsuji Tax & Consulting Co, Scaru Inc filed Critical Hongo Tsuji Tax & Consulting Co
Priority to JP2019115191A priority Critical patent/JP7486112B2/en
Publication of JP2021002183A publication Critical patent/JP2021002183A/en
Application granted granted Critical
Publication of JP7486112B2 publication Critical patent/JP7486112B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Character Input (AREA)

Abstract

To provide an accounting support apparatus, an accounting support program, and an accounting support method capable of improving the conversion accuracy by OCR software for vouchers in which a plurality of fields are irregularly arranged.SOLUTION: In an accounting support system 100, an accounting support apparatus 1 comprises: acquisition means (a communication unit 13) for acquiring medical receipt image data D2; frame identification means (a control unit 11) for identifying a frame that is an area enclosed by a ruled line L from the medical receipt image data D2; frame image data creation means (the control unit 11) for creating frame image data D7 which is image data acquired by extracting the frame portion from the medical receipt image data D2; and conversion means (the control unit 11) for converting the frame image data D7 into a character code and acquiring frame image conversion result data D10 using OCR software 129.SELECTED DRAWING: Figure 1

Description

本発明は、会計支援装置、会計支援プログラム及び会計支援方法に関する。 The present invention relates to an accounting support device, an accounting support program, and an accounting support method.

請求書、領収書等、ユーザの取引を示す紙媒体の証憑を種々の会計処理に用いるためには、その記載内容を文字コードに変換し、電子的な文字データにすることが望ましい。
そこで、従来、税理士、公認会計士等は、医療領収書の記載内容を逐一読み取った上で、手作業でコンピュータに入力していた。
In order to use a paper voucher indicating a user's transaction, such as an invoice or receipt, for various accounting processes, it is desirable to convert the description content into a character code and convert it into electronic character data.
Therefore, conventionally, tax accountants, certified accountants, etc. have read the contents of medical receipts one by one and manually input them into a computer.

しかし、このような手作業による証憑の記載内容の入力は、非常に手間が掛かる上に、入力ミスが生じることが避け難く、精度の上でも十分なものとは言い難かった。
そこで、OCR(光学文字認識、Optical Character Recognition/Reader)ソフトウェアを用いて、所定の証憑の記載内容を自動的に文字コードに変換することを可能としたシステムが知られている(例えば、特許文献1参照)。
However, it is very troublesome to manually input the contents of the voucher, and it is unavoidable that an input error occurs, and it cannot be said that the accuracy is sufficient.
Therefore, there is known a system that can automatically convert the contents of a predetermined voucher into a character code by using OCR (Optical Character Recognition / Reader) software (for example, Patent Documents). 1).

特許第6404524号公報Japanese Patent No. 6404524

OCRソフトウェアを用いての証憑の記載内容の文字コードへの変換は、通常、証憑の左から右、上から下へと順次変換していくことから、文字が規則的に配置されている証憑であれば、変換の精度を高め易かった。
しかし、例えば、医療領収書、給与の明細、社会保険の納付書等の証憑については、罫線に囲まれた複数の記載欄(以下、「コマ」という。)が不規則に配置されている場合が多く、このような証憑については、正確な変換が困難であった。
Conversion of the contents of the voucher to the character code using OCR software is usually done in order from left to right and top to bottom of the voucher, so it is a voucher in which characters are regularly arranged. If so, it was easy to improve the conversion accuracy.
However, for example, for vouchers such as medical receipts, salary details, and social insurance payment slips, when multiple entry fields (hereinafter referred to as "frames") surrounded by ruled lines are irregularly arranged. For such vouchers, it was difficult to convert them accurately.

本発明の課題は、複数の記載欄が不規則に配置された証憑について、OCRソフトウェアによる変換精度を高めることができる会計支援装置、会計支援プログラム及び会計支援方法を提供することである。 An object of the present invention is to provide an accounting support device, an accounting support program, and an accounting support method capable of improving the conversion accuracy by OCR software for a voucher in which a plurality of entry fields are irregularly arranged.

上記課題を解決するために、請求項1に記載の発明は、会計支援装置において、
変換対象となる証憑の画像データである証憑画像データを取得する取得手段と、
前記証憑画像データから罫線によって囲まれた領域であるコマを識別するコマ識別手段と、
前記証憑画像データから、前記コマ部分を抽出した画像データであるコマ画像データを作成するコマ画像データ作成手段と、
OCRソフトウェアを使用して、前記コマ画像データを文字コードに変換し、コマ画像変換結果データを取得する変換手段と、
を備えることを特徴とする。
In order to solve the above problems, the invention according to claim 1 is used in an accounting support device.
An acquisition means for acquiring voucher image data, which is the image data of the voucher to be converted, and
A frame identification means for identifying a frame that is an area surrounded by a ruled line from the voucher image data,
A frame image data creation means for creating frame image data, which is image data obtained by extracting the frame portion from the voucher image data, and
A conversion means for converting the frame image data into a character code and acquiring the frame image conversion result data using OCR software, and
It is characterized by having.

請求項2に記載の発明は、請求項1に記載の会計支援装置において、
前記コマ識別手段は、
前記証憑画像データから直線を検出の上、
当該直線によって囲まれた領域を前記コマとして識別することを特徴とする。
The invention according to claim 2 is the accounting support device according to claim 1.
The frame identification means
After detecting a straight line from the voucher image data,
The area surrounded by the straight line is identified as the frame.

請求項3に記載の発明は、請求項1又は2に記載の会計支援装置において、
前記証憑画像データから、前記コマ部分の記載を削除した画像データである枠外画像データを作成する枠外画像データ作成手段を備え、
前記変換手段は、OCRソフトウェアを使用して、前記枠外画像データを文字コードに変換し、枠外画像変換結果データを取得することを特徴とする。
The invention according to claim 3 is the accounting support device according to claim 1 or 2.
An out-of-frame image data creation means for creating out-of-frame image data, which is image data obtained by deleting the description of the frame portion from the voucher image data, is provided.
The conversion means is characterized in that the out-of-frame image data is converted into a character code by using OCR software and the out-of-frame image conversion result data is acquired.

請求項4に記載の発明は、請求項1から3のいずれか一項に記載の会計支援装置において、
前記コマ画像変換結果データを用いて前記コマ画像データに所定の項目名が含まれるかを判定し、所定の項目名が含まれる前記コマ画像データである項目名コマ画像データを抽出する項目名コマ抽出手段を備えることを特徴とする。
The invention according to claim 4 is the accounting support device according to any one of claims 1 to 3.
Using the frame image conversion result data, it is determined whether or not the frame image data includes a predetermined item name, and the item name frame image data which is the frame image data including the predetermined item name is extracted. It is characterized by being provided with an extraction means.

請求項5に記載の発明は、請求項4に記載の会計支援装置において、
前記項目名コマ画像データに、隣接するコマのコマ画像データを合成して二コマ画像データを作成する二コマ画像データ作成手段を備えることを特徴とする。
The invention according to claim 5 is the accounting support device according to claim 4.
It is characterized by comprising a two-frame image data creating means for creating two-frame image data by synthesizing frame image data of adjacent frames with the item name frame image data.

請求項6に記載の発明は、請求項1から5のいずれか一項に記載の会計支援装置において、
前記コマ画像変換結果データを基に、前記コマ画像データに含まれる文字列の行数を特定する行数特定手段を備えることを特徴とする。
The invention according to claim 6 is the accounting support device according to any one of claims 1 to 5.
It is characterized by providing a line number specifying means for specifying the number of lines of a character string included in the frame image data based on the frame image conversion result data.

請求項7に記載の発明は、請求項6に記載の会計支援装置において、
前記コマ画像データに複数行の文字列が含まれる場合に、前記コマ画像データを行毎に分割した行毎コマ画像データを作成する行毎コマ画像データ作成手段を備えることを特徴とする。
The invention according to claim 7 is the accounting support device according to claim 6.
When the frame image data includes a character string of a plurality of lines, the frame image data is provided with a line-by-line image data creating means for creating the line-by-line frame image data by dividing the frame image data into lines.

請求項8に記載の発明は、請求項7に記載の会計支援装置において、
前記コマ画像変換結果データを用いて前記コマ画像データに所定の項目名が含まれるかを判定し、所定の項目名が含まれる前記コマ画像データである項目名コマ画像データを抽出する項目名コマ抽出手段を備え、
前記項目名コマ抽出手段は、
前記行毎コマ画像データが作成されたコマについては、前記行毎コマ画像データに所定の項目名が含まれるかを判定し、所定の項目名が含まれる前記行毎コマ画像データを、前記項目名コマ画像データとして抽出し、
前記行毎コマ画像データが作成されていないコマについては、前記コマ画像データに所定の項目名が含まれるかを判定し、所定の項目名が含まれる前記コマ画像データを、前記項目名コマ画像データとして抽出することを特徴とする。
The invention according to claim 8 is the accounting support device according to claim 7.
Using the frame image conversion result data, it is determined whether or not the frame image data includes a predetermined item name, and the item name frame image data which is the frame image data including the predetermined item name is extracted. Equipped with extraction means
The item name frame extraction means
With respect to the frame in which the line-by-line frame image data is created, it is determined whether the line-by-line frame image data includes a predetermined item name, and the line-by-frame image data including the predetermined item name is used as the item. Extracted as name frame image data,
For frames for which frame-by-line image data has not been created, it is determined whether the frame image data includes a predetermined item name, and the frame image data including the predetermined item name is used as the item name frame image. It is characterized by being extracted as data.

請求項9に記載の発明は、請求項8に記載の会計支援装置において、
前記項目名コマ画像データに、隣接するコマのコマ画像データを合成して二コマ画像データを作成する二コマ画像データ作成手段を備え、
前記二コマ画像データ作成手段は、
前記行毎コマ画像データが前記項目名コマ画像データとして抽出された場合には、
当該行毎コマ画像データが含まれるコマと、これと隣接するコマとの行数が一致するかを判定の上、一致する場合に、当該行毎コマ画像データと、右に隣接するコマの同一行の行毎コマ画像データとを合成し、
前記コマ画像データが前記項目名コマ画像データとして抽出された場合には、
当該コマ画像データに係るコマと、下に隣接するコマとの左右方向の幅が一致するかを判定の上、これが一致する場合に、当該コマ画像データと、下に隣接するコマのコマ画像データとを合成することを特徴とする。
The invention according to claim 9 is the accounting support device according to claim 8.
A two-frame image data creation means for creating two-frame image data by synthesizing frame image data of adjacent frames with the item name frame image data is provided.
The two-frame image data creation means
When the line-by-frame image data is extracted as the item name frame image data,
After determining whether the number of rows of the frame containing the frame-by-line image data matches the number of adjacent frames, if they match, the frame-by-line image data and the frame adjacent to the right are the same. Combine the line-by-line frame image data
When the frame image data is extracted as the item name frame image data,
After determining whether the widths of the frame related to the frame image data and the adjacent frame below match in the left-right direction, if they match, the frame image data and the frame image data of the adjacent frame below It is characterized by synthesizing and.

請求項10に記載の発明は、請求項1から9のいずれか一項に記載の会計支援装置において、
前記コマ画像データと、前記コマ画像データに対応するコマ画像変換結果データとを、前記コマ画像データ毎に別個の作業者端末へと送信する送信手段と、
前記作業者端末から、作業者による確認及び修正後の前記コマ画像変換結果データを受信する受信手段と、
を備えることを特徴とする。
The invention according to claim 10 is the accounting support device according to any one of claims 1 to 9.
A transmission means for transmitting the frame image data and the frame image conversion result data corresponding to the frame image data to a separate worker terminal for each frame image data.
A receiving means for receiving the frame image conversion result data after confirmation and correction by the worker from the worker terminal, and
It is characterized by having.

請求項11に記載の発明は、請求項1から10のいずれか一項に記載の会計支援装置において、
前記コマ画像変換結果データから、所定の抽出項目に係るデータである抽出項目データと合致する項目についてのデータを抽出するデータ抽出手段を備えることを特徴とする。
The invention according to claim 11 is the accounting support device according to any one of claims 1 to 10.
It is characterized by comprising a data extraction means for extracting data about an item that matches the extraction item data, which is data related to a predetermined extraction item, from the frame image conversion result data.

請求項12に記載の発明は、請求項5又は9に記載の会計支援装置において、
前記コマ画像変換結果データから、所定の抽出項目に係るデータである抽出項目データと合致する項目についてのデータを抽出するデータ抽出手段を備え、
前記データ抽出手段は、前記二コマ画像データの項目名コマ画像データに対応するコマ画像変換結果データに、前記抽出項目データと合致する項目名が含まれる場合に、当該項目名コマ画像データと合成されたコマ画像データに係るコマ画像変換結果データを抽出することを特徴とする。
The invention according to claim 12 is the accounting support device according to claim 5 or 9.
A data extraction means for extracting data for items that match the extraction item data, which is data related to a predetermined extraction item, from the frame image conversion result data is provided.
When the frame image conversion result data corresponding to the item name frame image data of the two-frame image data includes an item name matching the extracted item data, the data extraction means synthesizes the item name frame image data. It is characterized in that the frame image conversion result data related to the frame image data is extracted.

請求項13に記載の発明は、請求項12に記載の会計支援装置において、
前記データ抽出手段は、前記二コマ画像データの項目名コマ画像データに対応するコマ画像変換結果データに前記抽出項目データと合致する項目名が含まれなかった場合に、全ての前記コマ画像変換結果データから、前記抽出項目データと合致する項目についてのデータを抽出することを特徴とする。
The invention according to claim 13 is the accounting support device according to claim 12.
When the frame image conversion result data corresponding to the item name frame image data of the two-frame image data does not include an item name matching the extracted item data, the data extraction means all the frame image conversion results. It is characterized in that data for an item matching the extracted item data is extracted from the data.

請求項14に記載の発明は、請求項11から13のいずれか一項に記載の会計支援装置において、
前記データ抽出手段は、前記抽出項目データと合致する項目についてのデータのうち、その記載形式が、前記データ抽出手段によって抽出するデータの記載形式に係るデータである抽出項目形式データと合致するデータを抽出することを特徴とする。
The invention according to claim 14 is the accounting support device according to any one of claims 11 to 13.
The data extraction means selects data whose description format matches the extraction item format data, which is the data related to the description format of the data extracted by the data extraction means, among the data about the items matching the extraction item data. It is characterized by extracting.

請求項15に記載の発明は、請求項3に記載の会計支援装置において、
前記コマ画像変換結果データから所定の抽出項目に係るデータである抽出項目データと合致する項目についてのデータを抽出し、
前記コマ画像変換結果データから前記抽出項目データと合致する項目についてのデータが抽出されなかった場合に、前記枠外画像変換結果データから前記抽出項目データと合致する項目についてのデータを抽出するデータ抽出手段を備えることを特徴とする。
The invention according to claim 15 is the accounting support device according to claim 3.
From the frame image conversion result data, data for items that match the extraction item data, which is data related to a predetermined extraction item, is extracted.
Data extraction means for extracting data for items that match the extracted item data from the out-of-frame image conversion result data when data for items that match the extracted item data is not extracted from the frame image conversion result data. It is characterized by having.

請求項16に記載の発明は、会計支援プログラムにおいて、
コンピュータを、
変換対象となる証憑の画像データである証憑画像データを取得する取得手段、
前記証憑画像データから罫線によって囲まれた領域であるコマを識別するコマ識別手段、
前記証憑画像データから、前記コマ部分を抽出した画像データであるコマ画像データを作成するコマ画像データ作成手段、
OCRソフトウェアを使用して、前記コマ画像データを文字コードに変換し、コマ画像変換結果データを取得する変換手段、
として機能させることを特徴とする。
The invention according to claim 16 is used in an accounting support program.
Computer,
Acquisition means for acquiring voucher image data, which is the image data of the voucher to be converted,
A frame identification means for identifying a frame that is an area surrounded by a ruled line from the voucher image data.
A frame image data creation means for creating frame image data which is image data obtained by extracting the frame portion from the voucher image data.
A conversion means for converting the frame image data into a character code and acquiring the frame image conversion result data using OCR software.
It is characterized by functioning as.

請求項17に記載の発明は、会計支援方法において、
変換対象となる証憑の画像データである証憑画像データを取得する取得ステップと、
前記証憑画像データから罫線によって囲まれた領域であるコマを識別するコマ識別ステップと、
前記証憑画像データから、前記コマ部分を抽出した画像データであるコマ画像データを作成するコマ画像データ作成ステップと、
OCRソフトウェアを使用して、前記コマ画像データを文字コードに変換し、コマ画像変換結果データを取得する変換ステップと、
を含むことを特徴とする。
The invention according to claim 17 is an accounting support method.
The acquisition step to acquire the voucher image data, which is the image data of the voucher to be converted,
A frame identification step for identifying a frame that is an area surrounded by a ruled line from the voucher image data,
A frame image data creation step for creating frame image data, which is image data obtained by extracting the frame portion from the voucher image data, and
A conversion step of converting the frame image data into a character code and acquiring the frame image conversion result data using OCR software, and
It is characterized by including.

本発明によれば、複数の記載欄が不規則に配置された証憑について、OCRソフトウェアによる変換精度を高めることができる会計支援装置、会計支援プログラム及び会計支援方法を提供することができる。 According to the present invention, it is possible to provide an accounting support device, an accounting support program, and an accounting support method capable of improving the conversion accuracy by the OCR software for a voucher in which a plurality of entry fields are irregularly arranged.

実施形態に係る会計支援システムの構成を示すブロック図である。It is a block diagram which shows the structure of the accounting support system which concerns on embodiment. 実施形態に係る会計支援システムにおける、データの流れを示すブロック図である。It is a block diagram which shows the flow of data in the accounting support system which concerns on embodiment. 実施形態に係る会計支援システムにおける、動作の流れの概略を示すフローチャートである。It is a flowchart which shows the outline of the operation flow in the accounting support system which concerns on embodiment. 実施形態に係る会計支援システムにおける、事前登録の流れを示すフローチャートである。It is a flowchart which shows the flow of the pre-registration in the accounting support system which concerns on embodiment. 実施形態に係る会計支援システムにおける、医療領収書の変換の流れを示すフローチャートである。It is a flowchart which shows the flow of conversion of the medical receipt in the accounting support system which concerns on embodiment. 実施形態に係る会計支援システムにおける、クラウドワーカによるチェックの流れを示すフローチャートである。It is a flowchart which shows the flow of the check by a cloud worker in the accounting support system which concerns on embodiment. 実施形態に係る会計支援システムにおける、医療費控除申請用データの抽出の流れを示すフローチャートである。It is a flowchart which shows the flow of the extraction of the data for medical expense deduction application in the accounting support system which concerns on embodiment. 医療領収書画像データの一例を示す図である。It is a figure which shows an example of the medical receipt image data. 医療領収書画像データの一例を示す図である。It is a figure which shows an example of the medical receipt image data. コマ画像データの一例を示す図である。It is a figure which shows an example of frame image data. コマ画像データの一例を示す図である。It is a figure which shows an example of frame image data. コマ画像データの一例を示す図である。It is a figure which shows an example of frame image data. コマ画像データの一例を示す図である。It is a figure which shows an example of frame image data. 枠外画像データの一例を示す図である。It is a figure which shows an example of the out-of-frame image data. 行毎コマ画像データの一例を示す図である。It is a figure which shows an example of the frame image data for every line. 行毎コマ画像データの一例を示す図である。It is a figure which shows an example of the frame image data for every line. 二コマ画像データの一例を示す図である。It is a figure which shows an example of two-frame image data. 二コマ画像データの一例を示す図である。It is a figure which shows an example of two-frame image data.

以下、図1から図18に基づいて、本発明の実施形態である会計支援システム100について説明する。なお、以下においては、OCRソフトウェアによる変換対象とする証憑が医療領収書であり、変換結果から医療費控除申請に必要となる項目についてのデータを抽出する場合を例として説明するが、本発明の技術的範囲はこれに限定されるものではない。 Hereinafter, the accounting support system 100 according to the embodiment of the present invention will be described with reference to FIGS. 1 to 18. In the following, a case where the voucher to be converted by the OCR software is a medical receipt and data on items required for medical expense deduction application is extracted from the conversion result will be described as an example. The technical scope is not limited to this.

[第1 構成の説明]
まず、会計支援システム100の構成につき、図1に基いて説明する。
会計支援システム100は、図1に示すように、医療領収書の画像データ(医療領収書画像データD2)の記載内容の文字コードへの変換等を行う会計支援装置1と、会計支援装置1による変換結果を確認する複数の作業者Wがそれぞれ使用する作業者端末2と、会計支援システム100のユーザUがそれぞれ使用するユーザ端末3と、を備え、会計支援装置1と各作業者端末2との間、及び会計支援装置1と各ユーザ端末3との間は、通信ネットワークNを介して接続されている。
[Explanation of the first configuration]
First, the configuration of the accounting support system 100 will be described with reference to FIG.
As shown in FIG. 1, the accounting support system 100 is composed of an accounting support device 1 that converts the description content of the medical receipt image data (medical receipt image data D2) into a character code, and the accounting support device 1. The accounting support device 1 and each worker terminal 2 are provided with a worker terminal 2 used by each of a plurality of workers W for confirming the conversion result and a user terminal 3 used by each user U of the accounting support system 100. And between the accounting support device 1 and each user terminal 3 are connected via the communication network N.

[1 会計支援装置]
会計支援装置1は、例えば、会計支援システム100を運用する企業や税理士法人等に設置されたPC(Personal Computer)、WS(Work Station)等の情報機器であり、図1に示すように、制御部11と、記憶部12と、通信部13と、表示部14と、操作部15と、を備えて構成されている。
[1 Accounting support device]
The accounting support device 1 is, for example, an information device such as a PC (Personal Computer) or WS (Work Station) installed in a company operating the accounting support system 100, a tax accountant corporation, or the like, and is controlled as shown in FIG. It is configured to include a unit 11, a storage unit 12, a communication unit 13, a display unit 14, and an operation unit 15.

[(1)制御部]
制御部11は、会計支援装置1の動作を制御する部分であり、具体的には、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等を備えて構成され、RAMの作業領域に展開されたROMや記憶部12に記憶されたプログラムとCPUとの協働により、会計支援装置1の各部を統括制御する。
[(1) Control unit]
The control unit 11 is a part that controls the operation of the accounting support device 1, and specifically, is configured to include a CPU (Central Processing Unit), a ROM (Read Only Memory), a RAM (Random Access Memory), and the like. Each part of the accounting support device 1 is collectively controlled by the cooperation between the CPU and the ROM stored in the ROM or the storage unit 12 developed in the work area of the RAM.

[(2)記憶部]
記憶部12は、会計支援装置1の運用に必要となる各種情報が記憶される部分であり、例えば、HDD(Hard Disk Drive)、半導体メモリ等により構成され、プログラムデータ、各種設定データ等のデータを、制御部11から読み書き可能に記憶する。
[(2) Storage unit]
The storage unit 12 is a part that stores various information necessary for the operation of the accounting support device 1, and is composed of, for example, an HDD (Hard Disk Drive), a semiconductor memory, or the like, and is data such as program data and various setting data. Is readable and writable from the control unit 11.

記憶部12には、ユーザデータ記憶部121と、変換対象データ記憶部122と、変換データ記憶部123と、医療費控除申請用抽出データ記憶部124と、抽出項目データ記憶部125と、抽出項目形式データ記憶部126と、医療領収書変換エンジン127と、医療費控除申請用データ抽出エンジン128と、OCRソフトウェア129と、が備えられている。 The storage unit 12 includes a user data storage unit 121, a conversion target data storage unit 122, a conversion data storage unit 123, an extraction data storage unit 124 for medical expense deduction application, an extraction item data storage unit 125, and an extraction item. A format data storage unit 126, a medical receipt conversion engine 127, a data extraction engine 128 for medical expense deduction application, and OCR software 129 are provided.

なお、これらのデータベース、ソフトウェア等は、必ずしもそれ自体が記憶部12内に備えられている必要はなく、会計支援装置1とは別個のサーバ等に備えられ、記憶部12内には、これらにアクセスするためのURL、パスワード等のみが記憶され、必要に応じて、会計支援装置1が通信ネットワークNを介して情報を取得して用いるようにしてもよい。 It should be noted that these databases, software, etc. do not necessarily have to be provided in the storage unit 12, but are provided in a server or the like separate from the accounting support device 1, and are provided in the storage unit 12. Only the URL, password, etc. for access may be stored, and the accounting support device 1 may acquire and use the information via the communication network N, if necessary.

ユーザデータ記憶部121は、会計支援システム100を利用するユーザUについてのデータであるユーザデータD1を記憶するデータベースである。
ユーザデータD1は、例えば、ユーザUの氏名、企業名等の種々の情報が、ユーザU毎に設定されたID及びログインパスワードに紐付けて記憶されたデータである。
The user data storage unit 121 is a database that stores user data D1 which is data about a user U who uses the accounting support system 100.
The user data D1 is data in which various information such as the name and company name of the user U are stored in association with an ID and a login password set for each user U, for example.

変換対象データ記憶部122は、会計支援装置1において文字コードに変換される対象である医療領収書画像データD2を、当該医療領収書画像データD2に係るユーザUのユーザデータD1及び変換有無データD3と紐対応付けて記憶するデータベースである。 The conversion target data storage unit 122 converts the medical receipt image data D2, which is the target to be converted into the character code by the accounting support device 1, into the user data D1 and the conversion presence / absence data D3 of the user U related to the medical receipt image data D2. It is a database that stores in association with.

医療領収書画像データD2は、例えば、図8及び図9に示すような、病院、薬局等が発行する医療領収書を画像データ化したデータであり、PDF、JPEG等、一般的な所定のデジタル静止画像データに係るファイル形式の画像を用いることができる。医療領収書画像データD2は、例えば、紙媒体である医療費領収書を、一般的なイメージスキャナを用いてデジタル静止画像情報化することで得られる。
変換有無データD3は、医療領収書画像データD2が既に会計支援装置1における文字コードへの変換等の処理がなされたデータであるかを示すデータであり、後述のように変換等の処理が完了する前には未変換である旨が記憶されており、変換等の処理が完了すると、記憶内容が、既変換である旨の記憶に切り替わる。
The medical receipt image data D2 is, for example, data obtained by converting a medical receipt issued by a hospital, a pharmacy, etc. into image data as shown in FIGS. 8 and 9, and is a general predetermined digital such as PDF, JPEG, etc. An image in a file format related to still image data can be used. The medical receipt image data D2 can be obtained, for example, by converting a medical expense receipt, which is a paper medium, into digital still image information using a general image scanner.
The conversion presence / absence data D3 is data indicating whether the medical receipt image data D2 is data that has already been converted into a character code in the accounting support device 1, and the processing such as conversion is completed as described later. It is stored that the conversion has not been performed before the conversion, and when the processing such as conversion is completed, the stored content is switched to the storage indicating that the conversion has already been performed.

変換データ記憶部123は、OCRソフトウェア129による変換後のデータが記憶されるデータベースであり、後述のように、コマ画像データD7、コマ位置情報データD8、枠外画像データD9、コマ画像変換結果データD10、枠外画像変換結果データD11、行毎コマ画像データD12、行毎コマ画像変換結果データD13、項目名コマ画像データD14、項目名コマ画像変換結果データD15及び二コマ画像データD16が記憶される。 The conversion data storage unit 123 is a database that stores the data after conversion by the OCR software 129, and as will be described later, the frame image data D7, the frame position information data D8, the out-of-frame image data D9, and the frame image conversion result data D10. , Out-of-frame image conversion result data D11, row-by-frame image data D12, row-by-frame image conversion result data D13, item name frame image data D14, item name frame image conversion result data D15, and two-frame image data D16 are stored.

医療費控除申請用抽出データ記憶部124は、後述のように、医療領収書画像データD2の変換結果から抽出された医療費控除申請に必要となる項目に係るデータである医療費控除申請用抽出データD21を、当該データに係るユーザUのユーザデータD1と紐付けて記憶するデータベースである。
医療費控除申請用抽出データD21は、日付に係るデータである日付データD21−1と、氏名に係るデータである氏名データD21−2と、支払先に係るデータである支払先データD21−3と、使用医薬品に係るデータである使用医薬品データD21−4と、支払金額に係るデータである支払金額データD21−5と、医療・治療の点数に係るデータである医療・治療点数データD21−6と、医療品購入の点数に係るデータである医療品購入点数データD21−7と、介護保険サービスの点数に係るデータである介護保険サービス点数データD21−8と、を含む。
As will be described later, the extraction data storage unit 124 for the medical expense deduction application extracts the data related to the items required for the medical expense deduction application extracted from the conversion result of the medical receipt image data D2 for the medical expense deduction application. This is a database that stores data D21 in association with user data D1 of user U related to the data.
The extracted data D21 for medical expense deduction application includes date data D21-1 which is data related to the date, name data D21-2 which is data related to the name, and payee data D21-3 which is data related to the payee. , Used drug data D21-4 which is data related to used drug, payment amount data D21-5 which is data related to payment amount, and medical / treatment score data D21-6 which is data related to medical / treatment score. , Medical product purchase score data D21-7, which is data related to the score of medical product purchase, and nursing care insurance service score data D21-8, which is data related to the score of the care insurance service.

抽出項目データ記憶部125は、医療費控除申請に必要な抽出項目に係るデータである抽出項目データD4が予め記憶されているデータベースである。
抽出項目データD4は、日付項目データD4−1と、氏名項目データD4−2と、医療機関データD4−3と、医薬品項目データD4−4と、第一支払項目データD4−5と、第二支払項目データD4−6と、医療・治療項目データD4−7と、医療品購入項目データD4−8と、介護保険サービス項目データD4−9と、を含む。なお、抽出項目データD4の内容はこれらに限られず、医療費控除申請に必要なデータに増減が生じた場合等には、それに対応して、適宜追加又は省略することが可能である。
The extraction item data storage unit 125 is a database in which the extraction item data D4, which is data related to the extraction items required for the medical expense deduction application, is stored in advance.
The extracted item data D4 includes date item data D4-1, name item data D4-2, medical institution data D4-3, drug item data D4-4, first payment item data D4-5, and second. It includes payment item data D4-6, medical / treatment item data D4-7, medical product purchase item data D4-8, and nursing care insurance service item data D4-9. The content of the extracted item data D4 is not limited to these, and if there is an increase or decrease in the data required for the medical expense deduction application, it can be added or omitted as appropriate.

日付項目データD4−1は、医療領収書において、日付の記載に付される項目名のリストであり、例えば、「診療日」、「発行日」等の項目名が記憶されている。
氏名項目データD4−2は、医療領収書において、氏名の記載を抽出するための記載内容を記憶したデータであり、例えば、「様」という文字が記憶されている。
医療機関データD4−3は、病院、薬局等の医療機関名と、当該医療機関に係る電話番号とが紐づけて記憶されたデータである。
医薬品項目データD4−4は、医療領収書に登場する可能性のある所定の医薬品名が記憶されたデータである。
第一支払項目データD4−5は、医療領収書において、支払金額の記載に付される項目名のリストであり、例えば、「領収金額」、「請求金額」、「支払金額」等の項目名が記憶されている。後述のように、第一支払項目データD4−5は、第二支払項目データD4−6よりも優先的に使用されるデータである。
第二支払項目データD4−6は、医療領収書において、支払金額の記載を抽出するための記載内容を記憶したデータであり、例えば、「¥」、「円」、「計」等の文字が記憶されている。
医療・治療項目データD4−7は、医療領収書において、医療・治療の記載に付される項目名のリストであり、例えば、「診療」、「治療」、「針きゅう」、「検査費用」、「付添人料」等の項目名が記憶されている。
医療品購入項目データD4−8は、医療領収書において、医療品購入の記載に付される項目名のリストであり、例えば、「調剤技術」、「薬学管理」、「薬剤」、「特定保健医療材料」、「医療材料」等の項目名が記憶されている。
介護保険サービス項目データD4−9は、医療領収書において、介護保険サービスの記載に付される項目名のリストであり、例えば、「訪問介護」、「ホームヘルプサービス」、「訪問入浴介護」、「訪問リハビリテーション」、「デイサービス」等の項目名が記憶されている。
The date item data D4-1 is a list of item names attached to the description of the date in the medical receipt, and for example, the item names such as "medical treatment date" and "issue date" are stored.
The name item data D4-2 is data in which the description contents for extracting the description of the name are stored in the medical receipt, and for example, the character "sama" is stored.
The medical institution data D4-3 is data in which the names of medical institutions such as hospitals and pharmacies are associated with the telephone numbers of the medical institutions.
The drug item data D4-4 is data in which a predetermined drug name that may appear in the medical receipt is stored.
The first payment item data D4-5 is a list of item names attached to the description of the payment amount in the medical receipt, for example, item names such as "receipt amount", "billing amount", and "payment amount". Is remembered. As will be described later, the first payment item data D4-5 is data that is preferentially used over the second payment item data D4-6.
The second payment item data D4-6 is data that stores the description contents for extracting the description of the payment amount in the medical receipt, and for example, characters such as "¥", "yen", and "total" are displayed. It is remembered.
The medical / treatment item data D4-7 is a list of item names attached to the description of medical / treatment in the medical receipt, for example, "medical treatment", "treatment", "needle", and "examination cost". , "Attendant fee" and other item names are stored.
The medical product purchase item data D4-8 is a list of item names attached to the description of the medical product purchase in the medical receipt, and is, for example, "dispensing technology", "pharmacy management", "drug", "specific health". Item names such as "medical material" and "medical material" are stored.
The long-term care insurance service item data D4-9 is a list of item names attached to the description of the long-term care insurance service in the medical receipt, and is, for example, "home-visit care", "home help service", "home-visit bathing care", etc. Item names such as "visit rehabilitation" and "day service" are stored.

抽出項目形式データ記憶部126は、医療費控除申請に必要な項目ごとに、抽出すべきデータの記載形式を記憶したデータである抽出項目形式データD5が予め記憶されているデータベースである。
抽出項目形式データD5は、日付形式データD5−1と、氏名形式データD5−2と、電話番号形式データD5−3と、支払金額形式データD5−4と、医療・治療点数形式データD5−5と、医療品購入点数形式データD5−6と、介護保険サービス点数形式データD5−7と、を含む。なお、抽出項目形式データD5の内容はこれらに限られず、医療費控除申請に必要なデータに増減が生じた場合等には、それに対応して、適宜追加又は省略することが可能である。
The extraction item format data storage unit 126 is a database in which extraction item format data D5, which is data in which the description format of the data to be extracted is stored for each item required for the medical expense deduction application, is stored in advance.
The extracted item format data D5 includes date format data D5-1, name format data D5-2, telephone number format data D5-3, payment amount format data D5-4, and medical / treatment score format data D5-5. And, the medical product purchase point format data D5-6 and the care insurance service point format data D5-7 are included. The content of the extracted item format data D5 is not limited to these, and if there is an increase or decrease in the data required for the medical expense deduction application, it can be added or omitted as appropriate.

日付形式データD5−1は、日付として抽出すべき記載の記載形式に係るデータであり、例えば、複数の数字が「/」で区切られた形式や、複数の数字が「年」、「月」及び/又は「日」で区切られた形式が記憶されている。
氏名形式データD5−2は、氏名として抽出すべき記載の記載形式に係るデータであり、例えば、算用数字や記号を含まない文字列の形式が記憶されている。
電話番号形式データD5−3は、電話番号として抽出すべき記載の記載形式に係るデータであり、例えば、複数の数字が「−」で区切られた形式や、複数の数字の間に「()」で括られた数字が存在する形式や、複数の数字の間に「−」及び「()」の両者が存在する形式が記憶されている。
支払金額形式データD5−4は、支払金額として抽出すべき記載の記載形式に係るデータであり、例えば、数字の間が「−」、「()」又は「/」で区切られずに記載された形式が記憶されている。
医療・治療点数形式データD5−5は、医療・治療点数として抽出すべき記載の記載形式に係るデータであり、例えば、数字のみ又は数字の後に「点」が続く形式が記憶されている。
医療品購入点数形式データD5−6は、医療品購入点数として抽出すべき記載の記載形式に係るデータであり、例えば、数字のみ又は数字の後に「点」が続く形式が記憶されている。
介護保険サービス点数形式データD5−7は、介護保険サービス点数として抽出すべき記載の記載形式に係るデータであり、例えば、数字のみ又は数字の後に「点」が続く形式が記憶されている。
The date format data D5-1 is data related to the description format to be extracted as a date. For example, a format in which a plurality of numbers are separated by "/" or a plurality of numbers are "year" and "month". And / or the format separated by "days" is stored.
The name format data D5-2 is data related to the description format to be extracted as a name, and for example, a character string format that does not include arithmetic numbers or symbols is stored.
The telephone number format data D5-3 is data related to the description format to be extracted as a telephone number. For example, a format in which a plurality of numbers are separated by "-" or a "()" between the plurality of numbers. The format in which the numbers enclosed in "" exist and the format in which both "-" and "()" exist between a plurality of numbers are stored.
The payment amount format data D5-4 is data related to the description format to be extracted as the payment amount, and is, for example, described without being separated by "-", "()" or "/" between the numbers. The format is remembered.
The medical / treatment score format data D5-5 is data related to the description format to be extracted as the medical / treatment score, and for example, only a number or a format in which a “point” follows a number is stored.
The medical product purchase point format data D5-6 is data related to the description format to be extracted as the medical product purchase point, and for example, only a number or a format in which a "point" follows a number is stored.
The long-term care insurance service score format data D5-7 is data related to the description format to be extracted as the long-term care insurance service score, and for example, only numbers or a format in which "dots" follow the numbers are stored.

医療領収書変換エンジン127は、後述の医療領収書画像データD2の変換等から作業者Wによる確認・修正までの所定のプロセスにおける会計支援装置1への指令内容が組み合わされたプログラムである。 The medical receipt conversion engine 127 is a program in which the contents of instructions to the accounting support device 1 in a predetermined process from conversion of the medical receipt image data D2 described later to confirmation / correction by the worker W are combined.

医療費控除申請用データ抽出エンジン128は、後述の医療費控除申請に必要となるデータの抽出に係る所定のプロセスにおける会計支援装置1への指令内容が組み合わされたプログラムである。 The data extraction engine 128 for medical expense deduction application is a program in which the contents of instructions to the accounting support device 1 in the predetermined process related to the extraction of the data required for the medical expense deduction application described later are combined.

OCRソフトウェア129は、一般的なOCR(光学文字認識、Optical Character Recognition/Reader)に係るソフトウェアであり、活自の文書の画像を文字コードの列に変換するソフトウェアである。
ただし、上記のように、OCRソフトウェア129そのものが記憶部12内に記憶されていることは必須ではなく、例えばクラウド型のOCRサービスを利用し、OCRソフトウェア129そのものは、所定のクラウドサーバ上に記憶され、記憶部12内には、このようなOCRソフトウェア129を呼び出すための、URL、パスワード等の情報のみ記憶されており、会計支援装置1が、通信ネットワークNを介して、クラウドサーバ上のOCRソフトウェア129にアクセスして、これを使用するようにしてもよい。
OCR software 129 is software related to general OCR (Optical Character Recognition / Reader), and is software that converts an image of a living document into a string of character codes.
However, as described above, it is not essential that the OCR software 129 itself is stored in the storage unit 12, for example, using a cloud-type OCR service, the OCR software 129 itself is stored on a predetermined cloud server. Only information such as a URL and a password for calling such OCR software 129 is stored in the storage unit 12, and the accounting support device 1 uses the communication network N to store the OCR on the cloud server. You may want to access software 129 and use it.

[(3)通信部]
通信部13は、会計支援装置1と作業者端末2との間の通信及び会計支援装置1とユーザ端末3との間の通信に用いられる部分であり、例えば、通信用IC(Integrated Circuit)及び通信コネクタなどを有する通信インターフェイスであり、制御部11の制御の元、所定の通信プロトコルを用いて、通信ネットワークNを介したデータ通信を行う。
[(3) Communication section]
The communication unit 13 is a part used for communication between the accounting support device 1 and the worker terminal 2 and communication between the accounting support device 1 and the user terminal 3. For example, a communication IC (Integrated Circuit) and It is a communication interface having a communication connector and the like, and under the control of the control unit 11, data communication is performed via the communication network N using a predetermined communication protocol.

[(4)表示部]
表示部14は、例えば、LCD(Liquid Crystal Display)等のディスプレイを備え、制御部11から出力された表示制御信号に基づいた画像を表示画面に表示する。
[(4) Display]
The display unit 14 includes, for example, a display such as an LCD (Liquid Crystal Display), and displays an image based on a display control signal output from the control unit 11 on the display screen.

[(5)操作部]
操作部15は、例えば、文字入力キー、数字入力キー、その他各種機能に対応付けられたキーなどを有するキーボード、マウス等のポインティングデバイス等を備え、例えば、会計支援システム100を運用する企業や税理士法人等の従業員からの操作入力を受け付けて、操作入力に応じた操作信号を制御部11へと出力する。なお、操作部15は、例えば、表示部14と一体的に形成されたタッチパネル等であってもよい。
[(5) Operation unit]
The operation unit 15 includes, for example, a keyboard having a character input key, a number input key, and other keys associated with various functions, a pointing device such as a mouse, and the like. For example, a company or a tax accountant who operates the accounting support system 100. It receives an operation input from an employee of a corporation or the like and outputs an operation signal corresponding to the operation input to the control unit 11. The operation unit 15 may be, for example, a touch panel integrally formed with the display unit 14.

[2 作業者端末]
作業者端末2は、会計支援装置1による変換結果を確認する複数の作業者Wがそれぞれ使用するPC、WS(Work Station)等の情報機器であり、例えば、図1に示すように、会計支援装置1と同様に、制御部21と、記憶部22と、通信部23と、表示部24と、操作部25と、を備えて構成されている。
ただし、図1に示すように、記憶部22には、会計支援装置1と異なり、後述のように、会計支援装置1から受信したデータをあてはめた上で、作業者Wに対して表示する画面のデータである表示画面データD6が記憶される表示画面データ記憶部221が備えられている。
なお、表示画面データ記憶部221は、会計支援装置1の記憶部12に備えられ、会計支援装置1においてこれに所定のデータをあてはめて、作業者端末2に表示される画面を完成させた上で、作業者端末2へと送信するようにしてもよい。
[2 Worker terminal]
The worker terminal 2 is an information device such as a PC or WS (Work Station) used by each of a plurality of workers W who confirm the conversion result by the accounting support device 1. For example, as shown in FIG. 1, accounting support is provided. Similar to the device 1, the control unit 21, the storage unit 22, the communication unit 23, the display unit 24, and the operation unit 25 are provided.
However, as shown in FIG. 1, unlike the accounting support device 1, the storage unit 22 is a screen to be displayed to the worker W after applying the data received from the accounting support device 1 as described later. The display screen data storage unit 221 for storing the display screen data D6, which is the data of the above, is provided.
The display screen data storage unit 221 is provided in the storage unit 12 of the accounting support device 1, and the accounting support device 1 applies predetermined data to the storage unit 12 to complete the screen displayed on the worker terminal 2. Then, it may be transmitted to the worker terminal 2.

[3 ユーザ端末]
ユーザ端末3は、会計支援システム100の複数のユーザUがそれぞれ使用するPC、スマートフォン、タブレット端末等の情報機器であり、例えば、図1に示すように、会計支援装置1と同様に、制御部31と、記憶部32と、通信部33と、表示部34と、操作部35と、を備えて構成されている。
[3 User terminal]
The user terminal 3 is an information device such as a PC, a smartphone, or a tablet terminal used by each of a plurality of users U of the accounting support system 100. For example, as shown in FIG. 1, a control unit like the accounting support device 1. It includes 31, a storage unit 32, a communication unit 33, a display unit 34, and an operation unit 35.

[4 通信ネットワーク]
通信ネットワークNは、例えば、インターネット、電話回線網、携帯電話通信網等であり、会計支援装置1と作業者端末2との間でのデータの送受信、及び会計支援装置1とユーザ端末3との間でのデータの送受信を行うことが可能なものであれば特に限定されない。
[4 Communication network]
The communication network N is, for example, the Internet, a telephone line network, a mobile phone communication network, etc., and transmits / receives data between the accounting support device 1 and the worker terminal 2, and the accounting support device 1 and the user terminal 3. There is no particular limitation as long as it is possible to send and receive data between them.

[第2 動作の説明]
以下、実施形態に係る会計支援システム100の使用時の流れについて、図2から図18に基づいて説明する。なお、以下においては、図8及び図9に示すように医療領収書の上下及び左右を定め、かつ、医療領収書の横(左右)方向をX軸方向、縦(上下)方向をY軸方向と定めて説明する。
[Explanation of the second operation]
Hereinafter, the flow at the time of using the accounting support system 100 according to the embodiment will be described with reference to FIGS. 2 to 18. In the following, as shown in FIGS. 8 and 9, the top, bottom, left and right of the medical receipt are defined, and the horizontal (left and right) direction of the medical receipt is the X-axis direction, and the vertical (vertical) direction is the Y-axis direction. I will explain it.

会計支援システム100使用時の流れは、大別すると、図3に示すように、事前登録(ステップS1)、医療領収書の変換(ステップS2)、クラウドワーカによるチェック(ステップS3)、医療費控除申請用データの抽出(ステップS4)の4つの過程からなる。以下、それぞれの過程について詳細に説明する。 The flow when using the accounting support system 100 can be roughly divided into pre-registration (step S1), conversion of medical receipts (step S2), check by cloud worker (step S3), and medical expense deduction, as shown in FIG. It consists of four processes of extracting application data (step S4). Each process will be described in detail below.

[1 ステップS1:事前登録]
まず、会計支援システム100を使用するユーザUは、以下の事前登録を行う。事前登録の過程は、図4に示すように、ステップS1−1からS1−2の2つのステップからなる。
[1 step S1: Pre-registration]
First, the user U who uses the accounting support system 100 performs the following pre-registration. As shown in FIG. 4, the pre-registration process consists of two steps, steps S1-1 to S1-2.

[(1) ステップS1−1:ユーザデータの登録]
会計支援システム100を使用するユーザUは、システム使用開始前に、まずユーザデータD1の登録を行う。具体的には、ユーザUは、ユーザ端末3の操作部35を用いて、例えば、氏名、住所、連絡先、システム使用時のID、パスワード等を含む所定の情報からなるユーザデータD1を入力する。
これらのデータが入力されると、ユーザ端末3は、入力されたデータを、通信部33から通信ネットワークNを介して、図2に示すように会計支援装置1に送信し、通信部13によってこれを受信した会計支援装置1においては、制御部11が、受信したユーザデータD1を、記憶部12のユーザデータ記憶部121に記憶する。
[(1) Step S1-1: Registration of user data]
The user U who uses the accounting support system 100 first registers the user data D1 before starting to use the system. Specifically, the user U uses the operation unit 35 of the user terminal 3 to input user data D1 including predetermined information including, for example, a name, an address, a contact information, an ID when using the system, a password, and the like. ..
When these data are input, the user terminal 3 transmits the input data from the communication unit 33 to the accounting support device 1 via the communication network N as shown in FIG. 2, and the communication unit 13 transmits the input data to the accounting support device 1. In the accounting support device 1 that has received the above, the control unit 11 stores the received user data D1 in the user data storage unit 121 of the storage unit 12.

[(2) ステップS1−2:医療領収書画像データの登録]
会計支援システム100を使用するユーザUは、続いて、医療領収書画像データD2の登録を行う。
具体的には、ユーザUは、任意の方法でスキャンすることで医療領収書画像データD2を作成の上、ユーザ端末3に記憶された医療領収書画像データD2を、通信部33から通信ネットワークNを介して、図2に示すように会計支援装置1に送信する。
通信部13によってこれを受信した会計支援装置1においては、制御部11が、受信した医療領収書画像データD2を、当該ユーザに係るユーザデータD1及び変換有無データD3と紐付けて、記憶部12の変換対象データ記憶部122に記憶する。なお、登録された段階では、変換有無データD3は、全て未変換である旨のデータとなる。
[(2) Step S1-2: Registration of medical receipt image data]
The user U who uses the accounting support system 100 subsequently registers the medical receipt image data D2.
Specifically, the user U creates the medical receipt image data D2 by scanning by an arbitrary method, and then transmits the medical receipt image data D2 stored in the user terminal 3 from the communication unit 33 to the communication network N. Is transmitted to the accounting support device 1 as shown in FIG.
In the accounting support device 1 that has received this from the communication unit 13, the control unit 11 associates the received medical receipt image data D2 with the user data D1 and the conversion presence / absence data D3 related to the user, and the storage unit 12 Is stored in the conversion target data storage unit 122 of. At the stage of registration, the conversion presence / absence data D3 is all data indicating that the conversion has not been performed.

なお、上記のような過程を経ることなく、例えば、会計支援システム100を運用する企業や税理士法人等の従業員によって、会計支援装置1に直接接続されたスキャナ等を用いて、ユーザUから預かった医療領収書の原本又はそのコピーをスキャンすることで、会計支援装置1が、直接医療領収書画像データD2を取得するようにしてもよい。 It should be noted that, without going through the above process, for example, an employee of a company operating the accounting support system 100 or a tax accountant corporation uses a scanner or the like directly connected to the accounting support device 1 to receive the receipt from the user U. The accounting support device 1 may directly acquire the medical receipt image data D2 by scanning the original medical receipt or a copy thereof.

[2 ステップS2:医療領収書の変換]
続いて、会計支援装置1において、医療領収書画像データD2に対するOCRソフトウェア129による文字コードへの変換等の処理がなされる。医療領収書の変換の過程は、図5に示すように、ステップS2−1からS2−8の8つのステップからなる。
なお、これらの過程は、医療領収書変換エンジン127に従って、制御部11によって自動的に行われる。
[2 Step S2: Conversion of medical receipt]
Subsequently, in the accounting support device 1, processing such as conversion of the medical receipt image data D2 into a character code by the OCR software 129 is performed. As shown in FIG. 5, the process of converting the medical receipt consists of eight steps from steps S2-1 to S2-8.
Note that these processes are automatically performed by the control unit 11 according to the medical receipt conversion engine 127.

[(1)ステップS2−1:変換対象データの抽出]
会計支援装置1は、まず、変換対象データ記憶部122から、変換対象となる、未変換の医療領収書画像データD2を抽出する。
具体的には、制御部11が、記憶部12の変換対象データ記憶部122から、変換有無データD3によって、医療領収書画像データD2のそれぞれにつき、既にOCRソフトウェア129による変換等の後述の処理がなされたデータであるかを判別の上、未変換のデータを選択して抽出する。
[(1) Step S2-1: Extraction of data to be converted]
The accounting support device 1 first extracts the unconverted medical receipt image data D2 to be converted from the conversion target data storage unit 122.
Specifically, the control unit 11 has already performed the later processing such as conversion by the OCR software 129 from the conversion target data storage unit 122 of the storage unit 12 by the conversion presence / absence data D3 for each of the medical receipt image data D2. After determining whether the data is made, select and extract the unconverted data.

[(2)ステップS2−2:コマ画像データの生成]
会計支援装置1において、変換の対象となる未変換の医療領収書画像データD2が抽出されると、制御部11は、続いて、抽出された医療領収書画像データD2につき、コマC、すなわち罫線Lで囲まれた領域ごとに分割し、コマ画像データD7を生成する。具体的には、以下のとおりである。
[(2) Step S2-2: Generation of frame image data]
When the unconverted medical receipt image data D2 to be converted is extracted in the accounting support device 1, the control unit 11 subsequently refers to the extracted medical receipt image data D2 as frame C, that is, a ruled line. The frame image data D7 is generated by dividing each area surrounded by L. Specifically, it is as follows.

[ステップS2−2−1:直線検出]
まず、制御部11は、医療領収書画像データD2から、直線を検出する。直線の検出の手法は特に限定されないが、例えば、モノクロに変換した医療領収書画像データD2からエッジ(明るさの変化が大きい箇所)を抽出することで直線を検出すればよい。
[Step S2-2-1: Straight line detection]
First, the control unit 11 detects a straight line from the medical receipt image data D2. The method for detecting the straight line is not particularly limited, but for example, the straight line may be detected by extracting an edge (a portion where the change in brightness is large) from the medical receipt image data D2 converted to monochrome.

[ステップS2−2−2:コマの識別]
続いて、制御部11は、ステップS2−2−1において検出された直線に基づき、コマCを識別する。具体的には、検出された直線の位置から、四方が直線で囲まれ、長方形が形成された領域を算出の上、当該領域を、罫線Lによって囲まれたコマCと識別する。
なお、図9に示すように、罫線Lによって囲まれた領域には、長方形の一部の角部に曲線部分が存在する領域も存在するが、このような領域についても、例えば、四辺それぞれの少なくとも一部が直線である場合にはコマCとして識別されるようにすることで、コマCとして識別することができる。このような領域についても、上下左右の四辺それぞれの少なくとも一部が直線である限り、本発明においては、直線によって囲まれているものとする。
[Step S2-2-2: Identification of frames]
Subsequently, the control unit 11 identifies the coma C based on the straight line detected in step S2-2-1. Specifically, from the position of the detected straight line, a region surrounded by straight lines on all sides and a rectangle is formed is calculated, and the region is identified as the frame C surrounded by the ruled line L.
As shown in FIG. 9, in the area surrounded by the ruled line L, there is an area in which a curved portion exists at a part of the corners of the rectangle. In such an area, for example, each of the four sides When at least a part of it is a straight line, it can be identified as a frame C by identifying it as a frame C. In the present invention, such a region is also surrounded by straight lines as long as at least a part of each of the four sides of the top, bottom, left, and right is a straight line.

[ステップS2−2−3:コマ画像データの生成]
続いて、制御部11は、ステップS2−2−2において識別されたコマCごとに医療領収書画像データD2から切り出すようにして、図10から図13に示すような、コマ画像データD7を生成する。なお、図10から図13に示したコマ画像データD7は一例に過ぎず、これらの他にステップS2−2−2においてコマCと識別された全ての部分につき、コマ画像データD7が作成される。
[Step S2-2-3: Generation of frame image data]
Subsequently, the control unit 11 generates frame image data D7 as shown in FIGS. 10 to 13 by cutting out each frame C identified in step S2-2-2 from the medical receipt image data D2. To do. The frame image data D7 shown in FIGS. 10 to 13 is only an example, and in addition to these, frame image data D7 is created for all the portions identified as frame C in step S2-2-2. ..

コマ画像データD7の作成の際には、ステップS2−2−2において識別されたコマCの周囲まで僅かに切り出すようにして、各コマCよりも一回り大きい画像を生成することが好ましい。
医療領収書等の証憑においては、印字の位置が証憑内の表に対してずれた結果として、本来表の枠内に収まるべき印字が表から僅かにはみ出していることがあるが、コマ画像データD7を、各コマCよりも大きく作成することで、印字が表からはみ出した医療領収書に係る医療領収書画像データD2にも対応し易くなる。
When creating the frame image data D7, it is preferable to generate an image one size larger than each frame C by slightly cutting out the periphery of the frame C identified in step S2-2-2.
In vouchers such as medical receipts, as a result of the printing position shifting from the table in the voucher, the print that should originally fit in the frame of the table may slightly protrude from the table, but the frame image data By making D7 larger than each frame C, it becomes easy to correspond to the medical receipt image data D2 related to the medical receipt whose print is out of the table.

また、コマ画像データD7の生成の際には、同時に、各コマCについて、例えばその4隅について医療領収書画像データD2に係る画像上におけるX軸方向及びY軸方向の座標を記録する等の方法により、各コマ画像データD7に係るコマCにつき、医療領収書画像データD2上での位置を判別可能としたデータであるコマ位置情報データD8を作成する。
コマ画像データD7とコマ位置情報データD8とは、例えば、コマ画像データD7に係る各コマCに番号を振ると共に、コマ画像データD7とこれに対応するコマ位置情報データD8の両者に当該番号を記憶する等の方法によって対応付けられる。
Further, when the frame image data D7 is generated, at the same time, the coordinates in the X-axis direction and the Y-axis direction on the image related to the medical receipt image data D2 are recorded for each frame C, for example, for the four corners thereof. By the method, for each frame C related to each frame image data D7, frame position information data D8, which is data capable of determining the position on the medical receipt image data D2, is created.
The frame image data D7 and the frame position information data D8 are assigned numbers to each frame C related to the frame image data D7, and the numbers are assigned to both the frame image data D7 and the corresponding frame position information data D8. It is associated by a method such as storing.

[(3)ステップS2−3:枠外画像データの生成]
コマ画像データD7が生成されると、会計支援装置1の制御部11は、続いて、ステップS2−2でコマ画像データD7が生成された医療領収書画像データD2につき、コマC、すなわちステップS2−2−2で直線によって囲まれた領域として識別された部分を除いた画像データである枠外画像データD9を生成する。
[(3) Step S2-3: Generation of out-of-frame image data]
When the frame image data D7 is generated, the control unit 11 of the accounting support device 1 subsequently refers to the frame C, that is, step S2, with respect to the medical receipt image data D2 for which the frame image data D7 was generated in step S2-2. The out-of-frame image data D9, which is the image data excluding the portion identified as the region surrounded by the straight line in -2-2, is generated.

具体的には、ステップS2−2−2において識別されたコマC部分の記載を全て消去し、例えば図14に示すような、コマC以外の部分のみが記載された画像を生成する。当該画像のデータが、枠外画像データD9である。 Specifically, all the description of the frame C portion identified in step S2-2-2 is deleted, and an image in which only the portion other than the frame C is described, as shown in FIG. 14, is generated. The image data is the out-of-frame image data D9.

[(4)ステップS2−4:OCR処理]
ステップS2−2においてコマ画像データD7が生成され、ステップS2−3において枠外画像データD9が生成されると、続いて、OCR処理がなされる。
具体的には、会計支援装置1の制御部11は、OCRソフトウェア129を用いて、コマ画像データD7のそれぞれ及び枠外画像データD9につき、個別に文字コードに変換し、コマ画像データD7のそれぞれに対応した、OCRソフトウェア129による変換結果のデータである複数のコマ画像変換結果データD10と、枠外画像データD9に対応した、OCRソフトウェア129による変換結果のデータである枠外画像変換結果データD11と、を作成する。すなわち、制御部11が、コマ画像データD7及び枠外画像データD9の変換手段として機能することとなる。
[(4) Step S2-4: OCR processing]
When the frame image data D7 is generated in step S2-2 and the out-of-frame image data D9 is generated in step S2-3, OCR processing is subsequently performed.
Specifically, the control unit 11 of the accounting support device 1 individually converts each of the frame image data D7 and the out-of-frame image data D9 into a character code using the OCR software 129, and converts each of the frame image data D7 into a character code. The corresponding plurality of frame image conversion result data D10 which is the conversion result data by the OCR software 129 and the out-of-frame image conversion result data D11 which is the conversion result data by the OCR software 129 corresponding to the out-of-frame image data D9. create. That is, the control unit 11 functions as a conversion means for the frame image data D7 and the out-of-frame image data D9.

なお、例えば、OCRソフトウェア129そのものは、会計支援装置1の記憶部12に記憶されずに所定のクラウドサーバ上に記憶され、記憶部12内には、このようなOCRソフトウェア129を呼び出すためのURL、パスワード等の情報のみ記憶されており、クラウドサーバ上のOCRソフトウェア129を逐一呼び出して変換が行われる場合においても、このような呼び出しは制御部11が行うことから、この場合も、制御部11が、コマ画像データD7及び枠外画像データD9の変換手段として機能することとなる。
また、本発明におけるコマ画像変換結果データD10及び枠外画像変換結果データD11の取得には、OCRソフトウェア129を使用して、制御部11自らがコマ画像データD7及び枠外画像データD9を変換する場合と、クラウドサーバ上のOCRソフトウェア129によってコマ画像データD7及び枠外画像データD9が変換されたデータを、通信部13を介して受信する場合の両者が含まれる。
For example, the OCR software 129 itself is stored on a predetermined cloud server without being stored in the storage unit 12 of the accounting support device 1, and the URL for calling such OCR software 129 is stored in the storage unit 12. , Passwords and other information are stored, and even when the OCR software 129 on the cloud server is called one by one for conversion, the control unit 11 makes such a call. Therefore, in this case as well, the control unit 11 However, it functions as a conversion means for the frame image data D7 and the out-of-frame image data D9.
Further, in order to acquire the frame image conversion result data D10 and the out-of-frame image conversion result data D11 in the present invention, the control unit 11 itself converts the frame image data D7 and the out-of-frame image data D9 by using the OCR software 129. , Both are included in the case where the frame image data D7 and the out-of-frame image data D9 are converted by the OCR software 129 on the cloud server and received via the communication unit 13.

なお、コマ画像データD7と、これを変換した結果であるコマ画像変換結果データD10とは、例えば、コマ画像データD7に係る各コマCに番号を振ると共に、コマ画像データD7とこれに対応するコマ画像変換結果データD10の両者に当該番号を記憶する等の方法によって対応付けられる。 The frame image data D7 and the frame image conversion result data D10 which is the result of converting the frame image data D7 are assigned a number to each frame C related to the frame image data D7, and correspond to the frame image data D7. Both of the frame image conversion result data D10 are associated with each other by a method such as storing the number.

[(5)ステップS2−5:コマ画像の分割]
ステップS2−4において、コマ画像変換結果データD10と、枠外画像変換結果データD11とが作成されると、続いて、制御部11は、コマ画像データD7のうち、複数行の文字列が含まれるものにつき分割を行う。
具体的には、以下のステップS2−5−1からステップS2−5−4の4つの過程を経て、分割が行われる。
[(5) Step S2-5: Division of frame image]
When the frame image conversion result data D10 and the out-of-frame image conversion result data D11 are created in step S2-4, the control unit 11 subsequently includes a plurality of lines of character strings in the frame image data D7. Divide things.
Specifically, the division is performed through the following four steps from step S2-5-1 to step S2-5-4.

[ステップS2−5−1:文字列の存否の判定]
まず、制御部11は、各コマ画像データD7につき、ステップS2−4において作成されたコマ画像変換結果データD10に、OCRソフトウェア129によって生成された文字コードが含まれているか否かを判定する。
[Step S2-5-1: Judgment of existence / absence of character string]
First, for each frame image data D7, the control unit 11 determines whether or not the frame image conversion result data D10 created in step S2-4 includes the character code generated by the OCR software 129.

ここで、コマ画像変換結果データD10に、OCRソフトウェア129によって生成された文字コードが含まれていると判定されたコマ画像データD7は、文字列が存在しているコマCに係るデータを意味しており、ステップS2−5−2に進む。
これに対し、ここで、コマ画像変換結果データD10に、OCRソフトウェア129によって生成された文字コードが含まれていないと判定されたコマ画像データD7は、文字列が存在しない空欄となっているコマCに係るデータを意味しており、ステップS2−5におけるこの後の処理から除外され、ステップS2−6に進む。
Here, the frame image data D7 determined to include the character code generated by the OCR software 129 in the frame image conversion result data D10 means the data related to the frame C in which the character string exists. Then, the process proceeds to step S2-5-2.
On the other hand, here, the frame image data D7 determined that the frame image conversion result data D10 does not include the character code generated by the OCR software 129 is a blank frame in which no character string exists. It means the data related to C, is excluded from the subsequent processing in step S2-5, and proceeds to step S2-6.

[ステップS2−5−2:行数の判定]
続いて、制御部11は、各コマ画像データD7と、これに対応したコマ画像変換結果データD10とを用いて、各コマ画像データD7に複数行の文字列が含まれるか否かを判定する。
[Step S2-5-2: Determining the number of lines]
Subsequently, the control unit 11 uses each frame image data D7 and the corresponding frame image conversion result data D10 to determine whether or not each frame image data D7 includes a character string of a plurality of lines. ..

具体的には、OCR処理によって取得された文字コードの列には1文字ごとに元画像(ここではコマ画像データD7)に対する位置情報が付与されていることから、この位置情報を基に、X軸方向(横方向)において近い位置にある文字列を行と推定し、このような行のY軸方向(縦方向)の数から、行数を判定する。
そして、このようにして行数が複数と判定されたコマ画像変換結果データD10に対応するコマ画像データD7を、図10及び図11に示すような、複数行の文字列を含むコマ画像データD7であると判定し、行数が一行のみとされたコマ画像変換結果データD10に対応するコマ画像データD7を、図12及び図13に示すような、複数行の文字列を含まないコマ画像データD7であると判定する。
ここで複数行の文字列を含まないと判定されたコマ画像データD7は、ステップS2−5におけるこの後の処理から除外され、ステップS2−6に進む。
Specifically, since the position information for the original image (here, the frame image data D7) is given to each character in the character code string acquired by the OCR processing, X is based on this position information. A character string located close to each other in the axial direction (horizontal direction) is estimated as a line, and the number of lines is determined from the number of such lines in the Y-axis direction (vertical direction).
Then, the frame image data D7 corresponding to the frame image conversion result data D10 in which the number of lines is determined to be a plurality of lines in this way is the frame image data D7 including a character string of a plurality of lines as shown in FIGS. 10 and 11. The frame image data D7 corresponding to the frame image conversion result data D10, which is determined to be only one line, is the frame image data that does not include a multi-line character string as shown in FIGS. 12 and 13. It is determined that it is D7.
Here, the frame image data D7 determined not to include the character strings of a plurality of lines is excluded from the subsequent processing in step S2-5, and the process proceeds to step S2-6.

[ステップS2−5−3:隣接コマとの行数の一致の判定]
続いて、制御部11は、複数行の文字列が含まれると判定されたコマ画像データD7につき、当該コマ画像データD7に係るコマCと、その右側に隣接するコマCとの行数が一致するか否かを判定する。
[Step S2-5-3: Determination of matching of the number of lines with the adjacent frame]
Subsequently, the control unit 11 matches the number of lines of the frame C related to the frame image data D7 and the frame C adjacent to the right side of the frame image data D7 determined to include the character strings of a plurality of lines. Determine whether or not to do so.

具体的には、コマ位置情報データD8に基づき、複数行の文字列が含まれると判定されたコマ画像データD7に係るコマCの右に、これに隣接するコマC、すなわち、左に位置するコマCの右の罫線と、右に位置するコマCの左の罫線とが共通するコマCが存在するかを判定の上、存在すると判定された場合に、さらにこのような2つのコマCにつき、上端及び下端のY軸方向の位置が一致するかを判定する。
その上で、これが一致する場合に、さらに、これら2つのコマCにつき、ステップS2−5−2において判定された行数を比較し、行数が一致するかを判定する。
Specifically, it is located to the right of the frame C related to the frame image data D7 determined to include a character string of a plurality of lines based on the frame position information data D8, that is, the frame C adjacent to the frame C, that is, to the left. After determining whether there is a frame C in which the right border of the frame C and the left border of the frame C located on the right are common, if it is determined that the frame C exists, then for each of these two frames C , Determine if the positions of the upper and lower ends in the Y-axis direction match.
Then, when they match, the number of rows determined in step S2-5-2 is further compared for these two frames C, and it is determined whether or not the numbers of rows match.

[ステップS2−5−4:行分割画像の生成]
続いて、制御部11は、ステップS2−5−2において複数行の文字列が含まれると判定されたコマ画像データD7について、これを行ごとに分割し、図15及び図16に示すような、行毎コマ画像データD12を生成する。なお、図15は図10に係るコマ画像データD7の一行目を切り出したものであり、図16は図11に係るコマ画像データD7の一行目を切り出したものである。
また、行毎コマ画像データD12が生成されたコマCに係るコマ画像変換結果データD10については、行毎コマ画像データD12に合わせて分割され、行毎コマ画像変換結果データD13が生成される。
[Step S2-5-4: Generation of line-split image]
Subsequently, the control unit 11 divides the frame image data D7 determined to include the character strings of a plurality of lines in step S2-5-2 into each line, as shown in FIGS. 15 and 16. , Line-by-line frame image data D12 is generated. Note that FIG. 15 is a cut-out of the first line of the frame image data D7 according to FIG. 10, and FIG. 16 is a cut-out of the first line of the frame image data D7 according to FIG.
Further, the frame image conversion result data D10 related to the frame C in which the line-by-line frame image data D12 is generated is divided according to the line-by-line frame image data D12, and the line-by-frame image conversion result data D13 is generated.

なお、行毎コマ画像データD12と、行毎コマ画像変換結果データD13とは、例えば、上記のように、コマ画像データD7に係る各コマCに番号を振ると共に、行毎コマ画像データD12とこれに対応する行毎コマ画像変換結果データD13に、当該番号に加え、当該コマC内で上から何行目の行のデータであるかを記憶する等の方法によって紐付けられる。 The line-by-line frame image data D12 and the line-by-line frame image conversion result data D13 are, for example,, as described above, each frame C related to the frame image data D7 is numbered, and the line-by-line frame image data D12 is used. The line-by-line image conversion result data D13 corresponding to this is associated with the data by a method such as storing the data of the line from the top in the frame C in addition to the number.

[(6)ステップS2−6:項目名コマの判定]
続いて、制御部11は、各コマ画像データD7又は行毎コマ画像データD12が、所定の項目名を含むかを判定する。
[(6) Step S2-6: Judgment of item name frame]
Subsequently, the control unit 11 determines whether each frame image data D7 or line-by-line frame image data D12 includes a predetermined item name.

まず、制御部11は、ステップS2−5−4において行毎コマ画像データD12に分割されたコマCについて、行毎コマ画像データD12が、所定の項目名を含むかを判定する。
具体的には、項目名に該当する所定の文字列についてのデータを予め記憶部12に記憶しておき、当該データに含まれる文字列と一致する文字列が行毎コマ画像変換結果データD13に含まれるかを判定し、含まれる場合に、当該行毎コマ画像変換結果データD13に対応する行毎コマ画像データD12につき、所定の項目名を含むものと判定する。
First, the control unit 11 determines whether the line-by-line frame image data D12 includes a predetermined item name for the frame C divided into the line-by-line frame image data D12 in step S2-5-4.
Specifically, the data about the predetermined character string corresponding to the item name is stored in the storage unit 12 in advance, and the character string matching the character string included in the data is stored in the line-by-frame image conversion result data D13. It is determined whether or not the data is included, and if it is included, it is determined that the row-by-line frame image data D12 corresponding to the row-by-frame image conversion result data D13 includes a predetermined item name.

続いて、制御部11は、ステップS2−5−4において行毎コマ画像データD12に分割されなかったコマCについて、コマ画像データD7が、所定の項目名を含むかを判定する。
この場合も同様に、項目名に該当する所定の文字列についてのデータを記憶部12に記憶しておき、当該データに含まれる文字列と一致する文字列がコマ画像変換結果データD10に含まれるかを判定し、含まれる場合に、当該コマ画像変換結果データD10に対応するコマ画像データD7につき、所定の項目名を含むものと判定する。
Subsequently, the control unit 11 determines whether the frame image data D7 includes a predetermined item name for the frame C that is not divided into the line-by-line frame image data D12 in step S2-5-4.
In this case as well, the data for the predetermined character string corresponding to the item name is stored in the storage unit 12, and the character string matching the character string included in the data is included in the frame image conversion result data D10. If it is included, it is determined that the frame image data D7 corresponding to the frame image conversion result data D10 includes a predetermined item name.

本実施形態においては、抽出項目データD4のうち、日付項目データD4−1、第一支払項目データD4−5、医療・治療項目データD4−7、医療品購入項目データD4−8、介護保険サービス項目データD4−9が、項目名に該当する所定の文字列についてのデータに該当する。
なお、項目名を含むものと判定された行毎コマ画像データD12及びコマ画像データD7を、まとめて項目名コマ画像データD14という。また、項目名コマ画像データD14に対応する行毎コマ画像変換結果データD13及びコマ画像変換結果データD10を、項目名コマ画像変換結果データD15という。
In the present embodiment, among the extracted item data D4, date item data D4-1, first payment item data D4-5, medical / treatment item data D4-7, medical product purchase item data D4-8, nursing care insurance service Item data D4-9 corresponds to the data for a predetermined character string corresponding to the item name.
The line-by-line frame image data D12 and the frame image data D7 determined to include the item name are collectively referred to as the item name frame image data D14. Further, the line-by-line frame image conversion result data D13 and the frame image conversion result data D10 corresponding to the item name frame image data D14 are referred to as item name frame image conversion result data D15.

[(7)ステップS2−7:コマ画像の合成]
ステップS2−6において、項目名コマ画像データD14が抽出されると、続いて、制御部11は、コマ画像の合成を行う。
なお、合成された画像データを、コマ画像データD7同士が合成されたものか、行毎コマ画像データD12同士が合成されたものかを問わず、二コマ画像データD16という。
[(7) Step S2-7: Combining frame images]
When the item name frame image data D14 is extracted in step S2-6, the control unit 11 subsequently synthesizes the frame images.
It should be noted that the combined image data is referred to as two-frame image data D16 regardless of whether the frame image data D7 are combined with each other or the frame-by-line image data D12 are combined with each other.

[ステップS2−7−1:行毎コマ画像同士の合成]
まず、複数行の文字列を含み、かつ同一行数のコマCが左右に隣接する場合、左右のコマCの同一行目の行毎コマ画像データD12同士が合成される。
具体的には、まず、ステップS2−5−2において複数行の文字列が含まれると判定され、ステップS2−5−3において隣接するコマCと行数が一致するものと判定されたコマ画像データD7が、ステップS2−5−4において分割されて生成された行毎コマ画像データD12を抽出の上、更にその中から、ステップS2−6において、項目名コマ画像データD14に該当すると判定されたものを抽出する。
その上で、当該項目名コマ画像データD14と、ステップS2−5−3において行数が一致する隣接するコマCに係るものと判定されたコマ画像データD7が、ステップS2−5−4において分割されて生成された行毎コマ画像データD12のうち、上から数えて同一行目の行毎コマ画像データD12と、を合成する。
[Step S2-7-1: Combining line-by-line frame images]
First, when a plurality of lines of character strings are included and frames C having the same number of lines are adjacent to each other on the left and right, frame-by-line image data D12 of the same line of the left and right frames C are combined.
Specifically, first, in step S2-5-2, it is determined that a plurality of lines of character strings are included, and in step S2-5-3, it is determined that the number of lines matches the adjacent frame C. The data D7 extracts the row-by-line frame image data D12 generated by being divided in steps S2-5-4, and further, in step S2-6, it is determined that the data D7 corresponds to the item name frame image data D14. Extract the data.
Then, the item name frame image data D14 and the frame image data D7 determined to be related to the adjacent frame C having the same number of lines in step S2-5-3 are divided in step S2-5-4. Of the row-by-frame image data D12 generated in this process, the row-by-frame image data D12 of the same row counting from the top is combined.

図17においては、一例として、図10に示すコマ画像データD7の上から数えて一行目に該当する行毎コマ画像データD12が項目名コマ画像データD14に該当すると判定され、その右に隣接する図11に示すコマ画像データD7の上から数えて同一行目、すなわち一行目に該当する行毎コマ画像データD12と合成された二コマ画像データD16を図示している。 In FIG. 17, as an example, it is determined that the line-by-line frame image data D12 corresponding to the first line counting from the top of the frame image data D7 shown in FIG. 10 corresponds to the item name frame image data D14, and is adjacent to the right side thereof. The two-frame image data D16 combined with the line-by-line frame image data D12 corresponding to the same line, that is, the first line, counting from the top of the frame image data D7 shown in FIG. 11 is shown.

[ステップS2−7−2:コマ画像同士の合成]
続いて、複数行の文字列を含まないコマCが上下に隣接し、かつこれらのX軸方向の幅が等しい場合、上下に隣接するコマCのコマ画像データD7同士が合成される。
具体的には、まず、ステップS2−5−2において複数行の文字列が含まれると判定されなかったコマ画像データD7を抽出の上、更にその中から、ステップS2−6において、項目名コマ画像データD14に該当すると判定されたものを抽出する。
その上で、当該項目名コマ画像データD14の下に、これと隣接するコマC、すなわち、上に位置するコマCの下の罫線と、下に位置するコマCの上の罫線とが共通するコマCが存在するかを判定の上、存在した場合に、さらにX軸方向の幅並びに左端部及び右端部のX軸方向の位置が一致するかを判定し、これらが一致する場合に、項目名コマ画像データD14に該当するコマ画像データD7と、その下に隣接するコマ画像データD7とを合成する。
[Step S2-7-2: Combining frame images]
Subsequently, when the frames C not including the character strings of a plurality of lines are vertically adjacent to each other and their widths in the X-axis direction are equal, the frame image data D7s of the vertically adjacent frames C are combined.
Specifically, first, the frame image data D7 that was not determined to contain the character strings of a plurality of lines in step S2-5-2 is extracted, and then the item name frame is further extracted in step S2-6. The data determined to correspond to the image data D14 is extracted.
On top of that, under the item name frame image data D14, the border line adjacent to the frame C, that is, the border line below the frame C located above and the border line above the frame C located below are common. After determining whether the frame C exists, if it exists, it is further determined whether the width in the X-axis direction and the positions of the left end and the right end in the X-axis match, and if they match, the item The frame image data D7 corresponding to the name frame image data D14 and the frame image data D7 adjacent to the frame image data D7 are combined.

図18においては、一例として、図12に示すコマ画像データD7が項目名コマ画像データD14に該当すると判定され、かつ、その下に隣接する図13に示すコマ画像データD7とX軸方向の幅並びに左端部及び右端部のX軸方向の位置が一致するものと判定され、これらが合成された二コマ画像データD16を図示している。 In FIG. 18, as an example, it is determined that the frame image data D7 shown in FIG. 12 corresponds to the item name frame image data D14, and the width of the frame image data D7 shown in FIG. 13 adjacent to the frame image data D7 in the X-axis direction. Further, it is determined that the positions of the left end portion and the right end portion in the X-axis direction match, and the two-frame image data D16 in which these are combined is shown in the figure.

[(8)ステップS2−8:データの保存]
ステップS2−7まで完了すると、制御部11は、生成されたデータの保存を行う。
[(8) Step S2-8: Saving data]
When steps S2-7 are completed, the control unit 11 saves the generated data.

具体的には、制御部11は、ステップS2−5において分割されず、かつステップS2−7において合成もされていないコマCについては、コマ画像データD7につき、これに対応するコマ画像変換結果データD10と紐付けて、記憶部12の変換データ記憶部123に記憶させる。
また、ステップS2−5において分割され、ステップS2−7において合成されていないコマCについては、行毎コマ画像データD12につき、これに対応する行毎コマ画像変換結果データD13と紐付けて、記憶部12の変換データ記憶部123に記憶させる。
また、ステップS2−5において分割され、ステップS2−7において合成されたコマCについては、二コマ画像データD16につき、これに対応する行毎コマ画像変換結果データD13と紐付けて、記憶部12の変換データ記憶部123に記憶させる。
また、ステップS2−5において分割されず、ステップS2−7において合成されたコマCについては、二コマ画像データD16につき、これに対応するコマ画像変換結果データD10と紐付けて、記憶部12の変換データ記憶部123に記憶させる。
なお、このようにして記憶された、コマ画像データD7、行毎コマ画像データD12及び二コマ画像データD16を、合わせて分割・合成後コマ画像データD17といい、これらに対応付けて記憶されたコマ画像変換結果データD10及び行毎コマ画像変換結果データD13を、分割・合成後コマ画像変換結果データD18という。
なお、分割・合成後コマ画像データD17は、いずれも、医療領収書画像データD2上での位置を判別できるように、これ対応したコマ位置情報データD8と紐付けて記憶される。また、このうち、行毎コマ画像データD12に該当するものついては、分割前のコマ画像データD7において上から何行目の行のデータであるかについてのデータも記憶される。
Specifically, the control unit 11 refers to the frame image data D7 for the frame C which is not divided in step S2-5 and is not synthesized in step S2-7, and the corresponding frame image conversion result data. It is associated with D10 and stored in the conversion data storage unit 123 of the storage unit 12.
Further, for the frame C that is divided in step S2-5 and is not synthesized in step S2-7, the row-by-frame image data D12 is associated with the corresponding row-by-frame image conversion result data D13 and stored. It is stored in the conversion data storage unit 123 of the unit 12.
Further, for the frame C divided in step S2-5 and synthesized in step S2-7, the two-frame image data D16 is associated with the corresponding line-by-line frame image conversion result data D13, and is stored in the storage unit 12. Is stored in the conversion data storage unit 123 of.
Further, for the frame C that was not divided in step S2-5 and was synthesized in step S2-7, the two-frame image data D16 is associated with the corresponding frame image conversion result data D10, and the storage unit 12 It is stored in the converted data storage unit 123.
The frame image data D7, the line-by-line frame image data D12, and the two-frame image data D16 stored in this way are collectively referred to as the divided / combined frame image data D17, and are stored in association with these. The frame image conversion result data D10 and the line-by-line frame image conversion result data D13 are referred to as frame image conversion result data D18 after division / synthesis.
The divided / combined frame image data D17 is stored in association with the corresponding frame position information data D8 so that the position on the medical receipt image data D2 can be determined. Further, among these, for the data corresponding to the frame-by-line frame image data D12, the data regarding the row number from the top in the frame image data D7 before division is also stored.

また、制御部11は、枠外画像データD9についても、これに対応する枠外画像変換結果データD11と紐付けて、記憶部12の変換データ記憶部123に記憶させる。 Further, the control unit 11 also stores the out-of-frame image data D9 in the conversion data storage unit 123 of the storage unit 12 in association with the corresponding out-of-frame image conversion result data D11.

[3 ステップS3:クラウドワーカによるチェック]
続いて、ステップS2における変換結果のクラウドワーカ(作業者W)によるチェックがなされる。クラウドワーカ(作業者W)によるチェックの過程は、図6に示すように、ステップS3−1からS3−5の5つのステップからなる。
なお、これらの過程も、会計支援装置1において行われるものは、制御部11によって医療領収書変換エンジン127に従って、自動的に行われる。
[3 Step S3: Check by cloud worker]
Subsequently, the conversion result in step S2 is checked by the cloud worker (worker W). As shown in FIG. 6, the check process by the cloud worker (worker W) consists of five steps from steps S3-1 to S3-5.
It should be noted that these processes, which are performed in the accounting support device 1, are automatically performed by the control unit 11 according to the medical receipt conversion engine 127.

[(1)ステップS3−1:作業者端末への送信]
まず、会計支援装置1の制御部11は、チェック対象となるデータの作業者端末2への送信を行う。
[(1) Step S3-1: Transmission to worker terminal]
First, the control unit 11 of the accounting support device 1 transmits the data to be checked to the worker terminal 2.

具体的には、制御部11は、図2に示すように、ステップS2−8において記憶部12の変換データ記憶部123に記憶された分割・合成後コマ画像データD17につき、これに対応した分割・合成後コマ画像変換結果データD18と共に、通信部13から、通信ネットワークNを介して、データ毎に別個の作業者端末2へと送信する。また、枠外画像データD9についても、枠外画像変換結果データD11と共に、分割・合成後コマ画像データD17が送信されたのとは別の作業者端末2へと送信する。 Specifically, as shown in FIG. 2, the control unit 11 divides the divided / combined frame image data D17 stored in the converted data storage unit 123 of the storage unit 12 in step S2-8 corresponding to the divided / combined frame image data D17. Along with the post-composite frame image conversion result data D18, the data is transmitted from the communication unit 13 to a separate worker terminal 2 via the communication network N. Further, the out-of-frame image data D9 is also transmitted together with the out-of-frame image conversion result data D11 to a worker terminal 2 different from the one in which the divided / combined frame image data D17 is transmitted.

[(2)ステップS3−2:作業者端末における表示]
会計支援装置1から送信された分割・合成後コマ画像データD17及びこれに対応した分割・合成後コマ画像変換結果データD18を、通信部23によって受信した作業者端末2においては、制御部21が、受信した分割・合成後コマ画像データD17及びこれに対応した分割・合成後コマ画像変換結果データD18を、記憶部22の表示画面データ記憶部221に記憶された表示画面データD6にあてはめた上で、表示部24に表示する。
具体的には、分割・合成後コマ画像データD17と、これに対応した分割・合成後コマ画像変換結果データD18とが、同一の画面上に並べて表示される。この際には、分割・合成後コマ画像変換結果データD18については、作業者Wが、操作部25を用いて修正可能に表示される。
なお二コマ画像データD16については、2つのコマに係るコマ画像データD7又は行毎コマ画像データD12と、これらに係る2つのコマ画像変換結果データD10又は行毎コマ画像変換結果データD13の計4つが同時に表示されることとなる。
[(2) Step S3-2: Display on the worker terminal]
In the worker terminal 2 in which the communication unit 23 receives the divided / combined frame image data D17 and the corresponding divided / combined frame image conversion result data D18 transmitted from the accounting support device 1, the control unit 21 The received divided / combined frame image data D17 and the corresponding divided / combined frame image conversion result data D18 are applied to the display screen data D6 stored in the display screen data storage unit 221 of the storage unit 22. Then, it is displayed on the display unit 24.
Specifically, the divided / combined frame image data D17 and the corresponding divided / combined frame image conversion result data D18 are displayed side by side on the same screen. At this time, the divided / combined frame image conversion result data D18 is displayed so that the worker W can modify it by using the operation unit 25.
Regarding the two-frame image data D16, a total of 4 frames image data D7 or line-by-line frame image data D12 related to the two frames and two frame image conversion result data D10 or line-by-line image conversion result data D13 related to these. Will be displayed at the same time.

また枠外画像データD9及びこれに対応した枠外画像変換結果データD11を、通信部23によって受信した作業者端末2においては、制御部21が、受信した枠外画像データD9及びこれに対応した枠外画像変換結果データD11を、記憶部22の表示画面データ記憶部221に記憶された表示画面データD6にあてはめた上で、表示部24に表示する。
具体的には、枠外画像データD9と、これに対応した枠外画像変換結果データD11とが、同一の画面上に並べて表示される。また、この際には、枠外画像変換結果データD11については、作業者Wが、操作部25を用いて修正可能に表示される。
Further, in the worker terminal 2 in which the out-of-frame image data D9 and the out-of-frame image conversion result data D11 corresponding thereto are received by the communication unit 23, the control unit 21 receives the out-of-frame image data D9 and the corresponding out-of-frame image conversion. The result data D11 is applied to the display screen data D6 stored in the display screen data storage unit 221 of the storage unit 22, and then displayed on the display unit 24.
Specifically, the out-of-frame image data D9 and the corresponding out-of-frame image conversion result data D11 are displayed side by side on the same screen. Further, at this time, the out-of-frame image conversion result data D11 is displayed so that the worker W can correct it by using the operation unit 25.

なお、コマ画像、枠外画像のいずれについても、画像データと変換結果データの両者が同一の画面上に表示され、かつ変換結果データにつき作業者Wにより修正可能に表示されるものであれば、具体的な表示形式等は特に限定されない。
また、上記のように、表示画面データD6を会計支援装置1の記憶部12に記憶し、これに各データをあてはめた画面のデータを会計支援装置1において生成の上、作業者端末2へと送信するようにしてもよい。
For both the frame image and the out-of-frame image, if both the image data and the conversion result data are displayed on the same screen and the conversion result data can be corrected by the worker W, the specific method is specified. The display format is not particularly limited.
Further, as described above, the display screen data D6 is stored in the storage unit 12 of the accounting support device 1, and the screen data to which each data is applied is generated in the accounting support device 1 and then sent to the worker terminal 2. You may send it.

[(3)ステップS3−3:作業者によるチェック]
続いて、ステップS3−2において分割・合成後コマ画像データD17及びこれに対応した分割・合成後コマ画像変換結果データD18が表示された各作業者端末2を使用する作業者Wは、分割・合成後コマ画像データD17と、これに対応した分割・合成後コマ画像変換結果データD18とを対比の上、変換内容に誤変換がある箇所の分割・合成後コマ画像変換結果データD18について修正を行う。
[(3) Step S3-3: Check by operator]
Subsequently, the worker W who uses each worker terminal 2 displaying the divided / combined frame image data D17 and the corresponding divided / combined frame image conversion result data D18 in step S3-2 is divided and combined. After comparing the post-combination frame image data D17 with the corresponding split / post-combination frame image conversion result data D18, the division / post-combination frame image conversion result data D18 where there is an erroneous conversion in the conversion content is corrected. Do.

また、ステップS3−2において枠外画像データD9及びこれに対応した枠外画像変換結果データD11が表示された作業者端末2を使用する作業者Wは、枠外画像データD9と、これに対応した枠外画像変換結果データD11とを対比の上、変換内容に誤変換がある箇所の枠外画像変換結果データD11について修正を行う。 Further, the worker W who uses the worker terminal 2 on which the out-of-frame image data D9 and the corresponding out-of-frame image conversion result data D11 are displayed in step S3-2 is the out-of-frame image data D9 and the corresponding out-of-frame image. After comparing with the conversion result data D11, the out-of-frame image conversion result data D11 at the place where the conversion content has an erroneous conversion is corrected.

なお、分割・合成後コマ画像変換結果データD18につき作業者Wによるチェック及び誤変換があった場合にその修正が行われたものを、チェック後コマ画像変換結果データD19といい、枠外画像変換結果データD11につき作業者Wによるチェック及び誤変換があった場合にその修正が行われたものを、チェック後枠外画像変換結果データD20という。 It should be noted that the frame image conversion result data D18 after division / composition is checked by the worker W and corrected when there is an erroneous conversion, which is called the frame image conversion result data D19 after the check, and the out-of-frame image conversion result. When the data D11 is checked by the worker W and erroneously converted, the corrected data is referred to as the out-of-frame image conversion result data D20 after the check.

[(4)ステップS3−4:会計支援装置への送信]
ステップS3−3において作業者Wによるチェックが行われ、チェック後コマ画像変換結果データD19又はチェック後枠外画像変換結果データD20が生成されると、各作業者端末2の制御部21は、図2に示すように、チェック後コマ画像変換結果データD19又はチェック後枠外画像変換結果データD20を、通信部23から、通信ネットワークNを介して、会計支援装置1へと送信する。
[(4) Step S3-4: Transmission to accounting support device]
When the check is performed by the worker W in step S3-3 and the frame image conversion result data D19 after the check or the out-of-frame image conversion result data D20 after the check is generated, the control unit 21 of each worker terminal 2 displays FIG. As shown in the above, the post-check frame image conversion result data D19 or the post-check out-of-frame image conversion result data D20 is transmitted from the communication unit 23 to the accounting support device 1 via the communication network N.

[(5)ステップS3−5:変換データ記憶部の更新]
会計支援装置1は、通信部13によってチェック後コマ画像変換結果データD19を受信すると、制御部11が、記憶部12の変換データ記憶部123に記憶された分割・合成後コマ画像変換結果データD18を、チェック後コマ画像変換結果データD19に更新する。
また、会計支援装置1は、通信部13によってチェック後枠外画像変換結果データD20を受信すると、制御部11が、記憶部12の変換データ記憶部123に記憶された枠外画像変換結果データD11を、チェック後枠外画像変換結果データD20に更新する。
[(5) Step S3-5: Update conversion data storage unit]
When the accounting support device 1 receives the frame image conversion result data D19 after checking by the communication unit 13, the control unit 11 stores the frame image conversion result data D18 after division / synthesis stored in the conversion data storage unit 123 of the storage unit 12. Is updated to the frame image conversion result data D19 after the check.
Further, when the accounting support device 1 receives the out-of-frame image conversion result data D20 after being checked by the communication unit 13, the control unit 11 displays the out-of-frame image conversion result data D11 stored in the conversion data storage unit 123 of the storage unit 12. After the check, the image conversion result data outside the frame is updated to D20.

[4 ステップS4:医療費控除申請用データの抽出]
続いて、会計支援装置1において、変換結果からの医療費控除申請に必要なデータの抽出がなされる。医療費控除申請用データの抽出過程は、図7に示すように、ステップS4−1からS4−10の10のステップからなり、これらのステップを経て、医療費控除申請用のデータが抽出される。
なお、これらの過程は、医療費控除申請用データ抽出エンジン128に従って、制御部11によって自動的に行われる。
[4 Step S4: Extraction of data for medical expense deduction application]
Subsequently, the accounting support device 1 extracts the data necessary for applying for medical expense deduction from the conversion result. As shown in FIG. 7, the process of extracting the data for medical expense deduction application consists of 10 steps from steps S4-1 to S4-10, and the data for medical expense deduction application is extracted through these steps. ..
In addition, these processes are automatically performed by the control unit 11 according to the data extraction engine 128 for medical expense deduction application.

[(1)ステップS4−1:日付の抽出]
制御部11は、チェック後コマ画像変換結果データD19及びチェック後枠外画像変換結果データD20から、医療費控除申請に必要となる日付に係るデータを抽出する。具体的には以下の通りである。
[(1) Step S4-1: Extraction of date]
The control unit 11 extracts data related to the date required for the medical expense deduction application from the post-check frame image conversion result data D19 and the post-check out-of-frame image conversion result data D20. Specifically, it is as follows.

まず、制御部11は、チェック後コマ画像変換結果データD19のうち、二コマ画像データD16に対応するデータを抽出する。
続いて、制御部11は、抽出された二コマ画像データD16に対応するチェック後コマ画像変換結果データD19のうち、項目名コマ画像変換結果データD15に該当するデータを検索し、その中に、記憶部12の抽出項目データ記憶部125に記憶された抽出項目データD4に含まれる日付項目データD4−1に一致するデータ、すなわち、「診療日」又は「発行日」の文字列がある場合に、二コマ画像データD16において、当該項目名コマ画像変換結果データD15に対応する項目名コマ画像データD14に係るコマCと合成されているコマCに係るチェック後コマ画像変換結果データD19を抽出する。
First, the control unit 11 extracts the data corresponding to the two-frame image data D16 from the frame image conversion result data D19 after the check.
Subsequently, the control unit 11 searches for the data corresponding to the item name frame image conversion result data D15 among the checked frame image conversion result data D19 corresponding to the extracted two-frame image data D16, and contains the data corresponding to the item name frame image conversion result data D15. Extracted item data of the storage unit 12 When there is data matching the date item data D4-1 stored in the extracted item data D4 stored in the storage unit 125, that is, a character string of "medical treatment date" or "issue date". In the two-frame image data D16, the check-after frame image conversion result data D19 related to the frame C synthesized with the item name frame image data D14 corresponding to the item name frame image conversion result data D15 is extracted. ..

さらに、抽出されたチェック後コマ画像変換結果データD19を、抽出項目形式データ記憶部126に記憶された抽出項目形式データD5のうち日付形式データD5−1と対照の上、形式が一致する場合に、当該チェック後コマ画像変換結果データD19を、日付データD21−1として抽出する。 Further, when the extracted checked frame image conversion result data D19 is compared with the date format data D5-1 of the extracted item format data D5 stored in the extracted item format data storage unit 126 and the formats match. After the check, the frame image conversion result data D19 is extracted as date data D21-1.

この場合、例えば、「診療日」又は「発行日」と記載されたコマCと合成されたコマCの記載内容が、例えば、複数の数字が「/」で区切られた形式や、複数の数字が「年」、「月」及び/又は「日」で区切られた形式である場合に、当該記載が抽出されることとなる。
図9及び図18の例であれば、は「発行日」と記載されたコマCの下のコマCの記載内容が、複数の数字が「年」、「月」及び「日」で区切られた形式であることから、当該コマCの記載内容である「平成30年8月24日」が抽出される。
In this case, for example, the description content of the frame C combined with the frame C described as "medical treatment date" or "issue date" may be, for example, a format in which a plurality of numbers are separated by "/" or a plurality of numbers. The description will be extracted if is in the form separated by "year", "month" and / or "day".
In the example of FIGS. 9 and 18, the description content of the frame C below the frame C described as "issue date" is separated by a plurality of numbers by "year", "month" and "day". Since it is in the above format, "August 24, 2018", which is the description content of the frame C, is extracted.

抽出された二コマ画像データD16に対応するチェック後コマ画像変換結果データD19のうち、項目名コマ画像変換結果データD15に該当するデータを検索しても、日付項目データD4−1に一致するデータが発見されなかった場合、制御部11は、チェック後コマ画像変換結果データD19及びチェック後枠外画像変換結果データD20の全てから、日付形式データD5−1と形式が一致する記載を検索し、発見された場合に、当該記載を、日付データD21−1として抽出する。この場合、まずチェック後コマ画像変換結果データD19から、日付形式データD5−1と形式が一致する記載を検索し、発見されなかった場合に、チェック後枠外画像変換結果データD20から日付形式データD5−1と形式が一致する記載を検索することが好ましい。
図8の例であれば、チェック後枠外画像変換結果データD20に、複数の数字が「年」、「月」及び「日」で区切られた形式の記載が存在することから、当該記載の内容である「平成30年01月17日」が抽出される。
Even if the data corresponding to the item name frame image conversion result data D15 is searched among the checked frame image conversion result data D19 corresponding to the extracted two-frame image data D16, the data that matches the date item data D4-1. If is not found, the control unit 11 searches all of the post-check frame image conversion result data D19 and the post-check out-of-frame image conversion result data D20 for a description that matches the format of the date format data D5-1 and finds the data. If so, the description is extracted as date data D21-1. In this case, first, after checking, the frame image conversion result data D19 is searched for a description that matches the format of the date format data D5-1, and if not found, the post-check frame image conversion result data D20 to the date format data D5 It is preferable to search for a description whose format matches -1.
In the case of the example of FIG. 8, since there is a description in the format in which a plurality of numbers are separated by "year", "month" and "day" in the out-of-frame image conversion result data D20 after the check, the content of the description. "January 17, 2018" is extracted.

[(2)ステップS4−2:氏名の抽出]
制御部11は、チェック後コマ画像変換結果データD19及びチェック後枠外画像変換結果データD20から、医療費控除申請に必要となる氏名に係るデータを抽出する。具体的には以下の通りである。
[(2) Step S4-2: Extraction of name]
The control unit 11 extracts data related to the name required for the medical expense deduction application from the post-check frame image conversion result data D19 and the post-check out-of-frame image conversion result data D20. Specifically, it is as follows.

まず、制御部11は、全てのチェック後コマ画像変換結果データD19を検索し、その中に、記憶部12の抽出項目データ記憶部125に記憶された抽出項目データD4に含まれる氏名項目データD4−2に一致するデータ、すなわち、末尾に「様」という文字を含む文字列がある場合に、当該文字列の「様」の前の部分のデータを抽出する。 First, the control unit 11 searches for the frame image conversion result data D19 after all the checks, and in the search, the name item data D4 included in the extraction item data D4 stored in the extraction item data storage unit 125 of the storage unit 12. When there is data that matches -2, that is, a character string including the character "sama" at the end, the data of the part before "sama" in the character string is extracted.

さらに、抽出されたデータを、抽出項目形式データ記憶部126に記憶された抽出項目形式データD5のうち氏名形式データD5−2と対照の上、形式が一致する場合に、当該データを、氏名データD21−2として抽出する。 Further, when the extracted data is compared with the name format data D5-2 of the extracted item format data D5 stored in the extraction item format data storage unit 126 and the formats match, the data is referred to as the name data. Extract as D21-2.

この場合、例えば、末尾に「様」という文字を含む記載内容が、算用数字や記号を含まない文字列の形式である場合に、当該記載が抽出されることとなる。
図8の例であれば、「様」という文字を含むコマCにおいて、「様」の前に記載されている記載内容が、算用数字や記号を含まない文字列の形式であることから、当該コマCの「様」の前の記載内容である「A山A一」が抽出される。
また、図9の例であれば、「様」という文字を含むコマCにおいて、「様」の前に記載されている記載内容が、算用数字や記号でない文字列の形式であることから、当該コマCの「様」の前の記載内容である「B村B子」が抽出される。
なお、例えば、氏名形式データD5−2をアルファベットも除外するように設定してもよいが、ここではアルファベットは除外されないものとして説明する。
In this case, for example, when the description content including the character "sama" at the end is in the form of a character string that does not include arithmetic numbers or symbols, the description is extracted.
In the example of FIG. 8, in the frame C including the character "sama", the description content before "sama" is in the form of a character string that does not include arithmetic numbers or symbols. "A mountain A one" which is the description content before "sama" of the frame C is extracted.
Further, in the example of FIG. 9, in the frame C including the character "sama", the description content described before "sama" is in the form of a character string that is not an arithmetic number or a symbol. "B village B child" which is the description content before "sama" of the frame C is extracted.
Note that, for example, the name format data D5-2 may be set to exclude alphabets as well, but here, it will be described assuming that alphabets are not excluded.

チェック後コマ画像変換結果データD19を検索しても、末尾に「様」という文字を含み、かつ氏名形式データD5−2と形式が一致する文字列の形式のデータが発見されなかった場合、制御部11は、チェック後枠外画像変換結果データD20から、末尾に「様」という文字を含む文字列の形式のデータを検索し、発見された場合に、さらに氏名形式データD5−2と対照の上、形式が一致する場合に、当該記載の「様」の前の部分のデータを、氏名データD21−2として抽出する。
[(3)ステップS4−3:支払先の抽出]
制御部11は、チェック後コマ画像変換結果データD19及びチェック後枠外画像変換結果データD20から、医療費控除申請に必要となる支払先に係るデータを抽出する。具体的には以下の通りである。
If the frame image conversion result data D19 after the check is searched, but no data in the format of a character string that includes the character "sama" at the end and matches the format of the name format data D5-2 is found, control is performed. After checking, the part 11 searches the data in the form of a character string including the character "sama" at the end from the out-of-frame image conversion result data D20, and if found, further contrasts with the name format data D5-2. , When the formats match, the data in the part before the "sama" in the description is extracted as the name data D21-2.
[(3) Step S4-3: Extraction of payees]
The control unit 11 extracts data related to the payee required for the medical expense deduction application from the post-check frame image conversion result data D19 and the post-check out-of-frame image conversion result data D20. Specifically, it is as follows.

まず、制御部11は、全てのチェック後コマ画像変換結果データD19及びチェック後枠外画像変換結果データD20を検索し、その中に、電話番号形式データD5−3に形式が一致する記載がある場合に当該記載を電話番号の記載として抽出する。
例えば、複数の数字が「−」で区切られた形式、複数の数字の間に「()」で括られた数字が存在する形式、又は複数の数字の間に「−」及び「()」の両者が存在する形式である場合に、当該記載が抽出されることとなる。
First, the control unit 11 searches all the post-check frame image conversion result data D19 and the post-check out-of-frame image conversion result data D20, and when there is a description in which the format matches the telephone number format data D5-3. The description is extracted as the description of the telephone number.
For example, a format in which multiple numbers are separated by "-", a format in which a number enclosed in "()" exists between multiple numbers, or a "-" and "()" between multiple numbers. If both of the above are in the existing format, the description will be extracted.

さらに、制御部11は、抽出された電話番号の記載を用いて、記憶部12の抽出項目データ記憶部125に記憶された抽出項目データD4に含まれる医療機関データD4−3を検索の上、抽出された電話番号の記載と一致する電話番号が発見された場合に、当該電話番号と紐付けて記憶された医療機関名を、支払先データD21−3として抽出する。 Further, the control unit 11 searches for the medical institution data D4-3 included in the extracted item data D4 stored in the extracted item data storage unit 125 of the storage unit 12 using the description of the extracted telephone number, and then searches for the medical institution data D4-3. When a telephone number that matches the description of the extracted telephone number is found, the medical institution name stored in association with the telephone number is extracted as payee data D21-3.

図8の例であれば、「(01)2345−6789」という記載が電話番号の記載として抽出された上で、医療機関データD4−3に、当該電話番号と、「A病院」という医療機関名が紐付けて記憶されていた場合に、「A病院」が抽出される。
図9の例であれば、「987−654−3210」という記載が電話番号の記載として抽出された上で、医療機関データD4−3に、当該電話番号と、「B眼科」という医療機関名が紐付けて記憶されていた場合に、「B眼科」が抽出される。
In the example of FIG. 8, the description "(01) 2345-6789" is extracted as the description of the telephone number, and then the telephone number and the medical institution "A hospital" are displayed in the medical institution data D4-3. When the name is associated and memorized, "A hospital" is extracted.
In the example of FIG. 9, the description "987-654-3210" is extracted as the description of the telephone number, and then the telephone number and the medical institution name "B ophthalmology" are displayed in the medical institution data D4-3. "B ophthalmology" is extracted when is associated and memorized.

[(4)ステップS4−4:医薬品の名称の抽出]
制御部11は、チェック後コマ画像変換結果データD19及びチェック後枠外画像変換結果データD20から、医療費控除申請に必要となる医薬品名に係るデータを抽出する。具体的には以下の通りである。
[(4) Step S4-4: Extraction of drug name]
The control unit 11 extracts data related to the drug name required for the medical expense deduction application from the post-check frame image conversion result data D19 and the post-check out-of-frame image conversion result data D20. Specifically, it is as follows.

まず、制御部11は、チェック後コマ画像変換結果データD19及びチェック後枠外画像変換結果データD20を検索し、その中から、記憶部12の抽出項目データ記憶部125に記憶された抽出項目データD4に含まれる医薬品項目データD4−4に含まれる医薬品名と一致する記載を検索の上、これが発見された場合に、使用医薬品データD21−4として抽出する。 First, the control unit 11 searches the post-check frame image conversion result data D19 and the post-check out-of-frame image conversion result data D20, and from among them, the extracted item data D4 stored in the extracted item data storage unit 125 of the storage unit 12. Search for a description that matches the drug name contained in the drug item data D4-4 included in the above, and if this is found, extract it as the drug data used D21-4.

[(5)ステップS4−5:支払金額の抽出]
制御部11は、チェック後コマ画像変換結果データD19及びチェック後枠外画像変換結果データD20から、医療費控除申請に必要となる支払金額に係るデータを抽出する。具体的には以下の通りである。
[(5) Step S4-5: Extraction of payment amount]
The control unit 11 extracts data related to the payment amount required for the medical expense deduction application from the post-check frame image conversion result data D19 and the post-check out-of-frame image conversion result data D20. Specifically, it is as follows.

[ステップS4−5−1:第一支払項目データとの対照]
まず、制御部11は、チェック後コマ画像変換結果データD19のうち、二コマ画像データD16に対応するデータを抽出する。
続いて、制御部11は、抽出された二コマ画像データD16に対応するチェック後コマ画像変換結果データD19のうち、項目名コマ画像変換結果データD15に該当するデータを検索し、その中に、記憶部12の抽出項目データ記憶部125に記憶された抽出項目データD4に含まれる第一支払項目データD4−5に一致するデータ、すなわち、「領収金額」、「請求金額」又は「支払金額」の文字がある場合に、二コマ画像データD16において、当該項目名コマ画像変換結果データD15に対応する項目名コマ画像データD14に係るコマCと合成されているコマCに係るチェック後コマ画像変換結果データD19を抽出する。
[Step S4-5-1: Comparison with the first payment item data]
First, the control unit 11 extracts the data corresponding to the two-frame image data D16 from the frame image conversion result data D19 after the check.
Subsequently, the control unit 11 searches for the data corresponding to the item name frame image conversion result data D15 among the checked frame image conversion result data D19 corresponding to the extracted two-frame image data D16, and contains the data corresponding to the item name frame image conversion result data D15. Extracted item data of storage unit 12 Data matching the first payment item data D4-5 included in the extracted item data D4 stored in the storage unit 125, that is, "receipt amount", "billing amount" or "payment amount" When there is a character of, in the two-frame image data D16, the frame image conversion after the check related to the frame C combined with the frame C related to the item name frame image data D14 corresponding to the item name frame image conversion result data D15. Result data D19 is extracted.

さらに、抽出されたチェック後コマ画像変換結果データD19を、抽出項目形式データ記憶部126に記憶された抽出項目形式データD5のうち支払金額形式データD5−4と対照の上、形式が一致する場合に、当該チェック後コマ画像変換結果データD19の数字部分を、支払金額データD21−5として抽出する。 Further, when the extracted checked frame image conversion result data D19 is compared with the payment amount format data D5-4 of the extracted item format data D5 stored in the extracted item format data storage unit 126, and the formats match. The numerical portion of the frame image conversion result data D19 after the check is extracted as the payment amount data D21-5.

この場合、例えば、「領収金額」、「請求金額」又は「支払金額」と記載されたコマCと合成されたコマCの記載内容が、例えば、複数桁の数字を含み、かつ、数字の間が「−」、「()」又は「/」で区切られずに記載された形式である場合に、当該数字の記載が抽出されることとなる。
図9の例であれば、「領収金額」と記載されたコマCの下のコマCの記載内容及び「請求金額」と記載されたコマCの下のコマCの記載内容が、複数桁の数字が「−」、「()」又は「/」で区切られずに記載された形式の記載を含むことから、当該コマCの記載の数字部分である「200」が抽出される。
In this case, for example, the description content of the frame C combined with the frame C described as "receipt amount", "billing amount" or "payment amount" includes, for example, a multi-digit number and is between the numbers. If is in the format described without being separated by "-", "()" or "/", the description of the number will be extracted.
In the example of FIG. 9, the description content of the frame C below the frame C described as "receipt amount" and the description content of the frame C below the frame C described as "billing amount" are multiple digits. Since the numbers include the description in the format described without being separated by "-", "()" or "/", "200" which is the number part of the description of the frame C is extracted.

[ステップS4−5−2:第二支払項目データとの対照]
ステップS4−5−1において支払金額データD21−5が抽出されなかった場合、続いて、制御部11は、全てのチェック後コマ画像変換結果データD19を検索し、その中に、記憶部12の抽出項目データ記憶部125に記憶された抽出項目データD4に含まれる第二支払項目データD4−6に一致するデータ、すなわち、冒頭に「¥」という文字を含む記載、末尾に「円」という文字を含む記載、又は冒頭に「計」という文字を含む記載がある場合に、当該記載の「¥」、「円」又は「計」以外の部分のデータを抽出する。なお、「¥」、「円」、「計」のうち複数を含む記載についても同様に「¥」、「円」又は「計」以外の部分を抽出する。
全てのチェック後コマ画像変換結果データD19から、第二支払項目データD4−6に一致するデータが抽出されなかった場合には、続いて、チェック後枠外画像変換結果データD20から、第二支払項目データD4−6に一致するデータを抽出する。
[Step S4-5-2: Comparison with the second payment item data]
When the payment amount data D21-5 is not extracted in step S4-5-1, the control unit 11 subsequently searches for the frame image conversion result data D19 after all the checks, and in the storage unit 12, the storage unit 12 Data that matches the second payment item data D4-6 included in the extracted item data D4 stored in the extracted item data storage unit 125, that is, the description including the character "¥" at the beginning and the character "yen" at the end. If there is a description that includes, or a description that includes the word "total" at the beginning, the data of the part other than "¥", "yen", or "total" of the description is extracted. In addition, for the description including a plurality of "¥", "yen", and "total", the part other than "¥", "yen", or "total" is similarly extracted.
If the data matching the second payment item data D4-6 is not extracted from the frame image conversion result data D19 after all the checks, then the second payment item from the out-of-frame image conversion result data D20 after the check. Data matching data D4-6 is extracted.

さらに、抽出されたデータを、抽出項目形式データ記憶部126に記憶された抽出項目形式データD5のうち支払金額形式データD5−4と対照の上、形式が一致する場合に、当該データを、支払金額データD21−5として抽出する。 Further, the extracted data is compared with the payment amount format data D5-4 of the extracted item format data D5 stored in the extraction item format data storage unit 126, and when the formats match, the data is paid. Extracted as monetary data D21-5.

この場合、例えば、冒頭に「¥」という文字を含む記載、末尾に「円」という文字を含む記載、又は冒頭に「計」という文字を含む記載の「¥」、「円」又は「計」以外の部分の記載内容が、例えば、複数桁の数字を含み、かつ、数字の間が「−」、「()」又は「/」で区切られずに記載された形式である場合に、当該数字の記載が抽出されることとなる。 In this case, for example, the description including the character "\" at the beginning, the description including the character "yen" at the end, or the description including the character "total" at the beginning "\", "yen" or "total" When the description content of the part other than is, for example, a multi-digit number and the number is described without being separated by "-", "()" or "/", the number is concerned. Will be extracted.

なお、冒頭に「¥」という文字を含む記載、末尾に「円」という文字を含む記載、又は冒頭に「計」という文字を含む記載であっても、必ずしも支払金額を表すとは限らず、抽出の精度は第一支払項目データD4−5との対照を行うステップS4−5−1と比較して劣ることとなる。
そこで、本実施形態においては、上記のように、抽出精度の高い第一支払項目データD4−5との対照を行うステップと、抽出精度は劣るものの、何らかの記載を抽出できる可能性の高い第二支払項目データD4−6との対照を行うステップとの2段階を設けることで、抽出精度と、データが抽出されない可能性の低減の両立を図っている。
In addition, even if the description includes the characters "\" at the beginning, the characters "yen" at the end, or the characters "total" at the beginning, it does not necessarily indicate the payment amount. The accuracy of the extraction will be inferior to that of step S4-5-1, which is compared with the first payment item data D4-5.
Therefore, in the present embodiment, as described above, the step of contrasting with the first payment item data D4-5 having high extraction accuracy and the second step in which some description can be extracted although the extraction accuracy is inferior. By providing two steps, that is, a step of contrasting with the payment item data D4-6, both the extraction accuracy and the reduction of the possibility that the data is not extracted are achieved.

[(6)ステップS4−6:医療・治療点数の抽出]
制御部11は、チェック後コマ画像変換結果データD19から、医療費控除申請に必要となる医療・治療の点数に係るデータを抽出する。具体的には以下の通りである。
[(6) Step S4-6: Extraction of medical / treatment points]
The control unit 11 extracts data related to the points of medical care / treatment required for the medical expense deduction application from the frame image conversion result data D19 after the check. Specifically, it is as follows.

まず、制御部11は、チェック後コマ画像変換結果データD19のうち、二コマ画像データD16に対応するデータを抽出する。
続いて、制御部11は、抽出された二コマ画像データD16に対応するチェック後コマ画像変換結果データD19のうち、項目名コマ画像変換結果データD15に該当するデータを検索し、その中に、記憶部12の抽出項目データ記憶部125に記憶された抽出項目データD4に含まれる医療・治療項目データD4−7に一致するデータ、すなわち、「診療」、「治療」、「針きゅう」、「検査費用」又は「付添人料」の文字がある場合に、二コマ画像データD16において、当該項目名コマ画像変換結果データD15に対応する項目名コマ画像データD14に係るコマCと合成されているコマCに係るチェック後コマ画像変換結果データD19を抽出する。
First, the control unit 11 extracts the data corresponding to the two-frame image data D16 from the frame image conversion result data D19 after the check.
Subsequently, the control unit 11 searches for the data corresponding to the item name frame image conversion result data D15 among the checked frame image conversion result data D19 corresponding to the extracted two-frame image data D16, and contains the data corresponding to the item name frame image conversion result data D15. Extracted item data of the storage unit 12 Data that matches the medical / treatment item data D4-7 included in the extracted item data D4 stored in the storage unit 125, that is, "medical treatment", "treatment", "needle", "needle", " When there is a character of "inspection fee" or "attendant fee", the two-frame image data D16 is combined with the frame C related to the item name frame image data D14 corresponding to the item name frame image conversion result data D15. After the check related to the frame C, the frame image conversion result data D19 is extracted.

さらに、抽出されたチェック後コマ画像変換結果データD19を、抽出項目形式データ記憶部126に記憶された抽出項目形式データD5のうち医療・治療点数形式データD5−5と対照の上、形式が一致する場合に、当該チェック後コマ画像変換結果データD19の数字部分を、医療・治療点数データD21−6として抽出する。 Further, the extracted check-frame image conversion result data D19 is compared with the medical / treatment score format data D5-5 of the extracted item format data D5 stored in the extraction item format data storage unit 126, and the formats match. In this case, the numerical portion of the frame image conversion result data D19 after the check is extracted as the medical / treatment score data D21-6.

この場合、例えば、「診療」、「治療」、「針きゅう」、「検査費用」又は「付添人料」と記載されたコマCと合成されたコマCの記載内容が、例えば、数字のみ又は数字の後に「点」が続く形式である場合に、当該数字の記載が抽出されることとなる。
図8及び図17の例であれば、は「放射線治療」と記載された行毎コマ画像データD12の右に位置する行毎コマ画像データD12の記載内容が、数字の後に「点」が続く形式であることから、当該コマCの記載内容の数字部分である「0」が抽出される。
また、図9の例であれば、「放射線治療」と記載されたコマ画像データD7の下に位置するコマ画像データD7の記載内容が、数字の後に「点」が続く形式であることから、当該コマCの記載内容の数字部分である「0」が抽出される。
In this case, for example, the description content of the frame C combined with the frame C described as "medical treatment", "treatment", "needle", "examination cost" or "attendant fee" is, for example, only numbers or If the number is followed by a "dot", the description of the number will be extracted.
In the example of FIGS. 8 and 17, the description content of the row-by-frame image data D12 located to the right of the row-by-frame image data D12 described as "radiotherapy" is followed by a "dot" after the number. Since it is a format, "0" which is a numerical part of the description content of the frame C is extracted.
Further, in the example of FIG. 9, since the description content of the frame image data D7 located below the frame image data D7 described as "radiotherapy" is in a format in which a "dot" follows a number. “0”, which is the numerical part of the description content of the frame C, is extracted.

[(7)ステップS4−7:医療品購入点数の抽出]
制御部11は、チェック後コマ画像変換結果データD19から、医療費控除申請に必要となる医療品購入の点数に係るデータを抽出する。具体的には以下の通りである。
[(7) Step S4-7: Extraction of medical product purchase points]
The control unit 11 extracts data related to the number of medical product purchases required for the medical expense deduction application from the frame image conversion result data D19 after the check. Specifically, it is as follows.

まず、制御部11は、チェック後コマ画像変換結果データD19のうち、二コマ画像データD16に対応するデータを抽出する。
続いて、制御部11は、抽出された二コマ画像データD16に対応するチェック後コマ画像変換結果データD19のうち、項目名コマ画像変換結果データD15に該当するデータを検索し、その中に、記憶部12の抽出項目データ記憶部125に記憶された抽出項目データD4に含まれる医療品購入項目データD4−8に一致するデータ、すなわち、「調剤技術」、「薬学管理」、「薬剤」、「特定保健医療材料」又は「医療材料」の文字がある場合に、二コマ画像データD16において、当該項目名コマ画像変換結果データD15に対応する項目名コマ画像データD14に係るコマCと合成されているコマCに係るチェック後コマ画像変換結果データD19を抽出する。
First, the control unit 11 extracts the data corresponding to the two-frame image data D16 from the frame image conversion result data D19 after the check.
Subsequently, the control unit 11 searches for the data corresponding to the item name frame image conversion result data D15 among the checked frame image conversion result data D19 corresponding to the extracted two-frame image data D16, and contains the data corresponding to the item name frame image conversion result data D15. Extracted item data of the storage unit 12 Data that matches the medical product purchase item data D4-8 stored in the extracted item data D4 stored in the storage unit 125, that is, "dispensing technology", "pharmaceutical management", "drug", When there is a character of "specified health medical material" or "medical material", the two-frame image data D16 is combined with the frame C related to the item name frame image data D14 corresponding to the item name frame image conversion result data D15. After checking the frame C, the frame image conversion result data D19 is extracted.

さらに、抽出されたチェック後コマ画像変換結果データD19を、抽出項目形式データ記憶部126に記憶された抽出項目形式データD5のうち医療品購入点数形式データD5−6と対照の上、形式が一致する場合に、当該チェック後コマ画像変換結果データD19の数字部分を、医療品購入点数データD21−7として抽出する。 Further, the extracted checked frame image conversion result data D19 is compared with the medical product purchase point format data D5-6 of the extracted item format data D5 stored in the extracted item format data storage unit 126, and the formats match. In this case, the numerical portion of the frame image conversion result data D19 after the check is extracted as the medical product purchase point data D21-7.

この場合、例えば、「調剤技術」、「薬学管理」、「薬剤」、「特定保健医療材料」又は「医療材料」と記載されたコマCと合成されたコマCの記載内容が、例えば、数字のみ又は数字の後に「点」が続く形式である場合に、当該数字の記載が抽出されることとなる。 In this case, for example, the description content of the top C synthesized with the top C described as "dispensing technology", "pharmacy management", "drug", "specified health care material" or "medical material" is, for example, a number. If the format is a chisel or a number followed by a "dot", the description of the number will be extracted.

[(8)ステップS4−8:介護保険サービス点数の抽出]
制御部11は、チェック後コマ画像変換結果データD19から、医療費控除申請に必要となる介護保険サービスの点数に係るデータを抽出する。具体的には以下の通りである。
[(8) Step S4-8: Extraction of long-term care insurance service points]
The control unit 11 extracts data related to the points of the long-term care insurance service required for the medical expense deduction application from the frame image conversion result data D19 after the check. Specifically, it is as follows.

まず、制御部11は、チェック後コマ画像変換結果データD19のうち、二コマ画像データD16に対応するデータを抽出する。
続いて、制御部11は、抽出された二コマ画像データD16に対応するチェック後コマ画像変換結果データD19のうち、項目名コマ画像変換結果データD15に該当するデータを検索し、その中に、記憶部12の抽出項目データ記憶部125に記憶された抽出項目データD4に含まれる介護保険サービス項目データD4−9に一致するデータ、すなわち、「訪問介護」、「ホームヘルプサービス」、「訪問入浴介護」、「訪問リハビリテーション」又は「デイサービス」の文字がある場合に、二コマ画像データD16において、当該項目名コマ画像変換結果データD15に対応する項目名コマ画像データD14に係るコマCと合成されているコマCに係るチェック後コマ画像変換結果データD19を抽出する。
First, the control unit 11 extracts the data corresponding to the two-frame image data D16 from the frame image conversion result data D19 after the check.
Subsequently, the control unit 11 searches for the data corresponding to the item name frame image conversion result data D15 among the checked frame image conversion result data D19 corresponding to the extracted two-frame image data D16, and contains the data corresponding to the item name frame image conversion result data D15. Extracted item data of the storage unit 12 Data matching the care insurance service item data D4-9 stored in the extracted item data D4 stored in the storage unit 125, that is, "home-visit care", "home help service", "visit bathing" When there are characters such as "nursing care", "visit rehabilitation", or "day service", the two-frame image data D16 is combined with the frame C related to the item name frame image data D14 corresponding to the item name frame image conversion result data D15. After the check, the frame image conversion result data D19 related to the frame C is extracted.

さらに、抽出されたチェック後コマ画像変換結果データD19を、抽出項目形式データ記憶部126に記憶された抽出項目形式データD5のうち介護保険サービス点数形式データD5−7と対照の上、形式が一致する場合に、当該チェック後コマ画像変換結果データD19の数字部分を、介護保険サービス点数データD21−8として抽出する。 Further, the extracted checked frame image conversion result data D19 is compared with the long-term care insurance service score format data D5-7 of the extracted item format data D5 stored in the extracted item format data storage unit 126, and the formats match. In this case, the numerical portion of the frame image conversion result data D19 after the check is extracted as the long-term care insurance service score data D21-8.

この場合、例えば、「訪問介護」、「ホームヘルプサービス」、「訪問入浴介護」、「訪問リハビリテーション」又は「デイサービス」と記載されたコマCと合成されたコマCの記載内容が、例えば、数字のみ又は数字の後に「点」が続く形式である場合に、当該数字の記載が抽出されることとなる。 In this case, for example, the description content of the frame C synthesized with the frame C described as "home-visit care", "home help service", "visit bathing care", "visit rehabilitation" or "day service" is, for example, If the number is the only number or the number is followed by a "dot", the description of the number will be extracted.

[(9)ステップS4−9:抽出データの記憶]
日付データD21−1、氏名データD21−2、支払先データD21−3、使用医薬品データD21−4、支払金額データD21−5、医療・治療点数データD21−6、医療品購入点数データD21−7、介護保険サービス点数データD21−8からなる医療費控除申請用抽出データD21が抽出されると、制御部11は、これを、記憶部12の医療費控除申請用抽出データ記憶部124に、当該データに係るユーザUのユーザデータD1と紐付けて記憶する。
[(9) Step S4-9: Storage of extracted data]
Date data D21-1, name data D21-2, payee data D21-3, drug used data D21-4, payment amount data D21-5, medical / treatment score data D21-6, medical product purchase score data D21-7 When the medical expense deduction application extraction data D21 composed of the nursing care insurance service score data D21-8 is extracted, the control unit 11 applies the data to the medical expense deduction application extraction data storage unit 124 of the storage unit 12. It is stored in association with the user data D1 of the user U related to the data.

なお、抽出する医療費控除申請用抽出データD21の内容は、上記のものに限られず、医療費控除申請の制度上、申請に必要となるデータに増減が生じた場合等には、それに対応して、適宜追加又は省略することが可能である。
この際には、抽出項目データD4及び抽出項目形式データD5についても、抽出される医療費控除申請用抽出データD21に合わせて、新たな項目についてのデータの追加又は不要な項目についてのデータの削除を行うこととなる。
The content of the extracted data D21 for medical expense deduction application to be extracted is not limited to the above, and if there is an increase or decrease in the data required for the application due to the medical expense deduction application system, it will be dealt with. Therefore, it can be added or omitted as appropriate.
At this time, with respect to the extracted item data D4 and the extracted item format data D5, the data for new items is added or the data for unnecessary items is deleted according to the extracted data D21 for medical expense deduction application. Will be done.

[(10)ステップS4−10:変換有無データの更新]
ステップS4−9まで完了すると、制御部11は、記憶部12の変換対象データ記憶部122の、当該医療領収書画像データD2に対応する変換有無データD3を、未変換から既変換に更新する。
[(10) Step S4-10: Update of conversion presence / absence data]
When the steps S4-9 are completed, the control unit 11 updates the conversion presence / absence data D3 corresponding to the medical receipt image data D2 of the conversion target data storage unit 122 of the storage unit 12 from unconverted to already converted.

[第3 効果の説明]
OCRソフトウェアを用いての証憑の記載内容の文字コードへの変換は、通常、証憑の左から右、上から下へと順次変換していくことから、文字が規則的に配置されている証憑であれば変換精度を高め易いが、記載が不規則な証憑については、変換精度を高めることが困難であった。
また、OCRソフトウェアへの入力画像は、ノイズとなる文字列以外の情報が少なく、かつ文字列が記載されている領域が画像全体に対し大きいほど精度が向上するが、複数の記載欄が不規則に配置された証憑については、一般に文字列以外の情報が多く、かつ文字列が記載されている領域が画像全体に対し小さいことから、この点からも変換精度の向上が困難であった。
[Explanation of the third effect]
Conversion of the contents of the voucher to the character code using OCR software is usually done in order from left to right and top to bottom of the voucher, so it is a voucher in which the characters are regularly arranged. If there is, it is easy to improve the conversion accuracy, but it was difficult to improve the conversion accuracy for vouchers with irregular descriptions.
In addition, the accuracy of the input image to the OCR software improves as the amount of information other than the character string that causes noise is small and the area where the character string is described is larger than the entire image, but a plurality of entry fields are irregular. In general, there is a lot of information other than the character string and the area where the character string is described is small with respect to the entire image, so that it is difficult to improve the conversion accuracy from this point as well.

この点、本実施形態によれば、医療領収書画像データD2につき、複数のコマ画像データD7に分割した上で、コマ画像データD7毎に、OCRソフトウェア129使用して文字コードへの変換を行う。
証憑の画像データ(医療領収書画像データD2)自体は、複数の記載欄が不規則に配置されたものであっても、個々のコマC内の記載は証憑全体と比較して規則的なものとなり、また、個々のコマC内を見れば、証憑全体を見る場合と比較して、ノイズとなる文字列以外の情報が少なく、かつ文字列が記載されている領域が画像全体に対し大きい場合が多い。
したがって、本実施形態によれば、コマ画像データD7毎に文字コードへの変換を行うことで、OCRソフトウェア129による変換精度を高めることができる。
In this regard, according to the present embodiment, the medical receipt image data D2 is divided into a plurality of frame image data D7, and each frame image data D7 is converted into a character code by using the OCR software 129. ..
Even if the image data of the voucher (medical receipt image data D2) itself has a plurality of entry fields arranged irregularly, the description in each frame C is regular compared to the entire voucher. Also, when looking inside each frame C, there is less information other than the character string that causes noise, and the area where the character string is written is larger than the case of looking at the entire voucher. There are many.
Therefore, according to the present embodiment, the conversion accuracy by the OCR software 129 can be improved by converting each frame image data D7 into a character code.

また、本実施形態によれば、医療領収書画像データD2から、コマ画像データD7部分を除いた枠外画像データD9を作成の上、これについてもコマ画像データD7とは別個にOCRソフトウェア129使用して文字コードへの変換がなされることから、コマCの外側の領域についても、ノイズの減少等により、OCRソフトウェア129による変換精度を高めることができる。 Further, according to the present embodiment, the out-of-frame image data D9 excluding the frame image data D7 portion is created from the medical receipt image data D2, and the OCR software 129 is also used for this as well, separately from the frame image data D7. Since the conversion to the character code is performed, the conversion accuracy by the OCR software 129 can be improved also in the region outside the frame C by reducing noise and the like.

また、コマ画像データD7の変換結果であるコマ画像変換結果データD10を基に、所定の項目名が含まれるコマ画像データD7である項目名コマ画像データD14を抽出の上、これと隣接するコマCのコマ画像データD7とを合成して二コマ画像データD16を作成することで、証憑の記載において、所定の項目名の記載と、それに対応する記載内容との対応関係を判別し易くすることができる。 Further, based on the frame image conversion result data D10 which is the conversion result of the frame image data D7, the item name frame image data D14 which is the frame image data D7 including a predetermined item name is extracted, and the frames adjacent thereto are extracted. By synthesizing the frame image data D7 of C to create the two-frame image data D16, it is easy to determine the correspondence between the description of the predetermined item name and the corresponding description content in the description of the voucher. Can be done.

また、コマ画像データD7の変換結果であるコマ画像変換結果データD10を基に、コマ画像データD7に含まれる文字列の行数を特定の上、コマ画像データD7に複数行の文字列が含まれる場合に、コマ画像データD7を行毎に分割した行毎コマ画像データD12を作成の上、行毎コマ画像データD12に分割されたコマCについては、行毎コマ画像データD12を基に二コマ画像データD16を作成することで、複数行の文字列が含まれるコマCについても、所定の項目名の記載と、それに対応する記載内容との対応関係を判別し易くすることができる。 Further, based on the frame image conversion result data D10 which is the conversion result of the frame image data D7, the number of lines of the character string included in the frame image data D7 is specified, and the frame image data D7 includes a plurality of lines of character strings. In this case, the frame image data D7 is divided into rows to create row-to-frame image data D12, and the frame C divided into row-to-frame image data D12 is divided into row-by-line frame image data D12. By creating the frame image data D16, it is possible to easily determine the correspondence between the description of the predetermined item name and the corresponding description content even for the frame C including the character strings of a plurality of lines.

また、所定の分割、合成処理後のコマ画像のデータである分割・合成後コマ画像データD17及びこれに対応した変換結果のデータである分割・合成後コマ画像変換結果データD18を、分割・合成後コマ画像データD17毎に別個の作業者端末2へと送信し、作業者Wに確認及び修正させることで、証憑の記載内容の全体像を作業者Wに秘匿しつつ、変換精度を高めることができる。 Further, the divided / combined frame image data D17, which is the data of the frame image after the predetermined division / compositing process, and the divided / combined frame image conversion result data D18, which is the corresponding conversion result data, are divided / combined. By transmitting each post-frame image data D17 to a separate worker terminal 2 and having the worker W confirm and correct it, the conversion accuracy is improved while concealing the entire image of the contents of the voucher from the worker W. Can be done.

また、医療領収書画像データD2から抽出する必要のある所定の項目についてのデータ(抽出項目データD4)を用いて、当該データと一致する項目についてのデータを抽出することで、医療領収書画像データD2から、所定の申請等(本実施形態では医療費控除申請)に必要となるデータを抽出することが容易となる。 Further, by using the data (extracted item data D4) for a predetermined item that needs to be extracted from the medical receipt image data D2, the data for the item that matches the data is extracted, and the medical receipt image data is obtained. From D2, it becomes easy to extract the data required for a predetermined application, etc. (in this embodiment, a medical expense deduction application).

この際に、項目名コマ画像データD14と、これと隣接するコマCのコマ画像データD7とを合成して二コマ画像データD16が作成されていることで、項目名コマ画像データD14に、抽出項目データD4のうち特定の項目と合致する項目名が含まれる場合に、当該項目名コマ画像データD14と合成されたコマ画像データD7に係るコマ画像変換結果データD10からデータを抽出可能となり、所定の申請等(本実施形態では医療費控除申請)に必要となるデータを抽出することがさらに容易となる。 At this time, the item name frame image data D14 and the frame image data D7 of the adjacent frame C are combined to create the two-frame image data D16, which is extracted into the item name frame image data D14. When an item name matching a specific item is included in the item data D4, data can be extracted from the frame image conversion result data D10 related to the frame image data D7 combined with the item name frame image data D14, and predetermined data can be extracted. It will be easier to extract the data required for the application, etc. (in this embodiment, the medical expense deduction application).

また二コマ画像データD16から抽出項目データD4のうち特定の項目についてのデータが抽出されなかった場合に、二コマ画像データD16が作成されていないコマCに係るコマ画像変換結果データD10を含めて、抽出項目データD4と一致する項目についてのデータを抽出することで、まず、抽出の精度が他の部分のデータと比較して高い二コマ画像データD16内からの抽出を試みつつ、二コマ画像データD16内から抽出できなかった項目に係るデータについても抽出することが可能となる。 Further, when the data for a specific item among the extracted item data D4 is not extracted from the two-frame image data D16, the frame image conversion result data D10 related to the frame C for which the two-frame image data D16 is not created is included. By extracting the data for the item that matches the extracted item data D4, first, while trying to extract from the two-frame image data D16 whose extraction accuracy is higher than that of the data of other parts, the two-frame image It is possible to extract data related to items that could not be extracted from the data D16.

また、抽出項目データD4を用いて、当該データと一致する項目についてのデータを抽出する際に、さらに、抽出項目形式データD5と合致する形式のデータのみを抽出するようにすることで、明らかに形式が合致しないデータの抽出を防止でき、データの抽出精度を向上することができる。 Further, when the extraction item data D4 is used to extract the data for the item that matches the data, it is clarified by extracting only the data in the format that matches the extraction item format data D5. It is possible to prevent the extraction of data whose formats do not match, and improve the accuracy of data extraction.

また、コマ画像変換結果データD10から抽出項目データD4のうち特定の項目についてのデータが抽出されなかった場合に、枠外画像データD9に係る枠外画像変換結果データD11を含めて、抽出項目データD4と一致する項目についてのデータを抽出することで、まず、抽出の精度がコマC以外の部分と比較して高いコマ画像データD7内からの抽出を試みつつ、コマ画像データD7内から抽出できなかった項目に係るデータについても抽出することが可能となる。 Further, when the data for a specific item among the extracted item data D4 is not extracted from the frame image conversion result data D10, the extracted item data D4 includes the out-of-frame image conversion result data D11 related to the out-of-frame image data D9. By extracting the data for the matching items, first, while trying to extract from the frame image data D7 whose extraction accuracy is higher than that of the part other than the frame C, it could not be extracted from the frame image data D7. It is also possible to extract data related to items.

[第4 変形例]
上記実施形態においては、医療領収書画像データD2の記載内容を文字コードに変換する場合について説明したが、本発明の対象となる証憑は、医療領収書に限られない。
複数の記載欄が設けられた証憑であれば、例えば給与の明細、社会保険の納付書等、医療領収書以外の証憑であっても、本発明によって、コマ画像データD7及び枠外画像データD9に分割の上、OCRソフトウェア129による変換を行うことで、その記載内容の文字コードへの変換精度を高めることができる。
[Fourth variant]
In the above embodiment, the case where the description content of the medical receipt image data D2 is converted into a character code has been described, but the voucher that is the subject of the present invention is not limited to the medical receipt.
If the voucher is provided with a plurality of entry fields, for example, a voucher other than a medical receipt such as a salary statement, a social insurance payment slip, etc., according to the present invention, the frame image data D7 and the out-of-frame image data D9 By performing the conversion by the OCR software 129 after the division, the conversion accuracy of the described content into the character code can be improved.

また、上記実施形態においては、医療費控除申請に必要となる項目に係るデータを抽出する場合について説明したが、証憑の記載内容の文字コードへの変換後に抽出する項目もこれには限定されず、必要となる項目が明らかとなっている申請等に必要となるデータであれば、それに合わせて抽出項目データを構成することで、医療費控除申請以外の申請等に必要となる項目に係るデータを抽出することも可能である。 Further, in the above embodiment, the case of extracting the data related to the items required for the medical expense deduction application has been described, but the items to be extracted after converting the contents of the voucher into the character code are not limited to this. If the required items are clear data required for applications, etc., by configuring the extracted item data accordingly, data related to items required for applications other than medical expense deduction applications, etc. It is also possible to extract.

また、上記実施形態においては、クラウドワーカによるチェック(ステップS3)を含む場合について説明したが、変換の精度は低下するものの、当該過程を経ることなく、ステップS2において記憶部12の変換データ記憶部123に記憶された分割・合成後コマ画像変換結果データD18及び枠外画像変換結果データD11から、医療費控除申請用データの抽出を行うようにすることも可能である。 Further, in the above embodiment, the case where the check by the cloud worker (step S3) is included has been described. However, although the conversion accuracy is lowered, the conversion data storage unit of the storage unit 12 in step S2 does not go through the process. It is also possible to extract the medical expense deduction application data from the divided / combined frame image conversion result data D18 and the out-of-frame image conversion result data D11 stored in 123.

100 会計支援システム
1 会計支援装置
11 制御部(コマ識別手段、コマ画像データ作成手段、変換手段、枠外画像データ作成手段、項目名コマ抽出手段、二コマ画像データ作成手段、行数特定手段、行毎コマ画像データ作成手段、データ抽出手段)
12 記憶部
127 医療領収書変換エンジン(会計支援プログラム)
128 医療費控除申請用データ抽出エンジン(会計支援プログラム)
129 OCRソフトウェア
13 通信部(取得手段、送信手段、受信手段)
2 作業者端末
D2 医療領収書画像データ(証憑画像データ)
D4 抽出項目データ
D5 抽出項目形式データ
D7 コマ画像データ
D9 枠外画像データ
D10 コマ画像変換結果データ
D11 枠外画像変換結果データ
D12 行毎コマ画像データ
D14 項目名コマ画像データ
D16 二コマ画像データ
L 罫線
C コマ
W 作業者
100 Accounting support system 1 Accounting support device 11 Control unit (frame identification means, frame image data creation means, conversion means, out-of-frame image data creation means, item name frame extraction means, two-frame image data creation means, line number specifying means, line Image data creation means for each frame, data extraction means)
12 Memory 127 Medical Receipt Conversion Engine (Accounting Support Program)
128 Data extraction engine for medical expense deduction application (accounting support program)
129 OCR software 13 Communication unit (acquisition means, transmission means, reception means)
2 Worker terminal D2 Medical receipt image data (voucher image data)
D4 Extracted item data D5 Extracted item format data D7 Frame image data D9 Out-of-frame image data D10 Frame image conversion result data D11 Out-of-frame image conversion result data D12 Line-by-frame image data D14 Item name Frame image data D16 Two-frame image data L Border C frame W worker

Claims (17)

変換対象となる証憑の画像データである証憑画像データを取得する取得手段と、
前記証憑画像データから罫線によって囲まれた領域であるコマを識別するコマ識別手段と、
前記証憑画像データから、前記コマ部分を抽出した画像データであるコマ画像データを作成するコマ画像データ作成手段と、
OCRソフトウェアを使用して、前記コマ画像データを文字コードに変換し、コマ画像変換結果データを取得する変換手段と、
を備えることを特徴とする会計支援装置。
An acquisition means for acquiring voucher image data, which is the image data of the voucher to be converted, and
A frame identification means for identifying a frame that is an area surrounded by a ruled line from the voucher image data,
A frame image data creation means for creating frame image data, which is image data obtained by extracting the frame portion from the voucher image data, and
A conversion means for converting the frame image data into a character code and acquiring the frame image conversion result data using OCR software, and
An accounting support device characterized by being equipped with.
前記コマ識別手段は、
前記証憑画像データから直線を検出の上、
当該直線によって囲まれた領域を前記コマとして識別することを特徴とする請求項1に記載の会計支援装置。
The frame identification means
After detecting a straight line from the voucher image data,
The accounting support device according to claim 1, wherein the area surrounded by the straight line is identified as the frame.
前記証憑画像データから、前記コマ部分の記載を削除した画像データである枠外画像データを作成する枠外画像データ作成手段を備え、
前記変換手段は、OCRソフトウェアを使用して、前記枠外画像データを文字コードに変換し、枠外画像変換結果データを取得することを特徴とする請求項1又は2に記載の会計支援装置。
An out-of-frame image data creation means for creating out-of-frame image data, which is image data obtained by deleting the description of the frame portion from the voucher image data, is provided.
The accounting support device according to claim 1 or 2, wherein the conversion means uses OCR software to convert the out-of-frame image data into a character code and obtains the out-of-frame image conversion result data.
前記コマ画像変換結果データを用いて前記コマ画像データに所定の項目名が含まれるかを判定し、所定の項目名が含まれる前記コマ画像データである項目名コマ画像データを抽出する項目名コマ抽出手段を備えることを特徴とする請求項1から3のいずれか一項に記載の会計支援装置。 Using the frame image conversion result data, it is determined whether or not the frame image data includes a predetermined item name, and the item name frame image data which is the frame image data including the predetermined item name is extracted. The accounting support device according to any one of claims 1 to 3, further comprising an extraction means. 前記項目名コマ画像データに、隣接するコマのコマ画像データを合成して二コマ画像データを作成する二コマ画像データ作成手段を備えることを特徴とする請求項4に記載の会計支援装置。 The accounting support device according to claim 4, further comprising a two-frame image data creating means for creating two-frame image data by synthesizing frame image data of adjacent frames with the item name frame image data. 前記コマ画像変換結果データを基に、前記コマ画像データに含まれる文字列の行数を特定する行数特定手段を備えることを特徴とする請求項1から5のいずれか一項に記載の会計支援装置。 The accounting according to any one of claims 1 to 5, further comprising a line number specifying means for specifying the number of lines of a character string included in the frame image data based on the frame image conversion result data. Support device. 前記コマ画像データに複数行の文字列が含まれる場合に、前記コマ画像データを行毎に分割した行毎コマ画像データを作成する行毎コマ画像データ作成手段を備えることを特徴とする請求項6に記載の会計支援装置。 A claim characterized in that, when the frame image data includes a character string of a plurality of lines, a line-by-line image data creating means for creating the line-by-line frame image data obtained by dividing the frame image data into lines is provided. The accounting support device according to 6. 前記コマ画像変換結果データを用いて前記コマ画像データに所定の項目名が含まれるかを判定し、所定の項目名が含まれる前記コマ画像データである項目名コマ画像データを抽出する項目名コマ抽出手段を備え、
前記項目名コマ抽出手段は、
前記行毎コマ画像データが作成されたコマについては、前記行毎コマ画像データに所定の項目名が含まれるかを判定し、所定の項目名が含まれる前記行毎コマ画像データを、前記項目名コマ画像データとして抽出し、
前記行毎コマ画像データが作成されていないコマについては、前記コマ画像データに所定の項目名が含まれるかを判定し、所定の項目名が含まれる前記コマ画像データを、前記項目名コマ画像データとして抽出することを特徴とする請求項7に記載の会計支援装置。
Using the frame image conversion result data, it is determined whether or not the frame image data includes a predetermined item name, and the item name frame image data which is the frame image data including the predetermined item name is extracted. Equipped with extraction means
The item name frame extraction means
With respect to the frame in which the line-by-line frame image data is created, it is determined whether the line-by-line frame image data includes a predetermined item name, and the line-by-frame image data including the predetermined item name is used as the item. Extracted as name frame image data,
For frames for which frame-by-line image data has not been created, it is determined whether the frame image data includes a predetermined item name, and the frame image data including the predetermined item name is used as the item name frame image. The accounting support device according to claim 7, wherein the data is extracted as data.
前記項目名コマ画像データに、隣接するコマのコマ画像データを合成して二コマ画像データを作成する二コマ画像データ作成手段を備え、
前記二コマ画像データ作成手段は、
前記行毎コマ画像データが前記項目名コマ画像データとして抽出された場合には、
当該行毎コマ画像データが含まれるコマと、これと隣接するコマとの行数が一致するかを判定の上、一致する場合に、当該行毎コマ画像データと、右に隣接するコマの同一行の行毎コマ画像データとを合成し、
前記コマ画像データが前記項目名コマ画像データとして抽出された場合には、
当該コマ画像データに係るコマと、下に隣接するコマとの左右方向の幅が一致するかを判定の上、これが一致する場合に、当該コマ画像データと、下に隣接するコマのコマ画像データとを合成することを特徴とする請求項8に記載の会計支援装置。
A two-frame image data creation means for creating two-frame image data by synthesizing frame image data of adjacent frames with the item name frame image data is provided.
The two-frame image data creation means
When the line-by-frame image data is extracted as the item name frame image data,
After determining whether the number of rows of the frame containing the frame-by-line image data matches the number of adjacent frames, if they match, the frame-by-line image data and the frame adjacent to the right are the same. Combine the line-by-line frame image data
When the frame image data is extracted as the item name frame image data,
After determining whether the widths of the frame related to the frame image data and the adjacent frame below match in the left-right direction, if they match, the frame image data and the frame image data of the adjacent frame below The accounting support device according to claim 8, wherein the data and the data are combined with each other.
前記コマ画像データと、前記コマ画像データに対応するコマ画像変換結果データとを、前記コマ画像データ毎に別個の作業者端末へと送信する送信手段と、
前記作業者端末から、作業者による確認及び修正後の前記コマ画像変換結果データを受信する受信手段と、
を備えることを特徴とする請求項1から9のいずれか一項に記載の会計支援装置。
A transmission means for transmitting the frame image data and the frame image conversion result data corresponding to the frame image data to a separate worker terminal for each frame image data.
A receiving means for receiving the frame image conversion result data after confirmation and correction by the worker from the worker terminal, and
The accounting support device according to any one of claims 1 to 9, further comprising.
前記コマ画像変換結果データから、所定の抽出項目に係るデータである抽出項目データと合致する項目についてのデータを抽出するデータ抽出手段を備えることを特徴とする請求項1から10のいずれか一項に記載の会計支援装置。 Any one of claims 1 to 10, further comprising a data extraction means for extracting data for an item that matches the extraction item data, which is data related to a predetermined extraction item, from the frame image conversion result data. Accounting support device described in. 前記コマ画像変換結果データから、所定の抽出項目に係るデータである抽出項目データと合致する項目についてのデータを抽出するデータ抽出手段を備え、
前記データ抽出手段は、前記二コマ画像データの項目名コマ画像データに対応するコマ画像変換結果データに、前記抽出項目データと合致する項目名が含まれる場合に、当該項目名コマ画像データと合成されたコマ画像データに係るコマ画像変換結果データを抽出することを特徴とする請求項5又は9に記載の会計支援装置。
A data extraction means for extracting data for items that match the extraction item data, which is data related to a predetermined extraction item, from the frame image conversion result data is provided.
When the frame image conversion result data corresponding to the item name frame image data of the two-frame image data includes an item name matching the extracted item data, the data extraction means synthesizes the item name frame image data. The accounting support device according to claim 5 or 9, wherein the frame image conversion result data related to the frame image data is extracted.
前記データ抽出手段は、前記二コマ画像データの項目名コマ画像データに対応するコマ画像変換結果データに前記抽出項目データと合致する項目名が含まれなかった場合に、全ての前記コマ画像変換結果データから、前記抽出項目データと合致する項目についてのデータを抽出することを特徴とする請求項12に記載の会計支援装置。 When the frame image conversion result data corresponding to the item name frame image data of the two-frame image data does not include an item name matching the extracted item data, the data extraction means all the frame image conversion results. The accounting support device according to claim 12, wherein data about an item matching the extracted item data is extracted from the data. 前記データ抽出手段は、前記抽出項目データと合致する項目についてのデータのうち、その記載形式が、前記データ抽出手段によって抽出するデータの記載形式に係るデータである抽出項目形式データと合致するデータを抽出することを特徴とする請求項11から13のいずれか一項に記載の会計支援装置。 The data extraction means selects data whose description format matches the extraction item format data, which is the data related to the description format of the data extracted by the data extraction means, among the data about the items matching the extraction item data. The accounting support device according to any one of claims 11 to 13, characterized in that it is extracted. 前記コマ画像変換結果データから所定の抽出項目に係るデータである抽出項目データと合致する項目についてのデータを抽出し、
前記コマ画像変換結果データから前記抽出項目データと合致する項目についてのデータが抽出されなかった場合に、前記枠外画像変換結果データから前記抽出項目データと合致する項目についてのデータを抽出するデータ抽出手段を備えることを特徴とする請求項3に記載の会計支援装置。
From the frame image conversion result data, data for items that match the extraction item data, which is data related to a predetermined extraction item, is extracted.
Data extraction means for extracting data for items that match the extracted item data from the out-of-frame image conversion result data when data for items that match the extracted item data is not extracted from the frame image conversion result data. The accounting support device according to claim 3, wherein the data is provided.
コンピュータを、
変換対象となる証憑の画像データである証憑画像データを取得する取得手段、
前記証憑画像データから罫線によって囲まれた領域であるコマを識別するコマ識別手段、
前記証憑画像データから、前記コマ部分を抽出した画像データであるコマ画像データを作成するコマ画像データ作成手段、
OCRソフトウェアを使用して、前記コマ画像データを文字コードに変換し、コマ画像変換結果データを取得する変換手段、
として機能させる会計支援プログラム。
Computer,
Acquisition means for acquiring voucher image data, which is the image data of the voucher to be converted,
A frame identification means for identifying a frame that is an area surrounded by a ruled line from the voucher image data.
A frame image data creation means for creating frame image data which is image data obtained by extracting the frame portion from the voucher image data.
A conversion means for converting the frame image data into a character code and acquiring the frame image conversion result data using OCR software.
Accounting support program to function as.
変換対象となる証憑の画像データである証憑画像データを取得する取得ステップと、
前記証憑画像データから罫線によって囲まれた領域であるコマを識別するコマ識別ステップと、
前記証憑画像データから、前記コマ部分を抽出した画像データであるコマ画像データを作成するコマ画像データ作成ステップと、
OCRソフトウェアを使用して、前記コマ画像データを文字コードに変換し、コマ画像変換結果データを取得する変換ステップと、
を含む会計支援方法。
The acquisition step to acquire the voucher image data, which is the image data of the voucher to be converted,
A frame identification step for identifying a frame that is an area surrounded by a ruled line from the voucher image data,
A frame image data creation step for creating frame image data, which is image data obtained by extracting the frame portion from the voucher image data, and
A conversion step of converting the frame image data into a character code and acquiring the frame image conversion result data using OCR software, and
Accounting support methods including.
JP2019115191A 2019-06-21 2019-06-21 Accounting support device, accounting support program, and accounting support method Active JP7486112B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019115191A JP7486112B2 (en) 2019-06-21 2019-06-21 Accounting support device, accounting support program, and accounting support method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019115191A JP7486112B2 (en) 2019-06-21 2019-06-21 Accounting support device, accounting support program, and accounting support method

Publications (2)

Publication Number Publication Date
JP2021002183A true JP2021002183A (en) 2021-01-07
JP7486112B2 JP7486112B2 (en) 2024-05-17

Family

ID=73995049

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019115191A Active JP7486112B2 (en) 2019-06-21 2019-06-21 Accounting support device, accounting support program, and accounting support method

Country Status (1)

Country Link
JP (1) JP7486112B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
USD1003679S1 (en) * 2021-02-01 2023-11-07 Panasonic Holdings Corporation Electric impact driver

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11184949A (en) * 1997-12-19 1999-07-09 Casio Comput Co Ltd Slip processing device and storage medium
JP2006309611A (en) * 2005-04-28 2006-11-09 Canon Marketing Japan Inc Analysis device, program and recording medium
JP2009003496A (en) * 2007-06-19 2009-01-08 Data Design Kk Business form data conversion device
JP2012003670A (en) * 2010-06-21 2012-01-05 East Cloud Inc Receipt information processing apparatus, method and computer program
WO2014103024A1 (en) * 2012-12-28 2014-07-03 富士通株式会社 Chart synthesizing device and chart synthesizing program
JP2015135576A (en) * 2014-01-16 2015-07-27 グローリー株式会社 Document item recognition method, device and program
JP2016189174A (en) * 2015-03-30 2016-11-04 ブラザー工業株式会社 Information specification program and information specification method
JP2017228092A (en) * 2016-06-22 2017-12-28 大日本印刷株式会社 Examination business support device and examination business support method

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11184949A (en) * 1997-12-19 1999-07-09 Casio Comput Co Ltd Slip processing device and storage medium
JP2006309611A (en) * 2005-04-28 2006-11-09 Canon Marketing Japan Inc Analysis device, program and recording medium
JP2009003496A (en) * 2007-06-19 2009-01-08 Data Design Kk Business form data conversion device
JP2012003670A (en) * 2010-06-21 2012-01-05 East Cloud Inc Receipt information processing apparatus, method and computer program
WO2014103024A1 (en) * 2012-12-28 2014-07-03 富士通株式会社 Chart synthesizing device and chart synthesizing program
JP2015135576A (en) * 2014-01-16 2015-07-27 グローリー株式会社 Document item recognition method, device and program
JP2016189174A (en) * 2015-03-30 2016-11-04 ブラザー工業株式会社 Information specification program and information specification method
JP2017228092A (en) * 2016-06-22 2017-12-28 大日本印刷株式会社 Examination business support device and examination business support method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
USD1003679S1 (en) * 2021-02-01 2023-11-07 Panasonic Holdings Corporation Electric impact driver

Also Published As

Publication number Publication date
JP7486112B2 (en) 2024-05-17

Similar Documents

Publication Publication Date Title
US11868717B2 (en) Multi-page document recognition in document capture
US9317484B1 (en) Page-independent multi-field validation in document capture
US10671805B2 (en) Digital processing and completion of form documents
JPH0573598A (en) Document processing method and document processing system
JP5385349B2 (en) Receipt definition data creation device and program thereof
US9471800B2 (en) Securing visual information on images for document capture
US20150178855A1 (en) Ocr enabled management of accounts payable and/or accounts receivable auditing data
JP2018124705A (en) Voucher management program
JP7486112B2 (en) Accounting support device, accounting support program, and accounting support method
JP6976763B2 (en) Journal information processing device, journal information processing method, and program
JP4983464B2 (en) Form image processing apparatus and form image processing program
JP2014021700A (en) Credit slip check support device, method and program
JP4430490B2 (en) Data entry device, control method therefor, and program
JP2016115022A (en) Information processing apparatus, information processing method, and program
JP2020173819A (en) Financial statement read device, financial statement read method, and program
JP7480953B2 (en) Accounting support device, accounting support program, and accounting support method
JPH09167176A (en) Device and method for health insurance card input
JP2016031729A (en) Slip processor, slip processing method, and program
JP2019117520A (en) Character recognition device, method and program
JP2015060471A (en) Slip creation system and slip creation method
CN116992835B (en) Method and equipment for processing batch deposit of layout document
JP6154214B2 (en) Customer guidance system, electronic bookkeeping machine, and customer guidance method
JPH0991107A (en) Paper format register device
JP2003203200A (en) Handwriting input display device
JP6693045B2 (en) Personal information display program, personal information display method, and display control device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220601

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230531

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230606

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230804

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231031

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231227

RD13 Notification of appointment of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7433

Effective date: 20231227

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20231227

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240326

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240424

R150 Certificate of patent or registration of utility model

Ref document number: 7486112

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150