JP2022013524A - Form information generation apparatus, method, and program - Google Patents
Form information generation apparatus, method, and program Download PDFInfo
- Publication number
- JP2022013524A JP2022013524A JP2020135157A JP2020135157A JP2022013524A JP 2022013524 A JP2022013524 A JP 2022013524A JP 2020135157 A JP2020135157 A JP 2020135157A JP 2020135157 A JP2020135157 A JP 2020135157A JP 2022013524 A JP2022013524 A JP 2022013524A
- Authority
- JP
- Japan
- Prior art keywords
- information
- past
- image
- unit
- invoice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000000605 extraction Methods 0.000 claims abstract description 43
- 238000004364 calculation method Methods 0.000 claims abstract description 17
- 239000000284 extract Substances 0.000 claims abstract description 12
- 230000013016 learning Effects 0.000 claims description 55
- 230000006870 function Effects 0.000 claims description 20
- 238000012015 optical character recognition Methods 0.000 claims description 13
- 238000012545 processing Methods 0.000 description 17
- 230000008569 process Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 238000013527 convolutional neural network Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000004397 blinking Effects 0.000 description 3
- 230000006735 deficit Effects 0.000 description 3
- 230000005611 electricity Effects 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
本発明は、帳票情報生成装置、方法及びプログラムに関する。 The present invention relates to a form information generator, a method and a program.
特許文献1及び2には、「管理装置1は、紙媒体の画像を示す画像情報と、当該画像に対応して過去に入力された入力情報とを関連付けて記憶部11に記憶しており、記憶部11に記憶されている画像情報から、取得された画像情報と類似する画像情報を特定する(図1の(3))。管理装置1は、特定した画像情報に関連付けられている入力情報を特定し、当該入力情報と、取得された画像情報から抽出された文字情報とを、ユーザ端末2に送信される入力画面に出力する(図1の(4))。」と記載されている。
[先行技術文献]
[特許文献]
[特許文献1] 特開2017-174199
[特許文献2] 特開2017-174200
In
[Prior Art Document]
[Patent Document]
[Patent Document 1] Japanese Patent Application Laid-Open No. 2017-174199
[Patent Document 2] Japanese Patent Application Laid-Open No. 2017-174200
本発明の第1の態様においては、帳票情報生成装置であって、過去の帳票画像から抽出された過去特徴量と、過去の帳票画像に記載された文字の情報に基づいた過去の帳票情報とを関連付けて取得する取得部と、対象とする帳票画像から対象特徴量を抽出する抽出部と、対象特徴量と過去特徴量との類似度を算出する算出部と、類似度に基づいて、過去の帳票情報を選択する選択部と、対象とする帳票画像から予め定められた項目の文字の情報を読み取る読取部と、選択部で選択された過去の帳票情報と、読取部で読み取られた文字の情報とから、対象とする帳票画像に関連付けられた新たな帳票情報を生成して表示する生成部とを備える。 In the first aspect of the present invention, the form information generation device is a past form information based on the past feature amount extracted from the past form image and the character information described in the past form image. An acquisition unit that acquires the target feature amount in association with each other, an extraction unit that extracts the target feature amount from the target form image, a calculation unit that calculates the similarity between the target feature amount and the past feature amount, and a past based on the similarity degree. A selection unit that selects the form information of, a reading unit that reads the character information of the predetermined item from the target form image, the past form information selected by the selection unit, and the characters read by the reading unit. It is provided with a generation unit that generates and displays new form information associated with the target form image from the information of.
本発明の第2の態様においては、会計処理システムに読み込ませる請求情報を生成するための装置であって、請求情報及び当該請求情報に対応する請求書画像は、それぞれ第1情報と第2情報とを含むものであり、過去の請求情報と、過去の請求書画像とを関連付けて取得する取得部と、取得部を参照することにより新たな請求書画像と類似する過去の請求書画像を選択し、当該選択した過去の請求情報から第1情報を抽出する第1情報取得部と、新たな請求書画像から第2情報を光学的文字認識装置(OCR)で読み取る第2情報取得部と、第1情報取得部により抽出された第1情報と、第2情報取得部により読み取られた第2情報とから、新たな請求情報を生成する生成部と、を備える。 In the second aspect of the present invention, the device for generating the billing information to be read by the accounting processing system, and the billing information and the billing image corresponding to the billing information are the first information and the second information, respectively. And, the acquisition unit that acquires the past invoice information in association with the past invoice image, and the past invoice image that is similar to the new invoice image is selected by referring to the acquisition unit. A first information acquisition unit that extracts the first information from the selected past billing information, and a second information acquisition unit that reads the second information from the new invoice image with an optical character recognition device (OCR). It includes a generation unit that generates new billing information from the first information extracted by the first information acquisition unit and the second information read by the second information acquisition unit.
本発明の第3の態様においては、方法であって、過去の帳票画像から抽出された過去特徴量と、過去の帳票画像に記載された文字の情報に基づいた過去の帳票情報とを関連付けて取得するステップと、対象とする帳票画像から対象特徴量を抽出するステップと、対象特徴量と過去特徴量との類似度を算出するステップと、類似度に基づいて、過去の帳票情報を選択するステップと、対象とする帳票画像から予め定められた項目の文字の情報を読み取るステップと、選択のステップで選択された過去の帳票情報と、読み取りのステップで読み取られた文字の情報とから、対象とする帳票画像に関連付けられた新たな帳票情報を生成して表示するステップとを備える。 In the third aspect of the present invention, there is a method of associating the past feature amount extracted from the past form image with the past form information based on the character information described in the past form image. A step to acquire, a step to extract the target feature amount from the target form image, a step to calculate the similarity between the target feature amount and the past feature amount, and a step to select the past form information based on the similarity degree. The target is from the step, the step of reading the character information of the predetermined item from the target form image, the past form information selected in the selection step, and the character information read in the reading step. It is provided with a step of generating and displaying new form information associated with the form image.
本発明の第4の態様においては、プログラムであって、コンピュータに上記方法を実現させる。 In the fourth aspect of the present invention, the program is a computer to realize the above method.
本発明の第5の態様においては、会計処理システムに読み込ませる請求情報を生成するための方法であって、請求情報及び当該請求情報に対応する請求書画像は、それぞれ第1情報と第2情報とを含むものであり、過去の請求情報と、過去の請求書画像とを関連付けて取得するステップと、取得した過去の請求書画像を参照することにより新たな請求書画像と類似する過去の請求書画像を選択し、当該選択した過去の請求情報から第1情報を抽出するステップと、新たな請求書画像から第2情報を光学的文字認識装置(OCR)で読み取るステップと、第1情報と、第2情報とから、新たな請求情報を生成するステップと、を備える。 In the fifth aspect of the present invention, there is a method for generating billing information to be read by the accounting processing system, and the billing information and the billing image corresponding to the billing information are the first information and the second information, respectively. And, the step of associating the past invoice information with the past invoice image and acquiring the past invoice image, and the past invoice similar to the new invoice image by referring to the acquired past invoice image. A step of selecting a calligraphy image and extracting the first information from the selected past billing information, a step of reading the second information from the new billing image with an optical character recognition device (OCR), and the first information. , A step of generating new billing information from the second information.
本発明の第6の態様においては、プログラムであって、コンピュータに上記方法を実現させる。 In the sixth aspect of the present invention, the program is a computer to realize the above method.
なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。 The outline of the above invention does not list all the necessary features of the present invention. A subcombination of these feature groups can also be an invention.
以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。 Hereinafter, the present invention will be described through embodiments of the invention, but the following embodiments do not limit the invention to which the claims are made. Also, not all combinations of features described in the embodiments are essential to the means of solving the invention.
図1は、本実施形態における帳票画像の一例である請求書画像10の具体的な一例を示す。図1の請求書画像10は「ABC電力会社」から、本実施形態の使用者である「〇〇株式会社」に宛ての電気料金の請求である。請求書画像10は、紙で送られて使用者側でスキャナ等により画像データ化したり、元々PDFなどの汎用の画像データとして送られたりする。
FIG. 1 shows a specific example of the
図2は、使用者が図1の請求書画像10から生成する帳票情報の一例である請求情報20の具体的な一例を示す。使用者は、請求書画像10を受け取った場合に、請求書画像10に記載されている文字の情報の中から使用者自身に必要な又は関心のある情報を、例えば会計処理システムなどに用いる。請求情報20は、当該会計処理システムへの入力が容易となるよう、csv、xlsなどのフォーマットであることが好ましい。
FIG. 2 shows a specific example of the
請求情報20は、使用者側の会計処理システムで用いる情報である。会計処理システムを用いることで、使用者は独自の規則で費用を計上し、財務諸表などを作成することが可能となる。図2の例では、請求情報20の項目として、請求項目、費目、費用発生部署、金額、請求日、支払期日、及び、請求元を含むものである。請求情報20は、これらの項目の他、送金処理に必要な取引先の銀行口座の情報や、備考欄なども関連付けたものでもよい。また、ここでは、各項目が部署ごとに記載されているが、各項目を部署ごとの費用として計上する必要がない場合には、例えば費用発生部署に全社又は総務部等と記載する。
The
ここで、請求書画像10と請求情報20とを対比すると、請求書画像10に記載された「割引」のように、請求情報20には反映されない文字の情報がある。一方で、請求書画像10の「請求金額」と請求情報20の「金額」のように、請求書画像10に記載された文字の情報をそのままではなく、独自の規則で変換して反映させる文字の情報がある。したがって、いわゆるOCRの精度を高くするだけでは必ずしも請求書画像10から使用者の望む請求情報20は容易には生成されない。
Here, when the
さらに、電気料金が年単位での定額の契約である場合などは、請求書画像10に記載される電気料金に関する情報は前月と変わらない。したがって、このような場合には当該請求書が前月のどの請求書と対応するのかが精度よく選択されることが好ましい。
Further, when the electricity rate is a fixed amount contract on a yearly basis, the information on the electricity rate described in the
そこで本実施形態では、新たな請求書画像の特徴量に対して、これと類似する過去の特徴量に対応付けられた請求情報を選択する。さらに、当該過去の請求情報と、新たな請求書画像から読み取った文字の情報とを用いることで、使用者の望む請求情報を容易に生成する装置を提供する。 Therefore, in the present embodiment, the billing information associated with the past feature amount similar to the feature amount of the new invoice image is selected. Further, by using the past billing information and the character information read from the new billing image, a device for easily generating the billing information desired by the user is provided.
図3は、本実施形態に係る帳票情報生成装置100のブロック図である。帳票情報生成装置100の一例は、汎用コンピュータにプログラムがインストールされたものである。また、帳票情報生成装置100は使用者の端末装置と通信可能に構成されており、使用者の端末装置から請求情報の修正などを受け付ける。
FIG. 3 is a block diagram of the form
帳票情報生成装置100は、記憶部110と、請求書画像から特徴量を抽出する抽出部120と、抽出した特徴量と記憶部110に記憶された特徴量との類似度を算出する算出部130と、類似度に基づいて記憶部110に記憶された請求情報を選択する選択部140とを備える。帳票情報生成装置100はさらに、請求書画像から予め定められた項目の文字の情報を読み取る読取部150と、選択された請求情報及び読み取られた文字の情報から、新たな請求情報を生成して表示する生成部160とを備える。
The form
記憶部110は、学習済み抽出部111と、選択用データ112と、読取条件113と、対応関係114とを記憶する。例えば、これらの情報はインターネットを介して他のサーバ等から又はUSBメモリのような記録媒体により、使用者により予め記憶される。当該情報を外部から取得して記憶するという観点から、記憶部110は取得部としての機能も担っているといえる。
The
学習済み抽出部111は、予め学習された方法で請求書画像から特徴量を抽出するものであって、詳細は後述する。学習済み抽出部111そのものを記憶することに代えて、予め学習することによって得られた各パラメータや重み付け値を、抽出部120で利用可能に記憶していてもよい。
The learned
図4は、選択用データ112を模式的に示す。選択用データ112において、請求書画像10、特徴量30及び請求情報20が1つのデータセットとして互いに対応付けられている。また、請求書画像10には請求元の会社毎にラベル40が対応付けられている。ただし、これに限定されるものではなく、請求書画像10は、同じ請求元であって異なる請求書のフォーマット毎にラベルが対応付けられているものでもよい。なお、請求書画像10及びラベル40は主に後述する学習に用いられるので、選択用データ112には含まれていなくてよい。
FIG. 4 schematically shows the
請求書画像10及び請求情報20は、使用者が過去に会計処理システムに使用したものであってよい。これらは、少量多種類の情報であり、例えば1万程度の会社(すなわちラベル40)に対し、会社毎(すなわちラベル40毎)に100枚程度のものが存在する。なお、図4の例では、説明を簡略化するために、ラベル40が「ABC電力」と「DEF新聞販売店」の2つあり、「ABC電力」に対して3つのデータセット、「DEF新聞販売店」に対して1つのデータセットのものを示している。
The
特徴量V0等は学習済み抽出部111で抽出された、請求書画像10の特徴をd次元のベクトル(dは例えば1000程度)で表現したものである。当該特徴量V0等はユーザが視認可能な形で記憶されていなくてよい。以上を換言すれば、記憶部110には、少なくとも、過去の請求書画像から抽出された特徴量である過去特徴量と、過去の請求書画像に記載された文字の情報に基づいた過去の請求情報とが関連付けて記憶されているといえる。
The feature amount V0 and the like represent the features of the
図5は、読取条件113を模式的に示す。読取条件113には請求書画像10から読取部150が読み取る項目と、当該項目を読み取る条件とが対応付けられている。
FIG. 5 schematically shows the
ここで「条件」は、請求書画像10のどこに又はどのように当該項目に対応する文字の情報をOCRで読み取ることができるかをルールベースで示したものである。図5の例において、例えば、項目「発行日」の条件「1)」は、発行日が請求書画像10の「発行日」という文字列の右の文字列から得られることを示す。また、例えば、項目「発行日」の条件「2)」は、発行日が、請求書画像10の「発行日」という文字列の下の文字列から得られることを示す。また、例えば、項目「発行日」の条件「3)」は、発行日が、請求書画像10の右上領域の「年」「月」「日」のいずれかの文字を含む文字列から得られることを示す。なお、読取条件として、「発行日」という文字列に代えて、「発」「行」「日」のうちの例えば2文字を含む文字列が用いられてもよい。これにより「発行年月日」等の文字列を発行日として読み取ることが可能となる。
Here, the "condition" indicates where or how the character information corresponding to the item can be read by OCR in the
また、図5の例において、例えば、項目「請求金額」の条件「1)」は、請求金額が、請求書画像10の「請求金額」という文字列の右の文字列から得られることを示す。また、例えば、項目「請求金額」の条件「2)」は、請求金額が、請求書画像10の「請求金額」という文字列の下の文字列から得られることを示す。また、例えば、項目「請求金額」の条件「3)」は、請求金額が、請求書画像10の「合計」という文字列の右の文字列から得られることを示す。また、例えば、項目「請求金額」の条件「4)」は、請求金額が、請求書画像10の「合計」という文字列の下の文字列から得られることを示す。なお、読取条件として、「請求金額」という文字列に代えて、「請」「求」「金」「額」のうちの例えば3文字が含まれる項目を「請求金額」と記載される文字列としてもよい。これにより「請求額」等の文字列を請求金額として読み取ることが可能となる。
Further, in the example of FIG. 5, for example, the condition "1)" of the item "billing amount" indicates that the billing amount is obtained from the character string to the right of the character string "billing amount" of the
また、図5の例において、例えば、項目「支払期日」の条件「1)」は、支払期日が、請求書画像10の「支払期日」という文字列の右の文字列から得られることを示す。また、例えば、項目「支払期日」の条件「2)」は、支払期日が、請求書画像10の「支払期日」という文字列の下の文字列から得られることを示す。なお、読取条件として、「支払期日」という文字列に代えて、「支」「払」「期」「日」「限」のうちの例えば2文字が含まれる項目を「支払期日」と記載される文字列としてもよい。これにより「支払い期限」「請求期限」等の文字列を支払期日として読み取ることが可能となる。
Further, in the example of FIG. 5, for example, the condition "1)" of the item "payment date" indicates that the payment date is obtained from the character string to the right of the character string "payment date" of the
なお複数の条件のうち、番号が早い順に読み取りが試行され、見つからなければ次の条件を試行する。読取条件113はOCRの知識を有する者により予め設定されていることが好ましいが、使用者により変更することができてもよい。
Of the multiple conditions, reading is tried in ascending order of number, and if not found, the next condition is tried. The
図6は、対応関係114を模式的に示す。対応関係114は、読取部150による読取の項目と、選択用データの過去の請求情報20の項目との対応関係、及び、当該項目に対して生成部160が行う処理が対応付けられている。対応関係114は使用者が自ら望む請求情報20を得るように、任意に設定することができるようにしてもよい。
FIG. 6 schematically shows the
図6の例では、読取の項目「発行日」が請求情報の項目「請求日」に対応する。そして、請求情報の「請求日」を読取の項目で読み取った「発行日」で上書きするという処理を行なうための情報が記憶部110に格納されている。
In the example of FIG. 6, the reading item "issue date" corresponds to the billing information item "billing date". Then, information for performing a process of overwriting the "billing date" of the billing information with the "issue date" read in the reading item is stored in the
また、図6の例では、読取の項目「請求金額」が請求情報の項目「金額」に対応する。そして、請求情報の「金額」の合計と読取の項目で読み取った「請求金額」とを比較するという処理を行なうための情報が記憶部110に格納されている。
Further, in the example of FIG. 6, the reading item "billing amount" corresponds to the billing information item "amount". Then, information for performing a process of comparing the total of the "amounts" of the billing information with the "billing amount" read in the reading item is stored in the
また、図6の例では、読取の項目「支払期日」が請求情報の項目「支払期日」に対応する。そして、請求情報の「支払期日」の合計と読取の項目で読み取った「支払期日」で上書きするという処理を行なうための情報が記憶部110に格納されている。
Further, in the example of FIG. 6, the reading item “payment date” corresponds to the billing information item “payment date”. Then, information for performing a process of overwriting with the total of the "payment date" of the billing information and the "payment date" read in the reading item is stored in the
なお、対応関係114において、読取条件113で読み取るとされた項目の全てを請求情報20のいずれかの項目と対応付けする必要はない。さらに、対応関係114において、選択用データ112の請求情報20に含まれる項目の全てをいずれかの読取の項目と対応付ける必要もない。
In the
むしろ、請求書画像10に含まれる文字の情報のように毎回変わらない情報が多い場合には、変わらない情報に関する項目を対応関係114に含めないことが好ましい場合がある。対応関係114に含めないことにより、読取部150で誤って読み取った文字の情報に基づいて、誤った請求情報が生成されることを防ぐことができる場合がある。
Rather, when there is a lot of information that does not change each time, such as character information included in the
図7は、帳票情報生成装置100の動作フローS10の一例を示し、図8は新たな請求書画像12の一例を示す。動作フローS10は、新たな請求書画像12が入力された場合に開始される。なお、以下の説明において、新たな請求情報を符号22で表し、記憶部110に記憶されている請求情報20と区別して表すことにする。
FIG. 7 shows an example of the operation flow S10 of the form
抽出部120は記憶部110から学習済み抽出部111を読み込んで、請求書画像12の特徴量である対象特徴量を抽出する(S100)。これは、抽出部120が、過去の請求書画像10から特徴量30を抽出する学習済の方法に対応した方法で、対象特徴量を抽出しているともいえる。
The
算出部130は、対象特徴量と、記憶部110に格納されている選択用データ11の特徴量30との類似度を算出する(S102)。類似度の算出方法はいくつか方法があり、後述する学習済み抽出部111を学習させるのに用いた類似度の算出方法とは必ずしも同じでなくてもよい。
The
算出部130は、選択用データ112の全ての又は予め定められた一部分の特徴量30に対して、対象特徴量との類似度を計算する(S104)。その結果、閾値以上の類似度となる特徴量30が少なくとも1つあった場合に(S106:Yes)、ステップS107に進む。一方、閾値以上の類似度となる特徴量30が1つもなかった場合に(S106:No)、ステップS116に進む。当該閾値は予め設定されて記憶部110に格納されているが、使用者によって変更できてよい。
The
ステップS107において、選択部140は上記類似度に基づいて、選択用データ112の請求情報20を選択する(S107)。この場合に、選択部140は類似度の大きい順に予め定められた個数、例えば10個、の特徴量30に対応付けられた(すなわち同数の)請求情報20を選択する。
In step S107, the
以下、説明を簡略化するために、図2の請求情報20が選択される例で説明する。
Hereinafter, in order to simplify the description, an example in which the
上記ステップS100からS107と並行して、読取部150は記憶部110に記憶された読取条件113に基づいて、当該条件に対応した項目について請求書画像12から文字の情報を読み取る(S120)。図5の読取条件113の場合には、発行日及び請求金額の情報を読み取る。図8の請求書画像12が正しく読み取られたとすれば、発行日の文字の情報として「令和2年6月10日」、及び、請求金額の文字の情報として「:¥110,000-」が読み取られる。
In parallel with steps S100 to S107, the
この場合に、読取部150は既知の非定型OCRエンジンを用いてよい。例えば、CTPN、EAST、SegLink、TextBoxes++、PSENet、TextSnakeなどで文字領域を抽出し、当該文字領域からCRNN(畳み込みリカレントニューラルネットワーク)系のモデルを用いて文字の情報を読み取って良い。この際、CNN部分はVGG16, ResNet等、RNN部分はLSTM、GRU、seq2seq、注意機構等種々のネットワークが利用できる。また、文字領域を抽出後、文字を一文字ずつに分割してからCNN系のモデル(VGG16, ResNet等)で文字の情報を読み取ってもよい。また、文字領域抽出から文字情報の読取までをEnd-to-Endで一つのネットワークで行ってもよい。
In this case, the
ステップS108において、生成部160は、記憶部110に記憶された対応関係114に基づいて、選択された請求情報20の請求日を、読み取った発行日で上書きする。この場合に生成部160は、読み取った発行日の文字の情報をそのまま上書きしてもよいし、予め定められた変換規則に従って変換して上書きしてもよい。当該変換規則は使用者が対応関係114の処理として設定してもよいし、対応関係114とは別個に記憶部110に記憶されてもよい。本実施形態において、元号を西暦に変換した上で「YYYY/MM/DD」の形に変換する例で説明する。
In step S108, the
次に、生成部160は、記憶部110に記憶された対応関係114に基づいて、選択された請求情報20の金額の合計と、読み取った請求金額とを比較する(S110)。図8の請求書画像12及び図2の請求情報20の例の場合、生成部160は請求情報20の金額の欄を合計し、「110000」を得る。生成部160はこれと、請求書画像12から読み取った請求金額の文字の情報「:¥110,000-」のうちの数字部分「110000」とを比較し、一致すると判断する。
Next, the
ステップS110の判断がYesの場合に、生成部160はステップS108で上書きされた請求情報を新たな請求情報として生成し、ディスプレイ等に表示する(S114)。
When the determination in step S110 is Yes, the
図9は、生成部160が生成した新たな請求情報22の一例を示す。請求情報22において、図2の請求情報20の文字の情報のうち、請求日及び支払期日が、読取部150で読み取られた発行日及び支払期日の情報で書き換えられている。一方、請求項目等、書き換えられなかった文字の情報について、選択された過去の請求情報20の文字の情報が新たな請求情報22に使用されている。
FIG. 9 shows an example of the
さらに、当該請求日が、請求項目等の書き換えられていない情報と区別可能に斜体で表現されている。区別可能な表現は、ボールド、赤字、点滅など、他の方法であってもよい。 Further, the billing date is expressed in italics so as to be distinguishable from unrewritten information such as billing items. The distinguishable representation may be in other ways, such as bold, deficit, blinking, etc.
さらに生成部160は、読取部150で読み取った文字の情報の読み取りの確度に応じて、請求情報22を表示してもよい。例えば、請求情報22のうち、読取部150で読み取られた情報で書き換えたもののうち、確度が閾値より高いものと低いものとを区別可能に表示してもよい。区別可能な表示は、斜体、ボールド、赤字、点滅などであってよく、確度が低い方が目に使用者の目に付きやすい表現であることが好ましい。
Further, the
上記ステップS110の判断がNoの場合に、生成部160は新たに生成する請求情報22に警告を追加する(S112)。警告の例は、請求情報22の金額の欄を斜体、ボールド、赤字、点滅にするなどである。上記の書き換えられた情報に用いる表現とは異なっていることが好ましい。これに加えて又は代えて、請求情報22の欄外に「請求金額が異なっています」という文字情報を表示してもよい。
If the determination in step S110 is No, the
上記ステップ106の判断がNoの場合に、選択部140は過去に類似した請求書画像がない旨を警告する(S116)。例えば、ディスプレイ等に「類似度の高い請求書が見つかりませんでした」という文字情報を表示してもよい。
If the determination in step 106 is No, the
以上により、動作フローS10が終了する。その後、帳票情報生成装置100は、表示した請求情報22について、使用者の修正や追加などを受け付ける。ここでは、ステップS107で類似度の大きい順に予め定められた個数(例えば10個)の請求情報20が選択されているので、新たな請求情報22は上記個数(例えば10個)と同じだけ表示されることになる。使用者は、複数の請求情報22から最も好ましい請求情報を選択した上で、修正や追加をする。なお、ステップS116で警告していた場合には、全く新規の請求情報22の入力を受け付ける構成としてもよい。
As a result, the operation flow S10 ends. After that, the form
なお、上記ステップS110及びS112、及び/又は、ステップS116は必ずしも必要な処理ではなく、適宜省略してもよいものである。 It should be noted that the steps S110 and S112 and / or step S116 are not necessarily necessary processes and may be omitted as appropriate.
帳票情報生成装置100は、使用者から請求情報22を確定する旨の入力があった場合に、確定した情報としてディスプレイ等に表示する。ディスプレイ等に表示することに代えて又はこれに加えて、会計処理システムにエクスポートしたり、データとして外部に出力等したりしてもよい。さらに、帳票情報生成装置100は、請求書画像12及び/又はその特徴量と請求情報22とを対応付けて、新たなデータセットとして記憶部110の選択用データ112に追加する。すなわち、次回から類似画像として選択される候補となる。
When the user inputs that the
図10は、帳票情報生成装置100の記憶部110に記憶される学習済み抽出部111を生成する学習装置200のブロック図である。学習装置200の一例は、汎用コンピュータにプログラムがインストールされたものである。
FIG. 10 is a block diagram of the
学習装置200は、記憶部210と、請求書画像10から特徴量30を抽出する抽出部220と、抽出した特徴量30同士の類似度を算出する類似度算出部230と、類似度に基づいて損失関数の値を算出してそれを最小化する損失関数算出部240とを備える。本実施形態において、学習装置200は、抽出部220としてCNNを用いて、深層距離学習を行う。なお、抽出部220は、CNNに限らず、全結合、RNN、self-attentionなどのニューラルネットワークを用いて特徴量を抽出するものでもよい。さらに、抽出部220は、ニューラルネットワークではなく、SIFT、HOGなどの局所特徴量を抽出するものでもよい。
The
記憶部110は、学習用データ211と、学習用パラメータ212と、学習済み抽出部111とを記憶する。なお、学習前では学習済み抽出部111は記録されていなくてよい。
The
学習用データ211は、少なくとも、ラベル40と、請求書画像10と請求情報20とが対応付けられたデータセットとを含む。ラベル40と、請求書画像10と請求情報20とが対応付けられたデータセットは学習を実行する学習者によって、例えば、インターネットを介して他のサーバ等から又はUSBメモリのような記録媒体により記憶部210に記憶される。
The learning
学習用データ211はさらに、学習の結果として請求情報20に対応付けられた特徴量30も含む。学習用データ211のデータセットは、帳票情報生成装置100で使われる選択用データ112のデータセットと同一であるか、少なくとも一部は、好ましくは大部分が重複していることが好ましい。説明の簡略化のため、本実施形態では学習用データ211のデータセットと選択用データ112のデータセットとが同一であるとする。
The learning
学習用パラメータ212は、学習の方法に応じて当該学習に用いるパラメータの値を格納する。抽出部220としてCNNを用いて、深層距離学習を行う場合には、抽出部220のパラメータとして、ネットワークの階層数、各層におけるノードの数、重みの初期値などが含まれる。また、深層距離学習のパラメータとして、学習条件としての学習率及び学習回数、並びに、損失関数等が含まれる。当該パラメータの値は、学習者により設定され、学習中に適宜変更されてよい。
The learning
図11は、深層距離学習の方法を模式的に示す。まず、データセットのペアを用意する。 FIG. 11 schematically shows a method of deep distance learning. First, prepare a pair of datasets.
ペアの請求書画像G1,G2のそれぞれを抽出部220に入力して、それぞれの特徴量C1、C2を計算する。特徴量C1,C2を類似度算出部230に入力してそれらの間の類似度を計算する。類似度は、コサイン類似度や特徴量空間のユークリッド距離などの距離関数の逆数等、既知の方法のいずれでもよいが、損失関数に対応したものが用いられる。
Each of the paired invoice images G1 and G2 is input to the
当該類似度、及び、ペアの請求書画像のそれぞれのラベルL1,L2を損失関数算出部240に入力して損出関数の値を計算し、当該値が小さくなるように誤差逆伝搬により抽出部220の重み等を更新する。損失関数は、ラベルL1とラベルL2とが同じであれば類似度が大きいほど(すなわち特徴量のベクトル間の距離が近いほど)値が小さく、かつ、ラベルL1とラベルL2とが異なっていれば類似度が小さいほど(すなわち特徴量のベクトル間の距離が遠いほど)値が小さくなる関数である。そのような損失関数として、Contrastive Loss、ArcFace、CosFace、SphereFaceなどが用いられてよい。
The similarity and the labels L1 and L2 of the invoice image of the pair are input to the loss
上記の更新を、予め設定した学習回数又はEarly Stoppingに基づいて繰り返し行う。上記更新は、バッチ、オンライン、ミニバッチのいずれの更新タイミングで行われてもよい。 The above update is repeated based on a preset number of learning times or early stopping ping. The above update may be performed at any of batch, online, and mini-batch update timings.
なお、請求書画像10のように多ラベルで少数データの場合には、ラベルが同じペアと異なるペアとが予め定められた割合、例えば、等しい割合で学習に使われるようにサンプリングすることが好ましい。これにより、ランダムでサンプリングした場合に生じる、同じラベルを持つペアが使われる確率が小さくて学習が進まない、という問題を回避することができる。
In the case of a large number of labels and a small number of data such as the
学習装置200は、上記の通り学習した結果得られた抽出部220を学習済み抽出部111として記憶部210に記憶する。抽出部220そのものを記憶することに代えて、抽出部220と同等の演算が再現できる、当該抽出部220で用いられている重み等のパラメータが学習済み抽出部111に記憶されてもよい。学習済み抽出部111そのもの又はそれに用いられるパラメータを、帳票情報生成装置100の抽出部120に読み込むことにより、上記で学習した結果得られた抽出部220と同等の演算で特徴量30を抽出することができる。
The
上記の通り、過去の請求書画像10の特徴量30、及び、帳票情報生成装置100の抽出部120は、機械学習で得られたものに対応する。これにより、精度の高い類似画像検索を行うことができる。ここで、「対応する」とは同一であってもよいし、パラメータの読み込み等により再現されたものであってもよく、確率等の他の要因の範囲内で等価な演算結果が得られるものであることを含む。
As described above, the
図12は、深層距離学習を用いた場合とカテゴリ分類による学習を用いた場合とで、帳票情報生成装置100で類似画像検索をしたときの正解率を示す。学習用データとして、100ラベルで、各ラベル1~100枚の概ね1000枚の画像について、30~40ラベルの3グループに分割してグループ交差検証をした結果である。図12において、横軸が検索候補数を示し、縦軸がtop-k正解率(検索候補の中に少なくとも一つ同ラベルの請求書が含まれた割合)を示している。
FIG. 12 shows the correct answer rate when a similar image search is performed by the form
図12に示すように、機械学習として深層距離学習を用いると、請求書画像10のような、多種類かつ少数の検索対象について、カテゴリ分類による学習よりも精度を向上させることができる。
As shown in FIG. 12, when deep distance learning is used as machine learning, it is possible to improve the accuracy of a large number of types and a small number of search targets, such as the
図13は、深層距離学習の他の方法を模式的に示す。図13の方法では、データセットのペアを用意する代わりに、個々のデータセットに対する特徴量と、各ラベルに対応する代表特徴量(行列)との類似度を算出する。そして、当該類似度、及び、請求書画像のラベルL1を損失関数算出部240に入力して損出関数の値を計算し、当該値が小さくなるように誤差逆伝搬により抽出部220及び各ラベルの代表特徴量の値等を更新する。
FIG. 13 schematically shows another method of deep distance learning. In the method of FIG. 13, instead of preparing a pair of data sets, the similarity between the feature amount for each data set and the representative feature amount (matrix) corresponding to each label is calculated. Then, the similarity and the label L1 of the invoice image are input to the loss
補足すると、「代表特徴量」は、予め設定された複数のラベルに対応する特徴量を示すものである。詳しくは、個々のデータセットに対する特徴量がd次元で表され、ラベルがN個あるとすると、代表特徴量はN×d次元の行列で表される。そのため、図13に示す例では、類似度算出部230で、特徴量C1に対して、各ラベルに対応してN個の類似度が算出される。そして、損失関数算出部240では、それらのN個の類似度に対し、ラベルL1に対応する類似度が大きいほど値が小さく、かつ、ラベルL1以外に対応する類似度が小さいほど値が小さくなるように出力する。なお、代表特徴量の初期値は乱数で決定される。
Supplementally, the "representative feature amount" indicates the feature amount corresponding to a plurality of preset labels. Specifically, if the features for each data set are represented in d-dimensional and there are N labels, the representative features are represented by an N × d-dimensional matrix. Therefore, in the example shown in FIG. 13, the
換言すると、上述した抽出部220は、一の請求書画像G1の第1ラベル(L1)と、当該請求書画像G1から得られる特徴量C1及び予め設定された複数の第2ラベル(L1~LN)に対応する特徴量を含む代表特徴量の類似度との入力に応じて、第1ラベル(L1)と第2ラベル(L1~LN)とが同じラベル(L1)のときには前記類似度が大きいほど値が小さく、第1ラベルと第2ラベルとが異なるラベル(L2~LN)のときには類似度が小さいほど値が小さくなる損失関数を用いた学習で得られたものに対応する。
In other words, the
以上、本実施形態によれば、対象とする請求書画像の特徴量に対して、これと類似する過去の特徴量に対応付けられた請求情報と、対象とする請求書画像から読み取った文字の情報とを用いる。これにより、新たな請求書画像から、使用者の望む請求情報を容易に生成することができる。 As described above, according to the present embodiment, with respect to the feature amount of the target invoice image, the billing information associated with the past feature amount similar to the feature amount and the characters read from the target invoice image. Use information. Thereby, the billing information desired by the user can be easily generated from the new invoice image.
詳しくは、本実施形態に係る帳票情報生成装置100を用いれば、請求情報22として、「項目」「費目」「費用発生部署」「金額」「請求日」「支払期日」「請求元」が少なくとも関連付けられて記憶されている場合、「項目」「費目」「費用発生部署」「請求元」を過去の請求書画像に基づいて抽出し、「請求日」「支払期限」をOCRで読み取ることで、会計処理システムに必要な請求情報22を使用者が容易に生成することができる。特に、「金額」以外の項目があまり変動しない場合に、本実施形態に係る帳票情報生成装置100を用いることで、会計処理システムに必要な請求情報を生成するのに要する使用者の労力を大幅に低減することができる。
Specifically, if the form
本実施形態の変形例として下記のものが考えられる。まず、帳票として、請求書以外に、注文書、見積書、領収書、保険証券等が考えられる。 The following can be considered as a modification of this embodiment. First, in addition to invoices, purchase orders, quotations, receipts, insurance policies, etc. can be considered as forms.
また、読取条件113がルールベースであることに代えて、機械学習によって予め定められた項目の文字の情報が読み取られてもよい。また、機械学習として深層距離学習に代えて、少し精度は劣るが、カテゴリ分類による学習、自己教師あり学習、Imagenetなどを学習したモデルの転移学習などを用いてもよい。
Further, instead of the
また、帳票情報生成装置100と学習装置200とはサーバと通信可能であってよい。その場合に、当該サーバに、帳票情報生成装置100の記憶部110に記憶されていると説明されていたデータの一部又は全部、及び/又は、学習装置200の記憶部210に記憶されていると説明されていたデータの一部又は全部が記憶されていてもよい。この場合には、帳票情報生成装置100が当該サーバと通信する送受信部が各種情報を取得する取得部の機能を有することになる。これに代えて、帳票情報生成装置100と学習装置200とが通信可能で、いずれか一方が上記サーバの機能を有していてもよい。この場合も、帳票情報生成装置100が当該学習装置200と通信する送受信部が各種情報を取得する取得部の機能を有することになる。
Further, the form
本発明の様々な実施形態は、フローチャートおよびブロック図を参照して記載されてよく、ここにおいてブロックは、(1)操作が実行されるプロセスの段階または(2)操作を実行する役割を持つ装置のセクションを表わしてよい。特定の段階およびセクションが、専用回路、コンピュータ可読媒体上に格納されるコンピュータ可読命令と共に供給されるプログラマブル回路、および/またはコンピュータ可読媒体上に格納されるコンピュータ可読命令と共に供給されるプロセッサによって実装されてよい。専用回路は、デジタルおよび/またはアナログハードウェア回路を含んでよく、集積回路(IC)および/またはディスクリート回路を含んでよい。プログラマブル回路は、論理AND、論理OR、論理XOR、論理NAND、論理NOR、および他の論理操作、フリップフロップ、レジスタ、フィールドプログラマブルゲートアレイ(FPGA)、プログラマブルロジックアレイ(PLA)等のようなメモリ要素等を含む、再構成可能なハードウェア回路を含んでよい。 Various embodiments of the present invention may be described with reference to flowcharts and block diagrams, wherein the block is (1) a stage of the process in which the operation is performed or (2) a device having a role of performing the operation. May represent a section of. Specific stages and sections are implemented by dedicated circuits, programmable circuits supplied with computer-readable instructions stored on computer-readable media, and / or processors supplied with computer-readable instructions stored on computer-readable media. It's okay. Dedicated circuits may include digital and / or analog hardware circuits, and may include integrated circuits (ICs) and / or discrete circuits. Programmable circuits are memory elements such as logical AND, logical OR, logical XOR, logical NAND, logical NOR, and other logical operations, flip flops, registers, field programmable gate arrays (FPGAs), programmable logic arrays (PLA), etc. May include reconfigurable hardware circuits, including, etc.
コンピュータ可読媒体は、適切なデバイスによって実行される命令を格納可能な任意の有形なデバイスを含んでよく、その結果、そこに格納される命令を有するコンピュータ可読媒体は、フローチャートまたはブロック図で指定された操作を実行するための手段を作成すべく実行され得る命令を含む、製品を備えることになる。コンピュータ可読媒体の例としては、電子記憶媒体、磁気記憶媒体、光記憶媒体、電磁記憶媒体、半導体記憶媒体等が含まれてよい。コンピュータ可読媒体のより具体的な例としては、フロッピー(登録商標)ディスク、ディスケット、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、消去可能プログラマブルリードオンリメモリ(EPROMまたはフラッシュメモリ)、電気的消去可能プログラマブルリードオンリメモリ(EEPROM)、静的ランダムアクセスメモリ(SRAM)、コンパクトディスクリードオンリメモリ(CD-ROM)、デジタル多用途ディスク(DVD)、ブルーレイ(RTM)ディスク、メモリスティック、集積回路カード等が含まれてよい。 The computer readable medium may include any tangible device capable of storing instructions executed by the appropriate device, so that the computer readable medium having the instructions stored therein is specified in a flow chart or block diagram. It will be equipped with a product that contains instructions that can be executed to create means for performing the operation. Examples of computer-readable media may include electronic storage media, magnetic storage media, optical storage media, electromagnetic storage media, semiconductor storage media, and the like. More specific examples of computer readable media include floppy (registered trademark) disks, diskettes, hard disks, random access memory (RAM), read-only memory (ROM), erasable programmable read-only memory (EPROM or flash memory), Electrically erasable programmable read-only memory (EEPROM), static random access memory (SRAM), compact disk read-only memory (CD-ROM), digital versatile disk (DVD), Blu-ray (RTM) disk, memory stick, integrated A circuit card or the like may be included.
コンピュータ可読命令は、アセンブラ命令、命令セットアーキテクチャ(ISA)命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、またはSmalltalk、JAVA(登録商標)、C++等のようなオブジェクト指向プログラミング言語、および「C」プログラミング言語または同様のプログラミング言語のような従来の手続型プログラミング言語を含む、1または複数のプログラミング言語の任意の組み合わせで記述されたソースコードまたはオブジェクトコードのいずれかを含んでよい。 Computer-readable instructions are assembler instructions, instruction set architecture (ISA) instructions, machine instructions, machine-dependent instructions, microcode, firmware instructions, state-setting data, or object-oriented programming such as Smalltalk, JAVA®, C ++, etc. Includes either source code or object code written in any combination of one or more programming languages, including languages, and traditional procedural programming languages such as the "C" programming language or similar programming languages. good.
コンピュータ可読命令は、汎用コンピュータ、特殊目的のコンピュータ、若しくは他のプログラム可能なデータ処理装置のプロセッサまたはプログラマブル回路に対し、ローカルにまたはローカルエリアネットワーク(LAN)、インターネット等のようなワイドエリアネットワーク(WAN)を介して提供され、フローチャートまたはブロック図で指定された操作を実行するための手段を作成すべく、コンピュータ可読命令を実行してよい。プロセッサの例としては、コンピュータプロセッサ、処理ユニット、マイクロプロセッサ、デジタル信号プロセッサ、コントローラ、マイクロコントローラ等を含む。 Computer-readable instructions are used locally or to a local area network (LAN), wide area network (WAN) such as the Internet, to a general purpose computer, a special purpose computer, or the processor or programmable circuit of another programmable data processing device. ) May execute computer-readable instructions to create means for performing the operations specified in the flowchart or block diagram. Examples of processors include computer processors, processing units, microprocessors, digital signal processors, controllers, microcontrollers, and the like.
図14は、本発明の複数の態様が全体的または部分的に具現化されてよいコンピュータ1200の例を示す。コンピュータ1200にインストールされたプログラムは、コンピュータ1200に、本発明の実施形態に係る装置に関連付けられる操作または当該装置の1または複数のセクションとして機能させることができ、または当該操作または当該1または複数のセクションを実行させることができ、および/またはコンピュータ1200に、本発明の実施形態に係るプロセスまたは当該プロセスの段階を実行させることができる。そのようなプログラムは、コンピュータ1200に、本明細書に記載のフローチャートおよびブロック図のブロックのうちのいくつかまたはすべてに関連付けられた特定の操作を実行させるべく、CPU1212によって実行されてよい。
FIG. 14 shows an example of a
本実施形態によるコンピュータ1200は、CPU1212、RAM1214、グラフィックコントローラ1216、およびディスプレイデバイス1218を含み、それらはホストコントローラ1210によって相互に接続されている。コンピュータ1200はまた、通信インタフェース1222、ハードディスクドライブ1224、DVD-ROMドライブ1226、およびICカードドライブのような入/出力ユニットを含み、それらは入/出力コントローラ1220を介してホストコントローラ1210に接続されている。コンピュータはまた、ROM1230およびキーボード1242のようなレガシの入/出力ユニットを含み、それらは入/出力チップ1240を介して入/出力コントローラ1220に接続されている。
The
CPU1212は、ROM1230およびRAM1214内に格納されたプログラムに従い動作し、それにより各ユニットを制御する。グラフィックコントローラ1216は、RAM1214内に提供されるフレームバッファ等またはそれ自体の中にCPU1212によって生成されたイメージデータを取得し、イメージデータがディスプレイデバイス1218上に表示されるようにする。
The
通信インターフェース1222は、ネットワークを介して他の電子デバイスと通信する。ハードディスクドライブ1224は、コンピュータ1200内のCPU1212によって使用されるプログラムおよびデータを格納する。DVD-ROMドライブ1226は、プログラムまたはデータをDVD‐ROM1201から読み取り、ハードディスクドライブ1224にRAM1214を介してプログラムまたはデータを提供する。ICカードドライブは、プログラムおよびデータをICカードから読み取り、および/またはプログラムおよびデータをICカードに書き込む。
The
ROM1230はその中に、アクティブ化時にコンピュータ1200によって実行されるブートプログラム等、および/またはコンピュータ1200のハードウェアに依存するプログラムを格納する。入/出力チップ1240はまた、様々な入/出力ユニットをパラレルポート、シリアルポート、キーボードポート、マウスポート等を介して、入/出力コントローラ1220に接続してよい。
The
プログラムが、DVD-ROM1201またはICカードのようなコンピュータ可読媒体によって提供される。プログラムは、コンピュータ可読媒体から読み取られ、コンピュータ可読媒体の例でもあるハードディスクドライブ1224、RAM1214、またはROM1230にインストールされ、CPU1212によって実行される。これらのプログラム内に記述される情報処理は、コンピュータ1200に読み取られ、プログラムと、上記様々なタイプのハードウェアリソースとの間の連携をもたらす。装置または方法が、コンピュータ1200の使用に従い情報の操作または処理を実現することによって構成されてよい。
The program is provided by a computer readable medium such as a DVD-
例えば、通信がコンピュータ1200および外部デバイス間で実行される場合、CPU1212は、RAM1214にロードされた通信プログラムを実行し、通信プログラムに記述された処理に基づいて、通信インターフェース1222に対し、通信処理を命令してよい。通信インターフェース1222は、CPU1212の制御下、RAM1214、ハードディスクドライブ1224、DVD‐ROM1201、またはICカードのような記録媒体内に提供される送信バッファ処理領域に格納された送信データを読み取り、読み取られた送信データをネットワークに送信し、またはネットワークから受信された受信データを記録媒体上に提供される受信バッファ処理領域等に書き込む。
For example, when communication is executed between the
また、CPU1212は、ハードディスクドライブ1224、DVD‐ROMドライブ1226(DVD‐ROM1201)、ICカード等のような外部記録媒体に格納されたファイルまたはデータベースの全部または必要な部分がRAM1214に読み取られるようにし、RAM1214上のデータに対し様々なタイプの処理を実行してよい。CPU1212は次に、処理されたデータを外部記録媒体にライトバックする。
Further, the
様々なタイプのプログラム、データ、テーブル、およびデータベースのような様々なタイプの情報が記録媒体に格納され、情報処理を受けてよい。CPU1212は、RAM1214から読み取られたデータに対し、本開示の随所に記載され、プログラムの命令シーケンスによって指定される様々なタイプの操作、情報処理、条件判断、条件分岐、無条件分岐、情報の検索/置換等を含む、様々なタイプの処理を実行してよく、結果をRAM1214に対しライトバックする。また、CPU1212は、記録媒体内のファイル、データベース等における情報を検索してよい。例えば、各々が第2の属性の属性値に関連付けられた第1の属性の属性値を有する複数のエントリが記録媒体内に格納される場合、CPU1212は、第1の属性の属性値が指定される、条件に一致するエントリを当該複数のエントリの中から検索し、当該エントリ内に格納された第2の属性の属性値を読み取り、それにより予め定められた条件を満たす第1の属性に関連付けられた第2の属性の属性値を取得してよい。
Various types of information such as various types of programs, data, tables, and databases may be stored in recording media and processed. The
上で説明したプログラムまたはソフトウェアモジュールは、コンピュータ1200上またはコンピュータ1200近傍のコンピュータ可読媒体に格納されてよい。また、専用通信ネットワークまたはインターネットに接続されたサーバーシステム内に提供されるハードディスクまたはRAMのような記録媒体が、コンピュータ可読媒体として使用可能であり、それによりプログラムを、ネットワークを介してコンピュータ1200に提供する。
The program or software module described above may be stored on a
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。 Although the present invention has been described above using the embodiments, the technical scope of the present invention is not limited to the scope described in the above embodiments. It will be apparent to those skilled in the art that various changes or improvements can be made to the above embodiments. It is clear from the description of the claims that the form with such changes or improvements may be included in the technical scope of the present invention.
特許請求の範囲、明細書、および図面中において示した装置、システム、プログラム、および方法における動作、手順、ステップ、および段階等の各処理の実行順序は、特段「より前に」、「先立って」等と明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、および図面中の動作フローに関して、便宜上「まず、」、「次に、」等を用いて説明したとしても、この順で実施することが必須であることを意味するものではない。 The order of execution of each process such as operation, procedure, step, and step in the apparatus, system, program, and method shown in the claims, specification, and drawings is particularly "before" and "prior to". It should be noted that it can be realized in any order unless the output of the previous process is used in the subsequent process. Even if the scope of claims, the specification, and the operation flow in the drawings are explained using "first", "next", etc. for convenience, it means that it is essential to carry out in this order. It's not a thing.
10 請求書画像、12 請求書画像、20 請求情報、22 請求情報、30 特徴量、40 ラベル、100 帳票情報生成装置、110 記憶部、111 学習済み抽出部、112 選択用データ、113 読取条件、114 対応関係、120 抽出部、130 算出部、140 選択部、150 読取部、160 生成部、200 学習装置、210 記憶部、211 学習用データ、212 学習用パラメータ、220 抽出部、230 類似度算出部、240 損失関数算出部
10 invoice image, 12 invoice image, 20 invoice information, 22 invoice information, 30 features, 40 labels, 100 form information generator, 110 storage unit, 111 learned extraction unit, 112 selection data, 113 reading conditions, 114 correspondence, 120 extraction unit, 130 calculation unit, 140 selection unit, 150 reading unit, 160 generation unit, 200 learning device, 210 storage unit, 211 learning data, 212 learning parameter, 220 extraction unit, 230 similarity calculation. Part, 240 Loss function calculation part
Claims (14)
対象とする帳票画像から対象特徴量を抽出する抽出部と、
前記対象特徴量と前記過去特徴量との類似度を算出する算出部と、
前記類似度に基づいて、前記過去の帳票情報を選択する選択部と、
前記対象とする帳票画像から予め定められた項目の文字の情報を読み取る読取部と、
前記選択部で選択された前記過去の帳票情報と、前記読取部で読み取られた前記文字の情報とから、前記対象とする帳票画像に関連付けられた新たな帳票情報を生成して表示する生成部と
を備える帳票情報生成装置。 An acquisition unit that acquires the past feature amount extracted from the past form image in association with the past form information based on the character information described in the past form image, and the acquisition unit.
An extraction unit that extracts the target feature amount from the target form image,
A calculation unit that calculates the degree of similarity between the target feature amount and the past feature amount,
A selection unit that selects past form information based on the similarity, and
A reading unit that reads character information of predetermined items from the target form image, and
A generation unit that generates and displays new form information associated with the target form image from the past form information selected by the selection unit and the character information read by the reading unit. A form information generator equipped with and.
請求項1又は2に記載の帳票情報生成装置。 The extraction unit responds to the input of labels and similarity of a set of form images. When the labels are the same, the larger the similarity, the smaller the value, and when the labels are different, the smaller the similarity, the smaller the value. The form information generation device according to claim 1 or 2, which corresponds to the one obtained by learning using.
請求項1又は2に記載の帳票情報生成装置。 The past feature amount and the extraction unit input the similarity between the first label of one form image, the feature amount obtained from the form image, and the feature amount corresponding to a plurality of preset second labels. When the first label and the second label are the same label, the larger the similarity is, the smaller the value is, and when the first label and the second label are different labels, the smaller the similarity is, the smaller the value is. The form information generation device according to claim 1 or 2, which corresponds to the one obtained by learning using a function.
前記請求情報及び当該請求情報に対応する請求書画像は、それぞれ第1情報と第2情報とを含むものであり、
過去の請求情報と、過去の請求書画像とを関連付けて記憶する取得部と、
前記取得部を参照することにより新たな請求書画像と類似する過去の請求書画像を選択し、当該選択した過去の請求情報から前記第1情報を抽出する第1情報取得部と、
前記新たな請求書画像から前記第2情報を光学的文字認識装置(OCR)で読み取る第2情報取得部と、
前記第1情報取得部により抽出された第1情報と、前記第2情報取得部により読み取られた第2情報とから、新たな請求情報を生成する生成部と、
を備える装置。 A device for generating billing information to be read by the accounting system.
The billing information and the invoice image corresponding to the billing information include the first information and the second information, respectively.
An acquisition unit that stores past invoice information in association with past invoice images,
A first information acquisition unit that selects a past invoice image similar to the new invoice image by referring to the acquisition unit and extracts the first information from the selected past invoice information.
A second information acquisition unit that reads the second information from the new invoice image with an optical character recognition device (OCR), and
A generation unit that generates new billing information from the first information extracted by the first information acquisition unit and the second information read by the second information acquisition unit.
A device equipped with.
対象とする帳票画像から対象特徴量を抽出するステップと、
前記対象特徴量と前記過去特徴量との類似度を算出するステップと、
前記類似度に基づいて、前記過去の帳票情報を選択するステップと、
前記対象とする帳票画像から予め定められた項目の文字の情報を読み取るステップと、
前記選択のステップで選択された前記過去の帳票情報と、前記読み取りのステップで読み取られた前記文字の情報とから、前記対象とする帳票画像に関連付けられた新たな帳票情報を生成して表示するステップと
を備える方法。 A step of associating a past feature amount extracted from a past form image with a past form information based on the character information described in the past form image, and a step of acquiring the past form information.
Steps to extract the target feature amount from the target form image,
A step of calculating the degree of similarity between the target feature amount and the past feature amount,
The step of selecting the past form information based on the similarity, and
The step of reading the character information of the predetermined item from the target form image, and
From the past form information selected in the selection step and the character information read in the reading step, new form information associated with the target form image is generated and displayed. How to prepare with steps.
前記請求情報及び当該請求情報に対応する請求書画像は、それぞれ第1情報と第2情報とを含むものであり、
過去の請求情報と、過去の請求書画像とを関連付けて取得するステップと、
取得した前記過去の請求書画像を参照することにより新たな請求書画像と類似する過去の請求書画像を選択し、当該選択した過去の請求情報から前記第1情報を抽出するステップと、
前記新たな請求書画像から前記第2情報を光学的文字認識装置(OCR)で読み取るステップと、
前記第1情報と、前記第2情報とから、新たな請求情報を生成するステップと、
を備える方法。 It is a method for generating billing information to be read by the accounting system.
The billing information and the invoice image corresponding to the billing information include the first information and the second information, respectively.
Steps to obtain past invoice information in association with past invoice images,
A step of selecting a past invoice image similar to the new invoice image by referring to the acquired past invoice image and extracting the first information from the selected past invoice information.
A step of reading the second information from the new invoice image with an optical character recognition device (OCR), and
A step of generating new billing information from the first information and the second information,
How to prepare.
A program that realizes the method according to claim 13 on a computer.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020135157A JP7086361B2 (en) | 2020-06-30 | 2020-08-07 | Form information generator, method and program |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020113622A JP2022012078A (en) | 2020-06-30 | 2020-06-30 | Form information generation apparatus, method, and program |
JP2020135157A JP7086361B2 (en) | 2020-06-30 | 2020-08-07 | Form information generator, method and program |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020113622A Division JP2022012078A (en) | 2020-06-30 | 2020-06-30 | Form information generation apparatus, method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022013524A true JP2022013524A (en) | 2022-01-18 |
JP7086361B2 JP7086361B2 (en) | 2022-06-20 |
Family
ID=87798747
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020135157A Active JP7086361B2 (en) | 2020-06-30 | 2020-08-07 | Form information generator, method and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7086361B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116561602A (en) * | 2023-07-10 | 2023-08-08 | 三峡高科信息技术有限责任公司 | Automatic sales material matching method for sales cost transfer |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011060219A (en) * | 2009-09-14 | 2011-03-24 | Hiroaki Ono | Document classification system, document classification method, and program |
JP2014191416A (en) * | 2013-03-26 | 2014-10-06 | Hitachi Kokusai Electric Inc | Service user confirmation apparatus |
US20160253303A1 (en) * | 2015-02-27 | 2016-09-01 | Hrb Innovations, Inc. | Digital processing and completion of form documents |
JP2017033139A (en) * | 2015-07-30 | 2017-02-09 | 富士通フロンテック株式会社 | Ledger sheet reading apparatus, ledger sheet reading method and ledger sheet reading system |
JP2017174199A (en) * | 2016-03-24 | 2017-09-28 | クラウドインボイス株式会社 | Information output device, information output method, and information output program |
JP2019144771A (en) * | 2018-02-19 | 2019-08-29 | 株式会社ミラボ | Business form processing system and business form processing program |
JP2019185141A (en) * | 2018-04-02 | 2019-10-24 | 日本電気株式会社 | Image processor, image processing method, and program |
JP2020027504A (en) * | 2018-08-14 | 2020-02-20 | 日本電信電話株式会社 | Object recognition apparatus, object recognition learning apparatus, method, and program |
JP2020087112A (en) * | 2018-11-28 | 2020-06-04 | 株式会社日立製作所 | Document processing apparatus and document processing method |
-
2020
- 2020-08-07 JP JP2020135157A patent/JP7086361B2/en active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011060219A (en) * | 2009-09-14 | 2011-03-24 | Hiroaki Ono | Document classification system, document classification method, and program |
JP2014191416A (en) * | 2013-03-26 | 2014-10-06 | Hitachi Kokusai Electric Inc | Service user confirmation apparatus |
US20160253303A1 (en) * | 2015-02-27 | 2016-09-01 | Hrb Innovations, Inc. | Digital processing and completion of form documents |
JP2017033139A (en) * | 2015-07-30 | 2017-02-09 | 富士通フロンテック株式会社 | Ledger sheet reading apparatus, ledger sheet reading method and ledger sheet reading system |
JP2017174199A (en) * | 2016-03-24 | 2017-09-28 | クラウドインボイス株式会社 | Information output device, information output method, and information output program |
JP2019144771A (en) * | 2018-02-19 | 2019-08-29 | 株式会社ミラボ | Business form processing system and business form processing program |
JP2019185141A (en) * | 2018-04-02 | 2019-10-24 | 日本電気株式会社 | Image processor, image processing method, and program |
JP2020027504A (en) * | 2018-08-14 | 2020-02-20 | 日本電信電話株式会社 | Object recognition apparatus, object recognition learning apparatus, method, and program |
JP2020087112A (en) * | 2018-11-28 | 2020-06-04 | 株式会社日立製作所 | Document processing apparatus and document processing method |
Non-Patent Citations (2)
Title |
---|
坪田 亘記: ""キャラクター顔特徴量の個別漫画への適応手法"", 一般社団法人人工知能学会第32回全国大会論文集DVD[DVD−ROM], JPN6021018937, 8 June 2018 (2018-06-08), pages 1 - 4, ISSN: 0004722267 * |
松岡 佑磨: ""教師なし学習を導入した深層距離学習法"", 第79回(平成29年)全国大会講演論文集(2) 人工知能と認知科学, JPN6020048286, 16 March 2017 (2017-03-16), pages 2 - 383, ISSN: 0004722268 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116561602A (en) * | 2023-07-10 | 2023-08-08 | 三峡高科信息技术有限责任公司 | Automatic sales material matching method for sales cost transfer |
CN116561602B (en) * | 2023-07-10 | 2023-09-19 | 三峡高科信息技术有限责任公司 | Automatic sales material matching method for sales cost transfer |
Also Published As
Publication number | Publication date |
---|---|
JP7086361B2 (en) | 2022-06-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11816165B2 (en) | Identification of fields in documents with neural networks without templates | |
CN111209738B (en) | Multi-task named entity recognition method combining text classification | |
US20230147276A1 (en) | System and method for determining a structured representation of a form document utilizing multiple machine learning models | |
RU2723293C1 (en) | Identification of fields and tables in documents using neural networks using global document context | |
US20210374479A1 (en) | Intelligent payment processing platform system and method | |
US10733675B2 (en) | Accuracy and speed of automatically processing records in an automated environment | |
US20190294921A1 (en) | Field identification in an image using artificial intelligence | |
Kyriakides et al. | Hands-On Ensemble Learning with Python: Build highly optimized ensemble machine learning models using scikit-learn and Keras | |
US11899727B2 (en) | Document digitization, transformation and validation | |
CN110827131B (en) | Tax payer credit evaluation method based on distributed automatic feature combination | |
RU2765884C2 (en) | Identification of blocks of related words in documents of complex structure | |
AU2022203643B2 (en) | Artificial intelligence based compliance document processing | |
JP7086361B2 (en) | Form information generator, method and program | |
JP2015069256A (en) | Character identification system | |
JP2022012078A (en) | Form information generation apparatus, method, and program | |
Egger et al. | A new algorithm for matching Chinese NBS firm-level with customs data | |
US11809980B1 (en) | Automatic classification of data sensitivity through machine learning | |
CN112668335A (en) | Method for identifying and extracting business license structured information by using named entity | |
Tschirschwitz et al. | A dataset for analysing complex document layouts in the digital humanities and its evaluation with Krippendorff’s alpha | |
JP2022072482A (en) | Business form information generation device, method, and program | |
US20230237589A1 (en) | Model output calibration | |
Danner et al. | Invoice Automation: Increasing Efficiency in the Office at Satherm GmbH Using Artificial Intelligence | |
Pandey et al. | A robust approach to plagiarism detection in handwritten documents | |
JP7632734B2 (en) | System for recognizing cursive characters, method for recognizing cursive characters, and program | |
JP7392191B1 (en) | Accounting data conversion device, accounting data conversion method, learning device, learning method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200807 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20200807 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20200820 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20200909 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201207 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201215 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210215 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210525 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210720 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20211019 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211221 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20211221 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20220105 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20220106 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220308 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220425 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220518 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220527 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7086361 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |