JP6736742B1 - 帳票処理プログラム、帳票処理装置、帳票処理方法 - Google Patents

帳票処理プログラム、帳票処理装置、帳票処理方法 Download PDF

Info

Publication number
JP6736742B1
JP6736742B1 JP2019195348A JP2019195348A JP6736742B1 JP 6736742 B1 JP6736742 B1 JP 6736742B1 JP 2019195348 A JP2019195348 A JP 2019195348A JP 2019195348 A JP2019195348 A JP 2019195348A JP 6736742 B1 JP6736742 B1 JP 6736742B1
Authority
JP
Japan
Prior art keywords
identification information
type
image
form identification
correspondence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019195348A
Other languages
English (en)
Other versions
JP2021068378A (ja
Inventor
秀史 小林
秀史 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TIS Inc
Original Assignee
TIS Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TIS Inc filed Critical TIS Inc
Priority to JP2019195348A priority Critical patent/JP6736742B1/ja
Application granted granted Critical
Publication of JP6736742B1 publication Critical patent/JP6736742B1/ja
Publication of JP2021068378A publication Critical patent/JP2021068378A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

【課題】帳票の画像に対して当該帳票の帳票種別を適切に判定する帳票処理プログラム、帳票処理装置及び帳票処理方法を提供する。
【解決手段】帳票処理プログラムは、コンピュータに、処理対象の帳票である対象帳票の帳票画像を取得する画像取得処理と、帳票の帳票種別に対応する帳票識別情報と帳票の帳票画像との対応関係について学習済みの帳票識別モデルと、対象帳票の帳票画像とに基づいて、対象帳票の帳票画像が対応する帳票識別情報及び帳票識別情報の確信度を出力する帳票識別処理と、確信度が所定の閾値を満たすか否かを判定する確信度判定処理と、所定の閾値を満たす帳票識別情報及び対応情報記憶部に記憶される帳票種別と帳票識別情報との対応を示す対応情報に基づいて、対象帳票の帳票種別を判定する、種別判定処理と、を実行させる。
【選択図】図2

Description

本発明は、帳票処理プログラム、帳票処理装置及び帳票処理方法に関する。
紙媒体に記録される財務諸表に対し、OCR(Optical Character Recognition)処理を行うことによって、電子データとして電子媒体に記録するための手法が特許文献1に示される。特許文献1には、勘定科目と金額を精度よく読み取るために、抽出した文字を適切に置換する手法が示されている。
特開平11−219394号公報
財務諸表などの帳票をOCR処理によって電子化するにあたり、OCR処理の対象の帳票の種類である帳票種別を判定することによって、当該帳票に応じたOCR処理をすることができる。帳票種別ごとに適したOCR手法を採用することによって、OCR処理の正確さ及び処理速度が向上する。
OCR処理において帳票種別が適切に判定されない場合、OCR処理の所要時間の増加や、誤読又は読み取り漏れによる不十分な読み取り結果の発生などを招く。
そこで、本発明は、帳票の画像に対して当該帳票の帳票種別を適切に判定する帳票処理プログラム、帳票処理装置及び帳票処理方法を提供することを目的とする。
本発明の一態様に係る帳票処理プログラムは、コンピュータに、処理対象の帳票である対象帳票の帳票画像を取得する画像取得処理と、帳票の帳票種別に対応する帳票識別情報と帳票の帳票画像との対応関係について学習済みの帳票識別モデルと、対象帳票の帳票画像とに基づいて、対象帳票の帳票画像が対応する帳票識別情報及び帳票識別情報の確信度を出力する帳票識別処理と、確信度が所定の閾値を満たすか否かを判定する確信度判定処理と、所定の閾値を満たす帳票識別情報及び対応情報記憶部に記憶される帳票種別と帳票識別情報との対応を示す対応情報に基づいて、対象帳票の帳票種別を判定する、種別判定処理と、を実行させ、帳票識別情報は、第1の帳票種別に対応する第1の帳票識別情報及び第2の帳票識別情報を有し、第1の帳票種別が第1の帳票識別情報及び第2の帳票識別情報に対応することが対応情報として記憶され、帳票識別モデルは、第1の帳票識別情報と第2の帳票識別情報とを区別可能に学習され、種別判定処理は、確信度判定処理によって判定された閾値を満たす帳票識別情報が、第1の帳票識別情報又は第2の帳票識別情報である場合に、対応情報に基づいて対象帳票の帳票種別を第1の帳票種別であると判定する。
この態様では、一つの帳票種別に対して複数の帳票識別情報が設けられる。複数の帳票識別情報を設けることによって、様々な状態の帳票画像に対して帳票識別モデルを用いて得られる確信度の精度を高くすることができる。確信度の精度を高めることで、帳票種別を精度よく適切に判定することが可能となる。
上記態様において、確信度判定処理において、閾値を満たす帳票識別情報がない場合に、対象帳票の帳票画像を、帳票の帳票種別に対応する帳票識別情報と帳票の帳票画像との対応関係について学習するための学習データとして用いるために学習データ記憶部に記憶する、学習データ記憶処理、をさらに含んでもよい。
この態様によれば、帳票識別情報に対して十分な確信度が得られないような帳票画像が学習データとして記憶される。記憶された学習データを用いて帳票識別モデルに学習を行わせることで、帳票種別を適切に判定することが可能となる。
上記態様において、帳票識別情報には、学習データ記憶部に記憶された学習データに基づいて生成される第3の帳票識別情報が含まれ、第3の帳票識別情報に対応する帳票種別が第3の帳票識別情報に対応することが対応情報として記憶され、帳票識別モデルは、第3の帳票識別情報と学習データとの対応関係について学習されてもよい。
この態様によれば、学習データから生成される帳票識別情報を用いて、帳票識別モデルが学習される。よって、帳票識別情報に対して十分な確信度が得られないような帳票画像に対しても、十分な確信度を算出することができる。したがって、帳票種別を適切に判定することが可能となる。
本発明の他の態様に係る帳票処理装置は、処理対象の帳票である対象帳票の帳票画像を取得する画像取得部と、帳票の帳票種別に対応する帳票識別情報と帳票の帳票画像との対応関係について学習済みの帳票識別モデルと、対象帳票の帳票画像とに基づいて、対象帳票の帳票画像が対応する帳票識別情報及び帳票識別情報の確信度を出力する帳票識別部と、確信度が所定の閾値を満たすか否かを判定する確信度判定部と、所定の閾値を満たす帳票識別情報及び対応情報記憶部に記憶される帳票種別と帳票識別情報との対応を示す対応情報に基づいて、対象帳票の帳票種別を判定する、種別判定部と、を備え、帳票識別情報は、第1の帳票種別に対応する第1の帳票識別情報及び第2の帳票識別情報を有し、第1の帳票種別が第1の帳票識別情報及び第2の帳票識別情報に対応することが対応情報として記憶され、帳票識別モデルは、第1の帳票識別情報と第2の帳票識別情報とを区別可能に学習され、種別判定部は、確信度判定処理によって判定された閾値を満たす帳票識別情報が、第1の帳票識別情報又は第2の帳票識別情報である場合に、対応情報に基づいて、対象帳票の帳票種別を第1の帳票種別であると判定する。
本発明の他の態様に係る帳票処理方法は、コンピュータが、処理対象の帳票である対象帳票の帳票画像を取得する画像取得ステップと、コンピュータが、帳票の帳票種別に対応する帳票識別情報と帳票の帳票画像との対応関係について学習済みの帳票識別モデルと、対象帳票の帳票画像とに基づいて、対象帳票の帳票画像が対応する帳票識別情報及び帳票識別情報の確信度を出力する帳票識別ステップと、コンピュータが、確信度が所定の閾値を満たすか否かを判定する確信度判定ステップと、コンピュータが、所定の閾値を満たす帳票識別情報及び対応情報記憶部に記憶される帳票種別と帳票識別情報との対応を示す対応情報に基づいて、対象帳票の帳票種別を判定する、種別判定ステップと、を含み、帳票識別情報は、第1の帳票種別に対応する第1の帳票識別情報及び第2の帳票識別情報を有し、第1の帳票種別が第1の帳票識別情報及び第2の帳票識別情報に対応することが対応情報として記憶され、帳票識別モデルは、第1の帳票識別情報と第2の帳票識別情報とを区別可能に学習され、種別判定ステップでは、確信度判定ステップによって判定された閾値を満たす帳票識別情報が、第1の帳票識別情報又は第2の帳票識別情報である場合に、対応情報に基づいて、対象帳票の帳票種別を第1の帳票種別であると判定する。
本発明によれば、帳票の画像に対して当該帳票の帳票種別を適切に判定する帳票処理プログラム、帳票処理装置及び帳票処理方法を提供することができる。
第1実施形態に係る帳票処理システムの概略図である。 第1実施形態に係る帳票処理装置の構成を示すブロック図である。 第1実施形態に係る帳票処理装置における帳票処理情報の一例である。 第1実施形態に係る帳票処理装置における対応情報の一例である。 第1実施形態に係る帳票処理装置における処理のフローチャートである。 第2実施形態に係る帳票処理装置における対応情報の一例である。 第2実施形態に係る帳票処理装置における帳票処理情報の一例である。
添付図面を参照して、本発明の好適な実施形態について説明する。なお、各図において、同一の符号を付したものは、同一又は同様の構成を有する。
[第1実施形態]
第1実施形態について説明する。図1には、第1実施形態に係る帳票処理システム1の概略図が示される。帳票処理システム1は、読取装置10及び帳票処理装置20を備える。読取装置10と帳票処理装置20はネットワークNを介して接続される。読取装置10と帳票処理装置20は有線ケーブルによって接続されてもよい。
読取装置10は、紙媒体を読み取り可能な、コンピュータを有する端末である。例えば、読取装置10は、スキャナや複合機に接続されたコンピュータである。あるいは、読取装置10は、紙媒体をカメラによって撮影可能な、スマートフォンやタブレット端末であってもよい。読取装置10 は、紙媒体から画像を生成する。生成された画像は帳票処理装置20へと送信される。なお、読取装置10が生成した画像は、外部記録媒体を用いて帳票処理装置20へと移されてもよい。
第1実施形態では、読取装置10は、帳票を読み取り、読み取った帳票から帳票画像を生成する。第1実施形態では、読み取り処理の処理対象となる帳票を対象帳票とよぶ。
帳票処理装置20は、読取装置10とネットワークNを通じて通信可能に接続される情報処理装置である。例えば、帳票処理装置20は、読取装置10に接続されるサーバ装置である。帳票処理装置20は、デスクトップ型あるいはノート型のパーソナルコンピュータやタブレット端末等のコンピュータであってもよい。すなわち、読取装置10と通信可能であり、画像の入力が可能な端末であればよい。
図2には、帳票処理装置20の構成がブロック図として示される。帳票処理装置20は、画像取得部201、帳票識別モデル記憶部202、帳票識別部203、確信度判定部204、種別判定部205、学習データ記憶処理部206、帳票処理情報記憶部207、対応情報記憶部208及び学習データ記憶部209を備える。
帳票処理装置20の各部は、例えば、帳票処理装置20において、メモリ等の記憶領域を用いたり、記憶領域に格納されたプログラムをプロセッサが実行したりすることによって、実現することができる。
画像取得部201は、読取装置10によって生成された帳票画像を取得する。画像取得部201が取得した帳票画像にはそれぞれ帳票画像番号が割り当てられる。帳票画像は割り当てられた帳票画像番号によって管理される。帳票画像番号は、複数の帳票画像を読み取った後に割り当てられてもよい。帳票画像番号は、帳票画像を読み取る度に割り当てられてもよい。なお、帳票画像の管理は、必ずしも帳票画像番号によって行われる必要はなく、帳票画像を適切に管理できる方法を用いることができる。
取得した帳票画像の管理は、図3に示されるような帳票処理情報が、帳票処理情報記憶部207に記憶されることによって行われる。なお、図3に示す帳票処理情報には、帳票処理装置20による処理が行われた後の状態が示される。
帳票処理情報は、「帳票画像番号」、「帳票識別情報」、「確信度」、「閾値チェック」及び「結果」の項目を有する。「帳票画像番号」の項目には、帳票画像ごとの帳票画像番号が記録される。「結果」の項目には、帳票処理装置20によって判定された読み取り結果が記録される。「帳票識別情報」、「確信度」及び「閾値チェック」の項目についてはそれぞれ後述する。
帳票識別モデル記憶部202には、帳票の帳票種別に対応する帳票識別情報と帳票の帳票画像との対応関係について学習済みの帳票識別モデルが記憶される。
帳票識別モデルは、帳票画像と帳票画像に対応する帳票識別情報の組を教師データとして、帳票画像の入力に対して、帳票画像が対応する帳票識別情報及び帳票識別情報の確信度を出力するように機械学習される。機械学習は一般的なアルゴリズムを用いて行うことができる。
確信度は、帳票画像が帳票識別モデルに記憶される帳票の画像とどの程度類似しているかを示す情報である。確信度は例えば、0から1までの間の数値として表現され、数値が大きいほど、より確からしいことを示す。
帳票識別情報とは、帳票種別に対して設けられるコードである。帳票種別と帳票識別情報は、図4に示されるように、対応情報として関係づけられる。対応情報は対応情報記憶部208に記録される。
図4に示されるように、「確定申告書」には、帳票識別情報として、「1」、「1A」、「1B」が関連付けられる。「収支内訳書」には「2」が関連付けられる。
帳票識別情報は一つの帳票種別に対して複数設けられてもよい。一つの帳票種別に対して複数の帳票識別情報が設けられるような場合とは、例えば、紙媒体での帳票の印字がかすれている場合である。この場合、帳票種別は同じであるが、かすれていない場合に対する帳票識別情報とは別の帳票識別情報が関連付けられる。あるいは、紙媒体における帳票の一部が欠けている場合がある。また、帳票の表示の方法が異なるものの、帳票種別が同じである場合にも、それぞれに帳票識別情報が関連付けられる。
一例として、帳票識別モデルは、「かすれた確定申告書」の帳票画像については、帳票識別情報として「1A」を関連付けるとする。また、「一部が欠けた確定申告書」の帳票画像については、帳票識別情報として「1B」を関連付けるとする。
帳票識別部203は、帳票識別モデルと、対象帳票の帳票画像とに基づいて、対象帳票の帳票画像が対応する帳票識別情報及び帳票識別情報の確信度を出力する。つまり、帳票画像について、帳票識別情報の判定及び判定された帳票識別情報の確信度の算出という処理が行われる。帳票識別部203により算出された確信度は、帳票処理情報の「確信度」の項目に記録される。
確信度判定部204は、確信度が所定の閾値を満たすか否かを判定する。
閾値は帳票識別情報ごとに設けられる。閾値は例えば、帳票識別情報「1」に対して「0.95」、帳票識別情報「1A」に対して「0.90」のように設定される。閾値の数値は予め設定され、帳票識別情報に関連付けられて記憶される。閾値は、対応情報記憶部208に記憶される対応情報に関連付けられて記憶されるなどして、帳票処理装置20に記憶される。
確信度判定部204による判定結果は、帳票処理情報の「閾値チェック」の項目に、「満たす」又は「満たさない」ことを示す情報として記録される。
種別判定部205は、閾値を満たすと判断された帳票画像に関連付けられた帳票識別情報と、対応情報とに基づいて、対象帳票の帳票種別を判定する。種別判定部205による帳票種別の判定によって、帳票処理情報の「結果」の項目に帳票種別を示す情報が記録される。
学習データ記憶処理部206は、確信度判定部204によって確信度が閾値を満たさないと判断された場合、対象帳票の帳票画像を、帳票種別に対応する帳票識別情報と帳票の帳票画像との対応関係について学習するための学習データとして用いるために、学習データ記憶部209に記憶する。
学習データ記憶部209に記憶された学習データは、帳票識別モデルを更新するために用いられる。更新された帳票識別モデルによる処理については、第2実施形態において説明する。
学習データ記憶処理部206は、帳票処理情報において、学習データ記憶部209に記憶される帳票画像を示す帳票画像番号の結果の項目に、「学習用データ」であることを示す情報を記録する。
帳票処理装置20における処理について、図5のフローチャートを参照しつつ図3、図4のデータを例に説明する。ここでは、対象帳票が3つある場合について説明する。
ステップS501において、画像取得部201は読取装置10から帳票画像を取得し、帳票画像に対して帳票画像番号を割り当てる。
図3においては、「No.1」から「No.3」までの帳票画像番号がそれぞれの帳票画像に対して割り当てられている。
ステップS502において、帳票識別部203は、帳票識別モデル記憶部202から帳票識別モデルを呼び出し、帳票画像について、帳票識別情報の判定及び帳票識別情報の確信度を算出する。図3では、例えば「No.1」の帳票画像に対して、帳票識別情報「1」及び確信度「0.9998」のように算出される。他の帳票画像に対しても同様である。
ステップS503において、確信度判定部204は帳票処理情報の確信度を参照し、確信度が閾値を満たすかどうかを判断する。判断された結果は、帳票処理情報に記録される。
ステップS503にて否定判断された場合、ステップS504において、学習データ記憶処理部206によって、対象帳票の帳票画像は学習データ記憶部209に記憶される。また、学習データ記憶処理部206は、「学習用データ」であることを示す情報を記録することで帳票処理情報を更新する。
例えば、「No.2」の帳票画像に対しては、いずれの帳票識別情報に対する確信度も閾値を満たさないので、学習用データとして保存される。
ステップS503にて肯定判断された場合、ステップS505において、種別判定部205は対応情報記憶部208に記憶される対応情報を参照し、帳票識別情報に基づいて対象帳票の帳票種別を判定する。また、種別判定部205は、帳票処理情報の「結果」の項目に帳票種別を記録することで、帳票処理情報を更新する。
例えば、「No.1」の帳票画像に対しては帳票識別情報「1」が閾値を満たす。対応情報記憶部208において、帳票識別情報「1」には「確定申告書」という帳票種別が対応することが記憶されている。よって、種別判定部205は、「No.1」の帳票画像は帳票種別が「確定申告書」であると判定する。
また、「No.3」の帳票画像に対しては、帳票識別情報「1A」が閾値を満たす。対応情報記憶部208において、帳票識別情報「1A」には、「確定申告書」という帳票種別が対応することが記憶されている。よって、種別判定部205は、「No.3」の帳票画像の帳票種別が「確定申告書」であると判定する。
「No.3」の帳票画像に対するような処理は、帳票識別情報「1A」が「かすれた確定申告書」に対する帳票識別情報であるような場合に、帳票種別を「確定申告書」として、集約することを意味する。
帳票処理装置20は機械学習された帳票識別モデルを用いて、帳票画像に対して帳票識別情報を関連付ける。例えば、帳票識別モデルから確定申告書に対応する帳票識別情報を取得する場合がある。この場合、印字がかすれた確定申告書や、印字の一部が欠けた確定申告書に対しても確定申告書として帳票識別情報を取得しようとすると、帳票識別モデルの精度が低下する。
印字がかすれた確定申告書のように、帳票画像の入力情報としての質が低い帳票が対象帳票である場合、帳票識別モデルが確定申告書であると識別できないことがある。また、帳票識別モデルが対象帳票を確定申告書であると識別した場合であっても、確信度が不十分となり、閾値の設定が難しくなることがある。
このような場合に、帳票識別モデルは、「かすれた確定申告書」の帳票画像に、帳票識別情報「1A」を関連付けるようにすると、帳票識別モデルによる識別が精度よく行われるようにできる。また、それぞれの帳票識別情報に対して、閾値の設定をより適切に行うことができる。
[第2実施形態]
第2実施形態では第1実施形態と共通の事柄についての記述を省略し、異なる点についてのみ説明する。
第2実施形態に係る帳票処理装置は、第1実施形態に係る帳票処理装置20とは、帳票識別モデル及び対応情報記憶部208に記憶される対応情報が異なる。
第2実施形態に係る帳票処理装置が用いる帳票識別モデルは、学習データ記憶部209に記憶される学習データを用いてモデルが更新されている。
例えば、図3の「No.2」の帳票画像は「学習用データ」として学習データ記憶部209に記憶される。これらの帳票画像及び帳票処理装置20によって学習データ記憶部209に記憶された帳票画像に基づいて、帳票識別モデルが更新される。
帳票識別モデルの更新の一例を説明する。まず、学習データ記憶部209に記憶された帳票画像を、いくつかのカテゴリーに分類する処理が行われる。分類されたカテゴリーに基づいて、帳票識別情報が新たに設けられる。
あるカテゴリーに含まれる帳票画像と、当該カテゴリーに対応する帳票識別情報の組を教師データとして、帳票画像の入力に対して帳票画像が対応する帳票識別情報及び帳票識別情報の確信度を出力するように帳票識別モデルが更新される。
新たに設けられた帳票識別情報が対応する帳票画像の帳票種別は、例えば人による目視確認によって判断される。判断された帳票種別と帳票識別情報が関連付けられるように対応情報が更新される。
図6には、第2実施形態における対応情報の一例が示される。図4の対応情報とは、例えば、帳票種別「収支内訳書」には、帳票識別情報「2A」が対応することが追加される点で異なる。
これは、「No.2」の帳票画像では、帳票識別情報「2」に対する確信度が閾値を満たさないと判断された場合における対応である。人による目視確認によって、「No.2」の帳票画像の帳票種別が「収支内訳書」であると判断され、「一部が欠けた収支内訳書」として帳票識別情報「2A」が新たに設けられるとする。
新たに帳票識別情報を設けない場合、帳票識別モデルは、通常の「収支内訳書」と、「一部が欠けた収支内訳書」の両方を含んだ基準に対して確信度を出力するように更新されることになる。この場合、「一部が欠けた収支内訳書」が含まれることにより、通常の「収支内訳書」に対する確信度の算出精度が影響される。ある帳票画像が通常の「収支内訳書」によく類似している場合、「一部が欠けた収支内訳書」を含む基準によって確信度が出力されるとする。このとき、確信度は通常の「収支内訳書」のみの基準の場合と比較して、小さくなる。
新たに帳票識別情報を設けることによって、帳票識別モデルは確信度の算出精度に影響を受けることなく更新され、帳票種別の関連付けが可能となる。
第2実施形態に係る帳票処理装置によって、図5と同様の処理が行われた場合に得られる帳票処理情報を図7に示す。なお、第1実施形態に係る帳票処理装置20によって処理される帳票と同じ帳票を読み取った場合が示される。
図7において、「No.2」の帳票画像では、帳票識別情報「2A」に対する確信度が閾値を満たし、図6の対応情報に基づいて、「収支内訳書」という結果が記録される。
第2実施形態に係る帳票処理装置によって、一度は確信度が不十分であり、帳票種別が関連付けられなかった帳票画像に対しても、帳票種別を適切に判定することが可能となる。
なお、第2実施形態に係る帳票処理装置が用いる更新された帳票識別モデルは、第2実施形態に係る帳票処理装置による処理によって更新されてもよい。例えば、第2実施形態に係る帳票処理装置は、学習用データをカテゴリーに分類し、ユーザによる帳票種別の入力を受け付け、入力された帳票種別に基づいて、帳票識別モデルを更新することができる。
以上、第1実施形態及び第2実施形態について説明した。第1実施形態又は第2実施形態にて得られた帳票処理情報は、対象帳票に記載された内容を読み取るためのOCR処理を行う装置にて利用可能とすることができる。帳票処理情報を用いて、帳票種別に応じたOCR処理を行うことで、より正確あるいは迅速なOCR処理が可能となる。
以上説明した実施形態は、本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。実施形態が備える各要素並びにその配置、材料、条件、形状及びサイズ等は、例示したものに限定されるわけではなく適宜変更することができる。また、異なる実施形態で示した構成同士を部分的に置換し又は組み合わせることが可能である。
1…帳票処理システム、10…読取装置、20…帳票処理装置、201…画像取得部、202…帳票識別モデル記憶部、203…帳票識別部、204…確信度判定部、205…種別判定部、206…学習データ記憶処理部、207…帳票処理情報記憶部207…対応情報記憶部、209…学習データ記憶部

Claims (4)

  1. 帳票処理プログラムであって、
    コンピュータに、
    処理対象の帳票である対象帳票の帳票画像を取得する画像取得処理と、
    帳票の帳票種別に対応する帳票識別情報と前記帳票の帳票画像との対応関係について学習済みの帳票識別モデルと、前記対象帳票の帳票画像とに基づいて、前記対象帳票の帳票画像が対応する前記帳票識別情報及び前記帳票識別情報の確信度を出力する帳票識別処理と、
    前記確信度が所定の閾値を満たすか否かを判定する、確信度判定処理と、
    前記所定の閾値を満たす帳票識別情報、及び対応情報記憶部に記憶される前記帳票種別と前記帳票識別情報との対応を示す対応情報に基づいて、前記対象帳票の帳票種別を判定する、種別判定処理と、を実行させ、
    前記確信度判定処理は、前記帳票識別情報のうち、前記閾値を満たす前記帳票識別情報がない場合に、前記対象帳票の帳票画像を、前記帳票の帳票種別に対応する帳票識別情報と前記帳票の帳票画像との対応関係について学習するための学習データとして用いるために学習データ記憶部に記憶する、学習データ記憶処理を含み、
    前記帳票識別情報は、第1の帳票種別に対応する第1の帳票識別情報及び前記学習データ記憶部に記憶された前記学習データに基づいて生成される第2の帳票識別情報を有し、
    前記第1の帳票種別が前記第1の帳票識別情報及び前記第2の帳票識別情報に対応することが前記対応情報として記憶され、
    前記帳票識別モデルは、前記第1の帳票識別情報と前記第2の帳票識別情報とを区別可能に学習され、
    前記種別判定処理は、
    前記確信度判定処理によって判定された前記閾値を満たす帳票識別情報が、前記第1の帳票識別情報又は前記第2の帳票識別情報である場合に、前記対応情報に基づいて、前記対象帳票の帳票種別を前記第1の帳票種別であると判定する、帳票処理プログラム。
  2. 請求項1に記載の帳票処理プログラムであって、
    前記第1の帳票種別は、収支内訳書であって、
    前記第2の帳票識別情報は、一部が欠けた収支内訳書を示す、帳票処理プログラム。
  3. 帳票処理装置であって、
    処理対象の帳票である対象帳票の帳票画像を取得する画像取得部と、
    帳票の帳票種別に対応する帳票識別情報と前記帳票の帳票画像との対応関係について学習済みの帳票識別モデルと、前記対象帳票の帳票画像とに基づいて、前記対象帳票の帳票画像が対応する前記帳票識別情報及び前記帳票識別情報の確信度を出力する帳票識別部と、
    前記確信度が所定の閾値を満たすか否かを判定する確信度判定部と、
    前記所定の閾値を満たす帳票識別情報及び対応情報記憶部に記憶される前記帳票種別と前記帳票識別情報との対応を示す対応情報に基づいて、前記対象帳票の帳票種別を判定する、種別判定部と、を備え、
    前記確信度判定部は、前記帳票識別情報のうち、前記閾値を満たす前記帳票識別情報がない場合に、前記対象帳票の帳票画像を、前記帳票の帳票種別に対応する帳票識別情報と前記帳票の帳票画像との対応関係について学習するための学習データとして用いるために学習データ記憶部に記憶する、学習データ記憶部を有し、
    前記帳票識別情報は、第1の帳票種別に対応する第1の帳票識別情報及び前記学習データ記憶部に記憶された前記学習データに基づいて生成される第2の帳票識別情報を有し、
    前記第1の帳票種別が前記第1の帳票識別情報及び前記第2の帳票識別情報に対応することが前記対応情報として記憶され、
    前記帳票識別モデルは、前記第1の帳票識別情報と前記第2の帳票識別情報とを区別可能に学習され、
    前記種別判定部は、
    前記確信度判定部によって判定された前記閾値を満たす帳票識別情報が、前記第1の帳票識別情報又は前記第2の帳票識別情報である場合に、前記対応情報に基づいて、前記対象帳票の帳票種別を前記第1の帳票種別であると判定する、帳票処理装置。
  4. 帳票処理方法であって、
    コンピュータが、処理対象の帳票である対象帳票の帳票画像を取得する画像取得ステップと、
    コンピュータが、帳票の帳票種別に対応する帳票識別情報と前記帳票の帳票画像との対応関係について学習済みの帳票識別モデルと、前記対象帳票の帳票画像とに基づいて、前記対象帳票の帳票画像が対応する前記帳票識別情報及び前記帳票識別情報の確信度を出力する帳票識別ステップと、
    コンピュータが、前記確信度が所定の閾値を満たすか否かを判定する、確信度判定ステップと、
    コンピュータが、前記所定の閾値を満たす帳票識別情報及び対応情報記憶部に記憶される前記帳票種別と前記帳票識別情報との対応を示す対応情報に基づいて、前記対象帳票の帳票種別を判定する、種別判定ステップと、を含み、
    前記確信度判定ステップは、前記帳票識別情報のうち、前記閾値を満たす前記帳票識別情報がない場合に、前記対象帳票の帳票画像を、前記帳票の帳票種別に対応する帳票識別情報と前記帳票の帳票画像との対応関係について学習するための学習データとして用いるために学習データ記憶部に記憶する、学習データ記憶ステップを含み、
    前記帳票識別情報は、第1の帳票種別に対応する第1の帳票識別情報及び前記学習データ記憶部に記憶された前記学習データに基づいて生成される第2の帳票識別情報を有し、
    前記第1の帳票種別が前記第1の帳票識別情報及び前記第2の帳票識別情報に対応することが前記対応情報として記憶され、
    前記帳票識別モデルは、前記第1の帳票識別情報と前記第2の帳票識別情報とを区別可能に学習され、
    前記種別判定ステップは、
    前記確信度判定ステップによって判定された前記閾値を満たす帳票識別情報が、前記第1の帳票識別情報又は前記第2の帳票識別情報である場合に、前記対応情報に基づいて、前記対象帳票の帳票種別を前記第1の帳票種別であると判定する、帳票処理方法。
JP2019195348A 2019-10-28 2019-10-28 帳票処理プログラム、帳票処理装置、帳票処理方法 Active JP6736742B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019195348A JP6736742B1 (ja) 2019-10-28 2019-10-28 帳票処理プログラム、帳票処理装置、帳票処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019195348A JP6736742B1 (ja) 2019-10-28 2019-10-28 帳票処理プログラム、帳票処理装置、帳票処理方法

Publications (2)

Publication Number Publication Date
JP6736742B1 true JP6736742B1 (ja) 2020-08-05
JP2021068378A JP2021068378A (ja) 2021-04-30

Family

ID=71892434

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019195348A Active JP6736742B1 (ja) 2019-10-28 2019-10-28 帳票処理プログラム、帳票処理装置、帳票処理方法

Country Status (1)

Country Link
JP (1) JP6736742B1 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04302073A (ja) * 1991-03-29 1992-10-26 Meidensha Corp 文字認識装置
JP4100885B2 (ja) * 2001-07-11 2008-06-11 キヤノン株式会社 帳票認識装置、方法、プログラムおよび記憶媒体
JP5670787B2 (ja) * 2011-03-18 2015-02-18 株式会社Pfu 情報処理装置、帳票種別推定方法および帳票種別推定用プログラム
JP2017107455A (ja) * 2015-12-10 2017-06-15 キヤノン株式会社 情報処理装置、制御方法、及びプログラム

Also Published As

Publication number Publication date
JP2021068378A (ja) 2021-04-30

Similar Documents

Publication Publication Date Title
US9697193B2 (en) Associating captured image data with a spreadsheet
JP4829920B2 (ja) フォーム自動埋込方法及び装置、グラフィカルユーザインターフェース装置
JP2017224184A (ja) 機械学習装置
CN102611815A (zh) 图像处理装置、图像处理系统以及图像处理方法
JP2017010069A (ja) 情報処理装置
CN112036295B (zh) 票据图像处理方法、装置、存储介质及电子设备
CN101841628A (zh) 图像处理系统、历史管理设备、图像处理控制设备、历史管理方法和图像处理控制方法
JP2015201100A (ja) 既読判断装置、既読判断方法、及び既読判断プログラム
JP6736742B1 (ja) 帳票処理プログラム、帳票処理装置、帳票処理方法
US20230334889A1 (en) Systems and methods for spatial-aware information extraction from electronic source documents
JP4808579B2 (ja) 画像評価装置および方法並びにプログラム
JP7379987B2 (ja) 情報処理装置及びプログラム
JP7263720B2 (ja) 情報処理装置及びプログラム
JP7409427B2 (ja) 情報処理装置、情報処理システム、及びプログラム
JP4518212B2 (ja) 画像処理装置及びプログラム
US11307809B2 (en) Information processing device, learning device, and storage medium storing learnt model
JP2008257543A (ja) 画像処理システム及びプログラム
JP7317612B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP7027696B2 (ja) 情報処理装置及び情報処理プログラム
JP4517822B2 (ja) 画像処理装置及びプログラム
JP2022003446A (ja) 情報処理装置
US11574490B2 (en) Information processing apparatus and non-transitory computer readable medium storing information processing program
JP2018005801A (ja) 画像処理装置
JP2020166658A (ja) 情報処理装置、情報処理方法及びプログラム
US20220092761A1 (en) Information processing apparatus and non-transitory computer readable medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191105

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20191105

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20200302

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200302

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200327

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200522

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200710

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200715

R150 Certificate of patent or registration of utility model

Ref document number: 6736742

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250