JP2020046860A - Form reading apparatus - Google Patents
Form reading apparatus Download PDFInfo
- Publication number
- JP2020046860A JP2020046860A JP2018174013A JP2018174013A JP2020046860A JP 2020046860 A JP2020046860 A JP 2020046860A JP 2018174013 A JP2018174013 A JP 2018174013A JP 2018174013 A JP2018174013 A JP 2018174013A JP 2020046860 A JP2020046860 A JP 2020046860A
- Authority
- JP
- Japan
- Prior art keywords
- information
- model
- extracting
- learned
- account
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000605 extraction Methods 0.000 claims abstract description 39
- 238000012546 transfer Methods 0.000 claims description 29
- 238000000034 method Methods 0.000 description 15
- 238000013528 artificial neural network Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 12
- 239000000284 extract Substances 0.000 description 10
- 238000010586 diagram Methods 0.000 description 6
- 238000007781 pre-processing Methods 0.000 description 6
- 230000006854 communication Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000012549 training Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Abstract
Description
本発明は、一般に金融技術に関し、より詳細には帳票読取システムに関する。 The present invention relates generally to financial technology, and more particularly to a form reading system.
現在、銀行における金融サービスを利用する際、顧客は、預金の預入、引出、振込、為替取引等の多くの金融取引を、フィンテックの進展によってインターネットバンキング等を操作することによって電子ベースで実行すること可能である。一方、顧客が依然として紙媒体の書類や帳票に必要事項を記入押印することによって行われる金融取引もある。例えば、顧客口座から公共料金、クレジットカードの利用代金、商品・サービスの購入代金等を定期的に引き落とすための口座振替依頼書は、紙媒体の帳票ベースの金融取引の典型例である。 Currently, when using financial services in banks, customers execute many financial transactions such as deposits, withdrawals, transfers, foreign exchange transactions, etc. on an electronic basis by operating Internet banking etc. with the development of FinTech. It is possible. On the other hand, there is also a financial transaction in which a customer still fills in and seals a paper document or form. For example, an account transfer request form for regularly debiting a utility bill, a credit card usage fee, a purchase price for a product or service from a customer account is a typical example of a paper-based form-based financial transaction.
顧客によって記入押印された口座振替依頼書は顧客口座のある銀行に送付され、記入内容に不備がないかの確認、押印された印鑑の照合、行内システムへの入力等が主として人手によって行われている。例えば、メガバンクでは、日々膨大な数の口座振替依頼書が銀行スタッフによって処理されており、依頼書の処理に係る事務作業の自動化・効率化が強く求められている。例えば、このような目的のため、文字列が多数記載されている帳票画像から高速に項目名と項目値とのペアを抽出するための帳票認識方式などが知られている。 The debit request form filled out and stamped by the customer is sent to the bank where the customer's account is located, and it is mainly performed by hand that confirmation of the entry contents is complete, verification of the stamped seal, input to the in-line system, etc. I have. For example, in megabanks, a huge number of account transfer request documents are processed by bank staff every day, and there is a strong demand for automation and efficiency of office work related to processing the request documents. For example, for such a purpose, a form recognition method for extracting a pair of an item name and an item value at high speed from a form image in which many character strings are described is known.
しかしながら、従来の文字認識モデルによる帳票認識方式によると、特定タイプの帳票における情報を読み取ることはできるが、多数のタイプの帳票から所望の情報を読取可能な帳票認識方式は知られていない。実際の事務処理では、公共料金、クレジットカード利用代金、購入代金等の個々のサービス毎に書式もレイアウトも異なる独自の口座振替依頼書が用意され、例えば、メガバンクで扱われる口座振替依頼書の種類は、数千タイプ以上にのぼる。このため、異なる書式及びレイアウトによる複数種別の帳票を一括に読取可能な抽出モデルが望まれる。 However, according to a conventional form recognition method based on a character recognition model, information in a specific type of form can be read, but a form recognition method capable of reading desired information from many types of forms is not known. In the actual paperwork, a unique fund transfer request form with a different format and layout is prepared for each service such as utility bill, credit card use price, purchase price etc.For example, the types of fund transfer requests handled by megabanks Number over thousands of types. For this reason, an extraction model that can collectively read a plurality of types of forms with different formats and layouts is desired.
このように、口座振替依頼書は委託者毎などに異なる書式及びレイアウトによって用意され、委託者識別情報(委託者コードなど)、顧客の口座情報、印影情報などの口座振替を実行するのに必要とされる情報の記載場所も様々である。また、口座振替依頼書には、手書きされた文字や数字と共に、該当事項を選択するためのレ点、丸印などの様々なタイプの情報も含まれており、事務処理の自動化にはこれらの判別も必要となる。このため、従来の文字認識モデルにより対処することは困難である。 As described above, the fund transfer request form is prepared in different formats and layouts for each client, and is necessary for executing the bank transfer such as client ID information (client code, etc.), customer account information, and seal imprint information. There are various places where information is described. In addition, the debit request form contains various types of information, such as check marks and circles, for selecting relevant items, along with handwritten letters and numbers. Is also required. For this reason, it is difficult to cope with the conventional character recognition model.
上述した問題点を鑑み、本発明の課題は、記入済みの帳票から所望の情報を抽出可能な帳票読取装置を提供することである。 In view of the above-described problems, an object of the present invention is to provide a form reading apparatus capable of extracting desired information from a filled form.
上記課題を解決するため、本発明の一態様は、学習済みモデルによって、記入済みの帳票から所定の情報を抽出する抽出部を有する帳票読取装置に関する。 In order to solve the above-described problem, one embodiment of the present invention relates to a form reading device including an extraction unit that extracts predetermined information from a filled-out form using a learned model.
本発明によると、様々な書式及びレイアウトの帳票から様々なタイプの記入内容に基づく所望の情報を抽出することが可能になる。 ADVANTAGE OF THE INVENTION According to this invention, it becomes possible to extract desired information based on various types of entry contents from forms of various formats and layouts.
以下、図面に基づいて本発明の実施の形態を説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
以下の実施例では、記入済みの帳票から様々なタイプの情報を抽出する帳票読取装置が開示される。後述される実施例を概略すると、帳票読取装置は、複数種別の記入済みの帳票を入力とし、当該帳票の記入内容に基づく所定の情報を出力するニューラルネットワークなどの学習済みモデルを利用して、入力された帳票から各種情報を抽出する。例えば、帳票読取装置は、入力として口座振替依頼書を取得すると、学習済みモデルを利用して、当該口座振替依頼書の委託者コード、口座情報(口座番号など)、印影情報等の口座振替を実行するのに必要な所定の情報を抽出する。 In the following embodiment, a form reading apparatus that extracts various types of information from filled forms is disclosed. Briefly describing an embodiment described later, the form reading apparatus uses a learned model such as a neural network which inputs a plurality of types of filled forms and outputs predetermined information based on the contents of the forms, Various information is extracted from the input form. For example, when the form reader obtains an account transfer request as an input, the form reader uses the learned model to transfer the account transfer information such as the entrustor code, account information (such as account number), and imprint information of the account transfer request. Extract predetermined information necessary for execution.
なお、以下の実施例は口座振替依頼書に関して主として説明されるが、本発明による帳票はこれに限定されず、例えば、紙媒体に記入/押印された他の何れかの帳票に適用されてもよい。また、以下の実施例は抽出対象の情報として、口座振替依頼書などへの記入内容などの金融サービスに関連する情報に着目するが、本発明による抽出対象の情報は、これに限定されず、公共サービスなどにおける氏名、住所、生年月日等の個人情報など、帳票から読取可能な他の何れかの記入情報であってもよい。 Although the following embodiment is mainly described with respect to a fund transfer request form, the form according to the present invention is not limited to this, and may be applied to any other form filled in / stamped on a paper medium, for example. Good. Further, the following embodiment focuses on information related to financial services such as the contents of an account transfer request form as information to be extracted, but information to be extracted according to the present invention is not limited to this. Any other entry information that can be read from a form, such as personal information such as a name, address, and date of birth in a public service or the like, may be used.
まず、図1を参照して、本発明の一実施例による帳票読取システムを説明する。図1は、本発明の一実施例による帳票読取システムを示す概略図である。 First, a form reading system according to an embodiment of the present invention will be described with reference to FIG. FIG. 1 is a schematic diagram showing a form reading system according to one embodiment of the present invention.
図1に示されるように、帳票読取システム10は、ユーザ端末50、学習装置60、ストレージ70及び帳票読取装置100を有する。
As shown in FIG. 1, the
ユーザ端末50は、典型的には、帳票読取装置100に各種指示及び/又はデータを提供するための端末であり、例えば、パーソナルコンピュータなどの通信機能を備えた何れかの情報処理装置であってもよい。
The
学習装置60は、帳票と抽出対象の情報とのペアから構成される教師データを利用して学習対象のモデルを学習する。例えば、学習対象のモデルがニューラルネットワークとして構成される場合、学習装置60は、教師用の帳票を示す画像情報を当該ニューラルネットワークに入力し、出力情報と教師用の抽出対象の情報との誤差に基づき、例えば、バックプロパゲーションに従ってニューラルネットワークのパラメータを更新する。所定の終了条件が充足されると、学習装置60は、更新されたパラメータによるニューラルネットワークを学習済みモデルとしてストレージ70に格納する。例えば、学習済みモデルは、抽出対象の個別の情報毎に学習されてもよいし、抽出対象の全て又は一部の情報に対して学習されてもよい。
The
例えば、記入済みの複数種別の口座振替依頼書から委託者コードを抽出する場合、委託者の名称等が口座振替依頼書に予め印字されているケース、顧客が口座振替依頼書に委託者を手書きにより指定するケース、顧客が選択対象の委託者から特定の委託者の欄を手書きでチェック(例えば、レ点を書き込む、丸印で囲むなど)することによって指定するケースなど、口座振替依頼書の書式に応じて様々なバリエーションがある。また、委託者を特定するレイアウト領域も口座振替依頼書のレイアウトに応じて様々である。このような多種多様な口座振替依頼書から委託者情報、委託者コード等を抽出するニューラルネットワークを取得するため、学習装置60は、ユーザ端末50などから提供される記入済みの複数種別の口座振替依頼書と委託者コードとのペアから構成される教師データに対して適切な前処理(委託者コード毎の並び替え、正規化、データ圧縮、罫線抽出など)を実行し、前処理された教師データを利用して、何れか適切な学習アルゴリズム(例えば、Resnet、Xception、SENetなど)に従って学習対象のニューラルネットワークを学習する。
For example, when extracting a consignor code from multiple types of completed fund transfer request forms, the case where the name of the consignor is pre-printed on the fund transfer request form, the customer writes the consignor on the fund transfer request form The form of the debit request form, such as the case specified by the customer or the case where the customer specifies by hand writing (for example, writing a check mark, encircling with a circle, etc.) the column of the specific consignor from the selected consignor. There are various variations according to. The layout area for specifying the entrustor also varies depending on the layout of the fund transfer request form. In order to obtain a neural network for extracting entrustor information, entrustor code, etc. from such a variety of fund transfer request forms, the
また、記入済みの複数種別の口座振替依頼書から口座情報の記載場所及び口座情報を抽出する場合も同様に、口座振替依頼書の書式に応じて様々なバリエーションがあり、また、口座情報の記載場所及び口座情報が記入されるレイアウト領域も口座振替依頼書のレイアウトに応じて様々である。さらに、口座番号等は、典型的には罫線により区切られたマス目に記入してもらう形式となっており、罫線と記入内容とを適切に区別することが可能なモデルが必要とされる。このような多種多様な口座振替依頼書から口座情報の記載場所及び口座情報を抽出するニューラルネットワークを取得するため、学習装置60は、ユーザ端末50などから提供される記入済みの複数種別の口座振替依頼書と口座情報の場所又は口座情報とのペアから構成される教師データに対して適切な前処理(罫線抽出のための輪郭抽出、輪郭直線近似、マス目抽出など)を実行し、前処理された教師データを利用して、何れか適切な学習アルゴリズム(例えば、Resnet、Xception、SENetなど)に従って学習対象のニューラルネットワークを学習する。
In addition, when extracting the location and account information of the account information from the completed multiple types of account transfer request forms, there are also various variations according to the format of the account transfer request form. The layout area in which the location and the account information are entered also varies depending on the layout of the account transfer request form. Furthermore, account numbers and the like are typically in a form to be entered in squares separated by ruled lines, and a model capable of appropriately distinguishing ruled lines from written contents is required. In order to obtain a neural network for extracting the account information entry location and account information from such various types of account transfer requests, the
さらに、押印された印影情報を抽出する場合、様々な向きで押印されることが多く、向きに依存しない印影情報の抽出が所望される。例えば、学習装置60は、ユーザ端末50などから提供される記入済みの複数種別の口座振替依頼書と押印場所とのペアから構成される教師データに対して適切な前処理(罫線抽出のための輪郭抽出、輪郭直線近似、マス目抽出など)を実行し、前処理された教師データを利用して、何れか適切な学習アルゴリズム(例えば、Resnet、Xception、SENet、SSDなど)に従って学習対象のニューラルネットワークを学習する。学習済みモデルによって押印場所が特定されると、帳票読取装置100は、特定された押印場所における画像を抽出することができ、帳票読取装置100又は他の照合装置(図示せず)などによって、抽出した画像と当該顧客の登録されている印影情報との自動照合が可能になる。
Furthermore, when extracting stamped seal imprint information, stamping is often performed in various directions, and it is desired to extract seal imprint information independent of the direction. For example, the
ストレージ70は、帳票読取装置100により利用される学習済みモデルを格納する。例えば、学習済みモデルは、学習装置60によって学習され、記入済みの複数種別の口座振替依頼書から所定の情報(例えば、委託者コード、口座情報の場所、口座情報、印影情報の場所、印影情報など)を抽出するニューラルネットワークなどの機械学習モデルである。
The
帳票読取装置100は、以下で詳細に説明されるように、ユーザ端末50からの帳票読取処理の起動指示に応答して、帳票読取装置100は、スキャナ(図示せず)などにより読み取られた帳票から生成された画像情報に対して帳票読取処理を実行する。
As described in detail below, the
帳票読取装置100及び学習装置60は、典型的には、サーバにより実現され、例えば、図2に示されるようなハードウェア構成を有してもよい。すなわち、帳票読取装置100及び学習装置60は、バスBを介し相互接続されるドライブ装置101、補助記憶装置102、メモリ装置103、CPU(Central Processing Unit)104、インタフェース装置105及び通信装置106を有する。
The
帳票読取装置100及び学習装置60における後述される各種機能及び処理を実現するプログラムを含む各種コンピュータプログラムは、CD−ROM(Compact Disk−Read Only Memory)などの記録媒体107によって提供されてもよい。プログラムを記憶した記録媒体107がドライブ装置101にセットされると、プログラムが記録媒体107からドライブ装置101を介して補助記憶装置102にインストールされる。但し、プログラムのインストールは必ずしも記録媒体107により行う必要はなく、ネットワークなどを介し何れかの外部装置からダウンロードするようにしてもよい。補助記憶装置102は、インストールされたプログラムを格納すると共に、必要なファイルやデータなどを格納する。メモリ装置103は、プログラムの起動指示があった場合に、補助記憶装置102からプログラムやデータを読み出して格納する。プロセッサとして機能するCPU104は、メモリ装置103に格納されたプログラムやプログラムを実行するのに必要なパラメータなどの各種データに従って、後述されるような帳票読取装置100及び学習装置60の各種機能及び処理を実行する。インタフェース装置105は、ネットワーク又は外部装置に接続するための通信インタフェースとして用いられる。通信装置106は、外部装置と通信するための各種通信処理を実行する。しかしながら、帳票読取装置100及び学習装置60は、上述したハードウェア構成に限定されるものでなく、他の何れか適切なハードウェア構成により実現されてもよい。
Various computer programs including programs for realizing various functions and processes described below in the
次に、図3を参照して、本発明の一実施例による帳票読取装置を説明する。図3は、本発明の一実施例による帳票読取装置の機能構成を示すブロック図である。 Next, a form reader according to an embodiment of the present invention will be described with reference to FIG. FIG. 3 is a block diagram showing a functional configuration of the form reading apparatus according to one embodiment of the present invention.
図3に示されるように、帳票読取装置100は、インタフェース部110及び抽出部120を有する。
As shown in FIG. 3, the
インタフェース部110は、抽出対象の記入済みの帳票を取得すると、当該帳票を抽出部120にわたし、抽出部120から所定の情報を取得する。具体的には、インタフェース部110は、スキャナなどによって帳票をスキャンすることによって生成された複数種別の帳票の画像情報を取得し、取得した画像情報を抽出部120にわたす。抽出部120によって学習済みモデルを利用した帳票の画像情報に対する抽出処理が実行された後、インタフェース部110は、抽出部120から取得された情報を取得し、例えば、ユーザ端末50に送信する。当該情報を受信すると、ユーザ端末50は、帳票から抽出した所定の情報を格納及び表示することができる。
When acquiring the filled-out form to be extracted, the
抽出部120は、学習済みモデルによって、記入済みの帳票から所定の情報を抽出する。具体的には、抽出部120は、学習装置60によって学習されたニューラルネットワークなどの機械学習モデルに、インタフェース部110から提供された複数種別の帳票の画像情報を入力し、学習済みモデルから出力された当該帳票に関する所定の情報を取得する。例えば、帳票が口座振替依頼書である場合、抽出部120は、インタフェース部110から提供された口座振替依頼書の画像情報を学習済みモデルに入力し、当該口座振替依頼書の委託者コード、口座情報の場所、口座情報(口座番号など)、印影の場所、印影情報等の所定の情報を出力として取得する。抽出部120は、このようにして取得した情報をユーザ端末50に送信する。
The extracting
一実施例では、学習済みモデルは、帳票の画像から画像特徴量を抽出する画像特徴抽出モデルと、帳票に予め記載された罫線から罫線特徴量を抽出する罫線特徴抽出モデルと、画像特徴量と罫線特徴量とから所定の情報を抽出する対象情報抽出モデルとを含んでもよい。具体的には、図4に示されるように、学習済みモデルは、帳票画像と帳票に印字された罫線との2つのタイプの入力をそれぞれ処理するマルチモーダルなニューラルネットワーク構造を有し、帳票画像から画像特徴量を抽出する画像特徴量抽出モデルと、罫線画像から罫線特徴量を抽出する罫線特徴量抽出モデルとを含んでもよい。学習装置60は、前処理として記入済みの複数種別の帳票から帳票画像と罫線画像とを生成し、帳票画像を画像特徴抽出モデルに入力して画像特徴量を取得し、罫線画像を罫線特徴抽出モデルに入力して罫線特徴量を取得する。なお、罫線画像は、必ずしも記入済みの帳票から生成される必要はなく、未記入の対応する帳票から生成されてもよい。学習装置60は、取得した画像特徴量と罫線特徴量とを対象情報抽出モデルに入力し、所定の情報(例えば、委託者コード、口座情報の場所、口座情報、印影の場所、印影情報など)として出力情報を取得する。学習装置60は、取得した出力情報と教師データとを比較し、その誤差に従って画像特徴抽出モデル、罫線特徴抽出モデル及び対象情報抽出モデルの各パラメータを更新することによって、これらのモデルを学習する。また、学習済みモデルは、罫線部分の抽出に限定されず、帳票に予め記載された矩形領域などの所定の図形領域を抽出する領域抽出モデルを含んでもよい。
In one embodiment, the learned model is an image feature extraction model that extracts an image feature amount from an image of a form, a ruled line feature extraction model that extracts a ruled line feature amount from a ruled line previously described in the form, and an image feature amount. And a target information extraction model for extracting predetermined information from the ruled line feature amount. Specifically, as shown in FIG. 4, the trained model has a multimodal neural network structure for processing two types of input, a form image and a ruled line printed on the form, respectively. And a ruled line feature amount extraction model for extracting a ruled line feature amount from a ruled line image. The
また、一実施例では、学習済みモデルは、帳票の画像から帳票種別を判定する帳票種別判定モデルと、帳票種別毎の対象情報抽出モデルとを含んでもよい。具体的には、学習装置60は、記入済みの複数種別の帳票と当該帳票の種別とのペアから構成される教師データによって帳票種別判定モデルを学習し、さらに帳票種別毎に対象情報抽出モデルを用意し、記入済みの特定種別の帳票と所定の情報とのペアから構成される教師データによって各対象情報抽出モデルを学習する。抽出部120は、記入済みの複数種別の帳票を取得すると、まず帳票の種別を判定するため、当該帳票を帳票種別判定モデルに入力して帳票種別を特定する。その後、抽出部120は、特定した帳票種別に対応する対象情報抽出モデルに当該記入済みの帳票を入力して所定の情報(口座情報の場所、口座情報、印影の場所、印影情報など)を抽出する。本実施例によると、帳票種別毎に対象情報抽出モデルを準備する必要はあるが、例えば、帳票の書式又はレイアウト変更があった際には、帳票種別判定モデルと、変更があった帳票の対象情報抽出モデルのみとを再学習すればよく、メンテナンス性に優れたものとなると共に、特定の書式及びレイアウトに特化した対象情報抽出モデルとなるため、抽出精度の向上が見込まれる。
Further, in one embodiment, the learned model may include a form type determination model for determining a form type from a form image, and a target information extraction model for each form type. More specifically, the
次に、図5を参照して、本発明の一実施例によるモデル学習処理を説明する。図5は、本発明の一実施例によるモデル学習処理を示すフローチャートである。当該モデル学習処理は、学習装置60、より具体的には、学習装置60のプロセッサによって実行される。
Next, a model learning process according to an embodiment of the present invention will be described with reference to FIG. FIG. 5 is a flowchart illustrating a model learning process according to an embodiment of the present invention. The model learning process is executed by the
図5に示されるように、ステップS101において、学習装置60は、記入済みの複数種別の帳票と抽出対象の情報(例えば、委託者コード、口座情報の場所、口座情報、印影の場所、印影情報など)とのペアから構成される教師データをユーザ端末50などから取得する。例えば、学習装置60は、抽出対象の情報タイプ毎にモデルを学習する。
As shown in FIG. 5, in step S101, the
ステップS102において、学習装置60は、訓練用の記入済みの帳票を学習対象モデルに入力する。なお、学習装置60は、訓練用の記入済みの帳票に対して適切な前処理をし、前処理された帳票を学習対象モデルに入力してもよい。
In step S102, the
ステップS103において、学習装置60は、学習対象モデルから出力データを取得する。
In step S103, the
ステップS104において、学習装置60は、訓練用の抽出対象の情報と出力データとを比較し、それらの間の誤差に基づきバックプロパゲーションなどに従って学習対象モデルのパラメータを更新する。
In step S104, the
学習装置60は、終了条件が充足されるまでステップS101〜S104の処理を各教師データに対して実行し、最終的に取得された学習対象モデルを学習済みモデルとしてストレージ70に格納する。終了条件としては、所定数の教師データが処理されたこと、誤差が所定の閾値以下になったこと、誤差が収束したことなどであってもよい。
The
次に、図6を参照して、本発明の一実施例による帳票読取処理を説明する。図6は、本発明の一実施例による学習済みモデルによる帳票読取処理を示すフローチャートである。当該帳票読取処理は、帳票読取装置100、より具体的には、帳票読取装置100のプロセッサによって実行される。
Next, a form reading process according to an embodiment of the present invention will be described with reference to FIG. FIG. 6 is a flowchart showing a form reading process using a learned model according to an embodiment of the present invention. The form reading process is executed by the
図6に示されるように、ステップS201において、帳票読取装置100は、抽出対象の記入済み帳票を学習済みモデルに入力する。
As shown in FIG. 6, in step S201, the
ステップS202において、帳票読取装置100は、学習済みモデルから所定の情報を取得する。取得される情報は、学習済みモデルに応じて、帳票への記入内容の全て又は一部の情報であってもよい。帳票読取装置100は、抽出した情報をユーザ端末50などに送信する。
In step S202, the
以上、本発明の実施例について詳述したが、本発明は上述した特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。 As described above, the embodiments of the present invention have been described in detail. However, the present invention is not limited to the specific embodiments described above, and various modifications may be made within the scope of the present invention described in the appended claims.・ Change is possible.
10 帳票読取システム
50 ユーザ端末
60 学習装置
70 ストレージ
100 帳票読取装置
10
Claims (5)
前記所定の情報は、口座振替を実行するのに必要な情報である、請求項1記載の帳票読取装置。 The form is a fund transfer request form,
The form reading device according to claim 1, wherein the predetermined information is information necessary for executing an account transfer.
前記帳票の画像から画像特徴量を抽出する第1のサブモデルと、
前記帳票に予め記載された罫線から罫線特徴量を抽出する第2のサブモデルと、
前記画像特徴量と前記罫線特徴量とから前記所定の情報を抽出する第3のサブモデルと、
を含む、請求項1乃至3何れか一項記載の帳票読取装置。 The trained model is
A first sub-model for extracting an image feature amount from the image of the form,
A second sub-model for extracting a ruled line feature from a ruled line previously described in the form;
A third sub-model for extracting the predetermined information from the image feature amount and the ruled line feature amount;
The form reading apparatus according to claim 1, further comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018174013A JP2020046860A (en) | 2018-09-18 | 2018-09-18 | Form reading apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018174013A JP2020046860A (en) | 2018-09-18 | 2018-09-18 | Form reading apparatus |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2020046860A true JP2020046860A (en) | 2020-03-26 |
Family
ID=69901390
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018174013A Pending JP2020046860A (en) | 2018-09-18 | 2018-09-18 | Form reading apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2020046860A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111695517A (en) * | 2020-06-12 | 2020-09-22 | 北京百度网讯科技有限公司 | Table extraction method and device for image, electronic equipment and storage medium |
WO2022145343A1 (en) * | 2020-12-28 | 2022-07-07 | 有限責任監査法人トーマツ | Architecture for digitalizing documents using multi-model deep learning, and document image processing program |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03268074A (en) * | 1990-03-19 | 1991-11-28 | Hitachi Ltd | System and device for recognition of pattern |
JPH11102416A (en) * | 1997-09-26 | 1999-04-13 | Fujitsu Ltd | Device and method for slip read direction decision |
JP2005056432A (en) * | 1996-12-27 | 2005-03-03 | Fujitsu Ltd | Form identification apparatus and method |
JP2011128679A (en) * | 2009-12-15 | 2011-06-30 | Fujitsu Frontech Ltd | Slip recognition device, unique information extraction method, unique information collation method, and slip recognition program |
-
2018
- 2018-09-18 JP JP2018174013A patent/JP2020046860A/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03268074A (en) * | 1990-03-19 | 1991-11-28 | Hitachi Ltd | System and device for recognition of pattern |
JP2005056432A (en) * | 1996-12-27 | 2005-03-03 | Fujitsu Ltd | Form identification apparatus and method |
JPH11102416A (en) * | 1997-09-26 | 1999-04-13 | Fujitsu Ltd | Device and method for slip read direction decision |
JP2011128679A (en) * | 2009-12-15 | 2011-06-30 | Fujitsu Frontech Ltd | Slip recognition device, unique information extraction method, unique information collation method, and slip recognition program |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111695517A (en) * | 2020-06-12 | 2020-09-22 | 北京百度网讯科技有限公司 | Table extraction method and device for image, electronic equipment and storage medium |
KR20210040878A (en) * | 2020-06-12 | 2021-04-14 | 베이징 바이두 넷컴 사이언스 테크놀로지 컴퍼니 리미티드 | Image table extraction method, apparatus, electronic device and storage medium |
JP2021103581A (en) * | 2020-06-12 | 2021-07-15 | 北京百度網訊科技有限公司 | Method for extracting form in image, device for extracting form in image, electronic apparatus, computer readable storage medium, method for training form extraction module, and computer program |
JP7278321B2 (en) | 2020-06-12 | 2023-05-19 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | Method for extracting tables in images, apparatus for extracting tables in images, electronic devices, computer readable storage media, methods and computer programs for training table extraction modules |
CN111695517B (en) * | 2020-06-12 | 2023-08-18 | 北京百度网讯科技有限公司 | Image form extraction method and device, electronic equipment and storage medium |
KR102604306B1 (en) * | 2020-06-12 | 2023-11-17 | 베이징 바이두 넷컴 사이언스 테크놀로지 컴퍼니 리미티드 | Image table extraction method, apparatus, electronic device and storage medium |
WO2022145343A1 (en) * | 2020-12-28 | 2022-07-07 | 有限責任監査法人トーマツ | Architecture for digitalizing documents using multi-model deep learning, and document image processing program |
JP2022104411A (en) * | 2020-12-28 | 2022-07-08 | 有限責任監査法人トーマツ | Document digitalization architecture by multi-model deep learning and document image processing program |
JP7150809B2 (en) | 2020-12-28 | 2022-10-11 | 有限責任監査法人トーマツ | Document digitization architecture by multi-model deep learning, document image processing program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111489487B (en) | Bill identification method, device, equipment and storage medium | |
US7840890B2 (en) | Generation of randomly structured forms | |
US11393233B2 (en) | System for information extraction from form-like documents | |
JP3422924B2 (en) | CHARACTER RECOGNITION DEVICE, CHARACTER RECOGNITION METHOD, AND COMPUTER-READABLE RECORDING MEDIUM RECORDING PROGRAM FOR CAUSING COMPUTER TO EXECUTE THE METHOD | |
CN109271951A (en) | A kind of method and system promoting book keeping operation review efficiency | |
US20220292861A1 (en) | Docket Analysis Methods and Systems | |
CN113935710A (en) | Contract auditing method and device, electronic equipment and storage medium | |
JP2020046860A (en) | Form reading apparatus | |
CN111507214A (en) | Document identification method, device and equipment | |
CN111931771A (en) | Bill content identification method, device, medium and electronic equipment | |
CN113255767B (en) | Bill classification method, device, equipment and storage medium | |
JP6527256B1 (en) | Report support system, report support method and report support program | |
CN112464927B (en) | Information extraction method, device and system | |
US20210004578A1 (en) | Standardized form recognition method, associated computer program product, processing and learning systems | |
WO2022029874A1 (en) | Data processing device, data processing method, and data processing program | |
JP7118923B2 (en) | Form handling system, form handling method and form handling program | |
CN111144409A (en) | Order following, accepting and examining processing method and system | |
JP7430219B2 (en) | Document information structuring device, document information structuring method and program | |
TWI807467B (en) | Key-item detection model building method, business-oriented key-value identification system and method | |
JP6844076B1 (en) | Data processing equipment, data processing methods and programs | |
CN113435331B (en) | Image character recognition method, system, electronic equipment and storage medium | |
CN117094783A (en) | Bill generation method, bill generation device, bill generation processor and storage medium | |
CN115761745A (en) | Bill data identification method and device, electronic equipment and storage medium | |
CN117831052A (en) | Identification method and device for financial form, electronic equipment and storage medium | |
TWM595252U (en) | Smart identification input device for bank counters |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210805 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220727 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220830 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221024 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20230228 |