JP2023029196A - データ処理装置、データ処理方法及びプログラム - Google Patents
データ処理装置、データ処理方法及びプログラム Download PDFInfo
- Publication number
- JP2023029196A JP2023029196A JP2022027702A JP2022027702A JP2023029196A JP 2023029196 A JP2023029196 A JP 2023029196A JP 2022027702 A JP2022027702 A JP 2022027702A JP 2022027702 A JP2022027702 A JP 2022027702A JP 2023029196 A JP2023029196 A JP 2023029196A
- Authority
- JP
- Japan
- Prior art keywords
- logo
- extracted
- data
- issuer
- publisher
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 title claims abstract description 68
- 238000003672 processing method Methods 0.000 title claims description 4
- 238000000605 extraction Methods 0.000 claims abstract description 27
- 239000000284 extract Substances 0.000 abstract description 11
- 238000010586 diagram Methods 0.000 description 8
- 238000000034 method Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000012015 optical character recognition Methods 0.000 description 4
- 238000012790 confirmation Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/04—Billing or invoicing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/42—Document-oriented image-based pattern recognition based on the type of document
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Finance (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- General Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Artificial Intelligence (AREA)
- Technology Law (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Telephonic Communication Services (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
- Image Analysis (AREA)
Abstract
【課題】証憑の正誤判定の確認にかかる手間を削減する。【解決手段】データ処理装置1において、記憶部12は、証憑を発行する発行元の名称である発行元名称と、発行元の電話番号である基準電話番号と、発行元を示すロゴである基準ロゴと、を関連付けた1以上の発行元データを記憶する。制御部において、取得部131は、発行された証憑を示す証憑データを取得する。抽出部132は、証憑データに含まれる発行元名称と電話番号とロゴとを抽出する。検索部133は、1以上の発行元データから、抽出部が抽出した発行元名称である抽出発行元名称を含む第1発行元データを検索する。判定部134は、第1発行元データに含まれる第1基準電話番号が、抽出部が抽出した電話番号である抽出電話番号と一致する場合か又は第1発行元データに含まれる第1基準ロゴが、抽出部が抽出したロゴである抽出ロゴと一致する場合に、取得した証憑データに誤りが無いと判定する。【選択図】図2
Description
本発明は、データ処理装置、データ処理方法及びプログラムに関する。
レシートや伝票に記載された情報を光学的文字認識によって抽出し、抽出した情報に基いて適切な費目等を付与する技術が知られている。
特許文献1においては、認識精度を向上させるためにレシート等に記載された電話番号を光学的文字認識によって抽出し、抽出した電話番号に基づいて店舗名を特定する方法が記載されている。しかし、特許文献1に記載された技術においては、電話番号が誤認識された場合に、誤った店舗名が特定されることが想定されるため、証憑の内容が適切であるかどうかをオペレータが確認するための手間がかかるという問題が生じていた。
そこで、本発明はこれらの点に鑑みてなされたものであり、証憑の正誤判定の確認にかかる手間を削減することを目的とする。
本発明の第1の態様のデータ処理装置においては、証憑を発行する発行元の名称である発行元名称と、前記発行元の電話番号である基準電話番号と、前記発行元を示すロゴである基準ロゴと、を関連付けた1以上の発行元データを記憶する記憶部と、発行された証憑を示す証憑データを取得する取得部と、前記証憑データに含まれる発行元名称と電話番号とロゴとを抽出する抽出部と、前記1以上の発行元データから、前記抽出部が抽出した発行元名称である抽出発行元名称を含む第1発行元データを検索する検索部と、前記第1発行元データに含まれる第1基準電話番号が、前記抽出部が抽出した電話番号である抽出電話番号と一致する場合、又は前記第1発行元データに含まれる第1基準ロゴが、前記抽出部が抽出したロゴである抽出ロゴと一致する場合に、取得された前記証憑データに誤りが無いと判定する判定部と、を有する。
前記判定部は、前記第1基準ロゴの画像データと、前記抽出ロゴの画像データと、の類似度が閾値以上の場合に、前記第1基準ロゴと前記抽出ロゴとが一致すると判定してもよい。
前記抽出部は、前記抽出ロゴが前記証憑データにおいて配置された位置を特定し、前記判定部は、前記第1基準ロゴと前記抽出ロゴとの類似度が前記閾値以上であって、前記抽出したロゴが証憑データにおける基準位置から所定範囲以内から抽出された場合に、前記第1基準ロゴと前記抽出ロゴとが一致すると判定してもよい。
前記記憶部は、前記基準ロゴと、証憑データにおける前記発行元ごとに異なる基準位置と、を関連づけて記憶し、前記判定部は、前記抽出ロゴが、証憑データにおける前記発行元ごとに異なる基準位置から所定範囲以内から抽出された場合に、前記第1基準ロゴと前記抽出ロゴとが一致すると判定してもよい。
前記第1発行元データに含まれる前記第1基準電話番号が前記抽出電話番号と一致し、かつ、前記第1発行元データに含まれる前記基準ロゴが前記抽出ロゴと一致しない場合に、前記抽出発行元名称と、前記抽出ロゴと、を関連づけて記憶するかを確認する画面をオペレータが操作するオペレータ端末に表示させる表示制御部をさらに有していてもよい。
前記検索部は、前記第1基準電話番号が前記抽出電話番号と一致せず、かつ前記第1基準ロゴが前記抽出ロゴと一致しない場合に、前記抽出電話番号を含む、前記第1発行元データと異なる第2発行元データをさらに検索し、前記第2発行元データに含まれる基準ロゴである第2基準ロゴが前記抽出ロゴと一致する場合に、前記抽出発行元名称を前記第2発行元データに含まれる発行元名称に置換する置換部をさらに有してもよい。
本発明の第2の態様のデータ処理方法は、コンピュータが実行する、発行された証憑を示す証憑データを取得するステップと、前記証憑データに含まれる証憑を発行する発行元の名称である発行元名称と電話番号とロゴとを抽出するステップと、記憶部に記憶された、発行元名称と、前記発行元の電話番号である基準電話番号と、前記発行元を示すロゴである基準ロゴと、を関連付けた、1以上の発行元データから、前記抽出するステップが抽出した発行元名称である抽出発行元名称を含む第1発行元データを検索するステップと、前記第1発行元データに含まれる第1基準電話番号が、前記抽出するステップが抽出した電話番号である抽出電話番号と一致する場合、又は前記第1発行元データに含まれる第1基準ロゴが、前記抽出するステップが抽出したロゴである抽出ロゴと一致する場合に、取得された前記証憑データに誤りが無いと判定するステップと、を有する。
本発明の第3の態様のプログラムは、コンピュータに実行させる、発行された証憑を示す証憑データを取得するステップと、前記証憑データに含まれる証憑を発行する発行元の名称である発行元名称と電話番号とロゴとを抽出するステップと、記憶部に記憶された、発行元名称と、前記発行元の電話番号である基準電話番号と、前記発行元を示すロゴである基準ロゴと、を関連付けた、1以上の発行元データから、前記抽出するステップが抽出した発行元名称である抽出発行元名称を含む第1発行元データを検索するステップと、前記第1発行元データに含まれる第1基準電話番号が、前記抽出するステップが抽出した電話番号である抽出電話番号と一致する場合、又は前記第1発行元データに含まれる第1基準ロゴが、前記抽出するステップが抽出したロゴである抽出ロゴと一致する場合に、取得された前記証憑データに誤りが無いと判定するステップと、を有する。
本発明によれば、証憑の正誤判定の確認にかかる手間を削減するという効果を奏する。
[データ処理装置1の概要]
図1は、データ処理システムSにおける処理の流れを模式的に示す図である。データ処理システムSは、請求書等の証憑に記載された内容を読み取って仕分け等の会計処理を行うためのシステムである。データ処理システムSは、データ処理装置1、読取装置2及び会計処理装置3を有する。
図1は、データ処理システムSにおける処理の流れを模式的に示す図である。データ処理システムSは、請求書等の証憑に記載された内容を読み取って仕分け等の会計処理を行うためのシステムである。データ処理システムSは、データ処理装置1、読取装置2及び会計処理装置3を有する。
データ処理装置1は、証憑データに含まれる文字の正誤を判定する装置である。証憑データは、外部装置から送信された画像データであってもよく、読取装置2により紙の証憑を読み取ることにより作成された画像データであってもよい。一例として、読取装置2は、紙の証憑を読み取った画像データである証憑データをデータ処理装置1に入力する。証憑データは、読取装置2がOCR(Optical Character Recognition)により文字認識をすることにより作成されたテキストデータを含む電子データであってもよい。
データ処理装置1は、入力された証憑データに含まれる発行元名称、電話番号、ロゴを抽出する。入力された証憑データが画像データである場合、データ処理装置1は文字認識処理を実行することにより、発行元名称及び電話番号を抽出する。入力された証憑データがテキストデータを含む場合、データ処理装置1はテキストデータの内容に基づいて発行元名称及び電話番号を抽出する。
データ処理装置1は、予め記憶された発行元データテーブルを参照し、抽出した発行元名称に対応する発行元電話番号及び基準ロゴを取得する。データ処理装置1は、抽出した電話番号又はロゴと、記憶された発行元の電話番号又は基準ロゴと、が一致するかを判定することで証憑データの正誤を判定する。基準ロゴは、発行元を示すロゴの画像データである。データ処理装置1は、読み取った証憑データの内容が正しいと判定する場合、会計処理装置3に証憑データを入力する。
会計処理装置3は、入力された証憑データに基づいて仕訳処理等の所定の処理を行う。ここで、データ処理装置1が扱う証憑は、例えば領収書、請求書、納品書、注文書、レシート等である。図1においては、データ処理装置1、読取装置2、会計処理装置3を別々の装置として説明したが、データ処理装置1は、読取装置2の一部として構成されてもよいし、会計処理装置3の一部として構成されてもよい。
[データ処理装置1の構成]
図2は、データ処理装置1の構成を示すブロック図である。データ処理装置1は、通信部11、記憶部12及び制御部13を有する。制御部13は、取得部131、抽出部132、検索部133、判定部134、置換部135及び表示制御部136を有する。通信部11は、ネットワークを介して読取装置2及び会計処理装置3と通信するための通信インターフェースである。
図2は、データ処理装置1の構成を示すブロック図である。データ処理装置1は、通信部11、記憶部12及び制御部13を有する。制御部13は、取得部131、抽出部132、検索部133、判定部134、置換部135及び表示制御部136を有する。通信部11は、ネットワークを介して読取装置2及び会計処理装置3と通信するための通信インターフェースである。
記憶部12は、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)、SSD(Solid State Drive)、ハードディスク等の記憶媒体である。記憶部12は、制御部13が実行するプログラムを予め記憶している。記憶部12は、証憑を発行する発行元の名称である発行元名称と、発行元の電話番号である基準電話番号と、発行元を示すロゴである基準ロゴと、を関連付けた1以上の発行元データを記憶する。
図3は、記憶部12が記憶する発行元データテーブルのデータ構造の一例を示す図である。記憶部12は、発行元名称と発行元電話番号と基準ロゴとを関連付けた発行元データテーブルを記憶する。記憶部12は、基準ロゴと、証憑データにおける発行元ごとに異なる基準位置と、を関連づけて記憶してもよい。すなわち、記憶部12は、基準ロゴと基準ロゴが証憑データに記載される位置を示す基準位置とをさらに関連付けた発行元データテーブルを記憶する。基準位置は、証憑データにおける位置を示すデータであり、例えば証憑における所定の位置(例えば左上の角の位置)を原点とする二次元の座標データにより表される。
制御部13は、例えばCPU(Central Processing Unit)である。制御部13は、記憶部12に記憶されている制御プログラムを実行することにより、取得部131、抽出部132、検索部133、判定部134、置換部135及び表示制御部136として機能する。
取得部131は、発行された証憑を示す証憑データを取得する。図4は、取得部131が取得する証憑データの一例を示す図である。証憑データは、一例として、宛先事業者名、宛先部署名、宛先事業者識別番号、宛先電話番号、発行元事業者名C1、ロゴC2、発行元電話番号C3、請求書番号、請求書発行日、請求書対象となる商品名又はサービス名、請求額、税額、振込先口座番号等を含む。証憑データは文書データ、画像データ又はテキストデータである。
抽出部132は、証憑データに含まれる発行元名称と電話番号とロゴとを抽出する。抽出部132は、読取装置2から入力された証憑を読み取った画像データである証憑データを文字認識することで、証憑データに含まれる発行元名称(以下抽出発行元名称という場合がある)と電話番号(以下抽出電話番号という場合がある)とを示すテキストデータを抽出する。さらに、抽出部132は、証憑データを画像認識することにより、ロゴを示す画像データ(以下、抽出ロゴという場合がある)を抽出する。
抽出部132は、抽出ロゴが証憑データにおいて配置された位置を特定してもよい。抽出部132は、画像データである証憑データにおいて、抽出ロゴが配置された位置である証憑位置データを取得する。証憑位置データは例えば二次元の座標データである。証憑位置データは例えば、ロゴを抽出した領域の重心又は任意の端点(左上等)の座標である。
検索部133は、1以上の発行元データから、抽出部132が抽出した発行元名称である抽出発行元名称を含む第1発行元データを検索する。検索部133は、記憶部12が記憶する発行元データテーブルから、抽出発行元名称と発行元名称が一致する発行元データを検索し、抽出された発行元データに関連付けられた電話番号(基準電話番号という場合がある)とロゴ(基準ロゴという場合がある)を取得する。
判定部134は、第1発行元データに含まれる第1基準電話番号が、抽出部132が抽出した電話番号である抽出電話番号と一致する場合、又は第1発行元データに含まれる第1基準ロゴが、抽出部132が抽出したロゴである抽出ロゴと一致する場合に、取得された証憑データに誤りが無いと判定する。判定部134は、第1基準電話番号を構成する文字列と抽出電話番号を構成する文字列とを比較する。さらに判定部134は、第1基準ロゴと抽出ロゴとを比較する。そして、判定部134は、電話番号の比較結果とロゴの比較結果のうちいずれか一方が一致していれば取得した証憑データに誤りが無いと判定する。
判定部134は、第1基準ロゴの画像データと、抽出ロゴの画像データと、の類似度が閾値以上の場合に、第1基準ロゴと抽出ロゴとが一致すると判定してもよい。判定部134は、画像データである第1基準ロゴと抽出ロゴとの類似度を算出する。判定部134は、一例として、第1基準ロゴ及び抽出ロゴの特徴点を抽出し、抽出した特徴点の距離に基づいて算出する。類似度は例えば0から1の間の値を取る実数で表される。判定部134は、算出した類似度が閾値以上の場合に第1基準ロゴと抽出ロゴとが一致すると判定する。類似度が0から1で表される場合、閾値は一例として0.8と設定される。
例えば、ロゴの形状や色彩によっては用紙やインク等の影響で表現されるロゴが一定せず、判定精度を安定させることが困難な場合も想定される。そこで、判定部134は、基準ロゴごとに異なる閾値に基づいて第1基準ロゴと抽出ロゴとが一致するか否かを判定してもよい。この場合、記憶部12は、発行元データテーブルにおいて、基準ロゴごとに異なる閾値を記憶する。判定部134は、記憶部12に記憶された基準ロゴと基準ロゴに関連付けられた閾値を読み出し、基準ロゴと抽出ロゴとの類似度を算出する。判定部134は、算出した類似度が記憶部12から読みだした閾値以上であれば基準ロゴと抽出ロゴとが一致すると判定する。
なお、閾値は、ユーザがデータ処理装置1と通信可能に接続されたオペレータ端末(不図示)を操作することで設定できるように構成されてもよい。オペレータ端末は、例えば請求書の処理を行う経理担当者のようなオペレータが使用する端末である。データ処理装置1がこのように構成されることで、類似度の判断結果が安定しないロゴについても判定精度を向上させることができる。
判定部134は、抽出ロゴから、ロゴを構成する要素を抽出し、それぞれの要素ごとに基準ロゴとの類似度を算出してもよい。ロゴを構成する要素は、例えば色、形状、大きさ、ロゴに含まれるテキストである。この場合、判定部134は、各要素の類似度の和又は績を算出し、算出した類似度の和又は績が閾値以上である場合にロゴが一致すると判定してもよい。判定部134は、それぞれの要素の類似度が閾値以上である場合にロゴが一致すると判定してもよい。この場合、記憶部12は、要素ごとの閾値を記憶しており、判定部134は要素ごとの類似度を記憶部12から読みだして判定してもよい。
判定部134は、第1基準ロゴと抽出ロゴとの類似度が閾値以上であって、抽出したロゴが証憑データにおける基準位置から所定範囲以内から抽出された場合に、第1基準ロゴと抽出ロゴとが一致すると判定してもよい。すなわち、基準ロゴと抽出ロゴとの類似度が閾値以上である場合、判定部134は、証憑データにおけるロゴが配置される位置を示す座標データである基準位置と、抽出部132が特定した証憑位置データとを比較し、両者の差分が閾値以内である場合に基準ロゴと抽出ロゴとが一致すると判定する。
基準位置は、発行元ごとに異なる位置が設定されてもよい。判定部134は、記憶部12が記憶する発行元データテーブルから抽出発行元名称に関連付けられた基準位置を取得する。判定部134は、抽出ロゴが、証憑データにおける発行元ごとに異なる基準位置から所定範囲以内から抽出された場合に、第1基準ロゴと抽出ロゴとが一致すると判定してもよい。判定部134は、取得した基準位置と抽出部132が特定した証憑位置データとを比較し、両者の差分が閾値以内である場合に基準ロゴと抽出ロゴとが一致すると判定する。判定部134は、記憶部12が記憶する発行元データから発行元の基準ロゴに対応する基準位置を取得する。判定部134は、取得した基準位置と、抽出部132が特定した証憑位置データとを比較し、両者の差分が閾値以内である場合に基準ロゴと抽出ロゴとが一致すると判定する。
データ処理装置1がこのように構成されることで、証憑の発行元ごとに証憑のフォーマットが異なる場合であっても、証憑に記載された発行元を示すロゴを読み取ることができる。
発行元名称の読取結果が異なる場合に、名称以外の要素が一致する発行元データにより抽出した発行元名称を補正し、読取内容に誤りが無いことを判定してもよい。検索部133は、第1基準電話番号が抽出電話番号と一致せず、かつ第1基準ロゴが抽出ロゴと一致しない場合に、抽出電話番号を含む、第1発行元データと異なる第2発行元データをさらに検索してもよい。具体的には、抽出電話番号及び抽出ロゴと、抽出した発行元名称を含む第1発行元データに含まれる電話番号及びロゴとが一致しない場合、検索部133は、記憶部12に記憶された複数の発行元データテーブルから抽出電話番号を含む発行元データ(第2発行元データという場合がある)を検索する。
置換部135は、第2発行元データに含まれる基準ロゴである第2基準ロゴが抽出ロゴと一致する場合に、抽出発行元名称を第2発行元データに含まれる発行元名称に置換する。判定部134は、第2発行元データに含まれる基準ロゴと抽出ロゴとの類似度を算出する。置換部135は、算出した類似度が所定以上の場合、抽出発行元名称を第2発行元データに含まれる発行元名称に置換する。
データ処理装置1がこのように構成されることで、抽出した電話番号及びロゴを用いて発行元を特定できる場合に、特定した情報に基づいて発行元名称を置換することができる。その結果、オペレータは証憑を参照して発行元名称を確認せずに、データ処理装置1から出力された情報に基づいて証憑の処理を進めることが可能となる。
表示制御部136は、オペレータ端末のような外部端末に、判定部134による判定結果に基づく情報を表示させる。発行元名称と電話番号が一致するが、ロゴが一致しない場合は、ロゴが変更になった可能性が想定される。そこで、表示制御部136は、このような場合にロゴの登録を行うかどうかをオペレータに確認する画面をオペレータ端末に表示させてもよい。
具体的には、表示制御部136は、第1発行元データに含まれる第1基準電話番号が抽出電話番号と一致し、かつ、第1発行元データに含まれる基準ロゴが抽出ロゴと一致しない場合に、抽出発行元名称と、抽出ロゴと、を関連づけて記憶するかを確認する画面をオペレータが操作するオペレータ端末に表示させる。判定部134が第1基準電話番号と抽出電話番号とは一致するが、基準ロゴと抽出ロゴとが一致しないと判定する場合、表示制御部136は、抽出ロゴが発行元データに記憶された情報と異なることをオペレータ端末の画面上に表示し、オペレータに抽出ロゴを発行元データに登録してよいかを確認する画面を表示する。
オペレータが登録を許可する操作を行った場合、表示制御部136は、発行元名称と抽出されたロゴとを関連付けて記憶部12が記憶する発行元データテーブルに記憶させる。データ処理装置1がこのように構成されることで、ロゴが変更になった場合において、読み取った証憑データに含まれるロゴを発行元データに登録することができる。そして、データ処理装置1は登録された新しいロゴに基づいて証憑データの正誤を判定できるようになる。その結果、証憑の確認に必要なオペレータの手間を削減することができる。
なお、表示制御部136は、第1発行元データに含まれる第1基準電話番号が抽出電話番号と一致せず、かつ、第1発行元データに含まれる基準ロゴが抽出ロゴと一致する場合に、抽出発行元名称と、抽出電話番号と、を関連づけて記憶するかを確認する画面をオペレータが操作するオペレータ端末に表示させるように構成されてもよい。
[データ処理装置1における処理の流れ]
図5は、データ処理装置1における処理の流れを示すフローチャートである。図5におけるフローチャートは、データ処理装置1が読取装置2から証憑データを受信するタイミングから開始している。取得部131は、証憑データを取得する(S101)。抽出部132は、取得した証憑データから発行元名称、ロゴ及び電話番号を抽出する(S102)。
図5は、データ処理装置1における処理の流れを示すフローチャートである。図5におけるフローチャートは、データ処理装置1が読取装置2から証憑データを受信するタイミングから開始している。取得部131は、証憑データを取得する(S101)。抽出部132は、取得した証憑データから発行元名称、ロゴ及び電話番号を抽出する(S102)。
検索部133は、記憶部12が記憶する発行元データテーブルから、抽出した発行元名称を含む第1発行元データを検索する(S103)。判定部134は、証憑データから抽出した抽出ロゴ又は電話番号と、検索結果として取得された発行元データに含まれるロゴ又は電話番号が一致するかどうかを判定する(S104)。
ロゴ又は電話番号が一致する場合(S104におけるYES)、判定部134は、ロゴと電話番号いずれも一致しているかどうかを判定する(S105)。ロゴと電話番号のいずれか一方が異なる場合(S105におけるNO)、表示制御部136は、オペレータが操作するオペレータ端末に確認画面を表示し(S106)、オペレータの確認操作が行われた場合、処理をS110に進める。ロゴと電話番号いずれも一致している場合(S105におけるYES)、判定部134は、処理をS110に進める。
ロゴと電話番号のいずれも一致しない場合(S104におけるNO)、検索部133は、抽出した電話番号を含む第2発行元データを検索する(S107)。判定部134は、第2発行元データに含まれるロゴと抽出したロゴが一致するかどうかを判定する(S108)。第2発行元データに含まれるロゴと抽出したロゴが一致する場合(S108におけるYES)、置換部135は、抽出発行元名称を第2発行元データに含まれる発行元名称に置換する(S109)。判定部134は、取得した証憑データに誤りがないと判定し(S110)、証憑データを会計処理装置3に入力し、処理を終了する。
第2発行元データに含まれるロゴと抽出したロゴが一致しない場合(S108におけるNO)、取得した証憑データと一致する発行元データが無いことを示すエラー情報をオペレータ端末に出力するエラー処理を行い(S111)、データ処理装置1は処理を終了する。
[データ処理装置1による効果]
以上説明したように、データ処理装置1においては、証憑を発行する発行元の名称である発行元名称と、発行元の電話番号である基準電話番号と、発行元を示すロゴである基準ロゴと、を関連付けた1以上の発行元データを記憶する記憶部12を有する。そして、取得部131が、発行された証憑を示す証憑データを取得し、抽出部132が、証憑データに含まれる発行元名称と電話番号とロゴとを抽出する。さらに、検索部133が、1以上の発行元データから、抽出部132が抽出した発行元名称である抽出発行元名称を含む第1発行元データを検索し、判定部134が、第1発行元データに含まれる第1基準電話番号が、抽出部132が抽出した電話番号である抽出電話番号と一致する場合、又は第1発行元データに含まれる第1基準ロゴが、抽出部132が抽出したロゴである抽出ロゴと一致する場合に、取得された証憑データに誤りが無いと判定する。
以上説明したように、データ処理装置1においては、証憑を発行する発行元の名称である発行元名称と、発行元の電話番号である基準電話番号と、発行元を示すロゴである基準ロゴと、を関連付けた1以上の発行元データを記憶する記憶部12を有する。そして、取得部131が、発行された証憑を示す証憑データを取得し、抽出部132が、証憑データに含まれる発行元名称と電話番号とロゴとを抽出する。さらに、検索部133が、1以上の発行元データから、抽出部132が抽出した発行元名称である抽出発行元名称を含む第1発行元データを検索し、判定部134が、第1発行元データに含まれる第1基準電話番号が、抽出部132が抽出した電話番号である抽出電話番号と一致する場合、又は第1発行元データに含まれる第1基準ロゴが、抽出部132が抽出したロゴである抽出ロゴと一致する場合に、取得された証憑データに誤りが無いと判定する。
データ処理装置1は、判定した結果をオペレータ端末に表示させたり、証憑データに誤りがないと判定したことを条件として、証憑データを会計処理装置3に送信したりする。データ処理装置1がこのように構成されることで、証憑を処理する担当者が証憑の正誤を確認することなく自動的に証憑の正誤を判定することができるので、担当者が証憑の正誤の確認にかかる手間を削減することができる。
以上、実施の形態を用いて本発明を説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を併せ持つ。
1 データ処理装置
2 読取装置
3 会計処理装置
11 通信部
12 記憶部
13 制御部
131 取得部
132 抽出部
133 検索部
134 判定部
135 置換部
136 表示制御部
2 読取装置
3 会計処理装置
11 通信部
12 記憶部
13 制御部
131 取得部
132 抽出部
133 検索部
134 判定部
135 置換部
136 表示制御部
Claims (8)
- 証憑を発行する発行元の名称である発行元名称と、前記発行元の電話番号である基準電話番号と、前記発行元を示すロゴである基準ロゴと、を関連付けた1以上の発行元データを記憶する記憶部と、
発行された証憑を示す証憑データを取得する取得部と、
前記証憑データに含まれる発行元名称と電話番号とロゴとを抽出する抽出部と、
前記1以上の発行元データから、前記抽出部が抽出した発行元名称である抽出発行元名称を含む第1発行元データを検索する検索部と、
前記第1発行元データに含まれる第1基準電話番号が、前記抽出部が抽出した電話番号である抽出電話番号と一致する場合、又は前記第1発行元データに含まれる第1基準ロゴが、前記抽出部が抽出したロゴである抽出ロゴと一致する場合に、取得された前記証憑データに誤りが無いと判定する判定部と、
を有するデータ処理装置。 - 前記判定部は、前記第1基準ロゴの画像データと、前記抽出ロゴの画像データと、の類似度が閾値以上の場合に、前記第1基準ロゴと前記抽出ロゴとが一致すると判定する、
請求項1に記載するデータ処理装置。 - 前記抽出部は、前記抽出ロゴが前記証憑データにおいて配置された位置を特定し、
前記判定部は、前記第1基準ロゴと前記抽出ロゴとの類似度が前記閾値以上であって、前記抽出したロゴが証憑データにおける基準位置から所定範囲以内から抽出された場合に、前記第1基準ロゴと前記抽出ロゴとが一致すると判定する、
請求項2に記載するデータ処理装置。 - 前記記憶部は、前記基準ロゴと、証憑データにおける前記発行元ごとに異なる基準位置と、を関連づけて記憶し、
前記判定部は、前記抽出ロゴが、証憑データにおける前記発行元ごとに異なる基準位置から所定範囲以内から抽出された場合に、前記第1基準ロゴと前記抽出ロゴとが一致すると判定する、
請求項3に記載するデータ処理装置。 - 前記第1発行元データに含まれる前記第1基準電話番号が前記抽出電話番号と一致し、かつ、前記第1発行元データに含まれる前記基準ロゴが前記抽出ロゴと一致しない場合に、前記抽出発行元名称と、前記抽出ロゴと、を関連づけて記憶するかを確認する画面をオペレータが操作するオペレータ端末に表示させる表示制御部をさらに有する、
請求項1から4のいずれか1項に記載するデータ処理装置。 - 前記検索部は、前記第1基準電話番号が前記抽出電話番号と一致せず、かつ前記第1基準ロゴが前記抽出ロゴと一致しない場合に、前記抽出電話番号を含む、前記第1発行元データと異なる第2発行元データをさらに検索し、
前記第2発行元データに含まれる基準ロゴである第2基準ロゴが前記抽出ロゴと一致する場合に、前記抽出発行元名称を前記第2発行元データに含まれる発行元名称に置換する置換部をさらに有する、
請求項1から5のいずれか1項に記載するデータ処理装置。 - コンピュータが実行する、
発行された証憑を示す証憑データを取得するステップと、
前記証憑データに含まれる証憑を発行する発行元の名称である発行元名称と電話番号とロゴとを抽出するステップと、
記憶部に記憶された、発行元名称と、前記発行元の電話番号である基準電話番号と、前記発行元を示すロゴである基準ロゴと、を関連付けた、1以上の発行元データから、前記抽出するステップが抽出した発行元名称である抽出発行元名称を含む第1発行元データを検索するステップと、
前記第1発行元データに含まれる第1基準電話番号が、前記抽出するステップが抽出した電話番号である抽出電話番号と一致する場合、又は前記第1発行元データに含まれる第1基準ロゴが、前記抽出するステップが抽出したロゴである抽出ロゴと一致する場合に、取得された前記証憑データに誤りが無いと判定するステップと、
を有するデータ処理方法。 - コンピュータに実行させる、
発行された証憑を示す証憑データを取得するステップと、
前記証憑データに含まれる証憑を発行する発行元の名称である発行元名称と電話番号とロゴとを抽出するステップと、
記憶部に記憶された、発行元名称と、前記発行元の電話番号である基準電話番号と、前記発行元を示すロゴである基準ロゴと、を関連付けた、1以上の発行元データから、前記抽出するステップが抽出した発行元名称である抽出発行元名称を含む第1発行元データを検索するステップと、
前記第1発行元データに含まれる第1基準電話番号が、前記抽出するステップが抽出した電話番号である抽出電話番号と一致する場合、又は前記第1発行元データに含まれる第1基準ロゴが、前記抽出するステップが抽出したロゴである抽出ロゴと一致する場合に、取得された前記証憑データに誤りが無いと判定するステップと、
を有するプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022027702A JP2023029196A (ja) | 2021-08-19 | 2022-02-25 | データ処理装置、データ処理方法及びプログラム |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021548658A JP7037237B1 (ja) | 2021-08-19 | 2021-08-19 | データ処理装置、データ処理方法及びプログラム |
PCT/JP2021/030274 WO2023021636A1 (ja) | 2021-08-19 | 2021-08-19 | データ処理装置、データ処理方法及びプログラム |
JP2022027702A JP2023029196A (ja) | 2021-08-19 | 2022-02-25 | データ処理装置、データ処理方法及びプログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021548658A Division JP7037237B1 (ja) | 2021-08-19 | 2021-08-19 | データ処理装置、データ処理方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023029196A true JP2023029196A (ja) | 2023-03-03 |
Family
ID=81213572
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021548658A Active JP7037237B1 (ja) | 2021-08-19 | 2021-08-19 | データ処理装置、データ処理方法及びプログラム |
JP2022027702A Pending JP2023029196A (ja) | 2021-08-19 | 2022-02-25 | データ処理装置、データ処理方法及びプログラム |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021548658A Active JP7037237B1 (ja) | 2021-08-19 | 2021-08-19 | データ処理装置、データ処理方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
JP (2) | JP7037237B1 (ja) |
WO (1) | WO2023021636A1 (ja) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140195416A1 (en) * | 2013-01-10 | 2014-07-10 | Bill.Com, Inc. | Systems and methods for payment processing |
JP6743445B2 (ja) * | 2016-03-25 | 2020-08-19 | 大日本印刷株式会社 | 携帯型情報装置およびプログラム |
JP7077998B2 (ja) * | 2019-03-07 | 2022-05-31 | セイコーエプソン株式会社 | 情報処理装置 |
JP6794564B1 (ja) * | 2020-04-09 | 2020-12-02 | ファーストアカウンティング株式会社 | 請求書管理装置、請求書管理方法及びプログラム |
JP6912841B2 (ja) * | 2020-04-30 | 2021-08-04 | 株式会社日本デジタル研究所 | 証憑判定装置、会計処理装置、証憑判定プログラム、証憑判定システム及び証憑判定方法 |
-
2021
- 2021-08-19 WO PCT/JP2021/030274 patent/WO2023021636A1/ja active Application Filing
- 2021-08-19 JP JP2021548658A patent/JP7037237B1/ja active Active
-
2022
- 2022-02-25 JP JP2022027702A patent/JP2023029196A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2023021636A1 (ja) | 2023-02-23 |
JPWO2023021636A1 (ja) | 2023-02-23 |
JP7037237B1 (ja) | 2022-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11348330B2 (en) | Key value extraction from documents | |
JP4366108B2 (ja) | 文書検索装置、文書検索方法及びコンピュータプログラム | |
AU2006307452B2 (en) | Form data extraction without customization | |
JP6702629B2 (ja) | 活字ocrシステム | |
US11328504B2 (en) | Image-processing device for document image, image-processing method for document image, and storage medium on which program is stored | |
US20110103689A1 (en) | System and method for obtaining document information | |
US11321936B2 (en) | Image processing device, image processing method, and storage medium storing program | |
JP2004139484A (ja) | 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム | |
JP2008204226A (ja) | 帳票認識装置およびそのプログラム | |
CN104809099B (zh) | 文档文件生成装置及文档文件生成方法 | |
US11321558B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
JPWO2019008766A1 (ja) | 証憑処理システムおよび証憑処理プログラム | |
US9213756B2 (en) | System and method of using dynamic variance networks | |
US20210192200A1 (en) | Image-processing device, image-processing method, and storage medium on which program is stored | |
US11605219B2 (en) | Image-processing device, image-processing method, and storage medium on which program is stored | |
CN109726369A (zh) | 一种基于标准文献的智能模板化题录技术实现方法 | |
US11315351B2 (en) | Information processing device, information processing method, and information processing program | |
JP2008282094A (ja) | 文字認識処理装置 | |
WO2023021636A1 (ja) | データ処理装置、データ処理方法及びプログラム | |
US20210303782A1 (en) | Information processing apparatus and non-transitory computer readable medium | |
JP2005165978A (ja) | 帳票ocrプログラム、方法及び装置 | |
JP3985926B2 (ja) | 文字認識方法、文字認識装置、文書画像処理システム及び記録媒体 | |
US20230073775A1 (en) | Image processing and machine learning-based extraction method | |
JP2004164376A (ja) | 識別コード添付帳票、帳票読取プログラム、及び帳票作成プログラム | |
JP2009223391A (ja) | 画像処理装置及び画像処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20231014 |