JP2022075467A - データ処理装置、データ処理方法及びプログラム - Google Patents
データ処理装置、データ処理方法及びプログラム Download PDFInfo
- Publication number
- JP2022075467A JP2022075467A JP2021068170A JP2021068170A JP2022075467A JP 2022075467 A JP2022075467 A JP 2022075467A JP 2021068170 A JP2021068170 A JP 2021068170A JP 2021068170 A JP2021068170 A JP 2021068170A JP 2022075467 A JP2022075467 A JP 2022075467A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- character
- master data
- recognition
- similar
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 title claims abstract description 53
- 238000003672 processing method Methods 0.000 title claims description 4
- 238000012937 correction Methods 0.000 claims abstract description 100
- 238000004891 communication Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 238000000034 method Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000012015 optical character recognition Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/12—Detection or correction of errors, e.g. by rescanning the pattern
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
Abstract
【課題】証憑の画像データに含まれる文字列が正しく出力される確率を向上させる。
【解決手段】データ処理装置1は、証憑に記載される複数の文字列が複数の登録文字列として関連付けられたマスターデータを記憶する記憶部12と、証憑画像データに含まれる文字列を認識することにより複数の認識文字列を出力する文字認識部132と、複数の認識文字列のうち第1文字列がマスターデータに含まれておらず、複数の認識文字列のうち第1文字列と異なる第2文字列がマスターデータに含まれている場合に、マスターデータにおいて第2文字列に関連付けられている一以上の登録文字列のうち第1文字列に最も類似する類似文字列に第1文字列を補正する補正部133と、を有する。
【選択図】図4
【解決手段】データ処理装置1は、証憑に記載される複数の文字列が複数の登録文字列として関連付けられたマスターデータを記憶する記憶部12と、証憑画像データに含まれる文字列を認識することにより複数の認識文字列を出力する文字認識部132と、複数の認識文字列のうち第1文字列がマスターデータに含まれておらず、複数の認識文字列のうち第1文字列と異なる第2文字列がマスターデータに含まれている場合に、マスターデータにおいて第2文字列に関連付けられている一以上の登録文字列のうち第1文字列に最も類似する類似文字列に第1文字列を補正する補正部133と、を有する。
【選択図】図4
Description
本発明は、データ処理装置、データ処理方法及びプログラムに関する。
従来、請求書を読み取った画像に基づいて文字認識し、文字認識した結果に誤りがある場合に認識した文字を補正する技術が知られている(例えば、特許文献1を参照)。
従来の技術においては、抽出された文字を所定のデータベースの内容と比較することにより誤りが補正される。しかしながら、証憑に記載された文字列がデータベースに登録されておらず、文字認識した結果に誤りがないにもかかわらず、データベースの内容と一致しないという場合がある。このような場合にデータベースに含まれる他の文字列の内容と一致するように補正をしてしまうと、正しく文字認識されているにもかかわらず、証憑に記載された文字列と異なる文字列が出力されてしまうという問題が生じていた。
そこで、本発明はこれらの点に鑑みてなされたものであり、証憑の画像データに含まれる文字列が正しく出力される確率を向上させることを目的とする。
本発明の第1の態様に係るデータ処理装置は、証憑画像データを取得するデータ取得部と、前記証憑画像データに含まれる文字列を認識することにより複数の認識文字列を出力する文字認識部と、前記複数の認識文字列のうち第1文字列が、複数の登録文字列が関連付けられたマスターデータに含まれておらず、前記複数の認識文字列のうち前記第1文字列と異なる第2文字列が前記マスターデータに含まれている場合に、前記マスターデータにおいて前記第2文字列に関連付けられている一以上の前記登録文字列のうち前記第1文字列に最も類似する類似文字列に前記第1文字列を補正する補正部と、前記第1文字列が補正された後の補正第1文字列と前記第2文字列とを関連付けて出力する出力部と、を有する。
前記補正部は、前記複数の認識文字列のうち2つ以上の前記第2文字列が前記マスターデータに含まれていることを条件として、前記第1文字列を前記類似文字列に補正してもよい。
前記補正部は、前記第1文字列に最も類似する前記類似文字列の候補が複数あることを特定した場合、前記第1文字列を前記類似文字列に補正をする前に、前記類似文字列の複数の候補を前記出力部に出力させ、前記複数の候補から選択された候補に対応する前記類似文字列に前記第1文字列を補正してもよい。
前記マスターデータは、会社名及び口座情報を前記複数の登録文字列として含み、前記補正部は、前記文字認識部が認識した前記第1文字列である認識会社名が前記マスターデータに含まれておらず、前記文字認識部が認識した前記第2文字列である認識口座情報が前記マスターデータに含まれている場合に、前記マスターデータにおいて前記認識口座情報に関連付けられている会社名に前記認識会社名を補正してもよい。
前記マスターデータは、会社名及び品目名を前記複数の登録文字列として含み、前記補正部は、前記文字認識部が認識した前記第1文字列である認識会社名が前記マスターデータに含まれておらず、前記文字認識部が認識した前記第2文字列である認識品目名が前記マスターデータに含まれている場合に、前記マスターデータにおいて前記認識品目名に関連付けられている複数の会社名のうち、前記認識会社名に最も類似する会社名に前記認識会社名を補正してもよい。
前記マスターデータは、品目名及び商品単価を前記複数の登録文字列として含み、前記補正部は、前記文字認識部が認識した前記第1文字列である認識品目名が前記マスターデータに含まれておらず、前記文字認識部が認識した前記第2文字列である認識商品単価が前記マスターデータに含まれている場合に、前記マスターデータにおいて前記認識商品単価に関連付けられている複数の品目名のうち、前記認識品目名に最も類似する品目名に前記認識品目名を補正してもよい。
前記補正部は、前記第1文字列を前記類似文字列に補正する前に、前記第1文字列又は前記類似文字列の少なくともいずれかをキーワードとしてインターネット上での検索を実行し、前記類似文字列が前記第1文字列よりも正しい蓋然性が高いと判定した場合に、前記第1文字列を前記類似文字列に補正してもよい。
前記補正部は、前記第1文字列を前記類似文字列に補正する前に、前記第1文字列又は前記類似文字列の少なくともいずれかをキーワードとしてインターネット上での検索を実行し、前記第1文字列が前記類似文字列よりも正しい蓋然性が高いと判定した場合に、前記第1文字列を補正することなく、前記マスターデータにおける前記類似文字列を前記第1文字列に補正してもよい。
前記出力部は、前記複数の認識文字列のうち、補正が必要であると前記補正部が判定した文字列と、補正が不要であると前記補正部が判定した文字列とを識別できる態様で出力してもよい。
前記第1文字列との類似度が閾値以上の文字列が前記マスターデータに含まれていない場合、前記出力部は、前記第1文字列を前記マスターデータに登録する対象の文字列として出力してもよい。
前記出力部は、前記複数の認識文字列のうち、前記マスターデータに含まれていない認識文字列の割合が所定の値以上である場合に、前記マスターデータに含まれていない文字列が多いということを示す情報を出力してもよい。
本発明の第2の態様のデータ処理方法は、コンピュータが実行する、証憑画像データを取得するステップと、前記証憑画像データに含まれる文字列を認識することにより複数の認識文字列を出力するステップと、前記複数の認識文字列のうち第1文字列が、複数の登録文字列が関連付けられたマスターデータに含まれておらず、前記複数の認識文字列のうち前記第1文字列と異なる第2文字列が前記マスターデータに含まれている場合に、前記マスターデータにおいて前記第2文字列に関連付けられている一以上の前記登録文字列のうち前記第1文字列に最も類似する類似文字列に前記第1文字列を補正するステップと、前記第1文字列が補正された後の補正第1文字列と前記第2文字列とを関連付けて出力するステップと、を有する。
本発明の第3の態様のプログラムは、コンピュータに、証憑画像データを取得するステップと、前記証憑画像データに含まれる文字列を認識することにより複数の認識文字列を出力するステップと、前記複数の認識文字列のうち第1文字列が、複数の登録文字列が関連付けられたマスターデータに含まれておらず、前記複数の認識文字列のうち前記第1文字列と異なる第2文字列が前記マスターデータに含まれている場合に、前記マスターデータにおいて前記第2文字列に関連付けられている一以上の前記登録文字列のうち前記第1文字列に最も類似する類似文字列に前記第1文字列を補正するステップと、前記第1文字列が補正された後の補正第1文字列と前記第2文字列とを関連付けて出力するステップと、を実行させる。
本発明によれば、証憑の画像データに含まれる文字列が正しく出力される確率を向上させることができるという効果を奏する。
[データ処理装置1の概要]
図1は、データ処理装置1の概要を説明するための図である。データ処理装置1は、証憑画像データを取得し、証憑画像データに文字認識の処理を施すことにより証憑画像データに含まれる文字列を特定する装置であり、例えばコンピュータである。データ処理装置1は、特定した文字列を含む証憑データを作成し、作成した証憑データを外部装置3に出力する。
図1は、データ処理装置1の概要を説明するための図である。データ処理装置1は、証憑画像データを取得し、証憑画像データに文字認識の処理を施すことにより証憑画像データに含まれる文字列を特定する装置であり、例えばコンピュータである。データ処理装置1は、特定した文字列を含む証憑データを作成し、作成した証憑データを外部装置3に出力する。
証憑画像データは、請求書、注文書、納品書、見積書又は検収書等の証憑書面の画像データである。証憑画像データが請求書の画像データである場合、証憑画像データは、会社名、連絡先、請求対象の商品又はサービスの名称(品目名)、請求額及び税額等が含まれている証憑が画像化されたデータである。証憑画像データは、例えば画像読取装置2(例えばスキャナ又はデジタルカメラ)が証憑を読み取ることによって生成された画像データであるが、コンピュータにより作成された画像データ又はテキストデータであってもよい。
外部装置3は、例えば、証憑を受け取った企業においてデータ処理装置1を利用するユーザ(例えば経理担当者)が使用するコンピュータ、又は会計基幹システム(ERP:Enterprise Resource Planning)である。データ処理装置1は、例えば、特定した文字列をユーザのコンピュータに表示させたり、特定した文字列を基幹システムに送信したりする。基幹システムは、例えば会計処理に使用される各種のデータを記憶しているシステムである。
図2は、証憑画像データの一種である請求書画像データの一例である。図3は、図2に示す請求書画像データに基づいて特定された文字列を含む証憑データである請求書データの一例である。図3に示す請求書データにおいては、図2に示す請求書画像データに含まれる文字列が正しく記載されている。
しかしながら、データ処理装置1が文字認識を行うことにより、請求書画像データに含まれる全ての文字列を正しく特定できるとは限らない。データ処理装置1が文字列を誤認識した場合、請求書データに誤った文字列が含まれてしまい、誤った文字列を含む請求書データが作成され、誤った文字列が外部装置3に登録されてしまう。
そこで、本実施形態に係るデータ処理装置1は、証憑に記載される文字列である会社名、支店名、電話番号、口座情報、連絡先、担当部署、担当者名、品目名及び商品単価のうち複数の文字列が関連付けられたマスターデータを参照し、マスターデータにおいて関連付けられた複数の文字列に基づいて、文字認識した文字列が正しいかどうかを判定する。データ処理装置1は、マスターデータにおいて関連付けられている他の文字列を用いて、判定対象の文字列に誤りがあると判定した場合、誤認識した文字列を、マスターデータにおいて上記の他の文字列に関連付けられた複数の文字列のうち最も類似する文字列に補正する。データ処理装置1がこのように構成されていることで、データ処理装置1が正しい文字列を出力する確率が高まる。
以下、データ処理装置1の構成及び動作を詳細に説明する。以下の説明においては、証憑が請求書である場合を中心に説明するが、証憑が請求書以外の注文書、納品書、見積書又は検収書等であってもよい。
[データ処理装置1の構成]
図4は、データ処理装置1の構成を示す図である。データ処理装置1は、通信部11と、記憶部12と、制御部13と、を有する。制御部13は、データ取得部131と、文字認識部132と、補正部133と、出力部134と、を有する。
図4は、データ処理装置1の構成を示す図である。データ処理装置1は、通信部11と、記憶部12と、制御部13と、を有する。制御部13は、データ取得部131と、文字認識部132と、補正部133と、出力部134と、を有する。
通信部11は、インターネット又はイントラネットなどのネットワークを介して画像読取装置2又は外部装置3との間で各種のデータを送受信するための通信インターフェースを含む。通信部11は、画像読取装置2から受信した請求書画像データをデータ取得部131に入力する。また、通信部11は、出力部134が出力した請求書データを外部装置3へと出力する。
記憶部12は、ROM(Read Only Memory)、RAM(Random Access Memory)及びSSD(Solid State Drive)等の記憶媒体を有する。記憶部12は、制御部13が実行するプログラムを記憶する。
また、記憶部12は、証憑に記載される文字列である会社名(登録会社名)、支店名、電話番号、口座情報(登録口座情報)、連絡先、担当部署、担当者名、品目名及び商品単価のうち複数の文字列が複数の登録文字列として関連付けられたマスターデータを記憶する。記憶部12は、例えば、会社に関するデータを含む会社マスターデータ121、及び商品に関するデータを含む商品マスターデータ122を記憶している。これらのマスターデータは、ユーザが証憑を作成する際に使用されるが、制御部13が文字認識して特定した文字列を補正するためにも用いられる。なお、会社マスターデータ121及び商品マスターデータ122は、記憶部12の外部の記憶媒体に記憶されていてもよい。
図5は、会社マスターデータ121の一例を示す図である。図5に示す会社マスターデータ121においては、会社名と、支店名と、会社の住所と、電話番号と、担当部署と、担当者名と、振込先口座番号とが関連付けられている。
図6は、商品マスターデータ122の一例を示す図である。図6に示す商品マスターデータ122においては、商品名と、価格と、メーカー名と、取引先名とが関連付けられている。商品名は、商品の名称と型名又は型番を含んでいるが、商品の名称のみを含んでいてもよく、型名又は型番のみを含んでいてもよい。
図4に示す制御部13は、例えばCPU(Central Processing Unit)を有する。制御部13は、記憶部12に記憶されたプログラムを実行することにより、データ取得部131、文字認識部132、補正部133、及び出力部134として機能する。
データ取得部131は、通信部11を介して証憑画像データを取得する。データ取得部131は、例えば、証憑を読み取った画像読取装置2から出力された証憑画像データを取得し、取得した証憑画像データを文字認識部132に入力する。
文字認識部132は、証憑画像データに含まれる文字列を認識することにより複数の認識文字列を出力する。文字認識部132は、例えばAI(Artificial Intelligence)により実行されるOCR(Optical Character Recognition)処理を実行することにより証憑画像データに含まれている文字を認識し、連続する複数の文字を文字列として認識する。文字認識部132は、認識した複数の文字列を補正部133に入力する。
補正部133は、文字認識部132が一つの証憑画像データにおいて認識した複数の認識文字列のうち第1文字列が、複数の登録文字列が関連付けられたマスターデータに含まれておらず、複数の認識文字列のうち第1文字列と異なる第2文字列がマスターデータに含まれている場合に、マスターデータにおいて第2文字列に関連付けられている一以上の登録文字列のうち第1文字列に最も類似する類似文字列に第1文字列を補正する。補正部133は、第1文字列及び第2文字列がマスターデータに含まれていない場合には、第1文字列を補正しないで、第1文字列及び第2文字列がマスターデータに含まれていないということを出力部134に通知する。マスターデータは、会社マスターデータ121であってもよく、商品マスターデータ122であってもよい。補正部133は、会社マスターデータ121と商品マスターデータ122とを組み合わせて使用してもよい。補正部133は、補正した後の補正第1文字列を出力部134に入力する。
出力部134は、補正第1文字列と第2文字列とを関連付けて出力する。出力部134は、例えば、図3に示した請求書データのように、一つの証憑画像データに対応する複数の文字列が関連付けられた状態の証憑データを出力する。出力部134は、例えば、通信部11を介して外部装置3に証憑データを出力したり、ディスプレイに証憑データを出力したりする。
出力部134は、補正部133が第1文字列を類似文字列に補正する前に、第1文字列と類似文字列とを関連付けて出力し、補正部133は、出力部134が第1文字列と類似文字列とを関連付けて出力した後に、補正を許可する指示を受けたことを条件として、第1文字列を類似文字列に補正してもよい。また、出力部134は、第1文字列及び第2文字列がマスターデータに含まれていないという通知を補正部133から受けた場合、第1文字列及び第2文字列がマスターデータに含まれていないことを示す情報を出力してもよい。
[補正処理の詳細]
以下、補正部133による補正処理の詳細を説明する。
一例として、補正部133は、文字認識部132が認識した第1文字列である認識会社名がマスターデータに含まれておらず、文字認識部が認識した第2文字列である認識口座情報がマスターデータに含まれている場合に、マスターデータにおいて認識口座情報に関連付けられている会社名に認識会社名を補正する。
以下、補正部133による補正処理の詳細を説明する。
一例として、補正部133は、文字認識部132が認識した第1文字列である認識会社名がマスターデータに含まれておらず、文字認識部が認識した第2文字列である認識口座情報がマスターデータに含まれている場合に、マスターデータにおいて認識口座情報に関連付けられている会社名に認識会社名を補正する。
一例として、複数の認識文字列が「田口商事」と「AAA銀行 東京支店 普通 1223334」であるとする。第1文字列が「田口商事」である場合、図5に示す会社マスターデータ121には第1文字列が含まれていない。しかしながら、「AAA銀行 東京支店 普通 1223334」という第2文字列は、図5に示す会社マスターデータ121に含まれている。このような場合、補正部133は、「AAA銀行 東京支店 普通 1223334」に関連付けられている「田中商事」、「東京支店」、「東京都千代田区〇〇1-12」等の複数の文字列のうち「田中商事」が「田口商事」に最も類似すると判定し、第1文字列の「田口商事」を「田中商事」に補正する。
補正部133は、例えば複数の文字列それぞれに含まれる複数の文字のうち、一致する文字の数に基づいて算出した類似度に基づいて、最も類似する類似文字列を特定する。補正部133は、第1文字列と一致する文字列が最も多い文字列を類似文字列として特定する。補正部133は、第1文字列が会社名であることを特定した場合、マスターデータにおいて会社名として登録されている文字列を類似文字列として特定してもよい。
他の例として、複数の認識文字列が「インク(AK-123)」と「¥1,800」であるとする。第1文字列が「¥1,800」である場合、図6に示す商品マスターデータ122には第1文字列が含まれていない。しかしながら、「インク(AK-123)」という第2文字列は、図6に示す商品マスターデータ122に含まれている。このような場合、補正部133は、「インク(AK-123)」に関連付けられている「¥1,000」、「ABC社」、「田中商事株式会社」等の文字列のうち、「¥1,000」が「¥1,800」に最も類似すると判定し、第1文字列の「¥1,800」を「¥1,000」に補正する。
補正部133は、文字認識部132が認識した第1文字列である認識品目名がマスターデータに含まれておらず、文字認識部132が認識した第2文字列である認識商品単価がマスターデータに含まれている場合に、マスターデータにおいて認識商品単価に関連付けられている複数の品目名のうち、認識品目名に最も類似する品目名に認識品目名を補正してもよい。例えば文字認識部132が第1文字列としてインク(AK-723)を認識し、文字認識部132が第2文字列として「¥1,000」を認識した場合、補正部133は、図6に示す商品マスターデータ122において「¥1,000」に関連付けられている「インク(AK-0123)」と「コピー用紙(A1)」を特定する。そして、補正部133は、「インク(AK-0123)」と「コピー用紙(A1)」のうち、第1文字列である「インク(AK-723)」に「コピー用紙(A1)」よりも類似する「インク(AK-0123)」に第1文字列を補正する。
補正部133は、文字認識部132が認識した第1文字列である認識会社名がマスターデータに含まれておらず、文字認識部が認識した第2文字列である認識品目名がマスターデータに含まれている場合に、マスターデータにおいて認識品目名に関連付けられている複数の会社名のうち、認識会社名に最も類似する会社名に認識会社名を補正してもよい。例えば文字認識部132が第1文字列として「田口商事株式会社」を認識し、文字認識部132が第2文字列として「インク(AK-0123)」を認識した場合、補正部133は、図6に示す商品マスターデータ122において「インク(AK-0123)」に関連付けられている「田中商事株式会社」と「MM電気株式会社」を特定する。そして、補正部133は、「田中商事株式会社」と「MM電気株式会社」のうち、第1文字列である「田口商事株式会社」に「MM電気株式会社」よりも類似する「田中商事株式会社」に第1文字列を補正する。
ところで、第2文字列がマスターデータに含まれているとしても、第2文字列が誤認識された結果としてマスターデータに含まれているという場合もある。このような場合に、第2文字列が正しいという前提で、補正部133が第2文字列に関連付けられた文字列に第1文字列を補正してしまうと、間違った文字列に第1文字列が補正されてしまう場合がある。そこで、補正部133は、補正部133は、複数の認識文字列のうち2つ以上の第2文字列がマスターデータに含まれていることを条件として、第1文字列を類似文字列に補正してもよい。
先の例の場合、補正部133は、例えば「AAA銀行 東京支店 普通 1223334」と「03-1234-5678」とが関連付けられてマスターデータに含まれていることにより、これらに関連付けられている「田中商事」に第1文字列の「田口商事」を補正する。2つ以上の文字列が誤認識される確率が十分に低い場合、補正部133がこのように動作することで、間違った文字列に第1文字列が補正されてしまう確率を低下させることができるので、証憑に記載された文字列が正しく出力される確率を向上させることができる。
補正部133は、第1文字列に最も類似する類似文字列の候補が複数あることを特定した場合、第1文字列を類似文字列に補正をする前に、類似文字列の複数の候補を出力部134に出力させ、複数の候補から選択された候補に対応する類似文字列に第1文字列を補正してもよい。例えば会社マスターデータ121に電話番号「03-1234-5678」とFAX番号「03-1234-5679」が含まれており、第1文字列が「03-1234-5670」である場合、「03-1234-5678」及び「03-1234-5679」の両方が第1文字列に類似する。
このような場合には、どの文字列に補正をすべきかをユーザが判断する必要があるため、補正部133は、「03-1234-5678」及び「03-1234-5679」を補正の候補として、ユーザが使用するコンピュータのディスプレイに表示させる。補正部133は、ユーザが選択した文字列に第1文字列を補正する。補正部133がこのように動作することで、類似する複数の文字列がマスターデータに登録されている場合であっても、間違った文字列に第1文字列が補正されてしまう確率を低下させることができる。
ところで、文字認識部132が認識した文字列とマスターデータに含まれている文字列とが一致しない場合、マスターデータに含まれている文字列が間違っていることも想定される。例えば、会社が移転した場合、マスターデータに含まれている住所が最新の住所でないという場合もある。そこで、補正部133は、第1文字列を類似文字列に補正する前に、第1文字列又は類似文字列の少なくともいずれかをキーワードとしてインターネット上での検索を実行し、類似文字列が第1文字列よりも正しい蓋然性が高いと判定した場合に、第1文字列を類似文字列に補正してもよい。
一例として、文字認識部132が認識した第1文字列が「東京都千代田区〇〇2-15」であり、補正部133が図5に示す会社マスターデータ内の「東京都千代田区〇〇1-12」を類似文字列として特定した場合、補正部133は、類似文字列に関連付けられた会社名又は電話番号等をキーワードとして用いてインターネット上で検索する。補正部133は、検索して表示されるウェブサイトに記載されている住所が第1文字列に一致している場合に第1文字列を補正せず、ウェブサイトに記載されている住所が類似文字列に一致しており、類似文字列が第1文字列よりも正しいと判定した場合に、第1文字列の「東京都千代田区〇〇2-15」を「東京都千代田区〇〇1-12」に補正する。補正部133がこのように動作することで、マスターデータに登録されている文字列が最新でない場合に、誤って補正されてしまうことを防げる。
また、補正部133は、第1文字列を類似文字列に補正する前に、第1文字列又は類似文字列の少なくともいずれかをキーワードとしてインターネット上での検索を実行し、第1文字列が類似文字列よりも正しい蓋然性が高いと判定した場合に、第1文字列を補正することなく、マスターデータにおける類似文字列を第1文字列に補正してもよい。上述した例の場合、補正部133は、検索して表示されるウェブサイトに記載されている住所が第1文字列に一致しており、第1文字列が類似文字列よりも正しい蓋然性が高いと判定した場合、会社マスターデータにおける「東京都千代田区〇〇1-12」という文字列を第1文字列「東京都千代田区〇〇2-15」に補正する。補正部133がこのように動作することで、マスターデータが最新の状態になる。その結果、将来、文字認識部132が誤認識をして補正部133が文字列を補正する際の補正の精度が向上する。
[出力部134の動作]
出力部134は、証憑に記載された文字列に基づいて、適切な文字列が基幹システムに登録される確率を向上させるために、補正部133が補正をした文字列を基幹システムに出力する前にユーザが確認できるようにしてもよい。一例として、出力部134は、複数の認識文字列のうち、補正が必要であると補正部133が判定した文字列と、補正が不要であると補正部133が判定した文字列とを識別できる態様で出力する。
出力部134は、証憑に記載された文字列に基づいて、適切な文字列が基幹システムに登録される確率を向上させるために、補正部133が補正をした文字列を基幹システムに出力する前にユーザが確認できるようにしてもよい。一例として、出力部134は、複数の認識文字列のうち、補正が必要であると補正部133が判定した文字列と、補正が不要であると補正部133が判定した文字列とを識別できる態様で出力する。
図7は、出力部134が出力する証憑データの表示画面の一例を示す図である。図7(a)においては、「田口商事」と「インク(AK-723)」が会社マスターデータ又は商品マスターデータに含まれていないため、他の文字列と異なる態様(太枠内に斜体字)で表示されている。出力部134がこのようなデータを出力することで、例えばユーザは、どの文字列を補正する必要があるかを容易に把握することができる。
出力部134は、図7(a)の画面において、所定の操作をした場合に、補正の候補となる文字列を表示してもよい。所定の操作は、例えば、補正が必要な文字列をユーザが選択する操作(例えばクリック操作又はタッチ操作)である。図7(b)は、補正の候補となる文字列が表示された例を示す図である。表示された候補をユーザが選択すると、補正部133は、図7(a)に表示された文字列を表示された候補の文字列に補正する。その結果、証憑データが、図3に示した状態に補正される。
ところで、証憑画像データに含まれる文字列を認識した結果、多くの文字列がマスターデータに含まれていないという場合がある。このようなことが生じるのは、証憑画像データの画質が悪過ぎるという場合、間違って発行された証憑であるという場合、又はマスターデータに未登録の取引先からの証憑であるという場合が想定される。ユーザが、これらの状況を把握することができるように、出力部134は、複数の認識文字列のうち、マスターデータに含まれていない認識文字列の割合が所定の値以上である場合に、マスターデータに含まれていない文字列が多いということを示す警告情報を出力してもよい。
出力部134は、複数の認識文字列とともに警告情報を出力してもよい。出力部134は、図7に示したように、補正が必要な文字列を識別できるようにした状態で、複数の認識文字列とともに警告情報を出力してもよい。出力部134は、警告情報とともに、又は警告情報として、ユーザが実行する処理を入力するための画面を表示してもよい。出力部134は、例えば、複数の認識文字列を関連付けてマスターデータに登録するための操作を行うための画面を表示する。出力部134は、登録するための操作が行われた場合に、複数の認識文字列をマスターデータに登録する。
出力部134は、第1文字列と類似する文字列(例えば類似度が閾値以上の文字列)がマスターデータに含まれていない場合、第1文字列をマスターデータに登録する対象の文字列として出力してもよい。出力部134は、例えば、第1文字列が「佐藤商事」であり、マスターデータに「佐藤商事」が含まれていない場合に、「佐藤商事をマスターデータに登録しますか?」のように、第1文字列を含むメッセージをユーザのコンピュータに表示させる。
出力部134は、登録する対象であると判定された文字列(例えば上述の「佐藤商事」)が含まれている証憑画像データに含まれる他の複数の文字列のうち、マスターデータに登録するべき項目に対応する複数の文字列を、登録対象候補の文字列として表示してもよい。出力部134は、登録対象候補の文字列とともに、登録するための操作を受け付ける操作用画像を表示し、当該操作用画像が操作された場合に、第1文字列及び登録対象候補の文字列をマスターデータに登録してもよい。出力部134がこのように動作することで、例えば、過去の取引がない新しい取引先が生じた場合に、マスターデータに登録する文字列をユーザが入力する必要がないので、ユーザの作業効率が向上する。
[データ処理装置1の処理の流れ]
図8は、データ処理装置1の処理の流れを示すフローチャートである。図8に示すフローチャートは、画像読取装置2が証憑画像データを出力した時点から開始している。
図8は、データ処理装置1の処理の流れを示すフローチャートである。図8に示すフローチャートは、画像読取装置2が証憑画像データを出力した時点から開始している。
画像読取装置2が出力した証憑画像データをデータ取得部131が取得すると(S11)、文字認識部132が、証憑画像データに含まれている文字を認識するOCR処理を実行する(S12)。文字認識部132は、認識した文字に基づいて、複数の文字列を認識する。
補正部133は、文字認識部132が認識した複数の文字列が正しく認識されているか否かを判定するために、まず、複数の認識文字列から1つの認識文字列を選択する(S13)。補正部133は、選択した1つの認識文字列が、マスターデータに含まれている複数の文字列のいずれかと一致するか否かを判定する(S14)。補正部133は、選択した1つの認識文字列が、マスターデータに含まれている複数の文字列のいずれかと一致すると判定した場合(S14においてYES)、他の認識文字列を選択して(S15)、S14の処理を再度実行する。
補正部133は、選択した1つの認識文字列である第1文字列が、マスターデータに含まれている複数の文字列の全てと一致しないと判定した場合(S14においてNO)、文字認識部132が認識した複数の認識文字列のうち他の認識文字列が、マスターデータに含まれている複数の文字列のいずれかと一致するか否かを判定する(S16)。
補正部133は、他の認識文字列が、マスターデータに含まれている複数の文字列のいずれかと一致していると判定した場合(S16においてYES)、他の認識文字列と一致するマスターデータ内の文字列に関連付けられた複数の文字列のうち、第1文字列に最も類似する文字列に、認識された第1文字列を補正する(S17)。補正部133は、他の認識文字列が、マスターデータに含まれている複数の文字列のいずれかと一致していないと判定した場合(S16においてNO)、さらに他の認識文字列に対してS16の処理を実行する。
補正部133は、全ての認識文字列に対してS14からS17の処理が終了したか否かを判定し、終了していない場合(S18においてNO)、S14に戻る。補正部133は、全ての認識文字列に対する処理が終了した場合(S18においてYES)、補正後の文字列により構成される証憑データを作成し、出力部134が証憑データを出力する(S19)。
[データ処理装置1による効果]
以上説明したように、データ処理装置1は、証憑に記載される文字列である会社名、支店名、電話番号、口座情報、連絡先、担当部署、担当者名、品目名及び商品単価のうち複数の文字列が複数の登録文字列として関連付けられたマスターデータを参照する。そして、補正部133は、証憑画像データに含まれる文字列を認識することにより特定された複数の認識文字列のうち第1文字列が前記マスターデータに含まれておらず、複数の認識文字列のうち第1文字列と異なる第2文字列がマスターデータに含まれている場合に、マスターデータにおいて第2文字列に関連付けられている一以上の登録文字列のうち第1文字列に最も類似する類似文字列に第1文字列を補正する。
以上説明したように、データ処理装置1は、証憑に記載される文字列である会社名、支店名、電話番号、口座情報、連絡先、担当部署、担当者名、品目名及び商品単価のうち複数の文字列が複数の登録文字列として関連付けられたマスターデータを参照する。そして、補正部133は、証憑画像データに含まれる文字列を認識することにより特定された複数の認識文字列のうち第1文字列が前記マスターデータに含まれておらず、複数の認識文字列のうち第1文字列と異なる第2文字列がマスターデータに含まれている場合に、マスターデータにおいて第2文字列に関連付けられている一以上の登録文字列のうち第1文字列に最も類似する類似文字列に第1文字列を補正する。
データ処理装置1がこのように構成されていることで、文字認識において誤りが生じたとしても出力部134が正しい文字列を出力することができるので、証憑の画像データに含まれる文字列が正しく出力される確率を向上させる。その結果、証憑に記載されたデータを用いて業務を行うユーザの業務効率と業務品質を向上させることができる。
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を併せ持つ。
例えば、以上の説明においては、データ処理装置1の記憶部12に会社マスターデータ121及び商品マスターデータ122が記憶されている場合を例示したが、データ処理装置1は、会社マスターデータ121及び商品マスターデータ122のいずれか一方のみを使用してもよい。また、データ処理装置1は、一つのコンピュータにより構成されていなくてもよく、複数のコンピュータが連携して動作したり、コンピュータと、マスターデータが記憶された記憶媒体とが物理的に分離したりしていてもよい。
1 データ処理装置
2 画像読取装置
3 外部装置
11 通信部
12 記憶部
13 制御部
121 会社マスターデータ
122 商品マスターデータ
131 データ取得部
132 文字認識部
133 補正部
134 出力部
2 画像読取装置
3 外部装置
11 通信部
12 記憶部
13 制御部
121 会社マスターデータ
122 商品マスターデータ
131 データ取得部
132 文字認識部
133 補正部
134 出力部
Claims (13)
- 証憑画像データを取得するデータ取得部と、
前記証憑画像データに含まれる文字列を認識することにより複数の認識文字列を出力する文字認識部と、
前記複数の認識文字列のうち第1文字列が、複数の登録文字列が関連付けられたマスターデータに含まれておらず、前記複数の認識文字列のうち前記第1文字列と異なる第2文字列が前記マスターデータに含まれている場合に、前記マスターデータにおいて前記第2文字列に関連付けられている一以上の前記登録文字列のうち前記第1文字列に最も類似する類似文字列に前記第1文字列を補正する補正部と、
前記第1文字列が補正された後の補正第1文字列と前記第2文字列とを関連付けて出力する出力部と、
を有するデータ処理装置。 - 前記補正部は、前記複数の認識文字列のうち2つ以上の前記第2文字列が前記マスターデータに含まれていることを条件として、前記第1文字列を前記類似文字列に補正する、
請求項1に記載のデータ処理装置。 - 前記補正部は、前記第1文字列に最も類似する前記類似文字列の候補が複数あることを特定した場合、前記第1文字列を前記類似文字列に補正をする前に、前記類似文字列の複数の候補を前記出力部に出力させ、前記複数の候補から選択された候補に対応する前記類似文字列に前記第1文字列を補正する、
請求項1又は2に記載のデータ処理装置。 - 前記マスターデータは、会社名及び口座情報を前記複数の登録文字列として含み、
前記補正部は、前記文字認識部が認識した前記第1文字列である認識会社名が前記マスターデータに含まれておらず、前記文字認識部が認識した前記第2文字列である認識口座情報が前記マスターデータに含まれている場合に、前記マスターデータにおいて前記認識口座情報に関連付けられている会社名に前記認識会社名を補正する、
請求項1から3のいずれか一項に記載のデータ処理装置。 - 前記マスターデータは、会社名及び品目名を前記複数の登録文字列として含み、
前記補正部は、前記文字認識部が認識した前記第1文字列である認識会社名が前記マスターデータに含まれておらず、前記文字認識部が認識した前記第2文字列である認識品目名が前記マスターデータに含まれている場合に、前記マスターデータにおいて前記認識品目名に関連付けられている複数の会社名のうち、前記認識会社名に最も類似する会社名に前記認識会社名を補正する、
請求項1から4のいずれか一項に記載のデータ処理装置。 - 前記マスターデータは、品目名及び商品単価を前記複数の登録文字列として含み、
前記補正部は、前記文字認識部が認識した前記第1文字列である認識品目名が前記マスターデータに含まれておらず、前記文字認識部が認識した前記第2文字列である認識商品単価が前記マスターデータに含まれている場合に、前記マスターデータにおいて前記認識商品単価に関連付けられている複数の品目名のうち、前記認識品目名に最も類似する品目名に前記認識品目名を補正する、
請求項1から5のいずれか一項に記載のデータ処理装置。 - 前記補正部は、前記第1文字列を前記類似文字列に補正する前に、前記第1文字列又は前記類似文字列の少なくともいずれかをキーワードとしてインターネット上での検索を実行し、前記類似文字列が前記第1文字列よりも正しい蓋然性が高いと判定した場合に、前記第1文字列を前記類似文字列に補正する、
請求項1から6のいずれか一項に記載のデータ処理装置。 - 前記補正部は、前記第1文字列を前記類似文字列に補正する前に、前記第1文字列又は前記類似文字列の少なくともいずれかをキーワードとしてインターネット上での検索を実行し、前記第1文字列が前記類似文字列よりも正しい蓋然性が高いと判定した場合に、前記第1文字列を補正することなく、前記マスターデータにおける前記類似文字列を前記第1文字列に補正する、
請求項1から6のいずれか一項に記載のデータ処理装置。 - 前記出力部は、前記複数の認識文字列のうち、補正が必要であると前記補正部が判定した文字列と、補正が不要であると前記補正部が判定した文字列とを識別できる態様で出力する、
請求項1から8のいずれか一項に記載のデータ処理装置。 - 前記第1文字列との類似度が閾値以上の文字列が前記マスターデータに含まれていない場合、前記出力部は、前記第1文字列を前記マスターデータに登録する対象の文字列として出力する、
請求項1から9のいずれか一項に記載のデータ処理装置。 - 前記出力部は、前記複数の認識文字列のうち、前記マスターデータに含まれていない認識文字列の割合が所定の値以上である場合に、前記マスターデータに含まれていない文字列が多いということを示す情報を出力する、
請求項1から10のいずれか一項に記載のデータ処理装置。 - コンピュータが実行する、
証憑画像データを取得するステップと、
前記証憑画像データに含まれる文字列を認識することにより複数の認識文字列を出力するステップと、
前記複数の認識文字列のうち第1文字列が、複数の登録文字列が関連付けられたマスターデータに含まれておらず、前記複数の認識文字列のうち前記第1文字列と異なる第2文字列が前記マスターデータに含まれている場合に、前記マスターデータにおいて前記第2文字列に関連付けられている一以上の前記登録文字列のうち前記第1文字列に最も類似する類似文字列に前記第1文字列を補正するステップと、
前記第1文字列が補正された後の補正第1文字列と前記第2文字列とを関連付けて出力するステップと、
を有するデータ処理方法。 - コンピュータに、
証憑画像データを取得するステップと、
前記証憑画像データに含まれる文字列を認識することにより複数の認識文字列を出力するステップと、
前記複数の認識文字列のうち第1文字列が、複数の登録文字列が関連付けられたマスターデータに含まれておらず、前記複数の認識文字列のうち前記第1文字列と異なる第2文字列が前記マスターデータに含まれている場合に、前記マスターデータにおいて前記第2文字列に関連付けられている一以上の前記登録文字列のうち前記第1文字列に最も類似する類似文字列に前記第1文字列を補正するステップと、
前記第1文字列が補正された後の補正第1文字列と前記第2文字列とを関連付けて出力するステップと、
を実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021068170A JP2022075467A (ja) | 2020-11-04 | 2021-04-14 | データ処理装置、データ処理方法及びプログラム |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020561940A JP6870159B1 (ja) | 2020-11-04 | 2020-11-04 | データ処理装置、データ処理方法及びプログラム |
PCT/JP2020/041162 WO2022097189A1 (ja) | 2020-11-04 | 2020-11-04 | データ処理装置、データ処理方法及びプログラム |
JP2021068170A JP2022075467A (ja) | 2020-11-04 | 2021-04-14 | データ処理装置、データ処理方法及びプログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020561940A Division JP6870159B1 (ja) | 2020-11-04 | 2020-11-04 | データ処理装置、データ処理方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022075467A true JP2022075467A (ja) | 2022-05-18 |
Family
ID=75801856
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020561940A Active JP6870159B1 (ja) | 2020-11-04 | 2020-11-04 | データ処理装置、データ処理方法及びプログラム |
JP2021068170A Pending JP2022075467A (ja) | 2020-11-04 | 2021-04-14 | データ処理装置、データ処理方法及びプログラム |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020561940A Active JP6870159B1 (ja) | 2020-11-04 | 2020-11-04 | データ処理装置、データ処理方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
JP (2) | JP6870159B1 (ja) |
WO (1) | WO2022097189A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7339708B1 (ja) | 2022-09-29 | 2023-09-06 | 株式会社トランザック | プログラム、事業者情報確認方法及び事業者情報確認システム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4102153B2 (ja) * | 2002-10-09 | 2008-06-18 | 富士通株式会社 | インターネットを利用した文字認識の後処理装置 |
US8345981B2 (en) * | 2009-02-10 | 2013-01-01 | Kofax, Inc. | Systems, methods, and computer program products for determining document validity |
JP6221220B2 (ja) * | 2012-10-12 | 2017-11-01 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
JP2014137791A (ja) * | 2013-01-18 | 2014-07-28 | Fujitsu Ltd | 表示プログラム、表示装置及び表示方法 |
JP2016159245A (ja) * | 2015-03-03 | 2016-09-05 | 株式会社東芝 | 配達物処理装置、および配達物処理プログラム |
-
2020
- 2020-11-04 WO PCT/JP2020/041162 patent/WO2022097189A1/ja active Application Filing
- 2020-11-04 JP JP2020561940A patent/JP6870159B1/ja active Active
-
2021
- 2021-04-14 JP JP2021068170A patent/JP2022075467A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
JPWO2022097189A1 (ja) | 2022-05-12 |
JP6870159B1 (ja) | 2021-05-12 |
WO2022097189A1 (ja) | 2022-05-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11868717B2 (en) | Multi-page document recognition in document capture | |
US7672543B2 (en) | Triggering applications based on a captured text in a mixed media environment | |
US7991778B2 (en) | Triggering actions with captured input in a mixed media environment | |
US7920759B2 (en) | Triggering applications for distributed action execution and use of mixed media recognition as a control input | |
US7769772B2 (en) | Mixed media reality brokerage network with layout-independent recognition | |
US7587412B2 (en) | Mixed media reality brokerage network and methods of use | |
US8064703B2 (en) | Property record document data validation systems and methods | |
US20070047816A1 (en) | User Interface for Mixed Media Reality | |
US20070047008A1 (en) | System and methods for use of voice mail and email in a mixed media environment | |
JP6357621B1 (ja) | 会計処理装置、会計処理システム、会計処理方法及びプログラム | |
JP2008276766A (ja) | フォーム自動埋込方法及び装置 | |
US20140169665A1 (en) | Automated Processing of Documents | |
US20200184267A1 (en) | System to extract information from documents | |
JP2017174309A (ja) | 携帯型情報装置、サーバ装置、データ入力支援システム、およびプログラム | |
JP6253354B2 (ja) | 帳票読取装置、プログラムおよび帳票読取システム | |
JP6870159B1 (ja) | データ処理装置、データ処理方法及びプログラム | |
US12056945B2 (en) | Method and system for extracting information from a document image | |
US20100023517A1 (en) | Method and system for extracting data-points from a data file | |
JP7021496B2 (ja) | 情報処理装置及びプログラム | |
JP7317612B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
US11170211B2 (en) | Information processing apparatus for extracting portions filled with characters from completed document without user intervention and non-transitory computer readable medium | |
JP2022029398A (ja) | データ処理装置、データ処理方法及びデータ処理プログラム | |
TWM584476U (zh) | 轉帳伺服系統 | |
JP2806340B2 (ja) | 帳票管理装置 | |
US11763582B2 (en) | Information processing apparatus, control method of information processing apparatus, and non-transitory storage medium |