WO2022254560A1

WO2022254560A1 - 光学文字認識により生成されるテキストデータを用いたデータマッチング

Info

Publication number: WO2022254560A1
Application number: PCT/JP2021/020762
Authority: WO
Inventors: ファーハンカーン; セルヒオバルブエナ; 佳奈西田
Original assignee: 株式会社KPMG Ignition Tokyo
Priority date: 2021-05-31
Filing date: 2021-05-31
Publication date: 2022-12-08

Abstract

一又は複数のプロセッサは、画像に第１編集処理を行って得られる第１編集済画像に光学文字認識を行うことで第１テキストデータセットを生成する機能と、前記第１テキストデータセットと基準データセットとのマッチングを行うことにより第１マッチングスコアを算出する機能と、前記画像に第２編集処理を行って得られる第２編集済画像に光学文字認識を行うことで第２テキストデータセットを生成する機能と、前記第２テキストデータセットと前記基準データセットとのマッチングを行うことにより第２マッチングスコアを算出する機能と、を実行する。

Description

光学文字認識により生成されるテキストデータを用いたデータマッチング

　本明細書の開示は、光学文字認識により得られるテキストデータを用いたデータマッチングに関する。本明細書のより具体的な開示は、証憑画像に対して光学文字認識を行うことにより得られるテキストデータと会計記録データとのマッチングに関する。

　監査手続では、監査対象の会社の会計処理の適切さを確かめるために証憑突合（Vouching）が行われる。多くの場合、証憑突合は、会計記録とその会計記録に関連する証憑（例えば、納品書や請求書）とを監査人が目視で突合することにより実施されている。取引を記録する会計記録及び各取引の根拠となる証憑の数は、監査対象企業の取引規模が大きくなるほど増加する。このように、証憑突合は手間のかかる作業であるため、技術による効率性の改善が期待される。

　特開２０２０－１８１５４２号公報（特許文献１）には、企業ごとに独自のフォーマットで作成されている会計記録を共通フォーマットに変換してデータベースに格納し、このデータベースに格納された会計記録を照合可能とするシステムが記載されている。特許文献１によれば、当該システムの利用により、監査人が監査対象企業の取引先に証憑を取得する問い合わせをする必要がなくなるとされている。

特開２０２０－１８１５４２号公報

　証憑や会計記録へのアクセスが容易となっても、証憑と会計記録との証憑突合自体に手間がかかる。よって、会計記録や証憑へのアクセス性の改善による監査業務効率化以外に、証憑の写しやその画像データと会計記録との突合についても効率化が求められる。

　本明細書に開示される発明の目的は、従来の証憑突合における問題の少なくとも一部を解決又な緩和することである。本明細書に開示される発明のより具体的な目的の一つは、これまで監査人によって目視で行われている証憑突合の効率を改善することである。

　本明細書に開示される発明の前記以外の目的は、本明細書全体を参照することにより明らかになる。本明細書に開示される発明は、前記の課題に代えて又は前記の課題に加えて、本明細書の記載から把握される課題を解決するものであってもよい。

　本明細書に開示されるいくつかの実施形態は、一又は複数のプロセッサを備え、この一又は複数のプロセッサに、画像に第１編集処理を行って得られる第１編集済画像に光学文字認識を行うことで第１テキストデータセットを生成する機能と、前記第１テキストデータセットと基準データセットとのマッチングを行うことにより第１マッチングスコアを算出する機能と、前記画像に第２編集処理を行って得られる第２編集済画像に光学文字認識を行うことで第２テキストデータセットを生成する機能と、前記第２テキストデータセットと前記基準データセットとのマッチングを行うことにより第２マッチングスコアを算出する機能と、を実行させる。

　本明細書に開示されるいくつかの実施形態において、一又は複数のプロセッサは、前記第１マッチングスコア及び前記第２マッチングスコアに基づいて、前記第１テキストデータセット又は前記第２テキストデータセットのいずれかを適合テキストデータセットとして選択する機能をさらに実行することができる。

　本明細書に開示されるいくつかの実施形態において、第１編集処理及び第２編集処理の一方は、画像から罫線を削除する罫線削除処理と、罫線削除処理済みの画像内の字画を含むテキスト領域を検出するテキスト領域検出処理と、を含み、第１編集処理及び第２編集処理の他方は、画像に含まれる表を認識する表認識処理を含む。

　本明細書に開示されるいくつかの実施形態において、第１編集処理は、第２編集処理が含む編集処理と相反する編集処理を含む。

　本明細書に開示されるいくつかの実施形態において、第１編集済画像は、画像に第１編集処理に加えて第３編集処理を行うことで生成され、記第２編集済画像は、画像に第２編集処理に加えて第３編集処理を行うことで生成される。

　本明細書に開示されるいくつかの実施形態において、第１テキストデータセットは、第１編集済画像に光学文字認識を行って生成された第１仮テキストデータセットに、前記基準データセットに基づいて第１補正処理を行うことにより生成される。

　本明細書に開示されるいくつかの実施形態において、一又は複数のプロセッサは、前記適合データセットに基づいて生成されるマッチング結果を表示させる機能をさらに実行する。本明細書に開示されるいくつかの実施形態において、マッチング結果は、適合テキストデータセットに含まれる第１認識テキスト要素が基準データセットに含まれる第１基準テキスト要素と一致するか否かを示す一致フラグを含む。

　本明細書に開示されるいくつかの実施形態において、マッチング結果においては、第１認識テキスト要素と第１基準テキスト要素とが対応付けられている。

　本明細書に開示されるいくつかの実施形態において、一又は複数のプロセッサは、第１認識テキスト要素が第１基準テキスト要素と一致しない場合に、第１認識テキスト要素を訂正するための訂正入力を受け付ける機能をさらに実行する。

　本明細書に開示されるいくつかの実施形態において、マッチング結果は、画像のビューを含む。画像のビューは、第１認識テキスト要素に対応する第１字画と、第１字画が含まれる第１テキスト領域を画定する第１境界線と、を含んでもよい。

　本明細書に開示されるいくつかの実施形態において、適合テキストデータセットが第１認識テキスト要素と同一の第２認識テキスト要素を含む場合、第１マッチングスコアの算出及び前記第２マッチングスコアの算出は、第１認識テキスト要素を基準データセットに含まれる複数の基準テキスト要素のうち第１認識テキスト要素に割り当てられている第１データ種別と同一のデータ種別が割り当てられている第１基準テキスト要素と比較することで行われる。

　本明細書に開示されるいくつかの実施形態において、適合テキストデータセットの第１認識テキスト要素のデータ種別は、前記複数のデータ要素の各々に付されているタグに基づいて決定される。

　本明細書に開示されるいくつかの実施形態において、適合テキストデータセットの第１認識テキスト要素のデータ種別は、画像において第１認識テキスト要素に対応する第１字画の近傍に配置されているデータ種別字画に基づいて定められる。

　本明細書に開示されるいくつかの実施形態によるシステムは、一又は複数のプロセッサを備え、この一又は複数のプロセッサに、画像に光学文字認識を行うことで、前記画像に含まれる第１テキスト領域に含まれる第１字画に対応する第１テキストデータと、前記画像に含まれる第２テキスト領域に含まれる第２字画に対応する第２テキストデータと、を結合して結合テキストデータを生成する機能と、結合テキストデータと基準データセットに含まれる基準テキスト要素とのマッチングを行う機能と、を備える。

　本明細書に開示されるいくつかの実施形態において、結合テキストデータは、第１テキスト領域と第２テキスト領域との間の距離が基準距離以下の場合に生成される。

　本明細書に開示されるいくつかの実施形態において、結合テキストデータは、第１テキストデータ及び第２テキストデータがいずれも基準データセットに含まれる場合に生成される。

　本明細書に開示されるいくつかの実施形態において、結合テキストデータは、第１テキストデータの末尾に改行コードが検出されない場合に生成される。

　本明細書に開示されるいくつかの実施形態において、テキストデータセットは、画像に含まれる第３テキスト領域に含まれる第３字画に対応する第３テキストデータをさらに含む。一又は複数のプロセッサは、第３テキストデータと第２テキストデータとを結合して他の結合テキストデータを生成する機能をさらに実行することができる。

　本明細書に開示されるいくつかの実施形態において、画像に第３字画が含まれ、第１テキスト領域及び前記第２テキスト領域は、いずれも前記第３字画を含むように設定される。

　本明細書に開示されるいくつかの実施形態において、一又は複数のプロセッサは、第１テキスト領域と第２テキスト領域とを結合させた結合テキスト領域を画定する境界線を重ねた合成画像を表示する機能を実行することができる。

　本明細書に開示されるいくつかの実施形態において、基準データセットは、取引を記録した会計記録データであり、画像は、取引の内容を示す証憑書類を示す証憑画像である。

　本明細書に開示されるいくつかの実施形態において、会計記録データは、第１会計記録データセットと第２会計記録データセットとを含み、証憑画像は、第１会計記録データセット及び第２会計記録データセットにそれぞれ対応付けられる。

　本明細書に開示されるいくつかの実施形態において、選択する機能は、前記会計記録データに含まれる前記複数の取引のそれぞれについて算出された前記画像の前記第１マッチングスコア及び前記第２マッチングスコアのうち最大のスコアを与える取引を前記画像に対応する取引として特定し、かつ、当該最大のスコアを与えた方のマッチングスコアに対応するテキストデータセットを当該取引に対応する適合テキストデータセットとして選択する機能を含む。

　本明細書に開示されるいくつかの実施形態によるプログラムは、一又は複数のプロセッサに、画像に第１編集処理を行って得られる第１編集済画像に光学文字認識を行うことで第１テキストデータセットを生成する機能と、前記第１テキストデータセットと前記画像に関連する基準データセットとのマッチングを行うことにより第１マッチングスコアを算出する機能と、前記画像に第２編集処理を行って得られる第２編集済画像に光学文字認識を行うことで第２テキストデータセットを生成する機能と、前記第２テキストデータセットと前記基準データセットとのマッチングを行うことにより第２マッチングスコアを算出する機能と、を実行させる。

　本明細書に開示されるいくつかの実施形態による方法は、一又は複数のコンピュータプロセッサがコンピュータ読み取り可能な命令を実行することにより実行される方法であって、画像に第１編集処理を行って得られる第１編集済画像に光学文字認識を行うことで第１テキストデータセットを生成する工程と、前記第１テキストデータセットと前記画像に関連する基準データセットとのマッチングを行うことにより第１マッチングスコアを算出する工程と、前記画像に第２編集処理を行って得られる第２編集済画像に光学文字認識を行うことで第２テキストデータセットを生成する工程と、前記第２テキストデータセットと前記基準データセットとのマッチングを行うことにより第２マッチングスコアを算出する工程と、を備える。

　本明細書に開示されるいくつかの実施形態によれば、証憑突合の効率を改善することができる。

本明細書に開示される幾つかの実施形態におけるマッチング処理の概略を示す説明図である。本明細書に開示される幾つかの実施形態における監査支援用途に適用されるマッチング処理の概略を示す説明図である。基準データセットの取引ごとに算出されたマッチングスコアのデータ構造の一例を示すデータ構造図である。基準データセットの取引ごとに算出されたマッチングスコアのデータ構造の一例を示すデータ構造図である。本明細書に開示される幾つかの実施形態が適用される監査支援システムを示すブロック図である。本明細書に開示される幾つかの実施形態に従って実行されるマッチング処理の流れを示すフロー図である。図４における補正処理におけるより詳細な処理の流れを示すフロー図である。図３の監査支援システムにおいて用いられる証憑画像の例を示す。図３の監査支援システムにおいて生成されるマッチング結果をリスト形式で表したマッチング結果リストの例を示す。図３の監査支援システムにおいてディスプレイに表示されるマッチング結果のビューの例を示す。本明細書に開示される幾つかの実施形態における監査支援用途に適用されるマッチング処理の概略を示す説明図である。本明細書に開示される幾つかの実施形態における監査支援システムにおいて用いられる注釈付き証憑画像の例を示す。本明細書に開示される幾つかの実施形態における監査支援システムにおいて用いられるテキストデータ要素のデータ構造の例を示す。本明細書に開示される幾つかの実施形態が適用される監査支援システムの別の実施形態を概略的に示すブロック図である。図１２の監査支援システムにおいて用いられる証憑画像の例を示す。２つのテキスト領域の結合の一例について説明する図である。複数のテキスト領域の結合の例について説明する図である。２つのテキスト領域の結合のさらに別の例について説明する図である。２つのテキスト領域の結合のさらに別の例について説明する図である。複数のテキスト領域の結合のさらに別の例について説明する図である。２つのテキスト領域の結合のさらに別の例について説明する図である。２つのテキスト領域の設定方法の例について説明する図である。

　以下、適宜図面を参照し、本明細書に開示される発明が適用されるシステムの実施形態について説明する。各図面に示される同一または同等の構成要素、部材、処理には、同一の符号を付するものとし、重複した説明は適宜省略する。以下で説明される本発明の実施形態は特許請求の範囲にかかる発明を限定するものではない。以下の実施形態で説明されている諸要素が発明の解決手段に必須であるとは限らない。

　まず、図１ａ及び図１ｂを参照して、本明細書に開示される発明の実施形態の概略を説明する。本明細書に開示される発明は、画像Ｖ１にＯＣＲを行って得られるテキストデータセットと基準データセットＬ１とのマッチング処理を行うことにより、画像Ｖ１に含まれている情報と基準データセットＬ１に含まれるデータとの整合性の確認作業の効率化を支援する。基準データセットＬ１の例は、会計記録データであり、画像Ｖ１の例は、基準データセットに記録されている取引の根拠となる証憑（Voucher）の画像である。監査手続においては、会計記録データとその会計記録データに含まれる取引記録の根拠となる証憑に記載されている内容との整合性を確認するために、証憑突合と呼ばれる手続が行われる。従来は、会計記録データと証憑に記載されている取引の内容の整合性の確認は、監査人が目視で行っている。本明細書に開示されている実施形態により、証憑の画像Ｖ１にＯＣＲを行って得られるテキストデータセットと会計記録データである基準データセットＬ１とのマッチングを行って、そのマッチング結果を監査人に提供することにより、監査人は、そのマッチング結果を参照して、取引記録データと証憑の内容との整合性の確認をより効率的に行うことができる。

　図１ｂに示されているように、一つの基準データセットＬ１（会計記録データ）には、多数の取引レコードが含まれていても良く、この取引レコードの各々の根拠となる複数の証憑の画像が一つの基準データセットＬ１と関連付けられ得る。図１ｂの例では、基準データセットＬ１に取引ＩＤで識別される３つのレコードが含まれており、そのレコードの各々が証憑画像Ｖ１～Ｖ３にそれぞれ関連付けられている。記載の簡潔さのために、レコードが３つのみ記載されているが、企業における取引の数は膨大であり、この膨大な数の取引の会計記録を含む基準データセットＬ１とその各々の取引に関連する証憑の内容との整合性の確認は手間のかかる作業である。

　監査人が会計記録データと証憑の画像Ｖ１にＯＣＲを行って得られるテキストデータセットとをマッチングして得られるマッチング結果に基づいて証憑突合を効率的に行うためには、画像Ｖ１に対するＯＣＲの認識精度の向上が求められる。元の（未加工の）画像にＯＣＲを行うと必ずしも十分な認識精度が得られないため、元の画像にそのままＯＣＲを行うのではなく、元の画像に認識精度を向上させるための編集処理（前処理（Preprocessing）ともいう）を行ってから、その編集処理が行われた編集済画像にＯＣＲを行うことが試みられている。例えば、画像に含まれる字画が上下反転している場合に、その画像を１８０°回転させる補正をした後の画像に対してＯＣＲを行うことで認識精度が向上する。

　しかしながら、画像に含まれる字画のレイアウト、表の有無、表の構成などの認識精度に影響を与える要素は、画像ごとに異なっているため、このような様々な画像について認識精度の向上のために汎用的な編集処理を見いだすことは困難である。例えば、一部の画像に対しては、表を構成する罫線の削除により認識精度が向上するが、他の画像に対しては罫線の削除は認識精度の向上のために有効ではないこともある。

　特に、会計処理で用いられる証憑には、請求書、納品書、注文書、領収書、見積書といった多様な書類が含まれるため、そのレイアウトも区々である。また、同じ種類の書類であっても、その書類の作成主体によってレイアウトは異なる。例えば、Ａ社が発行する請求書は、Ｂ社が発行する請求書と異なるレイアウトを有する。このように様々なレイアウトを有する複数の書類の画像にＯＣＲを行うことが想定される場合、いずれの画像の認識精度の向上にも有効な汎用的な編集処理を見いだすことは困難であるし、書類の種類に応じて個別に編集処理を定めることも書類の多様性から困難である。

　そこで、本明細書に開示される幾つかの実施形態においては、画像に複数種類の編集処理を行って複数の編集済画像を生成する。そして、この複数の編集済画像の各々に対してＯＣＲを行って複数のテキストデータセットを生成し、この複数のテキストデータセットの各々と基準データセットとのマッチングをそれぞれ行うことで、各テキストデータセットの信頼度（マッチングスコア）を算出する。このため、複数のテキストデータセットの中から高いマッチングスコアを獲得したテキストデータセットをマッチング結果として採用することで、より高い認識精度を有するテキストデータセットを得ることができる。そして、監査人は、高い認識精度を有する画像Ｖ１のテキストデータセットと基準データセットＬ１とのマッチング結果に基づいて、画像Ｖ１の内容と基準データセットＬ１との整合性の確認をより効率的に行うことができる。以上の手法は、様々なレイアウトを有する画像Ｖ１～Ｖ３と基準データセットＬ１との整合性の確認するためにも有用である。

　図１ａ及び図１ｂに基づいて、本明細書に開示されるいくつかの実施形態の概略をさらに説明する。これらの図に記載されている実施形態では、画像Ｖ１にＯＣＲを行って得られるテキストデータセットと基準データセットＬ１とのマッチング処理を行うことにより、画像Ｖ１の内容と、この画像Ｖ１に関連付けられている基準データセットＬ１に含まれるデータとの整合性の確認作業の効率化を支援する。上記のとおり、基準データセットＬ１として会計記録データを用い、画像Ｖ１として基準データセットＬ１に記録されている取引の根拠となる証憑（Voucher）の画像を用いることにより、本明細書に開示されるいくつかの実施形態は、監査手続における証憑突合を効率化することができる。

　図１ａに示されているように、本明細書に開示される幾つかの実施形態においては、画像Ｖ１に第１編集処理を行うことにより第１編集済画像Ｅ１が生成され、画像Ｓ２に第２編集処理を行うことにより第２編集済画像Ｅ２が生成される。そして、第１編集済画像Ｅ１にＯＣＲを行うことにより第１テキストデータセットＴ１が生成され、第２編集済画像Ｅ２にＯＣＲを行うことにより第２テキストデータセットＴ２が生成される。第１編集処理は、第２編集処理とは異なる処理である。第１編集済画像Ｅ１に行われるＯＣＲと第２編集済画像Ｅ２に行われるＯＣＲとは同じ処理であってもよく、例えば同じＯＣＲエンジンにより実行されてもよい。

　次に、第１テキストデータセットＴ１と基準データセットＬ１とのマッチングを行うことにより、第１テキストデータセットＴ１の信頼度を示す第１マッチングスコアが算出される。同様に、第２テキストデータセットＴ２と基準データセットＬ１とのマッチングを行うことにより、第２テキストデータセットの信頼度を示す第２マッチングスコアが算出される。基準データセットＬ１が複数のデータ単位（例えば、各々が個別の取引の会計記録を示すレコード）を含む場合、データ単位ごとに第１マッチングスコアと第２マッチングスコアとが算出される。

　このようにして算出された第１マッチングスコアと第２マッチングスコアとを比較し、第１テキストデータセットＴ１及び第２テキストデータセットＴ２のうち高いスコアを有する方のテキストデータセットと基準データセットＬ１に含まれるデータ単位とのマッチング結果を利用することにより、高い認識精度を有する画像Ｖ１のテキストデータセットと基準データセットＬ１とのマッチング結果に基づいて、画像Ｖ１の内容と基準データセットＬ１との整合性を効率良く確認することができる。このように、事前に第１編集処理及び第２編集処理の認識精度に対する影響が分からなくとも、第１編集処理及び第２編集処理のうち認識精度の改善への寄与が相対的に大きい編集処理がなされた編集済画像に基づいて生成されたテキストデータセットを利用することができる。

　図１ｂの例では、ユーザは、基準データセットＬ１と証憑画像Ｖ１～Ｖ３とをまとめてシステム（例えば、後述する監査支援システム１）にアップロードすることができる。その際に、基準データセットＬ１に含まれる３つの取引データのどれがどの証憑画像に対応するかを指定する必要はない。監査支援システム１は、上記のプロセスに従って、アップロードされた証憑画像の各々について基準データセットＬ１に含まれるデータ単位ことに（例えば、個々の取引ごとに）マッチングスコアを算出することができる。このようにして証憑画像の各々について基準データセットＬ１のデータ単位で算出されたマッチングスコアは、監査支援システム１において、例えば図２ａに示されるデータ構造で記憶される。図２ａは、基準データセットＬ１に含まれるデータ単位ごとに算出されたマッチングスコアのデータ構造の一例を示す。監査支援システム１は、基準データセットＬ１に含まれるどの取引がどの証憑画像に対応するかを判定するため、取引と証憑画像とをいわゆる総当たりでマッチングし、取引と証憑画像のペアごとにマッチングスコアを算出することで、マッチングスコアの高い対応関係を有するペアを特定することができる。図２ａの例では、取引ＩＤ「１」の取引に注目すると、証憑画像Ｖ１の第２マッチングスコアが「０．９」で最大であることから、監査支援システム１は、取引ＩＤ「１」の取引に対応する証憑画像は証憑画像Ｖ１であると決定することができる。また、証憑画像Ｖ１の第１マッチングスコアと第２マッチングスコアとを比較すると第２マッチングスコアの方が大きいため、証憑画像Ｖ１の２つのテキストデータセットのうち突合において使用すべきテキストデータセットは第２テキストデータセットであると決定することができる。同様の判断ロジックで、取引ＩＤ「２」の取引に対応する証憑画像は、証憑画像Ｖ２であると決定され、取引ＩＤ「３」の取引に対応する証憑画像は、証憑画像Ｖ３であると決定される。

　本明細書に開示される幾つかの実施形態においては、元の画像に対して第１編集処理及び第２編集処理だけでなく、３種類以上の互いに異なる編集処理を行い、その編集処理が行われた３以上の編集済画像の各々に対してＯＣＲを行って３以上のテキストデータセットを生成し、この３以上のテキストデータセットの各々と基準データセットとのマッチングを行ってもよい。元の画像に対して行う画像処理の種類を増やすことにより、より優れた認識精度を有するテキストデータセットを利用することができるようになる。

　次に、図３から図８を参照して、本明細書において開示される幾つかの実施形態が適用可能な監査支援システム１について説明する。図３に示されているように、監査支援システム１は、ユーザ装置１０と、証憑にＯＣＲを行って得られるテキストデータセットを利用して証憑突合の効率化を支援する監査支援装置２０と、を備える。ユーザ装置１０及び監査支援装置２０は、ネットワーク４０を介して互いとデータを送受信することができる。監査支援システム１は、ユーザ装置１０及び監査支援装置２０以外の装置を備えてもよい。例えば、監査支援システム１は、ユーザ装置１０又は監査支援装置２０によって実行されるべき処理を分散して処理するためのクラウド環境を備えていてもよい。

　監査支援システム１は、本明細書に開示される発明を適用可能なシステムの例である。本明細書に開示される発明のいくつかの実施形態は、証憑突合に適用できることは既に述べた通りであるが、証憑突合以外に画像にＯＣＲを行って得られるテキストデータを当該画像に関連付けられた他のデータとマッチングする用途に広く適用することができる。

　監査支援装置２０は、プロセッサ２１、メモリ２２、ユーザインタフェース２３、通信インタフェース２４、及びストレージ２５を備えている。

　プロセッサ２１は、ストレージ２５又はそれ以外のストレージからオペレーティングシステムやそれ以外の様々なプログラムをメモリ２２にロードし、ロードしたプログラムに含まれる命令を実行する演算装置である。プロセッサ２１は、例えば、ＣＰＵ、ＭＰＵ、ＤＳＰ、ＧＰＵ、これら以外の各種演算装置、又はこれらの組み合わせである。プロセッサ２１は、ＡＳＩＣ、ＰＬＤ、ＦＰＧＡ、ＭＣＵ等の集積回路により実現されてもよい。

　メモリ２２は、プロセッサ２１が実行する命令及びそれ以外の各種データを格納するために用いられる。メモリ２２は、プロセッサ２１が高速にアクセス可能な主記憶装置（メインメモリ）である。メモリ２２は、例えば、ＤＲＡＭやＳＲＡＭ等のＲＡＭによって構成される。

　ユーザインタフェース２３は、ユーザの入力を受け付ける入力インタフェースと、プロセッサ２１の制御により様々な情報を出力する出力インタフェースと、を備える。入力インタフェースは、例えば、音を電気信号に変換するマイクロフォンを含む。入力インタフェースは、キーボード、マウス等のポインティングデバイス、タッチパネル、又は前記以外のユーザの入力を入力可能な任意の情報入力装置である。出力インタフェースは、例えば、液晶ディスプレイ、表示パネル、又は前記以外のプロセッサ２１の演算結果を出力可能な任意の情報出力装置である。

　通信インタフェース２４は、ハードウェア、ファームウェア、又はＴＣＰ／ＩＰドライバやＰＰＰドライバ等の通信用ソフトウェア又はこれらの組み合わせとして実装される。監査支援装置２０は、通信インタフェース２４を介して、ユーザ装置１０を含む他の情報機器とデータを送受信することができる。

　ストレージ２５は、プロセッサ２１によりアクセスされる外部記憶装置である。ストレージ２５は、例えば、磁気ディスク、光ディスク、半導体メモリ、又はデータを記憶可能な前記以外の各種記憶装置である。

　ユーザ装置１０は、パーソナルコンピュータ（ＰＣ）、タブレット端末、スマートフォン、またはこれら以外の各種情報処理装置である。ユーザ装置１０は、デスクトップＰＣ、ラップトップＰＣ、スマートフォン、又はこれら以外の情報処理装置である。ユーザ装置１０は、不図示のプロセッサ、メモリ、ユーザインタフェース、通信インタフェース、及びストレージ（いずれも不図示）を備えることができる。ユーザ装置１０のユーザとしては、監査人又はその補助者が想定されている。監査人は、ユーザ装置１０を介して、監査支援装置２０により生成される証憑画像と会計記録データとのマッチング結果を利用することができ、このマッチング結果を利用して証憑突合を効率良く行うことができる。

　続いて、監査支援装置２０の機能及び監査支援装置２０に記憶されるデータについて説明する。監査支援装置２０は、ストレージ２５に格納されているプログラムに含まれる命令及び必要に応じてそれ以外の命令を実行することにより、データ取得部２１ａ、文字認識部２１ｂ、補正処理部２１ｃ、マッチング部２１ｄ、出力部２１ｅ、入力受付部２１ｆとして機能する。

　ストレージ２５には、証憑画像２５ａ、会計記録データ２５ｂ、マッチング結果リスト２５ｄ、注釈付き画像２５ｅ、及びこれら以外のデータが記憶され得る。また、ストレージ２５は、マッチング部２１ｄにより算出されるマッチングスコアを格納するマッチングスコア領域２５ｃを含むことができる。

　データ取得部２１ａは、ユーザ端末１０又はそれ以外の装置又は媒体から証憑突合に使用する証憑の画像及び会計記録データを取得する。証憑の画像及び会計記録データは、監査対象の企業及び当該企業の取引先から取得することができる。証憑には、注文書、納品書、請求書、領収書、見積書、及びこれら以外の取引内容や取引条件が記載された様々な書類が含まれ得る。会計記録データは、企業の取引を記録した台帳（ledger）を構成するデータセットである。台帳は、例えば、会計帳簿である。会計帳簿には、仕訳帳、金銭出納帳、売掛金元帳、買掛金元帳、及びこれら以外の会計実務で用いられる各種の帳簿が含まれ得る。

　データ取得部２１ａは、取得した証憑の画像を証憑画像２５ａとしてストレージ２５に保存することができる。証憑画像２５ａは、証憑画像２５ａを識別する証憑ＩＤと対応付けてストレージ２５に保存されてもよい。証憑画像２５ａは、構造の定義を有していない非構造化文書（Unstructured Document）であり、ＰＤＦ形式で保存されてもよい。証憑画像２５ａは、証憑突合のために必要な数の証憑の画像を含むことができる。図６に証憑画像２５ａの一例である証憑画像２５ａ１を示す。証憑画像２５ａ１は、請求書の画像であり、具体的には、「Ｘ株式会社」から「株式会社Alpha」へ「PD0321-1101」という商品の販売代金として合計２２５０９００円を請求する請求書の画像である。以下では、証憑画像２５ａに含まれる画像に関する説明を行う場合には、証憑画像２５ａ１を例に取って説明を行う。証憑画像２５ａ１に関する説明は、証憑画像２５ａとして記録されている他の証憑画像にも同様に当てはまり得る。

　会計記録データ２５ｂは、証憑突合において証憑画像２５ａ１に対応する証憑と付き合わされる会計記録を表す様々なデータを含むデータセットである。会計記録データ２５ｂは、例えば、取引の台帳を構成するデータを含むデータセットである。会計記録データ２５ｂは、図１ａ及び図１ｂに示されている基準データセットＬ１の一例である。会計記録データ２５ｂは、各々が取引の内容（例えば、取引先、商品名、価格）を示すテキストデータを含む。これらの取引内容を示すテキストデータは、複数のフィールドに分けたデータ形式を有していてもよい。会計記録データ２５ｂは、表計算ソフトが使用可能なデータ形式、例えばＣＳＶ形式で保存されてもよい。会計記録データ２５ｂの一つのレコードが一つの取引に対応していてもよい。会計記録データ２５ｂの各レコードは、複数のフィールドに分割されていてもよく、この複数のフィールドの各々に取引の内容を示すテキストデータが格納され得る。会計記録データ２５ｂのレコードは、企業が行う多数の取引の中の一つの取引に対応する。データ取得部２１aは、会計記録データ２５ｂと複数の証憑画像とを取得するが、その際に会計記録データ２５ｂに含まれる複数の取引データのうちどの取引データが複数の証憑画像のうちのどの証憑画像に対応するかを関連付ける情報を取得する必要はない。言い換えると、ユーザは、会計記録データ２５ｂに含まれる複数の取引データと複数の証憑画像との関連付けの調査や指定を行う必要がないので、監査支援システム１により証憑突合の効率性が向上する。監査支援装置２０は、会計記録データ２５ｂの各レコードについて、当該レコードを、対応する取引の根拠となる証憑画像に関連付けることができる。例えば、会計記録データ２５ｂに含まれる複数のレコードのうちの一つが、証憑画像２５ａ１と関連付けられてもよい。監査支援装置２０は、会計記録データ２５ｂに含まれる複数のレコードのうち証憑画像２５ａ１が対応する取引と対応するレコードに証憑画像２５ａ１の証憑ＩＤを対応付けて記憶することで、会計記録データ２５ｂのレコードと証憑画像２５ａ１とを関連付けてもよい。この関連付け情報は、監査支援装置２０がユーザに提供する出力の一つであってもよい。

　証憑画像２５ａ１の証憑ＩＤは、会計記録データ２５ｂに含まれる複数のレコードのうちの２以上のレコードと関連付けられてもよい。証憑は、２以上の取引の内容を示すことがあるので、かかる場合には、一つの証憑ＩＤが会計記録データ２５ｂの２つ以上のレコードと関連付けられる。例えば、２つの商品（例えば、商品Ａと商品Ｂ）の請求を１通の請求書で行う場合があり、かかる場合には、１通の証憑（請求書）によって２つの商品に関する別個の取引内容が示されている。また、開発を請け負った情報処理システムを納品する場合の納品書や請求書には、当該情報処理システムを構成するハードウェアの取引及びソフトウェアの取引という別個の取引の内容が含まれる。このような場合に、会計記録データ２５ｂの２つ以上のレコードに１つの証憑ＩＤが関連付けられる。１つの証憑ＩＤと会計記録データ２５ｂの２つ以上のレコードとの関連付けについて、図２ｂを参照して具体的に説明する。図２ｂは、会計記録データ２５ｂに含まれるデータ単位（レコード）ごとに算出されたマッチングスコアのデータ構造の一例を示している。監査支援装置２０では、まずデータ取得部２１ａによって、取引ＩＤ「４」～「７」で識別される４つの取引データと３つの証憑画像Ｖ４～Ｖ６が取得される。監査支援装置２０では、取得した会計記録データに含まれる取引データの数（４つ：取引ＩＤ４～７）と証憑画像Ｖ４～Ｖ６の数とが一致しないことから、２つ以上の取引に一つの証憑画像が対応づけられるべきであると判定する。次に監査支援装置２０は、図２ａに基づいて説明した手法と同様にして各取引ＩＤで識別される取引と証憑画像との対応関係を決定する。図２ｂの場合、取引ＩＤ「４」及び取引ＩＤ「７」の両方について、証憑画像Ｖ４とのマッチングスコアが他の証憑画像とのマッチングスコアよりも大きいため、証憑画像Ｖ４は、取引ＩＤ「４」および取引ＩＤ「７」の両方に対応すると決定される。仮に取引データの数と証憑画像の数とが一致していたならば、この結果は否定され、各取引ＩＤと証憑画像とは１対１に対応付けられる。しかしながら、取得した会計記録データに含まれる取引の数（レコード数）と取得した証憑画像の数とが一致しない場合には、１つの証憑画像と２つ以上の取引との関連付けは許容される。よって、図２ｂの例では、監査支援装置２０は、会計記録データに含まれるの取引ＩＤ「４」および取引ＩＤ「７」で識別される２つの取引に１つの証憑画像Ｖ４を対応付けることができる。

　以下の説明において、会計記録データ２５ｂは、「株式会社Ｘ」の取引記録を表すデータセットであることが想定される。よって、証憑画像２５ａは、株式会社Ｘとその取引先との取引内容を示す書類である。図６に示されている証憑画像２５ａ１に記載されている（株）Alphaは、株式会社Ｘの取引先であることが想定されている。

　会計記録データ２５ｂに含まれるテキストデータは、会計記録に誤りや改ざんがない限り、証憑画像２５ａに対してＯＣＲを行うことで得られるテキストデータセットの信頼度を算出する際の基準（正解データ）となるため、本明細書において会計記録データ２５ｂに含まれるテキストデータの各々を「基準テキスト要素」と呼ぶことがある。また、会計記録データ２５ｂの一つのレコードに含まれている基準テキスト要素の組を「基準テキストセット」と呼ぶことがある。つまり、基準テキスト要素は、基準テキストセットの構成要素である。会計業務において会計記録として記録される様々なデータが基準テキスト要素となり得る。例えば、図１ｂに示されている基準データセットＬ１に含まれる「販売日」、「販売額」、及び「販売先」として格納されているデータの各々が基準テキスト要素の例である。

　文字認識部２１ｂは、証憑画像２５ａ１に複数種類の編集処理を行って複数の編集済画像を生成し、その複数の編集済画像の各々に対して光学文字認識（ＯＣＲ）を行うことができる。図１ａを参照して説明したように、証憑画像２５ａ１に対しては３種類以上の互いに異なる編集処理を行うことができるが、以下では、説明の簡潔さのために、証憑画像２５ａ１に対して２種類の互いに異なる編集処理、つまり、第１編集処理及び第２編集処理が行われる実施形態について説明する。第２編集処理は、第１編集処理と同じ画像に対する編集処理であるが第１編集処理とは異なる編集処理である。文字認識部２１ｂは、証憑画像２５ａ１に対して第１編集処理を行うことにより第１編集済画像を生成し、証憑画像２５ａ１に対し第１編集処理と異なる第２編集処理を行うことにより第２編集済画像を生成することができる。文字認識部２１ｂが証憑画像２５ａ１に対して行う編集処理には、証憑画像２５ａ１に対するＯＣＲの認識精度を向上させるための様々な処理が含まれ得る。証憑画像２５ａ１に対して３種類以上の編集処理が行われる場合には、２種類の編集処理に関する説明を、３種類目以降の編集処理にも適用することができる。

　ＯＣＲによる認識精度を向上させるための編集処理の具体例について説明する。ＯＣＲによる認識精度を向上させるための編集処理には、画像を９０°、１８０°、又は２７０°だけ回転させる回転処理が含まれ得る。証憑画像２５ａ１が上下反転している場合には、証憑画像２５ａ１を１８０°回転させる回転処理を行うことによりＯＣＲによる認識精度の向上が期待される。証憑をスキャナで取り込む際に、証憑が正しい姿勢から９０°だけ時計回り又は反時計回りに回転した姿勢で読み込まれることがある。このように正しい姿勢から回転した姿勢で読み込まれた証憑画像２５ａ１に対して９０°だけ時計回り又は反時計回りに回転させる回転処理を行うことにより、同様にＯＣＲによる認識精度の向上が期待される。

　ＯＣＲによる認識精度を向上させるための編集処理の別の例として、画像から罫線を削除する罫線削除処理がある。証憑画像２５ａ１から罫線を削除することにより、ＯＣＲを行う際に罫線をテキストの一部と誤認することが防止できるので、罫線削除処理がなされた画像に対してＯＣＲを行うと未加工の画像にＯＣＲを行う場合よりも認識精度が向上することがある。証憑画像２５ａ１は、「摘要」という文字の下方に表を含んでいる。文字認識部２１ｂは、例えば、証憑画像２５ａ１に含まれる表の縦方向の罫線及び横方向の罫線の少なくとも一部を削除する罫線削除処理を行うことができる。

　また、ＯＣＲによる認識精度を向上させるための編集処理には、画像に含まれる表及びその表内のセルを検出する表検出処理が含まれ得る。表やセルを検出することにより、表内又はセル内に記入されているひとまとまりのテキストの認識精度が向上することがある。文字認識部２１ｂは、例えば、証憑画像２５ａ１の「摘要」の下方にある表及びそのセルを検出する表検出処理を行うことができる。

　また、ＯＣＲによる認識精度を向上させるための編集処理には、画像内の字画（Characters）を含むテキスト領域を検出するテキスト領域検出処理を行うことができる。画像内に含まれる複数の字画をまとまりのある単位ごとにテキスト領域として検出することで、認識精度が向上することがある。テキスト領域検出処理には、画像に対するレイアウト解析が含まれ得る。文字認識部２１ｂは、例えば、証憑画像２５ａ１に含まれる「（株）Alpha」を含む領域を矩形の境界ボックスで囲むことにより、その境界ボックスの内側を一つのテキスト領域とすることができる。文字認識部２１ｂは、証憑画像２５ａ１に複数のテキスト領域を設定することができる。

　上述した編集処理はあくまで例示であり、本明細書に開示される発明に適用可能な編集処理は上記の処理には限られない。例えば、証憑画像２５ａ１に適用可能な編集処理として、バイナリ画像への変換、グレースケール化、色の変更、及びこれら以外の公知の処理が含まれ得る。本明細書に開示される発明に適用可能な編集処理は、本明細書において明記されたものには限定されない。

　上記の通り、証憑画像２５ａ１に対して行われる第１編集処理は、証憑画像２５ａ１に対して行われる第２編集処理と異なっている。第１編集処理は、上記の又は上記以外の様々な編集処理のうちの一又は複数を含むことができる。同様に、第２編集処理は、上記の又は上記以外の様々な編集処理のうちの一又は複数を含むことができる。第１編集処理と第２編集処理とは、共通する編集処理を含んでいても良い。第１編集処理と第２編集処理とが共通する編集処理を含む場合には、第１編集処理及び第２編集処理の少なくとも一方は、その共通する編集処理以外に他方と異なる編集処理を含む。例えば、第１編集処理が罫線削除処理と、罫線削除処理済みの画像に対するテキスト領域検出処理と、を含み第２編集処理が表検出処理とテキスト領域検出処理を含む場合には、テキスト領域検出処理は、第１編集処理及び第２編集処理のいずれにも含まれているが、第１編集処理には第２編集処理に含まれていない罫線削除処理が含まれているので、第１編集処理と第２編集処理とは異なる編集処理となる。また、罫線を消してしまうと表検出は不可能となることから、罫線削除処理と表検出処理とは相反する編集処理の例である。このように、第１編集処理と第２編集処理とに互いに相反する２つの編集処理の一方、他方をそれぞれ含ませることで、処理態様の豊富化による文字検出精度の向上を図ることができる。表検出機能は、様々な表レイアウトに対して同等のパフォーマンスを発揮するとは限らない。表検出機能は、一部の表形式を高精度で検出することができる一方で、別の表形式を高精度で検出できないことがある。高精度で検出できないレイアウトの表を含む証憑画像に対しては、表検出機能を含む第２編集処理を行うと、ＯＣＲによる認識精度が十分に向上せず、したがってマッチングスコアが低く算出される可能性がある。この低いマッチングスコアを有するテキストデータセットしか得られないと、本来得られるべき証憑画像と取引との正しい対応関係を検出することができなくなる虞がある。この場合でも、表の罫線を削除してテキストとして検出する第１編集処理を行うことによりＯＣＲによる認識精度を向上させることができ、したがってより高いマッチングスコアを有するテキストデータセットを得ることができる可能性がある。このように、互いに相反する２つの編集処理（上記の例では、罫線削除処理と表検出処理）を証憑画像に対して行い、その編集処理済の画像の各々にＯＣＲを行うことで、より高いマッチングスコアを有するテキストデータセットを生成することができ、その結果、会計記録データ２５ｂに含まれる取引と証憑画像との対応付けの精度を高めることができる。

　証憑画像２５ａ１への編集処理のうち、回転処理は、証憑画像２５ａ１に含まれる字画、レイアウト、表の有無とは無関係に認識精度の向上に寄与すると考えられる。本明細書においては、証憑画像２５ａ１の内容（例えば、字画、レイアウト、表の有無）によらず汎用的に認識精度の向上に寄与する処理を、汎用編集処理と呼ぶことがある。証憑画像２５ａ１が上下反転している場合や左右に９０°倒れている場合に行われる９０°単位での回転処理が汎用編集処理の例である。

　文字認識部２１ｂは、上記のように証憑画像２５ａ１に対して第１編集処理を行って生成された第１編集済画像及び証憑画像２５ａ１に対して第２編集処理を行って生成された第２編集済画像の各々に対してＯＣＲを行うことができる。以下では、説明の簡略化のために第１編集済画像に対するＯＣＲについて説明するが、第１編集済画像に対する処理の説明は、第２編集済画像に対する処理にも適用することができる。第１編集済画像に対してＯＣＲを行う場合には、文字認識部２１ｂは、第１編集済画像においてテキスト領域を識別し、このテキスト領域ごとに文字認識を行うことで、テキスト領域の各々に含まれる字画をテキストデータに変換する。テキスト領域が設定された第１編集済画像及び第２編集済画像の少なくとも一方は、注釈付き画像２５ｅとしてストレージ２５に記憶されてもよい。注釈付き画像２５ｅは、後述するマッチング結果の出力において利用され得る。

　本明細書においては、証憑画像２５ａ１から生成された第１編集済画像のテキスト領域の各々に含まれる字画から識別されたテキストの組を第１テキストデータセットといい、各テキスト領域に含まれる字画を文字識別して得られたテキストを第１テキストデータセットの「認識テキスト要素」という。同様に、証憑画像２５ａ１から生成された第２編集済画像のテキスト領域の各々に含まれる字画から識別されたテキストの組を第２テキストデータセットといい、各テキスト領域に含まれる識別されたテキストを第２テキストデータセットの「認識テキスト要素」という。

　第１編集済画像の各テキスト領域における文字認識は、常法に従って行われてもよい。例えば、テキスト領域に含まれる字画が正規化され、次に正規化された字画について特徴量が抽出される。そして、抽出された字画の特徴量が文字や数字等の標準パターンとマッチングされ、字画の特徴量と一致度が最も高い標準パターンがその字画の認識結果として出力される。例えば、図６の例においては、表内の各セルがテキスト領域として設定され、セル内に記載されている「ＰＤ０３２１－１１０１」、「５，００２」等を認識することで得られるテキストが認識テキスト要素として出力される。表中の「商品名」の欄に含まれるセルに関しては、誤認識がなければ、表示されている「ＰＤ０３２１－１１０１」が認識テキスト要素として出力される。他方、先頭の「Ｐ」が「Ｄ」と誤認識されると、正しい「ＰＤ０３２１－１１０１」ではなく「ＤＤ０３２１－１１０１」が認識テキスト要素として出力される。文字認識部２１ｂは、証憑画像２５ａ１に含まれる複数のテキスト領域の全てについて文字認識を行ってもよいし、複数のテキスト領域のうち基準テキスト要素との比較に用いられることが想定される字画が含まれるテキスト領域についてのみ文字認識を行ってもよい。各テキスト領域の認識結果とともに、その認識結果の認識の信頼性（confidence）が出力されてもよい。上記のとおり、各テキスト領域における文字認識には誤認識の可能性がある。認識結果とともに出力される信頼性は、例えば、０～１の間の数値で表され、その数値によって出力された認識テキスト要素がどの程度信頼できるかを表すことができる。例えば、信頼性の数値が「１」に近いほど認識結果の信頼性が高い（誤っている可能性が低い）ことを意味してもよい。

　以上のようにして、文字認識部２１ｂは、第１編集済画像に対してＯＣＲを行うことにより第１テキストデータセットを生成し、第２編集済画像に対してＯＣＲを行うことにより第２テキストデータセットを生成することができる。第１編集済画像及び第２編集済画像に対するＯＣＲは、一般に利用可能なＯＣＲエンジンを利用して行うことができる。ＯＣＲエンジンとして、例えば、フリーソフトウェアとして提供されているTesseractを用いることができる。Tesseractは、認識したテキストごとに、上述した信頼性（confidence）を出力することができる。

　補正処理部２１ｃは、第１テキストデータセット及び第２テキストデータセットの認識テキスト要素の信頼性に応じて認識テキスト要素を補正することができる。補正処理部２１ｃは、第１テキストデータセット及び第２テキストデータセットに含まれる認識テキスト要素の中から、補正対象とするテキストを補正データ抽出基準に従って抽出し、この基準によって抽出された認識テキスト要素に対して補正処理を行うことができる。補正データ抽出基準は、認識テキスト要素の文字数が２より大きく、信頼性が０．９より小さいという基準であってもよい。補正データ抽出基準に文字数の下限を設けるのは、文字数が短い認識テキスト要素については、日本語の助詞や英語の前置詞などであることが多く、後述する会計記録データ２５ｂとのマッチングにおいて、会計記録データ２５ｂの基準テキスト要素と比較する必要が小さいためである。会計記録データ２５ｂの基準テキスト要素は、会計記録の一部であるから、日付、数量、商品名といった取引に関連のあるデータであることが想定され、２文字以下のテキストが会計記録の一部となっていることは少ないため、２文字以下の認識テキスト要素は、会計記録に対応していない文字と考えることができる。補正データ抽出基準は、会計記録データ２５ｂに含まれる会計記録のデータフォーマットやそれ以外の要素に基づいて適宜変更され得る。

　補正処理部２１ｃは、補正データ抽出基準を満たす認識テキスト要素に対して、その信頼性を高めるための補正処理を行うことができる。例えば、商品マスタＤＢ、取引先一覧、会計の専門用語のリストを辞書として準備することにより、公知のSymsSpellアルゴリズムを用い、誤認識された認識テキスト要素を正しいテキストに修正することができる。例えば、図６に示されている証憑画像２５ａ１において、「（株）Alpha」が「（株）Alpho」と誤認識された場合、SymsSpellアルゴリズムを用いることにより取引先ＤＢから「（株）Alpha」を、誤認識された「（株）Alpho」を置換する補正候補として抽出することができる。補正対象の認識テキスト要素を辞書に含まれているテキストで置換した場合には、その置換後のテキストが補正された認識テキスト要素となる。このように辞書に登録されているテキストで置換する方法で補正された認識テキスト要素の信頼性は、「１」に変更されてもよい。

　補正処理部２１ｃは、正規表現を使用して、認識テキスト要素に含まれる典型的な誤認識をまとめて補正してもよい。認識テキスト要素に含まれる典型的な誤認識には、例えば、以下のようなものがある。表の横方向の罫線が「－」（マイナス記号）の繰り返しと誤認識されることがある。この場合、正しくは「－」を含まない語が「－」を含む語として誤認識されることがある。例えば、正しくは「メモ」である文字が「－－－－メモ－」と誤認識されることがある。日本語の文字を含む画像に対してＯＣＲを行うと、意味をなさないアルファベットと数字の羅列（例えば、「2K29RM3S96GO020R2OCSKN」）が認識結果として現れることがある。また、画像が表を含む場合、表の縦の罫線が「｜」の記号と誤認識されることがある。これらの場合、正規表現を用いて誤って挿入されている文字や記号を削除することで、認識テキスト要素の信頼性を向上させることができる。

　日本語の画像に対してＯＣＲを行うと、元の画像にはない同じ文字の繰り返しが認識結果として出力されることがある。例えば、画像では「コ」が１度だけ記載されているにもかかわらず、「ココココ」のように画像中の文字が繰り返し認識されるという誤認識が起こることがある。「,」（カンマ）が誤って「.」と認識されることがある。「,」が二重に認識され、その結果、認識結果が「,,」となってしまうことがある。これらに対しては、正規表現を用いて、誤認識されている文字を正しい文字に置換したり、重複しているテキストを削除する補正処理を行うことで、認識テキスト要素の信頼性を向上させることができる。

　補正部２１ｃは、補正データ抽出基準を満たした（つまり、誤認識の可能性が高い）認識テキスト要素について、認識テキスト要素と類似する語を会計記録データ２５ｂから曖昧検索により抽出し、この会計記録データ２５ｂから抽出された語で補正データ抽出基準を満たした認識テキスト要素を置換することができる。再び「（株）Alpha」が「（株）Alpho」と誤認識された例を用いると、「（株）Alpha」は「株式会社Ｘ」の取引先であるから正しい「（株）Alpha」が会計記録データ２５ｂに含まれている可能性が高い。そこで、会計記録データ２５ｂに対して誤認識された「（株）Alpho」と類似する語を曖昧検索により抽出し、曖昧検索により抽出された「（株）Alpha」で誤認識された「（株）Alpho」を置換することにより誤認識を補正することができる。曖昧検索は、会計記録データ２５ｂに含まれるテキストの中から、検索キー（つまり、誤認識されている認識テキスト要素）と所定のレーベンシュタイン距離以内にあるテキストを選択することで行われてもよい。つまり、この所定のレーベンシュタイン距離は、曖昧検索のしきい値として機能する。曖昧検索のしきい値は、会計記録データ２５ｂに保持されているテキストの性質等に応じて随時変更され得る。

　補正部２１ｃによる補正処理を行わなくともマッチング部２１ｄによるマッチングを行うことができる場合には、補正部２１ｃの機能は省略されてもよい。

　マッチング部２１ｄは、会計記録データ２５ｂに含まれる各レコードの基準テキストセットを、文字認識部２１ｂにより証憑画像２５ａ１に基づいて生成された第１テキストデータセット（補正部２１ｃにより補正処理が行われた場合には補正処理後の第１テキストデータセット）と比較することで、当該基準テキストセットと第１テキストデータセットとのマッチングまたは一致の度合いを表す第１マッチングスコアを算出することができる。マッチング部２１ｄは、算出された第１マッチングスコアをマッチングスコア領域２５ｃに格納することができる。マッチング部２１ｄは第２テキストデータセットについても同様に第２マッチングスコアを算出し、算出した第２マッチングスコアをマッチングスコア領域２５ｃに格納することができる。マッチング部２１ｄは、データ取得部が取得した証憑画像のそれぞれについて上記の第１マッチングスコア及び第２マッチングスコアの算出および格納を実行することができる。マッチング部２１ｄは、このようにして算出された第１マッチングスコア及び第２マッチングスコアをマッチングスコア領域２５ｃに格納する。図２ａ及び図２ｂに示されているテーブルは、マッチング部２１ｄによって算出されマッチングスコア領域２５ｃに格納されている第１マッチングスコア及び第２マッチングスコアの例である。

　マッチング部２１ｄは、例えば、会計記録データ２５ｂに含まれる各レコードに含まれる基準テキスト要素の各々について、証憑画像２５ａ１に対してＯＣＲを行って得られた第１テキストデータセットに含まれる認識テキスト要素の各々との間でのレーベンシュタイン距離を算出し、その算出した値のうち最も小さな値を各基準テキスト要素についての個別のレーベンシュタイン距離の値として採用することができる。具体的には、会計記録データ２５ｂがＸ株式会社の売上帳であり、当該売上帳には、Ｘ株式会社が販売した商品名、販売先、販売数量、及び販売金額が基準テキスト要素として含まれている場合には、マッチング部２１ｄは、会計記録データ２５ｂに含まれる各レコードに含まれる基準テキスト要素の各々、すなわち、販売先、商品名、販売数量、及び販売金額の各々と、第１テキストデータセットに含まれる認識テキスト要素の各々との間でのレーベンシュタイン距離を算出する。会計記録データ２５ｂのあるレコードＡにおいて、販売した商品名が、「ＰＤ０３２１－１１０１」と記録されているとする。この「ＰＤ０３２１－１１０１」と、証憑画像２５ａ１に基づいて生成された第１テキストデータセットに含まれる各認識テキスト要素とを比較すると、証憑画像２５ａ１に含まれている「ＰＤ０３２１－１１０１」の文字が正しく認識されて認識テキスト要素として出力された場合には、会計記録データ２５ｂのレコードＡに商品名を表す基準テキスト要素として含まれている「ＰＤ０３２１－１１０１」と、第１テキストデータセットに認識テキスト要素として含まれている「ＰＤ０３２１－１１０１」とは一致し、そのレーベンシュタイン距離は「０」（一致）となる。証憑画像２５ａ１に含まれている「ＰＤ０３２１－１１０１」の文字が誤って「ＤＤ０３２１－１１０１」と認識された場合には、基準テキスト要素として含まれている「ＰＤ０３２１－１１０１」と第１テキストデータセットに認識テキスト要素として含まれている「ＤＤ０３２１－１１０１」とのレーベンシュタイン距離は、「１」よりも１文字の相違を反映した大きな値となる。基準テキスト要素として含まれている「ＰＤ０３２１－１１０１」については、第１テキストデータセットに含まれる上記の商品名を表す認識テキスト要素以外の認識テキスト要素との間でもレーベンシュタイン距離の算出が行われるが、商品名を表す認識テキスト要素以外の認識テキスト要素は、商品名とは関係の小さな数字や日付に対応するテキストであるため、商品名を表す基準テキスト要素と商品名以外に対応する認識テキスト要素との間のレーベンシュタイン距離は、商品名に対応する認識テキスト要素との間のレーベンシュタイン距離よりも大きくなる。このようにして、商品名を表す基準テキスト要素と商品名に対応する認識テキスト要素との間のレーベンシュタイン距離が、当該商品名を表す基準テキスト要素の個別のレーベンシュタイン距離として採用される。このレーベンシュタイン距離の算出を、会計記録データ２５ｂに含まれる各レコードに含まれる基準テキスト要素の各々について行うことで、会計記録データ２５ｂに含まれる各レコードに含まれる基準テキスト要素の各々について、個別のレーベンシュタイン距離が算出される。会計記録データ２５ｂに含まれるあるレコードについては、当該レコードの基準テキスト要素の各々について算出される個別のレーベンシュタイン距離を当該レコードの基準テキスト要素の各々について合算した合計、または、当該レコードの基準テキスト要素の各々について算出される個別のレーベンシュタイン距離の平均値を０～１の範囲の値に正規化し、１からこの正規化された値を引いた値を、当該レコードの基準データセットと証憑画像２５ａ１の第１編集済画像に基づいて生成された第１テキストデータセットとのマッチングの度合いを表す第１マッチングスコアとすることができる。

　以上のように、一つの例においては、会計記録データ２５ｂに含まれる各レコードの基準データセットを構成する基準テキスト要素の各々について、第１テキストデータセットを構成する認識テキスト要素のうち各基準テキスト要素に対応するものとの個別のレーベンシュタイン距離を算出し、この個別のレーベンシュタイン距離に基づいて、各レコードの基準データセットと証憑画像２５ａ１の第１編集済画像に基づいて生成された第１テキストデータセットとのマッチングの度合いを表す第１マッチングスコアを算出することができる。会計記録データ２５ｂに含まれる各レコードの基準データセットと、証憑画像２５ａ１の第２編集済画像に基づいて生成された第２テキストデータセットとのマッチングの度合いを表す第２マッチングスコアについても、第１マッチングスコアと同様の方法で算出され得る。

　第１マッチングスコア及び第２マッチングスコアの算出方法は、上記の方法には限られない。第１マッチングスコアとして、会計記録データ２５ｂに含まれる各レコードの基準データセットと、証憑画像２５ａ１の第１編集済画像に基づいて生成された第１テキストデータセットとのマッチングの度合いを表す任意の値を用いることができる。第２マッチングスコアについても同様である。

　マッチング部２１ｄは、上記のようにして算出された第１マッチングスコア及び第２マッチングスコアに基づいて、第１テキストデータセット又は第２テキストデータセットのいずれかを適合テキストデータセットとして選択する。具体的には、マッチング部２１ｄは、第１マッチングスコアが第２マッチングスコアよりも大きい場合には、第１テキストデータセットを適合テキストデータセットとして選択し、他方、第２マッチングスコアが第１マッチングスコアよりも大きい場合には、第２テキストデータセットを適合テキストデータセットとして選択することができる。より具体的には、マッチング部２１ｄは、マッチングスコア領域２５ｃを参照し、会計記録データ２５ｂに含まれるあるレコード（取引）について最大のマッチングスコアを与える証憑画像を特定することができる。また、マッチング部２１ｄは、あるレコードについて特定された証憑画像に関して算出されている第１マッチングスコア及び第２マッチングスコアのどちらがその最大のマッチングスコアを与えるかを特定する。マッチング部２１ｄは、あるレコードについて最大のマッチングスコアを与える証憑画像の証憑ＩＤを、当該レコード（取引）の取引ＩＤに対応付けてマッチング結果リストに登録することができる。これにより、取引と証憑画像との対応付けが得られる。さらに、マッチング部２１ｄは、ある取引と対応付けられた証憑画像について算出されている複数のマッチングスコアのうち、最大のマッチングスコアを与えるものとして特定された方のマッチングスコアに対応するテキストデータセットを適合テキストデータセットとして選択する。あるいはまた、マッチング部２１ｄはレコードと証憑画像との組み合わせごとに算出されている第１マッチングスコアと第２マッチングスコアとをまず比較し、大きい方を当該レコードと当該証憑画像とのマッチングスコアとして特定してもよい。このようにして、マッチング部２１ｄは、第１テキストデータセットと第２テキストデータセットのうち、基準テキストセットとの一致度が高い（よって、信頼性が高い）方を適合テキストデータセットとして選択することができる。

　出力部２１ｅは、第１テキストデータセット及び第２テキストデータセットのうち適合データセットとして選択された方のテキストデータセットに基づいてマッチング結果を生成する。例えば、出力部２１ｅは、適合データセットとして選択されたテキストデータセットに含まれる認識テキスト要素の各々について、各認識テキスト要素が会計記録データ２５ｂに含まれる基準テキスト要素のうち対応するものと一致するか否かを判定することができる。マッチング結果には、適合データセットとして選択されたテキストデータセットに含まれる認識テキスト要素の各々について、各認識テキスト要素が会計記録データ２５ｂに含まれる基準テキスト要素のうち対応するものと一致するか否かを示すフラグを含むことができる。

　マッチング結果は、ユーザ装置１０に送信され、ユーザ装置１０においてディスプレイに表示される。図８に、ディスプレイに表示されたマッチング結果を示すマッチング結果ビュー３０の一例を示す。図８に示されているように、マッチング結果ビュー３０は、注釈が付けられた証憑画像２５ａ１を表す第１ビュー３０ａと、基準テキスト要素の各々が適合テキストデータセットに含まれる認識テキスト要素と対応付けて表示される第２ビュー３０ｂと、を含む。

　第１ビュー３０ａには、証憑画像２５ａ１に、証憑画像２５ａ１の編集済画像に対してＯＣＲを行う際に設定されたテキスト領域Ａ０～Ａ１０を画定する境界ボックスが注釈として付加されている。このテキスト領域Ａ０～Ａ１０に含まれる字画を文字認識することで得られた認識テキスト要素の一部が第２ビュー３０ｂの認識テキスト表示領域３２ａ～３２ｄに表示されている。テキスト領域Ａ０～Ａ１０を囲む境界ボックスは、証憑画像２５ａ１に付加される注釈の例である。境界ボックス以外にも、証憑画像２５ａ１に対する各種処理において証憑画像２５ａ１に関して抽出された情報を注釈として付加することができる。例えば、境界ボックスの近傍に、その境界ボックスに囲まれているテキスト領域のデータ種別を表示してもよい。例えば、証憑画像２５ａ１が監査人の母語以外の言語による字画を含む場合、その字画を含むテキスト領域の近傍に、当該字画の訳語を表示してもよい。第１ビュー３０ａは、ストレージ２５に保存されている注釈付き画像２５ｅのうち証憑画像２５ａ１に対応する注釈付き画像を読み出すことにより、マッチング結果ビュー３０の一部に表示され得る。

　第２ビュー３０ｂは、基準テキスト要素を表示するための４つの基準テキスト表示領域３１ａ～３１ｄを含んでいる。例えば、基準テキスト表示領域３１ａには、会計記録データ２５ｂの証憑画像２５ａ１に対応するレコードにおいて、請求書番号を格納するためのフィールドに格納されている基準テキスト要素が表示される。会計記録データ２５ｂにおいては、請求書番号を格納するためのフィールドに請求書番号として「Ａ１１０１」が格納されているので、基準テキスト表示領域３１ａには、基準テキスト要素「Ａ１１０１」が表示されている。同様に、基準テキスト表示領域３１ｂ～３１ｄの各々には、会計記録データ２５ｂの証憑画像２５ａ１に対応するレコードにおいて、納品日、商品名、取引先を格納するためのフィールドに格納されている基準テキスト要素がそれぞれ表示されている。第２ビュー３０ｂには、上位以外の基準テキスト要素を表示するための表示領域が含まれてもよい。

　第２ビュー３０ｂにおいて、基準テキスト表示領域３１ａ～３１ｄの各々の直下には、証憑画像２５ａ１の適合テキストデータセットに含まれている認識テキスト要素を表示するための認識テキスト表示領域３２ａ～３２ｄがそれぞれ配置されている。認識テキスト表示領域３２ａには、証憑画像２５ａ１においてテキスト領域Ａ１として示されている領域に含まれている字画をＯＣＲで認識することにより生成された認識テキスト要素「Ａ１１０１」が表示されている。テキスト領域Ａ１に含まれている字画は、ＯＣＲによって正しく「Ａ１１０１」と認識されたため、認識テキスト表示領域３２ａに表示されている認識テキスト要素は、基準テキスト表示領域３１ａに表示されている基準テキスト要素と一致している。

　基準テキスト表示領域３１ａ及び認識テキスト表示領域３２ａの右側には、基準テキスト表示領域３１ａに表示されている基準テキスト要素と認識テキスト表示領域３２ａに表示されている認識テキスト要素とが一致するか否かを示す一致フラグ３３ａが表示されている。図示の例においては、認識テキスト表示領域３２ａに表示されている認識テキスト要素が基準テキスト表示領域３１ａに表示されている基準テキスト要素と一致しているため、一致フラグ３３ａは、両者が一致していることを示すように表示されている。一致フラグ３３ｄも認識テキスト表示領域３２ｄに表示されている認識テキスト要素が基準テキスト表示領域３１ｄに表示されている基準テキスト要素と一致していることを示している。

　基準テキスト表示領域３１ｂ及び認識テキスト表示領域３２ｂの右側には、基準テキスト表示領域３１ｂに表示されている基準テキスト要素と認識テキスト表示領域３２ｂに表示されている認識テキスト要素とが一致するか否かを示す一致フラグ３３ｂが表示されている。図示の例においては、認識テキスト表示領域３２ｂに表示されている認識テキスト要素が、基準テキスト表示領域３１ｂに表示されている基準テキスト要素と一致していないため、一致フラグ３３ｂは、両者が不一致であることを示すように表示されている。図示の例においては、会計記録データ２５ｂの納品日を格納するフィールドに格納された納品日を表すテキストが「２０２０年１月１日」であるため、基準テキスト表示領域３１ｂには、この「２０２０年１月１日」が表示されている。他方、認識テキスト表示領域３２ｂには、証憑画像２５ａ１においてテキスト領域Ａ３として示されている領域に含まれている字画をＯＣＲで認識することにより生成された認識テキスト要素「２０２０年１月７日」が表示されている。このように、証憑画像２５ａ１においてテキスト領域Ａ３に含まれている字画については誤認識が発生しているため、認識テキスト表示領域３２ｂに表示されている認識テキスト要素「２０２０年１月７日」は、基準テキスト表示領域３１ｂに表示されている基準テキスト要素「２０２０年１月１日」と一致していない。このマッチング結果のビュー３０を見て証憑突合を行うユーザは、まず一致フラグ３３ｂを見ることにより、会計記録データ２５ｂと証憑画像２５ａ１との間に一致しない項目があることを把握することができる。そして、一致フラグ３３ｂの近傍（左側）に配置されている基準テキスト表示領域３１ｂ及び認識テキスト表示領域３２ｂを見ることにより、両者がどのように不一致なのかを確認することができる。ユーザはさらに、ビュー３０ａの納品日に対応する項目を見ることで、証憑画像２５ａ１においては納品日が正しく「２０２０年１月１日」と記されていることを確認することができる。このような確認を行うことにより、ユーザは、納品日に対応する認識テキスト要素の生成時に誤認識が発生しており、認識テキスト表示領域３２ｂには誤認識されたテキストが表示されていることを確認することができる。入力受付部２１ｆは、認識テキスト表示領域３２ｂにおいて誤って表示されているテキストの訂正入力をユーザから受け付けることができる。ユーザは、ユーザ装置１０の入力インタフェース（例えば、キーボードやマウス）を用いて、認識テキスト表示領域３２に表示されているテキストを正しい値である「２０２０年１月１日」に修正し、その後に確認ボタン３４ｂを選択することができる。または、認識テキスト表示領域３２に表示されているテキストを修正せずに、証憑画像２５ａ１に記載されている納品日と、基準テキスト表示領域３１ｂに表示されている納品日とが一致していることを確認したことに応じて、確認ボタン３４ｂに対して選択操作を行ってもよい。監査支援システム１は、証憑突合の効率化を支援するためのシステムなので、必ずしも認識テキスト要素の誤りの修正までは必要とされない。

　図示の例においては、一致フラグ３３ｃも不一致の判定結果を示している。基準テキスト表示領域３１ｃに表示されている基準テキスト要素である「ＰＤ３２１－１００１」が認識テキスト表示領域３２ｂに表示されている認識テキスト要素「ＤＤ３２１－１００１」とが一致していないためである。ユーザは、一致フラグ３３ｂに関する説明と同様に、第１ビュー３０ａの商品名に対応する項目を確認することで、証憑画像２５ａ１においては商品名が正しく「ＰＤ３２１－１００１」と記されていることを確認することができる。

　以上のように、マッチング結果を示すビュー３０においては、認識テキスト要素が対応する基準テキスト要素と一致していない項目が、一致フラグ３３ａによって視覚的に特定可能なように表示される。したがって、ユーザは、証憑画像２５ａ１と会計記録データ２５ｂに含まれるデータとを項目ごとに全て確認する必要がなく、一致フラグ３３ａによって不一致であることが示されているデータ項目について証憑画像２５ａ１と会計記録データ２５ｂとの間でのデータの整合性を確認することで証憑突合を行うことができるので、証憑突合を効率良く行うことができる。つまり、証憑画像２５ａ１に編集処理及びＯＣＲを行うことによって生成されたテキストデータセットと会計記録データ２５ｂのうち証憑画像２５ａ１に対応するレコードとのマッチングが行われ、そのマッチングにより証憑画像２５ａ１と会計記録データ２５ｂとの間で対応するデータが一致している項目については整合性の確認が自動的に完了している。よって、ユーザは、一致フラグ３３ａによって証憑画像２５ａ１と会計記録データ２５ｂとの間で不整合があることが示された項目についてのみ、その不整合がＯＣＲの誤認識に起因するものなのか、証憑画像２５ａ１に対応する証憑や会計記録データ２５ｂに誤りが存在することに起因するものなのかを確かめればよい。これにより証憑突合の作業負荷を軽減することができる。

　さらに、マッチング結果のビュー３０には、一致フラグ３３ａ～３３ｄを含む第２ビュー３０ｂだけでなく、注釈が付された証憑画像２５ａ１を含む第１ビュー３０ａも表示されるので、ユーザは、一致フラグ３３ａ～３３のいずれかが不一致を示す場合に、その不一致とされたデータ項目の証憑画像２５ａ１における記載内容を、別ファイルにアクセスすることなく確認することができる。これにより、証憑突合作業のさらなる効率化が図られている。また、第１ビュー３０ａに含まれる証憑画像２５ａ１には、ＯＣＲを行う際に設定されたテキスト領域Ａ０～Ａ１０を示す境界ボックスが注釈として付加されている。よって、ユーザは、不一致のデータ項目があった場合でも、証憑画像２５ａ１の全体を見る必要がなく境界ボックスが付された領域のみを確認すればよい。

　一態様において、出力部２１ｅは、一致フラグ３３ａ～３３ｄのうち不一致を示している一致フラグに対応するデータ項目を指し示している境界ボックスを強調表示してもよい。図示の例においては、不一致を示している一致フラグ３３ｂに対応する納品日に対応するテキスト領域Ａ３を囲む境界ボックス及び一致フラグ３３ｃに対応する商品名に対応するテキスト領域Ａ４を囲む境界ボックスを強調表示してもよい。境界ボックスの強調表示は、境界ボックスの色や太さを変更することにより行ってもよい。境界ボックスの強調表示の具体的な態様は、本明細書に明示されたものには限定されない。

　ＯＣＲにより生成されたテキストデータセットと会計記録データ２５ｂに含まれる基準テキスト要素とが一致するか否かを判断する際には、２種類の異なる編集処理により編集された編集済画像に基づいて生成された第１テキストデータセット及び第２テキストデータセットのうち、会計記録データ２５ｂにおける関連レコードの基準テキストセットとマッチングした際のマッチングスコアが高い方を適合テキストデータセットとして選択し、この適合テキストデータセットが一致・不一致の判定に用いられている。このように、証憑画像２５ａ１に対する２系統の編集処理を経て生成されたテキストデータセットのうち認識精度の高い方が、基準テキストセットに含まれる基準テキスト要素との一致判定に用いられているので、ＯＣＲの誤認識により不一致と判定される頻度を下げることができる。これにより、証憑突合においてユーザが確認すべきデータ項目の数を減らすことができるので、証憑突合の効率をさらに向上させることができる。

　続いて、図４を参照して、監査支援システム１において実行される証憑突合を効率化するためのマッチング処理の流れについて説明する。まず、ステップＳ１において、証憑突合に使用する複数の証憑の画像、及び、会計記録データが取得される。証憑突合に使用する複数の証憑の画像及び会計記録データは、例えば、監査対象企業及びその取引先から一括して又は随時取得される。図４に示されている例では、証憑画像２５ａ１に対して行われる処理を例に説明する。

　次に、取得された証憑画像に対して、ＯＣＲの認識精度を向上させるための前処理として、２種類以上の編集処理が行われる。図示のように、この編集処理工程は、共通編集処理を行うステップＳ２と、共通編集処理Ｓ２の実行後に個別編集処理を行う工程Ｓ３ａ、Ｓ３ｂとの二段階に分けることができる。共通編集処理は、例えば、画像の種類やレイアウトによらず、ＯＣＲの認識精度の向上に寄与すると考えられる処理であり、具体的には、画像を９０°単位で回転させる回転処理であってもよい。例えば、証憑画像２５ａ１が上下反転している場合には、工程Ｓ２において、証憑画像２５ａ１を１８０°回転させる処理が行われる。次に、共通編集処理が行われた証憑画像２５ａ１に対して、工程Ｓ３ａにおいて第１編集処理が行われ、工程Ｓ３ｂにおいて第２編集処理が行われる。記述のとおり、第２編集処理は、第１編集処理と異なる種類の編集処理である。個別編集処理の例として、記述の罫線削除処理、表検出処理、テキスト領域検出処理、バイナリ画像への変換処理、グレースケール化処理、色の変更処理、これら以外の画像の編集処理、及びこれらの組み合わせが挙げられる。工程Ｓ２における編集処理と工程Ｓ３ａにおける編集処理とを合わせて第１編集処理とすることができ、工程Ｓ２における編集処理と工程Ｓ３ｂにおける編集処理とを合わせて第２編集処理とすることができる。証憑画像２５ａ１に対して第１編集処理を行うことで第１編集済画像が生成され、証憑画像２５ａ１に対して第２編集処理を行うことで第２編集済画像が生成される。工程Ｓ２と、工程Ｓ３ａ、Ｓ３ｂとの順序は入れ替わっても良い。

　次に、工程Ｓ４ａにおいて、第１編集済画像に対してＯＣＲが行われ、第１テキストデータセットが生成される。また、工程Ｓ４ｂにおいて、第２編集済画像に対してＯＣＲが行われ、第２テキストデータセットが生成される。工程Ｓ４ａにおいては、工程Ｓ３ａにおいて生成された第１編集済画像において各々が字画を含むようにテキスト領域が設定され、このテキスト領域ごとに文字認識が行われる。よって、第１テキストデータセットは、第１編集済画像のテキスト領域の各々に含まれる字画を文字識別して得られたテキスト（認識テキスト要素）により構成される。工程Ｓ４ｂにおいては、工程Ｓ３ｂにおいて生成された第２編集済画像において各々が字画を含むようにテキスト領域が設定され、このテキスト領域ごとに文字認識が行われる。よって、第２テキストデータセットは、第２編集済画像のテキスト領域の各々に含まれる字画を文字識別して得られたテキスト（認識テキスト要素）により構成される。工程Ｓ４ａ及び工程４ｂにおいて各テキスト領域において行われる文字認識の結果には、その認識結果の認識の信頼性（confidence）が付加されていてもよい。ステップＳ２、Ｓ３ａ、Ｓ３ｂにおける編集処理及びステップＳ４ａ、Ｓ４ｂにおけるＯＣＲは、例えば、上記の文字認識部２１ｂにより行われてもよい。

　次に、工程Ｓ５ａにおいて、工程Ｓ４ａで生成された第１テキストデータセットに含まれる認識テキスト要素の少なくとも一部に対して、その信頼性を向上させるための補正処理が行われ、工程Ｓ５ｂにおいて、工程Ｓ４ｂで生成された第２テキストデータセットに含まれる認識テキスト要素の少なくとも一部に対して、その信頼性を向上させるための補正処理が行われる。補正処理は、例えば、図５に示すフローに従って実行されてもよい。図５は、第１テキストデータセット又は第２テキストデータセットに対して行われる補正処理の流れの一例を示すフロー図である。第１テキストデータセットに対する補正処理と第２テキストデータセットに対する補正処理は同様に行われ得るため、以下の説明では、第１テキストデータセットに含まれる認識テキスト要素に補正処理を行うことが想定される。

　図５に示されているように、補正処理を行う場合には、ステップＳ１１において、第１テキストデータセットに含まれる複数の認識テキスト要素のうち補正処理が必要なものが補正データ抽出基準に従って抽出される。補正データ抽出基準は、認識テキスト要素の文字数が２より大きく、信頼性が０．９より小さいという基準であってもよい。次に、ステップＳ１２において、会計記録データ２５ｂを参照して第１補正処理が行われる。第１補正処理は、認識テキスト要素と類似する語を会計記録データ２５ｂから曖昧検索により抽出し、この会計記録データ２５ｂから抽出された語で認識テキスト要素を置換する曖昧検索処理であってもよい。次に、ステップＳ１３において、会計記録データ２５ｂを用いない補正処理が行われる。ステップＳ１３における補正処理は省略されてもよい。ステップＳ１３において行われる補正処理は、例えば、SymsSpellアルゴリズム及び辞書を用いた補正処理であってもよい。上記以外に、補正処理としては、認識テキスト要素の信頼性を向上させることができる任意の処理を用いることができる。ステップＳ５ａ、Ｓ５ｂにおける補正処理は、例えば、上記の補正処理部２１ｃにより行われてもよい。工程Ｓ５ａ、Ｓ５ｂは、適宜省略することができる。例えば、工程Ｓ４ａ、Ｓ４ｂにおいて生成される第１テキストデータセット及び第２テキストデータセットに含まれる認識テキスト要素の信頼性が十分に高い場合には補正処理を省略してもよい。その他の理由で補正処理を省略することもできる。

　次に、工程Ｓ６において、会計記録データ２５ｂに含まれる各レコードの基準テキストセットを、工程Ｓ４ａにおいて生成された第１テキストデータセット及び工程Ｓ４ｂにおいて生成された第２テキストデータセットとそれぞれ比較することで、当該基準テキストセットと第１テキストデータセットとのマッチングの度合いを表す第１マッチングスコア及び当該基準テキストセットと第２テキストデータセットとのマッチングの度合いを示す第２マッチングスコアが算出される。工程Ｓ６では、第１マッチングスコアと第２マッチングスコアとが比較され、第１マッチングスコアと第２マッチングスコアのうちのいずれが大きいかが判定され、大きい方のマッチングスコアを選択する。この選択されたマッチングスコアを選択マッチングスコアと呼ぶ。

　以上の工程Ｓ２から工程Ｓ６における処理が、工程Ｓ１で取得された複数の証憑画像のそれぞれについて行われる。これにより、図２ａや図２ｂに示されているように、複数の証憑画像の各々について、会計記録データ２５ｂのレコードごとに、第１マッチングスコア及び第２マッチングスコアが算出され、各証憑画像について第１マッチングスコア及び第２マッチングスコアのうち大きい方が選択マッチングスコアとして選択される。このように、会計記録データに含まれる各レコードについて複数の証憑画像の各々について特定された選択マッチングスコアを比較し、最大の選択マッチングスコアを与える証憑画像が、当該レコードに対応する証憑画像として特定される。このようにして複数の証憑画像の中から、会計記録データ２５ｂのあるレコードに対応すると判定された証憑画像を「選択証憑画像」と呼ぶ。工程Ｓ６においては、選択証憑画像について生成されている第１テキストデータセット及び第２テキストデータセットのうち、選択マッチングスコアと対応している方のデータセットを適合テキストデータセットとして特定される。ステップＳ６におけるマッチング処理は、例えば、上記のマッチング部２１ｄにより行われてもよい。

　次に、ステップＳ７において、第１テキストデータセット及び第２テキストデータセットのうち適合データセットとして選択された方のテキストデータセットに基づいてマッチング結果が生成される。マッチング結果として、例えば、図８に示される第１ビュー３０ａ及び第２ビュー３０ｂを含むマッチング結果のビュー３０が生成される。ステップＳ７におけるマッチング結果の生成及び出力に関する処理は、例えば、上記の出力部２１ｅにより行われてもよい。

　以上のようにして、証憑画像２５ａ１に２種類の編集処理を行って生成された２種類の編集済画像にＯＣＲを行って得られた２種類のテキストデータセットのうち、基準テキストセットとのマッチングスコアが高い適合テキストデータセットに含まれる認識テキスト要素と会計記録データ２５ｂに含まれる基準テキストセットに含まれる基準テキスト要素とのマッチング結果が生成され、このマッチング結果のビュー３０がユーザ装置１０において表示される。ユーザ装置１０のユーザは、このマッチング結果のビュー３０を利用して効率良く証憑突合を行うことができる。

　監査対象企業の取引規模に応じて、証憑画像２５ａとして含まれる証憑画像のファイル数は多くなる。大量の証憑画像に上記のマッチング処理を適用することにより、取引と証憑画像との対応付けが自動化されるので証憑突合作業の効率化のメリットを大きくすることができる。図７に、複数の証憑画像に対して上記のマッチング処理を行ったマッチング結果のリスト形式での表示例を示す。図７の表において、各エントリは会計記録データのレコード（取引）に対応する。各エントリにおいて「画像へのリンク」で対応付けられている証憑画像は、マッチング部２１ｄによって当該エントリに対応するレコードに関連すると判定された証憑画像（つまり、選択証憑画像）である。図７の表において、＃１の行に記録されているレコードが、図８に表示されているマッチング結果に対応する。図８のビューでは、請求書番号、納品日、商品名、顧客名についてのみ、証憑画像２５ａ１の編集済画像にＯＣＲを行って得られたテキストデータセットに含まれる認識テキスト要素と、会計記録データ２５ｂに含まれる証憑画像２５ａ１に関連すると判定されたレコードの基準テキスト要素とのマッチング結果が示されているが、他の認識テキスト要素（例えば、単価、金額、税額）についても基準テキスト要素とのマッチング結果を生成し、このマッチング結果が第２ビュー３０ｂの一部として表示されてもよい。例えば、図８に示されている第２ビュー３０ｂを下方にスクロールすることで、単価等の図８の例に示されていないデータ項目に対応するマッチング結果を表示できるようにしてもよい。

　図７に示されているマッチング結果リスト２５ｄの＃２～＃４のレコードには、証憑画像２５ａ１とは別の証憑画像が関連付けられている。図示されているように、＃２～＃４のレコードについても、＃１のレコードと同様に、各証憑画像の編集済画像にＯＣＲを行って得られたテキストデータセットに含まれる認識テキスト要素と、会計記録データ２５ｂに含まれる各証憑画像に関連するレコードの基準テキスト要素とのマッチング結果が示されている。＃２及び＃３のレコードにおいては、全てのデータ項目について一致と判定されている。＃４のレコードにおいては、納品日のデータ項目について不一致と判定され、それ以外のデータ項目について一致と判定されている。

　図９に図１ｂの変形例を示す。図１ｂにおいては、証憑画像Ｖ１が会計記録データＬ１１にのみ関連付けられていたが、図９に示されているように、証憑画像Ｖ１は、会計記録データＬ１１に加えて会計記録データＬ１２（に含まれるレコード）にも関連付けられてもよい。証憑画像Ｖ１は、３種類以上の会計記録データに関連付けられていてもよい。また、証憑画像Ｖ２、Ｖ３も２種類以上の会計データに関連付けられていてもよい。

　次に、図１０及び図１１を参照して別の実施形態による監査支援システム１を説明する。図１０は、本発明の別の実施形態における監査支援システム１において用いられる証憑画像１２５ａ１を模式的に示し、図１１は、文字認識部２１ｂによって生成される第１テキストデータセット及び第２テキストデータセットを構成する認識テキスト要素のデータ構造の例を示す。証憑画像２５ａ１と同様に、証憑画像１２５ａ１に対しても第１編集処理及び第２編集処理が行われるが、説明の簡潔さのために、証憑画像１２５ａ１から生成された第１編集済画像に関する処理について説明し、第２編集済画像に関する説明は省略する。第２編集済画像に対しても、第１編集済画像に対する説明が適用され得る。

　図１０に示されているように、証憑画像１２５ａ１においては、テキスト領域Ａ１１に含まれている請求書番号を示す数字「５００」が、別のテキスト領域Ａ１２に含まれている数量を示す数字「５００」と偶然に一致している。会計記録データ２５ｂの証憑画像１２５ａ１に関連するレコードに基準テキスト要素として「５００」という数字が含まれている場合、文字認識部２１ｂにおいてテキスト領域Ａ１１の「５００」とテキスト領域Ａ１２の「５００」が両方とも正しく「５００」と文字認識されると、会計記録データ２５ｂに含まれている請求書番号を示すデータ「５００」及び数量を示す「５００」を、テキスト領域Ａ１１における文字認識により得られた「５００」及びテキスト領域Ａ１２における文字認識により得られた「５００」のいずれと比較すべきかを決定することができない。

　そこで、文字認識部２１ｂは、第１編集済画像においてテキスト領域を識別し、このテキスト領域ごとに文字認識を行う際に、各テキスト領域に含まれる字画に基づいて認識されたテキストデータにテキスト領域ごとに固有のデータ種別を付与する。例えば、文字認識部２１ｂは、テキスト領域Ａ１１に含まれている字画から「５００」のテキストを認識した際にこの「５００」のテキストに対してこのテキスト領域Ａ１１に固有のデータ種別を付与し、同様に、テキスト領域Ａ１２に含まれている字画から「５００」のテキストを認識した際にこの「５００」のテキストに対してこのテキスト領域Ａ１２に固有のデータ種別を付与する。これにより、証憑画像１２５ａ１の第１編集済画像において認識される「５００」という２つのテキストを互いから区別することができる。例えば、テキスト領域Ａ１１から認識される「５００」のテキストＴ１１ａに対して、テキスト領域Ａ１１に固有のデータ種別Ｔ１１ｂとして「請求書番号」を付加した構造を有するデータＴ１１をテキスト領域Ａ１１に含まれる字画に対応する認識テキスト要素とすることができる。データ種別Ｔ１１ｂは、証憑画像１２５ａ１においてテキスト領域Ａ１１に含まれている字画にメタデータ（タグ）としてデータ種別が設定されている場合には、そのメタデータをデータ種別Ｔ１１ｂとして設定することができる。別の例においては、テキスト領域Ａ１１の近傍に表示されている別の字画（特に文字）を含むテキスト領域に含まれる字画を認識して得られるテキストをデータ種別１１ｂとして設定することができる。図１０に示されている例では、テキスト領域Ａ１１の左隣に文字がひとまとまりとなっている字画があるため、この文字のひとまとまりの字画を含むテキスト領域Ａ１３を設定し、このテキスト領域Ａ１３に含まれている字画の認識結果をデータ種別１１ｂとして設定することができる。図１０に示されている例では、誤認識がなければテキスト領域Ａ１３に含まれている「請求書番号」がデータ種別１１ｂとして設定される。

　テキスト領域Ａ１２から認識される「５００」のテキストＴ１２ａに対しても同様に、テキスト領域Ａ１２に固有のデータ種別Ｔ１２ｂとして「数量」を付加した構造を有するデータＴ１２をテキスト領域Ａ１１に含まれる字画に対応する認識テキスト要素とすることができる。データ種別Ｔ１２ｂは、テキスト領域Ａ１２に設定されているメタデータ（タグ）、又は、テキスト領域Ａ１２の近傍に設定されたテキスト領域Ａ１４に含まれる文字の認識結果をデータ種別１２ｂとして設定することができる。

　会計記録データ２５ｂにおいては、レコードに含まれる複数のフィールドの各々に項目名が設定されている。会計記録データ２５ｂは、例えば、表計算ソフトで作成されるため、フィールドごとに項目名を容易に設定することができる。会計記録データ２５ｂの証憑画像１２５ａ１に関連するレコードにおいては、例えば、データ項目「請求書番号」に「５００」が格納され、データ項目「数量」に「５００」が格納されている。会計記録データ２５ｂにおけるデータ項目を、基準テキスト要素のデータ種別とすることができる。

　マッチング部２１ｄは、会計記録データ２５ｂに含まれる各レコードに含まれる基準テキスト要素の各々について、証憑画像１２５ａ１の第１編集済画像にＯＣＲを行って得られた第１テキストデータセットに含まれる認識テキスト要素のうち、自らのデータ項目と一致するデータ種別を有する認識テキスト要素との間でのレーベンシュタイン距離を算出し、このレーベンシュタイン距離を当該基準テキスト要素についての個別のレーベンシュタイン距離とすることができる。

　認識テキスト要素に対するデータ種別の付加は、証憑画像の編集済画像にＯＣＲを行って得られる認識テキスト要素のうちの少なくとも２つが一致している場合にのみ行われてもよいし、認識テキスト要素の重複の有無によらずに行われてもよい。認識テキスト要素に会計記録データ２５ｂのデータ項目と関連付けが可能なデータ種別が付されていれば、マッチング部２１ｄにおいて行われるレーベンシュタイン距離の算出のための計算負荷を軽減することができる。

　次に、図１２及び図１３を参照して別の実施形態による監査支援システム１を説明する。図１２は、本発明の別の実施形態における監査支援システム１で実行される機能を説明するための模式的なブロック図であり、図１３は、図１２の監査支援システムにおいて用いられる証憑画像２２５ａ１を示す。

　図１２に示されている監査支援システム１に含まれる監査支援装置２０のプロセッサ２１は、結合部２１ｇとして機能することができる。図１３に示されているように、証憑画像２２５ａ１は、Ｘ株式会社から「株式会社Alphaセキュリティーズ」に宛てた請求書を示している。証憑画像２２５ａ１に対してＯＣＲを行う場合には、レイアウト解析などの手法により、テキスト領域が設定され、このテキスト領域を単位として文字認識が行われる。図１３に示されている証憑画像２２５ａには、ＯＣＲを行う際のテキスト領域を画定する境界ボックスが示されている。図１３の例では、証憑画像２２５ａにテキスト領域Ａ１～Ａ９及びＢ１１、Ｂ１２が設定されている。

　テキスト領域Ｂ１１には、請求書の宛先である「株式会社Alphaセキュリティーズ」の一部である「株式会社Alpha」が含まれており、テキスト領域Ｂ１２には当該宛先の残部である「セキュリティーズ」が含まれている。このテキスト領域の設定のままでＯＣＲを行うと、「株式会社Alpha」と「セキュリティーズ」とは別個の認識テキスト要素として認識される。このため、会計記録データ２５ｂの証憑画像２２５ａ１に関連するレコードに「株式会社Alphaセキュリティーズ」が基準テキスト要素として格納されていても、「株式会社Alphaセキュリティーズ」と「株式会社Alpha」及び「セキュリティーズ」の各々とのレーベンシュタイン距離は大きな値となる。このため、会計記録データ２５ｂ及び証憑画像２２５ａのいずれもが誤りなく記載され、さらに誤認識なくＯＣＲが行われても、証憑画像２２５ａにＯＣＲを行って得られる認識テキスト要素と会計記録データ２５ｂの証憑画像２２５ａに関連するレコードの基準テキスト要素とのマッチング処理において、「取引先」の項目が不一致となってしまう。

　図１２に示されている実施形態において、結合部２１ｇは、テキスト領域Ｂ１１に含まれる「株式会社Alpha」を文字認識することで生成されるテキストデータと「セキュリティーズ」を文字認識することで生成されるテキストデータとを結合して、一つの結合テキストデータとする。証憑画像２２５ａにＯＣＲを行って得られるテキストデータセット（第１テキストデータセット又は第２テキストデータセット）は、その認識テキスト要素として、「株式会社Alpha」のテキスト及び「セキュリティーズ」のテキストに代えて、又は、「株式会社Alpha」のテキスト及び「セキュリティーズ」のテキストに加えて結合テキストデータ（つまり、「株式会社Alphaセキュリティーズ」）を含むように構成される。これにより、マッチング結果を出力する際には、認識テキスト要素の一つである結合テキストデータと、会計記録データ２５ｂの証憑画像２２５ａに関連するレコードに含まれている基準テキスト要素とのマッチングが行われる。結合テキストデータは、取引先を正しく「株式会社Alphaセキュリティーズ」と特定しているので、結合を行わない場合に起こる誤った不一致判定を防止できる。

　図１３に示されているように、結合部２１ｇは、ＯＣＲを行う際のテキスト領域の設定時にテキスト領域Ｂ１１とテキスト領域Ｂ１２とを結合して一つの結合テキスト領域Ｂ１を設定してもよい。この場合、結合テキスト領域Ｂ１に含まれる字画をまとめて文字認識することで、「株式会社Alphaセキュリティーズ」をまとめて文字認識することができる。結合部２１ｇは、テキスト領域Ｂ１１及びテキスト領域Ｂ１２の各々において個別に文字認識された「株式会社Alpha」と「セキュリティーズ」とを結合することで結合テキストデータを生成してもよい。

　図１４ａから図１９を参照して、図１２及び図１３に示されている実施形態の変形例を説明する。

　図１４ａの実施形態においては、テキスト領域Ｂ１１とテキスト領域Ｂ１２との距離ｄ１を用いて、結合テキストデータを生成するか否かが判断される。具体的には、結合部２１ｇは、テキスト領域Ｂ１１とテキスト領域Ｂ１２との間の距離ｄ１が所定値よりも小さい場合に、テキスト領域Ｂ１１に含まれる「株式会社Alpha」とテキスト領域Ｂ１２に含まれる「セキュリティーズ」とを結合して結合テキストデータを生成する。２つのテキスト領域が所定距離よりも近接しているときに、両者に含まれるテキストを結合することができる。

　図１４ｂは、別の実施形態を示す。図１４ｂの例において「（株）斜め４５°」「企画」「企画部」「御中」を含むテキスト領域Ｂ２１～Ｂ２４は互いに所定距離内に配置されているとする。このため、結合部２１ｇは、４つのテキスト領域Ｂ２１～Ｂ２４を互いに結合可能なテキスト領域として認識する。符号Ｒ１は、テキスト領域Ｂ２１～Ｂ２４を結合せずに実行されたＯＣＲの結果の例を示す。符号Ｒ２は、結合部２１ｇによってテキスト領域Ｂ２１とテキスト領域Ｂ２２とが結合された結合テキスト領域Ｂ２ａ、及び、テキスト領域Ｂ２３とテキスト領域２４とが結合された結合テキスト領域Ｂ２ｂに対してそれぞれＯＣＲを実行した場合に得られる結果を示し、符号Ｒ３は、４つのテキスト領域Ｂ２１～Ｂ２４を全て結合した結合テキスト領域に対してＯＣＲを実行した場合に得られる結果を示している。会計記録データ２５ｂのあるレコードに含まれる取引先名称に「株斜め４５°企画」が含まれている場合、テキスト領域Ｂ２１～Ｂ２４に個別にＯＣＲを行ったＯＣＲ結果Ｒ１と当該レコードとをマッチングしても、当該レコード内にＯＣＲ結果Ｒ１が示すテキストデータとは不一致となる。これに対して、結合部２１ｇによって結合テキスト領域Ｂ２ａ、Ｂ２ｂを生成し、この結合テキスト領域Ｂ２ａ、Ｂ２ｂにＯＣＲを行ったＯＣＲ結果Ｒ２と当該レコードとをマッチングすると、ＯＣＲ結果Ｒ２は、テキスト領域Ｂ２ａから生成された「株斜め４５°企画」のテキストデータを含んでいるため、ＯＣＲ結果Ｒ２は、当該レコード内の取引先名称として格納されている「株斜め４５°企画」と一致すると判定される。結合部２１ｇによって生成された結合テキスト領域Ｂ２にＯＣＲを行ったＯＣＲ結果Ｒ３と当該レコードとをマッチングすると、ＯＣＲ結果Ｒ３は、「株斜め４５°企画」のテキストデータを含んでいるため、ＯＣＲ結果Ｒ２は、当該レコード内の取引先名称として格納されている「株斜め４５°企画」と一致する（または、レコード内の取引先名称を包含している）と判定される。

　図１５の実施形態においては、会計記録データ２５ｂを参照して、結合テキストデータを生成するか否かが判断される。具体的には、結合部２１ｇは、テキスト領域Ｂ１１に含まれる「株式会社Alpha」とテキスト領域Ｂ１２に含まれる「セキュリティーズ」のいずれもが、会計記録データ２５ｂのうち証憑画像２２５ａ１に関連するレコードの同じ１つのフィールドに格納されている場合には、両者に含まれるテキストを結合した「株式会社Alphaセキュリティーズ」が株式会社Ｘの取引先である可能性が高い。そこで、テキスト領域Ｂ１１に含まれる「株式会社Alpha」とテキスト領域Ｂ１２に含まれる「セキュリティーズ」のいずれもが会計記録データ２５ｂのうち証憑画像２２５ａ１に関連するレコードの同じ１つのフィールドに格納されている場合に両者を結合して結合テキストデータを生成することで、結合を行わない場合に起こる誤った不一致判定を防止できる。

　図１６の実施形態においては、先行するテキスト領域Ｂ１１の末尾に改行が存在するか否かによって結合テキストデータを生成するか否かが判断される。具体的には、結合部２１ｇは、先行するテキスト領域Ｂ１１の末尾に改行コードが付されているか否かを検出する。改行コードが検出されない場合には、テキスト領域Ｂ１１に含まれるテキストは次行にまたがる一つの語又は文章の途中でありテキスト領域Ｂ１１の末尾で区切られることは意図されていないと考えられる。そこで、結合部２１ｇは、先行するテキスト領域Ｂ１１の末尾に改行コードが付されている場合には、テキスト領域Ｂ１１と、その次の行に存在するテキスト領域Ｂ１２とを別個のテキスト領域として扱い、結合テキストデータの生成を行わない。逆に、先行するテキスト領域Ｂ１１の末尾に改行コードが付されていない場合には、テキスト領域Ｂ１１に含まれる語または文章は、分断されることなくテキスト領域Ｂ１２の先頭まで続いていると考えられる。よって、結合部２１ｇは、先行するテキスト領域Ｂ１１の末尾に改行コードが付されていない場合に、テキスト領域Ｂ１１に含まれるテキストと、テキスト領域Ｂ１１の次の行の先頭にあるテキスト領域Ｂ１２に含まれるテキストとを結合して結合テキストを生成することができる。

　結合テキストを生成して取引のレコードと比較する場合、結合テキストを包含するテキスト領域を画定する境界ボックスを画面に表示してもよい。例えば、図１３、図１４ａ、図１５、図１６ａにおけるテキスト領域Ｂ１を画定する境界ボックス及び図１４ｂに示されているテキスト領域Ｂ２ａ、Ｂ２ｂ、Ｂ２をそれぞれ画定する境界ボックスが画面に表示されてもよい。

　図１６ａに示されている例のように、改行前後のテキスト領域を互いに結合すると、そのように結合された結合テキスト領域を画定する境界ボックスは不必要に大きくなることがある。そこで、結合テキスト領域を画定する結合ボックスは、分割して表示されてもよい。図１６ａに示されている例では、テキスト領域Ｂ１１に対応する境界ボックス及びテキスト領域Ｂ１２に対応する境界ボックスを分割して表示してもよい。テキスト領域Ｂ１１に対応する境界ボックスとテキスト領域Ｂ１２に対応する境界ボックスとを分割して表示する場合には、両者の関連性を示すために、双方の境界ボックスを同じ線種（実線、破線、など）及び／又は同じ色で表示して統一感を表現してもよい。

　３つ以上のテキスト領域を結合することもできる。図１６ｂには、テキスト領域Ｂ１１、Ｂ１２、Ｂ１３の３つのテキスト領域が結合される例を示す。図示されているように、３つのテキスト領域を結合する場合、この３つのテキスト領域のうちの２つのテキスト領域Ｂ１１及びＢ１２を囲む境界ボックスと、残りのテキスト領域Ｂ１３を囲む別の境界ボックスと、を表示してもよい。図１６ｂの例において、Ｔｅｘｔ１、Ｔｅｘｔ２、及びＴｅｘｔ３は結合テキストを構成するが、互いに近くに配置されているＴｅｘｔ２及びＴｅｘｔ３を囲む第１の境界ボックスと、Ｔｅｘｔ２及びＴｅｘｔ３から離れた位置にあるＴｅｘｔ１を囲む第２の境界ボックスで、Ｔｅｘｔ１、Ｔｅｘｔ２、及びＴｅｘｔ３が結合された結合テキストを含む結合テキスト領域が画定されている。

　図１７の実施形態においては、テキスト領域Ｃ１１に「Tomatoes」が含まれ、テキスト領域Ｃ１２に「2 Units」が含まれ、テキスト領域Ｃ１３に「Bananas」が含まれている。通常のレイアウト解析では、Ｃ１１～Ｃ１３は、３つの異なるテキスト領域として認識される。また、テキスト領域Ｃ３に「Milk　1Unit」が含まれている。図１７の実施形態では、テキスト領域Ｃ１２に含まれている「2 Units」が「Tomatoes」と「Bananas」の双方の個数を示していると考えられる。そこで、結合部２１ｇは、テキスト領域Ｃ１１～Ｃ１３の論理的な構造を解析し、テキスト領域Ｃ１１に含まれる「Tomatoes」とテキスト領域Ｃ１２に含まれる「2 Units」とを結合し、また、テキスト領域Ｃ１３に含まれる「Bananas」とテキスト領域Ｃ１２に含まれる「2 Units」とを結合することができる。

　図１７に示されているように、結合部２１ｇは、ＯＣＲを行う際のテキスト領域の設定時にテキスト領域Ｃ１１とテキスト領域Ｃ１２とを結合して一つの結合テキスト領域Ｃ１を設定するとともに、テキスト領域Ｃ１３とテキスト領域Ｃ１２とを結合して別の結合テキスト領域Ｃ２を設定することができる。この場合、結合テキスト領域Ｃ１に含まれる字画をまとめて文字認識することができ、また、結合テキスト領域Ｃ２に含まれる字画をまとめて文字認識することができる。結合部２１ｇは、テキスト領域Ｃ１１～Ｃ１３の各々において個別に文字認識された「Tomatoes」、「2 Units」、「Bananas」のうち、「Tomatoes」と「2 Units」とを結合して第１の結合テキストデータを生成するとともに、「Bananas」と「2 Units」とを結合して第２の結合テキストデータを生成してもよい。

　図１８に図１７の実施形態の変形例を示す。図１８に示されている実施形態では、文字認識部２１ｂがテキスト領域を設定する際に、「2 Units」がテキスト領域Ｃ１とテキスト領域Ｃ２のいずれにも含まれるように設定される。図１８の実施形態によれば、テキスト領域の設定時に証憑画像に含まれる文字の論理的な構造を解析して、「2 Units」が「Tomatoes」及び「Bananas」の両方と結合するようにテキスト領域Ｃ１、Ｃ２が設定される。

　本明細書中で説明される処理及び手順が単一の装置、ソフトウェア、コンポーネント、モジュールによって実行される旨が説明されたとしても、そのような処理または手順は複数の装置、複数のソフトウェア、複数のコンポーネント、及び／又は複数のモジュールによって実行され得る。また、本明細書中で説明されるデータ、テーブル、又はデータベースが単一の記憶装置（ストレージやメモリ）に格納される旨説明されたとしても、そのようなデータ、テーブル、又はデータベースは、単一の装置に備えられた複数の記憶装置または複数の装置に分散して配置された複数の記憶装置に分散して格納され得る。さらに、本明細書において説明されるソフトウェアおよびハードウェアの要素は、それらをより少ない構成要素に統合して、またはより多い構成要素に分解することによって実現することも可能である。

　プロセッサ１１で実行されるプログラムは、図示されているストレージ以外にも様々なタイプの非一時的なコンピュータ可読媒体（non-transitory computer readable medium）に格納され得る。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体（tangible storage medium）を含む。非一時的なコンピュータ可読媒体の例には、磁気記録媒体（例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ）、光磁気記録媒体（例えば光磁気ディスク）、Compact Disc Read Only Memory（CD-ROM）、CD-R、CD-R/W、半導体メモリ（例えば、マスクROM、Programmable ROM（PROM）、Erasable PROM（EPROM）、フラッシュROM、Random Access Memory（RAM））を含む。

　監査支援システム１において、データの格納場所には特段の制限はない。例えば、ストレージ１５に記憶され得る各種データは、オンプレミス環境５内又はオンプレミス環境５外のストレージ１５とは物理的に別体のストレージやデータベースサーバに格納されてもよい。つまり、本明細書において、ストレージ１５に記憶されると説明されているデータは、単一のストレージに記憶されてもよいし、複数のストレージに分散して記憶されてもよい。また、本明細書及び特許請求の範囲において、単に「ストレージ」という場合には、文脈上許される限り、単一のストレージと複数のストレージの集合のいずれを指し示すこともある。

　本明細書で説明された実施形態において、ＯＣＲは、証憑画像から生成された編集済画像に対して行われるが、説明の簡潔さのために編集済画像の生成の有無が重要でない場合には、単に証憑画像にＯＣＲを行うと説明されることもある。証憑画像にＯＣＲを行うと説明される場合でも、そのような説明は、証憑画像に対して編集処理を行った後の編集済画像に対してＯＣＲが行われる態様を包含する説明と解釈することができる。

　本明細書に開示されている複数の実施形態を組み合わせることにより、その組み合わされた態様を、本発明のさらに別の実施形態とすることができる。

　本明細書等における「第１」、「第２」、「第３」などの表記は、構成要素を識別するために付するものであり、必ずしも、数、順序、もしくはその内容を限定するものではない。また、構成要素の識別のための番号は文脈毎に用いられ、一つの文脈で用いた番号が、他の文脈で必ずしも同一の構成を示すとは限らない。また、ある番号で識別された構成要素が、他の番号で識別された構成要素の機能を兼ねることを妨げるものではない。

　本明細書において単数形で表される構成要素は、矛盾を生じさせない限り、複数形を含むものとする。

　１　監査支援システム
　１０　ユーザ装置
　２０　監査支援装置

Claims

　一又は複数のプロセッサを備え、前記一又は複数のプロセッサに、
　画像に第１編集処理を行って得られる第１編集済画像に光学文字認識を行うことで第１テキストデータセットを生成する機能と、
　前記第１テキストデータセットと基準データセットとのマッチングを行うことにより第１マッチングスコアを算出する機能と、
　前記画像に第２編集処理を行って得られる第２編集済画像に光学文字認識を行うことで第２テキストデータセットを生成する機能と、
　前記第２テキストデータセットと前記基準データセットとのマッチングを行うことにより第２マッチングスコアを算出する機能と、
　を実行させるシステム。
　前記一又は複数のプロセッサに、
　前記第１マッチングスコア及び前記第２マッチングスコアに基づいて、前記第１テキストデータセット又は前記第２テキストデータセットのいずれかを適合テキストデータセットとして選択する機能をさらに実行させる、
　請求項１に記載のシステム。
　前記第１編集処理及び前記第２編集処理の一方は、前記画像から罫線を削除する罫線削除処理と、罫線削除処理済みの画像内の字画を含むテキスト領域を検出するテキスト領域検出処理と、を含み、
　前記第１編集処理及び前記第２編集処理の他方は、前記画像に含まれる表を認識する表認識処理を含む、
　請求項１又は２に記載のシステム。
　前記第１編集処理は、前記第２編集処理が含む編集処理と相反する編集処理を含む、
　請求項１から３のいずれか１項に記載のシステム。
　前記第１編集済画像は、前記画像に前記第１編集処理に加えて第３編集処理（Ｓ２）を行うことで生成され、
　前記第２編集済画像は、前記画像に前記第２編集処理に加えて前記第３編集処理を行うことで生成される、
　請求項１から４のいずれか１項に記載のプログラム。
　前記第１テキストデータセットは、前記第１編集済画像に光学文字認識を行って生成された第１仮テキストデータセットに、前記基準データセットに基づいて第１補正処理を行うことにより生成される、
　請求項１から５のいずれか１項に記載のシステム。
　前記一又は複数のプロセッサに、前記適合データセットに基づいて生成されるマッチング結果を表示させる機能をさらに実行させ、
　前記マッチング結果は、前記適合テキストデータセットに含まれる第１認識テキスト要素が前記基準データセットに含まれる第１基準テキスト要素と一致するか否かを示す一致フラグを含む、
　請求項１から６のいずれか１項に記載のシステム。
　前記マッチング結果においては、前記第１認識テキスト要素と前記第１基準テキスト要素とが対応付けられている、
　請求項７に記載のシステム。
　前記一又は複数のプロセッサに、前記第１認識テキスト要素が前記第１基準テキスト要素と一致しない場合に、前記第１認識テキスト要素を訂正するための訂正入力を受け付ける機能をさらに実行させる、
　請求項７又は８に記載のシステム。
　前記マッチング結果は、前記画像のビューを含み、
　前記画像のビューは、前記第１認識テキスト要素に対応する第１字画と、前記第１字画が含まれる第１テキスト領域を画定する第１境界線と、を含む、
　請求項７から９のいずれか１項に記載のシステム。
　前記適合テキストデータセットが前記第１認識テキスト要素と同一の第２認識テキスト要素を含む場合、前記第１マッチングスコアの算出及び前記第２マッチングスコアの算出は、前記第１認識テキスト要素を前記基準データセットに含まれる複数の基準テキスト要素のうち前記第１認識テキスト要素に割り当てられている第１データ種別と同一のデータ種別が割り当てられている前記第１基準テキスト要素と比較することで行われる、
　請求項７から１０のいずれか１項に記載のシステム。
　前記適合テキストデータセットの前記第１認識テキスト要素の前記データ種別は、前記複数のデータ要素の各々に付されているタグに基づいて決定される、
　請求項１１に記載のシステム。
　前記適合テキストデータセットの前記第１認識テキスト要素の前記データ種別は、前記画像において前記第１認識テキスト要素に対応する第１字画の近傍に配置されているデータ種別字画に基づいて定められる、
　請求項１１に記載のシステム。
　一又は複数のプロセッサを備え、前記一又は複数のプロセッサに、
　画像に光学文字認識を行うことで、前記画像に含まれる第１テキスト領域に含まれる第１字画に対応する第１テキストデータと、前記画像に含まれる第２テキスト領域に含まれる第２字画に対応する第２テキストデータと、を結合して結合テキストデータを生成する機能と、
　前記結合テキストデータと前記基準データセットに含まれる基準テキスト要素とのマッチングを行う機能と、
　を備えるシステム。
　前記結合テキストデータは、前記第１テキスト領域と前記第２テキスト領域との間の距離が基準距離以下の場合に生成される、
　請求項１４に記載のシステム。
　前記結合テキストデータは、前記第１テキストデータ及び前記第２テキストデータがいずれも前記基準データセットに含まれる場合に生成される、
　請求項１４又は１５に記載のシステム。
　前記結合テキストデータは、前記第１テキストデータの末尾に改行コードが検出されない場合に生成される、
　請求項１４から１６のいずれか１項に記載のシステム。
　前記テキストデータセットは、前記画像に含まれる第３テキスト領域に含まれる第３字画に対応する第３テキストデータをさらに含み、
　前記一又は複数のプロセッサに、前記第３テキストデータと前記第２テキストデータとを結合して他の結合テキストデータを生成する機能をさらに実行させる、
　請求項１４から１７のいずれか１項に記載のシステム。
　前記画像に第３字画が含まれ、
　前記第１テキスト領域及び前記第２テキスト領域は、いずれも前記第３字画を含むように設定される、
　請求項１４から１８のいずれか１項に記載のシステム。
　前記一又は複数のプロセッサに、前記第１テキスト領域と前記第２テキスト領域とを結合させた結合テキスト領域を画定する境界線を重ねた合成画像を表示する機能を実行させる、
　請求項１４から１９のいずれか１項に記載のシステム。
　前記基準データセットは、複数の取引を記録した会計記録データであり、
　前記画像は、前記取引の内容を示す証憑書類を示す証憑画像である、
　請求項１から２０のいずれか１項に記載のシステム。
　前記会計記録データは、第１会計記録データセットと第２会計記録データセットとを含み、
　前記証憑画像は、前記第１会計記録データセット及び前記第２会計記録データセットにそれぞれ対応付けられる、
　請求項２１に記載のシステム。
　前記選択する機能は、前記会計記録データに含まれる前記複数の取引のそれぞれについて算出された前記画像の前記第１マッチングスコア及び前記第２マッチングスコアのうち最大のスコアを与える取引を前記画像に対応する取引として特定し、かつ、当該最大のスコアを与えた方のマッチングスコアに対応するテキストデータセットを当該取引に対応する適合テキストデータセットとして選択する機能を含む、
　請求項２１に記載のシステム。
　一又は複数のプロセッサに、
　画像に第１編集処理を行って得られる第１編集済画像に光学文字認識を行うことで第１テキストデータセットを生成する機能と、
　前記第１テキストデータセットと前記画像に関連する基準データセットとのマッチングを行うことにより第１マッチングスコアを算出する機能と、
　前記画像に第２編集処理を行って得られる第２編集済画像に光学文字認識を行うことで第２テキストデータセットを生成する機能と、
　前記第２テキストデータセットと前記基準データセットとのマッチングを行うことにより第２マッチングスコアを算出する機能と、
　を実行させるプログラム。
　一又は複数のコンピュータプロセッサがコンピュータ読み取り可能な命令を実行することにより実行される方法であって、
　画像に第１編集処理を行って得られる第１編集済画像に光学文字認識を行うことで第１テキストデータセットを生成する工程と、
　前記第１テキストデータセットと前記画像に関連する基準データセットとのマッチングを行うことにより第１マッチングスコアを算出する工程と、
　前記画像に第２編集処理を行って得られる第２編集済画像に光学文字認識を行うことで第２テキストデータセットを生成する工程と、
　前記第２テキストデータセットと前記基準データセットとのマッチングを行うことにより第２マッチングスコアを算出する工程と、
　を備える方法。