JP2022037632A - 検査装置、検査プログラム、検査方法 - Google Patents

検査装置、検査プログラム、検査方法 Download PDF

Info

Publication number
JP2022037632A
JP2022037632A JP2020141864A JP2020141864A JP2022037632A JP 2022037632 A JP2022037632 A JP 2022037632A JP 2020141864 A JP2020141864 A JP 2020141864A JP 2020141864 A JP2020141864 A JP 2020141864A JP 2022037632 A JP2022037632 A JP 2022037632A
Authority
JP
Japan
Prior art keywords
document
unit
key
storage unit
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020141864A
Other languages
English (en)
Other versions
JP7574572B2 (ja
Inventor
昌希 内田
Masaki Uchida
錬 松山
Ren Matsuyama
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP2020141864A priority Critical patent/JP7574572B2/ja
Publication of JP2022037632A publication Critical patent/JP2022037632A/ja
Application granted granted Critical
Publication of JP7574572B2 publication Critical patent/JP7574572B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

【課題】各書類にマークを付すことなく、複数の書類に異なる顧客のものが混入していないか否かを検査可能な検査装置等を提供する。【解決手段】検査装置と、撮像装置3が夫々接続されている複数の端末2とがネットワークにより互いに通信可能に接続されている検査システムにおいて、検査装置1は、複数書類画像を取得する取得部と、特徴データ及び書類種別を対応付けて記憶した記憶部を参照し、取得した複数書類画像及び特徴データに基づき、書類画像毎に含まれる書類の書類種別を認識する認識部と、書類種別が基準書類である書類画像から基準キーを抽出し、書類種別が照合書類である書類画像から参照キーを抽出する抽出部と、抽出した参照キーが全て基準キーと一致するか否かを判定する判定部と、判定した結果を出力する出力部と、を備える。【選択図】図16

Description

本発明は、書類を検査する検査装置等に関する。
自社には運用ノウハウがない業務を一括して外部業者へ委託するBPO(Business Process Outsourcing)が行われている。BPO業務の中には、委託元の顧客データをパーソナルな印刷物として製造し、封入封緘を行うプリントサービスがある。プリントサービスにおいては、個人情報が記載された書類を複数、各顧客に送付する場合がある。この場合、異なる顧客に対する書類が混入して送付されてしまうと、委託元は顧客からの信頼を失うことになる。そのため、プリントサービスにおいては、封入封緘前に書類一式を目視で確認し、書類の混入がないかを検査しており、工数を要している。
そのような状況に対して、同一の封筒に封入される複数の書類に対して同じパターンとなるように穿孔パターンを設定し、書類の封入後に穿孔パターンを検査することで、異なる顧客に対する書類が封入された封筒を検出する封筒検査システムが提案されている(特許文献1)。
特開2013-193777号公報
しかしながら、各書類に穿孔パターン等のマークを付すのは作業の都合であり、書類の美観を損ねるため、委託元から許可を得るのは困難である。
本発明はこのような状況に鑑みてなされたものである。その目的は、各書類にマークを付すことなく、複数の書類に異なる顧客のものが混入してないか否かを検査可能な検査装置等の提供である。
本願の一態様に係る検査装置は、複数書類画像を取得する取得部と、特徴データ及び書類種別を対応付けて記憶した記憶部を参照し、取得した前記複数書類画像及び特徴データに基づき、書類画像毎に含まれる前記書類の前記書類種別を認識する認識部と、前記書類種別が基準書類である前記書類画像から基準キーを抽出し、前記書類種別が照合書類である前記書類画像から参照キーを抽出する抽出部と、抽出した前記参照キーが全て前記基準キーと一致するか否かを判定する判定部と、判定した結果を出力する出力部とを備えることを特徴とする。
本願の一態様にあっては、各書類にマークを付すことなく、複数の書類に異なる顧客のものが混入していないか否かを検査可能となる。
検査システムの構成例を示す説明図である。 検査装置のハードウェア構成例を示すブロック図である。 端末のハードウェア構成例を示すブロック図である。 作業マスターDBの例を示す説明図である。 付帯情報DBの例を示す説明図である。 履歴DBの例を示す説明図である。 作業状況DBの例を示す説明図である。 訓練データDBの例を示す説明図である。 業務手順の例を示すフローチャートである。 業務手順の他の例を示すフローチャートである。 照合処理の手順例を示すフローチャートである。 学習モデルの生成処理に関する説明図である。 学習モデル生成処理の手順例を示すフローチャートである。 照合結果画面の例を示す説明図である。 照合結果画面の例を示す説明図である。 検査装置が備える機能部の一例を示すブロック図である。
(実施の形態1)
以下実施の形態を、図面を参照して説明する。図1は検査システムの構成例を示す説明図である。検査システム100は検査装置1、端末2、撮像装置3を含む。検査装置1及び端末2はネットワークNにより、互いに通信可能に接続されている。
検査装置1はサーバコンピュータ、PC(Personal Computer)等で構成する。また、検査装置1を複数のコンピュータからなるマルチコンピュータ、ソフトウェアによって仮想的に構築された仮想マシン又は量子コンピュータで構成してもよい。さらに、検査装置
1の機能をクラウドサービスで実現してもよい。
端末2はノートパソコン、パネルコンピュータ、タブレットコンピュータ又はスマートフォン等で構成する。撮像装置3はデジタルカメラ又はスキャナ等で構成する。撮像装置3は複数のデジタルカメラで構成してもよい。また、撮像装置3はフィーダ付きのスキャナやハンディスキャナ等で構成してもよい。図1において、撮像装置3は端末2に接続されているが、ネットワークNに接続されていてもよい。
図1において、端末2は2台記載しているが、1台でもよいし3台以上でもよい。同様に、撮像装置3は1台でもよいし3台以上でもよい。
図2は検査装置のハードウェア構成例を示すブロック図である。検査装置1は、制御部11、主記憶部12、補助記憶部13、通信部15、計時部16及び読み取り部17を含む。制御部11、主記憶部12、補助記憶部13、通信部15、計時部16及び読み取り部17はバスBにより接続されている。
制御部11は、一又は複数のCPU(Central Processing Unit)、MPU(Micro-Processing Unit)、GPU(Graphics Processing Unit)等の演算処理装置を有する。制御部11は、補助記憶部13に記憶された制御プログラム1P(検査プログラム)を読み出して実行することにより、検査装置1に係る種々の情報処理、制御処理等を行い、取得部、認識部、抽出部、判定部及び出力部等の機能部を実現する。
主記憶部12は、SRAM(Static Random Access Memory)、DRAM(Dynamic Random Access Memory)、フラッシュメモリ等である。主記憶部12は主として制御部11が演算処理を実行するために必要なデータを一時的に記憶する。
補助記憶部13はハードディスク又はSSD(Solid State Drive)等であり、制御部11が処理を実行するために必要な制御プログラム1Pや各種DB(Database)を記憶する。補助記憶部13は、作業マスターDB131、付帯情報DB132、履歴DB133、作業状況DB134及び訓練データDB135を記憶する。また、補助記憶部13は学習モデル141を記憶する。補助記憶部13は検査装置1に接続された外部記憶装置であってもよい。補助記憶部13に記憶する各種DB等を、検査装置1とは異なるデータベースサーバやクラウドストレージに記憶してもよい。
通信部15はネットワークNを介して、端末2と通信を行う。また、制御部11が通信部15を用い、ネットワークN等を介して他のコンピュータから制御プログラム1Pをダウンロードし、補助記憶部13に記憶してもよい。
計時部16は時刻又は検査装置1が起動してからの経過時間等の時間を計時する。計時部16は制御部11からの求めに応じて、計時結果を制御部11に与える回路である。計時部16は、信頼できるNTPサーバとNTP(Network Time Protocol)を用いた通信を繰り返し行い、時刻補正を行なうことが望ましい。
読み取り部17はCD(Compact Disc)-ROM及びDVD(Digital Versatile Disc)-ROMを含む可搬型記憶媒体1aを読み取る。制御部11が読み取り部17を介して、制御プログラム1Pを可搬型記憶媒体1aより読み取り、補助記憶部13に記憶してもよい。また、ネットワークN等を介して他のコンピュータから制御部11が制御プログラム1Pをダウンロードし、補助記憶部13に記憶してもよい。さらにまた、半導体メモリ1bから、制御部11が制御プログラム1Pを読み込んでもよい。
図3は端末のハードウェア構成例を示すブロック図である。端末2は制御部21、主記憶部22、補助記憶部23、通信部24、入力部25、表示部26、インタフェース部27及び計時部28を含む。各構成はバスBで接続されている。
制御部21は、一又は複数のCPU、MPU、GPU等の演算処理装置を有する。制御部21は、補助記憶部23に記憶された制御プログラム2Pを読み出して実行することにより、端末2に係る種々の情報処理、制御処理等を行う。
主記憶部22は、SRAM、DRAM、フラッシュメモリ等である。主記憶部22は主として制御部21が演算処理を実行するために必要なデータを一時的に記憶する。
補助記憶部23はハードディスク又はSSD等であり、制御部21が処理を実行するために必要な制御プログラム2Pや各種データを記憶する。
通信部24はネットワークNを介して、検査装置1と通信を行う。また、制御部21が通信部24を用い、ネットワークN等を介して他のコンピュータから制御プログラム2Pをダウンロードし、補助記憶部23に記憶してもよい。
入力部25はキーボードやマウスである。表示部26は液晶表示パネル等を含む。表示部26は書類の検査結果などを表示する。表示部26は検査結果がエラーとなった場合、エラー箇所、エラー内容を表示する。表示部26と入力部25とを一体化し、タッチパネルディスプレイとしてもよい。なお、端末2は外部の表示装置に表示を行ってもよい。
インタフェース部27は、USB(Universal Serial Bus)、IEEE(Institute of Electrical and Electronics Engineers)1394等の規格に沿ったデータ通信を行なう。インタフェース部27は撮像装置3から画像を受け取る。
計時部28は時刻又は端末2が起動してからの経過時間等の時間を計時する。計時部28は制御部21からの求めに応じて、計時結果を制御部21に与える回路である。計時部28が保持する時刻と、検査装置1の計時部16が保持する時刻とは、同期が取れていることが望ましい。
次に、検査システム100が用いるデータベースについて説明する。図4は作業マスターDB131の例を示す説明図である。作業マスターDB131は作業フローに関する情報を記憶する。作業マスターDB131は作業コード列及び作業名列を含む。作業コード列は作業フローを一意に特定する作業コードを記憶する。作業名列は作業フローの名称を記憶する。
図5は付帯情報DB132の例を示す説明図である。付帯情報DB132は書類に関する付帯情報を記憶する。付帯情報DB132は作業コード列、書類認識情報列、書類種別列、書類名列、キー領域座標列、配置箇所列及び順序列を含む。作業コード列は作業コードを記憶する。書類認識情報列は書類種別を認識する際に参照されるデータを記憶する。例えば、学習モデル141を用いて書類種別を認識する場合、書類認識情報列は出力ラベルの情報を記憶する。画像のパターンマッチングにより書類種別を認識する場合、書類認識情報列は基準画像を記憶する。書類種別列は書類種別を記憶する。書類種別は例えば、基準、照合又は汎用である。基準とはキーの参照の際に、基準となる書類(基準書類)を示す。基準書類に記載のキー(基準キー)と異なるキーが記載された書類はエラーとなる。照合はキーの参照の際に、基準キーと比較されるキーが記載された書類(参照書類)を示す。汎用とはキーの記載のない汎用的な書類(汎用書類)を示す。なお、本明細書において、汎用書類には封筒を含むものとする。書類名列は書類の名称を記憶する。キー領域座標列は書類毎の画像(以下、「書類画像」という。)においてキー領域を示す座標を記憶する。例えばキー領域は矩形状として、矩形の対角線の端点2つの座標値を記憶する。キー領域が複数箇所にわたる場合は、「キー1」、「キー2」のように順番号を含むラベルを座標値に付す。配置箇所列は書類を作業台上に並べる際の正しい位置を記憶する。作業台上に書類を並べるためのスペースを確保し、当該スペースを複数の領域に分けて、順番号を含むラベルを付す。順序列は、書類画像を取得する撮像装置3がスキャナである場合、書類をスキャンする順番を記憶する。書類の順番は、複数の書類を封筒に封入する際の重ね順を示す。順番号1の書類を最も上に、その下に順番号2の書類、順番号3の書類、…というような要領で書類重ねて封筒に封入する。
図6は履歴DB133の例を示す説明図である。履歴DB133は照合作業の履歴を記憶する。履歴DB133は作業コード列、照合日時列、照合結果列、キー列、エラー列、エラー箇所列、第1作業者列及び第2作業者列を含む。作業コード列は作業コードを記憶する。照合日時列は照合作業を行った日時を記憶する。照合結果列は照合結果を記憶する。照合に成功した場合、照合結果列は例えばOKを記憶する。OK以外の値、例えば○や1等を照合結果列に記憶してもよい。照合に失敗した場合、照合結果列はNGを記憶する。NG以外の値、例えば×や0等を照合結果列に記憶してもよい。キー列は照合に使用された基準キーを記憶する。エラー列は照合に失敗した場合のエラー内容を記憶する。照合書類のキーが基準キーと一致しなかった場合、エラー列は例えばキー不一致を記憶する。書類の配置が間違っていた場合、エラー列は例えば配置誤りを記憶する。各エラー内容にコードをふり、エラー列はコードを記憶してもよい。照合に成功した場合、エラー列は-、NULL、0等を記憶する。エラー箇所列はエラー箇所を記憶する。書類を作業台上に並べた場合、エラーが発生した領域のラベル又は順番号をエラー箇所列は記憶する。書類をスキャナでスキャンした場合、エラーを発した書類の順番号をエラー箇所列は記憶する。第1作業者列及び第2作業者列は作業を担当した作業員を一意に特定可能な社員IDや作業員ID等をそれぞれ記憶する。
図7は作業状況DB134の例を示す説明図である。作業状況DB134は作業状況を記憶する。作業状況DB134は作業コード列、作業名列、作業日列、第1作業者列、第2作業者列、照合回数列、OK列及びNG列を含む。作業コード列は作業コードを記憶する。作業名列は作業フローの名称を記憶する。作業日列は作業日を記憶する。第1作業者列及び第2作業者列は作業者の社員ID等を記憶する。照合回数列は照合を行った回数を記憶する。OK列は照合に成功した回数を記憶する。NG列は照合に失敗した回数を記憶する。作業状況DBは当日の作業状況を記憶する。当該作業状況は端末2の表示部26の表示に利用される。そのため作業状況DB134は当日分の1レコードのみを記憶してもよい。この場合、作業日列は必須ではない。また、OK列及びNG列も必須ではない。照合に成功した回数及び照合に失敗した回数は、履歴DB133より求まるからである。
図8は訓練データDB135の例を示す説明図である。訓練データDB135は学習モデル141を生成又は再学習するための訓練データを記憶する。訓練データDB135は作業コード列、画像列、正解ラベル列を含む。作業コード列は作業コードを記憶する。画像列は書類画像を記憶する。書類画像の実体を補助記憶部13にファイルとして記憶し、画像列はファイル名を記憶してもよい。正解ラベル列は書類画像に対応する書類種別の正解ラベルを記憶する。
次に、検査システム100での業務手順について説明する。図9は業務手順の例を示すフローチャートである。図9に示す業務手順は、撮像装置3が卓上カメラであって、作業台に配置した書類一式を当該卓上カメラで撮影する場合の業務フローである。作業者は検査プログラムを起動し、作業者IDの入力、作業フローを選択する(ステップS1)。作業者は作業台上に、書類一式を配置する(ステップS2)。作業者は書類を撮影する(ステップS3)。撮影後、検査システム100に照合を行わせる(ステップS4)。作業者は検査システム100が返答した照合結果を確認する(ステップS5)。作業者は照合結果が成功であるか否かを確認する(ステップS6)。作業者は照合結果が成功であることを確認した場合(ステップS6でYES)、書類を封筒に封入し封緘する(ステップS7)。作業者は作業を終了するか否か判断する(ステップS8)。作業者は作業を継続すると判断した場合(ステップS8でNO)、ステップS2に戻り、未処理の書類についての作業を行なう。作業者は作業を終了すると判断した場合(ステップS8でYES)、終了する。作業者は照合結果が失敗であることを確認した場合(ステップS6でNO)、エラーメッセージを参照の上、対応を行なう(ステップS9)。作業者はステップS3に戻り、再度、検査を行なう。なお、作業台に配置する書類は、すぐに封入可能なように大きな書類については折り畳まれていることが望ましい。そして、基準書類又は照合書類は、折り畳まれている状態で、視認可能である位置にキー領域があり、キー領域が撮影されるように配置する。作業台上に、書類一式を配置する際、ロボットアーム等を用いてもよい。また、作業台上の書類の配置に誤りがあると判明した場合、ロボットアーム等を用いて、正しい配置となるように配列してもよい。
図10は業務手順の他の例を示すフローチャートである。図10に示す業務手順は、撮像装置3がスキャナであって、書類一式を構成する各書類をスキャンする場合の業務フローである。作業者は検査プログラムを起動し、作業者IDの入力、作業フローを選択する(ステップS11)。作業者は書類一式を構成する書類を順にスキャンする(ステップS12)。作業者は全ての書類をスキャンしたら、照合指示をする(ステップS13)。作業者は検査システム100が返答した照合結果を確認する(ステップS14)。作業者は照合結果が成功であるか否かを確認する(ステップS15)。作業者は照合結果が成功であることを確認した場合(ステップS15でYES)、書類を封筒に封入し封緘する(ステップS16)。作業者は作業を終了するか否か判断する(ステップS17)。作業者は作業を継続すると判断した場合(ステップS17でNO)、ステップS12に戻り、未処理の書類についての作業を行なう。作業者は作業を終了すると判断した場合(ステップS17でYES)、終了する。作業者は照合結果が失敗であることを確認した場合(ステップS15でNO)、エラーメッセージを参照の上、対応を行なう(ステップS18)。作業者はステップS12に戻り、再度、検査を行なう。なお、スキャンする書類は、すぐに封入可能なように大きな書類については折り畳まれていることが望ましい。そして、基準書類又は照合書類は、折り畳まれている状態で、視認可能である位置にキー領域があり、キー領域が読み取られるようにスキャンする。
続いて、検査システム100が行う情報処理について説明する。図11は照合処理の手順例を示すフローチャートである。検査装置1の制御部11は撮像装置3で撮影された画像を端末2から受信したことを契機に、照合処理を開始する。制御部11は受信した画像が単一画像であるか否かを判定する(ステップS31)。書類一式を卓上カメラで撮影した場合、受信画像は単一画像である。書類一式を構成する各書類をスキャナでスキャナした場合、受信画像は複数画像からなる画像群である。制御部11は受信した画像が単一画像でないと判定した場合(ステップS31でNO)、処理をステップS33へ進める。制御部11は受信した画像が単一画像であると判定した場合(ステップS31でYES)、受信した画像から各書類の画像を切り出す(ステップS32)。例えば、以下のように各書類の領域を検出する。作業台に緑色の布又はシートを敷き、その上に、書類を配置し撮影する。この場合、色情報における閾値処理で書類領域を検出可能である。画像のカラー情報(RGB値)を参照し、緑成分を示す値が大きい部分は背景であり、それ以外の部分は書類の領域と判定できる。また、公知のエッジ検出処理により、書類の輪郭線を検出し、輪郭線をもとに書類の領域を検出してもよい。なお、書類の領域は矩形状であることが前提であるので、検出した書類の領域が矩形となるように、台形補正処理を行ってもよい。制御部11は処理対象とする書類画像を選択する(ステップS33)。制御部11は書類種別の認識を行なう(ステップS34)。書類種別の認識は、学習モデル141に書類画像を入力し、学習モデル141が出力した各ラベルの値より判定する。学習モデル141については後述する。また、書類画像と、付帯情報DB132の書類認識情報列に記憶してある基準画像とを照合して、書類を判定してもよい。制御部11は書類種別が汎用書類であるか否かを判定する(ステップS35)。制御部11は書類種別が汎用書類であると判定した場合(ステップS35でYES)、処理をステップS38へ進める。制御部11は書類種別が汎用書類でないと判定した場合(ステップS35でNO)、付帯情報DB132のキー領域座標列の値に基づき、キー領域を抽出する(ステップS36)。制御部11はキー領域に対して、文字認識処理を行い、キーの認識を行なう(ステップS37)。なお、キー領域の抽出(ステップS36)は必須でない。キー領域の抽出を行わず、書類画像全体を対象に文字認識を行ってもよい。キー領域に対して文字領域の検出を行い、検出した文字領域に対して文字認識を行ってもよい。それにより、認識率の向上が期待される。制御部11は認識した書類種別、キー、及び、書類の配置位置又はスキャン順を対応付けて、一時記憶領域に記憶する(ステップS38)。一時記憶領域は、主記憶部12又は補助記憶部13に設ける。制御部11は未処理の書類画像があるか否かを判定する(ステップS39)。制御部11は未処理の書類画像があると判定した場合(ステップS39でYES)、処理をステップS33へ戻し、未処理の書類画像に対する処理を行なう。制御部11は未処理の書類画像がないと判定した場合(ステップS39でNO)、一時記憶領域に記憶した書類種別、及び、書類の配置位置又はスキャン順と、付帯情報DB132の書類種別、配置位置列又は順序列とを照合する(ステップS40)。制御部11は基準キーの照合を行なう(ステップS41)。制御部11は一時記憶領域に記憶した書類種別及びキーより、基準キー取得する。制御部11は一時記憶領域に記憶した書類種別及びキーより、照合書類のキー(照合キー)を取得する。制御部11は、全ての照合キーと基準キーとを照合し、全て一致しているかを判定する。制御部11は照合結果を出力する(ステップS42)。すべての書類の配置位置又は順序が正しく、全ての照合キーが基準キーと一致した場合、照合結果は成功となる。配置位置若しくは順序が正しくない書類がある場合、書類に過不足がある場合、又は、照合キーが基準キーと一致しない書類がある場合、照合結果は失敗となる。照合結果が失敗の場合、制御部11は失敗となった内容を出力する。制御部11は照合処理を終了する。ステップS42で照合結果を出力する際に、制御部11は履歴DB133に照合結果を履歴としてレコードを追加する。なお、キーの認識(ステップS37)において、文字認識は行わなくともよい。この場合、基準キーとの照合(ステップS41)において、基準キーの画像と照合キーの画像とを画像照合し、一致するか否かを判定する。
続いて、学習モデル141について説明する。図12は学習モデル141の生成処理に関する説明図である。図12は機械学習を行って学習モデル141を生成する処理を概念的に示している。検査装置1の制御部11は、学習モデル141として、各作業フローにおける各書類の画像について、その特徴量を学習するディープラーニングを行うことで、書類画像を入力とし、書類種別を出力とするニューラルネットワークを生成する。ニューラルネットワークは例えばCNN(Convolution Neural Network)であり、書類画像の入力を受け付ける入力層と、書類種別を出力する出力層と、書類画像の画像特徴量を抽出する中間層とを有する。
入力層は、書類画像に含まれる各画素の画素値の入力を受け付ける複数のニューロンを有し、入力された画素値を中間層に受け渡す。中間層は複数のニューロンを有し、書類画像内から特徴量を抽出して出力層に受け渡す。例えば、中間層は、入力層から入力された各画素の画素値を畳み込むコンボリューション層と、コンボリューション層で畳み込んだ画素値をマッピングするプーリング層とが交互に連結された構成を有し、書類画像の画素情報を圧縮しながら最終的に画像特徴量を抽出する。出力層は書類種別を出力する一又は複数のニューロンから成り、中間層から出力された画像特徴量に基づいて書類種別を出力する。なお、本実施の形態では学習モデル141はCNNであるとして説明するが、学習モデル141はCNNに限定されず、CNN以外のニューラルネットワークやSVM(Support Vector Machine)など他の学習アルゴリズムで構築されたモデルでもよく、パターンマッチングや決定木など学習モデルを使用せずに書類種別を判定してもよい。
制御部11は、複数の書類画像と、各書類画像に対する書類種別の正解値とが対応付けられた訓練データを用いて学習を行う。例えば図12に示すように、訓練データは、作業コード及び書類画像に対し、書類種別に対応する正解ラベルが付けされたデータである。ラベル0は基準書類を、ラベル1は照合書類を、ラベル2は汎用書類に対応する。
制御部11は、訓練データである書類画像を入力層に入力し、中間層での演算処理を経て、出力層から各ラベルの確率値を取得する。制御部11は、出力層から出力された各ラベルの確率値を正解値ラベルと比較し、出力層において正解ラベルからの確率値が1に近づくように、中間層での演算処理に用いるパラメータを最適化する。当該パラメータは、例えばニューロン間の重み(結合係数)、各ニューロンで用いられる活性化関数の係数などである。パラメータの最適化の方法は特に限定されないが、例えば制御部11は誤差逆伝播法を用いて各種パラメータの最適化を行う。制御部11は、訓練データに含まれる各書類画像について上記の処理を行い、学習モデル141を生成する。
図13は学習モデル141生成処理の手順例を示すフローチャートである。制御部11は訓練データDB135に記憶されている訓練データの一つを選択する(ステップS51)。制御部11は訓練データから正解ラベルを除いた入力データを抽出する(ステップS52)。制御部11は入力データをニューラルネットワークの入力層に入力する(ステップS53)。制御部11は出力データ、ラベル毎の確率値を出力層から取得する(ステップS54)。制御部11は、ラベル毎の確率値と正解ラベルとを比較し、出力層から出力される正解ラベルの確率値が1に近づくよう、中間層での演算処理に用いるパラメータ(重み等)を最適化する(ステップS55)。制御部11は未利用の訓練データがあるか否かを判定する(ステップS56)。制御部11は未利用の訓練データがあると判定した場合(ステップS56でYES)、処理をステップS51へ戻す。制御部11は未利用の訓練データがないと判定した場合(ステップS56でNO)、制御部11は、生成した学習モデル141を補助記憶部13に記憶し(ステップS57)、処理を終了する。
次に、端末2の表示部26に表示される画面について説明する。図14は照合結果画面の例を示す説明図である。図14は照合に成功した場合の画面例である。照合結果画面d01は名称領域d011、作業者領域d012、キー領域d013、メッセージ領域d014は結果表示領域d015及びカウンタ領域d016を含む。名称領域d011は作業フローの名称を表示する。作業者領域d012は作業者2名の作業者IDを表示する。キー領域d013は認識したキーを表形式で表示する。図14ではキー領域が2つある場合を示している。キー領域d013の最初の行は、認識したキーの値を表示している。その他の行は、キー領域の画像を書類毎に示す。KEYは基準キーの画像、SUB1、SUB2、SUB3は照合書類の照合キーの画像を表示する。メッセージ領域d014は照合結果を補足するメッセージを表示する。照合に成功した場合は何も表示しない。結果表示領域d015は照合結果を表示する。図14では照合の成功した場合の表示として丸を表示している。カウンタ領域d016は照合した回数を表示する。照合した回数は検査プログラムを起動した直後、及び作業フローを選択直後、0にリセットされる。照合した回数は、成功した回数及び失敗した回数を含む。成功した回数及び失敗した回数を個別に表示してもよい。
図15は照合結果画面の例を示す説明図である。図15は照合に失敗した場合の画面例である。画面の構成は図14と同様であるから、各領域の説明は省略する。図15の示す例では、SUB1で示す帳票のキーが基準キーと一致していないため、エラーとなっている。SUB1帳票がエラーであることを示すため、キー領域d013において、SUB1の行の背景がハッチングとなっている。実際の画面においては背景を赤色にしてもよい、また点滅表示としてもよい。メッセージ領域d014はエラーメッセージが表示されている。結果表示領域d015は照合に失敗したことを示すバツを表示している。
照合結果画面d01において、名称領域d011、作業者領域d012、カウンタ領域d016は、作業状況DB134に記憶しているデータに基づいて表示してもよい。作業状況DB134を端末2の補助記憶部23に記憶してもよい。
本実施の形態においては、複数の書類に異なる顧客のものが混入してないか否かを検査可能となる。また、照合に失敗した箇所を表示するので、作業者は失敗した箇所に対応する書類を確認の上、正しい書類に入れ替える作業を迅速に行えることが可能となる。
照合処理を検査装置1で行うのではなく、端末2で行ってもよい。この場合、作業マスターDB131、付帯情報DB132、作業状況DB134及び学習モデル141は、端末2の補助記憶部23に記憶する。照合履歴は作業中には補助記憶部23に記憶しておき、作業完了後、検査装置1に転送してもよい。
履歴DB133に書類画像も記憶してもよい。ある程度数の履歴データが履歴DB133に蓄積されたら、履歴データから訓練データを生成し、学習モデル141を再学習してもよい。再学習は検査装置1で行う。端末2で認識を行っている場合、再学習で得た学習モデル141のパラメータを端末2に記憶する学習モデル141に反映する。
図16は検査装置が備える機能部の一例を示すブロック図である。検査装置1は機能部として、取得部11a、認識部11b、抽出部11c、判定部11d及び出力部11eを備える。これらの各機能部は、制御部11が制御プログラム1Pに基づいて動作することにより、実現される。
取得部11aは、複数書類の画像から書類毎の書類画像を取得する。認識部11bは、特徴データ及び書類種別を対応付けて記憶した記憶部を参照し、取得した前記書類画像及び特徴データに基づき、前記書類画像毎に含まれる前記書類の書類種別を認識する。抽出部11cは、前記書類種別が基準書類である前記書類画像から基準キーを抽出し、前記書類種別が照合書類である前記書類画像から参照キーを抽出する。判定部11dは、抽出した前記参照キーが全て前記基準キーと一致するか否かを判定する。出力部11eは、判定した結果を出力する。
各実施の形態で記載されている技術的特徴(構成要件)はお互いに組み合わせ可能であり、組み合わせすることにより、新しい技術的特徴を形成することができる。
今回開示された実施の形態はすべての点で例示であって、制限的なものではないと考えられるべきである。本発明の範囲は、上記した意味ではなく、特許請求の範囲によって示され、特許請求の範囲と均等の意味及び範囲内でのすべての変更が含まれることが意図される。
100 検査システム
1 検査装置
11 制御部
11a 取得部
11b 認識部
11c 抽出部
11d 判定部
11e 出力部
12 主記憶部
13 補助記憶部
131 作業マスターDB
132 付帯情報DB
133 履歴DB
134 作業状況DB
135 訓練データDB
141 学習モデル
15 通信部
16 計時部
17 読み取り部
1P 制御プログラム
1a 可搬型記憶媒体
1b 半導体メモリ
2 端末
21 制御部
22 主記憶部
23 補助記憶部
24 通信部
25 入力部
26 表示部
27 インタフェース部
28 計時部
2P 制御プログラム
3 撮像装置

Claims (6)

  1. 複数書類画像を取得する取得部と、
    特徴データ及び書類種別を対応付けて記憶した記憶部を参照し、取得した前記複数書類画像及び特徴データに基づき、書類画像毎に含まれる前記書類の前記書類種別を認識する認識部と、
    前記書類種別が基準書類である前記書類画像から基準キーを抽出し、前記書類種別が照合書類である前記書類画像から参照キーを抽出する抽出部と、
    抽出した前記参照キーが全て前記基準キーと一致するか否かを判定する判定部と、
    判定した結果を出力する出力部と
    を備えることを特徴とする検査装置。
  2. 前記記憶部は前記書類種別とキー領域座標列とを対応付けて記憶しており、
    前記抽出部は、前記キー領域座標列の値に基づき、前記基準キー及び前記参照キーを抽出する
    ことを特徴とする請求項1に記載の検査装置。
  3. 前記記憶部は、前記書類の配置及び前記書類種別を対応付けて記憶しており、
    前記複数書類画像は単一画像であり、前記認識部は各書類画像を切り出し、
    前記書類画像それぞれの前記複数書類画像における前記配置を認識し、
    前記判定部は、前記記憶部を参照し、認識した前記書類種別及び前記配置に基づき、前記書類の過不足がないか否か、及び、前記配置に誤りがないかを判定する
    ことを特徴とする請求項1又は請求項2のいずれか1項に記載の検査装置。
  4. 前記記憶部は、前記書類の取得順及び前記書類種別を対応付けて記憶しており、
    前記複数書類画像は、前記書類画像に取得順を示す順番号を付した複数画像からなり、
    前記判定部は、前記記憶部を参照し、認識した前記書類種別及び前記順番号に基づき、前記書類の過不足がないか否か、及び、取得順に誤りがないかを判定する
    ことを特徴とする請求項1又は請求項2のいずれか1項に記載の検査装置。
  5. 特徴データ及び書類種別を対応付けて記憶した記憶部を参照可能なコンピュータが、
    複数書類画像を取得し、
    前記記憶部を参照し、取得した前記複数書類画像及び特徴データに基づき、書類画像毎に含む前記書類の前記書類種別を認識し、
    前記書類種別が基準書類である前記書類画像から基準キーを抽出し、前記書類種別が照合書類である前記書類画像から参照キーを抽出し、
    抽出した前記参照キーが全て前記基準キーと一致するか否かを判定し、
    判定した結果を出力する
    処理を前記コンピュータに行わせることを特徴とする検査プログラム。
  6. 特徴データ及び書類種別を対応付けて記憶した記憶部を参照可能なコンピュータが、
    複数書類画像を取得し、
    前記記憶部を参照し、取得した前記複数書類画像及び特徴データに基づき、書類画像毎に含む前記書類の前記書類種別を認識し、
    前記書類種別が基準書類である前記書類画像から基準キーを抽出し、前記書類種別が照合書類である前記書類画像から参照キーを抽出し、
    抽出した前記参照キーが全て前記基準キーと一致するか否かを判定し、
    判定した結果を出力する
    ことを特徴とする検査方法。
JP2020141864A 2020-08-25 2020-08-25 検査装置、検査プログラム、検査方法 Active JP7574572B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020141864A JP7574572B2 (ja) 2020-08-25 2020-08-25 検査装置、検査プログラム、検査方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020141864A JP7574572B2 (ja) 2020-08-25 2020-08-25 検査装置、検査プログラム、検査方法

Publications (2)

Publication Number Publication Date
JP2022037632A true JP2022037632A (ja) 2022-03-09
JP7574572B2 JP7574572B2 (ja) 2024-10-29

Family

ID=80494936

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020141864A Active JP7574572B2 (ja) 2020-08-25 2020-08-25 検査装置、検査プログラム、検査方法

Country Status (1)

Country Link
JP (1) JP7574572B2 (ja)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005242786A (ja) 2004-02-27 2005-09-08 Oki Electric Ind Co Ltd 帳票識別装置および帳票識別方法
JP5356905B2 (ja) 2009-04-28 2013-12-04 株式会社Pfu 書類管理装置、画像読取装置、書類管理システム、書類管理方法、及びプログラム
JP2015191382A (ja) 2014-03-28 2015-11-02 日本電気株式会社 画像データ処理装置、方法、及びプログラム
JP6561882B2 (ja) 2016-03-16 2019-08-21 大日本印刷株式会社 情報処理装置、情報処理方法、情報処理装置用のプログラム、および、書類管理システム
JP2020046860A (ja) 2018-09-18 2020-03-26 株式会社三菱Ufj銀行 帳票読取装置

Also Published As

Publication number Publication date
JP7574572B2 (ja) 2024-10-29

Similar Documents

Publication Publication Date Title
WO2019071660A1 (zh) 票据信息识别方法、电子装置及可读存储介质
JP6569532B2 (ja) 管理システム、リスト作成装置、リスト作成方法、管理方法及び管理用プログラム
US11321598B2 (en) Multicolor barcode and color calibration method thereof
JP2004139484A (ja) 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム
CN110135449A (zh) 使用计算机视觉和机器学习的制造零件识别
CN107025076B (zh) 一种自动化打印测试方法及装置
JP2017090970A (ja) 物品管理装置、その方法、及びそのプログラム
JP6087452B1 (ja) 紙文書管理システム
CN114092951A (zh) 结合rpa及ai的财务票据处理方法、装置、系统、设备及介质
CN113420756B (zh) 证件图像的识别方法和装置、存储介质及电子装置
US20190236813A1 (en) Information processing apparatus, information processing program, and information processing method
CN115660933A (zh) 一种水印信息的识别方法、装置及设备
CN113704111A (zh) 页面自动化测试方法、装置、设备及存储介质
JP6507459B2 (ja) 会計処理システム
CN110378886B (zh) 图像比对方法、图像比对装置、电子设备和介质
US11823086B2 (en) Membership analyzing method, apparatus, computer device and storage medium
JP2020030730A (ja) 家屋異動判読システム、家屋異動判読方法、家屋異動判読プログラム及び滅失判読モデル
CN113487702A (zh) 一种模板生成、图片识别方法及装置
JP7574572B2 (ja) 検査装置、検査プログラム、検査方法
CN111832381A (zh) 物体信息登记装置以及物体信息登记方法
JPWO2004068407A1 (ja) アプリケーション間のデータ連携支援方法
CN114359918A (zh) 提货单信息提取方法、装置及计算机设备
JP2013003909A (ja) 作業前後写真照合システム
JP6626946B1 (ja) テスト支援システム、テスト支援方法及びテスト支援プログラム
CN110751140A (zh) 字符批量识别方法、装置和计算机设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230626

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240507

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240613

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240917

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240930