JP6946056B2 - 情報処理装置及び情報処理プログラム - Google Patents

情報処理装置及び情報処理プログラム Download PDF

Info

Publication number
JP6946056B2
JP6946056B2 JP2017104783A JP2017104783A JP6946056B2 JP 6946056 B2 JP6946056 B2 JP 6946056B2 JP 2017104783 A JP2017104783 A JP 2017104783A JP 2017104783 A JP2017104783 A JP 2017104783A JP 6946056 B2 JP6946056 B2 JP 6946056B2
Authority
JP
Japan
Prior art keywords
image data
document
document image
processing
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017104783A
Other languages
English (en)
Other versions
JP2018201122A (ja
Inventor
圭一 長谷川
圭一 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba TEC Corp
Original Assignee
Toshiba TEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba TEC Corp filed Critical Toshiba TEC Corp
Priority to JP2017104783A priority Critical patent/JP6946056B2/ja
Publication of JP2018201122A publication Critical patent/JP2018201122A/ja
Application granted granted Critical
Publication of JP6946056B2 publication Critical patent/JP6946056B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明の実施形態は、情報処理装置及び情報処理プログラムに関する。
近年、電子領収書法が整備され、電子帳簿保存法(国税関係帳簿や国税関係書類に対し、電子化された文書ファイルによる保存を認めた法律)のスキャナ保存に関する規制が2016年の改正において緩和された。これにより、ほぼ全ての文書に対してスキャンデータでの保存が可能となり、さらに電子署名が不要になった。これにより、これまでは紙文書としての保存を義務付けられていた文書を、電子文書として保存することが可能となった。
しかしながら、電子文書を保存するにあたっては、タイムスタンプを付与する必要がある。
タイムスタンプは、公平な第三者機関により発行されたものである必要がある。このため、タイムスタンプを付与した電子文書を保存しようとするユーザは、紙文書の個々を電子文書化した上で、これらの電子文書のそれぞれについてのタイムスタンプの発行を第三者機関に依頼しなければならず、その作業は面倒なものとなる。
このような事情から、紙文書の電子文書化及びタイムスタンプの付与を容易な操作で行える情報処理装置及び情報処理プログラムが望まれていた。
特開2006−287360号公報 特開2007−20122号公報 特開2005−57603号公報 特開2002−10059号公報 特開2001−76127号公報
本発明が解決しようとする課題は、紙文書の電子文書化及びタイムスタンプの付与を容易な操作で行える情報処理装置及び情報処理プログラムを提供することである。
実施形態の情報処理装置は、抽出手段、選出手段、生成手段及び確定手段を備える。抽出手段は、複数の書面を並べて表した1つの元画像から、予め定められた特徴データを複数の書面のそれぞれについて抽出する。選出手段は、抽出手段により抽出された特徴データに基づき、元画像が表した複数の書面のうちから予め定められた処理の対象である書面を選出する。生成手段は、選出手段が1つのみの書面を選出したならば当該書面を表す1つの書面画像データを、また選出手段が複数の書面を選出したならば当該複数の書面をそれぞれ表す複数の書面画像データを、元画像に基づいて生成する。確定手段は、生成手段により生成された書面画像データのうちから、既に処理の対象とされた書面画像データとは異なる書面画像データと、操作者が処理の対象とすることを決定した書面画像データとを、処理の対象として確定する。
一実施形態に係るMFPの要部回路構成を示すブロック図。 図1中のプロセッサによる情報処理のフローチャート。 図1中のプロセッサによる情報処理のフローチャート。
以下、実施の形態の一例について図面を用いて説明する。なお、本実施の形態では、情報処理装置としての機能を備えたMFP(multifunction peripheral)を例に説明する。
図1は本実施形態に係るMFP100の要部回路構成を示すブロック図である。
MFP100は、システム制御ユニット1、スキャンユニット2、プリントユニット3、記憶ユニット4、コントロールパネル5及び通信ユニット6を有する。
システム制御ユニット1は、MFP100としての所期の動作を実現するために、MFP100を構成する各部を統括的に制御する。なお、MFP100としての所期の動作は、例えば既存の別のMFPにより実現される、例えばコピー機能、イメージスキャン機能、プリント機能及びファクシミリ機能等の種々の機能を実現するための動作である。さらにMFP100は、所期の動作の1つとして、紙文書を電子文書化した上でタイムスタンプを付与する機能を実現するための後述する動作を実現する。システム制御ユニット1は、プロセッサ11、メインメモリ12、インタフェースユニット13及び伝送路14を含む。
プロセッサ11、メインメモリ12及びインタフェースユニット13は、伝送路14によって接続される。これによりプロセッサ11及びメインメモリ12は、MFP100を制御するための情報処理を行うコンピュータを構成している。
プロセッサ11は、上記コンピュータの中枢部分に相当する。プロセッサ11は、メインメモリ12に記憶されたオペレーティングシステム及びアプリケーションプログラムに従って、上述の制御のための情報処理を実行する。
メインメモリ12は、上記コンピュータの主記憶部分に相当する。メインメモリ12は、不揮発性のメモリ領域と揮発性のメモリ領域とを含む。メインメモリ12は、不揮発性のメモリ領域ではオペレーティングシステム及びアプリケーションプログラムを記憶する。またメインメモリ12は、プロセッサ11が各部を制御するための処理を実行する上で必要なデータを不揮発性又は揮発性のメモリ領域で記憶する場合もある。メインメモリ12は、揮発性のメモリ領域を、プロセッサ11によってデータが適宜書き換えられるワークエリアとして使用する。
インタフェースユニット13は、プロセッサ11と、スキャンユニット2、プリントユニット3、記憶ユニット4及びコントロールパネル5との通信をインタフェースする。
伝送路14は、アドレスバス、データバス及び制御信号線等を含み、接続されている各部の間で授受されるデータや制御信号を伝送する。
スキャンユニット2は、原稿台にセットされた原稿の書面を読み取って、その画像を表す画像データを生成する。スキャンユニット2は、具体的には、CCD(charge-coupled device)ラインセンサなどのイメージセンサを用い、原稿の書面からの反射光像に応じた画像データを生成する。なおスキャンユニット2は、自動原稿送り装置が搬送する原稿を、固定されたイメージセンサによりスキャンする機能も備えていてもよい。
プリントユニット3は、用紙に電子写真方式により画像を形成する。プリントユニット3は、電子写真方式を用いるものには限定されない。たとえば、プリントユニット3は、インクジェット方式、あるいは熱転写方式を用いるものであってもよい。
記憶ユニット4は、画像データ等のデータを記憶する。記憶ユニット4には例えば、HDD(hard disk drive)又はSSD(solid state drive)などの大容量な記憶デバイスが用いられる。
コントロールパネル5は、入力デバイス51および表示デバイス52を含む。コントロールパネル5は、入力デバイス51により、MFP100の操作者による指示を入力する。コントロールパネル5は、表示デバイス52により、操作者に対して通知すべき各種の情報を表示する。コントロールパネル5としては、例えばタッチパネルが利用できる。
通信ユニット6は、通信ネットワーク200を介してのデータ通信を行う。通信ユニット6による通信の相手の1つは、タイムスタンプ局300である。タイムスタンプ局300は、通信ネットワーク200を介しての要求に応じて、タイムスタンプを発行する。
次に以上のように構成されたMFP100の動作について説明する。
MFP100は、前述のように既存の別のMFPにより実現される機能を備えるが、これらの機能を実現するためのMFP100の動作は、例えば既存の別のMFPにおける動作と同様であってよいので、その詳細な説明は省略する。そして以下においては、紙文書を電子文書化した上でタイムスタンプを付与する機能に関わる動作について説明する。
当該機能を利用するに当たって操作者は、当該機能のための動作モードを選択する操作を入力デバイス51にて行うとともに、スキャンユニット2の原稿台に紙文書をセットした上で、入力デバイス51により開始指示を行う。なお、当該機能においては、操作者が、原稿台に複数の紙文書を並べてセットすることを許容する。なお、紙文書は例えば、伝票、レシート、領収書、あるいは支払明細書等である。
そうするとプロセッサ11は、メインメモリ12に記憶されたアプリケーションプログラムに従って、以下に説明するような情報処理を開始する。
図2及び図3はプロセッサ11の処理手順を示すフローチャートである。なお、以下に説明するプロセッサ11の処理手順は一例であって、同様な結果を得ることが可能な様々な処理を適宜に利用できる。
Act1としてプロセッサ11は、原稿台にセットされている紙文書をスキャンユニット2にスキャンさせる。これによりスキャンユニット2は、上記のように操作者により原稿台にセットされた1つ又は複数の紙文書を一括で読み取り、当該1つ又は複数の紙文書の書面の画像を表した1つの画像データを生成する。
Act2としてプロセッサ11は、上記のように生成された画像データが表す画像(以下、元画像と称する)の中で、個々の紙文書の書面に相当する範囲をそれぞれ判定する。この判定には、オブジェクト認識技術など公知の画像認識処理技術を用いることができる。
Act3としてプロセッサ11は、上記のように判定した範囲のうちの1つに関する画像(以下、書面画像と称する)を元画像から切り出す。
Act4としてプロセッサ11は、書面画像から特徴データを抽出する。この判定には、オブジェクト認識技術などを用いることができる。特徴データは、特徴量及び特徴画像を含む。特徴量は、例えば大きさ(四方寸法)などの紙文書の特徴を表す物理量である。特徴画像は、ロゴマーク、背景模様及び印影など、紙文書に表される特徴的な画像である。なおプロセッサ11は、特徴量及び特徴画像のいずれか一方のみを特徴データとして抽出してもよい。なお特徴データは、タイムスタンプ付与の対象となる同種の異なる紙文書に共通で含まれるデータであり、例えば領収金額などのように同種の異なる紙文書の間で異なる可能性のある情報を含まない。例えば、紙文書として領収書を想定するならば、ある企業が発行する領収書には、その発行企業のロゴマークが共通に表されることがある。このような領収書に関しては、当該ロゴマークが特徴画像の1つとなる。また例えば、紙文書として領収書を想定するならば、発行する企業毎の用紙が利用され、かつ当該用紙には模様が予め印刷されていることがある。このような場合は、背景の模様が特徴画像の1つとなる。また例えば、紙文書として領収書を想定するならば、発行者を証するための印影が表されることがある。このような場合は、印影が特徴画像の1つとなる。このように、アプリケーションプログラムに基づく情報処理をプロセッサ11が実行することによって、プロセッサ11を中枢部分とするコンピュータは特徴データを抽出する抽出手段として機能する。
Act5としてプロセッサ11は、特徴マッチングを行う。プロセッサ11は具体的には、上記の抽出した特徴データと、記憶ユニット4又はメインメモリ12に記憶されているエビデンスデータとのマッチングをチェックする。エビデンスデータは後述するように、当該情報処理を過去に行った結果を考慮して学習されるデータであり、タイムスタンプ付与の対象となる紙文書の特徴を表す特徴量及び特徴画像を含む。
Act6としてプロセッサ11は、上記の特徴マッチングにより、特徴データとエビデンスデータとが一致したか否かを確認する。そしてプロセッサ11は、両データが一致しないならばNoと判定し、Act7へと進む。
Act7としてプロセッサ11は、周知のOCR(optical character recognition)などにより書面画像内のテキストを認識する。
Act8としてプロセッサ11は、テキストマッチングを行う。プロセッサ11は具体的には、上記のように認識したテキストと、記憶ユニット4又はメインメモリ12に記憶されているキーワード辞書に含まれたキーワードとのマッチングをチェックする。なお、キーワード辞書は、タイムスタンプの付与対象となる紙書面に表される文字列を、少なくとも1つキーワードとして含む。キーワード辞書にどのようなキーワードを含むかは、設計者、メンテナンス作業者又は使用者により任意に定められてよい。例えば、紙文書として領収書を想定するならば、「領収書」という文字列がキーワードの1つとなる。
Act9としてプロセッサ11は、上記のテキストマッチングにより、認識したテキストとキーワードとが一致したか否かを確認する。そしてプロセッサ11は、テキストとキーワードとが一致しないならばNoと判定し、Act10へと進む。
Act10としてプロセッサ11は、書面画像を除外画像に設定する。
一方でプロセッサ11は、Act5における特徴マッチングにより、特徴データとエビデンスデータとが一致したならば、Act6にてYesと判定し、Act11へと進む。なお、特徴マッチング及びAct6の判定を具体的にどのように行うかは任意である。一例としては、紙文書の大きさを表す特徴量を、エビデンスデータとして用意しておく。また複数の特徴画像を、紙文書において表されるのと同じ位置関係で表した画像を表すデータをエビデンスデータとして用意しておく。そしてプロセッサ11は、書面画像の大きさがエビデンスデータとされた特徴量で表される大きさであり、かつ書面画像の一部がエビデンスデータとされた画像と一致する場合にAct6にてYesと判定する。あるいは、1つの紙文書に対して複数の特徴画像を、それぞれエビデンスデータとして用意しておく。そしてプロセッサ11は、書面画像の大きさがエビデンスデータとされた特徴量で表される大きさであり、かつ書面画像から抽出した複数の特徴データのうちの規定数がエビデンスデータと一致する場合にAct6にてYesと判定する。なおいずれの場合も、紙文書として領収書のように複数種類が存在するものを対象とするならば、複数種の紙文書のそれぞれに対応付けてエビデンスデータを用意しておく。そしてプロセッサ11は、これら複数のエビデンスデータのうちのいずれか1つに関して一致すると判断できる場合に、Act6にてYesと判定することとする。なお、本実施形態における「一致」とは、完全な一致を意味せず、ある程度の類似性を有する状態を指す。
またプロセッサ11は、Act8におけるテキストマッチングにより、テキストとキーワードとが一致したならば、Act9にてYesと判定し、Act11へと進む。なお、テキストマッチング及びAct9の判定を具体的にどのように行うかは任意である。一例としては、タイムスタンプ付与の対象となる紙文書に必ず含まれる複数の文字列をそれぞれキーワードとしておく。そしてプロセッサ11は、認識したテキストにそれら複数のキーワードに一致する文字列が全て含まれる場合に、Act9にてYesと判定する。あるいは、タイムスタンプ付与の対象となる紙文書に含まれない可能性のある文字列もキーワードに含んでおく。そしてプロセッサ11は、認識したテキストにそれら複数のキーワードに一致する文字列が規定数含まれる場合に、Act9にてYesと判定する。なおいずれの場合も、紙文書として領収書のように複数種類が存在するものを対象とするならば、複数種の紙文書のそれぞれに対応付けてキーワード辞書を用意しておく。そしてプロセッサ11は、これら複数のキーワード辞書のうちのいずれか1つに関して一致すると判断できる場合に、Act9にてYesと判定することとする。
Act11としてプロセッサ11は、画像マッチングを行う。プロセッサ11は具体的には、書面画像と、付与済み画像とのマッチングをチェックする。付与済み画像は後述するように、タイムスタンプが付与された画像ファイルとして記憶ユニット4に記憶される書面画像である。
Act12としてプロセッサ11は、上記の画像マッチングにより、書面画像が付与済み画像のいずれかと一致したか否かを確認する。そしてプロセッサ11は、書面画像に一致する付与済み画像があるならばYesと判定し、Act13へと進む。
Act13としてプロセッサ11は、書面画像が既にタイムスタンプ付与済みである恐れがある旨を操作者に警報する。プロセッサ11は例えば、書面画像と、タイムスタンプ付与済みである恐れがある旨の文字メッセージとを含んだ警報画面を表示デバイス52に表示させる。
Act14としてプロセッサ11は、書面画像をタイムスタンプ付与の対象とすることを許可する指示がなされたか否かを確認する。つまりプロセッサ11は、許可を指示するためのボタン及び拒否を指示するためのボタンを上記の警報画面に含めておき、これらのボタンのいずれが操作されたかを判断する。そしてプロセッサ11は例えば、拒否を指示するためのボタンが操作されるなどして許可が指示されなかった場合にはNoと判定し、Act10へと進む。つまりプロセッサ11は、操作者が警報に応じてタイムスタンプを付与しないことを決定した書面画像については、除外画像として設定する。これに対してプロセッサ11は、許可を指示するためのボタンが操作されるなどして許可が指示されたならばYesと判定し、Act15へと進む。なおプロセッサ11は、画像マッチングにより書面画像が付与済み画像のいずれとも一致しなかった場合には、Act12にてNoと判定し、Act13及びAct14をパスしてAct15へと進む。
Act15としてプロセッサ11は、書面画像をタイムスタンプ付与の対象画像として設定する。つまりプロセッサ11は、付与済み画像のいずれとも一致しない書面画像、あるいは操作者が警報を受けてもタイムスタンプを付与することを決定した書面画像については、対象画像として設定する。
プロセッサ11は、Act10又はAct15にて書面画像を除外画像又は対象画像に設定し終えたならば、いずれの場合もAct16へと進む。
Act16としてプロセッサ11は、Act2にて判定した範囲の中に、Act3での書面画像の切り出しの対象としていない範囲が有るか否かを確認する。そしてプロセッサ11は、そのような範囲があるならばYesと判定し、Act3以降の処理を前述と同様に繰り返す。ただしこの場合にプロセッサ11はAct3としては、これまでに行ったAct3において書面画像を切り出していない範囲に関して書面画像を切り出す。これによりプロセッサ11は、Act2で複数の範囲を判定したならば、それら複数の範囲のそれぞれに関する書面画像について順次にAct4−Act15を実行する。そしてプロセッサ11は、Act2で判定した範囲の全てに関する書面画像について、除外画像又は対象画像としての設定を終えたならば、Act16にてNoと判定し、図3中のAct17へと進む。
Act17としてプロセッサ11は、対象一覧画面を表示デバイス52に表示させる。対象一覧画面は、対象画像として設定されている書面画像を一覧として表した画面である。プロセッサ11は例えば、対象画像として設定されている書面画像を、必要であれば回転するなどの処理を施した上できれいに整列させ、一覧で見やすく表示する画面を生成する。ただし、ここで表示する画面は、どの書面画像が対象画像として設定されているのかを操作者が確認できるものであればよく、例えば書面画像を1つずつ順次に表示するものなど、その具体的な形態は任意であってよい。かくしてアプリケーションプログラムに基づく情報処理をプロセッサ11が実行することによって、プロセッサ11を中枢部分とするコンピュータは表示処理手段として機能する。
Act18としてプロセッサ11は、対象画像として設定されている書面画像の1つに関する除外指示がなされたか否かを確認する。そしてプロセッサ11は、当該指示がなされていないならばNoと判定し、Act19へと進む。
Act19としてプロセッサ11は、確定指示がなされたか否かを確認する。そしてプロセッサ11は、当該指示がなされていないならばNoと判定し、Act18へと戻る。
かくしてプロセッサ11はAct18及びAct19としては、除外指示又は確定指示がなされるのを待ち受ける。
操作者は、対象一覧画面により、対象画像として設定されている書面画像のうちに、タイムスタンプを付与する必要の無いものが含まれているかどうかを確認する。そして、そのような書面画像が有ったならば、その書面画像についての除外指示を入力デバイス51により行う。そうするとプロセッサ11は、Act18にてYesと判定し、Act20へと進む。
Act20としてプロセッサ11は、除外指示がなされた書面画像についての設定を除外画像に変更する。そしてプロセッサ11はこののち、Act18及びAct19の待受状態に戻る。
一方で操作者は、対象一覧画面での確認を終えたならば、確定を指示するための操作を入力デバイス51により行う。そうするとプロセッサ11は、Act19にてYesと判定し、Act21へと進む。
Act21としてプロセッサ11は、除外一覧画面を表示デバイス52に表示させる。除外一覧画面は、除外画像として設定されている書面画像を一覧として表した画面である。プロセッサ11は例えば、除外画像として設定されている書面画像を、必要であれば回転するなどの処理を施した上できれいに整列させ、一覧で見やすく表示する画面を生成する。ただし、ここで表示する画面は、どの書面画像が除外画像として設定されているのかを操作者が確認できるものであればよく、例えば書面画像を1つずつ順次に表示するものなど、その具体的な形態は任意であってよい。
Act22としてプロセッサ11は、除外画像として設定されている書面画像の1つに関する採用指示がなされたか否かを確認する。そしてプロセッサ11は、当該指示がなされていないならばNoと判定し、Act23へと進む。
Act23としてプロセッサ11は、確定指示がなされたか否かを確認する。そしてプロセッサ11は、当該指示がなされていないならばNoと判定し、Act22へと戻る。
かくしてプロセッサ11はAct22及びAct23としては、採用指示又は確定指示がなされるのを待ち受ける。
操作者は、除外一覧画面により、除外画像として設定されている書面画像のうちに、タイムスタンプを付与する必要があるものが含まれているかどうかを確認する。そして、そのような書面画像が有ったならば、その書面画像についての採用指示を入力デバイス51により行う。そうするとプロセッサ11は、Act22にてYesと判定し、Act24へと進む。
Act24としてプロセッサ11は、採用指示がなされた書面画像についての設定を対象画像に変更する。そしてプロセッサ11はこののち、Act22及びAct23の待受状態に戻る。
一方で操作者は、除外一覧画面での確認を終えたならば、確定を指示するための操作を入力デバイス51により行う。そうするとプロセッサ11は、Act23にてYesと判定し、Act25へと進む。
Act25としてプロセッサ11は、タイムスタンプの発行要求処理を行う。プロセッサ11は具体的には、対象画像として設定されている書面画像をそれぞれ含んだ文書ファイルを個々に生成し、これを記憶ユニット4に記憶させる。なお、文書ファイルのファイル形式としては、例えばPDF(portable file format)などの、タイムスタンプを付与することが可能な周知の形式を利用することができる。プロセッサ11は、当該文書ファイルのそれぞれについて、含まれる書面画像についてのハッシュ値を算出する。そして当該ハッシュ値の通知を伴って、通信ユニット6から通信ネットワーク200を介してタイムスタンプ局300に対してタイムスタンプの発行を要求する。
タイムスタンプ局300は、このような要求に応じて、通知されたハッシュ値に応じたタイムスタンプを作成し、当該タイムスタンプを要求元に通信ネットワーク200を介して送信する。タイムスタンプ局300は、複数のハッシュ値が通知されているならば、これらハッシュ値のそれぞれに応じた複数のタイムスタンプを作成し、送信する。このようにしてMFP100からの要求に応じてタイムスタンプ局300により発行されたタイムスタンプは、通信ネットワーク200を介してMFP100へと送られる。そしてタイムスタンプは、通信ユニット6により受信される。
Act26としてプロセッサ11は、上記のように通信ユニット6により受信されたタイムスタンプを、対応する文書ファイルに付与するように、記憶ユニット4に記憶してある文書ファイルを更新する。このときプロセッサ11は、タイムスタンプを付帯情報として文書ファイルに付加し、書面画像を表した画像データについては変更を加えない。このタイムスタンプの付与は、予め定められた処理の一例である。そしてタイムスタンプの付与は、対象画像として設定した書面画像を対象として行われる。つまり、Act15において書面画像を対象画像として設定することは、予め定められた処理の対象である書面を選出することに相当する。また、元画像から切り出した書面画像の一部を対象画像として設定することは、対象画像としての書面画像を表す書面画像データを生成することに相当する。また、Act17−Act23を経て、対象画像として設定されている書面画像を処理の対象としていることは、上記のように生成された書面画像データの全て又は一部を前記処理の対象として確定することに相当する。すなわち、アプリケーションプログラムに基づく情報処理をプロセッサ11が実行することによって、プロセッサ11を中枢部分とするコンピュータは上記の処理、選出、生成及び確定をそれぞれ行う処理手段、選出手段、生成手段及び確定手段として機能する。さらに、記憶ユニット4に記憶され、タイムスタンプが付与された文書ファイルに含まれる書面画像は、これ以降にAct11を実行される場合に付与済み画像として利用される。かくしてアプリケーションプログラムに基づく情報処理をプロセッサ11が実行することによって、プロセッサ11を中枢部分とするコンピュータは記憶処理手段として機能する。
Act27としてプロセッサ11は、結果画面を表示デバイス52に表示させる。結果画面は、タイムスタンプの付与が完了した文書ファイルに含まれる画像データが表す書面画像を一覧として表した画面である。また結果画面は、各書面画像に、タイムスタンプの付与済みであることを視覚的に示す電子スタンプ画像(電子マーク)を重畳表示するものとしてもよい。ただし、ここで表示する画面は、どの書面画像に対してタイムスタンプが付与済みであるかを操作者が確認できるものであればよく、例えば該当の書面画像を1つずつ順次に表示するものなど、その具体的な形態は任意であってよい。
Act28としてプロセッサ11は、学習処理を実行する。この学習処理の対象は、エビデンスデータ及びキーワード辞書の少なくとも一方である。つまりプロセッサ11は例えば、Act24での設定変更を行っているならば、該当する書面画像に対して次に特徴マッチング又はテキストマッチングを行った場合に一致と判断されるようにエビデンスデータ及びキーワード辞書の少なくとも一方を更新する。プロセッサ11はさらに、Act20で設定変更を行っているならば、該当する書面画像に対して次に特徴マッチング又はテキストマッチングを行った場合に一致しないと判断されるようにエビデンスデータ及びキーワード辞書の少なくとも一方を更新してもよい。
プロセッサ11は、学習処理を終えたならば、結果画面の表示終了が操作者により指示されるのを待って、図2及び図3に示す情報処理を終了する。
以上のようにMFP100によれば、操作者が、原稿台に複数の紙文書を並べてセットした上で開始を指示すれば、それら複数の紙文書のそれぞれに対応する書面画像がそれぞれ切り出された上で、当該書面画像のそれぞれにタイムスタンプが付与される。従って、操作者は、複数の紙文書のそれぞれについて、電子化されるとともに、タイムスタンプが付与された文書ファイルを、非常に簡易な操作により得ることが可能である。
MFP100は、企業等において、多量の紙文書の電子化を行うために利用されることが想定される。そしてこの場合には、タイムスタンプを付与する必要の有る紙文書と、必要の無い紙文書とが混在して原稿台に並べられることがあり得る。しかしながらMFP100によれば、特徴マッチング又はテキストマッチングで一致と判断できる書面画像について、タイムスタンプ付与の対象として設定する。従って、予め定められた特徴を持つ紙文書及び予め定められた文字列を表した紙文書に関する文書ファイルについてのみ、タイムスタンプが付与される。これにより、タイムスタンプを付与する必要の無い紙文書に関する文書ファイルに対してまでタイムスタンプを付与してしまう無駄を省くことができる。
上記のように多量の紙文書の電子化を行うのであれば、上述した動作が複数回繰り返されることになる。そしてこの場合には、操作者の不注意により、同じ紙文書が複数回、原稿台にセットされることが有り得る。しかしながらMFP100によれば、このような場合には、プロセッサ11によるAct11−Act13の処理により操作者に対して警報が発せられる。これにより操作者は、上記のような不注意に気づくことができる。そしてMFP100では、操作者により拒否が指示された場合には、再度の読み取りに係る書面画像についてはタイムスタンプ付与の対象から除外する。従って、同じ紙文書に対応する複数の文書ファイルに対してそれぞれにタイムスタンプが付与されてしまうことを容易に防止できる。
なお、MFP100の利用形態としては、例えば1日分の紙文書をその翌日に電子化し、電子化を完了した紙文書は破棄する、といった形態が想定される。この場合には、同じ日においての重複読み取りは生じ得るが、同一の紙文書が異なる日に重複して読み取られることはない。そこで、プロセッサ11はAct11としては、付与されているタイムスタンプの日付が当日である付与済み画像のみを処理の対象としてもよい。そしてこのようにすれば、全ての付与済み画像に関して画像マッチングを行う場合に比べて、その処理量を軽減でき、プロセッサ11の負荷の軽減及び処理時間の短縮を図ることができる。この場合、付与されているタイムスタンプの日付が当日を含む最近の数日間である付与済み画像のみを処理の対象とするなどの変形も可能である。さらに、どの範囲の付与済み画像を処理対象とするかを、例えば操作者の指示に応じて設定可能としておけば、利用形態に応じた柔軟な運用が可能となる。
またMFP100は、特徴マッチング及びテキストマッチングにより決定したタイムスタンプ付与の対象とするか否かの設定を、操作者の指示に応じて変更する。従って、タイムスタンプ付与の対象とするか否かの設定がプロセッサ11により適切に行われなかった場合、新しい種類の紙文書に関する文書ファイルにタイムスタンプを付与したい場合、あるいは過去にはタイムスタンプを付与したが今回はその必要がない場合、などにおいて、操作者のニーズに応じてタイムスタンプ付与の対象とするか否かを設定できる。
またMFP100は、タイムスタンプ付与の対象とするか否かの設定を操作者の指示に応じて変更した場合には、エビデンスデータ及びキーワード辞書の少なくとも一方を更新する。これにより、過去におけるタイムスタンプ付与の実行状況を学習し、タイムスタンプ付与の対象とするか否かの新たな設定の妥当性を向上することができる。
この実施形態は、次のような種々の変形実施が可能である。
(1) Act11及びAct12における重複読み取りの確認に当たっては、同種の互いに異なる紙文書どうしの間で異なっている可能性の高い情報を比較してもよい。当該情報は、紙文書が領収書であるならば、例えば領収金額である。プロセッサ11は、操作者による操作に応じて、あるいは書面画像に対するOCR処理によって、該当の情報を取得する。そしてプロセッサ11は、該当の情報を、タイムスタンプを付与した文書ファイルに含まれる書面画像に関して取得した情報を、文書ファイルに関連づけて例えば記憶ユニット4に記憶させておく。そしてプロセッサ11は、新たにAct11の画像マッチングを実行する際には、書面画像に関して上記のように取得した情報とは異なる情報が上記のように関連づけられている文書ファイルに含まれた書面画像は、マッチングを確認する対象から除外する。この場合、同種の互いに異なる紙文書どうしの間で異なっている可能性の高い情報が特定項目の特徴データの一例である。そしてアプリケーションプログラムに基づく情報処理をプロセッサ11が実行することによって、プロセッサ11を中枢部分とするコンピュータは取得手段として機能する。
(2) プロセッサ11は、Act16にてNoと判定した場合には、別の紙文書の読み取りを行うか、それともAct17へと進むかを操作者に指定させて、別の紙文書の読み取りを行うことが指定された場合にはAct1へと戻るようにしてもよい。これにより、1度ではスキャンし切れない量の紙文書に関するタイムスタンプの発行要求を一括で行うことが可能となる。
ただしこの場合は、複数回のスキャンにおいて同一の紙文書が読み取られた場合は、上記実施形態の動作では重複読み取りをチェックできない。そこで、対象画像として設定済みの書面画像をAct11の画像マッチングの対象としてもよい。
(3) 対象一覧画面及び除外一覧画面を表示するのに代えて、対象画像として設定された書面画像と、除外画像として設定された書面画像とを、それらを区別可能に同時に表す画面を表示してもよい。
(4) タイムスタンプは、文書ファイルに関連づけて文書ファイルとは独立して保存されてもよい。
(5) Act4−Act6よりもAct7−Act9を先に実行し、Act9にてNoと判定した場合にAct4−Act6が実行されてもよい。あるいは、Act6でYesと判定される頻度と、Act9でYesと判定される頻度とを管理し、Act6の頻度が高い場合にはAct4−Act6を先に実行し、またAct9の頻度が高い場合にはAct7−Act9を先に実行してもよい。
(6) Act4−Act6に代えて、エビデンスデータが書面画像に含まれるか否かを確認する処理を行い、含まれる場合にAct11へと進み、含まれない場合にAct7へと進むようにしてもよい。
(7) エビデンスデータ及びキーワード辞書は、初期状態においては有効な情報を含まなくてもよいし、あるいは設計者などにより決定されたデフォルトの情報を含んでいてもよい。
(8) 対象画像として設定された書面画像に対する処理は、タイムスタンプの付与には限定されず、別の任意の処理であってよい。
(9) Act4−Act15は、書面画像を切り出すことなしに、Act1のスキャンで得られた元画像の一部を処理対象として実行してもよい。そして、対象画像として確定された範囲の画像のみをAct1のスキャンで得られた元画像から切り出すこととする。
(10) 各種の表示は、MFP100に外付けされた表示装置や、タブレット端末などのような他の端末装置に備えられた表示デバイスなどで行ってもよい。これらの場合、MFP100で行う表示のための処理は、表示画面を表したデータを外部に出力する処理などである。
(11) プロセッサ11が行う前述した情報処理の一部は省略してもよい。例えば、Act4−Act6及びAct7−Act9のいずれか一方は省略してもよい。Act11−Act13は省略してもよい。Act17−Act20及びAct21−Act24の少なくともいずれか一方を省略してもよい。Act27を省略してもよい。Act28を省略してもよい。
(12) 汎用のパーソナルコンピュータなどをハードウェアとして用い、Act1以外の処理を、他のスキャナにより得られた画像データを対象として実行する情報処理装置として実現してもよい。また、スキャナなどのMFP以外の装置に上記の情報処理を行う機能を備えることも可能である。
(13) 図2及び図3に示す情報処理に関するアプリケーションプログラムは、MFP100のハードウェアの譲渡の際にメインメモリ12に記憶されていてもよい。あるいは当該アプリケーションプログラムは、ハードウェアの譲渡後に、当該ハードウェアのメインメモリ12に、別途に譲渡されたアプリケーションプログラムが利用者の指示の下に書き込まれてもよい。後者の場合、アプリケーションプログラムは、磁気ディスク、光磁気ディスク、光ディスク、半導体メモリなどのようなリムーバブルな記録媒体に記録して、あるいはネットワークを介して譲渡され得る。
(14) 情報処理によりプロセッサ11が実現する各機能は、その一部または全てをロジック回路などのようなプログラムに基づかない情報処理を実行するハードウェアにより実現することも可能である。また上記の各機能のそれぞれは、上記のロジック回路などのハードウェアにソフトウェア制御を組み合わせて実現することも可能である。また、上記の各機能を、複数のプロセッサにより分担して実現してもよい。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
以下に、本願の当初の特許請求の範囲に記載された発明を付記する。
[付記1] 複数の書面を並べて表した1つの元画像から、予め定められた特徴データを前記複数の書面のそれぞれについて抽出する抽出手段と、
前記抽出手段により抽出された前記特徴データに基づき、前記元画像が表した複数の書面のうちから予め定められた処理の対象である書面を選出する選出手段と、
前記選出手段が1つのみの書面を選出したならば当該書面を表す1つの書面画像データを、また前記選出手段が複数の書面を選出したならば当該複数の書面をそれぞれ表す複数の書面画像データを、前記元画像に基づいて生成する生成手段と、
前記生成手段により生成された前記書面画像データの全て又は一部を前記処理の対象として確定する確定手段と、
を具備した情報処理装置。
[付記2] 前記生成手段により生成された1つ又は複数の書面画像データが表す書面を表示させる表示処理手段をさらに備え、
かつ前記確定手段は、操作者による指示に応じて、前記複数の書面画像データの全て又は一部を前記処理の対象として確定する、
付記1に記載の情報処理装置。
[付記3] 前記確定手段により確定された前記書面画像データを記憶デバイスに記憶させる記憶処理手段をさらに備え、
かつ前記確定手段は、前記生成手段により生成された前記書面画像データのうちで前記記憶デバイスに記憶された前記書面画像データと同じものは前記処理の対象として確定しない、
付記1又は付記2に記載の情報処理装置。
[付記4] 前記生成手段により生成された書面画像データに関して特定項目の特徴データを取得する取得手段をさらに備え、
前記記憶処理手段は、前記取得手段により取得された特徴データを前記書面画像データに関連づけて前記記憶デバイスに記憶させ、
かつ前記確定手段は、前記生成手段により生成された1つ又は複数の書面画像データの全て又は一部を前記処理の対象として確定する処理の中で、前記記憶デバイスに記憶された前記書面画像データのうち、関連づけて前記記憶デバイスに記憶されている前記特定項目の特徴データが、前記生成手段により生成された1つの前記書面画像データに関して前記取得手段により新たに取得された特徴データとは異なる前記書面画像データは、前記生成手段により生成された前記1つの書面画像データとは異なるものであるとする、
付記3に記載の情報処理装置。
[付記5] 前記確定手段により確定された前記書面画像データに関するタイムスタンプの発行を要求するための処理を前記予め定められた処理として実行する処理手段、
をさらに備えた付記1−付記4のいずれか一項に記載の情報処理装置。
[付記6] コンピュータを、
複数の書面を並べて表した1つの元画像から、予め定められた特徴データを前記複数の書面のそれぞれについて抽出する抽出手段と、
前記抽出手段により抽出された前記特徴データに基づき、前記元画像が表した複数の書面のうちから予め定められた処理の対象である書面を選出する選出手段と、
前記選出手段が1つのみの書面を選出したならば当該書面を表す1つの書面画像データを、また前記選出手段が複数の書面を選出したならば当該複数の書面をそれぞれ表す複数の書面画像データを、前記元画像に基づいて生成する生成手段と、
前記生成手段により生成された前記書面画像データの全て又は一部を前記処理の対象として確定する確定手段と、
して機能させるための情報処理プログラム。
1…システム制御ユニット、2…スキャンユニット、3…プリントユニット、4…記憶ユニット、5…コントロールパネル、51…入力デバイス、52…表示デバイス、6…通信ユニット、11…プロセッサ、12…メインメモリ、13…インタフェースユニット、14…伝送路、200…通信ネットワーク、300…タイムスタンプ局。

Claims (7)

  1. 複数の書面を並べて表した1つの元画像から、予め定められた特徴データを複数の書面のそれぞれについて抽出する抽出手段と、
    前記抽出手段により抽出された特徴データに基づき、前記元画像が表した複数の書面のうちから予め定められた処理の対象である書面を選出する選出手段と、
    前記選出手段が1つのみの書面を選出したならば当該書面を表す1つの書面画像データを、また前記選出手段が複数の書面を選出したならば当該複数の書面をそれぞれ表す複数の書面画像データを、前記元画像に基づいて生成する生成手段と、
    前記生成手段により生成された書面画像データのうちから、既に前記処理の対象とされた書面画像データとは異なる書面画像データと、操作者が前記処理の対象とすることを決定した書面画像データとを、前記処理の対象として確定する確定手段と、
    を具備した情報処理装置。
  2. 前記生成手段により生成された書面画像データのうち、既に前記処理の対象とされた書面画像データとは異なる書面画像データと、操作者が前記処理の対象とすることを決定した書面画像データとが表す書面を表示させる表示処理手段をさらに備え、
    かつ前記確定手段は、前記表示処理手段により表示された書面の全て又は一部を表す書面画像データを、表示された書面に関する操作者による指示に応じて前記処理の対象として確定する、
    請求項1に記載の情報処理装置。
  3. 前記確定手段により前記処理の対象として確定された書面画像データを記憶デバイスに記憶させる記憶処理手段をさらに備え、
    かつ前記確定手段は、前記生成手段により生成された書面画像データのうちで前記記憶デバイスに記憶された書面画像データと異なる書面画像データは、既に前記処理の対象とされた書面画像データとは異なる書面画像データとして前記処理の対象として確定する
    請求項1又は請求項2に記載の情報処理装置。
  4. 前記生成手段により生成された書面画像データに関して特定項目の特徴データを取得する取得手段をさらに備え、
    前記記憶処理手段は、前記生成手段により生成された書面画像データに関連づけて、当該書面画像データに関して前記取得手段により取得された特徴データを前記記憶デバイスに記憶させ、
    かつ前記確定手段は、関連づけて前記記憶デバイスに記憶されている前記特定項目の特徴データが、前記生成手段により生成された書面画像データに関して前記取得手段により新たに取得された特徴データとは異なる書面画像データは、既に前記処理の対象とされた書面画像データとは異なるものであるとする、
    請求項3に記載の情報処理装置。
  5. 前記確定手段により確定された書面画像データに関するタイムスタンプの発行を要求するための処理を前記予め定められた処理として実行する処理手段、
    をさらに備えた請求項1−請求項4のいずれか一項に記載の情報処理装置。
  6. 前記抽出手段は、ロゴマーク、背景模様及び印影のいずれかを特徴データとして抽出する、
    請求項1−請求項5のいずれか一項に記載の情報処理装置。
  7. コンピュータを、
    複数の書面を並べて表した1つの元画像から、予め定められた特徴データを複数の書面のそれぞれについて抽出する抽出手段と、
    前記抽出手段により抽出された特徴データに基づき、前記元画像が表した複数の書面のうちから予め定められた処理の対象である書面を選出する選出手段と、
    前記選出手段が1つのみの書面を選出したならば当該書面を表す1つの書面画像データを、また前記選出手段が複数の書面を選出したならば当該複数の書面をそれぞれ表す複数の書面画像データを、前記元画像に基づいて生成する生成手段と、
    前記生成手段により生成された書面画像データのうちから、既に前記処理の対象とされた書面画像データとは異なる書面画像データと、操作者が前記処理の対象とすることを決定した書面画像データとを、前記処理の対象として確定する確定手段と、
    して機能させるための情報処理プログラム。
JP2017104783A 2017-05-26 2017-05-26 情報処理装置及び情報処理プログラム Active JP6946056B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017104783A JP6946056B2 (ja) 2017-05-26 2017-05-26 情報処理装置及び情報処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017104783A JP6946056B2 (ja) 2017-05-26 2017-05-26 情報処理装置及び情報処理プログラム

Publications (2)

Publication Number Publication Date
JP2018201122A JP2018201122A (ja) 2018-12-20
JP6946056B2 true JP6946056B2 (ja) 2021-10-06

Family

ID=64668394

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017104783A Active JP6946056B2 (ja) 2017-05-26 2017-05-26 情報処理装置及び情報処理プログラム

Country Status (1)

Country Link
JP (1) JP6946056B2 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4132828B2 (ja) * 2002-01-11 2008-08-13 グローリー株式会社 帳票登録支援方法および装置並びにプログラム
JP4827543B2 (ja) * 2006-02-01 2011-11-30 キヤノン株式会社 画像処理方法、および、その装置
JP2016136310A (ja) * 2015-01-23 2016-07-28 セイコーエプソン株式会社 会計情報管理システム
JP6575310B2 (ja) * 2015-11-10 2019-09-18 株式会社リコー 免税販売書類作成システム、免税販売書類作成装置、免税販売書類作成プログラムおよび免税販売書類作成方法

Also Published As

Publication number Publication date
JP2018201122A (ja) 2018-12-20

Similar Documents

Publication Publication Date Title
US10528679B2 (en) System and method for real time translation
JP2006229670A (ja) 画像形成装置およびプログラム
JP2015211340A (ja) 画像処理装置、画像処理装置の制御方法及びプログラム
US7573594B2 (en) Methods and systems for document reproduction management
US8208173B2 (en) Image forming apparatus, image reading apparatus, and control method thereof
US20110102826A1 (en) Image forming apparatus, document managing system, and document managing method
US20180270387A1 (en) Printing apparatus, server, printing method, and control method
US10404885B2 (en) Image forming system, terminal, server, image forming apparatus and image forming method
US20070061377A1 (en) Document management system and control method thereof
CN107786771B (zh) 图像形成装置、图像形成方法以及图像形成系统
JP5537626B2 (ja) 画像形成装置および画像形成システム
JP4715413B2 (ja) 文書管理装置及びプログラム
JP6946056B2 (ja) 情報処理装置及び情報処理プログラム
JP2014183584A (ja) コード化文書印刷方法、コード化文書スキャン方法、及びコード化文書処理システム
JP2015194525A (ja) 問題生成システム、処理サーバ、問題生成システムの制御方法、処理サーバの制御方法、問題生成システムのプログラム、処理サーバのプログラム、および記録媒体
EP3376750B1 (en) System for originals copy control
JP4725483B2 (ja) 電子文書と印鑑データとを管理する方法および文書処理装置
US8554751B2 (en) Image forming apparatus, method of controlling the image forming apparatus, and storage medium
JP6767651B2 (ja) 情報処理システムとその処理方法及びプログラム
JP5347844B2 (ja) 文書管理システム及びプログラム
JP2017021654A (ja) 文書管理サーバ及びシステム
JP6053532B2 (ja) テーブルに応じた出力形態で出力する装置、方法、プログラム。
JP5088833B2 (ja) 文書復元装置、文書復元システム、文書復元方法、プログラム、及び、コンピュータ読み取り可能な記憶媒体
JP2007005862A (ja) 印刷システム
JP6332107B2 (ja) 画像形成システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200424

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210209

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210412

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210817

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210915

R150 Certificate of patent or registration of utility model

Ref document number: 6946056

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150