JP2007312225A - データ処理装置、並びに当該装置で実行されるデータ処理方法及びデータ処理プログラム - Google Patents

データ処理装置、並びに当該装置で実行されるデータ処理方法及びデータ処理プログラム Download PDF

Info

Publication number
JP2007312225A
JP2007312225A JP2006140636A JP2006140636A JP2007312225A JP 2007312225 A JP2007312225 A JP 2007312225A JP 2006140636 A JP2006140636 A JP 2006140636A JP 2006140636 A JP2006140636 A JP 2006140636A JP 2007312225 A JP2007312225 A JP 2007312225A
Authority
JP
Japan
Prior art keywords
image data
comparison
feature amount
data
job
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006140636A
Other languages
English (en)
Inventor
Koya Okabe
康矢 岡部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2006140636A priority Critical patent/JP2007312225A/ja
Publication of JP2007312225A publication Critical patent/JP2007312225A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】多種多様なジョブに対しても同一の画像データを1つだけ保持し、それ以外は削除することにより、記憶装置の使用容量を抑えることができる。
【解決手段】画像検索サーバ108において、特徴量抽出部202は、格納されたすべての画像データについて、類似画像検索用の特徴量を抽出し、抽出した特徴量と、元となる画像データとを関連付けておく。ジョブ種比較部203はすべての画像データ同士間でジョブの種類を比較し、特徴量比較部204はジョブ種比較部203で比較された結果に応じて、特徴量抽出部202で抽出したすべての特徴量同士を比較する。画像データ削除部206は、画像データ削除判定部205で当該特徴量に対応する画像データ同士が等しいと判定された場合に、比較先の画像データは削除し、比較元の画像データへのリンク情報を保持する。
【選択図】図2

Description

本発明は、ネットワークを介して複合機に接続されるデータ処理装置、並びに当該装置で実行されるデータ処理方法及びデータ処理プログラムに関する。
デジタル複合機の普及に従って、誰でも原稿の印刷、複写や送信が容易に行うことが可能になっている。しかし、これらはユーザにとっての利便性向上に寄与する反面、機密原稿などの印刷や複写、送信といった情報漏洩の問題が新たに発生している。このような問題への対策として、印刷や複写、FAX、E-mail送信などの際に、読み取った画像データ及びテキストデータをすべて記憶装置に蓄積しておく文書管理システムが存在する。
これにより、管理者が前記蓄積したデータを確認することによって、情報漏洩した原稿が、いつ、どこで、どのような処理をされたかを追跡可能になるといった効果がある。
上記蓄積されるデータを1つの記憶装置に保存する場合、画像データの記録条件(解像度やビット数等)やデータを保存しておく期間によっては、蓄積するデータ量は膨大になるため、その記憶装置も大容量のものが求められる。そのため蓄積するデータ量をできる限り削減する手法が求められている。
データの削減手法として、重複している画像データは削除して、実データへの参照パスのみ保持する方法がある。従来の技術には、本発明と似たような目的でプリントサーバに保存する印刷ジョブの記憶量を抑えるものがある。これは、プリントサーバに保存されている印刷ジョブのうちの、1つのジョブと画像識別データ(画像データのファイル名、画像データのサイズ、画像データの記録に用いたデジタルカメラを識別する情報、デジタルカメラを用いて画像データを記録した日など)が一致する同一の画像データをもつ印刷ジョブを検索し、検索された印刷ジョブの参照パスにある画像データを削除すると共に検索された印刷ジョブの参照パスを対象ジョブの参照パスに書き換えるものである(特許文献1参照)。
特開2004−310215号公報
しかしながら、上記先行技術では、デジタルカメラによる写真データの印刷ジョブを対象としており、デジタル複合機の多種多様なジョブに対応しているものではない。また、デジタル複合機の多種多様なジョブは、そのフォーマットや内容も容易に特定できるものではなく、すべてのジョブが先行技術のような画像識別データを保持しているわけでもないため、重複データの識別が困難である。
本発明の目的は、多種多様なジョブに対しても同一の画像データを1つだけ保持し、それ以外は削除することにより、記憶装置の使用容量を抑えることができるデータ処理装置、並びに当該装置で実行されるデータ処理方法及びデータ処理プログラムを提供することにある。
上記目的を達成するために、請求項1のデータ処理装置は、複合機のジョブに関連する画像データを当該ジョブに関連するログ情報とともに記憶手段に保存し、ネットワークを介して当該複合機に接続されるデータ処理装置において、前記記憶手段に保存された画像データの特徴量を抽出する特徴量抽出手段と、前記特徴量抽出手段で抽出した特徴量と、当該特徴量を抽出した画像データとを関連付けておく関連付け手段と、前記記憶手段に保存された複数の画像データ同士間でジョブの種類を比較するジョブ種比較手段と、前記ジョブ種比較手段による比較結果に応じて、前記特徴量抽出手段で抽出した複数の特徴量同士を比較する特徴量比較手段と、前記特徴量比較手段による比較結果に基づいて特徴量に対応する画像データ同士が等しいか否かを判定する削除画像データ判定手段と、前記削除画像データ判定手段で当該特徴量に対応する画像データ同士が等しいと判定された場合に、比較先の画像データは削除し、比較元の画像データへのリンク情報を保持する画像データ削除手段とを備えることを特徴とする。
請求項11のデータ処理方法は、複合機のジョブに関連する画像データを当該ジョブに関連するログ情報とともに記憶手段に保存し、ネットワークを介して当該複合機に接続されるデータ処理装置で実行されるデータ処理方法において、前記記憶手段に保存された画像データの特徴量を抽出する特徴量抽出工程と、前記特徴量抽出工程で抽出した特徴量と、当該特徴量を抽出した画像データとを関連付けておく関連付け工程と、前記記憶手段に保存された画像データ同士間で当該画像データに関連して前記複合機が実行したジョブの種類を比較するジョブ種比較工程と、前記ジョブ種比較工程での比較結果に応じて、前記特徴量抽出工程で抽出した複数の特徴量同士を比較する特徴量比較工程と、前記特徴量比較工程における比較結果に基づいて特徴量に対応する画像データ同士が等しいか否かを判定する削除画像データ判定工程と、前記削除画像データ判定工程で当該特徴量に対応する画像データ同士が等しいと判定された場合に、比較先の画像データは削除し、比較元の画像データへのリンク情報を保持する画像データ削除工程とを備えることを特徴とする。
請求項12のデータ処理プログラムは、複合機のジョブに関連する画像データを当該ジョブに関連するログ情報とともに記憶手段に保存し、ネットワークを介して当該複合機に接続されるデータ処理装置で実行されるデータ処理プログラムにおいて、前記記憶手段に保存された画像データの特徴量を抽出する特徴量抽出工程と、前記特徴量抽出工程で抽出した特徴量と、当該特徴量を抽出した画像データとを関連付けておく関連付け工程と、前記記憶手段に保存された画像データ同士間で当該画像データに関連して前記複合機が実行したジョブの種類を比較するジョブ種比較工程と、前記ジョブ種比較工程での比較結果に応じて、前記特徴量抽出工程で抽出した複数の特徴量同士を比較する特徴量比較工程と、前記特徴量比較工程における比較結果に基づいて特徴量に対応する画像データ同士が等しいか否かを判定する削除画像データ判定工程と、前記削除画像データ判定工程で当該特徴量に対応する画像データ同士が等しいと判定された場合に、比較先の画像データは削除し、比較元の画像データへのリンク情報を保持する画像データ削除工程とをデータ処理装置に実行させることを特徴とする。
本発明によれば、ネットワークを介して接続されるデジタル複合機やプリンタのジョブの画像データを保存するデータ処理装置において、同一の画像データについては実体を1つだけ保持し、それ以外は実データを削除する。これにより、データ処理装置が備える記憶装置の使用容量を抑えることができる。
以下、本発明の実施の形態について、図面を参照して詳細に説明する。
図1は、本発明の実施の形態に係るデータ処理装置を含むネットワーク文書管理システムの構成図である。
本ネットワーク文書管理システムは、デジタル複合機101、画像処理サーバ102、データサーバ103、ユーザPC104、プリンタドライバ105、プリントサーバ106、プリンタ107、画像検索サーバ108及び管理者PC109を備えている。デジタル複合機101、画像処理サーバ102、データサーバ103、ユーザPC104、プリントサーバ106、画像検索サーバ108(データ処理装置)及び管理者PC109はネットワーク100を介して互いに接続されている。プリントサーバ106にはプリンタ107が接続されている。
デジタル複合機101は、スキャナ・プリンタ・コピー、メール・ファックス機能などを有している。デジタル複合機101は、出力・実行したジョブに関して、そのジョブの電子的な画像データを生成する。デジタル複合機101はこの画像データを即時、又は一旦自身の記憶装置に保存したあと、画像処理サーバ102に転送する。
ユーザPC104は一般的なクライアントPCである。ユーザPC104が印刷を実行したとき、プリンタドライバ105はPDL(Page Description Language)等の印刷データを生成する。ユーザPC104は生成した印刷データをデジタル複合機へ送信する。デジタル複合機は受信した印刷データに基づいて印刷などの画像出力処理を実行する。このようにデジタル複合機101がユーザPC104などのクライアントPCから受信した印刷データに基づいて実行する画像出力処理を印刷ジョブ(あるいはPDLジョブ)という。このとき、さらにプリンタドライバ105が文字描画命令として送られてきた文字列を、実行ジョブのテキストデータとして同時に抽出する場合には、画像データとテキストデータを関連付けておく。ユーザPC104はこれらのデータを即時、又は一旦自身の記憶装置、もしくはプリントサーバ106の記憶装置に保存したあと、画像処理サーバ102に転送する。
画像処理サーバ102は上記転送されてきた画像データに対し、データサーバ103に格納できる形式に画像変換処理を行い、データサーバ103へ転送する。このとき、特に画像処理サーバ102はデジタル複合機101から転送された画像データに対してはOCR処理をかけてテキスト情報を抽出する場合は、画像データと関連付けてデータサーバ103に転送する。
データサーバ103には画像処理サーバ102から送られてきた画像データ、及び関連付けられたテキストデータが逐次保存されていく。画像処理サーバ102やプリンタドライバ105においてテキストデータが抽出されず、画像データに関連付けられたテキストデータがない場合には(かつシステム管理者がテキストデータを必要としている場合には)、データサーバ103上でOCRをかけてテキストデータを抽出しても良い。
画像検索サーバ108は定期的にデータサーバ103へアクセスし、保存されている画像データの特徴量を抽出し、保存する。また画像検索サーバ108は、抽出した特徴量同士を比較することによって類似画像検索を行い、特徴量の元となる画像データ同士が等しいかどうか判断し、等しければ片方の画像データは削除する。
図2(A)は、本発明の実施の形態に係る画像検索サーバ108に配置される各処理部の構成を示すブロック図であり、図2(B)は、画像データの構成を模式的に示した図である。
画像データダウンロード部201はデータサーバ103へアクセスし、新規にデータサーバ103に登録された画像データの集合208をダウンロードする。画像データ1つ1つは印刷ジョブをそのまま画像化したものである。
特徴量抽出部202は当該ダウンロードされた画像データの集合208の1つである画像データ210について、像域分離処理を行い画像部分とテキスト部分を分離する。特徴量抽出部202は、検出された画像部分に対し、特徴量抽出処理を行い、画像の特徴量(図2(B)の211、221)を抽出する。像域分離の結果、複数の画像が検出された場合、その数だけ特徴量を抽出し、画像データと関連付けておく。
ジョブ種比較部203は、画像データの集合208に属するすべての画像データの特徴量を抽出した後に、上記任意の画像データ210を比較元、他の任意の画像データ220を比較先として選択し、それらのログ情報の1つであるジョブ種を比較する。ジョブ種とは例えばCOPY、PRINT、FAX、Emailなどである。
特徴量比較部204は前記特徴量211を他の画像データの特徴量221と比較し、比較結果を得る。比較結果はパーセンテージで得ることができる。
画像データ削除判定部205は前記特徴量比較部204の結果と、対応する画像データとの関連で、画像データを削除するかどうか判定する。
画像データ削除部206は、前記画像データ削除判定部205の結果を受け、等しいと判定された場合には、比較先の特徴量221に対応する画像データ220を削除し、画像データ210へのリンク情報を設定する。なお、画像検索サーバは不図示のCPUを備えており、図2における画像データダウンロード部201〜管理者設定処理部207の各ブロックは不図示のCPUにより制御される。
管理者設定処理部207はPDL(Page Description Language)ジョブ(ユーザPCの104から送られたPDLなどの印刷データに基づいて印刷処理を行うジョブ)以外のジョブを削除の対象にするかどうか、管理者からの設定を受けつける。
図3は、ネットワーク文書管理システムの重複画像データ削除の動作例を示すフローチャートである。図4は、図3の動作に含まれる判定処理Aを示すフローチャートであり、図5は、図3の動作に含まれる判定処理Bを示すフローチャートである。これらフローチャートは画像検索サーバ108により実行される。
また、データサーバ103には既にさまざまなジョブ種の画像データ、及び関連するテキストデータが保存されているとする。
まず、画像検索サーバ108の画像データダウンロード部201は定期的にデータサーバ103へアクセスし、新規に登録された画像データの集合208をダウンロードする(ステップS301)。
特徴量抽出部202は前記ダウンロードした画像データ集合の任意の1つについて、像域分離処理を行い画像部分とテキスト部分を判別する。得られた画像部分に対し、特徴量抽出処理を行い、得られた特徴量を画像データと関連付けて記録する。像域分離処理の結果、複数の画像が認識された場合にはすべての画像に対して特徴量抽出処理を行う(ステップS303)。ステップS303はステップS301でダウンロードしたすべての画像データに対して実行される(ステップS302、ステップS304)。
ジョブ種比較部203は比較元の画像データ210を選択し、次に比較先の画像データ220を選択する。そして両画像データに付随するログ情報の1つであるジョブ種を比較する(ステップS307)。ジョブが両方ともPDLジョブである場合と、少なくとも一方のジョブがPDLジョブでない場合で処理をわける(ステップS308)。
ジョブが両方ともPDLジョブである場合、特徴量比較部204は前記2つの画像データに関連付けられた特徴量の比較を行う(ステップS309)。特徴量が複数ある場合にはそれぞれ比較する。さらに、ジョブが両方ともPDLジョブの場合は、より検索精度を高めるために、画像データに付随するログ情報の内の「ジョブ名」、「ジョブのページ数」、「印刷実行モジュール名」などを比較することも考えられる(ステップS310)。
画像データ削除判定部205は、ステップS309及びステップS310の比較結果を受けてそれぞれ関連する画像データが等しいか否かを判定する(ステップS311)。
ここで、ステップS311の判定処理Aの詳細を、図4を参照にしつつ説明する。
画像データ削除判定部205は、まず1つの画像データに関連付けられた画像の数を調べ(ステップS401)、画像が1つである場合には、その特徴量同士が100%等しいか否かを判定する(ステップS402)。画像が1つではなく複数関連付いている場合には、その関連したすべての画像の特徴量同士が100%等しいか否かを判定する(ステップS403)。
ステップS402又はステップS403において特徴量同士が100%等しいと判断された場合、ステップS310でログ情報同士の比較を行っていれば、画像データ削除判定部205は、そのログ情報同士の比較結果が等しいか否かも判定する(ステップS404)。ログ情報同士の比較結果が等しければ両画像データは等しいと判定する(ステップS405)。ただし、ジョブを実行した日時や、ジョブの設定内容などがログ情報中に記録される場合、同じ画像データであってもそのログ情報は異なる場合もある。このような場合は、ステップS404の処理は実行せず、ステップS402、S403での特徴量同士の比較結果に基づいて画像データが等しいか否かを判断しても良い。ステップS402、ステップS403及びステップS404のうち、一つでも等しくなければ両画像データは互いに異なると判定する(ステップS406)。
図3に戻り、ステップS308で、少なくとも一方のジョブがPDLジョブでない場合、特徴量比較部204は前記2つの画像データに関連付けられた特徴量の比較を行う(ステップS312)。
画像データ削除判定部205は前記ステップS312の比較結果を受けてそれぞれ関連する画像データが等しいか否かを判定する(ステップS313)。
ここで、ステップS313の判定処理Bの詳細を、図5を参照にしつつ説明する。
画像データ削除判定部205は、まず1つの画像データに関連付けられた画像の数を調べ(ステップS501)、画像が1つである場合には、特徴量がある閾値以上等しいか否かを判定する(ステップS502)。画像が1つではなく複数関連付いている場合には、その関連したすべての画像の特徴量同士がある閾値以上等しいか否かを判定する(ステップS503)。この閾値は管理者が設定可能である。
ステップS502又はステップS503において、画像の特徴量同士がある閾値以上等しいと判断された場合、画像データは互いに等しいと判定し(ステップS505)、そうでなければ画像データは異なると判定し(ステップS506)、判定処理Bを終了する。
図3に戻り、ステップS311又はステップS313における画像データ削除判定部205の判定の結果、2つの画像データが等しいと判断された場合(ステップS314でYES)、データ削除部206は比較先の画像データは削除し、比較元の画像データへのリンク情報のみを保持する(ステップS315)。2つの画像データが等しくないと判定された場合は、データ削除部206は画像データを削除しない。また画像データに関連付けられたテキストデータは対応する画像データが削除する判定でも、削除しない。
前記ステップS307からステップS315までの処理は比較先の画像データとして全ての画像データを対象として行う(ステップS306、ステップS316)。
前記ステップS306からステップS316までの処理は比較元の画像データとして全ての画像データを対象として行う(ステップS305、ステップS317)。ただし既に比較元に選んだデータは比較先にはならない。
上述した重複画像データ削除の動作例では、図3のステップS308において、ジョブがPDL系でないと判断した場合でも必ず比較処理へ流れていったが、PDL系以外のジョブについては削除の対象としないという設定でもよい。例えば、この設定は管理者が指定可能とする。また上述したステップS502、ステップS503の比較処理を行う場合の比較時の閾値も管理者が指定可能とする。
図6は、管理者が画像検索サーバ108に対し、削除対象の設定、閾値の設定を行うときの処理を示すフローチャートである。
管理者設定処理部207は、管理者からの設定を受けて、PDL系以外のジョブを削除の対象にするか否かを判別する(ステップS601)。PDL系以外のジョブを削除の対象にする場合には、管理者設定処理部207は、比較時の閾値を管理者に問い合わせる(ステップS602)。そして管理者から受け取った閾値、及びPDL系以外のジョブも削除対象とする設定を画像検索サーバ108に登録する(ステップS603)。なお、最適な閾値は特徴量抽出のアルゴリズムや画像の一致度を判定するアルゴリズムによって適宜決めればよい。
ステップS601において、PDL系以外のジョブを削除の対象としない場合は、PDL以外のジョブは削除の対象としない設定を画像検索サーバ108に登録する(ステップS604)。
以上、本発明の実施の一形態について説明したが、上記構成図や動作フローは一例であり、上記に限定されるものではない。
例えば、図1のシステム構成図において、画像検索サーバ108が存在せず、その機能はデータサーバ103がすべて保持しても良い。さらにデータサーバ103と画像検索サーバ108を同一のサーバとしても良い。またプリントサーバ106が存在せず、ユーザPC104から直接プリンタ107に接続している環境でも良い。また、図3のフローにおいて、PDL系のジョブ同士の比較でログ情報まで比較しなくても良い。その他、本発明の要旨を逸脱しない範囲内において、種々なる形態で実施し得ることは勿論である。
以上詳細に説明したように、本実施の形態によれば、特徴量抽出部202が、格納されたすべての画像データについて、類似画像検索用の特徴量を抽出し、抽出した特徴量と、元となる画像データとを関連付けておく。ジョブ種比較部203がすべての画像データ同士間でジョブの種類を比較し、特徴量比較部204がジョブ種比較部203で比較された結果に応じて、特徴量抽出部202で抽出したすべての特徴量同士を比較する。画像データ削除判定部205は、特徴量比較部204において比較結果が等しいと判断された場合に、特徴量に対応する画像データ同士が等しいか否かを判定する。画像データ削除部206は、削除画像データ判定部205で当該特徴量に対応する画像データ同士が等しいと判定された場合に、比較先の画像データは削除し、比較元の画像データへのリンク情報を保持する。
よって、ネットワークを介して接続されるデジタル複合機やプリンタのジョブの画像データを保存するデータ処理装置において、同一の画像データについては実体を1つだけ保持し、それ以外は実データを削除することにより、データ処理装置が備える記憶装置の使用容量を抑えることができる。
また、本発明の目的は、前述した各実施の形態の機能を実現するソフトウェアのプログラムコードを記憶した記憶媒体を、システム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)が記憶媒体に格納されたプログラムコードを読み出し実行することによっても達成される。
この場合、記憶媒体から読み出されたプログラムコード自体が前述した各実施の形態の機能を実現することになり、そのプログラムコード及び該プログラムコードを記憶した記憶媒体は本発明を構成することになる。
また、プログラムコードを供給するための記憶媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光磁気ディスク、CD−ROM、CD−R、CD−RW、DVD−ROM、DVD−RAM、DVD−RW、DVD+RW等の光ディスク、磁気テープ、不揮発性のメモリカード、ROM等を用いることができる。または、プログラムコードをネットワークを介してダウンロードしてもよい。
また、コンピュータが読み出したプログラムコードを実行することにより、前述した各実施の形態の機能が実現されるだけではなく、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行い、その処理によって前述した各実施の形態の機能が実現される場合も含まれる。
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その拡張機能を拡張ボードや拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって前述した各実施の形態の機能が実現される場合も含まれる。
本発明の実施の形態に係るデータ処理装置を含むネットワーク文書管理システムの構成図である。 (A)は、本発明の実施の形態に係る画像検索サーバ108に配置される各処理部の構成を示すブロック図であり、(B)は、画像データの構成を模式的に示した図である。 ネットワーク文書管理システムの重複画像データ削除の動作例を示すフローチャートである。 図3の動作に含まれる判定処理Aを示すフローチャートである。 図3の動作に含まれる判定処理Bを示すフローチャートである。 管理者が画像検索サーバ108に対し、削除対象の設定、閾値の設定を行うときの処理を示すフローチャートである。
符号の説明
101 デジタル複合機
102 画像処理サーバ
103 データサーバ
104 ユーザPC
105 プリンタドライバ
106 プリントサーバ
107 プリンタ
108 画像検索サーバ
109 管理者PC
201 画像データダウンロード部
202 特徴量抽出部
203 ジョブ種比較部
204 特徴量比較部
205 画像データ削除判定部
206 画像データ削除部
207 管理者設定処理部

Claims (12)

  1. 複合機のジョブに関連する画像データを当該ジョブに関連するログ情報とともに記憶手段に保存し、ネットワークを介して当該複合機に接続されるデータ処理装置において、
    前記記憶手段に保存された画像データの特徴量を抽出する特徴量抽出手段と、
    前記特徴量抽出手段で抽出した特徴量と、当該特徴量を抽出した画像データとを関連付けておく関連付け手段と、
    前記記憶手段に保存された複数の画像データ同士間で当該画像データに関連して前記複合機が実行したジョブの種類を比較するジョブ種比較手段と、
    前記ジョブ種比較手段による比較結果に応じて、前記特徴量抽出手段で抽出した複数の特徴量同士を比較する特徴量比較手段と、
    前記特徴量比較手段による比較結果に基づいて特徴量に対応する画像データ同士が等しいか否かを判定する削除画像データ判定手段と、
    前記削除画像データ判定手段で当該特徴量に対応する画像データ同士が等しいと判定された場合に、比較先の画像データは削除し、比較元の画像データへのリンク情報を保持する画像データ削除手段と
    を備えることを特徴とするデータ処理装置。
  2. 前記削除画像データ判定手段は、前記ジョブ種比較手段の比較結果において、比較する2つのジョブが両方ともクライアントから受信した印刷データを処理する印刷ジョブである場合と、少なくとも一方が印刷ジョブ以外である場合とで、特徴量に対応する画像データ同士が等しいか否かの判定方法を変えることを特徴とする請求項1に記載のデータ処理装置。
  3. 前記削除画像データ判定手段は、前記ジョブ種比較手段で比較されたジョブが両方ともクライアントから受信した印刷データを処理する印刷ジョブだった場合に、これらのジョブに関連する2つの画像データに対応する特徴量を比較し、両者が一致する場合に画像データは等しいと判断することを特徴とする請求項1又は2に記載のデータ処理装置。
  4. 前記削除画像データ判定手段は、前記ジョブ種比較手段で比較されたジョブのうち少なくとも一方がクライアントから受信した印刷データを処理する印刷ジョブでない場合に、これらのジョブに関連する2つの画像データの特徴量を比較し、所定の閾値以上等しい場合に画像データは等しいと判断することを特徴とする請求項1又は2に記載のデータ処理装置。
  5. 前記ジョブ種比較手段で比較されたジョブのうち少なくとも一方がクライアントから受信した印刷データを処理する印刷ジョブでない場合に、前記削除画像データ判定手段による判定を実行しない設定をする設定手段を備えることを特徴とする請求項1、2又は4に記載のデータ処理装置。
  6. 前記所定の閾値を設定する閾値設定手段を備えることを特徴とする請求項4記載のデータ処理装置。
  7. 前記削除画像データ判定手段は、1つの画像データに対し複数の画像が含まれる場合には、対応する特徴量同士がすべて等しい場合に画像データは等しいと判定し、1つでも異なっている場合には画像データは等しくないと判定することを特徴とする請求項1乃至6のいずれか1項に記載のデータ処理装置。
  8. 前記画像データに含まれるテキストをテキストデータとして抽出して、当該画像データに関連付けておき、前記画像データを削除しても当該テキストデータは削除せずに保存しておくことを特徴とする請求項1乃至7のいずれか1項に記載のデータ処理装置。
  9. 前記テキストデータは、プリンタドライバが文字描画命令をテキストデータとして抽出する、格納する前の画像データに対しOCR処理を実行してテキストデータを抽出する、又は既に格納された画像データに対し定期的な間隔でOCR処理を実行してテキストデータを抽出するのいずれかによって、抽出されることを特徴とする請求項8に記載のデータ処理装置。
  10. 前記削除画像データ判定手段は、特徴量の比較に加えて前記ログ情報の比較も行うことを特徴とする請求項1乃至3のいずれか1項に記載のデータ処理装置。
  11. 複合機のジョブに関連する画像データを当該ジョブに関連するログ情報とともに記憶手段に保存し、ネットワークを介して当該複合機に接続されるデータ処理装置で実行されるデータ処理方法において、
    前記記憶手段に保存された画像データの特徴量を抽出する特徴量抽出工程と、
    前記特徴量抽出工程で抽出した特徴量と、当該特徴量を抽出した画像データとを関連付けておく関連付け工程と、
    前記記憶手段に保存された画像データ同士間で当該画像データに関連して前記複合機が実行したジョブの種類を比較するジョブ種比較工程と、
    前記ジョブ種比較工程での比較結果に応じて、前記特徴量抽出工程で抽出した複数の特徴量同士を比較する特徴量比較工程と、
    前記特徴量比較工程における比較結果に基づいて特徴量に対応する画像データ同士が等しいか否かを判定する削除画像データ判定工程と、
    前記削除画像データ判定工程で当該特徴量に対応する画像データ同士が等しいと判定された場合に、比較先の画像データは削除し、比較元の画像データへのリンク情報を保持する画像データ削除工程と
    を備えることを特徴とするデータ処理方法。
  12. 複合機のジョブに関連する画像データを当該ジョブに関連するログ情報とともに記憶手段に保存し、ネットワークを介して当該複合機に接続されるデータ処理装置で実行されるデータ処理プログラムにおいて、
    前記記憶手段に保存された画像データの特徴量を抽出する特徴量抽出工程と、
    前記特徴量抽出工程で抽出した特徴量と、当該特徴量を抽出した画像データとを関連付けておく関連付け工程と、
    前記記憶手段に保存された画像データ同士間で当該画像データに関連して前記複合機が実行したジョブの種類を比較するジョブ種比較工程と、
    前記ジョブ種比較工程での比較結果に応じて、前記特徴量抽出工程で抽出した複数の特徴量同士を比較する特徴量比較工程と、
    前記特徴量比較工程における比較結果に基づいて特徴量に対応する画像データ同士が等しいか否かを判定する削除画像データ判定工程と、
    前記削除画像データ判定工程で当該特徴量に対応する画像データ同士が等しいと判定された場合に、比較先の画像データは削除し、比較元の画像データへのリンク情報を保持する画像データ削除工程と
    をデータ処理装置に実行させることを特徴とするデータ処理プログラム。
JP2006140636A 2006-05-19 2006-05-19 データ処理装置、並びに当該装置で実行されるデータ処理方法及びデータ処理プログラム Pending JP2007312225A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006140636A JP2007312225A (ja) 2006-05-19 2006-05-19 データ処理装置、並びに当該装置で実行されるデータ処理方法及びデータ処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006140636A JP2007312225A (ja) 2006-05-19 2006-05-19 データ処理装置、並びに当該装置で実行されるデータ処理方法及びデータ処理プログラム

Publications (1)

Publication Number Publication Date
JP2007312225A true JP2007312225A (ja) 2007-11-29

Family

ID=38844645

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006140636A Pending JP2007312225A (ja) 2006-05-19 2006-05-19 データ処理装置、並びに当該装置で実行されるデータ処理方法及びデータ処理プログラム

Country Status (1)

Country Link
JP (1) JP2007312225A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008259105A (ja) * 2007-04-09 2008-10-23 Fuji Xerox Co Ltd 画像処理装置、画像処理システム、画像処理プログラム、画像処理方法
JP2010211422A (ja) * 2009-03-09 2010-09-24 Canon Inc 管理装置及び管理方法及びプログラム
WO2013002425A1 (en) 2011-06-29 2013-01-03 Gulf Energy Limited Liquefied petroleum gas (lpg) partial refilling machine
JP2017177722A (ja) * 2016-03-31 2017-10-05 ブラザー工業株式会社 印刷装置
WO2019123983A1 (ja) * 2017-12-19 2019-06-27 オムロン株式会社 認証システムおよびデータ処理方法
JP2020027505A (ja) * 2018-08-14 2020-02-20 富士ゼロックス株式会社 情報処理装置およびプログラム

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008259105A (ja) * 2007-04-09 2008-10-23 Fuji Xerox Co Ltd 画像処理装置、画像処理システム、画像処理プログラム、画像処理方法
JP4626627B2 (ja) * 2007-04-09 2011-02-09 富士ゼロックス株式会社 画像処理装置、画像処理システム、画像処理プログラム、画像処理方法
JP2010211422A (ja) * 2009-03-09 2010-09-24 Canon Inc 管理装置及び管理方法及びプログラム
WO2013002425A1 (en) 2011-06-29 2013-01-03 Gulf Energy Limited Liquefied petroleum gas (lpg) partial refilling machine
JP2017177722A (ja) * 2016-03-31 2017-10-05 ブラザー工業株式会社 印刷装置
WO2019123983A1 (ja) * 2017-12-19 2019-06-27 オムロン株式会社 認証システムおよびデータ処理方法
JP2019109731A (ja) * 2017-12-19 2019-07-04 オムロン株式会社 認証システムおよびデータ処理方法
JP2020027505A (ja) * 2018-08-14 2020-02-20 富士ゼロックス株式会社 情報処理装置およびプログラム
JP7180195B2 (ja) 2018-08-14 2022-11-30 富士フイルムビジネスイノベーション株式会社 情報処理装置およびプログラム

Similar Documents

Publication Publication Date Title
US8243320B2 (en) Document management apparatus, control method therefor, computer program, and storage medium
JP4631792B2 (ja) 印刷記録管理装置、プログラム及び方法
JP2011088327A (ja) 画像入出力装置及び画像入出力方法
US20080100873A1 (en) Information processing device, image log management device, and image log management system
JP2008070975A (ja) データ保存装置及びデータ保存方法
US8250103B2 (en) Image log management device, image log management method, image log management program
JP2009026077A (ja) 画像処理サーバ、画像処理方法、コンピュータプログラム、および記憶媒体
JP2007312225A (ja) データ処理装置、並びに当該装置で実行されるデータ処理方法及びデータ処理プログラム
CN101990049B (zh) 数据处理系统及该数据处理系统的控制方法
JP5332343B2 (ja) 情報処理装置、電子マニュアル管理方法、及び電子マニュアル管理プログラム
US20090282117A1 (en) Management apparatus and management method
JP2008035224A (ja) ログ情報管理システム、ログ情報管理装置、ログ情報管理方法、ログ情報管理プログラム及び記憶媒体
JP2007221340A (ja) 画像ファイル生成方法及び画像ファイル生成装置
JP4965996B2 (ja) 画像処理装置、画像処理方法、画像処理プログラム並びに記憶媒体
US10438011B2 (en) Information processing apparatus and non-transitory computer readable medium
JP4847280B2 (ja) 印刷データ管理装置、印刷データ管理プログラム及び記録媒体
JP2008147947A (ja) 情報処理装置、プログラム、及び画像履歴管理システム
JP2011028557A (ja) 格納禁止フォーマット設定を有する画像形成装置
KR20110104030A (ko) 화상형성장치, 화상형성장치의 제어 방법 및 기억매체
JP4235519B2 (ja) 画像形成システム、画像形成装置及びその制御方法、プログラム
JP4848920B2 (ja) 画像管理装置、画像管理装置の制御方法、およびプログラム
JP2007312224A (ja) 文書管理システム、並びに当該システムの制御方法及び制御プログラム
JP2020027505A (ja) 情報処理装置およびプログラム
JP2019083380A (ja) 画像形成システムおよび画像形成プログラム
US20110019211A1 (en) System and method for altering document output properties in accordance with altering intercepted print stream data