JP2007081955A - 情報処理装置及び方法、並びにプログラム - Google Patents

情報処理装置及び方法、並びにプログラム Download PDF

Info

Publication number
JP2007081955A
JP2007081955A JP2005268633A JP2005268633A JP2007081955A JP 2007081955 A JP2007081955 A JP 2007081955A JP 2005268633 A JP2005268633 A JP 2005268633A JP 2005268633 A JP2005268633 A JP 2005268633A JP 2007081955 A JP2007081955 A JP 2007081955A
Authority
JP
Japan
Prior art keywords
document
information
history information
storage
processing apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005268633A
Other languages
English (en)
Inventor
Daiki Suzuki
大記 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2005268633A priority Critical patent/JP2007081955A/ja
Publication of JP2007081955A publication Critical patent/JP2007081955A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Storing Facsimile Image Data (AREA)
  • Storage Device Security (AREA)
  • Facsimiles In General (AREA)

Abstract

【課題】 本発明は、ネットワーク化された環境における限られた資源(蓄積容量)の中で、実行されたジョブの履歴情報を効率良く蓄積することができる情報処理装置を提供する。
【解決手段】 複合機101は、ネットワーク105を介してクライアント104、履歴管理サーバ102、文書管理サーバ103に接続され、実行したジョブの履歴情報を履歴管理サーバ102に蓄積する際に、当該ジョブの実行により得られた文書データの文書情報を、算出された文書機密度に応じて削減する。
【選択図】 図7

Description

本発明は、情報処理装置及び方法、並びにプログラムに関する。特に、文書の読み取り、コピー、印刷または送信を行う情報処理装置及び方法、並びにプログラムに関する。
近年、デジタル機器のネットワーク化が進み、複写機、スキャナ、ファクシミリ、プリンタ、及び複数の機能を有する複合機等のデバイスとコンピュータとの接続によって電子文書や紙文書の共有化が進んでいる。一方、ネットワーク化による情報アクセス手段の進化により、機密情報等の情報漏洩が問題となっている。
このようなネットワーク化されたシステムにおける情報漏洩対策として、上述したデバイスが実行するジョブ(処理)の履歴情報を記録する方法がある。例えば、情報漏洩が発覚した場合、記録されたジョブの履歴情報の中から情報漏洩に関連すると思われるジョブを検索して抽出することが可能となる。また、エンドユーザが行ったすべてのジョブに対して記録が取られているという事実が周知になることによって、不正の抑止力が働く効果が大きくなる。
一方、システムがすべてのジョブの履歴情報を記録するためには非常に大きな資源(蓄積容量)が必要となる。そのため、システム構築のキーポイントは、限られた資源にいかに効率よく情報を記録できるか否かにある。
本発明に関連する特許文献として、操作モードごとに動作履歴を記憶するか否かを選択する方法が提案されている(特許文献1参照)。
特開2005−191686号公報
しかしながら、上記従来の技術では、情報漏洩対策でジョブの履歴情報を蓄積する場合、エンドユーザが行ったすべてのジョブを記録することが不正の抑止力を働かせるために必要となっているが、特定のジョブやデバイスを蓄積対象外に設定できるのは、そこからの情報漏洩が不可能である場合に限られる。
また、情報漏洩の発覚後には、ジョブの対象となる文書データの内容に基づいて当該ジョブを特定する必要があることから、当該ジョブの履歴情報と共に文書データ或いはその内容に関する情報を蓄積することが必須である。そのため、上記従来の技術を情報漏洩対策としてのジョブ履歴蓄積に適用した場合では、すべてのジョブが文書データと共に蓄積されることになり、目的とする蓄積容量の効率的な使用が不可能となってしまう。
ここで、蓄積容量を削減するために文書データを一律に圧縮して蓄積することも考えられるが、情報漏洩が発生し、蓄積されたデータを実際に参照する際に十分な情報量が得られない可能性が生じる。一方、十分な情報が得られるようにすると、必要となる蓄積容量はほとんど削減されないことになってしまう。
本発明は、上記課題を解決するために成されたものであり、ネットワーク化された環境における限られた資源(蓄積容量)の中で、実行されたジョブの履歴情報を効率良く蓄積することができる情報処理装置及び方法、並びにプログラムを提供することを目的とする。
上記目的を達成するために、請求項1記載の情報処理装置は、機器の動作履歴情報を作成する情報処理装置であって、前記機器の動作によって得られた文書データの文書機密度を算出する文書機密度算出手段と、前記算出された文書機密度に基づいて、前記文書データを蓄積用文書データに加工する文書データ加工手段と、前記蓄積用文書データを前記機器の動作履歴情報と共に蓄積する履歴情報蓄積手段とを備えることを特徴とする。
上記目的を達成するために、請求項5記載の情報処理装置の処理方法は、機器の動作履歴情報を作成する情報処理装置の処理方法であって、前記機器の動作によって得られた文書データの文書機密度を算出する文書機密度算出ステップと、前記算出された文書機密度に基づいて、前記文書データを蓄積用文書データに加工する文書データ加工ステップと、前記蓄積用文書データを前記機器の動作履歴情報と共に記憶装置に蓄積させる履歴情報蓄積ステップとを備えることを特徴とする。
本発明によれば、機器の動作によって得られた文書データの文書機密度を算出し、算出された文書機密度に基づいて、文書データを蓄積用文書データに加工し、蓄積用文書データを機器の動作履歴情報と共に蓄積するので、ネットワーク化された環境における限られた資源(蓄積容量)の中で、実行されたジョブの履歴情報を効率良く蓄積することができる。
以下、本発明の実施の形態を図面を参照して詳細に説明する。
[第1の実施の形態]
図1は、本発明の第1の実施の形態に係る情報処理システムの全体構成を機能的に示した図である。
図1において、情報処理システムは、印刷機能や複写機能、画像読み取り機能等の複数の機能を有する複合機(MFP:Multi Function Printer)101を有する。また、情報処理システムは、MFP101等で実行されるジョブの履歴情報を蓄積・管理する履歴管理サーバ102を有する。また、情報処理システムは、ジョブの実行により得られた文書データを蓄積・管理する文書管理サーバ103を有する。また、情報処理システムは、コンピュータ等の情報処理装置から成るクライアント104と、これらを互いに接続するLAN(Local Area Network)等のネットワーク105とを有する。
MFP101は、その機能的な構成として、紙文書から画像の読み取りを行う文書読取部101aと、文書データの印刷出力を行う文書印刷部101bと、全体を管理するMFP管理部101cとを有する。また、MFP101は、ユーザからの操作指示を受け付けたり、文書データの表示を行ったりする操作入出力部101dと、履歴情報作成部101eと、サービス提供・実行部101fとを有する。
MFP管理部101cは、操作入出力部101dから入力されるユーザの指示情報に基づいて、文書読取部101a又は文書印刷部101bにて所定のジョブを実行させる。履歴情報作成部101eは、ジョブの実行に応じて当該ジョブの履歴情報(機器の動作履歴情報)を作成する。MFP管理部101cは、履歴情報作成部101eによって作成されたジョブ履歴情報の蓄積を、サービス提供・実行部101fを介して外部の監視サービス(ここでは履歴管理サーバ102)に要求する。このサービス提供・実行部101fは、クライアント104がネットワーク105を介してMFP101の複数の機能を利用することを可能にするものである。
履歴管理サーバ102は、サービス提供部102aと、履歴情報管理部102bと、履歴情報記憶部102cとを備える。
履歴情報管理部102bは、MFP101から受信したジョブ履歴情報の蓄積要求に応じて、ジョブ履歴情報(機器の動作履歴情報)を履歴情報記憶部102cに蓄積したり、履歴情報記憶部102cから読み出したりする。サービス提供部102aは、履歴情報記憶部102cに蓄積されたジョブ履歴情報を、ネットワーク105を介してMFP101やクライアント104が利用することを可能にするものである。
文書管理サーバ103は、履歴管理サーバ102と同じように、サービス提供部103aと、文書データ管理部103bと、文書データ記憶部103cとを備える。文書管理サーバ103は、履歴管理サーバ102がジョブ履歴情報を管理しているのに対して、文書データそのものを管理している。
クライアント104は、サービス実行部104aと、操作入出力部104bとを備える。クライアント104は、MFP101、履歴管理サーバ102や文書管理サーバ103により提供されるサービスを操作入出力部104bによってユーザが利用可能としている。
本情報処理システムでは、MFP101で実行されたジョブの履歴情報が該MFP101上で作成され、ネットワーク105を介して履歴管理サーバ102に蓄積される。そのため、ユーザは、クライアント104から履歴管理サーバ102のサービスを利用することで、情報漏洩の問題が発覚後にジョブ履歴情報の検索を行うことができる。
なお、図1に示したMFP101やクライアント104等の数はこれに限定されず、ネットワーク105に複数接続されていてもよい。また、他の装置がネットワーク105に接続されていてもよいことは云うまでもない。
図2は、図1におけるMFP101のハードウェア構成を示すブロック図である。
図2において、MFP101は、ハードウェア構成として、CPU(Central Processing Unit:中央演算処理装置)201と、ROM(Read Only Memory)202と、RAM(Random Access Memory)203と、記憶装置204とを有する。さらに、MFP101は、入力装置205と、表示装置206と、読取装置207と、印刷装置208と、通信装置209と、システムバス(BUS)210とを有する。
CPU201は、各種機能を実現するための演算処理、論理判断処理であるプログラムを実行すると共に、BUS210を介して接続された後述する各構成要素を制御する。ROM202は、読み出し専用の固定メモリであり、CPU201によって実行されるプログラム等を記憶する。RAM203は、各構成要素からの各種データの一時記憶に用いられる。
記憶装置204は、ハードディスクであり、CPU201によって実行されるプログラムやデータ等を記憶する。入力装置205は、キーボード、マウス、及び操作パネル等から成る。表示装置206は、CRT(陰極線管)或いは液晶表示装置等から成る。また、表示装置206は、入力装置205を兼ねたタッチパネルディスプレイであってもよい。読取装置207は、スキャナ等から成る。印刷装置208は、プリンタや紙装填ユニット等から成る。
通信装置209は、LANコントローラ等から成り、通信回線を介して外部とのデータ交換を行う。BUS210は、CPU301の制御対象である各構成要素を指示するためのアドレス信号、コントロール信号を転送する。また、後述する各構成要素間のデータ転送を行う。
図3は、MFP101のソフトウェア構成を示すブロック図である。
図3において、MFP101は、ソフトウェア構成として、ネットワークドライバ301と、トランスポート制御部302と、メッセージング制御部303と、アプリケーション304と、デバイス制御部305とを備える。
CPU201がROM202または記憶装置204に記憶されているプログラムを実行することによって、ネットワークドライバ301、トランスポート制御部302、メッセージング制御部303、アプリケーション304、及びデバイス制御部305の各モジュールが構成される。
ネットワークドライバ301は、通信装置209を制御し、ネットワーク105を介して外部とのデータ交換を行うためのモジュールである。トランスポート制御部302は、TCP/IPによるデータ交換、HTTPリクエストパケットの受信及び解析、HTTPレスポンスパケットの返信を制御するためのモジュールである。解析されたデータは、上位にあるメッセージング制御部303に渡される。
メッセージング制御部303は、SOAP(Simple Object Access Protocol)プロトコルを制御し、受信したXML形式のデータをXMLパーサを用いて解析し、指示されたアプリケーションを呼び出す。また、メッセージング制御部303は、返すべきデータをXML形式に変換し、トランスポート制御部302を用いて返信する。
アプリケーション304は、本システムで実現している機能を提供する。提供される機能は、例えばMFP101における画像読み取り機能やコピー機能、印刷機能であり、履歴管理サーバ102、文書管理サーバ103における情報管理機能である。また、アプリケーション304は、ユーザの操作を受け付けるGUI機能も提供する。
デバイス制御部305は、読取装置207及び印刷装置208をアプリケーション304からの指示に基づいて制御し、データ送信や排紙制御等を行う。
次に、MFP101上で実行されたコピージョブの履歴情報を、算出された文書機密度に応じて文書情報が削減された文書データと共に履歴管理サーバ102に蓄積する処理の流れを図4〜図10を参照して説明する。なお、本実施の形態では、一例としてコピージョブを実行する場合について説明するが、他のジョブを実行する場合であっても同様である。
図4は、図1の情報処理システムにおける文書機密度の算出ルールの一例を示す図である。
図4において、文書機密度とは、「機密文書との最大類似度」と、「機密用語に基づく機密度」と、「固有表現に基づく機密度」との総和となっている。
「機密文書との最大類似度」とは、予め登録されている「機密文書との類似度」の中の最大値である。この「機密文書との類似度」は、文書間の「意味概念ベクトル類似度」に100を乗じた値が用いられる。「意味概念ベクトル」は、文書の特徴をn次元のベクトルで表現したものであり、その類似度として余弦値が用いられる。
特徴ベクトルは、n個の意味分類を次元とし、その特徴量を値とするものである。文書の特徴ベクトル:Pは、単語レベルの特徴ベクトルを予めシステムで保持しており、文書に出現する単語すべての特徴ベクトルの総和を求め、ノルム1で正規化したものが用いられる。これにより、類似度である余弦値は、ベクトル間の内積に等しく、同次元の値同士の積の総和となる。
「機密用語に基づく機密度」は、予め登録されている「機密用語の出現頻度」が用いられる。「固有表現に基づく機密度」は、人名・地名等の「固有表現単語の出現頻度」を10で割った値が用いられる。
図5は、情報処理システムにおける文書情報の削減条件を決定するルールの一例を示す図である。
図5において、文書情報の削減条件は、図4に示した算出ルールにより算出された文書機密度に基づいて決定される。
文書情報の削減条件は、文書機密度のレベルによって5段階に分けられ、それぞれに文書情報の削減条件が設定されている。例えば、文書機密度が80以上ある場合、文書削減条件として、文書データから文書情報を削減することなく文書データそのものを無加工で履歴管理サーバ102に蓄積する。
文書機密度が50以上ある場合、文書情報削減条件として文書データの画像解像度を30%落とす加工処理を行い、また文書機密度が10以上ある場合は、文書情報削減条件として画像を白黒変換した後に画像解像度を50%落とす加工処理を行う。更に、文書機密度が10以上あるときは、文書情報削減条件として画像から抽出されたテキストデータのみを蓄積する。それ以下の場合は何のデータも蓄積しない。
図6は、MFP101からネットワーク105上に散在するサービスを検索する流れを示すフローチャートである。なお、MFP101とクライアント104とは同一の処理を実行することから、図6ではMFP101をクライアント104に置き換えて説明することも可能である。
図6において、MFP101側では、ネットワーク105上の各サーバに対してディスカバリリクエストをそれぞれ送信して、対応するサービスを提供するサーバの検索を実行する(ステップS601)。
各サーバ側は、MFP101側からの同リクエストを受信した後(ステップS602でYES)、同リクエストの内容を解析する。そして、各サーバ側は、要求されているサービスと提供しているサービスとが一致し、当該サービスの提供が可能であることを判断して(ステップS603でYES)、MFP101側にレスポンスを発行する(ステップS604)。
MFP側では、各サーバ側からのレスポンスを受信しないときは(ステップS605でNO)、ステップS607へ進む一方、レスポンスを受信したときは(ステップS605でYES)、該レスポンスの内容をサービステーブルに登録する(ステップS606)。ここで、サービステーブルとは、MFP101及びクライアント104が保存するテーブル情報であり、ネットワーク105上の各種サーバや複合機等で提供されているサービス内容を登録、管理するものである。
ステップS607では、サービステーブルの更新を行う。具体的には、サービステーブルに蓄積済で応答無しのサービスを該サービステーブルから削除する。つづいて、ステップS608では、規定時間が経過したか否かを判別し、経過した場合は(ステップS608でYES)、サーバ検索を規定時間間隔で繰り返すためにステップS601に戻る一方、規定時間を経過していない場合は(ステップS608でNO)、規定時間を経過するまで待機する。本処理により、サービステーブルの登録内容が常に最新の状態に更新される。
図7は、MFP101上でのコピージョブ実行からジョブ履歴情報の蓄積までの流れを示すフローチャートである。図7〜図9に示す処理は、MFP101のCPU201により読み出されたプログラムに基づいて実行されるものとする。
図7において、MFP101では、ユーザ指示に従ったコピージョブを実行し、文書読取部101aにて読み取った文書の画像データをジョブ実行対象の文書データとしてRAM203又は記憶装置204に一時記憶する(ステップS701)。その後、ステップS701において、読み取った文書の画像データを文書管理サーバ103の文書データ記憶部103cに記憶すべく文書管理サーバ103に転送する。
次に、ステップS702において、ジョブ履歴情報を作成する。ジョブ履歴情報は、画像読み取りやコピー等を示すジョブタイプ情報とその実行パラメータ、ジョブ実行ユーザ情報、日時情報、及び実行したMFP101に関するデバイス情報から構成される。
次に、ステップS703において、作成されたジョブ履歴情報と共に履歴管理サーバ102に蓄積する蓄積用文書データを、RAM203又は記憶装置204に一時記憶された文書データから作成する(蓄積用文書データ作成処理)。
次に、ステップS704では、作成された蓄積用文書データとジョブ履歴情報を履歴管理サーバ102に蓄積するジョブ履歴情報蓄積処理を行って、本処理を終了する。
図8は、図7のステップS703におけるMFP蓄積用文書データ作成処理の詳細を示すフローチャートである。
図8において、ステップS901では、RAM203又は記憶装置204に一時記憶された文書データの解析を行い、OCR処理を行うことによりテキストデータを抽出する(文書解析処理)。次に、ステップS902において、抽出されたテキストデータから形態素解析処理によって単語とその単語の品詞情報及び特徴ベクトルを抽出し、文書全体の特徴ベクトルを、単語ベクトルの総和をノルム1で正規化することによって算出する(文書特徴量抽出処理)。
次に、ステップS903において、抽出された単語と特徴ベクトルを利用し、図4に示した機密度算出ルールに基づいて文書機密度を算出する(文書機密度算出処理)。次に、算出された文書機密度を利用し、図5に示した文書情報の削減条件決定ルールに基づいて文書情報の削減条件を決定し(ステップS904)(削減条件決定処理)する。そして、決定された削減条件に基づいて文書データの文書情報を削減して(ステップS905)(文書情報削減処理)、リターンする。
図9は、図8のステップS903におけるMFP101の文書機密度算出処理の詳細を示すフローチャートである。
図9において、ステップS1001では、文書機密度、機密文書との最大類似度、機密用語に基づく機密度、及び固有表現に基づく機密度を保持するためのデータの各データの値を0にし、カウンタ(N及びM)の値を1にして初期化を行う(リセット処理)。
次に、予め登録されている機密文書との最大類似度を算出する。すなわち、ステップS1002では、登録済の機密文書の有無を判別し、登録済の機密文書がない場合は、ステップS1007へスキップする。一方、登録済の機密文書が複数存在する場合は、ステップS1003に進み、カウンタN番目(初期化直後は1番目)の登録済の機密文書との類似度を算出する。類似度の算出は、図4で示したように、文書全体の特徴ベクトル間の内積値に100を乗じることで行う。
次に、ステップS1004では、機密文書類似度の登録の更新処理を行う。具体的には、ステップS1003で算出した類似度と現在登録されている最大類似度とを比較し、ステップS1003で算出した類似度が大きい場合は、現在登録されている最大類似度を更新する。そして、登録済みの機密文書との比較がすべて終了した後、最終的に登録された最大類似度をこの文書の「機密文書との最大類似度」とする。
次に、ステップS1005では、類似度未算出の登録済機密文書の有無を判別し、類似度未算出の登録済機密文書がある場合は、ステップS1006でカウンタNを1増やし、(N+1)番目の登録済文書に対してステップS1003〜S1005の処理を繰り返す。一方、すべての登録済文書との類似度を算出し、その最大類似度の更新が終了したときは、ステップS1007へ進む。
ステップS1007以降では、抽出された単語毎に機密度の算出を行う。
ステップS1007では、カウンタM番目(初期化直後は1番目)の単語情報を取得し、ステップ1008では取得した単語の品詞情報から固有表現単語か否かを判別する。この判別の結果、固有表現単語である場合は、ステップS1009において、固有表現に基づく機密度を算出する。例えば、図4で示したように、固有表現単語の出現頻度を10で割ったものを固有表現に基づく機密度としているので、カウンタM番目の単語の出現頻度を10で割った値を、現在保持している固有表現に基づく機密度に加算することで行う。
次に、ステップS1010では、カウンタM番目の単語が蓄積済の機密用語か否かを判別し、機密用語である場合はステップS1011において、機密用語に基づく機密度を算出する。例えば、図4で示したように、機密用語の出現頻度を機密用語に基づく機密度としているので、カウンタM番目の単語の出現頻度を、現在保持している機密用語の機密度に加算することで行う。
次に、ステップS1012では、機密度未算出の単語の有無を判別し、機密度未算出の単語がある場合は、ステップS1013でカウンタMを1増やし、(M+1)番目の単語に対してステップS1007〜S1012を繰り返す。一方、すべての単語から機密度の算出が終了したときは、ステップS1014へ進む。
ステップS1014では、ステップS1013までの処理で得られた値を統合することで、文書の機密度を算出する。文書機密度の算出は、図4で示したように、機密文書との最大類似度と、機密用語に基づく機密度と、固有表現に基づく機密度との総和を計算することで行われる。
図10は、図7のステップS704におけるジョブ履歴情報の蓄積処理の詳細を示すフローチャートである。
図10において、MFP101は、上述したサービステーブルに基づいてジョブ履歴情報を管理するサービスを提供しているサーバを検索し(ステップS801)、該当するサービスを提供するサーバが存在しない場合は(ステップS802でNO)、そのままリターンする。一方、該当するサービスを提供するサーバ(ここでは履歴管理サーバ102)が存在する場合は、ステップS803に進み、該履歴管理サーバ102にデータ蓄積リクエストを送信する。
履歴管理サーバ102は、MFP101からデータ蓄積リクエストを受信すると(ステップS804でYES)、MFP101に対してレスポンスを発行する(ステップS805)。
履歴管理サーバ102からレスポンスを受信(ステップS806でYES)したMFP101は、ステップS807において、履歴管理サーバ102に蓄積するジョブ履歴情報と蓄積用文書データを送信する。
MFP101からデータを受信(ステップS808でYES)した履歴管理サーバ102は、ステップS809において、履歴情報記憶部102c(管理システム)にデータを蓄積し、蓄積終了通知をMFP101に送信して(ステップS810)、リターンする。
一方、履歴管理サーバ102から蓄積終了通知を受信(ステップS811でYES)したMFP101は、ステップS812において、一時保存していたデータ等を削除する終了処理を行い、リターンする。
上記処理により、MFP101上で実行されたジョブの履歴情報を、算出された文書機密度に応じて文書情報が削減された文書データと共に履歴管理サーバ102に蓄積することができる。
なお、上記ステップS806及びステップS811において、直前の送信処理から所定時間内に受信しなかった場合は、ステップS801に戻り、再度サービステーブルから利用可能なサーバの検索を行うようにしてもよい。
本第1の実施の形態によれば、情報処理システム上でMFP101等により実行されたジョブの履歴情報を履歴管理サーバ102に蓄積する際に、当該ジョブの実行により得られた文書データの文書情報を、算出された文書機密度に応じて削減するので、ネットワーク化された環境における限られた資源(蓄積容量)の中で、実行されたジョブの履歴情報を効率良く蓄積することができる。
[第2の実施の形態]
本発明の第2の実施の形態は、その構成(図1〜図3)が、上記第1の実施の形態と同じであり、その説明を省略する。以下に、上記第1の実施の形態と異なる点のみを説明する。
上記第1の実施の形態における文書機密度の算出方法では、登録済の機密文書との類似度をすべて求め、その最大値を使用している。本実施の形態では、機密文書の管理を他の電子文書と共に文書管理サーバ103で管理する形態を示す。これによって、文書管理サーバ103にジョブ対象文書の特徴量を検索クエリとして検索が行われ、容易に機密文書との最大類似度を得ることが可能となる。
図11は、本発明の第2の実施の形態に係る情報処理システムにおける文書管理サーバにより登録済の機密文書との最大類似度を算出する処理を示すフローチャートである。本処理は、上記第1の実施の形態における図10のステップS1002〜ステップS1005に相当する。
図11において、MFP101は、上記第1の実施の形態で説明したサービステーブルに基づいて、電子文書情報を管理するサービスを提供しているサーバを検索し(ステップS1101)、該当するサービスを提供するサーバが存在しない場合は(ステップS1102でNO)、そのままリターンする。一方、該当するサービスを提供するサーバ(ここでは文書管理サーバ103)が存在する場合は、ステップS1103に進み、該文書管理サーバ103にデータ検索リクエストを送信する。
文書管理サーバ103は、MFP101からデータ検索リクエストを受信すると(ステップS1104でYES)、MFP101に対してレスポンスを発行する(ステップS1105)。
文書管理サーバ103からレスポンスを受信(ステップS1106でYES)したMFP101は、ステップS1107において、文書特徴ベクトルを検索クエリとして送信する。
MFP101から検索クエリを受信(ステップS1108でYES)した文書管理サーバ103は、ステップS1109において、文書データ記憶部103cからデータを検索し、検索結果データをMFP101に送信して(ステップS1110)、リターンする。
MFP101は、文書管理サーバ103から検索結果データを受信すると(ステップS1111でYES)、ステップS1112において、検索結果における機密文書の最大類似度を更新してリターンする。
上記処理において、検索クエリとして文書データそのものを文書管理サーバ103に送信し、文書管理サーバ103側でサポートする類似文書検索を行い、その検索結果を利用する形態でも可能である。いずれにせよ、機密文書の管理を文書管理サーバ103が担うことによって、業務で管理する電子文書との一元管理することが可能となる。
上記第2の実施の形態によれば、機密文書の管理を他の電子文書と共に文書管理サーバ103で管理することにより、容易に機密文書との最大類似度を得ることが可能である。
上記第1及び第2の実施の形態における機密度算出のための文書特徴量は、テキストデータを解析して得た特徴量であるが、テキストデータに限らず、レイアウトや画像特徴を用いることも可能である。
また、固有表現単語、機密用語を用いた機密度の算出において、単語毎に固定の値を持たせ、それを出現頻度に乗じた値の総和を用いることで、より高精度な機密度算出が可能である。そのような処理の場合には、逆に単語に意図的に大きな負の値を設定することで、蓄積対象から外すための仕掛けを組み込ませることも可能となる。
また、情報量の削減手段においても、ファイルサイズを削減することが目的とする汎用の圧縮処理やテキスト系の要約処理等を組み合わして使うことは当然ながら可能である。
また、機密文書・固有表現単語・機密用語とも予めシステムに登録させておくことも可能であり、稼動後にユーザが任意のタイミングで追加・削除等の編集を行うことも可能である。
また、従来文書情報の蓄積をするか否かの判断に用いられていたジョブタイプやデバイス等のジョブ履歴情報を、本発明における機密度の算出や情報削減条件を決定するための条件に組み入れることも可能である。例えば、特定のユーザのジョブの機密度を一律高めるとか、特定のデバイスに対しての機密度を下げる等のコントロールが可能である。
また、ジョブ実行直後にすぐにジョブ履歴情報の蓄積処理を実行する必要はなく、深夜等に複数のジョブに対してまとめて処理を実行することも可能である。
本発明の目的は、上記実施の形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)が記憶媒体に記憶されたプログラムコードを読み出して実行することによっても達成される。
この場合、記憶媒体から読み出されたプログラムコード自体が上述した実施の形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
また、プログラムコードを供給するための記憶媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光磁気ディスク、CD−ROM、CD−R、CD−RW、DVD−ROM、DVD±R、DVD−RAM、DVD±RW、磁気テープ、不揮発性のメモリカード等を用いることができる。または、プログラムコードをネットワークを介してダウンロードしてもよい。
また、コンピュータが読み出したプログラムコードを実行することにより、上記実施の形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行い、その処理によって上述した実施の形態の機能が実現される場合も含まれる。
更に、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって上述した実施の形態の機能が実現される場合も含まれる。
また、コンピュータが読み出したプログラムコードを実行することにより、前述した各実施の形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOSなどが実際の処理の一部または全部を行い、その処理によって前述した各実施の形態の機能が実現される場合も、本発明に含まれることは云うまでもない。
この場合、上記プログラムは、該プログラムを記憶した記憶媒体から直接、またはインターネット、商用ネットワーク、若しくはローカルエリアネットワーク等に接続された不図示の他のコンピュータやデータベース等からダウンロードすることにより供給される。
本発明の第1の実施の形態に係る情報処理システムの全体構成を機能的に示した図である。 図1におけるMFP101のハードウェア構成を示すブロック図である。 MFP101のソフトウェア構成を示すブロック図である。 図1の情報処理システムにおける文書の機密度算出ルールの一例を示す図である。 情報処理システムにおける文書情報の削減条件を決定するルールの一例を示す図である。 情報処理システムにおけるネットワーク105上に散在するサービスを検索する流れを示すフローチャートである。 MFP101上でのジョブ実行から履歴情報蓄積までの流れを示すフローチャートである。 図7のステップS703におけるMFP蓄積用文書データ作成処理の詳細を示すフローチャートである。 図8のステップS903におけるMFP101の文書機密度算出処理の詳細を示すフローチャートである。 図7のステップS704におけるジョブ履歴情報蓄積処理の詳細を示すフローチャートである。 本発明の第2の実施の形態に係る情報処理システムにおける文書管理サーバによって蓄積済の機密文書との最大類似度を算出する処理を示すフローチャートである。
符号の説明
101 MFP
101c MFP管理部
102 履歴管理サーバ
102c 履歴情報記憶部
103 文書管理サーバ
103c 文書データ記憶部
104 クライアント
105 ネットワーク

Claims (9)

  1. 機器の動作履歴情報を作成する情報処理装置であって、
    前記機器の動作によって得られた文書データの文書機密度を算出する文書機密度算出手段と、
    前記算出された文書機密度に基づいて、前記文書データを蓄積用文書データに加工する文書データ加工手段と、
    前記蓄積用文書データを前記機器の動作履歴情報と共に蓄積する履歴情報蓄積手段とを備えることを特徴とする情報処理装置。
  2. 前記文書機密度算出手段は、予め蓄積された機密文書との類似度を算出する文書類似度算出手段を備えることを特徴とする請求項1記載の情報処理装置。
  3. 前記文書機密度算出手段は、前記抽出された文書特徴に含まれる単語が固有表現単語であるか否かを判定する固有表現単語判定手段を備えることを特徴とする請求項1又は2記載の情報処理装置。
  4. 前記文書機密度算出手段は、前記抽出された文書特徴に含まれる単語が予め蓄積された機密用語であるか否かを判定する機密用語判定手段を備えることを特徴とする請求項1乃至3のいずれか1項に記載の情報処理装置。
  5. 機器の動作履歴情報を作成する情報処理装置の処理方法であって、
    前記機器の動作によって得られた文書データの文書機密度を算出する文書機密度算出ステップと、
    前記算出された文書機密度に基づいて、前記文書データを蓄積用文書データに加工する文書データ加工ステップと、
    前記蓄積用文書データを前記機器の動作履歴情報と共に記憶装置に蓄積させる履歴情報蓄積ステップとを備えることを特徴とする情報処理装置の処理方法。
  6. 前記文書機密度算出ステップは、予め蓄積された機密文書との類似度を算出する文書類似度算出ステップを備えることを特徴とする請求項5記載の情報処理装置の処理方法。
  7. 前記文書機密度算出ステップは、前記抽出された文書特徴に含まれる単語が固有表現単語であるか否かを判定する固有表現単語判定ステップを備えることを特徴とする請求項5又は6記載の情報処理装置の処理方法。
  8. 前記文書機密度算出ステップは、前記抽出された文書特徴に含まれる単語が予め蓄積された機密用語であるか否かを判定する機密用語判定ステップを備えることを特徴とする請求項5乃至7のいずれか1項に記載の情報処理装置の処理方法。
  9. 請求項5乃至8のいずれか1項に記載の情報処理装置の処理方法をコンピュータに実行させるためのコンピュータに読み取り可能なプログラム。
JP2005268633A 2005-09-15 2005-09-15 情報処理装置及び方法、並びにプログラム Pending JP2007081955A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005268633A JP2007081955A (ja) 2005-09-15 2005-09-15 情報処理装置及び方法、並びにプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005268633A JP2007081955A (ja) 2005-09-15 2005-09-15 情報処理装置及び方法、並びにプログラム

Publications (1)

Publication Number Publication Date
JP2007081955A true JP2007081955A (ja) 2007-03-29

Family

ID=37941758

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005268633A Pending JP2007081955A (ja) 2005-09-15 2005-09-15 情報処理装置及び方法、並びにプログラム

Country Status (1)

Country Link
JP (1) JP2007081955A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010081056A (ja) * 2008-09-24 2010-04-08 Fuji Xerox Co Ltd 設定確認報知システム、及び設定自動修正システム
JP2010134586A (ja) * 2008-12-03 2010-06-17 Fuji Xerox Co Ltd 情報処理装置及びプログラム
JP2012194970A (ja) * 2011-03-14 2012-10-11 Internatl Business Mach Corp <Ibm> 内密の(イン−プライベート)ブラウジングのための方法、システム、およびコンピュータ・プログラム(製品)
US8307451B2 (en) 2009-02-24 2012-11-06 International Business Machines Corporation Method, apparatus and computer program for supporting determination on degree of confidentiality of document
US8760702B2 (en) 2011-09-07 2014-06-24 Ricoh Company, Ltd. Device cooperation system, image forming apparatus, function providing method

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010081056A (ja) * 2008-09-24 2010-04-08 Fuji Xerox Co Ltd 設定確認報知システム、及び設定自動修正システム
JP2010134586A (ja) * 2008-12-03 2010-06-17 Fuji Xerox Co Ltd 情報処理装置及びプログラム
JP4666065B2 (ja) * 2008-12-03 2011-04-06 富士ゼロックス株式会社 情報処理装置及びプログラム
US8307451B2 (en) 2009-02-24 2012-11-06 International Business Machines Corporation Method, apparatus and computer program for supporting determination on degree of confidentiality of document
US8769700B2 (en) 2009-02-24 2014-07-01 International Business Machines Corporation Method, apparatus and computer program for supporting determination on degree of confidentiality of document
JP2012194970A (ja) * 2011-03-14 2012-10-11 Internatl Business Mach Corp <Ibm> 内密の(イン−プライベート)ブラウジングのための方法、システム、およびコンピュータ・プログラム(製品)
US8760702B2 (en) 2011-09-07 2014-06-24 Ricoh Company, Ltd. Device cooperation system, image forming apparatus, function providing method

Similar Documents

Publication Publication Date Title
JP5173594B2 (ja) 管理装置、画像形成装置及びそれらの処理方法
JP5129640B2 (ja) 出力装置とその制御方法
US20060187496A1 (en) Digital computer and system for recording information on operations
JP2007299308A (ja) ジョブ処理システム、ジョブ処理方法、プログラムおよび記録媒体
CN101212533A (zh) 图像日志管理装置、记录介质和图像日志管理方法
CN101964855A (zh) 信息处理装置及信息处理方法
CN101449277B (zh) 信息处理设备和信息处理方法
JP2001134612A (ja) 電子文書公開システム、電子文書公開方法、情報処理装置及び記録媒体
JP2007081955A (ja) 情報処理装置及び方法、並びにプログラム
JP5371611B2 (ja) データ処理システム、サーバ、サーバの制御方法、及びプログラム
JP5458861B2 (ja) 文書検索装置、プログラム、文書登録装置、および文書検索システム
JP2005252715A (ja) 画像登録装置、画像検索装置、画像管理方法およびプログラム
JP2010160740A (ja) 管理装置、情報処理装置、ログ処理方法及びプログラム
JP2021096832A (ja) 情報処理装置、情報処理システム、方法およびプログラム
US20030142347A1 (en) Method and apparatus for embodying documents
JP2015108857A (ja) システム、その制御方法、情報処理装置、その制御方法及びプログラム
JP2007087186A (ja) ログ収集システムおよび方法
JP2008035224A (ja) ログ情報管理システム、ログ情報管理装置、ログ情報管理方法、ログ情報管理プログラム及び記憶媒体
JP2006331274A (ja) ネットワーク文書管理システム、及びその制御方法、並びに記憶媒体
JP2005050018A (ja) 文書ファイル管理装置及びデータ構造
JP2004151994A (ja) データ処理装置
JP2001216260A (ja) サーバ
JP2007080066A (ja) 情報処理システム及びその制御方法
JP2005050017A (ja) 文書ファイル管理装置、文書ファイル管理方法及びデータ構造
JP2008176710A (ja) 文書管理システム、文書管理装置および文書管理プログラム

Legal Events

Date Code Title Description
RD05 Notification of revocation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7425

Effective date: 20070626