JP4145171B2 - Image processing device unauthorized use monitoring device - Google Patents

Image processing device unauthorized use monitoring device Download PDF

Info

Publication number
JP4145171B2
JP4145171B2 JP2003066905A JP2003066905A JP4145171B2 JP 4145171 B2 JP4145171 B2 JP 4145171B2 JP 2003066905 A JP2003066905 A JP 2003066905A JP 2003066905 A JP2003066905 A JP 2003066905A JP 4145171 B2 JP4145171 B2 JP 4145171B2
Authority
JP
Japan
Prior art keywords
word
image data
document
image
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003066905A
Other languages
Japanese (ja)
Other versions
JP2004280169A (en
Inventor
敦士 太田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2003066905A priority Critical patent/JP4145171B2/en
Publication of JP2004280169A publication Critical patent/JP2004280169A/en
Application granted granted Critical
Publication of JP4145171B2 publication Critical patent/JP4145171B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Cleaning In Electrography (AREA)
  • Control Or Security For Electrophotography (AREA)
  • Character Discrimination (AREA)
  • Facsimiles In General (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、プリンタ、スキャナ、複写機、これらの複合機等の画像処理装置が不正使用されることを監視するための不正使用監視装置に係る。特に、本発明は、ユーザが要求した画像処理に係る画像データと、そのユーザを特定するための情報(ID番号等)とを関連付けて記憶することによって不正使用を監視する監視装置における情報記憶動作の改良に関する。
【0002】
【従来の技術】
近年、オフィス等においては、パーソナルコンピュータ等の端末をネットワークを通じてデジタル複合機等の画像処理装置に接続したシステムを構築していることが多い。この種の画像処理装置は、プリンタ、スキャナ、複写機等としての役目を果たす複合機として構成されているものが一般的である。つまり、プリンタ機能では、端末からネットワークを通じて印刷データ(イメージデータやテキストデータ)を受信し、この印刷データに基づく画像や文字等を記録用紙に記録する。スキャナ機能では、読み取った原稿の画像を端末のディスプレイ等に表示する。複写機能では、上記スキャナ機能によって読み取った原稿画像を記録用紙に記録する。
【0003】
このような画像処理装置は、オフィスでの作業効率の向上に多大に貢献するものの、簡単かつ容易に使用することができるので、仕事以外の私事(私用)のために不正使用されることが度々あった。
【0004】
この画像処理装置の不正使用を抑制することに鑑みられたものとして下記の特許文献1,2がこれまでに提案されている。
【0005】
特許文献1には、システム使用者(ユーザ)に対応した個人情報を記録した複数の個人カードを用意しておくと共に、マルチファンクションプリンタに接続するキーカウンタに、個人カードの差込口を複数設けた構成が開示されている。そして、1箇所の差込口をプリンタの複写機能に、他の差込口をプリンタのプリント機能にそれぞれ対応させ、個人カードをキーカウンタのプリント機能に対応する差込口で読み出したときに、読み出された個人情報をネットワーク接続時の個人情報と照合し、その照合の結果、各個人情報が一致したことを条件に、サーバで保持している印字データの印字をプリンタにより実行可能にしている。また、この印字動作を実行した際、ユーザ別の印字枚数をデータ記憶部に記録するようにしている。
【0006】
特許文献2は、本発明の発明者が提案したものであって、記録用紙へのデータ記録が行われたときに、このデータ記録を要求したユーザのID番号と記録されたデータとを対応づけて記憶することにより、何れのユーザが如何なるデータを記録したかを管理者が知ることができ、画像処理装置の不正利用を把握することを可能にしたものである。また、この特許文献2では、ユーザのID番号と記録された画像データとを対応づけた情報の記憶を実行するか否かを、ユーザ毎に予め設定した保存率に基づいて決定している。
【0007】
【特許文献1】
特開平11−24859号公報
【特許文献2】
特開2002−116901号公報
【0008】
【発明が解決しようとする課題】
しかしながら、上記各特許文献に開示されている技術にあっては、記憶の必要のない画像データ、つまり、不正使用ではない情報(ユーザの業務に係る情報)までもが大量に記憶されてしまう可能性がある。このため、記憶装置として大きな記憶容量が必要であるばかりでなく、記憶された情報が不正使用のものであるか否かを管理者が判別していく監視作業に多大な労力を要することになって管理者の負担が大きかった。
【0009】
尚、上記特許文献2では、ユーザ毎に保存率を予め設定しておき、不正使用である可能性の高い情報を記憶する点を考慮しているが、未だその効果は十分ではなく、更なる改良が必要であった。
【0010】
本発明は、かかる点に鑑みてなされたものであり、その目的とするところは、不正使用である可能性の高い画像データを高い確率で抽出し、それのみを記憶していくことにより、記憶装置の記憶容量の削減、管理者の監視負担の軽減、監視作業の高効率化を図ることにある。
【0011】
【課題を解決するための手段】
−発明の概要−
上記の目的を達成するために、本発明は、画像データの中からそれに含まれる文字(単語)を認識し、その文字に基づいて、画像データがそのユーザの業務に係るものであるか否か、つまり、私用(不正使用)の画像処理に係るものでないか否かを判別するようにしている。そして、その画像データが私用の画像処理に係るものであると判断した場合に限り、その画像データとユーザとを関連付けて記憶するようにしている。これによって、不正使用である可能性の高い画像データを高い確率で記憶できることになる。
【0012】
−解決手段−
具体的には、画像処理要求に応じて画像処理を実行する画像処理装置が不正使用されることを監視するための不正使用監視装置を前提とする。この不正使用監視装置に対し、識別手段、記憶手段、判定手段を備えさせる。識別手段は、画像処理を要求したユーザを識別するものである。記憶手段は、識別手段により識別したユーザと、そのユーザが要求した画像処理に係る画像データの少なくとも一部分とを関連付けた情報を記憶可能なものである。判定手段は、記憶手段への情報記憶を実行するか否かを判定するものである。そして、この判定手段が、ユーザが要求した画像処理に係る画像データに含まれる文字とそのユーザの業務との関連を評価し、その評価結果に基づき、画像データが業務に関連するものでないと判定したときにのみ、その画像データの少なくとも一部分とその画像データの画像処理を要求したユーザとを関連付けた情報を記憶手段に記憶させるよう構成している。
【0013】
各手段の設置形態としては、識別手段、記憶手段、判定手段を、共に画像処理装置に備えさせるようにしている。
【0014】
これら特定事項により、ユーザが、ある画像データに対して画像処理を要求した際、判定手段によって、その画像データに含まれる文字とそのユーザの業務との関連が評価される。つまり、画像データ中にユーザの業務に関連する文字が多い場合や業務に関連する特定の文字が存在する場合には、その画像データは業務に係るものであると判断し、その画像データについては記憶手段へ記憶が行われることはない。これに対し、画像データ中にユーザの業務に関連する文字が少ない場合や私用目的として使用(不正使用)される文書に関連する文字が多い場合には、その画像データは業務に係るものではないと判断し、その画像データについては、その画像データの少なくとも一部分とそのユーザとを関連付けた情報を記憶手段に記憶させる。これにより、不正使用に係る情報のみを高い確率で抽出することができ、管理者は、大量のデータを確認することなしに不正使用を監視することが可能となる。その結果、管理者の監視負担の軽減、監視作業の高効率化を図ることが可能になる。
【0015】
また、画像処理装置を監視サーバとの間で情報の送受信を可能な構成としておき、上記記憶手段を監視サーバに備えさせる構成としてもよい。この場合の構成としては以下のものが掲げられる。つまり、監視サーバとの間で情報の送受信が可能に構成された画像処理装置が不正使用されることを監視するための不正使用監視装置を前提とする。この不正使用監視装置に対し、画像処理を要求したユーザを識別する識別手段と、上記監視サーバに備えられ、識別手段により識別したユーザと、そのユーザが要求した画像処理に係る画像データの少なくとも一部分とを関連付けた情報を記憶可能な記憶手段と、この記憶手段への情報記憶を実行するか否かを判定する判定手段とを備えさせる。そして、判定手段が、ユーザが要求した画像処理に係る画像データに含まれる文字とそのユーザの業務との関連を評価し、その評価結果に基づき、画像データが業務に関連するものでないと判定したときにのみ、その画像データの少なくとも一部分とその画像データの画像処理を要求したユーザとを関連付けた情報を記憶手段に記憶させるよう構成している。
【0016】
この構成は、例えば複数の画像処理装置と監視サーバとによってネットワークを構成する場合に有効である。つまり、管理者は、それぞれの画像処理装置において実行された不正な使用を、監視サーバ内の記憶手段に記憶された情報に対して不正使用であるか否かの判断を行うことによって一括管理することが可能になる。
【0017】
上記識別手段がユーザを識別するための手段としては、画像処理を要求したユーザのID番号を識別することが掲げられる。
【0018】
また、上記判定手段による判定動作を行うための具体的な構成としては以下のものが掲げられる。つまり、複数の単語が登録された単語辞書記憶手段と、ユーザが要求した画像処理に係る画像データ中に含まれる単語を上記単語辞書記憶手段に登録されている単語に基づいて切り出す形態素解析手段とを備えさせる。そして、判定手段が、形態素解析手段が切り出した単語とユーザの業務との関連を評価し、その評価結果に基づき、画像データが業務に関連するものでないと判定したときにのみ、その画像データの少なくとも一部分とその画像データの画像処理を要求したユーザとを関連付けた情報を記憶手段に記憶させる構成としている。
【0019】
このように予め単語辞書記憶手段に登録されている単語に基づいて、画像データ中から単語を切り出し、その切り出した単語に対して業務との関連を評価することにより、画像データが業務に関連するものであるか否かを正確に判定することが可能になる。また、単語の切り出し手法としては形態素解析を採用しているため、単語の切り出しも正確に行うことができる。この形態素解析とは、文章を文法的に解析して複数の単語に分割し、各単語の品詞や活用形等の情報を抽出する手法である。
【0020】
また、上記単語辞書記憶手段に、登録されている単語のうち業務に関連するものではない可能性の高い単語を「私用目的単語」として認識するための情報を予め記憶させておく。そして、判定手段が、単語辞書記憶手段に登録されている単語を参照し、ユーザが要求した画像処理に係る画像データから形態素解析手段によって切り出された単語に上記「私用目的単語」が含まれているときには、その画像データの少なくとも一部分とその画像データの画像処理を要求したユーザとを関連付けた情報を記憶手段に記憶させるよう構成している。
【0021】
また、単語辞書記憶手段に、業務に関連するものではない可能性の高い単語ほど高い値に設定される「私用目的ポイント」を予め単語毎に付与して記憶しておく。そして、判定手段が、単語辞書記憶手段に登録されている単語を参照し、ユーザが要求した画像処理に係る画像データから形態素解析手段によって切り出された単語の「私用目的ポイント」の総ポイント数が所定値以上であるときには、その画像データの少なくとも一部分とその画像データの画像処理を要求したユーザとを関連付けた情報を記憶手段に記憶させるよう構成している。
【0022】
これら特定事項により、単語辞書記憶手段を利用して、画像データの処理要求が私用目的であるか否かを容易に判別でき、装置の信頼性の向上を図ることができる。例えば、「私用目的単語」の有無によって判断するようにした場合には、単語辞書記憶手段に登録する「私用目的単語」として業務用文書中には存在するはずのない単語を登録しておけば、その単語を認識するのみでその画像データは記憶すべきデータであると判断することができる。また、「私用目的ポイント」の総ポイント数によって判断するようにした場合には、業務用文書での使用頻度が低い単語が多数存在する場合、それを認識することによって、その画像データは記憶すべきデータであると判断することができる。逆に、その単語(業務用文書での使用頻度が低い単語)の使用頻度が極端に少ない文書は業務用文書であると判断できるので、その画像データは記憶する必要がないと判断することが可能になる。
【0023】
尚、本解決手段の場合、「私用目的ポイント」の総ポイント数を個々の単語について個別に累積していき、総ポイント数が所定値以上に達した単語が1つでも発生した場合にその画像データを記憶するようにしてもよいし、その画像データ中の全ての単語の「私用目的ポイント」の総ポイント数の合算値が所定値以上に達した場合にその画像データを記憶するようにしてもよい。
【0024】
上記単語辞書記憶手段に登録されている単語を更新していくための構成としては以下のものが掲げられる。つまり、業務用文書を予め解析することによって業務用文書中に含まれる各単語の出現率を算出することにより文書評価データを生成する文書評価データ生成手段と、この文書評価データ生成手段により生成された文書評価データを、単語辞書記憶手段に登録されている単語毎の評価データとして記憶する文書評価データ記憶手段とを備えさせる。そして、判定手段が、画像データから切り出された各単語の出現率を個別に演算していき、この各単語の演算値と上記文書評価データ記憶手段に記憶されている各単語の評価データとを比較し、演算値が評価データの出現率未満であるとき、その画像データの少なくとも一部分とその画像データの画像処理を要求したユーザとを関連付けた情報を記憶手段に記憶させるよう構成している。具体的には、ユーザが画像処理を要求した画像データから切り出された単語の出現率を加算して単語数で正規化し、この値が所定値未満であるときに、その画像データを記憶するようにしている。
【0025】
この特定事項では、先ず、業務用文書を解析することによって業務用文書に含まれる各単語の出現率を算出して、これを文書評価データとして生成しておく。つまり、その後にユーザが画像データの処理を要求した場合、その画像データにおける各単語の出現率が上記文書評価データのものと略一致または類似した傾向にある場合には、その文書は業務用文書であって記憶しておく必要はないと判断することができる。逆に、業務用文書にあっては所定の出現率である単語が、その出現率に達していない場合には、そのユーザが画像処理を要求した文書は業務用文書ではなく私用目的の文書である可能性が高く、記憶しておくべきものであると判断することができる。このように、予め業務用文書を解析しておき、それとユーザが画像データの処理を要求した画像データとを対比することで、画像データが私用目的のものであるか否かを正確に判断することができる。
【0026】
また、単語辞書記憶手段に登録されている単語毎に「特徴ベクトル」を評価データとして付加しておく一方、業務用文書を予め解析することによって業務用文書中に含まれる各単語の「特徴ベクトル」を求めることにより文書評価データを生成する文書評価データ生成手段と、上記文書評価データ生成手段により生成された文書評価データを、単語辞書記憶手段に登録されている単語毎の評価データとして記憶する文書評価データ記憶手段とを備えさせる。そして、判定手段が、画像データから切り出された各単語の「特徴ベクトル」を認識し、その「特徴ベクトル」と上記文書評価データ記憶手段に記憶されている各単語の評価データとを比較し、上記業務用文書と画像データの「特徴ベクトル」との内積が所定値未満であるとき、その画像データの少なくとも一部分とその画像データの画像処理を要求したユーザとを関連付けた情報を記憶手段に記憶させるよう構成している。
【0027】
この特定事項により、文字列全体で評価することになるため、より正確に業務との関連性を評価できる。また、単語を直接的に評価するのではなく、その語意を反映する「特徴ベクトル」に基づいて評価するため、監視を免れるための手段を採りにくくすることができ、高い信頼性をもって不正使用の監視を実現することができる。
【0028】
また、上記業務用文書の解析を所定時間毎に実行するようにした場合には、業務内容の変化に合わせて動的に評価基準を変更することが可能になる。これにより、評価基準として正確に業務用文書のみを対象とすることができる。
【0029】
更に、文書評価データ生成手段が、業務に関連する画像データであると判定手段が判定した画像データに対して文書の解析を実行して、その結果を文書評価データ記憶手段に追加記憶させるようにした場合にも、業務内容の変化に合わせて動的に評価基準を変更することが可能になる。また、業務用文書を別途解析したり、この解析のための特別な業務用文書を用意しておく必要もなくなる。
【0030】
加えて、画像データに含まれる文字とそのユーザの業務との関連の評価を、その画像データに含まれる文字をコード変換した後に行うようにした場合には、スキャナ等で読み取った画像データ(イメージデータ)であっても効率良く評価を行うことができる。
【0031】
尚、上記各解決手段のうち何れか一つの解決手段に係る不正使用監視装置において実行される制御方法も本発明の技術的思想の範疇である。この方法は、画像処理を要求したユーザを識別する識別動作と、ユーザが要求した画像処理に係る画像データに含まれる文字とそのユーザの業務との関連を評価し、その評価結果に基づき、画像データが業務に関連するものであるか否かを判定する判定動作と、この判定動作によって画像データが業務に関連するものでないと判定したときにのみ、その画像データの少なくとも一部分とその画像データの画像処理を要求したユーザとを関連付けた情報を記憶手段に記憶させる記憶動作とを行う制御方法である。
【0032】
【発明の実施の形態】
以下、本発明の実施の形態を図面に基づいて説明する。
【0033】
(第1実施形態)
先ず、第1実施形態について説明する。本形態では、複数台のユーザ端末(情報処理装置)と1台の画像処理装置(デジタル複写機)とがネットワーク(所謂LAN(Local Area Network))に接続されて成るネットワークシステムに本発明を適用した場合について説明する。
【0034】
−ネットワークシステムの構成説明−
図1は、本発明に係る不正使用監視装置を備えたネットワークシステムを示すブロック図である。図1に示すネットワークシステムは、オフィス等で使用されるものであって、複写機(以下、コピー機と呼ぶ場合もある)、プリンタ、スキャナの役目を果たす画像処理装置(デジタル複写機)1、パーソナルコンピュータやワークステーションで成る第1及び第2ユーザ端末2,3、共有文書サーバ4等がネットワークケーブル5を通じて相互に接続されて構築されている。
【0035】
画像処理装置1は、読み取った原稿を用紙に記録するコピー機としての機能を果たしたり、ユーザ端末2,3から受信した画像データを用紙に記録するプリンタとしての機能を果たしたり、読み取った原稿画像データをユーザ端末2,3に送信するスキャナとしての機能を果たすよう構成されている。
【0036】
画像処理装置1をコピー機として使用する場合は、原稿を画像読取部11にセットし、ユーザI/F16で入力操作することにより、原稿のコピーを指示する。これに応答して制御部14は、原稿の画像をコピーするために、画像読取部11を起動する。画像読取部11は、原稿の画像を読み取り、この画像に基づいた画像データを生成して画像処理部12に出力する。画像形成部13では、この画像データに基づく画像を記録用紙に記録し、この記録用紙を排出する。
【0037】
本画像処理装置1では、モノクロ画像及びカラー画像をコピーすることが可能である。原稿の画像を記録用紙にコピーするときには、コピーの指示と共に、ユーザI/F16を操作することにより、モノクロ画像及びカラー画像の何れかを選択指示する。カラー画像を指示した場合は、画像読取部11からカラー画像を示す画像データが出力され、画像処理部12によってその画像データが処理されて、画像形成部13によってカラー画像が記録用紙に記録される。一方、モノクロ画像を指示した場合は、画像読取部11からモノクロ画像を示す画像データが出力され、画像処理部12によってその画像データが処理されて、画像形成部13によってモノクロ画像が記録用紙に記録される。
【0038】
また、画像処理装置1をプリンタとして使用する場合は、例えば第1ユーザ端末2からネットワークケーブル5を通じて画像処理装置1へと、画像や文字等を示す画像データが送信される。画像処理装置1は、ネットワークI/F17で印刷データを受信し、制御部14に備えられた図示しない言語解析部による印刷データの言語解析と、その言語解析の結果に基づく図示しない印刷データ展開部による印刷データの展開とが行われ、印刷画像処理部14h及び画像処理部12において各種の画像処理が施されてから、画像形成部13において記録用紙に画像が記録されることになる。
【0039】
あるいは、第2ユーザ端末3からネットワークケーブル5を通じて共有文書サーバ4へと、1つの画像データの記録が指示されると、共有文書サーバ4の制御部41は、この指示をネットワークI/F42を介して受け、文書アクセス管理部41aを起動する。文書アクセス管理部41aは、この画像データを記憶部43から検索し、この画像データをネットワークケーブル5を通じて画像処理装置1へと送信する。画像処理装置1では、この画像データをネットワークI/F17で受信し、この画像データを制御部14を介して画像処理部12に入力する。この画像データは、画像処理部12により処理されてから、画像形成部13に入力される。画像形成部13は、この画像データによって示される画像を記録用紙に記録する。
【0040】
このようにプリンタの役目を果たすときにも、モノクロ画像及びカラー画像を記録することができ、端末(第1及び第2ユーザ端末2,3、共有文書サーバ4)から画像処理装置1へとモノクロ画像及びカラー画像のいずれであるかを指示する。
【0041】
また、画像処理装置1をスキャナとして使用する場合は、原稿を画像読取部11にセットし、ユーザI/F16で入力操作することにより、原稿の読み取りを指示する。画像読取部11は、原稿の画像を読み取り、制御部14はこの画像に基づく画像データを例えば第1ユーザ端末2が認識できる形式となるように画像処理を行い、ネットワークケーブル5を通じて第1ユーザ端末2に送信する。第1ユーザ端末2は、この画像データについてプレビュープログラムを用いて、ユーザI/Fの表示装置(ディスプレイ)に表示する。
【0042】
以上のように、本画像処理装置1は、コピー機、プリンタ及びスキャナの役目を共に果たすことができる。従って、オフィスでの作業効率に貢献するものの仕事以外の私事のために不正利用される可能性がある。
【0043】
このため、複写機やスキャナの役目を果たすときに、本実施形態の不正使用監視装置は、図2に示すフローチャートの処理を並行して行うことにより、不正使用である可能性の高い画像データの少なくとも一部と画像処理装置1の使用者(ユーザ)のID番号とを対応させて記憶する。同様に、プリンタの役目を果たすときに、本実施形態の不正使用監視装置は、図3に示すフローチャートの処理を並行して行うことにより、不正使用である可能性の高い画像データの少なくとも一部とユーザのID番号とを対応させて記憶する。こうして画像データの少なくとも一部とユーザのID番号を対応させて保存しておけば、何時でも、いずれのユーザが如何なるデータの画像処理を実行したかを知ることができ、画像処理装置1を不正使用した使用者を把握して、この使用者を注意することにより、不正使用を抑制することができる。
【0044】
−動作説明−
<コピー動作>
以下、画像処理装置1がコピー機の役目を果たすときに行われる処理動作を図2のフローチャートを用いて説明する。尚、本画像処理装置1がスキャナの役目を果たすときに行われる処理動作も本フローチャートの場合と同様に行われる。
【0045】
コピー処理動作の実施に際し、ユーザは、先ず、予め与えられているICカード18aを画像処理装置1のユーザID入力部18に挿入する。または、非接触でユーザIDの送信が可能な非接触タグ18bをユーザID入力部18に近付ける。
【0046】
ユーザID入力部18は、ICカードの挿入を待機しており(ステップS1の「無」状態)、ICカードが挿入されると(ステップS1の「有」状態)、このICカードからユーザのID番号を読み取り、このID番号を制御部14に出力する。制御部14のユーザID識別部(識別手段)14aは、ID番号を入力し、このID番号を前回記憶したID番号と照合し(ステップS2)、このID番号が前回のID番号に一致しなければ(ステップS2の「別」判定)、このID番号を記憶すると共に、前回のID番号を消去することにより、ID番号を更新する(ステップS3)。また、このID番号が前回のID番号に一致すれば(ステップS2の「同」判定)、ステップS3の処理は行わない。そして、ユーザID識別部14aは、ICカードのID番号を画像保存管理部14bに通知する。
【0047】
この後、原稿の画像を画像読取部11にセットし、ユーザI/F16を操作することにより、原稿画像の複写が指示される(ステップS4の「有」判定)。
【0048】
このような操作によって原稿画像の複写が開始されると、先ず、上記画像読取部11において原稿の画像が1枚ずつ読み取られていく。この読み取られた画像データは画像処理部12及び制御部14にそれぞれ送信される。画像データを受信した画像処理部12では画像データが処理され、処理後の画像データが画像形成部13に入力されて記録用紙に対する画像形成が行われる。
【0049】
一方、画像データを受信した制御部14では、先ず、文字認識部14jにおいて文字認識動作が行われる(ステップS5)。この文字認識動作としては、光学式文字読み取り装置(OCR)等により実行される。これにより、イメージ画像であった文字がコード変換されることになる。
【0050】
その後、コード変換された文字データは形態素解析部(形態素解析手段)14kに送信され、この形態素解析部14kによる単語の切り出し動作が行われる(ステップS6)。具体的には、画像形成装置1の記憶部(記憶手段)15に備えられている単語辞書(単語辞書記憶手段)15aに登録されている単語に基づいてデータ中から単語が切り出される。
【0051】
図4はこの単語辞書15aの登録データの一例を示している。この単語辞書15aは、予め複数の単語を登録しておく部分である。この登録単語としては、不正使用文書であれば含んでいる可能性高い単語の他に、不正使用である可能性の低い文書に含まれる単語も掲げられる。また、この単語辞書15aへの単語の登録は、管理者が予め設定登録してもよいし、画像データの処理が実行された際に、上記形態素解析部14kが切り出した単語を順次登録していくようにしてもよい。
【0052】
また、この単語辞書15aには、登録されている単語のそれぞれに対して品詞、私用文書単語と判断するか否かの情報、評価データが記憶されている。例えば、図中の「ディスク」や「情報」等の単語は業務用文書に使用される可能性が高い単語であるとして設定されている(図中の「−」印)一方、「グルメ」や「観光」等の単語は私用文書に使用される可能性が高い単語(本発明でいう「私用目的単語」)であるとして設定されている(図中の「×」印)。上述したように画像データの処理が実行された際、単語辞書15aに単語を自動的に登録していく場合、その画像データが最終的に不正使用文書であったか業務用文書であったかによってその単語を私用文書単語と判断するか否かの情報が付加されることになる。尚、上記評価データについては後述する。
【0053】
形態素解析部14kによる単語の切り出し動作が行われた後、ステップS7に移り、保存判定部(判定手段)14dが、解析後の画像情報(切り出された単語の情報)中には私用単語、つまり、上記単語辞書において私用文書に使用される可能性が高い単語であるとして設定されている単語が存在しているか否かを判定する。
【0054】
そして、私用単語が存在していると判定された場合には、ステップS10に移り、画像保存管理部14bの画像縮小部14gが、画像処理部12からの画像データに対して縮小処理(圧縮処理)を施す。この縮小処理は、画像を縮小するための既存の方法を適用すればよく、画像の各画素を適宜に間引くという最も単純な処理方法であっても構わない。
【0055】
この画像の縮小処理の途中で、画像処理部12の特定パターン検出部12aによって画像データから特定パターンが検出され(ステップS11で「検出」判定)、この旨が画像縮小部14gに通知されると、画像縮小部14gは、画像データに対する縮小処理を中断する(ステップS12)。これは、特定パターンは、複数の使用者に共有の画像データに付加されるものであって、私用の画像データに付加されることがなく、この特定パターンが付加された画像を複写しても、画像処理装置1の不正使用にはならず、画像データの縮小及び保存を必要としないためである。
【0056】
この画像の縮小が完了するまで(ステップS13で「完」判定されるまで)、画像データから特定パターンが検出されなければ(ステップS11で「未検出」が維持)、画像保存管理部14bは、縮小された画像データとICカードのID番号を対応付けて記憶部15に記憶する(ステップS14)。尚、ここで記憶する画像データは全画像データであってもよいし、一部の画像データであってもよい。
【0057】
一方、上記ステップS7において、私用単語が存在していないと判定された場合にはステップS8に移る。このステップS8では、読み取った画像データと、予め解析された業務用文書との類似度が評価される。つまり、上記私用単語が存在していない場合であっても、業務用文書との類似度が低い場合には、私用目的の文書である可能性があるため、この文書の画像データを記憶部15に記憶させるようにするためである。
【0058】
この類似度判定は記憶部15の文書評価データ記憶部(文書評価データ記憶手段)15bに記憶されている文書評価データに基づいて行われる。この文書評価データは、業務用文書を予め解析しておくことによって業務用文書中に含まれる各単語の出現率を算出することにより生成されるものである。具体的には、共有文書サーバ4に備えられた文書評価データ生成部(文書評価データ生成手段)41bが、共有文書サーバ4中に記憶されている文書(業務用文書)を解析することによって生成される。この文書評価データ生成部41bにより生成された文書評価データが文書評価データ記憶部15bに格納され、保存判定部14dが、画像データから切り出された各単語の出現率を個別に演算していき、この各単語の演算値と上記文書評価データ記憶部15bに記憶されている各単語の評価データとを比較する。そして、演算値が評価データの出現率未満であるときに、画像処理要求された画像データと業務用文書との類似度が低く、その画像データは保存すべきものであると判定することになる。具体的には、ユーザが画像処理を要求した画像データから切り出された単語の出現率を加算して単語数で正規化し、この値が所定値未満であるときに、その画像データを記憶するようにしている。
【0059】
また、上記文書評価データを作成する際の各単語の出現率の演算は、共有文書サーバ4に備えられた使用単語統計処理部41cにおいて行われる。ここで演算された使用単語の統計は、単語統計部43bに一旦格納された後、上記文書評価データ生成部41bにおいて業務用文書の解析を実行する際にその統計データが読み出されるようになっている。
【0060】
ステップS9の判定(保存判定部14dの判定動作)で、読み取った画像データが業務用文書に類似していないと判定した場合には、その文書は記憶する必要があると判断して上記ステップS10以降の動作に移る。一方、ステップS9の判定で、読み取った画像データが業務用文書に類似していると判定した場合には、その文書は記憶することなしにステップS15に移る。
【0061】
このステップS15では、この文書、つまり業務用文書であると判定された文書の解析を行い、上述の「類似度評価」で使用される文書評価データを更新する。
【0062】
以下、このステップS15における文書評価データの更新について説明する。この文書評価データの更新動作は、上記文書評価データ記憶部15bに格納されている文書評価データを更新するための動作である。つまり、上記判定動作により新たに業務用文書であるとして認定された画像データを予め解析することによってその文書中に含まれる各単語の出現率を算出することにより、文書評価データ生成部41bが文書評価データを新規に生成するようになっている。そして、この新規作成された文書評価データが、共有文書サーバ4中の記憶部43に備えられた文書評価データ記憶部43a及び上記画像処理装置の記憶部15に備えられた文書評価データ記憶部15bにそれぞれ追加記憶される。これにより、業務内容の変化に合わせて動的に評価基準(文書評価データ)を変更することが可能になる。
【0063】
<プリント動作>
次に、画像処理装置1がプリンタの役目を果たすときに行われる処理動作を図3のフローチャートを用いて説明する。
【0064】
先に述べたように画像処理装置1は、第1及び第2ユーザ端末2,3や共有文書サーバ4からの画像データを受信し、この画像データによって示される画像の記録を行う。画像処理装置1において、制御部14の印刷画像処理14hは、ネットワークケーブル5からネットワークI/F17を介しての画像データの受信を待機しており(ステップS21の「無」状態)、画像データを受信すると(ステップS21の「有」状態)、この画像データに付加されているヘッダーを抽出して、画像データを送信したユーザ端末2のアドレスをヘッダーから読み取る。そして、印刷画像処理部14hは、このアドレスが共有文書サーバ4のものであるか否かを判定する(ステップS22)。このアドレスが共有文書サーバ4のものである場合は(ステップS22でYES判定)、印刷画像処理部14hは、モノクロ画像及びカラー画像のいずれが指示されているかをヘッダーから読み取り、モノクロ画像及びカラー画像のいずれであるかを画像処理部12に通知する(ステップS23)。また、制御部14の特定パターン付加部14iは、画像データに特定パターンを示すパターンデータを付加してから、この画像データを画像処理部12に与え、ステップS21に戻る。
【0065】
この画像データは、画像処理部12によって処理されてから画像形成部13に入力され、ここでモノクロ画像及びカラー画像のいずれかが記録用紙に記録される。この記録された画像には、特定パターンが付加されている。
【0066】
すなわち、共有文書サーバ4から受信した画像データについては、画像データを保存することなく、特定パターンを付加した画像を記録する。これは、共有文書サーバ4からの画像データは複数の使用者に共有のものであって、画像の記録を行っても、画像処理装置1の不正使用にはならず、画像データの保存を必要としないためである。
【0067】
尚、ここで印刷した記録用紙(特定パターンが付随する画像が印刷された記録用紙)を複写するときには、先に述べたように図2のステップS11において特定パターンが検出されるので、この画像を示す画像データが保存されることはない。
【0068】
また、ヘッダーから読み取ったアドレスが共有文書サーバ4のものでなければ(ステップS22でNO判定)、印刷画像処理部14hは、モノクロ画像及びカラー画像のいずれが指示されているかをヘッダーから読み取り、モノクロ画像及びカラー画像のいずれであるかを画像処理部12及び画像保存管理部14bに通知し、画像データを画像処理部12及び画像保存管理部14bに与える(ステップS24)。画像処理部12は、画像データを処理してから画像形成部13に与える。画像形成部13は、画像データによって示されるモノクロ画像及びカラー画像のいずれかを記録用紙に記録する。
【0069】
ヘッダーから読み取ったアドレスが共有文書サーバ4のものでなければ、画像データは、第1及び第2ユーザ端末2,3のいずれかより送信されてきたものである。この場合、ヘッダーには、ユーザ端末のアドレスと共に、ユーザ端末の使用者のID番号が含まれている。印刷画像処理部14hは、このID番号をヘッダーから読み取り、画像保存管理部14bに通知する(ステップS25)。
【0070】
その後、文字データは形態素解析部14kに送信され、この形態素解析部14kによる単語の切り出し動作が行われる(ステップS26,27)。具体的には、画像形成装置1の記憶部15に備えられている単語辞書15aに登録されている単語に基づいてデータ中から単語が切り出される。ここで使用される単語辞書15aのデータは上述したコピー動作の場合と同様である。
【0071】
形態素解析部14kによる単語の切り出し動作が行われた後、ステップS28に移り、解析後の画像情報(切り出された単語の情報)中には私用単語、つまり、上記単語辞書において私用文書に使用される可能性が高い単語であるとして設定されている単語が存在しているか否かを判定する。
【0072】
そして、私用単語が存在していると判定された場合には、ステップS31に移り、画像保存管理部14bの画像縮小部14gは、画像データに対して縮小処理を施す。そして、画像の縮小が完了すると(ステップS32で「完」判定)、画像保存管理部14bは、縮小された画像データとICカードのID番号を対応付けて記憶部15に記憶する(ステップS33)。この場合も、記憶する画像データは全画像データであってもよいし、一部の画像データであってもよい。
【0073】
一方、上記ステップS28において、私用単語が存在していないと判定された場合にはステップS29に移る。このステップS29では、読み取った画像データと、予め解析された業務用文書との類似度が評価される。つまり、上記私用単語が存在していない場合であっても、業務用文書との類似度が低い場合には、私用目的の文書である可能性があるため、この文書の画像データを記憶部に記憶させるようにするためである。この際の類似度判定は上述したコピー動作の場合と同様である。
【0074】
ステップS30の判定(保存判定部14dの判定動作)で、読み取った画像データが業務用文書に類似していないと判定した場合には、その文書は記憶する必要があると判断して上記ステップS31以降の動作に移る。一方、ステップS30の判定で、読み取った画像データが業務用文書に類似していると判定した場合には、その文書は記憶することなしにステップS34に移る。
【0075】
このステップS34では、この文書、つまり業務用文書であると判定された文書の解析を行い、上述の「類似度評価」で使用される文書評価データを更新する。この文書評価データの更新動作も上述したコピー動作の場合と同様である。
【0076】
コピー動作及びプリント動作では以上の動作が行われる。このため、上記ユーザID識別部14a、記憶部15、保存判定部14d、形態素解析部14k、単語辞書15a、文書評価データ記憶部15b、文書評価データ生成部41bによって本発明に係る不正使用監視装置が構成されている。
【0077】
このように本実施形態に係る画像処理装置1の使用に際しては、記録されたデータの少なくとも一部と使用者のID番号を対応付けて記憶部15に記憶している。このため、記憶部15の記憶内容を読み出せば、いずれの使用者が如何なるデータを記録したかを知ることができ、画像処理装置1の不正使用を把握して、これを抑制することができる。
【0078】
以上のように、本形態では、画像データの中からそれに含まれる文字(単語)を認識し、その文字に基づいて、画像データがそのユーザの業務に係るものであるか否か、つまり、私用(不正使用)の画像処理に係るものでないか否かを判別するようにしている。そして、その画像データが私用の画像処理に係るものであると判断した場合に限り、その画像データとユーザとを関連付けて記憶するようにしている。これにより、不正使用ではない情報が大量に記憶部15に記憶されてしまうといった状況を回避することができ、記憶部15の記憶容量の削減、管理者の監視負担の軽減、監視作業の高効率化を図ることが可能になる。
【0079】
また、本形態では、画像データに対して縮小処理を施してから、画像データを記憶しているため、記憶されるデータ量が減少し、不正使用を把握するための管理業務が容易になる。
【0080】
(第2実施形態)
次に、第2実施形態について説明する。本形態では、図5に示すように、複数台のユーザ端末2,3、複数台の画像処理装置1,7、共有文書サーバ4、監視サーバ6がネットワーク(LAN)に接続されて成るネットワークシステムに本発明を適用した場合である。図5では、上述した第1実施形態との同一構成部分については同一の符号を付す。また、以下では、第1実施形態との相違点についてのみ説明する。
【0081】
図5に示すように、本形態に係るネットワークシステムでは、監視サーバ6を個別に設け、この監視サーバ6に記憶部15を備えさせている。つまり、ユーザ(ID番号)と画像データとを関連付けた情報を、画像処理装置1ではなく監視サーバ6に記憶させるようにしている。
【0082】
この監視サーバ6では、記憶部15への情報記憶を実行すると判定された際に(図2に示すフローチャートにおいてステップS9でNO判定され且つステップS13で「完」判定された場合、図3に示すフローチャートにおいてステップS30でNO判定され且つステップS32で「完」判定された場合など)、画像データとユーザID番号とを関連付けた情報を画像処理装置1からネットワークケーブル5を通じてネットワークI/F61で受信し、これらを制御部62に入力する。制御部62は、画像データとユーザID番号とを関連付けた情報を記憶部15に記憶し、管理者が監視できるようになっている。
【0083】
本形態では、上記判定(画像データとユーザID番号とを関連付けた情報を記憶部15に記憶するか否かの判定)を行うための保存判定部14dは、各画像処理装置1,7に備えられていてもよいし、監視サーバ6に備えられていてもよい。
【0084】
図5のネットワークシステムにおいては、画像処理装置1だけでなく、他の画像処理装置7等がネットワークケーブル5に接続されており、それぞれの画像処理装置1,7が複写機やプリンターの役目を果たす。これらの画像処理装置1,7毎に、画像データとユーザID番号とを関連付けた情報を保存すると、不正使用の管理業務が煩雑化してしまうが、本形態では、各画像処理装置1,7においては画像データとユーザID番号とを関連付けた情報を設定するだけとし、保存すべき全ての画像データとユーザID番号を監視サーバ6の記憶部15に一括して記憶しているので、管理業務の煩雑化を招かずに済む。
【0085】
−その他の実施形態−
上述した各実施形態に係る画像処理装置1は、複写機、プリンタ、スキャナの役目を果たすものであった。本発明はこれに限らず、ユーザ端末2,3からのファクシミリ送信を可能にする所謂PCfaxの役目をも果たすものであってもよい。また、これら各種機能のうち少なくとも一つを備えた画像処理装置1に対しても本発明は適用可能である。
【0086】
更に、上述した各実施形態では、ICカード等が厳正に管理されているものとして、入力されたユーザID等のユーザ識別情報をユーザID識別部14aがそのまま受け入れて利用していた。本発明はこれに限らず、ICカードの盗難等の不正利用に備えて、例えばユーザI/F16から入力させたパスワードとユーザIDとの対応をチェックするユーザ認証機能をユーザID識別部14aに備えさせて、認証されたユーザのみが画像処理装置1の機能を利用できるようにしてもよい。これによって、ユーザID等のユーザ識別情報とユーザとの対応がより確実になる。また、ユーザ認証機能の付加は、ネットワーク上に認証サーバ(例えば、LDAP:Lightweight Directory Access Protocol等のプロトコルを使用したもの等)を備えさせ、この認証サーバによってユーザID番号及びパスワードを一括管理するようにしたものに対しても適用可能である。尚、この認証サーバとしては、ユーザID番号及びパスワードだけでなく、更に高度な認証アルゴリズムを備えさせたり、ユーザ毎に利用可能な機能を管理させたりすることが好ましい。
【0087】
また、画像データが不正使用に係るものであるか否かを判定する手法としては、上記実施形態の手法に代えて以下のものも掲げられる。つまり、単語辞書15aに、業務に関連するものではない可能性の高い単語ほど高い値に設定される「私用目的ポイント」を予め単語毎に付与して記憶しておく。そして、保存判定部14dが、単語辞書15aに登録されている単語を参照し、ユーザが要求した画像処理に係る画像データから形態素解析部14kによって切り出された単語の「私用目的ポイント」の総ポイント数が所定値以上であるときに、その画像データの少なくとも一部分とその画像データの画像処理を要求したユーザとを関連付けた情報を記憶部15に記憶させるといった手法である。これによれば、業務用文書での使用頻度が低い単語が多数存在する場合、それを認識することによって、その画像データは記憶すべきデータであると判断することが可能になる。逆に、その単語(業務用文書での使用頻度が低い単語)の使用頻度が極端に少ない文書は業務用文書であると判断できるので、その画像データは記憶する必要がないと判断することが可能になる。
【0088】
また、上記「文書評価データ」としては、上述した実施形態のものに代えて、単語辞書15aに登録されている単語毎に「特徴ベクトル」を付加したものであってもよい。つまり、業務用文書を予め解析することによって業務用文書中に含まれる各単語の「特徴ベクトル(単語の語意を反映した「0」「1」の2値から成る複数桁の信号;文脈ベクトルとも呼ばれる)」を求めて文書評価データを生成し、これを文書評価データ記憶部15bに記憶させるものである。この場合、保存判定部14dが、画像データから切り出された各単語の「特徴ベクトル」を認識し、その「特徴ベクトル」と上記文書評価データ記憶部15bに記憶されている各単語の評価データとを比較し、上記業務用文書と画像データの「特徴ベクトル」との内積が所定値未満であるとき、その画像データの少なくとも一部分とその画像データの画像処理を要求したユーザとを関連付けた情報を記憶部15に記憶させるようにする。これによれば、文字列全体で評価することになるため、より正確に業務との関連性を評価できる。また、単語を直接的に評価するのではなく、その語意を反映する「特徴ベクトル」に基づいて評価するため、監視を免れるための手段を採りにくくすることができ、高い信頼性をもって不正使用の監視を実現することができる。
【0089】
また、上述した業務用文書の解析は、新たな画像データの処理要求が実行される度に行ってもよいし、画像データの処理要求タイミングに拘わりなく所定時間毎に行うようにしてもよい。
【0090】
【発明の効果】
以上のように、本発明によれば、画像データの中からそれに含まれる文字(単語)を認識し、その文字に基づいて、画像データがそのユーザの業務に係るものであるか否か、つまり、私用(不正使用)の画像処理に係るものでないか否かを判別するようにしている。そして、その画像データが私用の画像処理に係るものであると判断した場合に限り、その画像データとユーザとを関連付けて記憶するようにしている。これによって、不正使用である可能性の高い画像データを高い確率で記憶できることになる。その結果、記憶手段の記憶容量の削減、管理者の監視負担の軽減、監視作業の高効率化を図ることが可能になる。
【0091】
また、予め単語辞書記憶手段に登録されている単語に基づいて、形態素解析手法を用いて画像データ中から単語を切り出し、その切り出した単語に対して業務との関連を評価するようにしているので、画像データが業務に関連するものであるか否かを正確に判定することが可能になり、装置の信頼性の向上を図ることができる。
【図面の簡単な説明】
【図1】第1実施形態に係るネットワークシステムの構成を示すブロック図である。
【図2】複写処理動作を示すフローチャート図である。
【図3】印刷処理動作を示すフローチャート図である。
【図4】単語辞書に登録されている単語の一例を示す図である。
【図5】第2実施形態に係るネットワークシステムの構成を示すブロック図である。
【符号の説明】
1 画像処理装置
14a ユーザID識別部(識別手段)
14d 保存判定部(判定手段)
14k 形態素解析部(形態素解析手段)
15 記憶部(記憶手段)
15a 単語辞書(単語辞書記憶手段)
15b 文書評価データ記憶部(文書評価データ記憶手段)
41b 文書評価データ生成部(文書評価データ生成手段)
6 監視サーバ
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an unauthorized use monitoring apparatus for monitoring an unauthorized use of an image processing apparatus such as a printer, a scanner, a copying machine, or a multifunction machine of these. In particular, the present invention relates to an information storage operation in a monitoring device that monitors unauthorized use by associating and storing image data relating to image processing requested by a user and information (ID number or the like) for specifying the user. Regarding improvements.
[0002]
[Prior art]
In recent years, in offices and the like, a system is often constructed in which a terminal such as a personal computer is connected to an image processing apparatus such as a digital multifunction peripheral through a network. This type of image processing apparatus is generally configured as a multi-function machine that serves as a printer, scanner, copier, or the like. That is, in the printer function, print data (image data or text data) is received from the terminal via the network, and images, characters, and the like based on the print data are recorded on the recording paper. In the scanner function, the read image of the original is displayed on the display of the terminal. In the copying function, the document image read by the scanner function is recorded on a recording sheet.
[0003]
Although such an image processing apparatus greatly contributes to the improvement of work efficiency in the office, it can be used easily and easily. Therefore, it can be illegally used for private matters other than work. There were many times.
[0004]
The following Patent Documents 1 and 2 have been proposed so far in view of suppressing unauthorized use of the image processing apparatus.
[0005]
In Patent Document 1, a plurality of personal cards recording personal information corresponding to a system user (user) are prepared, and a plurality of personal card insertion ports are provided in a key counter connected to a multifunction printer. The configuration is disclosed. Then, when one insertion port corresponds to the printer copying function, the other insertion port corresponds to the printer printing function, and the personal card is read by the insertion port corresponding to the key counter printing function, The read personal information is collated with the personal information at the time of network connection, and if the personal information matches as a result of the collation, the printer can print the print data stored in the server. Yes. In addition, when this printing operation is executed, the number of prints for each user is recorded in the data storage unit.
[0006]
Patent Document 2 is proposed by the inventor of the present invention, and when data is recorded on a recording sheet, the ID number of the user who requested the data recording is associated with the recorded data. By storing the information, the administrator can know what data is recorded by which user, and can grasp unauthorized use of the image processing apparatus. Moreover, in this patent document 2, whether or not to store information in which a user ID number is associated with recorded image data is determined based on a storage rate set in advance for each user.
[0007]
[Patent Document 1]
JP-A-11-24859
[Patent Document 2]
JP 2002-116901 A
[0008]
[Problems to be solved by the invention]
However, in the technologies disclosed in the above patent documents, a large amount of image data that does not need to be stored, that is, information that is not unauthorized use (information related to the user's business) can be stored in large quantities. There is sex. For this reason, not only a large storage capacity is required as a storage device, but also a great amount of labor is required for the monitoring work for the administrator to determine whether or not the stored information is for unauthorized use. The burden on the administrator was great.
[0009]
In addition, in the above-mentioned Patent Document 2, a storage rate is set in advance for each user, and consideration is given to storing information that is likely to be unauthorized use. However, the effect is still not sufficient, and further Improvement was needed.
[0010]
The present invention has been made in view of such a point, and the object of the present invention is to extract image data that is likely to be unauthorized use with a high probability and store only that data. The purpose is to reduce the storage capacity of the device, reduce the monitoring burden on the administrator, and increase the efficiency of the monitoring work.
[0011]
[Means for Solving the Problems]
-Summary of invention-
In order to achieve the above object, the present invention recognizes a character (word) included in image data, and based on the character, whether or not the image data relates to the business of the user. That is, it is determined whether or not the image processing is for private (unauthorized use) image processing. Only when it is determined that the image data is related to private image processing, the image data and the user are stored in association with each other. As a result, it is possible to store image data having a high possibility of unauthorized use with a high probability.
[0012]
-Solution-
Specifically, an unauthorized use monitoring device for monitoring unauthorized use of an image processing device that executes image processing in response to an image processing request is assumed. The unauthorized use monitoring apparatus is provided with an identification unit, a storage unit, and a determination unit. The identification means identifies a user who has requested image processing. The storage means can store information in which the user identified by the identification means is associated with at least a part of the image data related to the image processing requested by the user. The determination means determines whether or not to store information in the storage means. Then, this determination means evaluates the relationship between the characters included in the image data related to the image processing requested by the user and the user's business, and determines that the image data is not related to the business based on the evaluation result. Only when this is done, the storage means stores information associating at least a part of the image data with the user who requested the image processing of the image data.
[0013]
As an installation form of each means, an identification means, a storage means, and a determination means are all provided in the image processing apparatus.
[0014]
With these specific matters, when the user requests image processing for certain image data, the determination means evaluates the relationship between the characters included in the image data and the user's business. In other words, if there are many characters related to the user's job in the image data or if there are specific characters related to the job, it is determined that the image data is related to the job. No storage is performed in the storage means. On the other hand, if there are few characters related to the user's business in the image data or there are many characters related to the document used for private purposes (illegal use), the image data is not related to the business. For the image data, information relating at least a part of the image data and the user is stored in the storage means. As a result, only information relating to unauthorized use can be extracted with a high probability, and the administrator can monitor unauthorized use without checking a large amount of data. As a result, it becomes possible to reduce the monitoring burden on the administrator and to increase the efficiency of the monitoring work.
[0015]
Further, the image processing apparatus may be configured to be capable of transmitting and receiving information to and from the monitoring server, and the storage server may be provided with the storage unit. In this case, the following are listed. That is, it is premised on an unauthorized use monitoring apparatus for monitoring an unauthorized use of an image processing apparatus configured to be able to transmit and receive information to and from the monitoring server. Identification means for identifying the user who has requested image processing for the unauthorized use monitoring apparatus, the user provided in the monitoring server and identified by the identification means, and at least a part of the image data related to the image processing requested by the user Storage means capable of storing information associated with the information, and determination means for determining whether or not to store information in the storage means. Then, the determination means evaluates the relationship between the characters included in the image data related to the image processing requested by the user and the user's business, and determines that the image data is not related to the business based on the evaluation result. Only in some cases, the storage means stores information that associates at least a part of the image data with the user who requested the image processing of the image data.
[0016]
This configuration is effective, for example, when a network is configured with a plurality of image processing apparatuses and a monitoring server. That is, the administrator collectively manages unauthorized use executed in each image processing apparatus by determining whether or not the information stored in the storage unit in the monitoring server is unauthorized use. It becomes possible.
[0017]
A means for the identification means to identify the user is to identify the ID number of the user who requested the image processing.
[0018]
Moreover, the following is mentioned as a concrete structure for performing the determination operation | movement by the said determination means. That is, a word dictionary storage unit in which a plurality of words are registered, and a morpheme analysis unit that extracts words included in the image data related to the image processing requested by the user based on the words registered in the word dictionary storage unit; To prepare. Then, only when the determination unit evaluates the relationship between the word extracted by the morphological analysis unit and the user's job, and based on the evaluation result, determines that the image data is not related to the job, the image data Information that associates at least a portion with a user who has requested image processing of the image data is stored in the storage unit.
[0019]
Thus, based on the words registered in the word dictionary storage means in advance, the image data is related to the business by cutting out the word from the image data and evaluating the relation with the business for the extracted word. It is possible to accurately determine whether or not it is a thing. Moreover, since morphological analysis is adopted as a method for extracting words, it is possible to accurately extract words. This morphological analysis is a method of analyzing a sentence grammatically and dividing it into a plurality of words, and extracting information such as parts of speech and utilization forms of each word.
[0020]
The word dictionary storage means stores in advance information for recognizing as a “private purpose word” a word that is highly likely not to be related to business among the registered words. Then, the determination unit refers to the word registered in the word dictionary storage unit, and the word extracted by the morphological analysis unit from the image data related to the image processing requested by the user includes the above-mentioned “private target word”. In this case, the storage unit stores information that associates at least a part of the image data with the user who has requested image processing of the image data.
[0021]
In addition, the word dictionary storage means stores “private purpose points”, which are set to a higher value for words that are not likely to be related to business, for each word. Then, the determination means refers to the words registered in the word dictionary storage means, and the total number of “private target points” of the words cut out by the morphological analysis means from the image data related to the image processing requested by the user Is equal to or greater than a predetermined value, the storage means stores information associating at least a part of the image data with the user who requested the image processing of the image data.
[0022]
With these specific items, it is possible to easily determine whether the image data processing request is for private use by using the word dictionary storage means, and to improve the reliability of the apparatus. For example, when judging based on the presence or absence of “private target word”, register a word that should not exist in the business document as “private target word” to be registered in the word dictionary storage means. In this case, it is possible to determine that the image data is data to be stored only by recognizing the word. In addition, when judging based on the total number of “private purpose points”, if there are many words that are not used frequently in business documents, the image data is stored by recognizing them. It can be determined that the data should be. On the contrary, since it can be determined that a document with extremely low usage frequency of the word (word that is used less frequently in a business document) is a business document, it may be determined that the image data does not need to be stored. It becomes possible.
[0023]
In the case of this solution, the total number of points for “Private Purpose Points” is accumulated individually for each word, and if even one word with the total number of points exceeding the predetermined value occurs. The image data may be stored, or the image data is stored when the total value of the total number of “private target points” of all words in the image data reaches a predetermined value or more. It may be.
[0024]
The following is listed as a configuration for updating the words registered in the word dictionary storage means. That is, a document evaluation data generating unit that generates document evaluation data by calculating an appearance rate of each word included in the business document by analyzing the business document in advance, and generated by the document evaluation data generating unit. Document evaluation data storage means for storing the document evaluation data as evaluation data for each word registered in the word dictionary storage means. Then, the determination means calculates the appearance rate of each word cut out from the image data individually, and calculates the calculated value of each word and the evaluation data of each word stored in the document evaluation data storage means. In comparison, when the calculated value is less than the appearance rate of the evaluation data, the storage unit stores information that associates at least a part of the image data with the user who requested the image processing of the image data. Specifically, the appearance rate of words extracted from image data requested by the user for image processing is added and normalized by the number of words, and when this value is less than a predetermined value, the image data is stored. I have to.
[0025]
In this specific matter, first, the appearance rate of each word included in the business document is calculated by analyzing the business document, and this is generated as document evaluation data. That is, when the user subsequently requests processing of image data, if the appearance rate of each word in the image data tends to be substantially the same as or similar to that of the document evaluation data, the document is a business document. Therefore, it can be determined that it is not necessary to memorize. On the other hand, if a word that has a predetermined appearance rate in a business document does not reach the appearance rate, the document for which the user requested image processing is not a business document but a private purpose document. Therefore, it can be determined that it should be memorized. In this way, it is possible to accurately determine whether the image data is for private use by analyzing the business document in advance and comparing it with the image data requested by the user to process the image data. can do.
[0026]
In addition, a “feature vector” is added as evaluation data for each word registered in the word dictionary storage means, while the “feature vector” of each word included in the business document is analyzed by analyzing the business document in advance. The document evaluation data generating means for generating the document evaluation data by obtaining "and the document evaluation data generated by the document evaluation data generating means are stored as evaluation data for each word registered in the word dictionary storage means. Document evaluation data storage means. Then, the determination unit recognizes the “feature vector” of each word cut out from the image data, compares the “feature vector” with the evaluation data of each word stored in the document evaluation data storage unit, When the inner product of the business document and the “feature vector” of the image data is less than a predetermined value, information that associates at least a part of the image data with the user who requested the image processing of the image data is stored in the storage means It is configured to make it.
[0027]
Because of this specific matter, the entire character string is evaluated, so the relevance to the business can be evaluated more accurately. In addition, since words are not evaluated directly but based on a “feature vector” that reflects their meaning, it is possible to make it difficult to take measures to avoid monitoring, and to use illegally with high reliability. Monitoring can be realized.
[0028]
In addition, when the business document analysis is executed at predetermined time intervals, the evaluation criteria can be dynamically changed in accordance with changes in business content. As a result, it is possible to accurately target only business documents as evaluation criteria.
[0029]
Further, the document evaluation data generation means performs document analysis on the image data determined by the determination means as image data related to business, and additionally stores the result in the document evaluation data storage means. Even in such a case, it is possible to dynamically change the evaluation criteria in accordance with changes in business contents. Further, there is no need to separately analyze a business document or prepare a special business document for this analysis.
[0030]
In addition, in the case where the evaluation of the relationship between the characters included in the image data and the user's business is performed after the characters included in the image data are transcoded, the image data read by the scanner or the like (image (Data) can be evaluated efficiently.
[0031]
Note that the control method executed in the unauthorized use monitoring apparatus according to any one of the above solutions is also within the scope of the technical idea of the present invention. This method evaluates the identification operation for identifying the user who requested the image processing, the relationship between the character included in the image data related to the image processing requested by the user and the business of the user, and based on the evaluation result, A determination operation for determining whether or not the data is business-related, and only when it is determined that the image data is not business-related by this determination operation, at least a part of the image data and the image data This is a control method for performing a storage operation of storing information associated with a user who has requested image processing in a storage unit.
[0032]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[0033]
(First embodiment)
First, the first embodiment will be described. In this embodiment, the present invention is applied to a network system in which a plurality of user terminals (information processing apparatuses) and a single image processing apparatus (digital copying machine) are connected to a network (so-called LAN (Local Area Network)). The case will be described.
[0034]
-Network system configuration description-
FIG. 1 is a block diagram showing a network system provided with an unauthorized use monitoring apparatus according to the present invention. The network system shown in FIG. 1 is used in an office or the like, and is an image processing apparatus (digital copying machine) 1 serving as a copying machine (hereinafter also referred to as a copying machine), a printer, and a scanner. The first and second user terminals 2 and 3, which are personal computers and workstations, the shared document server 4, and the like are connected to each other through a network cable 5.
[0035]
The image processing apparatus 1 functions as a copier that records a read document on a sheet, functions as a printer that records image data received from the user terminals 2 and 3 on a sheet, or reads a document image The scanner is configured to function as a scanner that transmits data to the user terminals 2 and 3.
[0036]
When the image processing apparatus 1 is used as a copying machine, a document is set on the image reading unit 11 and an input operation is performed by the user I / F 16 to instruct copying of the document. In response to this, the control unit 14 activates the image reading unit 11 to copy the image of the document. The image reading unit 11 reads an image of a document, generates image data based on the image, and outputs the image data to the image processing unit 12. The image forming unit 13 records an image based on the image data on a recording sheet, and discharges the recording sheet.
[0037]
The image processing apparatus 1 can copy a monochrome image and a color image. When copying an image of a document onto a recording sheet, a user instructs the user I / F 16 to select either a monochrome image or a color image together with a copy instruction. When a color image is designated, image data indicating a color image is output from the image reading unit 11, the image data is processed by the image processing unit 12, and the color image is recorded on a recording sheet by the image forming unit 13. . On the other hand, when a monochrome image is designated, image data indicating a monochrome image is output from the image reading unit 11, the image processing unit 12 processes the image data, and the image forming unit 13 records the monochrome image on a recording sheet. Is done.
[0038]
When the image processing apparatus 1 is used as a printer, for example, image data indicating images, characters, and the like is transmitted from the first user terminal 2 to the image processing apparatus 1 through the network cable 5. The image processing apparatus 1 receives print data through the network I / F 17, performs language analysis of print data by a language analysis unit (not shown) provided in the control unit 14, and print data expansion unit (not shown) based on the result of the language analysis After the print data is developed, various image processing is performed in the print image processing unit 14h and the image processing unit 12, and then the image is recorded on the recording paper in the image forming unit 13.
[0039]
Alternatively, when recording of one image data is instructed from the second user terminal 3 to the shared document server 4 through the network cable 5, the control unit 41 of the shared document server 4 transmits this instruction via the network I / F 42. The document access management unit 41a is activated. The document access management unit 41 a retrieves this image data from the storage unit 43 and transmits this image data to the image processing apparatus 1 through the network cable 5. In the image processing apparatus 1, this image data is received by the network I / F 17, and this image data is input to the image processing unit 12 via the control unit 14. The image data is processed by the image processing unit 12 and then input to the image forming unit 13. The image forming unit 13 records an image indicated by the image data on a recording sheet.
[0040]
Even when serving as a printer in this manner, monochrome images and color images can be recorded, and monochrome images can be transferred from the terminals (first and second user terminals 2 and 3, shared document server 4) to the image processing apparatus 1. Indicates whether it is an image or a color image.
[0041]
When the image processing apparatus 1 is used as a scanner, an original is set on the image reading unit 11 and input operation is performed by the user I / F 16 to instruct reading of the original. The image reading unit 11 reads an image of a document, and the control unit 14 performs image processing so that image data based on the image is in a format that can be recognized by the first user terminal 2, for example, and the first user terminal through the network cable 5. 2 to send. The first user terminal 2 displays this image data on the display device (display) of the user I / F using a preview program.
[0042]
As described above, the image processing apparatus 1 can function as both a copier, a printer, and a scanner. Therefore, although it contributes to work efficiency in the office, it may be illegally used for private matters other than work.
[0043]
For this reason, when serving as a copying machine or a scanner, the unauthorized use monitoring apparatus according to the present embodiment performs processing of the flowchart shown in FIG. At least a part and the ID number of the user (user) of the image processing apparatus 1 are stored in association with each other. Similarly, when serving as a printer, the unauthorized use monitoring apparatus of this embodiment performs at least a part of image data that is likely to be unauthorized by performing the processing of the flowchart shown in FIG. 3 in parallel. And the user ID number are stored in association with each other. If at least a part of the image data is stored in correspondence with the user ID number in this way, it is possible to know which user has executed the image processing of which data at any time, and illegally use the image processing apparatus 1. By grasping the user who used it and paying attention to this user, unauthorized use can be suppressed.
[0044]
-Description of operation-
<Copy operation>
Hereinafter, processing operations performed when the image processing apparatus 1 serves as a copier will be described with reference to the flowchart of FIG. The processing operation performed when the image processing apparatus 1 serves as a scanner is performed in the same manner as in the flowchart.
[0045]
In carrying out the copy processing operation, the user first inserts an IC card 18 a given in advance into the user ID input unit 18 of the image processing apparatus 1. Alternatively, the non-contact tag 18 b that can transmit the user ID without contact is brought close to the user ID input unit 18.
[0046]
The user ID input unit 18 is waiting for the insertion of the IC card (“No” state in Step S1). When the IC card is inserted (“Yes” state in Step S1), the user ID is input from this IC card. The number is read and the ID number is output to the control unit 14. The user ID identification unit (identification means) 14a of the control unit 14 inputs an ID number, compares this ID number with the previously stored ID number (step S2), and this ID number must match the previous ID number. If this is the case ("determined" determination in step S2), this ID number is stored and the previous ID number is deleted to update the ID number (step S3). If this ID number matches the previous ID number ("same" determination in step S2), the process in step S3 is not performed. Then, the user ID identification unit 14a notifies the image storage management unit 14b of the ID number of the IC card.
[0047]
Thereafter, the image of the document is set on the image reading unit 11 and the user I / F 16 is operated to instruct copying of the document image ("Yes" determination in step S4).
[0048]
When copying of the document image is started by such an operation, first, the image reading unit 11 reads the image of the document one by one. The read image data is transmitted to the image processing unit 12 and the control unit 14, respectively. The image processing unit 12 that has received the image data processes the image data, and inputs the processed image data to the image forming unit 13 to form an image on a recording sheet.
[0049]
On the other hand, in the control unit 14 that has received the image data, first, a character recognition operation is performed in the character recognition unit 14j (step S5). This character recognition operation is executed by an optical character reader (OCR) or the like. As a result, the character that was the image image is subjected to code conversion.
[0050]
Thereafter, the character data subjected to the code conversion is transmitted to a morpheme analysis unit (morpheme analysis unit) 14k, and a word segmentation operation is performed by the morpheme analysis unit 14k (step S6). Specifically, words are cut out from the data based on words registered in a word dictionary (word dictionary storage means) 15 a provided in the storage unit (storage means) 15 of the image forming apparatus 1.
[0051]
FIG. 4 shows an example of registration data of the word dictionary 15a. The word dictionary 15a is a part where a plurality of words are registered in advance. Examples of the registered word include a word included in a document having a low possibility of being illegally used in addition to a word having a high possibility of being included in an illegally used document. The registration of words in the word dictionary 15a may be set and registered in advance by the administrator, or the words extracted by the morphological analysis unit 14k are sequentially registered when image data processing is executed. You may make it go.
[0052]
The word dictionary 15a stores part-of-speech, information on whether or not to determine that each word is a private document word, and evaluation data. For example, words such as “disc” and “information” in the figure are set as words that are highly likely to be used in business documents (“-” in the figure). Words such as “tourism” are set as words that are highly likely to be used in private documents (“private purpose words” in the present invention) (“×” in the figure). As described above, when a word is automatically registered in the word dictionary 15a when processing of image data is executed, the word is determined depending on whether the image data is finally an illegally used document or a business document. Information on whether or not to determine that the word is a private document word is added. The evaluation data will be described later.
[0053]
After the word extraction operation by the morpheme analysis unit 14k is performed, the process proceeds to step S7, and the storage determination unit (determination unit) 14d includes a private word in the analyzed image information (information of the extracted word), That is, it is determined whether or not there is a word that is set as a word that is highly likely to be used in a private document in the word dictionary.
[0054]
If it is determined that a private word exists, the process proceeds to step S10, where the image reduction unit 14g of the image storage management unit 14b performs reduction processing (compression) on the image data from the image processing unit 12. Process). This reduction process may be an existing method for reducing the image, and may be the simplest processing method of thinning out each pixel of the image as appropriate.
[0055]
In the middle of the image reduction process, when the specific pattern is detected from the image data by the specific pattern detection unit 12a of the image processing unit 12 ("detection" determination in step S11), this is notified to the image reduction unit 14g. The image reduction unit 14g interrupts the reduction process for the image data (step S12). This is because a specific pattern is added to image data shared by a plurality of users, and is not added to private image data. This is because the image processing apparatus 1 is not illegally used, and it is not necessary to reduce and save the image data.
[0056]
Until the reduction of the image is completed (until “complete” is determined in step S13), if the specific pattern is not detected from the image data (“not detected” is maintained in step S11), the image storage management unit 14b The reduced image data and the IC card ID number are associated with each other and stored in the storage unit 15 (step S14). The image data stored here may be all image data or a part of the image data.
[0057]
On the other hand, if it is determined in step S7 that no private word exists, the process proceeds to step S8. In step S8, the degree of similarity between the read image data and the business document analyzed in advance is evaluated. In other words, even if the above private word does not exist, if the similarity with the business document is low, it may be a private document, so the image data of this document is stored. This is because the data is stored in the unit 15.
[0058]
This similarity determination is performed based on the document evaluation data stored in the document evaluation data storage unit (document evaluation data storage unit) 15b of the storage unit 15. The document evaluation data is generated by calculating the appearance rate of each word included in the business document by analyzing the business document in advance. Specifically, the document evaluation data generation unit (document evaluation data generation means) 41b provided in the shared document server 4 generates a document (business document) stored in the shared document server 4 by analyzing it. Is done. The document evaluation data generated by the document evaluation data generation unit 41b is stored in the document evaluation data storage unit 15b, and the storage determination unit 14d individually calculates the appearance rate of each word extracted from the image data. The calculated value of each word is compared with the evaluation data of each word stored in the document evaluation data storage unit 15b. When the calculated value is less than the appearance rate of the evaluation data, the similarity between the image data requested for image processing and the business document is low, and it is determined that the image data should be saved. Specifically, the appearance rate of words extracted from image data requested by the user for image processing is added and normalized by the number of words, and when this value is less than a predetermined value, the image data is stored. I have to.
[0059]
Further, the calculation of the appearance rate of each word when creating the document evaluation data is performed in the used word statistics processing unit 41 c provided in the shared document server 4. The statistics of the used words calculated here are temporarily stored in the word statistics unit 43b, and then the statistical data is read when the document evaluation data generation unit 41b executes analysis of the business document. Yes.
[0060]
If it is determined in step S9 (determination operation of the storage determination unit 14d) that the read image data is not similar to the business document, it is determined that the document needs to be stored, and the above step S10 is performed. Move on to the following operations. On the other hand, if it is determined in step S9 that the read image data is similar to the business document, the process proceeds to step S15 without storing the document.
[0061]
In this step S15, this document, that is, a document determined to be a business document is analyzed, and the document evaluation data used in the above “similarity evaluation” is updated.
[0062]
Hereinafter, the update of the document evaluation data in step S15 will be described. This document evaluation data update operation is an operation for updating the document evaluation data stored in the document evaluation data storage unit 15b. In other words, the document evaluation data generation unit 41b calculates the appearance rate of each word included in the document by analyzing in advance the image data newly certified as a business document by the above-described determination operation. Evaluation data is newly generated. The newly created document evaluation data is stored in the document evaluation data storage unit 43a provided in the storage unit 43 in the shared document server 4 and the document evaluation data storage unit 15b provided in the storage unit 15 of the image processing apparatus. Are additionally stored. As a result, it is possible to dynamically change the evaluation standard (document evaluation data) in accordance with changes in business content.
[0063]
<Print operation>
Next, processing operations performed when the image processing apparatus 1 serves as a printer will be described with reference to the flowchart of FIG.
[0064]
As described above, the image processing apparatus 1 receives image data from the first and second user terminals 2 and 3 and the shared document server 4 and records an image indicated by the image data. In the image processing apparatus 1, the print image processing 14 h of the control unit 14 is waiting for reception of image data from the network cable 5 via the network I / F 17 (“No” state in Step S <b> 21), and the image data is stored. When received (“Yes” state in step S21), the header added to the image data is extracted, and the address of the user terminal 2 that transmitted the image data is read from the header. Then, the print image processing unit 14h determines whether or not this address is that of the shared document server 4 (step S22). If this address is that of the shared document server 4 (YES in step S22), the print image processing unit 14h reads from the header which one of the monochrome image and the color image is instructed, and the monochrome image and the color image. Is notified to the image processing unit 12 (step S23). The specific pattern adding unit 14i of the control unit 14 adds the pattern data indicating the specific pattern to the image data, and then gives the image data to the image processing unit 12 and returns to step S21.
[0065]
The image data is processed by the image processing unit 12 and then input to the image forming unit 13, where either a monochrome image or a color image is recorded on a recording sheet. A specific pattern is added to the recorded image.
[0066]
That is, for the image data received from the shared document server 4, an image with a specific pattern is recorded without saving the image data. This is because the image data from the shared document server 4 is shared by a plurality of users, and even if the image is recorded, the image processing apparatus 1 is not used illegally and it is necessary to save the image data. It is because it does not.
[0067]
When copying the recording paper printed here (recording paper on which an image accompanied by a specific pattern is printed), the specific pattern is detected in step S11 of FIG. 2 as described above. The image data shown is not saved.
[0068]
If the address read from the header is not that of the shared document server 4 (NO in step S22), the print image processing unit 14h reads from the header which of the monochrome image and the color image is instructed, and The image processing unit 12 and the image storage management unit 14b are notified of whether the image is a color image or the color image, and the image data is given to the image processing unit 12 and the image storage management unit 14b (step S24). The image processing unit 12 processes the image data and supplies the processed image data to the image forming unit 13. The image forming unit 13 records either a monochrome image or a color image indicated by the image data on a recording sheet.
[0069]
If the address read from the header is not that of the shared document server 4, the image data has been transmitted from either the first or second user terminal 2 or 3. In this case, the header includes the ID number of the user of the user terminal together with the address of the user terminal. The print image processing unit 14h reads this ID number from the header and notifies the image storage management unit 14b (step S25).
[0070]
Thereafter, the character data is transmitted to the morpheme analysis unit 14k, and a word extraction operation is performed by the morpheme analysis unit 14k (steps S26 and 27). Specifically, words are cut out from the data based on words registered in the word dictionary 15a provided in the storage unit 15 of the image forming apparatus 1. The data in the word dictionary 15a used here is the same as in the case of the copy operation described above.
[0071]
After the word segmentation operation by the morpheme analysis unit 14k is performed, the process proceeds to step S28, and in the analyzed image information (information of the segmented word), a private word, that is, a private document is stored in the word dictionary. It is determined whether there is a word that is set as a word that is likely to be used.
[0072]
If it is determined that a private word exists, the process proceeds to step S31, and the image reduction unit 14g of the image storage management unit 14b performs a reduction process on the image data. When the reduction of the image is completed ("complete" is determined in step S32), the image storage management unit 14b associates the reduced image data with the ID number of the IC card and stores them in the storage unit 15 (step S33). . Also in this case, the image data to be stored may be all image data or a part of the image data.
[0073]
On the other hand, if it is determined in step S28 that no private word exists, the process proceeds to step S29. In step S29, the similarity between the read image data and the business document analyzed in advance is evaluated. In other words, even if the above private word does not exist, if the similarity with the business document is low, it may be a private document, so the image data of this document is stored. This is because it is stored in the part. The similarity determination at this time is the same as in the case of the copy operation described above.
[0074]
If it is determined in step S30 (determination operation of the storage determination unit 14d) that the read image data is not similar to the business document, it is determined that the document needs to be stored, and the above step S31 is performed. Move on to the following operations. On the other hand, if it is determined in step S30 that the read image data is similar to the business document, the process proceeds to step S34 without storing the document.
[0075]
In this step S34, this document, that is, a document determined to be a business document is analyzed, and the document evaluation data used in the above “similarity evaluation” is updated. The update operation of the document evaluation data is the same as that of the copy operation described above.
[0076]
The above operations are performed in the copy operation and the print operation. For this reason, the unauthorized use monitoring apparatus according to the present invention includes the user ID identification unit 14a, the storage unit 15, the storage determination unit 14d, the morphological analysis unit 14k, the word dictionary 15a, the document evaluation data storage unit 15b, and the document evaluation data generation unit 41b. Is configured.
[0077]
As described above, when the image processing apparatus 1 according to the present embodiment is used, at least a part of the recorded data and the user ID number are stored in the storage unit 15 in association with each other. For this reason, by reading the stored contents of the storage unit 15, it is possible to know what data is recorded by which user, and it is possible to grasp the unauthorized use of the image processing apparatus 1 and to suppress this. .
[0078]
As described above, in this embodiment, the character (word) included in the image data is recognized, and based on the character, whether or not the image data relates to the business of the user, that is, I It is determined whether or not the image processing is not for use (unauthorized use). Only when it is determined that the image data is related to private image processing, the image data and the user are stored in association with each other. As a result, it is possible to avoid a situation in which a large amount of information that is not unauthorized use is stored in the storage unit 15, reduce the storage capacity of the storage unit 15, reduce the monitoring burden on the administrator, and increase the efficiency of monitoring work. It becomes possible to plan.
[0079]
In this embodiment, since the image data is stored after the image data is subjected to the reduction process, the amount of stored data is reduced, and management work for grasping unauthorized use is facilitated.
[0080]
(Second Embodiment)
Next, a second embodiment will be described. In this embodiment, as shown in FIG. 5, a network system in which a plurality of user terminals 2 and 3, a plurality of image processing apparatuses 1 and 7, a shared document server 4, and a monitoring server 6 are connected to a network (LAN). This is a case where the present invention is applied. In FIG. 5, the same components as those in the first embodiment described above are denoted by the same reference numerals. In the following, only differences from the first embodiment will be described.
[0081]
As shown in FIG. 5, in the network system according to this embodiment, the monitoring server 6 is provided individually, and the monitoring server 6 is provided with a storage unit 15. That is, information that associates the user (ID number) with the image data is stored in the monitoring server 6 instead of the image processing apparatus 1.
[0082]
In this monitoring server 6, when it is determined that information storage in the storage unit 15 is to be executed (NO in step S9 in the flowchart shown in FIG. 2 and “complete” in step S13), it is shown in FIG. In the flowchart, when NO is determined in step S30 and “complete” is determined in step S32), information relating the image data and the user ID number is received from the image processing apparatus 1 through the network cable 5 by the network I / F 61. These are input to the control unit 62. The control unit 62 stores information in which the image data and the user ID number are associated with each other in the storage unit 15 so that the administrator can monitor the information.
[0083]
In the present embodiment, a storage determination unit 14d for performing the above determination (determination as to whether or not information in which image data and a user ID number are associated is stored in the storage unit 15) is provided in each of the image processing devices 1 and 7. May be provided, or may be provided in the monitoring server 6.
[0084]
In the network system of FIG. 5, not only the image processing apparatus 1 but also other image processing apparatuses 7 and the like are connected to the network cable 5, and each of the image processing apparatuses 1 and 7 serves as a copying machine or a printer. . If information associated with image data and a user ID number is stored for each of these image processing apparatuses 1 and 7, management of unauthorized use becomes complicated, but in this embodiment, each image processing apparatus 1 and 7 Only sets information associating image data and user ID numbers, and stores all image data and user ID numbers to be stored in the storage unit 15 of the monitoring server 6 at a time. There is no complication.
[0085]
-Other embodiments-
The image processing apparatus 1 according to each of the above-described embodiments serves as a copying machine, a printer, and a scanner. The present invention is not limited to this, and may also serve as a so-called PCfax that enables facsimile transmission from the user terminals 2 and 3. The present invention is also applicable to the image processing apparatus 1 having at least one of these various functions.
[0086]
Furthermore, in each of the above-described embodiments, assuming that the IC card is strictly managed, the user ID identification unit 14a accepts and uses the input user identification information such as the user ID as it is. The present invention is not limited to this, and the user ID identification unit 14a has a user authentication function for checking the correspondence between a password input from the user I / F 16 and a user ID, for example, in preparation for unauthorized use such as theft of an IC card. Thus, only the authenticated user may be able to use the function of the image processing apparatus 1. Thereby, the correspondence between the user identification information such as the user ID and the user becomes more reliable. In addition, the user authentication function is added by providing an authentication server (for example, one using a protocol such as LDAP: Lightweight Directory Access Protocol) on the network, and collectively managing user ID numbers and passwords by this authentication server. It can also be applied to what has been made. The authentication server preferably includes not only the user ID number and password, but also a more advanced authentication algorithm, and manages functions available for each user.
[0087]
Further, as a method for determining whether or not the image data is related to unauthorized use, the following may be listed instead of the method of the above embodiment. That is, in the word dictionary 15a, “private purpose points”, which are set to higher values for words that are more likely not to be related to work, are assigned and stored in advance for each word. Then, the storage determination unit 14d refers to the words registered in the word dictionary 15a, and totals the “private target points” of the words extracted by the morpheme analysis unit 14k from the image data related to the image processing requested by the user. When the number of points is equal to or greater than a predetermined value, the storage unit 15 stores information that associates at least a part of the image data with a user who has requested image processing of the image data. According to this, when there are many words that are used less frequently in the business document, it is possible to determine that the image data is data to be stored by recognizing the words. On the contrary, since it can be determined that a document with extremely low usage frequency of the word (word that is used less frequently in a business document) is a business document, it may be determined that the image data does not need to be stored. It becomes possible.
[0088]
Further, the “document evaluation data” may be one in which a “feature vector” is added to each word registered in the word dictionary 15a, instead of the above-described embodiment. In other words, by analyzing the business document in advance, the “feature vector” of each word included in the business document (a multi-digit signal consisting of binary values of “0” and “1” reflecting the word meaning; the context vector) The document evaluation data is generated and stored in the document evaluation data storage unit 15b. In this case, the storage determination unit 14d recognizes the “feature vector” of each word cut out from the image data, and the “feature vector” and the evaluation data of each word stored in the document evaluation data storage unit 15b. When the inner product of the business document and the “feature vector” of the image data is less than a predetermined value, information that associates at least a part of the image data with the user who requested the image processing of the image data It is made to memorize | store in the memory | storage part 15. FIG. According to this, since the entire character string is evaluated, the relevance with the business can be evaluated more accurately. In addition, since words are not evaluated directly but based on a “feature vector” that reflects their meaning, it is possible to make it difficult to take measures to avoid monitoring, and to use illegally with high reliability. Monitoring can be realized.
[0089]
The business document analysis described above may be performed each time a new image data processing request is executed, or may be performed every predetermined time regardless of the timing of image data processing request.
[0090]
【The invention's effect】
As described above, according to the present invention, a character (word) included in image data is recognized, and based on the character, whether or not the image data relates to the business of the user, that is, Whether or not the image processing is related to private (unauthorized) image processing is determined. Only when it is determined that the image data is related to private image processing, the image data and the user are stored in association with each other. As a result, it is possible to store image data having a high possibility of unauthorized use with a high probability. As a result, it is possible to reduce the storage capacity of the storage means, reduce the monitoring burden on the administrator, and increase the efficiency of monitoring work.
[0091]
In addition, based on the words registered in the word dictionary storage means in advance, the words are extracted from the image data by using the morphological analysis technique, and the relationship with the business is evaluated for the extracted words. Therefore, it is possible to accurately determine whether or not the image data is related to business, and the reliability of the apparatus can be improved.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of a network system according to a first embodiment.
FIG. 2 is a flowchart showing a copy processing operation.
FIG. 3 is a flowchart illustrating a print processing operation.
FIG. 4 is a diagram illustrating an example of words registered in a word dictionary.
FIG. 5 is a block diagram showing a configuration of a network system according to a second embodiment.
[Explanation of symbols]
1 Image processing device
14a User ID identification part (identification means)
14d Save determination unit (determination means)
14k Morphological analyzer (morphological analyzer)
15 Storage unit (storage means)
15a Word dictionary (word dictionary storage means)
15b Document evaluation data storage unit (document evaluation data storage means)
41b Document evaluation data generation unit (document evaluation data generation means)
6 Monitoring server

Claims (7)

監視サーバとの間で情報の送受信が可能に構成された画像処理装置が不正使用されることを監視するための不正使用監視装置において、
画像処理を要求したユーザのID番号を識別する識別手段と、
複数の単語が登録された単語辞書記憶手段と、
ユーザが要求した画像処理に係る画像データ中に含まれる各単語を上記単語辞書記憶手段に登録されている各単語に基づいて切り出す形態素解析手段と、
業務用文書を予め解析することによって業務用文書中に含まれる各単語の出現率を算出することにより文書評価データを生成する文書評価データ生成手段と、
上記文書評価データ生成手段により生成された文書評価データを、単語辞書記憶手段に登録されている単語毎の評価データとして記憶する文書評価データ記憶手段と、
上記記憶手段への情報記憶を実行するか否かを判定する判定手段とを備え、
上記判定手段は、形態素解析手段により画像データから切り出された各単語の出現率を個別に演算し、この各単語の演算値と上記文書評価データ記憶手段に記憶されている各単語の評価データとを比較し、演算値が評価データの出現率未満であるとき、その画像データの少なくとも一部分とその画像データの画像処理を要求したユーザとを関連付けた情報を記憶手段に記憶させるよう構成されていることを特徴とする画像処理装置の不正使用監視装置。
In an unauthorized use monitoring device for monitoring an unauthorized use of an image processing device configured to be able to send and receive information to and from a monitoring server ,
Identifying means for identifying the ID number of the user who has requested image processing;
A word dictionary storage means in which a plurality of words are registered;
Morpheme analysis means for cutting out each word included in the image data related to the image processing requested by the user based on each word registered in the word dictionary storage means;
Document evaluation data generating means for generating document evaluation data by calculating an appearance rate of each word included in the business document by analyzing the business document in advance;
Document evaluation data storage means for storing the document evaluation data generated by the document evaluation data generation means as evaluation data for each word registered in the word dictionary storage means;
E Bei a determination means for determining whether to execute the information storage in the storage means,
The determination means individually calculates the appearance rate of each word cut out from the image data by the morphological analysis means, and the calculated value of each word and the evaluation data of each word stored in the document evaluation data storage means When the calculated value is less than the appearance rate of the evaluation data, the storage means stores information associating at least a part of the image data with the user who requested the image processing of the image data. An unauthorized use monitoring device for an image processing device.
請求項1記載の不正使用監視装置において、
単語辞書記憶手段には、登録されている単語のうち業務に関連するものではない可能性の高い単語を「私用目的単語」として認識するための情報が予め記憶されており、
判定手段は、単語辞書記憶手段に登録されている単語を参照し、ユーザが要求した画像処理に係る画像データから形態素解析手段によって切り出された単語に上記「私用目的単語」が含まれているときには、その画像データの少なくとも一部分とその画像データの画像処理を要求したユーザとを関連付けた情報を記憶手段に記憶させるよう構成されていることを特徴とする画像処理装置の不正使用監視装置。
In the unauthorized use monitoring device according to claim 1,
The word dictionary storage means stores in advance information for recognizing as a “private purpose word” a word that is not likely to be related to work among registered words.
The determination unit refers to the word registered in the word dictionary storage unit, and the word extracted by the morpheme analysis unit from the image data related to the image processing requested by the user includes the “private purpose word”. An unauthorized use monitoring apparatus for an image processing apparatus, characterized in that the storage means stores information associating at least a part of the image data with a user who has requested image processing of the image data .
請求項1記載の不正使用監視装置において、
単語辞書記憶手段には、業務に関連するものではない可能性の高い単語ほど高い値に設定される「私用目的ポイント」が予め単語毎に付与されて記憶されており、
判定手段は、単語辞書記憶手段に登録されている単語を参照し、ユーザが要求した画像処理に係る画像データから形態素解析手段によって切り出された単語の「私用目的ポイント」の総ポイント数が所定値以上であるときには、その画像データの少なくとも一部分とその画像データの画像処理を要求したユーザとを関連付けた情報を記憶手段に記憶させるよう構成されていることを特徴とする画像処理装置の不正使用監視装置。
In the unauthorized use monitoring device according to claim 1,
In the word dictionary storage means, “private purpose points”, which are set to higher values for words that are more likely not to be related to work, are previously assigned and stored for each word,
The determination means refers to the words registered in the word dictionary storage means, and the total number of “private target points” of the words extracted by the morpheme analysis means from the image data related to the image processing requested by the user is predetermined. When the value is equal to or greater than the value , the storage means stores information that associates at least a part of the image data with the user who requested the image processing of the image data. Monitoring device.
請求項1記載の不正使用監視装置において、
単語辞書記憶手段に登録されている単語毎に「特徴ベクトル」を評価データとして付加しておく一方、
業務用文書を予め解析することによって業務用文書中に含まれる各単語の「特徴ベクトル」を求めることにより文書評価データを生成する文書評価データ生成手段と、
上記文書評価データ生成手段により生成された文書評価データを、単語辞書記憶手段に登録されている単語毎の評価データとして記憶する文書評価データ記憶手段とを備え、
判定手段は、画像データから切り出された各単語の「特徴ベクトル」を認識し、その「特徴ベクトル」と上記文書評価データ記憶手段に記憶されている各単語の評価データとを比較し、上記業務用文書と画像データの「特徴ベクトル」との内積が所定値未満であるとき、その画像データの少なくとも一部分とその画像データの画像処理を要求したユーザとを関連付けた情報を記憶手段に記憶させるよう構成されていることを特徴とする画像処理装置の不正使用監視装置。
In the unauthorized usage monitoring apparatus according to claim 1 Symbol placement,
While adding a “feature vector” as evaluation data for each word registered in the word dictionary storage means,
Document evaluation data generating means for generating document evaluation data by obtaining a “feature vector” of each word included in the business document by analyzing the business document in advance;
Document evaluation data storage means for storing the document evaluation data generated by the document evaluation data generation means as evaluation data for each word registered in the word dictionary storage means,
The determination unit recognizes the “feature vector” of each word cut out from the image data, compares the “feature vector” with the evaluation data of each word stored in the document evaluation data storage unit, and when the inner product of a "feature vector" in use the document and the image data is less than a predetermined value, Ru stores the information associated with the user who requested the at least a portion of the image processing of the image data of the image data in the storage means An unauthorized use monitoring apparatus for an image processing apparatus, characterized in that the apparatus is configured as described above.
請求項1または4記載の不正使用監視装置において、
文書評価データ生成手段は、業務用文書の解析を所定時間毎に実行するよう構成されていることを特徴とする画像処理装置の不正使用監視装置。
In the unauthorized use monitoring device according to claim 1 or 4,
Document evaluation data generation means, unauthorized monitoring device of an image processing apparatus characterized by being so that configured to perform analysis of business documents every predetermined time.
請求項1、4または5記載の不正使用監視装置において、
文書評価データ生成手段は、業務に関連する画像データであると判定手段が判定した画像データに対して文書の解析を実行して、その結果を文書評価データ記憶手段に追加記憶させるよう構成されていることを特徴とする画像処理装置の不正使用監視装置。
In the unauthorized use monitoring device according to claim 1, 4 or 5,
The document evaluation data generation unit is configured to perform document analysis on the image data determined by the determination unit as image data related to business, and additionally store the result in the document evaluation data storage unit. An unauthorized use monitoring device for an image processing device.
請求項1から6までのいずれか1項に記載の不正使用監視装置において、
画像データに含まれる文字とそのユーザの業務との関連の評価は、その画像データに含まれる文字をコード変換した後に行うよう構成されていることを特徴とする画像処理装置の不正使用監視装置。
Te unauthorized monitoring apparatus odor according to any one of claims 1 to 6,
An unauthorized use monitoring apparatus for an image processing apparatus, wherein the evaluation of the relationship between a character included in image data and a user's job is performed after code conversion of the character included in the image data.
JP2003066905A 2003-03-12 2003-03-12 Image processing device unauthorized use monitoring device Expired - Fee Related JP4145171B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003066905A JP4145171B2 (en) 2003-03-12 2003-03-12 Image processing device unauthorized use monitoring device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003066905A JP4145171B2 (en) 2003-03-12 2003-03-12 Image processing device unauthorized use monitoring device

Publications (2)

Publication Number Publication Date
JP2004280169A JP2004280169A (en) 2004-10-07
JP4145171B2 true JP4145171B2 (en) 2008-09-03

Family

ID=33284673

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003066905A Expired - Fee Related JP4145171B2 (en) 2003-03-12 2003-03-12 Image processing device unauthorized use monitoring device

Country Status (1)

Country Link
JP (1) JP4145171B2 (en)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4756930B2 (en) * 2005-06-23 2011-08-24 キヤノン株式会社 Document management system, document management method, image forming apparatus, and information processing apparatus
JP4784506B2 (en) 2006-12-27 2011-10-05 富士ゼロックス株式会社 Image history management apparatus and program
JP5436040B2 (en) * 2009-05-14 2014-03-05 株式会社沖データ Image input / output device and monitoring system
US9064125B2 (en) * 2013-05-03 2015-06-23 Citrix Systems, Inc. Image analysis and management
JP6907728B2 (en) * 2017-06-06 2021-07-21 富士フイルムビジネスイノベーション株式会社 Image processing system, image forming device and program
JP2022151113A (en) * 2021-03-26 2022-10-07 京セラドキュメントソリューションズ株式会社 Image formation apparatus

Also Published As

Publication number Publication date
JP2004280169A (en) 2004-10-07

Similar Documents

Publication Publication Date Title
US8073257B2 (en) Information processing system, information processing method, image processing apparatus, program, and recording medium
US6704119B1 (en) File system and storage medium storing program used in such system
US20060165263A1 (en) Person verification apparatus, information processing apparatus and person verification system
US8045228B2 (en) Image processing apparatus
US9167120B2 (en) Document policies for a document processing unit
US20060285748A1 (en) Document processing device
JP2008299499A (en) Information processing program and information processing system
JP2007082238A (en) Method for interfacing with personal digital assistance and communications equipment
US8488157B2 (en) Printing system, method, and program for searching, identifying, and displaying information related to non-retrieved print jobs
US20060077417A1 (en) Job execution device, method for controlling the device, image forming device and computer program product
US7929164B2 (en) Image forming apparatus accepting a print job and computer transmitting a print job
JP4358879B2 (en) Image processing apparatus and image processing server
JP4145171B2 (en) Image processing device unauthorized use monitoring device
KR100673198B1 (en) Image inputing system
JP2006255936A (en) Printing apparatus
JP4137650B2 (en) Image processing apparatus unauthorized use monitoring apparatus and network system
US7707243B2 (en) Image processor and method for controlling the same
CN112541498A (en) Information processing apparatus and recording medium
US20110161322A1 (en) Image forming apparatus, information processing apparatus, data processing server, and information processing method
JP6749583B2 (en) Information processing device, image processing device, and program
US8031352B2 (en) Apparatus and method for processing received data
JP4765593B2 (en) Image forming apparatus, image forming processing program, and image forming processing method
JPH10285325A (en) Facsimile reception transfer system
JP2008020946A (en) Image log management system
JP4149282B2 (en) Image processing device unauthorized use monitoring device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050810

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080324

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080401

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080523

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080617

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080617

R150 Certificate of patent or registration of utility model

Ref document number: 4145171

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110627

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120627

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120627

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130627

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees