JP2008176665A - ファイル保管場所監視装置、ファイル保管場所監視プログラム、記録媒体 - Google Patents

ファイル保管場所監視装置、ファイル保管場所監視プログラム、記録媒体 Download PDF

Info

Publication number
JP2008176665A
JP2008176665A JP2007010856A JP2007010856A JP2008176665A JP 2008176665 A JP2008176665 A JP 2008176665A JP 2007010856 A JP2007010856 A JP 2007010856A JP 2007010856 A JP2007010856 A JP 2007010856A JP 2008176665 A JP2008176665 A JP 2008176665A
Authority
JP
Japan
Prior art keywords
file
storage location
file storage
document
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007010856A
Other languages
English (en)
Other versions
JP4976146B2 (ja
Inventor
Kazuyo Hashimoto
加寿代 橋本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2007010856A priority Critical patent/JP4976146B2/ja
Publication of JP2008176665A publication Critical patent/JP2008176665A/ja
Application granted granted Critical
Publication of JP4976146B2 publication Critical patent/JP4976146B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】文書ファイルが監視対象のファイル保管場所に適合しているかを容易に検証できるファイル保管場所監視装置、ファイル保管場所監視プログラム、記録媒体を提供することを目的とする。
【解決手段】ファイル保管場所に保管される文書ファイルを監視しているファイル保管場所監視装置であって、監視対象のファイル保管場所に保管されている文書ファイルを用いてファイル保管場所のパターンファイルを生成するパターンファイル生成手段と、ファイル保管場所のパターンファイルに基づき、ファイル保管場所に保管される文書ファイルの適合性を検証する適合性検証手段と、適合する文書ファイルをファイル保管場所に保管する保管手段と、ファイル保管手段に保管した文書ファイルをファイル保管場所のパターンファイルへ学習させる学習手段として機能することにより上記課題を解決する。
【選択図】図8

Description

本発明は、ファイル保管場所監視装置、ファイル保管場所監視プログラム、記録媒体に係り、特に文書ファイルが監視対象のファイル保管場所に適合しているかを検証するファイル保管場所監視装置、ファイル保管場所監視プログラム、記録媒体に関する。
例えばコンピュータにおいて、文書ファイル等のファイルは、ハードディスク装置(HDD)やフレキシブルディスク、CD−ROMなどの記憶装置で階層構造を持ったディレクトリやフォルダなどのファイル保管場所に格納される。ディレクトリやフォルダなどのファイル保管場所はファイルを分類・整理する為に利用される。
近年、オフィスや家庭における文書ファイルの普及により、コンピュータにおいては文書ファイルを効率良く管理することが望まれている。例えば特許文献1には、分類体系に従って文書を自動的に分類する内容が記載されている。
特開平11−195046号公報
例えば共有ファイルサーバ等、文書ファイルの管理にフォルダを使用している場合は文書ファイルをフォルダへ登録するのは人間である。したがって、フォルダごとに様々なカテゴリを用意して文書ファイルを分類しようとしても、人によって分類の感覚は違っていることが多いという問題があった。また、フォルダごとに様々なカテゴリを用意して文書ファイルを分類しようとした場合は、同じ人でも文書ファイルの分類を迷うことが多いという問題もあった。
このように、様々なカテゴリを用意して文書ファイルを分類したフォルダには意図しないカテゴリの文書ファイルが存在している可能性が高く、フォルダの正当性が確保できないという問題があった。フォルダの正当性を確保する為には、一定の判断をもって管理者が一個一個の文書ファイルを開いて内容を確認する必要がある。しかしながら、大量に文書ファイルが保存された状態では、現実的な作業でない。
なお、特許文献1に記載されている内容を利用すれば、分類体系に従って文書を自動的に分類できる。しかし、特許文献1は分類規則の構築作業におけるユーザの負担を軽減できるが、結局、分類規則をユーザが構築しなければならなかった。
本発明は、上記の点に鑑みなされたもので、文書ファイルが監視対象のファイル保管場所に適合しているかを容易に検証できるファイル保管場所監視装置、ファイル保管場所監視プログラム、記録媒体を提供することを目的とする。
上記課題を解決する為、本発明は、記憶装置、演算処理装置を備え、前記記憶装置のファイル保管場所に保管される文書ファイルを監視しているファイル保管場所監視装置であって、前記演算処理装置が、監視対象のファイル保管場所に保管されている文書ファイルを用いて前記ファイル保管場所のパターンファイルを生成するパターンファイル生成手段と、前記演算処理装置が、前記ファイル保管場所のパターンファイルに基づき、前記ファイル保管場所に保管される文書ファイルの適合性を検証する適合性検証手段と、前記演算処理装置が、適合する前記文書ファイルを前記ファイル保管場所に保管する保管手段と、前記演算処理装置が、前記ファイル保管手段に保管した前記文書ファイルを前記ファイル保管場所のパターンファイルへ学習させる学習手段として機能することを特徴とする。
なお、本発明の構成要素、表現または構成要素の任意の組合せを、方法、装置、システム、コンピュータプログラム、記録媒体、データ構造などに適用したものも本発明の態様として有効である。
本発明によれば、文書ファイルが監視対象のファイル保管場所に適合しているかを容易に検証できるファイル保管場所監視装置、ファイル保管場所監視プログラム、記録媒体を提供可能である。
次に、本発明を実施するための最良の形態を、以下の実施例に基づき図面を参照しつつ説明していく。なお、本実施例ではファイル保管場所の一例としてフォルダを例に説明するが、フォルダに限るものでなく、ファイルを分類・整理する為に利用される如何なるファイル格納場所であってもよい。
(概要)
本発明によるフォルダ監視装置は、監視対象のフォルダを常駐監視するフォルダ監視プログラムによって、そのフォルダへ文書ファイル(以下、単に文書という)を登録(例えば作成、移動,コピー等)する際に、その文書が、フォルダの特徴を示すパターンファイル(以下、単にパターンという)に適合しているかを検証するものである。
不適合とみなした場合、フォルダ監視装置はディスプレイ等に警告を出し、その文書の扱いを管理者に選択させる。管理者も不適合とみなせば、その文書はフォルダへ登録されない。管理者が適合とみなした場合、フォルダ監視装置は文書をフォルダへ登録すると共に、そのフォルダのパターンへ学習させる。このような処理を繰り返すことで、フォルダ内の文書は管理者の意図に従って正しく配置されることになる。また、フォルダ監視装置は事前にパターンを持たない場合でも、フォルダ内の文書から自己的にパターンを生成することができる。
(システム構成)
図1はフォルダ監視装置の一例のシステム構成図である。フォルダ監視装置は、それぞれバスBで相互に接続されている入力装置11,出力装置12,ドライブ装置13,補助記憶装置14,メモリ装置15,演算処理装置16およびインターフェース装置17で構成される。
入力装置11はキーボードやマウスなどで構成され、各種信号を入力するために用いられる。出力装置12はディスプレイ装置などで構成され、各種ウインドウやデータ等を表示するために用いられる。インターフェース装置17は、モデム,LANカードなどで構成されており、ネットワークに接続する為に用いられる。
本発明によるフォルダ監視プログラムは、フォルダ監視装置を制御する各種プログラムの少なくとも一部である。フォルダ監視プログラムは例えば記録媒体18の配布やネットワークからのダウンロード等によって提供される。フォルダ監視プログラムを記録した記録媒体18は、CD−ROM、フレキシブルディスク、光磁気ディスク等の様に情報を光学的,電気的或いは磁気的に記録する記録媒体、ROM、フラッシュメモリ等の様に情報を電気的に記録する半導体メモリ等、様々なタイプの記録媒体を用いることができる。
また、フォルダ監視プログラムを記録した記録媒体18がドライブ装置13にセットされると、フォルダ監視プログラムは記録媒体18からドライブ装置13を介して補助記憶装置14にインストールされる。ネットワークからダウンロードされたフォルダ監視プログラムはインターフェース装置17を介して補助記憶装置14にインストールされる。
フォルダ監視装置はインストールされたフォルダ監視プログラムを格納すると共に、必要なファイル,データ等を格納する。メモリ装置15は、起動時に補助記憶装置14からフォルダ監視プログラムを読み出して格納する。そして、演算処理装置16はメモリ装置15に格納されたフォルダ監視プログラムに従って、後述するような各種処理を実現している。
(プログラム構成)
図2はフォルダ監視プログラムの一例のプログラム構成図である。フォルダ監視プログラム20は常駐監視プロセス21と、検査プログラム22と、初期検査プログラム23とで構成される。
常駐監視プロセス21はフォルダ監視プログラム20の起動時に起動される。常駐監視プロセス21はユーザの指定した監視対象のフォルダにパターンが存在しているか否かで検査プログラム22又は初期検査プログラム23の何れか一方を起動する。ユーザの指定した監視対象のフォルダにパターンが存在している場合、常駐監視プロセス21は検査プログラム22を起動する。また、ユーザの指定した監視対象のフォルダにパターンが存在していない場合、常駐監視プロセス21は初期検査プログラム23を起動する。
つまり、検査プログラム22は監視対象のフォルダにパターンが存在しているときに動くものである。また、初期検査プログラム23は初期で、パターンがまだ存在していないときに動くものである。
常駐監視プロセス21は起動されると、出力装置12に図3の監視フォルダ指定画面30を表示する。図3は監視フォルダ指定画面の一例のイメージ図である。ユーザは、監視フォルダ指定画面30のフォルダ指定欄31に監視対象のフォルダ名を入力して実行ボタン33を押下することにより、監視対象のフォルダを指定できる。
なお、参照ボタン32が押下されると、常駐監視プロセス21はフォルダ選択画面35を出力装置12に表示し、ユーザに監視対象のフォルダを指定させる。ユーザはフォルダ選択画面35からフォルダを選択することにより、監視対象のフォルダを指定できる。
(監視対象のフォルダにパターンが存在している場合)
図4は監視対象のフォルダにパターンが存在している場合のフォルダ監視プログラムの動きを表したフローチャートである。常駐監視プロセス21の常駐監視スレッド41は監視対象のフォルダへ登録される文書(新規ファイル)を検出すると、ステップS1に続いてステップS2に進む。
ステップS2では、常駐監視スレッド41が、検査プログラム22の検査スレッド42を起動する。検査スレッド42はステップS3に進み、新規ファイル及びパターンの特徴量を後述のように照合し、新規ファイルと監視対象のフォルダとの適合性検証を行う。ステップS4に進み、検査スレッド42は新規ファイルが監視対象のフォルダに適合するか否かを判定する。
適合すると判定すれば、検査スレッド42はステップS5に進み、新規ファイルを監視対象のフォルダへ登録する。ステップS5に続いてステップS6に進み、検査スレッド42は新規ファイルの特徴量をパターン43へ学習させたあと、処理を終了する。
一方、適合しないと判定すれば、検査スレッド42はステップS7に進み、出力装置12へ新規ファイルが監視対象のフォルダに適合していないことを警告する為の不適合表示を行う。つまり、新規ファイルが監視対象のフォルダに適合していないと判定した場合は新規ファイルの扱いをユーザ(管理者)に選択させる。ステップS8に進み、管理者は新規ファイルが監視対象のフォルダに適合するか否かを判定する。
ステップS9に進み、管理者は新規ファイルが監視対象のフォルダに適合するか否かの判定結果に基づき、新規ファイルを監視対象のフォルダへ登録するか否かを判定し、判定結果を入力装置11から入力する。
入力された判定結果が新規ファイルを監視対象のフォルダへ登録するであれば、検査スレッド42はステップS5に進み、新規ファイルを監視対象のフォルダへ登録する。そして、ステップS5に続いてステップS6に進み、検査スレッド42は新規ファイルの特徴量をパターン43へ学習させたあと、処理を終了する。一方、入力された判定結果が新規ファイルを監視対象のフォルダへ登録しないであれば、検査スレッド42は新規ファイルを監視対象フォルダへ登録することなく処理を終了する。
(監視対象のフォルダにパターンが存在していない場合)
初期状態において、フォルダ監視装置には監視対象のフォルダのパターンが存在していない。そこで、フォルダ監視装置は監視対象のフォルダに登録されている文書(現状のエントリファイル群)を検査して自己的にパターンを生成する。
図3によって指定された監視対象のフォルダにパターンが存在していない場合、常駐監視プロセス21の常駐監視スレッド41は初期検査プログラム23の初期検査スレッドを起動する。初期検査スレッドは現状のエントリファイル群の特徴を捉え、ひどく特異な文書について、例外としてパターンに学習させず退避して図5及び図6のように管理者へ通知する。
図5は現状のエントリファイル群の検査中に表示される検査中画面の一例のイメージ図である。図6は現状のエントリファイル群の検査完了後に表示される検査完了画面の一例のイメージ図である。
検査中画面50及び検査完了画面60は、不適合文書と判定した文書と、その文書の移動先とを管理者へ通知するものである。管理者は、検査中画面50及び検査完了画面60に基づき、不適合文書と判定された文書を確認し、特異な文書を除去するか、特異でも監視対象のフォルダに再登録してパターンに学習させるかを判定して、意図するパターンを形成していく。
なお、特異な文書を監視対象のフォルダから除去すると判定した場合、管理者は特異な文書を監視対象以外のフォルダに移動する。また、特異な文書を監視対象のフォルダに再登録してパターンに学習させると判定した場合、管理者は特異な文書を監視対象のフォルダに移動する。すると、フォルダ管理プログラムは図4に表したように動く。管理者は図4に表した処理により特異な文書を監視対象のフォルダに再登録してパターンに学習させることができる。
図7は監視対象のフォルダにパターンが存在していない場合のフォルダ監視プログラムの動きを表したフローチャートである。常駐監視プロセス21の常駐監視スレッド41はフォルダ選択画面35からユーザによって指定された監視対象のフォルダにパターンが存在していない場合、初期検査プログラム23の初期検査スレッドを起動する。
初期検査スレッドはステップS21に進み、監視対象のフォルダに登録されている文書の文書リストを取得する。ステップS22に進み、初期検査スレッドは取得した文書リストから未処理の文書を一文書ずつ選択する。
ステップS23に進み、初期検査スレッドは取得した文書リストの全文書を処理済みか否か判定する。文書リストに未処理の文書があれば、初期検査スレッドはステップS24に進み、ステップS22で選択した文書(対象文書)の特徴量と、文書リストに含まれる全文書のうち対象文書以外から生成した一時パターンの特徴量とを後述のように照合して適合性検証を行う。
ステップS25に進み、初期検査スレッドは対象文書が監視対象のフォルダに適合するか否かを判定する。対象文書が監視対象のフォルダに適合すると判定すれば、初期検査スレッドはステップS26に進み、対象文書の特徴量をパターン43へ学習させたあと、ステップS22に戻る。
一方、対象文書が監視対象のフォルダに適合しないと判定すれば、初期検査スレッドはステップS27に進み、不適合ファイル(不適合文書)を一時フォルダへ退避させる。ステップS27に続いてステップS28に進み、初期検査スレッドは出力装置12へ不適合ファイルありの表示を行った後、ステップS22に戻る。ステップS23において、文書リストに未処理の文書が無く、取得した文書リストの全文書を処理済みであれば、初期検査スレッドは処理を終了する。
ステップS24の適合性検証処理について更に説明する。図8は初期状態における適合性検証処理を表した一例のフローチャートである。図9は一時パターンの生成を表した一例の概念図である。
ステップS31に進み、初期検査スレッドは対象文書を目的文書とし、文書リストに含まれる文書のうち目的文書以外の全文書から一時パターンを生成する。ここで、図9を用いて一時パターンの生成について説明する。
図9は文書リストが「doc1」〜「docN」のN個の文書から構成される例を表している。目的文書が「doc1」であるとき、初期検査スレッドは一時パターンを「doc2」〜「docN」のN−1個の文書から生成する。目的文書が「doc2」であるとき、初期検査スレッドは一時パターンを「doc1」、「doc3」〜「docN」のN−1個の文書から生成する。目的文書が「doc3」であるとき、初期検査スレッドは一時パターンを「doc1」、「doc2」、「doc4」〜「docN」のN−1個の文書から生成する。目的文書が「doc4」〜「docN」であるときも同様である。
ステップS32に進み、初期検査スレッドは目的文書の特徴量と、一時パターンの特徴量とを後述のように照合して照合値を計算する。ステップS33に進み、初期検査スレッドは照合値が合格か否かを判定する。照合値が合格であれば、初期検査スレッドはステップS34に進み、目的文書が監視対象のフォルダに適合すると判定する。照合値が合格でなければ、初期検査スレッドはステップS35に進み、目的文書が監視対象のフォルダに適合しないと判定する。
初期状態における適合性検証処理について更に詳細に説明する。図10は、初期状態における適合性検証処理を表した一例の概念図である。初期検査スレッドは対象文書を質問文書100とし、文書リストに含まれる文書のうち質問文書100以外の全文書(学習文書)101を学習することで一時パターン(比較元パターン)102を生成する。
初期検査スレッドは、多種の特徴を持つ学習文書101を学習することにより多様な特徴を持つパターン102となる。パターン102は、従来技術を応用することで生成することができる。例えば初期検査スレッドは学習文書101を文字列や単語、文節の組み合わせの要素に分解し、各要素の出現頻度や重みによって特徴を示すn次元ベクトルを生成する。本実施例ではn次元ベクトルをパターンと呼んでいる。
また、初期検査スレッドは質問文書100も学習文書101と同様、各要素に分解して特徴を示すn次元ベクトルを生成する。初期検査スレッドは、質問文書100から生成されたn次元ベクトル(質問文書パターン103)と、学習文書101から生成されたn次元ベクトル(比較元パターン102)との適合度(照合値)を以下のように計算する。
適合度の計算は、例えば特開2000−148770号公報などに記載されているようなn次元ベクトル間の内積あるいは余弦によって算出する方法を用いることができる。適合度が閾値を超えていれば、初期検査スレッドは質問文書100が監視対象のフォルダに適合すると判定する。なお、閾値の決め方は後述する。
図11は初期状態における適合性検証処理の詳細を表したフローチャートである。ステップS51に進み、初期検査スレッドは文書リストに含まれる文書のうち質問文書100以外の全文書(学習文書)101から上述のように一時パターン102を生成する。
ステップS52に進み、初期検査スレッドは質問文書100から上述のように質問文書パターン103を生成する。ステップS53に進み、初期検査スレッドは上述のように一時パターン102と質問文書パターン103との適合度を計算する。ステップS54に進み、初期検査スレッドは適合度が閾値を超えているか否かを判定する。
適合度が閾値を超えていれば、初期検査スレッドはステップS55に進み、質問文書100が監視対象のフォルダに適合すると判定する。適合度が閾値を超えていなければ、初期検査スレッドはステップS56に進み、質問文書100が監視対象のフォルダに適合していないと判定する。なお、検査スレッド42が行うステップS3の適合性検証処理は使用するパターン43が異なるが、ステップS53〜S56と同様に行うことができる。
図12は閾値の決め方を説明する為の説明図である。使用する分類によって類似度の値や分布が違う為、閾値の推奨値は予め実験して決めておくことが望ましい。閾値の推奨値は目的に近いサンプルデータセットを使って決められる。曖昧な分類を目的とする場合は確実な分類を目的とする閾値に対して低い値を設定する。例えば通常の識別が70%を閾値としていれば、曖昧な分類では50%を閾値とする。
例えば図12に示すように、誤りと判断する分布および正解と判断する分布とがあれば誤りと判断する分布のピーク前の値を、曖昧な分類における閾値(2)とする。正解を謝りとしてしまう誤認および誤りを正解としてしまう誤認のバランスを考えた値を通常の閾値(1)とする。
初期状態における適合性検証処理では、パターンが存在しないため、曖昧な分類を目的とするパターンの生成に、曖昧な分類における閾値(2)を用いる。監視対象のフォルダにパターンが存在している場合における適合性検証処理では、そのパターンに対して曖昧な分類における閾値(2)でなく、通常の閾値(1)を用いる。
なお、閾値(1),(2)はフォルダ監視プログラム20の外のパラメータとして実際の運用データの状態により変更できる。これは、運用時、あまりにも正解を誤りとしてしまうケースが出現して警告が多くでることを管理者が改善する為のものである。
図13は適合性検証処理のイメージ図である。図13(a)は監視対象のフォルダAの特徴、文書B〜Eの特徴をエリアで表すものである。図13(b)は監視対象のフォルダAの特徴、文書B〜Eの特徴をn次元ベクトルで表すものである。
最初、監視対象のフォルダAは図13(a)及び図13(b)の監視対象のフォルダAの特徴に適合する文書を管理している。図13(a)及び図13(b)に示すように、監視対象のフォルダAの特徴に文書B〜Dの特徴も含まれるため、本発明によるフォルダ監視プログラムは文書B〜Dを監視対象のフォルダAに適合するとみなす。なお、監視対象のフォルダAの特徴に文書Eの特徴が含まれないため、本発明によるフォルダ監視プログラムは文書Eを監視対象のフォルダAに適合しないとみなす。
監視対象のフォルダAのパターンは、文書B〜Dのパターンを学習した為、文書B〜Dのパターンも含まれるようになる。なお、文書Eは特徴的にかけ離れているため、不適合文書として除外される。すなわち、本発明によるフォルダ監視プログラム20は文書Eのような特徴の大きく異なった文書を検出するものである。
(まとめ)
本発明によるフォルダ監視プログラム20は、予め整理された教師データを用意することなく、監視対象となるフォルダの内容により、カテゴリの大まかな性質を探ろうとするものである。
文書管理において、完全な分類は非現実的である。例えば開発テーマごとの分類では共通する文書も多い。技術分野でも「通信」、「セキュリティ」には共通部分がある。本発明によるフォルダ監視プログラム20は完全な分類を目指すのではなく、そこに分類することに違和感がない程度で文書を管理するものである。つまり、本発明によるフォルダ監視プログラム20は曖昧な分類を許容するものである。
また、本発明によるフォルダ監視プログラム20は教師データを一切必要としない。本発明によるフォルダ監視プログラム20は自己的にパターンを生成する。例えば従来技術であるスパムメールのフィルタリングでは、予め辞書を用意するとか、ユーザが何をスパムメールと考えているのかの例文が必要とされる。本発明によるフォルダ監視プログラム20はユーザが用意したスパムメール用学習データに別の文書が混じっていれば、その文書を警告することができる。また、管理者の意図的な分類もパターンにフィードバックすることができる。
以上のように、本発明によるフォルダ監視プログラム20は、外部の教師データを必要とせず、自己完結的なパターン生成を行って文書ファイルが監視対象となるフォルダに適合するか検証する。なお、パターンに一定の特徴を維持させることで、セキュリティレベル違反となるような文書ファイルの検出に使用することも可能である。
本発明は、具体的に開示された実施例に限定されるものではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。
フォルダ監視装置の一例のシステム構成図である。 フォルダ監視プログラムの一例のプログラム構成図である。 監視フォルダ指定画面の一例のイメージ図である。 監視対象のフォルダにパターンが存在している場合のフォルダ監視プログラムの動きを表したフローチャートである。 現状のエントリファイル群の検査中に表示される検査中画面の一例のイメージ図である。 現状のエントリファイル群の検査完了後に表示される検査完了画面の一例のイメージ図である。 監視対象のフォルダにパターンが存在していない場合のフォルダ監視プログラムの動きを表したフローチャートである。 初期状態における適合性検証処理を表した一例のフローチャートである。 一時パターンの生成を表した一例の概念図である。 初期状態における適合性検証処理を表した一例の概念図である。 初期状態における適合性検証処理の詳細を表したフローチャートである。 閾値の決め方を説明する為の説明図である。 適合性検証処理のイメージ図である。
符号の説明
11 入力装置
12 出力装置
13 ドライブ装置
14 補助記憶装置
15 メモリ装置
16 演算処理装置
17 インターフェース装置
20 フォルダ監視プログラム
21 常駐監視プロセス
22 検査プログラム
23 初期検査プログラム23
41 常駐監視スレッド
42 検査スレッド
43 パターン
100 質問文書
101 学習文書
102 一時パターン
103 質問文書パターン
B バス

Claims (23)

  1. 記憶装置、演算処理装置を備え、前記記憶装置のファイル保管場所に保管される文書ファイルを監視しているファイル保管場所監視装置であって、
    前記演算処理装置が、監視対象のファイル保管場所に保管されている文書ファイルを用いて前記ファイル保管場所のパターンファイルを生成するパターンファイル生成手段と、
    前記演算処理装置が、前記ファイル保管場所のパターンファイルに基づき、前記ファイル保管場所に保管される文書ファイルの適合性を検証する第1適合性検証手段と、
    前記演算処理装置が、適合する前記文書ファイルを前記ファイル保管場所に保管する保管手段と、
    前記演算処理装置が、前記ファイル保管手段に保管した前記文書ファイルを前記ファイル保管場所のパターンファイルへ学習させる第1学習手段と
    して機能するファイル保管場所監視装置。
  2. 前記パターンファイル生成手段は、前記ファイル保管場所に保管されている文書ファイルから対象文書を一文書ずつ選択し、前記ファイル保管場所に保管されている前記対象文書以外の全文書ファイルから一時パターンファイルを前記対象文書ごとに生成する一時パターンファイル生成手段と、
    前記対象文書から対象文書パターンファイルを生成する対象文書パターンファイル生成手段と、
    前記一時パターンファイルと前記対象文書パターンファイルとを照合し、前記対象文書が前記ファイル保管場所に適合するかを検証する第2適合性検証手段と、
    前記ファイル保管場所に適合する前記対象文書の対象文書パターンファイルを前記ファイル格納場所のパターンファイルへ学習させる第2学習手段と
    して機能する請求項1記載のファイル保管場所監視装置。
  3. 前記パターンファイル生成手段は、前記ファイル保管場所に適合しない前記対象文書の対象文書パターンファイルを前記ファイル格納場所から退避させる対象文書退避手段と、
    前記ファイル保管場所に適合しない前記対象文書を操作者に通知する通知手段と
    して機能する請求項2記載のファイル保管場所監視装置。
  4. 前記一時パターンファイル生成手段は、前記ファイル保管場所に保管されている前記対象文書以外の全文書ファイルから特徴量を抽出し、その特徴量を表す一時パターンファイルを前記対象文書ごとに生成するように機能する請求項2記載のファイル保管場所監視装置。
  5. 前記対象文書パターンファイル生成手段は、前記対象文書から特徴量を抽出し、その特徴量を表す対象文書パターンファイルを生成するように機能する請求項4記載のファイル保管場所監視装置。
  6. 前記一時パターンファイル生成手段は、前記ファイル保管場所に保管されている前記対象文書以外の全文書ファイルを要素に分解し、各要素から特徴量を抽出するように機能する請求項4記載のファイル保管場所監視装置。
  7. 前記対象文書パターンファイル生成手段は、前記対象文書を要素に分解し、各要素から特徴量を抽出するように機能する請求項5記載のファイル保管場所監視装置。
  8. 前記第2適合性検証手段は前記一時パターンファイルの特徴量と前記対象文書パターンファイルの特徴量とを照合して適合度を算出し、その適合度が第1の閾値よりも大きいときに前記対象文書が前記ファイル保管場所に適合すると判定するように機能する請求項3記載のファイル保管場所監視装置。
  9. 前記第1適合性検証手段は、前記ファイル保管場所のパターンファイルの特徴量と前記ファイル保管場所に保管される文書ファイルの特徴量とを照合して適合度を算出し、その適応度が第2の閾値よりも大きいときに前記文書ファイルが前記ファイル保管場所に適合すると判定するように機能する請求項1記載のファイル保管場所監視装置。
  10. 前記演算処理装置が、適合しない前記文書ファイルがあるとき、その文書ファイルを前記ファイル保管場所に保管するか否かの判定結果を操作者に入力させる判定結果入力手段として更に機能する請求項1記載のファイル保管場所監視装置。
  11. 前記判定結果入力手段により操作者から適合しない前記文書ファイルを前記ファイル保管場所に保管する判定結果が入力されると、前記第1学習手段は適合しない前記文書ファイルを前記ファイル保管場所のパターンファイルへ学習させるように機能する請求項10記載のファイル保管場所監視装置。
  12. 記憶装置、演算処理装置を備え、前記記憶装置のファイル保管場所に保管される文書ファイルを監視しているコンピュータにおいて実行されるファイル保管場所監視プログラムであって、
    前記演算処理装置を、
    監視対象のファイル保管場所に保管されている文書ファイルを用いて前記ファイル保管場所のパターンファイルを生成するパターンファイル生成手段と、
    前記ファイル保管場所のパターンファイルに基づき、前記ファイル保管場所に保管される文書ファイルの適合性を検証する適合性検証手段と、
    適合する前記文書ファイルを前記ファイル保管場所に保管する保管手段と、
    前記ファイル保管手段に保管した前記文書ファイルを前記ファイル保管場所のパターンファイルへ学習させる学習手段と
    して機能させるファイル保管場所監視プログラム。
  13. 前記パターンファイル生成手段は、前記ファイル保管場所に保管されている文書ファイルから対象文書を一文書ずつ選択し、前記ファイル保管場所に保管されている前記対象文書以外の全文書ファイルから一時パターンファイルを前記対象文書ごとに生成する一時パターンファイル生成手段と、
    前記対象文書から対象文書パターンファイルを生成する対象文書パターンファイル生成手段と、
    前記一時パターンファイルと前記対象文書パターンファイルとを照合し、前記対象文書が前記ファイル保管場所に適合するかを検証する第2適合性検証手段と、
    前記ファイル保管場所に適合する前記対象文書の対象文書パターンファイルを前記ファイル格納場所のパターンファイルへ学習させる第2学習手段と
    して前記演算処理装置を機能させる請求項12記載のファイル保管場所監視プログラム。
  14. 前記パターンファイル生成手段は、前記ファイル保管場所に適合しない前記対象文書の対象文書パターンファイルを前記ファイル格納場所から退避させる対象文書退避手段と、
    前記ファイル保管場所に適合しない前記対象文書を操作者に通知する通知手段と
    して前記演算処理装置を機能させる請求項13記載のファイル保管場所監視プログラム。
  15. 前記一時パターンファイル生成手段は、前記ファイル保管場所に保管されている前記対象文書以外の全文書ファイルから特徴量を抽出し、その特徴量を表す一時パターンファイルを前記対象文書ごとに生成するように前記演算処理装置を機能させる請求項13記載のファイル保管場所監視プログラム。
  16. 前記対象文書パターンファイル生成手段は、前記対象文書から特徴量を抽出し、その特徴量を表す対象文書パターンファイルを生成するように前記演算処理装置を機能させる請求項15記載のファイル保管場所監視プログラム。
  17. 前記一時パターンファイル生成手段は、前記ファイル保管場所に保管されている前記対象文書以外の全文書ファイルを要素に分解し、各要素から特徴量を抽出するように前記演算処理装置を機能させる請求項15記載のファイル保管場所監視プログラム。
  18. 前記対象文書パターンファイル生成手段は、前記対象文書を要素に分解し、各要素から特徴量を抽出するように前記演算処理装置を機能させる請求項16記載のファイル保管場所監視プログラム。
  19. 前記第2適合性検証手段は前記一時パターンファイルの特徴量と前記対象文書パターンファイルの特徴量とを照合して適合度を算出し、その適合度が第1の閾値よりも大きいときに前記対象文書が前記ファイル保管場所に適合すると判定するように前記演算処理装置を機能させる請求項14記載のファイル保管場所監視プログラム。
  20. 前記第1適合性検証手段は、前記ファイル保管場所のパターンファイルの特徴量と前記ファイル保管場所に保管される文書ファイルの特徴量とを照合して適合度を算出し、その適応度が第2の閾値よりも大きいときに前記文書ファイルが前記ファイル保管場所に適合すると判定するように前記演算処理装置を機能させる請求項12記載のファイル保管場所監視プログラム。
  21. 前記演算処理装置が、適合しない前記文書ファイルがあるとき、その文書ファイルを前記ファイル保管場所に保管するか否かの判定結果を操作者に入力させる判定結果入力手段として更に前記演算処理装置を機能させる請求項12記載のファイル保管場所監視プログラム。
  22. 前記判定結果入力手段により操作者から適合しない前記文書ファイルを前記ファイル保管場所に保管する判定結果が入力されると、前記第1学習手段は適合しない前記文書ファイルを前記ファイル保管場所のパターンファイルへ学習させるように前記演算処理装置を機能させる請求項21記載のファイル保管場所監視プログラム。
  23. 請求項12乃至22何れか一項記載のファイル保管場所監視プログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2007010856A 2007-01-19 2007-01-19 ファイル保管場所監視装置、ファイル保管場所監視プログラム、記録媒体 Expired - Fee Related JP4976146B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007010856A JP4976146B2 (ja) 2007-01-19 2007-01-19 ファイル保管場所監視装置、ファイル保管場所監視プログラム、記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007010856A JP4976146B2 (ja) 2007-01-19 2007-01-19 ファイル保管場所監視装置、ファイル保管場所監視プログラム、記録媒体

Publications (2)

Publication Number Publication Date
JP2008176665A true JP2008176665A (ja) 2008-07-31
JP4976146B2 JP4976146B2 (ja) 2012-07-18

Family

ID=39703625

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007010856A Expired - Fee Related JP4976146B2 (ja) 2007-01-19 2007-01-19 ファイル保管場所監視装置、ファイル保管場所監視プログラム、記録媒体

Country Status (1)

Country Link
JP (1) JP4976146B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016146147A (ja) * 2015-02-09 2016-08-12 キヤノン株式会社 文書管理システム、文書登録装置、文書登録方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10111869A (ja) * 1996-10-07 1998-04-28 Fujitsu Ltd 情報分類装置とその方法
JPH1115848A (ja) * 1997-06-26 1999-01-22 Sharp Corp 情報分類装置、文書情報分類方法及び同方法の実行に用いる記録媒体

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10111869A (ja) * 1996-10-07 1998-04-28 Fujitsu Ltd 情報分類装置とその方法
JPH1115848A (ja) * 1997-06-26 1999-01-22 Sharp Corp 情報分類装置、文書情報分類方法及び同方法の実行に用いる記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016146147A (ja) * 2015-02-09 2016-08-12 キヤノン株式会社 文書管理システム、文書登録装置、文書登録方法

Also Published As

Publication number Publication date
JP4976146B2 (ja) 2012-07-18

Similar Documents

Publication Publication Date Title
US9691027B1 (en) Confidence level threshold selection assistance for a data loss prevention system using machine learning
US9495583B2 (en) Organizing images by correlating faces
EP2203847A2 (en) Intelligent editing of relational models
JP6544205B2 (ja) 情報処理装置、プログラム、情報処理システムおよび情報処理方法
CN101533400B (zh) 相关文档呈现系统和相关文档呈现方法
US20150095356A1 (en) Automatic keyword tracking and association
WO2020063524A1 (zh) 一种法律文书的确定方法及系统
JP7275591B2 (ja) 評価支援プログラム、評価支援方法および情報処理装置
JP4976146B2 (ja) ファイル保管場所監視装置、ファイル保管場所監視プログラム、記録媒体
WO2024057589A1 (ja) 修正提案方法、修正提案システム、及び修正提案プログラム
JP5928733B2 (ja) 文字列からなるテストデータを自動的に生成する方法及び文字列からなるテストデータ中に埋め込まれたシグネチャーを識別する方法、並びに、それらのコンピュータ及びコンピュータ・プログラム
JP2004341623A (ja) セキュリティ仕様書作成支援装置、および、セキュリティ仕様書作成支援方法
JP5648336B2 (ja) 不整合検出装置、プログラム及び方法、修正支援装置、プログラム及び方法
JP5084341B2 (ja) 文書解析処理装置、画像処理装置、文書解析処理プログラム、文書解析処理方法
WO2008004221A2 (en) Inserting digital signatures into a transformed document
CN107491466A (zh) 客户端设备、信息处理系统、以及信息处理方法
JP2009230427A (ja) 電子文書属性検出推定方法、電子文書属性検出推定装置、電子文書属性検出推定プログラム及び記憶媒体
CN111796886B (zh) 辅助系统及存储介质
CN114491195A (zh) 特征数据识别方法及装置、电子设备、存储介质
CN109409127B (zh) 网络数据安全策略的生成方法、装置及存储介质
JP7139631B2 (ja) 情報処理プログラム、情報処理方法、および情報処理装置
JP2009110445A (ja) 画像認識装置、画像認識プログラムおよび画像認識方法
US7558642B2 (en) Method, apparatus, and product for optimizing manufacturing tests by integrating part and test objects in the same order configuration application
JP7024533B2 (ja) 検出パターン評価モデル生成システム、方法およびプログラム
JP7456289B2 (ja) 判定プログラム、判定方法および情報処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091002

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111216

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120104

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120216

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120313

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120412

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150420

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees