JP5399114B2 - ファイルサーバ運用支援装置、方法、プログラム及び記録媒体 - Google Patents

ファイルサーバ運用支援装置、方法、プログラム及び記録媒体 Download PDF

Info

Publication number
JP5399114B2
JP5399114B2 JP2009081695A JP2009081695A JP5399114B2 JP 5399114 B2 JP5399114 B2 JP 5399114B2 JP 2009081695 A JP2009081695 A JP 2009081695A JP 2009081695 A JP2009081695 A JP 2009081695A JP 5399114 B2 JP5399114 B2 JP 5399114B2
Authority
JP
Japan
Prior art keywords
document
search
server
file
operation support
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009081695A
Other languages
English (en)
Other versions
JP2010237725A (ja
Inventor
聡 土井
恒男 盛井
美佳 秋山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Solutions Ltd
Original Assignee
Hitachi Solutions Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Solutions Ltd filed Critical Hitachi Solutions Ltd
Priority to JP2009081695A priority Critical patent/JP5399114B2/ja
Publication of JP2010237725A publication Critical patent/JP2010237725A/ja
Application granted granted Critical
Publication of JP5399114B2 publication Critical patent/JP5399114B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、ファイルサーバ運用支援技術に関し、企業などの組織内において用いられるファイルサーバ中の文書を適切に検索、削除するファイルサーバ運用支援装置に関する。
企業などの組織において、パーソナルコンピュータ(クライアント端末、以降PCと称する。)に代表される業務端末の普及は進み、社員は、電子データからなる文書等をPC等の端末を用いて作成する。作成した文書は、企業内において共有化を図るために、ファイルサーバ等のシステムへ保管する。
近年、セキュリティ上の観点からPC等の端末上にファイルを残さずファイルサーバ等へ集中保管することが推奨されている。また、内部統制およびディザスタリカバリの面からも業務の証拠・成果物として文書は、ファイルサーバ等に全て保管することが望まれている。
そのため、企業のファイルサーバ等で集中保管される文書はますます増加している。
企業内において文書を集中保管する仕組みは、大きく2つにわけられる。1つは、OSやNAS(Network Attached Storage)のファイル共有機能を利用したファイルサーバを用いた仕組みである。もう1つは、サーバとデータベースとで構成される文書管理システムである。また、これらに保管されている文書を探しやすくするために、検索システムが併用される場合がある。
図11は、企業にみられる一般的なファイルサーバ、文書管理システム、検索システムを含む一構成例を示す図であり、文書を作成するPC1101、1101、…と、ファイルサーバ1102、1102、…と、文書管理サーバ1103と、その文書保管状態を記録するデータベース1104と、検索サーバ1105と、を有して構成されている。
このような構成のシステムにおいて、利用者は、PC1101上で文書を作成し、OSのファイル管理機能を用いてファイルサーバ1102へ接続し、ユーザ認証を行い許可された場合には、ユーザ権限に応じたフォルダに文書を保管させることができる。
同様に、利用者は、PC1101に備えられたWebブラウザまたは専用のクライアントソフトを用い、文書管理サーバ1103へ接続し、ユーザ認証を行い許可された場合、ユーザ権限に応じたフォルダに文書を保管することができる。このときデータベース1104に文書の保管情報が記録される。
一方、保管した文書を参照したい場合は、PC1101のOSのファイル管理機能、または、Webブラウザ、または、専用のクライアントソフトを用い、文書を保管したファイルサーバ1102又は文書管理サーバ1103に接続し、ユーザ認証を行い許可された場合に、ユーザ権限に応じて表示されるフォルダ、ファイルの一覧から文書を探し、参照する。
さらに、検索システムを用い文書を探す場合は、利用者はPC1101に備えられたWebブラウザで検索サーバ1105へ接続し、表示されたWebページに参照したい文書に含まれると予想される文字列(キーワード)等を入力し、検索サーバ1105へ送信する。検索サーバ1105が検索を行い、検索結果として表示されるWebページの一覧から文書を探し、参照することができる。
尚、本発明に関連する公知技術文献として、ファイルサーバ中の不要な文書を削除する技術に関する技術として下記の特許文献1があり、また、文書の保管、検索に関するものに下記の特許文献2から4までが挙げられる。
特許公開平10−260875号公報 特許公開2008−99140号公報 特許公開2007−135174号公報 特許公開2001−222525号公報
ところで、一般的なファイルサーバは、文書を保管し、共有する機能のみを有している。従って、例えば、文書を削除するなどの管理はできない。例えば、文書に保管期間を設定しておき、その期限が経過すると削除するような運用を行うことはできない。すなわち、文書毎に保管期間を設けることができないため、文書の保管日付を見て一定期間経過したものを一律削除するような運用や、利用者からの参照履歴を見て一定期間参照していないものを一律削除する運用だけで対処せざるを得ないという問題がある。
上記の特許文献1には、そのような技術が開示されているが、企業内の文書はその種別によって、3年、5年、7年、10年、永年の保管期間などと、異なる保存期間が定められているのが一般的であり、種別によらず、一定期間で一律削除する運用では対処することができない。また、文書が参照されていなくとも、定められた保管期間を待たずに削除することも問題がある。
このため、ファイルサーバ中の文書は、利用者の手動による削除処理に依存するしかなく、削除されず文書数が増え続けるという問題がある。
一方、一般的な文書管理システムでは、文書の保管期間を文書毎にそのデータベースに記録することができ、保管期間を過ぎた文書を削除することができる。上記の特許文献2、3、4は、文書の保管期間の記録方法、経過期間の判断方法、文書を削除する技術が開示されている。
しかしながら、多くの企業において、文書管理システムに全ての文書を保管するような運用は行われていない。これは、文書管理システムに文書を保管する作業が、PC上のWebブラウザ、専用クライアントで行う必要があり、操作が煩雑なこと、利用者数に応じた複数の文書管理システムの構築、運用は管理負荷が高いこと、文書管理システムはクライアント毎にライセンス費が発生し高コストであること、文書管理システムに文書を保管する際に、利用者が保管期間を設定しなければ、保管期間による削除を行うことができないこと、等が原因である。
また、ファイルサーバ上において、利用者が文書を作成し、編集し、完成させるまでの過程では、バックアップや履歴をとる目的で様々な時点でそのコピーが行われる。文書が完成した時点で、コピーされた文書を削除することが望ましいが、システム側で自動的に削除することは難しく、利用者の作業負担となる。この点、上記の特許文献1で開示されたアクセス頻度によるファイル削除技術、特許文献2、3、4で開示された保管期間によるファイル削除技術では解決することができない。
これらのことから、企業内では、ファイルサーバに多くの文書を保管し、その数は増え続けるままにされている。
以上の現状に鑑み、本発明の目的は、企業のファイルサーバ中の文書数増加を軽減するファイルサーバ運用支援技術を提供することにある。
上記目的を達成するために、本発明のファイルサーバ運用支援システムは、ファイルサーバ中の文書に対し適切な保管期間を設定し、保管期間が切れた文書を削除できるようにすると共に、バックアップや履歴の目的でコピーされた文書を探し出し利用者に削除を促すことを特徴とする。
本発明の一観点によれば、クライアントPC及び文書を保管するファイルサーバと接続されるファイルサーバ運用支援装置であって、文書ファイル又はフォルダ(以下、文書と称する。)を削除するためのGUIを提供する運用支援サーバと、削除対象の文書の検索を実行する検索サーバ、とから構成されるファイルサーバ運用支援装置において、前記運用支援サーバは、前記検索サーバに送信する検索クエリを文書の削除対象条件を基に作成する検索クエリ作成部と、検索結果の文書を前記クライアントPCからの指示により前記ファイルサーバから削除するための文書操作部と、前記ファイルサーバから削除された文書を一時的に保存する削除文書格納部と、を備え、前記検索サーバは、対象文書のテキストデータである検索インデックスを作成する対象となる対象文書を前記ファイルサーバから取得するファイル探索部と、文書のメタデータを取得するメタデータ抽出部と、前記運用支援サーバからの要求により前記削除対象条件と前記メタデータとに基づいて削除対象文書の検索を実行する検索実行部と、を備えることを特徴とするファイルサーバ運用支援装置が提供される。
前記メタデータは、文書タイトル毎に指定された日付と文書タイトル毎に決められている文書保管期間であり、前記運用支援サーバは、前記文書の削除対象条件として期限切れの文書の保管期間を算出するための保管期間判定部を備えることが好ましい。或いは、前記メタデータは、文書のフォルダ名又はファイル名であり、前記運用支援サーバは、前記文書のフォルダ名又はファイル名の類似性から、前記文書の削除対象条件として不要文書の条件を導出するための類似文書判定部を備えるようにしても良い。
前記検索サーバは、取得した文書のメタデータを格納するメタデータDBと、前記メタデータと対応付けられ文書のテキストデータである検索インデックスを格納するインデックスDBと、関連付けされていることが好ましい。前記運用支援サーバからの要求により前記文書の前記メタデータを前記メタデータDBから削除するメタデータ削除部と、前記運用支援サーバからの要求により文書の検索インデックスを前記インデクスDBから削除するインデックス削除部と、を備えるようにしても良い。
前記取得したメタデータの各項目にタグを付け、XML形式にしてファイルを作成し、1文書につき1XMLファイルを作成する処理部を有することが好ましい。例えば、“提案書B.doc”と“提案書B.xml”が、削除文書格納領域内に一次保管される。これにより、削除した後に、XML文書からファイルを復元することができる。
前記XMLファイルを作成したその時点の日付、時刻を基にフォルダを作成し、前記削除文書格納領域に格納するようにしても良い。フォルダの下に削除対象の文書ごとに1つフォルダを作成し、文書とそのメタデータのXMLファイルをコピーすることが好ましい。削除対象の文書をコピーした後に、前記ファイルサーバ中の文書を削除し、削除対象の文書のメタデータを前記メタデータDBより削除した後に、前記検索インデックスをインデックスDB削除するようにしても良い。
本発明は、クライアントPCと、文書を保管するファイルサーバと、文書ファイル又はフォルダを削除するためのGUIを提供する運用支援サーバと、削除対象の文書の検索を実行する検索サーバ、とから構成されるファイルサーバ運用支援装置であって、前記運用支援サーバは、前記検索サーバに送信する検索クエリを文書の削除対象条件を基に作成する検索クエリ作成部と、検索結果の文書を前記クライアントPCからの指示により前記ファイルサーバから削除するための文書操作部と、前記ファイルサーバから削除された文書を一時的に保存する削除文書格納部と、を備え、前記検索サーバは、対象文書のテキストデータである検索インデックスを作成する対象となる対象文書を前記ファイルサーバから取得するファイル探索部と、前記対象文書のメタデータを取得するメタデータ抽出部と、前記運用支援サーバからの要求により検索を実行する検索実行部と、を備えることを特徴とするファイルサーバ運用支援システムであっても良い。
本発明の他の観点によれば、上記に記載のファイルサーバ運用支援装置におけるファイルサーバ運用支援方法であって、前記PCに備えられたWebブラウザの画面から日付が指定され、保管期限切れの文書の検索指示を受けるステップと、検索指示が出されると、前記運用支援サーバが指定日付よりその年度を算出するステップと、保管期間と削除対象年度を基に前記検索サーバで実行するための検索クエリを作成するステップと、検索クエリを作成した後に、前記検索サーバに検索クエリを送信し、検索を実行するステップと、その結果を前記検索サーバより受け取るステップと、利用者のWebブラウザへ表示するステップと、を備えたことを特徴とする保管期限切れ文書検索方法が提供される。また、上記に記載のファイルサーバ運用支援装置におけるファイルサーバ運用支援方法であって、前記PCに備えられたWebブラウザの画面からファイル名またはフォルダ名が指定され検索指示を出すステップと、ファイル名を指定された場合、それと類似するファイル名を持つ文書、または、ハッシュ値が同じであり、かつ、ファイルサイズが同じ文書を探すための検索クエリを作成するステップと、フォルダ指定された場合、その指定フォルダ以下で削除候補となる名前のフォルダ中にある文書を探すためのクエリを作成するステップと、得られたハッシュ値、ファイルサイズの条件と、正規表現を前記検索サーバ用のクエリで記述するステップと、検索クエリを作成後、前記検索サーバに検索クエリを送信し、検索を実行するステップと、その結果を前記検索サーバより受け取るステップと、利用者のWebブラウザへ表示するステップと、を備えたことを特徴とする不要文書の検索方法が提供される。
本発明は、上記に記載の方法をコンピュータに実行させるためのプログラムであっても良い。また、該プログラムを記録するコンピュータ読みとり可能な記録媒体であっても良い。
以上のように、本発明のファイルサーバ運用支援システムによれば、以下のような効果がある。
ファイルサーバ中の文書に対して適切な保管期間を設定し、保管期間が切れた文書を削除できるようにすると共に、バックアップや履歴の目的でコピーされた文書を探し出し利用者に削除を促すことで、企業のファイルサーバ中の文書数増加を軽減することができる。
本発明の一実施の形態によるファイルサーバ運用支援システムの概略構成例を示す機能ブロック図である。 本実施の形態によるファイルサーバ運用支援システムの内部の機能ブロック図である。 本実施の形態によるファイルサーバ運用支援システムで扱う文書のメタデータのデータ構成例を示す図である。 本実施の形態によるファイルサーバ運用支援システムの文書保管期間定義のデータ構成例を示す図である。 本実施の形態によるファイルサーバ運用支援システムの不要文書定義のデータ構成例を示す図である。 本実施の形態によるファイルサーバ運用支援システムで管理される文書のメタデータ、および、検索インデックスの記録処理の流れを示すフローチャート図である。 本実施の形態によるファイルサーバ運用支援システムの保管期限切れ文書検索処理の流れを示すフローチャート図である。 本実施の形態によるファイルサーバ運用支援システムの不要文書検索処理の流れを示すフローチャート図である。 本実施の形態によるファイルサーバ運用支援システムの指定文書リスト出力処理の流れを示すフローチャート図である。 本実施の形態によるファイルサーバ運用支援システムの指定文書削除処理の流れを示すフローチャート図である。 一般的なファイルサーバ、文書管理システム、検索システムの一構成例を示す構成図である。
以下、本発明の一実施の形態について図面を参照しながら説明を行う。図1は、本実施の形態によるファイルサーバ運用支援装置の一構成例を示す図である。このファイルサーバ運用支援装置は、利用者が用いるPC(クライアントPC)101と、利用者が文書を保管する少なくとも1のファイルサーバ102と、に接続されるファイルサーバ運用支援装置103であり、文書削除ためのGUIを提供する運用支援サーバ104と、削除対象の文書の検索を実行する検索サーバ105とから構成されている。これらの全ての構成がLAN108により接続されて通信自在に構成されている。検索サーバ105は、ファイル(文書)のメタデータをファイルと対応させて格納するメタデータデータベース(DB)106と、ファイルのテキストデータを格納するインデックスデータベース107と接続されている。
利用者が用いるPC101は、LAN経由でファイルサーバ102にアクセスし、文書を保管、参照する。このアクセスは、OS搭載のネットワーク機能と、認証機能と、を用いて行われる。また、PC101は、運用支援サーバ104にアクセスし、文書の検索、削除を実行するためのWebブラウザ(図示せず)を備えている。
図2は、ファイルサーバ運用支援装置の詳細な構成例を示す図である。図2に示すように、ファイルサーバ運用支援装置103中の運用支援サーバ104は、利用者の指示でファイルサーバ102から削除した文書を一時的に保管しておく削除文書格納領域217を備える。検索サーバ105は、ファイルサーバ中の文書を検索可能とするために文書のメタデータを記録するメタデータDB106と、文書ファイルのテキストデータである検索インデックスを記録するインデックスDB107と、を備える。メタデータとインデックスとは、対応関係を有している。
運用支援サーバ104は、その中に、保管期限が切れた文書、不要な文書の検索と削除を実行するためのGUIを利用者に提供するための検索画面表示部201と、文書ファイルの属性(タイトル、作者、日付、保管期間、キーワード)であるメタデータを編集するためのメタデータ編集画面表示部202と、指定された日付と文書保管期間から期限切れの条件を算出するための保管期間判定部203と、フォルダ名、ファイル名の類似性から不要文書の条件を導出するための類似文書判定部204と、これらの条件を基に検索サーバ105に送信する検索クエリ(検索条件文)を作成する検索クエリ作成部205と、検索サーバ105より返される検索結果を表示するための検索結果表示部206と、利用者からの指示により表示した検索結果をファイル出力する文書リスト出力部207と、利用者からの指示により表示した検索結果のファイルをファイルサーバ102から削除するための文書操作部208と、を有して構成される。さらに、削除文書格納領域217を設けることで、削除した文書を復元することができる。ここで言う削除とは、削除文書格納領域217への移動を言う。これにより、削除ファイルを一時的に保管しておき、1週間後などに、或いは、ユーザ選択により、適宜削除していくことができる。
検索サーバ105は、文書ファイルのテキストデータである検索インデックスを作成する文書をファイルサーバ102から取得するファイル探索部209と、メタデータに必要な文書のハッシュ値を取得するハッシュ値計算部210と、文書中の文字列からメタデータを取得するメタデータ抽出部211と、文書のメタデータをメタデータDB106に記録するためのメタデータ記録部212と、文書ファイルのテキストデータである検索インデックスをインデックスDBに記録するインデックス記録部213と、運用支援サーバ104からの要求で検索を実行する検索実行部214と、運用支援サーバ104からの要求で文書のメタデータをメタデータDB106から削除するメタデータ削除部215と、運用支援サーバ104からの要求で、文書ファイルのテキストデータである検索インデックスをインデクスDBから削除するインデックス削除部216と、を有して構成される。209から213までで検索前の準備が完了する。
図3は、メタデータDB106に格納される文書毎のメタデータの一例を示す図である。図3に示すように、ファイル毎のメタデータは、ID1、ID2、…のようにファイル毎に格納されている。各メタデータは、ある程度定型化されているタイトル301、作成した日付302、作成者(組織名など)303と、保管期間304と、ハッシュ値305と、ファイルサイズ306と、保存場所を示すURI307と、任意であるが確認フラグ308と、ユーザ任意のデータ309と、の各エリアデータから構成されている。文書の検索インデックス作成時に、合わせて、文書毎に、タイトル、日付、作成者、保管期間、ハッシュ値、ファイルサイズ、URIが登録される。また利用者が運用支援サーバ104へアクセスし、その検索結果表示部206で選択した文書に対しメタデータを更新するとき、文書毎に、タイトル、日付、作成者、保管期間、確認フラグ、ユーザ任意のデータが更新される。タイトル301は、GUIで提示される選択肢のなかからユーザが選ぶようにしても良い。
図4は、運用支援サーバ104が持つ文書保管期間定義のデータの一例を示す図である。図4に示すように、図3で示すタイトルとして、例えば文書のタイトル401から412までと、それに対応する保管期間(年数)のデータとの対により構成され、システム運用開始前に管理者によってあらかじめ定義されている。このうち、文書タイトル412のelseは、定義された文書タイトルのいずれにも該当しなかった場合に保管期間を適用するために用いる。また、保管期間の値99は、永年保管であることを示す。図4に示す文書タイトルは、運用により決められたタイトルであり、一般的には、文書作成時又は保存時などに、ユーザが図4に示すように決められたタイトルの中から選択することである程度決められたタイトルになるように構成されている。
図5は、運用支援サーバ104が持つ不要文書定義のデータの一構成例を示す図である。図5に示すように、不要文書定義のデータは、正規表現501により記述され、その正規表現501内にパラメータ502が含まれている。これにより、不要文書のフォルダ名、ファイル名のパターンを、システム運用開始前に予め管理者によって定義しておく。パラメータ502は、フォルダ名、ファイル名を正規表現中に指定するために用いられる。正規表現501を使ってファイルを指定する(検索条件をつけておく)。
図5には、正規表現501と、その意味とが例示されており、上から3行の例がフォルダ、下3行の例がファイルを示す正規表現である。例えば、1行目の正規表現は、pathで指定されたフォルダ以下のtmp(テンプレート)フォルダを示す。また、上から4行目は、filenameで指定されたファイル名を含む文書である。path、filenameなどのパラメータは、ユーザにより指定される(入力される)ものである。このテーブルにより、“pathで指定されたフォルダ以下の”、“filenameで指定されたファイル名を含む”などの、類似ファイルを見つけることができる。
図6は、文書のメタデータと検索インデックスの記録処理の流れを示すフローチャート図である。本実施の形態によるファイルサーバ運用支援装置を使用する場合に、対象となるファイルサーバ102中の文書に対し、メタデータと検索インデックスとを作成、記録しておく必要がある。この記録処理は、一定の周期で、ファイルサーバ102にアクセスし実行することが運用支援サーバ1045において設定されている。
まず、指定されたファイルサーバ102中の文書を取得する(ステップS601)。次に、文書が前回のメタデータ、検索インデックス記録処理以降に更新されているか否かを調べる(ステップS602)。この時、まだメタデータ、検索インデックスが作成されていない文書も更新された文書とみなす。更新されていなければ(NO)、次の対象文書へ処理を進める(ステップS609に進む)。更新されている文書の場合(YES)、メタデータの作成処理(ステップS603、S604、S605、S606)に進む。メタデータの1つ文書のハッシュ値305は、OS標準ライブラリ中のハッシュ関数を用いて取得する。メタデータの1つファイルサイズ306は、OS標準ライブラリを用いて取得する。メタデータの1つ文書タイトル301および日付302は、文書中の文字列から取得する。メタデータの1つ保管期間304は、運用支援サーバ104が持つ保管期間定義(図4参照)から、直前に取得した文書のタイトル301の値に該当する保管期間を取得する。残りのメタデータURI307は、ファイルのパス、確認フラグ308は”0”とする。尚、確認フラグ308は、後日利用者によるメタデータの確認または編集後に“1”となる。メタデータが決まると、メタデータDB106にメタデータを記録する(ステップS607)。続けて、インデックスDB107に検索インデックスを記録する(ステップS608)。メタデータ、検索インデックスへの記録が終わると、対象文書が残っているか否かを調べる(ステップS609)。残りの文書があれば(YES)、処理を繰り返す(S602からS609)。残りの文書がなければ(NO)、処理を終了する(終了)。
尚、図4・図5のテーブルは、例えば図1の運用支援サーバ104内のメモリ104aに記憶されている。
(保管期間によるファイルの削除)
図7は、保管期限切れ文書の検索処理の概要を示すフローチャート図であり、図5のテーブルを参照して実行させることができる。利用者はPCに備えられたWebブラウザを起動し、運用支援サーバ104にアクセスし、認証を行いシステムにログインすると、検索画面表示部201より検索指示を行うための画面が表示される。利用者は、この画面から日付を指定して、保管期限切れの文書の検索指示を出す(ステップS702)。
検索指示が出されると、運用支援サーバ104は、指定日付よりその年度を算出する(ステップ703)。年度は4月始まり、3月終わりとする。例えば、2009年2月23日が指定日であれば、年度は2008年であり、2009年4月1日が指定日であれば、年度は2009年である。
この年度と保管期間とを元に、削除対象となる年度を以下の式より、算出する。
削除対象年度=指定年度−(保管期間+1)
例えば、年度が2009年で、保管期間が3年であれば、削除対象となる年度は2005年である。次に、保管期間と削除対象年度とを基に、検索サーバ105で実行するための検索クエリを作成する(ステップS704)。例えば、2009年に保管期間3年の期限がきた文書を探す場合、条件は「文書メタデータの日付302が2006年3月以前で、保管期間304が3年」である。文書のメタデータと削除条件とが合致する文書が削除対象となる。
この条件を検索サーバ105用のクエリで記述する。記述書式は検索サーバにインストールされる検索エンジンソフトウェアに依存するものである。検索クエリを作成した後、検索サーバ105に検索クエリを送信し、指定した削除条件と合致するメタデータを有する文書の検索を実行する(ステップS705)。検索された文書が削除対象の文書となる。その結果を検索サーバより受け取り(ステップS706)、検索結果表示部206より利用者のWebブラウザへ表示する(ステップS707)。削除の前に表示させて最終確認を行っても良いし、検索された文書は自動的に削除しても良い。尚、この一連の処理は、ユーザの指定によって行うこともできるし、予め設定しておけば、その日時に自動的に開始されるようにすることもできる(図10参照)。
(類似性に基づくファイルの削除)
図8は、類似性に基づく不要文書を検索する処理の流れを示すフローチャート図であり、図6のテーブルを参照して実行させることができる。利用者は、PC101に備えられたWebブラウザを起動し、運用支援サーバ104にアクセスし、認証を行いシステムにログインする。すると、検索画面表示部201より検索指示を行うための画面が表示される。利用者はこの画面から、図5に示すファイル名またはフォルダ名を指定して検索指示を出す(ステップS801)。
ファイル名が指定された場合、それと類似するファイル名を持つ文書、または、ハッシュ値305が同じであり、かつ、ファイルサイズ306が同じ文書を探すための検索クエリを作成する(ステップS803)。ファイルサイズを比較することにより、ハッシュ値の衝突が起きていた場合に誤って異なる文書が検索結果に含まれる確率を低くすることができる。このファイル名も、ステップ3に示すメタデータに含まれる。ファイル名の類似条件は、運用支援サーバ104が持つ不要文書定義(図5)を基に作成する。不要ファイルは正規表現で表すようにする。文字列“?P”で始まるパラメータ502には、指定されたファイル名が入る。なお、正規表現で使用する文字が指定するパラメータに含まれる場合、“\”円記号(英語圏ではバックスラッシュ)を該当する文字の直前に付ける。例えば、“提案書.doc”という文書に対し、バックアップ目的でコピーをとると“コピー 〜 提案書.doc”というファイル名の文書となり、その正規表現は“^.*/コピー.*提案書\.doc$”となる。
一方、フォルダ指定された場合、その指定フォルダ以下で削除候補となる名前のフォルダ中にある文書を探すためのクエリを作成する(ステップS804)。例えば、ファイルサーバ192.168.1.2の“企画部フォルダ”以下にある“tmp”フォルダ中の文書を探したい場合、“^file://192\.168\.1\.2/企画部/.*tmp/.*$”となる。
ここで得られるハッシュ値、ファイルサイズの条件と、正規表現と、を、検索サーバ105用のクエリで記述する。記述書式は検索サーバにインストールされる検索エンジンソフトウェアに依存する。検索クエリを作成した後に、検索サーバ105に検索クエリを送信し、検索を実行する(ステップS805)。検索された文書が削除対象の文書となる。その検索結果を、検索サーバ105より受け取り(ステップS806)、検索結果表示部206より利用者のWebブラウザへ表示させる(ステップS807)。尚、この一連の処理は、ユーザの指定によって行うこともできるし、予め設定しておけば、その日時に自動的に開始されるようにすることもできる(図10参照)。
図9は、図7、図8の検索結果より指定された文書をリスト出力する処理の流れを示すフローチャート図である。保管期限切れの文書検索結果の表示処理(ステップS707)、または、不要文書検索結果の表示処理(ステップS807)で、表示されるWeb画面上で利用者は文書を選択、または、検索条件を指定してその一覧のファイル出力を運用支援サーバ104に指示することができる(ステップS901)。
一覧出力指示として選択した文書または検索条件を受けると、運用支援サーバ104は、その文書リスト出力部207において検索サーバ105で検索を実行し、文書一覧とそのメタデータを取得する(ステップS902、S903)。
次に、ファイル名と取得したメタデータの各項目をカンマ区切りで連結し、1行としCSV形式にする(ステップS904)。これにより、例えば表計算ソフトにより開くことができる。
CSV形式にした文書一覧をファイルとして、利用者のWebブラウザへ送信し(ステップS905)、利用者の確認を促す。
利用者は、取得した文書一覧を削除候補として、確認を行うことができる。また、メール等へ添付し他利用者へ通知することにより、その削除を促すこともできる。
図10は、検索結果より指定された文書を削除する処理の流れを示すフローチャート図である。保管期限切れの文書検索結果の表示処理(ステップS707)、または、不要文書検索結果の表示処理(ステップS807)において、表示されるWeb画面上で利用者は表示されるWeb画面上で文書を選択、または、検索条件で指定して文書削除を運用支援サーバ104に指示することができる(ステップS1001)。
文書削除指示として選択した文書または検索条件を受けると、運用支援サーバ104は、その文書操作部208において検索サーバ105で検索を実行し、文書一覧とそのメタデータを取得する(ステップS1002、S1003)。
次に、取得したメタデータの各項目にタグを付け、XML形式にしてファイルを作成する。この処理は、1文書につき1XMLファイルを作成する処理である(ステップS1004)。
ここで、XMLファイルのファイル名は、対応する文書の拡張子を除いたファイル名にXMLの拡張子“.xml”を付加したものである。
次に、運用支援サーバ104の削除文書格納領域217に、その時点の日付、時刻を基にフォルダを作成する(ステップS1005)。例えば、2009年2月23日15時32分であれば、フォルダ名“200902231532”とする。
続いて、このフォルダの下に削除対象の文書ごとに1つフォルダを作成し、文書とそのメタデータのXMLファイルをコピーする(ステップS1006)。ここで作成するフォルダは1から始まり、1文書コピーするごとに1ずつ増やす。例えば、“提案書A.doc”をフォルダ“200902231532”へコピーする場合、作成するフォルダは“1”であり、その中に“提案書A.doc”と“提案書A.xml”をコピーする。続いて“提案書B.doc”をコピーする場合に作成されるフォルダは“2”であり、その中に“提案書B.doc”と“提案書B.xml”がコピーされる。
削除対象の文書をコピーした後に、ファイルサーバ中の文書を削除する(ステップS1007)。また、削除対象の文書のメタデータをメタデータDB106より削除した後に、検索インデックスをインデックスDB107より削除する(ステップS1008、S1009)。“提案書B.doc”と“提案書B.xml”が、図2の削除文書格納領域217内に一次保管される。これにより、削除した後に、XML文書からファイルを復元することができる。
最後に、削除結果を利用者のWebブラウザへ送信する(ステップS1010)。
以上のように本発明のファイルサーバ運用支援システムによれば、次のような効果がある。
ファイルサーバ中の文書に対し適切な保管期間を設定し、保管期間が切れた文書を削除できるようにすることができる。
また、バックアップや履歴の目的でコピーされた類似名の文書を探し出し、利用者に削除を促すことで、企業のファイルサーバ中の文書数増加を軽減するファイルサーバ運用支援システムを提供することができる。
尚、本実施の形態による類似映像検索装置及び方法は、上述の図示例にのみ限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変更を加え得ることは勿論である。
また、実施の形態で説明した機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより各部の処理を行ってもよい。尚、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、光磁気ディスク等の可搬媒体、ハードディスク等の記憶装置のことをいう。
本発明は、ファイルサーバ運用支援技術として利用可能である。
101…PC(クライアントPC)、102…ファイルサーバ、103…ファイルサーバ運用支援装置、104…運用支援サーバ、105…検索サーバ、106…メタデータデータベース(DB)、107…インデックスデータベース、108…LAN、201…検索画面表示部、202…メタデータ編集画面表示部、203…保管期間判定部、204…類似文書判定部、205…検索クエリ作成部、206…検索結果表示部、207…文書リスト出力部、208…文書操作部、217…削除文書格納領域、209…ファイル探索部、210…ハッシュ値計算部、211…メタデータ抽出部、212…メタデータ記録部、213…インデックス記録部、214…検索実行部、215…メタデータ削除部、216…インデックス削除部、217…削除文書格納領域。

Claims (13)

  1. クライアント端末及び文書を保管するファイルサーバと接続されるファイルサーバ運用支援装置であって、文書ファイル又はフォルダ(以下、文書と称する。)を削除するためのGUIを提供する運用支援サーバと、削除対象の文書の検索を実行する検索サーバ、とから構成されるファイルサーバ運用支援装置において、
    前記運用支援サーバは、前記検索サーバに送信する検索クエリを文書の削除対象条件を基に作成する検索クエリ作成部と、検索結果の文書を前記クライアント端末からの指示により前記ファイルサーバから削除するための文書操作部と、前記ファイルサーバから削除された文書を一時的に保存する削除文書格納部と、を備え、
    前記検索サーバは、対象文書のテキストデータである検索インデックスを作成する対象となる対象文書を前記ファイルサーバから取得するファイル探索部と、文書のメタデータを取得するメタデータ抽出部と、前記運用支援サーバからの要求により前記削除対象条件と前記メタデータとに基づいて削除対象文書の検索を実行する検索実行部と、を備え、
    前記メタデータは、バックアップ目的で作成されたファイル又はフォルダを指定するために正規表現により記述される不要文書定義のデータであり、前記正規表現内にフォルダ名、ファイル名を指定するためのパラメータが含まれるように作成され、
    さらに、前記運用支援サーバは、
    前記文書の前記正規表現で表されることによるフォルダ名又はファイル名の類似性から、前記文書の削除対象条件として不要文書の条件を導出するための類似文書判定部を備えることを特徴とするファイルサーバ運用支援装置。
  2. 正規表現をされた前記メタデータは、バックアップ目的でコピーをとると、コピー元のファイル名が含まれ、コピーである旨の表現とされる文書タイトル毎に指定された日付と文書タイトル毎に決められている文書保管期間であり、前記運用支援サーバは、前記文書の削除対象条件として期限切れの文書の保管期間を算出するための保管期間判定部を備えることを特徴とする請求項1に記載のファイルサーバ運用支援装置。
  3. 前記検索サーバは、取得した文書のメタデータを格納するメタデータDBと、前記メタデータと対応付けられ文書のテキストデータである検索インデックスを格納するインデックスDBと、関連付けされていることを特徴とする請求項1又は2に記載のファイルサーバ運用支援装置。
  4. 前記運用支援サーバからの要求により前記文書の前記メタデータを前記メタデータDBから削除するメタデータ削除部と、
    前記運用支援サーバからの要求により文書の検索インデックスを前記インデクスDBから削除するインデックス削除部と、を備えることを特徴とする請求項3に記載のファイルサーバ運用支援装置。
  5. 前記取得したメタデータの各項目にタグを付け、XML形式にしてファイルを作成し、1文書につき1XMLファイルを作成する処理部を有することを特徴とする請求項1から4までのいずれか1項に記載のファイルサーバ運用支援装置。
  6. 前記1XMLファイルを作成したその時点の日付、時刻を基にフォルダを作成し、前記削除文書格納に格納することを特徴とする請求項5に記載のファイルサーバ運用支援装置。
  7. フォルダの下に削除対象の文書ごとに1つフォルダを作成し、文書とそのメタデータのXMLファイルをコピーすることを特徴とする請求項6に記載のファイルサーバ運用支援装置。
  8. 削除対象の文書をコピーした後に、前記ファイルサーバ中の文書を削除し、削除対象の文書のメタデータを前記メタデータDBより削除した後に、前記検索インデックスをインデックスDB削除することを特徴とする請求項7に記載のファイルサーバ運用支援装置。
  9. クライアント端末と、
    文書を保管するファイルサーバと、
    文書ファイル又はフォルダを削除するためのGUIを提供する運用支援サーバと、削除対象の文書の検索を実行する検索サーバ、とから構成されるファイルサーバ運用支援装置であって、前記運用支援サーバは、前記検索サーバに送信する検索クエリを文書の削除対象条件を基に作成する検索クエリ作成部と、検索結果の文書を前記クライアント端末からの指示により前記ファイルサーバから削除するための文書操作部と、前記ファイルサーバから削除された文書を一時的に保存する削除文書格納部と、を備え、
    前記検索サーバは、対象文書のテキストデータである検索インデックスを作成する対象となる対象文書を前記ファイルサーバから取得するファイル探索部と、前記対象文書のメタデータを取得するメタデータ抽出部と、前記運用支援サーバからの要求により検索を実行する検索実行部と、を有し、
    前記メタデータは、バックアップ目的で作成されたファイル又はフォルダを指定するために正規表現により記述される不要文書定義のデータであり、前記正規表現内にフォルダ名、ファイル名を指定するためのパラメータが含まれるように作成されることを特徴とするファイルサーバ運用支援システム。
  10. 請求項1に記載のファイルサーバ運用支援装置におけるファイルサーバ運用支援方法であって、
    前記クライアント端末に備えられたWebブラウザの画面から日付が指定され、保管期限切れの文書の検索指示を受けるステップと、
    検索指示が出されると、前記運用支援サーバが指定日付よりその年度を算出するステップと、
    前記検索クエリ作成部が、保管期間と削除対象年度を基に前記検索サーバで実行するための検索クエリを作成するステップと、
    検索クエリを作成した後に、前記検索サーバに前記検索クエリを送信し、前記検索サーバに検索を実行させるステップと、
    記検索サーバによる検索結果を受け取るステップと、
    前記クライアント端末へ前記検索結果を送信することで前記クライアント端末のWebブラウザへ表示させるステップと、を備えたことを特徴とするファイルサーバ運用支援方法。
  11. 請求項1に記載のファイルサーバ運用支援装置におけるファイルサーバ運用支援方法であって、
    前記クライアント端末に備えられたWebブラウザの画面からファイル名またはフォルダ名が指定され検索指示を受け取るステップと、
    前記検索クエリ作成部が、ファイル名を指定された場合には、それと類似するファイル名を持つ文書、または、ハッシュ値が同じであり、かつ、ファイルサイズが同じ文書を探すための検索クエリを作成し、フォルダ名を指定された場合には、その指定フォルダ以下で削除候補となる名前のフォルダ中にある文書を探すための検索クエリを作成するステップと、
    前記検索クエリを作成した、前記検索サーバに前記検索クエリを送信し、前記検索サーバに検索を実行させるステップと、
    記検索サーバによる検索結果を受け取るステップと、
    前記クライアント端末へ前記検索結果を送信することで前記クライアント端末のWebブラウザへ表示させるステップと、を備えたことを特徴とするファイルサーバ運用支援方法。
  12. 請求項10又は11に記載の方法をコンピュータに実行させるためのプログラム。
  13. 請求項12に記載のプログラムを記録するコンピュータ読みとり可能な記録媒体。
JP2009081695A 2009-03-30 2009-03-30 ファイルサーバ運用支援装置、方法、プログラム及び記録媒体 Expired - Fee Related JP5399114B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009081695A JP5399114B2 (ja) 2009-03-30 2009-03-30 ファイルサーバ運用支援装置、方法、プログラム及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009081695A JP5399114B2 (ja) 2009-03-30 2009-03-30 ファイルサーバ運用支援装置、方法、プログラム及び記録媒体

Publications (2)

Publication Number Publication Date
JP2010237725A JP2010237725A (ja) 2010-10-21
JP5399114B2 true JP5399114B2 (ja) 2014-01-29

Family

ID=43092019

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009081695A Expired - Fee Related JP5399114B2 (ja) 2009-03-30 2009-03-30 ファイルサーバ運用支援装置、方法、プログラム及び記録媒体

Country Status (1)

Country Link
JP (1) JP5399114B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5912949B2 (ja) * 2012-07-12 2016-04-27 株式会社日立ソリューションズ 業務文書処理システム、及びプログラム
KR101535979B1 (ko) * 2013-06-20 2015-07-27 주식회사 엘지씨엔에스 인터페이스 서비스 방법 및 인터페이스 서버
CN104158854B (zh) * 2014-07-23 2015-11-11 小米科技有限责任公司 资源共享方法及装置
JP6801268B2 (ja) 2016-07-05 2020-12-16 富士通株式会社 テーブル管理装置、テーブル管理方法およびテーブル管理プログラム
JP6834797B2 (ja) * 2017-06-19 2021-02-24 富士通株式会社 抽出プログラム、抽出方法および抽出装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0546451A (ja) * 1991-04-19 1993-02-26 Fuji Xerox Co Ltd フアイル検索装置
JPH07225704A (ja) * 1994-02-10 1995-08-22 Fuji Xerox Co Ltd ファイル管理装置
JPH09128380A (ja) * 1995-10-30 1997-05-16 Matsushita Electric Ind Co Ltd 文書蓄積管理システム
JPH1027116A (ja) * 1996-07-12 1998-01-27 Oki Electric Ind Co Ltd 不要ファイル削除装置
JP2002366410A (ja) * 2001-06-06 2002-12-20 Fujitsu Ltd ごみ箱サーバおよびごみ箱処理プログラム
JP2005258511A (ja) * 2004-03-09 2005-09-22 Hitachi Systems & Services Ltd 電子文書のライフサイクル管理システム
JP2005352687A (ja) * 2004-06-09 2005-12-22 Fuji Xerox Co Ltd 文書検索用プログラム、文書検索システムおよび文書検索方法
JP4978306B2 (ja) * 2007-05-21 2012-07-18 株式会社Jvcケンウッド コンテンツファイル処理装置、コンテンツファイル処理方法及びコンテンツファイル処理プログラム

Also Published As

Publication number Publication date
JP2010237725A (ja) 2010-10-21

Similar Documents

Publication Publication Date Title
US11775666B2 (en) Federated redaction of select content in documents stored across multiple repositories
US11899623B2 (en) Suggesting content items to be accessed by a user
CN101404567B (zh) 用于访问备份数据的方法和计算机系统
US11941344B2 (en) Document differences analysis and presentation
KR101614178B1 (ko) 웹페이지 컨텐츠의 주석처리
US8392677B2 (en) Systems and methods for creating copies of data, such as archive copies
KR101344101B1 (ko) 서버 파일을 서버 파일의 로컬 저장된 카피에 매핑하기위한 방법 및 컴퓨터 판독가능 매체
JP5023715B2 (ja) 情報処理システム、情報処理装置及びプログラム
JP7150830B2 (ja) クライアントデバイスによって実施されるコンテンツ管理システムのワークフロー機能
JP2020513599A (ja) コンテンツ管理システムにおけるタスクの管理
US9864736B2 (en) Information processing apparatus, control method, and recording medium
JP2011065546A (ja) ファイル検索システム及びプログラム
US20080147621A1 (en) Method and system for backup and restoration of content within a blog
JP5407209B2 (ja) 文書管理装置、文書管理プログラム、及び文書管理システム
JPH07175710A (ja) データ管理方法及び装置
JP5072550B2 (ja) 情報処理装置及び情報処理方法及びプログラム
JP2007257629A (ja) 共同で作成されるマスター・ドキュメントにサブ・ドキュメントをマージするためのシステムおよび方法
JP5399114B2 (ja) ファイルサーバ運用支援装置、方法、プログラム及び記録媒体
TWI334091B (en) Data file management and search method and system based on file attributes
US20080162944A1 (en) Information processing apparatus, information processing system, and computer readable storage medium
US20050246387A1 (en) Method and apparatus for managing and manipulating digital files at the file component level
JP2006107375A (ja) 文書管理システム、文書管理方法、プログラムおよび記憶媒体
JP2008181446A (ja) 文書管理装置、情報処理装置、文書管理システム及びプログラム
JP2007148739A (ja) ファイル管理システム及びそのプログラム
JP5783010B2 (ja) インデックス管理プログラム、インデックス管理装置及び検索システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110802

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130326

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130515

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130730

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130910

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131001

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131023

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees