JP2013088931A - Retrieval device, document management method, and document retrieval system - Google Patents

Retrieval device, document management method, and document retrieval system Download PDF

Info

Publication number
JP2013088931A
JP2013088931A JP2011227278A JP2011227278A JP2013088931A JP 2013088931 A JP2013088931 A JP 2013088931A JP 2011227278 A JP2011227278 A JP 2011227278A JP 2011227278 A JP2011227278 A JP 2011227278A JP 2013088931 A JP2013088931 A JP 2013088931A
Authority
JP
Japan
Prior art keywords
folder
file
search
deletion
files
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011227278A
Other languages
Japanese (ja)
Other versions
JP5753056B2 (en
Inventor
Mitsuharu Ohazama
光晴 大峡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Solutions Ltd
Original Assignee
Hitachi Solutions Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Solutions Ltd filed Critical Hitachi Solutions Ltd
Priority to JP2011227278A priority Critical patent/JP5753056B2/en
Publication of JP2013088931A publication Critical patent/JP2013088931A/en
Application granted granted Critical
Publication of JP5753056B2 publication Critical patent/JP5753056B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

PROBLEM TO BE SOLVED: To provide means for detecting and deleting folders including unnecessary files in a file server.SOLUTION: Pieces of information on files and folders in a file server are acquired, the pieces of information on the files and folders are analyzed, a folder which becomes a deletion candidate is detected, and the corresponding folder is explicitly displayed to an operator.

Description

本発明は、検索装置、文書管理方法、及び文書検索システムに関し、例えば、ファイルサーバ内に保存された大量のファイルデータを効率的に整理するための技術に関する。   The present invention relates to a search apparatus, a document management method, and a document search system, for example, a technique for efficiently organizing a large amount of file data stored in a file server.

近年、会社等の組織内において独自のファイルサーバを使う機会が増えている。このような組織内のファイルサーバは、電子データの保存・共有のために利便性が高く、広く普及している。しかし、ファイルサーバの容量は増大しがちであるため、不要なファイルの削除を支援・促進するための技術に対する要求が高まっている。例えば、デジタルデータが爆発的に増大していること(非特許文献1)、企業内ではRDB(Relational Database)に格納されている構造データは全体の2割に過ぎないこと、大半は文書ファイルなどの非構造文書であることなどが調査・報告されている(非特許文献2)。   In recent years, opportunities to use a unique file server in an organization such as a company have increased. Such a file server in an organization is highly convenient and widely used for storing and sharing electronic data. However, since the capacity of the file server tends to increase, there is an increasing demand for technology for supporting / promoting the deletion of unnecessary files. For example, digital data is explosively increasing (Non-Patent Document 1), the structure data stored in the RDB (Relational Database) is only 20% of the whole in the company, most are document files, etc. It has been investigated and reported that it is an unstructured document (Non-patent Document 2).

また、不要なファイルの削除を支援するソフトウェア(非特許文献3乃至5)が提案されている。これらの技術では、最終更新日が古い・最終アクセス日が古い・内容が重複したファイルがある・ファイル名が類似したファイルがあるなどの条件を用い、不要と思われるファイルの提示を行う機能を持つ。これらのファイルについて、自動的なアーカイブ化・削除の機能を持つものや、ファイルを利用しているユーザの確認・了承によりアーカイブ化・削除の機能を持つものがある。   In addition, software (Non-Patent Documents 3 to 5) that supports deletion of unnecessary files has been proposed. With these technologies, there is a function that presents files that are considered unnecessary using conditions such as the last update date is old, the last access date is old, there are files with duplicate contents, and there are files with similar file names. Have. Some of these files have an automatic archiving / deleting function, and others have an archiving / deleting function upon confirmation / approval of the user who uses the file.

J. F. Gantz, et al. The Diverse and Exploding Digital Universe, An IDC White Paper,http://japan.emc.com/collateral/analyst-reports/diverse-exploding-digital-universe.pdfJ. F. Gantz, et al. The Diverse and Exploding Digital Universe, An IDC White Paper, http://japan.emc.com/collateral/analyst-reports/diverse-exploding-digital-universe.pdf S. Grimes, "Unstructured Data and the 80 Percent Rule", Clarabridge Bridgepoints, http://clarabridge.com/default.aspx?tabid=137&ModuleID=635&ArticleID=551S. Grimes, "Unstructured Data and the 80 Percent Rule", Clarabridge Bridgepoints, http://clarabridge.com/default.aspx?tabid=137&ModuleID=635&ArticleID=551 NEC, 文書・コンテンツ管理支援システム, InfoFrame PROCENTER/C, http://www.nec.co.jp/pfsoft/procenter/index.htmlNEC, Document / Content Management Support System, InfoFrame PROCENTER / C, http://www.nec.co.jp/pfsoft/procenter/index.html ジャストシステム, GDMS, http://just-enterprise.com/product/gdms/Justsystem, GDMS, http://just-enterprise.com/product/gdms/ 株式会社日立ソリューションズ, MEANSファイルサーバスリム化ソリューション, http://hitachisoft.jp/products/means/slimserver/Hitachi Solutions, Ltd., MEANS file server slimming solution, http://hitachisoft.jp/products/means/slimserver/

上記既存技術は、いずれも不要と推定されるファイルをユーザに提示し、ユーザに当該ファイルの削除を促すことで、ファイルサーバの使用容量削減を図る機能を持っている。   Each of the above existing technologies has a function of reducing the use capacity of the file server by presenting a file that is estimated to be unnecessary to the user and prompting the user to delete the file.

しかしながら、この方式には主に以下の三つの課題がある。
一つ目の課題は、既存技術はファイル単位で削除候補を示すため、削除候補ファイルの数が膨大であった場合に、ユーザが確認及び削除を行う工数が膨大になってしまうことである。
However, this method has the following three main problems.
The first problem is that the existing technology indicates deletion candidates in units of files, and therefore, when the number of deletion candidate files is enormous, the number of steps for the user to check and delete becomes enormous.

二つ目の課題は、既存技術はファイル単位で削除候補を示すため、削除候補ファイルが格納されているフォルダ内に含まれる別のファイルが残ってしまうことである。一般的に、同一フォルダ内に格納されているファイルは互いに関連を持っているため、一部のファイルのみを削除すると、それ以外のファイルが用途不明の状態で残ってしまうことがあり、不便であるとともに、残ったファイル自体の使用頻度も減る可能性が高い。   The second problem is that another file included in the folder in which the deletion candidate file is stored remains because the existing technology indicates deletion candidates in units of files. In general, files stored in the same folder are related to each other, so if you delete only some files, other files may remain in an unknown state, which is inconvenient. At the same time, there is a high possibility that the frequency of use of the remaining files themselves will be reduced.

三つ目の課題は、既存技術を用いたとしても、個々のファイルの不要の度合いが低くても、フォルダ全体では不要とみなせる場合を検出できないことである。例えば、ファイルサイズによって、ファイルが不要か否かを判定するシステムの場合、閾値を下回るファイルが多数含まれるフォルダを、このシステムでは検出できない。   The third problem is that even if the existing technology is used, even if the degree of unnecessary individual files is low, it is impossible to detect a case where the entire folder can be regarded as unnecessary. For example, in the case of a system that determines whether a file is unnecessary based on the file size, a folder that includes a large number of files that are below a threshold cannot be detected by this system.

本発明はこのような状況に鑑みてなされたものであり、ファイルサーバに格納されたファイル及びフォルダに対して、ファイルのメタデータを利用し、削除候補をフォルダ単位で提示するための技術を提供する。   The present invention has been made in view of such circumstances, and provides a technique for presenting deletion candidates in units of folders using files metadata for files and folders stored in a file server. To do.

上記目的を達成するために、本発明の業務文書検索システムは、ファイルサーバに保存されているフォルダに対して、複数の観点に基づき、削除候補となるフォルダを自動的に検出する削除候補解析手段と、削除候補となるフォルダを、該当する観点の数に応じて表示形態を区別して表示する検索要求手段と、を設けたものである。   In order to achieve the above object, the business document search system of the present invention is a deletion candidate analysis unit that automatically detects a folder that is a deletion candidate for a folder stored in a file server based on a plurality of viewpoints. And a search requesting means for displaying the folders that are candidates for deletion according to the number of corresponding viewpoints with different display forms.

即ち、本発明は、ファイルサーバに接続され、複数のファイルと複数のフォルダの中から所望のデータを検索する検索装置であって、ファイルの不要度を決定するための評価情報であって、異なる複数の項目で構成される評価情報と、検索用の複数のファイル及びフォルダを含む検索用インデックスデータと、を保持する記憶装置と、ファイサーバを巡回し、前記検索用インデックスデータを作成するプロセッサと、を有する。ここで、評価情報は、複数の項目のそれぞれについて、複数のファイルを分類するための複数の閾値を含んでいる。そして、プロセッサは、ファイルサーバを巡回する度に、評価情報における各項目の前記複数の閾値を設定する。また、プロセッサは、評価情報に基づいてファイルの不要度のファイルスコア値を算出し、ファイルの不要度のスコア値に基づいて当該ファイルを含むフォルダの不要度を示すフォルダスコア値を算出する。このフォルダスコア値によって削除候補となるフォルダが検出される。   That is, the present invention is a search device that is connected to a file server and searches for desired data from a plurality of files and a plurality of folders, and is evaluation information for determining the degree of file unnecessary, which is different. A storage device that holds evaluation information composed of a plurality of items; search index data including a plurality of search files and folders; a processor that circulates a file server and creates the search index data; Have. Here, the evaluation information includes a plurality of threshold values for classifying a plurality of files for each of a plurality of items. The processor sets the plurality of threshold values for each item in the evaluation information every time it goes around the file server. Further, the processor calculates a file score value of the degree of unnecessaryness of the file based on the evaluation information, and calculates a folder score value indicating the degree of unnecessaryness of the folder including the file based on the score value of the degree of unnecessaryness of the file. A folder that is a deletion candidate is detected based on the folder score value.

本発明に関連する更なる特徴は、本明細書の記述、添付図面から明らかになるものである。また、本発明の実施形態は、要素及び多様な要素の組み合わせ及び以降の詳細な記述と添付される特許請求の範囲の様態により達成され実現される。   Further features related to the present invention will become apparent from the description of the present specification and the accompanying drawings. Further, the embodiments of the present invention are achieved and realized by elements and combinations of various elements and the following detailed description and appended claims.

本明細書の記述は典型的な例示に過ぎず、本発明の特許請求の範囲又は実施形態を如何なる意味に於いても限定するものではないことを理解する必要がある。   It should be understood that the description herein is merely exemplary and is not intended to limit the claims or embodiments of the invention in any way.

本発明によれば、ファイルサーバに格納されたファイル及びフォルダに対して、ファイルのメタデータを利用し、削除候補をフォルダ単位で提示することができるようになる。   According to the present invention, it is possible to present deletion candidates in units of folders using files metadata for files and folders stored in a file server.

本発明の実施形態による業務文書検索システム(文書処理システム)の概略構成例を示す図である。It is a figure which shows the example of schematic structure of the business document search system (document processing system) by embodiment of this invention. 本発明の実施形態によるフォルダデータのデータ構成例を示す図である。It is a figure which shows the example of a data structure of the folder data by embodiment of this invention. 本発明の実施形態によるファイルデータのデータ構成例を示す図である。It is a figure which shows the data structural example of the file data by embodiment of this invention. 本発明の実施形態による削除観点データのデータ構成例を示す図である。It is a figure which shows the example of a data structure of the deletion viewpoint data by embodiment of this invention. 本発明の実施形態によるファイルサーバ巡回プログラムにおいて実行される動作例を説明するフローチャートである。It is a flowchart explaining the operation example performed in the file server patrol program by embodiment of this invention. 本発明の実施形態による削除候補解析プログラムにおいて実行される動作例を説明するフローチャートである。It is a flowchart explaining the operation example performed in the deletion candidate analysis program by embodiment of this invention. 本発明の実施形態による検索要求プログラムにおいて実行される動作例を説明するフローチャートである。It is a flowchart explaining the operation example performed in the search request program by embodiment of this invention. 本発明の実施形態による検索要求画面での検索結果の表示内容を例示する図である。It is a figure which illustrates the display content of the search result on the search request | requirement screen by embodiment of this invention.

以下、添付図面を参照して本発明の実施形態について説明する。添付図面では、機能的に同じ要素は同じ番号で表示される場合もある。なお、添付図面は本発明の原理に則った具体的な実施形態と実装例を示しているが、これらは本発明の理解のためのものであり、決して本発明を限定的に解釈するために用いられるものではない。   Hereinafter, embodiments of the present invention will be described with reference to the accompanying drawings. In the accompanying drawings, functionally identical elements may be denoted by the same numbers. The accompanying drawings show specific embodiments and implementation examples according to the principle of the present invention, but these are for understanding the present invention and are not intended to limit the present invention. Not used.

本実施形態では、当業者が本発明を実施するのに十分詳細にその説明がなされているが、他の実装・形態も可能で、本発明の技術的思想の範囲と精神を逸脱することなく構成・構造の変更や多様な要素の置き換えが可能であることを理解する必要がある。従って、以降の記述をこれに限定して解釈してはならない。   This embodiment has been described in sufficient detail for those skilled in the art to practice the present invention, but other implementations and configurations are possible without departing from the scope and spirit of the technical idea of the present invention. It is necessary to understand that the configuration and structure can be changed and various elements can be replaced. Therefore, the following description should not be interpreted as being limited to this.

更に、本発明の実施形態は、後述されるように、汎用コンピュータ上で稼動するソフトウェアで実装しても良いし専用ハードウェア又はソフトウェアとハードウェアの組み合わせで実装しても良い。   Furthermore, as will be described later, the embodiment of the present invention may be implemented by software running on a general-purpose computer, or may be implemented by dedicated hardware or a combination of software and hardware.

なお、以後の説明では「テーブル」形式によって本発明の各情報について説明する(図2及び3)が、これら情報は必ずしもテーブルによるデータ構造で表現されていなくても良く、リスト、DB、キュー等のデータ構造やそれ以外で表現されていても良い。そのため、データ構造に依存しないことを示すために「テーブル」、「リスト」、「DB」、「キュー」等について単に「情報」と呼ぶことがある。   In the following description, each information of the present invention will be described in a “table” format (FIGS. 2 and 3). However, these information may not necessarily be represented by a data structure of a table, such as a list, DB, queue, etc. It may be expressed in the data structure or other than that. Therefore, “table”, “list”, “DB”, “queue”, etc. may be simply referred to as “information” to indicate that they do not depend on the data structure.

以下では「プログラム」を主語(動作主体)として本発明の実施形態における各処理について説明を行うが、プログラムはプロセッサによって実行されることで定められた処理をメモリ及び通信ポート(通信制御装置)を用いながら行うため、プロセッサを主語とした説明としてもよい。また、プログラムの一部または全ては専用ハードウェアで実現してもよく、また、モジュール化されていても良い。各種プログラムはプログラム配布サーバや記憶メディアによって本発明のシステムにインストールされてもよい。   In the following, each process in the embodiment of the present invention will be described using “program” as a subject (operation subject). However, a program is executed by a processor and a process determined by a memory and a communication port (communication control device). Since it is performed while being used, the description may be made with the processor as the subject. A part or all of the program may be realized by dedicated hardware or may be modularized. Various programs may be installed in the system of the present invention by a program distribution server or a storage medium.

<業務文書検索システムの構成及び機能>
以下、本発明を実施する場合の第1の実施形態を、図面を用いて詳細に説明する。図1は、本発明に係る実施形態における、業務文書検索システム(「文書検索システム」と言うこともできる)100の概略構成を示す図である。
<Configuration and function of business document search system>
Hereinafter, a first embodiment for carrying out the present invention will be described in detail with reference to the drawings. FIG. 1 is a diagram showing a schematic configuration of a business document search system (also referred to as a “document search system”) 100 according to an embodiment of the present invention.

業務文書検索システム100は、検索サーバ1と、クライアント3と、ファイルサーバ4と、を有し、それらがLAN(Local Area Network)等の有線又は無線の通信回線9により通信可能に接続されたシステムである。ここで、検索サーバ1、ファイルサーバ4及びクライアント3はそれぞれ1台ずつ図示しているが、それぞれ2台以上存在していてもよい。また、通信回線9はLANに限定されるものではなく、例えばWAN(Wide Area Network)やインターネットとすることもできるし、これらの組み合わせとすることもできる。   The business document search system 100 includes a search server 1, a client 3, and a file server 4, which are communicably connected via a wired or wireless communication line 9 such as a LAN (Local Area Network). It is. Here, one search server 1, one file server 4, and one client 3 are illustrated, but two or more of each may exist. Further, the communication line 9 is not limited to the LAN, and may be, for example, a WAN (Wide Area Network), the Internet, or a combination thereof.

以上のような構成により、後に詳述するように、検索サーバ1は、ファイルサーバ4に記憶されているファイル名等を収集して、フォルダデータ21及びファイルデータ22を作成して記憶しておくことができる。(以下、フォルダデータ21及びファイルデータ22を「インデックス」または「インデックスデータ」と呼ぶことがある。)そして、クライアント3は、検索サーバ1にファイル検索要求(以下「検索要求」と略記することがある。)を送信し、検索サーバ1は上述のインデックスデータを参照してファイル検索を行い、クライアント3にファイル検索結果(以下「検索結果」と略記することがある。)を送信することができる。   With the above configuration, as will be described in detail later, the search server 1 collects file names and the like stored in the file server 4 and creates and stores folder data 21 and file data 22. be able to. (Hereinafter, the folder data 21 and the file data 22 may be referred to as “index” or “index data”.) Then, the client 3 may be abbreviated to the search server 1 as a file search request (hereinafter referred to as “search request”). The search server 1 can search the file by referring to the above-mentioned index data, and can transmit a file search result (hereinafter sometimes abbreviated as “search result”) to the client 3. .

(i)クライアント3の構成・機能
クライアント3は、PC(Personal Computer)等の計算機によって構成され、入力装置32と、出力装置33と通信可能に接続されている。入力装置32は、キーボード、マウス等の装置であり、クライアント3の操作者は入力装置32を操作することで、クライアント3が実行するべき処理を指示することができる。すなわち入力装置32は、クライアント3の入力手段として機能する。出力装置33は、液晶ディスプレイ、プリンタ等の装置であり、クライアント3が実行した処理の結果等を表示あるいは印刷出力する。すなわち出力装置33はクライアント3の表示手段及び/又は出力手段として機能する。また、図示していないが、クライアント3は磁気ディスク等からなる記憶装置を内蔵、あるいは外部接続している。記憶装置と、図示していないがクライアント3の主記憶装置等は、クライアント3の記憶手段として機能する。
(I) Configuration and Function of Client 3 The client 3 is configured by a computer such as a PC (Personal Computer), and is connected to the input device 32 and the output device 33 so as to communicate with each other. The input device 32 is a device such as a keyboard or a mouse, and the operator of the client 3 can instruct a process to be executed by the client 3 by operating the input device 32. That is, the input device 32 functions as input means for the client 3. The output device 33 is a device such as a liquid crystal display or a printer, and displays or prints out the result of processing executed by the client 3. That is, the output device 33 functions as a display unit and / or an output unit of the client 3. Although not shown, the client 3 has a built-in or externally connected storage device such as a magnetic disk. The storage device and the main storage device of the client 3 (not shown) function as storage means of the client 3.

クライアント3は、図示していないCPU(Central Processing Unit)及び主記憶装置等を有し、当該CPUは、図示していないが、記憶装置に記憶されている検索要求プログラム31等のプログラムを主記憶装置上にローディングし、その命令コードを実行することで各種の処理を実行する。また、CPUは、検索要求プログラム31等の応用プログラムの命令コードを実行する際、OS(Operating System)等のプログラムの命令コードも実行する場合がある。以上のようなプログラム実行にかかわる技術は周知であるので、以降の説明および図面においては、プログラム実行に係る説明が煩雑になるのを避けるため、検索要求プログラム31等が主体となって処理を実行するかのように記載する。なお、各プログラムの機能を電子装置または電子装置とファームウェアの組合せ等で実現することも可能である。   The client 3 has a CPU (Central Processing Unit) and a main storage device that are not shown, and the CPU stores a program such as a search request program 31 stored in the storage device that is not shown. Various processes are executed by loading on the apparatus and executing the instruction code. Further, when executing the instruction code of an application program such as the search request program 31, the CPU may also execute the instruction code of a program such as an OS (Operating System). Since the technique related to the program execution as described above is well known, in the following explanation and drawings, the search request program 31 and the like are mainly executed in order to avoid complicated explanation of the program execution. Describe as if. Note that the function of each program can be realized by an electronic device or a combination of an electronic device and firmware.

検索要求プログラム31は、クライアント3の操作者が入力装置32によって入力した削除候補フォルダ解析指示(例えば、後述の処理によりファイルサーバ内の不要と推定されるフォルダの解析を要求するための指示)や、削除指示(例えば、フォルダ名が「バックアップ」であるフォルダの削除を要求するための指示)を受けて、検索サーバ1に削除要求を送信する。また、検索サーバ1がクライアント3に送信した削除候補フォルダ解析結果及び各フォルダ内のファイル情報を受信し、出力装置33に表示する。検索要求プログラム31は、実施形態1に係わる独自のプログラムであってもよいし、例えばWEBブラウザであってもよい。WEBブラウザを検索要求プログラム31として使用する場合、後述する検索サーバ1の検索プログラム13は、例えばWEBアプリケーションとすればよい。   The search request program 31 is a deletion candidate folder analysis instruction (for example, an instruction for requesting analysis of a folder estimated to be unnecessary in the file server by a process described later) input by the operator of the client 3 using the input device 32, In response to a deletion instruction (for example, an instruction for requesting deletion of a folder whose folder name is “backup”), a deletion request is transmitted to the search server 1. Further, the deletion candidate folder analysis result and the file information in each folder transmitted from the search server 1 to the client 3 are received and displayed on the output device 33. The search request program 31 may be a unique program according to the first embodiment, or may be a WEB browser, for example. When a WEB browser is used as the search request program 31, the search program 13 of the search server 1 to be described later may be a WEB application, for example.

(ii)ファイルサーバ4の構成・機能
ファイルサーバ4は、PC等の計算機によって構成され、記憶装置42と通信可能に接続されている。記憶装置42は、磁気ディスク等の装置であり、ファイルサーバ4に内蔵され又は外部接続される。図1では、1台の記憶装置42がファイルサーバ4に接続されているかのように例示しているが、実際には、むしろ2台以上の記憶装置42がファイルサーバ4に接続されることが多く、また、2台以上の記憶装置42が2台以上のファイルサーバ4に、切り替え可能に接続されることも多い。
(Ii) Configuration / Function of File Server 4 The file server 4 is configured by a computer such as a PC and is connected to the storage device 42 so as to be communicable. The storage device 42 is a device such as a magnetic disk, and is built in the file server 4 or connected externally. In FIG. 1, an example is shown as if one storage device 42 is connected to the file server 4, but actually, two or more storage devices 42 may rather be connected to the file server 4. In many cases, two or more storage devices 42 are connected to two or more file servers 4 in a switchable manner.

記憶装置42は、さまざまなファイルを記憶している。図1では、ファイルのうち後述する検索サーバ1がインデックス作成対象とするものを、「検索対象ファイル43」と記述しているが、検索対象ファイル43という特定のファイルが存在するのではない。検索対象ファイル43は、例えば記憶装置42に記憶されている全てのファイルであってもよいし、あるいは、特定のフォルダ内の全てのファイル等、記憶装置42に記憶されている一部のファイルであってもよい。   The storage device 42 stores various files. In FIG. 1, a file to be indexed by the search server 1 described later is described as “search target file 43”, but a specific file called the search target file 43 does not exist. The search target file 43 may be, for example, all files stored in the storage device 42, or a part of files stored in the storage device 42 such as all files in a specific folder. There may be.

ファイルサーバ4は、ファイル管理プログラム41を有している。ファイル管理プログラム41は、検索対象ファイル43を含め、記憶装置42に記憶されているファイルの記憶位置等を管理する。また、ファイル管理プログラム41は、検索サーバ1からファイルの格納場所等を受信し、当該格納場所に記憶された検索対象ファイル43等を読み込み、当該ファイルの記憶内容を検索サーバ1に送信する機能も有している。   The file server 4 has a file management program 41. The file management program 41 manages the storage location and the like of files stored in the storage device 42 including the search target file 43. The file management program 41 also has a function of receiving the storage location of the file from the search server 1, reading the search object file 43 stored in the storage location, and transmitting the storage content of the file to the search server 1. Have.

(iii)検索サーバ1の構成・機能
検索サーバ1は、PC等の計算機で構成され、記憶装置2と通信可能に接続されている。記憶装置2は磁気ディスク等の装置で構成され、ファイルサーバ1に内蔵され又は外部接続される。図1では、1台の記憶装置2が検索サーバ1に接続されているかのように例示しているが、2台以上であってもよい。記憶装置2と、図示していないがファイルサーバ1の主記憶装置等は、ファイルサーバ1の記憶手段として機能する。
(Iii) Configuration / Function of Search Server 1 The search server 1 is composed of a computer such as a PC and is connected to the storage device 2 so as to be communicable. The storage device 2 is constituted by a device such as a magnetic disk, and is built in the file server 1 or connected externally. In FIG. 1, an example is shown as if one storage device 2 is connected to the search server 1, but there may be two or more. The storage device 2 and the main storage device of the file server 1 (not shown) function as storage means of the file server 1.

記憶装置2は、フォルダデータ21、ファイルデータ22及び削除観点データ23を記憶している。これらのファイルの記憶内容等については、以降の検索サーバ1の機能説明と合わせて説明する。   The storage device 2 stores folder data 21, file data 22, and deletion viewpoint data 23. The contents stored in these files will be described together with the functional description of the search server 1 hereinafter.

また、検索サーバ1は、ファイルサーバ巡回プログラム11、削除候補解析プログラム12、及び検索プログラム13を有している。   The search server 1 has a file server patrol program 11, a deletion candidate analysis program 12, and a search program 13.

ファイルサーバ巡回プログラム11は、例えば毎日同じ時刻、一定時間毎(周期的)、或いはユーザが設定した時刻(必ずしも周期的である必要はない)等の所定のタイミングで、検索対象ファイル43を参照し、フォルダデータ21及びファイルデータ22を作成する。フォルダデータ21には、後述するように、フォルダのパス、当該フォルダの下位階層のフォルダのリスト、当該フォルダに格納されているファイルのリスト、及び不要フォルダか否かを判定する際に用いる削除フラグ等が記憶される。ファイルデータ22には、後述するように、ファイルのパス、ファイル名、ファイルサイズ、ファイルの更新日、及びファイルの参照回数等が記憶される。   The file server patrol program 11 refers to the search target file 43 at a predetermined timing such as the same time every day, every predetermined time (periodic), or a time set by the user (not necessarily periodic). The folder data 21 and the file data 22 are created. As will be described later, the folder data 21 includes a folder path, a list of folders below the folder, a list of files stored in the folder, and a deletion flag used when determining whether or not the folder is an unnecessary folder. Etc. are memorized. As will be described later, the file data 22 stores a file path, file name, file size, file update date, file reference count, and the like.

記憶装置42内のどのファイルを検索対象ファイル43とするかについては、図示していないが、例えば、予め記憶装置2に記憶装置42のファイルパス(“/etc/usr1/”等)を1以上記憶しておき、当該ファイルパス配下のファイルを検索対象ファイル43とすることができる。なお、記憶装置42が2台以上存在する場合等には、当該ファイルパスがどの記憶装置上に存在するか等も含めて記憶しておけばよい。以上のようにフォルダデータ21及びファイルデータ22を作成することで、フォルダデータ21及びファイルデータ22を参照してファイル及びフォルダの検索を行うことが可能になり、検索の都度、検索対象ファイル43を参照する必要がなくなるので、検索に要する処理時間を短縮することができる。   Although it is not shown which file in the storage device 42 is the search target file 43, for example, one or more file paths (“/ etc / usr1 /”, etc.) of the storage device 42 are stored in the storage device 2 in advance. The file under the file path can be stored as the search target file 43. When there are two or more storage devices 42, etc., the storage device including the storage device on which the file path exists may be stored. By creating the folder data 21 and the file data 22 as described above, it becomes possible to search for a file and a folder with reference to the folder data 21 and the file data 22. Since there is no need to refer to it, the processing time required for the search can be shortened.

なお、以上のように、フォルダデータ21及びファイルデータ22を参照して所望のファイル或いはフォルダを検索する場合、フォルダデータ21及びファイルデータ22(インデックス)作成後に検索対象ファイル43が削除された、あるいは変更されることがある。例えばファイル名が「作業報告」であるファイルについてフォルダデータ21及びファイルデータ22が作成された後、当該ファイルが削除された場合等である。このような場合、フォルダデータ21及びファイルデータ22を検索すると、検索対象ファイル43を検索した場合とは異なる検索結果が得られることになる。これは、フォルダデータ21及びファイルデータ22を参照するとファイル名が「作業報告」のファイルが存在しているように見えるが、検索対象ファイル43には存在していないからである。そこで、前述したように、ファイルサーバ巡回プログラム11は、例えば毎日同じ時刻等の所定のタイミングで処理を行うようにすることができる。このようにすることで、フォルダデータ21及びファイルデータ22が定期的に更新され、検索対象ファイル43と大きく乖離することを防ぐことができる。   As described above, when a desired file or folder is searched with reference to the folder data 21 and the file data 22, the search target file 43 is deleted after the folder data 21 and the file data 22 (index) are created, or Subject to change. For example, when the folder data 21 and the file data 22 are created for the file whose file name is “work report”, the file is deleted. In such a case, when the folder data 21 and the file data 22 are searched, a search result different from that when the search target file 43 is searched is obtained. This is because when the folder data 21 and the file data 22 are referred to, it appears that a file with the file name “work report” exists, but does not exist in the search target file 43. Therefore, as described above, the file server patrol program 11 can perform processing at a predetermined timing such as the same time every day. By doing so, it is possible to prevent the folder data 21 and the file data 22 from being regularly updated and greatly deviated from the search target file 43.

そして、ファイルサーバ巡回プログラム11が処理を行うタイミングの間隔を短くすることで(例えば、1時間おきに処理を行うようにすることで)、フォルダデータ21及びファイルデータ22と検索対象ファイル43の乖離を、より小さくすることができる。ただし、ファイルサーバ巡回プログラム11が処理を行うタイミングの間隔を短くするということは、検索対象ファイル43の全ファイルに対するIOが発生する間隔も短くなるということなので、ファイルサーバ4の性能等も考慮した上で、ファイルサーバ巡回プログラム11が処理を行うタイミングの間隔を決める必要がある。例えば、検索対象ファイル43においてファイルの追加或いは削除が発生したことをファイルサーバ4から検索サーバ1に通知し、その通知に応答して、ファイルサーバ巡回プログラム11による処理のタイミングが決定されるようにしても良い。   Then, by shortening the interval of timing when the file server patrol program 11 performs processing (for example, by performing processing every hour), the difference between the folder data 21 and the file data 22 and the search target file 43 is determined. Can be made smaller. However, shortening the interval of the timing at which the file server patrol program 11 performs processing also shortens the interval at which IO is generated for all files of the search target file 43, so the performance of the file server 4 is also taken into consideration. In the above, it is necessary to determine the timing interval at which the file server patrol program 11 performs processing. For example, the file server 4 notifies the search server 1 that a file has been added or deleted in the search target file 43, and the timing of processing by the file server patrol program 11 is determined in response to the notification. May be.

削除候補解析プログラム12は、検索サーバ1がクライアント3からの削除候補解析開始要求(後述の図8において、削除候補フォルダ解析ボタン806が押下されたことにより起動要求が出される)を受信した場合に起動される。そして、削除候補解析プログラム12は、フォルダデータ21及びファイルデータ22を基に、削除候補となるフォルダを判定する。より具体的には、削除候補解析プログラム12は、フォルダデータ21内に格納されている、当該フォルダ内の格納ファイルリストに記載の各ファイルを解析し、当該フォルダの不要の度合いを判定しフォルダ不要度215を更新する。また、削除候補解析プログラム12は、フォルダ不要度215に基づいてフォルダ表示形態216を更新する。   The deletion candidate analysis program 12 receives the deletion candidate analysis start request from the client 3 (the activation request is issued when the deletion candidate folder analysis button 806 is pressed in FIG. 8 described later) from the client 3. It is activated. Then, the deletion candidate analysis program 12 determines a folder that is a deletion candidate based on the folder data 21 and the file data 22. More specifically, the deletion candidate analysis program 12 analyzes each file described in the stored file list in the folder stored in the folder data 21, determines the degree of unnecessary folder, and does not need the folder. The degree 215 is updated. Further, the deletion candidate analysis program 12 updates the folder display form 216 based on the folder unnecessary degree 215.

不要か否かを判定するための条件は、削除観点データ23に記載されている。削除観点データ23は、削除観点データを一意に特定・識別するための情報である削除観点ID231と、当該削除観点の不要の度合いを決定する際に用いる条件(閾値)A232、条件(閾値)B233、条件(閾値)C234、及び条件(閾値)D235と、を構成情報として含んでいる。当該削除観点データ23の詳細については後述する。   Conditions for determining whether or not they are unnecessary are described in the deletion viewpoint data 23. The deletion viewpoint data 23 includes a deletion viewpoint ID 231 that is information for uniquely identifying and identifying the deletion viewpoint data, a condition (threshold value) A232 and a condition (threshold value) B233 used when determining the degree of unnecessary deletion viewpoint data. , Condition (threshold) C234 and condition (threshold) D235 are included as configuration information. Details of the deletion viewpoint data 23 will be described later.

検索プログラム13は、検索サーバ1がクライアント3からの検索要求を受信した場合に起動され、ファイル検索を実行する。具体的には、フォルダデータ21とファイルデータ22の一方又は両方を参照して、検索要求の検索条件式に合致するファイルが存在するかどうか判定し、存在する場合には、合致したファイルのファイル名等からなる検索結果をクライアント3に送信する。   The search program 13 is activated when the search server 1 receives a search request from the client 3 and executes a file search. Specifically, it is determined whether or not there is a file that matches the search condition expression of the search request by referring to one or both of the folder data 21 and the file data 22, and if so, the file of the matched file A search result including a name and the like is transmitted to the client 3.

検索プログラム13は、検索対象ファイル43をフォルダデータ21及びファイルデータ22に記憶された文書を含むフォルダのうち、不要の度合いが強いもの(必要度が低いもの)をより強調して、ツリー状の階層を作成する機能(以下「仮想分類機能」という。)を有している。当該仮想分類機能を実行する際には、フォルダデータ21が参照される。   The search program 13 emphasizes the search target file 43 that is strongly unnecessary (those with a low necessity) out of the folders including the documents stored in the folder data 21 and the file data 22, and has a tree shape. It has a function of creating a hierarchy (hereinafter referred to as “virtual classification function”). When executing the virtual classification function, the folder data 21 is referred to.

<フォルダデータの構成及び機能>
図2は、本発明の実施形態によるフォルダデータ21のデータ構成例を示す図である。フォルダデータ21には、検索対象ファイル43が格納されるフォルダの情報が格納される。
<Configuration and function of folder data>
FIG. 2 is a diagram showing a data configuration example of the folder data 21 according to the embodiment of the present invention. The folder data 21 stores information on the folder in which the search target file 43 is stored.

フォルダデータ21の1レコード210は、フォルダのパス211と、当該フォルダの下位階層のフォルダのリストである下位フォルダリスト212と、当該フォルダに格納されているファイル(下位階層にフォルダがある場合には当該下位階層フォルダ(「下位フォルダ」とも言う)に含まれるファイルは除かれる)のリストである格納ファイルリスト213と、当該フォルダ以下に削除候補となるフォルダを含むか否かを示す削除候補フォルダ保持フラグ214と、当該フォルダの不要の度合いを表すフォルダ不要度215と、クライアント画面における当該フォルダの表示形態を決定する際に用いるフォルダ表示形態216の各データ項目と、を構成項目として含んでいる。   One record 210 of the folder data 21 includes a folder path 211, a lower folder list 212 that is a list of folders in the lower hierarchy of the folder, and files stored in the folder (if there is a folder in the lower hierarchy) A storage file list 213 that is a list of files included in the lower-level folder (also referred to as “lower-level folder” is excluded), and a deletion candidate folder that indicates whether or not a folder that is a deletion candidate is included under the folder The configuration item includes a flag 214, a folder unnecessary degree 215 indicating the degree of unnecessaryness of the folder, and each data item of the folder display form 216 used when determining the display form of the folder on the client screen.

パス211には、当該フォルダの絶対パス、例えば“/ 部内共用 / バックアップ”が設定される。   In the path 211, an absolute path of the folder, for example, “/ internal sharing / backup” is set.

下位フォルダリスト212には、当該フォルダの下位階層に格納されているフォルダ群のパスが列挙されたリスト、例えば[“/ 部内共用 / バックアップ / 動画”, “/ 部内共用 / バックアップ / 報告書”, “/ 部内共用 / バックアップ / 開発資料”]が設定される。   The lower folder list 212 is a list in which the paths of folders stored in the lower hierarchy of the folder are listed, for example, [“/ internal sharing / backup / video”, “/ internal sharing / backup / report”, “/ Shared within departments / backup / development material”] is set.

格納ファイルリスト213には、当該フォルダに格納されているファイル群のファイル名が列挙されたリスト、例えば[“プロモーションビデオA.avi”,“プロモーションビデオB.avi”, “Readme.txt”]が設定される。   The stored file list 213 includes a list in which the file names of files stored in the folder are listed, for example, [“Promotion video A.avi”, “Promotion video B.avi”, “Readme.txt”]. Is set.

削除候補フォルダ保持フラグ214には、当該フォルダの下位階層に、削除候補となるフォルダを含むか否かを示すフラグが格納される。削除候補となるフォルダを含む場合はtrue、含まない場合はfalseが設定される。本発明の実施形態では、後述するクライアント画面(図8)において、削除候補のフォルダ、または、下位階層に削除候補のフォルダを含むフォルダを表示する。その際の表示形態の一部を決定するために削除候補保持フラグ214が使用される。クライアント画面(図8)を生成して表示画面上に表示する場合、下位に削除候補のフォルダ(下位階層フォルダ)を有する上位階層フォルダを表示せずに、当該削除候補の下位階層フォルダのみを表示してもフォルダ間の相対的な関係が分からない。このため、当該上位階層フォルダも表示するようにしている。そして、このような表示を実現するために、上記削除候補フォルダ保持フラグ214が必要となるのである。   The deletion candidate folder holding flag 214 stores a flag indicating whether or not a folder that is a deletion candidate is included in a lower hierarchy of the folder. Set to true if a folder that is a deletion candidate is included, false otherwise. In the embodiment of the present invention, a deletion candidate folder or a folder including a deletion candidate folder in a lower hierarchy is displayed on a client screen (FIG. 8) described later. In order to determine a part of the display form at that time, the deletion candidate holding flag 214 is used. When the client screen (Fig. 8) is generated and displayed on the display screen, only the lower layer folder of the deletion candidate is displayed without displaying the upper layer folder having the deletion candidate folder (lower layer folder) below. But I don't know the relative relationship between folders. For this reason, the upper hierarchy folder is also displayed. In order to realize such a display, the deletion candidate folder holding flag 214 is necessary.

フォルダ不要度215には、当該フォルダの不要の度合いを数値化した値が格納される。初期値は0であり、数値が大きいほど不要の度合いが高い(必要度が低い)ことを表す。この値は後述する削除候補解析処理によって算出される。   The folder unnecessary degree 215 stores a value obtained by quantifying the degree of necessity of the folder. The initial value is 0, and the larger the numerical value, the higher the degree of unnecessaryness (the lower the degree of necessity). This value is calculated by a deletion candidate analysis process described later.

フォルダ表示形態216には、クライアント画面における当該フォルダの表示形態(図8におけるフォルダの濃さや色)を表す数値が格納される。初期値は0で、例えば0から4の整数が格納される。フォルダ表示形態216は、フォルダ不要度215と関連しており、表示形態0は当該フォルダのフォルダ不要度215が0の場合に対応し、削除候補ではないことを表す。フォルダ不要度215が大きくなるにつれてフォルダ表示形態216も大きな値が段階的に設定されることになる。   The folder display form 216 stores a numerical value representing the display form of the folder on the client screen (folder density and color in FIG. 8). The initial value is 0, for example, an integer from 0 to 4 is stored. The folder display form 216 is related to the folder unnecessary degree 215, and the display form 0 corresponds to the case where the folder unnecessary degree 215 of the folder is 0, and represents that it is not a deletion candidate. As the folder unnecessary degree 215 increases, the folder display form 216 is also set to a large value step by step.

<ファイルデータの構成及び機能>
図3は、本発明の実施形態による、ファイルデータ22のデータ構成例を示す図である。ファイルデータ22には、検索対象ファイル43における、個々のファイルの情報が格納される。
<Configuration and function of file data>
FIG. 3 is a diagram showing a data configuration example of the file data 22 according to the embodiment of the present invention. The file data 22 stores information on individual files in the search target file 43.

ファイルデータ22の1レコード220は、当該ファイルのパス221と、当該ファイルのファイル名222と、当該ファイルのファイルサイズ223と、当該ファイルの更新日224と、当該ファイルの参照回数225と、当該ファイルのファイルサイズ不要度226と、当該ファイルの更新日不要度227と、当該ファイルの参照回数不要度228と、各削除観点を総合した当該ファイルのファイル不要度229と、を構成項目として含んでいる。   One record 220 of the file data 22 includes a path 221 of the file, a file name 222 of the file, a file size 223 of the file, an update date 224 of the file, a reference count 225 of the file, and the file The file size unnecessary degree 226, the update date unnecessary degree 227 of the file, the reference frequency unnecessary degree 228 of the file, and the file unnecessary degree 229 of the file in which each deletion viewpoint is integrated are included as configuration items. .

パス221には、当該ファイルが格納されているフォルダの絶対パス、例えば“/ 部内共用 / バックアップ”が設定される。
ファイル名222には、当該ファイルのファイル名、例えば“保存用.zip”が設定される。
In the path 221, an absolute path of a folder in which the file is stored, for example, “/ internal sharing / backup” is set.
In the file name 222, a file name of the file, for example, “for saving.zip” is set.

ファイルサイズ223には、当該ファイルのファイルサイズ、例えば“27,328”が設定される。なお数値の単位は適宜変更可能である。実施形態では単位をメガバイト(MB)とした。
更新日224には、当該ファイルの更新日、例えば“2004.03.02”が設定される。
In the file size 223, the file size of the file, for example, “27,328” is set. The unit of numerical values can be changed as appropriate. In the embodiment, the unit is megabyte (MB).
In the update date 224, the update date of the file, for example, “2004.03.02” is set.

参照回数225には、当該ファイルの参照回数、例えば“125”が設定される。なお、参照回数とは、ユーザが当該ファイルを実行した回数を表す。   In the reference count 225, the reference count of the file, for example, “125” is set. Note that the reference count represents the number of times the user has executed the file.

ファイルサイズ不要度226、更新日不要度227、及び参照回数不要度228には、それぞれ、ファイルサイズ、更新日、参照回数の観点での当該ファイルの不要の度合いを数値化した値が格納される。初期値は0で、0から4の整数が格納される。0は不要の度合いが0(必要度が高い)、すなわち当該ファイルが当該削除観点において削除候補ではないことを表す。数値が大きいほど不要の度合いが高い(必要度が低い)ことを意味している。不要の度合いを示す”観点”はここで列挙したものに限られず、別の要素を用いても良い。   The file size unnecessary degree 226, the update date unnecessary degree 227, and the reference number unnecessary degree 228 respectively store values obtained by quantifying the degree of unnecessaryness of the file in terms of the file size, the update date, and the reference number. . The initial value is 0, and an integer from 0 to 4 is stored. 0 indicates that the degree of unnecessary is 0 (the degree of necessity is high), that is, the file is not a deletion candidate in the deletion viewpoint. The larger the numerical value, the higher the degree of unnecessaryness (the lower the degree of necessity). The “viewpoint” indicating the degree of unnecessaryness is not limited to those listed here, and other elements may be used.

ファイル不要度229には、ファイルサイズ不要度226、更新日不要度227、参照回数不要度228を総合して決定される当該ファイルの不要の度合いを数値化した値が格納される。初期値は0で、例えば0から12の整数が格納される。ファイル不要度229は、ファイルサイズ不要度226、更新日不要度227、及び参照回数不要度228を加算した値が格納される。様々な観点で不要度を評価するので、ファイルサーバ4に含まれるファイルが不要か否か、正確に把握することが可能となる。   The file unnecessary degree 229 stores a value obtained by quantifying the degree of unnecessaryness of the file determined by combining the file size unnecessary degree 226, the update date unnecessary degree 227, and the reference number unnecessary degree 228. The initial value is 0, for example, an integer from 0 to 12 is stored. In the file unnecessary degree 229, a value obtained by adding the file size unnecessary degree 226, the update date unnecessary degree 227, and the reference number unnecessary degree 228 is stored. Since the unnecessary degree is evaluated from various viewpoints, it is possible to accurately grasp whether or not the file included in the file server 4 is unnecessary.

<削除観点データの構成>
図4は、本発明の実施形態による、削除観点データ23のデータ構成例を示す図である。削除観点データ23は、前述したように、フォルダが削除候補であるか否かを判定する際に使用される情報が格納される。
<Configuration of deletion perspective data>
FIG. 4 is a diagram showing a data configuration example of the deletion viewpoint data 23 according to the embodiment of the present invention. As described above, the deletion viewpoint data 23 stores information used when determining whether or not a folder is a deletion candidate.

削除観点データ23の1レコード230は、削除観点データを一意に特定・識別するための情報を表す削除観点ID231と、条件A232、条件B233、条件C234、条件D235、及び条件E236と、を構成項目として含んでいる。ここでは条件がA乃至Eの5つのみ示されているがこれよりも多くても少なくても構わない。   One record 230 of the deletion viewpoint data 23 includes a deletion viewpoint ID 231 representing information for uniquely identifying and identifying the deletion viewpoint data, a condition A232, a condition B233, a condition C234, a condition D235, and a condition E236. Includes as. Here, only five conditions A to E are shown, but more or less conditions may be used.

削除観点ID231は、各削除観点データを一意に特定・識別するための情報を数値で表しており、例えば“02”が設定される。   The deletion viewpoint ID 231 represents information for uniquely identifying and identifying each deletion viewpoint data as a numerical value. For example, “02” is set.

条件AからEは、ファイルデータ22における当該削除観点の不要度を決定する際に用いる。例えばあるファイルのファイルサイズ不要度226を求める際には、当該ファイルのファイルサイズ223を条件AからEと比較し、適合する条件に対応する値(例えば、条件Aの時は0)を格納する。   Conditions A to E are used when determining the degree of necessity of the deletion viewpoint in the file data 22. For example, when obtaining the file size unnecessary degree 226 of a certain file, the file size 223 of the file is compared with the conditions A to E, and a value corresponding to the matching condition (for example, 0 for the condition A) is stored. .

以上で実施形態の業務文書検索システムの構成・機能の説明を終了する。以下、各プログラムのフローチャートを参照しつつ、実施形態のファイル検索システムの動作を説明する。   This is the end of the description of the configuration and function of the business document search system of the embodiment. Hereinafter, the operation of the file search system according to the embodiment will be described with reference to flowcharts of the respective programs.

<ファイルサーバ巡回プログラムによる処理動作>
図5は、本発明の実施形態による、ファイルサーバ巡回プログラム11の処理動作を説明するためのフローチャートである。
(i)ステップS501
ファイルサーバ巡回プログラム11は、起動要求に応答して処理を開始すると、検索対象ファイル43のフォルダデータレコード210及びファイルデータレコード220を作成等する。具体的には、ファイルサーバ巡回プログラム11は、例えば、ファイル管理プログラム41に対して、予め設定したパス(例えば“/部内共用”)に含まれているファイルを読込、送信するように要求する。そして、ファイルサーバ巡回プログラム11は、ファイル管理プログラム41からファイルを受信すると、取得したファイルのパス(例えば“/部内共用/作業報告1.doc”)が、パス221に設定されているファイルデータレコード220が存在するか判定する。
<Processing by file server patrol program>
FIG. 5 is a flowchart for explaining the processing operation of the file server patrol program 11 according to the embodiment of the present invention.
(I) Step S501
When the file server patrol program 11 starts processing in response to the activation request, it creates a folder data record 210 and a file data record 220 of the search target file 43, and so on. Specifically, the file server patrol program 11 requests, for example, the file management program 41 to read and transmit a file included in a preset path (for example, “/ shared within”). When the file server patrol program 11 receives the file from the file management program 41, the file data record in which the path of the acquired file (for example, “/ partial sharing / work report 1.doc”) is set to the path 221 is obtained. It is determined whether 220 exists.

該当するファイルデータレコードが存在しない場合は、ファイルサーバ巡回プログラム11は、取得したファイルに基づいて、パス、ファイル名、ファイルサイズ、更新日、参照回数を、それぞれ、パス221、ファイル名222、ファイルサイズ223、更新日224、及び参照回数225を設定して、ファイルデータレコード220を追加する。   If the corresponding file data record does not exist, the file server patrol program 11 sets the path 221, file name 222, file name 222, file number, path, file name, file size, update date, and reference count based on the acquired file. A size 223, an update date 224, and a reference count 225 are set, and a file data record 220 is added.

一方、該当するファイルデータレコードが存在する場合は、ファイルサーバ巡回プログラム11は、当該ファイルデータレコード220(以下「更新対象ファイルレコード」という。)のファイルサイズ223、更新日224及び参照回数225を更新する。   On the other hand, if the corresponding file data record exists, the file server patrol program 11 updates the file size 223, the update date 224, and the reference count 225 of the file data record 220 (hereinafter referred to as “update target file record”). To do.

また、ファイルサーバ巡回プログラム11は、当該パスが、パス211に設定されているフォルダデータレコード210が存在するか判定する。   Further, the file server patrol program 11 determines whether or not the folder data record 210 in which the path is set to the path 211 exists.

該当するフォルダレコードが存在しない場合は、ファイルサーバ巡回プログラム11は、取得したファイルから、パス、下位階層のフォルダのリスト、格納されているファイルのリストを、それぞれ、パス211、下位フォルダリスト212、格納ファイルリスト213を設定して、フォルダデータレコード210を追加する。   If the corresponding folder record does not exist, the file server patrol program 11 obtains a path, a list of lower-level folders, and a list of stored files from the acquired file, respectively, as a path 211, a lower-level folder list 212, The storage file list 213 is set, and the folder data record 210 is added.

一方、該当するフォルダレコードが存在する場合は、ファイルサーバ巡回プログラム11は、当該フォルダデータレコード210(以下「更新対象フォルダレコード」という。)の下位フォルダリスト212及び格納ファイルリスト213を更新する。   On the other hand, when the corresponding folder record exists, the file server patrol program 11 updates the lower folder list 212 and the stored file list 213 of the folder data record 210 (hereinafter referred to as “update target folder record”).

ファイルサーバ巡回プログラム11は、以上の処理を、予め設定したパス配下のファイル全てについて実行した後、新たに作成したファイルデータレコード220以外のレコードであって、更新対象ファイルレコードにならなかったファイルデータレコード220が存在する場合、当該ファイルデータレコード220を削除する。   The file server patrol program 11 performs the above processing for all the files under the preset path, and then records the file data other than the newly created file data record 220 and not the update target file record. If the record 220 exists, the file data record 220 is deleted.

同様に、ファイルサーバ巡回プログラム11は、予め設定したパス配下のファイル全てについて実行した後、新たに作成したフォルダデータレコード210以外のレコードであって、更新対象フォルダレコードにならなかったフォルダデータレコード210が存在する場合、当該フォルダデータレコード210を削除する。   Similarly, the file server patrol program 11 is executed for all the files under the preset path, and then is a record other than the newly created folder data record 210 and does not become the update target folder record 210. Is present, the folder data record 210 is deleted.

なお、ファイルデータ22及びフォルダデータ21を作成等する方法は、上述の方法に限られず、予め設定したパス以下に含まれるファイル及びフォルダの情報が取得できる方法であれば任意の方法が適用可能である。   The method of creating the file data 22 and the folder data 21 is not limited to the above-described method, and any method can be applied as long as it can acquire information on files and folders included under a preset path. is there.

(ii)ステップS502
ファイルサーバ巡回プログラム11は、ファイルデータ22及びフォルダデータ21を作成した後、それらを基に削除観点データ23における各削除観点の条件AからEを設定する。各条件を設定する際には、各フォルダデータレコード210の格納ファイルリスト213に記載のファイル群における該当する削除観点(ファイルサイズなど)の分布に基づいて決定する。
(Ii) Step S502
After creating the file data 22 and the folder data 21, the file server patrol program 11 sets conditions A to E for each deletion viewpoint in the deletion viewpoint data 23 based on them. When setting each condition, it is determined based on the distribution of the corresponding deletion viewpoint (file size, etc.) in the file group described in the storage file list 213 of each folder data record 210.

ファイルサーバ4において、一般に不要とみなせるファイルには偏りがあると考えられる。これはパレートの法則などの経験則に基づく。パレートの法則が成り立つと仮定すると、ファイルサーバ4において、全ファイルの2割の中に不要なファイルの8割が含まれ、また別の見方をすると、全フォルダの2割の中に不要なフォルダの8割が集中していると経験則上言うことができる。そのため、条件を設定する際にはこのような経験則を考慮することで効率のよいフォルダの削除を実現することが可能となる。   In the file server 4, it is considered that there is a bias in the files that are generally considered unnecessary. This is based on empirical rules such as Pareto's law. Assuming that Pareto's Law holds, 80% of unnecessary files are included in 20% of all files in the file server 4, and from another perspective, unnecessary folders are included in 20% of all folders. As a rule of thumb, it can be said that 80% of these are concentrated. Therefore, efficient folder deletion can be realized by considering such an empirical rule when setting conditions.

例えば、削除観点がファイルサイズである場合を考える。条件A232から順に設定を行う。まず条件A232を設定する際には、インデックス登録されている全ファイルをファイルサイズが大きい順にソートする。そして、ファイルサイズが上位2割までに含まれるファイル群(例えば100000件のファイルがあるとすると、ファイルサイズが上位20000件までのファイル群)であって、ファイル群に含まれるファイルとそうでないファイルとの境界となるファイルサイズ(例えば、135MB)を求め、この値を用いて条件A232の条件式を設定する(例えば、ファイルサイズ<135MB)。この条件を用いることで、ファイルサーバの中で容量のボトルネックになっているファイルサイズが上位2割のファイルを発見することが容易になる。ファイルサイズが大きいということはファイルサーバ4を圧迫しているという考えに基づくものである。なお、「2割」という数値は固定の割合ではなく、状況に応じて適宜設定可能である。従って、一般化して、K割(ただし、K<10−Kが望ましい)と表現することができる。   For example, consider a case where the deletion viewpoint is the file size. Settings are made in order from condition A232. First, when setting the condition A232, all the files registered in the index are sorted in descending order of file size. A file group whose file size is included in the top 20% (for example, if there are 100000 files, the file size is a file group whose file size is the top 20000), and the files included in the file group and the files that are not A file size (for example, 135 MB) serving as a boundary is obtained, and a conditional expression of condition A232 is set using this value (for example, file size <135 MB). By using this condition, it becomes easy to find the file with the top 20% of the file size that is the bottleneck of capacity in the file server. The large file size is based on the idea that the file server 4 is under pressure. The numerical value “20%” is not a fixed ratio, and can be set as appropriate according to the situation. Therefore, it can be generalized and expressed as K percent (where K <10−K is desirable).

また、削除観点が更新日の場合は、日付が古いほど不要の度合いが高くなる。そのため、古い順に上位2割を抽出していくことで、各条件を設定すればよい。削除観点が参照回数の場合は、参照回数が少ないほど不要の度合いが高くなる。そのため、参照回数が少ない上位2割を抽出していくことで、各条件を設定すればよい。   Further, when the deletion viewpoint is the update date, the degree of unnecessary is higher as the date is older. Therefore, each condition may be set by extracting the upper 20% from the oldest. When the deletion viewpoint is the number of references, the unnecessary degree increases as the number of references decreases. Therefore, each condition may be set by extracting the top 20% with the smallest number of references.

次に、条件B233を設定する際には、条件Aで上位2割のファイル群(上記20000件のファイル)の中でさらに上位2割となるファイル群(4000件のファイル群)であって、そのファイル群に含まれるファイルとそうでないファイルとの境界となるファイルサイズ(例えば372MB)を求め、この値と条件Aに用いた値を用いて条件B233の条件式として設定する(例えば、135MB≦ファイルサイズ<372MB)。   Next, when setting the condition B233, it is a file group (4000 file groups) that is the top 20% of the top 20% file group (the above 20000 files) in the condition A, A file size (for example, 372 MB) serving as a boundary between a file included in the file group and a file that is not so is obtained, and the value used for condition A is set as a conditional expression of condition B233 (for example, 135 MB ≦ File size <372MB).

さらに、条件C234、条件D235、条件E236も同様に、残ったファイル群の上位2割となるファイルサイズを求めて条件式を設定する。このようにパレートの法則を多段階に適用することで、不要なファイルを特定しやすくなる。本発明の実施形態では、さらにフォルダ単位で削除候補を提示するため、ひとまとめに確認・削除することができ、より効率が高まる。さらに、他の条件を用いると、上位の中のさらに上位のファイルを絞り込んでいくことが可能となり効率的である。また、当該実施形態では、複数種類(3種類)の削除観点を複合的に考慮して不要となるフォルダを提示するため、確認・削除すべきフォルダをさらに絞り込むことが可能となる。   Further, for condition C 234, condition D 235, and condition E 236, the file size that is the upper 20% of the remaining file group is obtained and a conditional expression is set. By applying Pareto's law in multiple stages, unnecessary files can be easily identified. In the embodiment of the present invention, deletion candidates are further presented in units of folders, so that confirmation and deletion can be performed in a lump, and efficiency is further increased. Furthermore, when other conditions are used, it is possible to narrow down the upper files among the upper files, which is efficient. Further, in the present embodiment, unnecessary folders are presented in consideration of a plurality of types (three types) of deletion viewpoints, so that the folders to be confirmed and deleted can be further narrowed down.

以上で説明したように、当該実施形態においては、ファイルサーバ巡回プログラム11が処理を行うたびに、処理時点の検索対象ファイル43に対応するフォルダデータ21とファイルデータ22と削除観点データ23が作成される。よって、動的に各ファイル及びフォルダの不要度が算出されるため、使用状況に応じて、ファイルサーバ4内のおける削除候補フォルダを動的にユーザに提示することが可能となる。   As described above, in this embodiment, each time the file server patrol program 11 performs processing, folder data 21, file data 22, and deletion viewpoint data 23 corresponding to the search target file 43 at the time of processing are created. The Accordingly, since the degree of necessity of each file and folder is dynamically calculated, it is possible to dynamically present a deletion candidate folder in the file server 4 to the user according to the usage situation.

<削除解析プログラムの処理動作>
図6は、本発明の実施形態による、削除候補解析プログラム12の処理動作を説明するためのフローチャートである。削除候補解析プログラム12は、前述したように、各フォルダに含まれるファイル群を解析し、各フォルダが削除候補か否かを判定するプログラムである。削除候補解析プログラム12は各フォルダ内容を表すフォルダデータ21を順に解析し、削除候補としての解析結果をフォルダ不要度215に、またそれから得られるフォルダ表示形態216の値を格納する処理を行う。なお、フローチャート内の各処理の動作主体は、特に断らない限りは削除候補解析プログラム12である。
<Processing of deletion analysis program>
FIG. 6 is a flowchart for explaining the processing operation of the deletion candidate analysis program 12 according to the embodiment of the present invention. As described above, the deletion candidate analysis program 12 is a program that analyzes a file group included in each folder and determines whether each folder is a deletion candidate. The deletion candidate analysis program 12 sequentially analyzes the folder data 21 representing the contents of each folder, and stores the analysis result as a deletion candidate in the folder unnecessary degree 215 and the value of the folder display form 216 obtained therefrom. Note that the operation subject of each process in the flowchart is the deletion candidate analysis program 12 unless otherwise specified.

(i)ステップS601
削除候補解析プログラム12は、削除候補フォルダ解析要求(ボタン806の押下)に応答して処理開始すると、未処理のフォルダデータレコード210、すなわち解析が済んでいないフォルダのレコードを1つ選択する。
(I) Step S601
When the deletion candidate analysis program 12 starts processing in response to a deletion candidate folder analysis request (pressing the button 806), it selects one unprocessed folder data record 210, that is, a record of a folder that has not been analyzed.

(ii)ステップS602
削除候補解析プログラム12は、S601で選択したフォルダデータレコード210における格納ファイルリスト213に格納されているファイル群に対して、それぞれのファイルサイズ不要度226、更新日不要度227、参照回数不要度228、ファイル不要度229を求める。
(Ii) Step S602
The deletion candidate analysis program 12 applies the file size unnecessary degree 226, the update date unnecessary degree 227, and the reference number unnecessary degree 228 to the file groups stored in the storage file list 213 in the folder data record 210 selected in S601. The file unnecessary degree 229 is obtained.

例えば、ファイルサイズ不要度226を求める際、削除候補解析プログラム12は、まず当該ファイルデータレコード220におけるファイルサイズ223(27,328MB)を取得する。次に、削除候補解析プログラム12は、削除観点データ23からファイルサイズに該当する削除観点データレコード230を参照し、各条件とファイルサイズ223を比較する。その結果該当する条件に応じてファイルサイズ不要度226を決定する。具体的には、条件Aは0、条件Bは1、条件Cは2、条件Dは3、条件Eは4となる。なお、各削除観点で条件が異なったとしても、条件と数値の対応は同一である。   For example, when obtaining the file size unnecessary degree 226, the deletion candidate analysis program 12 first acquires the file size 223 (27,328 MB) in the file data record 220. Next, the deletion candidate analysis program 12 refers to the deletion viewpoint data record 230 corresponding to the file size from the deletion viewpoint data 23 and compares each condition with the file size 223. As a result, the file size unnecessary degree 226 is determined according to the corresponding condition. Specifically, the condition A is 0, the condition B is 1, the condition C is 2, the condition D is 3, and the condition E is 4. Even if the conditions differ from each deletion viewpoint, the correspondence between the conditions and the numerical values is the same.

そして、削除候補解析プログラム12は、各削除観点について不要度を算出後、それらの数値を加算した値を当該ファイルデータレコード220のファイル不要度229として設定する。   Then, the deletion candidate analysis program 12 calculates an unnecessary degree for each deletion viewpoint, and sets a value obtained by adding the numerical values as the file unnecessary degree 229 of the file data record 220.

(iii)ステップS603
削除候補解析プログラム12は、S601で選択したフォルダデータレコード210のフォルダ不要度215を算出する。これはS602で算出した各ファイルデータレコードのファイル不要度229に基づいて算出される。様々な算出方法が適用可能であるが、当該実施形態では、当該フォルダデータレコード210の格納ファイルリスト213に含まれる各ファイルのファイルデータレコード220におけるファイル不要度229を加算した値とする。これにより、フォルダ内の個々のファイルの不要度が低くても、そのようなファイルが多数存在する場合はフォルダ不要度215が高くなり、より削除すべきフォルダをユーザに提示することが可能となる。
(Iii) Step S603
The deletion candidate analysis program 12 calculates the folder unnecessary degree 215 of the folder data record 210 selected in S601. This is calculated based on the file unnecessary degree 229 of each file data record calculated in S602. Although various calculation methods can be applied, in this embodiment, a value obtained by adding the file unnecessary degree 229 in the file data record 220 of each file included in the storage file list 213 of the folder data record 210 is used. As a result, even if the degree of necessity of individual files in the folder is low, if there are a large number of such files, the degree of folder unnecessary 215 becomes high, and a folder to be deleted can be presented to the user. .

(iv)ステップS604
削除候補解析プログラム12は、フォルダデータ21中に未処理のレコードが存在するか否かを判定する。未処理のレコードが存在すれば、処理はS601に戻り、存在しなければ、処理はS605に進む。このようにしてフォルダデータ21中の全レコードに対して各不要度を算出する。
(Iv) Step S604
The deletion candidate analysis program 12 determines whether or not an unprocessed record exists in the folder data 21. If there is an unprocessed record, the process returns to S601; otherwise, the process proceeds to S605. In this way, each unnecessary degree is calculated for all the records in the folder data 21.

(v)ステップS605
削除候補解析プログラム12は、すべてのフォルダデータレコード210におけるフォルダ不要度215の分布に基づき、各フォルダデータレコード210におけるフォルダ表示形態216を求める。これは、後述するクライアント画面において、削除候補となるフォルダを表示する際に、相対的に不要の度合いが大きいフォルダを強調して表示するために行う処理である。
(V) Step S605
The deletion candidate analysis program 12 obtains the folder display form 216 in each folder data record 210 based on the distribution of the folder unnecessary degree 215 in all the folder data records 210. This is a process performed to highlight a folder with a relatively high degree of unnecessaryness when displaying a folder as a deletion candidate on a client screen described later.

削除候補解析プログラム12は、フォルダ表示形態216を求める際、削除観点データ23における条件を求める場合と同様に、上述の経験則(パレートの法則)を利用する。すなわち、削除候補解析プログラム12は、まず全フォルダデータレコード210におけるフォルダ不要度215の分布を算出する(フォルダの不要度が大きい順にソートする)。そして、削除候補解析プログラム12は、フォルダ不要度215が0でないフォルダデータレコード210のフォルダ表示形態216を、1に設定する。これはフォルダ内のファイルに、いずれかの削除観点で削除候補と判定されたファイルが少なくとも1つ含んでいることを表す。   The deletion candidate analysis program 12 uses the above empirical rule (Pareto's law) when determining the folder display form 216 as in the case of determining the condition in the deletion viewpoint data 23. That is, the deletion candidate analysis program 12 first calculates the distribution of the folder unnecessary degree 215 in all the folder data records 210 (sorted in descending order of folder unnecessary degree). Then, the deletion candidate analysis program 12 sets the folder display form 216 of the folder data record 210 whose folder unnecessary degree 215 is not 0 to 1. This indicates that the files in the folder include at least one file determined as a deletion candidate from any deletion viewpoint.

次に、削除候補解析プログラム12は、フォルダ不要度215が0でない(不要度が1に設定された)フォルダデータレコード210群の中で、フォルダ不要度215の値が上位2割となるフォルダ群を特定し、当該上位2割のフォルダレコード群に含まれる不要度の値と含まれない不要度の値との境界値を取得してこれを条件(閾値)Aとする。そして、削除候補解析プログラム12は、フォルダ不要度215が条件(閾値)Aより大きいフォルダデータレコード210のフォルダ表示形態216を、「2」に設定する。そして、さらに当該条件(閾値)Aよりも大きいフォルダ不要度215の値を有するフォルダレコード210群(表示形態「2」に設定されたフォルダ群)を、上述の処理を同様に、上位2割で区切る値で閾値を設定し、表示形態を順次決定していく。本実施形態では、フォルダ表示形態216を最大で4まで求めるようにしているが、必ずしも上限を設けなくてよい。   Next, the deletion candidate analysis program 12 has a folder group in which the value of the folder unnecessary degree 215 is the top 20% in the folder data record 210 group in which the folder unnecessary degree 215 is not 0 (the unnecessary degree is set to 1). And the boundary value between the unnecessary degree value included in the upper 20% folder record group and the unnecessary degree value not included in the group is acquired as a condition (threshold value) A. Then, the deletion candidate analysis program 12 sets the folder display form 216 of the folder data record 210 whose folder unnecessary degree 215 is larger than the condition (threshold) A to “2”. Further, the folder records 210 group (folder group set to the display form “2”) having a value of the folder unnecessary degree 215 larger than the condition (threshold value) A are classified into the upper 20% similarly. The threshold value is set by the value to be divided, and the display form is sequentially determined. In the present embodiment, the folder display form 216 is obtained up to 4, but an upper limit is not necessarily provided.

(vi)ステップS606
削除候補解析プログラム12は、削除候補フォルダ保持フラグ214を更新する。すなわち、これはフォルダデータ21中の全フォルダデータレコード210をチェックし、削除候補フォルダ保持フラグ214を更新することを意味する。削除候補フォルダ保持フラグ214は、仮想分類を表示する際に使用される。削除候補フォルダ保持フラグ214がtrueであれば、上述のように、当該フォルダに削除候補の下位階層フォルダが含まれることを意味するので、当該フォルダが表示され、falseであれば当該フォルダは表示されない。この処理については後述する。
(Vi) Step S606
The deletion candidate analysis program 12 updates the deletion candidate folder holding flag 214. That is, this means that all the folder data records 210 in the folder data 21 are checked and the deletion candidate folder holding flag 214 is updated. The deletion candidate folder holding flag 214 is used when displaying the virtual classification. If the deletion candidate folder holding flag 214 is true, it means that the folder includes a lower-level folder of deletion candidates as described above. Therefore, the folder is displayed, and if it is false, the folder is not displayed. . This process will be described later.

具体的には、S606において、削除候補解析プログラム12は、まず各フォルダデータレコード210におけるフォルダ表示形態216をチェックし、表示形態が「0」に設定されていなければ、当該フォルダデータレコード210における削除候補フォルダ保持フラグ214をtrueに更新する。この処理はフォルダデータレコード210内の下位フォルダリスト212に格納されているパス211に該当するフォルダデータレコード210に対しても再帰的に行う。例えば、フォルダデータレコード210のパス211が“/ 部内共用 / バックアップ / 動画”であり、下位フォルダリスト212が[“/ 部内共用 / バックアップ / 動画 / 製品紹介”, “/ 部内共用 / バックアップ / 技術紹介”]であり、“/ 部内共用 / バックアップ / 動画 / 製品紹介”の下位フォルダリスト212が[“/ 部内共用 / バックアップ / 動画 / 製品紹介 / 大容量”]であり、“/ 部内共用 / バックアップ / 動画 / 技術紹介”の下位フォルダリスト212が存在しなかった場合、削除候補フォルダ保持フラグ215のチェックは以下の4つのフォルダに対して行う。
“/ 部内共用 / バックアップ / 動画”
“/ 部内共用 / バックアップ / 動画 / 製品紹介”
“/ 部内共用 / バックアップ / 動画 / 製品紹介 / 大容量”
“/ 部内共用 / バックアップ / 動画 / 技術紹介”
Specifically, in S606, the deletion candidate analysis program 12 first checks the folder display form 216 in each folder data record 210. If the display form is not set to “0”, the deletion candidate analysis program 12 deletes the folder data record 210. The candidate folder holding flag 214 is updated to true. This process is also recursively performed on the folder data record 210 corresponding to the path 211 stored in the lower folder list 212 in the folder data record 210. For example, the path 211 of the folder data record 210 is “/ internal sharing / backup / video”, and the lower folder list 212 is “/ internal sharing / backup / video / product introduction”, “/ internal sharing / backup / technical introduction”. ”] And the subfolder list 212 of“ / internal sharing / backup / video / product introduction ”is [“ / internal sharing / backup / video / product introduction / large capacity ”] and“ / internal sharing / backup / When the subfolder list 212 of “Movie / Technology” does not exist, the deletion candidate folder holding flag 215 is checked for the following four folders.
“/ Internal sharing / backup / video”
“/ Internal sharing / backup / video / product introduction”
“/ Internal sharing / backup / video / product introduction / large capacity”
“/ Internal sharing / backup / video / technology”

これらのパスに該当するフォルダデータレコード210の表示形態216の中に、0でない数値が少なくとも1つあれば、“/ 部内共用 / バックアップ / 動画”のパスに該当するフォルダデータレコード210中の削除候補フォルダ保持フラグ215はtrueとなる。   If there is at least one numeric value other than 0 in the display form 216 of the folder data record 210 corresponding to these paths, the deletion candidate in the folder data record 210 corresponding to the path of “/ internal sharing / backup / video” The folder holding flag 215 is true.

<検索要求プログラムの処理動作>
図7は、本発明の実施形態による、検索要求プログラム31の処理動作を説明するためのフローチャートである。検索要求プログラム31は、クライアント3の操作者が入力装置32を使用することにより起動される。
<Processing of search request program>
FIG. 7 is a flowchart for explaining the processing operation of the search request program 31 according to the embodiment of the present invention. The search request program 31 is activated when the operator of the client 3 uses the input device 32.

(i)ステップS701
検索要求プログラム31は、起動されると、出力装置33に検索要求画面800を表示する。図8は、検索要求プログラム31が起動されたときに表示される検索要求画面800の構成例を示す図である。図8において、検索要求画面800は、仮想分類表示領域801と、格納ファイル表示領域802と、削除候補フォルダ解析ボタン806と、選択フォルダ削除ボタン807と、選択ファイル削除ボタン808と、終了ボタン809と、を構成要素として含んでいる。なお、検索要求プログラム31において、必要に応じて検索プログラム13が実行される。
(I) Step S701
When started, the search request program 31 displays a search request screen 800 on the output device 33. FIG. 8 is a diagram illustrating a configuration example of a search request screen 800 displayed when the search request program 31 is started. In FIG. 8, a search request screen 800 includes a virtual classification display area 801, a storage file display area 802, a deletion candidate folder analysis button 806, a selection folder deletion button 807, a selection file deletion button 808, and an end button 809. , As a component. In the search request program 31, the search program 13 is executed as necessary.

仮想分類表示領域801では、仮想フォルダがツリー構造で表示される。最上位階層は、ファイルサーバ4において、指定されたフォルダ以下のフォルダの階層構造が踏襲される。表示するフォルダは、フォルダデータ21を参照することによって決定される。対応するフォルダデータレコード210におけるフォルダ表示形態216の値によって、仮想フォルダの表示形態は異なる。フォルダ表示形態216が0の場合は、白色など相対的に目立たない表示形態となる。数値が大きくなるに従って、色が濃くなったり、大きさ等形状が変化したりするなど、相対的に目立つ表示形態となる。このようなフォルダを目立たせることによって、操作者は当該フォルダが削除すべきフォルダであることを認識しやすくなる。例えば「大容量」仮想フォルダ804は、より不要の度合いが強いため目立つ表示形態となっている。   In the virtual classification display area 801, virtual folders are displayed in a tree structure. As for the highest hierarchy, the file server 4 follows the hierarchical structure of folders below the designated folder. The folder to be displayed is determined by referring to the folder data 21. The display form of the virtual folder differs depending on the value of the folder display form 216 in the corresponding folder data record 210. When the folder display form 216 is 0, the display form is relatively inconspicuous, such as white. As the numerical value increases, the display form becomes relatively conspicuous, such as a darker color or a change in shape such as size. By making such a folder stand out, the operator can easily recognize that the folder is a folder to be deleted. For example, the “large-capacity” virtual folder 804 has a conspicuous display form because it is more unnecessary.

また、削除候補フォルダ保持フラグ214がfalseの場合は、当該フォルダ及び当該フォルダの下の階層に削除候補フォルダが存在しないことを示す。この場合は、当該フォルダ及び当該フォルダの下位の階層を表示しない。従って、白色で表示されたフォルダは、当該フォルダは削除候補となっていない(当該フォルダ直下には不要度が高いファイルが含まれていない)が、下位階層のいずれかのフォルダには不要度が高く、削除候補対象のフォルダが含まれていることが分かる。このように、削除候補のフォルダと、その上位フォルダのみが表示されることになり、操作者は無駄なフォルダを確認する必要がなくなる。   Further, when the deletion candidate folder holding flag 214 is false, it indicates that there is no deletion candidate folder in the folder and the hierarchy below the folder. In this case, the folder and the lower hierarchy of the folder are not displayed. Therefore, a folder displayed in white is not a candidate for deletion (a file with a high degree of unnecessaryness is not included immediately below the folder), but a folder in any lower level has a degree of unnecessaryness. It is high and it can be seen that a deletion candidate target folder is included. In this way, only the deletion candidate folder and its upper folder are displayed, and the operator does not need to confirm a useless folder.

格納ファイル表示領域802は、仮想分類表示部801において選択された仮想フォルダに格納されているファイルが表示される。これらのファイルは、選択された仮想フォルダに対応するフォルダデータレコード210における格納ファイルリスト213を参照することによって得られる。   The stored file display area 802 displays files stored in the virtual folder selected in the virtual classification display unit 801. These files are obtained by referring to the stored file list 213 in the folder data record 210 corresponding to the selected virtual folder.

また、格納ファイル表示領域802には、各ファイルに対応するファイルデータレコード220の、ファイル名222、ファイルサイズ223、更新日224、参照回数225及び削除対象か否かを表す削除チェックボックス805が表示される。   In the storage file display area 802, a file name 222, a file size 223, an update date 224, a reference count 225, and a deletion check box 805 indicating whether or not the file data record 220 corresponding to each file is a deletion target are displayed. Is done.

(ii)ステップS702
検索要求プログラム31は、検索要求画面800が表示されると、操作者からの操作を待ち受ける。
(Ii) Step S702
When the search request screen 800 is displayed, the search request program 31 waits for an operation from the operator.

(iii)ステップS703
検索要求プログラム31は、削除候補フォルダ解析ボタン806が押下されると、検索要求プログラム31は、削除候補フォルダ解析プログラムを起動する。
(Iii) Step S703
When the deletion candidate folder analysis button 806 is pressed, the search request program 31 activates the deletion candidate folder analysis program.

(iv)ステップS704
仮想分類表示領域801において仮想フォルダが押下されると、検索要求プログラム31は、選択された仮想フォルダに対応するファイルデータレコード220を読み込み、格納ファイル表示部に該当するファイル群を表示する。
(Iv) Step S704
When a virtual folder is pressed in the virtual classification display area 801, the search request program 31 reads the file data record 220 corresponding to the selected virtual folder and displays the file group corresponding to the stored file display unit.

(v)ステップS705
格納ファイル表示領域802において削除チェックボックス805がチェックされると、検索要求プログラム31は、削除チェックボックスを更新する。具体的には、検索要求プログラム31は、削除チェックボックス805がチェックされる前にチェックされていない状態となっていたのであれば、チェックされた状態にし、チェックされた状態となっていたのであれば、チェックされていない状態に変更する。
(V) Step S705
When the delete check box 805 is checked in the storage file display area 802, the search request program 31 updates the delete check box. Specifically, if the search request program 31 is not checked before the deletion check box 805 is checked, the search request program 31 may be checked and checked. If it is not checked, change it to the unchecked state.

(vi)ステップS706及びS707
選択フォルダ削除ボタン807が押下されると、検索要求プログラム31は、選択されているフォルダ及びその下位のフォルダ及びファイルを削除する。すなわち、仮想分類表示領域801において選択されている仮想フォルダに対応するフォルダデータレコード210と当該フォルダデータレコード210の格納ファイルリスト213に対応するファイルデータ群が削除される。ただし、当該フォルダが削除候補になっていたとしても、下位フォルダが削除候補になっているとは限らない。このような場合、当該フォルダを削除してしまうと下位フォルダも削除されてしまうことになるため、当該フォルダ直下のファイルのみ削除し、当該フォルダ自身は親フォルダとして残しておいても良い。この場合、検索要求画面800上に「当該フォルダには下位フォルダがあるので当該フォルダ直下のファイルのみ削除します」等のメッセージを表示するようにしても良い。或いは、削除候補となっていない下位フォルダについてのツリー構造を自動的に再構成するようにしても良い。
(Vi) Steps S706 and S707
When the delete selected folder button 807 is pressed, the search request program 31 deletes the selected folder and its lower folders and files. That is, the folder data record 210 corresponding to the virtual folder selected in the virtual classification display area 801 and the file data group corresponding to the stored file list 213 of the folder data record 210 are deleted. However, even if the folder is a deletion candidate, the lower folder is not necessarily a deletion candidate. In such a case, if the folder is deleted, the lower folder is also deleted. Therefore, only the files immediately under the folder may be deleted, and the folder itself may be left as a parent folder. In this case, a message such as “Since the folder has a lower folder, only the files immediately under the folder will be deleted” may be displayed on the search request screen 800. Or you may make it automatically reconfigure | reconstruct the tree structure about the lower folder which is not a deletion candidate.

さらに、検索要求プログラム31は、当該フォルダデータレコード210の下位フォルダリスト212に対応するフォルダデータレコード210に対しても同様に削除する。   Further, the search request program 31 similarly deletes the folder data record 210 corresponding to the lower folder list 212 of the folder data record 210.

選択ファイル削除ボタン808が押下されると、検索要求プログラム31は、格納ファイル表示領域802において、削除チェックボックス805がチェックされているファイルを削除する。すなわち、対応するファイルデータレコード220が削除される。   When the selection file deletion button 808 is pressed, the search request program 31 deletes a file whose deletion check box 805 is checked in the storage file display area 802. That is, the corresponding file data record 220 is deleted.

このようにファイルやフォルダを削除する場合、検索要求プログラム31は、ファイルサーバ4上に存在する、対応するフォルダ及びファイルも削除するようにファイルサーバ4にリクエストする。   When deleting a file or folder in this way, the search request program 31 requests the file server 4 to delete the corresponding folder and file existing on the file server 4.

以上のS703からS707の各処理が終了すると、検索要求画面800が更新されS702に戻る。
終了ボタン809が押下されると、検索要求プログラム31は、検索要求画面800を閉じる。
When the processes from S703 to S707 are completed, the search request screen 800 is updated and the process returns to S702.
When the end button 809 is pressed, the search request program 31 closes the search request screen 800.

<変形例>
本実施形態では、削除候補フォルダ保持フラグ214の値を決定する際に、対象のフォルダの直下のファイルのみの特徴に基づいて決定する処理について述べている。この他に、対象のフォルダの直下のファイルだけでなく、その下位に属するすべてのフォルダに含まれるファイルの特徴に基づいて決定する方法も考えられる。
<Modification>
In the present embodiment, the process of determining the value of the deletion candidate folder holding flag 214 based on the characteristics of only the files immediately under the target folder is described. In addition to this, a method may be considered in which the determination is based not only on the files immediately under the target folder but also on the characteristics of the files included in all the folders belonging to the folder.

また、本実施形態では、削除観点の例として、ファイルサイズとファイルの更新日とファイルの参照回数について述べている。この他の削除観点として、重複したファイル(ファイルの内容が部分的あるいはすべてが同一のファイル)を含むか否かという削除観点や、削除候補となるためのキーワード(削除キーワード)をあらかじめ設定しておき、そのキーワードを含むファイルを含むか否かという削除観点などが考えられる。前者の削除観点を導入する際には、S602の処理において、当該ファイルと重複したファイルがファイルサーバ上に含まれる数が多いほど当該不要度を高くするように設定すればよい。また、後者の削除観点を導入する場合には、S602の処理において、当該ファイルのファイル名に削除キーワードを含む数が多いほど当該不要度を高くするように設定すればよい。   In this embodiment, the file size, the file update date, and the file reference count are described as examples of the deletion viewpoint. As other deletion points of view, a deletion point of whether or not duplicate files (file contents are partially or all of the same file) and a keyword (deletion keyword) to become a deletion candidate are set in advance. Another possible point of view is whether or not to include a file containing the keyword. When the former deletion viewpoint is introduced, in the process of S602, the unnecessary degree may be set to be higher as the number of files that overlap with the file is larger on the file server. Further, when the latter deletion viewpoint is introduced, in the process of S602, the unnecessary degree may be set higher as the number of deletion keywords included in the file name of the file increases.

<まとめ>
(1)本発明の実施形態では、検索サーバにおいて、ファイルサーバの巡回処理をして検索用インデックスを更新する度に、削除観点データ(評価情報)の各項目(例えば、ファイルサイズ不要度、更新日不要度、参照回数不要度等)における、複数の閾値(例えば、図4における条件A乃至Eの各条件に含まれるか否かを決定するための閾値)が動的に設定される。そして、削除候補解析処理において、削除観点データが参照され、各ファイルの不要度がスコア値として算出され、そのファイルのスコア値(ファイルスコア値)を合計することにより対象ファイル(例えば、直下のファイル)を含むフォルダの不要度のスコア値(フォルダスコア値)が算出される。このスコア値によって、削除候補となるフォルダが検出される。このようにすることにより、ファイルサーバに格納されたデータの削除候補をフォルダ単位で発見することができるようになる。
<Summary>
(1) In the embodiment of the present invention, each time the search server updates the search index by performing the cyclic processing of the file server, each item of the deletion viewpoint data (evaluation information) (for example, file size unnecessary degree, update A plurality of threshold values (for example, threshold values for determining whether or not to be included in the conditions A to E in FIG. 4) in the day unnecessary degree, the reference frequency unnecessary degree, etc.) are dynamically set. Then, in the deletion candidate analysis process, the deletion viewpoint data is referred to, the unnecessary degree of each file is calculated as a score value, and the score value (file score value) of the file is summed to calculate the target file (for example, the file immediately below ) Including an unnecessary score score (folder score value) is calculated. Based on this score value, a folder that is a deletion candidate is detected. By doing so, it becomes possible to find deletion candidates for data stored in the file server in units of folders.

また、検索サーバは、検出された削除候補のフォルダの不要度を示すスコア値(フォルダスコア値)の大小に基づいて表示形態を変化させて、削除候補のフォルダを提示する。このようにすることにより、ユーザは、どのフォルダの不要度が高いか(必要度が低いか)一目瞭然で判断することができる。また、これにより、ユーザはフォルダ単位で不要ファイルを削除することができるため、削除工数の削減が可能となる。また、フォルダ内の関連ファイルもまとめて削除できる。さらに、個々のファイルは不要か否かを判断し難い場合でも、フォルダ単位で不要とみなせる場合であれば削除が可能となる。   Further, the search server presents the deletion candidate folder by changing the display form based on the magnitude of the score value (folder score value) indicating the degree of unnecessaryness of the detected deletion candidate folder. In this way, the user can determine at a glance which folder is unnecessary (whether the necessity is low). This also allows the user to delete unnecessary files on a folder-by-folder basis, thus reducing the number of deletion steps. You can also delete related files in a folder. Furthermore, even if it is difficult to determine whether or not each individual file is unnecessary, it can be deleted if it can be considered unnecessary for each folder.

削除観点データの各条件を決定する複数の閾値を設定する場合、パレートの法則のような経験則を多段階で適用する。つまり、複数の項目のそれぞれについて、検索用インデックスに含まれる全ファイルのうち上位m%(例えば20%)に含まれる第1のファイル群を特定し、当該第1のファイル群に含まれるか否かの境界となる値を第1の閾値とする。第1のファイル群のうちさらに上位m%に含まれる第2のファイル群を特定し、当該第2のファイル群に含まれるか否かの境界となる値を第2の閾値とする閾値決定処理を実行する。この閾値決定処理を繰り返すことにより複数の閾値を決定して、削除観点データ(評価情報)を設定する。このようにすることにより、閾値が固定化されず、そのときのファイルサーバの状況に応じて適応的にフォルダの不要度を評価するための要素を決定することができる。また、このように全ファイルを、各項目(例えば、ファイルサイズ不要度、更新日不要度、参照回数不要度等)について相対的に評価できるようにしているので、不要なファイル及びフォルダの候補が固定化されず、必ず削除候補を検出することができる。さらに、パレートの法則に基づいて不要か否かの評価を行っているので、できるだけ少ないファイル及びフォルダをチェックするだけで、できるだけ多くの削除候補を検出できるため(不要なファイルを絞り込みやすいため)、処理効率を高くすることができる。   When setting a plurality of threshold values for determining each condition of deletion viewpoint data, an empirical rule such as Pareto's law is applied in multiple stages. That is, for each of the plurality of items, the first file group included in the upper m% (for example, 20%) of all the files included in the search index is specified, and whether or not the first file group is included in the first file group. A value serving as the boundary is set as a first threshold value. Threshold determination processing in which the second file group included in the upper m% of the first file group is specified, and a value serving as a boundary as to whether the second file group is included in the second file group is the second threshold value Execute. A plurality of threshold values are determined by repeating this threshold value determination process, and deletion viewpoint data (evaluation information) is set. By doing so, the threshold value is not fixed, and it is possible to determine an element for adaptively evaluating the unnecessary degree of the folder according to the situation of the file server at that time. In addition, since all the files can be relatively evaluated with respect to each item (for example, the file size unnecessary degree, the update date unnecessary degree, the reference number unnecessary degree, etc.) in this way, unnecessary file and folder candidates can be determined. Deletion candidates can always be detected without being fixed. Furthermore, because we are evaluating whether it is unnecessary based on Pareto's law, it is possible to detect as many deletion candidates as possible by simply checking as few files and folders as possible (since it is easy to narrow down unnecessary files) Processing efficiency can be increased.

また、表示形態を決定する場合にもパレートの法則を多段階で適用する。つまり、全フォルダのうち、フォルダスコア値が上位n%(例えば、20%)に含まれる第1のフォルダ群を特定し、当該第1のフォルダ群に含まれるフォルダに第1の表示形態を割り当てる。第1のフォルダのうちさらにフォルダスコア値が上位n%(20%)に含まれる第2のフォルダ群を特定し、当該第2のフォルダ群に含まれるフォルダに第2の表示形態を割り当てる表示形態割り当て処理を実行する。この表示形態割り当て処理を繰り返すことにより、削除候補となるフォルダの表示形態を決定する。このようにすることにより、表示形態が固定化される事態を回避することができる。よって、ユーザは削除すべきか否かの判断がし易くなる。   In addition, Pareto's law is applied in multiple stages when determining the display form. That is, among all folders, the first folder group whose folder score value is included in the upper n% (for example, 20%) is specified, and the first display form is assigned to the folder included in the first folder group. . A display mode in which a second folder group having a folder score value included in the upper n% (20%) of the first folder is further specified, and a second display mode is assigned to the folder included in the second folder group. Execute the allocation process. By repeating this display form assignment process, the display form of a folder that is a deletion candidate is determined. By doing in this way, the situation where a display form is fixed can be avoided. Therefore, the user can easily determine whether or not to delete.

なお、あるフォルダについて、下位階層に削除候補と判断された下位フォルダがある場合には、当該フォルダが削除候補ではないと判断された場合でも、当該フォルダを削除候補ではないことを示す表示形態(例えば、「白表示」)で表示するようにする。このようにすることにより、ユーザは、下位階層に削除候補フォルダがあることを簡単に認識することができ、深い階層にあるフォルダの削除の是非を決定することができる。また、下位階層に削除候補のフォルダもなく、当該フォルダも削除候補となっていない場合には、そのフォルダ及び下位フォルダは表示さなれいため、ユーザは、惑わされることもなく、フォルダの削除の是非を決定することができるようになる。   When there is a lower folder that is determined as a deletion candidate in a lower hierarchy for a certain folder, even if it is determined that the folder is not a deletion candidate, a display form that indicates that the folder is not a deletion candidate ( For example, “white display”) is displayed. In this way, the user can easily recognize that there is a deletion candidate folder in the lower hierarchy, and can decide whether to delete the folder in the deep hierarchy. If there is no deletion candidate folder in the lower hierarchy and the folder is not a deletion candidate, the user cannot delete the folder without being confused because the folder and the lower folder cannot be displayed. Will be able to determine.

(2)本発明は、実施形態の機能を実現するソフトウェアのプログラムコードによっても実現できる。この場合、プログラムコードを記録した記憶媒体をシステム或は装置に提供し、そのシステム或は装置のコンピュータ(又はCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出す。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコード自体、及びそれを記憶した記憶媒体は本発明を構成することになる。このようなプログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、CD−ROM、DVD−ROM、ハードディスク、光ディスク、光磁気ディスク、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどが用いられる。 (2) The present invention can also be realized by software program codes that implement the functions of the embodiments. In this case, a storage medium in which the program code is recorded is provided to the system or apparatus, and the computer (or CPU or MPU) of the system or apparatus reads the program code stored in the storage medium. In this case, the program code itself read from the storage medium realizes the functions of the above-described embodiments, and the program code itself and the storage medium storing the program code constitute the present invention. As a storage medium for supplying such program code, for example, a flexible disk, CD-ROM, DVD-ROM, hard disk, optical disk, magneto-optical disk, CD-R, magnetic tape, nonvolatile memory card, ROM Etc. are used.

また、プログラムコードの指示に基づき、コンピュータ上で稼動しているOS(オペレーティングシステム)などが実際の処理の一部又は全部を行い、その処理によって前述した実施の形態の機能が実現されるようにしてもよい。さらに、記憶媒体から読み出されたプログラムコードが、コンピュータ上のメモリに書きこまれた後、そのプログラムコードの指示に基づき、コンピュータのCPUなどが実際の処理の一部又は全部を行い、その処理によって前述した実施の形態の機能が実現されるようにしてもよい。   Also, based on the instruction of the program code, an OS (operating system) running on the computer performs part or all of the actual processing, and the functions of the above-described embodiments are realized by the processing. May be. Further, after the program code read from the storage medium is written in the memory on the computer, the computer CPU or the like performs part or all of the actual processing based on the instruction of the program code. Thus, the functions of the above-described embodiments may be realized.

さらに、実施の形態の機能を実現するソフトウェアのプログラムコードを、ネットワークを介して配信することにより、それをシステム又は装置のハードディスクやメモリ等の記憶手段又はCD−RW、CD−R等の記憶媒体に格納し、使用時にそのシステム又は装置のコンピュータ(又はCPUやMPU)が当該記憶手段や当該記憶媒体に格納されたプログラムコードを読み出して実行するようにしても良い。   Further, by distributing the program code of the software that realizes the functions of the embodiment via a network, it is stored in a storage means such as a hard disk or memory of a system or apparatus, or a storage medium such as a CD-RW or CD-R And the computer (or CPU or MPU) of the system or apparatus may read and execute the program code stored in the storage means or the storage medium when used.

最後に、ここで述べたプロセス及び技術は本質的に如何なる特定の装置に関連することはなく、コンポーネントの如何なる相応しい組み合わせによってでも実装できることを理解する必要がある。更に、汎用目的の多様なタイプのデバイスがここで記述した教授に従って使用可能である。ここで述べた方法のステップを実行するのに、専用の装置を構築するのが有益であることが判るかもしれない。また、実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。本発明は、具体例に関連して記述したが、これらは、すべての観点に於いて限定の為ではなく説明の為である。本分野にスキルのある者には、本発明を実施するのに相応しいハードウェア、ソフトウェア、及びファームウエアの多数の組み合わせがあることが解るであろう。例えば、記述したソフトウェアは、アセンブラ、C/C++、perl、Shell、PHP、Java(登録商標)等の広範囲のプログラム又はスクリプト言語で実装できる。   Finally, it should be understood that the processes and techniques described herein are not inherently related to any particular apparatus, and can be implemented by any suitable combination of components. In addition, various types of devices for general purpose can be used in accordance with the teachings described herein. It may prove useful to build a dedicated device to perform the method steps described herein. Various inventions can be formed by appropriately combining a plurality of constituent elements disclosed in the embodiments. For example, some components may be deleted from all the components shown in the embodiment. Furthermore, constituent elements over different embodiments may be appropriately combined. Although the present invention has been described with reference to specific examples, these are in all respects illustrative rather than restrictive. Those skilled in the art will appreciate that there are numerous combinations of hardware, software, and firmware that are suitable for implementing the present invention. For example, the described software can be implemented in a wide range of programs or script languages such as assembler, C / C ++, perl, shell, PHP, Java (registered trademark).

さらに、上述の実施形態において、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。全ての構成が相互に接続されていても良い。   Furthermore, in the above-described embodiment, control lines and information lines are those that are considered necessary for explanation, and not all control lines and information lines on the product are necessarily shown. All the components may be connected to each other.

加えて、本技術分野の通常の知識を有する者には、本発明のその他の実装がここに開示された本発明の明細書及び実施形態の考察から明らかになる。記述された実施形態の多様な態様及び/又はコンポーネントは、データを管理する機能を有するコンピュータ化ストレージシステムに於いて、単独又は如何なる組み合わせでも使用することが出来る。明細書と具体例は典型的なものに過ぎず、本発明の範囲と精神は後続する請求範囲で示される。   In addition, other implementations of the invention will be apparent to those skilled in the art from consideration of the specification and embodiments of the invention disclosed herein. Various aspects and / or components of the described embodiments can be used singly or in any combination in a computerized storage system capable of managing data. The specification and specific examples are merely exemplary, and the scope and spirit of the invention are indicated in the following claims.

1・・・検索サーバ
2・・・記憶装置
3・・・クライアント(計算機)
4・・・ファイルサーバ
11・・・ファイルサーバ巡回プログラム
12・・・削除候補解析プログラム
13・・・検索プログラム
21・・・フォルダデータ
22・・・ファイルデータ
23・・・削除観点データ
31・・・検索要求プログラム
32・・・入力装置
33・・・出力装置
41・・・ファイル管理プログラム
42・・・記憶装置
43・・・検索対象ファイル
100・・・業務文書検索システム
DESCRIPTION OF SYMBOLS 1 ... Search server 2 ... Storage device 3 ... Client (computer)
4 ... File server 11 ... File server patrol program 12 ... Deletion candidate analysis program 13 ... Search program 21 ... Folder data 22 ... File data 23 ... Deletion point of view data 31 ... Search request program 32 ... input device 33 ... output device 41 ... file management program 42 ... storage device 43 ... search target file 100 ... business document search system

Claims (13)

ファイルサーバに接続され、複数のファイルと複数のフォルダの中から所望のデータを検索する検索装置であって、
ファイルの不要度を決定するための評価情報であって、異なる複数の項目で構成される評価情報と、検索用の複数のファイル及びフォルダを含む検索用インデックスデータと、を保持する記憶装置と、
前記ファイサーバを巡回し、前記検索用インデックスデータを作成するプロセッサと、を有し、
前記評価情報は、前記複数の項目のそれぞれについて、前記複数のファイルを分類するための複数の閾値を含み、
前記プロセッサは、前記ファイルサーバを巡回する度に、前記評価情報における各項目の前記複数の閾値を設定し、前記評価情報に基づいて前記ファイルの不要度のファイルスコア値を算出し、ファイルの不要度のスコア値に基づいて当該ファイルを含むフォルダの不要度を示すフォルダスコア値を算出し、当該フォルダスコア値によって削除候補となるフォルダを検出することを特徴とする検索装置。
A search device connected to a file server and searching for desired data from a plurality of files and a plurality of folders,
A storage device that holds evaluation information for determining the degree of file unnecessary, and includes evaluation information composed of a plurality of different items, and search index data including a plurality of search files and folders,
A processor that circulates the file server and creates the search index data,
The evaluation information includes a plurality of thresholds for classifying the plurality of files for each of the plurality of items,
The processor sets the plurality of threshold values for each item in the evaluation information each time it goes around the file server, calculates a file score value of the file unnecessary degree based on the evaluation information, and eliminates the need for a file A search device that calculates a folder score value indicating an unnecessary degree of a folder including the file based on the score value of the degree, and detects a folder as a deletion candidate based on the folder score value.
請求項1において、
前記プロセッサは、前記削除候補のフォルダを前記フォルダスコア値に応じて表示形態を区別して表示装置に表示することを特徴とする検索装置。
In claim 1,
The search device, wherein the processor displays the deletion candidate folder on a display device by distinguishing display forms according to the folder score value.
請求項2において、
前記プロセッサは、前記複数の項目のそれぞれについて、前記検索用インデックスに含まれる全ファイルのうち上位m%に含まれる第1のファイル群を特定し、当該第1のファイル群に含まれるか否かの境界となる値を第1の閾値とし、前記第1のファイル群のうちさらに上位m%に含まれる第2のファイル群を特定し、当該第2のファイル群に含まれるか否かの境界となる値を第2の閾値とする閾値決定処理を実行し、当該閾値決定処理を繰り返すことにより前記複数の閾値を決定して、前記評価情報を設定することを特徴とする検索装置。
In claim 2,
For each of the plurality of items, the processor specifies a first file group included in the upper m% of all files included in the search index, and whether or not the first file group is included in the first file group. The first threshold value is used as the first threshold value, the second file group included in the higher m% of the first file group is specified, and the boundary whether or not the second file group is included is determined. A search apparatus that executes a threshold value determination process using a value that becomes a second threshold value, determines the plurality of threshold values by repeating the threshold value determination process, and sets the evaluation information.
請求項3において、
前記プロセッサは、全フォルダのうち、前記フォルダスコア値が上位n%に含まれる第1のフォルダ群を特定し、当該第1のフォルダ群に含まれるフォルダに第1の表示形態を割り当て、さらに、前記第1のフォルダのうちさらに前記フォルダスコア値が上位n%に含まれる第2のフォルダ群を特定し、当該第2のフォルダ群に含まれるフォルダに第2の表示形態を割り当てる表示形態割り当て処理を実行し、当該表示形態割り当て処理を繰り返すことにより、前記削除候補となるフォルダの表示形態を決定することを特徴とする検索装置。
In claim 3,
The processor specifies a first folder group including the folder score value in the top n% of all folders, assigns a first display form to the folder included in the first folder group, and A display form assignment process for specifying a second folder group whose folder score value is included in the upper n% of the first folders and assigning a second display form to the folders included in the second folder group And a display form assignment process is repeated to determine the display form of the folder as the deletion candidate.
請求項3において、
前記プロセッサは、各フォルダの前記フォルダスコア値を、該当するフォルダ直下のファイルの前記ファイルスコア値を合計することにより算出することを特徴とする検索装置。
In claim 3,
The search device, wherein the processor calculates the folder score value of each folder by summing the file score values of files immediately under the corresponding folder.
請求項5において、
前記プロセッサは、対象のフォルダの下位階層に前記削除候補と判断された下位フォルダがある場合には、前記対象のフォルダが削除候補ではないと判断された場合でも、前記対象のフォルダを削除候補ではないことを示す表示形態で前記表示装置に表示することを特徴とする検索装置。
In claim 5,
When there is a lower folder that is determined as the deletion candidate in a lower hierarchy of the target folder, the processor determines that the target folder is not a deletion candidate even if it is determined that the target folder is not a deletion candidate. A display device that displays on the display device in a display form indicating that there is no data.
ファイルサーバに接続された検索装置において、複数のファイルと複数のフォルダを管理する文書管理方法であって、
前記検索装置は、ファイルの不要度を決定するための評価情報であって、異なる複数の項目で構成される評価情報と、検索用の複数のファイル及びフォルダを含む検索用インデックスデータと、を保持する記憶装置と、前記ファイサーバを巡回し、前記検索用インデックスデータを作成するプロセッサと、を有し、
前記評価情報は、前記複数の項目のそれぞれについて、前記複数のファイルを分類するための複数の閾値を含み、
前記文書管理方法は、
前記プロセッサが、前記ファイルサーバを巡回する度に、前記評価情報における各項目の前記複数の閾値を設定するステップと、
前記プロセッサが、前記評価情報に基づいて前記ファイルの不要度のファイルスコア値を算出し、ファイルの不要度のスコア値に基づいて当該ファイルを含むフォルダの不要度を示すフォルダスコア値を算出し、当該フォルダスコア値によって削除候補となるフォルダを検出するステップと、
を含むことを特徴とする文書管理方法。
A document management method for managing a plurality of files and a plurality of folders in a search device connected to a file server,
The search device is evaluation information for determining the degree of file unnecessary, and holds evaluation information composed of a plurality of different items and search index data including a plurality of search files and folders And a processor that circulates the file server and creates the search index data,
The evaluation information includes a plurality of thresholds for classifying the plurality of files for each of the plurality of items,
The document management method includes:
Each time the processor circulates the file server, setting the plurality of threshold values for each item in the evaluation information;
The processor calculates a file score value of the unnecessary degree of the file based on the evaluation information, calculates a folder score value indicating the unnecessary degree of the folder including the file based on the score value of the unnecessary degree of the file; Detecting a folder as a deletion candidate based on the folder score value;
A document management method comprising:
請求項7において、
さらに、前記プロセッサが、前記削除候補のフォルダを前記フォルダスコア値に応じて表示形態を区別して表示装置に表示するステップを含むことを特徴とする文書管理方法。
In claim 7,
The document management method further comprising the step of displaying the deletion candidate folder on a display device by distinguishing a display form according to the folder score value.
請求項8において、
前記複数の閾値を設定するステップにおいて、前記プロセッサは、前記複数の項目のそれぞれについて、前記検索用インデックスに含まれる全ファイルのうち上位m%に含まれる第1のファイル群を特定し、当該第1のファイル群に含まれるか否かの境界となる値を第1の閾値とし、前記第1のファイル群のうちさらに上位m%に含まれる第2のファイル群を特定し、当該第2のファイル群に含まれるか否かの境界となる値を第2の閾値とする閾値決定処理を実行し、当該閾値決定処理を繰り返すことにより前記複数の閾値を決定して、前記評価情報を設定することを特徴とする文書管理方法。
In claim 8,
In the step of setting the plurality of thresholds, the processor specifies a first file group included in the upper m% of all files included in the search index for each of the plurality of items, A value serving as a boundary whether or not to be included in one file group is set as a first threshold, a second file group included in the upper m% of the first file group is specified, and the second file group is specified. Executes a threshold value determination process using a value serving as a boundary as to whether or not it is included in the file group as a second threshold value, repeats the threshold value determination process to determine the plurality of threshold values, and sets the evaluation information A document management method characterized by the above.
請求項9において、
前記表示するステップにおいて、前記プロセッサは、全フォルダのうち、前記フォルダスコア値が上位n%に含まれる第1のフォルダ群を特定し、当該第1のフォルダ群に含まれるフォルダに第1の表示形態を割り当て、さらに、前記第1のフォルダのうちさらに前記フォルダスコア値が上位n%に含まれる第2のフォルダ群を特定し、当該第2のフォルダ群に含まれるフォルダに第2の表示形態を割り当てる表示形態割り当て処理を実行し、当該表示形態割り当て処理を繰り返すことにより、前記削除候補となるフォルダの表示形態を決定することを特徴とする文書管理方法。
In claim 9,
In the displaying step, the processor identifies a first folder group including the folder score value in the upper n% among all folders, and displays a first display on the folder included in the first folder group. A form is assigned, a second folder group in which the folder score value is further included in the upper n% of the first folder is specified, and a second display form is displayed in the folder included in the second folder group. A document management method characterized by determining a display form of a folder as a deletion candidate by executing a display form assigning process for assigning and deleting the display form assigning process.
請求項9において、
前記プロセッサは、各フォルダの前記フォルダスコア値を、該当するフォルダ直下のファイルの前記ファイルスコア値を合計することにより算出することを特徴とする文書管理方法。
In claim 9,
The document management method, wherein the processor calculates the folder score value of each folder by summing the file score values of files immediately under the corresponding folder.
請求項11において、
前記表示するステップにおいて、前記プロセッサは、対象のフォルダの下位階層に前記削除候補と判断された下位フォルダがある場合には、前記対象のフォルダが削除候補ではないと判断された場合でも、前記対象のフォルダを削除候補ではないことを示す表示形態で前記表示装置に表示することを特徴とする文書管理方法。
In claim 11,
In the displaying step, when the processor has a lower folder determined to be the deletion candidate in a lower hierarchy of the target folder, the processor may determine that the target folder is not a deletion candidate. A document management method characterized in that the folder is displayed on the display device in a display form indicating that it is not a deletion candidate.
検索対象データを有するファイルサーバと、請求項2乃至6の何れか1項に記載の検索装置と、クライアント装置と、を有し、
前記クライアント装置は、ユーザの指示に応答して、表示装置に表示された削除候補のフォルダの削除要求を前記検索装置に送信し、
前記検索装置は、前記削除要求に応答して該当するフォルダを前記検索用インデックスデータから削除し、前記検索用インデックスから削除されたフォルダを前記検索対象データから削除するように前記ファイルサーバに要求し、
前記ファイルサーバは、前記検索装置から受信したフォルダの削除要求に応答して、該当フォルダを削除し、前記検索対象データと前記検索用インデックスの内容について同期を取ることを特徴とする文書検索システム。
A file server having search target data, the search device according to any one of claims 2 to 6, and a client device,
In response to a user instruction, the client device transmits a deletion request for deletion candidate folders displayed on the display device to the search device,
In response to the deletion request, the search device deletes the corresponding folder from the search index data, and requests the file server to delete the folder deleted from the search index from the search target data. ,
In response to a folder deletion request received from the search device, the file server deletes the corresponding folder and synchronizes the contents of the search target data and the search index.
JP2011227278A 2011-10-14 2011-10-14 Search device, document management method, and document search system Expired - Fee Related JP5753056B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011227278A JP5753056B2 (en) 2011-10-14 2011-10-14 Search device, document management method, and document search system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011227278A JP5753056B2 (en) 2011-10-14 2011-10-14 Search device, document management method, and document search system

Publications (2)

Publication Number Publication Date
JP2013088931A true JP2013088931A (en) 2013-05-13
JP5753056B2 JP5753056B2 (en) 2015-07-22

Family

ID=48532803

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011227278A Expired - Fee Related JP5753056B2 (en) 2011-10-14 2011-10-14 Search device, document management method, and document search system

Country Status (1)

Country Link
JP (1) JP5753056B2 (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015087942A (en) * 2013-10-30 2015-05-07 株式会社日立ソリューションズ Business document processing device, business document processing method, program, and computer-readable storage medium
JP2018005522A (en) * 2016-06-30 2018-01-11 富士通株式会社 File presentation program, file presentation device, and file presentation method
JP2018532184A (en) * 2015-09-17 2018-11-01 ベリタス テクノロジーズ エルエルシー System and method for provisioning frequently used image segments from cache
CN112540968A (en) * 2020-12-10 2021-03-23 中信银行股份有限公司 Garbage recycling method and device of HDFS
JP2022142992A (en) * 2021-03-17 2022-10-03 Necプラットフォームズ株式会社 Hierarchical storage device, file control method, and file control program

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030172094A1 (en) * 2002-03-06 2003-09-11 International Business Machines Corporation Automatic file system maintenance
JP2005018225A (en) * 2003-06-24 2005-01-20 Fuji Xerox Co Ltd Document management device
JP2005148798A (en) * 2003-11-11 2005-06-09 Casio Comput Co Ltd Information processing device and information processing program
JP2006302010A (en) * 2005-04-21 2006-11-02 Kyocera Mita Corp Information processor
JP2009301534A (en) * 2008-06-11 2009-12-24 Hitachi Software Eng Co Ltd File retrieval system
JP2011059919A (en) * 2009-09-09 2011-03-24 Fujitsu Ltd Information management device, information management method, and information management program

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030172094A1 (en) * 2002-03-06 2003-09-11 International Business Machines Corporation Automatic file system maintenance
JP2005018225A (en) * 2003-06-24 2005-01-20 Fuji Xerox Co Ltd Document management device
JP2005148798A (en) * 2003-11-11 2005-06-09 Casio Comput Co Ltd Information processing device and information processing program
JP2006302010A (en) * 2005-04-21 2006-11-02 Kyocera Mita Corp Information processor
JP2009301534A (en) * 2008-06-11 2009-12-24 Hitachi Software Eng Co Ltd File retrieval system
JP2011059919A (en) * 2009-09-09 2011-03-24 Fujitsu Ltd Information management device, information management method, and information management program

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015087942A (en) * 2013-10-30 2015-05-07 株式会社日立ソリューションズ Business document processing device, business document processing method, program, and computer-readable storage medium
JP2018532184A (en) * 2015-09-17 2018-11-01 ベリタス テクノロジーズ エルエルシー System and method for provisioning frequently used image segments from cache
JP2018005522A (en) * 2016-06-30 2018-01-11 富士通株式会社 File presentation program, file presentation device, and file presentation method
CN112540968A (en) * 2020-12-10 2021-03-23 中信银行股份有限公司 Garbage recycling method and device of HDFS
JP2022142992A (en) * 2021-03-17 2022-10-03 Necプラットフォームズ株式会社 Hierarchical storage device, file control method, and file control program
JP7222491B2 (en) 2021-03-17 2023-02-15 Necプラットフォームズ株式会社 Hierarchical storage device, file control method and file control program

Also Published As

Publication number Publication date
JP5753056B2 (en) 2015-07-22

Similar Documents

Publication Publication Date Title
US9251157B2 (en) Enterprise node rank engine
JP5005726B2 (en) Managing media files from multiple sources
US10417265B2 (en) High performance parallel indexing for forensics and electronic discovery
JP4930153B2 (en) Document search system, document number subsequence acquisition apparatus, and document search method
JP5759915B2 (en) File list generation method and system, program, and file list generation device
JP5753056B2 (en) Search device, document management method, and document search system
JP2005078612A (en) File sharing system, and file transfer method between file sharing systems
WO2010076625A1 (en) Method, apparatus and computer program product for providing analysis and visualization of content items association
US20070100888A1 (en) Method and apparatus for managing content file information, and recording medium storing program for performing the method
KR101744892B1 (en) System and method for data searching using time series tier indexing
US9280551B2 (en) De-duplication deployment planning
US20130346385A1 (en) System and method for a purposeful sharing environment
CN101432727A (en) Item type specific structured search
US20120239657A1 (en) Category classification processing device and method
JP2010003309A (en) File management system and file management method
CN107408239B (en) Architecture for managing mass data in communication application through multiple mailboxes
JP5912949B2 (en) Business document processing system and program
JPWO2010061538A1 (en) Information search apparatus, information search method, and program
JP2012208565A (en) Log management method, log management device, and program
JP5757187B2 (en) File storage location candidate determination device, file storage location candidate determination method, file storage location determination support system, and computer program
JPWO2014002161A1 (en) Information processing apparatus, file management method, and file management program
WO2019163610A1 (en) Information processing system and information processing method
JP2012027841A (en) Retrieval program, retrieval device, retrieval system, retrieval method, and recording medium
US9256608B2 (en) Mapping user content to folders in a file system
CN111061755A (en) Document-based vigilance of medications

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140724

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150123

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150203

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150406

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150507

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150521

R150 Certificate of patent or registration of utility model

Ref document number: 5753056

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees