JP2004013213A - Logical directory constituting method, logical tree display method, logical tree display condition setting method, and information processor - Google Patents

Logical directory constituting method, logical tree display method, logical tree display condition setting method, and information processor Download PDF

Info

Publication number
JP2004013213A
JP2004013213A JP2002161673A JP2002161673A JP2004013213A JP 2004013213 A JP2004013213 A JP 2004013213A JP 2002161673 A JP2002161673 A JP 2002161673A JP 2002161673 A JP2002161673 A JP 2002161673A JP 2004013213 A JP2004013213 A JP 2004013213A
Authority
JP
Japan
Prior art keywords
keyword
file
logical
directory
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2002161673A
Other languages
Japanese (ja)
Inventor
Koichi Kato
加藤 浩一
Tetsuei Akaishi
赤石 哲英
Yoshimiki Matsuura
松浦 義幹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MEDIASELECT Inc
Original Assignee
MEDIASELECT Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MEDIASELECT Inc filed Critical MEDIASELECT Inc
Priority to JP2002161673A priority Critical patent/JP2004013213A/en
Publication of JP2004013213A publication Critical patent/JP2004013213A/en
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To solve the problem that when there are many objects of detection, it is not easy to detect a target through file retrieval by a file retrieving tool without storing a period of file generation, a use application kind, a file name, a physical directory name, a folder name, etc. <P>SOLUTION: Feature components of a file to be retrieved are previously extracted by monitoring a use history and actions of a user, a metadata list for constituting a logical directory is generated, and file retrieval under the logical directory can be performed. <P>COPYRIGHT: (C)2004,JPO

Description

【0001】
【発明の属する技術分野】
本発明は、コンピュータのファイルについて、物理ディレクトリーを論理ディレクトリーに区分及び再編成する方法に関し、より詳細にはユーザーの利用履歴及びアクションに応じて、論理ディレクトリー(マップ)を作成し及び利用するための方法に関する。
【0002】
【従来の技術】
近年、パーソナルコンピュータ(以下PC)の利用は急速に増大しており、この傾向は、電子メールやWorldWideWeb(WWWまたはWeb)を利用するユーザーの増加に伴って特に顕著となっている。また、ハードウェアの進歩に伴いハードディスクなどの記憶装置の容量が増大し、1台のPCで管理できるファイルの数も膨大となってきている。このような状況下において、ユーザーは膨大な数のファイルの中から所望のファイルを見つけるためには、自己の記憶を辿って物理ディレクトリー内を探索するか、又はファイル検索処理を実行する。このファイル検索処理は、ファイル名、使用アプリケーション種別、物理ディレクトリーなどの要素に基づき、検索ツールを用いて行っている。
【0003】
【発明が解決しようとする課題】
ファイル検索ツールによるファイル検索では、単純にキーワードによる部分もしくは全文検索によって実行されており、検索結果は単純なマッチングリストであるために、実際に検索したいターゲットとの意味づけは行われておらず、検索結果が役に立たないことが多い。また、その関連ファイルの検索には、あらためてキーワード検索を行う必要があり、ユーザーに大きな苦労を強いていることが珍しくない。このような問題点は、検索空間の構造によるものであり、従来のファイル保管方法、検索手法、そして検索編成スキームに本質的な欠陥があることに原因を見いだすことができる。
【0004】
さらに、ユーザーは、ファイル作成の時期、使用アプリケーション種別、ファイル名、物理ディレクトリー名、フォルダ名などを記憶していない限り、検索エンジンの結果を基にしても、その対象が多い場合には対象にたどり着くのが容易でないといった問題がある。
【0005】
【課題を解決するための手段】
本発明は、以下の方法を提供することにより上記課題を解決する。
【0006】
コンピュータの記憶手段に格納された1以上のファイルで構成される物理ディレクトリーから論理ディレクトリーを構成するための論理ディレクトリー構成方法であって、前記ファイルに対して前記コンピュータのユーザーが行うアクションを検知するユーザーアクション検知工程と、前記ユーザーアクション検知工程において前記ファイルに対するアクションが検知された場合に、前記ファイルに対してキーワード検索を行うキーワード検索工程と、前記キーワード検索工程におけるキーワード検索の結果に基づいて、前記ファイルのメタデータファイルを構成するメタデータファイル構成工程と、前記メタデータファイル構成工程において構成された前記メタデータファイルと前記ファイルとを、前記物理ディレクトリーの構成に基づいて一元化して論理ディレクトリーを構成する論理ディレクトリー構成工程とを備える。
【0007】
ここで、前記ユーザーアクション検知工程において検知される前記アクションには、前記ファイルの保存、変更、削除及びメール送信のうち少なくともいずれかのファイル操作が含まれてもよい。また、前記ユーザーアクション検知工程は、前記ファイルの保存、変更、削除及びメール送信のうち少なくともいずれかのファイル操作が完了した場合に、前記アクションを検知してもよい。
【0008】
さらに、前記キーワード検索工程は、前記キーワードを格納するユーザーキーワードデータベースを管理するユーザーキーワード管理工程と、前記ユーザーキーワードデータベースに格納されたキーワードについて前記ファイルを全文検索する全文検索工程とを備え、更に、前記全文検索工程における全文検索結果に基づいて、前記ユーザーキーワードデータベース内に構成された前記キーワードの使用履歴情報を格納するキーワードアクセステーブルを更新するテーブル更新工程と、前記キーワードデータテーブルの内容に基づいて前記キーワードについてキーワード重み情報を生成して、前記ユーザーキーワードデータベース内にキーワードデータテーブルを構成するテーブル構成工程とを備えてもよい。ここで、前記キーワード重み情報が、前記全文検索工程における前記キーワードの使用頻度、使用時期及び使用頻度の偏りのうち少なくともいずれかを含んでもよい。
【0009】
また、前記メタデータファイルは、前記ファイルに関連する関連キーワード及び前記ファイルについてのファイル重み情報を含み、前記ユーザーアクション監視工程が前記ファイル操作に関連する情報を抽出するファイル操作関連情報抽出工程を備える場合は、前記メタデータファイルが更に前記ファイル操作関連情報を含んでいてもよい。また、前記ファイル重み情報には、前記ファイル内における前記関連キーワードの検出数を示す情報、前記ファイルのファイル名及び新規入力部分における前記関連キーワードの検出数を示す情報、又は、前記ユーザーアクション検知工程において前記アクションが検知された際の時間情報が含まれてもよい。
【0010】
また、本発明の別の側面においては、コンピュータの記憶手段に格納された1以上のファイルからなる物理ディレクトリーに基づいて構成される論理ディレクトリーに格納されたデータを利用して所定のキーワードに関連する前記ファイルを表示部に論理ツリー表示する論理ツリー表示方法であって、前記キーワードを選定するキーワード選定工程と、前記論理ツリーの表示形態を設定する表示形態設定工程と、前記キーワード選定工程において選定されたキーワードと前記表示形態設定工程において設定された表示形態に基づいて、前記論理ディレクトリーに格納された前記データの中から論理ツリー表示のためのデータを抽出するデータ抽出工程と、前記データ抽出工程において抽出した前記論理ツリー表示のためのデータに基づいて前記表示形態に対応する論理ツリーを表示する表示工程とを備える。
【0011】
ここで、前記キーワード選定工程が、前記コンピュータのユーザーからのキーワードの選定入力を受け付けるキーワード選定受付工程を備え、前記表示形態設定工程が、前記ユーザーによって指定される表示形態の指定入力を受け付ける表示形態指定受付工程を備え、前記データ抽出工程が、前記表示形態指定受付工程において受け付けた前記ユーザーからの指定入力に基づいて、類似ポイント関数の演算を実行する演算工程と、前記演算工程における類似ポイント関数の演算結果に基づいて、論理ツリー情報を生成する論理ツリー情報生成工程とを備え、前記表示工程が、前記論理ツリー情報を論理ツリー表示してもよい。
【0012】
さらに、前記論理ツリー情報生成工程が、前記ユーザーからの指定入力に基づき前記生成した論理ツリー情報について、ツリーの階層数、ツリーのリンク数、及び、ツリー表示されるファイル数のうち少なくとも1つを絞り込むツリー絞込工程を備えてもよい。また、前記論理ディレクトリーは上述した論理ディレクトリー構成方法によって構成された論理ディレクトリーであってもよい。
【0013】
また、前記演算工程が、前記キーワード重み情報及び前記ファイル重み情報に基づいて前記類似ポイント関数の演算を行ってもよい。
【0014】
本発明の更に別の側面では、コンピュータの記憶手段に格納された1以上のファイルからなる物理ディレクトリーに基づいて構成される論理ディレクトリーに格納されたデータを利用して所定のキーワードに関連する前記ファイルを表示部に論理ツリー表示するための論理ツリー表示条件設定方法であって、前記キーワードの設定入力を受け付けるキーワード設定受付工程と、表示ファイルの数及び前記キーワードと表示ファイルとの関連度のうち、少なくともいずれか一方を設定することにより前記ツリーの表示形態を指定する表示形態指定工程とを備える。
【0015】
上記の課題は、上述した方法を実行可能な情報処理装置、さらに当該方法をコンピュータに実行させるためのコンピュータプログラム及び当該コンピュータプログラムを記憶したコンピュータが読取り可能な情報記憶媒体を提供することによっても解決されることは言うまでもない。
【0016】
【発明の実施の形態】
以下、図面を参照して本発明の実施形態を説明する。図1は、本発明の実施形態に対応したユーザー端末100のブロック図である。
【0017】
CPU101は、ROM102、RAM103、または、内部記憶装置104、外部記憶装置(105)に記憶されたプログラムから読み出されたプログラムに従って、後述の論理ディレクトリー構成処理を含めてシステムバスを介したユーザー端末100全体の動作を制御するものである。ROM102は、CPU101の制御プログラム等を格納している。RAM103は、一時的にプログラムや画像データを記憶し、ユーザー端末100の処理を高速に動作させるためのものである。
【0018】
内部記憶装置104は、オペレーティング・システム、各種アプリケーションプログラムや表示用オブジェクトなどの画像データ等が格納されている。また内部記憶装置104には、本発明におけるユーザーキーワードデータベースやメタデータデータベースが格納されている。さらに本実施形態における論理ディレクトリー構成処理のためのソフトの他、ユーザー端末100で実行されるアプリケーションプログラム(例えばワープロ、表計算のプログラムや電子メールプログラム等)を格納する。また、論理ディレクトリー構成処理の基礎となる、テキストデータが抽出可能な、又は、全文検索や部分検索が可能なファイル群も格納する。
【0019】
操作部105は、ユーザーからの指示入力手段としてのキーボードやマウス(不図示)を制御するものである。ユーザー端末100に対する命令、操作には、通常、操作部105のキーボードやマウスで行われる。
【0020】
表示部106は、ユーザーに各種表示を行うものである。例えば、ユーザー端末100で後述する論理ツリー表示を行う場合には、図6に示すような設定画面等をまず表示部106に表示し、ユーザーに入力を促す。また論理ツリーそのものの表示では、例えば図7に示す画面をユーザーに提供する。
【0021】
通信部107は、図示しないネットワーク(例えばLANやインターネット等)に接続したり、通信回線を通してインターネットプロバイダへの接続や、相手通信装置との間でのデータや画像情報等の通信を行う。ネットワークや通信回線への接続に関しては、公知の方法を使用するものとし、詳述しない。
【0022】
本実施形態では、上記図1のユーザー端末100において検索対象となるファイルの特徴成分をあらかじめ抽出してメタファイルデータを生成し、このメタファイルデータに基づいて論理ディレクトリーを構成する論理ディレクトリー構成処理を実行する。論理ディレクトリーは、論理ディレクトリー構成エージェントがOS動作環境のバックグラウンドで自動的もしくは手動により動作することにより構成される。この論理ディレクトリー構成エージェントは、ユーザーの利用履歴及びアクションに応じて、論理ディレクトリーを構成するためのメタデータファイルを生成する。更に本実施形態では、論理ディレクトリー内に格納されたメタデータファイルを用いて、ディレクトリーの多階層マップが作成され、コンテンツ、キーワード、ファイル関連性(トポロジー)、関連度の全てが視覚的に提供される。
【0023】
本実施形態における論理ディレクトリー構成処理は、テキストデータが抽出可能な、もしくは、全文検索、部分検索が可能なファイルを扱う動作環境において実行することができる。よって、例えば、Microsoft(登録商標)社のOffice(登録商標)のようなワープロ、表計算のファイルだけでなく、メールシステムにおける個々のメール、Web際とを参照する際の履歴などが論理ディレクトリーの構成要素に含まれることは言うまでもない。
【0024】
また、本実施形態では図1に示すユーザー端末100において動作するOSがMicrosoft社Windows(登録商標)の場合について説明する。しかし、OSをWindows(登録商標)としたのは本実施形態の説明を目的としたものであって、本発明を実施するためのOSはWindows(登録商標)に限定されるものではなく、Windows(登録商標)以外の他のOS(Machintosh(登録商標)社のMacOS、UNIX(登録商標)、Linux等)を適用した場合であっても、本発明が実施可能なのはいうまでもない。
【0025】
図2は、本実施形態における論理ディレクトリー構成エージェントの構成の一例を示す図である。本発明において、論理ディレクトリーとは、物理ディレクトリーに格納されたファイル群と所定のキーワードとの関連性をユーザーの利用履歴とアクションとに基づいて区分・再編成することによって構成されるディレクトリーである。論理ディレクトリーでは、各ファイルがそれぞれが有する特徴成分によって関連づけられる。物理ディレクトリーにおける各ファイルの格納場所は、論理ディレクトリーを構成する過程において参酌されても良い。
【0026】
図2において、201は、ユーザーのアクションを監視するユーザーアクション監視エンジンである。202は、ユーザーアクション監視エンジン201からの通知をトリガーとして、対象ファイルのキーワード検索を実行するためのメタファイル構成エンジンである。203はユーザーキーワード管理エンジンであり、204のユーザーキーワードデータベースを管理する。また、ユーザーキーワードデータベース204は、キーワードアクセステーブル204aとキーワードデータテーブル204bを含んでいてもよい。
【0027】
205は、ユーザーキーワード管理エンジン203でキーワードの検出を行うための全文検索エンジンである。206は対象ファイルの物理ディレクトリーとメタデータファイルを一元化し、メタデータデータベース207を構成すると共に、その管理を行うための物理ディレクトリー管理エンジンである。207は、物理ディレクトリー管理エンジン206によって管理されるメタデータデータベースであって、キーワード記録テーブル207aとファイル記録テーブル207bを含む。208は、メタデータデータベース207に格納されたメタデータファイル等に基づき論理ツリーを作成・表示するための論理ツリー表示エンジンである。
【0028】
図2における各ブロック(201から208)の機能は、図3に示すフローチャートの処理と併せて以下においてより詳細に説明する。
【0029】
図3は、本実施形態における論理ツリー表示のための処理のフローチャートである。S301において、ユーザーアクション監視エンジン201は、ファイルI/Oなどを制御するシステムAPIを監視し、その都度メタファイル構成エンジン202にそのアクションを通知する。監視対象アクションには、ファイルの保存(新規又は上書き)、変更、削除、メール送信(新規、転送)、削除、Web等のブラウジングなどが含まれる。従って、ユーザーが新規文書を作成したり、受信したメールを他人に転送する等のアクションを行った場合は、ユーザーアクション監視エンジン201により当該アクションがあった事実がメタファイル構成エンジン202へ通知される。なお、アクションとは所定の動作が完了したことを意味するものであり、例えば新規文書の作成であれば文書作成動作はユーザーアクション監視エンジンによって監視されるアクションそのものではない。即ち、ユーザーが作成した文書を保存して終了した段階で例えば「新規ファイルの保存」というアクションが行われたことが認識され、当該事実がメタファイル構成エンジン202へ通知されるのである。
【0030】
APIの監視について更に一例を説明する。ユーザーアクション監視エンジン201は、OSやファイルシステムが有する所定の機能を利用してファイルに対する操作をトラップして、ファイル操作情報を収集することができる。ここでOS等が有する所定の機能には、例えばWindows(登録商標)2000/XP(登録商標)で用いられているNTFS5.0や5.1の再解析ポイント機能という機能がある。この機能を利用すれば、操作されたファイルのフルパス名、ファイル作成日、ファイル最終更新日、アクセス回数(オープン回数をカウントしてデータを得る)などのファイル操作情報を収集することができる。
【0031】
次に、S302において、メタファイル構成エンジン202は、ユーザーアクション監視エンジン201からの通知をトリガーとして、対象ファイルのキーワード検索を実行する。更に、S303においてユーザーキーワード管理エンジン203の有するユーザーキーワードデータベース204とマッチングが取れた単語をメタデータとして抽出し、キーワード及び当該対象ファイルの重みとなる情報をメタデータファイルとして構成する。ここでファイルの重みとなる情報には、例えばファイルのタイトルや本文中に含まれるキーワード数等が含まれる。また、ユーザーアクション監視エンジン201からの通知にはファイル操作情報が含まれており、当該ファイル操作情報から、ユーザーが実行した処理の種別(新規作成、上書き、転送、参照、添付)、ファイルの作成日時、実行したアプリケーションの種別などを抽出しメタデータファイルとして構成する。このようにして構成されたメタデータファイルは、物理ディレクトリー管理エンジン206へ送信される。
【0032】
S303で生成されるメタデータとは、対象ファイルに関連する属性情報、及び当該対象ファイルとキーワードとの関連(このように対象ファイルと関連を有するキーワードを関連キーワードと呼ぶ)において見いだすことができる属性情報が含まれる。また、メタデータファイルとはメタデータの集合体と考えてもよい。メタデータファイルのデータ形式は特に限定されるものではなく、所定の動作環境において利用可能なデータ形式を任意に利用できることは言うまでもない。
【0033】
メタファイル構成エンジン202から物理ディレクトリー管理エンジン206へ送信されるデータは、後述するキーワード記録テーブル207a及びファイル記録テーブル207bに格納されるデータに相当する。このとき、ファイルやメールのタイトル部、ファイルの新規加筆部分にあるキーワードの重みを上げるため、所定の変数を乗じたり、新規加筆部分を元ファイルのキーワードと新ファイルのキーワードとの差分で判別することもできる。
【0034】
ここで、ユーザーキーワード管理エンジン203は、1〜n個の(nはユーザーもしくはシステムの制約によって決定される)キーワードをユーザーキーワードデータベース204内に保管している。ユーザーキーワードデータベース204は、後述するキーワードアクセステーブル204aとキーワードデータテーブル204bを含んでいてもよい。キーワードデータベース204内に格納されるキーワードはユーザーが任意のキーワードを指定することによって決定されても良いし、デフォルトとして使用頻度の高いと思われるキーワードをn個設定しておき、その後の使用頻度などに応じて変更しても良い。
【0035】
キーワードデータベース204に格納される内容は、それを格納するハードディスクなどの記憶媒体の容量によって変更することが可能であり、容量が小さい場合には使用頻度などの重みについて所定の演算結果を格納しておき、容量が大きい場合には実際に使用された時期を全て格納しておき、演算によって使用頻度や使用時期の重みを求めても良い。
【0036】
ユーザーキーワード管理エンジン203は一般用語辞書を備えており、キーワードデータベース204に格納されているキーワードは、使用頻度などに基づいて一般用語辞書から抽出された語句である。ユーザーはキーワードとして不適切な用語のキーワードデータベース204への登録を排除することができる。これは、「ファイル」、「メール」のように多くのファイルに含まれる可能性の高い語句をキーワードとした場合に関連づけの効率が上がらなくなることを防ぐためである。
【0037】
本実施形態において、ユーザーキーワード管理エンジン203によるキーワードの検出には全文検索エンジン205を使用する。具体的には、OSはまずGUIシステムの持っている機能を利用することで、各ファイルの種別に対応するアプリケーションを判別することができる。例えば、Windows(登録商標)の場合、拡張子”DOC”はMicrosoftWord(登録商標)の文章であることはシステムに問い合わせればわかる。このように、アプリケーションが判別できればそのアプリケーションのAPI等を利用してそのデータのテキスト部分やタイトル、作成者等の種々の情報を取得することができる。これらの取得したデータについて全文検索エンジン205により全文検索をかけ、ヒットしたキーワードを基に必要なメタデータを作成することができる。
【0038】
ここで図4を参照して、キーワードアクセステーブル204aとキーワードデータテーブル204bの一例を示す。図4aは、キーワードアクセステーブル204aの一例を示すものである。キーワードアクセステーブル204aとは、検索対象のファイル中に所定のキーワードの出現を検知した場合にその日時を記録したものである。例えば、あるファイルに「予算」というキーワード301が5つ見つかった場合には、検出数303として「5」と当該ファイルの処理日時302を記録する。なお、キーワード検索はユーザーがファイル保存等の動作を完了した時に実行されるので、キーワードの出現を検知した日時は当該ファイルを処理(例えば、保存、削除、送受信、転送等)した日時と対応する。また、キーワードアクセステーブルにエントリしているキーワード数は上記の通りn個である。
【0039】
次に、図4bは、キーワードの頻度と時期等を記録したキーワードデータテーブル204bの一例を示す図である。図4aに示すキーワードアクセステーブルには、上記のようにn個のキーワードの使用履歴が格納されているので、この履歴情報に基づいて、一定期間内における使用時期の中央値(時期405)、一定期間内に各キーワードが何回検出されたか(使用頻度406)及び各キーワードが1ファイルについて平均何回検出されたか(使用頻度偏り407)等を抽出してテーブルエントリデータとする。例えば、キーワードとして「予算」を例にとると、使用頻度:25、使用頻度の偏り:5、時期:2002/4/1となる。ここで、一定期間とは例えば1日、1月、6月、1年など任意に定めることができる。また、当該期間についてはユーザーが任意に設定可能としても良い。
【0040】
このように、キーワードデータテーブル204bは一定期間毎に更新されるので、キーワードデータベース204の内容はキーワードに与えられた重みに従い随時ソートが行われることになる。そこで図8を参照して、ユーザーアクションに対応してキーワードデータテーブル204bを更新する処理の流れを改めて説明する。
【0041】
まずS801において、ユーザーアクション監視エンジン201によりユーザーアクションが監視され、ユーザーアクションの有無が判定される。ここで例えば上書き保存などのアクションがあった場合にはS802へ進み、メタファイル構成エンジン202が対象ファイルのキーワード検索を実行する。このキーワード検索の結果によって、キーワードアクセステーブル204aが更新される。次に、S804において設定されている一定期間、即ち更新期間が経過したか否かが判定される。もし更新期間が経過していないと判定された場合は、S805には進まず、S801においてユーザーアクションの監視処理に戻る。一方、更新期間が経過したと判定された場合には、S805に進み、上記一定期間内におけるキーワードアクセステーブル204aの内容に基づいて、キーワードデータテーブル204bの内容を更新する。
【0042】
尚、図8のフローチャートでは説明の容易のために、S803におけるキーワードアクセステーブル204aの更新に続いて、S804にて更新期間の経過を判定したが、更新期間経過を判定する処理は常にバックグラウンドにおいて実行されていてもよい。その場合はユーザーアクションの有無やキーワードアクセステーブル204aの更新に拘わらずキーワードデータテーブル204bを更新することができる。
【0043】
さらに、本実施形態ではキーワードデータテーブル204bに使用頻度406と共に使用頻度の偏り407を格納することにより、一つ一つのファイル内で検出される数は少ないがたまたま多数のファイルで検出されたために使用頻度が高くなっているキーワードよりも、1ファイルにおいて多数検出されるキーワードの重みを高くするように調整することができる。また、上記の時期405を求める場合は、例えば一定期間内に所定のキーワードが検出された日時の単純な平均を求めてもよい。さらに、縦軸をキーワードの検出数、横軸を日時とする座標系を考え、この座標系において日時と検出数から求まる面積に基づいてメジアンや偏差をとってもよい。その他、一定期間における使用時期の中央値として時期を求めるための手法が適用可能であることはいうまでもない。
【0044】
ここで図3の説明に戻ると、S304において物理ディレクトリー管理エンジン206は、対象ファイルの物理ディレクトリーとメタファイル構成エンジン202によって作成又は更新されたメタデータファイルを一元化し、メタデータデータベース207を構成すると共に、その管理を行う。ここで一元化とは、メタデータファイルを物理ディレクトリーにおける対象ファイルと関連づけることを意味する(より具体的には図5を参照のこと)。これにより、当該メタデータファイルが、物理ディレクトリーのどこに格納されたどのファイルと関連するのかが明確化される。また、物理ディレクトリーにおいてファイルが削除された場合や、物理ディレクトリーにおける単純な移動についての記録も行い、メタデータデータベース207の内容(物理ディレクトリーに関連するデータについて)を随時更新する。
【0045】
このように、論理ディレクトリーはメタデータデータベース207に格納されているが、メタデータデータベース207自体にはファイルデータそのものは格納されいない。即ち、メタデータデータベース207には、物理ディレクトリーに本体が格納されたファイルについて論理ディレクトリーを構成するために必要な情報が格納されているものである。
【0046】
メタデータデータベース207は、例えば新規作成、上書き、名前を変えて保存、削除などのファイルの操作に関連する情報を格納している。また、所定のファイルにおいて検出されたキーワードに関連する情報も格納している。
【0047】
そこで、図5を参照してメタデータデータベース207に格納されているキーワード記録テーブル207aとファイル記録テーブル207bの一例を示す。図5aは、キーワード履歴テーブル207aの一例を示すものである。キーワード記録テーブル207aとは、所定の検索対象ファイルについて、当該ファイル内で検出されたキーワードに関する情報を格納するテーブルであり、ファイル毎に検出されたキーワードの数に相当するテーブルが生成される。図5a中のC:¥事業計画¥平成14予算.docというファイルについて着目すると、キーワードを「予算」とした場合、ファイル名に当該キーワードが検出された回数(Ct503)を1、本文の新規書き込み部分におけるキーワードの出現回数(Cn504)を3、元々のファイルにおけるキーワードの出現回数(Cb505)を1として格納している。
【0048】
メタデータデータベース207では、ファイル名を物理ディレクトリーと関連づけて格納する必要があるので、キーワード記録テーブル207aは物理ディレクトリーにおけるパス名も含めてファイル名を格納している。図5aのキーワード記録テーブル207aではエントリ項目について一つのキーワードに対して3種類を列挙したが、これらの項目はあくまで例示であって、これ以外にテンプレートにおいてキーワードが検出された回数(Ctemp1)等を項目として設定しても良いし、テンプレート自体重みを表す項目(Ctemp2)を設定してもよい。例えば後者の場合、「予算報告書」というテンプレートを利用するファイルは当然に「予算」のキーワードとの関連性が高くなる。従って、「予算報告書」のテンプレートを使ったファイルについては、Ctemp2の項目の値を特に大きくすればよい。また、これらに限らずファイルとキーワードを関連づけるための項目を任意に設定可能であることは言うまでもない。
【0049】
次に、図5bは、ファイル記録テーブル207bの一例を示すものである。ファイル記録テーブル207bとは、所定のファイルについて、実行されたアクションやアプリケーションの種別などの属性情報を格納するテーブルである。
【0050】
より具体的に図5bを参照して説明すると、ファイル名506がC:¥事業計画¥平成13予算.docというファイルについてみれば、当該ファイルについて、作成日時507として2002/5/20、実行されたアクション508が2、アプリケーション種別509がMicrosoft社のWordであればC:¥program¥word.exe、作者名510として△中×郎が格納されている。アクションには例えば新規作成:1、上書き:2、転送:3、参照:4、添付:5等といった具合に、それぞれのアクションに対応する識別番号が与えられており、ファイル記録テーブル207bには当該識別番号が格納されている。ユーザーが行ったアクションの種類はファイル自体の重みに反映されることになる。例えば、ユーザー自身が起こしたアクション、例えば新規文書の保存や既存文書の上書きは、ユーザーに対して行われたアクション、例えばメール受信や転送よりも重みが大きくなる。また、作成日時は、ユーザーアクション監視エンジン201が生成しメタファイル構成エンジン202経由で送られてきたファイル操作情報に基づいたものである。
【0051】
また、ファイル記録テーブル207bは、各物理ファイル(上記の場合であればC:¥事業計画¥平成13予算.doc)について1つ生成される。作者名のデータは、作者名を抽出可能なアプリケーションにおいてのみ有効となる。
【0052】
次にS305においてユーザーからの論理ツリー表示指示があったか否かを判定する。S304までの処理(本実施形態では、論理ディレクトリー構成処理と呼ぶところの処理)は、ユーザー端末100において例えばバックグラウンドで動作している処理であってもよいし、ユーザーが手動で起動して実行する処理であっても良い。バックグラウンドで実行される処理の場合、ユーザーがユーザー端末100を起動すると論理ディレクトリー構成処理が常駐処理となって、ユーザーが文書作成やメール送受信を行っている間、メタデータデータベース207が更新され論理ディレクトリーが構成されることになる。そして、ユーザーからの論理ツリー表示指示を受け付けると、S306において論理ツリー表示システム208が、メタデータファイルに基づき論理ツリーを作成・表示する。
【0053】
以下、S306における論理ツリー表示処理の詳細を図6及び図9を参照して説明する。図6は、論理ツリー表示のための所定の条件をユーザーが入力するための画面表示の一例である。図9は論理ツリー表示方法の処理のフローチャートである。図6に示す形態ではOKボタンをクリックすることにより入力内容が確定する。従って、図9のフローチャートに対応する処理は当該入力内容確定後に実行されても良いが、以下では理解の容易のために図6における入力箇所に対応する図9の処理を並行して説明する。
【0054】
まず、S901において、ユーザーからのキーワード指定入力を受け付ける。このとき、表示部106には図6の画面600が表示され、キーワード指示601に操作部105のキーボードやマウスを介して行われるユーザーからの入力が当該キーワード指定入力に相当する。キーワード指定入力においては、キーワードの重みが高いものから表示することを選択したり(601a)、ユーザーが検索したいキーワードをボックス601cに直接入力することによりキーワードを指定することもできる(601b)。なお、S901において受け付けるキーワードには、キーワードデータベースに格納されている複数のキーワードのいずれかが該当する。
【0055】
次に、S902において、ユーザーからの指定入力に応じて検索キーワードを決定する。ユーザーがボックス601cにキーワードを直接入力した場合には、当該キーワードが検索キーワードとされる。一方、キーワード指定601においてキーワード重み順に表示601aを選択した場合、キーワードデータテーブル204bに格納されたn個のキーワードの内、使用頻度が高いものや使用時期の新しいものが重みが高いとみなされ、当該重みの高いキーワードから論理ディレクトリーの検索が行われる。
【0056】
本発明では主としてバックグラウンドにおいてキーワードデータテーブル204bの更新処理が行われており、重みの高いキーワードはユーザーが最近処理したファイルに頻出のキーワードと言える。また、上記キーワードデータテーブル204bの更新処理によりユーザーの職業、使用目的などに応じて頻出キーワードは自ずと選定されることになるので、頻出キーワードであればわざわざ指定しなくても、検索をかけ最新のファイルを読出すことが可能となる。また、頻出キーワード以外のキーワードや複数のキーワードの組み合わせで検索をかけたいときには、キーワード指定601bを選択して、所定のキーワードを入力すればよい。
【0057】
次に、S903において、ユーザーからのツリー表示形態指定を受け付ける。ユーザーは図6の画面600中の602において、ツリー表示の形態を指定することができる。ツリー表示は表示形式603として2次元形式603aと、3次元形式602bのいずれかを選択することができる。また、ユーザーがツリー表示される場合のリンクの数を設定することも可能であり(604)、表示ファイル数を設定したり(604a)、キーワードとの関連度を任意に設定することによりリンク数を指定することができる(604b)。
【0058】
その他、リンクツリー深度を605において設定することができる。仮に、ユーザーが604aにおいてファイル数を指定することによりリンク数を設定したとしても、関連度の低いファイルが多く検出される場合は、ツリー深度が深くなる一方で、重要な不要なファイルばかり表示されることになる。そこで、このリンクツリー深度605を設定して不要なファイルの表示を防止することができる。このようにユーザーの指定数を越えるリンクは表示させない方法を採ることもできるが、表示されないリンクが存在する旨の通知を行うことにより、ユーザーは自分の把握しやすい詳細度において画面を管理することも可能である。
【0059】
さらに、後述するキーワード類似関数について、類似の質と量のいずれを重要視するかをやはりカーソル位置によって決定することができる(606a)。ここで「質」とはキーワード自体の重みを意味し、「量」とはキーワードが対象ファイル内において検索された数を意味する。
【0060】
また、ツリー表示させるためのキーワードの重み付けに関する設定を606bにおいて行うことができる。例えば、所定のキーワードがタイトルに使用されているファイルを検索したい場合には、キーワードの重みレベルを「タイトル」位置に合わせる事ができるし、本文においてキーワードが多く検出されたファイルを検索したい場合には「ファイル全体」に合わせればよい。図6のレベルメーター表示606bにおいては「タイトル」、「新規部分」、「ファイル全体」のうち1つが選択される態様となっているが、これは表示態様として示しただけであって、例えば「タイトル」が選択された場合には、「タイトル」とそれ以外との重み付けを変えてもよいし、「タイトル」以外を全く無視することもできる。
【0061】
S903における処理が終了すると、S904へ進み重み変数が決定される。重み変数には、キーワードの使用頻度などに関連するキーワード自体の重み変数と、キーワードの対象ファイル内における検出数に関連する重み変数とがある。もし、ユーザーがキーワード指定601においてボックス601cに単一のキーワード(例えば「予算」のみ)しか入力しなかった場合、キーワード自体の重み変数はこれ以降の処理に必要とされない。しかし、ユーザーがボックス601cに複数のキーワード(例えば、「予算or積立金or見積り」等)を入力した場合や、キーワード重み順に表示601aが選択された場合には、複数のキーワード間の優先度を決定するためにキーワード自体の重み変数が利用される。
【0062】
上記重み変数には、具体的にキーワードデータテーブル204bに格納された使用頻度、使用頻度の偏り、時期などのキーワード自体の重みを表す変数や、ファイル記録テーブル207bに格納された所定のキーワードに関連するCt、Cn、Cb等のキーワードと対象ファイルとの関連を示す重み変数が含まれる。
【0063】
変数を決定するの要素はツリー表示形態602における設定内容である。例えば、重みの種類606aとして「質」が選択されれば、キーワード自体の重みを表す変数が重み変数として決定され、「量」が選択されれば対象ファイル内のキーワード検出数に関するCt等が重み変数として決定される。また、キーワードの重み606bにおいて「タイトル」が選択されていれば、Ctが重み変数として決定され、他のCn、CbはCtに対して重みが低くなる。
【0064】
ここで、重みの種類606aの設定によっては、質、量のいずれか一方の重み変数を採用し採用されない他方は切り捨てても良い。しかし、重みの種類606aの設定レベルに応じて、さらに質、量に対し重み付けをする方がより詳細にファイルを区分することができる。例えば、重みの種類606aが量を重視する側に設定されている場合にキーワード検出数が同数だったとしても、キーワードの質、ちキーワードの重みを参照することにより重みがより大きい方が最終的に上位に表示されることになる。
【0065】
また、S904における重み変数では、単に類似ポイント関数の計算に使用する変数を決定するだけではなく、ユーザーからの指定入力内容に基づいて複数の変数間でさらに重み付けを行っても良い。例えば、対象ファイルにおけるキーワードの検出数(Ct、Cn及びCbの変数が存在する)を例に取ると、ユーザーからのキーワードの重み606bの入力で「タイトル」が選択されたとする。この場合選択された重みCtに対して所定の係数(例えばk)を乗じて他の重み(Cn、Cb)よりも重みを高くすることができる。
【0066】
次に、S905においてS904において決定された変数を用いて類似ポイント関数の計算を行う。類似ポイント関数とは、物理ディレクトリー内に格納された複数のファイルを、所定のキーワードとの関連性に基づいて順位付けするための基準値を算出するための関数であって、例えば以下の3つが相当する。
キーワードの重みを優先する(1)キーワード類似質関数
キーワードの量を優先する(2)キーワード類似量関数
ユーザーアクションのタイミングを優先する(3)タイミング類似関数
【0067】
上記類似ポイント関数を変数xの関数としてf(x)として表すと、変数xには、S904において決定された種々の重み変数が相当する。即ち変数xは複数の変数を代表する変数として例示したものであって、類似ポイント関数は単一変数の関数に限定されるものではない。また、ここで列挙した変数の態様は本実施形態に対応して記載したものであるが、あくまで例示であって、キーワードの重みや量を表す変数を任意に選択して利用することができるのは言うまでもない。
【0068】
さらに、対象ファイルが格納されている物理ディレクトリーの位置に関連する情報を変数とする物理ディレクトリー類似関数を含めて類似ポイント関数を算出しても良い。この物理ディレクトリー類似関数とは、対象ファイルが複数ある場合に、当該ファイルの類似度を物理ディレクトリーにおけるファイルの格納位置に応じて決定するための関数である。
【0069】
例えば、ファイルA、B及びCの物理パスがそれぞれC:¥usr¥local¥bin¥A.txt、C:¥usr¥local¥temp¥B.txt C:¥doc¥temp¥C.txtである場合、ファイルAとファイルBはC:¥usr¥localの下に位置し物理ディレクトリーに共通性を有するファイルである一方、ファイルCは全く異なる物理ディレクトリーに位置するファイルである。この場合、ファイルA,Bは類似度が高く、ファイルA,BとCは類似度が低くなる。従って、後述する論理ツリー表示において、ファイルAとBとの関連性を示すために隣接して表示する一方、ファイルCをファイルA、Bと離して表示することによりその物理的な関連性が低いことを表示することもできる。また、ローカルに限らずLANやインターネットなどのネットワークに接続された場合にも物理ディレクトリー類似関数の概念を適用可能であることはいうまでもない。
【0070】
続いてS906においてツリー情報を生成する。当該ツリー情報は類似ポイント関数の計算値を用いる以外は公知の情報処理技術を利用して生成することができる。例えば、階層を決定するための閾値を複数用意しておき、類似ポイント関数の値に応じてファイルのグループ化を行って階層を決定する。さらに、ファイルの類似度に応じて階層を構成するファイル間のリンクを形成することによって生成することができる。このファイルの類似度とは、物理ディレクトリー類似関数の計算値に基づく者であっても良いし、使用するアプリケーションや作者名、作成時期などにもとづいて決定される。また上記階層とは、類似ツリー表示される際の階層に対応するものである。
【0071】
また、ツリー情報生成は、ユーザーがツリー表示形式603について、2次元形式603aと3次元形式603bのいずれを選択したかに応じて処理が異なる。例えば、もし2次元形式を選択した場合には、上記(1)と(2)のポイント関数の計算値をそれぞれ縦軸の及び横軸の座標値として原点からの距離を求め、原点に近いものから階層化し、リンクを形成する。また、2次元座標系を利用せず単に平面表示する場合(図7aに示すような場合)には、(1)から(3)までの計算値を所定の演算結果に基づいて合計し、その合計値の大きさに基づいて階層化、リンク形成を行えばよい。一方、3次元形式603bが選択された場合には、(1)から(3)までの計算結果に基づいて上記2次元座標系の手法を3次元的に展開すればよい。
【0072】
次に、S907においてS906で生成されたツリー情報について階層数の絞り込みを行う。階層数の絞り込みはユーザーがリンクツリー深度605において設定した階層数に基づいて行われる。また、ユーザーがリンクツリー深度605を設定していない場合は、デフォルト値として例えば3階層まで表示するように設定しても良いし、他の表示指定の要素に基づいて階層数を決定しても良い。
【0073】
次に、S908において、ツリー情報をリンク数によってさらに絞り込む。この絞り込みは、ファイル間のリンクの数をユーザーによる関連リンク数設定604の設定内容に基づいて行われる。ユーザーが604aにおいてファイル数を指定した場合には、そのファイル数に対応するリンク数に絞り込みが行われ、関連度指定604bにおいて関連度が指定された場合には、類似ポイント関数の計算結果が所定の閾値を越えるファイルを特定し、そのファイル数に対応するリンク数に絞り込みが行われる。
【0074】
以上の絞り込みによって、表示部106に表示すべきツリー情報が生成されたので、S909において当該ツリー情報を表示情報に変換して表示部106に表示する。その際、表示されるリンクの外に位置するファイル、即ち表示部には直接表示されていないファイルについて、その存在を通知するための情報を表示部106に併せて表示しておいても良い。なお、表示のトリガーとして、ユーザーはOKボタンをクリックする。
【0075】
図7a及び図7bはS909における表示の一例を示す図である。図7aは「予算」というキーワードに対して関連するファイルを平面的に表示した場合の表示の一例を示す図である。ここで、キーワード「予算」は中央701に示され、中央から周辺にかけて702、703、704の点線で描かれた円が階層を示す線であり、当該点線上に存在するファイルA、ファイルBがキーワード予算と最も関連するファイルであり、ついでファイルA’、ファイルB’ファイルA’’ファイルCの順に関連性が弱くなっている。このように中心701からファイルまでの距離が類似ポイント関数の計算値を反映したものとなる。なお、点線702、703及び704は階層の境界を示すために例示的に記載したものであって、当該点線は表示部106に表示してもしなくてもよい。
【0076】
また、図7bは、類似ポイント関数(1)から(3)をそれぞれ3つの軸として3次元空間に表示した場合の一例を示す図である。
【0077】
このような表示形態において、ユーザーは表示されたファイル群の中から、自分が必要とするファイルにカーソルを持っていきダブルクリックなど所定の動作を行えば、当該ファイルを直接開くことができる。これは、メタデータデータベース207のファイル記録テーブル207bにおいて、当該ファイルが物理ディレクトリー506及びアプリケーション種別509と関連づけられて格納されていることにより可能となる。
【0078】
なお、以上の本実施形態における論理ディレクトリー構成処理は、ユーザー端末100において実行される場合を説明したが、LANやインターネットなどのネットワークに接続された複数のクライアント端末が存在する場合に、サーバー側で上記論理ディレクトリー構成処理を実行してメタデータファイルを生成し、各クライアント端末でこれを論理ツリー表示させても良い。
【0079】
以上の処理(例えば上記実施形態では図3及び図8に示したフローチャートに従った処理)をプログラムとしてCD−R、ROMやDVD−ROM、MO等の記憶媒体に記憶させ、この記憶媒体に記憶されているプログラムをコンピュータに読み込ませる(インストール、もしくはコピーさせる)ことで、このコンピュータは以上の処理を行うことができる。よって、この記憶媒体も本発明の範疇にあることは明白である。
【0080】
また、以上に説明した本発明の実施形態は、あくまで本発明を説明するために記載したものであって、本発明の実施形態を上記記載内容に限定することを意図したものではない。また、コンピュータを使用した情報処理の技術分野における当業者であれば、本発明の目的を達成するために上記の実施形態の記載内容を適宜変更・修正したり、均等物と置換することは容易になしえるものであり、その結果得られた発明も本発明の技術的範囲に属する発明そのものであることは明らかである。
【0081】
【発明の効果】
以上のように、本発明によれば物理ディレクトリーをユーザーの利用履歴及びアクションに応じて区分・再編成して論理ディレクトリーを構成することができ、当該論理ディレクトリーに基づいた検索が可能となる。これにより、キーワードと検索したいターゲットとの意味づけが行われることになり、ユーザーは当該ターゲットに関連するキーワードを把握するだけで、自己にとって意味のある検索結果を容易に取得できることとなり、検索処理効率が著しく向上する。
【図面の簡単な説明】
【図1】本発明のユーザー端末の構成の一例を示す図である。
【図2】本発明の論理ディレクトリー構成エージェントの構成の一例を示す図である。
【図3】本発明の実施形態に対応した論理ツリー表示のための処理のフローチャートである。
【図4a】本発明の実施形態に対応したキーワードアクセステーブルの構成の一例を示す図である。
【図4b】本発明の実施形態に対応したキーワードデータテーブルの構成の一例を示す図である。
【図5a】本発明の実施形態に対応したキーワード記録テーブル207aの構成の一例を示す図である。
【図5b】本発明の実施形態に対応したファイル記録テーブル207bの構成の一例を示す図である。
【図6】本発明の実施形態に対応した論理ツリー表示のための所定の条件をユーザーが入力するための画面表示の一例である。
【図7a】本発明の実施形態に対応した論理ツリー表示の一例を示す図である。
【図7b】本発明の実施形態に対応した論理ツリー表示の一例を示す図である。
【図8】本発明の実施形態に対応したユーザーアクションに対応してキーワードデータテーブル204bを更新するための処理のフローチャートである。
【図9】本発明の実施形態に対応した論理ツリー表示処理のフローチャートである。
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a method of partitioning and reorganizing a physical directory into logical directories for files on a computer, and more particularly, to creating and using a logical directory (map) according to a user's usage history and actions. About the method.
[0002]
[Prior art]
In recent years, the use of personal computers (hereinafter, referred to as PCs) has been rapidly increasing, and this tendency has become particularly remarkable with an increase in the number of users using e-mail and World Wide Web (WWW or Web). In addition, with the progress of hardware, the capacity of storage devices such as hard disks has increased, and the number of files that can be managed by one PC has become enormous. Under such circumstances, in order to find a desired file from an enormous number of files, the user searches his / her memory in the physical directory or executes a file search process. This file search process is performed using a search tool based on factors such as the file name, the type of application used, and the physical directory.
[0003]
[Problems to be solved by the invention]
In the file search by the file search tool, partial or full-text search is simply performed by keyword, and since the search result is a simple matching list, the meaning of the target to be actually searched is not performed. Search results are often useless. In addition, in order to search for the related file, it is necessary to perform a keyword search again, and it is not unusual for the user to have great difficulty. These problems are due to the structure of the search space, and can be found due to the inherent flaws in the conventional file storage method, search method, and search organization scheme.
[0004]
Furthermore, unless the user remembers the time of file creation, application type used, file name, physical directory name, folder name, etc., based on search engine results, if there are many such There is a problem that it is not easy to get to.
[0005]
[Means for Solving the Problems]
The present invention solves the above problems by providing the following method.
[0006]
A logical directory configuration method for configuring a logical directory from a physical directory composed of one or more files stored in storage means of a computer, wherein the user detects an action performed by a user of the computer on the file. An action detection step, a keyword search step of performing a keyword search on the file when an action on the file is detected in the user action detection step, and a keyword search result based on the keyword search step. A metadata file configuration step of configuring a metadata file of the file; and the metadata file and the file configured in the metadata file configuration step, based on the configuration of the physical directory. And a logical directory structure steps constituting the logical directory and centralized.
[0007]
Here, the action detected in the user action detecting step may include at least one of file operations of saving, changing, deleting, and sending an e-mail of the file. The user action detecting step may detect the action when at least one of file saving, changing, deleting, and sending an e-mail is completed.
[0008]
Further, the keyword search step includes a user keyword management step of managing a user keyword database that stores the keywords, and a full-text search step of performing a full-text search of the file for the keywords stored in the user keyword database. A table updating step of updating a keyword access table storing usage history information of the keyword configured in the user keyword database based on a full-text search result in the full-text search step; and A table configuration step of generating keyword weight information for the keyword to configure a keyword data table in the user keyword database. Here, the keyword weight information may include at least one of a frequency of use of the keyword, a time of use, and a bias of the frequency of use in the full-text search process.
[0009]
The metadata file includes a related keyword related to the file and file weight information about the file, and the user action monitoring step includes a file operation related information extracting step of extracting information related to the file operation. In this case, the metadata file may further include the file operation related information. The file weight information may include information indicating the number of detections of the related keyword in the file, information indicating the file name of the file and the number of detections of the related keyword in a newly input portion, or the user action detecting step. May include time information when the action is detected.
[0010]
Further, in another aspect of the present invention, a data related to a predetermined keyword is associated with data stored in a logical directory based on a physical directory including one or more files stored in a storage unit of a computer. A logical tree display method of displaying the file in a logical tree on a display unit, wherein the keyword is selected in a keyword selecting step of selecting the keyword, a display form setting step of setting a display form of the logical tree, and the keyword selecting step. A data extraction step of extracting data for displaying a logical tree from the data stored in the logical directory based on the keyword set in the display mode setting step and the display mode set in the display mode setting step; Based on the extracted data for displaying the logical tree, And a display step of displaying a logical tree corresponding to the display mode.
[0011]
Here, the keyword selecting step includes a keyword selection receiving step of receiving a keyword selection input from a user of the computer, and the display form setting step receives a designation of a display form designated by the user. A designation receiving step, wherein the data extraction step executes a calculation of a similar point function based on a designation input from the user received in the display form designation receiving step, and a similar point function in the calculation step. And a logical tree information generating step of generating logical tree information based on the operation result of the logical tree information. The display step may display the logical tree information as a logical tree.
[0012]
Further, the logical tree information generating step includes, for the generated logical tree information based on the designation input from the user, at least one of the number of tree layers, the number of tree links, and the number of files displayed in the tree. A tree narrowing step may be provided. Further, the logical directory may be a logical directory configured by the above-described logical directory configuration method.
[0013]
Further, the calculating step may calculate the similar point function based on the keyword weight information and the file weight information.
[0014]
In still another aspect of the present invention, the file associated with a predetermined keyword using data stored in a logical directory based on a physical directory made up of one or more files stored in a storage means of a computer. A logical tree display condition setting method for displaying a logical tree on a display unit, wherein a keyword setting receiving step of receiving the setting input of the keyword, the number of display files and the degree of association between the keyword and the display file, A display mode designating step of designating a display mode of the tree by setting at least one of them.
[0015]
The above object is also achieved by providing an information processing apparatus capable of executing the above method, a computer program for causing a computer to execute the method, and a computer readable information storage medium storing the computer program. Needless to say.
[0016]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram of a user terminal 100 corresponding to the embodiment of the present invention.
[0017]
In accordance with a program read from a program stored in the ROM 102, the RAM 103, or the internal storage device 104 or the external storage device (105), the CPU 101 includes a user terminal 100 via a system bus including a logical directory configuration process described later. It controls the overall operation. The ROM 102 stores a control program for the CPU 101 and the like. The RAM 103 temporarily stores programs and image data, and operates the user terminal 100 at high speed.
[0018]
The internal storage device 104 stores an operating system, various application programs, image data such as display objects, and the like. The internal storage device 104 stores a user keyword database and a metadata database according to the present invention. Further, in addition to software for logical directory configuration processing in the present embodiment, an application program (for example, a word processor, a spreadsheet program, an e-mail program, etc.) executed on the user terminal 100 is stored. It also stores a file group from which text data can be extracted or from which full-text search or partial search can be performed, which is the basis of the logical directory configuration process.
[0019]
The operation unit 105 controls a keyboard and a mouse (not shown) as means for inputting instructions from a user. Commands and operations for the user terminal 100 are usually performed using a keyboard or a mouse of the operation unit 105.
[0020]
The display unit 106 performs various displays for the user. For example, when performing a logical tree display described later on the user terminal 100, a setting screen or the like as shown in FIG. 6 is first displayed on the display unit 106 to prompt the user to input. In displaying the logical tree itself, for example, a screen shown in FIG. 7 is provided to the user.
[0021]
The communication unit 107 connects to a network (not shown) (for example, a LAN or the Internet), connects to an Internet provider through a communication line, and communicates data and image information with a partner communication device. A known method is used for connection to a network or a communication line, and will not be described in detail.
[0022]
In the present embodiment, the user terminal 100 shown in FIG. 1 extracts a characteristic component of a file to be searched in advance to generate metafile data, and performs a logical directory configuration process of configuring a logical directory based on the metafile data. Execute. The logical directory is configured by the logical directory configuration agent operating automatically or manually in the background of the OS operating environment. The logical directory configuration agent generates a metadata file for configuring the logical directory according to the usage history and the action of the user. Furthermore, in the present embodiment, a multi-level map of the directory is created using the metadata file stored in the logical directory, and all of the contents, keywords, file relevance (topology), and relevance are visually provided. You.
[0023]
The logical directory configuration processing according to the present embodiment can be executed in an operating environment that handles files from which text data can be extracted or from which full-text search and partial search can be performed. Therefore, for example, not only a word processor such as Microsoft (registered trademark) Office (registered trademark), a spreadsheet file, but also individual mails in a mail system, a history when referring to a web page, and the like are stored in a logical directory. It goes without saying that it is included in the components.
[0024]
In this embodiment, a case will be described in which the OS operating on the user terminal 100 shown in FIG. 1 is Microsoft Windows (registered trademark). However, the use of Windows (registered trademark) as the OS is for the purpose of describing the present embodiment, and the OS for carrying out the present invention is not limited to Windows (registered trademark), and is not limited to Windows (registered trademark). It is needless to say that the present invention can be implemented even when an OS other than (registered trademark) (MacOS, UNIX (registered trademark), Linux, or the like of Macintosh (registered trademark)) is applied.
[0025]
FIG. 2 is a diagram illustrating an example of the configuration of the logical directory configuration agent according to the present embodiment. In the present invention, a logical directory is a directory configured by sorting and reorganizing the association between a group of files stored in a physical directory and a predetermined keyword based on a user's use history and actions. In a logical directory, each file is related by a characteristic component that the file has. The storage location of each file in the physical directory may be taken into account in the process of configuring the logical directory.
[0026]
In FIG. 2, reference numeral 201 denotes a user action monitoring engine that monitors user actions. Reference numeral 202 denotes a metafile configuration engine for executing a keyword search of a target file by using a notification from the user action monitoring engine 201 as a trigger. A user keyword management engine 203 manages a user keyword database 204. Further, the user keyword database 204 may include a keyword access table 204a and a keyword data table 204b.
[0027]
Reference numeral 205 denotes a full-text search engine for allowing the user keyword management engine 203 to detect a keyword. Reference numeral 206 denotes a physical directory management engine for unifying the physical directory of the target file and the metadata file, configuring the metadata database 207, and managing the metadata database 207. Reference numeral 207 denotes a metadata database managed by the physical directory management engine 206, and includes a keyword recording table 207a and a file recording table 207b. Reference numeral 208 denotes a logical tree display engine for creating and displaying a logical tree based on a metadata file or the like stored in the metadata database 207.
[0028]
The function of each block (201 to 208) in FIG. 2 will be described in more detail below in conjunction with the processing of the flowchart shown in FIG.
[0029]
FIG. 3 is a flowchart of a process for displaying a logical tree in the present embodiment. In step S301, the user action monitoring engine 201 monitors a system API that controls file I / O and the like, and notifies the metafile configuration engine 202 of the action each time. The monitoring target actions include file saving (new or overwriting), modification, deletion, mail transmission (new or transfer), deletion, Web browsing, and the like. Therefore, when the user performs an action such as creating a new document or forwarding the received mail to another person, the user action monitoring engine 201 notifies the metafile configuration engine 202 of the fact that the action has been performed. . Note that the action means that a predetermined operation has been completed. For example, when a new document is created, the document creation operation is not the action itself monitored by the user action monitoring engine. That is, at the stage when the user saves the created document and ends, for example, it is recognized that the action of “save new file” is performed, and the fact is notified to the metafile configuration engine 202.
[0030]
An example of API monitoring will be described further. The user action monitoring engine 201 can collect file operation information by trapping an operation on a file using a predetermined function of the OS or the file system. Here, the predetermined function of the OS or the like includes, for example, a function called a re-analysis point function of NTFS 5.0 or 5.1 used in Windows (registered trademark) 2000 / XP (registered trademark). By using this function, it is possible to collect file operation information such as the full path name of the operated file, the file creation date, the file last update date, and the number of accesses (counting the number of opens to obtain data).
[0031]
Next, in S302, the metafile configuration engine 202 executes a keyword search for the target file, triggered by a notification from the user action monitoring engine 201. Further, in S303, a word that has been matched with the user keyword database 204 of the user keyword management engine 203 is extracted as metadata, and the keyword and information serving as the weight of the target file are configured as a metadata file. Here, the information serving as the weight of the file includes, for example, the title of the file, the number of keywords included in the text, and the like. The notification from the user action monitoring engine 201 includes file operation information. Based on the file operation information, the type of process executed by the user (new creation, overwrite, transfer, reference, attachment), file creation The date and time, the type of the executed application, and the like are extracted and configured as a metadata file. The metadata file thus configured is transmitted to the physical directory management engine 206.
[0032]
The metadata generated in S303 is attribute information related to the target file and an attribute that can be found in the relationship between the target file and the keyword (the keyword having the relationship with the target file is called a related keyword). Information is included. The metadata file may be considered as an aggregate of metadata. The data format of the metadata file is not particularly limited, and it goes without saying that a data format that can be used in a predetermined operating environment can be arbitrarily used.
[0033]
Data transmitted from the metafile configuration engine 202 to the physical directory management engine 206 corresponds to data stored in a keyword recording table 207a and a file recording table 207b described later. At this time, in order to increase the weight of the keyword in the title portion of the file or the mail or in the new retouched portion of the file, a predetermined variable is multiplied or the new retouched portion is determined by the difference between the keyword of the original file and the keyword of the new file. You can also.
[0034]
Here, the user keyword management engine 203 stores 1 to n keywords (n is determined by a user or a system restriction) in the user keyword database 204. The user keyword database 204 may include a keyword access table 204a and a keyword data table 204b described later. The keyword stored in the keyword database 204 may be determined by the user specifying an arbitrary keyword, or n keywords that are considered to be frequently used are set as defaults, and the frequency of subsequent use is set. It may be changed according to.
[0035]
The contents stored in the keyword database 204 can be changed depending on the capacity of a storage medium such as a hard disk for storing the keyword database 204. When the capacity is small, a predetermined calculation result is stored for weights such as frequency of use. When the capacity is large, all the periods of actual use may be stored, and the frequency of use and the weight of the use period may be obtained by calculation.
[0036]
The user keyword management engine 203 includes a general term dictionary, and the keywords stored in the keyword database 204 are words extracted from the general term dictionary based on the frequency of use or the like. The user can exclude registration of an inappropriate term as a keyword in the keyword database 204. This is to prevent the efficiency of association from being reduced when a keyword such as “file” or “mail” that is likely to be included in many files is used as a keyword.
[0037]
In the present embodiment, a full-text search engine 205 is used for keyword detection by the user keyword management engine 203. Specifically, the OS can first determine the application corresponding to the type of each file by using the function of the GUI system. For example, in the case of Windows (registered trademark), it can be understood by inquiring the system that the extension "DOC" is a sentence of Microsoft Word (registered trademark). As described above, if the application can be determined, various information such as a text portion, a title, and a creator of the data can be acquired by using an API or the like of the application. A full-text search is performed on the obtained data by the full-text search engine 205, and necessary metadata can be created based on the hit keywords.
[0038]
Here, an example of the keyword access table 204a and the keyword data table 204b is shown with reference to FIG. FIG. 4A shows an example of the keyword access table 204a. The keyword access table 204a records the date and time when the occurrence of a predetermined keyword in a file to be searched is detected. For example, when five keywords 301 of “budget” are found in a file, “5” and the processing date and time 302 of the file are recorded as the number of detections 303. Since the keyword search is executed when the user completes an operation such as saving a file, the date and time when the appearance of a keyword is detected corresponds to the date and time when the file was processed (for example, saved, deleted, transmitted / received, transferred, etc.). . Further, the number of keywords entered in the keyword access table is n as described above.
[0039]
Next, FIG. 4B is a diagram showing an example of the keyword data table 204b in which the frequency and the timing of the keyword are recorded. Since the use history of n keywords is stored in the keyword access table shown in FIG. 4A as described above, the median of use time within a certain period (time 405), the certain The number of times each keyword is detected during the period (use frequency 406) and the average number of times each keyword is detected for one file (use frequency bias 407) are extracted as table entry data. For example, taking "budget" as a keyword as an example, the usage frequency is 25, the bias of the usage frequency is 5, and the timing is 2002/4/1. Here, the certain period can be arbitrarily determined, for example, 1 day, 1 month, 6 months, 1 year, and the like. Further, the user may arbitrarily set the period.
[0040]
As described above, since the keyword data table 204b is updated at regular intervals, the contents of the keyword database 204 are sorted at any time according to the weight given to the keyword. Therefore, with reference to FIG. 8, the flow of processing for updating the keyword data table 204b in response to a user action will be described again.
[0041]
First, in step S801, the user action is monitored by the user action monitoring engine 201, and the presence or absence of the user action is determined. If there is an action such as overwriting and saving, the process advances to step S802, and the metafile configuration engine 202 executes a keyword search for the target file. The keyword access table 204a is updated based on the result of the keyword search. Next, it is determined whether the fixed period set in S804, that is, the update period has elapsed. If it is determined that the update period has not elapsed, the process does not proceed to S805, but returns to the user action monitoring process in S801. On the other hand, if it is determined that the update period has elapsed, the process advances to step S805 to update the contents of the keyword data table 204b based on the contents of the keyword access table 204a within the certain period.
[0042]
In the flowchart of FIG. 8, for the sake of simplicity, the update period is determined in S804 following the update of the keyword access table 204a in S803. However, the process of determining whether the update period has elapsed is always performed in the background. It may be executed. In that case, the keyword data table 204b can be updated irrespective of the presence or absence of a user action and the update of the keyword access table 204a.
[0043]
Furthermore, in the present embodiment, the use frequency bias 407 is stored in the keyword data table 204b together with the use frequency 406, so that the number of files detected in each file is small, but the number of files used by chance is detected in many files. It is possible to make an adjustment so that the weight of keywords detected in a larger number in one file is higher than that of keywords whose frequency is higher. When the above-mentioned time 405 is obtained, for example, a simple average of the date and time when a predetermined keyword is detected within a certain period may be obtained. Furthermore, a coordinate system may be considered in which the vertical axis represents the number of detected keywords and the horizontal axis represents the date and time. In this coordinate system, the median and the deviation may be obtained based on the area obtained from the date and time and the number of detections. In addition, it is needless to say that a method for obtaining the timing as the median of the usage timing in a certain period is applicable.
[0044]
Returning to the description of FIG. 3, in S304, the physical directory management engine 206 unifies the physical directory of the target file and the metadata file created or updated by the metafile configuration engine 202, and configures the metadata database 207. In addition, it manages it. Here, unification means that the metadata file is associated with the target file in the physical directory (more specifically, see FIG. 5). This clarifies where the metadata file is associated with which file stored in the physical directory. In addition, it records the case where a file is deleted in the physical directory or records a simple movement in the physical directory, and updates the contents of the metadata database 207 (for data related to the physical directory) as needed.
[0045]
As described above, the logical directory is stored in the metadata database 207, but the file data itself is not stored in the metadata database 207 itself. That is, the metadata database 207 stores information necessary for configuring a logical directory for a file whose main body is stored in a physical directory.
[0046]
The metadata database 207 stores information related to file operations such as new creation, overwriting, changing the name, saving, and deleting. Also, information related to a keyword detected in a predetermined file is stored.
[0047]
Therefore, an example of the keyword recording table 207a and the file recording table 207b stored in the metadata database 207 will be described with reference to FIG. FIG. 5A shows an example of the keyword history table 207a. The keyword record table 207a is a table for storing information about keywords detected in a predetermined search target file, and a table corresponding to the number of keywords detected for each file is generated. C in Fig. 5a: {Business plan} 2002 budget. Focusing on the file “doc”, when the keyword is “budget”, the number of times the keyword is detected in the file name (Ct 503) is 1, the number of appearances of the keyword in the newly written part of the text (Cn 504) is 3, and the original The number of appearances of keywords in the file (Cb505) is stored as 1.
[0048]
In the metadata database 207, it is necessary to store the file name in association with the physical directory, so the keyword record table 207a stores the file name including the path name in the physical directory. In the keyword record table 207a of FIG. 5A, three types of entry items are listed for one keyword. However, these items are merely examples, and the number of times a keyword is detected in a template (Ctemp1) and the like are also shown. It may be set as an item, or an item (Ctemp2) representing the weight of the template itself may be set. For example, in the latter case, the file using the template “budget report” naturally has a high relevance to the keyword “budget”. Therefore, for a file using the template of the "budget report", the value of the item of Ctemp2 may be particularly increased. In addition, it goes without saying that items for associating a keyword with a file can be arbitrarily set.
[0049]
Next, FIG. 5B shows an example of the file recording table 207b. The file recording table 207b is a table that stores attribute information such as the type of an executed action and an application for a predetermined file.
[0050]
More specifically, with reference to FIG. 5B, the file name 506 is C: {business plan} 2001 budget. In the case of a file called "doc", if the file is created on May 20, 2002 as the creation date and time 507, the executed action 508 is 2, and the application type 509 is Word of Microsoft Corporation, C: \ program \ word. exe and author name 510 are stored as $ naka * ro. The action is given an identification number corresponding to each action, for example, new creation: 1, overwrite: 2, transfer: 3, reference: 4, attachment: 5, etc., and the file record table 207b has the corresponding identification number. The identification number is stored. The type of action taken by the user will be reflected in the weight of the file itself. For example, an action performed by the user, for example, saving a new document or overwriting an existing document, is heavier than an action performed on the user, for example, receiving or forwarding mail. The creation date is based on file operation information generated by the user action monitoring engine 201 and transmitted via the metafile configuration engine 202.
[0051]
In addition, one file record table 207b is generated for each physical file (in the above case, C: {business plan} 2001 budget.doc). The author name data is valid only in applications that can extract the author name.
[0052]
Next, in S305, it is determined whether or not there is a logical tree display instruction from the user. The process up to S304 (in the present embodiment, a process referred to as a logical directory configuration process) may be, for example, a process operating in the background on the user terminal 100, or may be manually activated and executed by the user. May be performed. In the case of processing executed in the background, when the user starts the user terminal 100, the logical directory configuration processing becomes a resident processing, and the metadata database 207 is updated and logically updated while the user performs document creation and mail transmission / reception. The directory will be configured. Then, upon receiving a logical tree display instruction from the user, the logical tree display system 208 creates and displays a logical tree based on the metadata file in S306.
[0053]
Hereinafter, the details of the logical tree display processing in S306 will be described with reference to FIGS. FIG. 6 is an example of a screen display for a user to input a predetermined condition for displaying a logical tree. FIG. 9 is a flowchart of the processing of the logical tree display method. In the mode shown in FIG. 6, the input contents are determined by clicking the OK button. Therefore, the processing corresponding to the flowchart of FIG. 9 may be executed after the input content is determined, but the processing of FIG. 9 corresponding to the input location in FIG. 6 will be described in parallel below for easy understanding.
[0054]
First, in step S901, a keyword designation input from a user is received. At this time, the screen 600 of FIG. 6 is displayed on the display unit 106, and an input from the user to the keyword instruction 601 through the keyboard or the mouse of the operation unit 105 corresponds to the keyword designation input. In the keyword designation input, it is possible to select the keyword to be displayed in descending order of weight (601a), or to designate the keyword by directly inputting the keyword that the user wants to search into the box 601c (601b). Note that the keyword received in S901 corresponds to any one of a plurality of keywords stored in the keyword database.
[0055]
Next, in S902, a search keyword is determined in accordance with the designation input from the user. When the user directly inputs a keyword into the box 601c, the keyword is set as a search keyword. On the other hand, when the display 601a is selected in the order of the keyword weight in the keyword designation 601, among the n keywords stored in the keyword data table 204b, a keyword having a high use frequency or a keyword having a new use time is regarded as having a high weight. The logical directory is searched from the keyword having the higher weight.
[0056]
In the present invention, the updating process of the keyword data table 204b is mainly performed in the background, and a keyword having a high weight can be said to be a keyword that frequently appears in a file recently processed by the user. In addition, since the keyword that frequently appears is automatically selected according to the occupation of the user, the purpose of use, and the like by the updating process of the keyword data table 204b, if the keyword frequently appears, it is necessary to search for the latest keyword. The file can be read. When a search is to be performed using a keyword other than the frequently-used keyword or a combination of a plurality of keywords, the user may select the keyword designation 601b and input a predetermined keyword.
[0057]
Next, in S903, a tree display form designation from the user is received. The user can specify a tree display form on a screen 602 in a screen 600 in FIG. The tree display can select either a two-dimensional format 603a or a three-dimensional format 602b as the display format 603. It is also possible to set the number of links when the user is displayed in a tree (604), to set the number of displayed files (604a), or to set the degree of association with the keyword arbitrarily. Can be specified (604b).
[0058]
Otherwise, the link tree depth can be set at 605. Even if the user sets the number of links by specifying the number of files in 604a, if many files with low relevance are detected, only important unnecessary files are displayed while the tree depth is increased. Will be. Therefore, it is possible to prevent the display of unnecessary files by setting the link tree depth 605. In this way, it is possible to adopt a method of not displaying links exceeding the number specified by the user, but by notifying that there are links that are not displayed, the user can manage the screen with a detail level that is easy for the user to grasp Is also possible.
[0059]
Further, for the keyword similarity function described later, which one of the similarity and quantity is regarded as important can also be determined by the cursor position (606a). Here, “quality” means the weight of the keyword itself, and “quantity” means the number of times the keyword has been searched in the target file.
[0060]
Further, a setting regarding weighting of a keyword for displaying a tree can be performed in 606b. For example, if you want to search for a file in which a given keyword is used in the title, you can adjust the weight level of the keyword to the "title" position, and if you want to search for a file in which many keywords are found in the text, Should be set to "entire file". In the level meter display 606b of FIG. 6, one of “title”, “new part”, and “entire file” is selected. However, this is only shown as a display mode. When "Title" is selected, the weight of "Title" may be changed from that of "Title", or the weight other than "Title" may be completely ignored.
[0061]
When the process in S903 ends, the process proceeds to S904, where a weight variable is determined. The weight variables include a weight variable of the keyword itself related to the frequency of use of the keyword and a weight variable related to the number of detected keywords in the target file. If the user inputs only a single keyword (for example, only “budget”) in the box 601c in the keyword specification 601, the weight variable of the keyword itself is not required for further processing. However, when the user inputs a plurality of keywords (for example, “budget or reserve or estimate”) in the box 601c, or when the display 601a is selected in the order of keyword weight, the priority between the plurality of keywords is changed. The weight variable of the keyword itself is used for the determination.
[0062]
The weight variable specifically relates to a variable representing the weight of the keyword itself such as the use frequency stored in the keyword data table 204b, the bias of the use frequency, and the time, or a predetermined keyword stored in the file record table 207b. And a weight variable indicating the relationship between the target file and keywords such as Ct, Cn, and Cb.
[0063]
The element for determining the variable is the setting content in the tree display form 602. For example, if “quality” is selected as the weight type 606a, a variable representing the weight of the keyword itself is determined as a weight variable, and if “quantity” is selected, Ct or the like relating to the number of detected keywords in the target file is weighted. Determined as a variable. If “title” is selected in the keyword weight 606b, Ct is determined as a weight variable, and the other Cn and Cb have lower weights than Ct.
[0064]
Here, depending on the setting of the weight type 606a, one of the weight variables of the quality and the quantity may be adopted, and the other that is not adopted may be discarded. However, according to the setting level of the weight type 606a, it is possible to further divide the file by weighting the quality and the quantity. For example, even if the number of detected keywords is the same when the weight type 606a is set on the side that emphasizes the amount, the larger the weight is, by referring to the quality of the keyword, that is, the weight of the keyword, in the final case Will be displayed at the top.
[0065]
In the weighting variable in S904, not only the variable used for calculating the similarity point function is determined but also a plurality of variables may be further weighted based on the input contents specified by the user. For example, taking the number of detected keywords in the target file (the variables Ct, Cn and Cb are present) as an example, it is assumed that “title” is selected by the user inputting the keyword weight 606b. In this case, the selected weight Ct can be multiplied by a predetermined coefficient (for example, k) to make the weight higher than the other weights (Cn, Cb).
[0066]
Next, in S905, a similar point function is calculated using the variables determined in S904. The similarity point function is a function for calculating a reference value for ranking a plurality of files stored in the physical directory based on the relevance with a predetermined keyword. Equivalent to.
Give priority to keyword weight (1) Keyword similarity function
Give priority to keyword quantity (2) Keyword similarity function
Give priority to user action timing (3) Timing similar function
[0067]
If the similar point function is expressed as f (x) as a function of the variable x, the variable x corresponds to the various weight variables determined in S904. That is, the variable x is exemplified as a variable representing a plurality of variables, and the similar point function is not limited to a function of a single variable. Further, although the aspects of the variables listed here are described corresponding to the present embodiment, they are merely examples, and the variables representing the weight and amount of the keyword can be arbitrarily selected and used. Needless to say.
[0068]
Furthermore, the similar point function may be calculated including a physical directory similar function that uses information relating to the position of the physical directory in which the target file is stored as a variable. This physical directory similarity function is a function for determining the similarity of the target file according to the storage location of the file in the physical directory when there are a plurality of target files.
[0069]
For example, if the physical paths of files A, B, and C are respectively C: \ usr \ local \ bin \ A. txt, C: {usr local local temp} B. txt C: {doc} temp {C. In the case of txt, file A and file B are files located under C: \ usr \ local and having commonality with the physical directory, while file C is a file located in a completely different physical directory. In this case, files A and B have a high degree of similarity, and files A, B and C have a low degree of similarity. Accordingly, in the logical tree display described later, the files A and B are displayed adjacent to each other to show the relevance, while the file C is displayed separately from the files A and B, so that the physical relevance is low. Can also be displayed. Further, it goes without saying that the concept of the physical directory similar function can be applied to not only a local network but also a network such as a LAN or the Internet.
[0070]
Subsequently, tree information is generated in S906. The tree information can be generated by using a known information processing technique except that the calculated value of the similar point function is used. For example, a plurality of thresholds for determining the hierarchy are prepared, and the files are grouped according to the value of the similar point function to determine the hierarchy. Furthermore, it can be generated by forming a link between the files constituting the hierarchy according to the similarity of the files. The similarity of the file may be based on a calculated value of the physical directory similar function, or may be determined based on an application to be used, an author name, a creation time, and the like. The above-mentioned hierarchy corresponds to the hierarchy when a similar tree is displayed.
[0071]
The tree information generation process is different depending on whether the user selects the two-dimensional format 603a or the three-dimensional format 603b for the tree display format 603. For example, if the two-dimensional format is selected, the distances from the origin are calculated using the calculated values of the point functions (1) and (2) as coordinate values on the vertical and horizontal axes, respectively. To form a link. In the case of simply displaying a plane without using the two-dimensional coordinate system (as shown in FIG. 7A), the calculated values of (1) to (3) are summed based on a predetermined calculation result, and Hierarchization and link formation may be performed based on the magnitude of the total value. On the other hand, when the three-dimensional format 603b is selected, the method of the two-dimensional coordinate system may be three-dimensionally developed based on the calculation results from (1) to (3).
[0072]
Next, in S907, the number of layers is narrowed down for the tree information generated in S906. The number of layers is narrowed down based on the number of layers set by the user at the link tree depth 605. If the user does not set the link tree depth 605, the default value may be set to display up to three levels, for example, or the number of levels may be determined based on other display-designated elements. good.
[0073]
Next, in S908, the tree information is further narrowed down by the number of links. This narrowing is performed based on the setting content of the related link number setting 604 by the user for the number of links between the files. When the user specifies the number of files in 604a, the number of links corresponding to the number of files is narrowed down. When the relevance is specified in the relevance specification 604b, the calculation result of the similarity point function is set to a predetermined value. Are specified, and the number of links corresponding to the number of files is narrowed down.
[0074]
Since the tree information to be displayed on the display unit 106 is generated by the above-described narrowing down, the tree information is converted into display information and displayed on the display unit 106 in S909. At this time, information for notifying the existence of a file located outside the displayed link, that is, a file not directly displayed on the display unit, may be displayed on the display unit 106. The user clicks the OK button as a display trigger.
[0075]
FIG. 7A and FIG. 7B are diagrams showing an example of the display in S909. FIG. 7A is a diagram illustrating an example of a display when files related to the keyword “budget” are displayed in a plane. Here, the keyword “budget” is shown in the center 701, and circles drawn by dotted lines 702, 703, and 704 from the center to the periphery are lines indicating the hierarchy, and the files A and B existing on the dotted lines are The file is most related to the keyword budget, and then the file A ′, the file B ′, the file A ″, and the file C are weakly related in this order. Thus, the distance from the center 701 to the file reflects the calculated value of the similar point function. Note that the dotted lines 702, 703, and 704 are exemplarily described to indicate the boundaries of the hierarchy, and the dotted lines may or may not be displayed on the display unit 106.
[0076]
FIG. 7B is a diagram showing an example of a case where the similar point functions (1) to (3) are displayed in a three-dimensional space with three axes each.
[0077]
In such a display mode, the user can directly open the file by moving the cursor to a file required by the user from the displayed file group and performing a predetermined operation such as double-clicking. This is possible because the file is stored in the file record table 207b of the metadata database 207 in association with the physical directory 506 and the application type 509.
[0078]
Although the logical directory configuration process in the present embodiment has been described as being executed in the user terminal 100, if there are a plurality of client terminals connected to a network such as a LAN or the Internet, the server side may be used. The above-described logical directory configuration processing may be executed to generate a metadata file, and each client terminal may display this in a logical tree.
[0079]
The above processing (for example, processing according to the flowcharts shown in FIGS. 3 and 8 in the above embodiment) is stored as a program in a storage medium such as a CD-R, a ROM, a DVD-ROM, and an MO, and stored in this storage medium. By causing the computer to read (install or copy) the program, the computer can perform the above processing. Therefore, it is clear that this storage medium also falls within the scope of the present invention.
[0080]
Further, the embodiments of the present invention described above have been described only for describing the present invention, and are not intended to limit the embodiments of the present invention to the above description. Further, those skilled in the technical field of information processing using a computer may easily change, modify, or replace the equivalents of the above-described embodiments with equivalents in order to achieve the object of the present invention. It is obvious that the invention obtained as a result is also an invention itself belonging to the technical scope of the present invention.
[0081]
【The invention's effect】
As described above, according to the present invention, a logical directory can be configured by dividing and reorganizing a physical directory according to the use history and action of a user, and a search based on the logical directory can be performed. As a result, the keyword and the target to be searched are made meaningful, and the user can easily obtain a meaningful search result only by grasping the keyword related to the target, thereby improving the search processing efficiency. Is significantly improved.
[Brief description of the drawings]
FIG. 1 is a diagram illustrating an example of a configuration of a user terminal according to the present invention.
FIG. 2 is a diagram showing an example of a configuration of a logical directory configuration agent according to the present invention.
FIG. 3 is a flowchart of a process for displaying a logical tree according to the embodiment of the present invention.
FIG. 4A is a diagram showing an example of a configuration of a keyword access table according to the embodiment of the present invention.
FIG. 4B is a diagram showing an example of a configuration of a keyword data table corresponding to the embodiment of the present invention.
FIG. 5A is a diagram showing an example of a configuration of a keyword recording table 207a according to the embodiment of the present invention.
FIG. 5B is a diagram illustrating an example of a configuration of a file recording table 207b according to the embodiment of the present invention.
FIG. 6 is an example of a screen display for a user to input a predetermined condition for displaying a logical tree according to the embodiment of the present invention.
FIG. 7a is a diagram showing an example of a logical tree display according to the embodiment of the present invention.
FIG. 7B is a diagram showing an example of a logical tree display according to the embodiment of the present invention.
FIG. 8 is a flowchart of a process for updating the keyword data table 204b in response to a user action according to the embodiment of the present invention.
FIG. 9 is a flowchart of a logical tree display process according to the embodiment of the present invention.

Claims (22)

コンピュータの記憶手段に格納された1以上のファイルで構成される物理ディレクトリーから論理ディレクトリーを構成するための論理ディレクトリー構成方法であって、
前記ファイルに対して前記コンピュータのユーザーが行うアクションを検知するユーザーアクション検知工程と、
前記ユーザーアクション検知工程において前記ファイルに対するアクションが検知された場合に、前記ファイルに対してキーワード検索を行うキーワード検索工程と、
前記キーワード検索工程におけるキーワード検索の結果に基づいて、前記ファイルのメタデータファイルを構成するメタデータファイル構成工程と、
前記メタデータファイル構成工程において構成された前記メタデータファイルと前記ファイルとを、前記物理ディレクトリーの構成に基づいて一元化して論理ディレクトリーを構成する論理ディレクトリー構成工程と
を備えることを特徴とする論理ディレクトリー構成方法。
A logical directory configuration method for configuring a logical directory from a physical directory composed of one or more files stored in storage means of a computer, comprising:
A user action detection step of detecting an action performed by a user of the computer on the file;
A keyword search step of performing a keyword search on the file when an action on the file is detected in the user action detection step;
A metadata file configuration step of configuring a metadata file of the file based on a result of the keyword search in the keyword search step;
A logical directory configuration step of unifying the metadata file and the file configured in the metadata file configuration step based on the configuration of the physical directory to configure a logical directory. Configuration method.
前記ユーザーアクション検知工程において検知される前記アクションには、前記ファイルの保存、変更、削除及びメール送信のうち少なくともいずれかのファイル操作が含まれることを特徴とする請求項1に記載の論理ディレクトリー構成方法。The logical directory configuration according to claim 1, wherein the actions detected in the user action detection step include at least one of file operations of saving, changing, deleting, and sending an e-mail of the file. Method. 前記ユーザーアクション検知工程は、前記ファイルの保存、変更、削除及びメール送信のうち少なくともいずれかのファイル操作が完了した場合に、前記アクションを検知することを特徴とする請求項2に記載の論理ディレクトリー構成方法。The logical directory according to claim 2, wherein the user action detection step detects the action when at least one of file operations of saving, changing, deleting, and sending an email of the file is completed. Configuration method. 前記キーワード検索工程は、
前記キーワードを格納するユーザーキーワードデータベースを管理するユーザーキーワード管理工程と、
前記ユーザーキーワードデータベースに格納されたキーワードについて前記ファイルを全文検索する全文検索工程と
を備えることを特徴とする請求項1乃至請求項3のいずれか1項に記載の論理ディレクトリー構成方法。
The keyword search step includes:
A user keyword management step of managing a user keyword database that stores the keywords,
4. The logical directory configuration method according to claim 1, further comprising: a full-text search step of performing a full-text search on the file for the keyword stored in the user keyword database.
前記キーワード検索工程は更に、
前記全文検索工程における全文検索結果に基づいて、前記ユーザーキーワードデータベース内に構成された前記キーワードの使用履歴情報を格納するキーワードアクセステーブルを更新するテーブル更新工程と、
前記キーワードデータテーブルの内容に基づいて前記キーワードについてキーワード重み情報を生成して、前記ユーザーキーワードデータベース内にキーワードデータテーブルを構成するテーブル構成工程とを備えることを特徴とする請求項4に記載の論理ディレクトリー構成方法。
The keyword search step further includes:
A table updating step of updating a keyword access table storing usage history information of the keyword configured in the user keyword database based on a full-text search result in the full-text search step;
The logic according to claim 4, further comprising: generating keyword weight information for the keyword based on the content of the keyword data table, and configuring a keyword data table in the user keyword database. Directory configuration method.
前記キーワード重み情報が、前記全文検索工程における前記キーワードの使用頻度、使用時期及び使用頻度の偏りのうち少なくともいずれかを含むことを特徴とする請求項5に記載の論理ディレクトリー構成方法。6. The logical directory configuration method according to claim 5, wherein the keyword weight information includes at least one of use frequency, use time, and use frequency bias of the keyword in the full-text search process. 前記メタデータファイルは、前記ファイルに関連する関連キーワード及び前記ファイルについてのファイル重み情報を含むことを特徴とする請求項1乃至請求項6のいずれか1項に記載の論理ディレクトリー構成方法。7. The logical directory configuration method according to claim 1, wherein the metadata file includes related keywords related to the file and file weight information about the file. 前記ユーザーアクション監視工程が前記ファイル操作に関連する情報を抽出するファイル操作関連情報抽出工程を備え、
前記メタデータファイルが更に前記ファイル操作関連情報を含むことを特徴とする請求項7に記載の論理ディレクトリー構成方法。
The user action monitoring step comprises a file operation related information extraction step of extracting information related to the file operation,
The method according to claim 7, wherein the metadata file further includes the file operation related information.
前記ファイル重み情報には、前記ファイル内における前記関連キーワードの検出数を示す情報が含まれることを特徴とする請求項7又は請求項8に記載の論理ディレクトリー構成方法。9. The logical directory configuration method according to claim 7, wherein the file weight information includes information indicating the number of detections of the related keyword in the file. 前記ファイル重み情報には、前記ファイルのファイル名及び新規入力部分における前記関連キーワードの検出数を示す情報が含まれることを特徴とする請求項7又は請求項8に記載の論理ディレクトリー構成方法。9. The logical directory configuration method according to claim 7, wherein the file weight information includes information indicating a file name of the file and the number of detections of the related keyword in a newly input portion. 前記ファイル重み情報には、前記ユーザーアクション検知工程において前記アクションが検知された際の時間情報が含まれることを特徴とする請求項7又は請求項8に記載の論理ディレクトリー構成方法。9. The logical directory configuration method according to claim 7, wherein the file weight information includes time information when the action is detected in the user action detection step. コンピュータの記憶手段に格納された1以上のファイルからなる物理ディレクトリーに基づいて構成される論理ディレクトリーに格納されたデータを利用して所定のキーワードに関連する前記ファイルを表示部に論理ツリー表示する論理ツリー表示方法であって、
前記キーワードを選定するキーワード選定工程と、
前記論理ツリーの表示形態を設定する表示形態設定工程と、
前記キーワード選定工程において選定されたキーワードと前記表示形態設定工程において設定された表示形態に基づいて、前記論理ディレクトリーに格納された前記データの中から論理ツリー表示のためのデータを抽出するデータ抽出工程と、
前記データ抽出工程において抽出した前記論理ツリー表示のためのデータに基づいて前記表示形態に対応する論理ツリーを表示する表示工程と
を備えることを特徴とする論理ツリー表示方法。
Logic for displaying a file related to a predetermined keyword on a display unit in a logical tree using data stored in a logical directory configured based on a physical directory including one or more files stored in a storage unit of a computer. A tree display method,
A keyword selection step of selecting the keyword;
A display mode setting step of setting a display mode of the logical tree;
A data extracting step of extracting data for displaying a logical tree from the data stored in the logical directory based on the keyword selected in the keyword selecting step and the display mode set in the display mode setting step When,
A display step of displaying a logical tree corresponding to the display form based on the data for displaying the logical tree extracted in the data extracting step.
前記キーワード選定工程が、前記コンピュータのユーザーからのキーワードの選定入力を受け付けるキーワード選定受付工程を備え、
前記表示形態設定工程が、前記ユーザーによって指定される表示形態の指定入力を受け付ける表示形態指定受付工程を備え、
前記データ抽出工程が、
前記表示形態指定受付工程において受け付けた前記ユーザーからの指定入力に基づいて、類似ポイント関数の演算を実行する演算工程と、
前記演算工程における類似ポイント関数の演算結果に基づいて、論理ツリー情報を生成する論理ツリー情報生成工程とを備え、
前記表示工程が、前記論理ツリー情報を論理ツリー表示することを特徴とする請求項12に記載の論理ツリー表示方法。
The keyword selecting step includes a keyword selection receiving step of receiving a keyword selection input from a user of the computer,
The display form setting step includes a display form designation receiving step of receiving a designation input of a display form designated by the user,
The data extraction step includes:
An operation step of executing an operation of a similarity point function based on the designation input from the user received in the display form designation accepting step;
A logical tree information generating step of generating logical tree information based on an operation result of the similar point function in the operation step,
13. The logical tree display method according to claim 12, wherein the display step displays the logical tree information in a logical tree.
前記論理ツリー情報生成工程が、
前記ユーザーからの指定入力に基づき前記生成した論理ツリー情報について、ツリーの階層数、ツリーのリンク数、及び、ツリー表示されるファイル数のうち少なくとも1つを絞り込むツリー絞込工程を備えることを特徴とする請求項13に記載の論理ツリー表示方法。
The logical tree information generating step includes:
A tree narrowing step of narrowing down at least one of the number of tree layers, the number of tree links, and the number of files displayed in the tree for the generated logical tree information based on the designation input from the user. The logical tree display method according to claim 13, wherein:
前記論理ディレクトリーは請求項1乃至請求項11に記載の論理ディレクトリー構成方法によって構成された論理ディレクトリーであることを特徴とする請求項12乃至請求項14のいずれか1項に記載の論理ツリー表示方法。The logical tree display method according to any one of claims 12 to 14, wherein the logical directory is a logical directory configured by the logical directory configuration method according to any one of claims 1 to 11. . 前記演算工程が、前記キーワード重み情報及び前記ファイル重み情報に基づいて前記類似ポイント関数の演算を行うことを特徴とする請求項15に記載の論理ツリー表示方法。The method according to claim 15, wherein the calculating step calculates the similarity point function based on the keyword weight information and the file weight information. コンピュータの記憶手段に格納された1以上のファイルからなる物理ディレクトリーに基づいて構成される論理ディレクトリーに格納されたデータを利用して所定のキーワードに関連する前記ファイルを表示部に論理ツリー表示するための論理ツリー表示条件設定方法であって、
前記キーワードの設定入力を受け付けるキーワード設定受付工程と、
表示ファイルの数及び前記キーワードと表示ファイルとの関連度のうち、少なくともいずれか一方を設定することにより前記ツリーの表示形態を指定する表示形態指定工程と
を備えることを特徴とする論理ツリー表示条件設定方法。
Displaying a file related to a predetermined keyword on a display unit in a logical tree using data stored in a logical directory based on a physical directory including one or more files stored in a storage unit of a computer. Logical tree display condition setting method,
A keyword setting receiving step of receiving the keyword setting input;
A display mode designating step of designating the display mode of the tree by setting at least one of the number of display files and the degree of association between the keyword and the display file. Setting method.
請求項1乃至請求項17のいずれか1項に記載の方法をコンピュータに実行させるためのコンピュータプログラム。A computer program for causing a computer to execute the method according to any one of claims 1 to 17. 請求項18に記載の方法をコンピュータプログラムを記憶したコンピュータが読取り可能な情報記憶媒体。19. A computer-readable information storage medium storing a computer program for executing the method according to claim 18. 記憶手段に格納された1以上のファイルで構成される物理ディレクトリーから論理ディレクトリーを構成するための情報処理装置であって、
前記ファイルに対して前記コンピュータのユーザーが行うアクションを検知するユーザーアクション検知手段と、
前記ユーザーアクション検知手段において前記ファイルに対するアクションが検知された場合に、前記ファイルに対してキーワード検索を行うキーワード検索手段と、
前記キーワード検索手段におけるキーワード検索の結果に基づいて、前記ファイルのメタデータファイルを構成するメタデータファイル構成手段と、
前記メタデータファイル構成手段において構成された前記メタデータファイルと前記ファイルとを、前記物理ディレクトリーの構成に基づいて一元化して論理ディレクトリーを構成する論理ディレクトリー構成手段と
を備えることを特徴とする情報処理装置。
An information processing apparatus for constructing a logical directory from a physical directory composed of one or more files stored in a storage means,
User action detection means for detecting an action performed by a user of the computer on the file;
When an action on the file is detected by the user action detection means, a keyword search means for performing a keyword search on the file;
A metadata file configuration unit configured to configure a metadata file of the file based on a result of the keyword search in the keyword search unit;
An information processing apparatus comprising: a logical directory configuration unit configured to unify the metadata file and the file configured by the metadata file configuration unit based on a configuration of the physical directory to configure a logical directory. apparatus.
記憶手段に格納された1以上のファイルからなる物理ディレクトリーに基づいて構成される論理ディレクトリーに格納されたデータを利用して所定のキーワードに関連する前記ファイルを表示部に論理ツリー表示する情報処理装置であって、
前記キーワードを選定するキーワード選定手段と、
前記論理ツリーの表示形態を設定する表示形態設定手段と、
前記キーワード選定手段において選定されたキーワードと前記表示形態設定手段において設定された表示形態に基づいて、前記論理ディレクトリーに格納された前記データの中から論理ツリー表示のためのデータを抽出するデータ抽出手段と、
前記データ抽出手段において抽出した前記論理ツリー表示のためのデータに基づいて前記表示形態に対応する論理ツリーを表示する表示手段と
を備えることを特徴とする情報処理装置。
An information processing apparatus for displaying a file related to a predetermined keyword on a display unit in a logical tree by using data stored in a logical directory configured based on a physical directory including one or more files stored in a storage unit And
Keyword selecting means for selecting the keyword;
Display mode setting means for setting a display mode of the logical tree;
Data extracting means for extracting data for displaying a logical tree from the data stored in the logical directory based on the keyword selected by the keyword selecting means and the display form set by the display form setting means. When,
A display unit for displaying a logical tree corresponding to the display form based on the data for displaying the logical tree extracted by the data extracting unit.
記憶手段に格納された1以上のファイルからなる物理ディレクトリーに基づいて構成される論理ディレクトリーに格納されたデータを利用して所定のキーワードに関連する前記ファイルを表示部に論理ツリー表示するための情報処理装置であって、
前記キーワードの設定入力を受け付けるキーワード設定受付手段と、
表示ファイルの数及び前記キーワードと表示ファイルとの関連度のうち、少なくともいずれか一方を設定することにより前記ツリーの表示形態を指定する表示形態指定手段と
を備えることを特徴とする情報処理装置。
Information for displaying a file related to a predetermined keyword on a display unit in a logical tree using data stored in a logical directory configured based on a physical directory including one or more files stored in a storage unit A processing device,
A keyword setting receiving means for receiving a setting input of the keyword,
An information processing apparatus comprising: a display mode specifying unit that specifies a display mode of the tree by setting at least one of the number of display files and the degree of association between the keyword and the display file.
JP2002161673A 2002-06-03 2002-06-03 Logical directory constituting method, logical tree display method, logical tree display condition setting method, and information processor Withdrawn JP2004013213A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002161673A JP2004013213A (en) 2002-06-03 2002-06-03 Logical directory constituting method, logical tree display method, logical tree display condition setting method, and information processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002161673A JP2004013213A (en) 2002-06-03 2002-06-03 Logical directory constituting method, logical tree display method, logical tree display condition setting method, and information processor

Publications (1)

Publication Number Publication Date
JP2004013213A true JP2004013213A (en) 2004-01-15

Family

ID=30430681

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002161673A Withdrawn JP2004013213A (en) 2002-06-03 2002-06-03 Logical directory constituting method, logical tree display method, logical tree display condition setting method, and information processor

Country Status (1)

Country Link
JP (1) JP2004013213A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006244028A (en) * 2005-03-02 2006-09-14 Nippon Hoso Kyokai <Nhk> Information exhibition device and information exhibition program
JP2009187310A (en) * 2008-02-06 2009-08-20 Canon Inc Document management method, document management device and document management system
JP2009193171A (en) * 2008-02-12 2009-08-27 Canon Inc Document management device, method, program, and document management system
CN112784234A (en) * 2021-01-29 2021-05-11 北京译泰教育科技有限公司 Supplier management method

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006244028A (en) * 2005-03-02 2006-09-14 Nippon Hoso Kyokai <Nhk> Information exhibition device and information exhibition program
JP4568144B2 (en) * 2005-03-02 2010-10-27 日本放送協会 Information presentation device and information presentation program
JP2009187310A (en) * 2008-02-06 2009-08-20 Canon Inc Document management method, document management device and document management system
US8688656B2 (en) 2008-02-06 2014-04-01 Canon Kabushiki Kaisha Document management method, document management apparatus, and document management system
JP2009193171A (en) * 2008-02-12 2009-08-27 Canon Inc Document management device, method, program, and document management system
CN112784234A (en) * 2021-01-29 2021-05-11 北京译泰教育科技有限公司 Supplier management method

Similar Documents

Publication Publication Date Title
JP5106045B2 (en) Search engine linkage file sharing system
CN110178151B (en) Task front view
CA2462415C (en) Computer searching with associations
US7769771B2 (en) Searching a document using relevance feedback
US7461043B2 (en) Methods and apparatus to abstract events in software applications or services
KR100962925B1 (en) Search ranking method for file system and related search engine
JP4721740B2 (en) Program for managing articles or topics
US6912550B2 (en) File classification management system and method used in operating systems
US9612847B2 (en) Destination list associated with an application launcher
US20140280121A1 (en) Interest graph-powered feed
US20060085391A1 (en) Automatic query suggestions
US20100121859A1 (en) Workflow management system, workflow management control method, and computer-readable recording medium storing workflow management control program
JP4746439B2 (en) Document search server and document search method
WO2016054196A1 (en) Document curation system
JPH11328227A (en) Document storage management system, management method for document storage system and graphical user interface
KR101502671B1 (en) Online analysis and display of correlated information
US20160210355A1 (en) Searching and classifying unstructured documents based on visual navigation
WO2004036454A2 (en) Automated information management system and methods
CN110352416B (en) Ontology-based graph query optimization
KR20120130196A (en) Automatic association of informational entities
US8595205B2 (en) Device and method for managing search conditions
JP2004013213A (en) Logical directory constituting method, logical tree display method, logical tree display condition setting method, and information processor
JP2004302981A (en) Electronic data management system
JP5757187B2 (en) File storage location candidate determination device, file storage location candidate determination method, file storage location determination support system, and computer program
JP2006277061A (en) Knowledge retrieval system, method and program

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050906