JPH02199558A - コンピュータシステムにおけるファイルの索引付け方法およびその装置 - Google Patents

コンピュータシステムにおけるファイルの索引付け方法およびその装置

Info

Publication number
JPH02199558A
JPH02199558A JP1270575A JP27057589A JPH02199558A JP H02199558 A JPH02199558 A JP H02199558A JP 1270575 A JP1270575 A JP 1270575A JP 27057589 A JP27057589 A JP 27057589A JP H02199558 A JPH02199558 A JP H02199558A
Authority
JP
Japan
Prior art keywords
file
indexing
date
files
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1270575A
Other languages
English (en)
Inventor
Michael J Hawley
マイケル ジェイ ホーリー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Next Inc
Original Assignee
Next Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Next Inc filed Critical Next Inc
Publication of JPH02199558A publication Critical patent/JPH02199558A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野コ この発明は、ファ不、ルの索引付はシステムに係り、特
にコンピュータのファイルシステムにおけるファイル内
容に基づくテキストファイルの自動索引付けに関する。
[従来の技術] 一般的にコンピュータオペレーティングシステムは、コ
ンピュータのファイルシステム(例:ディスクメモリ)
に格納された全てのファイルをユーザにリストするファ
イルディレクトリを提供する。この場合、ユーザは、フ
ァイル名に基づいて必要なファイルを決定するものであ
る。ファイル数の増加に伴い、迅速かつ能率的な全ファ
イル名の走査が雛しくなる。殆んどのオペレーティング
システムはブイレフI・りを分割して更にサブディレク
トリを作成するが、各サブディレクトリにはファイルシ
ステム内のファイル総数の一部が含まれるにすぎず、走
査の対象となるサブディレクトリを知り、しかも、ファ
イル名によってサブディレクトリを走査することが要求
される。コンピュータがネットワークに接続され、コン
ピュータのファイル記憶システムだけでなくネットワー
クの全てのファイル記憶システムに接続される場合は、
問題が複雑になる。
更に、アプリケーションプログラムがファイルにアクセ
スする場合、アクセスの対象となるファイルを決定する
方法がない。これは、ファイル名が、ファイル内容につ
いてプログラムに全く指標を与えないためである。それ
どころかファイル名または少なくともその一部が、プロ
グラムに明示されねばならない。
ファイルがプログラムそのもので作成され、かつ、特別
なフォーマットのファイル名を持つ場合でも、そのプロ
グラムがファイルを発見できるのは、単にそのフォーマ
ットを探索するようにプログラムが作成されているとい
う理由からである。
周知のとうり、データベースプログラムは、フィル内容
から選択されたキーワードに基づいてファイルに索引を
付ける。このようなプログラムのユーザは、それらのキ
ーワードの1つに基づいて間合わせるだけでよく、プロ
グラムが、そのキーワードに基づいて索引付けされた全
てのファイルを見つける。ユーザは、索引から選択され
た比較的少数のファイルの中から所望のファイルを選択
するだけでよい。しかしながら、こうしたデータベース
用ファイルに索引付けするためには、キーワードを手入
力せねばならない。
[発明が解決しようとする課題] ファイル内に出現する全ての単語のリストによってテキ
ストファイルに索引付けをすることは可能であるが、こ
のような索引はファイルと同じくらい大きくなり扱いが
不便である。こうした索引には「aJ、rthe」、r
to、1.rbe」およびrnot」のような共通語(
commo、n  word)は含まれないが、このル
ールに従って構築された索引は、例えば°、ウィリアム
シェークスピアの全作品を含むIMiのファイルからハ
ムレットの独白を見つけるのには不都合である。
従って、コンピュータシステムのユーザおよびそこで実
行するアプリケーションプログラムのために、コンピュ
ータシステム自身がファイルから選択したキーワードに
基づきコンピュータファイルシステム内の多数のテキス
トファイルの中から所望のファイルを選択する方法を提
供することが望ましい。
この発明の目的は、コンピュータシステムのユーザおよ
びそこで実行するアプリケーションプログラムのために
、コンピュータシステム自身がファイルから選択したキ
ーワードに基づきコンピュータファイルシステム内の多
数のテキストファイルの中から所望のファイルを選択す
る方法を提供することにある。
[課題を解決するための手段] この発明に係る大容量記憶ファイルシステムを有するコ
ンピュータシステムで使用される前記ファイルシステム
の格納ファイルの自動索引付は装置は、最新の索引付は
日付と、少なくとも幾つかの前記格納ファイルの各々に
ついて、最終の更新日付および前記格納ファイルと少な
くとも1つのキーワードとの関連に関する情報とを有す
る少なくとも1つの索引ファイルを前記ファイルシステ
ムに保持する手段から成ることを特徴とする。
また、この発明に係るファイルの自動索引付は装置は、
新たなファイルが前記ファイルシステムに加えられる時
並びに既存のファイルが更新される時に前記少なくとも
1つの索引ファイルを自動的に更新する手段から成り、
前記自動更新手段が更に、各ファイルについて前記最新
の索引付は日付と前記最終の更新日付とを比較する手段
と、当該ファイルの前記最終の更新日付が前記最新の索
引付は日付よりも遅いかどうかを判定する手段と、前記
判定手段により前記各ファイルの最終の更新日付が前記
最新の索引付は日付よりも遅いと判定された時に前記キ
ーワード関連情報を更新する手段とから構成されること
を特徴とする。
同様に、この装置の動作方法も提供する。
本発明の上記および他の諸口的並びに利益は、添付図面
と共に以下の詳細な説明により明らかとなる。尚、同一
部分には同一の参照符号を付して説明する。
[実施例] 本発明によれば、キーワードに基づいたファイルの索引
付け、特にファイルの検索が容易になる。ファイルを見
つけるためには、探索の対象となるファイルの内容を記
述すると考えられる単語に基づいて探索要求を行う。
キーワードの抽出が適当に成された場合には、これらの
単語はキーワードとして選択された中に含まれ、ファイ
ルの探索が可能となる。
その結果、探索要求に使用された単語がキワードとして
指定されているファイルの比較的短いリストが、探索要
求によって検索される。ユーザまたはアプリケーション
プログラムは、ファイルシステム内の全ファイルではな
く、これらのファイルの中からファイルを選択するだけ
でよい。
ファイルの最初の作成時と同様、更新の度に、ファイル
からキーワードが選択され、ファイルに自動的に索引付
けされることが、最も効果的で望ましい。少なくとも定
期的に、好ましくは比較的頻繁に索引を更新すべきであ
り、新ファイルの作成または既存ファイルの更新から索
引の更新までに長時間が経過しないようにする。この発
明の好適な実施例で使用され得る、ファイルからキーワ
ードを自動的に抽出するシステムおよび方法の可能な一
形態は、本願と同時出願に係る特許願(2)に述べられ
、全般的に参照される。
この発明によれば、少なくとも1つの特定の索引ファイ
ルがファイルシステム内に格納される。あるタイプのフ
ァイル(コンピュータプログラムソースコードリスト等
)が異なる方法で索引付けされる場合、1つ以上の索引
ファイルが存在する。各索引ファイルには、ファイル名
、ファイルの自然言語(例:英語)記述、ファイルのタ
イプに関する情報、ファイルサイズおよび最終の更新日
時が含まれる。
好ましくは、この発明による索引付はプロセスは、自動
的に、規則正しい時間間隔で行われ、また、ユーザの要
求があればいつでも呼出し可能である。この発明の実施
においては、前記プロセスはマニュアルオプションなし
で自動的に実行されるか、または、単にマニュアルで実
行される。
この発明の索引付はプロセスにおいては、特定の索引と
関連する全てのファイルが検査される。(新たに作成さ
れたファイルと特定の索引は、ファイル作成時にユーザ
によって関連づけられるか、または、ファイル作成時に
呼出される自動プロセスによって関連づけられる)、索
引の最終更新時以降にファイルの書込が行われた場合、
そのファイルに再度索引付けを行う。ファイルが新たに
作成される場合には、作成日時は、最後に書込が行われ
た時であり、索引の最終更新時以降となって、こうして
新ファイルの索引付けが行われる。
索引付はプロセスは、次の通りである。
ファイルのタイプQリストは、ファイルシステム内に別
ファイルとして格納される。リストには異なる種類のフ
ァイルの索引付けに有効な情報が含まれる。例えば、フ
ァイルが数値データ、コンピュータプログラムのオブジ
ェクトコードまたは他の種類の非原文データであるなら
ば、索引付けは全く行われない。
このようなファイルの探索に索引付けは無効であり、こ
れによって問題が生じることはない。
ファイルの索引付けを目的として、キーワド抽出プロセ
スを実行して、ファイル中めキーワードおよびその重み
付出現を識別する。
この発明によるキーワード抽出プロセスにおいては、前
記特許出願に示されるように、同一の単語が参照領域(
rdomai n」)□よりもファイル中に頻出する場
合、この単語はキーワードとして記される。参照領域は
、ファイルのタイプによって決定することができる。例
えば、シェークスピア作品を含むファイルに索引付けを
行う時は、参照領域として現代アメリカ英語でなくエリ
ザベス朝英語を採用する。このように、ファイルタイプ
のリストは、適当な領域の選択を容易にするとともに、
各ファイルのタイプについてフィルタ機能を指示する。
索引付はプロセスは、索引付けの対象となる特定のファ
イルについて指示されたフィルタ機能を用いて、索引付
けに使用されない、キーワード抽出時に無視される単語
(前置詞、代名詞、冠詞等)を削除する。これらの単語
は、多数の有効な索引fづけデータを提供することもな
く、多量のシステム資源を占有するからである。場合に
よっては、フィルタ機能が一般的キーワード抽出プロセ
スへの再分類を行わずにキーワードを抽出することもあ
る。これはコンピュータプログラムソースコードファイ
ルのような特定のタイプのファイルで行われ得る。この
ような特定のプログラミング言語による予約語に基づい
たファイルの索引付けは、有効ではない。
殆んどの場合に索引付けに有効となるようなソースコー
ドリスト中の独特の単語は、可変名である。従って、フ
ァイルのタイプがソースコードファイルを示す場合には
、キーワード抽出プロセスは、そのプログラミング言語
のフィルタ機能を呼出して終了する。こうしたフィルタ
機能は、コンパイラのサブセットとして動作し、全ての
可変名を識別し、ファイル中での重み付出現を知らせる
特定の索引ファイルは、特定キーワード抽出ルーチンと
関連づけられる。その索引付はプロセスでは、一般的キ
ーワード抽出プロセスが呼出される前に前記ルーチンの
有無を確認し、前記ルーチンがあれば、索引付けの対象
となる全ファイルについて特定キーワード抽出ルーチン
を呼出す、索引ファイルは固有の索引付はルーチンを有
することも可能であるが、その場合、固有の索引付はル
ーチンは一般的索引付はルーチンに優先する。
索引付はプロセスは、キーワード抽出プロセスの結果を
受は取り、特定のキーワードと関連して、索引付けの対
象となるファイルおよび各ファイル中のキーワードの出
現重み付けを索引ファイルに格納する。各キーワードと
関連するファイルは、それが索引に入力された時間に基
づいて入力順または逆入力順にその重み付けによってリ
ストされるため、特定のファイルが索引に入力された順
序を判定することができる。
また、この発明には検索プロセスが含まれる。ユーザま
たはアプリケーションプログラムは、特定のキーワード
を含むファイルについて探索要求を表示する。探索要求
は、1つ以上のキーワードを含むプール式でもよい。
その間合わせは、ファイルシステム内の全索引ファイル
に対して行われるか、または、1つ以上の特定の索引フ
ァイルに限定して行われる。システムは、特定の索引を
探索するか、または、ファイルのリストに戻り、キーワ
ードおよびその重み付出現、更には各ファイルの最終の
更新日付をも表示する。そこで、ユーザまたはアプリケ
ーションプログラムは、ファイル名または可能であれば
重み付出現に基づいてリストから所望のファイルを選択
できる。ファイル探索中のアプリケーションプログラム
は、特にファイル名よりも重み付出現に依存する傾向が
ある。実際、この発明の実施においては、探索の対象と
なるキーワードの出現の重み付けが探索要求を表すユー
ザまたはプログラムによって決定された最低限度を越え
る場合、単にファイルを検索リストに含むだけでもよい
この発明によるファイルの索引付けおよび探索は、専門
家間で知られた従来のハツシュ技術を使用することによ
って向上する。
この発明の実施に適したコンピュータプログラムは、こ
の明細書の末尾記載のプログラムで提供される。これら
のコンピュータプログラムは、周知のCプログラミング
言語で書かれ、カリフォルニア州マウンテンビュー〇サ
ンマイクロシステムズインコーポレイテッドが提供する
従来モデル3150ワークステーシヨンのような従来コ
ンピュータで実行される。これらのプログラムのフロー
図を図1〜3に示し、以下に説明する。
第1図は末尾記載のプログラムAの rindeK」ルーチンのフロー図であり、このルーチ
ンでは、各索引が属するファイルシステムの量に基づい
て、ファイルシステムまたはその一部を探索することに
よって1つ以上の索引が更新される。ステップ10では
、rindexdir (S)Jルーチンにおいて、所
望の索引を開き、その索引が更新された最新の日付(お
よび時間)を記録することで前記rindex」ルーチ
ンが始まる。ステップ11でr L ridex」ルー
チンは、索引が属する全ファイルをrindexdir
(S)」ルーチンが別べたかどうかテストする。前記全
ファイルについて調査が行われていれば、ステップ12
でrindex」ルーチンは終了し、そうでない場合に
は、ステップ13でrnoteJルーチンが次のファイ
ルを調べる。ステップ14で、rnote」ルーチンは
、ファイルが索引付けできないタイプ(例:数値データ
)のものかどうかをテストする。ファイルが索引付けで
きないタイプのものならば、rLndex」ルーチンは
ステップ11に戻り、次に調査の対象となるファイルの
有無を確認する。逆にファイルが索引付は可能なタイプ
のものであれば、ステップ15で’modi f Le
d (b)Jルチンが、ファイルの最新書込日付をチエ
ツクし索引の最新書込日付と比較することによって、特
定のファイルに関して索引を更新すべきかどうかをテス
トする。ファイルの最新書込日付が索引の最新書込日付
以前であれば、ファイルの変更が行われていないため、
rindex、1ルーチンは、ステップ11へ戻り、次
のファイルをチエツクする。逆にファイルの最新書込日
付が索引の最新書込日付以降であれば、最後に索引付け
が行われた後でファイルに変更があったものとして、ス
テップ16でrnote」ルーチンによって、ファイル
が関連キーワード抽出プログラムを有するかどうかテス
トされる。ファイルが前記プログラムを有する場合、ス
テップ17で関連キーワード抽出ルーチンが呼出され、
ステップ18でrLndex」ルーチンが終了する。そ
うでない場合には、ステップ19で、前記特許出願にお
いて述べられたような一般的キーワード抽出ルーチンが
呼出され、ステップ18でrindexjルーチンが終
了する。
第2図は末尾記載のプログラムBの rdbAddIndex」ルーチンのフロー図であり、
このルーチンは□、キーワード抽出ルーチンがファイル
で実行された後、ステップ20で呼出される。
rdbAddIndex」ルーチンでは、キーワードお
よび関連ファイルを索引に加える。
ステップ20で、索引の更新に関するファイル識別情報
(例:名前、説明、タイプ、サイズおよび最新の更新日
時)をファイルから得る。ステップ21で、ファイルの
各キーワードおよびその重み付けが、キーワード抽出ル
ーチンから読込まれる。ステップ22で、ルチンは、キ
ーワードが既に索引に含まれているかどうかテストする
。?f−ワードが索引に含まれていなければ、ステップ
23で索引に加えられ、ルーチンはステップ24に進む
キーワードが索引に含まれていれば、ルーチンはステッ
プ24に直接進み、ファイル(全ての識別情報を含む)
およびファイル中のキーワードの重み付けが、索引にお
けるキーリードエントリに関連づけられる。前記のとう
り、各キーワードについての関連情報は、索引に加えら
れた時間を基にして入力順または逆入力順でリストされ
るので、特定のキーワードについての全ての関連情報を
見ることで、各ファイルがそのキーワードに関連づけら
れた順序を知ることができる。こめ   □rdbAd
dIndex」ルーチンは、ステップ25で終了する。
第3図は末尾記載のプログラムCの rf LndManFi Ie (S)Jルーチンのフ
ロー図であり、このルーチンは索引付けされたファイル
の検索に使用される。ステップ30では、探索の対象と
なる索引が、ユーザまたは前記ルーチンを呼出す他のプ
ロゲラムによって特定される。ステップ31で、探索の
対象となる全ての索引が探索されたかどうかテストされ
る。全索引について探索が終了している場合には、この
ルーチンはステップ32で終了し、そうでない場合には
、ステップ33で次の索引が探索される。ステップ34
では、探索中の索引のキーワードとして探索テキストが
発見された場合、その探索テキストが関連するファイル
は、全ての識別情報および重み付けとともに参照リスト
に加えられる。そして、ルーチンは、ステップ31に戻
り、探索を要する索引の有無を確認する。
ステップ32でルーチンが終了すると、ユーザまたはr
f fndManFi le」ルーチンを呼び出す他の
プログラムに対して参照リストが示される。
ハードウェアシステム 本発明は従来のコンピュータシステムにおいて効果的に
実施されるが、本発明の好適な実施例としてコンピュー
タシステム400を第4図において説明する。
第4図は、本発明によるコンピュータシステムの一部を
構成するハードウェアシステム400の実施例である0
図において、システム400は、CPU401と、主記
憶装置402と、ビデオメモリ403と、ユーザ入力用
キーボード404と、プリンタ405と、大容量記憶装
W406とを具備する。前記大容量記憶装置406は、
1台またはそれ以上の磁気、光または光磁気記憶技術も
しくは他の有効な大容量記憶技術を用いた固定並びに取
外し可能な媒体を有することができ、索引および探索の
対象となるファイルがこの記憶装置に格納される(前記
ファイルは、キーボード404から入力されるか、また
は、取外し可能な媒体の大容量記憶装置406に直接入
力される。システム400がコンピュータシステムのネ
ットワークの一部を構成する場合、そのファイルシステ
ムはネットワークの他のシステムで用いられる大容量記
憶装置の全部または一部を有することができる。これら
のコンポーネントは、従来の双方向性システムバス40
7を経て相互接続される。
バス407は、32のアドレスラインを有し、メモリ4
02および403のどの部分をもアドレス指定する。ま
た、システムバス407は、32ビツトデータバスを有
し、CPU401、主記憶装置402、ビデオメモリ4
03および大容量記憶装置406の間でデータ転送する
。システム400のこの実施例では、CPU401には
、モトローラ6803032ビツトマイクロプロセツサ
を採用したが、他の適当なマイクロプロセッサまたはマ
イクロボンピユータを使用してもよい、68030マイ
クロコンピユータに関する詳細な説明は、特に命令セッ
ト、バス構成および制御回線については、モトローラ社
(アリシナ州フェニックス)刊のMC68030ユーザ
マニユアルを参照するとよい。
システム400の主記憶装置402は、8メガバイトの
従来のダイナミックランダムアクセスメモリから構成さ
れるが、大抵のメモリが使用可能である。ビデオメモリ
403は、256にバイトの従来のデュアルポートビデ
オランダムアクセスメモリから構成される。また、所望
の解像度により、大抵のメモリが使用可能である。ビデ
オマルチプレクスおよびシフタ回路408をビデオメモ
リ403のボートに接続し、順次にビデオアンプ409
に接続する。ビデオアンプ409は、陰f!線管(CR
T)ラスタモニタ410を駆動する。ビデオマルチプレ
クスおよびシフタ回路408並びにビデオアンプ409
は、従来技術によるものであるが、ビデオメモリ403
に格納されたピクセルデータをモニタ410での使用に
適したラスクシグナルに変換する。モニタ410は、横
1120個X縦832個のピクセルの解像度を有するグ
ラフィックイメージの表示に適したタイプのものである
この発明による参照リストは、大容量記憶装置406に
格納され、モニタ410でユーザに表示されるか、また
は、プリンタ405で印刷される。
[発明の効果] 前述した実施例から明らかなように、本発明によれば、
コンピュータシステムにおけるファイルの自動索引付は
方法およびその装置が提供される9本発明は、前記のと
うり図示された実施例に限定されることなく、他にも使
用可能であり、特許請求の範囲によってめみ限定される
ものである。
尚、以下はプログラムである。
PROGRAM  A inclax、c 拳True11’b’l寥adlreet6ryorj
yllbollellnkindex c that”co6dTyg41H入×1−10+ )l O駄p11) ” Ram am ’OKnamll’、 but f
or ell・t ypa。
’ Append ’x’ to tM glv@n 
6(*fllIn、atm array。
1oHInd@X1lrlt@111t++1rll*
celλ−f−1r11scall自10.’dWat
rilocal14eoae+++’ R*eur++
1マely !mixヒM contIlmn or 
dlr*eearyすゝ支ndex、 C PROGRAM B PROCRMi R1’kl+ua−ノーys會+abAmaoc>at
m+1.に、ld、+z17プ◆ゆl ^ddl:@1lslR1+ r*cm a−σowd7
【図面の簡単な説明】
第1図は本発明の実施に使用される第1のコンピュータ
プログラムのフロー図、第2図は本発明め実施に使用さ
れる第2のコンピュータプログラムのフロー図、第3図
は本発明の実施に使用される第3のコンピュータプログ
ラムのフロー図、第4図は本発明の実施が可能なコンピ
ュータシステムのためのハードウェア構成の一実施例を
示すブロッ1り図である。 400・・・CPU 401・・・主記憶装置 403・・・ビデオメモリ 404・・・キーボード 405・・・プリンタ 406・・・大容量記憶装置 407・・・双方向性システムバス 408・・・ビデオマルチブレクスおよびシフタ回路4
09・・・陰極線管(CRT)

Claims (6)

    【特許請求の範囲】
  1. (1)大容量記憶ファイルシステムを有するコンピュー
    タシステムで使用される前記ファイルシステムに格納さ
    れたファイルの自動索引付け装置において、 最新の索引付け日付と、少なくとも幾つか の前記格納ファイルの各々について、最終の更新日付お
    よび前記格納ファイルと少なくとも1つのキーワードと
    の関連に関する情報とを有する少なくとも1つの索引フ
    ァイルを前記ファイルシステムに保持する手段と、 新たなファイルが前記ファイルシステムに 加えられる時並びに既存のファイルが更新される時に前
    記少なくとも1つの索引ファイルを自動的に更新する手
    段とから成り、前記自動更新手段が更に、 各ファイルについて前記最新の索引付け日 付と前記最終の更新日付とを比較する手段と、当該ファ
    イルの前記最終の更新日付が前記 最新の索引付け日付よりも遅いかどうかを判定する手段
    と、 前記判定手段により前記各ファイルの最終 の更新日付が前記最新の索引付け日付よりも遅いと判定
    された時に前記キーワード関連情報を更新する手段とか
    ら構成されることを特徴とするファイルの自動索引付け
    装置。
  2. (2)前記格納ファイルが各々1つのファイルのタイプ
    と関連づけられ、 前記自動更新手段が更に、 各ファイルについて前記ファイルのタイプ を検査する手段と、 前記ファイルのタイプに基づいて前記ファ イルからキーワードと前記キーワードの相対的出現度に
    関する情報とを抽出する手段とから成ることを特徴とす
    る請求項1記載のファイルの自動索引付け装置。
  3. (3)更に、前記キーワード関連情報に基づいて前記フ
    ァイルを検索する手段から構成されることを特徴とする
    請求項1記載のファイルの自動索引付け装置。
  4. (4)大容量記憶ファイルシステムを有するコンピュー
    タシステムで使用される前記ファイルシステムに格納さ
    れたファイルの自動索引付け方法において、 最新の索引付け日付と、少なくとも幾つか の前記格納ファイルの各々について、最終の更新日付お
    よび前記格納ファイルと少なくとも1つのキーワードと
    の関連に関する情報とを有する少なくとも1つの索引フ
    ァイルを前記ファイルシステムに保持するステップと、
    新たなファイルが前記ファイルシステムに 加えられる時並びに既存のファイルが更新される時に前
    記少なくとも1つの索引ファイルを自動的に更新するス
    テップとから成り、前記自動更新ステップが更に、 各ファイルについて、前記最新の索引付け 日付と前記最終の更新日付とを比較するステップと、 当該ファイルの前記最終の更新日付が前記 最新の索引付け日付よりも遅いかどうかを判定するステ
    ップと、 前記各ファイルの最終の更新日付が前記最 新の索引付け日付よりも遅いと判定された時に前記キー
    ワード関連情報を更新するステップとから構成されるこ
    とを特徴とするファイルの自動索引付け方法。
  5. (5)前記格納ファイルが各々1つのファイルのタイプ
    と関連づけられ、 前記自動更新ステップが更に、 各ファイルについて、前記ファイルのタイ プを検査する手段と、 前記ファイルのタイプに基づいて前記ファ イルからキーワードと前記キーワードの相対的出現度に
    関する情報とを抽出する手段とから成ることを特徴とす
    る請求項4記載のファイルの自動索引付け方法。
  6. (6)前記キーワード関連情報に基づいて前記ファイル
    を検索する手段から構成されることを特徴とする請求項
    4記載のファイルの自動索引付け方法。
JP1270575A 1988-10-11 1989-10-11 コンピュータシステムにおけるファイルの索引付け方法およびその装置 Pending JPH02199558A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US25533888A 1988-10-11 1988-10-11
US255,338 1988-10-11

Publications (1)

Publication Number Publication Date
JPH02199558A true JPH02199558A (ja) 1990-08-07

Family

ID=22967872

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1270575A Pending JPH02199558A (ja) 1988-10-11 1989-10-11 コンピュータシステムにおけるファイルの索引付け方法およびその装置

Country Status (3)

Country Link
EP (1) EP0364180A3 (ja)
JP (1) JPH02199558A (ja)
CA (1) CA1318404C (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5657180A (en) * 1992-01-16 1997-08-12 Fujitsu Limited Management information updating method and mass storage system employing the method

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2078423C (en) * 1991-11-19 1997-01-14 Per-Kristian Halvorsen Method and apparatus for supplementing significant portions of a document selected without document image decoding with retrieved information
US5390259A (en) * 1991-11-19 1995-02-14 Xerox Corporation Methods and apparatus for selecting semantically significant images in a document image without decoding image content
CA2077604C (en) * 1991-11-19 1999-07-06 Todd A. Cass Method and apparatus for determining the frequency of words in a document without document image decoding
US5581751A (en) * 1992-09-22 1996-12-03 Mitsubishi Denki Kabushiki Kaisha Key extraction apparatus and a key extraction method
AU684549B2 (en) * 1993-09-28 1997-12-18 Kabushiki Kaisha Toshiba Selective diversity system
US7716163B2 (en) 2000-06-06 2010-05-11 Microsoft Corporation Method and system for defining semantic categories and actions
US7770102B1 (en) 2000-06-06 2010-08-03 Microsoft Corporation Method and system for semantically labeling strings and providing actions based on semantically labeled strings
US7788602B2 (en) 2000-06-06 2010-08-31 Microsoft Corporation Method and system for providing restricted actions for recognized semantic categories
US7712024B2 (en) 2000-06-06 2010-05-04 Microsoft Corporation Application program interfaces for semantically labeling strings and providing actions based on semantically labeled strings
US7778816B2 (en) 2001-04-24 2010-08-17 Microsoft Corporation Method and system for applying input mode bias
US7707496B1 (en) 2002-05-09 2010-04-27 Microsoft Corporation Method, system, and apparatus for converting dates between calendars and languages based upon semantically labeled strings
US7707024B2 (en) 2002-05-23 2010-04-27 Microsoft Corporation Method, system, and apparatus for converting currency values based upon semantically labeled strings
US7742048B1 (en) 2002-05-23 2010-06-22 Microsoft Corporation Method, system, and apparatus for converting numbers based upon semantically labeled strings
US7827546B1 (en) 2002-06-05 2010-11-02 Microsoft Corporation Mechanism for downloading software components from a remote source for use by a local software application
US7356537B2 (en) 2002-06-06 2008-04-08 Microsoft Corporation Providing contextually sensitive tools and help content in computer-generated documents
US7716676B2 (en) 2002-06-25 2010-05-11 Microsoft Corporation System and method for issuing a message to a program
US7209915B1 (en) 2002-06-28 2007-04-24 Microsoft Corporation Method, system and apparatus for routing a query to one or more providers
US7783614B2 (en) 2003-02-13 2010-08-24 Microsoft Corporation Linking elements of a document to corresponding fields, queries and/or procedures in a database
US7711550B1 (en) 2003-04-29 2010-05-04 Microsoft Corporation Methods and system for recognizing names in a computer-generated document and for providing helpful actions associated with recognized names
US7739588B2 (en) 2003-06-27 2010-06-15 Microsoft Corporation Leveraging markup language data for semantically labeling text strings and data and for providing actions based on semantically labeled text strings and data
US7788590B2 (en) 2005-09-26 2010-08-31 Microsoft Corporation Lightweight reference user interface
US7992085B2 (en) 2005-09-26 2011-08-02 Microsoft Corporation Lightweight reference user interface
US10007803B2 (en) 2012-10-26 2018-06-26 Infosys Limited Searching over encrypted keywords in a database
IN2014CH00681A (ja) 2014-02-13 2015-08-14 Infosys Ltd

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4358824A (en) * 1979-12-28 1982-11-09 International Business Machines Corporation Office correspondence storage and retrieval system
JPS59180641A (ja) * 1983-03-30 1984-10-13 Fuji Facom Corp フアイル管理方式
JPS63240677A (ja) * 1987-03-27 1988-10-06 Matsushita Graphic Commun Syst Inc フアイルシステムの文書登録・検索方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5657180A (en) * 1992-01-16 1997-08-12 Fujitsu Limited Management information updating method and mass storage system employing the method

Also Published As

Publication number Publication date
EP0364180A3 (en) 1990-11-14
CA1318404C (en) 1993-05-25
EP0364180A2 (en) 1990-04-18

Similar Documents

Publication Publication Date Title
JPH02199558A (ja) コンピュータシステムにおけるファイルの索引付け方法およびその装置
JP3341988B2 (ja) インデックス表示方法
US5848409A (en) System, method and computer program product for maintaining group hits tables and document index tables for the purpose of searching through individual documents and groups of documents
US5758358A (en) Method and system for reconciling sections of documents
US5671426A (en) Method for organizing incremental search dictionary
US7328211B2 (en) System and methods for improved linguistic pattern matching
US6081804A (en) Method and apparatus for performing rapid and multi-dimensional word searches
US5157606A (en) System for translation of source language data into multiple target language data including means to prevent premature termination of processing
US6546394B1 (en) Database system having logical row identifiers
JPH10501912A (ja) Nグラム・ワード分解を用いた携帯型文書索引付け用のシステム及び方法
JPH02271468A (ja) データ処理方法
US5307494A (en) File name length augmentation method
US6298343B1 (en) Methods for intelligent universal database search engines
CN111324607B (zh) Sql语句复用方法和装置
US6212513B1 (en) Database access system
US5778383A (en) System for dynamically caching and constructing software resource tables
JPH05324719A (ja) 文書検索システム
JPH07146880A (ja) 文書検索装置及び方法
US6963865B2 (en) Method system and program product for data searching
US9020995B2 (en) Hybrid relational, directory, and content query facility
US6618724B1 (en) Human-natural string compare for filesystems
JP4690232B2 (ja) 情報処理装置、ソフトウェア登録方法およびプログラム
JPH05128159A (ja) キーワード抽出方法及び装置
JPH07230452A (ja) 文書処理装置
JPH05342161A (ja) セキュリティ識別装置