JPH11161686A - 連続インデックス機構 - Google Patents

連続インデックス機構

Info

Publication number
JPH11161686A
JPH11161686A JP10278174A JP27817498A JPH11161686A JP H11161686 A JPH11161686 A JP H11161686A JP 10278174 A JP10278174 A JP 10278174A JP 27817498 A JP27817498 A JP 27817498A JP H11161686 A JPH11161686 A JP H11161686A
Authority
JP
Japan
Prior art keywords
file
index
user
information
file system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10278174A
Other languages
English (en)
Other versions
JP3341988B2 (ja
Inventor
Jeffrey J Walls
ジェフリー・ジェイ・ウォールズ
David J Sweetser
デイビッド・ジェイ・スウィーサー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HP Inc
Original Assignee
Hewlett Packard Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Co filed Critical Hewlett Packard Co
Publication of JPH11161686A publication Critical patent/JPH11161686A/ja
Application granted granted Critical
Publication of JP3341988B2 publication Critical patent/JP3341988B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/954Navigation, e.g. using categorised browsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99934Query formulation, input preparation, or translation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99936Pattern matching access
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99937Sorting
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99943Generating database or data structure, e.g. via user interface
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99951File or database maintenance
    • Y10S707/99952Coherency, e.g. same view to multiple users
    • Y10S707/99953Recoverability

Abstract

(57)【要約】 【課題】インターネットまたはイントラネットのワール
ド・ワイド・ウェブのような大規模データベースのファ
イルに記憶される所望の情報への効率的アクセス手段を
提供する。 【解決手段】複数の情報源に記憶される情報に包括的に
かつ連続的にインデックスを付ける連続インデックス機
構を提供し、このインデックスを用いてユーザが所望の
情報の所在する場所を迅速に検索する。そのため、連続
インデックス機構は、情報の主題を特徴づけるキーワー
ドのようなインデックス構成エレメントと、対応するイ
ンデックス構成エレメントによって特徴づけられる主題
をどのファイルが含むかを識別する対応する位置エレメ
ント(例えばURL)を含む。連続インデックス機能は、
ファイルのすべてを検索して当該ファイル・システム内
の情報の包括的インデックスを作成し、あらかじめ定め
られた間隔またはユーザの指定する間隔でそのインデッ
クスを更新する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、大規模データベー
スにおけるファイルへのアクセスを実行するデータ処
理、検索および表示システムに関するもので、特にパブ
リックおよびプライベートにアクセス可能なネットワー
クにおけるインデックス・ファイルに関するものであ
る。
【0002】
【従来の技術】ますます増大する大規模ネットワークに
おけるコンピュータの相互接続がユーザに膨大な量の情
報へのアクセスを提供している。この情報は、一般的に
は多数のネットワーク・サーバ上に記憶されまたはそれ
らサーバによってアクセスされることができるという意
味において極めて分散的であるといえよう。そのような
ネットワーク・サーバの各々は、典型的には、パーソナ
ル・コンピュータ、ワークステーションまたはその他の
タイプのコンピュータのネットワークに対するネットワ
ーク・サポートおよび調整を提供する。ネットワーク・
サーバが、ドキュメント、プログラム、スクリプトまた
はその他の形式のデータからなる1つまたは複数のファ
イル・グループへのアクセスを維持する場合がある。そ
のようなファイル・グループは、一般的にファイル・シ
ステムと呼ばれ、ディレクトリおよびサブディレクトリ
の階層システムによって構成される。ファイル・システ
ムのファイルは、ネットワーク・サーバによって直接的
にまたは間接的にアクセス可能な磁気、光学またはその
他の媒体に記憶される。
【0003】そのようにパブリックにアクセス可能なコ
ンピュータの相互接続形態は、一般に、多数の相対的に
小規模の(ネットワーク・サーバからなる)ネットワーク
を含むインターネットと呼ばれるものである。インター
ネットにおけるネットワーク・サーバは、典型的には、
ハイパーテキスト・マークアップ・ランゲージ(すなわ
ちHTML)でフォーマットされたデータ・ファイルの
転送および表示を可能にするハイパーテキスト転送プロ
トコル(すなわちHTTP)をサポートする。そのような
ネットワーク・サーバの相互接続形態は、一般にワール
ド・ワイド・ウェブ(すなわちWWW)と呼ばれ、ワール
ド・ワイド・ウェブを介して転送されるデータ・ファイ
ルは、一般にウェブ・ページと呼ばれる。
【0004】ウェブ・ページは、一般にウェブ・ブラウ
ザと呼ばれるソフトウェア・アプリケーションによって
表示あるいは複製されるデータを含む。そのようなデー
タは、テキスト、グラフィックス、画像、音およびビデ
オを含む種々の形式で表現される。加えて、ウェブ・ペ
ージは、一般的には、他のウェブ・ページまたはディレ
クトリへのポインタまたはハイパーリンクを含む。ウェ
ブ・ページ上で表示される時、そのようなハイパーリン
クは、典型的には、多くの場合カラー、下線、または近
傍に置かれるカーソルの形状変化によってハイライトさ
れる文字列またはアイコンのようなテキストまたはグラ
フィック・エレメントによって識別される。各ハイパー
リンクは、HTML形式のユニフォーム・リソース・ロ
ケータ(すなわちURL)として知られるアドレスに関連
づけられる。URLは、参照されるファイル・サーバ
(またはウェブ・サーバ)、ディレクトリ、ウェブ・ペー
ジまたはウェブ・ページ上の位置(以下単に"ウェブ・ペ
ージ"と呼ぶ)をユニークに識別する。参照されるウェブ
・ページへのアクセスは、典型的には、ビデオ・ディス
プレイ上のカーソルがハイパーリンクにまたはそれに隣
接して置かれるように、マウス、トラックボール、タッ
チパッド、ジョイスティックまたはキーボード方向キー
のようなポインティング・デバイスを操作することによ
って始動される。ユーザはボタンまたはキーを押してハ
イパーリンクを選択し、それによってユーザが取り出し
たいウェブ・ページのURLが間接的に標示される。
【0005】パブリックにアクセス可能なネットワーク
・サーバによって一般に使用されるHTMLによって、
ウェブ・ページの読者は、そのウェブ・ページのコンテ
ントに関連する関心事項をハイパーリンクの選択を通し
て容易に追求することが可能とされる。従って、特定の
主題に関心を持つユーザは、多数のその他の関連ウェブ
・ページにリンクする1つのウェブ・ページから開始す
ることができる。それらの他のウェブ・ページは更に別
のウェブ・ページにリンクしている。しかしながら、そ
のような一群の相互関係のあるウェブ・ページを通過す
るナビゲーションはしばしば時間を浪費する。この技術
は、また、ハイパーリンク表現がそれがポイントするウ
ェブ・ページのコンテントを正確に表現しないこともあ
るので、非常に能率が悪い場合もある。それに加えて、
異なるハイパーリンク表現のため同じではないように見
える多数のハイパーリンクが同じウェブ・ページをポイ
ントし、そのためユーザが以前にアクセスしたウェブ・
ページにアクセスすることとなる場合もある。
【0006】代替的方法として、特定の主題に関心のあ
るユーザが、検索エンジンと呼ばれる種々のソフトウェ
ア・アプリケーションの1つを使用する場合がある。典
型的には、ユーザは、しばしばキーワードと呼ばれる文
字列を検索エンジンに入力する。そこで、検索エンジン
は、そのキーワードを、ウェブ・ページのタイトルまた
はテキストの中に同じまたは関連した文字列を持つウェ
ブ・ページと合致させようと試みる。しかしながら、ワ
ールド・ワイド・ウェブは非常に大きいので、検索エン
ジンがユーザに返す合致ウェブ・ページの数は何万、何
十万あるいはそれ以上にのぼることもある。更に、検索
を狭めるためたとえブール表現や人工知能またはその他
の方式を使用しても、検索エンジンによって識別される
ウェブ・ページが、語の使用の同音異義語または合致に
よって生成されるので、ユーザの関心とは無関係のもの
である可能性もある。重要な点であるが、従来技術の検
索方法およびシステムは、一般に次のような反復プロセ
スを必要とする。すなわち、ユーザが情報を要求し、そ
の情報が取り出されユーザに提示され、最初の検索から
返される予想外の結果を排除するためまたは予想もしな
い広範囲の検索結果を狭くするためユーザは検索要求の
質を改善し、その後再び情報が取り出され、ユーザに提
示され、再び質の向上を行うというように、プロセスが
反復される。インターネット上の情報へのアクセスが瞬
間的ではなく遅いこともあるので、従来技術の方法およ
びシステムは、大きい時間量を消費するにもかかわら
ず、ユーザが所望の情報を最終的に見つけるかまたは情
報が利用できないと合理的に結論することができるこを
保証することができない。
【0007】ユーザが、ハイパーリンクをたどるか、キ
ーワードで検索するか、あるいは、直接URLを入力す
ることによって関心を持つウェブ・ページを見つけるこ
とに成功した時、ユーザは、そのようなウェブ・ページ
に将来戻ることができることを望むことがある。そのよ
うな再訪を可能にする1つの既知の方法は、いわゆる
「ブックマーク」にそれを関連づけることによってその
ようなウェブ・ページのURLを記録するものである。
ユーザは、フォルダ、サブフォルダ、サブ−サブフォル
ダ等々の範囲内に整理されるブックマークの階層を作成
することができる。これらのフォルダは、アルファベッ
ト順、または、主題別、あるいは、重要性やアクセス頻
度またはその他の基準に従って、配列される。次に、ユ
ーザは、関心事項を探し出すためそのブックマーク集合
を検索し、関連ウェブ・ページを再訪するため適切なブ
ックマークを選択する。そのようなブックマーク集合の
開発の負担はユーザにあり、関心を持つウェブ・ページ
を探し出し、フォルダおよびサブフォルダの記述的名前
を決定し、アルファベット順またはその他でフォルダを
構成し、ユーザの関心事項が変化したり増大する場合フ
ォルダの名前または構成を修正し、参照されるウェブ・
ページがそのURLを変更したりあるいはアクセス不可
能となる時フォルダの内容を修正するというような多大
な時間および労力を必要とする。
【0008】それに加えて、所望の情報を探し出し構成
するためのこのような従来技術のシステムおよび方法
は、そのような情報が取得される情報源に対する制御を
ユーザに適切に提供することができないことがしばしば
ある。例えば、ユーザは、適切なキーワードを使用する
ことによってまたは適切なカテゴリから選択することに
よって検索を制限することができても、ファイル・シス
テム・グループのうちの特定のファイル・システムに検
索を制限することができない。このように、特に関連の
あるファイル・システムに維持される非常に価値ある情
報への参照がさほど関連のないまたは偽の情報源から取
り出される多数の参照の間に隠されるので、そのような
参照が看過されることがある。また、種々の検索から拾
い集められ例えばあるブックマーク方式の下で構成され
た情報が最新のものであると保証されることが通常望ま
しい。この目標を満たすため、ユーザは、典型的には、
更に別の検索を始動したり、あるいは、ブックマーク方
式によって参照される情報を再検査することを必要とす
る。そのような努力は、典型的には、ユーザの大きな時
間および個人的注意を必要とする。更に、検索の結果
は、検索に使用される特定のキーワードまたはキーワー
ドの組合せ、検索エンジンのタイプ、ブックマーク方式
を構成する際のユーザの主観的好みおよびその他の要因
に大きく依存する。 また、一般に会社、団体、代理店
またはその他のエンティティの範囲内のコンピュータ・
ネットワークでありインターネットと違って通常または
一般にパブリックにアクセスすることはできない"イン
トラネット"のユーザに対し提示するため、ユーザの関
心のあるウェブ・ページを識別し、構成し、あるいはア
クセスする場合にも同様の問題が起きる。また、イント
ラネット・グループ内で生成されるウェブ・ページは多
数あり、また、イントラネットのユーザは、例えばイン
ターネットまたは別のイントラネットで外部的に生成さ
れたウェブ・ページを取り入れることを望むので、その
ようなイントラネットによってアクセスできるウェブ・
ページは非常に多数あり、主題の点で多様である。ウェ
ブ・ページの範囲内に含めるドキュメント、レポート、
様式、命令、リスト、記録およびその他の作業製品、参
照文献または情報が増大するにつれ、イントラネット
は、部門またはプロジェクトのようなユーザ・グループ
の効率的業務にとって不可欠なものとなる。そのような
グループの設定において、ブックマーク構成のような従
来技術の方法によって要求されるように、イントラネッ
ト上のそのようなウェブ・ページを識別、構成、あるい
はアクセスするため各人がそれぞれの方式を開発するこ
とは、しばしば、非効率であり、生産性を損なうもので
ある。
【0009】
【発明が解決しようとする課題】従って、データベース
のファイルに記憶される所望の情報への標準化された、
反復可能な、重複しない、適切で効率的アクセスを提供
するシステムおよび方法が必要とされる。所望の情報を
取り出すべき情報源を形成するファイル・システムをユ
ーザが識別し、制限することができなければならない。
加えて、そのようなシステムおよび方法は、グループに
よる使用にうまく適合しなければならない。特に、グル
ープ・メンバの中の努力の重複を避け、グループ・メン
バが最小限の努力でシステムまたは方法の使用を学ぶこ
とを可能にし、すべてのユーザに対して実質的に同じ形
式で情報を表示する直観的ユーザー・インタフェースを
提供することができなければならない。
【0010】
【課題を解決するための手段】本発明は、データベース
のような1つまたは複数の情報源に記憶される情報に包
括的にかつ連続的にインデックスを付けるシステムおよ
び方法である。本発明の1つの局面において、連続イン
デックス機構が提供される。連続インデックス機構は、
ファイル・システム内に含まれる情報の連続的に更新さ
れるインデックスをユーザに提供するため、少くとも1
つのファイル・システム内で1つまたは複数のファイル
を1つまたは複数の間隔で検索するように構成される。
インデックスは、情報の主題を特徴づけるインデックス
構成エレメント、および、対応するインデックス構成エ
レメントによって特徴づけられる主題をどのファイルが
含むかを識別する対応する位置エレメントを含む。この
ような機能は、ユーザに最新の情報を提供し、1つまた
は複数のファイルの情報における変更がユーザに認識さ
れていることを確実にするため必要とされる検索の周期
的反復を不要とする。
【0011】連続インデックス機構は、好ましくは、1
つまたは複数のファイル・システム内の上記1つまたは
複数のファイルのすべてを検索して、当該1つまたは複
数のファイル・システム内の情報の包括的インデックス
をユーザに提供する。このような機能は、すべての関連
した情報が取り出されたか否かを判断るため付加的検索
をユーザが始動する必要性を除去する。
【0012】1つの側面において、本発明のインデック
スは、各々がインデックス構成エレメントの1つおよび
それに対応する位置エレメントの1つに対応する複数の
記述エレメントを含む。記述エレメントは、対応するイ
ンデックス構成エレメントによって特徴づけられる情報
の主題を記述する。1つの側面において、上記インデッ
クスは、更に、各々がインデックス構成エレメントの1
つに対応する1つまたは複数の2次インデックス構成エ
レメントを含む。2次インデックス構成エレメントは、
対応するインデックス構成エレメントによって特徴づけ
られる情報を一層詳細に特徴づける。
【0013】1つの側面において、上記1つまたは複数
のファイル・システムは、ユーザによって選択される。
この機能によって、ユーザが関心のある情報を含んでい
る可能性があるものとしてユーザによって指定される情
報源だけを連続インデックス機構が検索することが可能
とされ、そのため、無関係な情報源の数を減少させるこ
とができる。
【0014】1つの側面において、上記少なくとも1つ
のファイル・システムは、ネットワークにおけるファイ
ルを含む。1つの側面において、上記少なくとも1つの
ファイル・システムは、分散データベースの中のファイ
ルを含む。1つの側面において、上記少なくとも1つの
ファイル・システムの1つまたは複数のファイルは、H
TML形式をしている。
【0015】1つの側面において、上記1つまたは複数
のファイル・システムは、ユーザによって選択される。
この機能によって、ユーザが関心のある情報を含んでい
る可能性があるものとしてユーザによって指定される情
報源だけを連続インデックス機能が検索することが可能
とされ、そのため、無関係な情報源の数を減少させるこ
とができる。
【0016】1つの側面において、連続インデックス機
構は、1つまたは複数のファイルのあらかじめ決められ
た部分を検索する。1つの側面において、そのようなあ
らかじめ決められた部分は、ヘッダである。ファイル全
体ではなくファイルのヘッダだけを検索するこのような
機能は、インデックスを作成するために必要とされる時
間量を減少させる。
【0017】1つの側面において、インデックスの記述
エレメントは、ファイル・システムにおけるファイルの
タイトルである。1つの側面において、ファイルは、キ
ーワードであるインデックス構成エレメントを含むヘッ
ダを含む。
【0018】1つの側面において、連続インデックス機
構は、ユーザによって選択される1つまたは複数の間隔
でファイル・システムのファイルを検索する。インデッ
クスにおける情報がユーザによって必要とされる時最新
のものであるようにするためインデックスが再作成され
るべき頻度をユーザが決定することが可能となる。1つ
の側面において、そのような間隔はあらかじめ決められ
た間隔である。この機構によって、毎時または始業時毎
のように定期的間隔でインデックスが自動的に再作成さ
れるので、ユーザは、インデックスの再作成を待つこと
なくインデックスを使用することができる。
【0019】1つの側面において、連続インデックス機
構は、インデックスが作成される元となるファイル・シ
ステムを識別し、また、ファイル・システムのファイル
を分析してインデックス構成エレメントおよび記述エレ
メントがファイルからどのように抽出されるべきかを決
定することができるように構成されるファイル・システ
ム識別機構を含む。1つの側面において、連続インデッ
クス機構は、ファイルからインデックス構成エレメント
および記述エレメントを抽出し、また、それらのエレメ
ントおよび位置エレメントで構成することができるよう
に構成されるインデックス構築機構を含む。1つの側面
において、そのようなあらかじめ決められた形式はアル
ファベット順である。このような構成方式によって、ア
ルファベット順に構成されたインデックス構成エレメン
トまたは記述エレメントを観察することによってユーザ
にとって関心のある主題がインデックスに含まれている
か否かをユーザが直感的にかつ迅速に判断することが可
能となる。
【0020】1つの側面において、インデックス構築機
構は、ファイルにアクセスするファイル走査機構、少く
とも1つのデータ構造を生成しそのようなデータ構造に
インデックス構成エレメント、記述エレメントおよび位
置エレメントを記憶するデータ構造生成機構、および記
憶されたエレメントからインデックスを生成するインデ
ックス生成機構を含む。1つの側面において、インデッ
クス生成機構は、インデックスを生成するため、記憶さ
れたエレメントをHTML形式でフォーマットする。こ
のような機能によって、イントラネットまたはインター
ネットのウェブ・ページとしてインデックスをユーザに
表示することが可能とされる。1つの側面において、フ
ァイル走査機構は、ユーザが選択した更新間隔でファイ
ル・システムのファイルの処理を定期的に再始動する。
1つの側面において、ファイル走査機構は、ユーザ・コ
マンドなしに自動的にそのような周期的処理を始動す
る。
【0021】1つの側面において、ファイル走査機構
は、ファイル・システムの遠隔ファイルからファイル・
システムのローカル・ファイルへヘッダ情報をコピーす
る。この機能によって、遠隔ファイルをアクセスする場
合発生する可能性のある時間遅延なしにローカルにヘッ
ダ情報が取得されるので、後続の周期的処理においてイ
ンデックスを作成するために必要とされる時間が減少さ
れる。
【0022】本発明の1つの側面において、インデック
ス構築機構によって作成されるデータ構造は、インデッ
クス構成エレメント、記述エレメントおよび位置エレメ
ントを記憶する記憶データ構造、および、記憶データ構
造にリンクされるポインタ・データ構造を含む。リンク
機構が、記憶された記述エレメントおよび対応する記憶
された位置エレメントの最初のペアを記憶された記述エ
レメントおよび対応する記憶された位置エレメントの第
2のペアにリンクし、この場合、第1のペアの対応する
インデックス構成エレメントは、第2のペアの対応する
インデックス構成エレメントに言語の観点から類似して
いる。1つの側面において、そのような言語上の類似性
は、第1のペアのインデックス構成エレメントが第2の
ペアの対応するインデックス構成エレメントと同じもの
であることを意味する。このようなリンク機構によっ
て、インデックス構築機構がインデックス構成エレメン
トおよび位置エレメントの第1のペアにアクセスするこ
とによってインデックスを作成し、言語的に類似または
同じインデックス構成エレメントを持つ別のそのような
ペアへのリンクを続けることを可能にする。次に、イン
デックス構築機構は、異なるインデックス構成エレメン
トを持つそのようなペアの次のグループに対するそのよ
うなプロセスを反復することができ、従って、共通のイ
ンデックス構成エレメントによって構成されるそのよう
なペアの複数グループを作成することができる。
【0023】1つの側面において、インデックス構築機
構によって作成されるデータ構造が、インデックス構成
エレメントおよび位置エレメントを記憶する検索データ
構造を更に含み、この場合、記憶される検索エレメント
は、少くとも1つのユーザ指定文字と比較されるように
構成される。1つの側面において、インデックス構築機
構のインデックス生成機構は、ユーザ指定の検索文字に
応じて検索レポートを生成するため記憶された検索エレ
メントをHTML形式にフォーマットする。この機能に
よって、ユーザが検索文字または検索語のような文字ス
トリングを指定することが可能とされ、また、ファイル
・システムの中のどのファイルが検索文字を含むインデ
ックス構成エレメントを持つかを標示するHTML形式
の検索レポートをユーザに提示することが可能とされ
る。更に、表示されない位置エレメントを含むそのよう
なレポートをHTML形式でユーザへ提示することによ
って、ウェブ・ページからハイパーリンクされたファイ
ルを選択し取り出すための既知の技術に従って、ユーザ
が、関心のあるレポートにおけるエントリを選択して対
応するファイルを取り出すことが可能とされる。
【0024】1つの側面において、ファイル走査機構
は、ファイル・システムにおけるファイルの処理を始動
する走査始動機構、走査始動機構に応答してファイルに
アクセスするファイル取り扱い機構、および、ファイル
からインデックス構成エレメントを抽出するヘッダ解析
機構を含む。1つの側面において、ファイルの形式があ
らかじめ決められた形式データベースの中の少なくとも
1つの形式と同じでなければ、ヘッダ解析機構はファイ
ルへのアクセスを中止する。別の側面において、インデ
ックス構成エレメントを見つける前にヘッダの後のHT
MLタグを見つけない場合、ヘッダ解析機構はファイル
へのアクセスを中止する。更に別の側面において、イン
デックス構成エレメントを見つける前にあらかじめ決め
られた数より多いデータ・バイトに出会う場合、ヘッダ
解析機構はファイルへのアクセスを中止する。このよう
なヘッダ解析機構によって、第1のファイルがHTML
形式のヘッダもインデックス構成エレメントも保有して
いないと判断され次第第1のファイルが閉じられ、ファ
イル・システムの次のファイルが読み取られることが可
能となる。このようにして、第1のファイル全体を読み
取るという時間の浪費が回避される。
【0025】1つの側面において、連続インデックス機
構は、また、ユーザ生成コマンドに応答してインデック
スの特定の部分を表示する表示管理機構を含む。1つの
側面において、インデックスのそのような特定の部分
は、対応するインデックス構成エレメントに関連して表
示される少くとも1つの記述エレメントを含む。1つの
側面において、表示される特定のインデックス部分が、
インデックス構成エレメント、対応するインデックス構
成エレメントに関連して表示される少くとも1つの第2
のインデックス構成エレメント、および、対応する2次
インデックス構成エレメントに関連して表示される少く
とも1つの記述エレメントを含む。このような機能によ
って、関心のある主題に関連したインデックス構成エレ
メントを求めてインデックスを調べることによって、ま
た、そのようなエレメントおよび対応する位置エレメン
トに関連するファイルの主題を具体的に特徴づける2次
インデックス構成エレメントを探すことによって検索の
質を向上させることができ、それによって、ユーザはそ
のような主題のある場所を迅速に特定することができ
る。
【0026】本発明の別の1つの局面において、グラフ
ィカル・ユーザ・インタフェース上にインデックスの一
部分を表示する方法が提供される。インデックスは、各
々が1つの頭文字および最初の2つの頭文字セットを有
する複数のインデックス構成エレメントおよび対応する
複数の位置エレメントを含む。該方法は、そのような頭
文字からなる文字バーを表示するステップ、グラフィカ
ル・ユーザ・インタフェース上のカーソルを所望の頭文
字に近い位置へ移動させるステップ、所望の頭文字を選
択するステップ、および、頭文字がインデックス構成エ
レメントに含まれているインデックス部分を表示するス
テップを含む。1つの側面において、該方法は、更に、
各々が選択された所望の頭文字を有する複数の最初の2
つの頭文字セットを含む文字バーを表示するステップ、
グラフィカル・ユーザ・インタフェース上のカーソルを
所望のそのような最初の2つの頭文字セットに近い位置
へ移動させるステップ、所望のそのような最初の2つの
頭文字セットを選択するステップ、および、所望の最初
の2つの頭文字セットがインデックス構成エレメントに
含まれているインデックス部分を表示するステップを含
む。
【0027】本発明の更に別の局面において、情報を含
む1つまたは複数のファイルを有するファイル・システ
ムからファイルを取り出す方法が提供される。該方法
は、グラフィカル・ユーザ・インタフェース上にインデ
ックスを表示するステップを含み、この場合、上記イン
デックスは、情報の主題を特徴づけるインデックス構成
エレメント、対応するインデックス構成エレメントによ
って表される主題をどのファイルが含むかを識別する対
応する位置エレメント、および、インデックス構成エレ
メントおよび位置エレメントの1つに対応し、情報の主
題を記述する記述エレメントを含む。該方法は、また、
グラフィカル・ユーザ・インタフェース上のカーソルを
関心のある情報を記述する第1の記述エレメントの近く
の位置へ移動させるステップ、第1の記述エレメントを
選択するステップ、および、位置エレメントによって識
別されたファイルを取り出すステップを含む。1つの側
面において、該方法は、また、選択された記述エレメン
トと関連したファイルの情報を表示するステップを含
む。
【0028】別の局面において、1つまたは複数のファ
イルを持つ少くとも1つのファイル・システム内に保持
され、連続的に更新される情報のインデックスを表示す
る方法が提供され、この場合、ファイルの各々は、イン
デックス構成エレメント、記述エレメントおよび位置エ
レメントを有する。該方法は、ファイル・システムを識
別するステップ、関連するインデックス構成エレメン
ト、記述エレメントおよび位置エレメントをファイルか
ら抽出するステップ、インデックス構成エレメントを構
成するステップ、位置エレメントの各々をその関連イン
デックス構成エレメントに関連づけるステップ、およ
び、記述エレメントの各々をその関連インデックス構成
エレメントと共に表示するステップを含む。
【0029】
【発明の実施の形態】本発明は、データベースのファイ
ルのような1つまたは複数の情報源に記憶される情報に
選択的にかつ連続的にインデックスを付けるシステムお
よび方法である。連続インデックス機構と呼ばれる本発
明の機構は、ユーザによって選択された情報源に含まれ
る主題の連続的に更新されるインデックスをユーザに提
供するため、選択されたあるいはあらかじめ定められた
間隔でユーザによって選択された情報源のあらかじめ定
められた部分を検索する。この機能によって、ユーザが
関心のある情報を含んでいる可能性があるものとしてユ
ーザによって指定される情報源だけを連続インデックス
機構が検索することが可能とされ、そのため、無関係な
情報源の数を減少させることができる。更に、このよう
な機能は、情報源における変更が検索結果に含まれてい
ることを確実にするために必要な検索をユーザが周期的
に反復することを不要とする。更に、連続インデックス
機構は、選択された情報源すべてを検索して、指定され
た情報源内のすべての情報の主題の包括的インデックス
をユーザに提供することができる。このような機能は、
すべての関連した情報が取り出されたか否かを判断るた
め付加的検索をユーザが始動する必要性を除去する。本
発明は、現在開発中または将来開発されるパーソナル・
コンピュータ、ネットワーク・サーバ、ワークステーシ
ョンまたはその他のコンピュータ・プラットホーム上で
の動作に適切なソフトウェアとして実施されることがで
きる。代替的には、本発明は、ハードウェア、ファーム
ウェアあるいはそれらのいかなる組み合せ形態でも実施
されることができる。
【0030】連続インデックス機構によって作成される
インデックスは、インデックス・エントリ集合を含む
(インデックス・エントリを以下単に"エントリ"と呼
ぶ)。エントリの各々は、ドキュメント、ファイル、ウ
ェブ・ページまたはその他の情報単位を参照する。連続
インデックス機構の1つの好ましい実施形態に従えば、
エントリは、インデックス構成エレメント、記述エレメ
ントおよび位置エレメントという3つのエレメントを含
む。インデックス構成エレメントは、情報単位のコンテ
ントを特徴づけるキーワードを含む。キーワードは、例
えば語または単純なフレーズである。記述エレメント
は、情報単位のコンテントのタイトルまたはそれに類似
した短い記述である。位置エレメントは、インデックス
作成のためユーザによって選択される情報源の1つの範
囲内の情報単位の位置を標示する。かくして、ユーザ
は、関心のある主題を探し出すためインデックス構成エ
レメントを調べ、その記述エレメントに基づいて特定の
情報単位を即座に所望のものとして識別し、対応する位
置エレメントに基づいてその情報単位を取り出すことが
できる。
【0031】1つの好ましい実施形態において、HTM
L型イントラネットの複数ノードにわたってデータベー
スが分散される。この形態においては、情報源は、イン
トラネットにおけるユーザ選択のファイル・システムで
あり、インデックスづけされる情報単位は、そのような
ファイル・システムにおける一般にウェブ・ページと呼
ばれるファイルである。この実施形態における各ファイ
ルに関連したインデックス構成エレメントは、ファイル
の作成者がファイルのヘッダに含めた1つのキーワード
またはおそらく複数のキーワードである。この実施形態
の記述エレメントは、ファイルのタイトルであり、これ
もまたファイルのヘッダに含められる。1つの実施形態
において、位置エレメントはファイルのURLである。
代替実施形態においては、位置エレメントは含まれない
かもしれないし、あるいは、ファイルの位置が推論され
る場合にはすべてのファイルに対して1つのURLがデ
フォルトとして使用されるかもしれない。例えば、1つ
のファイル・システムを持つイントラネットにおいて
は、すべてのファイルはそのファイル・システムに位置
しなければならない。用語「ヘッダ情報」は、この実施
形態においては以下タイトル、キーワードおよびファイ
ルのURLを意味するように使用されるが、更に一般的
には、その他の実施形態におけるファイルの記述エレメ
ント、インデックス構成エレメントおよび位置エレメン
トを意味する。
【0032】この実施形態のインデックスは、キーワー
ドに従ってアルファベット順に配列される。このよう
に、一旦インデックスされるべきファイル・システムを
選択すれば、その後は、ユーザは、キーワードのアルフ
ァベット順インデックスを参照することによってあるい
はそのタイトルに基づいて特定のファイルを選択するこ
とによって所望のファイルを容易に検出することができ
る。タイトルは、典型的には、共通のキーワードに関連
したグループ毎にアルファベット順に配列される。ファ
イルが少くとも1つのキーワードおよびタイトルを含む
ヘッダを持つことを前提とすれば選択されたファイル・
システムの中のあらゆるファイルがインデックスに含ま
れるので、インデックスは包括的である。そのような構
成に従って、ユーザは、特定のキーワードに関連する選
択されたファイル・システムにおけるすべてのファイル
のタイトルを即刻見ることができる。所望のファイルを
識別したりしなかったり、また、その他の適切な情報が
別の検索によって検出されるか否かが明確でないような
既知のシステムまたは方法に従った検索を実行するので
はなく、本発明の本実施形態は、所望の情報が選択され
たファイル・システムにおいて利用可能か、もし利用可
能であればそれがどこにあるかの識別をユーザに即刻提
供する。そのような結果は、ユーザのさほどの努力を必
要とせずに達成される。既知のシステムおよび方法と相
違して、本発明は、1つのグループ内のユーザが情報を
選択し取り出す共通の手法を学び使用することを可能に
する。そのような特性はグループを設定する際に重要で
あり、その際、情報共有、学習および保守容易さおよび
品質保証が価値を持つ。
【0033】本発明およびその基本的方法およびアーキ
テクチャの特性を、図1および図2に連続インデックス
機構123として表されている本発明の1つの実施形態
を参照して以下詳細に記述する。図1は、本発明の実施
に適切な1つのネットワーク環境を示すブロック図であ
る。ホスト・サーバ100は、プロセッサ110、入力
装置120、メモリ装置122、出力装置124、デー
タ・バックアップ装置126およびネットワーク・イン
タフェース128を含む既知の諸コンポーネントを含
む。連続インデックス機構123は、以下に記述される
ような連続インデックス機構123のデータ処理および
他の動作を実行することをプロセッサ11Oに命令する
ように本実施形態においてPERLおよび「C」プログ
ラミング言語で実施される。この目的のため他の多くの
プログラミング言語を使用することもできることは当業
者に理解されることであろう。代替的には、連続インデ
ックス機構123は、ソフトウェア、ハードウェア、フ
ァームウェアのどのような組合せでも実施することが可
能である。ソフトウェアで実施される場合、連続インデ
ックス機構123は、典型的には、入力装置120を介
してまたは種々の他の既知の方法のうちの1つに従って
メモリ装置122にロードされることができる。
【0034】プロセッサ110は、インテルのペンティ
アム・マイクロプロセッサ、PowerPCマイクロプ
ロセッサ、PA−RISCプロセッサ、SPARCプロ
セッサまたは68000シリーズ・マイクロプロセッサ
のような市販のプロセッサであり、あるいは、現在およ
び将来利用できるその他の多くのプロセッサのうちの1
つであることもできる。そのようなプロセッサは、典型
的には、オペレーティング・システム(図示されていな
い)を実行する。そのようなオペレーティング・システ
ムは、例えば、DOS、ウインドウズ3.1、ワーク・
グループ用ウインドウズ、マイクロソフトのウインドウ
ズ95またはウインドウズNTオペレーティング・シス
テム、アップルコンピュータのシステム7オペレーティ
ング・システム、サン・マイクロシステムズのソラリス
・オペレーティング・システム、サン・マイクロシステ
ムズ、ヒューレット・パッカードまたはAT&Tなど多
くのベンダから利用できるユニックス・オペレーティン
グ・システム、Linuxとして知られるユニックスの
「フリーウェア」バージョン、ノベルのネットウェア・
オペレーティング・システム、または、上記いずれかの
組合せあるいは将来のオペレーティング・システムであ
る。そのようなオペレーティング・システムは既知の方
法でファームウェアおよびハードウェアとインタフェー
スし、連続インデックス機構123を含む上述のホスト
・サーバ100のその他のコンポーネントの機構をプロ
セッサ110が調整し実行することを可能にする。
【0035】理解されることであろうが、ホスト・サー
バ100は、必ずしもそうでなければならないというこ
とではないが典型的にはネットワーク・サーバであり、
それは、パーソナル・コンピュータ、ワークステーショ
ン、その他のコンピュータ・プラットホーム、または後
述のホスト・サーバ100の諸機構を実行するように特
別に設計され構成される装置上に実施されることができ
る。例えば、入力装置120は、タッチ・スクリーン・
ディスプレイ、タッチ・パッドまたは音声認識装置をも
つマイクロホンのようなユーザ入力を受け取る種々の既
知の装置の何れをも含むことができる。同様に、出力装
置124は、ビデオ・モニタ、プリンタまたは音声合成
装置を持つ音声スピーカを含むことができる。メモリ1
22は、ランダムアクセス・メモリ(RAM)、リードオ
ンリー・メモリ(ROM)、組み込みハードディスクを含
むその他の磁気媒体あるいはその他のメモリ記憶装置を
含む市販の記憶装置のいずれかである。メモリ122
は、また、CD−ROMドライブ、テープ・ドライブ、
取り外し可能なハードディスク装置、ディスケット・ド
ライブのような取り外し可能な記憶装置を含むこともで
きる。ネットワーク・インタフェース128は、モデム
または他の通信装置を含むことができる。データ・バッ
クアップ装置126のようなホスト・サーバ100のこ
こに例示される実施形態のコンポーネントの一部は代替
実施形態では含められない場合があること、また、図1
の単純な実施形態が、ビデオ・ディスプレイ・カードま
たはキャッシュ・メモリのような一般にネットワーク・
サーバに見られるその他のコンポーネントを含んでいな
いことを明示的に示していないことは、理解されるであ
ろう。同じように、必要に応じてバックアップ・サーバ
140を使用してホスト・サーバ100の中断の場合ホ
スト・サーバ100の機構を引き継ぎ、連続インデック
ス機構123のユーザに対するサービスの中断がないよ
うにさせることも可能である。
【0036】本実施形態において、ホスト・サーバ10
0は、そのネットワーク・インタフェース128を経由
してネットワーク119に接続している。ノード11
1、112、113および114のようなネットワーク
119の諸ノードの各々は、各々がファイル・システム
を提供するホスト・サーバ100のようなホスト・サー
バから構成されるかそれを含む。ネットワーク119
は、インターネットまたはイントラネット150を経由
して、ネットワーク169またはネットワーク179の
ような他のネットワークに接続している場合もある。フ
ァイル・システム165がネットワーク169に接続し
ている。更に付加的ファイル・システムが、例えばノー
ド160、161、162または168におけるホスト
・サーバを経由してネットワーク169に接続すること
もできる。「接続」という用語は、インターネットまた
はイントラネット150にとって利用可能な既知のプロ
シージャおよびプロトコルに従って通信可能なように接
続されていることを意味する。本発明の他の実施形態に
おいては、ファイル・システム165はインターネット
またはイントラネットを経由してホスト・サーバ100
に接続している必要はなく、ネットワーク169などを
経由して直接接続されてもよい。
【0037】ホスト・サーバ100に接続しているが典
型的にはホスト・サーバ100に対して物理的に近接し
た位置にない、あるいはホスト・サーバ100を使用す
るグループのイントラネットの一部ではないファイル・
システムは、以下の記述において、遠隔ファイル・シス
テムと呼ばれる。遠隔ファイル・システムの範囲内に含
まれるファイルは、リンクまたは遠隔ファイルと呼ばれ
る。グループのイントラネットまたはローカル・エリア
・ネットワーク上でアクセスされるファイル・システム
は以下ローカル・ファイル・システムと呼ばれ、そこに
はソースまたはローカル・ファイルが記憶される。ロー
カル・ファイル・システムおよびローカル・ファイル
は、ホスト・サーバ100の一部であるメモリ122の
ようなメモリ装置に記憶されることもある。
【0038】連続インデックス機構123のユーザは、
ネットワーク179またはネットワーク・サーバに接続
するユーザ・コンピュータ175のようなパーソナル・
コンピュータ、ワークステーション、大型コンピュー
タ、またはインターネットあるいはイントラネット15
0のため設計されるあるいはそれと共に使用できるその
他の装置を利用することができる。そのようなユーザ・
コンピュータは、典型的には、(図示されてうないが)プ
ロセッサ、入力装置、ディスプレイ装置、少なくとも1
つのメモリ装置およびネットワーク・インタフェースを
含む。更に別の1つの実施形態において、ユーザ・コン
ピュータ175は、そのネットワーク・インタフェース
128およびネットワーク119のようなネットワーク
を経由してホスト・サーバ100に直接接続することも
できる。
【0039】理解されることであろうが、ネットワーク
119、169および179は、スイッチおよびアンプ
のような種々のコンポーネントを含むことができ、ま
た、電気ケーブルか、マイクロ波、光ファイバケーブ
ル、電波または他の材料あるいは媒体によって通信を搬
送することができる。更にまた理解されることであろう
が、例えばノード170、171、172または176
でネットワーク179に接続する多くのユーザ・コンピ
ュータは、インターネットあるいはイントラネット15
0を経由してホスト・サーバ100に接続する場合もあ
る。また、図1に示されるファイル・システム165
は、ホスト・サーバ100のノード以外のノードに位置
しているように示されているが、それは必ずしもそのよ
うな配置である必要はない。特に、ファイル・システム
165は、ホスト・サーバ100のメモリ122に配置
したり、直接ホスト・サーバ100によってアクセス可
能な配置とすることができる。また、別の1つの実施形
態において、ユーザ210は、ホスト・サーバ100の
入力装置120および出力装置124を経由してホスト
・サーバ100と直接対話することができる。
【0040】図2には、典型的には人間であるが機械で
あることもできるユーザ210によって使用されるもの
としてインデックス機構123が示されている。連続イ
ンデックス機構123は、ファイル・システム識別機構
220、表示管理機構240、およびインデックス構築
機構230を含む。ファイル・システム識別機構220
は、インデックスを構築する元となるファイル・システ
ムを識別し、選択されたファイル・システムのファイル
を分析して、キーワードおよびタイトル情報をそのよう
なファイルからどのように抽出するかを決定する。イン
デックス構築機構230は、HTMLインデックス・フ
ァイル239によって表されるインデックスに対応する
エントリを作成するために使用されるインデックス構成
エレメント、記述エレメントおよび位置エレメントを各
ファイルから抽出する。インデックス構築機構230
は、また、HTMLインデックス・ファイル239が表
示管理機構240に容易に提供されるようにするためこ
れら3つのエレメントを効率的に構成する。表示管理機
構240は、ユーザからの要求に応答してHTMLイン
デックス・ファイル239の特定部分をユーザに表示す
る。ファイル・システム識別機構220、インデックス
構築機構230および表示管理機構240の諸機構を以
下順に記述する。
【0041】ファイル・システム識別機構220 ファイル・システム識別機構220は、既知の技術を使
用してユーザ210にファイル・システムを選択するよ
うにプロンプトを出し、ユーザ210からファイル・シ
ステム選択211を受け取るファイル・システム定義機
構222を含む。種々の既知のグラフィック・インタフ
ェースなどのインタフェースを活用してそのようなプロ
ンプトを実行し応答を受け取ることができる。例えば、
ファイル・システムのディレクトリまたはツリーのグラ
フィック表現をユーザ210に提示して、ユーザがカー
ソル・ポインティング・デバイスを使用して1つのファ
イル・システムを選択することができる。代替的方法と
しては、キーボードを経由して所望のファイル・システ
ムへの経路を入力するようにユーザ210にプロンプト
することもできる。プロンプトに応じてユーザ210が
ファイル・システムを選択しない場合、ファイル・シス
テム定義機構222は、デフォルトのファイル・システ
ムを提供する。このデフォルトのファイル・システム
は、ユーザ210によって最も最近にまたは最も頻繁に
選択されたファイル・システム、ユーザ21Oがメンバ
であるグループによって使用されるイントラネットのフ
ァイル・システム、またはその他の1つのデフォルト・
ファイル・システムである。例示の目的のため、ユーザ
210がファイル・システム165を選択したと以下の
記述において仮定する。理解されることであろうが、フ
ァイル・システム165がインターネット上でアクセス
可能な遠隔ファイル・システムであるか、または、ユー
ザ210がメンバであるグループまたは他のエンティテ
ィのイントラネット上でアクセス可能なローカル・ファ
イル・システムであるかもしれない。
【0042】ファイル・システム定義機構222は、フ
ァイル・システム165を分析して、そのようなファイ
ル・システムの中のファイルが書かれている形式の特定
のタイプを決定する。そのような分析は、典型的には、
ハイパーテキスト転送プロトコールに従って遠隔または
ローカルのファイルをアドレスし取り出す既知の方法を
使用してファイル・システム165における最初のファ
イルにアクセスすることによって実行される。使用され
ている形式のタイプを標示する特殊文字、タグまたは他
の形式標示子がファイルに含まれているか否か調べられ
る。例えば、ファイルの中で遭遇される文字"<HTML>"
は、それがHTML形式で書かれていることを標示す
る。当業者にとって明らかであるように、種々の比較、
照合または他のどのような方法を使用しても、そのよう
な最初のファイルに存在する形式標示子を多数の既知の
形式方式のうちの1つの特徴を持つ形式識別子と関係づ
けることができる。
【0043】オプションとして、種々の既知のサンプリ
ング方法を使用して、1つまたは複数の付加的ファイル
を同様に検査して、ファイル・システム165の中のフ
ァイルに関して他の形式方式が使用されているか否か判
断することができる。1つの好ましい実施形態において
は、当該ファイルがヘッダ情報を求めて検索されるべき
ことを標示する拡張子をそのファイル名が持っているか
否かを考察することによってこの判断が達成される。例
えば、1つの実施形態において、.HTML、.HTYおよび.TX
Tというファイル拡張子を持つファイルは、検索される
べきファイルである。これは、本発明がバイナリ・ファ
イルのような無関係なファイルを探索することを防ぐ。
検索されるべきファイルの識別情報はユーザのアクセス
可能なファイルに含められ、ユーザに一層の制御を提供
する。
【0044】ファイル・システム識別機構220の形式
識別機構224は、インデックス構成および記述エレメ
ントを標示するためファイル・システム165に使用さ
れる特定の形式標示子を識別する。種々の既知の比較、
照合または他のどのような方法を使用してもこのような
機構を実行することができる。図1のネットワーク環境
に従う1つの典型的な実施形態において、ファイル・シ
ステム165がHTML形式で書かれたファイル(すな
わちウェブ・ページ)を含むと仮定される。そのような
形式においては、上述のように、適切な記述エレメント
は、ファイル作成者によって各ファイルのヘッダに頻繁
に記載されるタイトルである。詳細は後述するが、タイ
トルに関して公認されている1つのHTML形式は、"<
!-- Title:title of the file-->"という文字列であ
る。但し、引用符は含まれず、下線の語はファイルのタ
イトルである。従って、形式識別機構224は、そのよ
うな形式、および、ファイル・システム165における
タイトルを標示するため使用されるようなタイトルに関
するその他の公認のHTML形式を識別する。同様に、
HTML形式で書かれたファイルにおける適切なインデ
ックス構成エレメントは、同様にヘッダに書き込まれる
1つまたは複数のキーワードである。従って、形式識別
機構224は、ファイル・システム165におけるキー
ワードを標示するため使用される形式としてキーワード
に関するHTML形式を識別する。次に、タイトルおよ
びキーワードに関する公認の形式に関するこのような情
報、または、後述のように連続インデックス機構123
に従って処理される他のエレメントが、インデックス構
築機構230のファイル走査機構232に提供される。
【0045】インデックス構築機構230 インデックス構築機構230は、ファイル走査機構23
2、記憶、ポインタおよび検索データ構造235、23
6および237をそれぞれ生成するデータ構造生成機構
234、HTMLインデックス・ファイル239および
HTML検索ファイル231を生成するHTMLインデ
ックス生成機構238を含む。ファイル走査機構232
は、ハイパーテキスト転送プロトコルに従ってローカル
または遠隔のファイル・システムからファイルをアドレ
スして取り出す既知の方法に従って、選択されたファイ
ル・システムにおける各ファイルにアクセスする。それ
によって、ファイル走査機構232は、そのようなファ
イル各々の処理を始動し、ヘッダ情報を各ファイルから
取り出し、そのヘッダ情報を遠隔ファイルからローカル
のファイルへコピーする。本実施形態において、そのよ
うなアクセスは順次に実行されるが必ずしもそうである
必要はなく、また、他のデータ転送プロトコルに適した
他の既知のアクセス方法を他の実施形態において用いる
ことは可能である。典型的には、ファイル・システムの
中の各ファイルにアクセスするために要求される時間が
同一基準で制限されるようにするため制約された情報量
が各ファイルから読まれる。選択されたファイル・シス
テムにおけるすべてのファイルから制約された情報量に
アクセスするこのようなプロセスを以下ファイル・シス
テムの走査と呼ぶ。
【0046】また、ファイル走査機構232は、ユーザ
210によって選択された更新間隔で定期的にファイル
・システムの走査を再始動させることもできる。データ
構造生成機構234は、走査されたファイルの各々につ
いて抽出されたキーワード、タイトルおよび位置エレメ
ントを前記の関連データ構造に書き込む。データ構造生
成機構234は、また、記述エレメントがHTMLイン
デックス・ファイル239においてそれらの共通キーワ
ードの下でグループ化されるようにするため、同じキー
ワードを持つ少なくとも2つの走査ファイルから抽出さ
れたそのような情報の間のリンクを作成する。データ構
造生成機構234は、また、HTMLインデックス生成
機構238がHTMLインデックス・ファイル239を
迅速に構築することを可能にするような形態でそのよう
な情報を配列しリンクする。HTMLインデックス生成
機構238は、HTMLインデックス・ファイル239
を構築して、HTML形式に従ってそのようなファイル
をフォーマットする。
【0047】図3は、ファイル走査機構232の機構の
詳細を示すブロック図である。図3に示されるように、
ファイル走査機構232の走査始動機構310は、始動
または更新間隔選択212を入力するようにユーザ21
0にプロンプトする。そのようなプロンプトを出し応答
を受け取るため種々の既知のグラフィックまたは他のイ
ンタフェースの任意の1つを利用することが可能であ
る。典型的には、ユーザ210は、ファイル・システム
165の現在時走査が始動されるべき時、および、始動
の後後続の走査が実行されるべき時間間隔を標示する数
字を入力または標示する。例えば、ユーザ210は、走
査が即刻または1時間のような指定された任意の間隔の
後に開始されるべきことを標示する。ユーザ210は、
また、現在時走査の後、後続の走査が、24時間ごと、
各週毎、または他の指定するいかなる間隔で、実行され
るべきかを標示する。理解されることであろうが、その
ような時間間隔は、指定されたファイル・システムにお
ける情報が変更されると予想される頻度、最新の情報を
持つ重要性および他の要因に従って変わり得る。加え
て、走査始動機構310は、上述のようなユーザ210
へのプロンプトなしにそれ自身で走査を始動することも
ある。例えば、ユーザ210が新しい走査を始動させず
に現在時インデックスを利用できるようにするため、走
査始動機構310は、オフピークの時間にまたは通常仕
事日に先だって走査を始動することもある。そのような
走査を、ユーザ210によって最も最近選択されたまた
は最も頻繁に使用されたファイル・システムについて実
行することができる。代替的形態として、デフォルト・
ファイル・システムについて、またはその他の要因に従
って選択されるファイル・システムについて走査を行う
こともできる。
【0048】ファイル取り扱い機構320は、走査始動
機構310が走査を開始すると、ファイル・システム1
65中の各ファイルを逐次調べるプロセスを起動する。
ファイル取り扱い機構320は、ファイル・システム定
義機構222に従ってまたハイパーテキスト転送プロト
コルを使用してファイルにアクセスする既知の方法に従
ってファイル・システム165の最初のファイルにアク
セスする。その他の既知のアクセス方法を他の実施形態
において使用することもできる。ファイル・システム1
65がディレクトリおよびサブディレクトリ、フォルダ
およびサブフォルダという階層構造またはその他の階層
構造によって構成されることがある点は当業者に理解さ
れることであろう。何れのケースにおいても、ファイル
取り扱い機構320は、種々の既知の方法のいずれかを
用いて、そのようなディレクトリ、サブディレクトリ等
々の中の各ファイルを調べる。ファイル・システム16
5にファイルがない場合、または、ファイル・システム
165にアクセスすることができない場合、ファイル取
り扱い機構320は、連続インデックス機構123の動
作を停止させる。そのような停止は、動作の途中の終了
を要求するエラー条件または他の異常な条件を取り扱う
種々の既知の方法のいずれかに従って実行される。
【0049】そのような異常な条件が存在しないことお
よびファイル取り扱い機構320が上述のようにファイ
ル・システム165の最初のファイルへのアクセスに成
功したとすれば、そのような最初のファイルは、次に、
ヘッダ解析機構330によって処理される。ファイル取
り扱い機構320は、また、データ構造生成機構234
の動作に関して以下に記述するようにそのような最初の
ファイルの位置をデータ構造生成機構234に与える。
この実施形態に関して記述するこのような情報の伝達
は、種々の既知の技法のいずれかに従って実行される。
例えば、伝達されるべき位置情報は、データ構造生成機
構234がその情報に出会うことを期待するメモリ12
2の一部にファイル取り扱い機構320によって書き込
まれることができる。ファイル・システム165の中の
各ファイルは、すべてのファイルが処理されるまで、上
述の動作に従ってファイル取り扱い機構320によって
ヘッダ解析機構330に渡される。
【0050】ヘッダ解析機構330は、ファイル取り扱
い機構320によってアクセスされた最初のファイルを
開き、それを読み取る。典型的には、ヘッダ解析機構3
30はファイル全体を読み取らない。むしろ、ヘッダ解
析機構330は受け取るファイルの内容を調べてヘッダ
が存在するか否か判断する。ヘッダは、標準的または一
般に認められた形式に構成されるファイルに関する情報
の集合であって、ファイルの先頭付近に位置する。例え
ば、HTML形式では、ヘッダの標準形式は、ファイル
のコンテントを記述するためまたはユーザがファイルを
見つけるのを援助するため、ファイルの作成者の名前、
ファイルのタイトルおよび1つまたは複数のキーワード
を含むことができる。そのような標準の形式の1つで
は、各ヘッダ行は、文字"<!--"で始まり、文字"-->"で
終わる(但し両方の引用符""は含むまれない)。
【0051】以下は、この形式に従った定型的ヘッダの
文字列である(改行文字は示されてなく、最後にピリオ
ドが付加されている)。
【0052】 <!-- Author: author' name--> <!-- Title: title of the document--> <!-- Indexed By: (keyword1@subkeyword1)(keyword2@s
ubkeyword2)(...)-->. 下線を引かれたワードは、この実施形態におけるファイ
ルの作成者によって供給されるもので、コンテントを記
述している。すなわち、"author"(作成者)ヘッダ行に
は、例えば、"John Doe."というauthor' name(ファイル
の作成者)が記入される。"title"(タイトル)ヘッダ行に
は、例えば、"Supply Order Form."(消耗品発注様式)な
どというtitle of the document(ドキュメントのタイト
ル)が記入される。
【0053】"indexed by"ヘッダ行は、インデックス作
成のためのキーワードを指定するもので、典型的には、
符号@の前にkeyword(一次キーワード)、その後にsubkey
word(二次キーワード)が置かれるリストを含む。一次キ
ーワードだけを使用する場合は符号@は使用されない。
次の例は、一次キーワード"Animals"(動物)と一次キー
ワード"Elephant"(象)の両者に関連するファイルを標示
する"indexed by"ヘッダ行である。 <!-- Indexed By: (Animals)(Elephant)-->. 対照的に、以下のヘッダ行は、ファイルが、一次キーワ
ード"Animals"(動物)の下の動物というカテゴリとして
の二次キーワード"Elephant"(象)に関連するものである
ことを標示する。 <!-- Indexed By: (Animals@Elephant)-->. "indexed by"ヘッダ行における省略法によって示される
ように、多数の一次キーワード、または一次と二次のキ
ーワードのペアを含むことが可能である。
【0054】代替的形態として、HTMLファイルに関
して一般に受け入れられている別の1つの既知の形式
は、以下に示すような、"<"および">"という符号によっ
て囲われる行のヘッダ情報である。 <META NAME="Author" CONTENT="author's name"> <META NAME="Description" CONTENT="title of docume
nt") <META NAME="Keywords" CONTENT="(keywords1@subk
eyword1)(...). この場合も省略法は、多数の一次キーワード、または一
次と二次のキーワードのペアの可能性を示す。
【0055】これらの形式のどれが使用されるかまたは
別の形式が使用されるかは問題でないことは当業者によ
って理解されることであろう。上例において必要な点
は、ヘッダ解析機構330が検証するファイルのキーワ
ードおよびタイトルを識別することができるようにする
ため、キーワードおよびタイトル形式識別機構224が
形式を識別することができなければならないことだけで
ある。更にまた理解されるように、別の1つの実施形態
においては、検証されるべきファイルは、ヘッダを含ま
ないことも、あるいは、キーワードおよびタイトルをヘ
ッダ以外の部分に位置させる場合もあり得る。典型的に
ヘッダに含まれるような情報をファイルの先頭付近に集
めれば、そのような情報を見つけるためファイル全体を
完全に読み取る必要がないという利点がある。しかしな
がら、情報のそのような事前構成が典型的ではないアプ
リケーションにおいても本発明を使用することができる
という点は理解されることであろう。従って、本発明の
その他の実施形態が、そのような情報がより一般的なテ
キスト形式にフォーマットされている形態またはその他
の識別子からキーワードおよびタイトルを演繹する他の
方法を使用することもできる。
【0056】ヘッダ情報がその期待された位置で検出さ
れない場合、ヘッダ解析機構330はそのような最初の
ファイルの読み取りを中止する。具体的に述べれば、1
つの標準HTML形式に従って、ヘッダ情報が、ファイ
ルの先頭近辺で、<HTML>および<HEAD>のような一定のタ
グの後および<BODY>または<IMG>のような別のタグの前
に置かれるのが典型的である。そのような構文規則は、
照合テーブルのような既知の手段を使用して、検証下の
ファイルにおいて使用される形式タイプと関連づけるこ
とができる。本実施形態において、キーワードおよびタ
イトル形式識別機構224が、ファイル・システム16
5において使用されているHTML形式に適した形式情
報をヘッダ解析機構330に提供しているので、HTM
L形式ファイルにおけるヘッダ情報の位置に関する対応
する構文情報をヘッダ解析機構330に提供することも
可能である。従って、ヘッダ解析機構330がヘッダを
識別する前に<BODY>のようなヘッダの後に来るタグに出
会うならば、そのような条件は読み取られているファイ
ルにヘッダが欠けていることを標示する。そのような場
合、ヘッダ解析機構330は、最初のファイルの読み取
りを中止する。同様に、上述のように形式によって識別
できるタイトルおよびキーワードに出会う前に例えば1
万バイトのようなあらかじめ決められた数より多いバイ
トを読み取った場合、ヘッダ解析機構330は最初のフ
ァイルの読み取りを停止する。
【0057】いずれのケースでも、次のファイルが上述
のようにアクセスされ処理されるように、ヘッダ解析機
構330はファイル取り扱い機構320に制御を返す。
ヘッダ情報を解析するためまたはヘッダが存在すること
を判断するために必要なファイル部分のみが読み取られ
るので、典型的にはファイル全体が読み取られることは
ない。このように、所与の時間内に、ファイル全体が読
み取られる場合に比較して、一層多数のファイルが読み
取られ一層多量のヘッダ情報がそこから抽出される。他
の実施形態においてはヘッダ情報が明きらかに存在しな
いので他の基準を使用してファイルの読み取りが中止さ
れることは理解されるであろう。例えば、ヘッダ解析機
構330は、ファイルの形式またはコンテントがテキス
ト・ファイルではなく実行可能ファイルのものと整合し
ていると判断するか、さもなければ、照合テーブルまた
はその他の技法による処理のためヘッダ解析機構330
にとって既知の形式ではないと判断するかもしれない。
更に理解されることであろうが、別の実施形態における
ヘッダ解析機構330は、タイトルおよびキーワード情
報の抽出を求めるというよりはむしろ、ヘッダにあろう
がなかろうが、ファイル名、ファイル作成者の名前また
はその他の情報の抽出を求めるようにすることもでき
る。代替的形態において、ファイル全体を読み取ること
もできる。
【0058】本実施形態において、オプションとして、
HTMLインデックス・ファイル239の更新を更新加
速機構340によって加速させることができる。ユーザ
210は、既知の方法でファイル・システム定義機構2
22による1つまたは別のオプションを選択することを
求めるプロンプトによって更新加速機構340を利用す
るか否か指示することができる。たとえファイルのヘッ
ダだけが読み取られるとしても、遠隔ファイルがアクセ
スおよび読み取りのため大きな時間を必要とする場合が
あるので、ユーザ210は更新加速機構340を利用す
ることがある。更に、ホスト・サーバ100をファイル
・システム165に接続するインターネットまたは他の
ネットワーク上のサービスの中断が、本発明に従うHT
MLインデックス・ファイル239の更新を遅延または
妨げる可能性がある。アクセスおよび読み取り時間を最
小にするため、またはそのような遅延または障害を防ぐ
ため、更新加速機構340は、イントラネットまたはロ
ーカル・エリア・ネットワークによってホスト・サーバ
100に接続されるローカルのファイル・システムへ遠
隔ファイルのヘッダをコピーする。代替的には、ローカ
ルのファイル・システムがメモリ122に置かれる。他
の実施形態においては、ファイル全体が上述のようにコ
ピーされるか、あるいは、更新加速機構340は除去さ
れる。
【0059】更新加速機構340の起動の利点は、選択
されたファイル・システムにおけるすべてのファイルが
元々ローカル・ファイルであるかそれらのヘッダがロー
カル・ファイルにコピーされているので、HTMLイン
デックス・ファイル239が通常は遅延あるいは妨害さ
れないことである。しかしながら、コピーされたローカ
ル・ファイルによって表される遠隔ファイルが存在し続
けるかあるいは同じヘッダ情報を持って存在することの
保証がないので、ユーザ210は更新加速機構340を
利用することを望まないことがある。従って、図3の線
332は、ヘッダ解析機構330から更新加速機構34
0への制御の条件つき経路を表し、そこに標示されるフ
ラグは、ユーザ210によるオプションの選択に従って
またフラグを設定し応答する既知の既知の方法に従って
設定される。更新加速機構が、起動され、遠隔ファイル
の最初のファイルのヘッダ情報をローカル・コピー・フ
ァイルへコピーすると、そのようなローカル・ファイル
のアドレスもまた既知の技術に従って更新加速機構34
0からデータ構造生成機構234に渡される。
【0060】更新加速機構340が起動されているかい
ないかに関係なく、ヘッダ解析機構330が最初のファ
イルにおけるヘッダ検出に成功しそのようなファイルの
タイトルおよび1次および2次キーワードを識別したと
仮定して、制御はデータ構造生成機構234に移る。上
述のように、そのようなヘッダ情報が最初のファイルに
見つけられない場合、ファイル・システム165の中の
次のファイルの処理のため、制御はファイル取り扱い機
構320に戻る。生成機構234によって制御される記
憶、ポインタおよび検索データの構造に関するデータ構
造235、236および237が図4の(A)、(B)およ
び(C)に示されている。典型的には、これらデータ構造
はホスト・サーバ100のメモリ122に配置される。
データ構造235のレコード1、2および3は235−
1、235−2および235−3という符号をふられ、
他のデータ構造についても同様の符号がふられている。
レコード235−1の範囲内のフィールドは、410−
1、411−1等々のように符号をふられ、その他のデ
ータ構造の最初のレコードについても同じように符号が
付けられている。データ構造の第2および第3のレコー
ドのフィールドも存在すると想定されるが、図示されて
ない。更に、理解されるように、3つのレコードの例は
典型的なものにすぎず、レコードの数は一般にファイル
・システム165の中のファイルの数およびそのような
ファイルの各々に含まれる1次キーワードの数に関連す
るものである。
【0061】以下の表1、表2および表3は、記憶デー
タ構造235、ポインタ・データ構造236および検索
データ構造237のコンテントを要約している。表1、
表2および表3は、特に、ファイル・システム165の
最初のファイルに関する情報に対応している3つの標示
されたデータ構造の最初のレコードに生成機構234に
よって書き込まれる情報を要約している。そのような情
報をデータ構造に挿入するため生成機構234によって
実行される特定の動作は、表の後に記述される。
【0062】
【表1】 記憶データ構造235 図4(A)の符号 フィールド名 説 明 410-1 タイトル このフィールドは、ヘッダ解析機構330 によって最初のファイルのヘッダから 抽出されたファイルのタイトルを含む。 411-1 ローカル・ファイル位置 最初のファイルがローカル・ファイルで あれば、このフィールドは、そのような ファイルの位置、典型的にはその ファイル・システムのパスを含む。その ような位置はファイル取扱機構320に よって提供される。最初のファイルが 遠隔ファイルであれば、このフィールド は、遠隔ファイルのヘッダが更新加速 機構340によってコピーされた宛先の ローカル・ファイルの位置、典型的には そのファイル・システムのパスを含む。 そのような位置は更新加速機構340 によって提供される。 412-1 一次キーワード このフィールドは、ヘッダ解析機構330 によってファイルのヘッダから抽出される 最初のファイルの1次キーワードを含む。 413-1 二次キーワード このフィールドは、フィールド412-1に 記憶される1次キーワードに関連する 2次キーワードを(それが存在すれば)含む。 2次キーワードはヘッダ解析機構330 によって最初のファイルのヘッダから 抽出される。 414-1 次レコード このフィールドは、フィールド412-1に 含まれるものと同じ1次キーワードを持つ 記憶データ構造235における次の レコードへのポインタを (それが存在すれば)含む。 415-1 ローカル/遠隔識別 このフィールドは、最初のファイルが ローカル・ファイルか遠隔ファイルである か標示する2進インジケータを含む。 416-1 遠隔位置 このフィールドは、最初のファイルが遠隔 ファイルであれば最初のファイルのオリジ ナルの位置、典型的にはそのファイルの URLを含む。この位置はファイル取扱 機構320によって提供される。 上述のように、そのような遠隔ファイルが 更新加速機構340によってローカル・ ファイルにコピーされたならば、その ようなコピーされたローカル・ファイル の位置がフィールド411-1に書き込まれる。
【0063】
【表2】 ポインタ・データ構造236 図4(B)の符号 フィールド名 説 明 420-1 ノード名 このフィールドは一次キーワードを含む。 422-1 記憶データ構造への このフィールドは、フィールド420-1に リンク 入力される一次キーワードを含む記憶 データ構造235において最も最近処理 されたレコードへのポインターを含む。 424-1 記憶データ構造の このフィールドは、フィールド420-1に入力 レコードの数 される一次キーワードを含む記憶データ 構造235におけるレコードの数を記録 するカウンタを含む。 426-1 次ノード このフィールドは、ポインタ・データ 構造236における別のレコードへの ポインタ、典型的には、ノード名420 フィールドにおける一次キーワードの アルファベット順での次のレコードへの ポインタを含む。
【0064】
【表3】 検索データ構造237 図4(C)の符号 フィールド名 説 明 440-1 位置 このフィールドは、オリジナルの位置、 典型的には最初のファイルのURLを 含む。これは、最初のファイルが ローカル・ファイルであればローカル・ ファイル位置であり、最初のファイルが 遠隔ファイルであれば遠隔ファイル位置 である。 442-1 タイトル このフィールドは最初のファイルの タイトルを含む。 444-1 一次キーワード このフィールドは最初のファイルの ヘッダにおける一次キーワードを含む。 446-1 二次キーワード このフィールドは、存在する場合、 最初のファイルのヘッダにおける 二次キーワードを含む。
【0065】表1に示されるように、生成機構234
は、最初のファイルからヘッダ解析機構330によって
抽出されたタイトル、一次キーワードおよび(存在すれ
ば)二次キーワードをそれぞれフィールド410−1、
412−1および413−1に書き込む。最初のファイ
ルのヘッダが関連二次キーワードを持つかもしれない少
なくとも2つの一次キーワードを含むとすれば、そのよ
うな一次キーワードまたは一次と二次のキーワードのペ
アの各々に対応するため、記憶データ構造235の中に
別々のレコードが生成機構234によって作成される。
すなわち、複数の一次キーワードをもつ1つのファイル
はあたかも複数のファイルであるかのように扱われる。
【0066】図5は、複数の一次および二次キーワード
のそのような状況を示す。ブロック510は、ヘッダ解
析機構330によってファイル・システム165の最初
のファイルから取り出されたヘッダ情報の例を表す。最
初のファイルのタイトルは、"Large Animals of the Wo
rld(世界の大型動物)"であり、一次キーワード"Animals
(動物)"および"Elephants(象)"である。また、一次キー
ワード"Animals"は、二次キーワード"Elephants"およ
び"Giraffes(キリン)"と関連づけられている。典型的に
はヘッダ解析機構330によって取り除かれるものでは
あるが、例示の目的から、HTML形式文字はブロック
510に残されている。
【0067】最初のファイルからのヘッダ情報に基づい
て、生成機構234は次のような3つのレコードを記憶
データ構造235の中に作成する。すなわち、一次二次
キーワードのペア"Animals-Elephants"に関するレコー
ド235−1、一次二次キーワードのペア"Animals-Gir
affes"に関するレコード235−2、および、一次キー
ワード"Elephants"に関するレコード235−3であ
る。ブロック520は、同じプロセスが後続ファイルに
も適用される例として、ファイル・システム165の中
の8番目のファイルを恣意的に取り上げて示している。
このファイルのタイトルは、"Dangerous Animals(危険
な動物)"である。生成機構234は、そのような8番目
のファイルからのヘッダ情報を記憶するため、レコード
235−22を作成する(この間は、ファイル・システ
ム165の中の2番目から7番目までに関連する情報に
よってレコードが埋められていると恣意的に仮定す
る)。ブロック520に示されるように、そのようなヘ
ッダ情報は、二次キーワード"Dangerous"とペアにされ
た一次キーワード"Animals"を含む。
【0068】生成機構234は、また、記憶データ構造
235に位置情報を挿入する。ファイル・システム16
5の最初のファイルの処理に関して、そのようなファイ
ルがローカル・ファイル・システムに存在するとここで
仮定する。そのようなケースでは、フィールド415−
1、415−2および415−3の2進インジケータ
が、「遠隔」ではなく「ローカル」条件を標示するよう
に設定される。生成機構234は、ローカル・ファイル
位置フィールド411−1、411−2および411−
3に、図5に"LOC-1"という記号で表されているような
最初のファイルのファイル・システム位置を挿入する。
遠隔ファイル位置フィールド416−1、416−2お
よび416−3は、最初のファイルが遠隔ではなくロー
カルと仮定されたので、空のままである。8番目のファ
イルが遠隔ファイル・システムに位置し、そのような遠
隔ファイルのヘッダ情報を上述のようにローカル・ファ
イルにコピーするため更新加速機構340を起動するこ
とをユーザ210が選択したと仮定する。従って、生成
機構234は「遠隔」条件を示すようにフィールド41
5−22の2進インジケータを設定し、オリジナルの遠
隔ファイルの位置がフィールド416−22に書き込ま
れ、コピーされたローカル・ファイルの位置がフィール
ド411−22に書き込まれる。
【0069】記憶データ構造235におけるレコードが
それらの一次キーワードによって相互に関連し、1つの
一次キーワードと次のキーワードとの間のリンクが作成
されるようにするため、生成機構234は記憶データ構
造235およびポインタ・データ構造236の中にポイ
ンタを挿入する。この目的のために使用される技法が、
ファイル・システム165の最初のファイルの処理に関
連して図5に示されている。上述のように、生成機構2
34は、記憶データ構造に最初のレコード235−1を
作成して、タイトルおよび最初の一次二次キーワード・
ペア"Animals-Elephants"を記憶する。生成機構234
は、種々の既知の検索比較技術を使用して、ポインタ・
データ構造236のレコードのノード名フィールド42
0を調べて同じ一次キーワード"Animals"を持つレコー
ドが存在するか否か判断する。これが調べられる最初の
ファイルで最初の一次キーワードであると例示の目的か
ら仮定されているので、既存のノード名との一致は存在
しない。別の実施形態において「一致」の意味が厳格な
同一性に限られないこともあることは理解されることで
あろう。例えば、2つキーワード"Animal"および"Anima
ls"は等しいものととみなされ、2つの形式は既知の技
術を使用して共通の形式に正規化されることもできる。
【0070】本例のレコード236−1においては、生
成機構234は新しいレコードを作成して、ノード名フ
ィールド420−1に一次キーワード"Animals"を書き
込む。生成機構234は、また、フィールド424−1
のカウンタを増分して、フィールド420−1に入力さ
れた一次キーワードを持つ記憶データ構造235の中の
エントリの数が1つ増分されたことを標示する。生成機
構234は、処理されている記憶データ構造235にお
けるレコードへのポインタをフィールド422−1に書
き込む。この例では、それは、レコード235−1であ
るが、このフィールドの値は以下に記述されるように逐
次変更されるので、図5には示されていない。生成機構
234は、記憶データ構造235のレコード235−2
に関して同じ動作に着手する時、一次キーワード"Anima
ls"に出会う。生成機構234がレコード235−1の
処理を下記のように完了する前または完了した後にその
ような後続の処理が発生するか否かは重要でない点は理
解されることであろうが、明確にするためそのような後
続の処理を以下に記述する。
【0071】一次キーワード"Animals"が、ポインタ・
データ構造の1つのノード名前フィールド、具体的には
フィールド420−1に既に存在することを検出する
と、生成機構234はそのようなデータ構造に新しいレ
コードを作成しない。むしろフィールド424−1のカ
ウンタが増分される。レコード235−1へのポインタ
を含むフィールド422−1のポインタは、処理されつ
つある記憶データ構造235のレコードのフィールド4
14すなわちフィールド414−1へ動かされる。生成
機構234は、ポインタ・データ構造のフィールド42
2−1に、処理されつつある記憶データ構造のレコード
へのポインタすなわちレコード235−2を挿入する。
記憶データ構造235のレコード235−22に関して
同じ動作に着手する時、生成機構234はまた一次キー
ワード"Animals"に出会う。同じように、生成機構23
4は、レコード235−22の中の一次キーワードがポ
インタ・データ構造236に既に記録されていることを
認める。従って、生成機構234は、図5に示されてい
るように、カウンタを更新し、フィールド422−1の
ポインタをレコード235−22の中の「次」フィール
ドへ動かし、フィールド422−1にレコード235−
22へのポインタを書き込む。
【0072】生成機構234は、記憶データ構造のレコ
ード235−3を処理する時、そのようなレコードの一
次キーワード"Elephants"が、ポインタ・データ構造の
すべてのレコードのフィールド420に存在しないこと
に気付く。従って、生成機構234は、ポインタ・デー
タ構造に新しいレコード236−2を作成して、フィー
ルド420−2に一次キーワード"Elephants"を書き込
む。カウンタおよびポインタ・フィールドが上述のよう
に更新される。生成機構234は、このようにして、フ
ァイル・システム165における最初および後続のファ
イルの処理の結果として作成された記憶データ構造23
5の各レコードを処理する。当業者に明らかなように、
そのような処理の結果は、記憶データ構造235におけ
る一次キーワードの存在のすべてが、フィールド420
におけるそのようなキーワードを含むポインタ・データ
構造236のレコードのフィールド422を先ず調べ、
次にそのようなフィールド422にリンクされたポイン
タを辿って、記憶データ構造235におけるレコードの
「次」フィールド414に達することによって検出され
ることである。
【0073】データ・レコードをソートする種々の既知
の技術のいずれかを使用して、生成機構234は一次キ
ーワードのそのようなリンクされたリストをアルファベ
ット順に並べる。このソートは、典型的には、一次キー
ワードに従ってポインタ・データ構造236のレコード
のフィールド426におけるポインタをアルファベット
順に並べかえ、共通の一次キーワードと共にグループ化
されている二次キーワードに従ってポインタ・データ構
造235のレコードのフィールド414におけるポイン
タをアルファベット順に並べかえることによって実行さ
れる。これは「挿入ソート」と呼ばれる。当業者にとっ
て明白であるように、いかなるソート・アルゴリズムを
も使用することができる。アルファベット順の配列はフ
ァイルの処理の後に行うことも可能ではあるが、ソート
は、典型的には、ファイル・システム165のファイル
がデータ生成機構234によって上述のように処理され
ている間に行われる。本実施形態において、ファイル取
り扱い機構320が、遠隔またはローカル・ファイルへ
のアクセスおよび読み取りを行う既知の手段に従って、
ファイル・システム165の中のすべてのファイルが処
理されたことを判断し、そのようなアルファベット順配
列の目的のためデータ構造生成機構234へ制御を渡
す。リンクされたエントリの数を効率的に決定するた
め、記憶データ構造リンク・エントリ数424が使用さ
れる。
【0074】生成機構234は、また、検索データ構造
237にエントリを作成する。検索データ構造237
は、ユーザ210によって選択された文字列と一致する
ファイル・システム165のファイルからのヘッダ情報
をHTMLインデックス・ファイル239が含むか否か
をユーザ210が迅速に判断することを可能にする。例
えば、ユーザ210は、ワード"Elephants"がそのよう
なファイルのいずれかのタイトル、一次キーワードまた
は二次キーワードに含まれているか知りたい場合があ
る。この目的のため、生成機構234は、ファイル・シ
ステム165の中の最初のファイルに関して検索データ
構造237のレコード237−1を作成する。最初のフ
ァイルの位置はフィールド440−1に記憶され、タイ
トルはフィールド442−1に記憶され、一次キーワー
ドフィールド444−1に記憶され、二次キーワードは
存在する場合446−1に記憶される。
【0075】生成機構234による処理が進むにつれ、
ファイル・システム165におけるその他のすべてのフ
ァイルに関して同様のレコードが作成される。このプロ
セスは、図5において記述したものと同じ最初のファイ
ルと8番目のファイルの処理を例として図6に示されて
いる。すなわち、図6において、生成機構234は、上
述のプロセスに従って、レコード235−1、235−
2、235−3および235−22を既に作成してい
る。従って、図6は、最初のファイルの処理に伴って生
成機構234によって作成されるレコード237−1、
および8番目のファイルに処理に伴って作成されるレコ
ード237−8を示す。生成機構234によって処理さ
れる2番目から7番目のファイルに対応して、その他の
レコードが検索データ構造237に存在する点は理解さ
れることであろうが、図6にはそれらは示されていな
い。
【0076】同様に理解されることであろうが、他の実
施形態においては、フィールド444−1のワード"ani
mals"のような重複エントリは1つの発生に減じられる
こともできる。しかしながら、重複エントリは、そのよ
うな結果を加重するため残しておくこともある。すなわ
ち、ワード"animals"の検索は、そのワードが2回検出
されるレコード237−8に比較して、そのワードが3
回検出されるレコード237−1に一層強力に関連づけ
させることもできる。加重検索結果は、種々の既知の表
示形式または技法のいずれかの使用によってユーザ21
0へ提供されることができる。更に理解されることであ
ろうが、多くの既知の方法を使用して、"the"または"o
f"のような共通のワードが検索データ構造237のレコ
ードへ442−1へ入力されるのを生成機構234が防
止することもできる。また、別の1つの実施形態におい
て、種々の既知の検索および比較方法のいずれかを使用
して、相互に類似してはいるが同じものではない文字列
を一致とみなすようにすることもできる。
【0077】ファイル・システム165のファイルから
のヘッダ情報を処理することに加えて、生成機構234
は、ユーザ210によって直接提供される相応の情報を
処理することもできる。図12に関連して詳細が後述さ
れるように、ユーザ210は、ファイル・システム16
5に含められているか否か関心を持つファイルに関する
タイトル、一次または二次キーワードおよび位置を供給
することができる。そのような動作は、図2の手操作イ
ンデックス・エントリ213によって機構的に表現され
ている。連続インデックス機構123の後続の動作に関
して情報を再度入力せずにすむようにそのような手操作
で入力された情報が保存されることを確実にするため、
そのような手操作入力ヘッダ情報は、表示管理機構24
0によって更新加速機構340に送られる。そこで、更
新加速機構340は、遠隔ファイルのヘッダ情報に対し
て更新加速機構340が実行する場合と同様の方法でそ
のような手操作入力ヘッダ情報を処理する。具体的に
は、ファイル・システム165の一部とみなされるロー
カル・ファイルに手操作入力ヘッダ情報がコピーされ
る。次に、生成機構234は、記憶データ構造235、
ポインタ・データ構造236にレコードを作成し、その
ような情報がファイル・システム165のファイルに含
まれている場合と同じ方法でそのような手操作入力ヘッ
ダ情報を求めてデータ構造237を検索する。
【0078】ファイル・システム165におけるすべて
のファイルに関して上述のプロセスを完了した後、デー
タ構造生成機構234からHTMLインデックス生成機
構238へ制御が渡る。HTML形式でファイルを構築
する種々の既知の方法のいずれかで、生成機構238
は、記憶データ構造235およびポインタ・データ構造
236における情報を使用してHTMLインデックス・
ファイル239を作成する。例えば、図5の例を引用す
れば、生成機構238は、典型的には、ポインタ・デー
タ構造236の最初のレコード236−1を参照するこ
とによってファイル239の構築を開始する。
【0079】そのようなレコードのフィールド420−
1に記憶されるような最初の一次キーワードは、一次イ
ンデックス見出しとしてファイル239に入力される。
記憶データ構造235のレコード235−22へのポイ
ンタ422−1に続いて、二次キーワード、ファイル・
システム165のファイルのタイトルおよび位置、レコ
ード235−22に記憶されるヘッダ情報がHTMLイ
ンデックス・ファイル239へ入力される。フィールド
416−22に記憶される位置が遠隔ファイル位置であ
ればそれがHTMLインデックス・ファイル239に入
力されるので、ユーザ210は、図9および図10に関
連して後述するように、オリジナルのファイルにアクセ
スすることができる。レコード235−22が元々ロー
カル・ファイルであったファイルと関連づけられていれ
ば、HTMLインデックス・ファイル239に入れられ
る位置情報は、記憶データ構造235のレコードのフィ
ールド411に記憶されるローカル・ファイル位置であ
る。
【0080】当業者に理解されるように、HTMLイン
デックス・ファイル239は、ポインタ・データ構造2
36のフィールド422、426および記憶データ構造
235のフィールド414におけるポインタをたどるこ
とによって完成される。多くの可能な構成の1つにおい
て、生成機構238は、アルファベット順に配列されて
いる一次キーワードの下に二次キーワードをアルファベ
ット順に分類する。ファイル・システム165のファイ
ルのタイトルは、典型的には、二次キーワードの各々に
対応するように配列されるか、あるいは一次キーワード
が二次キーワードを持たない場合そのような一次キーワ
ードに対応して配列される。図5のHTMLインデック
ス・ファイル239においては、明確に示すため、その
ような構成はHTML形式文字を含まずに示されてい
る。また、HTMLインデックス・ファイル239にお
いて上述のように各タイトルの各発生と関連するファイ
ル位置情報も示されてない。
【0081】表示管理機構240 HTML形式のファイルを表示する既知の技術を使用し
て、表示管理機構240は、ユーザ・コンピュータ17
5のディスプレイ装置上にHTMLインデックス・ファ
イル239(以後単にインデックス239と呼ぶ)の特定
部分を表示する要求をユーザ210が始動することを可
能にする。また、そのような既知の技術を使用して、表
示管理機構240は、インデックス239の中の文字列
の検索を行うようにユーザ210が要求することを可能
にする。そのような要求に応答して、表示管理機構24
0は、インデックス239の要求された部分を表示する
か、あるいは検索レポートを表示する。図7乃至図11
は、表示管理機構240によるそのような動作の結果の
グラフィック表現である。図12は、ユーザ210がイ
ンデックス239にヘッダ情報を手操作で入力すること
を可能にするため表示管理機構240によって表示され
る様式のグラフィック表現である。
【0082】図7乃至図12の表現は、ネットスケープ
・ウェブ・ブラウザを使用してHTML形式ファイルを
表示する既知の方法に従って生成されている。しかしな
がら、そのような表示は、当業者によく知られたその他
の種々の技術によって生成され得ることは理解されるこ
とであろう。更に理解されることであろうが、参照符号
によって識別されてない図7乃至図12のグラフィック
・エレメントは、本発明にとって不可欠のものではな
く、また、グラフィック・エレメントの、タイプフェー
スまたはカラーのような表現スタイルは、以下に特別の
記述がない限り、本発明にとって不可欠のものではな
い。特に、図8および図9に表されているようなインデ
ックス239の部分を表示する形式は、これらの図に示
されている間隔やインデントの形式と種々の形態で異な
る場合があることは理解されるであろう。例えば、ダッ
シュ、番号づけ、カラー化、多様なフォント・スタイル
等々を使用して、関連キーワードに関するタイトルの配
置を強調したり、二次キーワードを一次キーワードと見
分けれるようにしたりすることができる。
【0083】図7は、本実施形態に従う最初の画面表示
である。そのような最初の表示画面は、ホスト・サーバ
100上のインデックス239の位置を表すURLをネ
ットスケープ・ウェブ・ブラウザに入力することによる
既知の方法でユーザ210によってアクセスされる。本
実施形態において、以下「メイン文字バー」と呼ばれる
グラフィック・エレメント700は、27個のサブエレ
メントから成る。サブエレントは、文字"A"に関するサ
ブエレメント700−Aのようなアルファベット26文
字と整数0から9を表すサブエレメント700−Nの2
7個から成る。別の実施形態として、アルファベットは
機械語またはコード含めいかなる言語でも可能であり、
文字または番号の分類または選択のその他多数の方法が
可能であることは理解されるであろう。
【0084】本実施形態において、700−Aのような
26のアルファベットのサブエレメントは、インデック
ス239における一次キーワードの最初の文字を表し、
サブエレメント700−Nは、整数で始まる一次キーワ
ードを表す。マウスのようなカーソル位置指定装置を動
かすかトラック・ボールを操作するような既知の方法
で、ユーザ210は、ユーザ・コンピュータ175のデ
ィスプレイ装置上で、メイン文字バー700のそのよう
な27個のサブエレメントの1つの近くにカーソルを置
く。次に、ユーザ20は、マウスまたはトラックボール
をクリックするような既知の方法によって、関心をもつ
一次キーワードの最初の文字または数字を選択する。例
えば、ユーザ210が、キーワード"Animals"(動物)に
よってインデックス239においてインデックスされる
ファイル・システム165のファイルに興味があるとす
れば、ユーザ210は、グラフィック・エレメント70
0−Aの上またはその近くでクリックすることによって
メイン文字バーから文字"A"を選択する。インデックス
239の一部を選択するためその他の技術を使用するこ
とが可能であることは理解されるであろう。
【0085】メイン文字バー700のサブエレメントの
各々は、インデックス239における特定の位置で識別
される。そのような識別は、表示されるHTMLのグラ
フィック・エレメントを同じまたは他のHTMLファイ
ル内の位置へリンクする既知の方法に従って達成され
る。例えば、サブエレメント700−Aは、文字"A"で
始まるキーワードがHTMLインデックス生成機構23
8によって配置されたインデックス239の範囲内の位
置にリンクされている。このように、ユーザ210が例
えばサブエレメント700−Aを選択するとすれば、イ
ンターネットまたはイントラネット150を経由してユ
ーザ・コンピュータ175からホスト・サーバ100へ
送られ、"A"で始まるキーワードが見つけられる位置の
インデックス239をユーザ210が見ることを望んで
いることを標示する信号が生成される。そのような信号
に応答する既知のプロシージャおよび技法に従って、ホ
スト・サーバ100は、ユーザ・コンピュータ175の
ディスプレイ装置上に表示されるべきインデックス23
9の要求された部分をユーザ・コンピュータ175に送
信する。
【0086】図8は、文字"A"で始まる一次キーワード
が位置するインデックス239の冒頭部分を表す画面表
示である。例えば、グラフィック・エレメント800
は、"Air Travel"(空の旅)を表す。そのようなキーワー
ドをヘッダの中に持つファイル・システム165のファ
イルのタイトルは、そのようなキーワードの下でアルフ
ァベット順に集められる。例えば、グラフィック・エレ
メント802は、一次キーワードとして"Air Travel"を
持つファイルのタイトル"In-Flight Tracking"(現在飛
行中)を表す。二次キーワード"Airlines"(航空会社)
が、一次キーワード"Air Travel"と関連づけられてい
る。本実施形態において、この二次キーワードは、グラ
フィック・エレメント803によって示されるように、
一次キーワードのすぐ下にインデントしてリストされ
る。一次および二次キーワードに関連するタイトルは、
グラフィック・エレメント804によって示されるよう
に、二次キーワードのすぐ下にインデントしてリストさ
れる。このような配置および形式は例示の目的にすぎ
ず、一次キーワードによってまたは二次キーワードによ
って構成されるインデックス239を提示し、関連タイ
トルを表示する他の多くのグラフィック形式が本発明に
従って可能であることは理解されるであろう。
【0087】ユーザ210はインデックス239におけ
る所望の位置を更に指定することができる。以下「二次
文字バー」と呼ばれるグラフィック・エレメント810
は、例えばメイン文字バーのサブエレメント700‐A
および文字ペア"At"812を含む複数文字ペアから成
る。そのような文字ペアは、メイン文字バーから選択さ
れる単一文字、この例では文字"A"と追加のアルファベ
ット1文字で構成される。しかしながら、表示管理機構
240によって、ある文字ペアで開始する少くとも1つ
の一次キーワードがインデックス239の中に存在する
場合だけ、そのような文字ペアは二次文字バーに含まれ
る。例えば、文字ペア"Ai"は、インデックス239が文
字"Ai"で始まる少くとも1つの一次キーワードを含むの
で、二次文字バー810に含められる。反対に、文字"A
j"で始まる一次キーワードはないので、この文字ペアは
含まれない。メイン文字バー700のサブエレメントの
選択に関する上述の方法で、ユーザ210は、文字ペア
812のような二次文字バー810のサブエレメントを
選択することができる。そのような選択は、ユーザ21
0が文字"At"から始まる一次キーワードが位置する位置
でインデックス239にアクセスすことを望むことを標
示する。
【0088】そのような選択およびインデックス239
の選択された部分の表示の結果が図9に示されている。
図9および図8は、インデックスの範囲内の異なる位置
を表していることを除いてインデックス239の等しい
グラフィック表現である。このように、メイン文字バー
700および二次文字バー810を参照する上述のよう
な選択プロセスによって、ユーザ210が簡単にかつ迅
速にインデックス239の異なる部分の表示の間を移動
することが可能とされる。代替的形態として、ユーザ2
10が、既知の方法および技術に従ってインデックス2
39の範囲内で図8または9で表される位置から別の位
置へインデックス239画面を順次移動させることもで
きる点は理解されるであろう。
【0089】ユーザ210がキーワード"ATS"に関連す
るファイル・システム165のファイルにアクセスする
ことに関心を持っていて、ユーザ210は二次文字バー
810から文字ペア"At"を選択すると例示の目的から仮
定する。図9のグラフィック・エレメント900によっ
て示されるように、そのようなキーワードがインデック
ス239に含まれていることが観察される。キーワード
900の下に分類されて示されているように、タイトル
902、904および906によって表されるファイル
・システム165の3つのファイルが一次キーワード"A
TS"を含む。次に、ユーザ210は、そのようなタイト
ルを持つファイルをファイル・システム165から取り
出すため上述された方法でそのようなタイトルのうちの
1つを選択することができる。例えば、ユーザ210は
タイトル"ATS Installations"を持つファイルにアクセ
スするためグラフィック・エレメント902を選択する
と、ハイパーリンク転送プロトコルを使用してHTML
形式のファイルにアクセスして表示する既知のプロシー
ジャおよび技法に従ってユーザ・コンピュータ175上
に選択されたファイルが表示される。具体的には、上述
のように、HTMLインデックス生成機構238は、そ
のようなタイトルを持つファイル・システム165のフ
ァイルのURLまたは位置を、各タイトルと共に、イン
デックス239の中に含める。
【0090】既知のプロセスおよび技法に従って、グラ
フィック・エレメント902によって表されるようなタ
イトルのユーザ21Oによる選択によって、インデック
ス239において選択されたタイトルに関連するURL
に位置するファイルにアクセスするための信号が、ユー
ザ・コンピュータ175によってインターネットまたは
イントラネット150上に送信される。このように、タ
イトル"ATS Installations"を持つファイルへのユーザ
210によるアクセスは、ファイル・システム165が
ホスト・サーバ100のメモリ122に位置しない限り
ホスト・サーバ100の関与なしに、実行される。上述
された例とは逆に、キーワード"ATS"が文字ペア"At"で
始まるキーワードの中のその該当するアルファベット順
の位置に表示されなかったとすれば、ユーザ210は、
ファイル・システム165にこのキーワードを含むファ
イルが存在しないことを直ちに認識するであろう。
【0091】図10は、ユーザ210による検索指定2
14に応答して表示管理機構240によって作成される
検索要求様式のグラフィック表現である。グラフィック
・エレメント1010は、ユーザ210がインデックス
239に関して検索することを望む文字列1012をユ
ーザ210が入力するテキスト入力バーである。図10
の例では、そのような検索要求文字列は、"Test Infras
tructure"である。表示管理機構は、既知の方法でこの
要求を受け取り、当面の検索に関するHTML検索ファ
イル231を生成するためHTMLインデックス生成機
構238に制御を渡す。生成機構238は、種々の既知
の検索および比較技術のいずれかを使用して、検索デー
タ構造237の各レコードを検索して、検索語の"test"
および"infrastructure"の両方を含むレコードを検出す
る。そのような一致が検出されるレコードの各々毎に、
生成機構238は、図11に表されている検索レポート
画面のグラフィック・エレメント1110として示され
ているようなエントリをHTML検索ファイル231の
中に作成する。この実施形態では、エントリは、検索デ
ータ構造237における合致レコードに対応するファイ
ルのタイトルおよび一次キーワードから成る。そのよう
なファイルが1つ以上の一次キーワードを含むならば、
そのような一次キーワードの各々に対してグラフィック
・エレメント1112によって示されるような追加エン
トリがHTML検索ファイル231の中に作成される。
当業者に明らかなように、別の実施形態において、合致
が存在するか否かを判定するその他多くの方法を使用す
ることができる。例えば、ユーザ210によって1つ以
上のワードが検索文字列に入力される場合、そのような
ワードのいずれかと合致すれば、HTML検索ファイル
231にエントリを作成する目的のための合致とみなす
こともできる。
【0092】検索データ構造237に関する検索を完了
すると、生成機構238はHTML検索ファイル231
の中のすべてのエントリをアルファベット順に配列す
る。生成機構238は、ユーザ210に対する表示のた
め表示管理機構240にHTML検索ファイル231を
提供する。その結果、図11のグラフィック・エレメン
ト1114で表される検索レポートが表示される。理解
されることであろうが、位置情報は、図に示されていな
いが、検索レポート1114における各エントリに対応
する各ファイル毎にHTML検索ファイル231に含め
られる、そこで、ユーザは、例えばグラフィック・エレ
メント1110を選択することによってエントリを選択
することができる。それに応じて、既知の方法で、その
ようなエントリに対応するファイル・システム165の
ファイルがユーザ・コンピュータ175上に表示され
る。
【0093】図12は、ユーザ210による手操作イン
デックス・エントリ213に応答して表示管理機構24
0によって作成されるエントリ追加様式のグラフィック
表現である。上述のように、そのようなエントリは、フ
ァイル・システム165のファイルが処理される場合と
同じ方法でデータ構造生成機構234によって処理され
るファイルを作成するため、更新加速機構340によっ
て処理される。グラフィック・エレメント1210、1
220、1230および1240は、ユーザの名前、ユ
ーザ210がインデックス239に含めることを望むフ
ァイルのURL、ユーザ210がそのようなファイルに
関連させることを望むタイトル、および、ユーザ210
がそのようなファイルに関連させることを望む一次ある
いは二次キーワードをユーザ210が入力するためのテ
キスト入力ボックスである。ユーザの名前はこの実施形
態では使用されていないが、他の実施形態において使用
される場合もある。例えば、ユーザの名前およびファイ
ル・システム165のファイルの作成者の名前を、その
ようなファイルの一次および二次キーワードの代わり
に、あるいは、それらに追加して、インデックス構成エ
レメントとして使用することも可能である。
【0094】以上本発明の実施形態を記述したが、上記
は例示の目的にすぎず、単に例を引用して表現されたも
のであることは当業者にとって明白であろう。上述され
たシステムおよび方法は、インターネットまたはイント
ラネット上の関心のあるHTML形式ファイルを識別、
構成およびアクセスするため使用することができるよう
な商用システムに適用できるように意図されている。本
発明は、また、インターネット上でまたはその他の分散
あるいは非分散データベースに見られる非HTML形式
の情報を識別、構成およびアクセスすることにも適用で
きる。例えば、本発明は、「ファイル転送プロトコル
(FTP)または「ゴーファ(Gopher)」プロトコルに従っ
て取り出されるドキュメントにインデックスを付けるこ
とにも適している。これらのプロトコルに従って取り出
されるドキュメントはそれらのURLによってユニーク
に識別されるが、ドキュメントの位置を識別する別の手
段を使用することは可能である。
【0095】更に、任意のデータベースのドキュメント
または他の情報単位を構成または取り出す場合、そのよ
うな情報単位の各々に関するデータベースの中の位置、
タイトルまたは他の記述を問わずユーザ210が情報単
位の範囲およびコンテントを識別できるような記述エレ
メント、および、必ずしもキーワードである必要はない
が情報単位の作成者名、作成日付またはその他の構成特
性であるかもしれないインデックス構成エレメントを識
別するため、本発明を使用することができる。そのよう
な情報は、HTML形式であろうが別の形式であろう
が、非分散データベースに含まれているかもしれない。
この場合、データは、通信回線またはネットワークを経
由してまたは直接本発明のデータ処理システムまたは方
法にとってアクセス可能な比較的少数のメモリ装置に保
持されている。このように、「ファイル」という用語が
インターネットおよびイントラネット上のHTML形式
ドキュメントの構成および検索のため本発明の実施形態
に関連して使用されたけれども、本発明はそのように限
定されないことは理解されることであろう。本発明の理
念を逸脱することなく上記実施形態の種々の修正および
多数のその他の実施形態が可能である。
【0096】本発明には、例として次のような実施様態
が含まれる。 (1)少くとも1つのファイル・システム内に含まれる
情報の連続的に更新されるインデックスをユーザに提供
するため上記少くとも1つのファイル・システム内の1
つまたは複数のファイルを1つまたは複数の間隔で検索
するように構成される連続インデックス機構であって、
上記情報の主題を特徴づける複数のインデックス構成エ
レメントと、対応する上記インデックス構成エレメント
によって特徴づけられる上記主題を上記1つまたは複数
のファイルの中のどのファイルが含むかを各々が識別す
る複数の対応する位置エレメントと、を備える連続イン
デックス機構。 (2)各々が上記インデックス構成エレメントの1つお
よびそれに対応する位置エレメントに対応し、上記対応
するインデックス構成エレメントによって特徴づけられ
る上記情報の上記主題を記述する複数の記述エレメント
を更に備える、上記(1)に記載の連続インデックス機
構。 (3)各々が上記インデックス構成エレメントの1つに
対応し、上記対応するインデックス構成エレメントによ
って特徴づけられるよりも一層詳細に上記情報を特徴づ
ける1つまたは複数の2次インデックス構成エレメント
を更に備える、上記(1)に記載の連続インデックス機
構。 (4)上記1つまたは複数のファイルのあらかじめ決め
られた部分を検索する、上記(1)に記載の連続インデ
ックス機構。
【0097】(5)上記1つまたは複数のファイルの少
なくとも1つのファイルがヘッダおよびテキストを含
み、該ヘッダが上記複数のインデックス構成エレメント
の1つを含み、該インデックス構成エレメントが1つの
キーワードを含む、上記(1)に記載の連続インデック
ス機構。 (6)上記1つまたは複数のファイルの少なくとも1つ
のファイルから上記インデックス構成エレメントおよび
上記記述エレメントを抽出し、それらのエレメントおよ
び位置エレメントをあらかじめ定められた形式で構成す
るインデックス構築機構を更に備える、上記(2)に記
載の連続インデックス機構。 (7)上記あらかじめ定められた形式がアルファベット
順である、上記(6)に記載の連続インデックス機構。 (8)上記インデックス構築機構が、上記1つまたは複
数のファイルの上記少なくとも1つのファイルにアクセ
スするファイル走査機構、少くとも1つのデータ構造を
生成しそのような少なくとも1つのデータ構造に上記イ
ンデックス構成エレメント、上記記述エレメントおよび
上記位置エレメントを記憶するデータ構造生成機構と、
上記記憶された諸エレメントから上記インデックスを生
成するインデックス生成機構を含む、上記(6)に記載
の連続インデックス機構。
【0098】(9)各々が1つの頭文字および最初の2
つの頭文字セットを有する複数のインデックス構成エレ
メントおよび対応する複数の位置エレメントを含むイン
デックスの一部分をグラフィカル・ユーザ・インタフェ
ース上に表示する方法であって、複数のそのような頭文
字からなる文字バーを表示するステップ(a)と、グラフ
ィカル・ユーザ・インタフェース上のカーソルを所望の
頭文字に近い位置へ移動させるステップ(b)と、上記所
望の頭文字を選択するステップ(c)と、上記頭文字が上
記インデックス構成エレメントに含まれている上記イン
デックス部分を表示するステップ(d)と、を含むインデ
ックス表示方法。 (10)各々が上記選択された所望の頭文字を有する複
数の上記最初の2つの頭文字の上記セットを含む文字バ
ーを表示するステップ(e)と、グラフィカル・ユーザ・
インタフェース上のカーソルを所望のそのような最初の
2つの頭文字セットに近い位置へ移動させるステップ
(f)と、所望のそのような最初の2つの頭文字セットを
選択するステップ(g)と、上記所望の最初の2つの頭文
字セットが上記インデックス構成エレメントに含まれて
いる上記インデックス部分を表示するステップ(h)と、
を更に含む、上記(9)に記載のインデックス表示方
法。
【0099】
【発明の効果】ユーザによって選択された情報源のあら
かじめ定められたヘッダ部分をあらかじめ定められた間
隔で検索して、選択された情報源に含まれる主題の連続
的に更新されるインデックスをユーザに提供することに
よって、ユーザが所望の情報を含んでいる可能性がある
ものとして指定した情報源だけを検索することが可能と
なり、そのため、無関係な情報源を検索する無駄が除去
される。このような機能は、また、情報源における変更
が検索結果に含まれていることを確実にするために必要
な検索をユーザが周期的に反復すること不要とする。更
に、選択された情報源すべての検索を介して、指定され
た情報源内のすべての情報の主題の包括的インデックス
がユーザに提供されるため、すべての関連した情報が取
り出されたか否かを判断るため付加的検索をユーザが始
動する必要性が除去される。
【図面の簡単な説明】
【図1】本発明の実施に適切なネットワーク環境を示す
ブロック図である。
【図2】本発明の1つの実施形態であるファイル・シス
テム識別機構、インデックス構築機構、および表示管理
機構を示すブロック図である。
【図3】図2の実施形態のインデックス構築機構のファ
イル取り扱い機構のブロック図である。
【図4】図2の実施形態のインデックス構築機構のデー
タ構造生成機構によって生成される記憶データ構造、ポ
インタ・データ構造および検索データ構造を示すブロッ
ク図である。
【図5】データ構造生成機構による図4の記憶データ構
造およびポインタ・データ構造へのデータの生成を示す
ブロック図である。
【図6】データ構造生成機構による図4の検索データ構
造へのデータの生成を示すブロック図である。
【図7】図2の実施形態に従ったメイン・ページ画面お
よび一次インデックス・ジャンプ・インタフェースを示
す表示画面図である。
【図8】図2の実施形態に従ったメイン・ページ画面お
よび2次インデックス・ジャンプ・インタフェースを示
す表示画面図である。
【図9】図2の実施形態に従った図8の2次インデック
ス・ジャンプ・インタフェースの使用によって指定され
た位置におけるインデックス表示を示す画面図である。
【図10】図2の実施形態に従った検索要求様式を示す
表示画面図である。
【図11】図2の実施形態に従った検索要求レポート形
式を示す表示画面図である。
【図12】図2の実施形態に従ったエントリ追加様式を
示す表示画面図である。
【符号の説明】
123 連続インデックス機構 165 ファイル・システム 210 ユーザ 410 記述エレメント 411 位置エレメント 412 インデックス構成エレメント

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】少くとも1つのファイル・システム内に含
    まれる情報の連続的に更新されるインデックスをユーザ
    に提供するため上記少くとも1つのファイル・システム
    内の1つまたは複数のファイルを1つまたは複数の間隔
    で検索するように構成される連続インデックス機構であ
    って、 上記情報の主題を特徴づける複数のインデックス構成エ
    レメントと、 対応する上記インデックス構成エレメントによって特徴
    づけられる上記主題を上記1つまたは複数のファイルの
    中のどのファイルが含むかを各々が識別する複数の対応
    する位置エレメントと、 を備える連続インデックス機構。
JP27817498A 1997-10-08 1998-09-30 インデックス表示方法 Expired - Fee Related JP3341988B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US947,005 1997-10-08
US08/947,005 US5848410A (en) 1997-10-08 1997-10-08 System and method for selective and continuous index generation

Publications (2)

Publication Number Publication Date
JPH11161686A true JPH11161686A (ja) 1999-06-18
JP3341988B2 JP3341988B2 (ja) 2002-11-05

Family

ID=25485347

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27817498A Expired - Fee Related JP3341988B2 (ja) 1997-10-08 1998-09-30 インデックス表示方法

Country Status (2)

Country Link
US (1) US5848410A (ja)
JP (1) JP3341988B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19990078876A (ko) * 1999-08-16 1999-11-05 노승환 일괄된 자원 위치기 입력을 통한 정보 검색 방법
JP2002149668A (ja) * 2000-11-10 2002-05-24 Mieko Tsuyusaki インターネット補助ソフトウェア及び該プログラムを記録した記録媒体
WO2009119811A1 (ja) * 2008-03-28 2009-10-01 日本電気株式会社 情報再構成システム、情報再構成方法及び情報再構成用プログラム
JP2014178902A (ja) * 2013-03-14 2014-09-25 Ricoh Co Ltd 検索システム、検索語辞書生成装置、プログラム、記憶媒体及び検索語辞書生成方法
JP2016024566A (ja) * 2014-07-18 2016-02-08 三菱電機株式会社 検索装置及び検索プログラム

Families Citing this family (286)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8352400B2 (en) 1991-12-23 2013-01-08 Hoffberg Steven M Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore
GB2300991B (en) * 1995-05-15 1997-11-05 Andrew Macgregor Ritchie Serving signals to browsing clients
US6088515A (en) 1995-11-13 2000-07-11 Citrix Systems Inc Method and apparatus for making a hypermedium interactive
JPH09269914A (ja) * 1996-03-29 1997-10-14 Fujitsu Ltd クライアント・サーバシステムにおけるローカルファイル転送方法及びシステム
JPH10143403A (ja) * 1996-11-12 1998-05-29 Fujitsu Ltd 情報管理装置および情報管理プログラム記憶媒体
US6678724B2 (en) * 1997-03-12 2004-01-13 Microsoft Corporation Common namespace for internet and local filesystem objects
US6055570A (en) * 1997-04-03 2000-04-25 Sun Microsystems, Inc. Subscribed update monitors
US6434607B1 (en) 1997-06-19 2002-08-13 International Business Machines Corporation Web server providing role-based multi-level security
US6301621B1 (en) * 1997-06-19 2001-10-09 International Business Machines Corporation Web server with direct mail capability
US6701376B1 (en) 1997-06-19 2004-03-02 International Business Machines Corporation Web server enabling browser access to HTML and Non-HTML documents
US6192415B1 (en) * 1997-06-19 2001-02-20 International Business Machines Corporation Web server with ability to process URL requests for non-markup language objects and perform actions on the objects using executable instructions contained in the URL
US6449640B1 (en) 1997-06-19 2002-09-10 International Business Machines Corporation Web server with unique identification of linked objects
US5917491A (en) * 1997-08-29 1999-06-29 Netscape Communications Corporation Page proxy
US6799174B2 (en) 1997-09-08 2004-09-28 Science Applications International Corporation Retrieving, organizing, and utilizing networked data using databases
US6038668A (en) 1997-09-08 2000-03-14 Science Applications International Corporation System, method, and medium for retrieving, organizing, and utilizing networked data
US5848410A (en) * 1997-10-08 1998-12-08 Hewlett Packard Company System and method for selective and continuous index generation
WO1999019864A2 (en) * 1997-10-15 1999-04-22 At & T Corp. Improved system and method for processing object-based audiovisual information
US6961954B1 (en) 1997-10-27 2005-11-01 The Mitre Corporation Automated segmentation, information extraction, summarization, and presentation of broadcast news
US6073137A (en) * 1997-10-31 2000-06-06 Microsoft Method for updating and displaying the hierarchy of a data store
US5991756A (en) * 1997-11-03 1999-11-23 Yahoo, Inc. Information retrieval from hierarchical compound documents
US6272492B1 (en) * 1997-11-21 2001-08-07 Ibm Corporation Front-end proxy for transparently increasing web server functionality
US6801911B1 (en) * 1997-11-21 2004-10-05 International Business Machines Corporation Data processing system and method for accessing files
US6711568B1 (en) * 1997-11-25 2004-03-23 Krishna Asur Bharat Method for estimating coverage of web search engines
US5987457A (en) * 1997-11-25 1999-11-16 Acceleration Software International Corporation Query refinement method for searching documents
US6145003A (en) * 1997-12-17 2000-11-07 Microsoft Corporation Method of web crawling utilizing address mapping
US6094649A (en) * 1997-12-22 2000-07-25 Partnet, Inc. Keyword searches of structured databases
US6289342B1 (en) 1998-01-05 2001-09-11 Nec Research Institute, Inc. Autonomous citation indexing and literature browsing using citation context
US6032162A (en) * 1998-01-08 2000-02-29 Burke; Alexander James System for processing and storing internet bookmark address links
US6654931B1 (en) 1998-01-27 2003-11-25 At&T Corp. Systems and methods for playing, browsing and interacting with MPEG-4 coded audio-visual objects
US6092074A (en) * 1998-02-10 2000-07-18 Connect Innovations, Inc. Dynamic insertion and updating of hypertext links for internet servers
AU2995999A (en) * 1998-03-10 1999-09-27 Ftp Software, Inc. Direct network file system
US6421675B1 (en) * 1998-03-16 2002-07-16 S. L. I. Systems, Inc. Search engine
US6766315B1 (en) * 1998-05-01 2004-07-20 Bratsos Timothy G Method and apparatus for simultaneously accessing a plurality of dispersed databases
US7770123B1 (en) * 1998-05-08 2010-08-03 Apple Inc. Method for dynamically generating a “table of contents” view of a HTML-based information system
US6212522B1 (en) * 1998-05-15 2001-04-03 International Business Machines Corporation Searching and conditionally serving bookmark sets based on keywords
WO1999062008A1 (en) * 1998-05-27 1999-12-02 At & T Corp. Apparatus and method for a network bookmarking system
US6769096B1 (en) * 1998-06-24 2004-07-27 Microsoft Corporation System and method for updating a table of contents in a frameset
US6549940B1 (en) 1998-06-29 2003-04-15 Sbc Technology Resources, Inc. Graphical user interface for providing and facilitating user for searching and accessing information with options of selecting one of carrier circuit, facility reroute, customer and cable
US6334145B1 (en) * 1998-06-30 2001-12-25 International Business Machines Corporation Method of storing and classifying selectable web page links and sublinks thereof to a predetermined depth in response to a single user input
US6449663B1 (en) * 1998-07-08 2002-09-10 International Business Machines Corporation Method and apparatus for adjusting an interval of polling a network printer based on changes in working status of the network printer
US6336116B1 (en) * 1998-08-06 2002-01-01 Ryan Brown Search and index hosting system
US6397222B1 (en) * 1998-08-07 2002-05-28 Paul Zellweger Method and apparatus for end-user management of a content menu on a network
US6304872B1 (en) * 1998-08-13 2001-10-16 Tornado Technology Co. Ltd. Search system for providing fulltext search over web pages of world wide web servers
US6314424B1 (en) * 1998-09-28 2001-11-06 International Business Machines Corporation System and method for dynamically expanding and collapsing a tree view for an HTML web interface
KR100318015B1 (ko) * 1998-10-22 2002-04-22 박화자 웹문서의하이퍼링크정보를이용한개념도의구축과이를통한인터넷검색방법
US7039688B2 (en) * 1998-11-12 2006-05-02 Ricoh Co., Ltd. Method and apparatus for automatic network configuration
US6314502B1 (en) 1998-11-12 2001-11-06 Ricoh Co., Ltd. Method and apparatus for opportunistic queue processing
US6978297B1 (en) * 1998-11-12 2005-12-20 Ricoh, Co., Ltd. System and method of managing queues by maintaining metadata files having attributes corresponding to capture of electronic document and using the metadata files to selectively lock the electronic document
WO2000034845A2 (en) * 1998-12-08 2000-06-15 Mediadna, Inc. A system and method of obfuscating data
US6480852B1 (en) * 1998-12-11 2002-11-12 International Business Machines Corporation Method and system for rating bookmarks in a web browser
US6928469B1 (en) 1998-12-29 2005-08-09 Citrix Systems, Inc. Apparatus and method for determining a program neighborhood for a client node in a client-server network using markup language techniques
US7421723B2 (en) * 1999-01-07 2008-09-02 Nielsen Media Research, Inc. Detection of media links in broadcast signals
US7904187B2 (en) 1999-02-01 2011-03-08 Hoffberg Steven M Internet appliance system and method
US6434556B1 (en) 1999-04-16 2002-08-13 Board Of Trustees Of The University Of Illinois Visualization of Internet search information
US6516329B1 (en) * 1999-04-26 2003-02-04 Gateway, Inc. Method of maintaining search results pages
US6253198B1 (en) * 1999-05-11 2001-06-26 Search Mechanics, Inc. Process for maintaining ongoing registration for pages on a given search engine
US6175830B1 (en) 1999-05-20 2001-01-16 Evresearch, Ltd. Information management, retrieval and display system and associated method
US6476828B1 (en) 1999-05-28 2002-11-05 International Business Machines Corporation Systems, methods and computer program products for building and displaying dynamic graphical user interfaces
US6486891B1 (en) 1999-06-03 2002-11-26 Ann M. Rice Automated bookmarking of online advertisements
JP2001022788A (ja) * 1999-07-13 2001-01-26 Nec Corp 情報検索装置および情報検索プログラムを記録した記録媒体
US7346605B1 (en) * 1999-07-22 2008-03-18 Markmonitor, Inc. Method and system for searching and monitoring internet trademark usage
US6907562B1 (en) * 1999-07-26 2005-06-14 Xerox Corporation Hypertext concordance
US7219073B1 (en) * 1999-08-03 2007-05-15 Brandnamestores.Com Method for extracting information utilizing a user-context-based search engine
US7013300B1 (en) 1999-08-03 2006-03-14 Taylor David C Locating, filtering, matching macro-context from indexed database for searching context where micro-context relevant to textual input by user
AU6630800A (en) 1999-08-13 2001-03-13 Pixo, Inc. Methods and apparatuses for display and traversing of links in page character array
US7613992B1 (en) 1999-08-16 2009-11-03 Raichur Arvind A Dynamic index and search engine server
US9977831B1 (en) 1999-08-16 2018-05-22 Dise Technologies, Llc Targeting users' interests with a dynamic index and search engine server
US9195756B1 (en) 1999-08-16 2015-11-24 Dise Technologies, Llc Building a master topical index of information
US8504554B2 (en) * 1999-08-16 2013-08-06 Raichur Revocable Trust, Arvind A. and Becky D. Raichur Dynamic index and search engine server
US7239406B1 (en) 1999-09-30 2007-07-03 Ricoh Co., Ltd System for capturing facsimile data in an electronic document management system
US7386599B1 (en) * 1999-09-30 2008-06-10 Ricoh Co., Ltd. Methods and apparatuses for searching both external public documents and internal private documents in response to single search request
US6772338B1 (en) 1999-10-26 2004-08-03 Ricoh Co., Ltd. Device for transfering data between an unconscious capture device and another device
DE60000909T2 (de) * 1999-11-12 2003-09-11 Ricoh Kk Erfassung von Facsimiledaten in einen elektronischen Dokumentverwaltungssystem
US6772141B1 (en) 1999-12-14 2004-08-03 Novell, Inc. Method and apparatus for organizing and using indexes utilizing a search decision table
US6366907B1 (en) 1999-12-15 2002-04-02 Napster, Inc. Real-time search engine
US6742023B1 (en) 2000-04-28 2004-05-25 Roxio, Inc. Use-sensitive distribution of data files between users
US7310629B1 (en) 1999-12-15 2007-12-18 Napster, Inc. Method and apparatus for controlling file sharing of multimedia files over a fluid, de-centralized network
US8019757B2 (en) * 2000-01-14 2011-09-13 Thinkstream, Inc. Distributed globally accessible information network implemented to maintain universal accessibility
ES2329008T3 (es) * 2000-01-14 2009-11-20 Thinkstream, Inc. Red de informacion dsitribuida accessible de forma global.
US6625594B1 (en) * 2000-01-18 2003-09-23 With1Click, Inc. System and method for searching a global communication system using a sub-root domain name agent
US7441014B1 (en) * 2000-02-09 2008-10-21 Tvworks, Llc Broadcast distribution using low-level objects and locator tables
US6594654B1 (en) * 2000-03-03 2003-07-15 Aly A. Salam Systems and methods for continuously accumulating research information via a computer network
US7174339B1 (en) 2000-03-07 2007-02-06 Tririga Llc Integrated business system for the design, execution, and management of projects
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US20020055919A1 (en) * 2000-03-31 2002-05-09 Harlequin Limited Method and system for gathering, organizing, and displaying information from data searches
US6778988B2 (en) * 2000-05-01 2004-08-17 R.R. Donnelley & Sons Company Method and apparatus for delivering a web page to a client device based on printed publications and publisher controlled links
US6678889B1 (en) 2000-05-05 2004-01-13 International Business Machines Corporation Systems, methods and computer program products for locating resources within an XML document defining a console for managing multiple application programs
US6654737B1 (en) 2000-05-23 2003-11-25 Centor Software Corp. Hypertext-based database architecture
US20010047404A1 (en) * 2000-05-24 2001-11-29 Takashi Suda Apparatus for managing web site addresses
US7822735B2 (en) * 2000-05-29 2010-10-26 Saora Kabushiki Kaisha System and method for saving browsed data
KR20020004041A (ko) * 2000-06-30 2002-01-16 임경환 인터넷을 통한 파일 검색 서비스 시스템 및 방법
US7136880B2 (en) * 2000-07-20 2006-11-14 Market Models, Inc. Method and apparatus for compiling business data
US6625596B1 (en) * 2000-07-24 2003-09-23 Centor Software Corporation Docubase indexing, searching and data retrieval
US6826555B2 (en) 2000-07-24 2004-11-30 Centor Software Corporation Open format for file storage system indexing, searching and data retrieval
AUPQ903400A0 (en) * 2000-07-27 2000-08-17 Oh, Young June Navigable search engine
US7089301B1 (en) 2000-08-11 2006-08-08 Napster, Inc. System and method for searching peer-to-peer computer networks by selecting a computer based on at least a number of files shared by the computer
US7233942B2 (en) * 2000-10-10 2007-06-19 Truelocal Inc. Method and apparatus for providing geographically authenticated electronic documents
US7167901B1 (en) * 2000-10-26 2007-01-23 International Business Machines Corporation Method and apparatus for improved bookmark and histories entry creation and access
AU2002237718A1 (en) * 2000-10-30 2002-05-21 Tririga, Inc. Method for associating graphical objects with non-graphical data
US7308445B2 (en) * 2000-11-08 2007-12-11 Overture Services, Inc. Method for estimating coverage of web search engines
US7069310B1 (en) * 2000-11-10 2006-06-27 Trio Systems, Llc System and method for creating and posting media lists for purposes of subsequent playback
US7213265B2 (en) 2000-11-15 2007-05-01 Lockheed Martin Corporation Real time active network compartmentalization
US7225467B2 (en) 2000-11-15 2007-05-29 Lockheed Martin Corporation Active intrusion resistant environment of layered object and compartment keys (airelock)
US6687711B1 (en) 2000-12-04 2004-02-03 Centor Software Corporation Keyword and methods for using a keyword
US7685224B2 (en) * 2001-01-11 2010-03-23 Truelocal Inc. Method for providing an attribute bounded network of computers
US20020107653A1 (en) * 2001-02-02 2002-08-08 Kraffert Mark J. Sharing data files in a test environment
MXPA03007733A (es) * 2001-02-28 2003-12-04 Thomson Licensing Sa Sistema y metodo para simplificar las busquedas en la guia de programas electronica.
US6874019B2 (en) * 2001-03-08 2005-03-29 International Business Machines Corporation Predictive caching and highlighting of web pages
US20020147775A1 (en) * 2001-04-06 2002-10-10 Suda Aruna Rohra System and method for displaying information provided by a provider
US7127444B2 (en) * 2001-04-27 2006-10-24 W. Quinn, Inc. System for active reports with drill down capability using memory mapping of HTML files with embedded data
US20020169872A1 (en) * 2001-05-14 2002-11-14 Hiroshi Nomiyama Method for arranging information, information processing apparatus, storage media and program tranmission apparatus
CN1524224A (zh) * 2001-07-06 2004-08-25 ���������˼�빫˾ 信息备份的系统和方法
US7162483B2 (en) * 2001-07-16 2007-01-09 Friman Shlomo E Method and apparatus for searching multiple data element type files
US7809710B2 (en) * 2001-08-14 2010-10-05 Quigo Technologies Llc System and method for extracting content for submission to a search engine
JP2003131927A (ja) * 2001-08-15 2003-05-09 Square Co Ltd 表示制御方法、情報処理装置、プログラム及び記録媒体
JP2003208434A (ja) * 2001-11-07 2003-07-25 Nec Corp 情報検索システム及びそれに用いる情報検索方法
US7209913B2 (en) * 2001-12-28 2007-04-24 International Business Machines Corporation Method and system for searching and retrieving documents
US6931410B2 (en) * 2002-01-11 2005-08-16 International Business Machines Corporation Method, apparatus, and program for separate representations of file system locations from referring file systems
US20030221163A1 (en) * 2002-02-22 2003-11-27 Nec Laboratories America, Inc. Using web structure for classifying and describing web pages
US8135843B2 (en) 2002-03-22 2012-03-13 Citrix Systems, Inc. Methods and systems for providing access to an application
US7069261B2 (en) * 2002-04-02 2006-06-27 The Boeing Company System, method and computer program product for accessing electronic information
US7120641B2 (en) * 2002-04-05 2006-10-10 Saora Kabushiki Kaisha Apparatus and method for extracting data
US20030195896A1 (en) * 2002-04-15 2003-10-16 Suda Aruna Rohra Method and apparatus for managing imported or exported data
US7103642B1 (en) * 2002-04-30 2006-09-05 Sprint Communications Company L.P. System and method for personalizing a home page
US7409404B2 (en) * 2002-07-25 2008-08-05 International Business Machines Corporation Creating taxonomies and training data for document categorization
US7146643B2 (en) * 2002-10-29 2006-12-05 Lockheed Martin Corporation Intrusion detection accelerator
US7080094B2 (en) * 2002-10-29 2006-07-18 Lockheed Martin Corporation Hardware accelerated validating parser
US20040143644A1 (en) * 2003-01-21 2004-07-22 Nec Laboratories America, Inc. Meta-search engine architecture
US20050149507A1 (en) * 2003-02-05 2005-07-07 Nye Timothy G. Systems and methods for identifying an internet resource address
US20070022110A1 (en) * 2003-05-19 2007-01-25 Saora Kabushiki Kaisha Method for processing information, apparatus therefor and program therefor
US7613687B2 (en) * 2003-05-30 2009-11-03 Truelocal Inc. Systems and methods for enhancing web-based searching
JP2006526837A (ja) * 2003-06-03 2006-11-24 株式会社Access ページ保存ファイルを用いてコンテンツを閲覧する方法
US7599938B1 (en) 2003-07-11 2009-10-06 Harrison Jr Shelton E Social news gathering, prioritizing, tagging, searching, and syndication method
US7548968B1 (en) 2003-12-10 2009-06-16 Markmonitor Inc. Policing internet domains
US7363294B2 (en) * 2003-12-19 2008-04-22 Fuji Xerox Co., Ltd. Indexing for contextual revisitation and digest generation
US7460737B2 (en) 2004-02-12 2008-12-02 Hoshiko Llc Method and apparatus for photograph finding
US7636710B2 (en) * 2004-03-04 2009-12-22 Symantec Operating Corporation System and method for efficient file content searching within a file system
US8145683B2 (en) * 2004-03-17 2012-03-27 Siemens Aktiengesellschaft Data structure and method for creating and storing a file
US8458783B2 (en) * 2004-06-30 2013-06-04 Citrix Systems, Inc. Using application gateways to protect unauthorized transmission of confidential data via web applications
GB2417342A (en) * 2004-08-19 2006-02-22 Fujitsu Serv Ltd Indexing system for a computer file store
US7487138B2 (en) * 2004-08-25 2009-02-03 Symantec Operating Corporation System and method for chunk-based indexing of file system content
US7386542B2 (en) * 2004-08-30 2008-06-10 The Mitre Corporation Personalized broadcast news navigator
US8095940B2 (en) 2005-09-19 2012-01-10 Citrix Systems, Inc. Method and system for locating and accessing resources
US8171479B2 (en) 2004-09-30 2012-05-01 Citrix Systems, Inc. Method and apparatus for providing an aggregate view of enumerated system resources from various isolation layers
US8613048B2 (en) 2004-09-30 2013-12-17 Citrix Systems, Inc. Method and apparatus for providing authorized remote access to application sessions
US7748032B2 (en) 2004-09-30 2010-06-29 Citrix Systems, Inc. Method and apparatus for associating tickets in a ticket hierarchy
US7680758B2 (en) 2004-09-30 2010-03-16 Citrix Systems, Inc. Method and apparatus for isolating execution of software applications
US7711835B2 (en) 2004-09-30 2010-05-04 Citrix Systems, Inc. Method and apparatus for reducing disclosure of proprietary data in a networked environment
US8364670B2 (en) 2004-12-28 2013-01-29 Dt Labs, Llc System, method and apparatus for electronically searching for an item
US8024568B2 (en) 2005-01-28 2011-09-20 Citrix Systems, Inc. Method and system for verification of an endpoint security scan
US20070022111A1 (en) * 2005-07-20 2007-01-25 Salam Aly A Systems, methods, and computer program products for accumulating, storing, sharing, annotating, manipulating, and combining search results
US20070022125A1 (en) * 2005-07-20 2007-01-25 Salam Aly A Systems, methods, and computer program products for accumulating, strong, sharing, annotating, manipulating, and combining search results
US7610345B2 (en) 2005-07-28 2009-10-27 Vaporstream Incorporated Reduced traceability electronic message system and method
US9282081B2 (en) 2005-07-28 2016-03-08 Vaporstream Incorporated Reduced traceability electronic message system and method
US8429167B2 (en) 2005-08-08 2013-04-23 Google Inc. User-context-based search engine
US8027876B2 (en) * 2005-08-08 2011-09-27 Yoogli, Inc. Online advertising valuation apparatus and method
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US8135763B1 (en) * 2005-09-30 2012-03-13 Emc Corporation Apparatus and method for maintaining a file system index
US8600997B2 (en) * 2005-09-30 2013-12-03 International Business Machines Corporation Method and framework to support indexing and searching taxonomies in large scale full text indexes
US7783615B1 (en) * 2005-09-30 2010-08-24 Emc Corporation Apparatus and method for building a file system index
US7779034B2 (en) 2005-10-07 2010-08-17 Citrix Systems, Inc. Method and system for accessing a remote file in a directory structure associated with an application program executing locally
US8131825B2 (en) 2005-10-07 2012-03-06 Citrix Systems, Inc. Method and a system for responding locally to requests for file metadata associated with files stored remotely
KR100664311B1 (ko) 2005-11-18 2007-01-04 삼성전자주식회사 자동 인덱스 생성이 가능한 화상형성장치 및 그 자동인덱스 생성방법
US20070174429A1 (en) 2006-01-24 2007-07-26 Citrix Systems, Inc. Methods and servers for establishing a connection between a client system and a virtual machine hosting a requested computing environment
US8135694B2 (en) * 2006-03-13 2012-03-13 Adobe Systems Incorporated Augmenting the contents of an electronic document with data retrieved from a search
WO2007106826A2 (en) 2006-03-13 2007-09-20 Markmonitor Inc. Domain name ownership validation
US7630975B2 (en) * 2006-03-30 2009-12-08 Microsoft Corporation Unified searching and running of files
US7747628B2 (en) * 2006-04-05 2010-06-29 Computer Associates Think, Inc. System and method for automated construction, retrieval and display of multiple level visual indexes
US8694910B2 (en) 2006-05-09 2014-04-08 Sonos, Inc. User interface to enable users to scroll through a large list of items
US7734618B2 (en) * 2006-06-30 2010-06-08 Microsoft Corporation Creating adaptive, deferred, incremental indexes
US7917499B2 (en) * 2006-06-30 2011-03-29 Microsoft Corporation Updating adaptive, deferred, incremental indexes
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8533846B2 (en) 2006-11-08 2013-09-10 Citrix Systems, Inc. Method and system for dynamically associating access rights with a resource
US9270963B2 (en) * 2007-01-03 2016-02-23 Tivo Inc. Program shortcuts
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US20080277314A1 (en) * 2007-05-08 2008-11-13 Halsey Richard B Olefin production utilizing whole crude oil/condensate feedstock and hydrotreating
JP2009037361A (ja) * 2007-07-31 2009-02-19 Brother Ind Ltd サーバ装置、サーバ装置制御プログラム、及びファイル転送システム
US8171483B2 (en) 2007-10-20 2012-05-01 Citrix Systems, Inc. Method and system for communicating between isolation environments
US8984044B2 (en) * 2007-12-25 2015-03-17 International Business Machines Corporation Managing bookmarks within a collaborative application
US8046675B2 (en) * 2007-12-28 2011-10-25 Yahoo! Inc. Method of creating graph structure from time-series of attention data
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US20090189892A1 (en) 2008-01-27 2009-07-30 Nitin Desai Methods and systems for detecting a dirty region within a frame encompassing three dimensional graphics
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
JP2010102456A (ja) * 2008-10-22 2010-05-06 Sony Computer Entertainment Inc コンテンツ提供装置、コンテンツ提供システム、コンテンツ提供方法およびユーザインタフェースプログラム
JP5080428B2 (ja) * 2008-11-14 2012-11-21 株式会社日立製作所 構成管理サーバ、名称特定方法および名称特定プログラム
US8090797B2 (en) 2009-05-02 2012-01-03 Citrix Systems, Inc. Methods and systems for launching applications into existing isolation environments
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US8930437B2 (en) * 2009-10-05 2015-01-06 Tynt Multimedia, Inc. Systems and methods for deterring traversal of domains containing network resources
EP2518608A4 (en) * 2009-12-24 2013-05-29 Samsung Electronics Co Ltd VISUALIZATION DEVICE FOR DISPLAYING A WEB PAGE AND VISUALIZATION METHOD THEREOF
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
DE202011111062U1 (de) 2010-01-25 2019-02-19 Newvaluexchange Ltd. Vorrichtung und System für eine Digitalkonversationsmanagementplattform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US8396889B2 (en) * 2010-08-26 2013-03-12 Lexisnexis, A Division Of Reed Elsevier Inc. Methods for semantics-based citation-pairing information
US8396882B2 (en) 2010-08-26 2013-03-12 Lexisnexis, A Division Of Reed Elsevier Inc. Systems and methods for generating issue libraries within a document corpus
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US10055491B2 (en) 2012-12-04 2018-08-21 Sonos, Inc. Media content search based on metadata
US9697271B2 (en) * 2013-03-06 2017-07-04 Tata Consultancy Services Limited Business intelligence reports with navigable reference indicators
US9900314B2 (en) 2013-03-15 2018-02-20 Dt Labs, Llc System, method and apparatus for increasing website relevance while protecting privacy
US9336305B2 (en) 2013-05-09 2016-05-10 Lexis Nexis, A Division Of Reed Elsevier Inc. Systems and methods for generating issue networks
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
CN110442699A (zh) 2013-06-09 2019-11-12 苹果公司 操作数字助理的方法、计算机可读介质、电子设备和系统
US9292553B2 (en) * 2013-08-20 2016-03-22 Pivotal Software, Inc. Queries for thin database indexing
US9292554B2 (en) * 2013-08-20 2016-03-22 Pivotal Software, Inc. Thin database indexing
US10095785B2 (en) 2013-09-30 2018-10-09 Sonos, Inc. Audio content search in a media playback system
US9226072B2 (en) 2014-02-21 2015-12-29 Sonos, Inc. Media content based on playback zone awareness
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9966065B2 (en) 2014-05-30 2018-05-08 Apple Inc. Multi-command single utterance input method
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US20160162149A1 (en) * 2014-12-05 2016-06-09 Htc Corporation Mobile electronic device, method for displaying user interface, and recording medium thereof
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US20160379270A1 (en) * 2015-06-24 2016-12-29 OpenDNA Limited Systems and methods for customized internet searching and advertising
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
CN108460075B (zh) * 2017-12-28 2021-11-30 上海顶竹通讯技术有限公司 一种文件内容检索方法及系统
US20220027419A1 (en) * 2018-12-28 2022-01-27 Shenzhen Sekorm Component Network Co., Ltd Smart search and recommendation method for content, storage medium, and terminal

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07230463A (ja) * 1994-02-15 1995-08-29 Kano Densan Hongkong Yugenkoshi 電子辞書
JPH09204433A (ja) * 1996-01-24 1997-08-05 Fuji Xerox Co Ltd キーワード設定装置
JPH09265482A (ja) * 1996-01-26 1997-10-07 Mitsubishi Electric Corp データベース検索装置及びデータベース検索方法
US5848410A (en) * 1997-10-08 1998-12-08 Hewlett Packard Company System and method for selective and continuous index generation

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3670310A (en) * 1970-09-16 1972-06-13 Infodata Systems Inc Method for information storage and retrieval
US4845658A (en) * 1986-12-01 1989-07-04 Massachusetts Institute Of Technology Information method and apparatus using simplex and duplex communications
US5685003A (en) * 1992-12-23 1997-11-04 Microsoft Corporation Method and system for automatically indexing data in a document using a fresh index table

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07230463A (ja) * 1994-02-15 1995-08-29 Kano Densan Hongkong Yugenkoshi 電子辞書
JPH09204433A (ja) * 1996-01-24 1997-08-05 Fuji Xerox Co Ltd キーワード設定装置
JPH09265482A (ja) * 1996-01-26 1997-10-07 Mitsubishi Electric Corp データベース検索装置及びデータベース検索方法
US5848410A (en) * 1997-10-08 1998-12-08 Hewlett Packard Company System and method for selective and continuous index generation

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19990078876A (ko) * 1999-08-16 1999-11-05 노승환 일괄된 자원 위치기 입력을 통한 정보 검색 방법
JP2002149668A (ja) * 2000-11-10 2002-05-24 Mieko Tsuyusaki インターネット補助ソフトウェア及び該プログラムを記録した記録媒体
WO2009119811A1 (ja) * 2008-03-28 2009-10-01 日本電気株式会社 情報再構成システム、情報再構成方法及び情報再構成用プログラム
US8489610B2 (en) 2008-03-28 2013-07-16 Nec Corporation Method, system and program for information re-organization
JP5589837B2 (ja) * 2008-03-28 2014-09-17 日本電気株式会社 情報再構成システム、情報再構成方法及び情報再構成用プログラム
JP2014178902A (ja) * 2013-03-14 2014-09-25 Ricoh Co Ltd 検索システム、検索語辞書生成装置、プログラム、記憶媒体及び検索語辞書生成方法
JP2016024566A (ja) * 2014-07-18 2016-02-08 三菱電機株式会社 検索装置及び検索プログラム

Also Published As

Publication number Publication date
US5848410A (en) 1998-12-08
JP3341988B2 (ja) 2002-11-05

Similar Documents

Publication Publication Date Title
JP3341988B2 (ja) インデックス表示方法
US8359550B2 (en) Method for dynamically generating a “table of contents” view of the HTML-based information system
US6381593B1 (en) Document information management system
US6094649A (en) Keyword searches of structured databases
US6411924B1 (en) System and method for linguistic filter and interactive display
US9384245B2 (en) Method and system for assessing relevant properties of work contexts for use by information services
US6985950B1 (en) System for creating a space-efficient document categorizer for training and testing of automatic categorization engines
US7130867B2 (en) Information component based data storage and management
CA2288745C (en) Method and apparatus for searching a database of records
US8978033B2 (en) Automatic method and system for formulating and transforming representations of context used by information services
US7730013B2 (en) System and method for searching dates efficiently in a collection of web documents
US6073170A (en) Information filtering device and information filtering method
US20030004941A1 (en) Method, terminal and computer program for keyword searching
US20020099685A1 (en) Document retrieval system; method of document retrieval; and search server
US20020055919A1 (en) Method and system for gathering, organizing, and displaying information from data searches
US7024405B2 (en) Method and apparatus for improved internet searching
US7636732B1 (en) Adaptive meta-tagging of websites
WO2001024046A2 (en) Authoring, altering, indexing, storing and retrieving electronic documents embedded with contextual markup
US7949656B2 (en) Information augmentation method
KR20030051577A (ko) 검색사이트의 검색결과 표시방법
JP3328913B1 (ja) 多言語文献検索システム
JP2002312389A (ja) 情報検索装置および情報検索方法
JP4034503B2 (ja) 文書検索システムおよび文書検索方法
Beall Using OCLC Connexion to find typographical errors in authority records
JPH07210568A (ja) ファイル管理装置

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080823

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090823

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100823

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110823

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110823

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120823

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120823

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130823

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130823

Year of fee payment: 11

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130823

Year of fee payment: 11

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees