JP2009508273A

JP2009508273A - ネットワーク化された情報のインデックス作成および検索についての装置および方法

Info

Publication number: JP2009508273A
Application number: JP2008531329A
Authority: JP
Inventors: ロバート，ピー．エリックソン; フォックス，デイビッド，エー．
Original assignee: オー−ヤ！，インク．
Priority date: 2005-09-14
Filing date: 2006-09-13
Publication date: 2009-02-26
Also published as: WO2007033338A3; EP1934703A4; CA2622625A1; EP1934703A2; US20070073894A1; WO2007033338A2

Abstract

ネットワーク化された情報のインデックス作成および検索についての装置および方法により、一つあるいは複数存在するイントラネット、インターネットまたはその両方に存在する情報へのアクセス（インデックス作成および検索のアクセスを含む）が可能となる。ネットワーク化した検索装置（本出願においてネットワーク検索機器またはネットワーク検索器具とも呼ばれる）および検索方法は、ネットワーク化した情報の検索・読み出しを円滑にするための設定機能、インデックス作成機能、検索機能から構成される。

Description

関連出願に関するクロスリファレンス
この出願は、2005年9月14日に先行して出願されたアメリカ特許出願番号第60/717,531号の優先権を主張し、その内容は参照により本出願に組み込まれる。

発明分野
本発明は、一般にネットワーク資源のインデックス作成および検索の分野に関連するが、特にネットワークを通じた検索・読み出しによりアクセス可能な共有化リソースのインデックス作成に関連し、また検索の装置および方法にも関連する。

関連技術の説明
コンピュータシステムは通常様々なビジネス、教育および娯楽関連のアプリケーションに利用され、そのアプリケーションの多くは情報を保管、検索、処理することに使用される。コンピュータシステムおよびコンピュータネットワークの機能が、例えばイントラネットやインターネットに見られるように拡大することで、莫大な数の人々が利用可能な情報が大量に蓄積された。

コンピュータによって情報のアクセス利便性および情報処理の能力が向上したことは疑いがなく、また電子形式で利用可能な情報の莫大な量は、いろいろな意味で、我々の処理能力を超えている。この現象は「情報過多」と呼ばれ、今や情報が溢れ出し、必要なときに情報を見つけ出すことが益々困難になっていくことを意味する。従って、電子形式で消費可能な情報の量が今もなお増大し続けていることに対処するため、多くの新しいツールが開発中である。比較的に原始的な検索機能が多くのデスクトップコンピュータのＯＳ環境において提供されているが、必要な書類を索引付け、分類し、検索して読み出す機能は極めて限定されている。

例えば、ワールドワイドウェブ（「WWW」もしくは「web」）により莫大な情報量にアクセス可能となる。しかし、必要な情報の在り処を突き止めるのはかなり難しい。この問題が複合的であるのは、ウェブ上で利用可能である情報量とウェブを検索する経験不足なユーザの数の双方が指数関数的に増え続けているからである。この問題に対処する試みとして、「検索エンジン」として知られる、検索に特化したツールが多く開発されてきた。有名な検索エンジンとしてグーグル、ヤフー、ＭＳＮサーチがある。

しかし、従来のウェブベース検索エンジンは、ローカルエリアネットワーク（ＬＡＮ）およびイントラネットで構成される企業環境での使用に適した設計ではない。そして、このような企業環境では多種多様なフォームまたはフォーマット形式のデータが、様々に分散して保管されている。

一般的に、検索エンジンはユーザの興味に関連すると考えられる一定のウェブページへのハイパーリンクを検索結果として出力しようとする。検索エンジンの目的は、ユーザの検索クエリを基礎として、質が高く、関連する複数のリンクを検索結果としてユーザに提供することである。ほとんどの検索エンジンでは、ユーザの関心事を判断する場合、ユーザが入力する検索ワードの集合（検索クエリと呼ばれる）に基礎を置いている。通常、検索エンジンはこれを、検索クエリのワードを事前に蓄積しインデックスを作成したウェブページのコーパス（文例データベース）に照合することで行う。ユーザの検索ワードを含んだウェブページは「ヒット」と呼ばれ、ユーザに検索結果として出力される。

ユーザに検索結果として出力されるウェブページの関連性と質を高めようとして、検索エンジンはヒットのリストを並び替えて最も関連性が高く、かつあるいはまた、最も質の高いページを検索結果のリストの最上位に挙げようとする。例えば、検索エンジンは各々のヒットにランクやスコアを割り当てる。そのスコアはウェブページの関連性または重要性に応じて計算されている。

関連性を測定する従来の方法は通常ウェブページの内容を基礎としている。より進んだ技術では、ウェブページの内容だけでなく、これを基礎にウェブページの重要性を判断する。例えば、次のような方法が知られている。すなわち、サージーブリン、ローレンスペイジ共著「大型ハイパーテキスト検索エンジンの分析」という題名の記事に記載されているのは、ウェブページのリンク構造に基礎を置いてウェブページの重要性の程度が割り当てられるという方法である。しかし、このようなアプローチはウェブページのフォーマットに従ったデータに依拠しており、多くのデータがウェブページフォーマット以外の形式となっているＬＡＮ環境に全て適合するわけではない。

例えば、インターネットもしくはイントラネットで保管されているデータにビデオクリップがあるとしても、そのビデオクリップのフォーマットや内容ないし検索エンジンの性能によっては、検索エンジンはそのビデオクリップの内容を特定してインデックスを作成したり、アクセスしたりすることはできないことがありうる。同様の問題は、例えば文書ファイル、画像ファイル、ＭＰ３クリップ、ブログ等の他の内容形式でも起こりうる。

更に、あらゆるリンク、ページ、文書が一定のユーザに利用可能となるのは望ましいことではないかもしれない。このことが特に当てはまるのは発達の速い分野であるデスクトップコンピュータ、ローカルエリアネットワーク、およびイントラネット環境である。例えば、あるイントラネット環境において、あるユーザがある文書を閲覧できるが、同じイントラネット上で他のユーザはその文書へのアクセスが禁止されているということがありうるが、それでも検索クエリはその文書を検索結果として出力してしまう。現時点の検索エンジン技術はほとんどのオペレーティングシステムの管理とは関係なく機能するので、いかなるタイプのセキュリティモデルでも検索結果へのアクセスがカスタマイズできるようにすることは極めて難しい。

発明の概要
ネットワーク化された情報のインデックス作成および検索についての装置および方法により、一つ以上のイントラネット、インターネットまたはその両方に存在する情報へのアクセス（インデックス作成および検索のアクセスを含む）が可能となる。ネットワーク化した検索装置（本出願においてネットワーク検索装置またはネットワーク検索機器とも呼ばれる）および検索方法は、ネットワーク化した情報の検索・読み出しを円滑にするための設定機能、インデックス作成機能、検索機能から構成される。

本発明の実施の一例として、ネットワークに接続可能な機器であって、インテグレータ、リソース識別子、情報検索エンジンからなる機器が挙げられる。インテグレータは、ネットワーク機器用のネットワークアドレスを含んだ動的ネットワーク設定を利用して、ネットワーク上の機器を統合するように設定されている。リソース識別子は以下の目的のためにネットワークの少なくとも一部分をトラヴァースするように設定されている。すなわち、ネットワークに接続された一つ以上のネットワーク機器を検知し、検知されたネットワーク機器の少なくとも一つに関連する情報ソースを特定し、その特定された情報ソースに関連する情報項目について少なくとも一つ以上のインデックスを作成するという目的である。情報検索エンジンは特定された検索基準を充足する情報ソースから利用可能な情報項目を特定するよう設定されている。

本発明の実施の一例として、ネットワーク検索装置は、設定機能あるいは統合機能、リソース特定およびインデックス作成、検索コンポーネントから構成される。設定中、例えばネットワークアドレスのようなネットワーク設定は、ネットワーク検索装置用に動的になされる。ネットワーク検索装置におけるインデックス作成コンポーネントは、ネットワークを検索して、ネットワーク上で利用可能な共有リソースを特定し、検索結果レポジトリ（保管庫）ないし検索情報データベースを保持する。検索リクエストに応じて、ネットワーク検索装置の検索コンポーネントは検索データベースを利用してネットワーク上の情報を検索する。本発明の実施例として、検索結果には、一つあるいは複数のスコアリングメカニズムに従ってスコアやランクが付される。

本発明の別の実施例として、ネットワーク検索装置により実行される方法は次のように構成される。すなわち、ネットワーク機器について、ネットワークアドレスのような動的ネットワーク設定を含んだ設定を行い、ネットワーク機器と通信を行う。また、ネットワーク上の共有リソースを特定するためネットワークを検索した上で検索結果レポジトリ（保管庫）ないし検索情報データベースを保持することを含めて、ネットワーク上の共有リソースについてインデックスを作成する。更に、検索リクエストに応じて検索データベースを利用してネットワーク上の情報を検索する。本発明の実施例に従って、検索結果には、一つあるいは複数のスコアリングメカニズムに従ってスコアやランクが付される。

本発明の実施例に従い、ネットワーク検索装置は設定された上で、ユーザデータグラムプロトコル（ＵＤＰ）クライアント／サーバモデルを利用し、検索機器用のＩＰアドレスを含んだインターネットプロトコル（ＩＰ）設定が移されるため、検索機器とネットワーク装置（例えば、ネットワークサーバ）との間でメッセージが送受信される。起動クライアントはネットワークサーバを実行させ、メッセージを配信することで、ネットワークもしくはネットワークの一部に物理的に接続されている各々のネットワーク検索装置にネットワークが登録される。これに応じて、各々のネットワーク検索装置は自己識別情報、例えばそのメディアアクセスコントロール（ＭＡＣ）アドレスとホスト名を提供する。ネットワークサーバ上の起動クライアントはネットワーク検索装置の自己識別情報を利用して、ネットワーク検索機器と通信し、検索機器にＩＰ状態の設定および設定解除を行う。

ネットワーク検索装置は、共有可能なリソースを求めてネットワークを検索し（あるいはここで巡回もしくはウェブ巡回ともいう）、または共有する。そして、インデックス作成および／または検索を促進するため、共有リソース各々に対応した情報レポジトリ（保管庫）を維持／更新する。例えば、共有可能なリソースは、ハードディスクドライブあるいは他のストレージメディア（固定、リムーバブル双方含む）、またはこれらに保存され、共有アクセス権限が認められる一つあるいは複数のフォルダ、ファイル、文書、ページ等に存在しうる。本発明の実施例に従って、データベースは、これらの共有可能リソースに対応した情報を保存し、インデックス作成および検索に利用する。

データベースにはドメインテーブル、ＵＲＩテーブルおよびページテーブルが含まれ、ネットワーク上のある位置あるいはドメインにファイルとして保存されている文書内のウェブページに対応した情報を保存するのに使用される。ドメインテーブルには各ドメインに対応した名前が挙げられている。ＵＲＩテーブルには各文書に対応したUniversal Resource Indicator（ＵＲＩ）が、他の文書情報（例えば、最終修正日付およびインデックス作成時）と一緒に挙げられている。ページテーブルには各ページ（例えば、ウェブページ、Ｅメール、ワープロ文書内のページ等）へのエントリが挙げられている。

データベースは更に「オリジナル」ワードの用語集（あるいは辞書）を含んでおり、その用語集は新規ワードを含めるため動的に更新される。加えて、データベースは各語の発音の一部も包含する。オリジナルワードから構成される幹ワードの一つあるいは複数、可能であれば全てが用語集に保管され、各々の幹ワードはデータベースにおいてその構成元のオリジナルワードに関連付けられる。ランクテーブルに保管される登録の各々には、現時点（すなわち最終のインデックス作成時および／または修正時）における、文書あるいはページでの幹ワードの出現頻度が記録されている。ワードテーブルでは、文書あるいはページでのオリジナルワードの位置が示される。

本発明の実施例において、データベースモデルは次のようなものである。すなわち、データベースインサートコマンド（例えばStructured Query Language（ＳＱＬ）インサートコマンド）の代わりに、ファイルインポートメカニズムを利用して新しい記録が一つあるいは複数のデータベーステーブルに追加できるようなものである。既存の記録はＳＱＬアップデートコマンドを利用して更新される。例えば、ファイルインポートメカニズムを利用して、ＵＲＩテーブル、ページテーブル、ランクテーブルおよびワードテーブルの一つあるいは複数に記録が投入されたデータがバッファ（一時保管）されて、その後（例えば、インデックス作成終了時および／またはデータバッファが一杯になった時）データベースに記録される。

本発明の実施例において、N項トライ木が用語集にバッファ（一時保管）するために使用され、効率的なワード検索を提供する。Ｎ値は、用語集においてワードを表すために使用される特定の文字セットによって決まる。例えば「Ｎ」は、桁数および句読点数と共に、アルファベットにおける文字数を表すこともある。本発明の実施例において、インデックス作成に先立ち、用語集テーブルの内容がN項トライ木バッファシステムに入力される。インデックス作成中になされた、新規のあるいは更新された文書／ページで見つけられた新単語のようなものについての更新は、最初にN項トライ木バッファシステムに入力され、その後ファイルインポートメカニズムを利用してデータベースに入力される。

本発明の実施例において、一つあるいは複数の「重み付け」方法論を含めたスコアリングメカニズムは検索結果を向上させるために使用される。より詳しく言えば、スコアリングメカニズムを使用して、検索結果をランク付けし、キーワード検索により特定される各項目（例えば文書やページ等）の関連値を測定する。本発明に従い、より詳細にみると、スコアリングメカニズムを使用して、文書中のキーワードの出現頻度およびその文書中に発見された複数のキーワードの相関関係に基づいて、項目の関連値をランク付けする。メリットとして、例えば、検索で特定された結果項目の中から発見された各キーワードに対応したそれぞれの出現頻度が全検索結果項目と比較対照できる場合、スコアリングメカニズムが使用されて、検索結果で発見された複数のキーワード相互の相関関係を測定し、ある検索結果項目とこれに関連する他の検索結果項目とを区別するために利用される。

本発明の実施例において、スコアリングアルゴリズムは出現頻度を次のように派生させる。すなわち、キーワードに関連した出現頻度の組み合わせを複数使用し、最初の項（オーダ）から始めて検索におけるキーワードの数まで項（オーダ）を増やす。そして複数のキーワードを含む検索結果項目に対応した関連性を決定する。実施例に従い、その関連性は複数のキーワードを含む検索結果項目のそれぞれについて決定される。別の実施例においては、キーワード数を識別する基準値が、検索結果項目に割り振られる関連値を決定するために使用される。より詳しく言えば、ある検索結果項目に含まれるキーワードの数が基準値よりも少ない場合には、関連値はゼロに設定される。しかし、検索結果項目に含まれるキーワード数が少なくとも基準値を満たしている場合には、スコアリングアルゴリズムによって関連値が測定される。

図面の簡略説明
本発明の実施例は以下において、添付図面と合わせて記述される。その添付図面において表示されるのは構成要素と以下の事項である。

図１が示すのは、本発明の実施例の一つあるいは複数が使用されるコンピュータ機器および周辺機器のネットワークを表したブロックダイアグラムである。

図２は、図２Ａから図２Ｈより構成され、本発明の実施例の一つあるいは複数に従って使用される、クライアント／サーバモデル間で通信される命令文の例を示している。

図３が示すのは、本発明の実施例の一つあるいは複数に従った検索機器の内部構造についてのブロックダイアグラム図示例である。

図４は、図４Ａから図４Ｄより構成され、本発明の実施例の一つあるいは複数に従ったスコアリング例を示している。

図５は、図５Ａから図５Ｂより構成され、本発明の実施例の一つあるいは複数に従った、典型的なケースにおけるスコアリング例を示している。

図６が示すのは、本発明の実施例の一つあるいは複数に従って、インデックスを作成し更新する過程のフローチャートである。

図７が示すのは、本発明の実施例の一つあるいは複数に従って、インデックス作成および検索に使用される検索機器のブロックダイアグラム図示例である。

図８が示すのは、本発明の実施例の一つあるいは複数に従って、検索結果をスコアリングしランク付けする過程のフローチャートである。

図９は、図９Ａから図９Ｂより構成され、本発明の実施例の一つあるいは複数に従って使用されるデータベーススキーマの図示例を示している。

図１０が示すのは、少なくとも一つの本実施例に従った３項トライ木の例である。

図１１は、図１１Ａから図１１Ｏまでを含み、本発明の実施例の一つあるいは複数に従った検索機器のユーザインターフェース画面の図示例を表している。

図１２は、図１２Ａから図１２Ｙまでを含み、本発明の実施例の一つあるいは複数に従った検索機器の設定操作に使用され、および／または検索装置に関連したユーザインターフェース画面の図示例を表している。

ネットワーク化された情報のインデックス作成、および検索装置および方法により、一つ以上のイントラネットとインターネットまたはその両方に存在する情報へのアクセス（インデックス作成および検索のアクセスを含む）が提供される。ネットワーク化した検索装置（本件出願においてネットワーク検索装置またはネットワーク検索機器とも称する）および検索方法は、ネットワーク化した情報の検索・読み出しを円滑にするための設定機能、インデックス作成機能、検索機能から構成される。

図１を参照すると、ネットワークコンピューティング装置の構成図表１００と周辺装置は、本件開示の１つまたは１以上の実施例に使用される。本件開示の１つまたは１つ以上の実施例によれば、コンピューター１５０、１６０と１７０、そして、少なくとも一例として検索機器１８０と少なくとも１つのデータサーバ１９０はネットワーク１２０を介して連結される。さらに、オプションであるプリンター１１０とオプションのファックス機械１４０が示されている。本件で開示した実施例によれば、例えば個人も事業体およびこれに類似する者も、効率的かつ有効に本件で詳述する電子データへのアクセス、記録操作、インデックス作成、およびアクセス作業と読み出し作業をすることが出来る。

オプションのプリンター１１０とオプションのファックス機械１４０は、コンピュータを基礎とするシステム１００によって実行される質問（クエリ）や処理と共に、報告、調査結果、メモ等の紙による文章の送出および出力ができる標準周辺機器である。オプションのプリンター１１０とオプションのファックス機械１４０は単に本件開示の関係で使用する多くの周辺装置の代表であることは明らかであり、また、他の周辺機器も１つまたは１つ以上の本件開示の実施例で使う事ができ、省略により図１では除外されているが、そのような機器を除外するものではない。

ネットワーク１２０は、適宜なコンピューター通信網や通信機構、配線接続、外部接続や内部接続バス、ハイスピードＴ１やモデム経由での電話接続アクセス、ラジオ、赤外線や他の無線接続、個人又はローカルエリアネットワーク（ＬＡＮ）と広域情報網（ＷＡＮｓ）、同様に、有線・無線通信を使ったインターネット又は企業や事業体の内部網上でのネットワーク標準コンピューター通信網（イントラネット）、又は、その他の、当該技術に熟練している当業者に現在知られているか若しくは将来開発されるであろうコンピューターやコンピューターコンポーネントの適宜な回線接続からなる。
ネットワーク１２０の一部にはダイアルアップ式の電話回線、放送ケーブル送信網、デジタル定期加入者網（ＤＳＬ）、ＩＳＤＮ網、公共事業のようなアクセス連動装置が適宜に含まれるのは明らかである。さらに、ネットワーク１２０は１つ又は１以上のネットワークの部分を構成することができる。

本件開示の１つまたは１以上の実施例では、少なくともネットワーク１２０の一部は標準的な有線、又は、コンピューターを基礎とするシステム１００のさまざまな構成部分の間にある無線のインターネット回線から成る。ネットワーク１２０は、そこへ連結する装置の間の情報の通信を可能にし、ネットワーク１２０と連結するさまざまな構成部分の間の通信を行う。本件開示の実施例を使うことにより、例えば、ネットワーク１２０と接続しているコンピューター１５０，１６０、１７０のコンピューターシステムの使用者は、使用者に対応したアクセス特権に基づいて、ネットワーク１２０経由でアクセス可能なデータや情報にアクセスをすることができる。物理的本質や幾何学とは無関係に、ネットワーク１２０は、それらの物理的な近接とは関係なく、コンピューターを基盤としたシステム１００の物理的部品の相互接続を行う。本件開示の１つまたは１以上の実施例では、データサーバ１９０とコンピュータ１５０、１６０、１７０は互いに地理的に遠く、物理的に分離することが想定されている。

ここで開示された実施例において、コンピューター１５０，１６０、１７０は、ここに記載されているコンピューターを基盤としたシステム１００に使えるような設定が可能である、技術に熟練している当業者によく知られているどのようなタイプのコンピューターであってもよい。この中には、ノートパソコン、卓上用コンピューター、タブレットコンピューター、ペンを基礎としたコンピューター、及びそれらに類似するものが含まれる。コンピューター１５０，１６０、１７０は最も好ましくは、ルミナックスを基盤とするコンピューター、ＰＣを基盤とするコンピューター、マッキントッシュを基盤とするコンピューターのように市場で入手できるものである。しかしながら、当該技術に熟練している当業者が期待するように、従来の「メインフレーム」コンピュータか、多数の使用者が利用する計算装置か、パーソナルコンピュータやワークステーションのような単独使用のコンピューターか、どうかに関らず、本件開示の方法と装置では、どのコンピューターやコンピューターシステムも同じように利用することができる。

さらに、手の中に納まる又は手の平に乗る装置は、コンピューター１５０，１６０、１７０のように展開（配置）することが可能な装置の例としてあげられる。どのようなオペレーションシステムやハードウェア・プラットフォームにも応用可能で、沢山の異なるハードウェアやソフトフェアを基礎とするコンピュータ１５０，１６０、１７０へ展開（配置）する設定が可能なことは明白である。当該技術に熟練している当業者によく知られている様々なハードウェアー部品とソフトウェアー部品（表示せず）がコンピューター１５０，１６０、１７０として使用可能である。

コンピューター１５０，１６０と１７０と共にデータ・サーバ１９０は、いくつか又は全てがネットワーク１２０を経由して共有可能なデータの記憶や読み出しに都合よく設定されている。外部接続モニター、キーボード、マウス、タブレット、ハードディスク装置、録音可能なCD-ROM/DVD装置、ジュークボックス、ファックス・サーバ、磁気テープ、当該技術に熟練している当業者によく知られている他の装置のような各種のハードウェアー部品（図示せず）が、データ・サーバ１９０とコンピューター１５０,１６０と１７０と共に使用可能である。

少なくとも１つの実施例の中で、データ・サーバ１９０は、データベース・サービス、ウェッブ・サーバ、ファイアーウォール、セキュリティ・ソフトウェアー又は同様のもの等の各種の追加ソフトウェア部品（図示せず）を設定できる。ひとつのデータ・サーバ１９０が図１のネットワーク１２０と接続していることが示されているが、本件開示の実施例では、いくつものデータ・サーバ１９０を組み合わせ包含させられることは明らかである。各種のデータ・サービスは大きさ、複雑さや容量が多様であるが、しかしほとんどが一般的に本件開示の実施例と共にネットワーク１２０を経由してインデックス作成や情報の読み出しの設定が可能である。

一般に、本件開示の１つまたは１以上の実施例のデータ・サーバ１９０は、ネットワーク１２０を経由してコンピューター１５０、１６０、１７０の使用者によって後で取り出されるデータ・ファイルの蓄積を設定するネットワーク利用可能データ・サーバの代表である。代表的な処理は、データ・サーバ１９０または例えばその他のコンピューターであってデータ・サーバ１９０と論理的に接続されたコンピューターシステムなどに直接蓄積された情報へのリクエスト（認証確認、検索読み出し、アクセス、など）で代表される。情報へのリクエストには、声、テキスト、画像、その他あらゆるデジタル化された様々な態様のデータへのリクエストが含まれ、情報は現在知られている、もしくは今後、開発又は確認されるどのようなフォーマットでも蓄積する事ができる。

一般的に、本件開示の１つまたは１以上の実施例によれば、検索機器１８０はネットワークに基づくインデックス作成、と、データのインッデックス作成、検索クエリ（質問）の受領、ネットワーク１２０を経由して利用可能な１つまたは１以上のデータ・ファイル、その他、検索クエリが関与している別の適切に指定されたコンピューターへの返還をするための検索クエリ（質問）の処理が可能な検索装置として働くよう設定されたネットワークで利用可能なコンピュータ・システムを示す。典型的な処理は、データ・サーバ１９０又はその他のコンピューター又はデータ・サーバ１９０に論理的に接続されたコンピューターからの特定のキーワードまたはフレーズを含むファイルのリクエストに表れる。
データの読み出しリクエストには、声、テキスト、画像、その他あらゆるデジタル化された様々な態様のデータへの検索リクエストが含まれ、情報は現在知られている、もしくは今後、開発又は確認されるどのようなフォーマットでも蓄積する事ができる。

１つ以上の本件開示の実施例によれば、検索機器１８０はUDPクライアント／サーバ・モデルを介して自動的に設定する事が可能である。１つまたは１つ以上の実施例では、標準ウェブ・ブラウザを使ったウェブ・ページを表示可能にしたユーザインターフェイス（User Interface）を検索機器１８０の設定に使うことが可能である。

すくなくとも１つ以上の実施例に従えば、ＵＤＰクライアント／サーバ・モデルの使用、と、ネットワーク１２０への設定（すなわち初期設定）以前は、検索機器１８０はネットワーク１２０に物理的に接続している。より詳細には以下に記載されるが、ひとたび検索機器１８０がネットワーク１２０とつながると、検索機器１８０は検索機器１８０を設定するために、認証情報が含まれたメッセージを、ネットワーク１２０とUDP（User Datagram Protocol）を経由して電送する。検索機器１８０は本件開示の実施例によって一旦ネットワーク１２０上に設定されると、ネットワーク上で利用できる共有資源（リソース）を識別するのに使用可能であり、そして検索情報のサーチ保管場所とデータベースが維持される。サーチ・リクエストへの応答として、検索機器１８０はネットワーク上の情報を検索するのに検索データ・ベースを使用する。本件開示の一つの実施例では、検索結果は１つまたは一つ以上の記録機構によって記録されランク付けされる。

本件開示の１つまたは１以上の実施例に使用されるUDPクライアント／サーバ・モデルは、ネットワーク１２０の様なネットワークにネットワーク装置を組み込む時に現れる問題に対処している。それは、ネットワーク１２０内に検索機器１８０の様なネットワーク機器を設定する時、ネットワーク網である例えば、TCP/IP イーサーネット網のための装置を設定する必要がある。例えば、TCP/IPネットワーク環境下では、展開されたネットワーク内のTCP/IP上で作動させるためには検索機器のためのIPアドレスとサブネット・マスクを確立しなければならない。

手動設定の取り組みも可能であり、例えば、検索機器１８０のネットワーク・パラメタを手動で設定する。手動設定によるアプローチ（取り組み）は、ネットワーク設定条件（ニーズ）に関するかなり洗礼された知識を要すると考えられる。したがって、自動でネットワーク１２０のための検索機器１８０の設定ができることは有益である。

本件開示の実施例で使用可能なもう１つのアプローチは、IPセッティグを入手するためのBOOTPの使用を含むか、または DHCPの取り替えや囲い込みによる検索機器１８０の設定である。本件開示の１つまたは１以上の実施例によれば、検索機器１８０はこれらの内のどれか１つ、または１つ又はそれ以上の組み合わせにより設定される。

本件開示の１つまたは１以上の実施例で使うことができるUDPクライアント／サーバ・モデルを使っての自動設定に関し、ネットワーク１２０内の通信のための有効なＩＰセティングの確認である検索機器１８０の設定は、自動または手動のユーザー介入により可能である。言い換えると、検索機器１８０のようなネットワーク装置が、最初に、ネットワーク１２０のような実在ネットワークに、すでに存在しているサブネットの中に存在しているという予備知識なしに接続されている時は、このアプローチは検索機器１８０とデータ・サーバ１９０の間の最初の通信を成立させる能力を提供する。

１つまたは１以上の実施例によれば、UDPクライアント／サーバ・モデルは、
検索機器１８０では必要な、例えば、TCP/IPアドレスのようなTCP/IPセッティングを設定すること無しに、例えば、ネットワーク１９０や検索機器１８０のようなネットワーク装置の間の通信に使用することができるセットのコネクションレス（無接続）のUDP放送メッセージの使用を考慮（contemplates）する。クライアント／サーバ・モデルはUDPに関して説明されているが、他のプロトコールを使うことが可能なのは明白である。さらに、検索機器１８０と通信するのに使われるセットのメッセージが通信プロトコールと規定されて説明されているが、他のメッセージ形式をUDPを介して検索機器１８０または他のネットワーク・プロトコールと通信するのに使うことができるのは明白である。

検索機器１８０を設定するための本件開示の１つまたは１以上の実施例に使われた実例となるセットのメッセージ形式が以下に説明され開示されている。コミュニケーション・プロトコルはUDPクライアント／サーバ・モデルを実装するのに使われるメッセージの構造を明確にする。さらに、例はUDPクライアント／サーバ・モデルを使った最終ユーザーのネットワークの設定を説明するのに提供されている。

クライアント／サーバ・モデルに簡単なプロトコルであるatop UDPを実装することは、BOOTPまたはDHCPサーバがネットワークの構成要素として存在していようとなかろうとネットワーク装置の設定に便利な解決策であることは明らかである。

本件開示のUDPクライアント／サーバ・モデルによれば、メッセージはUDPクライアントとサーバの間で通信可能である。より詳細には、メッセージ形式は、UDPクライアントである例えばデータ・サーバ１９０のようなネットワーク化された装置から、１つまたは１以上のUDPサーバである例えば、検索機器１８０に対するコマンド（命令）という形で表わされる。典型的なコマンド（命令）は、UDPクライアントから１つまたは１以上のUDPサーバのリッスンオン（listening on＝問合せ）専用ポートに送られたメッセージから成る。返信にあっては、返答用メッセージは１つまたは１以上のUDPサーバからUDPクライアントへの返送される独自の専用ポートへのリッスンオン（listening on＝問合せ）に対するメッセージの形であってもよい。遠隔操作の処理要求と違い、UDP限定送信（放送）の形式のメッセージでは、無接続なのでステートがない。意図したメッセージの受取人がメッセージを受け取る保証はない。メッセージはネットワーク区分のすべての装置に送信（放送）されている。本件開示の１つまたは１以上の実施例のUDPクライアント／サーバ・モデルと共に使うことが可能なメッセージや命令の例が図２に表示されている。

図２Ａから２Ｈからなる図２では、本件開示の１つまたは１以上の実施例において使われるクライアント／サーバ・モデルメッセージ形式の例が図示されている。図２Ａを参照すると、第一命令であるPOLメッセージはUDPクライアントであるデータ・サーバ１９０から、ネットワークまたはネットワーク区分内のすべてのUDPサーバである例えば検索機器１８０を確認するために発せられる。POLメッセージを受信するUDPサーバはPLRメッセージと共に返答が可能である。PLRメッセージと共に提供される情報確認を使って、メッセージによって特定された作業を一つの検索機器１８０に実行させる追加メッセージを特定の検索機器１８０に送る事ができる。UDPクライアントによって供給されるであろう他のメッセージの例として、GETメッセージ、特定のUDPサーバである特定の検索機器１８０からのIP情報の要求がある。意図（指定）されたUDPサーバは要求された情報が含まれるGTRメッセージを使って返答する事が可能である。

UDPクライアントによって発せられうる他のメッセージであるSETメッセージは、受取人UDPサーバにそのIPステートのセットを要求する。意図（指定）されたUDPサーバは、”成功や失敗”のような要求された作業の結果を表示するSTRメッセージを返答することができる。RESメッセージは、機器の再起動を伴うステートのリセットをするリセット作業の開始を特定の検索機器１８０に指示するため、UDPクライアントにより発せられる。個々のメッセージ形式の詳しい詳細が以下に記載される。

この中に説明されているメッセージ形式に使われるシンタックスの１つの例によれば、個々のメッセージは５１２バイトよりは大きくない。上記略述したこれらの７タイプのメッセージの中で４つのメッセージは、検索機器１８０によって実行される作業を始めるために、UDPサーバである例えばネットワーク・サーバ１９０からUDPクライアントである例えば検索機器１８０に送られる。上記特定された残りのメッセージの形式は検索機器１８０によって、返答としてUDPクライアントに送られる。個々のメッセージ・ボディ（body）はMACアドレスフィールドを介して送り主を確認する。UDPクライアントによって送られたPOLメッセージは問い合わせ（listening）しているであろうすべてのUDPサーバを意味する。残りのメッセージ形式はメッセージ（body）内のMACアドレスで確認された特定の受取人を意図（指定）している。

図２Ｂから２Ｈは、本件開示の１つまたは１以上の実施例に使われるメッセージのフォーマットの例を提供する。勿論、ここで述べられているフィールド（領域）のさまざまな長さを含むその他のフォーマットが、本件で開示した実施例で使用するネットワーク装置の認証の請求に使用できるのはもちろん明らかである。

図２Ｂを参照すると、例えば、本件開示の１つまたは１以上の実施例に使用されるポーリング（集計）メッセージのフォーマットの例が提供されている。例えばPOLのようなポーリング（集計）メッセージは、実在するネットワーク装置の同一性を要求するネットワークのそれぞれの検索機器１８０である例えば送信（放送）メッセージに、ブートストラップ・クライアントによって送られる。メッセージはネットワークまたはその一部に接続されているネットワーク機器１８０の同一性を要求する。少なくとも１つの実施例によれば、メッセージは、メッセージ・プロトコルのバージョンを確認するフィールド２１０と、メッセージ形式を確認するフィールド２１１と、ブートストラップ・クライアントのＭＡＣアドレスを確認するフィールド２１２と、から成る。この実施例では、フィールド２１０、２１１、２１２は、長さによりそれぞれ、１バイト、３バイト、６バイトとなる。

図２Ｃは、開示された１つまたは１以上の実施例に従ってポーリング・メッセージに応答として送られるポーリング（集計）の返答メッセージの例を提供する。ポーリングの返答メッセージ、PLRは検索機器１８０によって、POLメッセージに応じてブートストラップ・クライアントに送られる。POLメッセージに応じて、検索機器１８０はそのMACアドレスと、オプションとしてホスト名をPLRメッセージの返答として送る事ができる。図２Ｃに表示されたPLRメッセージのフォーマットは、プロトコルバージョンを確認するフィールド２１０と、メッセージ形式を確認するフィールド２１１、顧客のＭＡＣアドレスを確認するフィールド２１２と、応答している検索機器１８０のＭＡＣアドレスを確認する２１３と、応答している検索機器１８０のホスト名を確認するフィールド２１４とからなる。この実施例では、フィールド２１０，２１１，２１２と２１３は、長さによりそれぞれ、１バイト、３バイト、６バイトとなる。フィールド２１４は、ゼロから２５０バイトの範囲内でバイトの長さが変化する。

PLRメッセージ内に受け取ったMACアドレス情報を使って、ブートストラップ・クライアントは、機器から追加情報を得るために検索機器１８０の特定例にアクセスできる。GETメッセージは、ブートストラップ・クライアントによって検索機器１８０からの情報を要求するために、最新の機器のネットワーク設定（例えば機器のネットワーク（ＩＰ）アドレス）のように送られる。GETメッセージには、認証情報である、例えば、識別名、パスワードや検索機器１８０が要求者の認証に使うことができるその他の認証情報（例えばブートストラップ・クライアント）が含まれる。

図２Ｄは開示された１つまたは１以上の実施例に使われるGETメッセジフォーマットの例を提供する。フィールド２１０ではプロトコール・バージョンを確認し、フィールド２１１はメッセージ形式を確認し、フィールド２１２にはブートストラップ・クライアントのMACアドレスを含み、フィールド２１３は応答する検索機器１８０のＭＡＣアドレスを含む。また、フィールド２１５には検索機器１８０への要求者（例、ブートストラップ・クライアント）の認証に使われる認証情報（例えば、識別名、パスワードと、またはその他の認証情報）が含まれる。この実施例によれば、フィールド２１０，２１１，２１２と２１３は長さによりそれぞれ、１バイト、３バイト、６バイトと６バイトになる。フィールド２１５は、ゼロから２５５バイトまでのバイトの長さで変化する。

検索機器１８０がブートストラップ・クライアントから受け取ったGETメッセージの応答を送る場合、応答は図２Ｅで表示されるフォーマットをしたGTRメッセージの形となる。検索機器１８０がGETメッセージを受け取った時、GETメッセージ内に含まれる認証情報は要求者の認証に使うことが可能である。もし検索機器１８０がGETメッセージに応答すると決定するとすれば、検索機器１８０がGTRメッセージを送る前に、検索機器１８０はGETメッセージ内の認証情報を使う要求者を認証する。GTRメッセージは現行のIPアドレスと検索機器１８０のサブネット・マスクに戻る。ゲートウェー設定はHTTPインターフェースを介してその後に実行される。

図２Ｅに表示のGTRメッセージのフォーマットは、プロトコルバージョンを確認するフィールド２１０と、メッセージ形式を確認するフィールド２１１と、ブートストラップ・クライアントのMACアドレスを確認する２１２と、応答している検索機器１８０のMACアドレスを確認する２１３と、検索機器１８０のサブ・マスクとIPアドレスを確認するフィールド２２１および２２２と、DHCPフラッグからなるフィールド２２３と、からなる。１つまたは１以上の実施例によれば、DHCPフラッグは、検索機器１８０がDHCPを使うために設定されたか（例、”0x01” の値）または、例えば、検索機器１８０がDHCPサーバからアドレスを上手く借りたか（例、”0x02” の値）のどちらかを示す。この実施例によれば、フィールド２１０，２１１，２１２，２１３，２２１，２２２と２２３はそれぞれ、１バイト、３バイト、６バイト、６バイト、４バイト、４バイトと１バイトの長さになる。

検索機器１８０からネットワーク情報の受領に対応して、ブートストラップ・クライアントはそのIPセッティングを設定する命令を機器に送ることができる。ＳＥＴメッセージはブートストラップ・クライアントによってそのＩＰアドレスとサブネット・マスクを設定するため検索機器１８０に、認証情報と共に送られる。図２Ｆは本件開示の１つまたは１以上の実施例と共に使われるＳＥＴメッセージの例を提供する。フィールド２１０はプロトコルバージョンを確認し、フィールド２１１はメッセージ形式を確認し、フィールド２１２はブートストラップ・クライアントのMACアドレスを含み、フィールド２１３は応答している検索機器１８０のMACアドレスを含む、フィールド２１５には検索機器１８０への要求者（例えば、ブートストラップ・クライアント）の認証に使われる認証情報（例えば、識別名、パスワードと、またはその他の認証情報）が含まれる。フィールド２２１と２２２には、そのネットワークセッティングを設定する検索機器１８０によって使われるネットワーク・アドレス情報（例えば、ＩＰアドレスとサブネット・マスク）が含まれる。この実施例によると、フィールド２１０，２１１，２１２と２１３はそれぞれ、１バイト、３バイト、６バイトと６バイトの長さである。フィールド２１５はゼロから２５５バイトの範囲内でバイトの長さ変化する。フィールド２２１と２２２の長さは４バイトである。

検索機器１８０は、SETオペレーションの結果または状態を示すSTRメッセージのようなSETメッセージに対する返答を送ることができる。例として、結果は成功（例、返答コードはノン-ゼロ＝０でないとなる）または失敗（例、返答暗号は０となる）として示される。STRメッセージは状態のより詳細を記述した更なる情報を含むことができる。例として、STRメッセージは失敗という作業結果を記述することができる。

図2Ｇは１つまたは１以上の実施例に従った設定作業（例、セットとリセット作業）の結果を示すメッセージの例としてSTRメッセージを提供する。フィールド２１０はプロトコル・バージョンを表し、フィールド２１１はメッセージ形式を表しており、フィールド２１２はブートストラップ・クライアントのMACアドレスを含み、フィールド２１３は応答している検索機器１８０のMACアドレスを含む、フィールド２２０は作業の“状態のコード”を表し、そしてフィールド２１７は更に設定作業の成功または失敗を記述したメッセージを含む。この実施例に従って、フィールド２１０，２１１，２１２、２１３と２２０はそれぞれ、１バイト、３バイト、６バイト、６バイトと１バイトの大きさである。フィールド２１７はゼロから２５５バイトの範囲内でバイトの大きさが変化しやすい。この実施例によれば、フィールド２１０，２１１，２１２と２１３は長さによりそれぞれ、１バイト、３バイト、６バイト、６バイトと１バイトになる。フィールド２１７は、ゼロから２５５バイトまでのバイトの長さで変化する。

１つまたは１以上の実施例によれば、RESメッセージは検索機器１８０の状態をリセットするのに使うことができる。RESメッセージは検索機器１８０がその初期設定である、例えば工場出荷の初期設定にリセットすることを要求する。図２Ｈは１つまたは１以上の実施例において検索機器１８０をリセットするメッセージ例であるRESを提供する。

フィールド２１０のRESメッセージはプロトコル・バージョンを表示し、フィールド２１１はメッセージ形式を表示しており、フィールド２１２はブートストラップ・クライエントのMACアドレスを含み、フィールド２１３は応答している検索機器１８０のMACアドレスを含んでいる。この実施例では、フィールド２１０，２１１，２１２と２１３はそれぞれ、１バイト、３バイト、６バイトと６バイトの長さである。

本件開示の１つまたは１以上の実施例によれば、検索機器１８０の個々の例はUDPサーバを連続的に稼動し、ネットワークで稼動するDHCPサーバによってリースされたIPアドレスを許容するために工場内に設定することが考慮されていた。仮に、DHCPサーバがネットワーク内に存在しなかった場合、ここで開示された実施例では、検索機器１８０のTCP/IP設定が、上記のUDPクライエント／サーバ・モデルを使って、検索機器１８０内で実行されるUDPサーバによって受領される命令を介して使用することが可能である。

１つまたは１以上の実施例によれば、ここで記述されているUDPクライエント／サーバ・モデルは：（ｉ）ネットワークである例えばネットワーク１２０に接続している全ての検索機器１８０を認識し（ｉｉ）特定の検索機器１８０のサブネット・マスクとIPアドレスを発見し、そして／または（ｉｉｉ）特定された検索機器１８０のサブネット・マスクとＩＰアドレスを発見した通りに設定する。末端ユーザが遭遇するいくつかのシナリオの例と、取れる行動は以下に分類される。

シナリオの１つとしては、検索機器１８０をDHCPサーバを含むネットワーク内で立ち上げる。この場合、検索機器１８０はDHCPサーバから有効なIPアドレスを得て、検索機器１８０のネットワークのセットアップはこの中で記述されているUDPクライエント/サーバ・モデル無しで完成させることができる。以下は他の方法の中で、ネットワークがDHCPサーバを含む場合にユーザが利用可能なものである。例えば、末端ユーザはいかなる行動も取る必要はない。あるいは、行動を取ることを望むならば、UDPクライエント／サーバ・ブートストラップ・クライエントはネットワークに接続された検索機器１８０を発見するためにネットワークを操作することが可能である。例えば、DHCPサーバによって提供されるIP設定の取得、又は、IP設定を他の静的なIPアドレスに変更である。

もう１つのシナリオとしては、検索機器１８０をDHCPサーバの含まれないネットワーク内で立ち上げる。この場合、検索機器１８０は、例えばUDPサーバからくるUDPクライエント／サーバ・モデルのSET命令を使用して、IPアドレスとサブネット・マスクが設定されるのを待つ。この場合、末端ユーザは、ネットワーク装置であるデータ・サーバ１９０のUDPブートストラップ・クライエントに装備されているプログラム・コードを実行してネットワーク内に機器を設定する。UDPブートストラップ・クライエントは上述のように１つまたは１以上の検索機器１８０を発見するため、そして／または、ネットワーク通信用の検索機器１８０を設定するためのIPアドレスとサブネット・マスクとを設定する命令を出すために検索機器１８０と通信する。

ネットワークのセットアップが上手く完成した後はいつでも、UDPブートストラップ・クライエントは検索機器１８０の１つまたは１以上の実例の発見を実行できる。例ば、ブートストラップ・クライエントは、検索機器１８０の１または１以上の実例のIPアドレスとサブネット・マスクを得るため、IPアドレスと検索機器１８０の１つまたは１以上の実例をスタティック・バリューにリセットするため、または、検索機器１８０の１つまたは１以上の実例を初期（工場）設定にリセットするために使用される。

再び図1を参照すると、図1では少数のコンピューター１５０，１６０、１７０がネットワーク１２０に接続しているに過ぎないが、同時に、ダズンまたは数百さらには数千の類似に設定されたコンピューター１５０、１６０、１７０が検索機器１８０の実例を使ってインデックス付けされて検索される事が予期されていることは明らかである。１または１以上の本件開示の実施例によれば、マルチチプル・コンピューター１５０，１６０、１７０は検索機器１８０および１または１以上のデータ・サーバ１９０とネットワーク１２０を介して相互に通信可能に設定することができる。

検索機器１８０を使用することにより、コンピューター１５０，１６０、１７０のようなコンピューターの使用者は、例えばデータ・サーバ１９０から所望のデータ・ファイルを探し当て、読み出す検索要求を開始することができ、検索要求は検索機器１８０によって受領されて、処理される。受け取った要求に対する返答として、もし適切であれば、検索機器１８０は要求者に要求されたデータ・ファイルへのアクセスを提供できる。上述のように、１または１以上の実施例と検索機器１８０の使用によって、例えば、コンピューター１５０，１６０、１７０の一つの使用者は、データ・サーバ１９０ばかりでなく、その他どのコンピューター、または検索機器１８０を使用してインデックス付けされたネットワーク１２０と結合されたコンピュータ・システムからもこの形態の情報を要求し、読み出すことができる。検索機器１８０を使って、検索要求の提出、検索の結果のレヴュー、ローカル共有リソースに配置されたデータ量のインデックス作成、遠隔地からネットワーク１２０への接続、インターネットとインターネットとのトラバース、ができる。本件開示の実施例にはいくつかの典型的アプリケーションが使われているのに加えて、本件の開示は、電子発見とコンピューター・フォレンジックを例として含むその他の検索アプリケーションに使用することが予期できる。

図３を参照すると、本件開示の１つまたは１以上の実施例による検索機器１８０の内部アーキテクチャの１例を図解するブロック図形が提示されている。検索機器１８０はサーバ、ファイヤ・ウォール、包括的セキュリティ・ソフトウェアー、および同種のものなど（図示せず）の多様な追加ソフト・ウェアが設定可能である。今現在の利用可能なコンピュータ・システムの到達水準枠内での相対的な優位を前提とすると、検索機器１８０の機能は、少なくとも本件開示の１つまたは１以上の実施例を設定したすでに利用可能なコンピューティング装置およびシステムにおいて多数スタンダードとして提供される事は予期できる。

検索機器１８０は、システム・バス３６０を経由して相互に連結される少なくとも１つの中央処理装置（ＣＰＵ）またはプロセッサー３１０、メインメモリ３２０、メモリ・コントローラ３３０、補足記憶装置３４０、そしてターミナル・インターフェイス３５０によって構成される。
様々な改良、追加または削除である例えば、キャッシュ・メモリーの追加や周囲機器の追加が本件開示範囲内で、図３に図解されている検索機器１８０について行うことができる事は明白である。図３は全てを網羅する例のとして作られたものではなく、図解を目的とした表示である。

プロセッサ３１０は、コンピューターの操作と検索機器１８０の操作機能を行い、適切な中央処理装置（CPU）を構成する。プロセッサ３１０はマイクロプロセッサーのような単一の集積回路を構成し、または、適当数の集積回路機器そして／または、プロセッサの機能を完成させるべく協力して作業をする回路盤を構成する。プロセッサ３１０はメインンメモリ３２０内に含まれる１または１以上のソフトウェア・プログラムをうまく実行する。

補助記憶装置３４０は検索機器１８０に外付けされる外部記憶装置３７０のような、補助記憶装置、磁気のディスク・ドライブ（例えばハード・ディスクまたはフロッピ（登録商標）・ディスク）、または光学式記憶機器（例えばCD-ROM）からの情報を保存または読み出しをさせる。記憶（ストレージ）機器の１つの例として、直接アクセス記憶装置（DASD）３８０がある。図３に表示するように、DASD３８０はフロッピ（登録商標）・ディスク３９０からデータとプログラムを読み取ることができるフロッピ（登録商標）・ディスク・ドライブとなりえる。

補助記憶装置３４０は、外付けされる外部記憶装置３７０のような、補助記憶装置、磁気のディスク・ドライブ（例えばハード・ディスクまたはフロッピ（登録商標）・ディスク）、または光学式記憶機器（例えばCD-ROM）であって、検索機器１８０に情報を保存または読み出しさせる。記憶（ストレージ）機器の１つの例が直接アクセス記憶装置（DASD）３８０である。図３に表示するように、DASD３８０はフロッピ（登録商標）・ディスク３９０からデータとプログラムを読み取ることができるフロッピ（登録商標）・ディスク・ドライブとなりえる。

本件の開示では十分に機能するコンピュータ・システムが文脈の中で述べられているが、当業者は、本件開示の様々なソフトウェア構成が様々な形式の１または１以上のプログラム製品としてシグナル・ベアリング・メディア（信号を帯有する媒体）とともに流通配布される可能性があることが予知でき、また、本件開示の実施例は、特定のタイプまたはシグナル・ベアリング・メディアの配置に関係なく平均的に採用され現実に配布が実行されることが予期される。シグナル・ベアリング・メディアの例としては、CD ROMSやフロッピ（登録商標）ディスク（例；３９０）のような記憶可能型メディア、デジタル、アナログ通信リンクのような、無線式通信リンクを含む伝達タイプ・メディアを含む。

メモリ・コントローラ３３０は、プロセッサ３１０から切り離された補助プロセッサ（図示せず）の使用を通じて、要求された情報をメイン・メモリ３２０および／または補助記憶装置３４０からプロセッサ３１０に動かすことの責任を負う。
説明の都合で、メモリ・コントローラ３３０は単独の存在として表示される；実際には、本件技術の当業者は、メモリ・コントローラ３３０によって提供される機能の一部は、プロセッサ３１０、メイン・メモリ３２０、および／または補助記憶装置３４０に付いている回路の中に存在する事を理解している。

末端のインターフェイス３５０は通常は個別のワークステーション、または図１のコンピューター・システム１７０の様なスタンド・アローン・コンピューターを介して、使用者、システム管理者、コンピューター・プログラマーに検索機器１８０と通信する事を許可している。図３で描かれた検索機器１８０は単一のメイン・プロセッサー３１０と単一のメイン・システム・バス３６０を含んでいるが、本件開示はマルチ・プロセッサーとマルチ・バスを内蔵するコンピューター・システムにも等しく利用されることは明らかである。同様に、本件開示の１または１以上の実施例のシステム・バス３６０は典型的なハード・ワイヤー（コンピュータ組み込み）のマルチ・ドロップ・バスであるが、コンピュータ関連の環境内で双方向性通信をサポートするどのような結合手段にでも使用することができる。

メイン・メモリ３２０は、オペレーティング・システム３２１、ユーザ・インターフェイス３２２、データベース管理システム３２３と共に、インデックス機構３２４、サーチ機構３２５、レポート機構３２６、スコア機構３２７とセキュリティ機構３２８の様な本件開示の実施例との関係で記述され機能的に実装されるプログラム・コードを含むことが望ましい。この中で使われる“メモリ”という用語は、検索機器１８０の仮想の記憶スペース内のいかなるストレージ・ロケーションを示す。メイン・メモリ３２０は図示されたすべての部品のすべてのパーツを必ずしも含んでいる必要はないことは理解される。例として、オペレーション・システム３２１の一部はプロセッサ３１０を実行するためにインストラクション・キャッシュ（図示せず）内に入れることができ、その他のファイルは磁気または光学ディスク・ストレージ装置（図示せず）に保管する事ができる。加えて、ユーザ・インターフェイス３２２、データベース３２３、インデックス機構３２４、サーチ機構３２５、レポート機構３２６、スコア機構３２７とセキュリティ機構３２８はオペレーション・システム３２１として同じメモリ・ロケーションに存在するように表示されるが、メイン・メモリ３２０は多数の異なるメモリー・ロケーションから成ることができることを理解されるべきである。

データベース管理システム３２３は、データ・モデル、概要、定義、および、本件開示の１または１以上の実施例との関連で記載されたようなデータ・モデルによって保管されたデータを使用または実装することができるリレーショナル・データベース管理システムとすることが可能である。データベース管理システム３２３を使って保管されたデータは、データベース管理システム３２３を使って保管されているデータに行われた更新によって、各クエリごとに変更可能である。１または１以上の実施例によれば、メイン・メモリ３２０内に表示されているいくらか又は全ての個々の構成要素は、スタンド・アローン・プログラム製品として多くの形に結合され又は分配することができることも注目されるべきである。最後に、検索機器１８０は追加構成要素（図示せず）を含むことができる。

例えば、必須ではいないが、本件開示の実施例には検索機器１８０によって検索されるデータ・ファイルへの使用者のアクセスを確認し許可するためのセキュリティー機構３２８が含まれている。セキュリティー機構３２８は１または１以上の開示実施例において、オペレーション・システム３２１の中に組み込むことが可能である。１または１以上の実施例では、データベース３２３内に保管された情報の量や形によって、セキュリティー機構３２８は図１のコンピュータ１５０，１６０と１７０とデータ・サーバ１９０用のそれぞれの段階におけるセキュリティおよび／または暗号化を提供するように設定をすることができる。

更に、セキュリティー機構３２８によって適用されるセキュリティー手段のレベルと形式は、請求される検索および／または要求された検索への応答の性質および要求者の識別（情報）によって決めることができる。本件開示のいくつかの実施例の中のセキュリティー機構３２８には、ハード・ウェア・ファイアーウォール、ルータ、スイッチャ、ドングル、その他、のようなハードウェア部品に関するものが含まれるか又は実装されている。

少なくとも１つの実施例によれば、オペレーション・システム３２１は検索機器１８０の作動および／または操作に使われるソフト・ウェアを含む。通常は、プロセッサ３１０はオペレーティング・システム３２１を実行する。オペレーティング・システム３２１は単一のプログラムであるか又はどちらか一方がオペレーティング・システムの機能を協力して実行するマルチ・プログラムのコレクションである。現在本件技術の当業者に知られているか又は今後において開発・確認されるいかなるオペレーティング・システムも本件開示の１または１以上の実施例によって使用する事ができる。

ユーザー・インターフェイス３２２は他の形をとる事も可能であるが、ここでは画面表示可能なウェッブ・ページからなり、ここで確認された１つのブラウジンク゛・ソフトウェア・アプリケーションを使って、検索機器１８０に結合したモニタに画面に表示される、および／またはコンピュータ・システム１５０，１６０、１７０のようにネットワーク１２０を介して検索機器１８０に接続されたコンピューターと結合したモニターに表示される。ユーザー・インターフェイス３２２はメモリー３２０内に表示されたインデックス機構３２４、サーチ機構３２５、リポート機構３２６、スコア機構３２７とセキュリティー機構３２８を含む様々な構成要素を設定する事が可能である。

データベース管理システム３２３は、現在、本件技術の当業者に知られているか又は今後において開発・確認される適切なデータベースの代表である。本件開示の１または１以上の実施例において、データベース管理システム３２３はリレーショナル・データベースであり、データベース管理システム３２３はデータベースに保管されているデータを操作（例；創作、更新、照会等）するためにストラクチャード・クエリ・ランゲージ（SQL ＝Structured Query Language）を使う。データベース管理システム３２３がメイン・メモリ３２０内に存在することが表示されている間は、データベース管理システム３２３がメイン・メモリ３２０以外の場所に物理的に記憶する事ができることは明らかである。例えば、データベース管理システム３２３は外部記憶装置３７０またはDASD３８０に記憶可能であり、補助記憶I/F３４０を介して検索機器１８０に結合する。本件開示の１つまたは１以上の実施例では、データベース３２３は含まれている内容のためのキーワードを持つことができ、イントラネットまたはインターネットを介してアクセス可能である。１または１以上の実施例によれば、データベース管理システム３２３はコンピューター・システムや多くの異なるコンピューターに保管された本質的に異なる様々なデータベースで構成される。

図２の中には表示されてないが、すくなくとも１つの実施例によれば、検索機器１８０は、ネットワーク１２０へ接続するためのネットワーク・インターフェイスとともにネットワーク１２０を介して通信するのに必要なネットワーク・プロトコルを含んでいる。例として、開示された１または１以上の実施例では、検索機器１８０はトランスミション・制御・プロトコル／インターネット・プロトコル（TCP/IP／Transmission Control Protocol/Internet Protocol）として典型的に言及されるプロトコル・スートを含む。

インデックス機構３２４は、様々な形の情報を分類するため、および、データ・サービス１９０のようなネットワーク１２０上の情報を検索して読み出すことに共同で使用されるインデックスの作成のための、設定可能なインデックス器具である。インデックス機構３２４は、インデックスされるデータの特定の形式によって、プログラムまたは使用者の介入の様々なレベルに応じて手動で設定が可能である。インデックス機構は頭文字インデックスを行う事ができ、使用者の特定した間隔でデータベース３２３内に含まれるデータ・ファイルを再インデックスできるように設定することが可能であり、そのインデックスはデータベース３２３の内容を容易に検索するのに使うことが可能である。

サーチ機構３２５は、データベース３２３から情報を検索して読み出すユーザ・インターフェイス３２２のようなグラフィカル・ユーザ・インターフェイスを介してアスセス可能となるウェッブ・ベースのソフトウェア・アプリケーションを含む。本件開示の１または１以上の実施例において、例えばサーチ機構３２５は、インデックス機構３２４、インデックス３２９、スコア機構３２７とリポート機構３２６のような検索機器１８０の他の構成要素とともに、自然言語プロセッサ（Natural Language Processor ＝NLP）ベースの検索エンジンとを含み、希望した内容を検索して読み出す確固たる検索道具として使うことが可能である。

一般的に、図１のコンピューター１５０，１６０と１７０の使用者は、サファリ、ファイヤー・フォックス、ネットスケイプ、インターネット・エックスプローラ等の標準ウェッブ・ブラウザを経由してサーチ機構３２５にアクセスすることができる。
１または１以上の実施例で、使用者は、サーチ機構３２５を使って情報を要求でき、データベース３２３内に保管されている情報へのインターフェイスとして利用することができる。
データベース３２３に含まれる情報に関する様々な報告は、検索結果を表示するためのブラウザ・ベイスト使用者インターフェイスを含むリポート機構３２６によって作成されることが期待されている。

リポート機構３２６は、検索機構３２５を経由してデータベース３２３にアクセスして得られた結果のリポートを含む多様なリポートをについて、モニタにアウトプットを表示するか、又は、ハードコピーとして提供することができる。これらの報告には、図１のコンピューター・システム１７０のようなコンピュータの使用者によって実行された様々な検索の結果が含まれる。
これらの様々な報告は使用者に要請された特定のタイプまたは使用者に返還される情報のタイプに基いてフォーマットされて使用者に提出される。
後述する図11は、本件開示の１つまたは１以上の実施例によって提供されたアウトプットの例を示す。

本件開示の実施例によれば、スコア機構３２７は使用者の検索要求またはクエリに応答してサーチ機構３２５によって得られる結果をスコア付け又はランク付けする設定ができる。スコア機構３２７では、第一に適切な結果を提示できるであろう方法で結果がランク付けられるように検索結果にスコア付けするため多数のスコア分析法が採用できる。本件開示の１つまたは１以上の実施例で、スコア機構３２７は使用者によって設定可能であり、与えた検索クエリに応答して検索結果が返って来た時に、使用者がどの特性または評価（スコア）要素（重み付け方法）を採用するかを決定することを可能にしている。

本発明の１実施例の中で、スコアリングメカニズム３２７は、オリジナル検索クエリの中に含まれたＮ個の固有の幹ワードの発生の頻度、又は全数に基づいた検索クエリから戻ってきた書類をスコアリングするスコアリングメカニズムからなる。Ｍ個の書類が戻ってきた場合は、下記に説明される方程式（１）は、ｍ番目の結果のスコアを決定するのに使用される方程式の一例を提供する。

ここで、Ｘ_ｉ ^（ｍ）は、ｍ番目の文書のｉ番目の幹ワードの発生する頻度である。
いくつかの条件下で、この“頻度重み付け”方程式は、文書内の一幹ワード以上の発生に対して特別な配慮を提供しないだろう。このスコアリング・スキームを使って、すべての幹ワードの頻度の総合が測定される。

図４Ａから４Ｄを含む図４は、本発明の１以上の実施例に従って使われるスコアリングの例を提供する。図４Ａのテーブル４００は、三つの書類を確認するカラム（列）４０６を含み、それぞれのカラム（列）は、４０７と４０８内に示された一番目と二番目の検索用語と一致する頻度総計を有しており、三つの書類それぞれのスコアはカラム（列）４０９とロウ（行）４０１から４０３に示される。

図４Ａを参照すると、スコアリング例は二つの固有の幹ワードを含む検索クエリを提供し、それらの中の２つの結果は同じスコアに帰還される。カラム（列）４０４？（４０６）は与えられた書類、すなわち、ｍの１、２または３、に相当し、ロウ（行）４０１から４０３の各自は与えられた幹ワードに対応する。カラム（列）４０５？（４０７）は、ｍ番目の書類の一番目の幹ワードの発生頻度を確認する。同様に、カラム（列）４０６？（４０８）は、ｍ番目の書類の二番目の幹ワードの発生頻度を確認する。カラム（列）４０７？（４０９）は、それぞれの幹ワードに関連する発生頻度に基づいたそれぞれの書類のランキングを提供し、ランキングは上記の公式（１）を使って計算することができる。

図４Ａで示したように、最初の結果と一致するロウ（行）４０１は、一番目の幹ワードの１０の発生を含み、二番目の結果と一致するロウ（行）４０２は、それぞれの２つの幹ワードの５の発生を含む。もし、関連性の測定がすべての幹ワードを通しての頻度の数の総数ならば、両方の書類は同じスコアのはずであり、また、検索結果は同じ関連性（妥当性）を持つ。しかしながら、少なくとも１つの実施例に従って、二番目の結果は最初の結果よりも妥当性があると考えるのが望ましい。なぜならそれは二番目の結果は最初の検索クエリで確認された幹ワードの両方が含まれるからである。このような１つの実施例に従って、スコアリングメカニズム３２７は同じ書類内の幹ワードの同時発生を考慮して、書類はより少ない幹ワードを含む他の書類より、関連性が高いと考える。

本件開示の実施例によれば、スコアリング・メカニズム３２７は１つの書類の中の幹ワード又は、多くのキーワードの発生を考慮した検索結果に対するスコアを測定する。そのような実施例に従って、スコアリングメカニズム３２７は頻度の結果、例えば、例として相関関係を数値化するためのＸ_ｉ ^（ｍ）を使用した結果に対するスコアを測定する。言い換えれば、１以上の実施例に従って、頻度の結果Ｘ_ｉ ^（ｍ）を導入することによって、同一書類内に現れる多数の幹ワード間の相互関係を計上することが可能になる。このアプローチは“強化頻度重み付け”（enhanced frequency weighting）としてこの中で言及されている。

少なくとも１つの実施例の“強化頻度重み付け”は、方程式（１）は、組み合わせ解析を用いて展開され、頻度の積とその前の項（階数）の積（in ever higher-order products）との組み合わせを、与えられた多数キーワード検索クエリの中の幹ワードの数に等しい階数（項）まで導入する。加えて、算出を維持するために、それぞれの積は、最初の項の大きさまでスケールされることができ、こうして、先行するそれぞれの項は展開される。これは、オリジナルスコアリング公式の適当な乗法、例えば上記方程式（１）のＳ_Ｎ ^（ｍ）の累乗によりそれぞれの結果を割ることによって、達成することができる。その結果は、書類内の幹ワード間の高次元の相関関係によって補正されたオリジナルスコアリング公式である。Ｎ個の固有の幹ワードを含むクエリに使用可能なそのような式の一例を下記に示す。

前述のように、方程式（１）により示されたオリジナルスコアリング公式をともなう。

上記方程式（２）は、また、下記の形式で記載できる。

方程式（２）および（３）で表された公式を使用する例は、与えられた検索クエリ中の異なる数のキーワードをスコアリングする妥当性の効果を実演するものとして提示される。ここで、Ｎ＝１ならば、スコアリング公式は図４Ａに示す結果をもたらす。従って、妥当性の決定は、それぞれのファイルの中の幹ワードの発生頻度、又は数である。言い換えれば；

しかしながら、Ｎ＝２の時、二つのキーワード検索に相当するため、スコアリンク公式は次のようになる。

図４Ｂは、本発明の少なくとも１つの実施例に従って、方程式（５）を使用した結果の実施例を提供する。図４Ｂのテーブル４２０は、三つの書類を確認するカラム（列）４０６を提供し、それぞれの文書はカラム（列）４０７および４０８に示される一番目と二番目の検索タームを有し、それぞれの三つの書類のスコアは、カラム（列）４０９およびロウ（行）４０１から４０３に示される。図４Ｂのテーブル４２０に示されるように、ｍ＝２に対応する結果、すなわちロウ（行）４０２、は、図４Ａのテーブル４００のロウ（行）４０２に示される結果よりさらに関連性が高くスコアされている。これは、オリジナルスコアリングアルゴリズムに訂正項が加わったためであり、ｍ＝２の書類が検索クエリに両方の幹ワードを含むことを計上した結果である。更なる説明として、次に述べる事はＮ＝３を有する例の提供であり、その結果は図４Ｃに描写されている。少なくとも１つの実施例に従って、Ｎ＝３の場合、スコアリング公式は次のようになる。

図５図は図５Ａと図５Ｂとからなり、本発明で開示された１またはそれ以上の典型的なケースのスコアリングの例があげられている。図５Ａにおいて、少なくとも１つの実施例における１、２、３、用語に関するスコアリングの例が示されている。上述したように、方程式（４）は、検索クエリが１つの検索、ステム（幹）、言葉（用語）からなる場合の結果をスコアするのに使用することが出来る。方程式（５）は、検索クエリが２つの用語からなる時のスコアリング技術を示している。方程式（５）は、書類中の幹タームの同時発生と無関係に第１と第２用語の発生頻度を合計する第１階数または部分と、書類中の用語の同時発生を調整する第２階数部分とからなる。検索の中で３つの用語が使用される場合は、図５の方程式（６）で示されるように、第３階数は書類の中で３つの用語のすべてが同時発生した場合の調整に使用される。方程式（６）では、第１階数部分は、書類内の３つの用語の各々の発生頻度の合計に相当し、幹タームの２または２以上の同時発生とは無関係である。この式の中の第２のタームは、書類内の３つの単語のペアの同時の発生についての訂正であり、また、第３のタームは、書類内の３つの単語すべての同時の発生についての訂正である。

図４Ｃのテーブル４３０では、カラム（列）４０６には５種類の書類が表示され、それぞれカラム（列）４０７から４０９までの第１、第２、第３の検索用語に対応する頻度計算が示されており、５種類の書類のそれぞれのスコアがカラム（列）４１０とロウ（行）４０１〜４０５とで表示されている。テーブル４３０で示すように、方程式（６）を使用して、３つの幹タームを全て含む書類は、ロウ（行）４０２でｍ＝２として表示され、同じ総計の発生頻度が集計される書類である方程式（１）により計算される例えばロウ（行）４０３、４０４に対応する書類より高くランク付けされる。ｍ＝３のロウ（行）４０３に対応する書類は、３つの幹タームの内の２つを含む書類で次にランク付けされる。

当該技術に熟練している当業者は、単に1つの幹タームを含む書類が必ずしも多数の幹タームを含む書類より常に低くスコアされたりランクされるとは限らないかもしれないことを認識するべきである。例えば、ｍ＝４のロウ（行）４０４に対応する書類が３つ用語の合計（計算）で１５ではなく３０だったとすると、それはｍ＝２の書類より関連性があると考えられるだろう。しかしながら、現在開示しているスコアリングの式によれば、キーワードの全体の頻度計算の合計が比較可能か若しくはある程度は比較可能なら、その書類から検索クエリからの多数のキーワードがみつかったときには関連性の増加を導き出している。

方程式（６）を使用して、もしテーブル４３０のｍ＝４に対応する書類が１５でなく３０の３つの用語の合計（計算）だったとすれば、それは、テーブル４３０のロウ（行）４０２のｍ−２の書類のランクがより高い地位を占めるであろう。したがって、方程式（６）は同じ書類に現われる多数のキーワードを積算するが、特定の状況では、偶然に大きな合計の計算が発生した場合、マッチングのより劣ったものについての関連性を強調し過ぎることになるかもしれない。

１またはそれ以上の実施例によって上記を適用する場合、Ｎ＞１の場合は、方程式（６）のスコアリングを変更することができる。より詳細には、Ａが固有の幹タームの最小基準値（threshold）数を表わすところで、調整可能な遮断数に４＜Ｎを導入することが可能である。書類に現われる固有の幹タームの数がＡ未満である場合は、書類のスコアは０にセットされる。その実施例によれば、基準値（threshold）数は、結果がＮ幹タームを横切る高い集計の発生頻度であって、幹ターム間の相関性がほとんどない状況にアドレスするのに使用することができる。そのような場合、基準値（threshold）はユーザに返された検索結果から結果を除去するべきかどうかを決めるために使用することができる。そのような実施例によれば、mth書類に現われる明確な（distinct）幹タームと等しいＱ１ｎによって、方程式（６）のスコアリングの式を図５Ｂで示される方程式（７）のように変更することができる。

一例として、図４Ｃのテーブル４３０で示されるＮ＝３のケースを再考する。図4Dのテーブル430は、テーブル430で示される5部の書類を表示するカラム（列）４０６を提供する。それぞれの書類には、第1、第2、第3の検索用語に関する頻度計算が４０７から４０９にそれぞれ示され、５部の書類のそれぞれのスコアがカラム（列）４１０のロウ（行）４０１〜４０５に示される。Ａ＝２のようにＡに選ばれものの計算されたスコアが図4Dのテーブル440に示されている。Ｑ_ｍ＝２とＱ_ｍ＝３が方程式（６）に当てはめられる。他の結果は、方程式（７）に基づいて、０のスコアとしてテーブル430に示されている。

スコアリングの決定に基準値（threshold）数を用いる実施例である、方程式(7)を使用すると、検索クエリの多数の幹タームの同時発生に基づいて書類の関連を識別することが可能である。現在開示されている１つまたは１以上の実施例によれば、他の基準は単独であるいは上述のスコアリング技術と結合して使用することができる。

現在開示されている１つまたは１以上の実施例では、ユーザは全ての又は色々の特徴のあるスコアリングメカニズム３２７を標準的頻度重視に制限されることなく及び／又は頻度補強（強調）重視によることなく選択することができる。

図3を再び参照すると、現在開示されてる１つまたは１以上の実施例では、検索機器１８０にキュリティ・メカニズム３２８を包含させることができる。
セキュリティ・メカニズム３２８は、捜索機器の本性または役割に基づいて、補強された検索結果を供給するセキュリティ・モデルを提供するように形成される。現在開示されている１つまたは１以上の実施例では、各ユーザがネットワーク上で本人確認を認証し検索機構３２５にアクセスするためのユーザＩＤおよびパスワードを持たなければならないセキュリティ・メカニズム３２８としてのログインモデルを採用している。セキュリティ・メカニズム３２８は以下により詳細に記述される。

インデックス３２９は、ネットワーク１２０によるアクセス可能なシェアに内容が変更されてインデックス・メカニズム３２４で構築されたインデックスを表わす。
コンピューター１５０，１６０，１７０のうちの1つのコンピューターのユーザからの指示で与えられた検索クエリに関連する内容を捜し当てるために、インデックス３２９は検索メカニズム３２５によって使用される。インデックス３２９は、ネットワーク１２０によるアクセス可能なシェアに対するどんな内容の変更も正確に反映するように形成可能な間隔で定期的に再構築することができる。

インデックス３２９はデータベースの管理システム３２３からは離れて表示されるが、データベースの管理システム３２３を使用して、インデックス３２９が作成され維持されることは認識されるべきである。インデックス作成および検索のために使用されたデータ・モデルの１つの例の検討が以下に開示される。

当該技術に熟練している当業者は、次のことを認識するべきである、すなわち図３において、インデックス・メカニズム３２４とサーチ・メカニズム３２５とレポート・メカニズム３２６と、スコアリング・メカニズム３２７とセキュリティ・メカニズム３２８は別個の主体となっているが、インデックス・メカニズム３２４とサーチ・メカニズム３２５とレポート・メカニズム３２６と、スコアリング・メカニズム３２７とセキュリティ・メカニズム３２８は、単一のソフトウェア・プログラムあるいはアプリケーションか、プログラム製品の中へ組み入れられるかもしれない。

図６を参照すると、現在開示されている１以上の実施例に関する検索機器に使用するデータ・ファイル用のインデックスを維持および更新する方法６００が表記されている。図6に示されているように、データ・ファイルのインデックス作成は、ステップ６１０でネットワーク１２０により利用可能と判明した共有リソースについて実行される。

ステップ６１０の一部として、ネットワーク１２０は、共有リソース、共有可能リソースまたはシェアを判別のために検索する。さらに詳細には、検索機器１８０が共有可能なリソース・シェアを検索またはここでは巡回またはウェブ巡回し、インデックス作成や検索を促進するために各シェアに付随しているデータベース管理システム３２３を利用して、情報の蓄積を維持・更新する。検索機器１８０は、サーバ若しくはネットワーク上に共有できると認識されて蓄積された全てのファイルを含むネットワーク検索が可能であり、単なるHTTP〔index.htm〕検索ではない。例えば、共有可能なリソースはハードディスクドライブであってもよく、また他の記憶メディアや固定または離脱可能な１または１以上のフォルダー・ファイル・文書・ページなどであって、“共有可能”のアクセス権付きでその上に記憶されたものであればよい。さらに、共有可能なリソースは、典型的にはウェブ・ブラウザによって表示されるウェブ・ページを含むことができる。

初期のインデックスはデータベース管理システム３２３とインデックス・メカニズム３２４（ステップ６２０）を使用して構築することができる。インデックス作成は今ではどのような方法でも遂行できることが技術に熟練している人々に知られており、その後も開発され・認識されている。インデックス作成の方法の一つとして、１または１以上の実施例によれば、各データ・ファイルの作成期日および／または最終変更日が捕捉され記憶される。インデックスの構築と共に、データ・サーバ１９０上に記憶されたデータ・ファイルに含まれるキーワードあるいは用語を使用して、キーワード・データベースが構築される（ステップ６４０）。

少なくとも１つの実施例に従って、例えばユーザから出された検索クエリの提出に応じた検索結果アイテムを見つけ出す（識別する）ために、検索メカニズム３２５でキーワード・データベースにアクセスすることができる。１つまたは１以上の実施例に使用されるインデックス作成と共有リソース情報を記憶するためデータベース・モデルが以下に詳細に述べられる。１つまたは１以上の実施例では、共有可能リソースの変更すなわち共有可能特性が変わったことを認識するため、および／またはインデックスに反映されている内容の変更を認識するためにインデックスおよび／またはキーワード・データベースを再構築することができる。１つまたは１以上の実施例では、１つまたは１以上のインデックスおよびキーワード・データベースをいつ再構築するかを決めるために設定時間を使用することができる。そのようにした実施例では、もしステップ６４０で時間が経過していない（ステップ６４０が“ＮＯ”）と決定された場合、プロセス６００はステップ６４０と６５０で続行させて、時間の経過を待つことができる。もしステップ６４０で時間が経過した（ステップ６４０が“ＹＥＳ”）と決定された場合、ネットワーク１２０によってステップ６５０の検索が実行され、それぞれステップ６６０および６７０で再度インデックスおよびキーワード・データベースを構築する共有可能リソースを探し出す。

１つまたは１以上の実施例によれば、インデックスを再構築する場合、先に付けられた作成期日および／または最後の変更期日と、インデックス作成される各ファイルに付いている変更期日とを調べて対比する。関連する日付に変更がなかった場合はファイルに再度インデックス作成する必要はなく、キーワード・データベースのファイルについているキーワードも変更する必要がない。ただし、例えば新しいファイルの変更期日と従前の期日とを調べて既存のファイルが変更されたと判明した場合、新しい変更期日が付けられ、書類は再度インデックス作成され、キーワード・データベースのその書類に関連するキーワードは更新される。

更に新しいファイルがデータ・サーバ１９０に加えられると、それはインデックスに加えられ、さらに適当なキーワードが与えられキーワード・データベースに加えられる。しかしながら、データ・サーバ１９０に与えられたファイルがもはや存在しない、インデックスのファイルに関連するすべてと、キーワード・データベースに記憶されていたそのファイルに付いていたキーワードを削除することができる。このようにして、キーワード・データベースを再構築することができる。

図7によれば、本件開示の１つまたは１以上の実施例による、カスタマイズされた検索結果を提供するセキュリティ・メカニズム３２８の使用が図示されている。少なくとも１つの実施例によれば、セキュリティ・メカニズム３２８は様々なレベルのセキュリティ機能が提供できるように形成されている。本件開示の１つまたは１以上の実施例によれば、インデックス作成された内容およびクエリ（検索問）の結果の両方ともがセキュリティ・メカニズム３２８によって無許可アクセスから保護されている。無許可のアクセスからデータを守ることへのアプローチは企業レベルで、また、デスクトップで展開して例えば適切にまたは所望の通りに装備される。本件開示の１つまたは１以上の実施例によれば、セキュリティ・メカニズム３２８が内部データベースとなっており、セキュリティ・メカニズム３２８によって許可されたシステム・ユーザだけが情報へアクセスすることを保証するために様々なユーザおよび背景の微妙な情報を追跡している。

本件開示の実施例によれば、共有リソースが確定され、インデックスとキーワードのデータベースが作成された後、インデックスが付けられ内容のセキュリティは、データベース７４０の望まれたセキュリティと結びつけられて装備される。既に説明した通り、データベース７４０は、多数の異なるデータ記憶装置からのデータからなり、データベース７４０のデータに割り当てられたセキュリティはデータセットからデータセットまで変わることができる。図7の例では、データベース７４０はドメイン１、ドメイン２およびドメイン３と認定された３つの別個のデータ記憶装置から構成されている。当該技術に熟練している当業者であれば、３つの別個のデータ記憶装置とドメインを使用するということは単に図面上のことであり、本件に開示されている多様な実施例との関連で、より多い又はより少ないデータ記憶装置および／またはドメインが使用される得ることが認識できる。

１つまたは１以上の実施例によれば、検索メカニズム３２５によって返され、報告メカニズム３２６によって報告された検索結果に関するセキュリティは、ウェブ・サービスの制御（roll-based＝役割ベース）管理によって装備できる。そのような実施例においては、１または１以上の統合したサーバのシステムを構築する。その中では、パスワードによって保護され、サーバによって共有されているデータベースが様々なタイプの管理上の情報および通信を記憶するリレーショナル・テーブルとして使用されている。本件で開示する実施例では、ユーザ、グループ、ドメイン、ユーザロール（役割）およびドメイングループがセキュリティ・コンポーネント（構成要素）と認定されており、データベース７４０に記憶された様々なタイプのデータへのアクセスを許可または不許可またはセキュリティ・コンポーネントの状態によっては検索メカニズム３２５を介してアクセスの可能性ありとするためにセキュリティ・メカニズム３２８によって使用される。

図７の中で示されるように、ユーザは、特定のドメインおよび／またはデータ・ファイルでアクセスするように識別されたグループであって、グループ７１０、７２０、７３０のような別個のグループに配置される。この方法では、セキュリティ・メカニズム３２８はカスタマイズされた検索結果を提供し、要注意なデータ・ファイルを保護するために使用される。ユーザ１、ユーザ２、ユーザ３はユーザ・グループ７１０に区分され、ユーザ３とユーザ４はユーザ・グループ７２０に区分される。同様に、ユーザ４とユーザ５はユーザ・グループ７３０に割り当てられる。

図７の中で示される例では、それぞれユーザ２、ユーザ３、ユーザ４はデータベース７４０に同じ検索クエリを送出する。しかし、これらのユーザはそれぞれ異なるユーザ・グループに割り当てられているので、それぞれのクエリに応答した結果は本質的に異なるものとなる。ユーザ２からの検索リクエストに応答して、セキュリティ・メカニズム３２８は、データセット７５０に対しユーザ2に返送すること許可する。同様のユーザ3からの検索リクエストに応答して、データセット７６０から返送される。最後に、ユーザ5から提出された同様の検索リクエストに応答して、セキュリティ・メカニズム３２８は、データセット７７０から返送されることを許可する。

ユーザ3は、ユーザ・グループ７１０と７２０の両方に属するので、どちらのグループのアクセス権がユーザ３に与えられたかを決定しなければならない。この決定は、希望されているセキュリティ・レベルを維持するために行なわれる。例えば、１又は１以上の実施例で使用されているセキュリティ・モデル１つには、２つのユーザ・グループのものより厳しいアクセス権が適用されている。また、１又は１以上の実施例で使用されている他のセキュリティ・モデルでは、２つのユーザ・グループのものより自由なアクセス権が適用されている。希望するセキュリティ結果を必要なすべての方法で達成するために、ユーザを多種類のユーザ・グループへ移転することは当該技術に熟練している当業者にとっては明らかであるに違いない。さらに、各ユーザ・グループは個人ユーザと同じように小さくすることができる。

これらを総合すると、様々なユーザ・セキュリティのシステムの内容は、システムの登録ユーザを確定し、さらに、どのユーザがどの情報にアクセスを許容されるかを決めるためのフレームワークと方法論を提供することができる。各ユーザに関する情報は、セキュリティ・メカニズム３２８のデータベースに付随したデータベース・テーブルに記憶される。１つまたは１以上の実施例によれば、様々なフィールド（場）の中に、図１の検索装置１８０のユーザの少なくとも特定のユーザの姓名とパスワードを含ませることができる。

１つまたは１以上の実施例によれば、グループアクセス（許可）は、それぞれのアクセス（許可）されたグループについての名称のようなフィールド（場）からなるデータベース・テーブルに同様に記憶されるもので、許可されたグループはカスタマイズされたテキスト・ストリングからなり“販売”、“サポート”、“管理”のような企業の役割または機能が書かれる。１つまたは１以上の実施例によれば、ユーザに与えられたグループ用の特定のグループ許可に基づくセキュリティ関連の許可および制限をユーザは継承することができる。

検索可能なドメインがデータベース・テーブルに記憶され、そのフィールドによってウェブサイトURIテキスト・ストリングのようにそれぞれのドメインの位置が特定され、ユーザのリクエストによるインデックス・メカニズム３２４のインデックス操作により内容が抽出できる。一般に、ユーザはそのユーザおよび／またはそのユーザの属する特定のグループが認定され、検索可能ドメインテーブルの中でそのドメインの検索だけが可能と限定される。

ユーザロールはデータベース・テーブルに記憶させることができ、そのフィールドでシステム・ユーザとグループ許可との関連付けが行われ、その結果、ユーザが企業内で果たすべき１つまたは１以上の役割が確定される。特に、システム・ユーザ・テーブルのプライマリ（主要）キーが多数のレコードの中に現われるフィールドが存在し、グループ許可テーブルのエントリのプライマリ（主要）キーのある第二のフィールドに毎回ユニークに対応している。

同様に、１または1以上の実施例によれば、ドメイングループをそのフィールドで検索可能なドメインとグループ許可とを関連づけるデータベース・テーブルに記憶させることができ、それにより、企業の１つまたは１以上のグループ許可にドメインを関連させる。
検索可能なドメイン・テーブルのプライマリ（主要）キーが多数のレコードの中に現われるフィールドが存在し、グループ許可テーブルのエントリのプライマリ（主要）キーのある第二のフィールドと毎回ユニークに対応している。

１つまたは１以上の実施例によれば、上述のデータベース・テーブルおよびその関連性はユーザ検索リクエストに対する応答結果を保護するためにロールベース（ＲＢ）セキュリティ・プロトコルを提供するために使用することができる。特に、上記詳述した同じセキュリティ・コンポーネントおよびシーケンス／番号付けのスキームを使用すると、特定のセキュリティ・プロトコルが装備（インプリメント）できる。ユーザ認証は、要求した個人のユーザ識別のためのシステム・ユーザ・テーブルの記憶と入力したユーザ名とパスワードとの照合一致（マッチ）によって行われる。企業のグループのテキスト・ストリング名はグループ許可テーブルから得られる。企業に関する全ての内容のドメインは検索可能なドメインテーブルから得られる。ユーザ・ロール・テーブルは、認証されたユーザが属するグループを示す。ドメイングループ・テーブルは、与えられた検索可能なドメイン用に、どのユーザグループがそのドメインの内容にアクセスすることができるかを示し、ユーザ・ロール・テーブルとグループ許可のプライマリ（主要）キーの照合一致により、どの検索可能なドメインで認証されたユーザが見ることを許されているかを示す。

このように、少なくとも1つの実施例によれば、上記の管理情報は、認証されたユーザがその個人の企業内の役割に基づいて見ることを許されるドメインから単に情報を取り出す検索リクエストのクエリをフィルターするために使用することができる。グループ許可が検索可能なドメインに割り当てられた場合は、他の細分化レベルを使用することもできるが、検索制限の細分化のレベルは、検索可能なドメインのレベルとすることが出来ることは注目される。言いかえれば、許可の与えられたユーザには、典型的なファイル・システムでのように、常にではないが個人的なドキュメントへの許可が与えられる。しかしながら、現在開示されている１つまたは１以上の実施例では、管理者は検索可能なドメインを微細分（例えば、単体ファイルレベル）から、中細分（１組のサブディレクトリー・レベル）さらに、粗細分（例えば全ウェブサイトレベル）まで変化させて細分化すると決めることができる。したがって、どのようにグループ許可が定義されるかによって、検索可能なドメインの細分化も変更可能である。感度のレベルが共通するドキュメントは典型的に１つのグループとされるので、一般にドメインも相応して決められる。

図３と図８を参照すると、現在開示されている１つまたは１以上の実施例による検索結果のスコアリングとランキングの方法８００が示されている。検索リクエストをユーザ（ステップ８１０）から受領すると、データベース３２３に連結している検索メカニズム３２５とインデックス・メカニズム３２４が展開されて要求された検索を実行し、結果を取り出す（ステップ８２０）。

結果が得られるとスコアリング・メカニズム３２７により、検索結果のスコアリングの認定が行われる。スコアリング・メカニズム３２７は個々に詳述された方程式のどれかを使用して上記のように結果にスコアをつける。図8の中で示されるように、検索結果をスコア（評価）するために、前述の様々な重み付けメカニズムが使用されることも、また使用されないこともある。例えば、１つまたは１以上の実施例では、頻度の重み付け（頻度高重視）（ステップ８３０）を採用することにより検索結果を認定することができる。１つまたは１以上の実施例によれば、１つまたは１以上の重み付け要因のアプリケーションはユーザでも設定可能であり、また、最大の利益を求めてスコアリング・メカニズム３２７を各ユーザが設定することも可能である。

一旦、ユーザが選択した希望の重み付け要因が検索結果に適用されると、検索結果は呼び出されて（ステップ８４０）、ユーザに開示（ステップ８５０）される。このように、検索結果は検索機器１８０の個々のユーザによって強化されカスタマイズドされる。

本件開示の１つまたは１以上の実施例では、例えば１つまたは１以上のキーワードから成るクエリに応答して実行される検索の促進のために、検索メカニズム３２５は検索モデルを使用することができる。検索モデルは、検索とインデックス作成に使用されるデータ・モデルと、ランク付け操作と、ワード・ステミング（語の幹語化）と、品詞タグ付け（parts-of-speech tagging）技術、および、イニシャルとインクリメントのインデックス作成を実行する間に遭遇する新語を学習することができる用語集（lexicon）とからなる。加えて、検索モデルは、より詳細に後述されるパイプライン・アーキテクチャーを使用することができる。検索モデルはさらに検索結果アイテムである、例えば、本件開示の１つまたは１以上の実施例に使用された書類のようなクエリの結果をランク付けするためにスコアリング・メカニズム３２７で使用して実行されたもののスコアリング、またはランキングを含むことができる。

ワード・ステミング（語の幹語化）は、単語から共通の形態論と屈折語尾（語尾変化）を取り除き用語を標準化するために使用される。ワード・ステミング（語の幹語化）機能の１つの例はマーティン・ポーター・ステミング・アルゴリズムである。品詞タグ付け（parts-of-speech tagging）の１つの例はペンシルバニア大学の(Penn) Treebank Tagset である。

１つまたは１以上の実施例において使用できる検索モデルとして、使用されるデータ構造のデザインの実例的な記述と、支援するデータベースのレイアウトと、インクリメントのインデックス作成が提供される。更に詳細には、データベースのレイアウトと、書類内容から構築されたインデックスの長期保存を維持するために、それがどのように使用されるかが検討される。加えて、インデックス作成作業に短期働く記憶を供給するためにメモリに存在するデータ構造のデザインが検討される。インデックス作成作業の検討が提供され、先のインデックス作成に基づいて最終ユーザに結果を送り返すキーワード検索モデルがどのように適用されるか示すために、検索クエリの主要な使用のケースが提供される。

本件開示の１つまたは１以上の実施例の中で使用されるデータベース・スキームの実証的な例が、図９Ａと９Ｂとからなる図９で示される。スキームは後述される、キー、ドメイン、uri（URI）、ページ、用語集（lexicon）、ランク、単語テーブルとからなる。

本件開示の１つまたは１以上の実施例では、検索クエリの内部結合を形成するために使用されるデータベース・テーブル間の関係は明確に述べられない。本件開示の実施例によれば、プライマリキーまたは外部キーの使用は、SQL INSERTステートメントの使用によるものでなくファイル・インポート(取り込み)・メカニズムによる新らしい記録の書き込み（insert）を許可するために制限することができる。全てではないにしても殆どのデータベース・ベンダーは、取り込まれるデータのテーブルが自動インクリメンティング・フィールドと認定されているか、および／または、明確な外部キー関係と認定されて取り込まれるのでなければファイル・インポート（取り込み）が許可されないことは明白である。

ファイル取り込みメカニズムは効率を上げるために本件開示の実施例の中で使用することができる。検索モデル・インデックスを創出する際に作成されるレコードの数を考慮して、特にリレーショナル・データベース中のデータベース・テーブルにレコードを挿入するのにSQL INSERTを使用すると、時間の消費が顕著で非実用的である。従って、開示した実施例では、データベースに挿入されることになっているデータは、一時的ファイルまたはバッファに最初は書かれており、次に、データベースへ取り込まれる。このアプローチの例外の1つの例として、自動インクリメントされたインデックス・フィールドと認定されたドメイン・テーブルおよび、インデックスのカウントを維持するキー・テーブルとが含まれる。比較的少量のレコードしか含まれないので、ドメインとキー・テーブル中でレコードを作成するのにファイル取り込みメカニズムを使用する必要はない。

本件開示の１つまたは１以上の実施例では、ドメインと、uri（URI）と、ページ・テーブルとがインデックス作成の間に訪れたドキュメント・ページの情報を記憶するために使用される。ドメインは、ウェブサイトまたはファイルのディレクトリーのように、書類を記憶することができる位置を示す。このモデルによれば、インデックスが付けられるすべてのドメインはドメインテーブル中のエントリとして記録することができる。ドキュメントは特定のドメインに付加されているURI（Universal Resouce Indicater）によって指定される。インデックスが付けられた全ての書類はuriテーブル中にエントリとして記録することができる。特定の書類およびドメインに対応するページ・テーブルに入力される記録が訪れた全てのページについてある。ページ・テーブルに入力されたレコードがありえる。例えば、ファイル・システム・ディレクトリーに存在する電子メールのアーカイブにインデックスが付けられると、アーカイブの各電子メールはページ・テーブルのエントリとして記録される。

さらに上述のデータ・モデルに関して例示すると、用語集（lexicon）とランク・テーブルが、ネットワーク１２０を介して、アクセス可能な情報のインデックス作成に用いられている。特に、キーワード検索モデルの学習辞書もある用語集（lexicon）テーブルには、各単語の品詞を含むインデックス作成のアルゴリズムで知られているすべてのオリジナルでケース・インセンシティブ（大小文字無区別）な言葉へのエントリも含まれている。POS（品詞）フィールドは、例えばPenn Treebank tag setにより構築された限界をコンマで定めたタグのリストである。さらに、用語集テーブルは、既知のオリジナル言語のセットから構築される全ての幹タームへのエントリを含むことができる。用語集テーブルの全てのエントリは、lkeyフィールドによって表示される固有のインデックスと連結している。さらに、ukeyフィールドは幹タームに対応する特定のlkeyインデックスとなることができる。ukeyフィールドは、同じテーブル内でオリジナル言語間の関連と、それに対応する幹タームを構築するために使用することができる。すなわち、例えば、用語集（lexicon）の中のすべての幹タームエントリはlkeyと幹タームエントリのskeyの評価が同一であるように自己関連的でありえる。用語集（lexicon）テーブル内で知られてように、ランク・テーブル中のエントリは書類のページ内での幹タームの発生頻度を記録する。

単語テーブルは、その後の検索結果のプレゼンテーションで強調できるように、インデックス作成の間に出現したオリジナル言語の位置を記録する。単語テーブルの定義内ではフィールドskeyの外観であるので、オリジナル言語は単に対応する幹タームで関連付ける必要があるだけである。

本件開示の１以上の実施例の中では、上で検討されたように、バッファとファイル・インポート・メカニズムが使用されうる。データ構造はそれがデータベースに書かれる前にデータ用のバッファを提供するために使用される。バッファされたデータは、uri（URI）、ページ、ランクおよび単語テーブルのフィールドに対応する。データ構造およびバッファ・プロセスについてより詳細な検討が以下に展開されるが、１つまたは１以上の実施例によれば、バッファに蓄積されたデータはインデックス作成の最後に記録されるか、若しくはメモリが予め定められた有効領域の基準値（threshold）に達した場合はメモリを解放するためにデータのフラッシュが必要となる。新たな記録はファイル・インポート(取り込み)・メカニズムによってバッファされたデータからテーブルに書き込まれ、SQL UPDATEコマンドによって既存のレコードが更新される。

インデックス作成使用される別のタイプのデータ構造はＮ項トライ木で、Nがアルファベットの文字数（大文字）で、数字と句読点が加えられる。このツリー構造はメモリの中に全用語集の内容を保持するのに使われ、例えば、速い検査（単語検査）を提供するのに使用される。最初、インデックス作成より前に、ツリー構造は用語集テーブルの内容を使用するためにあった。インデックス作成の間に新語が出現した場合、それらはツリーに加えることができる。インデックス作成の最後に、ツリーの内容は用語集テーブルに書き戻される。好ましくは、上述の通り、ツリーの内容はファイル・インポート(取り込み)・メカニズムを使用して、用語集テーブルに書き戻すことができる。例えば、インデックス作成の間に出現した新語を表わすツリーのエントリはファイル・インポート(取り込み)・メカニズムを使用して、一時的にバッファまたはファイルを介して用語集テーブルにインポート(取り込み)することができる。

本発明の実施例によれば、トライ構造内でのテキスト・ストリング検索が速いので、Ｎ項トライ木構造は言語の大辞書に使用することができる。列の各要素が潜在的に子ノードである場合、ツリーの各ノードはNサイズの項からなる。ポインター項としてＮサイズ項を実装するアクセス可能なプログラミング環境内のインプリメンテーションのためのメモリへの配慮は比較的最小かもしれない。１つの実証的な実施例では、Ｎ＝６９で、それは過度のメモリ確保を制限するのに十分な程度に小さい。

図１０では、開示された少なくとも１つの実施例による3項トライ木の例が示されている。示された例において、ツリー1000は、大文字A、B、Cのアルファベットから構築される。３つの各要素（円）が長方形に囲まれた配列の１００２Ａから１００２Ｄとなり、配列の上段の要素がＡ、中段の要素がＢ，下段の要素がＣの文字に対応している。１００３Ａから１００３Ｄの円は、割付け（配置）されたノードを表わす。１００１Ａから１００１Ｄの正方形は、単語の品詞のようなノードによるデータの割付け（配置）を表わす。図10で示される3 項トライ木の例は、AB、ABC、C、CCという文字のためのデータの記憶装置を表している。配列１００２Ａの１つのノード指標である１００１Ａは、要素１００３Ａが“Ｃ”の文字に相当すると割付けられたことを示している。同様に１００１Ｂから１００１Ｄのノード指標は、それぞれ配列１００２Ｂから１００２Ｄの中での“Ｃ”、“Ｂ”、“Ａ”の文字の割付けに相当する。配列１００２Ａは文字“Ｃ”に相当する。配列１００２Ａから１００２Ｂへのトラバースパス１００４に従って、文字“ＣＣ”が要素１００３Ａと１００３Ｂから形成される。同様に、次のトラバースパス１００５により配列１００２Ｂと１００２Ｃは要素１００３Ｂと１００３Ｃから文字“ＡＢ”を形成することができる。文字“ＡＢＣ”は、要素１００３Ｂ、１００３Ｃ、１００３Ｄと、配列１００２Ｂ，１００２Ｂと１００２Ｃのそれぞれと、トラバースパス１００５及び１００６によって形成することが出来る。

本件開示の１つまたは１以上の実施例では、インデックス作成はパイプライン・スレッド・アーキテクチャーを使用して実行することができる。更に詳細には、インデックス作成の連続性はセグメントに分割することができ、処理能力（量）を増強するためにパイプラインの複数手順に割り当てることができる。例えば、１つまたは１以上の実施例によれば、ウェブクロール（巡回）をパイプラインの第一手順に割り当て、第二手順を書類の初期のフォーマット解析を実行するために使用することができる。追加の手順は（精巧なイメージ認識アルゴリズムを適用する）書類によってさらなるパス用に使用されるかもしれない。パイプラインの最終手順の1つでは、インデックスの付けられた内容はワーキングメモリに書かれる。

本件開示の実施例で使用されるパイプラインのアプリケーションの1つの例では、複数手順の１つにウェブの巡回から、フォーマット解析、言葉のインデックス作成までのインデックス作成タスクの実行をすべて割り当てることができる。１つまたは１以上の実施例によれば、連続するタスクのすべての連結はインデックス作成工程に含まれる。

開示された１つまたは１以上の実施例において、ここに詳述されるように、インデックス作成には用語集に加えられる新語を識別するため又はネットワーク１２０上で見つかった他のアイテムのための書類解析が含まれる。さらに、各書類に関しインデックス作成することは、書類内に含まれている単語、これらの単語の各々の位置、および書類で見つかった単語の発生の頻度を識別することからなる。

したがって、インデックス作成の間に、本件開示の実施例は、用語集の新語学習の能力を考慮する。インデックス作成が始まると、ここに検討されるように、用語集の現在の内容はメモリにロードされる。これはあらかじめ定められたエントリで、品詞と対応する幹タームが視覚による検査のように注意深く考察される。新しい語が学習工程の一部に入った場合、それらの幹タームは例えばPoterステミング・アルゴリズムを使用して評価することができる。さらに、個々の新しい語には、例えばPenn Treebank tag setによるNNタグを使用してデフォルト品詞を割り当てることができる。本件開示の１つまたは１以上の実施例に関してさらに熟考され、キーワード検索モデルの用語集は、例えば、最終利用者に送られたあらかじめ定められたエントリのある又は全くエントリのないバージョンで初期化することができる。

以下に、本件開示の１つまたは１以上の実施例の中で使用されるキーワード検索モデルと共に使用することができるインクリメントのインデックス作成の詳述（検討）を提供する。インクリメントのインデックス作成の１つの実装アプローチによれば、２つの別個の時間の評価である：（ｉ）インデックス作成操作のスタート時間（start_time ）、インデックス時間（index_time）および（ｉｉ）最後の変更時間（last_mod__time）がそれぞれ訪れた書類に残される。これらの値は、上述のデータベース・スキームのuriテーブルの各レコードのindexjimeとlast_mod_iimeのフィールドに、それぞれ記憶される。

少なくとも1つの実施例でインデックス作成が始まると、最後の変更時間の比較を促進するために、uriテーブルに記憶された書類情報はメモリ中のデータ構造に好ましくはロードされる。データ構造で書類を見つけることができない場合、それは、その最後の変更時間および現在のインデックス作成のスタート時間と供にデータ構造に加えられる。書類がデータ構造によって見つけられた場合、その変更時間は、書類に対応するデータ構造で記憶されていた変更と比較される。２つの時間が同じ場合、書類は再度インデックス作成されることはない。そうしないと、書類は再度完全にインデックス作成され、つまり、全てのページ、および、そのlast_mod_timeおよびindexjtimeを含む書類に関係する情報は、データ構造の中で更新されることになる。

少なくとも1つの実施例によれば、インデックス作成オペレーションの完成前に、一旦インデックスが付けられた内容が、取り込まれた又は更新されたかについて、データベースの“ 最終チェック（final scrub）”がおこなわれる。この最終チェックでデータベースから古いレコードを取り除くことができる。例としては、インデックス作成のオペレーション中にもはや存在しないもの（例えば、現在のインデックスオペレーションでインデックス作成したドメイン中には存在しない書類）や、又は、何かの理由でインデックス作成ができないようなものと識別された書類に相当するエントリである。インデックス作成オペレーション中にそのように識別された書類は、uriテーブルからそれに対応するエントリおよびデータベース中の他のテーブルと明示的または暗黙的な関係にあるものを削除することにより除外する。したがって、例えば、さらにそのような書類のページはすべてページ・テーブルからを削除することができる。uriテーブル内の古いレコードは、index_timeフィールドの評価が現在のインデックス作成のスタート時間とは一致しないものである。

以下に、エンドユーザからのリクエストに基づいて作成されたクエリのアプリケーションの例が示される。

SELECT skey, pos FROM lexion WHERE word= ‘FOO’;

例において、クエリは上述の検索モデルに対して処理される。例としてのクエリはキーワードとしてユーザのリクエスト（例えば、ユーザのリクエストが単語" FOO "を含む書類の要請かもしれない）から取り上げられた " FOO " を含む。以下に示されたクエリはモデル・データベースの用語集テーブル中の個々の固有なキーワードを調べるために使用することができるキーワード検索モデルの用語集テーブルを含むSQLクエリである。データベースの用語集テーブルは、単語とそれの幹へのエントリを含んでおり、各単語とその幹との関係を維持している。サンプルSQLクエリを使用して、クエリのキーワードがデータベースで見つかった場合、単語の品詞（pos）と関連する幹ターム（skey）を得ることができる。単語が主に名詞である場合、つまり、Penn Treebankの表記でNNあるいはNNP品詞であった場合は、データベースの次のSQLクエリはインデックスが付けられた書類のページ内での幹タームの発生頻度を得るために実行することができる。ここで後となるSQLクエリの例は以下のとうりである：

SELECT domain_name, uri, page_num, pagejitle, page_freq

FROM rank, page, uri, domain

WHERE (rank.skey=12345 AND rank.pkey=page.pkey AND page.ukey=uri.ukey AND uri.dkey=domain.dkey)

上記のSQLクエリは内部結合の一例であり、前記で紹介した書類とページとランク・テーブルとの間の関係を活用する。このように、書類の関連するページはスコアリング・オペレーションの後、エンドユーザに返すことができる。書類の関連するページはここに記載されたスコアリング・メカニズム３２７によりスコアリング・オペレーションが結果をソートするために実行された後でエンドユーザに返すことができる。開示された１つまたは１以上の実施例によれば、結果にゼロのスコアが付くとエンドユーザに返される前にリストから除去される。

本件開示の１つまたは１以上の実施例によれば、検索装置１８０が共有リソースを提供するサーバあるいはシェアを識別する。ブラウザ・サービスまたはサーバは、ネットワークドメイン上の利用可能なリソースのリストを提供する。マスター・ブラウザは、コンピューターと共有リソースのメインまたはマスター・リストを維持する。例えば、すべてのworkgroupsまたはドメインは１つのマスター・ブラウザを持つことができる。したがって、マスター・ブラウザは、共有リソースのマスター・リストを維持する。また、ブラウザ・サーバは、共有リソースのマスター・リストの一部分を維持する。これらのリストは追加または削除された共有リソースを反映するために定期的に更新される。

本件開示の少なくとも１つの実施例によれば、検索装置１８０は、SAMBA（共有リソースに関する情報を提供するオープンなリソースユーティリィティ・スイート）を使用して、共有可能なリソースを識別（確認）するためにネットワーク１２０を検索する。SAMBAユーティリィティ・スイートのためのドキュメンテーションはwww.samba.orgで見つけることができる。

SAMBAユーティリィティ・スイートの1つのユーティリィティとして提供されるのはSMB treeであり、それはリストを識別するネットワークをブラウズするために使用することができる、例えば、ツリーの形式で、既知のドメインとそのドメインのサーバおよびサーバ上のシェアを示している。このユーティリィティがドメイン、サーバおよび／またはシェアの正確で完全なリストを必ずしも提供しないことが本件の発明者によって明らかにされた。
従って、本件開示の実施例では、他のSAMBAユーティリィティがSMBtreeユーティリィティの補助として、ネットワークによってアクセス可能なシェアのより完全な識別を得るためにするために使用される。

SMBtreeユーティリィティの補助または替わりとして使用される別のSAMBAユーティリィティは、マスターとブラウザの検索ユーティリィティで、それはNetBIOSの名称とともに、全てのブラウザつまりネットワークのマスター・ブラウザおよびブラウザ・サーバに置かれている。別のユーティリィティであるSMB clientユーティリィティは、その後、従前のユーティリィティによって識別されたサーバからのディレクトリーの情報を得るために、本件開示の実施例の中で使用される。さらに、SMBtreeユーティリィティはサーバ上にあるサーバとシェアのリストを提供するために使用することができる。新しいサーバが返されなくなるまで、そのプロセスは反復して実行される。開示された１つまたは１以上の実施例では、反復プロセスがPERLスクリプトとして実装される。

例えば、上記の反復プロセスを使用して発見されたシェアは、共有ファイルへのアクセスを提供するためにマウント（装備）される。すなわち、例えば、サーバ、記憶機器、おおび／またはファイル・システム、記憶装置、ディレクトリー、ファイル等からなるネットワーク装置に参照を付けるマウント（装備）作業は、参照付けられたアイテムをアクセス可能にする。SMBのプロトコル／ファイル・システムでは、装備されているSAMBAを上述の反復プロセスを使用して発見された共有ファイルを装備するために使用することができる一方、SMBプロトコルの古いバージョンでは、デジタル署名、またはデジタル記名をサポートしない。これは、装備する作業の一部に関係するデジタル署名のような認証技術を使用するファイル・システムとの非互換性を結果として生じる。例えば最近の装備であるマイクロソフトの装備であるCIFSプロトコルは、マウント認証のためにデジタル署名を使用している。

このように、開示された少なくとも1つの実施例では、CIFS VFS （Common Internet File System, Vertual File System ＝共通のインターネット・ファイル・システムの仮想ファイル・システム）が、上述の反復プロセスを使用して発見されたシェアをマウント（装備）するために使用される。CIFS VFSは、サーバや記憶機器のようなシェアへのアクセスを許可するSAMBAと共同のオープンソースイニシアチブ（OSI=open souce initiative）である。CIFS VFSにはデジタル署名が装備され、SMBプロトコルも内包されており、SMBが前任であった新らしいマイクロソフト・インプリメンテーションのCIFSプロトコルのとの互換性をもつ。デジタル署名が装備され、SMBプロトコルも内包されたCIFS VFSは、特にデジタル署名がマウント認証に使用される場合、例えば、SMBファイル・シェアや、新しいCIFSファイル・シェアをマウントするために使用することができる。“ Common Internet File System（CIF ＝共通のインターネット・ファイル・システム）- Technical Reference (Rev.1.0)“と命名された書類、SNIA CIFS Technical Workgroup、2002年2月27日の日付が、CIFS VFSに関する補足情報を提供し、参照としてここに組み込まれる。技術的な参照はhttp://www.snia/org/tech_activities/CIFS/CIFS-TR-1p00_FINAL.pdf で利用可能である。

図11Ａから図11Ｏまでからなる図11は、開示された１つまたは１以上の実施例における検索機器のユーザー・インタフェースからの画面の実証となる例を提供する。より詳細には、画面は、開示された１つまたは１以上の実施例の中で使用されるユーザー・インタフェースによって提示された選択／オプションの例を提供する。これらの図の中の実施例は網羅的ではないことは明らかであり、他のもの、および／または追加の画面や情報が、開示された１つまたは１以上の実施例について表示される。

図11Aは、ユーザ・ログイン画面で、本件開示の様々な実施例による検索機器１８０によって提供される機能へのアクセスをユーザがログインして獲得することを可能にするユーザ・ログイン画面が示される。例えば、ログインに成功した後、ユーザには、図11Bのような画面が提示され、インデックス作成設定のための多くのオプションが提供される。図11 Bの中で示されるオプションは、インデックス作成設定オプションのサンプルで、本件開示の１つまたは１以上の実施例で供給されるかもしれない他のオプションを制限したり除外するものではないことは明らかである。

図11Ｂで示される１つのオプションは“モニター・インデックス作成”のオプションで、インデックス作成オペレーションの現状である、インデックス作成オペレーションの開始と、インデックス作成オペレーションの停止を可視的に提供する。図11Ｈは、ステータスを示す情報を含む画面でインデックス作成オペレーションが進行中であることを示す。例えば、インデックス作成オペレーションに関する、スタート、終了および経過タイムを表示することができる。さらに、パイプラインで送られたインデックス作成オペレーションに関する情報は“モニタリング・インデックス作成”のオプションを使用してモニターすることができる。さらに、インデックス作成オペレーションを終了することも可能である。

図11Bの“スケジュール・インデックス作成” オプションの選択は、インデックス作成オペレーションを自動的に指定の時間に始めるようにスケジュールを決める能力を提供する。図11Ｉは、“スケジュール・インデックス作成”の選択に応じて表示されたサンプル・画面を示し、“スケジュール・インデックス作成”の週の日付けと開始時間を指定することが出来る。

図11Bにおいて、“検索可能な位置の特定”のオプション選択は、インデックス作成する位置を特定する能力を提供し、そこから検索結果を得ることができる。11Ｄから図11Ｇは、“検索可能な位置の特定”オプションの選択に応答した表示画面を示す。

再び図11Bを参照すると、“書類タイプの選択”オプションは、ユーザがインデックス作成オペレーションでインデックスされる書類のタイプを選択することを可能にする。検索結果とともに検索の範囲も間接的にこのオプションを使用して識別することができる。
図11Ｃは、“書類タイプの選択”オプションの選択に応じて表示された画面の例を提供する。図11Ｃのサンプル選択で示すように、書類のタイプの例は電子メール、総括テキスト、発表、出版物、スプレッドシート（表形式データ）からなる。

図11Ｂの“オペレーション・パラメータのセット”オプションは、ユーザが検索機器１８０のオペレーションに関連したパラメータをセットすることを可能にする。図11Ｊは、“オペレーション・パラメータのセット” オプションの選択に応じて表示された画面の例を提供する。例えば、検索可能な位置からインデックス作成された書類の最大の数は、検索機器１８０のオペレーション中である、検索中またはインデックス作成オペレーション中にログ（参入）したメッセージのレベルと同様に特定することができる。

図11Ｋは、ヘルプ・オプションの選択に応じて表示されたヘルプ画面の例を示す。例えば、検索機器１８０および／またはログ・ファイルの内容から得られたヘルプを表示することができる。

図11Ｌでは、開示された１つまたは１以上の実施例によって検索が入力される画面の例を提供する。図11Ｍおよび図11Ｎは、本件開示の１つまたは１以上の実施例に従って検索機器１８０を使用することにより検索された "alan", "larry", "presentation", "publication"のキーワードを使用して検索の結果の例を提供する。図11Ｎで見ることができるように、検索で発見された書類の内容を表示することができる。

図11Ｏは、”Add User（ユーザの追加）“、”Change User Password（ユーザ・パスワードの変更）“、”Change User Permissions（ユーザアクセスの許可）“、”Remove User（ユーザの削除）“、”Add Groups（グループの追加）“、”Remove Groups（グループの削除）“等の“Users Administration（ユーザ管理）“オペレーションを実行するために使用するオプションの例を示す。

図12Ａから図12Ｙまでからなる図12は、設定作業（オペレーション）で使用される本件開示の１つまたは１以上の実施例における検索機器１８０の為および／または付随するユーザー・インタフェースからの画面の実証となる例を提供する。これらの図の中の実施例は網羅的ではないことは明らかであり、他のもの、および／または追加の画面や情報が、本件開示の１つまたは１以上の実施例について表示される。

図12Aはログイン画面を示すもので、これによりユーザは、ユーザー・インタフェースの残りの部分のうちのいくつかあるいは全てへのアクセスを獲得するために、ユーザ名およびパスワードを入力する。例えば、ログインに成功した後、図12Ｂで示される画面では、ユーザが“Network & Internet Connections（ネットワークとインターネット接続）”、“Network File Sharing & Security（ネットワーク・ファイル共有とセキュリティ）”、“Search Appliance File Sharing（検索機器ファイル共有）”の中から選択が可能であることを表示することができる。

“ネットワークとインターネット接続”オプションは、ネットワークおよび／またはインターネット上の他のコンピューターと通信するための検索機器１８０用に、特定のコンピューター・ネットワークに検索機器１８０を設定することに使用することができる。図12Ｃから図12Ｇまでは、オプションの選択に応じて表示することができる画面の例を提供する。図12Ｃは検索機器１８０に関連したホスト名とドメイン名を指定するために使用することができる。図12Ｄは、検索機器１８０のためのIPセッティングを手動または自動のどちらかで発見するオプションを提供する。上記詳述したように、開示された１つまたは１以上の実施例では、検索機器１８０に対応するIPセッティングはUDPクライアント/サーバ・モデルを自動的に使用して確立することができる。

検索機器１８０のIPセッティングのマニュアル設定が選択されている場合、ユーザが検索機器１８０のIPアドレス、サブネット・マスク、デフォルト・ゲートウェイに入ることを可能にするために図12Ｅで示されるような画面を表示することができる。さらに、図12Ｆは、ネットワークドメインネームの獲得を支援する検索機器１８０の第一と第二のドメインネームサーバに対応するIPアドレスを入れるのに使用することができる。図12Ｇは、検索機器１８０のIPセッティングの手動設定に成功した完成された画面表示の例を提供する。

図12Ｈで示される画面は、図12Ｂで与えられた“Network File Sharing & Security（ネットワーク・ファイル共有とセキュリティ）”オプションの選択に応答して表示することができる。図12Ｈにおいて、検索機器１８０のworkgroupおよびドメインが識別されるかもしれない。図12Ｉと図12Ｊは、ローカル・マスター・ブラウジングを使用した検索機器１８０の補強されたファイル共有特性を特定する能力を提供する。検索機器１８０は、図12Ｋで示される画面で提供されるオプションに基づいた符号化した送信を利用することによって通信することができる。図12Ｌは、ネットワーク・ファイル・シェアリングの成功した完成と実行されたセキュリティ設定オプションの画面表示の例を提供する。

図12Ｍから図12Ｒまでは、検索機器１８０を使用してインデックスを付けて検索する目的のファイル・シェアリングを“mount”するオプションを含む画面の例を提供する。
図12Ｏと図12Ｐはそれはネットワーク１２０をブラウジングする検索機器１８０によって得られた共有リソースをリストしている画面の底部と上部をそれぞれ表示している。マウント（搭載）されるファイル・システムのボリューム（量）はこの画面を使用して選択することができる。図12Ｑは、図12Ｏおよび図12Ｐで示された画面を使用して作ったファイル・システムのボリューム（量）の選択を確認するリストからなる画面を提供する。図12Ｒの画面は、マウンティング（搭載）作業の現状を示している。

図12Ｓは、既に存在したか、検索機器１８０にインストールされるべきであった、例えば、最新のステータスを認定するために使用することができるメンテナンス画面の一例を提供する。図12Ｔは、図11Ｋの“View Message Log（メッセージログ）”オプションの選択に応答したログ（履歴）表示の例を提供する。図12Ｕから図12Ｙまでは、支援トピックでもあるセキュリティや再始動のような色々なシステム・レベル・オプションに関係する画面を示す。

要約すると、本件開示では、効率的で有効な仕様で希望の情報にインデックス作成し、配置を決めて、取り出すための幅広く応用できる装置と方法を提供する。結局、図示された実施例は実証的な例示に過ぎず、どのような方法であっても現在の開示の範囲や適用可能性あるいは設定を限定することを意図しないことは認識されるべきである。むしろ、先の詳細な説明は、技術に熟練している当業者に、本件開示の実証的な実施例を装備（インプリメント）するための便利な指標（道標）を提供したものである。従って、添付の請求項で述べられるように、本件開示の精神および範囲から外れることなく、多様な実証的な実施例に記述された機能および要素を様々に変更することが行なわれるかもしれないことは理解されるべきである。

本発明の実施例の一つあるいは複数が使用されるコンピュータ機器および周辺機器のネットワークを表したブロックダイアグラム。本発明の実施例の一つあるいは複数に従って使用される、クライアント／サーバモデル間で通信される命令文の例。本発明の実施例の一つあるいは複数に従って使用される、クライアント／サーバモデル間で通信される命令文の例。本発明の実施例の一つあるいは複数に従って使用される、クライアント／サーバモデル間で通信される命令文の例。本発明の実施例の一つあるいは複数に従って使用される、クライアント／サーバモデル間で通信される命令文の例。本発明の実施例の一つあるいは複数に従って使用される、クライアント／サーバモデル間で通信される命令文の例。本発明の実施例の一つあるいは複数に従って使用される、クライアント／サーバモデル間で通信される命令文の例。本発明の実施例の一つあるいは複数に従って使用される、クライアント／サーバモデル間で通信される命令文の例。本発明の実施例の一つあるいは複数に従って使用される、クライアント／サーバモデル間で通信される命令文の例。本発明の実施例の一つあるいは複数に従った検索器具の内部構造についてのブロックダイアグラム図示例。本発明の実施例の一つあるいは複数に従った採点例。本発明の実施例の一つあるいは複数に従った採点例。本発明の実施例の一つあるいは複数に従った採点例。本発明の実施例の一つあるいは複数に従った採点例。本発明の実施例の一つあるいは複数に従った、典型的なケースにおける採点例。本発明の実施例の一つあるいは複数に従った、典型的なケースにおける採点例。本発明の実施例の一つあるいは複数に従って、インデックスを作成し更新する過程のフローチャート。本発明の実施例の一つあるいは複数に従って、インデックス作成および検索に使用される検索器具のブロックダイアグラム図示例。本発明の実施例の一つあるいは複数に従って、検索結果を採点しランク付けする過程のフローチャート。本発明の実施例の一つあるいは複数に従って使用されるデータベーススキーマの図示例。本発明の実施例の一つあるいは複数に従って使用されるデータベーススキーマの図示例。少なくとも一つの本実施例に従った３項トライ木の例。本発明の実施例の一つあるいは複数に従った検索器具のユーザインターフェース画面の図示例。本発明の実施例の一つあるいは複数に従った検索器具のユーザインターフェース画面の図示例。本発明の実施例の一つあるいは複数に従った検索器具のユーザインターフェース画面の図示例。本発明の実施例の一つあるいは複数に従った検索器具のユーザインターフェース画面の図示例。本発明の実施例の一つあるいは複数に従った検索器具のユーザインターフェース画面の図示例。本発明の実施例の一つあるいは複数に従った検索器具のユーザインターフェース画面の図示例。本発明の実施例の一つあるいは複数に従った検索器具のユーザインターフェース画面の図示例。本発明の実施例の一つあるいは複数に従った検索器具のユーザインターフェース画面の図示例。本発明の実施例の一つあるいは複数に従った検索器具のユーザインターフェース画面の図示例。本発明の実施例の一つあるいは複数に従った検索器具のユーザインターフェース画面の図示例。本発明の実施例の一つあるいは複数に従った検索器具のユーザインターフェース画面の図示例。本発明の実施例の一つあるいは複数に従った検索器具のユーザインターフェース画面の図示例。本発明の実施例の一つあるいは複数に従った検索器具のユーザインターフェース画面の図示例。本発明の実施例の一つあるいは複数に従った検索器具のユーザインターフェース画面の図示例。本発明の実施例の一つあるいは複数に従った検索器具のユーザインターフェース画面の図示例。本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および／または検索装置に関連したユーザインターフェース画面の図示例。本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および／または検索装置に関連したユーザインターフェース画面の図示例。本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および／または検索装置に関連したユーザインターフェース画面の図示例。本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および／または検索装置に関連したユーザインターフェース画面の図示例。本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および／または検索装置に関連したユーザインターフェース画面の図示例。本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および／または検索装置に関連したユーザインターフェース画面の図示例。本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および／または検索装置に関連したユーザインターフェース画面の図示例。本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および／または検索装置に関連したユーザインターフェース画面の図示例。本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および／または検索装置に関連したユーザインターフェース画面の図示例。本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および／または検索装置に関連したユーザインターフェース画面の図示例。本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および／または検索装置に関連したユーザインターフェース画面の図示例。本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および／または検索装置に関連したユーザインターフェース画面の図示例。本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および／または検索装置に関連したユーザインターフェース画面の図示例。本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および／または検索装置に関連したユーザインターフェース画面の図示例。本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および／または検索装置に関連したユーザインターフェース画面の図示例。本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および／または検索装置に関連したユーザインターフェース画面の図示例。本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および／または検索装置に関連したユーザインターフェース画面の図示例。本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および／または検索装置に関連したユーザインターフェース画面の図示例。本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および／または検索装置に関連したユーザインターフェース画面の図示例。本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および／または検索装置に関連したユーザインターフェース画面の図示例。本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および／または検索装置に関連したユーザインターフェース画面の図示例。本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および／または検索装置に関連したユーザインターフェース画面の図示例。本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および／または検索装置に関連したユーザインターフェース画面の図示例。本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および／または検索装置に関連したユーザインターフェース画面の図示例。本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および／または検索装置に関連したユーザインターフェース画面の図示例。

Claims

ネットワークに接続可能な装置であって、
ネットワーク装置のネットワークアドレスを含む動的に設置されたネットワークセッティングを使用してネットワーク上の装置を統合するように設定されたインテグレータと、
ネットワークに接続された少なくとも１以上のネットワーク装置を発見するために少なくともネットワークの一部をトラバースすること、
少なくとも一つの発見されたネットワーク装置に関連する情報源を識別すること、
識別した情報源に関連する情報項目の少なくとも一つのインデックスを生成すること、により設定されたリソース識別子と、
検索基準を満たす識別した情報源から得られる情報項目を識別するように設定された情報読み出しエンジンと、
からなる装置。
前記リソース識別子は、さらに、発見されたネットワーク装置のリストを保持するように構成されたことを特徴とする請求項１記載の装置。
前記リソース識別子は、さらに、情報源を識別するために発見されたネットワーク装置リストを使用するように設定されたことを特徴とする請求項２記載の装置。
リソース識別子は、さらに、データベースからなる検索結果保管（リポジトリ）を保持するように構成され、データベースは、ドメインと、ユニバーサル・リソース・インジケータ（ＵＲＩ）と、ネットワーク上の記憶場所またはドメインにファイルとして保存された文書内のページと一致する情報を保存するのに使用されるページテーブルとからなることを特徴とする請求項１記載の装置。
ドメインテーブルは、各ドメインと一致するネームを含み、
ＵＲＩテーブルは、最終変更日付およびインデックス・タイムとともに、各文書のＵＲＩを含み、
ページテーブルは、各ページのエントリを有することを特徴とする請求項４記載の装置。
ページは、ウェブページ、電子メールページ、または、文書内のページからなることを特徴とする請求項５記載の装置。
装置は、さらに、データベースの中の既存レコードをアップデート（更新）するように構成されたデータベース管理システムと、新しいレコードをデータベースにインポートするように構成されたデータ・インポータと、からなることを特徴とする請求項４記載の装置。
装置は、さらに、動的に更新可能な単語の用語集、各単語の品詞、および、用語集の中に保存された単語と一致する少なくとも一つの幹ワードのとからなることを特徴とする請求項４記載の装置。
装置は、さらに、用語集を保存するバッファとからなり、前記バッファはＮ項トライ構造を持ち、Ｎは文字セット中の要素の数を表すことを特徴とする請求項８記載の装置。
前記資源識別子は、さらに、識別した情報源に関連する情報項目をインデックス作成するとともに、用語集に対する最新情報を特定するように設定され、最新情報はデータベースに書き込まれる前に前記Ｎ項トライバッファ構造に保存されることを特徴とする請求項９記載の装置。
データベースは、さらに階層テーブルからなり、該階層テーブルは一以上のエントリからなり、各エントリは情報項目の中に幹ワードの出現頻度を記憶することを特徴とする請求項４記載の装置。
出現頻度は、情報項目の変更を反映するようにアップデート（更新）されることを特徴とする請求項１１記載の装置。
前記情報読み出しエンジンは、さらに、前記情報読み出しエンジンによって識別される各情報項目に対して決定されたスコアに従って識別した情報項目をランク付けするように構成され、スコアは情報項目に関連する一以上の幹ワードの出現頻度の少なくとも一部に基づくことを特徴とする請求項１１記載の装置。
各情報源は、ストレージ媒体、ファイルシステムディレクトリ、ファイル文書、またはページからなることを特徴とする請求項１記載の装置。
前記情報読み出しエンジンは、さらに、前記情報読み出しエンジンによって識別された各情報項目のスコアを決定するように設定されることを特徴とする請求項１記載の装置。
検索基準は、少なくとも一つの幹ワードからなり、前記情報読み出しエンジンは、さらに、各識別した情報項目の中でそれぞれの検索基準幹ワードの出現数を決定して、情報項目中で検出されたそれぞれの検索基準幹ワードの出現数の集合体の少なくとも一部に基づいて識別した情報項目の一つに対するスコアを決定するように設定されることを特徴とする請求項１５記載の装置。
前記情報読み出しエンジンは、さらに、集合体と情報項目に関連する検索基準幹ワードの同時発生を考慮に入れた重み付けとに基づく情報項目のスコアを決定するように設定されることを特徴とする請求項１６記載の装置。
前記インテグレータは、設定情報をネットワークサーバに通信し、それに応じてネットワーク設定を受信するように設定されることを特徴とする請求項１記載の装置。
前記インテグレータは、設定情報をネットワークサーバに通信する前に、または、ネットワーク上の装置を統合するためにネットワーク設定を使用する前に、ネットワークサーバを認証するように設定されることを特徴とする請求項１８記載の装置。
前記インテグレータは、ネットワーク上の装置を統合するためにユーザデータグラムプロトコル（ＵＤＰ）クライアント・サーバーモデルを使用するように設定されることを特徴とする請求項１８記載の装置。
前記資源識別子は、さらに、ネットワークドメインを識別するように設定され、各識別されたサーバ上の各識別されたネットワークドメインおよびネットワーク共有の中のサーバーを識別することを特徴とする請求項１記載の装置。
前記資源識別子は、さらに、識別したサーバ、識別したサーバに関連する記憶装置、および／または、記憶装置と関連するファイルシステムにアクセスするマウントオペレーションを使用するように設定されることを特徴とする請求項２１記載の装置。
前記資源識別子は、さらに、マウントオペレーションとともに使用するための認証情報を供給するように設定されることを特徴とする請求項２２記載の装置。
ネットワークに接続可能な装置の使用方法であって、
ネットワーク装置のためのネットワークアドレスを含む動的に確立されたネットワーク設定を使用してネットワーク上の装置を統合し、
ネットワークに接続された一以上のネットワーク装置を発見するために少なくともネットワークの一部をトラバースし、
少なくとも一つの発見されたネットワーク装置と関連する情報源を識別し、
識別した情報源に関連する情報項目の少なくとも一つのインデックスを生成し、
検索基準を満たす識別した情報源から得られる情報項目を識別することを特徴とする方法。
さらに、発見されたネットワーク装置のリストを保持することからなることを特徴とする請求項２４記載の方法。
さらに、発見されたネットワーク装置リストを使用して情報源を識別することからなることを特徴とする請求項２５記載の方法。
さらに、データベースからなる検索結果保管（リポジトリ）を保持することからなり、データベースはドメインと、ユニバーサル・リソース・インジケータ（ＵＲＩ）と、ネットワーク上の記憶場所またはドメインでファイルとして保存される文書内のページと一致する情報を保存するのに使用されるページテーブルと、かならることを特徴とする請求項２４記載の方法。
ドメインテーブルは、各ドメインと一致するネームを含み、
ＵＲＩテーブルは、最終変更日付およびインデックス・タイムとともに、各文書のＵＲＩを含み、
ページテーブルは、各ページのエントリを有することを特徴とする請求項２７記載の方法。
ページは、ウェブページ、電子メールページ、または、文書内のページからなることを特徴とする請求項２８記載の方法。
さらに、データベースの中の既存レコードをアップデート（更新）し、新しいレコードをデータベースにインポートすることを特徴とする請求項２７記載の方法。
さらに、動的に更新可能な単語の用語集、各単語の品詞、および、用語集の中に保存された単語と一致する少なくとも一つの幹ワードを保持することからなることを特徴とする請求項２７記載の方法。
さらに、Ｎ項トライ構造を有するバッファ中に用語集を保存することからなり、Ｎが文字セット中の要素の数を表すことを特徴とする請求項３１記載の方法。
さらに、識別した情報源に関連する情報項目をインデックス作成するとともに、用語集の最新情報を特定し、データベースに書き込まれる前にＮ項トライバッファ構造の中に最新情報が保存されることを特徴とする請求項３２記載の方法。
データベースは、さらに階層テーブルからなり、階層テーブルは一以上のエントリからなり、各エントリは情報項目の中に幹ワードの出現頻度を記憶することを特徴とする請求項２７記載の方法。
さらに、情報項目の変更を反映するように出現頻度をアップデート（更新）することを特徴とする請求項３４記載の方法。
さらに、前記情報読み出しエンジンによって識別される各情報項目に対して決定されたスコアに従って識別した情報項目を順位付けすることからなり、スコアは情報項目に関連する一以上の幹ワードの出現頻度の少なくとも一部に基づくことを特徴とする請求項３４記載の方法。
各情報源は、ストレージ媒体、ファイルシステムディレクトリ、ファイル文書、または、ページからなることを特徴とする請求項２４記載の方法。
さらに、各識別した情報項目のスコアを決定することを特徴とする請求項２４記載の方法。
検索基準は少なくとも一つの幹ワードからなり、
前記方法はさらに、
各識別した情報項目の中でそれぞれの検索基準幹ワードの出現数を決定し、
情報項目中で検出されたそれぞれの検索基準幹ワードの出現数の集合体の少なくとも一部に基づいて識別した情報項目の一つに対するスコアを決定することを特徴とする請求項３８記載の方法。
さらに、集合体と情報項目に関連する検索基準幹ワードの同時発生を考慮に入れた重み付けとに基づく情報項目のスコアを決定することを特徴とする請求項３９記載の方法。
さらに、設定情報をネットワークサーバに通信し、それに応じてネットワーク設定を受信することを特徴とする請求項２４記載の方法。
さらに、設定情報をネットワークサーバに通信する前に、または、ネットワーク上の装置を統合するためにネットワーク設定を使用する前に、ネットワークサーバを認証することを特徴とする請求項４１記載の方法。
さらに、ユーザデータグラムプロトコル（ＵＤＰ）クライアント・サーバーモデルを使用してネットワーク上の装置を統合することを特徴とする請求項４１記載の方法。
さらに、ネットワークドメインを識別し、各識別されたネットワークドメインのサーバを識別し、各識別されたサーバ上の共有を識別することを特徴とする請求項２４記載の方法。
さらに、マウントオペレーションを使用して、識別したサーバ、識別したサーバに関連する記憶装置、および／または記憶装置に関連するファイルシステムにアクセスすることを特徴とする請求項４４記載の方法。
さらに、マウントオペレーションとともに使用するための認証情報を供給することを特徴とする請求項４５記載の方法。