JP2009508273A - ネットワーク化された情報のインデックス作成および検索についての装置および方法 - Google Patents

ネットワーク化された情報のインデックス作成および検索についての装置および方法 Download PDF

Info

Publication number
JP2009508273A
JP2009508273A JP2008531329A JP2008531329A JP2009508273A JP 2009508273 A JP2009508273 A JP 2009508273A JP 2008531329 A JP2008531329 A JP 2008531329A JP 2008531329 A JP2008531329 A JP 2008531329A JP 2009508273 A JP2009508273 A JP 2009508273A
Authority
JP
Japan
Prior art keywords
network
information
search
identified
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008531329A
Other languages
English (en)
Inventor
ロバート,ピー. エリックソン
フォックス,デイビッド,エー.
Original Assignee
オー−ヤ!,インク.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by オー−ヤ!,インク. filed Critical オー−ヤ!,インク.
Publication of JP2009508273A publication Critical patent/JP2009508273A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/51Discovery or management thereof, e.g. service location protocol [SLP] or web services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L61/00Network arrangements, protocols or services for addressing or naming
    • H04L61/50Address allocation
    • H04L61/5007Internet protocol [IP] addresses
    • H04L61/5014Internet protocol [IP] addresses using dynamic host configuration protocol [DHCP] or bootstrap protocol [BOOTP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer And Data Communications (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

ネットワーク化された情報のインデックス作成および検索についての装置および方法により、一つあるいは複数存在するイントラネット、インターネットまたはその両方に存在する情報へのアクセス(インデックス作成および検索のアクセスを含む)が可能となる。ネットワーク化した検索装置(本出願においてネットワーク検索機器またはネットワーク検索器具とも呼ばれる)および検索方法は、ネットワーク化した情報の検索・読み出しを円滑にするための設定機能、インデックス作成機能、検索機能から構成される。

Description

関連出願に関するクロスリファレンス
この出願は、2005年9月14日に先行して出願されたアメリカ特許出願番号第60/717,531号の優先権を主張し、その内容は参照により本出願に組み込まれる。
発明分野
本発明は、一般にネットワーク資源のインデックス作成および検索の分野に関連するが、特にネットワークを通じた検索・読み出しによりアクセス可能な共有化リソースのインデックス作成に関連し、また検索の装置および方法にも関連する。
関連技術の説明
コンピュータシステムは通常様々なビジネス、教育および娯楽関連のアプリケーションに利用され、そのアプリケーションの多くは情報を保管、検索、処理することに使用される。コンピュータシステムおよびコンピュータネットワークの機能が、例えばイントラネットやインターネットに見られるように拡大することで、莫大な数の人々が利用可能な情報が大量に蓄積された。
コンピュータによって情報のアクセス利便性および情報処理の能力が向上したことは疑いがなく、また電子形式で利用可能な情報の莫大な量は、いろいろな意味で、我々の処理能力を超えている。この現象は「情報過多」と呼ばれ、今や情報が溢れ出し、必要なときに情報を見つけ出すことが益々困難になっていくことを意味する。従って、電子形式で消費可能な情報の量が今もなお増大し続けていることに対処するため、多くの新しいツールが開発中である。比較的に原始的な検索機能が多くのデスクトップコンピュータのOS環境において提供されているが、必要な書類を索引付け、分類し、検索して読み出す機能は極めて限定されている。
例えば、ワールドワイドウェブ(「WWW」もしくは「web」)により莫大な情報量にアクセス可能となる。しかし、必要な情報の在り処を突き止めるのはかなり難しい。この問題が複合的であるのは、ウェブ上で利用可能である情報量とウェブを検索する経験不足なユーザの数の双方が指数関数的に増え続けているからである。この問題に対処する試みとして、「検索エンジン」として知られる、検索に特化したツールが多く開発されてきた。有名な検索エンジンとしてグーグル、ヤフー、MSNサーチがある。
しかし、従来のウェブベース検索エンジンは、ローカルエリアネットワーク(LAN)およびイントラネットで構成される企業環境での使用に適した設計ではない。そして、このような企業環境では多種多様なフォームまたはフォーマット形式のデータが、様々に分散して保管されている。
一般的に、検索エンジンはユーザの興味に関連すると考えられる一定のウェブページへのハイパーリンクを検索結果として出力しようとする。検索エンジンの目的は、ユーザの検索クエリを基礎として、質が高く、関連する複数のリンクを検索結果としてユーザに提供することである。ほとんどの検索エンジンでは、ユーザの関心事を判断する場合、ユーザが入力する検索ワードの集合(検索クエリと呼ばれる)に基礎を置いている。通常、検索エンジンはこれを、検索クエリのワードを事前に蓄積しインデックスを作成したウェブページのコーパス(文例データベース)に照合することで行う。ユーザの検索ワードを含んだウェブページは「ヒット」と呼ばれ、ユーザに検索結果として出力される。
ユーザに検索結果として出力されるウェブページの関連性と質を高めようとして、検索エンジンはヒットのリストを並び替えて最も関連性が高く、かつあるいはまた、最も質の高いページを検索結果のリストの最上位に挙げようとする。例えば、検索エンジンは各々のヒットにランクやスコアを割り当てる。そのスコアはウェブページの関連性または重要性に応じて計算されている。
関連性を測定する従来の方法は通常ウェブページの内容を基礎としている。より進んだ技術では、ウェブページの内容だけでなく、これを基礎にウェブページの重要性を判断する。例えば、次のような方法が知られている。すなわち、サージー ブリン、ローレンス ペイジ共著「大型ハイパーテキスト検索エンジンの分析」という題名の記事に記載されているのは、ウェブページのリンク構造に基礎を置いてウェブページの重要性の程度が割り当てられるという方法である。しかし、このようなアプローチはウェブページのフォーマットに従ったデータに依拠しており、多くのデータがウェブページフォーマット以外の形式となっているLAN環境に全て適合するわけではない。
例えば、インターネットもしくはイントラネットで保管されているデータにビデオクリップがあるとしても、そのビデオクリップのフォーマットや内容ないし検索エンジンの性能によっては、検索エンジンはそのビデオクリップの内容を特定してインデックスを作成したり、アクセスしたりすることはできないことがありうる。同様の問題は、例えば文書ファイル、画像ファイル、MP3クリップ、ブログ等の他の内容形式でも起こりうる。
更に、あらゆるリンク、ページ、文書が一定のユーザに利用可能となるのは望ましいことではないかもしれない。このことが特に当てはまるのは発達の速い分野であるデスクトップコンピュータ、ローカルエリアネットワーク、およびイントラネット環境である。例えば、あるイントラネット環境において、あるユーザがある文書を閲覧できるが、同じイントラネット上で他のユーザはその文書へのアクセスが禁止されているということがありうるが、それでも検索クエリはその文書を検索結果として出力してしまう。現時点の検索エンジン技術はほとんどのオペレーティングシステムの管理とは関係なく機能するので、いかなるタイプのセキュリティモデルでも検索結果へのアクセスがカスタマイズできるようにすることは極めて難しい。
発明の概要
ネットワーク化された情報のインデックス作成および検索についての装置および方法により、一つ以上のイントラネット、インターネットまたはその両方に存在する情報へのアクセス(インデックス作成および検索のアクセスを含む)が可能となる。ネットワーク化した検索装置(本出願においてネットワーク検索装置またはネットワーク検索機器とも呼ばれる)および検索方法は、ネットワーク化した情報の検索・読み出しを円滑にするための設定機能、インデックス作成機能、検索機能から構成される。
本発明の実施の一例として、ネットワークに接続可能な機器であって、インテグレータ、リソース識別子、情報検索エンジンからなる機器が挙げられる。インテグレータは、ネットワーク機器用のネットワークアドレスを含んだ動的ネットワーク設定を利用して、ネットワーク上の機器を統合するように設定されている。リソース識別子は以下の目的のためにネットワークの少なくとも一部分をトラヴァースするように設定されている。すなわち、ネットワークに接続された一つ以上のネットワーク機器を検知し、検知されたネットワーク機器の少なくとも一つに関連する情報ソースを特定し、その特定された情報ソースに関連する情報項目について少なくとも一つ以上のインデックスを作成するという目的である。情報検索エンジンは特定された検索基準を充足する情報ソースから利用可能な情報項目を特定するよう設定されている。
本発明の実施の一例として、ネットワーク検索装置は、設定機能あるいは統合機能、リソース特定およびインデックス作成、検索コンポーネントから構成される。設定中、例えばネットワークアドレスのようなネットワーク設定は、ネットワーク検索装置用に動的になされる。ネットワーク検索装置におけるインデックス作成コンポーネントは、ネットワークを検索して、ネットワーク上で利用可能な共有リソースを特定し、検索結果レポジトリ(保管庫)ないし検索情報データベースを保持する。検索リクエストに応じて、ネットワーク検索装置の検索コンポーネントは検索データベースを利用してネットワーク上の情報を検索する。本発明の実施例として、検索結果には、一つあるいは複数のスコアリングメカニズムに従ってスコアやランクが付される。
本発明の別の実施例として、ネットワーク検索装置により実行される方法は次のように構成される。すなわち、ネットワーク機器について、ネットワークアドレスのような動的ネットワーク設定を含んだ設定を行い、ネットワーク機器と通信を行う。また、ネットワーク上の共有リソースを特定するためネットワークを検索した上で検索結果レポジトリ(保管庫)ないし検索情報データベースを保持することを含めて、ネットワーク上の共有リソースについてインデックスを作成する。更に、検索リクエストに応じて検索データベースを利用してネットワーク上の情報を検索する。本発明の実施例に従って、検索結果には、一つあるいは複数のスコアリングメカニズムに従ってスコアやランクが付される。
本発明の実施例に従い、ネットワーク検索装置は設定された上で、ユーザデータグラムプロトコル(UDP)クライアント/サーバモデルを利用し、検索機器用のIPアドレスを含んだインターネットプロトコル(IP)設定が移されるため、検索機器とネットワーク装置(例えば、ネットワークサーバ)との間でメッセージが送受信される。起動クライアントはネットワークサーバを実行させ、メッセージを配信することで、ネットワークもしくはネットワークの一部に物理的に接続されている各々のネットワーク検索装置にネットワークが登録される。これに応じて、各々のネットワーク検索装置は自己識別情報、例えばそのメディアアクセスコントロール(MAC)アドレスとホスト名を提供する。ネットワークサーバ上の起動クライアントはネットワーク検索装置の自己識別情報を利用して、ネットワーク検索機器と通信し、検索機器にIP状態の設定および設定解除を行う。
ネットワーク検索装置は、共有可能なリソースを求めてネットワークを検索し(あるいはここで巡回もしくはウェブ巡回ともいう)、または共有する。そして、インデックス作成および/または検索を促進するため、共有リソース各々に対応した情報レポジトリ(保管庫)を維持/更新する。例えば、共有可能なリソースは、ハードディスクドライブあるいは他のストレージメディア(固定、リムーバブル双方含む)、またはこれらに保存され、共有アクセス権限が認められる一つあるいは複数のフォルダ、ファイル、文書、ページ等に存在しうる。本発明の実施例に従って、データベースは、これらの共有可能リソースに対応した情報を保存し、インデックス作成および検索に利用する。
データベースにはドメインテーブル、URIテーブルおよびページテーブルが含まれ、ネットワーク上のある位置あるいはドメインにファイルとして保存されている文書内のウェブページに対応した情報を保存するのに使用される。ドメインテーブルには各ドメインに対応した名前が挙げられている。URIテーブルには各文書に対応したUniversal Resource Indicator(URI)が、他の文書情報(例えば、最終修正日付およびインデックス作成時)と一緒に挙げられている。ページテーブルには各ページ(例えば、ウェブページ、Eメール、ワープロ文書内のページ等)へのエントリが挙げられている。
データベースは更に「オリジナル」ワードの用語集(あるいは辞書)を含んでおり、その用語集は新規ワードを含めるため動的に更新される。加えて、データベースは各語の発音の一部も包含する。オリジナルワードから構成される幹ワードの一つあるいは複数、可能であれば全てが用語集に保管され、各々の幹ワードはデータベースにおいてその構成元のオリジナルワードに関連付けられる。ランクテーブルに保管される登録の各々には、現時点(すなわち最終のインデックス作成時および/または修正時)における、文書あるいはページでの幹ワードの出現頻度が記録されている。ワードテーブルでは、文書あるいはページでのオリジナルワードの位置が示される。
本発明の実施例において、データベースモデルは次のようなものである。すなわち、データベースインサートコマンド(例えばStructured Query Language(SQL)インサートコマンド)の代わりに、ファイルインポートメカニズムを利用して新しい記録が一つあるいは複数のデータベーステーブルに追加できるようなものである。既存の記録はSQLアップデートコマンドを利用して更新される。例えば、ファイルインポートメカニズムを利用して、URIテーブル、ページテーブル、ランクテーブルおよびワードテーブルの一つあるいは複数に記録が投入されたデータがバッファ(一時保管)されて、その後(例えば、インデックス作成終了時および/またはデータバッファが一杯になった時)データベースに記録される。
本発明の実施例において、N項トライ木が用語集にバッファ(一時保管)するために使用され、効率的なワード検索を提供する。N値は、用語集においてワードを表すために使用される特定の文字セットによって決まる。例えば「N」は、桁数および句読点数と共に、アルファベットにおける文字数を表すこともある。本発明の実施例において、インデックス作成に先立ち、用語集テーブルの内容がN項トライ木バッファシステムに入力される。インデックス作成中になされた、新規のあるいは更新された文書/ページで見つけられた新単語のようなものについての更新は、最初にN項トライ木バッファシステムに入力され、その後ファイルインポートメカニズムを利用してデータベースに入力される。
本発明の実施例において、一つあるいは複数の「重み付け」方法論を含めたスコアリングメカニズムは検索結果を向上させるために使用される。より詳しく言えば、スコアリングメカニズムを使用して、検索結果をランク付けし、キーワード検索により特定される各項目(例えば文書やページ等)の関連値を測定する。本発明に従い、より詳細にみると、スコアリングメカニズムを使用して、文書中のキーワードの出現頻度およびその文書中に発見された複数のキーワードの相関関係に基づいて、項目の関連値をランク付けする。メリットとして、例えば、検索で特定された結果項目の中から発見された各キーワードに対応したそれぞれの出現頻度が全検索結果項目と比較対照できる場合、スコアリングメカニズムが使用されて、検索結果で発見された複数のキーワード相互の相関関係を測定し、ある検索結果項目とこれに関連する他の検索結果項目とを区別するために利用される。
本発明の実施例において、スコアリングアルゴリズムは出現頻度を次のように派生させる。すなわち、キーワードに関連した出現頻度の組み合わせを複数使用し、最初の項(オーダ)から始めて検索におけるキーワードの数まで項(オーダ)を増やす。そして複数のキーワードを含む検索結果項目に対応した関連性を決定する。実施例に従い、その関連性は複数のキーワードを含む検索結果項目のそれぞれについて決定される。別の実施例においては、キーワード数を識別する基準値が、検索結果項目に割り振られる関連値を決定するために使用される。より詳しく言えば、ある検索結果項目に含まれるキーワードの数が基準値よりも少ない場合には、関連値はゼロに設定される。しかし、検索結果項目に含まれるキーワード数が少なくとも基準値を満たしている場合には、スコアリングアルゴリズムによって関連値が測定される。
図面の簡略説明
本発明の実施例は以下において、添付図面と合わせて記述される。その添付図面において表示されるのは構成要素と以下の事項である。
図1が示すのは、本発明の実施例の一つあるいは複数が使用されるコンピュータ機器および周辺機器のネットワークを表したブロックダイアグラムである。
図2は、図2Aから図2Hより構成され、本発明の実施例の一つあるいは複数に従って使用される、クライアント/サーバモデル間で通信される命令文の例を示している。
図3が示すのは、本発明の実施例の一つあるいは複数に従った検索機器の内部構造についてのブロックダイアグラム図示例である。
図4は、図4Aから図4Dより構成され、本発明の実施例の一つあるいは複数に従ったスコアリング例を示している。
図5は、図5Aから図5Bより構成され、本発明の実施例の一つあるいは複数に従った、典型的なケースにおけるスコアリング例を示している。
図6が示すのは、本発明の実施例の一つあるいは複数に従って、インデックスを作成し更新する過程のフローチャートである。
図7が示すのは、本発明の実施例の一つあるいは複数に従って、インデックス作成および検索に使用される検索機器のブロックダイアグラム図示例である。
図8が示すのは、本発明の実施例の一つあるいは複数に従って、検索結果をスコアリングしランク付けする過程のフローチャートである。
図9は、図9Aから図9Bより構成され、本発明の実施例の一つあるいは複数に従って使用されるデータベーススキーマの図示例を示している。
図10が示すのは、少なくとも一つの本実施例に従った3項トライ木の例である。
図11は、図11Aから図11Oまでを含み、本発明の実施例の一つあるいは複数に従った検索機器のユーザインターフェース画面の図示例を表している。
図12は、図12Aから図12Yまでを含み、本発明の実施例の一つあるいは複数に従った検索機器の設定操作に使用され、および/または検索装置に関連したユーザインターフェース画面の図示例を表している。
ネットワーク化された情報のインデックス作成、および検索装置および方法により、一つ以上のイントラネットとインターネットまたはその両方に存在する情報へのアクセス(インデックス作成および検索のアクセスを含む)が提供される。ネットワーク化した検索装置(本件出願においてネットワーク検索装置またはネットワーク検索機器とも称する)および検索方法は、ネットワーク化した情報の検索・読み出しを円滑にするための設定機能、インデックス作成機能、検索機能から構成される。
図1を参照すると、ネットワークコンピューティング装置の構成図表100と周辺装置は、本件開示の1つまたは1以上の実施例に使用される。本件開示の1つまたは1つ以上の実施例によれば、コンピューター150、160と170、そして、少なくとも一例として検索機器180と少なくとも1つのデータサーバ190はネットワーク120を介して連結される。さらに、オプションであるプリンター110とオプションのファックス機械140が示されている。本件で開示した実施例によれば、例えば個人も事業体およびこれに類似する者も、効率的かつ有効に本件で詳述する電子データへのアクセス、記録操作、インデックス作成、およびアクセス作業と読み出し作業をすることが出来る。
オプションのプリンター110とオプションのファックス機械140は、コンピュータを基礎とするシステム100によって実行される質問(クエリ)や処理と共に、報告、調査結果、メモ等の紙による文章の送出および出力ができる標準周辺機器である。オプションのプリンター110とオプションのファックス機械140は単に本件開示の関係で使用する多くの周辺装置の代表であることは明らかであり、また、他の周辺機器も1つまたは1つ以上の本件開示の実施例で使う事ができ、省略により図1では除外されているが、そのような機器を除外するものではない。
ネットワーク120は、適宜なコンピューター通信網や通信機構、配線接続、外部接続や内部接続バス、ハイスピードT1やモデム経由での電話接続アクセス、ラジオ、赤外線や他の無線接続、個人又はローカルエリアネットワーク(LAN)と広域情報網(WANs)、同様に、有線・無線通信を使ったインターネット又は企業や事業体の内部網上でのネットワーク標準コンピューター通信網(イントラネット)、又は、その他の、当該技術に熟練している当業者に現在知られているか若しくは将来開発されるであろうコンピューターやコンピューターコンポーネントの適宜な回線接続からなる。
ネットワーク120の一部にはダイアルアップ式の電話回線、放送ケーブル送信網、デジタル定期加入者網(DSL)、ISDN網、公共事業のようなアクセス連動装置が適宜に含まれるのは明らかである。さらに、ネットワーク120は1つ又は1以上のネットワークの部分を構成することができる。
本件開示の1つまたは1以上の実施例では、少なくともネットワーク120の一部は標準的な有線、又は、コンピューターを基礎とするシステム100のさまざまな構成部分の間にある無線のインターネット回線から成る。ネットワーク120は、そこへ連結する装置の間の情報の通信を可能にし、ネットワーク120と連結するさまざまな構成部分の間の通信を行う。本件開示の実施例を使うことにより、例えば、ネットワーク120と接続しているコンピューター150,160、170のコンピューターシステムの使用者は、使用者に対応したアクセス特権に基づいて、ネットワーク120経由でアクセス可能なデータや情報にアクセスをすることができる。物理的本質や幾何学とは無関係に、ネットワーク120は、それらの物理的な近接とは関係なく、コンピューターを基盤としたシステム100の物理的部品の相互接続を行う。本件開示の1つまたは1以上の実施例では、データサーバ190とコンピュータ150、160、170は互いに地理的に遠く、物理的に分離することが想定されている。
ここで開示された実施例において、コンピューター150,160、170は、ここに記載されているコンピューターを基盤としたシステム100に使えるような設定が可能である、技術に熟練している当業者によく知られているどのようなタイプのコンピューターであってもよい。この中には、ノートパソコン、卓上用コンピューター、タブレットコンピューター、ペンを基礎としたコンピューター、及びそれらに類似するものが含まれる。コンピューター150,160、170は最も好ましくは、ルミナックスを基盤とするコンピューター、PCを基盤とするコンピューター、マッキントッシュを基盤とするコンピューターのように市場で入手できるものである。しかしながら、当該技術に熟練している当業者が期待するように、従来の「メインフレーム」コンピュータか、多数の使用者が利用する計算装置か、パーソナルコンピュータやワークステーションのような単独使用のコンピューターか、どうかに関らず、本件開示の方法と装置では、どのコンピューターやコンピューターシステムも同じように利用することができる。
さらに、手の中に納まる又は手の平に乗る装置は、コンピューター150,160、170のように展開(配置)することが可能な装置の例としてあげられる。どのようなオペレーションシステムやハードウェア・プラットフォームにも応用可能で、沢山の異なるハードウェアやソフトフェアを基礎とするコンピュータ150,160、170へ展開(配置)する設定が可能なことは明白である。当該技術に熟練している当業者によく知られている様々なハードウェアー部品とソフトウェアー部品(表示せず)がコンピューター150,160、170として使用可能である。
コンピューター150,160と170と共にデータ・サーバ190は、いくつか又は全てがネットワーク120を経由して共有可能なデータの記憶や読み出しに都合よく設定されている。外部接続モニター、キーボード、マウス、タブレット、ハードディスク装置、録音可能なCD-ROM/DVD装置、ジュークボックス、ファックス・サーバ、磁気テープ、当該技術に熟練している当業者によく知られている他の装置のような各種のハードウェアー部品(図示せず)が、データ・サーバ190とコンピューター150,160と170と共に使用可能である。
少なくとも1つの実施例の中で、データ・サーバ190は、データベース・サービス、ウェッブ・サーバ、ファイアーウォール、セキュリティ・ソフトウェアー又は同様のもの等の各種の追加ソフトウェア部品(図示せず)を設定できる。ひとつのデータ・サーバ190が図1のネットワーク120と接続していることが示されているが、本件開示の実施例では、いくつものデータ・サーバ190を組み合わせ包含させられることは明らかである。各種のデータ・サービスは大きさ、複雑さや容量が多様であるが、しかしほとんどが一般的に本件開示の実施例と共にネットワーク120を経由してインデックス作成や情報の読み出しの設定が可能である。
一般に、本件開示の1つまたは1以上の実施例のデータ・サーバ190は、ネットワーク120を経由してコンピューター150、160、170の使用者によって後で取り出されるデータ・ファイルの蓄積を設定するネットワーク利用可能データ・サーバの代表である。代表的な処理は、データ・サーバ190または例えばその他のコンピューターであってデータ・サーバ190と論理的に接続されたコンピューターシステムなどに直接蓄積された情報へのリクエスト(認証確認、検索読み出し、アクセス、など)で代表される。情報へのリクエストには、声、テキスト、画像、その他あらゆるデジタル化された様々な態様のデータへのリクエストが含まれ、情報は現在知られている、もしくは今後、開発又は確認されるどのようなフォーマットでも蓄積する事ができる。
一般的に、本件開示の1つまたは1以上の実施例によれば、検索機器180はネットワークに基づくインデックス作成、と、データのインッデックス作成、検索クエリ(質問)の受領、ネットワーク120を経由して利用可能な1つまたは1以上のデータ・ファイル、その他、検索クエリが関与している別の適切に指定されたコンピューターへの返還をするための検索クエリ(質問)の処理が可能な検索装置として働くよう設定されたネットワークで利用可能なコンピュータ・システムを示す。典型的な処理は、データ・サーバ190又はその他のコンピューター又はデータ・サーバ190に論理的に接続されたコンピューターからの特定のキーワードまたはフレーズを含むファイルのリクエストに表れる。
データの読み出しリクエストには、声、テキスト、画像、その他あらゆるデジタル化された様々な態様のデータへの検索リクエストが含まれ、情報は現在知られている、もしくは今後、開発又は確認されるどのようなフォーマットでも蓄積する事ができる。
1つ以上の本件開示の実施例によれば、検索機器180はUDPクライアント/サーバ・モデルを介して自動的に設定する事が可能である。1つまたは1つ以上の実施例では、標準ウェブ・ブラウザを使ったウェブ・ページを表示可能にしたユーザインターフェイス(User Interface)を検索機器180の設定に使うことが可能である。
すくなくとも1つ以上の実施例に従えば、UDPクライアント/サーバ・モデルの使用、と、ネットワーク120への設定(すなわち初期設定)以前は、検索機器180はネットワーク120に物理的に接続している。より詳細には以下に記載されるが、ひとたび検索機器180がネットワーク120とつながると、検索機器180は検索機器180を設定するために、認証情報が含まれたメッセージを、ネットワーク120とUDP(User Datagram Protocol)を経由して電送する。検索機器180は本件開示の実施例によって一旦ネットワーク120上に設定されると、ネットワーク上で利用できる共有資源(リソース)を識別するのに使用可能であり、そして検索情報のサーチ保管場所とデータベースが維持される。サーチ・リクエストへの応答として、検索機器180はネットワーク上の情報を検索するのに検索データ・ベースを使用する。本件開示の一つの実施例では、検索結果は1つまたは一つ以上の記録機構によって記録されランク付けされる。
本件開示の1つまたは1以上の実施例に使用されるUDPクライアント/サーバ・モデルは、ネットワーク120の様なネットワークにネットワーク装置を組み込む時に現れる問題に対処している。それは、ネットワーク120内に検索機器180の様なネットワーク機器を設定する時、ネットワーク網である例えば、TCP/IP イーサーネット網のための装置を設定する必要がある。例えば、TCP/IPネットワーク環境下では、展開されたネットワーク内のTCP/IP上で作動させるためには検索機器のためのIPアドレスとサブネット・マスクを確立しなければならない。
手動設定の取り組みも可能であり、例えば、検索機器180のネットワーク・パラメタを手動で設定する。手動設定によるアプローチ(取り組み)は、ネットワーク設定条件(ニーズ)に関するかなり洗礼された知識を要すると考えられる。したがって、自動でネットワーク120のための検索機器180の設定ができることは有益である。
本件開示の実施例で使用可能なもう1つのアプローチは、IPセッティグを入手するためのBOOTPの使用を含むか、または DHCPの取り替えや囲い込みによる検索機器180の設定である。本件開示の1つまたは1以上の実施例によれば、検索機器180はこれらの内のどれか1つ、または1つ又はそれ以上の組み合わせにより設定される。
本件開示の1つまたは1以上の実施例で使うことができるUDPクライアント/サーバ・モデルを使っての自動設定に関し、ネットワーク120内の通信のための有効なIPセティングの確認である検索機器180の設定は、自動または手動のユーザー介入により可能である。言い換えると、検索機器180のようなネットワーク装置が、最初に、ネットワーク120のような実在ネットワークに、すでに存在しているサブネットの中に存在しているという予備知識なしに接続されている時は、このアプローチは検索機器180とデータ・サーバ190の間の最初の通信を成立させる能力を提供する。
1つまたは1以上の実施例によれば、UDPクライアント/サーバ・モデルは、
検索機器180では必要な、例えば、TCP/IPアドレスのようなTCP/IPセッティングを設定すること無しに、例えば、ネットワーク190や検索機器180のようなネットワーク装置の間の通信に使用することができるセットのコネクションレス(無接続)のUDP放送メッセージの使用を考慮(contemplates)する。クライアント/サーバ・モデルはUDPに関して説明されているが、他のプロトコールを使うことが可能なのは明白である。さらに、検索機器180と通信するのに使われるセットのメッセージが通信プロトコールと規定されて説明されているが、他のメッセージ形式をUDPを介して検索機器180または他のネットワーク・プロトコールと通信するのに使うことができるのは明白である。
検索機器180を設定するための本件開示の1つまたは1以上の実施例に使われた実例となるセットのメッセージ形式が以下に説明され開示されている。コミュニケーション・プロトコルはUDPクライアント/サーバ・モデルを実装するのに使われるメッセージの構造を明確にする。さらに、例はUDPクライアント/サーバ・モデルを使った最終ユーザーのネットワークの設定を説明するのに提供されている。
クライアント/サーバ・モデルに簡単なプロトコルであるatop UDPを実装することは、BOOTPまたはDHCPサーバがネットワークの構成要素として存在していようとなかろうとネットワーク装置の設定に便利な解決策であることは明らかである。
本件開示のUDPクライアント/サーバ・モデルによれば、メッセージはUDPクライアントとサーバの間で通信可能である。より詳細には、メッセージ形式は、UDPクライアントである例えばデータ・サーバ190のようなネットワーク化された装置から、1つまたは1以上のUDPサーバである例えば、検索機器180に対するコマンド(命令)という形で表わされる。典型的なコマンド(命令)は、UDPクライアントから1つまたは1以上のUDPサーバのリッスンオン(listening on=問合せ)専用ポートに送られたメッセージから成る。返信にあっては、返答用メッセージは1つまたは1以上のUDPサーバからUDPクライアントへの返送される独自の専用ポートへのリッスンオン(listening on=問合せ)に対するメッセージの形であってもよい。遠隔操作の処理要求と違い、UDP限定送信(放送)の形式のメッセージでは、無接続なのでステートがない。意図したメッセージの受取人がメッセージを受け取る保証はない。メッセージはネットワーク区分のすべての装置に送信(放送)されている。本件開示の1つまたは1以上の実施例のUDPクライアント/サーバ・モデルと共に使うことが可能なメッセージや命令の例が図2に表示されている。
図2Aから2Hからなる図2では、本件開示の1つまたは1以上の実施例において使われるクライアント/サーバ・モデルメッセージ形式の例が図示されている。図2Aを参照すると、第一命令であるPOLメッセージはUDPクライアントであるデータ・サーバ190から、ネットワークまたはネットワーク区分内のすべてのUDPサーバである例えば検索機器180を確認するために発せられる。POLメッセージを受信するUDPサーバはPLRメッセージと共に返答が可能である。PLRメッセージと共に提供される情報確認を使って、メッセージによって特定された作業を一つの検索機器180に実行させる追加メッセージを特定の検索機器180に送る事ができる。UDPクライアントによって供給されるであろう他のメッセージの例として、GETメッセージ、特定のUDPサーバである特定の検索機器180からのIP情報の要求がある。意図(指定)されたUDPサーバは要求された情報が含まれるGTRメッセージを使って返答する事が可能である。
UDPクライアントによって発せられうる他のメッセージであるSETメッセージは、受取人UDPサーバにそのIPステートのセットを要求する。意図(指定)されたUDPサーバは、”成功や失敗”のような要求された作業の結果を表示するSTRメッセージを返答することができる。RESメッセージは、機器の再起動を伴うステートのリセットをするリセット作業の開始を特定の検索機器180に指示するため、UDPクライアントにより発せられる。個々のメッセージ形式の詳しい詳細が以下に記載される。
この中に説明されているメッセージ形式に使われるシンタックスの1つの例によれば、個々のメッセージは512バイトよりは大きくない。上記略述したこれらの7タイプのメッセージの中で4つのメッセージは、検索機器180によって実行される作業を始めるために、UDPサーバである例えばネットワーク・サーバ190からUDPクライアントである例えば検索機器180に送られる。上記特定された残りのメッセージの形式は検索機器180によって、返答としてUDPクライアントに送られる。個々のメッセージ・ボディ(body)はMACアドレスフィールドを介して送り主を確認する。UDPクライアントによって送られたPOLメッセージは問い合わせ(listening)しているであろうすべてのUDPサーバを意味する。残りのメッセージ形式はメッセージ(body)内のMACアドレスで確認された特定の受取人を意図(指定)している。
図2Bから2Hは、本件開示の1つまたは1以上の実施例に使われるメッセージのフォーマットの例を提供する。勿論、ここで述べられているフィールド(領域)のさまざまな長さを含むその他のフォーマットが、本件で開示した実施例で使用するネットワーク装置の認証の請求に使用できるのはもちろん明らかである。
図2Bを参照すると、例えば、本件開示の1つまたは1以上の実施例に使用されるポーリング(集計)メッセージのフォーマットの例が提供されている。例えばPOLのようなポーリング(集計)メッセージは、実在するネットワーク装置の同一性を要求するネットワークのそれぞれの検索機器180である例えば送信(放送)メッセージに、ブートストラップ・クライアントによって送られる。メッセージはネットワークまたはその一部に接続されているネットワーク機器180の同一性を要求する。少なくとも1つの実施例によれば、メッセージは、メッセージ・プロトコルのバージョンを確認するフィールド210と、メッセージ形式を確認するフィールド211と、ブートストラップ・クライアントのMACアドレスを確認するフィールド212と、から成る。この実施例では、フィールド210、211、 212は、長さによりそれぞれ、1バイト、3バイト、6バイトとなる。
図2Cは、開示された1つまたは1以上の実施例に従ってポーリング・メッセージに応答として送られるポーリング(集計)の返答メッセージの例を提供する。ポーリングの返答メッセージ、PLRは検索機器180によって、POLメッセージに応じてブートストラップ・クライアントに送られる。POLメッセージに応じて、検索機器180はそのMACアドレスと、オプションとしてホスト名をPLRメッセージの返答として送る事ができる。図2Cに表示されたPLRメッセージのフォーマットは、プロトコルバージョンを確認するフィールド210と、メッセージ形式を確認するフィールド211、顧客のMACアドレスを確認するフィールド212と、応答している検索機器180のMACアドレスを確認する213と、応答している検索機器180のホスト名を確認するフィールド214とからなる。この実施例では、フィールド210,211,212と213は、長さによりそれぞれ、1バイト、3バイト、6バイトとなる。フィールド214は、ゼロから250バイトの範囲内でバイトの長さが変化する。
PLRメッセージ内に受け取ったMACアドレス情報を使って、ブートストラップ・クライアントは、機器から追加情報を得るために検索機器180の特定例にアクセスできる。GETメッセージは、ブートストラップ・クライアントによって検索機器180からの情報を要求するために、最新の機器のネットワーク設定(例えば機器のネットワーク(IP)アドレス)のように送られる。GETメッセージには、認証情報である、例えば、識別名、パスワードや検索機器180が要求者の認証に使うことができるその他の認証情報(例えばブートストラップ・クライアント)が含まれる。
図2Dは開示された1つまたは1以上の実施例に使われるGETメッセジフォーマットの例を提供する。フィールド210ではプロトコール・バージョンを確認し、フィールド211はメッセージ形式を確認し、フィールド212にはブートストラップ・クライアントのMACアドレスを含み、フィールド213は応答する検索機器180のMACアドレスを含む。また、フィールド215には検索機器180への要求者(例、ブートストラップ・クライアント)の認証に使われる認証情報(例えば、識別名、パスワードと、またはその他の認証情報)が含まれる。この実施例によれば、フィールド210,211,212と213は長さによりそれぞれ、1バイト、3バイト、6バイトと6バイトになる。フィールド215は、ゼロから255バイトまでのバイトの長さで変化する。
検索機器180がブートストラップ・クライアントから受け取ったGETメッセージの応答を送る場合、応答は図2Eで表示されるフォーマットをしたGTRメッセージの形となる。検索機器180がGETメッセージを受け取った時、GETメッセージ内に含まれる認証情報は要求者の認証に使うことが可能である。もし検索機器180がGETメッセージに応答すると決定するとすれば、検索機器180がGTRメッセージを送る前に、検索機器180はGETメッセージ内の認証情報を使う要求者を認証する。GTRメッセージは現行のIPアドレスと検索機器180のサブネット・マスクに戻る。ゲートウェー設定はHTTPインターフェースを介してその後に実行される。
図2Eに表示のGTRメッセージのフォーマットは、プロトコルバージョンを確認するフィールド210と、メッセージ形式を確認するフィールド211と、ブートストラップ・クライアントのMACアドレスを確認する212と、応答している検索機器180のMACアドレスを確認する213と、検索機器180のサブ・マスクとIPアドレスを確認するフィールド221および222と、DHCPフラッグからなるフィールド223と、からなる。1つまたは1以上の実施例によれば、DHCPフラッグは、検索機器180がDHCPを使うために設定されたか(例、”0x01” の値)または、例えば、検索機器180がDHCPサーバからアドレスを上手く借りたか(例、”0x02” の値)のどちらかを示す。この実施例によれば、フィールド210,211,212,213,221,222と223はそれぞれ、1バイト、3バイト、6バイト、6バイト、4バイト、4バイトと1バイトの長さになる。
検索機器180からネットワーク情報の受領に対応して、ブートストラップ・クライアントはそのIPセッティングを設定する命令を機器に送ることができる。SETメッセージはブートストラップ・クライアントによってそのIPアドレスとサブネット・マスクを設定するため検索機器180に、認証情報と共に送られる。図2Fは本件開示の1つまたは1以上の実施例と共に使われるSETメッセージの例を提供する。フィールド210はプロトコルバージョンを確認し、フィールド211はメッセージ形式を確認し、フィールド212はブートストラップ・クライアントのMACアドレスを含み、フィールド213は応答している検索機器180のMACアドレスを含む、フィールド215には検索機器180への要求者(例えば、ブートストラップ・クライアント)の認証に使われる認証情報(例えば、識別名、パスワードと、またはその他の認証情報)が含まれる。フィールド221と222には、そのネットワークセッティングを設定する検索機器180によって使われるネットワーク・アドレス情報(例えば、IPアドレスとサブネット・マスク)が含まれる。この実施例によると、フィールド210,211,212と213はそれぞれ、1バイト、3バイト、6バイトと6バイトの長さである。フィールド215はゼロから255バイトの範囲内でバイトの長さ変化する。フィールド221と222の長さは4バイトである。
検索機器180は、SETオペレーションの結果または状態を示すSTRメッセージのようなSETメッセージに対する返答を送ることができる。例として、結果は成功(例、返答コードはノン-ゼロ=0でないとなる)または失敗(例、返答暗号は0となる)として示される。STRメッセージは状態のより詳細を記述した更なる情報を含むことができる。例として、STRメッセージは失敗という作業結果を記述することができる。
図2Gは1つまたは1以上の実施例に従った設定作業(例、セットとリセット作業)の結果を示すメッセージの例としてSTRメッセージを提供する。フィールド210はプロトコル・バージョンを表し、フィールド211はメッセージ形式を表しており、フィールド212はブートストラップ・クライアントのMACアドレスを含み、フィールド213は応答している検索機器180のMACアドレスを含む、フィールド220は作業の“状態のコード”を表し、そしてフィールド217は更に設定作業の成功または失敗を記述したメッセージを含む。この実施例に従って、フィールド210,211,212、213と220はそれぞれ、1バイト、3バイト、6バイト、6バイトと1バイトの大きさである。フィールド217はゼロから255バイトの範囲内でバイトの大きさが変化しやすい。この実施例によれば、フィールド210,211,212と213は長さによりそれぞれ、1バイト、3バイト、6バイト、6バイトと1バイトになる。フィールド217は、ゼロから255バイトまでのバイトの長さで変化する。
1つまたは1以上の実施例によれば、RESメッセージは検索機器180の状態をリセットするのに使うことができる。RESメッセージは検索機器180がその初期設定である、例えば工場出荷の初期設定にリセットすることを要求する。図2Hは1つまたは1以上の実施例において検索機器180をリセットするメッセージ例であるRESを提供する。
フィールド210のRESメッセージはプロトコル・バージョンを表示し、フィールド211はメッセージ形式を表示しており、フィールド212はブートストラップ・クライエントのMACアドレスを含み、フィールド213は応答している検索機器180のMACアドレスを含んでいる。この実施例では、フィールド210,211,212と213はそれぞれ、1バイト、3バイト、6バイトと6バイトの長さである。
本件開示の1つまたは1以上の実施例によれば、検索機器180の個々の例はUDPサーバを連続的に稼動し、ネットワークで稼動するDHCPサーバによってリースされたIPアドレスを許容するために工場内に設定することが考慮されていた。仮に、DHCPサーバがネットワーク内に存在しなかった場合、ここで開示された実施例では、検索機器180のTCP/IP設定が、上記のUDPクライエント/サーバ・モデルを使って、検索機器180内で実行されるUDPサーバによって受領される命令を介して使用することが可能である。
1つまたは1以上の実施例によれば、ここで記述されているUDPクライエント/サーバ・モデルは:(i)ネットワークである例えばネットワーク120に接続している全ての検索機器180を認識し(ii)特定の検索機器180のサブネット・マスクとIPアドレスを発見し、そして/または(iii)特定された検索機器180のサブネット・マスクとIPアドレスを発見した通りに設定する。末端ユーザが遭遇するいくつかのシナリオの例と、取れる行動は以下に分類される。
シナリオの1つとしては、検索機器180をDHCPサーバを含むネットワーク内で立ち上げる。この場合、検索機器180はDHCPサーバから有効なIPアドレスを得て、検索機器180のネットワークのセットアップはこの中で記述されているUDPクライエント/サーバ・モデル無しで完成させることができる。以下は他の方法の中で、ネットワークがDHCPサーバを含む場合にユーザが利用可能なものである。例えば、末端ユーザはいかなる行動も取る必要はない。あるいは、行動を取ることを望むならば、UDPクライエント/サーバ・ブートストラップ・クライエントはネットワークに接続された検索機器180を発見するためにネットワークを操作することが可能である。例えば、DHCPサーバによって提供されるIP設定の取得、又は、IP設定を他の静的なIPアドレスに変更である。
もう1つのシナリオとしては、検索機器180をDHCPサーバの含まれないネットワーク内で立ち上げる。この場合、検索機器180は、例えばUDPサーバからくるUDPクライエント/サーバ・モデルのSET命令を使用して、IPアドレスとサブネット・マスクが設定されるのを待つ。この場合、末端ユーザは、ネットワーク装置であるデータ・サーバ190のUDPブートストラップ・クライエントに装備されているプログラム・コードを実行してネットワーク内に機器を設定する。UDPブートストラップ・クライエントは上述のように1つまたは1以上の検索機器180を発見するため、そして/または、ネットワーク通信用の検索機器180を設定するためのIPアドレスとサブネット・マスクとを設定する命令を出すために検索機器180と通信する。
ネットワークのセットアップが上手く完成した後はいつでも、UDPブートストラップ・クライエントは検索機器180の1つまたは1以上の実例の発見を実行できる。例ば、ブートストラップ・クライエントは、検索機器180の1または1以上の実例のIPアドレスとサブネット・マスクを得るため、IPアドレスと検索機器180の1つまたは1以上の実例をスタティック・バリューにリセットするため、または、検索機器180の1つまたは1以上の実例を初期(工場)設定にリセットするために使用される。
再び図1を参照すると、図1では少数のコンピューター150,160、170がネットワーク120に接続しているに過ぎないが、同時に、ダズンまたは数百さらには数千の類似に設定されたコンピューター150、160、170が検索機器180の実例を使ってインデックス付けされて検索される事が予期されていることは明らかである。1または1以上の本件開示の実施例によれば、マルチチプル・コンピューター150,160、170は検索機器180および1または1以上のデータ・サーバ190とネットワーク120を介して相互に通信可能に設定することができる。
検索機器180を使用することにより、コンピューター150,160、170のようなコンピューターの使用者は、例えばデータ・サーバ190から所望のデータ・ファイルを探し当て、読み出す検索要求を開始することができ、検索要求は検索機器180によって受領されて、処理される。受け取った要求に対する返答として、もし適切であれば、検索機器180は要求者に要求されたデータ・ファイルへのアクセスを提供できる。上述のように、1または1以上の実施例と検索機器180の使用によって、例えば、コンピューター150,160、170の一つの使用者は、データ・サーバ190ばかりでなく、その他どのコンピューター、または検索機器180を使用してインデックス付けされたネットワーク120と結合されたコンピュータ・システムからもこの形態の情報を要求し、読み出すことができる。検索機器180を使って、検索要求の提出、検索の結果のレヴュー、ローカル共有リソースに配置されたデータ量のインデックス作成、遠隔地からネットワーク120への接続、インターネットとインターネットとのトラバース、ができる。本件開示の実施例にはいくつかの典型的アプリケーションが使われているのに加えて、本件の開示は、電子発見とコンピューター・フォレンジックを例として含むその他の検索アプリケーションに使用することが予期できる。
図3を参照すると、本件開示の1つまたは1以上の実施例による検索機器180の内部アーキテクチャの1例を図解するブロック図形が提示されている。検索機器180はサーバ、ファイヤ・ウォール、包括的セキュリティ・ソフトウェアー、および同種のものなど(図示せず)の多様な追加ソフト・ウェアが設定可能である。今現在の利用可能なコンピュータ・システムの到達水準枠内での相対的な優位を前提とすると、検索機器180の機能は、少なくとも本件開示の1つまたは1以上の実施例を設定したすでに利用可能なコンピューティング装置およびシステムにおいて多数スタンダードとして提供される事は予期できる。
検索機器180は、システム・バス360を経由して相互に連結される少なくとも1つの中央処理装置(CPU)またはプロセッサー310、メインメモリ320、メモリ・コントローラ330、補足記憶装置340、そしてターミナル・インターフェイス350によって構成される。
様々な改良、追加または削除である例えば、キャッシュ・メモリーの追加や周囲機器の追加が本件開示範囲内で、図3に図解されている検索機器180について行うことができる事は明白である。図3は全てを網羅する例のとして作られたものではなく、図解を目的とした表示である。
プロセッサ310は、コンピューターの操作と検索機器180の操作機能を行い、適切な中央処理装置(CPU)を構成する。プロセッサ310はマイクロプロセッサーのような単一の集積回路を構成し、または、適当数の集積回路機器そして/または、プロセッサの機能を完成させるべく協力して作業をする回路盤を構成する。プロセッサ310はメインンメモリ320内に含まれる1または1以上のソフトウェア・プログラムをうまく実行する。
補助記憶装置340は検索機器180に外付けされる外部記憶装置370のような、補助記憶装置、磁気のディスク・ドライブ(例えばハード・ディスクまたはフロッピ(登録商標)・ディスク)、または光学式記憶機器(例えばCD-ROM)からの情報を保存または読み出しをさせる。記憶(ストレージ)機器の1つの例として、直接アクセス記憶装置(DASD)380がある。図3に表示するように、DASD380はフロッピ(登録商標)・ディスク390からデータとプログラムを読み取ることができるフロッピ(登録商標)・ディスク・ドライブとなりえる。
補助記憶装置340は、外付けされる外部記憶装置370のような、補助記憶装置、磁気のディスク・ドライブ(例えばハード・ディスクまたはフロッピ(登録商標)・ディスク)、または光学式記憶機器(例えばCD-ROM)であって、検索機器180に情報を保存または読み出しさせる。記憶(ストレージ)機器の1つの例が直接アクセス記憶装置(DASD)380である。図3に表示するように、DASD380はフロッピ(登録商標)・ディスク390からデータとプログラムを読み取ることができるフロッピ(登録商標)・ディスク・ドライブとなりえる。
本件の開示では十分に機能するコンピュータ・システムが文脈の中で述べられているが、当業者は、本件開示の様々なソフトウェア構成が様々な形式の1または1以上のプログラム製品としてシグナル・ベアリング・メディア(信号を帯有する媒体)とともに流通配布される可能性があることが予知でき、また、本件開示の実施例は、特定のタイプまたはシグナル・ベアリング・メディアの配置に関係なく平均的に採用され現実に配布が実行されることが予期される。シグナル・ベアリング・メディアの例としては、CD ROMSやフロッピ(登録商標)ディスク(例;390)のような記憶可能型メディア、デジタル、アナログ通信リンクのような、無線式通信リンクを含む伝達タイプ・メディアを含む。
メモリ・コントローラ330は、プロセッサ310から切り離された補助プロセッサ(図示せず)の使用を通じて、要求された情報をメイン・メモリ320および/または補助記憶装置340からプロセッサ310に動かすことの責任を負う。
説明の都合で、メモリ・コントローラ330は単独の存在として表示される;実際には、本件技術の当業者は、メモリ・コントローラ330によって提供される機能の一部は、プロセッサ310、メイン・メモリ320、および/または補助記憶装置340に付いている回路の中に存在する事を理解している。
末端のインターフェイス350は通常は個別のワークステーション、または図1のコンピューター・システム170の様なスタンド・アローン・コンピューターを介して、使用者、システム管理者、コンピューター・プログラマーに検索機器180と通信する事を許可している。図3で描かれた検索機器180は単一のメイン・プロセッサー310と単一のメイン・システム・バス360を含んでいるが、本件開示はマルチ・プロセッサーとマルチ・バスを内蔵するコンピューター・システムにも等しく利用されることは明らかである。同様に、本件開示の1または1以上の実施例のシステム・バス360は典型的なハード・ワイヤー(コンピュータ組み込み)のマルチ・ドロップ・バスであるが、コンピュータ関連の環境内で双方向性通信をサポートするどのような結合手段にでも使用することができる。
メイン・メモリ320は、オペレーティング・システム321、ユーザ・インターフェイス322、データベース管理システム323と共に、インデックス機構324、サーチ機構325、レポート機構326、スコア機構327とセキュリティ機構328の様な本件開示の実施例との関係で記述され機能的に実装されるプログラム・コードを含むことが望ましい。この中で使われる“メモリ”という用語は、検索機器180の仮想の記憶スペース内のいかなるストレージ・ロケーションを示す。メイン・メモリ320は図示されたすべての部品のすべてのパーツを必ずしも含んでいる必要はないことは理解される。例として、オペレーション・システム321の一部はプロセッサ310を実行するためにインストラクション・キャッシュ(図示せず)内に入れることができ、その他のファイルは磁気または光学ディスク・ストレージ装置(図示せず)に保管する事ができる。加えて、ユーザ・インターフェイス322、データベース323、インデックス機構324、サーチ機構325、レポート機構326、スコア機構327とセキュリティ機構328はオペレーション・システム321として同じメモリ・ロケーションに存在するように表示されるが、メイン・メモリ320は多数の異なるメモリー・ロケーションから成ることができることを理解されるべきである。
データベース管理システム323は、データ・モデル、概要、定義、および、本件開示の1または1以上の実施例との関連で記載されたようなデータ・モデルによって保管されたデータを使用または実装することができるリレーショナル・データベース管理システムとすることが可能である。データベース管理システム323を使って保管されたデータは、データベース管理システム323を使って保管されているデータに行われた更新によって、各クエリごとに変更可能である。1または1以上の実施例によれば、メイン・メモリ320内に表示されているいくらか又は全ての個々の構成要素は、スタンド・アローン・プログラム製品として多くの形に結合され又は分配することができることも注目されるべきである。最後に、検索機器180は追加構成要素(図示せず)を含むことができる。
例えば、必須ではいないが、本件開示の実施例には検索機器180によって検索されるデータ・ファイルへの使用者のアクセスを確認し許可するためのセキュリティー機構328が含まれている。セキュリティー機構328は1または1以上の開示実施例において、オペレーション・システム321の中に組み込むことが可能である。1または1以上の実施例では、データベース323内に保管された情報の量や形によって、セキュリティー機構328は図1のコンピュータ150,160と170とデータ・サーバ190用のそれぞれの段階におけるセキュリティおよび/または暗号化を提供するように設定をすることができる。
更に、セキュリティー機構328によって適用されるセキュリティー手段のレベルと形式は、請求される検索および/または要求された検索への応答の性質および要求者の識別(情報)によって決めることができる。本件開示のいくつかの実施例の中のセキュリティー機構328には、ハード・ウェア・ファイアーウォール、ルータ、スイッチャ、ドングル、その他、のようなハードウェア部品に関するものが含まれるか又は実装されている。
少なくとも1つの実施例によれば、オペレーション・システム321は検索機器180の作動および/または操作に使われるソフト・ウェアを含む。通常は、プロセッサ310はオペレーティング・システム321を実行する。オペレーティング・システム321は単一のプログラムであるか又はどちらか一方がオペレーティング・システムの機能を協力して実行するマルチ・プログラムのコレクションである。現在本件技術の当業者に知られているか又は今後において開発・確認されるいかなるオペレーティング・システムも本件開示の1または1以上の実施例によって使用する事ができる。
ユーザー・インターフェイス322は他の形をとる事も可能であるが、ここでは画面表示可能なウェッブ・ページからなり、ここで確認された1つのブラウジンク゛・ソフトウェア・アプリケーションを使って、検索機器180に結合したモニタに画面に表示される、および/またはコンピュータ・システム150,160、170のようにネットワーク120を介して検索機器180に接続されたコンピューターと結合したモニターに表示される。ユーザー・インターフェイス322はメモリー320内に表示されたインデックス機構324、サーチ機構325、リポート機構326、スコア機構327とセキュリティー機構328を含む様々な構成要素を設定する事が可能である。
データベース管理システム323は、現在、本件技術の当業者に知られているか又は今後において開発・確認される適切なデータベースの代表である。本件開示の1または1以上の実施例において、データベース管理システム323はリレーショナル・データベースであり、データベース管理システム323はデータベースに保管されているデータを操作(例;創作、更新、照会等)するためにストラクチャード・クエリ・ランゲージ(SQL =Structured Query Language)を使う。データベース管理システム323がメイン・メモリ320内に存在することが表示されている間は、データベース管理システム323がメイン・メモリ320以外の場所に物理的に記憶する事ができることは明らかである。例えば、データベース管理システム323は外部記憶装置370またはDASD380に記憶可能であり、補助記憶I/F340を介して検索機器180に結合する。本件開示の1つまたは1以上の実施例では、データベース323は含まれている内容のためのキーワードを持つことができ、イントラネットまたはインターネットを介してアクセス可能である。1または1以上の実施例によれば、データベース管理システム323はコンピューター・システムや多くの異なるコンピューターに保管された本質的に異なる様々なデータベースで構成される。
図2の中には表示されてないが、すくなくとも1つの実施例によれば、検索機器180は、ネットワーク120へ接続するためのネットワーク・インターフェイスとともにネットワーク120を介して通信するのに必要なネットワーク・プロトコルを含んでいる。例として、開示された1または1以上の実施例では、検索機器180はトランスミション・制御・プロトコル/インターネット・プロトコル(TCP/IP/Transmission Control Protocol/Internet Protocol)として典型的に言及されるプロトコル・スートを含む。
インデックス機構324は、様々な形の情報を分類するため、および、データ・サービス190のようなネットワーク120上の情報を検索して読み出すことに共同で使用されるインデックスの作成のための、設定可能なインデックス器具である。インデックス機構324は、インデックスされるデータの特定の形式によって、プログラムまたは使用者の介入の様々なレベルに応じて手動で設定が可能である。インデックス機構は頭文字インデックスを行う事ができ、使用者の特定した間隔でデータベース323内に含まれるデータ・ファイルを再インデックスできるように設定することが可能であり、そのインデックスはデータベース323の内容を容易に検索するのに使うことが可能である。
サーチ機構325は、データベース323から情報を検索して読み出すユーザ・インターフェイス322のようなグラフィカル・ユーザ・インターフェイスを介してアスセス可能となるウェッブ・ベースのソフトウェア・アプリケーションを含む。本件開示の1または1以上の実施例において、例えばサーチ機構325は、インデックス機構324、インデックス329、スコア機構327とリポート機構326のような検索機器180の他の構成要素とともに、自然言語プロセッサ(Natural Language Processor =NLP)ベースの検索エンジンとを含み、希望した内容を検索して読み出す確固たる検索道具として使うことが可能である。
一般的に、図1のコンピューター150,160と170の使用者は、サファリ、ファイヤー・フォックス、ネットスケイプ、インターネット・エックスプローラ等の標準ウェッブ・ブラウザを経由してサーチ機構325にアクセスすることができる。
1または1以上の実施例で、使用者は、サーチ機構325を使って情報を要求でき、データベース323内に保管されている情報へのインターフェイスとして利用することができる。
データベース323に含まれる情報に関する様々な報告は、検索結果を表示するためのブラウザ・ベイスト使用者インターフェイスを含むリポート機構326によって作成されることが期待されている。
リポート機構326は、検索機構325を経由してデータベース323にアクセスして得られた結果のリポートを含む多様なリポートをについて、モニタにアウトプットを表示するか、又は、ハードコピーとして提供することができる。これらの報告には、図1のコンピューター・システム170のようなコンピュータの使用者によって実行された様々な検索の結果が含まれる。
これらの様々な報告は使用者に要請された特定のタイプまたは使用者に返還される情報のタイプに基いてフォーマットされて使用者に提出される。
後述する図11は、本件開示の1つまたは1以上の実施例によって提供されたアウトプットの例を示す。
本件開示の実施例によれば、スコア機構327は使用者の検索要求またはクエリに応答してサーチ機構325によって得られる結果をスコア付け又はランク付けする設定ができる。スコア機構327では、第一に適切な結果を提示できるであろう方法で結果がランク付けられるように検索結果にスコア付けするため多数のスコア分析法が採用できる。本件開示の1つまたは1以上の実施例で、スコア機構327は使用者によって設定可能であり、与えた検索クエリに応答して検索結果が返って来た時に、使用者がどの特性または評価(スコア)要素(重み付け方法)を採用するかを決定することを可能にしている。
本発明の1実施例の中で、スコアリングメカニズム327は、オリジナル検索クエリの中に含まれたN個の固有の幹ワードの発生の頻度、又は全数に基づいた検索クエリから戻ってきた書類をスコアリングするスコアリングメカニズムからなる。M個の書類が戻ってきた場合は、下記に説明される方程式(1)は、m番目の結果のスコアを決定するのに使用される方程式の一例を提供する。
Figure 2009508273
ここで、X (m)は、m番目の文書のi番目の幹ワードの発生する頻度である。
いくつかの条件下で、この“頻度重み付け”方程式は、文書内の一幹ワード以上の発生に対して特別な配慮を提供しないだろう。このスコアリング・スキームを使って、すべての幹ワードの頻度の総合が測定される。
図4Aから4Dを含む図4は、本発明の1以上の実施例に従って使われるスコアリングの例を提供する。図4Aのテーブル400は、三つの書類を確認するカラム(列)406を含み、それぞれのカラム(列)は、407と408内に示された一番目と二番目の検索用語と一致する頻度総計を有しており、三つの書類それぞれのスコアはカラム(列)409とロウ(行)401から403に示される。
図4Aを参照すると、スコアリング例は二つの固有の幹ワードを含む検索クエリを提供し、それらの中の2つの結果は同じスコアに帰還される。カラム(列)404?(406)は与えられた書類、すなわち、mの1、2または3、に相当し、ロウ(行)401から403の各自は与えられた幹ワードに対応する。カラム(列)405?(407)は、m番目の書類の一番目の幹ワードの発生頻度を確認する。同様に、カラム(列)406?(408)は、m番目の書類の二番目の幹ワードの発生頻度を確認する。カラム(列)407?(409)は、それぞれの幹ワードに関連する発生頻度に基づいたそれぞれの書類のランキングを提供し、ランキングは上記の公式(1)を使って計算することができる。
図4Aで示したように、最初の結果と一致するロウ(行)401は、一番目の幹ワードの10の発生を含み、二番目の結果と一致するロウ(行)402は、それぞれの2つの幹ワードの5の発生を含む。もし、関連性の測定がすべての幹ワードを通しての頻度の数の総数ならば、両方の書類は同じスコアのはずであり、また、検索結果は同じ関連性(妥当性)を持つ。しかしながら、少なくとも1つの実施例に従って、二番目の結果は最初の結果よりも妥当性があると考えるのが望ましい。なぜならそれは二番目の結果は最初の検索クエリで確認された幹ワードの両方が含まれるからである。このような1つの実施例に従って、スコアリングメカニズム327は同じ書類内の幹ワードの同時発生を考慮して、書類はより少ない幹ワードを含む他の書類より、関連性が高いと考える。
本件開示の実施例によれば、スコアリング・メカニズム327は1つの書類の中の幹ワード又は、多くのキーワードの発生を考慮した検索結果に対するスコアを測定する。そのような実施例に従って、スコアリングメカニズム327は頻度の結果、例えば、例として相関関係を数値化するためのX (m)を使用した結果に対するスコアを測定する。言い換えれば、1以上の実施例に従って、頻度の結果X (m)を導入することによって、同一書類内に現れる多数の幹ワード間の相互関係を計上することが可能になる。このアプローチは“強化頻度重み付け”(enhanced frequency weighting)としてこの中で言及されている。
少なくとも1つの実施例の“強化頻度重み付け”は、方程式(1)は、組み合わせ解析を用いて展開され、頻度の積とその前の項(階数)の積(in ever higher-order products)との組み合わせを、与えられた多数キーワード検索クエリの中の幹ワードの数に等しい階数(項)まで導入する。加えて、算出を維持するために、それぞれの積は、最初の項の大きさまでスケールされることができ、こうして、先行するそれぞれの項は展開される。これは、オリジナルスコアリング公式の適当な乗法、例えば上記方程式(1)のS (m)の累乗によりそれぞれの結果を割ることによって、達成することができる。その結果は、書類内の幹ワード間の高次元の相関関係によって補正されたオリジナルスコアリング公式である。N個の固有の幹ワードを含むクエリに使用可能なそのような式の一例を下記に示す。
Figure 2009508273
前述のように、方程式(1)により示されたオリジナルスコアリング公式をともなう。
上記方程式(2)は、また、下記の形式で記載できる。
Figure 2009508273
方程式(2)および(3)で表された公式を使用する例は、与えられた検索クエリ中の異なる数のキーワードをスコアリングする妥当性の効果を実演するものとして提示される。ここで、N=1ならば、スコアリング公式は図4Aに示す結果をもたらす。従って、妥当性の決定は、それぞれのファイルの中の幹ワードの発生頻度、又は数である。言い換えれば;
Figure 2009508273
しかしながら、N=2の時、二つのキーワード検索に相当するため、スコアリンク公式は次のようになる。
Figure 2009508273
図4Bは、本発明の少なくとも1つの実施例に従って、方程式(5)を使用した結果の実施例を提供する。図4Bのテーブル420は、三つの書類を確認するカラム(列)406を提供し、それぞれの文書はカラム(列)407および408に示される一番目と二番目の検索タームを有し、それぞれの三つの書類のスコアは、カラム(列)409およびロウ(行)401から403に示される。図4Bのテーブル420に示されるように、m=2に対応する結果、すなわちロウ(行)402、は、図4Aのテーブル400のロウ(行)402に示される結果よりさらに関連性が高くスコアされている。これは、オリジナルスコアリングアルゴリズムに訂正項が加わったためであり、m=2の書類が検索クエリに両方の幹ワードを含むことを計上した結果である。更なる説明として、次に述べる事はN=3を有する例の提供であり、その結果は図4Cに描写されている。少なくとも1つの実施例に従って、N=3の場合、スコアリング公式は次のようになる。
Figure 2009508273
図5図は図5Aと図5Bとからなり、本発明で開示された1またはそれ以上の典型的なケースのスコアリングの例があげられている。図5Aにおいて、少なくとも1つの実施例における1、2、3、用語に関するスコアリングの例が示されている。上述したように、方程式(4)は、検索クエリが1つの検索、ステム(幹)、言葉(用語)からなる場合の結果をスコアするのに使用することが出来る。方程式(5)は、検索クエリが2つの用語からなる時のスコアリング技術を示している。方程式(5)は、書類中の幹タームの同時発生と無関係に第1と第2用語の発生頻度を合計する第1階数または部分と、書類中の用語の同時発生を調整する第2階数部分とからなる。検索の中で3つの用語が使用される場合は、図5の方程式(6)で示されるように、第3階数は書類の中で3つの用語のすべてが同時発生した場合の調整に使用される。方程式(6)では、第1階数部分は、書類内の3つの用語の各々の発生頻度の合計に相当し、幹タームの2または2以上の同時発生とは無関係である。この式の中の第2のタームは、書類内の3つの単語のペアの同時の発生についての訂正であり、また、第3のタームは、書類内の3つの単語すべての同時の発生についての訂正である。
図4Cのテーブル430では、カラム(列)406には5種類の書類が表示され、それぞれカラム(列)407から409までの第1、第2、第3の検索用語に対応する頻度計算が示されており、5種類の書類のそれぞれのスコアがカラム(列)410とロウ(行)401〜405とで表示されている。テーブル430で示すように、方程式(6)を使用して、3つの幹タームを全て含む書類は、ロウ(行)402でm=2として表示され、同じ総計の発生頻度が集計される書類である方程式(1)により計算される例えばロウ(行)403、404に対応する書類より高くランク付けされる。m=3のロウ(行)403に対応する書類は、3つの幹タームの内の2つを含む書類で次にランク付けされる。
当該技術に熟練している当業者は、単に1つの幹タームを含む書類が必ずしも多数の幹タームを含む書類より常に低くスコアされたりランクされるとは限らないかもしれないことを認識するべきである。例えば、m=4のロウ(行)404に対応する書類が3つ用語の合計(計算)で15ではなく30だったとすると、それはm=2の書類より関連性があると考えられるだろう。しかしながら、現在開示しているスコアリングの式によれば、キーワードの全体の頻度計算の合計が比較可能か若しくはある程度は比較可能なら、その書類から検索クエリからの多数のキーワードがみつかったときには関連性の増加を導き出している。
方程式(6)を使用して、もしテーブル430のm=4に対応する書類が15でなく30の3つの用語の合計(計算)だったとすれば、それは、テーブル430のロウ(行)402のm−2の書類のランクがより高い地位を占めるであろう。したがって、方程式(6)は同じ書類に現われる多数のキーワードを積算するが、特定の状況では、偶然に大きな合計の計算が発生した場合、マッチングのより劣ったものについての関連性を強調し過ぎることになるかもしれない。
1またはそれ以上の実施例によって上記を適用する場合、N>1の場合は、方程式(6)のスコアリングを変更することができる。より詳細には、Aが固有の幹タームの最小基準値(threshold)数を表わすところで、調整可能な遮断数に4<Nを導入することが可能である。書類に現われる固有の幹タームの数がA未満である場合は、書類のスコアは0にセットされる。その実施例によれば、基準値(threshold)数は、結果がN幹タームを横切る高い集計の発生頻度であって、幹ターム間の相関性がほとんどない状況にアドレスするのに使用することができる。そのような場合、基準値(threshold)はユーザに返された検索結果から結果を除去するべきかどうかを決めるために使用することができる。そのような実施例によれば、mth書類に現われる明確な(distinct)幹タームと等しいQ1nによって、方程式(6)のスコアリングの式を図5Bで示される方程式(7)のように変更することができる。
一例として、図4Cのテーブル430で示されるN=3のケースを再考する。図4Dのテーブル430は、テーブル430で示される5部の書類を表示するカラム(列)406を提供する。それぞれの書類には、第1、第2、第3の検索用語に関する頻度計算が407から409にそれぞれ示され、5部の書類のそれぞれのスコアがカラム(列)410のロウ(行)401〜405に示される。A=2のようにAに選ばれものの計算されたスコアが図4Dのテーブル440に示されている。Q=2とQ=3が方程式(6)に当てはめられる。他の結果は、方程式(7)に基づいて、0のスコアとしてテーブル430に示されている。
スコアリングの決定に基準値(threshold)数を用いる実施例である、方程式(7)を使用すると、検索クエリの多数の幹タームの同時発生に基づいて書類の関連を識別することが可能である。 現在開示されている1つまたは1以上の実施例によれば、他の基準は単独であるいは上述のスコアリング技術と結合して使用することができる。
現在開示されている1つまたは1以上の実施例では、ユーザは全ての又は色々の特徴のあるスコアリングメカニズム327を標準的頻度重視に制限されることなく及び/又は頻度補強(強調)重視によることなく選択することができる。
図3を再び参照すると、現在開示されてる1つまたは1以上の実施例では、検索機器180にキュリティ・メカニズム328を包含させることができる。
セキュリティ・メカニズム328は、捜索機器の本性または役割に基づいて、補強された検索結果を供給するセキュリティ・モデルを提供するように形成される。現在開示されている1つまたは1以上の実施例では、各ユーザがネットワーク上で本人確認を認証し検索機構325にアクセスするためのユーザIDおよびパスワードを持たなければならないセキュリティ・メカニズム328としてのログインモデルを採用している。セキュリティ・メカニズム328は以下により詳細に記述される。
インデックス329は、ネットワーク120によるアクセス可能なシェアに内容が変更されてインデックス・メカニズム324で構築されたインデックスを表わす。
コンピューター150,160,170のうちの1つのコンピューターのユーザからの指示で与えられた検索クエリに関連する内容を捜し当てるために、インデックス329は検索メカニズム325によって使用される。インデックス329は、ネットワーク120によるアクセス可能なシェアに対するどんな内容の変更も正確に反映するように形成可能な間隔で定期的に再構築することができる。
インデックス329はデータベースの管理システム323からは離れて表示されるが、データベースの管理システム323を使用して、インデックス329が作成され維持されることは認識されるべきである。インデックス作成および検索のために使用されたデータ・モデルの1つの例の検討が以下に開示される。
当該技術に熟練している当業者は、次のことを認識するべきである、すなわち図3において、インデックス・メカニズム324とサーチ・メカニズム325とレポート・メカニズム326と、スコアリング・メカニズム327とセキュリティ・メカニズム328は別個の主体となっているが、インデックス・メカニズム324とサーチ・メカニズム325とレポート・メカニズム326と、スコアリング・メカニズム327とセキュリティ・メカニズム328は、単一のソフトウェア・プログラムあるいはアプリケーションか、プログラム製品の中へ組み入れられるかもしれない。
図6を参照すると、現在開示されている1以上の実施例に関する検索機器に使用するデータ・ファイル用のインデックスを維持および更新する方法600が表記されている。図6に示されているように、データ・ファイルのインデックス作成は、ステップ610でネットワーク120により利用可能と判明した共有リソースについて実行される。
ステップ610の一部として、ネットワーク120は、共有リソース、共有可能リソースまたはシェアを判別のために検索する。さらに詳細には、検索機器180が共有可能なリソース・シェアを検索またはここでは巡回またはウェブ巡回し、インデックス作成や検索を促進するために各シェアに付随しているデータベース管理システム323を利用して、情報の蓄積を維持・更新する。検索機器180は、サーバ若しくはネットワーク上に共有できると認識されて蓄積された全てのファイルを含むネットワーク検索が可能であり、単なるHTTP〔index.htm〕検索ではない。例えば、共有可能なリソースはハードディスクドライブであってもよく、また他の記憶メディアや固定または離脱可能な1または1以上のフォルダー・ファイル・文書・ページなどであって、“共有可能”のアクセス権付きでその上に記憶されたものであればよい。さらに、共有可能なリソースは、典型的にはウェブ・ブラウザによって表示されるウェブ・ページを含むことができる。
初期のインデックスはデータベース管理システム323とインデックス・メカニズム324(ステップ620)を使用して構築することができる。インデックス作成は今ではどのような方法でも遂行できることが技術に熟練している人々に知られており、その後も開発され・認識されている。インデックス作成の方法の一つとして、1または1以上の実施例によれば、各データ・ファイルの作成期日および/または最終変更日が捕捉され記憶される。インデックスの構築と共に、データ・サーバ190上に記憶されたデータ・ファイルに含まれるキーワードあるいは用語を使用して、キーワード・データベースが構築される(ステップ640)。
少なくとも1つの実施例に従って、例えばユーザから出された検索クエリの提出に応じた検索結果アイテムを見つけ出す(識別する)ために、検索メカニズム325でキーワード・データベースにアクセスすることができる。1つまたは1以上の実施例に使用されるインデックス作成と共有リソース情報を記憶するためデータベース・モデルが以下に詳細に述べられる。1つまたは1以上の実施例では、共有可能リソースの変更すなわち共有可能特性が変わったことを認識するため、および/またはインデックスに反映されている内容の変更を認識するためにインデックスおよび/またはキーワード・データベースを再構築することができる。1つまたは1以上の実施例では、1つまたは1以上のインデックスおよびキーワード・データベースをいつ再構築するかを決めるために設定時間を使用することができる。そのようにした実施例では、もしステップ640で時間が経過していない(ステップ640が“NO”)と決定された場合、プロセス600はステップ640と650で続行させて、時間の経過を待つことができる。もしステップ640で時間が経過した(ステップ640が“YES”)と決定された場合、ネットワーク120によってステップ650の検索が実行され、それぞれステップ660および670で再度インデックスおよびキーワード・データベースを構築する共有可能リソースを探し出す。
1つまたは1以上の実施例によれば、インデックスを再構築する場合、先に付けられた作成期日および/または最後の変更期日と、インデックス作成される各ファイルに付いている変更期日とを調べて対比する。関連する日付に変更がなかった場合はファイルに再度インデックス作成する必要はなく、キーワード・データベースのファイルについているキーワードも変更する必要がない。ただし、例えば新しいファイルの変更期日と従前の期日とを調べて既存のファイルが変更されたと判明した場合、新しい変更期日が付けられ、書類は再度インデックス作成され、キーワード・データベースのその書類に関連するキーワードは更新される。
更に新しいファイルがデータ・サーバ190に加えられると、それはインデックスに加えられ、さらに適当なキーワードが与えられキーワード・データベースに加えられる。 しかしながら、データ・サーバ190に与えられたファイルがもはや存在しない、インデックスのファイルに関連するすべてと、キーワード・データベースに記憶されていたそのファイルに付いていたキーワードを削除することができる。このようにして、キーワード・データベースを再構築することができる。
図7によれば、本件開示の1つまたは1以上の実施例による、カスタマイズされた検索結果を提供するセキュリティ・メカニズム328の使用が図示されている。少なくとも1つの実施例によれば、セキュリティ・メカニズム328は様々なレベルのセキュリティ機能が提供できるように形成されている。本件開示の1つまたは1以上の実施例によれば、インデックス作成された内容およびクエリ(検索問)の結果の両方ともがセキュリティ・メカニズム328によって無許可アクセスから保護されている。無許可のアクセスからデータを守ることへのアプローチは企業レベルで、また、デスクトップで展開して例えば適切にまたは所望の通りに装備される。本件開示の1つまたは1以上の実施例によれば、セキュリティ・メカニズム328が内部データベースとなっており、セキュリティ・メカニズム328によって許可されたシステム・ユーザだけが情報へアクセスすることを保証するために様々なユーザおよび背景の微妙な情報を追跡している。
本件開示の実施例によれば、共有リソースが確定され、インデックスとキーワードのデータベースが作成された後、インデックスが付けられ内容のセキュリティは、データベース740の望まれたセキュリティと結びつけられて装備される。既に説明した通り、データベース740は、多数の異なるデータ記憶装置からのデータからなり、データベース740のデータに割り当てられたセキュリティはデータセットからデータセットまで変わることができる。図7の例では、データベース740はドメイン1、ドメイン2およびドメイン3と認定された3つの別個のデータ記憶装置から構成されている。当該技術に熟練している当業者であれば、3つの別個のデータ記憶装置とドメインを使用するということは単に図面上のことであり、本件に開示されている多様な実施例との関連で、より多い又はより少ないデータ記憶装置および/またはドメインが使用される得ることが認識できる。
1つまたは1以上の実施例によれば、検索メカニズム325によって返され、報告メカニズム326によって報告された検索結果に関するセキュリティは、ウェブ・サービスの制御(roll-based=役割ベース)管理によって装備できる。そのような実施例においては、1または1以上の統合したサーバのシステムを構築する。その中では、パスワードによって保護され、サーバによって共有されているデータベースが様々なタイプの管理上の情報および通信を記憶するリレーショナル・テーブルとして使用されている。本件で開示する実施例では、ユーザ、グループ、ドメイン、ユーザロール(役割)およびドメイングループがセキュリティ・コンポーネント(構成要素)と認定されており、データベース740に記憶された様々なタイプのデータへのアクセスを許可または不許可またはセキュリティ・コンポーネントの状態によっては検索メカニズム325を介してアクセスの可能性ありとするためにセキュリティ・メカニズム328によって使用される。
図7の中で示されるように、ユーザは、特定のドメインおよび/またはデータ・ファイルでアクセスするように識別されたグループであって、グループ710、720、730のような別個のグループに配置される。この方法では、セキュリティ・メカニズム328はカスタマイズされた検索結果を提供し、要注意なデータ・ファイルを保護するために使用される。ユーザ1、ユーザ2、ユーザ3はユーザ・グループ710に区分され、ユーザ3とユーザ4はユーザ・グループ720に区分される。同様に、ユーザ4とユーザ5はユーザ・グループ730に割り当てられる。
図7の中で示される例では、それぞれユーザ2、ユーザ3、ユーザ4はデータベース740に同じ検索クエリを送出する。しかし、これらのユーザはそれぞれ異なるユーザ・グループに割り当てられているので、それぞれのクエリに応答した結果は本質的に異なるものとなる。ユーザ2からの検索リクエストに応答して、セキュリティ・メカニズム328は、データセット750に対しユーザ2に返送すること許可する。 同様のユーザ3からの検索リクエストに応答して、データセット760から返送される。 最後に、ユーザ5から提出された同様の検索リクエストに応答して、セキュリティ・メカニズム328は、データセット770から返送されることを許可する。
ユーザ3は、ユーザ・グループ710と720の両方に属するので、どちらのグループのアクセス権がユーザ3に与えられたかを決定しなければならない。この決定は、希望されているセキュリティ・レベルを維持するために行なわれる。例えば、1又は1以上の実施例で使用されているセキュリティ・モデル1つには、2つのユーザ・グループのものより厳しいアクセス権が適用されている。また、1又は1以上の実施例で使用されている他のセキュリティ・モデルでは、2つのユーザ・グループのものより自由なアクセス権が適用されている。希望するセキュリティ結果を必要なすべての方法で達成するために、ユーザを多種類のユーザ・グループへ移転することは当該技術に熟練している当業者にとっては明らかであるに違いない。さらに、各ユーザ・グループは個人ユーザと同じように小さくすることができる。
これらを総合すると、様々なユーザ・セキュリティのシステムの内容は、システムの登録ユーザを確定し、さらに、どのユーザがどの情報にアクセスを許容されるかを決めるためのフレームワークと方法論を提供することができる。 各ユーザに関する情報は、セキュリティ・メカニズム328のデータベースに付随したデータベース・テーブルに記憶される。1つまたは1以上の実施例によれば、様々なフィールド(場)の中に、図1の検索装置180のユーザの少なくとも特定のユーザの姓名とパスワードを含ませることができる。
1つまたは1以上の実施例によれば、グループアクセス(許可)は、それぞれのアクセス(許可)されたグループについての名称のようなフィールド(場)からなるデータベース・テーブルに同様に記憶されるもので、許可されたグループはカスタマイズされたテキスト・ストリングからなり“販売”、“サポート”、“管理”のような企業の役割または機能が書かれる。1つまたは1以上の実施例によれば、ユーザに与えられたグループ用の特定のグループ許可に基づくセキュリティ関連の許可および制限をユーザは継承することができる。
検索可能なドメインがデータベース・テーブルに記憶され、そのフィールドによってウェブサイトURIテキスト・ストリングのようにそれぞれのドメインの位置が特定され、ユーザのリクエストによるインデックス・メカニズム324のインデックス操作により内容が抽出できる。一般に、ユーザはそのユーザおよび/またはそのユーザの属する特定のグループが認定され、検索可能ドメインテーブルの中でそのドメインの検索だけが可能と限定される。
ユーザロールはデータベース・テーブルに記憶させることができ、そのフィールドでシステム・ユーザとグループ許可との関連付けが行われ、その結果、ユーザが企業内で果たすべき1つまたは1以上の役割が確定される。特に、システム・ユーザ・テーブルのプライマリ(主要)キーが多数のレコードの中に現われるフィールドが存在し、グループ許可テーブルのエントリのプライマリ(主要)キーのある第二のフィールドに毎回ユニークに対応している。
同様に、1または1以上の実施例によれば、ドメイングループをそのフィールドで検索可能なドメインとグループ許可とを関連づけるデータベース・テーブルに記憶させることができ、それにより、企業の1つまたは1以上のグループ許可にドメインを関連させる。
検索可能なドメイン・テーブルのプライマリ(主要)キーが多数のレコードの中に現われるフィールドが存在し、グループ許可テーブルのエントリのプライマリ(主要)キーのある第二のフィールドと毎回ユニークに対応している。
1つまたは1以上の実施例によれば、上述のデータベース・テーブルおよびその関連性はユーザ検索リクエストに対する応答結果を保護するためにロールベース(RB)セキュリティ・プロトコルを提供するために使用することができる。特に、上記詳述した同じセキュリティ・コンポーネントおよびシーケンス/番号付けのスキームを使用すると、特定のセキュリティ・プロトコルが装備(インプリメント)できる。ユーザ認証は、要求した個人のユーザ識別のためのシステム・ユーザ・テーブルの記憶と入力したユーザ名とパスワードとの照合一致(マッチ)によって行われる。企業のグループのテキスト・ストリング名はグループ許可テーブルから得られる。企業に関する全ての内容のドメインは検索可能なドメインテーブルから得られる。ユーザ・ロール・テーブルは、認証されたユーザが属するグループを示す。ドメイングループ・テーブルは、与えられた検索可能なドメイン用に、どのユーザグループがそのドメインの内容にアクセスすることができるかを示し、ユーザ・ロール・テーブルとグループ許可のプライマリ(主要)キーの照合一致により、どの検索可能なドメインで認証されたユーザが見ることを許されているかを示す。
このように、少なくとも1つの実施例によれば、上記の管理情報は、認証されたユーザがその個人の企業内の役割に基づいて見ることを許されるドメインから単に情報を取り出す検索リクエストのクエリをフィルターするために使用することができる。グループ許可が検索可能なドメインに割り当てられた場合は、他の細分化レベルを使用することもできるが、検索制限の細分化のレベルは、検索可能なドメインのレベルとすることが出来ることは注目される。言いかえれば、許可の与えられたユーザには、典型的なファイル・システムでのように、常にではないが個人的なドキュメントへの許可が与えられる。しかしながら、現在開示されている1つまたは1以上の実施例では、管理者は検索可能なドメインを微細分(例えば、単体ファイルレベル)から、中細分(1組のサブディレクトリー・レベル)さらに、粗細分(例えば全ウェブサイトレベル)まで変化させて細分化すると決めることができる。したがって、どのようにグループ許可が定義されるかによって、検索可能なドメインの細分化も変更可能である。感度のレベルが共通するドキュメントは典型的に1つのグループとされるので、一般にドメインも相応して決められる。
図3と図8を参照すると、現在開示されている1つまたは1以上の実施例による検索結果のスコアリングとランキングの方法800が示されている。検索リクエストをユーザ(ステップ810)から受領すると、データベース323に連結している検索メカニズム325とインデックス・メカニズム324が展開されて要求された検索を実行し、結果を取り出す(ステップ820)。
結果が得られるとスコアリング・メカニズム327により、検索結果のスコアリングの認定が行われる。スコアリング・メカニズム327は個々に詳述された方程式のどれかを使用して上記のように結果にスコアをつける。図8の中で示されるように、検索結果をスコア(評価)するために、前述の様々な重み付けメカニズムが使用されることも、また使用されないこともある。例えば、1つまたは1以上の実施例では、頻度の重み付け(頻度高重視 )(ステップ830)を採用することにより検索結果を認定することができる。1つまたは1以上の実施例によれば、1つまたは1以上の重み付け要因のアプリケーションはユーザでも設定可能であり、また、最大の利益を求めてスコアリング・メカニズム327を各ユーザが設定することも可能である。
一旦、ユーザが選択した希望の重み付け要因が検索結果に適用されると、検索結果は呼び出されて(ステップ840)、ユーザに開示(ステップ850)される。このように、検索結果は検索機器180の個々のユーザによって強化されカスタマイズドされる。
本件開示の1つまたは1以上の実施例では、例えば1つまたは1以上のキーワードから成るクエリに応答して実行される検索の促進のために、検索メカニズム325は検索モデルを使用することができる。検索モデルは、検索とインデックス作成に使用されるデータ・モデルと、ランク付け操作と、ワード・ステミング(語の幹語化)と、品詞タグ付け(parts-of-speech tagging)技術、および、イニシャルとインクリメントのインデックス作成を実行する間に遭遇する新語を学習することができる用語集(lexicon)とからなる。加えて、検索モデルは、より詳細に後述されるパイプライン・アーキテクチャーを使用することができる。検索モデルはさらに検索結果アイテムである、例えば、本件開示の1つまたは1以上の実施例に使用された書類のようなクエリの結果をランク付けするためにスコアリング・メカニズム327で使用して実行されたもののスコアリング、またはランキングを含むことができる。
ワード・ステミング(語の幹語化)は、単語から共通の形態論と屈折語尾(語尾変化)を取り除き用語を標準化するために使用される。ワード・ステミング(語の幹語化)機能の1つの例はマーティン・ポーター・ステミング・アルゴリズムである。品詞タグ付け(parts-of-speech tagging)の1つの例はペンシルバニア大学の(Penn) Treebank Tagset である。
1つまたは1以上の実施例において使用できる検索モデルとして、使用されるデータ構造のデザインの実例的な記述と、支援するデータベースのレイアウトと、インクリメントのインデックス作成が提供される。更に詳細には、データベースのレイアウトと、書類内容から構築されたインデックスの長期保存を維持するために、それがどのように使用されるかが検討される。加えて、インデックス作成作業に短期働く記憶を供給するためにメモリに存在するデータ構造のデザインが検討される。インデックス作成作業の検討が提供され、先のインデックス作成に基づいて最終ユーザに結果を送り返すキーワード検索モデルがどのように適用されるか示すために、検索クエリの主要な使用のケースが提供される。
本件開示の1つまたは1以上の実施例の中で使用されるデータベース・スキームの実証的な例が、図9Aと9Bとからなる図9で示される。スキームは後述される、キー、ドメイン、uri(URI)、ページ、用語集(lexicon)、ランク、単語テーブルとからなる。
本件開示の1つまたは1以上の実施例では、検索クエリの内部結合を形成するために使用されるデータベース・テーブル間の関係は明確に述べられない。本件開示の実施例によれば、プライマリキーまたは外部キーの使用は、SQL INSERTステートメントの使用によるものでなくファイル・インポート(取り込み)・メカニズムによる新らしい記録の書き込み(insert)を許可するために制限することができる。全てではないにしても殆どのデータベース・ベンダーは、取り込まれるデータのテーブルが自動インクリメンティング・フィールドと認定されているか、および/または、明確な外部キー関係と認定されて取り込まれるのでなければファイル・インポート(取り込み)が許可されないことは明白である。
ファイル取り込みメカニズムは効率を上げるために本件開示の実施例の中で使用することができる。検索モデル・インデックスを創出する際に作成されるレコードの数を考慮して、特にリレーショナル・データベース中のデータベース・テーブルにレコードを挿入するのにSQL INSERTを使用すると、時間の消費が顕著で非実用的である。 従って、開示した実施例では、データベースに挿入されることになっているデータは、一時的ファイルまたはバッファに最初は書かれており、次に、データベースへ取り込まれる。このアプローチの例外の1つの例として、自動インクリメントされたインデックス・フィールドと認定されたドメイン・テーブルおよび、インデックスのカウントを維持するキー・テーブルとが含まれる。比較的少量のレコードしか含まれないので、ドメインとキー・テーブル中でレコードを作成するのにファイル取り込みメカニズムを使用する必要はない。
本件開示の1つまたは1以上の実施例では、ドメインと、uri(URI)と、ページ・テーブルとがインデックス作成の間に訪れたドキュメント・ページの情報を記憶するために使用される。ドメインは、ウェブサイトまたはファイルのディレクトリーのように、書類を記憶することができる位置を示す。このモデルによれば、インデックスが付けられるすべてのドメインはドメインテーブル中のエントリとして記録することができる。ドキュメントは特定のドメインに付加されているURI(Universal Resouce Indicater)によって指定される。インデックスが付けられた全ての書類はuriテーブル中にエントリとして記録することができる。特定の書類およびドメインに対応するページ・テーブルに入力される記録が訪れた全てのページについてある。ページ・テーブルに入力されたレコードがありえる。例えば、ファイル・システム・ディレクトリーに存在する電子メールのアーカイブにインデックスが付けられると、アーカイブの各電子メールはページ・テーブルのエントリとして記録される。
さらに上述のデータ・モデルに関して例示すると、用語集(lexicon)とランク・テーブルが、ネットワーク120を介して、アクセス可能な情報のインデックス作成に用いられている。特に、キーワード検索モデルの学習辞書もある用語集(lexicon)テーブルには、各単語の品詞を含むインデックス作成のアルゴリズムで知られているすべてのオリジナルでケース・インセンシティブ(大小文字無区別)な言葉へのエントリも含まれている。POS(品詞)フィールドは、例えばPenn Treebank tag setにより構築された限界をコンマで定めたタグのリストである。さらに、用語集テーブルは、既知のオリジナル言語のセットから構築される全ての幹タームへのエントリを含むことができる。用語集テーブルの全てのエントリは、lkeyフィールドによって表示される固有のインデックスと連結している。さらに、ukeyフィールドは幹タームに対応する特定のlkeyインデックスとなることができる。ukeyフィールドは、同じテーブル内でオリジナル言語間の関連と、それに対応する幹タームを構築するために使用することができる。すなわち、例えば、用語集(lexicon)の中のすべての幹タームエントリはlkeyと幹タームエントリのskeyの評価が同一であるように自己関連的でありえる。用語集(lexicon)テーブル内で知られてように、ランク・テーブル中のエントリは書類のページ内での幹タームの発生頻度を記録する。
単語テーブルは、その後の検索結果のプレゼンテーションで強調できるように、インデックス作成の間に出現したオリジナル言語の位置を記録する。単語テーブルの定義内ではフィールドskeyの外観であるので、オリジナル言語は単に対応する幹タームで関連付ける必要があるだけである。
本件開示の1以上の実施例の中では、上で検討されたように、バッファとファイル・インポート・メカニズムが使用されうる。データ構造はそれがデータベースに書かれる前にデータ用のバッファを提供するために使用される。バッファされたデータは、uri(URI)、ページ、ランクおよび単語テーブルのフィールドに対応する。データ構造およびバッファ・プロセスについてより詳細な検討が以下に展開されるが、1つまたは1以上の実施例によれば、バッファに蓄積されたデータはインデックス作成の最後に記録されるか、若しくはメモリが予め定められた有効領域の基準値(threshold)に達した場合はメモリを解放するためにデータのフラッシュが必要となる。新たな記録はファイル・インポート(取り込み)・メカニズムによってバッファされたデータからテーブルに書き込まれ、SQL UPDATEコマンドによって既存のレコードが更新される。
インデックス作成使用される別のタイプのデータ構造はN項トライ木で、Nがアルファベットの文字数(大文字)で、数字と句読点が加えられる。このツリー構造はメモリの中に全用語集の内容を保持するのに使われ、例えば、速い検査(単語検査)を提供するのに使用される。最初、インデックス作成より前に、ツリー構造は用語集テーブルの内容を使用するためにあった。インデックス作成の間に新語が出現した場合、それらはツリーに加えることができる。インデックス作成の最後に、ツリーの内容は用語集テーブルに書き戻される。好ましくは、上述の通り、ツリーの内容はファイル・インポート(取り込み)・メカニズムを使用して、用語集テーブルに書き戻すことができる。例えば、インデックス作成の間に出現した新語を表わすツリーのエントリはファイル・インポート(取り込み)・メカニズムを使用して、一時的にバッファまたはファイルを介して用語集テーブルにインポート(取り込み)することができる。
本発明の実施例によれば、トライ構造内でのテキスト・ストリング検索が速いので、N項トライ木構造は言語の大辞書に使用することができる。列の各要素が潜在的に子ノードである場合、ツリーの各ノードはNサイズの項からなる。ポインター項としてNサイズ項を実装するアクセス可能なプログラミング環境内のインプリメンテーションのためのメモリへの配慮は比較的最小かもしれない。1つの実証的な実施例では、N=69で、それは過度のメモリ確保を制限するのに十分な程度に小さい。
図10では、開示された少なくとも1つの実施例による3項トライ木の例が示されている。示された例において、ツリー1000は、大文字A、B、Cのアルファベットから構築される。3つの各要素(円)が長方形に囲まれた配列の1002Aから1002Dとなり、配列の上段の要素がA、中段の要素がB,下段の要素がCの文字に対応している。1003Aから1003Dの円は、割付け(配置)されたノードを表わす。1001Aから1001Dの正方形は、単語の品詞のようなノードによるデータの割付け(配置)を表わす。図10で示される3 項トライ木の例は、AB、ABC、C、CCという文字のためのデータの記憶装置を表している。配列1002Aの1つのノード指標である1001Aは、要素1003Aが“C”の文字に相当すると割付けられたことを示している。同様に1001Bから1001Dのノード指標は、それぞれ配列1002Bから1002Dの中での“C”、“B”、“A”の文字の割付けに相当する。配列1002Aは文字“C”に相当する。配列1002Aから1002Bへのトラバースパス1004に従って、文字“CC”が要素1003Aと1003Bから形成される。同様に、次のトラバースパス1005により配列1002Bと1002Cは要素1003Bと1003Cから文字“AB”を形成することができる。 文字“ABC”は、 要素1003B、1003C、1003Dと、配列1002B,1002Bと1002Cのそれぞれと、トラバースパス1005及び1006によって形成することが出来る。
本件開示の1つまたは1以上の実施例では、インデックス作成はパイプライン・スレッド・アーキテクチャーを使用して実行することができる。 更に詳細には、インデックス作成の連続性はセグメントに分割することができ、処理能力(量)を増強するためにパイプラインの複数手順に割り当てることができる。例えば、1つまたは1以上の実施例によれば、ウェブクロール(巡回)をパイプラインの第一手順に割り当て、第二手順を書類の初期のフォーマット解析を実行するために使用することができる。追加の手順は(精巧なイメージ認識アルゴリズムを適用する)書類によってさらなるパス用に使用されるかもしれない。パイプラインの最終手順の1つでは、インデックスの付けられた内容はワーキングメモリに書かれる。
本件開示の実施例で使用されるパイプラインのアプリケーションの1つの例では、複数手順の1つにウェブの巡回から、フォーマット解析、言葉のインデックス作成までのインデックス作成タスクの実行をすべて割り当てることができる。1つまたは1以上の実施例によれば、連続するタスクのすべての連結はインデックス作成工程に含まれる。
開示された1つまたは1以上の実施例において、ここに詳述されるように、インデックス作成には用語集に加えられる新語を識別するため又はネットワーク120上で見つかった他のアイテムのための書類解析が含まれる。さらに、各書類に関しインデックス作成することは、書類内に含まれている単語、これらの単語の各々の位置、および書類で見つかった単語の発生の頻度を識別することからなる。
したがって、インデックス作成の間に、本件開示の実施例は、用語集の新語学習の能力を考慮する。インデックス作成が始まると、ここに検討されるように、用語集の現在の内容はメモリにロードされる。これはあらかじめ定められたエントリで、品詞と対応する幹タームが視覚による検査のように注意深く考察される。新しい語が学習工程の一部に入った場合、それらの幹タームは例えばPoterステミング・アルゴリズムを使用して評価することができる。さらに、個々の新しい語には、例えばPenn Treebank tag setによるNNタグを使用してデフォルト品詞を割り当てることができる。本件開示の1つまたは1以上の実施例に関してさらに熟考され、キーワード検索モデルの用語集は、例えば、最終利用者に送られたあらかじめ定められたエントリのある又は全くエントリのないバージョンで初期化することができる。
以下に、本件開示の1つまたは1以上の実施例の中で使用されるキーワード検索モデルと共に使用することができるインクリメントのインデックス作成の詳述(検討)を提供する。 インクリメントのインデックス作成の1つの実装アプローチによれば、2つの別個の時間の評価である:(i)インデックス作成操作のスタート時間(start_time )、インデックス時間(index_time)および(ii)最後の変更時間(last_mod__time)がそれぞれ訪れた書類に残される。これらの値は、上述のデータベース・スキームのuriテーブルの各レコードのindexjimeとlast_mod_iimeのフィールドに、それぞれ記憶される。
少なくとも1つの実施例でインデックス作成が始まると、最後の変更時間の比較を促進するために、uriテーブルに記憶された書類情報はメモリ中のデータ構造に好ましくはロードされる。データ構造で書類を見つけることができない場合、それは、その最後の変更時間および現在のインデックス作成のスタート時間と供にデータ構造に加えられる。書類がデータ構造によって見つけられた場合、その変更時間は、書類に対応するデータ構造で記憶されていた変更と比較される。2つの時間が同じ場合、書類は再度インデックス作成されることはない。そうしないと、書類は再度完全にインデックス作成され、つまり、全てのページ、および、そのlast_mod_timeおよびindexjtimeを含む書類に関係する情報は、データ構造の中で更新されることになる。
少なくとも1つの実施例によれば、インデックス作成オペレーションの完成前に、一旦インデックスが付けられた内容が、取り込まれた又は更新されたかについて、データベースの“ 最終チェック(final scrub)”がおこなわれる。この最終チェックでデータベースから古いレコードを取り除くことができる。例としては、インデックス作成のオペレーション中にもはや存在しないもの(例えば、現在のインデックスオペレーションでインデックス作成したドメイン中には存在しない書類)や、又は、何かの理由でインデックス作成ができないようなものと識別された書類に相当するエントリである。インデックス作成オペレーション中にそのように識別された書類は、uriテーブルからそれに対応するエントリおよびデータベース中の他のテーブルと明示的または暗黙的な関係にあるものを削除することにより除外する。したがって、例えば、さらにそのような書類のページはすべてページ・テーブルからを削除することができる。uriテーブル内の古いレコードは、index_timeフィールドの評価が現在のインデックス作成のスタート時間とは一致しないものである。
以下に、エンドユーザからのリクエストに基づいて作成されたクエリのアプリケーションの例が示される。
SELECT skey, pos FROM lexion WHERE word= ‘FOO’;
例において、クエリは上述の検索モデルに対して処理される。例としてのクエリはキーワードとしてユーザのリクエスト(例えば、ユーザのリクエストが単語" FOO "を含む書類の要請かもしれない)から取り上げられた " FOO " を含む。以下に示されたクエリはモデル・データベースの用語集テーブル中の個々の固有なキーワードを調べるために使用することができるキーワード検索モデルの用語集テーブルを含むSQLクエリである。データベースの用語集テーブルは、単語とそれの幹へのエントリを含んでおり、各単語とその幹との関係を維持している。サンプルSQLクエリを使用して、クエリのキーワードがデータベースで見つかった場合、単語の品詞(pos)と関連する幹ターム(skey)を得ることができる。単語が主に名詞である場合、つまり、Penn Treebankの表記でNNあるいはNNP品詞であった場合は、データベースの次のSQLクエリはインデックスが付けられた書類のページ内での幹タームの発生頻度を得るために実行することができる。ここで後となるSQLクエリの例は以下のとうりである:
SELECT domain_name, uri, page_num, pagejitle, page_freq
FROM rank, page, uri, domain
WHERE (rank.skey=12345 AND rank.pkey=page.pkey AND page.ukey=uri.ukey AND uri.dkey=domain.dkey)
上記のSQLクエリは内部結合の一例であり、前記で紹介した書類とページとランク・テーブルとの間の関係を活用する。このように、書類の関連するページはスコアリング・オペレーションの後、エンドユーザに返すことができる。書類の関連するページはここに記載されたスコアリング・メカニズム327によりスコアリング・オペレーションが結果をソートするために実行された後でエンドユーザに返すことができる。開示された1つまたは1以上の実施例によれば、結果にゼロのスコアが付くとエンドユーザに返される前にリストから除去される。
本件開示の1つまたは1以上の実施例によれば、検索装置180が共有リソースを提供するサーバあるいはシェアを識別する。ブラウザ・サービスまたはサーバは、ネットワークドメイン上の利用可能なリソースのリストを提供する。マスター・ブラウザは、コンピューターと共有リソースのメインまたはマスター・リストを維持する。例えば、すべてのworkgroupsまたはドメインは1つのマスター・ブラウザを持つことができる。したがって、マスター・ブラウザは、共有リソースのマスター・リストを維持する。また、ブラウザ・サーバは、共有リソースのマスター・リストの一部分を維持する。これらのリストは追加または削除された共有リソースを反映するために定期的に更新される。
本件開示の少なくとも1つの実施例によれば、検索装置180は、SAMBA(共有リソースに関する情報を提供するオープンなリソースユーティリィティ・スイート)を使用して、共有可能なリソースを識別(確認)するためにネットワーク120を検索する。SAMBAユーティリィティ・スイートのためのドキュメンテーションはwww.samba.orgで見つけることができる。
SAMBAユーティリィティ・スイートの1つのユーティリィティとして提供されるのはSMB treeであり、それはリストを識別するネットワークをブラウズするために使用することができる、例えば、ツリーの形式で、既知のドメインとそのドメインのサーバおよびサーバ上のシェアを示している。このユーティリィティがドメイン、サーバおよび/またはシェアの正確で完全なリストを必ずしも提供しないことが本件の発明者によって明らかにされた。
従って、本件開示の実施例では、他のSAMBAユーティリィティがSMBtreeユーティリィティの補助として、ネットワークによってアクセス可能なシェアのより完全な識別を得るためにするために使用される。
SMBtreeユーティリィティの補助または替わりとして使用される別のSAMBAユーティリィティは、マスターとブラウザの検索ユーティリィティで、それはNetBIOSの名称とともに、全てのブラウザつまりネットワークのマスター・ブラウザおよびブラウザ・サーバに置かれている。別のユーティリィティであるSMB clientユーティリィティは、その後、従前のユーティリィティによって識別されたサーバからのディレクトリーの情報を得るために、本件開示の実施例の中で使用される。さらに、SMBtreeユーティリィティはサーバ上にあるサーバとシェアのリストを提供するために使用することができる。新しいサーバが返されなくなるまで、そのプロセスは反復して実行される。開示された1つまたは1以上の実施例では、反復プロセスがPERLスクリプトとして実装される。
例えば、上記の反復プロセスを使用して発見されたシェアは、共有ファイルへのアクセスを提供するためにマウント(装備)される。すなわち、例えば、サーバ、記憶機器、おおび/またはファイル・システム、記憶装置、ディレクトリー、ファイル等からなるネットワーク装置に参照を付けるマウント(装備)作業は、参照付けられたアイテムをアクセス可能にする。SMBのプロトコル/ファイル・システムでは、装備されているSAMBAを上述の反復プロセスを使用して発見された共有ファイルを装備するために使用することができる一方、SMBプロトコルの古いバージョンでは、デジタル署名、またはデジタル記名をサポートしない。これは、装備する作業の一部に関係するデジタル署名のような認証技術を使用するファイル・システムとの非互換性を結果として生じる。例えば最近の装備であるマイクロソフトの装備であるCIFSプロトコルは、マウント認証のためにデジタル署名を使用している。
このように、開示された少なくとも1つの実施例では、CIFS VFS (Common Internet File System, Vertual File System = 共通のインターネット・ファイル・システムの仮想ファイル・システム)が、上述の反復プロセスを使用して発見されたシェアをマウント(装備)するために使用される。CIFS VFSは、サーバや記憶機器のようなシェアへのアクセスを許可するSAMBAと共同のオープンソースイニシアチブ(OSI=open souce initiative)である。CIFS VFSにはデジタル署名が装備され、SMBプロトコルも内包されており、SMBが前任であった新らしいマイクロソフト・インプリメンテーションのCIFSプロトコルのとの互換性をもつ。デジタル署名が装備され、SMBプロトコルも内包されたCIFS VFSは、特にデジタル署名がマウント認証に使用される場合、例えば、SMBファイル・シェアや、新しいCIFSファイル・シェアをマウントするために使用することができる。“ Common Internet File System(CIF = 共通のインターネット・ファイル・システム)- Technical Reference (Rev.1.0)“と命名された書類、SNIA CIFS Technical Workgroup、2002年2月27日の日付が、CIFS VFSに関する補足情報を提供し、参照としてここに組み込まれる。技術的な参照はhttp://www.snia/org/tech_activities/CIFS/CIFS-TR-1p00_FINAL.pdf で利用可能である。
図11Aから図11Oまでからなる図11は、開示された1つまたは1以上の実施例における検索機器のユーザー・インタフェースからの画面の実証となる例を提供する。より詳細には、画面は、開示された1つまたは1以上の実施例の中で使用されるユーザー・インタフェースによって提示された選択/オプションの例を提供する。これらの図の中の実施例は網羅的ではないことは明らかであり、他のもの、および/または追加の画面や情報が、開示された1つまたは1以上の実施例について表示される。
図11Aは、ユーザ・ログイン画面で、本件開示の様々な実施例による検索機器180によって提供される機能へのアクセスをユーザがログインして獲得することを可能にするユーザ・ログイン画面が示される。例えば、ログインに成功した後、ユーザには、図11Bのような画面が提示され、インデックス作成設定のための多くのオプションが提供される。図11 Bの中で示されるオプションは、インデックス作成設定オプションのサンプルで、本件開示の1つまたは1以上の実施例で供給されるかもしれない他のオプションを制限したり除外するものではないことは明らかである。
図11Bで示される1つのオプションは“モニター・インデックス作成”の オプションで、インデックス作成オペレーションの現状である、インデックス作成オペレーションの開始と、インデックス作成オペレーションの停止を可視的に提供する。図11Hは、ステータスを示す情報を含む画面でインデックス作成オペレーションが進行中であることを示す。例えば、インデックス作成オペレーションに関する、スタート、終了および経過タイムを表示することができる。さらに、パイプラインで送られたインデックス作成オペレーションに関する情報は“モニタリング・インデックス作成”の オプションを使用してモニターすることができる。さらに、インデックス作成オペレーションを終了することも可能である。
図11Bの“スケジュール・インデックス作成” オプションの選択は、インデックス作成オペレーションを自動的に指定の時間に始めるようにスケジュールを決める能力を提供する。図11Iは、“スケジュール・インデックス作成”の選択に応じて表示されたサンプル・画面を示し、“スケジュール・インデックス作成”の週の日付けと開始時間を指定することが出来る。
図11Bにおいて、“検索可能な位置の特定”のオプション選択は、インデックス作成する位置を特定する能力を提供し、そこから検索結果を得ることができる。11Dから図11Gは、“検索可能な位置の特定”オプションの選択に応答した表示画面を示す。
再び図11Bを参照すると、“書類タイプの選択”オプションは、ユーザがインデックス作成オペレーションでインデックスされる書類のタイプを選択することを可能にする。検索結果とともに検索の範囲も間接的にこのオプションを使用して識別することができる。
図11Cは、“書類タイプの選択”オプションの選択に応じて表示された画面の例を提供する。図11Cのサンプル選択で示すように、書類のタイプの例は電子メール、総括テキスト、発表、出版物、スプレッドシート(表形式データ)からなる。
図11Bの“オペレーション・パラメータのセット”オプションは、ユーザが検索機器180のオペレーションに関連したパラメータをセットすることを可能にする。図11Jは、“オペレーション・パラメータのセット” オプションの選択に応じて表示された画面の例を提供する。例えば、検索可能な位置からインデックス作成された書類の最大の数は、検索機器180のオペレーション中である、検索中またはインデックス作成オペレーション中にログ(参入)したメッセージのレベルと同様に特定することができる。
図11Kは、ヘルプ・オプションの選択に応じて表示されたヘルプ画面の例を示す。 例えば、検索機器180および/またはログ・ファイルの内容から得られたヘルプを表示することができる。
図11Lでは、開示された1つまたは1以上の実施例によって検索が入力される画面の例を提供する。図11Mおよび図11Nは、本件開示の1つまたは1以上の実施例に従って検索機器180を使用することにより検索された "alan", "larry", "presentation", "publication"のキーワードを使用して検索の結果の例を提供する。図11Nで見ることができるように、検索で発見された書類の内容を表示することができる。
図11Oは、”Add User(ユーザの追加)“、”Change User Password(ユーザ・パスワードの変更)“、”Change User Permissions(ユーザアクセスの許可)“、”Remove User(ユーザの削除)“、”Add Groups(グループの追加)“、”Remove Groups(グループの削除)“等の“Users Administration(ユーザ管理)“オペレーションを実行するために使用するオプションの例を示す。
図12Aから図12Yまでからなる図12は、設定作業(オペレーション)で使用される本件開示の1つまたは1以上の実施例における検索機器180の為および/または付随するユーザー・インタフェースからの画面の実証となる例を提供する。これらの図の中の実施例は網羅的ではないことは明らかであり、他のもの、および/または追加の画面や情報が、本件開示の1つまたは1以上の実施例について表示される。
図12Aはログイン画面を示すもので、これによりユーザは、ユーザー・インタフェースの残りの部分のうちのいくつかあるいは全てへのアクセスを獲得するために、ユーザ名およびパスワードを入力する。例えば、ログインに成功した後、図12Bで示される画面では、ユーザが“Network & Internet Connections(ネットワークとインターネット接続)”、“Network File Sharing & Security(ネットワーク・ファイル共有とセキュリティ)”、“Search Appliance File Sharing(検索機器ファイル共有)”の中から選択が可能であることを表示することができる。
“ネットワークとインターネット接続”オプションは、ネットワークおよび/またはインターネット上の他のコンピューターと通信するための検索機器180用に、特定のコンピューター・ネットワークに検索機器180を設定することに使用することができる。図12Cから図12Gまでは、オプションの選択に応じて表示することができる画面の例を提供する。図12Cは検索機器180に関連したホスト名とドメイン名を指定するために使用することができる。図12Dは、検索機器180のためのIPセッティングを手動または自動のどちらかで発見するオプションを提供する。上記詳述したように、開示された1つまたは1以上の実施例では、検索機器180に対応するIPセッティングはUDPクライアント/サーバ・モデルを自動的に使用して確立することができる。
検索機器180のIPセッティングのマニュアル設定が選択されている場合、ユーザが検索機器180のIPアドレス、サブネット・マスク、デフォルト・ゲートウェイに入ることを可能にするために図12Eで示されるような画面を表示することができる。さらに、図12Fは、ネットワークドメインネームの獲得を支援する検索機器180の第一と第二のドメインネームサーバに対応するIPアドレスを入れるのに使用することができる。図12Gは、検索機器180のIPセッティングの手動設定に成功した完成された画面表示の例を提供する。
図12Hで示される画面は、図12Bで与えられた“Network File Sharing & Security(ネットワーク・ファイル共有とセキュリティ)”オプションの選択に応答して表示することができる。図12Hにおいて、検索機器180のworkgroupおよびドメインが識別されるかもしれない。図12Iと図12Jは、ローカル・マスター・ブラウジングを使用した検索機器180の補強されたファイル共有特性を特定する能力を提供する。検索機器180は、図12Kで示される画面で提供されるオプションに基づいた符号化した送信を利用することによって通信することができる。図12Lは、ネットワーク・ファイル・シェアリングの成功した完成と実行されたセキュリティ設定オプションの画面表示の例を提供する。
図12Mから図12Rまでは、検索機器180を使用してインデックスを付けて検索する目的のファイル・シェアリングを“mount”するオプションを含む画面の例を提供する。
図12Oと図12Pはそれはネットワーク120をブラウジングする検索機器180によって得られた共有リソースをリストしている画面の底部と上部をそれぞれ表示している。マウント(搭載)されるファイル・システムのボリューム(量)はこの画面を使用して選択することができる。図12Qは、図12Oおよび図12Pで示された画面を使用して作ったファイル・システムのボリューム(量)の選択を確認するリストからなる画面を提供する。図12Rの画面は、マウンティング(搭載)作業の現状を示している。
図12Sは、既に存在したか、検索機器180にインストールされるべきであった、例えば、最新のステータスを認定するために使用することができるメンテナンス画面の一例を提供する。図12Tは、図11Kの“View Message Log(メッセージログ)”オプションの選択に応答したログ(履歴)表示の例を提供する。図12Uから図12Yまでは、支援トピックでもあるセキュリティや再始動のような色々なシステム・レベル・オプションに関係する画面を示す。
要約すると、本件開示では、効率的で有効な仕様で希望の情報にインデックス作成し、配置を決めて、取り出すための幅広く応用できる装置と方法を提供する。結局、図示された実施例は実証的な例示に過ぎず、どのような方法であっても現在の開示の範囲や適用可能性あるいは設定を限定することを意図しないことは認識されるべきである。むしろ、先の詳細な説明は、技術に熟練している当業者に、本件開示の実証的な実施例を装備(インプリメント)するための便利な指標(道標)を提供したものである。従って、添付の請求項で述べられるように、本件開示の精神および範囲から外れることなく、多様な実証的な実施例に記述された機能および要素を様々に変更することが行なわれるかもしれないことは理解されるべきである。
本発明の実施例の一つあるいは複数が使用されるコンピュータ機器および周辺機器のネットワークを表したブロックダイアグラム。 本発明の実施例の一つあるいは複数に従って使用される、クライアント/サーバモデル間で通信される命令文の例。 本発明の実施例の一つあるいは複数に従って使用される、クライアント/サーバモデル間で通信される命令文の例。 本発明の実施例の一つあるいは複数に従って使用される、クライアント/サーバモデル間で通信される命令文の例。 本発明の実施例の一つあるいは複数に従って使用される、クライアント/サーバモデル間で通信される命令文の例。 本発明の実施例の一つあるいは複数に従って使用される、クライアント/サーバモデル間で通信される命令文の例。 本発明の実施例の一つあるいは複数に従って使用される、クライアント/サーバモデル間で通信される命令文の例。 本発明の実施例の一つあるいは複数に従って使用される、クライアント/サーバモデル間で通信される命令文の例。 本発明の実施例の一つあるいは複数に従って使用される、クライアント/サーバモデル間で通信される命令文の例。 本発明の実施例の一つあるいは複数に従った検索器具の内部構造についてのブロックダイアグラム図示例。 本発明の実施例の一つあるいは複数に従った採点例。 本発明の実施例の一つあるいは複数に従った採点例。 本発明の実施例の一つあるいは複数に従った採点例。 本発明の実施例の一つあるいは複数に従った採点例。 本発明の実施例の一つあるいは複数に従った、典型的なケースにおける採点例。 本発明の実施例の一つあるいは複数に従った、典型的なケースにおける採点例。 本発明の実施例の一つあるいは複数に従って、インデックスを作成し更新する過程のフローチャート。 本発明の実施例の一つあるいは複数に従って、インデックス作成および検索に使用される検索器具のブロックダイアグラム図示例。 本発明の実施例の一つあるいは複数に従って、検索結果を採点しランク付けする過程のフローチャート。 本発明の実施例の一つあるいは複数に従って使用されるデータベーススキーマの図示例。 本発明の実施例の一つあるいは複数に従って使用されるデータベーススキーマの図示例。 少なくとも一つの本実施例に従った3項トライ木の例。 本発明の実施例の一つあるいは複数に従った検索器具のユーザインターフェース画面の図示例。 本発明の実施例の一つあるいは複数に従った検索器具のユーザインターフェース画面の図示例。 本発明の実施例の一つあるいは複数に従った検索器具のユーザインターフェース画面の図示例。 本発明の実施例の一つあるいは複数に従った検索器具のユーザインターフェース画面の図示例。 本発明の実施例の一つあるいは複数に従った検索器具のユーザインターフェース画面の図示例。 本発明の実施例の一つあるいは複数に従った検索器具のユーザインターフェース画面の図示例。 本発明の実施例の一つあるいは複数に従った検索器具のユーザインターフェース画面の図示例。 本発明の実施例の一つあるいは複数に従った検索器具のユーザインターフェース画面の図示例。 本発明の実施例の一つあるいは複数に従った検索器具のユーザインターフェース画面の図示例。 本発明の実施例の一つあるいは複数に従った検索器具のユーザインターフェース画面の図示例。 本発明の実施例の一つあるいは複数に従った検索器具のユーザインターフェース画面の図示例。 本発明の実施例の一つあるいは複数に従った検索器具のユーザインターフェース画面の図示例。 本発明の実施例の一つあるいは複数に従った検索器具のユーザインターフェース画面の図示例。 本発明の実施例の一つあるいは複数に従った検索器具のユーザインターフェース画面の図示例。 本発明の実施例の一つあるいは複数に従った検索器具のユーザインターフェース画面の図示例。 本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および/または検索装置に関連したユーザインターフェース画面の図示例。 本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および/または検索装置に関連したユーザインターフェース画面の図示例。 本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および/または検索装置に関連したユーザインターフェース画面の図示例。 本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および/または検索装置に関連したユーザインターフェース画面の図示例。 本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および/または検索装置に関連したユーザインターフェース画面の図示例。 本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および/または検索装置に関連したユーザインターフェース画面の図示例。 本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および/または検索装置に関連したユーザインターフェース画面の図示例。 本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および/または検索装置に関連したユーザインターフェース画面の図示例。 本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および/または検索装置に関連したユーザインターフェース画面の図示例。 本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および/または検索装置に関連したユーザインターフェース画面の図示例。 本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および/または検索装置に関連したユーザインターフェース画面の図示例。 本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および/または検索装置に関連したユーザインターフェース画面の図示例。 本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および/または検索装置に関連したユーザインターフェース画面の図示例。 本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および/または検索装置に関連したユーザインターフェース画面の図示例。 本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および/または検索装置に関連したユーザインターフェース画面の図示例。 本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および/または検索装置に関連したユーザインターフェース画面の図示例。 本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および/または検索装置に関連したユーザインターフェース画面の図示例。 本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および/または検索装置に関連したユーザインターフェース画面の図示例。 本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および/または検索装置に関連したユーザインターフェース画面の図示例。 本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および/または検索装置に関連したユーザインターフェース画面の図示例。 本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および/または検索装置に関連したユーザインターフェース画面の図示例。 本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および/または検索装置に関連したユーザインターフェース画面の図示例。 本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および/または検索装置に関連したユーザインターフェース画面の図示例。 本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および/または検索装置に関連したユーザインターフェース画面の図示例。 本発明の実施例の一つあるいは複数に従った検索器具の設定操作に使用され、および/または検索装置に関連したユーザインターフェース画面の図示例。

Claims (46)

  1. ネットワークに接続可能な装置であって、
    ネットワーク装置のネットワークアドレスを含む動的に設置されたネットワークセッティングを使用してネットワーク上の装置を統合するように設定されたインテグレータと、
    ネットワークに接続された少なくとも1以上のネットワーク装置を発見するために少なくともネットワークの一部をトラバースすること、
    少なくとも一つの発見されたネットワーク装置に関連する情報源を識別すること、
    識別した情報源に関連する情報項目の少なくとも一つのインデックスを生成すること、により設定されたリソース識別子と、
    検索基準を満たす識別した情報源から得られる情報項目を識別するように設定された情報読み出しエンジンと、
    からなる装置。
  2. 前記リソース識別子は、さらに、発見されたネットワーク装置のリストを保持するように構成されたことを特徴とする請求項1記載の装置。
  3. 前記リソース識別子は、さらに、情報源を識別するために発見されたネットワーク装置リストを使用するように設定されたことを特徴とする請求項2記載の装置。
  4. リソース識別子は、さらに、データベースからなる検索結果保管(リポジトリ)を保持するように構成され、データベースは、ドメインと、ユニバーサル・リソース・インジケータ(URI)と、ネットワーク上の記憶場所またはドメインにファイルとして保存された文書内のページと一致する情報を保存するのに使用されるページテーブルとからなることを特徴とする請求項1記載の装置。
  5. ドメインテーブルは、各ドメインと一致するネームを含み、
    URIテーブルは、最終変更日付およびインデックス・タイムとともに、各文書のURIを含み、
    ページテーブルは、各ページのエントリを有することを特徴とする請求項4記載の装置。
  6. ページは、ウェブページ、電子メールページ、または、文書内のページからなることを特徴とする請求項5記載の装置。
  7. 装置は、さらに、データベースの中の既存レコードをアップデート(更新)するように構成されたデータベース管理システムと、新しいレコードをデータベースにインポートするように構成されたデータ・インポータと、からなることを特徴とする請求項4記載の装置。
  8. 装置は、さらに、動的に更新可能な単語の用語集、各単語の品詞、および、用語集の中に保存された単語と一致する少なくとも一つの幹ワードのとからなることを特徴とする請求項4記載の装置。
  9. 装置は、さらに、用語集を保存するバッファとからなり、前記バッファはN項トライ構造を持ち、Nは文字セット中の要素の数を表すことを特徴とする請求項8記載の装置。
  10. 前記資源識別子は、さらに、識別した情報源に関連する情報項目をインデックス作成するとともに、用語集に対する最新情報を特定するように設定され、最新情報はデータベースに書き込まれる前に前記N項トライバッファ構造に保存されることを特徴とする請求項9記載の装置。
  11. データベースは、さらに階層テーブルからなり、該階層テーブルは一以上のエントリからなり、各エントリは情報項目の中に幹ワードの出現頻度を記憶することを特徴とする請求項4記載の装置。
  12. 出現頻度は、情報項目の変更を反映するようにアップデート(更新)されることを特徴とする請求項11記載の装置。
  13. 前記情報読み出しエンジンは、さらに、前記情報読み出しエンジンによって識別される各情報項目に対して決定されたスコアに従って識別した情報項目をランク付けするように構成され、スコアは情報項目に関連する一以上の幹ワードの出現頻度の少なくとも一部に基づくことを特徴とする請求項11記載の装置。
  14. 各情報源は、ストレージ媒体、ファイルシステムディレクトリ、ファイル文書、またはページからなることを特徴とする請求項1記載の装置。
  15. 前記情報読み出しエンジンは、さらに、前記情報読み出しエンジンによって識別された各情報項目のスコアを決定するように設定されることを特徴とする請求項1記載の装置。
  16. 検索基準は、少なくとも一つの幹ワードからなり、前記情報読み出しエンジンは、さらに、各識別した情報項目の中でそれぞれの検索基準幹ワードの出現数を決定して、情報項目中で検出されたそれぞれの検索基準幹ワードの出現数の集合体の少なくとも一部に基づいて識別した情報項目の一つに対するスコアを決定するように設定されることを特徴とする請求項15記載の装置。
  17. 前記情報読み出しエンジンは、さらに、集合体と情報項目に関連する検索基準幹ワードの同時発生を考慮に入れた重み付けとに基づく情報項目のスコアを決定するように設定されることを特徴とする請求項16記載の装置。
  18. 前記インテグレータは、設定情報をネットワークサーバに通信し、それに応じてネットワーク設定を受信するように設定されることを特徴とする請求項1記載の装置。
  19. 前記インテグレータは、設定情報をネットワークサーバに通信する前に、または、ネットワーク上の装置を統合するためにネットワーク設定を使用する前に、ネットワークサーバを認証するように設定されることを特徴とする請求項18記載の装置。
  20. 前記インテグレータは、ネットワーク上の装置を統合するためにユーザデータグラムプロトコル(UDP)クライアント・サーバーモデルを使用するように設定されることを特徴とする請求項18記載の装置。
  21. 前記資源識別子は、さらに、ネットワークドメインを識別するように設定され、各識別されたサーバ上の各識別されたネットワークドメインおよびネットワーク共有の中のサーバーを識別することを特徴とする請求項1記載の装置。
  22. 前記資源識別子は、さらに、識別したサーバ、識別したサーバに関連する記憶装置、および/または、記憶装置と関連するファイルシステムにアクセスするマウントオペレーションを使用するように設定されることを特徴とする請求項21記載の装置。
  23. 前記資源識別子は、さらに、マウントオペレーションとともに使用するための認証情報を供給するように設定されることを特徴とする請求項22記載の装置。
  24. ネットワークに接続可能な装置の使用方法であって、
    ネットワーク装置のためのネットワークアドレスを含む動的に確立されたネットワーク設定を使用してネットワーク上の装置を統合し、
    ネットワークに接続された一以上のネットワーク装置を発見するために少なくともネットワークの一部をトラバースし、
    少なくとも一つの発見されたネットワーク装置と関連する情報源を識別し、
    識別した情報源に関連する情報項目の少なくとも一つのインデックスを生成し、
    検索基準を満たす識別した情報源から得られる情報項目を識別することを特徴とする方法。
  25. さらに、発見されたネットワーク装置のリストを保持することからなることを特徴とする請求項24記載の方法。
  26. さらに、発見されたネットワーク装置リストを使用して情報源を識別することからなることを特徴とする請求項25記載の方法。
  27. さらに、データベースからなる検索結果保管(リポジトリ)を保持することからなり、データベースはドメインと、ユニバーサル・リソース・インジケータ(URI)と、ネットワーク上の記憶場所またはドメインでファイルとして保存される文書内のページと一致する情報を保存するのに使用されるページテーブルと、かならることを特徴とする請求項24記載の方法。
  28. ドメインテーブルは、各ドメインと一致するネームを含み、
    URIテーブルは、最終変更日付およびインデックス・タイムとともに、各文書のURIを含み、
    ページテーブルは、各ページのエントリを有することを特徴とする請求項27記載の方法。
  29. ページは、ウェブページ、電子メールページ、または、文書内のページからなることを特徴とする請求項28記載の方法。
  30. さらに、データベースの中の既存レコードをアップデート(更新)し、新しいレコードをデータベースにインポートすることを特徴とする請求項27記載の方法。
  31. さらに、動的に更新可能な単語の用語集、各単語の品詞、および、用語集の中に保存された単語と一致する少なくとも一つの幹ワードを保持することからなることを特徴とする請求項27記載の方法。
  32. さらに、N項トライ構造を有するバッファ中に用語集を保存することからなり、Nが文字セット中の要素の数を表すことを特徴とする請求項31記載の方法。
  33. さらに、識別した情報源に関連する情報項目をインデックス作成するとともに、用語集の最新情報を特定し、データベースに書き込まれる前にN項トライバッファ構造の中に最新情報が保存されることを特徴とする請求項32記載の方法。
  34. データベースは、さらに階層テーブルからなり、階層テーブルは一以上のエントリからなり、各エントリは情報項目の中に幹ワードの出現頻度を記憶することを特徴とする請求項27記載の方法。
  35. さらに、情報項目の変更を反映するように出現頻度をアップデート(更新)することを特徴とする請求項34記載の方法。
  36. さらに、前記情報読み出しエンジンによって識別される各情報項目に対して決定されたスコアに従って識別した情報項目を順位付けすることからなり、スコアは情報項目に関連する一以上の幹ワードの出現頻度の少なくとも一部に基づくことを特徴とする請求項34記載の方法。
  37. 各情報源は、ストレージ媒体、ファイルシステムディレクトリ、ファイル文書、または、ページからなることを特徴とする請求項24記載の方法。
  38. さらに、各識別した情報項目のスコアを決定することを特徴とする請求項24記載の方法。
  39. 検索基準は少なくとも一つの幹ワードからなり、
    前記方法はさらに、
    各識別した情報項目の中でそれぞれの検索基準幹ワードの出現数を決定し、
    情報項目中で検出されたそれぞれの検索基準幹ワードの出現数の集合体の少なくとも一部に基づいて識別した情報項目の一つに対するスコアを決定することを特徴とする請求項38記載の方法。
  40. さらに、集合体と情報項目に関連する検索基準幹ワードの同時発生を考慮に入れた重み付けとに基づく情報項目のスコアを決定することを特徴とする請求項39記載の方法。
  41. さらに、設定情報をネットワークサーバに通信し、それに応じてネットワーク設定を受信することを特徴とする請求項24記載の方法。
  42. さらに、設定情報をネットワークサーバに通信する前に、または、ネットワーク上の装置を統合するためにネットワーク設定を使用する前に、ネットワークサーバを認証することを特徴とする請求項41記載の方法。
  43. さらに、ユーザデータグラムプロトコル(UDP)クライアント・サーバーモデルを使用してネットワーク上の装置を統合することを特徴とする請求項41記載の方法。
  44. さらに、ネットワークドメインを識別し、各識別されたネットワークドメインのサーバを識別し、各識別されたサーバ上の共有を識別することを特徴とする請求項24記載の方法。
  45. さらに、マウントオペレーションを使用して、識別したサーバ、識別したサーバに関連する記憶装置、および/または記憶装置に関連するファイルシステムにアクセスすることを特徴とする請求項44記載の方法。
  46. さらに、マウントオペレーションとともに使用するための認証情報を供給することを特徴とする請求項45記載の方法。
JP2008531329A 2005-09-14 2006-09-13 ネットワーク化された情報のインデックス作成および検索についての装置および方法 Pending JP2009508273A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US71753105P 2005-09-14 2005-09-14
PCT/US2006/035880 WO2007033338A2 (en) 2005-09-14 2006-09-13 Networked information indexing and search apparatus and method

Publications (1)

Publication Number Publication Date
JP2009508273A true JP2009508273A (ja) 2009-02-26

Family

ID=37865588

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008531329A Pending JP2009508273A (ja) 2005-09-14 2006-09-13 ネットワーク化された情報のインデックス作成および検索についての装置および方法

Country Status (5)

Country Link
US (1) US20070073894A1 (ja)
EP (1) EP1934703A4 (ja)
JP (1) JP2009508273A (ja)
CA (1) CA2622625A1 (ja)
WO (1) WO2007033338A2 (ja)

Families Citing this family (81)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070162481A1 (en) * 2006-01-10 2007-07-12 Millett Ronald P Pattern index
US8176052B2 (en) * 2006-03-03 2012-05-08 Perfect Search Corporation Hyperspace index
US8266152B2 (en) 2006-03-03 2012-09-11 Perfect Search Corporation Hashed indexing
US8200688B2 (en) 2006-03-07 2012-06-12 Samsung Electronics Co., Ltd. Method and system for facilitating information searching on electronic devices
US8115869B2 (en) 2007-02-28 2012-02-14 Samsung Electronics Co., Ltd. Method and system for extracting relevant information from content metadata
US8510453B2 (en) * 2007-03-21 2013-08-13 Samsung Electronics Co., Ltd. Framework for correlating content on a local network with information on an external network
US8209724B2 (en) * 2007-04-25 2012-06-26 Samsung Electronics Co., Ltd. Method and system for providing access to information of potential interest to a user
US8843467B2 (en) * 2007-05-15 2014-09-23 Samsung Electronics Co., Ltd. Method and system for providing relevant information to a user of a device in a local network
US8863221B2 (en) * 2006-03-07 2014-10-14 Samsung Electronics Co., Ltd. Method and system for integrating content and services among multiple networks
US20080235209A1 (en) * 2007-03-20 2008-09-25 Samsung Electronics Co., Ltd. Method and apparatus for search result snippet analysis for query expansion and result filtering
US20070214123A1 (en) * 2006-03-07 2007-09-13 Samsung Electronics Co., Ltd. Method and system for providing a user interface application and presenting information thereon
US20070255677A1 (en) * 2006-04-28 2007-11-01 Sun Microsystems, Inc. Method and apparatus for browsing search results via a virtual file system
US7792967B2 (en) * 2006-07-14 2010-09-07 Chacha Search, Inc. Method and system for sharing and accessing resources
US8935269B2 (en) * 2006-12-04 2015-01-13 Samsung Electronics Co., Ltd. Method and apparatus for contextual search and query refinement on consumer electronics devices
US20080163048A1 (en) * 2006-12-29 2008-07-03 Gossweiler Iii Richard Carl System and method for displaying multimedia events scheduling information and Corresponding search results
US8291454B2 (en) * 2006-12-29 2012-10-16 Google Inc. System and method for downloading multimedia events scheduling information for display
US8205230B2 (en) 2006-12-29 2012-06-19 Google Inc. System and method for displaying and searching multimedia events scheduling information
US8544040B2 (en) 2006-12-29 2013-09-24 Google Inc. System and method for displaying multimedia events scheduling information
US20090055393A1 (en) * 2007-01-29 2009-02-26 Samsung Electronics Co., Ltd. Method and system for facilitating information searching on electronic devices based on metadata information
US9729843B1 (en) 2007-03-16 2017-08-08 The Mathworks, Inc. Enriched video for a technical computing environment
US8005812B1 (en) 2007-03-16 2011-08-23 The Mathworks, Inc. Collaborative modeling environment
JP4829822B2 (ja) * 2007-03-19 2011-12-07 株式会社リコー 遠隔機器管理システム
US8176055B1 (en) * 2007-03-27 2012-05-08 Google Inc. Content entity management
US8972875B2 (en) * 2007-04-24 2015-03-03 Google Inc. Relevance bar for content listings
US8799952B2 (en) * 2007-04-24 2014-08-05 Google Inc. Virtual channels
US9286385B2 (en) 2007-04-25 2016-03-15 Samsung Electronics Co., Ltd. Method and system for providing access to information of potential interest to a user
WO2008141430A1 (en) * 2007-05-17 2008-11-27 Fat Free Mobile Inc. Method and system for continuation of browsing sessions between devices
US20080313307A1 (en) * 2007-06-12 2008-12-18 Technorati, Inc. Url-based keyword advertising
WO2009009757A1 (en) * 2007-07-11 2009-01-15 Google Inc. Processing digitally hosted volumes
US9084025B1 (en) 2007-08-06 2015-07-14 Google Inc. System and method for displaying both multimedia events search results and internet search results
US7774353B2 (en) * 2007-08-30 2010-08-10 Perfect Search Corporation Search templates
US7774347B2 (en) 2007-08-30 2010-08-10 Perfect Search Corporation Vortex searching
US7912840B2 (en) * 2007-08-30 2011-03-22 Perfect Search Corporation Indexing and filtering using composite data stores
US20090077065A1 (en) * 2007-09-13 2009-03-19 Samsung Electronics Co., Ltd. Method and system for information searching based on user interest awareness
US20090106271A1 (en) * 2007-10-19 2009-04-23 International Business Machines Corporation Secure search of private documents in an enterprise content management system
US8176068B2 (en) 2007-10-31 2012-05-08 Samsung Electronics Co., Ltd. Method and system for suggesting search queries on electronic devices
WO2009094633A1 (en) 2008-01-25 2009-07-30 Chacha Search, Inc. Method and system for access to restricted resource(s)
US8359365B2 (en) 2008-02-11 2013-01-22 Nuix Pty Ltd Systems and methods for load-balancing by secondary processors in parallel document indexing
US9928260B2 (en) 2008-02-11 2018-03-27 Nuix Pty Ltd Systems and methods for scalable delocalized information governance
US9785700B2 (en) * 2008-02-11 2017-10-10 Nuix Pty Ltd Systems and methods for load-balancing by secondary processors in parallelized indexing
CN101546309B (zh) * 2008-03-26 2012-07-04 国际商业机器公司 对计算机网络中的资源内容构建索引的方法和设备
US8032495B2 (en) * 2008-06-20 2011-10-04 Perfect Search Corporation Index compression
US9305013B2 (en) * 2008-08-28 2016-04-05 Red Hat, Inc. URI file system
US8938465B2 (en) * 2008-09-10 2015-01-20 Samsung Electronics Co., Ltd. Method and system for utilizing packaged content sources to identify and provide information based on contextual information
US8549327B2 (en) 2008-10-27 2013-10-01 Bank Of America Corporation Background service process for local collection of data in an electronic discovery system
US9275164B2 (en) * 2008-12-10 2016-03-01 Google Inc. Grouping and presenting search query results
US8086694B2 (en) * 2009-01-30 2011-12-27 Bank Of America Network storage device collector
US9558195B2 (en) * 2009-02-27 2017-01-31 Red Hat, Inc. Depopulation of user data from network
US9330374B2 (en) 2009-03-27 2016-05-03 Bank Of America Corporation Source-to-processing file conversion in an electronic discovery enterprise system
US8572227B2 (en) * 2009-03-27 2013-10-29 Bank Of America Corporation Methods and apparatuses for communicating preservation notices and surveys
US8806358B2 (en) * 2009-03-27 2014-08-12 Bank Of America Corporation Positive identification and bulk addition of custodians to a case within an electronic discovery system
US20100250509A1 (en) * 2009-03-27 2010-09-30 Bank Of America Corporation File scanning tool
US8364681B2 (en) 2009-03-27 2013-01-29 Bank Of America Corporation Electronic discovery system
US8250037B2 (en) 2009-03-27 2012-08-21 Bank Of America Corporation Shared drive data collection tool for an electronic discovery system
US8200635B2 (en) 2009-03-27 2012-06-12 Bank Of America Corporation Labeling electronic data in an electronic discovery enterprise system
US20100250266A1 (en) * 2009-03-27 2010-09-30 Bank Of America Corporation Cost estimations in an electronic discovery system
US20100250455A1 (en) * 2009-03-27 2010-09-30 Bank Of America Corporation Suggesting potential custodians for cases in an enterprise-wide electronic discovery system
US8417716B2 (en) * 2009-03-27 2013-04-09 Bank Of America Corporation Profile scanner
US9721227B2 (en) 2009-03-27 2017-08-01 Bank Of America Corporation Custodian management system
US8572376B2 (en) * 2009-03-27 2013-10-29 Bank Of America Corporation Decryption of electronic communication in an electronic discovery enterprise system
US8504489B2 (en) * 2009-03-27 2013-08-06 Bank Of America Corporation Predictive coding of documents in an electronic discovery system
US8224924B2 (en) * 2009-03-27 2012-07-17 Bank Of America Corporation Active email collector
US20100250456A1 (en) * 2009-03-27 2010-09-30 Bank Of America Corporation Suggesting preservation notice and survey recipients in an electronic discovery system
US9053454B2 (en) * 2009-11-30 2015-06-09 Bank Of America Corporation Automated straight-through processing in an electronic discovery system
US20120209823A1 (en) * 2011-02-14 2012-08-16 Nokia Corporation Method and system for managing database access contention
US8751742B2 (en) * 2011-04-01 2014-06-10 Telefonaktiebolaget L M Ericsson (Publ) Memory card having extended data storage functionality
US8954266B2 (en) 2011-06-28 2015-02-10 Microsoft Technology Licensing, Llc Providing routes through information collection and retrieval
US8782058B2 (en) * 2011-10-12 2014-07-15 Desire2Learn Incorporated Search index dictionary
RU2474869C1 (ru) * 2011-12-09 2013-02-10 Федеральное бюджетное учреждение "27 Центральный научно-исследовательский институт Министерства обороны Российской Федерации" Многофункциональная станция обмена документальной информацией
US9262511B2 (en) * 2012-07-30 2016-02-16 Red Lambda, Inc. System and method for indexing streams containing unstructured text data
US9430665B2 (en) * 2013-07-22 2016-08-30 Siemens Aktiengesellschaft Dynamic authorization to features and data in JAVA-based enterprise applications
KR20150045560A (ko) * 2013-10-18 2015-04-29 삼성전자주식회사 업 데이트 된 포스트 정보를 이용하여 컨텐츠를 분류하는 전자 장치 및 방법
US10140295B2 (en) * 2014-03-29 2018-11-27 Camelot Uk Bidco Limited Method, system and software for searching, identifying, retrieving and presenting electronic documents
US10826930B2 (en) 2014-07-22 2020-11-03 Nuix Pty Ltd Systems and methods for parallelized custom data-processing and search
US9594746B2 (en) * 2015-02-13 2017-03-14 International Business Machines Corporation Identifying word-senses based on linguistic variations
US11200249B2 (en) 2015-04-16 2021-12-14 Nuix Limited Systems and methods for data indexing with user-side scripting
US11200217B2 (en) 2016-05-26 2021-12-14 Perfect Search Corporation Structured document indexing and searching
US10764299B2 (en) * 2017-06-29 2020-09-01 Microsoft Technology Licensing, Llc Access control manager
US20190087466A1 (en) * 2017-09-21 2019-03-21 Mz Ip Holdings, Llc System and method for utilizing memory efficient data structures for emoji suggestions
CN110430043B (zh) * 2019-07-05 2022-11-08 视联动力信息技术股份有限公司 一种认证方法、系统及装置和存储介质
CN112165477B (zh) * 2020-09-22 2023-05-02 广州河东科技有限公司 一种网关搜索方法、装置、电子设备及存储介质

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6285999B1 (en) * 1997-01-10 2001-09-04 The Board Of Trustees Of The Leland Stanford Junior University Method for node ranking in a linked database
US6631369B1 (en) * 1999-06-30 2003-10-07 Microsoft Corporation Method and system for incremental web crawling
US6976053B1 (en) * 1999-10-14 2005-12-13 Arcessa, Inc. Method for using agents to create a computer index corresponding to the contents of networked computers
US6883135B1 (en) * 2000-01-28 2005-04-19 Microsoft Corporation Proxy server using a statistical model
US6910029B1 (en) * 2000-02-22 2005-06-21 International Business Machines Corporation System for weighted indexing of hierarchical documents
US6973456B1 (en) * 2000-08-10 2005-12-06 Ross Elgart Database system and method for organizing and sharing information
US6985947B1 (en) * 2000-09-14 2006-01-10 Microsoft Corporation Server access control methods and arrangements
US6584468B1 (en) * 2000-09-29 2003-06-24 Ninesigma, Inc. Method and apparatus to retrieve information from a network
US6785688B2 (en) * 2000-11-21 2004-08-31 America Online, Inc. Internet streaming media workflow architecture
US6795765B2 (en) * 2001-03-22 2004-09-21 Visteon Global Technologies, Inc. Tracking of a target vehicle using adaptive cruise control
US6961723B2 (en) * 2001-05-04 2005-11-01 Sun Microsystems, Inc. System and method for determining relevancy of query responses in a distributed network search mechanism
US7130921B2 (en) * 2002-03-15 2006-10-31 International Business Machines Corporation Centrally enhanced peer-to-peer resource sharing method and apparatus
US7120691B2 (en) * 2002-03-15 2006-10-10 International Business Machines Corporation Secured and access controlled peer-to-peer resource sharing method and apparatus
US6983280B2 (en) * 2002-09-13 2006-01-03 Overture Services Inc. Automated processing of appropriateness determination of content for search listings in wide area network searches
US7035257B2 (en) * 2002-11-14 2006-04-25 Digi International, Inc. System and method to discover and configure remotely located network devices
US6947930B2 (en) * 2003-03-21 2005-09-20 Overture Services, Inc. Systems and methods for interactive search query refinement
US7240069B2 (en) * 2003-11-14 2007-07-03 Microsoft Corporation System and method for building a large index
US7668939B2 (en) * 2003-12-19 2010-02-23 Microsoft Corporation Routing of resource information in a network

Also Published As

Publication number Publication date
WO2007033338A3 (en) 2007-09-13
EP1934703A4 (en) 2010-01-20
CA2622625A1 (en) 2007-03-22
EP1934703A2 (en) 2008-06-25
US20070073894A1 (en) 2007-03-29
WO2007033338A2 (en) 2007-03-22

Similar Documents

Publication Publication Date Title
JP2009508273A (ja) ネットワーク化された情報のインデックス作成および検索についての装置および方法
JP6419633B2 (ja) 検索システム
US7594258B2 (en) Access control systems and methods using visibility tokens with automatic propagation
Koshman et al. Web searching on the Vivisimo search engine
US6976053B1 (en) Method for using agents to create a computer index corresponding to the contents of networked computers
US8694493B2 (en) Computer-implemented search using result matching
JP5173186B2 (ja) 検索照会からコンセプトユニットを生成するためのシステム及び方法
US7603350B1 (en) Search result ranking based on trust
US7599988B2 (en) Desktop client interaction with a geographical text search system
WO2008070415A2 (en) Networked information collection apparatus and method
US20070005564A1 (en) Method and system for performing multi-dimensional searches
KR101407060B1 (ko) 인터넷을 통해 수집한 데이터의 분석과 증거화 방법 및 이를 이용한 데이터 분석과 증거화 시스템
JP5121194B2 (ja) 組織内情報検索システム及び組織内情報検索プログラム
AU6509800A (en) Indexing a network with agents
CA2713932C (en) Automated boolean expression generation for computerized search and indexing
US20060235886A1 (en) Method, system and software for centralized generation and storage of individualized requests and results
JP2004164555A (ja) 検索装置および方法ならびにそのインデクス構築装置および方法
WO2001027805A2 (en) Index cards on network hosts for searching, rating, and ranking
US20060218208A1 (en) Computer system, storage server, search server, client device, and search method
WO2007121490A2 (en) System and method of identifying shared resources on a network
US8832067B2 (en) Indirect data searching on the internet
JP5017405B2 (ja) 規程管理装置及びプログラム
JP5197179B2 (ja) データ管理装置
US8832066B2 (en) Indirect data searching on the internet
JP2002063170A (ja) Web検索の規制方法