JP2008538016A

JP2008538016A - 概念または項目を用いて知識相関を構成することによる知識発見技術

Info

Publication number: JP2008538016A
Application number: JP2007541415A
Authority: JP
Inventors: マークボビック; カールウィマー
Original assignee: メイクセンスインコーポレイテッド; マークボビック; カールウィマー
Priority date: 2004-11-12
Filing date: 2005-11-14
Publication date: 2008-10-02
Also published as: US8108389B2; US20120117053A1; WO2006053306A2; EP1825355A4; US20060253431A1; CN101124537A; US9311601B2; US10467297B2; WO2006053306A3; CN101124537B; EP1825355A2; US20160224669A1

Abstract

知識を識別する技術が、追加的な知識のために検討する１つ以上の項目を入力するためのグラフィカル・ユーザインタフェースを使用する。そして、情報の１つ以上のソースにわたる検索を実行して、この項目についての情報またはこの項目に関連する情報を含むリソースを識別する。これらのリソースを情報の要素単位に分解して、ノードと称するデータ構造中に格納する。ノードのグループをノードプール中に格納し、このノードプールから、知識を表現するノードの相関を構成する。

Description

本明細書の開示の一部は著作権保護を受ける題材を含む。著作権所有者は、米国特許商標局の特許ファイル記録に見られる部分については、何人による複写に対しても異議を唱えないが、それ以外の部分についてはいかなる場合も著作権を有する。

（関連出願へのクロスリファレンス）
本願は、米国特許暫定出願第60/627,772号、2004年11月12日出願、発明の名称”Techniques and Apparatus for Information Correlation”に基づいて優先権を主張し、その全内容を参考文献として本明細書に含める。

また本願は、米国特許暫定出願第60/637,936号、2004年12月21日出願、発明の名称”Techniques and Apparatus for Information Correlation”に基づいて優先権を主張し、その全文を参考文献として本明細書に含める。

また本願は、米国特許暫定出願第60/694,331号、2005年6月27日出願、発明の名称”A Knowledge Correlation Search Engine”に基づいて優先権を主張し、その全内容を参考文献として本明細書に含める。

（プログラム・シーケンス・リスト（ＣＤ−ＲＯＭ）の参照）
本願は、ＣＤ−ＲＯＭ上のコンピュータ・プログラムリストを含み、このプログラムリストはその全体を参考文献として本明細書に含む。

（発明の背景）
発明の分野
本発明は、情報技術の分野に指向したものであり、より詳細には、概念または項目を用いて知識相関を構成することによる知識発見の技術に指向したものである。

従来技術の説明
種々の項目についての情報を識別する多くの検索技術が、従来技術において知られている。これらの技術は、検索（サーチ）エンジン、検索ロボット、等を含む。一般に、検索エンジンは、テキストの本体の各項目に、その位置に関してインデックス（索引）付けし、これにより、質問項目が提出されると、これらの項目の位置を識別することができる。検索エンジンの検索の結果を、ブール論理を用いて他の項目の検索の結果と組み合わせて、所望のものに至る結果に、より正確に焦点を合わせることができる。

1979年版Websters New Collegiate Dictionary

（発明の概要）
1979年版の”Websters New Collegiate Dictionary”は、次の「知識」の定義を含む：
知識...
(a)...(2) 経験または交わりを通して得たものを、よく知っているという事実または状態；
(b)...(2) 人の情報または理解の範囲

本発明は、個別項目または項目のグループに関する知識を識別する技術を記述する。ユーザは、追加的な知識のために検討する１つ以上の項目を入力する。そして、入力した項目についての情報、あるいは入力項目に関連する情報を含む情報源上の検索を行う。こうしたリソース（情報源）を見つけると、このリソースが含む情報をノードに分解し、これらのノードは、情報の基本単位を格納する特定データ構造である。結果的なノードはノードプールに格納される。そしてノードプールを用いて、ノードを連結して知識ブリッジにするノードのチェーン（連鎖）または相関（相互関係）を構成し、ノードのチェーンまたは相関は、（追加的な知識を）探っている項目についての結果的な情報、あるいはこうした項目に関連する結果的な情報を文書化したものである。
本発明によれば、情報連鎖（リンケージ）についての人の情報及び理解の範囲を、さもなければ明らかにならない所まで拡大することによって知識を獲得する。この知識は、ノードをリンク（連結）して相関にすることによる形式的な方法で表現される。

（実施例の詳細な説明）
図１Ａ及び図１Ｂは、本発明の好適な実施例による知識相関を構成するプロセスのフローチャートである。図２Ａ〜２Ｅは、本発明用のＧＵＩ（Graphical User Interface：グラフィカル・ユーザインタフェース）のスクリーン・キャプチャ（スクリーン表示例）を示す。

図１Ａに示す品発明の実施例では、ユーザはＧＵＩインタフェースを用いることによって、少なくとも１つの項目を入力する。図２Ａは、ユーザ入力を受け付けることを意図したＧＵＩ構成要素のスクリーン・キャプチャである。インタフェース中の重要なフィールドは”X Term（Ｘ項目）”、”Y Term（Ｙ項目）”及び”Tangent（展開）”である。以下でより詳細に説明するように、１つ〜５つの項目または語句（フレーズ）のユーザ入力が、本発明の挙動に対する有意な効果を有する。図２Ａに示す好適な実施例では、ユーザは少なくとも２つの入力項目または語句を提供することを求められる。図１Ａを参照すれば、ユーザ入力１００”Gold（金）”は、図２Ａの”X Term（Ｘ項目）”データ入力フィールドに入力されることによって、検索可能な項目または語句１１０として獲得される。ユーザ入力１００”INFLATION（インフレーション、膨張）”は、図２Ａの”Y Term（Ｙ項目）”データ入力フィールドに入力されることによって、検索可能な項目または語句１１０として獲得される。一旦、ユーザによって起動されると、検索１２０が行われて、対象の項目または語句についての情報の実際及び潜在的なソース（情報源）を識別する。実際及び潜在的なソースの各々は、対象の項目または語句との関連性についてテストされる。検索されるソースの中には、コンピュータ・ファイルシステム、インターネット、リレーショナル（関係型）データベース、ｅ−メール・リポジトリ（保存所）、分類法の例、及びオントロジー（存在論）の例である。関係すると見られるソースをリソース１２８と称する。関係するリソース１２８の検索１２０を「発見」と称する。各リソース１２８からの情報は、ノードと称するディジタル情報オブジェクト１３８に分解（１３０）される。図１Ｃを参照すれば、ノード１８０Ａ及び１８０Ｂは、意味を含んで伝えるデータ構造である。各ノードは自己完結型である。ノードは、意味を伝えること以外は求めない。再び図１Ａを参照すれば、リソース１２８からの良好に分解（１３０）されたノード１８０Ａ及び１８０Ｂはノードプール１４０内に置かれる。ノードプール１４０は、データアクセス及び検索用の論理構造である。リソース１２８の及びノード１８０Ａ、１８０Ｂへの分解を「獲得」と称する。そしてノードプール１４０内のメンバーノードと称するノード１８０Ａ及び１８０Ｂを用いて、相関１５５を構成する。図１Ｂを参照すれば、相関はノードプール中のノードのうち、対象の項目または語句を明示的に含む１つのノードから開始される。こうしたノードを項目（ターム）ノードと称する。相関中の第１ノードとして用いる際には、この項目ノードを原点１５２（ソース）と称する。相関はノードのチェーン（連鎖）（またはパス（経路））の形で構成する。この経路は原点ノード１５２（同義的にパスルート（経路の根）と称する）から始まる。パスは、ノードプール１４０のノードメンバー１５１の中から、原点ノード１５２に関連し得るノードメンバー１５１を検索することによって拡張される。こうしたノード（有資格メンバー１５１Ｈ）が見つかれば、この有資格メンバーのノードは原点ノード１５２に連結され、そして現在のパスの末端として指定される。このパスはさらに、ノードプールの有資格ノードの相互作用的な関連付け及び逐次的な連結によって、現在のパスの末端に関連しこれに追加される有資格メンバーノードが最終の末端ノード（デスティネーションノード１５９）と見られるか、あるいは、ノードプール中にさらなる有資格メンバーノードが存在しなくなるまで、逐次的に指定される現在のパスの末端に拡張される。デスティネーションノード１５９の、最終的なパスの末端としての関連付け及び連結を成功の結果（ゴール（目標）状態）と称し、この場合には、パスをその後に相関１５５と称し、そしてこうした相関１５５を保存する。ノードプール中にさらなる有資格メンバーノードが存在しない状態、従って許容可能なデスティネーションノードが存在しない状態は不成功の結果（完全な消耗）と見られ、そしてパスは棄却され相関とは称さない。完成した相関１５５は、原点ノード１５２を相関中の他の各ノード、特にこの相関のデスティネーションノード１５９に関連付ける。このプロセスの名称は「相関」である。これにより相関１５５は、検索中に識別されたすべてのソースからの情報間にまたがりこれらの情報を結び付ける知識ブリッジを形成する。知識ブリッジは発見された知識である。

図２Ｂに、”Discovery（発見）”、”Acquisition（獲得）”、及び”Correlation（相関）”の３段階すべてが完了した瞬時におけるＧＵＩ構成要素”Ask the Question（質問をする）”を示す。本発明では、処理の段階毎の進行インジケータ（指標）が提供される。

図２Ｃを参照すれば、本発明の実施例において相関が見出され、タブ付きウィンドウ枠のフォーマットで表示される。スクリーンの左側にあるタブは原点１５２であり、これらはスクリーンの右側に示すデスティネーションノード１５９との間に成功の相関が存在する。各成功の相関１５５は個別に表示される。

図２Ｄを参照すれば、本発明では、ユーザはあらゆる相関を特別な利点を伴ってディスクに保存することができる。付録Ａ：報告は本発明のこうした実行によって生成された完全な報告を含む。

図２Ｅを参照すれば、追加的な報告”RankXY（ＸＹのランク）”が提供され、そのリソース１２８が、本発明のこうした実行によって生成された相関１５５に最も大きく寄与したかをユーザに助言する。

好適な一実施例では、ユーザは１つから５つまでの項目を入力することができ、そして入力した項目の数は、生成することのできる知識相関の種類、並びに以下でさらに説明する、生成することのできる相関の「品質」を決定付けるかまたはこれに影響する。項目は１単語、または２単語の句とすることができる。本発明によってサポートされる、次の２種類の相関が存在する：
１．「自由な関連付け」、ユーザによって入力された単一の項目が与えられると、この項目から複数の原点がノードの形に展開され、そして本発明は、各原点から、デスティネーションノードの形で見出すことのできる任意数の潜在的なデスティネーションのありとあらゆるものへの知識ブリッジを構築しようとする。これらのデスティネーションは、少なくとも２つの「停止相関」のシナリオで選択し、これについては以下でさらに説明する。この種の相関では、デスティネーションは先験的には知られず、ユーザが求める利益は第１に、原点と事実、思想、概念、あるいはデスティネーションによって指名または示唆される単純な項目との予期しない新規の関連付けであり、原点からデスティネーションまでの関連付けが、新規または革新的な解決法、予期しない影響、及び問題または題目について前には考えなかった態様を示唆するという第２の利益を伴う。
２．「点を接続する」、ユーザによって入力された２つの項目が与えられると、第１の項目から複数の原点が展開され、第２の項目から複数のデスティネーションが展開され、そして本発明は、ありとあらゆる原点からありとあらゆるデスティネーションへの知識ブリッジを構築しようとする。相関の動作は、少なくとも１つの原点を関連のチェーンによって少なくとも１つのデスティネーションにリンクすることのできる場合のみに成功と考える。この例では、ユーザが求める利益は第１に、原点からデスティネーションへのこうした関連が確立され、これにより、「存在する」が解決されることであり、そしてすべての相関に伴い、知識相関において明らかにされる原点からデスティネーションまでのパスから知識及び識見が伝えられる。

第３、第４、または第５の項目がユーザによって入力される際には、求める利益は、ノードを取り出して相関を構成する「源泉」であるノードプールの形の「検索空間」を豊富化または整形することである。本発明の好適な実施例では、第３、第４及び第５の概念または項目が提供されると、追加的なリソースの獲得が検索空間としてのノードプールのサイズ及び不均一性を増加させ、これにより、与えられたあらゆる原点を用いた相関が成功である可能性を増加させる点で、最小の利益が提供される。本発明の好適な利用では、第３、第４、及び／または第５の項目を提供した結果として獲得されるリソースは、検索空間及び知識領域としてのノードプールを直交的に拡張する。例えば、「エネルギー消費」の原点、及び「ラップ音楽」のデスティネーションが与えられると、第３、第４、及び第５の入力であるそれぞれ「電子工学（エレクトロニクス）」、「著作権」、及び「文化」は、結果的に新たな相関を生成するものと想定される情報をノードプール中に持ち込む。この好適な利用では、この拡張を「豊富化」と称し、そして第３、第４及び第５の項目を「展開」と称する。本発明の他の好適な利用では、良好に選定した第３、第４及び第５の項目は、検索空間及び知識領域としてのノードプールを、第１及び／または第２の項目の使用により生成された検索空間及び知識領域と並列させて、話題または意味のデカルト（カーテシアン）次元を用いて既定することを可能にする。例えば、原点「通信産業」及びデスティネーション「将来の収益性」が与えられると、第３、第４及び第５の入力であるそれぞれ「経済学」、「政治学」及び「規制」が、問題に関係するすべての題材の態様を有効に網羅するものと想定される情報をノードプール中に持ち込む。ノードプール中に作成される検索空間と知識領域との間に和集合、積集合、または隣接の特性が存在しない場合でも、相関の成功は可能である

ユーザが、第１、第２、第３、第４及び第５の対象の項目または語句用に入力する項目毎に、当該項目または語句についての情報源の独立した検索が行われる。このことは、次の１つ以上のトラバース（横断検索）を含む：
(i) コンピュータ・ファイルシステム
(ii) インターネットを含むコンピュータネットワーク
(iii) ｅ−メール・リポジトリ
(iv) リレーショナル・データベース
(v) 分類法
(vi) オントロジー
簡単に言えば、コンピュータがアクセスすることのできるあらゆる情報のリポジトリである。

検索はリポジトリ毎に異なる。１つ以上のコンピュータ・ファイルシステムの検索に指向した一実施例では、ファイルシステムのディレクトリを辿ることによって検索を行う。ファイルシステムのディレクトリは、コンピュータ・ファイルシステム内のすべてのサブディレクトリ及びファイルを位置検出すべく使用される階層構造である。ファイルシステムのディレクトリは、ツリー（木）として構成され表現され、このツリーはある種のグラフ（結線図）であり、グラフの頂点（ノード）はサブディレクトリまたはファイルであり、そしてグラフのエッジは、ディレクトリのルート（根）からすべてのサブディレクトリのファイルまでのパス（経路）である。このように検索することのできるコンピュータは、個別のパーソナルコンピュータ、ネットワーク上の個別のコンピュータ、ネットワークのサーバーコンピュータ、及びネットワーク・ファイルサーバーのコンピュータである。ネットワーク・ファイルサーバーは一般に高性能の特別なコンピュータであり、大きなユーザグループ用のファイルの存続及び検索機能をサポート（支援）するタスク向けに専用化されている。

コンピュータのファイルシステムは、対象の項目または語句についての情報の実際及び潜在的なソースを保持することができ、これらのソースは次のものとして記憶される：
(i) テキスト（プレーン（普通、標準）テキスト）ファイル。
(ii) リッチテキスト・フォーマット（ＲＴＦ：Rich Text Format、マイクロソフト社によって開発された規格）ファイル。
(iii) エクステンデッド・マークアップ・ランゲージ（ＸＭＬ：Extended Markup Language、ワールドワイド・ウェブ・コンソーシャム（World Wide Web Consortium）のプロジェクト（企画））ファイル。
(iv) マークアップ・ランゲージ・ファイルのあらゆる「方言」ファイル、これらの方言はハイパーテキスト・マークアップ・ランゲージ（ＨＴＭＬ：HyperText Markup Language）及びエクステンシブル・ハイパーテキスト・マークアップ・ランゲージ（ＸＨＴＭＬ（登録商標）：Extensible HTML）（ワールドワイド・ウェブ・コンソーシャムのプロジェクト）、RuleML（RuleMLイニシアティブのプロジェクト）、スタンダード・ジェネラライズド・マークアップ・ランゲージ（ＳＧＭＬ：Standard Generalized Markup Language、国際規格の１つ）、及びエクステンシブル・スタイルシート・ランゲージ（ＸＳＬ：Extensible Stylesheet Language、ワールドワイド・ウェブ・コンソーシャムのプロジェクト）を含むが、これらに限定されない。
(v) ポータブル・ドキュメント・フォーマット（ＰＤＦ：Portable Document Format、Adobe社の独自フォーマット）ファイル。
(vi) スプレッドシート・ファイル、例えばExcel（エクセル（登録商標）、マイクロソフト社のスプレッドシート（表計算）ソフトウェア製品）によるデータを格納するために使用するXLSファイル。
(vii) ＭＳワード（登録商標）（WORD）ファイル、例えば、MS WORD（マイクロソフト社によるワードプロセッサ・ソフトウェア製品）による文書を格納するために使用するDOCファイル。
(viii) プレゼンテーション（スライド）ファイル、例えばパワーポイント（PowerPoint、マイクロソフト社のスライドショー・スタジオ・ソフトウェア製品）によるデータを格納するために使用するPPTファイル。
(ix) イベント情報獲得ログ（記録）ファイル、トランザクション・ログ、電話発呼記録、従業員のタイムシート（勤務時間記録表）、及びコンピュータシステムのイベントログを含むが、これらに限定されない。

コンピュータのファイルシステムを検索する際には、時としてスパイダーと称されるソフトウェア・ロボット（例えばGoogle社の製品であるGoogle Desktop Crawler（登録商標））または検索（サーチ）ロボットを「派遣」して、対象の項目または語句についての情報の実際または潜在的なソースを識別することができる。スパイダー及びロボットは、ファイルシステムのディレクトリのようなあらゆるグラフ的構造をなすリンクに従って、ディレクトリからディレクトリへ、そしてファイルからファイルへと進むソフトウェア・プログラムである。この方法は次のステップを含む：(a) 対象の項目または語句をロボットに提供するステップ；(b) ロボットが検索を開始するファイルシステム・ディレクトリ上の出発点（通常はルート）を提供するステップ；(c) ロボットが訪ねた潜在的なソース毎に、ロボットが、以下でさらに説明する関連性テストを実行するステップ；(d) 当該ソースが関連性がある場合に、ロボットが当該ソースのＵＲＩ（Uniform Resource Identifier：ユニフォーム・リソース・アイデンティファイア）またはＵＲＬ（Uniform Resource Locator：ユニフォーム・リソース・ロケータ）を作成または獲得するステップ；及び、(e) ロボットが、このロボットを派遣した方法（プログラム）に戻り、獲得したリソースのＵＲＩまたはＵＲＬを、派遣した方法に送り届けるステップ。

一部の利用にとって好適な代案の実施例では、ロボットが自分自身を第１ロボットとして指名し、そして第１ロボットが自分自身のコピーをクローン化（複製）する際に、これにより、追加的な独立したクローンロボットを作製する。第１ロボットはクローンロボットに、関連リソースのＵＲＩまたはＵＲＬを授け、そしてクローンロボットに、第１ロボットを派遣した方法に（結果を）戻すことを指示する。クローンロボットは、獲得したリソースのＵＲＩまたはＵＲＬを派遣した方法に送り届け、その間に第１ロボットは追加的なＵＲＩまたはＵＲＬの獲得を進める。関連ソースのＵＲＩまたはＵＲＬに加えた、関連ソースに特有の情報はロボットによって獲得することができ、これらの情報は、ロボットが関連リソースを選択するために使用した関連性テストに基づき、かつその結果である詳細報告、この関連ソースのサイズのバイト数、及び関連ソースの内容のフォーマットを含む。

意図がインターネットを検索することにあれば、ウェブ・クローラ・ロボット（web crawler robot、例えばJava（登録商標）Coding.comのプロジェクトであるJSpider）を使用することができる。こうしたロボットは、インターネット上のリンクに従ってウェブサイトからウェブサイトへ、そしてウェブページからウェブページへと進む。一実施例では、本発明はワールド・ワイド・ウェブ（インターネット）を検索して、対象の項目または語句についての情報の実際及び潜在的なソースを識別し、これらのソースはウェブページとして公開され、次のものを含む：
(i) テキスト（プレーンテキスト）ファイル。
(ii) リッチテキスト・フォーマット（ＲＴＦ、マイクロソフト社によって開発された規格）ファイル。
(iii) エクステンデッド・マークアップ・ランゲージ（ＸＭＬ、ワールドワイド・ウェブ・コンソーシャムのプロジェクト）ファイル。
(iv) マークアップ・ランゲージ・ファイルのあらゆる「方言」ファイル、これらの方言は、ハイパーテキスト・マークアップ・ランゲージ（ＨＴＭＬ）及びエクステンシブル・ハイパーテキスト・マークアップ・ランゲージ（ＸＨＴＭＬ（登録商標））（ワールドワイド・ウェブ・コンソーシャムのプロジェクト）、RuleML（RuleMLイニシアティブのプロジェクト）、スタンダード・ジェネラライズド・マークアップ・ランゲージ（ＳＧＭＬ、国際規格の１つ）、及びエクステンシブル・スタイルシート・ランゲージ（ＸＳＬ、ワールドワイド・ウェブ・コンソーシャムのプロジェクト）を含むが、これらに限定されない。
(v) ポータブル・ドキュメント・フォーマット（ＰＤＦ、Adobe社の独自フォーマット）ファイル。
(vi) スプレッドシート・ファイル、例えばExcel（エクセル、マイクロソフト社のスプレッドシート（表計算）ソフトウェア製品）によるデータを格納するために使用するXLSファイル。
(vii) ＭＳワード（WORD）ファイル、例えば、MS WORD（マイクロソフト社によるワードプロセッサ・ソフトウェア製品）による文書を格納するために使用するDOCファイル。
(viii) プレゼンテーション（スライド）ファイル、例えばパワーポイント（マイクロソフト社のスライドショー・スタジオ・ソフトウェア製品）によるデータを格納するために使用するPPTファイル。
(ix) イベント情報獲得ログ（記録）ファイル、トランザクション・ログ、電話発呼記録、従業員のタイムシート（勤務時間記録表）、及びコンピュータシステムのイベントログを含むが、これらに限定されない。
(x) ブログページ（ウェブログのページ）

検索エンジンは、本発明において、対象の項目または語句についての情報の実際及び潜在的なソースを識別するために使用する好適な代案である。検索エンジンはサーバーベースのソフトウェア製品であり、特定の、時として独自の手段を用いて、ユーザの質問に関連するウェブページを識別する。検索エンジンは一般に、識別したウェブページへのＨＴＭＬリンクのリストをユーザに戻す。本発明のこの実施例では、検索エンジンがプログラムで起動される。対象の項目または語句は検索エンジン・ソフトウェアへの入力としてプログラムで入力される。検索エンジンによって戻されるＨＴＭＬリンクのリストは、対象の項目または語句についての情報の実際のソースと考えられるウェブページの事前認定されたリストを提供する。

検索エンジンの１つの種類は、インデックス（索引）エンジンの機能に限定される。インデックスエンジンは、インターネットを検索するサーバーベースのソフトウェアであり、発見したすべてのウェブページを個別の単語または句に分解する。インデックスエンジン用のサーバー上では、インデックスと称する単語のデータベースが維持される。ウェブページ上で発見されたインデックス中にない単語はインデックスに追加される。インデックス上の単語または句毎に、当該単語または句を見出すことのできるウェブページのリストが当該単語または句に関連付けられる。単語または句はキーとして作用し、そして当該単語または句を見出すことのできるウェブページのリストは、このキーに関連する一組の値である。インデックスエンジンによって戻されるＨＴＭＬリンクのリストは、対象の項目または語句についての情報の実際のソース（リソース）と考えることのできるウェブページのリストを提供する。ウェブページ中での対象の項目または語句の発生は、最小限信頼できる関連性テストである。各ソースに適用される追加的な関連性テストは非常に好ましい。

例えば、インデックスエンジンをスパイダーと組み合わせ、インデックスエンジンが１つ以上のスパイダーを、対象の各項目または概念を有するインデックス・データベース中の関連するウェブページの１つ以上に派遣する。スパイダーは、以下でさらに説明するより強固な関連性テストを各ウェブページに適用する。スパイダーが関連性のあるものと見たウェブページへのＨＴＭＬリンクは戻され、そして対象の項目または語句についての情報の実際のソース（リソース）と考えられる。

検索エンジンの改善された実現は、対象の項目または語句のすべてを質問として利用する。検索エンジンに質問が提出されると、検索エンジンはこの質問を捉え、この質問をデータベース・インデックス中に保存する。質問に対するインデックスは検索エンジンによって追加的なインデックスとして維持される。ロボットが関連性のあるものと見たウェブページが検索エンジンに報告されると、検索エンジンはこのウェブページへのＨＴＭＬリンクを報告するだけでなく、質問全体をキーとして用いて、関連性のあるウェブページへのＨＴＭＬリンクを、この質問に関連する値として記憶する。質問に関連性のあるものと見られたすべてのページへのＨＴＭＬリンクは獲得され、そして検索エンジンのデータベース中で質問と関連付けられる。検索エンジンが次の質問を受け取り、そしてこの質問が検索エンジンの質問インデックス中に既に存在する質問と正確に、あるいはおよそ一致する際には、検索エンジンは、質問データベース中の質問に関連するＨＴＭＬリンクのリストを戻す。改良された検索エンジンは即時の結果を戻すことができ、ウェブページに関連性テストを施すべくロボットを派遣する必要はない。

検索エンジンの他の有用な形態はメタクローラ（meta-crawler）である。メタクローラはサーバーベースのソフトウェア製品であり、独自の手段を用いてユーザの質問に関連するウェブページを識別する。メタクローラは一般に複数の検索エンジンをプログラムで起動し、そして各検索エンジンが関連性のあるものとして識別したウェブページへのＨＴＭＬリンクのリストを検索する。そしてメタクローラは、特別な、時として独自の手段を適用して、寄与した検索エンジンが定めた各ページの明示的または暗示的な関連性スコアに基づいて、個々のウェブページについての関連性のスコア（得点）を計算する。そしてメタクローラは一般に、関連性の順にランク付けした最も関連性のあるウェブページへのＨＴＭＬリンクのリストをユーザに戻す。一実施例では、メタクローラをプログラムで起動する。対象の項目または語句は、メタクローラ・ソフトウェアへの入力としてプログラムで入力する。そしてメタクローラ・ソフトウェアは、対象の項目または語句を、このメタクローラが起動した各検索エンジンにプログラムで入力する。メタクローラによって戻されるリンクのリストは、事前認定されたウェブページのリストであり、対象の項目または語句についての情報の実際のソースと考えられる。

個別のパーソナルコンピュータ上、ネットワーク上の各個別コンピュータ上、ネットワークのサーバーコンピュータ上、及びネットワークのｅ−メール・サーバーコンピュータ上にあるｅ−メール・リポジトリには、構造化されていない重要なデータが大量に記憶されている。ネットワークのｅ−メール・サーバーは、一般に高性能の特別なコンピュータであり、大きなユーザグループ用のｅ−メール機能をサポートするタスク向けに専用化されている。知識相関を構成するに当たり、本発明の１つの態様によれば、対象の項目または語句に関連するｅ−メールのメッセージ及びｅ−メールの添付ファイルを置くことが望ましい。

ｅ−メールのリポジトリは一般に、ｅ−メール・サーバーソフトウェアまたはｅ−メール・クライアントソフトウェアと称されるｅ−メール管理ソフトウェアによってカプセル化及びアクセスされ、サーバーソフトウェアは複数のユーザをサポートすべく設計され、そしてクライアントソフトウェアは、パーソナルコンピュータまたはラップトップコンピュータ上の個別ユーザをサポートすべく設計されている。本発明の一実施例は、JavaMail（登録商標、サン・マイクロシステム社のｅ−メール・クライアントＡＰＩ（Application Programming Interface：アプリケーションプログラム用インタフェース））を、http://jmbox.dev.java.net/のプロジェクトであるjmbox（登録商標）のようなLocal Store Provider for JavaMail（登録商標）と共に使用し、Outlook Express（登録商標、マイクロソフト社の製品）、Mozilla（登録商標、mozilla.orgの製品）、Netscape（登録商標、ネットスケープ社の製品）、等のようなローカル（個別コンピュータ内の）リポジトリ中のｅ−メール・メッセージを検索する。本実施例では、アクセスしたｅ−メール・メッセージをテキストとして、Java String（ジャバ・ストリング、登録商標）比較機能を用いて対象の項目または語句を検索する。

一部の使用にとって好適な代案の実施例はｅ−メール・パーサー（構文解析ツール）を利用する。本実施例では、ｅ−メールのヘッダを棄却し、送信者、宛先、件名（題目）、及びメッセージの各フィールド中で対象の項目または語句を検索する。

ｅ−メール・サーバー上のリポジトリは独自形式であることが多いが、一部は、プログラムでのｅ−メール・メッセージへのアクセス及びｅ−メール・メッセージの検索を可能にする。こうしたｅ−メールサーバーの一例は、Apache Japes（登録商標、Apache.orgの製品）である。他の例はOracle e-mail Server API（登録商標、オラクル社の製品）である。ｅ−メール・サーバーのリポジトリ管理ソフトウェアＡＰＩによってアクセスされ、対象の項目または語句を含むことが判明しているｅ−メール・メッセージはリソースであると考えられる。

プログラムでのｅ−メール・メッセージへのアクセスにより、本発明の大部分の実施例はｅ−メール・メッセージの添付ファイルへのアクセスを行う。添付ファイルが独自のフォーマットで存在すれば、次のような構文解析ユーティリティ：
(i) ＰＤＦ−テキスト・変換ユーティリティ（例えばEtymon Systems社の製品であるPJ（登録商標））
(ii) ＲＴＦ−テキスト・変換ユーティリティ（例えばPete Sergeant社の製品であるRTF-Parser-1.09（登録商標））
(iii) MS Word（登録商標）−テキスト・パーサー（例えばApache.orgの製品であるApache POI project（登録商標））
をリンクし起動して、添付ファイルを検索可能な形式にすることができる。ＡＰＩを提供するｅ−メール・サーバーについては、一部はさらに添付ファイル用のネイティブ（元の）フォーマット検索ユーティリティを内蔵している。ｅ−メール・メッセージ及びｅ−メール添付ファイルは次のものを含む多数のファイルフォーマットで存在し得る：
(i) テキスト（プレーンテキスト）ファイルのｅ−メール添付ファイル。
(ii) エクステンデッド・マークアップ・ランゲージ（ＸＭＬ）のｅ−メール添付ファイル。
(iii) マークアップ・ランゲージ・ファイルのあらゆる「方言」ファイルのｅ−メール添付ファイル、これらの方言はハイパーテキスト・マークアップ・ランゲージ（ＨＴＭＬ）及びエクステンシブル・ハイパーテキスト・マークアップ・ランゲージ（ＸＨＴＭＬ（登録商標））（ワールドワイド・ウェブ・コンソーシャムのプロジェクト）、RuleML（RuleMLイニシアティブのプロジェクト）、スタンダード・ジェネラライズド・マークアップ・ランゲージ（ＳＧＭＬ、国際規格の１つ）、及びエクステンシブル・スタイルシート・ランゲージ（ＸＳＬ、ワールドワイド・ウェブ・コンソーシャムのプロジェクト）を含むが、これらに限定されない。
(iv) ポータブル・ドキュメント・フォーマット（ＰＤＦ、Adobe社の独自フォーマット）ファイルのｅ−メール添付ファイル。
(v) リッチテキスト・フォーマット（ＲＴＦ、マイクロソフト社によって開発された規格）ファイルのｅ−メール添付ファイル。
(vi) スプレッドシート・ファイルのｅ−メール添付ファイル、例えばExcel（エクセル、マイクロソフト社のスプレッドシート（表計算）ソフトウェア製品）によるデータを格納するために使用するXLSファイルのｅ−メール添付ファイル。
(vii) ＭS DOCファイルのｅ−メール添付ファイル、例えば、MS WORD（マイクロソフト社によるワードプロセッサ・ソフトウェア製品）による文書を格納するために使用するDOCファイルのｅ−メール添付ファイル。
(viii) イベント情報獲得ログファイルのｅ−メール添付ファイル、これらのログファイルは例えば、トランザクション・ログ、電話発呼記録、従業員のタイムシート（勤務時間記録表）、及びコンピュータシステムのイベントログを含むが、これらに限定されない。

リレーショナル・データベース（ＲＤＢ）は、データを記憶し検索する良く知られた手段であり、Codd及びDateによって発明されたリレーショナル代数に基づく。リレーショナル・データベースは一般に、インデックス、テーブル（表）及びビュー（視覚）によって実現され、インデックスはデータキーを含み、テーブルはデータ値の列及び行または組で構成され、ビューは仮想的なテーブルとして作用し、これにより複数テーブルの特定の列及び行を、これらの列及び行のデータがあたかも実際の物理的テーブル中に統合されているように操作することができる。テーブル及び列の配置は、データを参照するための論理構造を実現し、この論理構造はスキーマと称される。リレーショナル・データベース・マネージメントシステム（ＲＤＢＭＳ：Relational Database Management System）と称されるソフトウェア層は一般に、アクセス、セキュリティ、エラー処理、完全性（インテグリティ）、テーブルの作成及び除去、及びＲＤＢの適正な動作及び利用に必要な他のすべての機能を処理するために使用される。これに加えて、ＲＤＢＭＳは一般に、ＲＤＢと外部ソフトウェアプログラム及び／またはユーザとのインタフェースを提供する。ＲＤＢＭＳと外部ソフトウェアプログラム及び／またはユーザとのインタフェースがアクティブ（活性）である各瞬時を接続と称する。ＲＤＢＭＳは、ＲＤＢＭＳと接続された外部ソフトウェアプログラム及び／またはユーザとの間で使用するための２つの特別な言語を提供する。第１の言語であるData Definition Language（ＤＤＬ：データ定義言語）は、外部ソフトウェアプログラム及びユーザがデータベースの構成要素及び構造を調べて管理することを可能にし、そしてインデックス、テーブル及びビューの作成、消去、及び修正のような機能を可能にする。スキーマはＤＤＬを用いてのみ修正することができる。他の言語であるData Manipulation Language（ＤＭＬ：データ操作言語）と称される質問言語（Query Language）は、データベース・テーブル中に含まれるデータ値の行の選択、検索、記憶、挿入及び消去を可能にする。最も一般に知られているリレーショナル・データベース用のＤＤＬ及びＤＭＬはStructured Query
Language（ＳＱＬ：構造化質問言語、ANSI/ISO規格）である。ＳＱＬのステートメント（文）は、ＲＤＢＭＳに接続したソフトウェアプログラム及び／またはユーザによって構成され、質問として提出される。ＲＤＢＭＳは質問を処理し、結果セットと称する回答を返す。結果セットは、質問に合った（質問に満足に答える）データベース中の行及び列の組である。質問に満足に答える行及び列がデータベース中にない場合には、この質問からは行及び列を戻さず、この場合には、結果セットは空である（NULL SET）と称する。本発明の実施例では、対象の項目または語句についての情報の潜在的及び実際のソースはＲＤＢ内のテーブル中のデータ行である。ＲＤＢテーブル中の各行は同等に、対象の項目または語句についての情報のソースになる資格があると考えられる。本発明の方法は次のステップを含む：
(a) データベースへの接続を生成するステップ；
(b) ＳＱＬで質問を形成するステップであって、この質問は、
(b1) ＳＱＬのWHERE節を含み、
(b2) このWHERE節は、ＲＤＢ内の少なくとも１つのテーブルを指定し、
(b3) このWHERE節は、このテーブル中の少なくとも１つの列を指定し、
(b4) このWHERE節は、EQUALSのような少なくとも１つのＳＱＬの比較演算子を含み、
(b5) このWHERE節は、対象の項目または語句を少なくとも１つ、パラメータとして含む；
(c) ＲＤＢＭＳに質問を提出するステップ；
(d) ＲＤＢＭＳによって戻されるデータの行（があれば）受け取るステップ、このデータの行は、対象の項目または語句についての情報の実際のソースであると考えられる。

検索するデータベース・テーブル中の列の数が２以上であれば、本発明の方法は次のステップを含む：
(a) データベースへの接続を生成するステップ；
(b) ＳＱＬで質問を形成するステップであって、この質問は、
(b1) ＳＱＬのWHERE節を含み、
(b2) このWHERE節は、ＲＤＢ内の少なくとも１つのテーブルを指定し、
(b3) このWHERE節は、このテーブル中の少なくとも１つの列を指定し、
(b4) このWHERE節は、EQUALSのような少なくとも１つのＳＱＬの比較演算子を含み、
(b5) このWHERE節は、対象の項目または語句を少なくとも１つ、パラメータとして含み、
(b6) 検索するテーブル中の列毎に、追加的なWHERE節が(b1)、(b2)、(b3)で構成され、検索する各列は、(b4)及び(b5)を個別に識別され、
(b7) 追加的なWHERE節の各々はＳＱＬの’ＯＲ’演算子によって結合される；
(c) ＲＤＢＭＳに質問を提出するステップ；
(d) ＲＤＢＭＳによって戻されるデータの行（があれば）受け取るステップ、このデータの行は、対象の項目または語句についての情報の実際のソースであると考えられる。

検索するデータベース・テーブルの数が２以上であれば、本発明の方法は次のステップを含む：
(a) データベースへの接続を生成するステップ；
(b) ＳＱＬで質問を形成するステップであって、この質問は、
(b1) ＳＱＬのWHERE節を含み、
(b2) このWHERE節は、ＲＤＢ内の少なくとも１つのテーブルを指定し、
(b3) このWHERE節は、このテーブル中の少なくとも１つの列を指定し、
(b4) このWHERE節は、EQUALSのような少なくとも１つのＳＱＬの比較演算子を含み、
(b5) このWHERE節は、対象の項目または語句を少なくとも１つ、パラメータとして含む；
(b8) 検索するテーブル毎に、追加的なWHERE節が(b1)、(b2)で構成され、検索する各テーブルは、(b3)、(b4)及び(b5)を個別に識別され、
(b7) 追加的なWHERE節の各々はＳＱＬの’ＯＲ’演算子によって結合される；
(c) ＲＤＢＭＳに質問を提出するステップ；
(d) ＲＤＢＭＳによって戻されるデータの行（があれば）受け取るステップ、このデータの行は、対象の項目または語句についての情報の実際のソースであると考えられる。

これらの実施例では、質問から戻されるあらゆるデータの行が、対象の項目または語句についての情報のリソースであると考えられる。リレーショナル・データベースのリソースのスキーマも、対象の項目または語句についての情報の実際のソースであると考えられる。本発明の一部の利用にとって好適なリレーショナル・データベースは、個別のパーソナルコンピュータ上、コンピュータネットワークの各コンピュータ上、ネットワークのサーバーコンピュータ上、及びネットワークのデータベース・サーバーコンピュータ上に展開される。ネットワークのデータベース・サーバーは、一般に高性能の特別なコンピュータであり、大きなユーザグループ用のデータベース機能をサポートするタスク向けに専用化されている。

データベースのビューは、データベース・テーブルの代わりにデータベースのビューを指定するWHERE節によって、実際のデータベース・テーブルと本質的に同じ手順を用いて、読取り用及び結果セットの検索用にアクセスすることができる。他の実施例は、ＳＱＬを用いてデータのウェアハウス（倉庫）をアクセス及び検索して、対象の項目または語句についての情報の潜在的なソースを識別する。データのウェアハウスはリレーショナル・データベースの特別な形である。ＳＱＬは大部分のデータ・ウェアハウス用にＤＭＬ及びＤＤＬとして使用されるが、データ・ウェアハウス内のデータは複雑かつ大局的なインデックス構造によってインデックス付けされる。

分類法は最初は、生物体の分類に使用されていた。分類法は分類の科学であるが、分類法の例は、説明、分析、あるいは情報検索の枠組み（フレームワーク）を提供するために使用されるカタログである。分類法は、事物を明確な階層構成に分類することによって生み出される。分類法は通常、ある種のグラフであるツリーとして表現される。グラフは、エッジまたはリンク（連結線）によって接続された頂点（またはノード）を有する。ツリーの「ルート」または最上の頂点（例えば生物体）から、明らかに一意的なグループ（例えば哺乳類、魚類、鳥類）毎に「ブランチ（枝）」（エッジ）が分岐する。ブランチは、サブグループ毎に次のブランチに分岐し続け（例えば哺乳類からのブランチは有袋類及びサピエンスであり得る）、外向きのエッジを有しないリーフ（葉）の頂点に行き当たるまで分岐し続ける（例えばサピエンスのサブグループからは、リーフの頂点はホモサピエンス（人）において見出される）。一実施例では、グラフ・トラバース（横断検索）機能と称するソフトウェア機能を用いて、分類中で対象の項目または語句を検索する。分類については、グラフは一般に、出現（インシデンス）リストと称される形式で記憶し、グラフのエッジは、各エッジを接続する複数対の頂点を含むアレイによって表現される。分類法は有向グラフ（ダイグラフ）であるので、このアレイは順序付けられている。分類法用の出現リストの例は次の表のように現われる：

こうしたリストのトラバースは、ほとんど任意のコンピュータ・プログラミング言語において単純である。分類用の出現リストがＲＤＢテーブル内に記憶されている場合には、ＲＤＢ内を検索する方法を用いる。対象の項目または語句が見出された場合には、分類全体が、対象の項目または語句についての情報のソースであると考えられる。特定の使用において関係する種類の分類の例は、個別のパーソナルコンピュータ上、コンピュータネットワーク上の個別のコンピュータ上、ネットワークのサーバーコンピュータ上、及びネットワークの分類サーバーコンピュータ上に存在する。ネットワークの分類サーバーは一般に高性能の特別なコンピュータであり、大きなユーザグループ用の分類検索機能をサポートするタスク向けに専用化されている。

本発明の一実施例は、参照構造としての分類の例に関係し、この理由で、分類は、対象の項目または語句が当該分類中にない場合でも、その全体がリソースであると考えられる。

オントロジーは、概念及び事物、及びこれらどうしの関係を形式的に記述する語彙であり、語彙の用語を用いて、指定した関係領域内で意味あるものを表現するパターンを有する。この語彙を用いて質問及び表明を行う。存在論は一般にグラフとして表現される。本実施例では、グラフ・トラバース機能と称されるソフトウェア機能を用いて、対象の項目または語句を含むオントロジー中の、対象の頂点と称する頂点を検索する。オントロジーは、オントロジーの開始頂点から「関係」（リンク）を、対象の項目または語句が見つかるまで、あるいはオントロジー中のすべての頂点を訪ね尽くすまで辿ることによって検索する。オントロジーを検索するために用いるグラフ・トラバース機能は、分類を検索するために用いるグラフ・トラバース機能とは次の理由で異なる：第１に、オントロジー中のエッジはラベル付けされている；第２に、頂点ａ、エッジｅ、頂点ｂの各三つ組の因果関係は、頂点ａと頂点ｂとの反転関係を捉えるために、頂点ｂ、エッジｅ^、頂点ａでなければならないことが多い。例えば次の表の通りである：

トラバースは単純であるが、大きなオントロジーについては時間を要し得る。可能であれば、本発明の実施例は、ＲＤＢＭＳ機能に基づく意味的（セマンティック）アクセス及び検索を伴うインデックス付きのオントロジーを用いる。対象の項目または語句が見つかった場合には、オントロジー全体を、対象の項目または語句についての情報の実際のソースであると考える。オントロジーの例は、個別のパーソナルコンピュータ上、コンピュータネットワーク上の各コンピュータ上、ネットワークのサーバーコンピュータ上、及びネットワークのオントロジー・サーバーコンピュータ上に存在する。ネットワークのオントロジー・サーバーは一般に高性能の特別なコンピュータであり、大きなユーザグループ用の意味的検索機能をサポートするタスク向けに専用化されている。

分類の例に当てはまるように、本発明の一実施例は参照構造としてのオントロジーに関係し、この理由で、オントロジーは、対象の項目または語句が当該オントロジー中にない場合でも、その全体が実際のソースであると考えられる。

あらゆる潜在的なソースを位置検出した後に、各潜在的なソースを、対象の項目または語句との関連性についてテストしなければならない。項目または語句に関連する文献を検索する際には、特定レベルの識別検索が可能である。例えば、当該文書が蓄積されているファイル名は記述的（説明的）なテキストを含み得る。より深いレベルでは、リソース識別によって識別される文書はそのタイトル（表題）を検索することができ、あるいはその要約を通してより深く検索することができ、あるいは、文書のテキスト全体を通してさらに深く検索することができる。これらの検索のいずれもが、質問中で利用される項目または語句にある文書が関連することを見出す結果を生じさせ得る。広範囲のテキストに検索を拡げる場合には、近接関係（近さの関係）を起動して、関連性のあるものとして識別されるリソースの数を制限することもできる。関連性用のテキストは、潜在的なソースが対象の項目または語句との正確な一致を含むことを確立するのと同じくらい単純かつ狭い。改善された高度な知識により、関連性のテストは、検査した潜在的なソースの中からより価値のあるリソースを、より一層正確に識別する。本発明によるこれらの関連性のテストは次のものを含むことができるが、これらに限定されない：
(i) 潜在的なソースが、対象の項目または語句の単数形または複数形との一致を含むこと；
(ii) 潜在的なソースが、対象の項目または語句の同義語との一致を含むこと；
(iii) 潜在的なソースが、対象の項目またが語句に関係する単語との一致を含むこと（シソーラス（語彙辞典）によって提供され得るものに関係する）；
(iv) 潜在的なソースが、対象の項目または語句に関係する単語との一致を含み、潜在的なソースの内容と対象の項目または語句との関係が権威ある参照ソースによって確立されること；
(v) Merrian-Webster’s Thesaurus（メリアン・ウェブスター社の刊行物）のようなシソーラスを使用して、検索中に存在する潜在的なソースの何らかの内容が、対象の項目または語句の同義語か、またはこれに関係するものであるか否かを判定すること；
(vi) 潜在的なソースが、対象の項目及び／または語句の１つの、権威ある参照ソース中の定義に現われる単語との一致を含むこと；
(vii) Merrian-Webster’s Dictionary（メリアン・ウェブスター社の刊行物）のような辞典を使用して、検索中に存在する潜在的なソースの何らかの内容が、対象の項目または語句の、この辞典の定義であるか否か、従って関係するか否かを判定すること；
(viii) 潜在的なソースが、権威ある参照ソースにおける対象の項目または語句についての説明中に出現する単語との一致を含むこと；
(ix) Encyclopedia Britannica（Encyclopedia Britannica社の刊行物）のような百科辞典を使用して、検索中に存在する潜在的なソースの何らかの内容が、対象の項目または語句についての百科事典の説明中にあるか否か、従って関係するか否かを判定すること；
(x) 潜在的なソース中にある項目が、対象の項目または語句と「親」、「子」、または「兄弟」の関係を有すること；
(xi) 分類を使用して、潜在的なソースに含まれる項目が、対象の項目または語句と「親」、「子」、または「兄弟」の関係を有することを判定すること。本実施例では、対象の項目または語句を含む頂点が分類中にある。これが対象の頂点である。潜在的なソースの内容中にある単語毎に、分類における「親」、「兄弟」及び「子」の頂点を、対象の頂点から、この対象の頂点の「親」、「兄弟」及び「子」の頂点までの関係（リンク）を辿ることによって検索する。「親」、「兄弟」または「子」の頂点のいずれかが、潜在的なソースの内容からの単語を含む場合には、一致を宣言し、このソースは対象の項目または語句についての情報の実際のソースであると考える。本実施例では、グラフ・トラバース機能と称するソフトウェア機能を用いて、対象の項目または語句の「親」、「兄弟」及び「子」の頂点を位置検出して検査する；
(xii) 対象の項目または語句が、潜在的なソースに含まれる項目から１（単位）の意味的度合い（長さ）のものであること；
(xiii) 対象の項目または語句が、潜在的なソースに含まれる項目から２（単位）の意味的度合い（長さ）のものであること；
(xiv) オントロジーを使用して、ソースが、対象の項目または語句から１（単位）の意味的度合い（長さ）だけ離れていることを判定すること。本実施例では、対象の項目または語句を含む頂点はオントロジー中に位置する。これが対象の頂点である。潜在的なソースの内容中にある単語毎に、対象の頂点から隣接するすべての頂点までの関係（リンク）を辿ることによって、オントロジーを検索する。隣接する頂点のいずれかが潜在的なソースの内容からの単語を含む場合には、一致を宣言し、このソースは対象の項目または語句についての情報の実際のソースであると考える；
(xv) オントロジーを使用して、ソースが、対象の項目または語句から２（単位）の意味的度合い（長さ）だけ離れていることを判定すること。本実施例では、対象の項目または語句を含む頂点はオントロジー中に位置する。これが対象の頂点である。潜在的なソースの内容中にある単語毎に、意味的度合い１の関連性テストを実行する。このテストが不合格であれば、対象の頂点に隣接する頂点からそれぞれの隣接する頂点のすべてまでの関係（リンク）を辿ることによって、オントロジーを検索する。こうした頂点は、対象の頂点から意味的度合い２である。意味的度合い２の頂点のいずれかが、潜在的なソースの内容からの単語を含む場合には、一致を宣言し、このソースは対象の項目または語句についての情報の実際のソースであると考える；
(xvi) CYC Ontology（Cycorp社の製品）のような汎用的なオントロジーを使用して、対象の項目及び／または語句の１つから、検索中に存在する潜在的なソースのあらゆる内容までの意味的距離の度合い（長さ）を測定すること；
(xvii) Gene Ontology（Gene Ontology Consortiumのプロジェクト）のような特化したオントロジーを使用して、対象の項目及び／または語句から、検索中に存在する潜在的なソースのあらゆる内容までの意味的距離の度合い（長さ）を測定すること；
(xviii) オントロジーを使用し、テストのために、オントロジー言語（例えばWeb Ontology Language（ＯＷＬ））を用いてオントロジーにアクセスしてオントロジー内を進むこと。

潜在的なソースを位置検出し、関連性テストに合格し、そしてリソースに進んだ後に、本発明の好適な実施例は、リソースをノードに分解することを求める。本発明のこの実施例に適用されるリソース分解の２つの方法は、単語分類及び中間フォーマットである。単語分類は、単語を品詞（例えば名詞、動詞、形容詞）の例として識別する。適正な単語分類は、コーパス（言語資料）と称されるテキストを必要とすることが多い、というのは、単語分類は、その単語が何であるかではなく、その単語をどのように使用するかに依存するからである。単語分類の作業は人間の言語（人間語）毎に一意的であるが、すべての人間語は品詞に分解することができる。本発明の好適な実施例における、単語分類によって分解される人間語は英語であり、単語分類の手段は自然言語パーサー（ＮＬＰ：natural Language Parser）（例えば英国のシェフィールド大学の製品であるＧＡＴＥ（登録商標））である。一実施例では、次のことを実行する：
(a) テキストをＮＬＰに入力する；
(b) ＮＬＰはテキストを「文章（センテンス）の文書（ドキュメント）」に再編成する；
(c) 「文章」毎に、
(c1) ＮＬＰは一連のトークンを符号化し、各トークンは、文章中の（このトークンに）対応する単語の品詞に対するコードである；

リソースが、プレーンテキスト中で許されない書式設定、処理、または特殊文字を少なくとも１つ含むならば、次のことを実行する：
(a) テキストをＮＬＰに入力する；
(b) ＮＬＰはテキストを「文章の文書」に再編成する；
(c) 「文章」毎に、
(c1) ＮＬＰはトークンの列を符号化し、各トークンは、文章中の（このトークンに）対応する単語の品詞に対するコードである；
(c2) ＮＬＰにとって認識可能でない文字を含む文字列または単語列を、文章及び上記トークンの列の両方から取り除く

この第２の方法を用いることによって、任意の英語テキストを含むリソースをノードに分解することができ、次のように書式設定したリソースを含む：
(i) テキスト（プレーンテキスト）ファイル。
(ii) リッチテキスト・フォーマット（ＲＴＦ、マイクロソフト社によって開発された規格）ファイル。代案の方法は、まずＲＴＦ−テキスト変換ユーティリティ（例えばPete Sergeant社の製品であるRTF-Parser-1.09）の中間的な使用によってＲＴＦからクリーンテキストを得ることである。
(iii) エクステンデッド・マークアップ・ランゲージ（ＸＭＬ、ワールドワイド・ウェブ・コンソーシャムのプロジェクト）ファイル。
(iv) マークアップ・ランゲージ・ファイルのあらゆる「方言」ファイル、これらの方言は、ハイパーテキスト・マークアップ・ランゲージ（ＨＴＭＬ）及びエクステンシブル・ハイパーテキスト・マークアップ・ランゲージ（ＸＨＴＭＬ）（ワールドワイド・ウェブ・コンソーシャムのプロジェクト）、RuleML（RuleMLイニシアティブのプロジェクト）、スタンダード・ジェネラライズド・マークアップ・ランゲージ（ＳＧＭＬ、国際規格の１つ）、及びエクステンシブル・スタイルシート・ランゲージ（ＸＳＬ、ワールドワイド・ウェブ・コンソーシャムのプロジェクト）を含むが、これらに限定されない。
(v) ポータブル・ドキュメント・フォーマット（ＰＤＦ、Adobe社の独自フォーマット）ファイル。
(vi) MS WOED（ＭＳワード（登録商標）ファイル、例えば、MS WORD（マイクロソフト社によるワードプロセッサ・ソフトウェア製品）による文書を格納するために使用するDOCファイル。本実施例は、ＭＳワード−テキスト・パーサー（例えばApache.orgの製品であるApache POIプロジェクト）をプログラムで利用する。ＰＯＩプロジェクトのＡＰＩは、Microsoft Excel（マイクロソフト・エクセル（登録商標））のスプレッドシート（表計算ソフト）ファイル（XLS）からのプログラムで起動されるテキスト抽出も可能にする。ＭＳワード・ファイルはＮＬＰによっても、特殊文字を含むプレーンテキストファイルとして処理することができるが、XLSファイルは処理できない。
(vii) イベント情報獲得ログ（記録）ファイル、トランザクション・ログ、電話発呼記録、従業員のタイムシート（勤務時間記録表）、及びコンピュータシステムのイベントログを含むが、これらに限定されない。
(viii) ウェブページ。
(ix) ブログページ。

単語分類によるＸＭＬファイルの分解のために、ＸＭＬ要素のオープン（開く）タグとクローズ（閉じる）タグとによって囲まれた英語の内容のみに分解を適用し、その代案は、ＸＭＬ要素のオープンタグとクローズタグとによって囲まれた英語の内容、及びＸＭＬ要素のオープンタグ及びクローズタグのあらゆる英語タグ値に分解を適用する。本実施例は、本発明における、メタデータ・ラベル値を内容と共に獲得し、そしてこれらのラベル値を、要素内容から成るノード中に伝播させることを追求する場合に有用である。この能力がなければ、本実施例は、ＮＬＰによって特殊文字を含むプレーンテキストファイルとして処理したＸＭＬファイルに頼る。マークアップ・ランゲージのあらゆる「方言」は、参照した実施例による方法と本質的に同一の方法で処理され、これらの方言は次のものを含むがこれらに限定されない：ハイパーテキスト・マークアップ・ランゲージ（ＨＴＭＬ：HyperText Markup Language）及びエクステンシブル・ハイパーテキスト・マークアップ・ランゲージ（ＸＨＴＭＬ（登録商標）：Extensible HTML）（ワールドワイド・ウェブ・コンソーシャムのプロジェクト）、RuleML（RuleMLイニシアティブのプロジェクト）、スタンダード・ジェネラライズド・マークアップ・ランゲージ（ＳＧＭＬ：Standard Generalized Markup Language、国際規格の１つ）、及びエクステンシブル・スタイルシート・ランゲージ（ＸＳＬ：Extensible Stylesheet Language、ワールドワイド・ウェブ・コンソーシャムのプロジェクト）

本発明の好適な実施例では、単語分類を用いてｅ−メール・メッセージ及びｅ−メール・メッセージの添付ファイルを分解する。前述したように、個別コンピュータ及びサーバー上のｅ−メール・リポジトリをアクセス及び検索するために使用するのと同じ、プログラムで起動されるユーティリティを、ｅ−メール・メッセージ及びｅ−メールの添付ファイルからの英語テキストの抽出に指向させる。結果的に抽出された英語テキストを「クリーン」にできる程度に依存して、本発明が使用するＮＬＰは抽出したテキストを、（単なる）プレーンテキストまたは特殊文字を含むプレーンテキストとして処理する。ｅ−メールの添付ファイルは前述したように、それぞれのファイルフォーマット毎に分解される。

単語分類による分解は、本発明によってサポートされる分解の２つの方法の１つであり、分解の他の手段は、中間フォーマットを用いたリソースからの情報の分解である。中間フォーマットは、第２の項目または語句と対をなす第１の項目または語句である。好適な実施例では、第１の項目または語句は第２の項目または語句と関係を有する。この関係は暗示的な関係または明示的な関係のいずれかであり、そしてこの関係はコンテクスト（文脈）によって規定される。一実施例では、このコンテクストがスキーマである。他の実施例では、このコンテクストがツリーグラフである。第３の実施例では、このコンテクストが有向グラフ（ダイグラフとも称される）である。これらの実施例では、コンテクストは、上記一対の項目または語句を抽出したリソースから提供される。他の実施例では、コンテクストは外部リソースによって提供される。本発明の一実施例によれば、上記関係はコンテクストによって規定される明示的な関係であり、この関係は当該コンテクストによって指定される。

一実施例では、コンテクストがスキーマであり、そしてリソースはリレーショナル・データベース（ＲＤＢ）である。第１の項目または語句から第２の項目または語句までの関係は暗示的な関係であり、この暗示的な関係はＲＤＢにおいて規定されている。本発明の分解方法は、一対の概念または項目で関係を提供し、これによりノードを作成する。第１の項目は句であり、このことは、第１の項目が２つ以上の部分（２単語、単語と数値、３単語）を有することを意味し、そして第２の項目は句であり、このことは、第２の項目が２つ以上の部分（２単語、単語と数値、３単語）を有することを意味する。

分解機能はＲＤＢスキーマを入力として解釈する。この方法は次のステップを含む：
(A) 第１段階では、
(a) 第１の項目または語句がデータベース名であり、第２の項目または語句がデータベース・テーブル（データベース内のテーブル）名である。例：データベース名が”ACCOUNTING（会計）”であり、データベース・テーブル名が”Invoice（送り状、納品書、請求書）”である；
(b) 第１の項目または語句（”ACCOUNTING（会計）”）と第２の項目または語句（”Invoice”）との関係（例えば”has”（有する））は、ＲＤＢスキーマの意味論（セマンティックス）により暗示的であると認識する。
(c) これら一対の概念または項目の関係（”has”）を提供することによってノード（”Accounting−has−Invoice”）を生成する；
(d) ＲＤＢ内のテーブル毎に、データベース名を固定するステップ(a)、関係を固定するステップ(b)、個別のテーブル名を反復的に用いてノードを生成するステップ(c)を実行する。
(B) 第２段階では、
(a) 第１の項目または語句がデータベース・テーブル名であり、第２の項目または語句がデータベース・テーブルの列名である。例：データベース・テーブル名が”Invoice”であり、列名が”Amount Due（未払額、精算額）”である；
(b) 第１の項目または語句（”Invoice”）と第２の項目または語句（”Amount Due”）との関係（例えば”has”）は、ＤＢスキーマの意味論（セマンティックス）により暗示的であると認識する。
(c) これら一対の概念または項目の関係（”has”）を提供することによってノード（”Invoice−has−Amount Due”）を生成する；
(d) データベース・テーブル中の列毎に、データベース・テーブル名を固定するステップ(a)、関係を固定するステップ(b)、個別の列名を反復的に用いてノードを生成するステップ(c)を実行する。
(e) ＲＤＢ内のテーブル毎に、ステップ(d)に続いて、データベース・テーブル名を反復的に使用するステップ(a)、関係を固定するステップ(b)、個別の列名を反復的に用いてノードを生成するステップ(c)を実行する。
本実施例では、ＲＤＢのスキーマ全体を分解し、上記暗示的な関係はＲＤＢの意味論によって直ちに知られるので、ＲＤＢのスキーマ全体は、中間フォーマットの一対の概念または項目を追加的に処理することなしにノードに分解することができる。

他の実施例では、分解機能は、ＲＤＢスキーマに加えて、テーブル中のある行からの少なくとも２つの値を入力として解釈する。この方法は次のステップを含む：
(a) 第１の項目または語句が複合項目であり；
(b) この複合項目の第１部分はデータベース・テーブルの列名であり、これは、このテーブルの”キー”列の名前である（例えば、テーブル”Invoice”に対しては、キー列は”Invoice No.（送り状番号）”である。）；
(c) 上記複合項目の第２部分は、テーブルの第１行からのキー列に対する値である（例えば、”Invoice”テーブルの列”Invoice No.”に対しては、行１の”Invoice No.”の値が”500024”であり、この行を「現在行」と称する）；
(d) 上記複合の第３部分は、テーブル中の第２列の列名である（例”Status（状態）”）；
(e) 第１の項目または語句は”Invoice No. 500024 Status（送り状番号500024の状態）”となる；
(f) 第２の項目または語句は、第２列、現在行からの値である。例：第２列の名前が”Status”であり、行１の値が”Overdue（期限切れ）”である；
(g) 第１の項目または語句（”Invoice No. 500024 Status”）と第２の項目または語句（”Overdue”）との関係（例えば”is（である）”）を、ＲＤＢスキーマの意味論により暗示的であると認識する；
(h) 上記一対の概念または項目の関係（”is”）を提供することによって、ノードを生成する（”Invoice No. 500024 Status−is−Overdue”）；
(i) テーブル中の行毎に、キー列名を固定するステップ(b)、行と共に変化するステップ(c)、第２列名を固定するステップ(d)、行毎の第２列の値と共に変化するステップ(f)、固定された関係（”is”）(g)でノードを生成するステップ(h)を実行する；
(j) テーブル中の列毎に、ステップ(i)を実行する；
(k) データベース内のテーブル毎に、ステップ(j)を実行する。
ＲＤＢの全体の内容を分解することができ、上記暗示的な関係はＲＤＢの意味論によって直ちに知られるので、ＲＤＢの全体の内容は、中間フォーマットの一対の概念または項目を追加的に処理することなしにノードに分解することができる。

コンテクストがツリーグラフであり、リソースが分類であれば、第１の項目または語句から第２の項目または語句までの関係は暗示的な関係であり、この暗示的な関係は分類によって規定される。

分解機能は、分類中のすべての階層関係を獲得する。分解方法はグラフ・トラバース機能であり、このことは、この方法が分類グラフのすべての頂点を訪ねることを意味する。ツリーグラフでは、（ルート以外の）頂点は、親は１つだけ有するが、多くの兄弟及び子を有する。この方法は次のステップを含む：
(a) グラフのルートの頂点から開始する；
(b) 頂点を訪ねる（現在の頂点と称する）；
(c) 現在の頂点に至る子の頂点が存在する場合には；
(d) 子の頂点の値は第１の項目または語句（例えば”mammal（哺乳類）”）である；
(e) 現在の頂点の値は第２の項目または語句（例えば”living organism（生物体）”）である；
(f) 第１の項目または語句（子の頂点の値）と第２の項目または語句（現在の頂点の値）との関係（例えば”is「である」”）を、分類の意味論により暗示的であると認識する；
(g) これら一対の概念または項目の関係（”is”）を提供することによって、ノード（”mammal−is−living organism（哺乳類は生物体である）”）を生成する；
(h) 分類グラフ中の頂点毎に、ステップ(b)、(c)、(d)、(e)、(f)、(g)を実行する。
分類ツリー全体の親／子関係は分解することができ、上記暗示的な関係は分類の意味論によって直ちに知られるので、分類の全体の内容は、中間フォーマットの一対の概念または項目を追加的に処理することなしにノードに分解することができる。

他の実施例では、分解機能は分類中のすべての兄弟関係を獲得する。この方法は次のステップを含む：
(a) グラフのルートの頂点から開始する；
(b) 頂点を訪ねる（現在の頂点と称する）；
(c) 現在の頂点に至る子の頂点が２つ以上存在する場合には；
(d) 左から右への参照フレームを用いる；
(e) 第１の子の頂点の値は、第１の項目または語句である（例えば”humans（人間）”）
(f) これに最も近い兄弟の（近接した）頂点は第２の項目または語句（例えば”aeps（類人猿）”）である；
(g) 第１の項目または語句（第１の子の頂点の値）と第２の項目または語句（他の子の頂点の値）との関係（例えば”related（関係があった）”）を、分類の意味論（即ち兄弟関係）により暗示的であると認識する；
(h) これら一対の概念または項目の関係（”related”）を提供することによって、ノード（”humans−related−apes（人間は類人猿と関係があった）”）を生成する；
(i) 現在の頂点の（第１の子より先の）他の子の頂点毎に、ステップ(e)、(f)、(g)、(h)を実行する；
(j) 分類グラフ中の頂点毎に、ステップ(b)、(c)、(d)、(i)を実行する。
分類ツリー全体中のすべての兄弟関係は分解することができ、上記暗示的な関係は分類の意味論によって直ちに知られるので、分類の全体の内容は、中間フォーマットの一対の概念または項目を追加的に処理することなしにノードに分解することができる。

コンテクストが有向グラフであり、リソースがオントロジーであれば、第１の項目または語句から第２の項目または語句までの関係は暗示的な関係であり、この暗示的な関係はオントロジーによって規定される。

分解機能は、オントロジー中の意味的度合い１のすべての意味的関係を獲得する。分解方法はグラフ・トラバース機能であり、このことは、この方法はオントロジーグラフのすべての頂点を訪ねることを意味する。オントロジーグラフ中では、度合い１の意味的関係は、与えられた頂点からちょうど１リンク（１「ホップ」）移動したすべての頂点によって表わされる。各リンクには、頂点間の関係をラベル付けしなければならない。この方法は次のステップを含む：
(a) グラフのルートの頂点から開始する；
(b) 頂点を訪ねる（現在の頂点と称する）；
(c) 現在の頂点から他の頂点へのリンクが存在する場合には；
(d) 時計回りの参照フレームを用いて；
(e) 現在の頂点の値は第１の項目または語句（例えば”husband（夫）”）である；
(f) 最初にリンクされる頂点の値は第２の項目または語句（例えば”wife（妻）”）である；
(g) 第１の項目または語句（現在の頂点の値）と第２の項目または語句（リンクされた頂点の値）との関係（例えば”spouse（配偶者）”）は、オントロジーの意味論により明示的に提供される；
(h) これら一対の概念または項目の関係（”spouse”）を提供することによって、ノード（”husband−spouse−wife（夫−配偶者−妻）”）（正式には「妻との配偶者関係を有する夫が存在する」ことを意味する）を生成する；
(i) オントロジーグラフ中の頂点毎に、ステップ(b)、(c)、(d)、(e)、(f)、(g)、(h)を実行する；
オントロジーツリーにおける度合い１の関係は分解することができ、上記明示的な関係は、オントロジーのラベル付けされた関係の意味論によって直ちに知られるので、オントロジーの全体の内容は、中間フォーマットの一対の概念または項目を追加的に処理することなしにノードに分解することができる。

ノードは相関の基礎的要素（ビルディングブロック）である。ノードは、与えられた原点から発見されたデスティネーション（行先）までの関連のチェーン（連鎖）中のリンクである。本発明の好適な実施例及び／または好適な方法は、ノードを用いて相関を構成することによって知識を発見するための改善されたシステム及び方法を提供することに指向したものである。ノードプールにノードが置かれ次第、相関を開始することができる。本発明のすべての実施例において、ノードはデータ構造である。ノードの各部分は、テキスト、数字、数学記号、論理記号、ＵＲＬ、ＵＲＩ、及びデータオブジェクトを含むデータ形式（データタイプ）を保持することができるが、これらに限定されない。ノードデータ構造は、独立して意味を伝えるのに十分であり、そしてノードデータ構造は関係を含むので、独立して意味を伝えることができる。ノードによって明らかになる関係には方向性があり、このことは、関係項どうしの間の関係は単方向性でも双方向性でもあり得ることを意味する。単方向性の関係は単一方向のみに存在し、１つの部分から他の部分へのトラバース（横断）は許容するが逆方向のトラバースは許容しない。双方向性の関係は両方向のトラバースを許容する。

一実施例では、ノードは３つの部分で構成されるデータ構造であり、これら３つの部分は、関係及び２つの関係項を含む。これらの部分の構成は次の通りである：
(a) 第１部分は第１の関係項を含む；
(b) 第２部分は関係を含む；
(c) 第３部分は第２の関係項を含む。
これらの部分に次の名称を与える：
(a) 第１の関係項を含む第１部分を主部と称する；
(b) 関係を含む第２の関係項を結合部と称する；
(c) 第２の関係項を含む第３部分を属性と称する。

他の好適な実施例では、ノードはデータ構造であり、４つの部分で構成される。これら４つの部分は、関係、２つの関係項、及びソースを含む。４つの部分の１つはソースであり、ソースは、ノードを抽出したリソースを識別するＵＲＬ、ＵＲＩを含む。代案の実施例では、ソースは、ノード中に含まれる関係についてのコンテクストを提供する外部リソースを識別するＵＲＬまたはＵＲＩを含む。これらの実施例では、これら４つの部分は関係、２つの関係項、及びソースを含み、これらの部分の構成は次の通りである：
(a) 第１部分は第１の関係項を含む；
(b) 第２部分は関係を含む；
(c) 第３部分は第２の関係項を含む；
(d) 第４部分はソースを含む。
これらの部分に次の名称を与える：
(a) 第１の関係項を含む第１部分を主部と称する；
(b) 関係を含む第２部分を結合部と称する；
(c) 第２の関係項を含む第３部分を属性と称する；
(d) ソースを含む第４部分をシーケンス（列）と称する。

図４Ａを参照すれば、ノード１８０Ａ及び１８０Ｂの生成は、自然言語プロセッサ（ＮＬＰ）４１０によって、分解の生成物を用いて達成され、少なくとも１つの単語文及びトークンの列を含み、この文とトークンの列とは一対一の対応４１５を有しなければならない。少なくとも１つの構文（シンタックス）パターン４２０に一致するすべてのノード１８０Ａ、１８０Ｂを構成することができる。その方法は次の通りである：
(a) トークンの構文パターン４２０を選択する（例：<noun（名詞）><preposition（前置詞）><noun（名詞）>）；
(b) 左から右に移動する；
(c) トークンの列中の、このパターンの中央のトークン（<preposition>）を検索する；
(d) 正しいトークン（<preposition>）がトークン列中に位置検出された場合には；
(e) <preposition>のトークンを現在トークンと称する；
(f) 現在トークンの左側のトークン（左トークンと称する）を調べる；
(g) 左トークンが上記パターンに一致しない場合には；
ａ．この試みを失敗と考える；
ｂ．トークンの列の検索を、現在トークンの位置から継続する；
ｃ．次に一致する<preposition>トークンを位置検出するまで行う；
ｄ．あるいは、トークンの列の終点に行き着く；
(h) 左トークンが上記パターンに一致する場合には；
(i) 現在トークンの右側のトークン（右トークンと称する）を調べる；
(j) 右トークンが上記パターンに一致しない場合には；
ａ．この試みを失敗と考える；
ｂ．トークンの列の検索を、現在トークンの位置から継続する；
ｃ．次に一致する<preposition>トークンを位置検出するまで行う；
ｄ．あるいは、トークンの列の終点に行き着く；
(k) 左トークンが上記パターンに一致する場合には；
(l) ノード１８０Ａ及び１８０Ｂを作成する；
(m) <noun><preposition><noun>のパターン、例えば”action regarding inflation（膨張に関する作用）”に相当する単語リストからの単語を使用する；
(n) トークンの列の検索を、現在トークン位置から継続する；
(o) 次に一致する<preposition>トークンを位置検出するまで行う；
(p) あるいは、トークンの列の終点に行き着く；

ノードの生成は、自然言語プロセッサ（ＮＬＰ）による分解の生成物を用いて達成され、少なくとも１つの単語文及びトークンの列を含み、この文とトークンの列とは一対一の対応を有しなければならない。少なくとも１つの構文パターンに一致するすべてのノードを組み立てることができる。その方法は次の通りである：
(q) トークンの構文パターン４２０を選択する（例：<noun（名詞）><preposition（前置詞）><noun（名詞）>）；
(r) 左から右に移動する；
(s) トークンの列中の、このパターンの中央のトークン（<preposition>）を検索する；
(t) 正しいトークン（<preposition>）がトークン列中に位置検出された場合には；
(u) <preposition>のトークンを現在トークンと称する；
(v) 現在トークンの左側のトークン（左トークンと称する）を調べる；
(w) 左トークンが上記パターンに一致しない場合には；
ａ．この試みを失敗と考える；
ｂ．トークンの列の検索を、現在トークンの位置から継続する；
ｃ．次に一致する<preposition>トークンを位置検出するまで行う；
ｄ．あるいは、トークンの列の終点に行き着く；
(x) 左トークンが上記パターンに一致する場合には；
(y) 現在トークンの右側のトークン（右トークンと称する）を調べる；
(z) 右トークンが上記パターンに一致しない場合には；
ａ．この試みを失敗と考える；
ｂ．トークンの列の検索を、現在トークンの位置から継続する；
ｃ．次に一致する<preposition>トークンを位置検出するまで行う；
ｄ．あるいは、トークンの列の終点に行き着く；
(aa) 左トークンが上記パターンに一致する場合には；
(bb) ノードを作成する；
(cc) <noun><preposition><noun>のパターン、例えば”prince among men（男の中の王子）”に相当する単語リストからの単語を使用する；
(dd) トークンの列の検索を、現在トークンの位置から継続する；
(ee) 次に一致する<preposition>トークンを位置検出するまで行う；
(ff) あるいは、トークンの列の終点に行き着く；

本発明の好適な実施例は、リソースの分解の生成物であるすべての文を用いたノードの生成に指向したものである。本実施例の方法は、ＮＬＰの分解機能によって生成されたすべての文についてステップ(a)〜(p)を実行する挿入ステップ(q)を含む。

ノードは、２つ以上のパターンを用いて組み立てることができる本実施例の方法は：
(1) 挿入ステップ(a1)は、パターンのリストの用意である。このリストは２つのパターンから始めることができ、そして本質的に、ノードを作成するに当たり使用可能なすべてのパターンに拡張することができ、次のものを含むがこれらに限定されない：
(i) <noun（名詞）><verb（動詞）><noun>、例：”man bites dog（人が犬を噛む）”,
(ii) <noun><adverb（副詞）><verb>、例：”horse quickly runs（馬が速く走る）”,
(iii) <verb><adjective（形容詞）><noun>、例：”join big company（大きい会社に入る）”,
(iv) <adjective><noun><noun>、例：”silent night song（静かな夜の歌）”,
(v) <noun><preposition（前置詞）><noun>、例：”voters around country（国中の有権者）”；
(2) ステップ(a)〜ステップ(p)の挿入ステップ(p1)を、パターンのリスト中のパターン毎に実行する；

改善された方法では、２つ以上のパターンを用いてノードを組み立て、ノードを組み立てる方法は、記憶しているパターンのリストを用いる。本実施例では、
挿入ステップ(a2)は、中央のトークン、次に左側のトークン、次に右側のトークン（例：<adjective>の前に<noun>、その前に<preposition>）の順によってパターンのリストをソートし（並べ替え）、このことは、パターン(i)〜(v)の組に対する検索順序が(iii), (ii), (iv), (v), (i)となること、及び同じ中央トークンを有するパターンがグループとなることを意味する。
(b), (c) 各トークン列中の、パターンリスト中の第１中央トークン、即ち<adjective>を検索する；
(d) 適正なトークン（<adjective>）がトークン列中に位置検出された場合には；
(e) 位置検出された<adjective>トークンを現在トークンと称する；
(e1) 現在トークンを用いて；
(e2) 同じ中央トークンを有するリスト中の各パターン（即ち、パターンリスト中のグループの各メンバー）を、現在トークンの点において、トークン列中の右側のトークン、現在トークン、及び左側のトークンと比較する。
(e3) 検索リスト中のグループ毎に、ステップ(b)〜(e2)を実行する；
(q) リソースから分解されたすべての文について、ステップ(b)〜(e3)を実行する。

２トークンのみのパターンを用いて、追加的な挿入ノードをトークンの列から抽出することができる。この方法は、パターン中の右側のトークンを検索し、そして組み立てたノードの結合部（ボンド）値はノード構成器によって提供される。他の変形例では、単数形または複数形の主部（左側のトークンに相当する）値をテストすることによって結合値を決定する。本実施例では、
(a) パターンは<noun><adjective>である；
(b) 左から右に移動する；
(c) トークンの列中の、トークン<adjective>を検索する；
(d) 適正なトークン（<adjective>）がトークン列中に位置検出された場合には；
(e) <adjective>トークンを現在トークンと称する；
(f) 現在トークンの左側にあるトークン（左トークンと称する）を検査する；
(g) 中央トークン（<noun>）が上記パターンに一致しない場合には、
ａ．この試みを失敗と考える；
ｂ．トークンの列の検索を、現在トークンの位置から継続する；
ｃ．次に一致する<adjective>トークンを位置検出するまで行う；
ｄ．あるいは、トークンの列の終点に行き着く；
(h) 左トークンが上記パターンに一致する場合には；
(i) ノードを作成する；
(j) <noun><adjective>のパターン、例えば”mountain big（山大きい）”に相当する単語リストからの単語を使用する；
(k) ノードの主部（上記パターン中の<noun>位置に相当する）の値を、単数形または複数形についてテストする；
(l) このテストに基づいて、ノード用の結合値（例えば”is” “are”（である））を挿入する；
(m) ノード”mountain is big（山は大きい）”が生じる；
(n) トークンの列の検索を、現在トークン位置から継続する；
(o) 次に一致する<adjective>トークンを位置検出するまで行う；
(p) あるいは、トークンの列の終点に行き着く；
(q) リソースから分解したすべての文について、ステップ(a)〜(p)を実行する。

３つのトークンの特定パターンを用いて、ノードを組み立てる方法はパターン中の左トークンを検索し、組み立てたノードの結合値はノード構成器によって提供され、そして結合値は、単数形または複数形の主部（左トークンに相当する）値をテストすることによって決定する。本実施例では、
(a) パターンは<adjective><noun><noun>である；
(b) 左から右に移動する；
(c) トークンの列中の、トークン<adjective>を検索する；
(d) 適正なトークン（<adjective>）がトークン列中に位置検出された場合には；
(e) <adjective>トークンを現在トークンと称する；
(f) 現在トークンの左側にあるトークン（左トークンと称する）を検査する；
(g) 左トークン（<noun>）が上記パターンに一致しない場合には、
ａ．この試みを失敗と考える；
ｂ．トークンの列の検索を、現在トークンの位置から継続する；
ｃ．次に一致する<adjective>トークンを位置検出するまで行う；
ｄ．あるいは、トークンの列の終点に行き着く；
(h) 中央トークンが上記パターンに一致する場合には；
(i) 中央トークンの右側にあるトークン（右トークンと称する）を検査する；
(j) 右トークン（<noun>）が上記パターンに一致しない場合には、
ａ．この試みを失敗と考える；
ｂ．トークンの列の検索を、現在トークンの位置から継続する；
ｃ．次に一致する<adjective>トークンを位置検出するまで行う；
ｄ．あるいは、トークンの列の終点に行き着く；
(k) 中央トークンが上記パターンに一致する場合には；
(l) ノードを作成する；
(m) <adjective><noun><noun>のパターン、例えば”silent night song（静かな夜の歌）”に相当する単語リストからの単語を使用する；
(n) ノード（上記パターン中の右トークン<noun>位置に相当する）の属性値を、単数形または複数形についてテストする；
(o) ノードに対する結合値（例：”is” ”are”）をテストに基づいて挿入する；
(p) ノード”silent night song”が生じる；
(q) トークンの列の検索を、現在トークン位置から継続する；
(r) 次に一致する<adjective>トークンを位置検出するまで行う；
(s) あるいは、トークンの列の終点に行き着く；
(t) リソースから分解したすべての文について、ステップ(a)〜(s)を実行する

ノードはパターンを用いて組み立てられ、ここで左トークンは２つ以上のトークンを含む左パターンに進展し、中央トークンは２つだけのトークンを含む中央パターンに進展し、そして右トークンは２つ以上のトークンを含む右パターンに進展する。左、中央、及び右トークンをパターンに進展させることによって、より複雑かつ精巧なノードを生成することができる。本実施例では、ＮＬＰが文字”to”を表現するためにトークン”TO”を用いることができる。例えば：
(i) <adjective><noun> <verb> <adjective><noun>、”large contributions fight word hunger（大きな寄付が世界的な飢餓と戦う）”,
(ii) <noun> <TO><verb> <noun>、”legislature to consider bill（法案を考えるための立法府）”,
(iii) <noun> <adverb><verb> <adjective><noun>、”people quickly read local news（人々はローカルニュースを速読する）”。
例えば、<noun> <TO><verb> <noun>、”legislature to consider bill（法案を考えるための立法府）”を用いて、次のことを行う：
(a) 左パターン、中央パターン、及び右パターン用に別個のパターンのリストを作成し参照する；
(b) 中央パターンからの最も左のトークンを検索として用いる；
(c) 適正なトークン<TO>がトークン列中に位置検出された場合には；
(d) <TO>トークンを現在トークンと称する；
(e) 現在トークンの右側にあるトークン（中央パターンの関係で右トークンと称する）を検査する；
(f) このトークンがいずれの中央パターンの右トークンとも一致しない場合には、
ａ．この試みを失敗と考える；
ｂ．トークンの列の検索を、現在トークンの位置から継続する；
ｃ．次に一致する<TO>トークンを位置検出するまで行う；
ｄ．あるいは、トークンの列の終点に行き着く；
(g) 右トークンが中央パターンのパターン（<TO><verb>）に一致する場合には；
(h) 現在トークンの左側にあるトークン（左パターンとの関係で右トークンと称する）を検査する；
(i) 右トークンがいずれの左パターンの右トークンとも一致しない場合には、
ａ．この試みを失敗と考える；
ｂ．トークンの列の検索を、現在トークンの位置から継続する；
ｃ．次に一致する<TO>トークンを位置検出するまで行う；
ｄ．あるいは、トークンの列の終点に行き着く；
(j) 右トークンが上記パターンに一致する場合には、
(k) 現在トークンの右側にあるトークン（中央パターンとの関係で右トークンと称する）が現在トークンとなる；
(l) 現在トークンの右側にあるトークン（右パターンとの関係で左トークンと称する）が現在トークンとなる；
(m) このトークンがいずれの右パターンの左トークンとも一致しない場合には、
ａ．この試みを失敗と考える；
ｂ．トークンの列の検索を、現在トークンの位置から継続する；
ｃ．次に一致する<TO>トークンを位置検出するまで行う；
ｄ．あるいは、トークンの列の終点に行き着く；
(n) 左トークンが右パターンのパターン（<noun>）に一致する場合には；
(o) ノードを作成する；
(p) <noun> <TO><verb> <noun>、例えば”legislature to consider bill”に相当する単語リストからの単語を使用する；
(q) トークンの列の検索を、現在トークン位置から継続する；
(r) 次に一致する<preposition>トークンを位置検出するまで行う；
(s) あるいは、トークンの列の終点に行き着く；

特定条件の下で、あり得る特定のノード構成をフィルタで除去することが望ましい。これらのフィルタは次のものを含むがこれらに限定されない：
(i) 主部、結合部、及び属性中のすべての単語が大文字化される；
(ii) 主部、結合部、または属性が、ハイフンまたはアポストロフィで始まるか、これらで終わる；
(iii) 主部、結合部、または属性が、それぞれの値のいずれかに、ハイフンとスペース（空白）（”- ”）、またはスペースとハイフン（” -”）、あるいはハイフンとハイフン（”--”）を埋め込まれる；
(iv) 主部、結合部、及び属性が、同じ文字の長さ４以上（例：”FFFF”）を含む；
(v) 主部、結合部、及び属性が多語値を含み、この多語値の第１語または最終語は単一文字のみ（例：”a big”（ある１つの大きい））である；
(vi) 主部及び属性が、互いの単数形または複数形である；
(vii) 主部と属性とが同一であるか、あるいは互いの値を埋め込まれている（例：”dog” ”sees” “big dog”（犬、見る、大きい犬））；
(viii) 主部、結合部、または属性がそれぞれ、２つの同一単語を含む（例：”Texas Texas” “is” “state”（テキサステキサス、である、州））；

ノードが４つの部分で構成される場合には、第４部分は、ノードを抽出したリソースのＵＲＬまたはＵＲＩを含む。本実施例では、文（単語の列、トークンの列に相当する）に加えて、文を抽出したＵＲＬまたはＵＲＩをノード生成機能に渡す。ノード生成機能によって文から作成されたすべてのノードについて、ＵＲＬまたはＵＲＩを、ノードデータ構造の、シーケンスと称する第４部分中にロードする。

上記第４部分のノードがＲＤＢの分解機能を用いて生成される場合には、ＲＤＢの分解機能は、ノードの上記第４（シーケンス）部分中に、このノードを抽出したＲＤＢリソースのＵＲＬまたはＵＲＩを置き、これは一般に、ＲＤＢの分解機能自体が当該ＵＲＬによってデータベースへの接続を生成したＵＲＬである。一例は、Ｊａｖａ（登録商標）言語の企業向け版（バージョン）を用い、そしてＭｙＳＱＬと称される周知のＲＤＢＭＳ、及び”mydb”:”jdbc:mysql://localhost/mydb”と称するデータベースを用いる。ＲＤＢＭＳがMicrosoft Access database（登録商標）であれば、ＵＲＬは例えば”c:＼anydatabase.mdb”のファイルパスであり得る。本実施例はこれらのＲＤＢＭＳ実現に制約され、ここでＲＤＢ用のＵＲＬはＲＤＢの分解機能にとってアクセス可能である。なお、データベース・リソースのＵＲＬは通常は、リソースにプログラムでアクセスするために十分ではない。

ノードが分類の分解機能を用いて生成される場合には、分類の分解機能は、ノードの第４（シーケンス）部分中に、このノードを抽出した分類リソースのＵＲＬまたはＵＲＩを置き、これは一般に、当該ＵＲＬによって分類の分解機能自体がリソースの位置を見出したＵＲＬである。

ノードがオントロジーの分解機能を用いて生成される場合には、オントロジーの分解機能は、ノードの第４（シーケンス）部分中に、このノードを抽出したリソースのＵＲＬまたはＵＲＩを置き、これは一般に、当該ＵＲＬによってオントロジーの分解機能自体がリソースの位置を見出したＵＲＬである。

本発明の好適な実施例はノードの生成に指向したものであり、これらのノードはノードプールに追加され、そしてノードが二重にノードプールに追加されることを阻止するための規則（ルール）が存在する。本実施例では、(a) 候補ノードを、Ｊａｖａ言語の特徴機能”toString()”を用いてストリング値に変換し、(b) ノードプールの検索機能を用いて、キーとしてのストリングの検索を実行する。(c) 既にノードプール中に存在し、かつ全く一致することが判明した候補ノードを棄却する。さもなければ、(d) このノードをノードプールに追加する。

ノードプール中のノードは、過渡的に計算装置上、コンピュータネットワーク接続装置上、あるいは個人用（パーソナル）計算装置上に駐在するか、または保持される。周知の計算装置は、スーパーコンピュータ、メインフレーム（大型）コンピュータ、企業規模のコンピュータ、サーバー、ファイルサーバー、ブレード（小型）サーバー、ウェブサーバー、部門サーバー、及びデータベースサーバーを含むがこれらに限定されない。周知のコンピュータネットワーク接続装置は、インターネット・ゲートウェイ装置、データ記憶装置、家庭用インターネット機器、セットトップボックス、及び車載用計算プラットフォームを含むが、これらに限定されない。周知の個人用計算装置は、デスクトップ型パーソナルコンピュータ、ラップトップ型パーソナルコンピュータ、パーソナル・ディジタル・亜アシスタント（ＰＤＡ）、高性能表示のセルラー電話機、高性能表示のページャ（ポケットベル）、及び高性能表示のテキストメッセージ装置を含むが、これらに限定されない。

ノードプールの記憶組織及びメカニズムは、ノードの１つ以上の部分の直接的な、あるいは計算された内容（値）の検査による個別ノードの効率的な選択及び検索を可能にする。こうした組織及びメカニズムを許容し可能にする周知のコンピュータ・ソフトウェア及びデータ構造は、リレーショナル・データベースシステム、オブジェクト・データベースシステム、ファイルシステム、コンピュータのオペレーティングシステム、コレクション、ハッシュマップ、マップ（連想配列）、及びテーブルを含むが、これらに限定されない。

ノードプール中に記憶されたノードはメンバーノードと称する。相関に対し、ノードプールは検索空間と称される。ノードプールは、少なくとも、対象の項目または語句を明示的に含むノードメンバーを含まなければならない。本実施例では、対象の項目または語句を含むノードを原点ノードと称し、同義語としてソースノードと称し、同義語としてパスルートと称する。

相関はチェーン（連鎖）（同義語としてパス（経路）と称する）の形で構成される。チェーンは、ノードプールのノードメンバー（候補ノードと称する）から構成され、候補ノードを選択してチェーンに追加する方法は、候補ノードをチェーンの現在の末端ノードに関連付けることができるかをテストすることである。関連性についてのテストは次のとおりである：
(i) 候補ノードの（最も左の）主部の値が、現在の末端ノードの（最も右の）属性部分との正確な一致を含むこと。
(ii) 候補ノードの主部の値が、現在の末端ノードの属性部分の単数形または複数形との一致を含むこと。
(iii) 候補ノードの主部の値が、現在の末端ノードの属性部分に関係する（例えばシソーラスのように）単語との一致を含むこと。
(iv) 候補ノードの主部の値が、現在の末端ノードの属性部分に関係する単語との一致を含み、候補ノードの主部と末端ノードの属性部分との関係は権威的な参照ソースによって確立されること。
(v) 候補ノードの主部の値が、現在の末端ノードの属性部分に関係する単語との一致を含み、候補ノードの主部と末端ノードの属性部分との関係は権威的な参照ソースによって確立され、関連性のテストは、Merrian-Webster’s Thesaurus （Merrian-Webster社の刊行物）のようなシソーラスを用いて、候補ノードの主部の値が現在の末端ノードの属性部分の同義語、または属性部分に関連するか否かを判定すること。
(vi) 候補ノードの主部の値が、権威的な参考文献における現在の末端ノードの属性部分の定義中に見られる単語との一致を含むこと。
(vii) 候補ノードの主部の値が、現在の末端ノードの属性部分に関係する単語との一致を含み、候補ノードの主部と末端ノードの属性部分との関係は権威的な参照ソースによって確立され、関連性のテストは、Merrian-Webster’s Dictionaty（Merrian-Webster社の刊行物）のような辞書を用いて、候補ノードの主部が辞書の定義中に出現し、従って現在の末端ノードの属性部分に関係するか否かを判定すること。
(viii) 候補ノードの主部の値が、現在の末端ノードの属性部分についての説明中に出現する単語との一致を含むこと。
(ix) 候補ノードの主部の値が、現在の末端ノードの属性部分に関係する単語との一致を含み、候補ノードの主部と末端ノードの属性部分との関係は権威的な参照ソースによって確立され、関連性のテストは、Encyclopedia Britannica（Encyclopedia Britannica社の刊行物）のような百科事典を用いて、検索中に存在する潜在的なソースの内容が、対象の項目または語句の百科事典中の説明中に出現し、従って現在の末端ノードの属性部分に関連するか否かを判定すること。
(x) 候補ノードの主部の値が、現在の末端ノードの属性部分と親、子、または兄弟の関係を有すること。
(xi) 候補ノードの主部の値が、現在の末端ノードの属性部分に関係する単語との一致を含み、候補ノードの主部と末端ノードの属性部分との関係は権威的な参照ソースによって確立され、関連性のテストは分類を用いて、候補ノードの主部に含まれる項目が、現在の末端ノードの属性部分と親、子、または兄弟の関係を有すること。現在の末端ノードの属性部分の値を含む頂点は分類中に位置する。これが対象の頂点である。候補ノードの主部に位置する単語毎に、対象の頂点の親、兄弟、及び子の頂点を、対象の頂点から、この対象の頂点の親、兄弟、及び子の頂点までの関係（リンク）を辿ることによって検索する。親、兄弟、または子の頂点のいずれかが、末端ノードの属性部分からの単語を含む場合には、一致を宣言し、候補ノードを現在の末端ノードに関連するものと考える。本実施例では、グラフ・トラバース機能と称するソフトウェア機能を用いて、現在の末端ノードの親、兄弟、及び子の頂点を位置検出して検査する。
(xii) 候補ノードの主部に含まれる項目が、現在の末端ノードの属性部分に含まれる項目から度合い（長さ）１の意味的距離を有すること。
(xiii) 候補ノードの主部に含まれる項目が、現在の末端ノードの属性部分に含まれる項目から度合い（長さ）２の意味的距離を有すること。
(xiv) 候補ノードの主部を現在の末端ノードの属性部分と比較し、関連性のテストは、オントロジーを用いて、候補ノードの主部が度合い（長さ）１の意味的距離だけ、現在の末端ノードの属性部分から離れていることを判定する。現在の末端ノードの属性部分を含む頂点は上記オントロジー中に位置する。これが対象の頂点である。候補ノードの主部に位置する単語毎に、対象の頂点からすべての隣接頂点までの関係（リンク）を辿ることによってオントロジーを検索する。いずれかの隣接頂点が候補ノードの主部からの単語を含む場合には、一致を宣言し、候補ノードを現在の末端ノードに関連するものと考える。
(xv) 候補ノードの主部を現在の末端ノードの属性部分と比較し、関連性のテストは、オントロジーを用いて、候補ノードの主部が度合い（長さ）２の意味的距離だけ、現在の末端ノードの属性部分から離れていることを判定する。現在の末端ノードの属性部分を含む頂点は上記オントロジー中に位置する。これが対象の頂点である。候補ノードの主部に位置する単語毎に、意味的度合い１の関連性テストを実行する。このテストが不合格である場合に、対象の頂点からすべての隣接頂点までの関係（リンク）を辿ることによってオントロジーを検索する。こうした頂点は対象の頂点から意味的度合い２である。意味的度合い２の頂点のいずれかが候補ノードの主部からの単語を含む場合には、一致を宣言し、候補ノードを現在の末端ノードに関連するものと考える。
(xvi) 候補ノードの主部を現在の末端ノードの属性部分と比較し、関連性のテストは、CYC Ontology（Cycorp社の製品）のような汎用的オントロジーを用いて、現在の末端ノードの属性部分から候補ノードの主部までの意味的距離の度合い（長さ）を測定する。
(xvii) 候補ノードの主部を現在の末端ノードの属性部分と比較し、関連性のテストは、Gene Ontology（Gene Ontology Consortiumの製品）のような特化したオントロジーを用いて、現在の末端ノードの属性部分から候補ノードの主部までの意味的距離の度合い（長さ）を測定する。
(xviii) 候補ノードの主部を現在の末端ノードの属性部分と比較し、関連性のテストはオントロジーを使用し、このテストのために、Ontology Language（オントロジー言語）（例えばWorld Wide Web Consortiumの製品であるWeb Ontology Language（ＯＷＬ））を用いてオントロジーにアクセスし、オントロジー中を進む。

本発明の改善された実施例はノードプールに指向したものであり、ノードプールは、主部によって一旦インデックス（索引）付けされ、これに加えて属性によってインデックス付けされたノードの集団（クラスタ）として構成される。本実施例は相関の速度について改善されている、というのは、すべての関連するノードを相関に加えることができるための関連性のテストを、上記集団に対して１回しか必要としないからである。

相関プロセスは、パス（経路）の現在の末端を逐次的に指定するための、ノードプールの有資格ノードメンバーの反復的関連付け及び逐次的変更から成る。成功または失敗が決まるまでは、このプロセスを試行または試みと称する。ターゲット（目標）またはデスティネーション（目的地）ノードと称する所望ノードの、パスにおける現在の末端への関連付け及び変更が発生すると、上記試行は良好な結果（目標状態）を達成したと称し、この場合には、上記パスをその後に相関と称してこうした相関を保存し、一方、ノードプール中にさらなる有資格メンバーのノードが存在しない状態は、失敗の結果（消耗）と考え、上記パスは棄却して相関とは称さない。

デスティネーションノードの指定は相関の中止を生じさせる。相関を中止する手段は複数存在する。好適な実施例では、ソフトウェアのユーザは、相関の終端に最新に追加したノードをデスティネーションノードとして指定することを意のままに選び、これにより、さらなる相関を中止する。ユーザは、相関方法の各ステップ後に、最新に追加したノードの表現を提供され、そして、グラフィカル・ユーザインタフェース（ＧＵＩ）のようなユーザインタフェースによって相関を中止するか継続するかを促される。相関を中止する他の方法は次の通りである：
(i) 相関方法を継続して、設定時間間隔が経過するまで相関を延長し、この時点で相関方法は、相関の終端に最新に追加したノードをデスティネーションノードとして指定し、これにより更なる相関を中止する。
(ii) 相関方法を継続して、相関が事前設定した特定の度合い（即ち、ノード数で測った「長さ」）を達成するまで相関を延長し、この時点で相関方法は、相関の終端に最新に追加したノードをデスティネーションノードとして指定し、これにより更なる相関を中止する。
(iii) 相関方法を継続して、ノードプール中で利用可能なノードがなくなり相関をさらに延長することができなくなるまで相関を延長し、この時点で相関方法は、相関の終端に最新に追加したノードをデスティネーションノードとして指定し、これにより更なる相関を中止する。
(iv) 相関方法を継続して、事前選択した特定のターゲットノードまたは事前指定した項目を主部に有するターゲットノードが相関に追加されるまで相関を延長し、この時点でイベントの成功を宣言して相関を中止する。本実施例では、事前選択したノードまたは事前指定した項目を有するノードを相関に関連付けることができず、かつノードプール中のすべてのノードを検査し尽した場合には、失敗を宣言して相関を中止する。
(v) 相関方法は、試行相関の回数を、事前設定した試行相関の制限（回数）と比較し、この制限に達すれば相関を中止する。
(vi) 相関方法は、現在の相関の経過時間を事前設定した時間制限と比較し、この時間制限に達すれば相関を中止する。

本発明の好適な実施例では、相関方法はグラフ理論の技法を利用する。その結果、相関における試みは、試行相関の有向グラフ（ダイグラフとも称する）としてまとめてモデル化される。

本発明の好適な実施例は相関方法に指向したものであり、相関における試みはグラフ理論の技法を利用し、その結果、相関における試みは、試行相関の有向グラフ（ダイグラフとも称する）としてまとめてモデル化される。相関方法によって構成した１つの種類のダイグラフはパスの振れであり、パスの振れ中の各パスが試行相関である。この好適な実施例は、ノードプールによる一連の通過路を用いてパスの振れを構成し、次のステップを含む：
(a) 最初の通過路では、次のことのみ行う：
ａ．原点ノードから開始し、
ｂ．原点ノードと良好に関連する候補ノード毎に、
ｃ．新たな試行相関（パス）を開始する；
(b) これに続くすべての通過路については、
ａ．試行相関パス毎に、
i 現在の試行相関パスが対象の試行である；
ii パスの末端（最も右）のノードが対象のノードとなる；
iii ノードプール中の、対象のノードと関連付けることのできる候補ノードを検索し、これにより、試行相関を度合い１だけ延長する；
iv 対象のノードに関連付けることのできるノードを見出した場合に、このノードを試行相関パスに追加する。こうしたノードの使用は排他的でない；
v 試行相関パスに追加されたノードをターゲットまたはデスティネーションノードに指定した場合には、次のことを行う：
１．この試行を相関と称する；
２．この相関をパスの振れから取り除く；
３．この相関を成功の相関として別個に記憶する；
４．相関方法は成功を宣言する；
５．次の試行相関パスが対象の試行となる；
vi 対象のノードに関連付けることのできるノードを２つ以上見出すことのできる場合には；
vii こうしたノード毎に；
viii 現在のパスを複製し、当該ノードによって延長する；
ix 現在の対象のノードに関連付けるべき候補ノードを見出すことができない場合には；
x 対象の経路を棄却する；
ｂ．すべての試行相関パスについてステップ”ａ．”を実行する；
(c) 相関を中止するまで、ステップ(b)を逐次的な通過路として実行する；
(d) 成功の相関が構成されなかった場合には、相関方法は失敗を宣言する。

１つの好適な実施例では、相関方法によって生成された成功の相関は、相関の有向グラフ（ダイグラフとも称する）としてまとめてモデル化される。あるいはまた、相関方法によって生成された成功の相関は、成功の相関のパスの振れとしてまとめてモデル化される。相関方法によって生成された成功の相関をまとめて、１つの相関に対して、回答空間と称する。相関方法がパスの振れを構成し、パスの振れ中の各パスが成功の相関であるならば、すべての成功の相関は原点ノードを始点として共有し、原点ノードからのすべての可能な相関が構成される。同じ原点の項目ノードから始まり、同じターゲット項目ノードまたは関連するターゲット項目ノードの同じ組で終わるすべての相関（パス）は、相関の組から成る。ターゲット項目ノードどうしは、相関方法がノードプールからの候補ノードによって試行相関を延長するために使用する同じ関連性テストを通過することによって、（互いに）関連するものと考えられる。

相関の特別な場合は、２つの項目及び／または語句を用いて知識相関を構成することであり、次のことを含む：
(a) 次の１つ以上をトラバース（検索）する：
(vii) コンピュータファイルシステム
(viii) インターネットを含むコンピュータネットワーク
(ix) リレーショナル・データベース
(x) 分類
(xi) オントロジー
(b) 第１の対象の項目または語句についての情報の実際及び潜在的なソースを識別する。
(c) そして、第２の独立した検索を実行して、第２の対象の項目または語句についての情報の実際及び潜在的なソースを識別する。
(d) いずれかの検索において発見された情報の実際及び潜在的なソースのすべてに、関連性についてのテストを適用する。
(e) 上記両方の検索において発見されたリソースをノードに分解する。
(f) そしてノードプールに追加する。
(g) 第１の項目または語句を明示的に含むノードプール中のノードを原点ノードとして用いる。
(h) 第２の対象の項目または語句を明示的に含む有資格メンバーの項目ノードが、少なくとも１つの成功の相関におけるパスの現在の末端に関連付けられて追加され、デスティネーションノードとして指定された際に、相関が成功であることを宣言する。

ノード抑制は、ユーザが個別のノードを相関方法から隠すことによって相関を「操縦」することを可能にする。ノードプール中の個別のノードは抑制されたものとして指定することができる。本実施例では、抑制はノードを相関にとって無資格にするが、このノードをノードプールから削除はしない。好適な使用では、ノードは、ノードプール・エディタ（編集ソフト）のようなＧＵＩ構成要素におけるユーザ操作によって抑制される。任意の瞬時において、あらゆるデータ記憶装置の内容は当該データ記憶装置についての状態を明示する。抑制は、検索空間及び知識領域としてのノードプールの状態を変化させる。抑制は、ユーザが相関方法に影響を与えることを可能にする。

特定条件下では、あり得る特定の相関構成をフィルタで除去することが望ましい。これらのフィルタは次のものを含むが、これらに限定されない：
(i) 相関中に既にある二重のノード；
(ii) 相関中に既にあるノード中の二重の主部；
(iii) 抑制されたノード；

好適な統計に基づく本発明の改善された実施例は、相関方法が、相関パスに追加されたすべてのノード中のすべての項目を記録しておくことを必要とし、いずれかの項目の発生の頻度が統計的有意性に近づくと、相関方法は、有意な項目についての情報のソースの独立した検索を追加する。本実施例では、相関を中断せずに、この検索によって獲得したリソースからのノードをノードプールに追加する。その代わりに、ノードが生成され次第これらのノードを追加し、これにより、後に続く相関の試行を改善することを追求する。

一実施例では、相関方法は、ファイルとして、あるいはユーザ入力によって提供される項目のリスト中のすべての項目についての情報のソースの独立した検索を追加する。５番目のこうした項目の先にあるすべての項目を用いて、検索空間及び知識領域としてのノードプールを直交的に拡張する。変形例では、相関方法は、第３、第４、または第５の項目についての情報、あるいはファイルとして、またはユーザ入力によって提供される項目のリスト中のすべての項目についての情報のソースの検索を追加するが、相関方法は、こうした項目の検索の範囲を、第１及び／または第２の概念及び／または項目を相関方法が検索する範囲に比べて制限する。本実施例では、相関方法は、項目の重要性を、入力ストリーム中の当該項目の通常の位置に拘束する規則を適用する。

本発明の他の好適な実施例及び／または好適な方法は相関方法に指向したものであり、この相関方法によれば、相関によって発見される知識は、以前には未発見の知識（即ち新しい知識）であるか、あるいは、産業特有または学術的な出版物においても以前には知られていないか文書化されていない知識である。

相関の生成物のユーザに対する表現は次のものを含むことができる：
(i) 完成した相関を図形的に表示する。
(ii) 完成した相関を図形的に表示する、完成した相関の提示であって、提示用の図形的構造はメニューツリーの構造である。
(iii) 完成した相関を図形的に表示する、完成した相関の提示であって、提示用の図形的構造はグラフの構造である。
(iv) 完成した相関を図形的に表示する、完成した相関の提示であって、提示用の図形的構造はテーブル（表）の構造である。

図２Ａ〜２Ｄは、入力項目”Gold is standard（金が標準である）”から生じた相関を示すおよそ222ページの出力の最初の４頁を示す。

本明細書では、本発明の種々の実施例を詳細に説明してきたが、当業者は、請求項に記載の本発明の範囲を逸脱することなしに、これらの実施例に変形及び適応を生じさせ得ることは明らかである。

本発明におけるユーザ入力、発見、及び獲得段階を示すフローチャートである。相関の方法を示すフローチャートである。３部分及び４部分のノードのブロック図である。最初にユーザが対面するＧＵＩ構成要素のスクリーン・キャプチャであり、相関用の対象フィールドを示す。「発見」、「獲得」、及び「相関」の３段階すべての瞬時におけるＧＵＩ構成要素「質問をする」のスクリーン・キャプチャである。本発明の実施例において発見された相関を示す図であり、タブ付きウィンドウ枠のフォーマットで表示する。これを”Get The Answers（答を得る）”ページと称する。ユーザがディスクに保存することを可能にするＧＵＩ構成要素を示す図である。処理の検索段階において発見されたすべてのリソースについての関連性尺度を提供する”RanXY”報告のＧＵＩを示す図である。インデックス型の検索エンジンを示す図である。自然言語の英文からのノードの生成を示す図である。

Claims

知識を識別する方法において：
ａ．追加的な知識のために検討する１つ以上の項目を入力するステップと；
ｂ．１つ以上の情報のソースを検索して、前記項目についての情報または前記項目に関連する情報を含むリソースを識別するステップと；
ｃ．検索中に識別したリソースをノードに分解するステップと；
ｄ．前記ノードをノードプールに格納するステップと；
ｅ．前記ノードプールから、知識を表現するノードの相関を構成するステップと
を具えていることを特徴とする知識識別方法。
前記入力するステップが、
ａ．１つ以上の項目をコマンドライン中にキーで打ち込むステップ；または、
ｂ．１つ以上の項目をグラフィカル・ユーザインタフェース中に入力するステップ；または、
ｃ．概念の自然言語記述を入力するステップ
のうちいずれか１つのステップを具えていることを特徴とする請求項１に記載の方法。
前記概念の自然言語記述を入力するステップが、前記自然言語記述を構文解析して、追加的な知識のために検討するトークンにする追加的ステップを具えていることを特徴とする請求項２に記載の方法。
前記検索するステップが、次のステップ：
ａ．パーソナルコンピュータ上のファイルを検索するステップ；
ｂ．ネットワーク上の１つ以上のコンピュータを検索するステップ；
ｃ．ネットワークサーバー上のファイルを検索するステップ
の少なくとも１つから成ることを特徴とする請求項１に記載の方法。
前記ファイルを、テキストを含むファイルに変換することを特徴とする請求項４に記載の方法。
前記検索するステップが、１つ以上のスパイダーを用いてファイルを調べるステップから成ることを特徴とする請求項４に記載の方法。
前記スパイダーが、検索を促進するための他のスパイダーを複製することを特徴とする請求項６に記載の方法。
前記１つ以上のスパイダーの少なくとも１つが、リソースの前記項目への関連性についての情報を獲得することを特徴とする請求項６に記載の方法。
前記１つ以上のスパイダーの少なくとも１つが、メタクローラを具えていることを特徴とする請求項６に記載の方法。
前記１つ以上の情報のソースが：
ａ．ファイルシステム；
ｂ．ワールドワイド・ウェブ；
ｃ．ｅ−メール・リポジトリ；
ｄ．ｅ−メール・リポジトリ中のｅ−メールの添付ファイル；
ｅ．リレーショナル・データベース管理システム；
ｆ．データ・ウェアハウス；
ｇ．分類；
ｈ．オントロジー；
ｉ．意味ネットワーク；
ｊ．ニューラルネット
ｋ．検索エンジン、及び
ｌ．インデックスエンジン
の少なくとも１つを含むことを特徴とする請求項１に記載の方法。
前記１つ以上の情報のソースを検索して、前記項目についての情報または前記項目に関連する情報を含むリソースを識別するステップが、
ａ．ファイル名；
ｂ．文書の題目；
ｃ．文書の要約；
ｄ．文書の全文；
ｅ．ノードのプール
の少なくとも１つを検索することを含むことを特徴とする請求項１に記載の方法。
前記リソースが：
ａ．ポータブル・ドキュメント・フォーマット（ＰＤＦ）ファイル；
ｂ．リッチテキスト（ＲＴＦ）ファイル；
ｃ．ワードプロセッサのファイル；
ｄ．マイクロソフト・パワーポイント（登録商標）（ＰＰＴ）ファイル；
ｅ．ハイパーテキスト・マークアップ・ランゲージ（ＨＴＭＬ）ファイル；
ｆ．ｅ−メールを含むファイル；
ｇ．ｅ−メールの添付ファイルを含むファイル
の１つ以上であることを特徴とする請求項１に記載の方法。
前記項目についての情報を含むリソースを識別するステップが、
ａ．情報のソースの内容と前記検討する項目との正確な一致を見出すこと；
ｂ．前記検討する項目の単数形または複数形を、ソースの内容中に見出すこと；
ｃ．前記検討する項目の同義語を、ソースの内容中に見出すこと；
ｄ．前記検討する項目の辞書における定義に含まれる項目を、ソースの内容中に見出すこと；
ｅ．前記検討する項目の、権威的ソースにおける説明に含まれる項目を、ソースの内容中に見出すこと；
ｆ．前記検討する項目を説明する百科事典中の見出しに含まれる項目を、ソースの内容中に見出すこと；
ｇ．前記検討する項目に非常に近い項目を、分類、オントロジー、または意味ネットワークを用いて、ソースの内容中に見出すこと；
の少なくとも１つを含むことを特徴とする請求項１１に記載の方法。
ノードが、第１関係項、結合部、及び第２関係項の各部分から成るデータ構造を具えていることを特徴とする請求項１に記載の方法。
前記ノードが追加的に、ソースまたはシーケンスのエントリを具えていることを特徴とする請求項１４に記載の方法。
前記項目についての情報を含むリソースをノードに分解するステップが、テキストを構文解析して言語単位にすることを含むことを特徴とする請求項１４に記載の方法。
前記言語単位がＸＭＬの文であることを特徴とする請求項１６に記載の方法。
ＸＭＬヘッダを棄却することを特徴とする請求項１７に記載の方法。
前記言語単位が文であることを特徴とする請求項１６に記載の方法。
前記リソースを分解するステップが、自然言語パーサーを用いて言語単位を解析することを含むことを特徴とする請求項１６に記載の方法。
前記自然言語パーサーは、言語単位を言語の単語またはトークンに分離して、各単語またはトークンにカテゴリを割り当てることを特徴とする請求項２０に記載の方法。
前記自然言語パーサーは、言語における単語またはトークンを組み立てるに当たり使用を許されない文字を棄却することを特徴とする請求項２１に記載の方法。
前記単語またはトークンを、当該単語またはトークンに割り当てられたカテゴリに基づいて、１つ以上の前記ノードのデータ構造の前記部分中に置くことを特徴とする請求項２１に記載の方法。
前記ノードのデータ構造をノードプールに格納することを特徴とする請求項２３に記載の方法。
前記ノードプールが、前記ノードにおける１つ以上の前記部分の内容に基づく個別のノードの選択及び検索を可能にすることを特徴とする請求項２４に記載の方法。
前記ノードプールが、ハッシュマップを用いた選択及び検索を可能にすることを特徴とする請求項２５に記載の方法。
前記ノードプールがデータベースであることを特徴とする請求項２５に記載の方法。
前記項目についての知識を表現する前記ノードの相関を、前記ノードプールからのノードをリンクすることによって構成することを特徴とする請求項１に記載の方法。
前記ノードをリンクして、ノードのチェーンを１つ以上作ることを特徴とする請求項２８に記載の方法。
前記ノードのチェーンが、対象の項目を明示的に含む原点ノードから始まることを特徴とする請求項２９に記載の方法。
前記原点ノード、または前記原点ノードから始まる前記ノードのチェーンの終端にある末端ノードの前記第２関係項が、候補ノードの関係項との関連性を有する際に、前記候補ノードを、前記原点ノードまたは前記末端ノードに追加することを特徴とする請求項３０に記載の方法。
前記関連性についてのテストが、
ａ．前記候補ノードの関係項と前記原点ノードまたは前記末端ノードの前記第２関係項との正確な一致を見出すこと；
ｂ．前記候補ノードの関係項の単数形または複数形と、前記原点ノードまたは前記末端ノードの前記第２関係項との一致を見出すこと；
ｃ．前記候補ノードの関係項と、前記原点ノードまたは前記末端ノードの前記第２関係項との一致を見出すこと；
ｄ．前記候補ノードの関係項の辞書における定義に含まれる重要項目と、前記原点ノードまたは前記末端ノードの前記第２関係項との一致を見出すこと；
ｅ．前記候補ノードの関係項の、権威的ソースにおける説明中に含まれる重要項目と、前記原点ノードまたは前記末端ノードの前記第２関係項との一致を見出すこと；
ｆ．前記候補ノードの関係項を説明する百科事典中の見出しに含まれる重要項目と、前記原点ノードまたは前記末端ノードの前記第２関係項との一致を見出すこと；
ｇ．前記原点ノードまたは前記末端ノードの前記第２関係項と一致する、前記候補ノードの関係項に非常に近い項目を、分類、オントロジー、または意味ネットワークを用いて見出すこと；
の１つ以上を含むことを特徴とする請求項３１に記載の方法。
ａ．ユーザが前記相関を中止させること；
ｂ．設定時間が満了すること；
ｃ．前記チェーンが、指定数より大きい数のノードを具えること；
ｄ．前記チェーンの前記原点ノードまたは前記末端ノードに関連付けることのできるノードが、前記ノードプール中からなくなること；
ｅ．ターゲットノードから事前選択した項目が、前記相関に追加されること；
ｆ．事前選択したターゲットノードが、前記相関に追加されること
の１つが生じるまで、前記候補ノードを追加して前記チェーンを形成することを特徴とする請求項３１に記載の方法。
ａ．メモリー媒体と；
ｂ．前記メモリー媒体上に記憶され、コンピュータを制御して：
ｂ１．追加的な知識のために検討する１つ以上の項目を入力する機能と；
ｂ２．１つ以上の情報のソースを検索して、前記についての情報または前記項目に関連する情報を含むリソースを識別する機能と；
ｂ３．前記検索中に識別した前記リソースをノードに分解する機能と；
ｂ４．前記ノードをノードプールに格納する機能と；
ｂ５．前記ノードプールから、知識を表現するノードの相関を構成する機能と
を実行するプログラミング文と
を具えていることを特徴とするコンピュータプログラム製品。
ａ．追加的な知識のために検討する１つ以上の項目を入力する入力メカニズムと；
ｂ．１つ以上の情報のソースを検索して、前記項目についての情報または前記項目に関連する情報を含むリソースを識別する検索メカニズムと；
ｃ．検索中に識別した前記リソースをノードに分解する解析メカニズムと；
ｄ．前記ノードをノードプールに格納する格納メカニズムと；
ｅ．前記ノードプールから、知識を表現するノードの相関を構成する相関メカニズムと
を具えていることを特徴とする知識識別装置。
ａ．ネットワークと；
ｂ．前記ネットワークに接続された１つ以上のコンピュータとを具え、
ｃ．前記ネットワークに接続された前記コンピュータの少なくとも１つが：
ｃ１．追加的な知識のために検討する１つ以上の項目を入力する入力メカニズムと；
ｃ２．１つ以上の情報のソースを検索して、前記項目についての情報または前記項目に関連する情報を含むリソースを識別する検索メカニズムと；
ｃ３．検索中に識別した前記リソースをノードに分解する解析メカニズムと；
ｃ４．前記ノードをノードプールに格納する格納メカニズムと；
ｃ５．前記ノードプールから、知識を表現するノードの相関を構成する相関メカニズムと
を具えていることを特徴とするシステム。