JP2008538016A - 概念または項目を用いて知識相関を構成することによる知識発見技術 - Google Patents
概念または項目を用いて知識相関を構成することによる知識発見技術 Download PDFInfo
- Publication number
- JP2008538016A JP2008538016A JP2007541415A JP2007541415A JP2008538016A JP 2008538016 A JP2008538016 A JP 2008538016A JP 2007541415 A JP2007541415 A JP 2007541415A JP 2007541415 A JP2007541415 A JP 2007541415A JP 2008538016 A JP2008538016 A JP 2008538016A
- Authority
- JP
- Japan
- Prior art keywords
- node
- item
- nodes
- correlation
- token
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2452—Query translation
- G06F16/24522—Translation of natural language queries to structured queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9532—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本願は、米国特許暫定出願第60/627,772号、2004年11月12日出願、発明の名称”Techniques and Apparatus for Information Correlation”に基づいて優先権を主張し、その全内容を参考文献として本明細書に含める。
本願は、CD−ROM上のコンピュータ・プログラムリストを含み、このプログラムリストはその全体を参考文献として本明細書に含む。
発明の分野
本発明は、情報技術の分野に指向したものであり、より詳細には、概念または項目を用いて知識相関を構成することによる知識発見の技術に指向したものである。
種々の項目についての情報を識別する多くの検索技術が、従来技術において知られている。これらの技術は、検索(サーチ)エンジン、検索ロボット、等を含む。一般に、検索エンジンは、テキストの本体の各項目に、その位置に関してインデックス(索引)付けし、これにより、質問項目が提出されると、これらの項目の位置を識別することができる。検索エンジンの検索の結果を、ブール論理を用いて他の項目の検索の結果と組み合わせて、所望のものに至る結果に、より正確に焦点を合わせることができる。
1979年版の”Websters New Collegiate Dictionary”は、次の「知識」の定義を含む:
知識...
(a)...(2) 経験または交わりを通して得たものを、よく知っているという事実または状態;
(b)...(2) 人の情報または理解の範囲
本発明によれば、情報連鎖(リンケージ)についての人の情報及び理解の範囲を、さもなければ明らかにならない所まで拡大することによって知識を獲得する。この知識は、ノードをリンク(連結)して相関にすることによる形式的な方法で表現される。
図1A及び図1Bは、本発明の好適な実施例による知識相関を構成するプロセスのフローチャートである。図2A〜2Eは、本発明用のGUI(Graphical User Interface:グラフィカル・ユーザインタフェース)のスクリーン・キャプチャ(スクリーン表示例)を示す。
1.「自由な関連付け」、ユーザによって入力された単一の項目が与えられると、この項目から複数の原点がノードの形に展開され、そして本発明は、各原点から、デスティネーションノードの形で見出すことのできる任意数の潜在的なデスティネーションのありとあらゆるものへの知識ブリッジを構築しようとする。これらのデスティネーションは、少なくとも2つの「停止相関」のシナリオで選択し、これについては以下でさらに説明する。この種の相関では、デスティネーションは先験的には知られず、ユーザが求める利益は第1に、原点と事実、思想、概念、あるいはデスティネーションによって指名または示唆される単純な項目との予期しない新規の関連付けであり、原点からデスティネーションまでの関連付けが、新規または革新的な解決法、予期しない影響、及び問題または題目について前には考えなかった態様を示唆するという第2の利益を伴う。
2.「点を接続する」、ユーザによって入力された2つの項目が与えられると、第1の項目から複数の原点が展開され、第2の項目から複数のデスティネーションが展開され、そして本発明は、ありとあらゆる原点からありとあらゆるデスティネーションへの知識ブリッジを構築しようとする。相関の動作は、少なくとも1つの原点を関連のチェーンによって少なくとも1つのデスティネーションにリンクすることのできる場合のみに成功と考える。この例では、ユーザが求める利益は第1に、原点からデスティネーションへのこうした関連が確立され、これにより、「存在する」が解決されることであり、そしてすべての相関に伴い、知識相関において明らかにされる原点からデスティネーションまでのパスから知識及び識見が伝えられる。
(i) コンピュータ・ファイルシステム
(ii) インターネットを含むコンピュータネットワーク
(iii) e−メール・リポジトリ
(iv) リレーショナル・データベース
(v) 分類法
(vi) オントロジー
簡単に言えば、コンピュータがアクセスすることのできるあらゆる情報のリポジトリである。
(i) テキスト(プレーン(普通、標準)テキスト)ファイル。
(ii) リッチテキスト・フォーマット(RTF:Rich Text Format、マイクロソフト社によって開発された規格)ファイル。
(iii) エクステンデッド・マークアップ・ランゲージ(XML:Extended Markup Language、ワールドワイド・ウェブ・コンソーシャム(World Wide Web Consortium)のプロジェクト(企画))ファイル。
(iv) マークアップ・ランゲージ・ファイルのあらゆる「方言」ファイル、これらの方言はハイパーテキスト・マークアップ・ランゲージ(HTML:HyperText Markup Language)及びエクステンシブル・ハイパーテキスト・マークアップ・ランゲージ(XHTML(登録商標):Extensible HTML)(ワールドワイド・ウェブ・コンソーシャムのプロジェクト)、RuleML(RuleMLイニシアティブのプロジェクト)、スタンダード・ジェネラライズド・マークアップ・ランゲージ(SGML:Standard Generalized Markup Language、国際規格の1つ)、及びエクステンシブル・スタイルシート・ランゲージ(XSL:Extensible Stylesheet Language、ワールドワイド・ウェブ・コンソーシャムのプロジェクト)を含むが、これらに限定されない。
(v) ポータブル・ドキュメント・フォーマット(PDF:Portable Document Format、Adobe社の独自フォーマット)ファイル。
(vi) スプレッドシート・ファイル、例えばExcel(エクセル(登録商標)、マイクロソフト社のスプレッドシート(表計算)ソフトウェア製品)によるデータを格納するために使用するXLSファイル。
(vii) MSワード(登録商標)(WORD)ファイル、例えば、MS WORD(マイクロソフト社によるワードプロセッサ・ソフトウェア製品)による文書を格納するために使用するDOCファイル。
(viii) プレゼンテーション(スライド)ファイル、例えばパワーポイント(PowerPoint、マイクロソフト社のスライドショー・スタジオ・ソフトウェア製品)によるデータを格納するために使用するPPTファイル。
(ix) イベント情報獲得ログ(記録)ファイル、トランザクション・ログ、電話発呼記録、従業員のタイムシート(勤務時間記録表)、及びコンピュータシステムのイベントログを含むが、これらに限定されない。
(i) テキスト(プレーンテキスト)ファイル。
(ii) リッチテキスト・フォーマット(RTF、マイクロソフト社によって開発された規格)ファイル。
(iii) エクステンデッド・マークアップ・ランゲージ(XML、ワールドワイド・ウェブ・コンソーシャムのプロジェクト)ファイル。
(iv) マークアップ・ランゲージ・ファイルのあらゆる「方言」ファイル、これらの方言は、ハイパーテキスト・マークアップ・ランゲージ(HTML)及びエクステンシブル・ハイパーテキスト・マークアップ・ランゲージ(XHTML(登録商標))(ワールドワイド・ウェブ・コンソーシャムのプロジェクト)、RuleML(RuleMLイニシアティブのプロジェクト)、スタンダード・ジェネラライズド・マークアップ・ランゲージ(SGML、国際規格の1つ)、及びエクステンシブル・スタイルシート・ランゲージ(XSL、ワールドワイド・ウェブ・コンソーシャムのプロジェクト)を含むが、これらに限定されない。
(v) ポータブル・ドキュメント・フォーマット(PDF、Adobe社の独自フォーマット)ファイル。
(vi) スプレッドシート・ファイル、例えばExcel(エクセル、マイクロソフト社のスプレッドシート(表計算)ソフトウェア製品)によるデータを格納するために使用するXLSファイル。
(vii) MSワード(WORD)ファイル、例えば、MS WORD(マイクロソフト社によるワードプロセッサ・ソフトウェア製品)による文書を格納するために使用するDOCファイル。
(viii) プレゼンテーション(スライド)ファイル、例えばパワーポイント(マイクロソフト社のスライドショー・スタジオ・ソフトウェア製品)によるデータを格納するために使用するPPTファイル。
(ix) イベント情報獲得ログ(記録)ファイル、トランザクション・ログ、電話発呼記録、従業員のタイムシート(勤務時間記録表)、及びコンピュータシステムのイベントログを含むが、これらに限定されない。
(x) ブログページ(ウェブログのページ)
(i) PDF−テキスト・変換ユーティリティ(例えばEtymon Systems社の製品であるPJ(登録商標))
(ii) RTF−テキスト・変換ユーティリティ(例えばPete Sergeant社の製品であるRTF-Parser-1.09(登録商標))
(iii) MS Word(登録商標)−テキスト・パーサー(例えばApache.orgの製品であるApache POI project(登録商標))
をリンクし起動して、添付ファイルを検索可能な形式にすることができる。APIを提供するe−メール・サーバーについては、一部はさらに添付ファイル用のネイティブ(元の)フォーマット検索ユーティリティを内蔵している。e−メール・メッセージ及びe−メール添付ファイルは次のものを含む多数のファイルフォーマットで存在し得る:
(i) テキスト(プレーンテキスト)ファイルのe−メール添付ファイル。
(ii) エクステンデッド・マークアップ・ランゲージ(XML)のe−メール添付ファイル。
(iii) マークアップ・ランゲージ・ファイルのあらゆる「方言」ファイルのe−メール添付ファイル、これらの方言はハイパーテキスト・マークアップ・ランゲージ(HTML)及びエクステンシブル・ハイパーテキスト・マークアップ・ランゲージ(XHTML(登録商標))(ワールドワイド・ウェブ・コンソーシャムのプロジェクト)、RuleML(RuleMLイニシアティブのプロジェクト)、スタンダード・ジェネラライズド・マークアップ・ランゲージ(SGML、国際規格の1つ)、及びエクステンシブル・スタイルシート・ランゲージ(XSL、ワールドワイド・ウェブ・コンソーシャムのプロジェクト)を含むが、これらに限定されない。
(iv) ポータブル・ドキュメント・フォーマット(PDF、Adobe社の独自フォーマット)ファイルのe−メール添付ファイル。
(v) リッチテキスト・フォーマット(RTF、マイクロソフト社によって開発された規格)ファイルのe−メール添付ファイル。
(vi) スプレッドシート・ファイルのe−メール添付ファイル、例えばExcel(エクセル、マイクロソフト社のスプレッドシート(表計算)ソフトウェア製品)によるデータを格納するために使用するXLSファイルのe−メール添付ファイル。
(vii) MS DOCファイルのe−メール添付ファイル、例えば、MS WORD(マイクロソフト社によるワードプロセッサ・ソフトウェア製品)による文書を格納するために使用するDOCファイルのe−メール添付ファイル。
(viii) イベント情報獲得ログファイルのe−メール添付ファイル、これらのログファイルは例えば、トランザクション・ログ、電話発呼記録、従業員のタイムシート(勤務時間記録表)、及びコンピュータシステムのイベントログを含むが、これらに限定されない。
Language(SQL:構造化質問言語、ANSI/ISO規格)である。SQLのステートメント(文)は、RDBMSに接続したソフトウェアプログラム及び/またはユーザによって構成され、質問として提出される。RDBMSは質問を処理し、結果セットと称する回答を返す。結果セットは、質問に合った(質問に満足に答える)データベース中の行及び列の組である。質問に満足に答える行及び列がデータベース中にない場合には、この質問からは行及び列を戻さず、この場合には、結果セットは空である(NULL SET)と称する。本発明の実施例では、対象の項目または語句についての情報の潜在的及び実際のソースはRDB内のテーブル中のデータ行である。RDBテーブル中の各行は同等に、対象の項目または語句についての情報のソースになる資格があると考えられる。本発明の方法は次のステップを含む:
(a) データベースへの接続を生成するステップ;
(b) SQLで質問を形成するステップであって、この質問は、
(b1) SQLのWHERE節を含み、
(b2) このWHERE節は、RDB内の少なくとも1つのテーブルを指定し、
(b3) このWHERE節は、このテーブル中の少なくとも1つの列を指定し、
(b4) このWHERE節は、EQUALSのような少なくとも1つのSQLの比較演算子を含み、
(b5) このWHERE節は、対象の項目または語句を少なくとも1つ、パラメータとして含む;
(c) RDBMSに質問を提出するステップ;
(d) RDBMSによって戻されるデータの行(があれば)受け取るステップ、このデータの行は、対象の項目または語句についての情報の実際のソースであると考えられる。
(a) データベースへの接続を生成するステップ;
(b) SQLで質問を形成するステップであって、この質問は、
(b1) SQLのWHERE節を含み、
(b2) このWHERE節は、RDB内の少なくとも1つのテーブルを指定し、
(b3) このWHERE節は、このテーブル中の少なくとも1つの列を指定し、
(b4) このWHERE節は、EQUALSのような少なくとも1つのSQLの比較演算子を含み、
(b5) このWHERE節は、対象の項目または語句を少なくとも1つ、パラメータとして含み、
(b6) 検索するテーブル中の列毎に、追加的なWHERE節が(b1)、(b2)、(b3)で構成され、検索する各列は、(b4)及び(b5)を個別に識別され、
(b7) 追加的なWHERE節の各々はSQLの’OR’演算子によって結合される;
(c) RDBMSに質問を提出するステップ;
(d) RDBMSによって戻されるデータの行(があれば)受け取るステップ、このデータの行は、対象の項目または語句についての情報の実際のソースであると考えられる。
(a) データベースへの接続を生成するステップ;
(b) SQLで質問を形成するステップであって、この質問は、
(b1) SQLのWHERE節を含み、
(b2) このWHERE節は、RDB内の少なくとも1つのテーブルを指定し、
(b3) このWHERE節は、このテーブル中の少なくとも1つの列を指定し、
(b4) このWHERE節は、EQUALSのような少なくとも1つのSQLの比較演算子を含み、
(b5) このWHERE節は、対象の項目または語句を少なくとも1つ、パラメータとして含む;
(b8) 検索するテーブル毎に、追加的なWHERE節が(b1)、(b2)で構成され、検索する各テーブルは、(b3)、(b4)及び(b5)を個別に識別され、
(b7) 追加的なWHERE節の各々はSQLの’OR’演算子によって結合される;
(c) RDBMSに質問を提出するステップ;
(d) RDBMSによって戻されるデータの行(があれば)受け取るステップ、このデータの行は、対象の項目または語句についての情報の実際のソースであると考えられる。
(i) 潜在的なソースが、対象の項目または語句の単数形または複数形との一致を含むこと;
(ii) 潜在的なソースが、対象の項目または語句の同義語との一致を含むこと;
(iii) 潜在的なソースが、対象の項目またが語句に関係する単語との一致を含むこと(シソーラス(語彙辞典)によって提供され得るものに関係する);
(iv) 潜在的なソースが、対象の項目または語句に関係する単語との一致を含み、潜在的なソースの内容と対象の項目または語句との関係が権威ある参照ソースによって確立されること;
(v) Merrian-Webster’s Thesaurus(メリアン・ウェブスター社の刊行物)のようなシソーラスを使用して、検索中に存在する潜在的なソースの何らかの内容が、対象の項目または語句の同義語か、またはこれに関係するものであるか否かを判定すること;
(vi) 潜在的なソースが、対象の項目及び/または語句の1つの、権威ある参照ソース中の定義に現われる単語との一致を含むこと;
(vii) Merrian-Webster’s Dictionary(メリアン・ウェブスター社の刊行物)のような辞典を使用して、検索中に存在する潜在的なソースの何らかの内容が、対象の項目または語句の、この辞典の定義であるか否か、従って関係するか否かを判定すること;
(viii) 潜在的なソースが、権威ある参照ソースにおける対象の項目または語句についての説明中に出現する単語との一致を含むこと;
(ix) Encyclopedia Britannica(Encyclopedia Britannica社の刊行物)のような百科辞典を使用して、検索中に存在する潜在的なソースの何らかの内容が、対象の項目または語句についての百科事典の説明中にあるか否か、従って関係するか否かを判定すること;
(x) 潜在的なソース中にある項目が、対象の項目または語句と「親」、「子」、または「兄弟」の関係を有すること;
(xi) 分類を使用して、潜在的なソースに含まれる項目が、対象の項目または語句と「親」、「子」、または「兄弟」の関係を有することを判定すること。本実施例では、対象の項目または語句を含む頂点が分類中にある。これが対象の頂点である。潜在的なソースの内容中にある単語毎に、分類における「親」、「兄弟」及び「子」の頂点を、対象の頂点から、この対象の頂点の「親」、「兄弟」及び「子」の頂点までの関係(リンク)を辿ることによって検索する。「親」、「兄弟」または「子」の頂点のいずれかが、潜在的なソースの内容からの単語を含む場合には、一致を宣言し、このソースは対象の項目または語句についての情報の実際のソースであると考える。本実施例では、グラフ・トラバース機能と称するソフトウェア機能を用いて、対象の項目または語句の「親」、「兄弟」及び「子」の頂点を位置検出して検査する;
(xii) 対象の項目または語句が、潜在的なソースに含まれる項目から1(単位)の意味的度合い(長さ)のものであること;
(xiii) 対象の項目または語句が、潜在的なソースに含まれる項目から2(単位)の意味的度合い(長さ)のものであること;
(xiv) オントロジーを使用して、ソースが、対象の項目または語句から1(単位)の意味的度合い(長さ)だけ離れていることを判定すること。本実施例では、対象の項目または語句を含む頂点はオントロジー中に位置する。これが対象の頂点である。潜在的なソースの内容中にある単語毎に、対象の頂点から隣接するすべての頂点までの関係(リンク)を辿ることによって、オントロジーを検索する。隣接する頂点のいずれかが潜在的なソースの内容からの単語を含む場合には、一致を宣言し、このソースは対象の項目または語句についての情報の実際のソースであると考える;
(xv) オントロジーを使用して、ソースが、対象の項目または語句から2(単位)の意味的度合い(長さ)だけ離れていることを判定すること。本実施例では、対象の項目または語句を含む頂点はオントロジー中に位置する。これが対象の頂点である。潜在的なソースの内容中にある単語毎に、意味的度合い1の関連性テストを実行する。このテストが不合格であれば、対象の頂点に隣接する頂点からそれぞれの隣接する頂点のすべてまでの関係(リンク)を辿ることによって、オントロジーを検索する。こうした頂点は、対象の頂点から意味的度合い2である。意味的度合い2の頂点のいずれかが、潜在的なソースの内容からの単語を含む場合には、一致を宣言し、このソースは対象の項目または語句についての情報の実際のソースであると考える;
(xvi) CYC Ontology(Cycorp社の製品)のような汎用的なオントロジーを使用して、対象の項目及び/または語句の1つから、検索中に存在する潜在的なソースのあらゆる内容までの意味的距離の度合い(長さ)を測定すること;
(xvii) Gene Ontology(Gene Ontology Consortiumのプロジェクト)のような特化したオントロジーを使用して、対象の項目及び/または語句から、検索中に存在する潜在的なソースのあらゆる内容までの意味的距離の度合い(長さ)を測定すること;
(xviii) オントロジーを使用し、テストのために、オントロジー言語(例えばWeb Ontology Language(OWL))を用いてオントロジーにアクセスしてオントロジー内を進むこと。
(a) テキストをNLPに入力する;
(b) NLPはテキストを「文章(センテンス)の文書(ドキュメント)」に再編成する;
(c) 「文章」毎に、
(c1) NLPは一連のトークンを符号化し、各トークンは、文章中の(このトークンに)対応する単語の品詞に対するコードである;
(a) テキストをNLPに入力する;
(b) NLPはテキストを「文章の文書」に再編成する;
(c) 「文章」毎に、
(c1) NLPはトークンの列を符号化し、各トークンは、文章中の(このトークンに)対応する単語の品詞に対するコードである;
(c2) NLPにとって認識可能でない文字を含む文字列または単語列を、文章及び上記トークンの列の両方から取り除く
(i) テキスト(プレーンテキスト)ファイル。
(ii) リッチテキスト・フォーマット(RTF、マイクロソフト社によって開発された規格)ファイル。代案の方法は、まずRTF−テキスト変換ユーティリティ(例えばPete Sergeant社の製品であるRTF-Parser-1.09)の中間的な使用によってRTFからクリーンテキストを得ることである。
(iii) エクステンデッド・マークアップ・ランゲージ(XML、ワールドワイド・ウェブ・コンソーシャムのプロジェクト)ファイル。
(iv) マークアップ・ランゲージ・ファイルのあらゆる「方言」ファイル、これらの方言は、ハイパーテキスト・マークアップ・ランゲージ(HTML)及びエクステンシブル・ハイパーテキスト・マークアップ・ランゲージ(XHTML)(ワールドワイド・ウェブ・コンソーシャムのプロジェクト)、RuleML(RuleMLイニシアティブのプロジェクト)、スタンダード・ジェネラライズド・マークアップ・ランゲージ(SGML、国際規格の1つ)、及びエクステンシブル・スタイルシート・ランゲージ(XSL、ワールドワイド・ウェブ・コンソーシャムのプロジェクト)を含むが、これらに限定されない。
(v) ポータブル・ドキュメント・フォーマット(PDF、Adobe社の独自フォーマット)ファイル。
(vi) MS WOED(MSワード(登録商標)ファイル、例えば、MS WORD(マイクロソフト社によるワードプロセッサ・ソフトウェア製品)による文書を格納するために使用するDOCファイル。本実施例は、MSワード−テキスト・パーサー(例えばApache.orgの製品であるApache POIプロジェクト)をプログラムで利用する。POIプロジェクトのAPIは、Microsoft Excel(マイクロソフト・エクセル(登録商標))のスプレッドシート(表計算ソフト)ファイル(XLS)からのプログラムで起動されるテキスト抽出も可能にする。MSワード・ファイルはNLPによっても、特殊文字を含むプレーンテキストファイルとして処理することができるが、XLSファイルは処理できない。
(vii) イベント情報獲得ログ(記録)ファイル、トランザクション・ログ、電話発呼記録、従業員のタイムシート(勤務時間記録表)、及びコンピュータシステムのイベントログを含むが、これらに限定されない。
(viii) ウェブページ。
(ix) ブログページ。
(A) 第1段階では、
(a) 第1の項目または語句がデータベース名であり、第2の項目または語句がデータベース・テーブル(データベース内のテーブル)名である。例:データベース名が”ACCOUNTING(会計)”であり、データベース・テーブル名が”Invoice(送り状、納品書、請求書)”である;
(b) 第1の項目または語句(”ACCOUNTING(会計)”)と第2の項目または語句(”Invoice”)との関係(例えば”has”(有する))は、RDBスキーマの意味論(セマンティックス)により暗示的であると認識する。
(c) これら一対の概念または項目の関係(”has”)を提供することによってノード(”Accounting−has−Invoice”)を生成する;
(d) RDB内のテーブル毎に、データベース名を固定するステップ(a)、関係を固定するステップ(b)、個別のテーブル名を反復的に用いてノードを生成するステップ(c)を実行する。
(B) 第2段階では、
(a) 第1の項目または語句がデータベース・テーブル名であり、第2の項目または語句がデータベース・テーブルの列名である。例:データベース・テーブル名が”Invoice”であり、列名が”Amount Due(未払額、精算額)”である;
(b) 第1の項目または語句(”Invoice”)と第2の項目または語句(”Amount Due”)との関係(例えば”has”)は、DBスキーマの意味論(セマンティックス)により暗示的であると認識する。
(c) これら一対の概念または項目の関係(”has”)を提供することによってノード(”Invoice−has−Amount Due”)を生成する;
(d) データベース・テーブル中の列毎に、データベース・テーブル名を固定するステップ(a)、関係を固定するステップ(b)、個別の列名を反復的に用いてノードを生成するステップ(c)を実行する。
(e) RDB内のテーブル毎に、ステップ(d)に続いて、データベース・テーブル名を反復的に使用するステップ(a)、関係を固定するステップ(b)、個別の列名を反復的に用いてノードを生成するステップ(c)を実行する。
本実施例では、RDBのスキーマ全体を分解し、上記暗示的な関係はRDBの意味論によって直ちに知られるので、RDBのスキーマ全体は、中間フォーマットの一対の概念または項目を追加的に処理することなしにノードに分解することができる。
(a) 第1の項目または語句が複合項目であり;
(b) この複合項目の第1部分はデータベース・テーブルの列名であり、これは、このテーブルの”キー”列の名前である(例えば、テーブル”Invoice”に対しては、キー列は”Invoice No.(送り状番号)”である。);
(c) 上記複合項目の第2部分は、テーブルの第1行からのキー列に対する値である(例えば、”Invoice”テーブルの列”Invoice No.”に対しては、行1の”Invoice No.”の値が”500024”であり、この行を「現在行」と称する);
(d) 上記複合の第3部分は、テーブル中の第2列の列名である(例”Status(状態)”);
(e) 第1の項目または語句は”Invoice No. 500024 Status(送り状番号500024の状態)”となる;
(f) 第2の項目または語句は、第2列、現在行からの値である。例:第2列の名前が”Status”であり、行1の値が”Overdue(期限切れ)”である;
(g) 第1の項目または語句(”Invoice No. 500024 Status”)と第2の項目または語句(”Overdue”)との関係(例えば”is(である)”)を、RDBスキーマの意味論により暗示的であると認識する;
(h) 上記一対の概念または項目の関係(”is”)を提供することによって、ノードを生成する(”Invoice No. 500024 Status−is−Overdue”);
(i) テーブル中の行毎に、キー列名を固定するステップ(b)、行と共に変化するステップ(c)、第2列名を固定するステップ(d)、行毎の第2列の値と共に変化するステップ(f)、固定された関係(”is”)(g)でノードを生成するステップ(h)を実行する;
(j) テーブル中の列毎に、ステップ(i)を実行する;
(k) データベース内のテーブル毎に、ステップ(j)を実行する。
RDBの全体の内容を分解することができ、上記暗示的な関係はRDBの意味論によって直ちに知られるので、RDBの全体の内容は、中間フォーマットの一対の概念または項目を追加的に処理することなしにノードに分解することができる。
(a) グラフのルートの頂点から開始する;
(b) 頂点を訪ねる(現在の頂点と称する);
(c) 現在の頂点に至る子の頂点が存在する場合には;
(d) 子の頂点の値は第1の項目または語句(例えば”mammal(哺乳類)”)である;
(e) 現在の頂点の値は第2の項目または語句(例えば”living organism(生物体)”)である;
(f) 第1の項目または語句(子の頂点の値)と第2の項目または語句(現在の頂点の値)との関係(例えば”is「である」”)を、分類の意味論により暗示的であると認識する;
(g) これら一対の概念または項目の関係(”is”)を提供することによって、ノード(”mammal−is−living organism(哺乳類は生物体である)”)を生成する;
(h) 分類グラフ中の頂点毎に、ステップ(b)、(c)、(d)、(e)、(f)、(g)を実行する。
分類ツリー全体の親/子関係は分解することができ、上記暗示的な関係は分類の意味論によって直ちに知られるので、分類の全体の内容は、中間フォーマットの一対の概念または項目を追加的に処理することなしにノードに分解することができる。
(a) グラフのルートの頂点から開始する;
(b) 頂点を訪ねる(現在の頂点と称する);
(c) 現在の頂点に至る子の頂点が2つ以上存在する場合には;
(d) 左から右への参照フレームを用いる;
(e) 第1の子の頂点の値は、第1の項目または語句である(例えば”humans(人間)”)
(f) これに最も近い兄弟の(近接した)頂点は第2の項目または語句(例えば”aeps(類人猿)”)である;
(g) 第1の項目または語句(第1の子の頂点の値)と第2の項目または語句(他の子の頂点の値)との関係(例えば”related(関係があった)”)を、分類の意味論(即ち兄弟関係)により暗示的であると認識する;
(h) これら一対の概念または項目の関係(”related”)を提供することによって、ノード(”humans−related−apes(人間は類人猿と関係があった)”)を生成する;
(i) 現在の頂点の(第1の子より先の)他の子の頂点毎に、ステップ(e)、(f)、(g)、(h)を実行する;
(j) 分類グラフ中の頂点毎に、ステップ(b)、(c)、(d)、(i)を実行する。
分類ツリー全体中のすべての兄弟関係は分解することができ、上記暗示的な関係は分類の意味論によって直ちに知られるので、分類の全体の内容は、中間フォーマットの一対の概念または項目を追加的に処理することなしにノードに分解することができる。
(a) グラフのルートの頂点から開始する;
(b) 頂点を訪ねる(現在の頂点と称する);
(c) 現在の頂点から他の頂点へのリンクが存在する場合には;
(d) 時計回りの参照フレームを用いて;
(e) 現在の頂点の値は第1の項目または語句(例えば”husband(夫)”)である;
(f) 最初にリンクされる頂点の値は第2の項目または語句(例えば”wife(妻)”)である;
(g) 第1の項目または語句(現在の頂点の値)と第2の項目または語句(リンクされた頂点の値)との関係(例えば”spouse(配偶者)”)は、オントロジーの意味論により明示的に提供される;
(h) これら一対の概念または項目の関係(”spouse”)を提供することによって、ノード(”husband−spouse−wife(夫−配偶者−妻)”)(正式には「妻との配偶者関係を有する夫が存在する」ことを意味する)を生成する;
(i) オントロジーグラフ中の頂点毎に、ステップ(b)、(c)、(d)、(e)、(f)、(g)、(h)を実行する;
オントロジーツリーにおける度合い1の関係は分解することができ、上記明示的な関係は、オントロジーのラベル付けされた関係の意味論によって直ちに知られるので、オントロジーの全体の内容は、中間フォーマットの一対の概念または項目を追加的に処理することなしにノードに分解することができる。
(a) 第1部分は第1の関係項を含む;
(b) 第2部分は関係を含む;
(c) 第3部分は第2の関係項を含む。
これらの部分に次の名称を与える:
(a) 第1の関係項を含む第1部分を主部と称する;
(b) 関係を含む第2の関係項を結合部と称する;
(c) 第2の関係項を含む第3部分を属性と称する。
(a) 第1部分は第1の関係項を含む;
(b) 第2部分は関係を含む;
(c) 第3部分は第2の関係項を含む;
(d) 第4部分はソースを含む。
これらの部分に次の名称を与える:
(a) 第1の関係項を含む第1部分を主部と称する;
(b) 関係を含む第2部分を結合部と称する;
(c) 第2の関係項を含む第3部分を属性と称する;
(d) ソースを含む第4部分をシーケンス(列)と称する。
(a) トークンの構文パターン420を選択する(例:<noun(名詞)><preposition(前置詞)><noun(名詞)>);
(b) 左から右に移動する;
(c) トークンの列中の、このパターンの中央のトークン(<preposition>)を検索する;
(d) 正しいトークン(<preposition>)がトークン列中に位置検出された場合には;
(e) <preposition>のトークンを現在トークンと称する;
(f) 現在トークンの左側のトークン(左トークンと称する)を調べる;
(g) 左トークンが上記パターンに一致しない場合には;
a.この試みを失敗と考える;
b.トークンの列の検索を、現在トークンの位置から継続する;
c.次に一致する<preposition>トークンを位置検出するまで行う;
d.あるいは、トークンの列の終点に行き着く;
(h) 左トークンが上記パターンに一致する場合には;
(i) 現在トークンの右側のトークン(右トークンと称する)を調べる;
(j) 右トークンが上記パターンに一致しない場合には;
a.この試みを失敗と考える;
b.トークンの列の検索を、現在トークンの位置から継続する;
c.次に一致する<preposition>トークンを位置検出するまで行う;
d.あるいは、トークンの列の終点に行き着く;
(k) 左トークンが上記パターンに一致する場合には;
(l) ノード180A及び180Bを作成する;
(m) <noun><preposition><noun>のパターン、例えば”action regarding inflation(膨張に関する作用)”に相当する単語リストからの単語を使用する;
(n) トークンの列の検索を、現在トークン位置から継続する;
(o) 次に一致する<preposition>トークンを位置検出するまで行う;
(p) あるいは、トークンの列の終点に行き着く;
(q) トークンの構文パターン420を選択する(例:<noun(名詞)><preposition(前置詞)><noun(名詞)>);
(r) 左から右に移動する;
(s) トークンの列中の、このパターンの中央のトークン(<preposition>)を検索する;
(t) 正しいトークン(<preposition>)がトークン列中に位置検出された場合には;
(u) <preposition>のトークンを現在トークンと称する;
(v) 現在トークンの左側のトークン(左トークンと称する)を調べる;
(w) 左トークンが上記パターンに一致しない場合には;
a.この試みを失敗と考える;
b.トークンの列の検索を、現在トークンの位置から継続する;
c.次に一致する<preposition>トークンを位置検出するまで行う;
d.あるいは、トークンの列の終点に行き着く;
(x) 左トークンが上記パターンに一致する場合には;
(y) 現在トークンの右側のトークン(右トークンと称する)を調べる;
(z) 右トークンが上記パターンに一致しない場合には;
a.この試みを失敗と考える;
b.トークンの列の検索を、現在トークンの位置から継続する;
c.次に一致する<preposition>トークンを位置検出するまで行う;
d.あるいは、トークンの列の終点に行き着く;
(aa) 左トークンが上記パターンに一致する場合には;
(bb) ノードを作成する;
(cc) <noun><preposition><noun>のパターン、例えば”prince among men(男の中の王子)”に相当する単語リストからの単語を使用する;
(dd) トークンの列の検索を、現在トークンの位置から継続する;
(ee) 次に一致する<preposition>トークンを位置検出するまで行う;
(ff) あるいは、トークンの列の終点に行き着く;
(1) 挿入ステップ(a1)は、パターンのリストの用意である。このリストは2つのパターンから始めることができ、そして本質的に、ノードを作成するに当たり使用可能なすべてのパターンに拡張することができ、次のものを含むがこれらに限定されない:
(i) <noun(名詞)><verb(動詞)><noun>、例:”man bites dog(人が犬を噛む)”,
(ii) <noun><adverb(副詞)><verb>、例:”horse quickly runs(馬が速く走る)”,
(iii) <verb><adjective(形容詞)><noun>、例:”join big company(大きい会社に入る)”,
(iv) <adjective><noun><noun>、例:”silent night song(静かな夜の歌)”,
(v) <noun><preposition(前置詞)><noun>、例:”voters around country(国中の有権者)”;
(2) ステップ(a)〜ステップ(p)の挿入ステップ(p1)を、パターンのリスト中のパターン毎に実行する;
挿入ステップ(a2)は、中央のトークン、次に左側のトークン、次に右側のトークン(例:<adjective>の前に<noun>、その前に<preposition>)の順によってパターンのリストをソートし(並べ替え)、このことは、パターン(i)〜(v)の組に対する検索順序が(iii), (ii), (iv), (v), (i)となること、及び同じ中央トークンを有するパターンがグループとなることを意味する。
(b), (c) 各トークン列中の、パターンリスト中の第1中央トークン、即ち<adjective>を検索する;
(d) 適正なトークン(<adjective>)がトークン列中に位置検出された場合には;
(e) 位置検出された<adjective>トークンを現在トークンと称する;
(e1) 現在トークンを用いて;
(e2) 同じ中央トークンを有するリスト中の各パターン(即ち、パターンリスト中のグループの各メンバー)を、現在トークンの点において、トークン列中の右側のトークン、現在トークン、及び左側のトークンと比較する。
(e3) 検索リスト中のグループ毎に、ステップ(b)〜(e2)を実行する;
(q) リソースから分解されたすべての文について、ステップ(b)〜(e3)を実行する。
(a) パターンは<noun><adjective>である;
(b) 左から右に移動する;
(c) トークンの列中の、トークン<adjective>を検索する;
(d) 適正なトークン(<adjective>)がトークン列中に位置検出された場合には;
(e) <adjective>トークンを現在トークンと称する;
(f) 現在トークンの左側にあるトークン(左トークンと称する)を検査する;
(g) 中央トークン(<noun>)が上記パターンに一致しない場合には、
a.この試みを失敗と考える;
b.トークンの列の検索を、現在トークンの位置から継続する;
c.次に一致する<adjective>トークンを位置検出するまで行う;
d.あるいは、トークンの列の終点に行き着く;
(h) 左トークンが上記パターンに一致する場合には;
(i) ノードを作成する;
(j) <noun><adjective>のパターン、例えば”mountain big(山 大きい)”に相当する単語リストからの単語を使用する;
(k) ノードの主部(上記パターン中の<noun>位置に相当する)の値を、単数形または複数形についてテストする;
(l) このテストに基づいて、ノード用の結合値(例えば”is” “are”(である))を挿入する;
(m) ノード”mountain is big(山は大きい)”が生じる;
(n) トークンの列の検索を、現在トークン位置から継続する;
(o) 次に一致する<adjective>トークンを位置検出するまで行う;
(p) あるいは、トークンの列の終点に行き着く;
(q) リソースから分解したすべての文について、ステップ(a)〜(p)を実行する。
(a) パターンは<adjective><noun><noun>である;
(b) 左から右に移動する;
(c) トークンの列中の、トークン<adjective>を検索する;
(d) 適正なトークン(<adjective>)がトークン列中に位置検出された場合には;
(e) <adjective>トークンを現在トークンと称する;
(f) 現在トークンの左側にあるトークン(左トークンと称する)を検査する;
(g) 左トークン(<noun>)が上記パターンに一致しない場合には、
a.この試みを失敗と考える;
b.トークンの列の検索を、現在トークンの位置から継続する;
c.次に一致する<adjective>トークンを位置検出するまで行う;
d.あるいは、トークンの列の終点に行き着く;
(h) 中央トークンが上記パターンに一致する場合には;
(i) 中央トークンの右側にあるトークン(右トークンと称する)を検査する;
(j) 右トークン(<noun>)が上記パターンに一致しない場合には、
a.この試みを失敗と考える;
b.トークンの列の検索を、現在トークンの位置から継続する;
c.次に一致する<adjective>トークンを位置検出するまで行う;
d.あるいは、トークンの列の終点に行き着く;
(k) 中央トークンが上記パターンに一致する場合には;
(l) ノードを作成する;
(m) <adjective><noun><noun>のパターン、例えば”silent night song(静かな夜の歌)”に相当する単語リストからの単語を使用する;
(n) ノード(上記パターン中の右トークン<noun>位置に相当する)の属性値を、単数形または複数形についてテストする;
(o) ノードに対する結合値(例:”is” ”are”)をテストに基づいて挿入する;
(p) ノード”silent night song”が生じる;
(q) トークンの列の検索を、現在トークン位置から継続する;
(r) 次に一致する<adjective>トークンを位置検出するまで行う;
(s) あるいは、トークンの列の終点に行き着く;
(t) リソースから分解したすべての文について、ステップ(a)〜(s)を実行する
(i) <adjective><noun> <verb> <adjective><noun>、”large contributions fight word hunger(大きな寄付が世界的な飢餓と戦う)”,
(ii) <noun> <TO><verb> <noun>、”legislature to consider bill(法案を考えるための立法府)”,
(iii) <noun> <adverb><verb> <adjective><noun>、”people quickly read local news(人々はローカルニュースを速読する)”。
例えば、<noun> <TO><verb> <noun>、”legislature to consider bill(法案を考えるための立法府)”を用いて、次のことを行う:
(a) 左パターン、中央パターン、及び右パターン用に別個のパターンのリストを作成し参照する;
(b) 中央パターンからの最も左のトークンを検索として用いる;
(c) 適正なトークン<TO>がトークン列中に位置検出された場合には;
(d) <TO>トークンを現在トークンと称する;
(e) 現在トークンの右側にあるトークン(中央パターンの関係で右トークンと称する)を検査する;
(f) このトークンがいずれの中央パターンの右トークンとも一致しない場合には、
a.この試みを失敗と考える;
b.トークンの列の検索を、現在トークンの位置から継続する;
c.次に一致する<TO>トークンを位置検出するまで行う;
d.あるいは、トークンの列の終点に行き着く;
(g) 右トークンが中央パターンのパターン(<TO><verb>)に一致する場合には;
(h) 現在トークンの左側にあるトークン(左パターンとの関係で右トークンと称する)を検査する;
(i) 右トークンがいずれの左パターンの右トークンとも一致しない場合には、
a.この試みを失敗と考える;
b.トークンの列の検索を、現在トークンの位置から継続する;
c.次に一致する<TO>トークンを位置検出するまで行う;
d.あるいは、トークンの列の終点に行き着く;
(j) 右トークンが上記パターンに一致する場合には、
(k) 現在トークンの右側にあるトークン(中央パターンとの関係で右トークンと称する)が現在トークンとなる;
(l) 現在トークンの右側にあるトークン(右パターンとの関係で左トークンと称する)が現在トークンとなる;
(m) このトークンがいずれの右パターンの左トークンとも一致しない場合には、
a.この試みを失敗と考える;
b.トークンの列の検索を、現在トークンの位置から継続する;
c.次に一致する<TO>トークンを位置検出するまで行う;
d.あるいは、トークンの列の終点に行き着く;
(n) 左トークンが右パターンのパターン(<noun>)に一致する場合には;
(o) ノードを作成する;
(p) <noun> <TO><verb> <noun>、例えば”legislature to consider bill”に相当する単語リストからの単語を使用する;
(q) トークンの列の検索を、現在トークン位置から継続する;
(r) 次に一致する<preposition>トークンを位置検出するまで行う;
(s) あるいは、トークンの列の終点に行き着く;
(i) 主部、結合部、及び属性中のすべての単語が大文字化される;
(ii) 主部、結合部、または属性が、ハイフンまたはアポストロフィで始まるか、これらで終わる;
(iii) 主部、結合部、または属性が、それぞれの値のいずれかに、ハイフンとスペース(空白)(”- ”)、またはスペースとハイフン(” -”)、あるいはハイフンとハイフン(”--”)を埋め込まれる;
(iv) 主部、結合部、及び属性が、同じ文字の長さ4以上(例:”FFFF”)を含む;
(v) 主部、結合部、及び属性が多語値を含み、この多語値の第1語または最終語は単一文字のみ(例:”a big”(ある1つの大きい))である;
(vi) 主部及び属性が、互いの単数形または複数形である;
(vii) 主部と属性とが同一であるか、あるいは互いの値を埋め込まれている(例:”dog” ”sees” “big dog”(犬、見る、大きい犬));
(viii) 主部、結合部、または属性がそれぞれ、2つの同一単語を含む(例:”Texas Texas” “is” “state”(テキサス テキサス、である、州));
(i) 候補ノードの(最も左の)主部の値が、現在の末端ノードの(最も右の)属性部分との正確な一致を含むこと。
(ii) 候補ノードの主部の値が、現在の末端ノードの属性部分の単数形または複数形との一致を含むこと。
(iii) 候補ノードの主部の値が、現在の末端ノードの属性部分に関係する(例えばシソーラスのように)単語との一致を含むこと。
(iv) 候補ノードの主部の値が、現在の末端ノードの属性部分に関係する単語との一致を含み、候補ノードの主部と末端ノードの属性部分との関係は権威的な参照ソースによって確立されること。
(v) 候補ノードの主部の値が、現在の末端ノードの属性部分に関係する単語との一致を含み、候補ノードの主部と末端ノードの属性部分との関係は権威的な参照ソースによって確立され、関連性のテストは、Merrian-Webster’s Thesaurus (Merrian-Webster社の刊行物)のようなシソーラスを用いて、候補ノードの主部の値が現在の末端ノードの属性部分の同義語、または属性部分に関連するか否かを判定すること。
(vi) 候補ノードの主部の値が、権威的な参考文献における現在の末端ノードの属性部分の定義中に見られる単語との一致を含むこと。
(vii) 候補ノードの主部の値が、現在の末端ノードの属性部分に関係する単語との一致を含み、候補ノードの主部と末端ノードの属性部分との関係は権威的な参照ソースによって確立され、関連性のテストは、Merrian-Webster’s Dictionaty(Merrian-Webster社の刊行物)のような辞書を用いて、候補ノードの主部が辞書の定義中に出現し、従って現在の末端ノードの属性部分に関係するか否かを判定すること。
(viii) 候補ノードの主部の値が、現在の末端ノードの属性部分についての説明中に出現する単語との一致を含むこと。
(ix) 候補ノードの主部の値が、現在の末端ノードの属性部分に関係する単語との一致を含み、候補ノードの主部と末端ノードの属性部分との関係は権威的な参照ソースによって確立され、関連性のテストは、Encyclopedia Britannica(Encyclopedia Britannica社の刊行物)のような百科事典を用いて、検索中に存在する潜在的なソースの内容が、対象の項目または語句の百科事典中の説明中に出現し、従って現在の末端ノードの属性部分に関連するか否かを判定すること。
(x) 候補ノードの主部の値が、現在の末端ノードの属性部分と親、子、または兄弟の関係を有すること。
(xi) 候補ノードの主部の値が、現在の末端ノードの属性部分に関係する単語との一致を含み、候補ノードの主部と末端ノードの属性部分との関係は権威的な参照ソースによって確立され、関連性のテストは分類を用いて、候補ノードの主部に含まれる項目が、現在の末端ノードの属性部分と親、子、または兄弟の関係を有すること。現在の末端ノードの属性部分の値を含む頂点は分類中に位置する。これが対象の頂点である。候補ノードの主部に位置する単語毎に、対象の頂点の親、兄弟、及び子の頂点を、対象の頂点から、この対象の頂点の親、兄弟、及び子の頂点までの関係(リンク)を辿ることによって検索する。親、兄弟、または子の頂点のいずれかが、末端ノードの属性部分からの単語を含む場合には、一致を宣言し、候補ノードを現在の末端ノードに関連するものと考える。本実施例では、グラフ・トラバース機能と称するソフトウェア機能を用いて、現在の末端ノードの親、兄弟、及び子の頂点を位置検出して検査する。
(xii) 候補ノードの主部に含まれる項目が、現在の末端ノードの属性部分に含まれる項目から度合い(長さ)1の意味的距離を有すること。
(xiii) 候補ノードの主部に含まれる項目が、現在の末端ノードの属性部分に含まれる項目から度合い(長さ)2の意味的距離を有すること。
(xiv) 候補ノードの主部を現在の末端ノードの属性部分と比較し、関連性のテストは、オントロジーを用いて、候補ノードの主部が度合い(長さ)1の意味的距離だけ、現在の末端ノードの属性部分から離れていることを判定する。現在の末端ノードの属性部分を含む頂点は上記オントロジー中に位置する。これが対象の頂点である。候補ノードの主部に位置する単語毎に、対象の頂点からすべての隣接頂点までの関係(リンク)を辿ることによってオントロジーを検索する。いずれかの隣接頂点が候補ノードの主部からの単語を含む場合には、一致を宣言し、候補ノードを現在の末端ノードに関連するものと考える。
(xv) 候補ノードの主部を現在の末端ノードの属性部分と比較し、関連性のテストは、オントロジーを用いて、候補ノードの主部が度合い(長さ)2の意味的距離だけ、現在の末端ノードの属性部分から離れていることを判定する。現在の末端ノードの属性部分を含む頂点は上記オントロジー中に位置する。これが対象の頂点である。候補ノードの主部に位置する単語毎に、意味的度合い1の関連性テストを実行する。このテストが不合格である場合に、対象の頂点からすべての隣接頂点までの関係(リンク)を辿ることによってオントロジーを検索する。こうした頂点は対象の頂点から意味的度合い2である。意味的度合い2の頂点のいずれかが候補ノードの主部からの単語を含む場合には、一致を宣言し、候補ノードを現在の末端ノードに関連するものと考える。
(xvi) 候補ノードの主部を現在の末端ノードの属性部分と比較し、関連性のテストは、CYC Ontology(Cycorp社の製品)のような汎用的オントロジーを用いて、現在の末端ノードの属性部分から候補ノードの主部までの意味的距離の度合い(長さ)を測定する。
(xvii) 候補ノードの主部を現在の末端ノードの属性部分と比較し、関連性のテストは、Gene Ontology(Gene Ontology Consortiumの製品)のような特化したオントロジーを用いて、現在の末端ノードの属性部分から候補ノードの主部までの意味的距離の度合い(長さ)を測定する。
(xviii) 候補ノードの主部を現在の末端ノードの属性部分と比較し、関連性のテストはオントロジーを使用し、このテストのために、Ontology Language(オントロジー言語)(例えばWorld Wide Web Consortiumの製品であるWeb Ontology Language(OWL))を用いてオントロジーにアクセスし、オントロジー中を進む。
(i) 相関方法を継続して、設定時間間隔が経過するまで相関を延長し、この時点で相関方法は、相関の終端に最新に追加したノードをデスティネーションノードとして指定し、これにより更なる相関を中止する。
(ii) 相関方法を継続して、相関が事前設定した特定の度合い(即ち、ノード数で測った「長さ」)を達成するまで相関を延長し、この時点で相関方法は、相関の終端に最新に追加したノードをデスティネーションノードとして指定し、これにより更なる相関を中止する。
(iii) 相関方法を継続して、ノードプール中で利用可能なノードがなくなり相関をさらに延長することができなくなるまで相関を延長し、この時点で相関方法は、相関の終端に最新に追加したノードをデスティネーションノードとして指定し、これにより更なる相関を中止する。
(iv) 相関方法を継続して、事前選択した特定のターゲットノードまたは事前指定した項目を主部に有するターゲットノードが相関に追加されるまで相関を延長し、この時点でイベントの成功を宣言して相関を中止する。本実施例では、事前選択したノードまたは事前指定した項目を有するノードを相関に関連付けることができず、かつノードプール中のすべてのノードを検査し尽した場合には、失敗を宣言して相関を中止する。
(v) 相関方法は、試行相関の回数を、事前設定した試行相関の制限(回数)と比較し、この制限に達すれば相関を中止する。
(vi) 相関方法は、現在の相関の経過時間を事前設定した時間制限と比較し、この時間制限に達すれば相関を中止する。
(a) 最初の通過路では、次のことのみ行う:
a.原点ノードから開始し、
b.原点ノードと良好に関連する候補ノード毎に、
c.新たな試行相関(パス)を開始する;
(b) これに続くすべての通過路については、
a.試行相関パス毎に、
i 現在の試行相関パスが対象の試行である;
ii パスの末端(最も右)のノードが対象のノードとなる;
iii ノードプール中の、対象のノードと関連付けることのできる候補ノードを検索し、これにより、試行相関を度合い1だけ延長する;
iv 対象のノードに関連付けることのできるノードを見出した場合に、このノードを試行相関パスに追加する。こうしたノードの使用は排他的でない;
v 試行相関パスに追加されたノードをターゲットまたはデスティネーションノードに指定した場合には、次のことを行う:
1.この試行を相関と称する;
2.この相関をパスの振れから取り除く;
3.この相関を成功の相関として別個に記憶する;
4.相関方法は成功を宣言する;
5.次の試行相関パスが対象の試行となる;
vi 対象のノードに関連付けることのできるノードを2つ以上見出すことのできる場合には;
vii こうしたノード毎に;
viii 現在のパスを複製し、当該ノードによって延長する;
ix 現在の対象のノードに関連付けるべき候補ノードを見出すことができない場合には;
x 対象の経路を棄却する;
b.すべての試行相関パスについてステップ”a.”を実行する;
(c) 相関を中止するまで、ステップ(b)を逐次的な通過路として実行する;
(d) 成功の相関が構成されなかった場合には、相関方法は失敗を宣言する。
(a) 次の1つ以上をトラバース(検索)する:
(vii) コンピュータファイルシステム
(viii) インターネットを含むコンピュータネットワーク
(ix) リレーショナル・データベース
(x) 分類
(xi) オントロジー
(b) 第1の対象の項目または語句についての情報の実際及び潜在的なソースを識別する。
(c) そして、第2の独立した検索を実行して、第2の対象の項目または語句についての情報の実際及び潜在的なソースを識別する。
(d) いずれかの検索において発見された情報の実際及び潜在的なソースのすべてに、関連性についてのテストを適用する。
(e) 上記両方の検索において発見されたリソースをノードに分解する。
(f) そしてノードプールに追加する。
(g) 第1の項目または語句を明示的に含むノードプール中のノードを原点ノードとして用いる。
(h) 第2の対象の項目または語句を明示的に含む有資格メンバーの項目ノードが、少なくとも1つの成功の相関におけるパスの現在の末端に関連付けられて追加され、デスティネーションノードとして指定された際に、相関が成功であることを宣言する。
(i) 相関中に既にある二重のノード;
(ii) 相関中に既にあるノード中の二重の主部;
(iii) 抑制されたノード;
(i) 完成した相関を図形的に表示する。
(ii) 完成した相関を図形的に表示する、完成した相関の提示であって、提示用の図形的構造はメニューツリーの構造である。
(iii) 完成した相関を図形的に表示する、完成した相関の提示であって、提示用の図形的構造はグラフの構造である。
(iv) 完成した相関を図形的に表示する、完成した相関の提示であって、提示用の図形的構造はテーブル(表)の構造である。
Claims (36)
- 知識を識別する方法において:
a.追加的な知識のために検討する1つ以上の項目を入力するステップと;
b.1つ以上の情報のソースを検索して、前記項目についての情報または前記項目に関連する情報を含むリソースを識別するステップと;
c.検索中に識別したリソースをノードに分解するステップと;
d.前記ノードをノードプールに格納するステップと;
e.前記ノードプールから、知識を表現するノードの相関を構成するステップと
を具えていることを特徴とする知識識別方法。 - 前記入力するステップが、
a.1つ以上の項目をコマンドライン中にキーで打ち込むステップ;または、
b.1つ以上の項目をグラフィカル・ユーザインタフェース中に入力するステップ;または、
c.概念の自然言語記述を入力するステップ
のうちいずれか1つのステップを具えていることを特徴とする請求項1に記載の方法。 - 前記概念の自然言語記述を入力するステップが、前記自然言語記述を構文解析して、追加的な知識のために検討するトークンにする追加的ステップを具えていることを特徴とする請求項2に記載の方法。
- 前記検索するステップが、次のステップ:
a.パーソナルコンピュータ上のファイルを検索するステップ;
b.ネットワーク上の1つ以上のコンピュータを検索するステップ;
c.ネットワークサーバー上のファイルを検索するステップ
の少なくとも1つから成ることを特徴とする請求項1に記載の方法。 - 前記ファイルを、テキストを含むファイルに変換することを特徴とする請求項4に記載の方法。
- 前記検索するステップが、1つ以上のスパイダーを用いてファイルを調べるステップから成ることを特徴とする請求項4に記載の方法。
- 前記スパイダーが、検索を促進するための他のスパイダーを複製することを特徴とする請求項6に記載の方法。
- 前記1つ以上のスパイダーの少なくとも1つが、リソースの前記項目への関連性についての情報を獲得することを特徴とする請求項6に記載の方法。
- 前記1つ以上のスパイダーの少なくとも1つが、メタクローラを具えていることを特徴とする請求項6に記載の方法。
- 前記1つ以上の情報のソースが:
a.ファイルシステム;
b.ワールドワイド・ウェブ;
c.e−メール・リポジトリ;
d.e−メール・リポジトリ中のe−メールの添付ファイル;
e.リレーショナル・データベース管理システム;
f.データ・ウェアハウス;
g.分類;
h.オントロジー;
i.意味ネットワーク;
j.ニューラルネット
k.検索エンジン、及び
l.インデックスエンジン
の少なくとも1つを含むことを特徴とする請求項1に記載の方法。 - 前記1つ以上の情報のソースを検索して、前記項目についての情報または前記項目に関連する情報を含むリソースを識別するステップが、
a.ファイル名;
b.文書の題目;
c.文書の要約;
d.文書の全文;
e.ノードのプール
の少なくとも1つを検索することを含むことを特徴とする請求項1に記載の方法。 - 前記リソースが:
a.ポータブル・ドキュメント・フォーマット(PDF)ファイル;
b.リッチテキスト(RTF)ファイル;
c.ワードプロセッサのファイル;
d.マイクロソフト・パワーポイント(登録商標)(PPT)ファイル;
e.ハイパーテキスト・マークアップ・ランゲージ(HTML)ファイル;
f.e−メールを含むファイル;
g.e−メールの添付ファイルを含むファイル
の1つ以上であることを特徴とする請求項1に記載の方法。 - 前記項目についての情報を含むリソースを識別するステップが、
a.情報のソースの内容と前記検討する項目との正確な一致を見出すこと;
b.前記検討する項目の単数形または複数形を、ソースの内容中に見出すこと;
c.前記検討する項目の同義語を、ソースの内容中に見出すこと;
d.前記検討する項目の辞書における定義に含まれる項目を、ソースの内容中に見出すこと;
e.前記検討する項目の、権威的ソースにおける説明に含まれる項目を、ソースの内容中に見出すこと;
f.前記検討する項目を説明する百科事典中の見出しに含まれる項目を、ソースの内容中に見出すこと;
g.前記検討する項目に非常に近い項目を、分類、オントロジー、または意味ネットワークを用いて、ソースの内容中に見出すこと;
の少なくとも1つを含むことを特徴とする請求項11に記載の方法。 - ノードが、第1関係項、結合部、及び第2関係項の各部分から成るデータ構造を具えていることを特徴とする請求項1に記載の方法。
- 前記ノードが追加的に、ソースまたはシーケンスのエントリを具えていることを特徴とする請求項14に記載の方法。
- 前記項目についての情報を含むリソースをノードに分解するステップが、テキストを構文解析して言語単位にすることを含むことを特徴とする請求項14に記載の方法。
- 前記言語単位がXMLの文であることを特徴とする請求項16に記載の方法。
- XMLヘッダを棄却することを特徴とする請求項17に記載の方法。
- 前記言語単位が文であることを特徴とする請求項16に記載の方法。
- 前記リソースを分解するステップが、自然言語パーサーを用いて言語単位を解析することを含むことを特徴とする請求項16に記載の方法。
- 前記自然言語パーサーは、言語単位を言語の単語またはトークンに分離して、各単語またはトークンにカテゴリを割り当てることを特徴とする請求項20に記載の方法。
- 前記自然言語パーサーは、言語における単語またはトークンを組み立てるに当たり使用を許されない文字を棄却することを特徴とする請求項21に記載の方法。
- 前記単語またはトークンを、当該単語またはトークンに割り当てられたカテゴリに基づいて、1つ以上の前記ノードのデータ構造の前記部分中に置くことを特徴とする請求項21に記載の方法。
- 前記ノードのデータ構造をノードプールに格納することを特徴とする請求項23に記載の方法。
- 前記ノードプールが、前記ノードにおける1つ以上の前記部分の内容に基づく個別のノードの選択及び検索を可能にすることを特徴とする請求項24に記載の方法。
- 前記ノードプールが、ハッシュマップを用いた選択及び検索を可能にすることを特徴とする請求項25に記載の方法。
- 前記ノードプールがデータベースであることを特徴とする請求項25に記載の方法。
- 前記項目についての知識を表現する前記ノードの相関を、前記ノードプールからのノードをリンクすることによって構成することを特徴とする請求項1に記載の方法。
- 前記ノードをリンクして、ノードのチェーンを1つ以上作ることを特徴とする請求項28に記載の方法。
- 前記ノードのチェーンが、対象の項目を明示的に含む原点ノードから始まることを特徴とする請求項29に記載の方法。
- 前記原点ノード、または前記原点ノードから始まる前記ノードのチェーンの終端にある末端ノードの前記第2関係項が、候補ノードの関係項との関連性を有する際に、前記候補ノードを、前記原点ノードまたは前記末端ノードに追加することを特徴とする請求項30に記載の方法。
- 前記関連性についてのテストが、
a.前記候補ノードの関係項と前記原点ノードまたは前記末端ノードの前記第2関係項との正確な一致を見出すこと;
b.前記候補ノードの関係項の単数形または複数形と、前記原点ノードまたは前記末端ノードの前記第2関係項との一致を見出すこと;
c.前記候補ノードの関係項と、前記原点ノードまたは前記末端ノードの前記第2関係項との一致を見出すこと;
d.前記候補ノードの関係項の辞書における定義に含まれる重要項目と、前記原点ノードまたは前記末端ノードの前記第2関係項との一致を見出すこと;
e.前記候補ノードの関係項の、権威的ソースにおける説明中に含まれる重要項目と、前記原点ノードまたは前記末端ノードの前記第2関係項との一致を見出すこと;
f.前記候補ノードの関係項を説明する百科事典中の見出しに含まれる重要項目と、前記原点ノードまたは前記末端ノードの前記第2関係項との一致を見出すこと;
g.前記原点ノードまたは前記末端ノードの前記第2関係項と一致する、前記候補ノードの関係項に非常に近い項目を、分類、オントロジー、または意味ネットワークを用いて見出すこと;
の1つ以上を含むことを特徴とする請求項31に記載の方法。 - a.ユーザが前記相関を中止させること;
b.設定時間が満了すること;
c.前記チェーンが、指定数より大きい数のノードを具えること;
d.前記チェーンの前記原点ノードまたは前記末端ノードに関連付けることのできるノードが、前記ノードプール中からなくなること;
e.ターゲットノードから事前選択した項目が、前記相関に追加されること;
f.事前選択したターゲットノードが、前記相関に追加されること
の1つが生じるまで、前記候補ノードを追加して前記チェーンを形成することを特徴とする請求項31に記載の方法。 - a.メモリー媒体と;
b.前記メモリー媒体上に記憶され、コンピュータを制御して:
b1.追加的な知識のために検討する1つ以上の項目を入力する機能と;
b2.1つ以上の情報のソースを検索して、前記についての情報または前記項目に関連する情報を含むリソースを識別する機能と;
b3.前記検索中に識別した前記リソースをノードに分解する機能と;
b4.前記ノードをノードプールに格納する機能と;
b5.前記ノードプールから、知識を表現するノードの相関を構成する機能と
を実行するプログラミング文と
を具えていることを特徴とするコンピュータプログラム製品。 - a.追加的な知識のために検討する1つ以上の項目を入力する入力メカニズムと;
b.1つ以上の情報のソースを検索して、前記項目についての情報または前記項目に関連する情報を含むリソースを識別する検索メカニズムと;
c.検索中に識別した前記リソースをノードに分解する解析メカニズムと;
d.前記ノードをノードプールに格納する格納メカニズムと;
e.前記ノードプールから、知識を表現するノードの相関を構成する相関メカニズムと
を具えていることを特徴とする知識識別装置。 - a.ネットワークと;
b.前記ネットワークに接続された1つ以上のコンピュータとを具え、
c.前記ネットワークに接続された前記コンピュータの少なくとも1つが:
c1.追加的な知識のために検討する1つ以上の項目を入力する入力メカニズムと;
c2.1つ以上の情報のソースを検索して、前記項目についての情報または前記項目に関連する情報を含むリソースを識別する検索メカニズムと;
c3.検索中に識別した前記リソースをノードに分解する解析メカニズムと;
c4.前記ノードをノードプールに格納する格納メカニズムと;
c5.前記ノードプールから、知識を表現するノードの相関を構成する相関メカニズムと
を具えていることを特徴とするシステム。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US62777204P | 2004-11-12 | 2004-11-12 | |
US63793504P | 2004-12-21 | 2004-12-21 | |
US69433105P | 2005-06-27 | 2005-06-27 | |
PCT/US2005/041233 WO2006053306A2 (en) | 2004-11-12 | 2005-11-14 | Knowledge discovery by constructing correlations using concepts or terms |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008538016A true JP2008538016A (ja) | 2008-10-02 |
Family
ID=36337305
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007541415A Pending JP2008538016A (ja) | 2004-11-12 | 2005-11-14 | 概念または項目を用いて知識相関を構成することによる知識発見技術 |
Country Status (5)
Country | Link |
---|---|
US (3) | US8108389B2 (ja) |
EP (1) | EP1825355A4 (ja) |
JP (1) | JP2008538016A (ja) |
CN (1) | CN101124537B (ja) |
WO (1) | WO2006053306A2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008065543A (ja) * | 2006-09-06 | 2008-03-21 | Toshiba Corp | 構造化文書検索装置及び構造化文書検索方法 |
JP2008225997A (ja) * | 2007-03-14 | 2008-09-25 | Nippon Telegr & Teleph Corp <Ntt> | メタデータ管理方法、メタデータ管理システム、及び、メタデータ管理プログラム |
JP2009528581A (ja) * | 2005-11-14 | 2009-08-06 | メイク センス インコーポレイテッド | 知識相関サーチエンジン |
JP2012511773A (ja) * | 2008-12-10 | 2012-05-24 | アリババ・グループ・ホールディング・リミテッド | 効率的なデータ同期化のための方法及びシステム |
KR20160088579A (ko) * | 2015-01-16 | 2016-07-26 | 한국과학기술정보연구원 | 에너지 관련 기술 분류 프레임 구축 시스템 및 방법 |
JP2017215999A (ja) * | 2011-09-07 | 2017-12-07 | マイクロソフト テクノロジー ライセンシング,エルエルシー | 変換コンテンツ・アウェア・データー・ソース管理 |
Families Citing this family (87)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7013308B1 (en) | 2000-11-28 | 2006-03-14 | Semscript Ltd. | Knowledge storage and retrieval system and method |
US8108389B2 (en) | 2004-11-12 | 2012-01-31 | Make Sence, Inc. | Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms |
US9330175B2 (en) | 2004-11-12 | 2016-05-03 | Make Sence, Inc. | Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms |
US8126890B2 (en) * | 2004-12-21 | 2012-02-28 | Make Sence, Inc. | Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms |
JP4797380B2 (ja) * | 2004-12-28 | 2011-10-19 | コニカミノルタホールディングス株式会社 | 医療支援システム |
US7849090B2 (en) * | 2005-03-30 | 2010-12-07 | Primal Fusion Inc. | System, method and computer program for faceted classification synthesis |
US8898134B2 (en) | 2005-06-27 | 2014-11-25 | Make Sence, Inc. | Method for ranking resources using node pool |
US8140559B2 (en) | 2005-06-27 | 2012-03-20 | Make Sence, Inc. | Knowledge correlation search engine |
US8666928B2 (en) | 2005-08-01 | 2014-03-04 | Evi Technologies Limited | Knowledge repository |
US8024653B2 (en) | 2005-11-14 | 2011-09-20 | Make Sence, Inc. | Techniques for creating computer generated notes |
US7941433B2 (en) | 2006-01-20 | 2011-05-10 | Glenbrook Associates, Inc. | System and method for managing context-rich database |
WO2008153566A1 (en) | 2007-06-12 | 2008-12-18 | Make Sence, Inc | Techniques for creating computer generated notes |
EP2035962A4 (en) * | 2006-06-12 | 2009-11-04 | Make Sence Inc | METHOD OF GENERATING COMPUTER MANUFACTURER NOTES |
US7761395B2 (en) * | 2006-08-28 | 2010-07-20 | Oracle America, Inc. | System and method for scalable processing of collected knowledge by creating knowledge generation nodes |
US8140493B2 (en) * | 2007-06-15 | 2012-03-20 | Oracle International Corporation | Changing metadata without invalidating cursors |
US20080313167A1 (en) * | 2007-06-15 | 2008-12-18 | Jim Anderson | System And Method For Intelligently Indexing Internet Resources |
US8356014B2 (en) * | 2007-06-15 | 2013-01-15 | Oracle International Corporation | Referring to partitions with for (values) clause |
US8135688B2 (en) * | 2007-06-15 | 2012-03-13 | Oracle International Corporation | Partition/table allocation on demand |
US8209294B2 (en) * | 2007-06-15 | 2012-06-26 | Oracle International Corporation | Dynamic creation of database partitions |
US8209214B2 (en) | 2007-06-26 | 2012-06-26 | Richrelevance, Inc. | System and method for providing targeted content |
US8612972B2 (en) | 2007-06-27 | 2013-12-17 | Microsoft Corporation | Running add-on components in virtual environments |
US8862590B2 (en) * | 2007-06-29 | 2014-10-14 | Microsoft Corporation | Flexible namespace prioritization |
JP2009025968A (ja) * | 2007-07-18 | 2009-02-05 | Fujifilm Corp | 関連語辞書作成装置、方法、及びプログラム、並びにコンテンツ検索装置 |
US8838659B2 (en) * | 2007-10-04 | 2014-09-16 | Amazon Technologies, Inc. | Enhanced knowledge repository |
WO2009068072A1 (en) * | 2007-11-30 | 2009-06-04 | Kinkadee Systems Gmbh | Scalable associative text mining network and method |
US20090187581A1 (en) * | 2008-01-22 | 2009-07-23 | Vincent Delisle | Consolidation and association of structured and unstructured data on a computer file system |
US8296279B1 (en) * | 2008-06-03 | 2012-10-23 | Google Inc. | Identifying results through substring searching |
US8745018B1 (en) | 2008-07-10 | 2014-06-03 | Google Inc. | Search application and web browser interaction |
US20140142920A1 (en) * | 2008-08-13 | 2014-05-22 | International Business Machines Corporation | Method and apparatus for Utilizing Structural Information in Semi-Structured Documents to Generate Candidates for Question Answering Systems |
EP2329406A1 (en) * | 2008-08-29 | 2011-06-08 | Primal Fusion Inc. | Systems and methods for semantic concept definition and semantic concept relationship synthesis utilizing existing domain definitions |
WO2010031081A2 (en) * | 2008-09-15 | 2010-03-18 | Erik Thomsen | Extracting semantics from data |
US9805089B2 (en) | 2009-02-10 | 2017-10-31 | Amazon Technologies, Inc. | Local business and product search system and method |
US8392896B2 (en) * | 2009-03-06 | 2013-03-05 | Microsoft Corporation | Software test bed generation |
WO2010148127A2 (en) | 2009-06-16 | 2010-12-23 | Medicomp Systems, Inc. | Caregiver interface for electronic medical records |
US20120221589A1 (en) * | 2009-08-25 | 2012-08-30 | Yuval Shahar | Method and system for selecting, retrieving, visualizing and exploring time-oriented data in multiple subject records |
US9355402B2 (en) * | 2009-09-15 | 2016-05-31 | International Business Machines Corporation | System, method and computer program product for improving messages content using user'S tagging feedback |
US8700652B2 (en) * | 2009-12-15 | 2014-04-15 | Ebay, Inc. | Systems and methods to generate and utilize a synonym dictionary |
US20110154376A1 (en) * | 2009-12-17 | 2011-06-23 | Microsoft Corporation | Use of Web Services API to Identify Responsive Content Items |
WO2011081096A1 (ja) * | 2009-12-28 | 2011-07-07 | 楽天株式会社 | 情報検索装置、件数決定方法、情報検索プログラム、情報検索システム及び記録媒体 |
US20110173236A1 (en) * | 2010-01-13 | 2011-07-14 | E-Profile | Method and system for generating a virtual profile of an entity |
US8543381B2 (en) | 2010-01-25 | 2013-09-24 | Holovisions LLC | Morphing text by splicing end-compatible segments |
US8868569B2 (en) * | 2010-02-24 | 2014-10-21 | Yahoo! Inc. | Methods for detecting and removing duplicates in video search results |
US8694304B2 (en) | 2010-03-26 | 2014-04-08 | Virtuoz Sa | Semantic clustering and user interfaces |
US9378202B2 (en) | 2010-03-26 | 2016-06-28 | Virtuoz Sa | Semantic clustering |
US8935339B2 (en) | 2010-04-28 | 2015-01-13 | Microsoft Corporation | News feed techniques |
US9110882B2 (en) | 2010-05-14 | 2015-08-18 | Amazon Technologies, Inc. | Extracting structured knowledge from unstructured text |
US9177057B2 (en) * | 2010-06-08 | 2015-11-03 | Microsoft Technology Licensing, Llc | Re-ranking search results based on lexical and ontological concepts |
US11068657B2 (en) * | 2010-06-28 | 2021-07-20 | Skyscanner Limited | Natural language question answering system and method based on deep semantics |
US8655805B2 (en) * | 2010-08-30 | 2014-02-18 | International Business Machines Corporation | Method for classification of objects in a graph data stream |
US9524291B2 (en) * | 2010-10-06 | 2016-12-20 | Virtuoz Sa | Visual display of semantic information |
US10185477B1 (en) | 2013-03-15 | 2019-01-22 | Narrative Science Inc. | Method and system for configuring automatic generation of narratives from data |
EP2678785A4 (en) * | 2011-02-24 | 2016-08-17 | Ericsson Telefon Ab L M | METHOD AND SERVER FOR CLASSIFYING MULTIMEDIA DATA |
US8996359B2 (en) * | 2011-05-18 | 2015-03-31 | Dw Associates, Llc | Taxonomy and application of language analysis and processing |
US9335885B1 (en) | 2011-10-01 | 2016-05-10 | BioFortis, Inc. | Generating user interface for viewing data records |
US10319466B2 (en) * | 2012-02-20 | 2019-06-11 | Medicomp Systems, Inc | Intelligent filtering of health-related information |
US9519631B2 (en) * | 2012-03-30 | 2016-12-13 | Microsoft Technology Licensing, Llc | Semantic diff and automerge |
US8938412B2 (en) * | 2012-05-04 | 2015-01-20 | Infotech Soft, Inc. | Resource community topic modeling with spreading activation |
CN103389988A (zh) * | 2012-05-10 | 2013-11-13 | 腾讯科技(深圳)有限公司 | 一种引导用户进行信息搜索的方法及装置 |
CN103049532A (zh) * | 2012-12-21 | 2013-04-17 | 东莞中国科学院云计算产业技术创新与育成中心 | 基于突发事件应急管理的知识库引擎构建及其查询方法 |
US10430906B2 (en) | 2013-03-15 | 2019-10-01 | Medicomp Systems, Inc. | Filtering medical information |
US11837340B2 (en) | 2013-03-15 | 2023-12-05 | Medicomp Systems, Inc. | Electronic medical records system utilizing genetic information |
WO2014144490A1 (en) | 2013-03-15 | 2014-09-18 | Mark Bobick | Method for resource decomposition and related devices |
US9342854B2 (en) * | 2013-05-08 | 2016-05-17 | Yahoo! Inc. | Identifying communities within a social network based on information propagation data |
WO2014188290A2 (en) * | 2013-05-23 | 2014-11-27 | Koninklijke Philips N.V. | Fast and secure retrieval of dna sequences |
US9959285B2 (en) | 2014-08-08 | 2018-05-01 | International Business Machines Corporation | Restricting sensitive query results in information management platforms |
US20160092595A1 (en) * | 2014-09-30 | 2016-03-31 | Alcatel-Lucent Usa Inc. | Systems And Methods For Processing Graphs |
US9715488B2 (en) | 2014-10-06 | 2017-07-25 | International Business Machines Corporation | Natural language processing utilizing transaction based knowledge representation |
US11475076B2 (en) | 2014-10-22 | 2022-10-18 | Narrative Science Inc. | Interactive and conversational data exploration |
US9912553B1 (en) * | 2015-06-08 | 2018-03-06 | Parallels IP Holdings GmbH | Method for provisioning domain model of applications resources using semantic analysis of links |
US20170060831A1 (en) * | 2015-08-26 | 2017-03-02 | International Business Machines Corporation | Deriving Logical Justification in an Extensible Logical Reasoning System |
WO2018004556A1 (en) * | 2016-06-29 | 2018-01-04 | Intel Corporation | Natural language indexer for virtual assistants |
US10891326B2 (en) * | 2017-01-05 | 2021-01-12 | International Business Machines Corporation | Representation of a data analysis using a flow graph |
US11568148B1 (en) | 2017-02-17 | 2023-01-31 | Narrative Science Inc. | Applied artificial intelligence technology for narrative generation based on explanation communication goals |
US11954445B2 (en) | 2017-02-17 | 2024-04-09 | Narrative Science Llc | Applied artificial intelligence technology for narrative generation based on explanation communication goals |
US10943069B1 (en) | 2017-02-17 | 2021-03-09 | Narrative Science Inc. | Applied artificial intelligence technology for narrative generation based on a conditional outcome framework |
US10333868B2 (en) * | 2017-04-14 | 2019-06-25 | Facebook, Inc. | Techniques to automate bot creation for web pages |
US20180316637A1 (en) * | 2017-05-01 | 2018-11-01 | Microsoft Technology Licensing, Llc | Conversation lens for context |
US10229195B2 (en) | 2017-06-22 | 2019-03-12 | International Business Machines Corporation | Relation extraction using co-training with distant supervision |
US10223639B2 (en) | 2017-06-22 | 2019-03-05 | International Business Machines Corporation | Relation extraction using co-training with distant supervision |
CN107491554B (zh) * | 2017-09-01 | 2018-12-04 | 北京神州泰岳软件股份有限公司 | 文本分类器的构建方法、构建装置及文本分类方法 |
US11561986B1 (en) | 2018-01-17 | 2023-01-24 | Narrative Science Inc. | Applied artificial intelligence technology for narrative generation using an invocable analysis service |
US11030408B1 (en) | 2018-02-19 | 2021-06-08 | Narrative Science Inc. | Applied artificial intelligence technology for conversational inferencing using named entity reduction |
US11361076B2 (en) * | 2018-10-26 | 2022-06-14 | ThreatWatch Inc. | Vulnerability-detection crawler |
US10990767B1 (en) * | 2019-01-28 | 2021-04-27 | Narrative Science Inc. | Applied artificial intelligence technology for adaptive natural language understanding |
CN111797631A (zh) * | 2019-04-04 | 2020-10-20 | 北京猎户星空科技有限公司 | 信息处理方法、装置及电子设备 |
US20200341977A1 (en) * | 2019-04-25 | 2020-10-29 | Mycelebs Co., Ltd. | Method and apparatus for managing attribute language |
CN111178771B (zh) * | 2019-12-31 | 2022-03-29 | 中国石油天然气股份有限公司 | 体系构建方法和装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0644074A (ja) * | 1991-09-06 | 1994-02-18 | Hitachi Ltd | 知識ベースおよび推論方法および説明文生成方法 |
JP2001282811A (ja) * | 2000-03-29 | 2001-10-12 | Computer Consultant Kk | 知識データ検索装置、知識データ検索方法及び知識データを検索するプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2002259429A (ja) * | 2001-01-17 | 2002-09-13 | Internatl Business Mach Corp <Ibm> | コンピュータベースの適合テキスト検索システムおよび方法 |
JP2003228580A (ja) * | 2002-02-04 | 2003-08-15 | Celestar Lexico-Sciences Inc | 文献知識管理装置、文献知識管理方法、プログラム、および、記録媒体 |
US20030163302A1 (en) * | 2002-02-27 | 2003-08-28 | Hongfeng Yin | Method and system of knowledge based search engine using text mining |
Family Cites Families (78)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3446286A1 (de) | 1984-12-19 | 1986-06-19 | Sigri GmbH, 8901 Meitingen | Verfahren zum beschichten von kohlenstoff- und graphitkoerpern |
US4930077A (en) * | 1987-04-06 | 1990-05-29 | Fan David P | Information processing expert system for text analysis and predicting public opinion based information available to the public |
JPH04252375A (ja) | 1991-01-28 | 1992-09-08 | Nippon Telegr & Teleph Corp <Ntt> | 情報提供方法 |
US5632480A (en) * | 1994-11-14 | 1997-05-27 | Huffy Corporation | Basketball goal support having removable ballast and continuously adjustable pole |
US5432118A (en) | 1994-06-28 | 1995-07-11 | Motorola, Inc. | Process for forming field isolation |
JP2855409B2 (ja) * | 1994-11-17 | 1999-02-10 | 日本アイ・ビー・エム株式会社 | 自然言語処理方法及びシステム |
US5684985A (en) | 1994-12-15 | 1997-11-04 | Ufil Unified Data Technologies Ltd. | Method and apparatus utilizing bond identifiers executed upon accessing of an endo-dynamic information node (EDIN) |
GB2297179B (en) * | 1995-01-17 | 1997-01-08 | Nippon Telegraph & Telephone | Information navigation system using clusterized information resource topology |
US5963940A (en) * | 1995-08-16 | 1999-10-05 | Syracuse University | Natural language information retrieval system and method |
US5987460A (en) * | 1996-07-05 | 1999-11-16 | Hitachi, Ltd. | Document retrieval-assisting method and system for the same and document retrieval service using the same with document frequency and term frequency |
JP3981170B2 (ja) | 1996-10-22 | 2007-09-26 | 富士通株式会社 | 情報検索装置 |
US6505150B2 (en) * | 1997-07-02 | 2003-01-07 | Xerox Corporation | Article and method of automatically filtering information retrieval results using test genre |
US6529934B1 (en) * | 1998-05-06 | 2003-03-04 | Kabushiki Kaisha Toshiba | Information processing system and method for same |
ATE300834T1 (de) * | 1998-05-07 | 2005-08-15 | Samsung Electronics Co Ltd | Verfahren und vorrichtung für universellen zugriffsbefehl und kontrollinformation in einem netzwerk |
US6141010A (en) | 1998-07-17 | 2000-10-31 | B. E. Technology, Llc | Computer interface method and apparatus with targeted advertising |
GB9821969D0 (en) | 1998-10-08 | 1998-12-02 | Canon Kk | Apparatus and method for processing natural language |
CA2366057C (en) * | 1999-03-05 | 2009-03-24 | Canon Kabushiki Kaisha | Database annotation and retrieval |
US6836768B1 (en) | 1999-04-27 | 2004-12-28 | Surfnotes | Method and apparatus for improved information representation |
JP2001043221A (ja) * | 1999-07-29 | 2001-02-16 | Matsushita Electric Ind Co Ltd | 中国語単語分割装置 |
US6278987B1 (en) * | 1999-07-30 | 2001-08-21 | Unisys Corporation | Data processing method for a semiotic decision making system used for responding to natural language queries and other purposes |
US6615253B1 (en) | 1999-08-31 | 2003-09-02 | Accenture Llp | Efficient server side data retrieval for execution of client side applications |
CA2360571A1 (en) * | 1999-11-16 | 2001-05-25 | 01,Inc. | Method and system for executing financial transactions via a communication medium |
JP4320491B2 (ja) * | 1999-11-18 | 2009-08-26 | ソニー株式会社 | 文書処理システム、端末装置、文書提供装置、文書処理方法、記録媒体 |
US6366907B1 (en) | 1999-12-15 | 2002-04-02 | Napster, Inc. | Real-time search engine |
CN1411586A (zh) * | 2000-03-06 | 2003-04-16 | 埃阿凯福斯公司 | 包括指定文档位置处字的多个译码的用于创建扫描文档搜索字索引的系统和方法 |
AU2001239950B2 (en) | 2000-03-08 | 2005-03-10 | Accenture Global Services Limited | Method for a knowledge model |
US6941513B2 (en) * | 2000-06-15 | 2005-09-06 | Cognisphere, Inc. | System and method for text structuring and text generation |
WO2002001401A1 (en) * | 2000-06-26 | 2002-01-03 | Onerealm Inc. | Method and apparatus for normalizing and converting structured content |
US8396859B2 (en) | 2000-06-26 | 2013-03-12 | Oracle International Corporation | Subject matter context search engine |
US7865358B2 (en) * | 2000-06-26 | 2011-01-04 | Oracle International Corporation | Multi-user functionality for converting data from a first form to a second form |
US6618717B1 (en) | 2000-07-31 | 2003-09-09 | Eliyon Technologies Corporation | Computer method and apparatus for determining content owner of a website |
US6766320B1 (en) | 2000-08-24 | 2004-07-20 | Microsoft Corporation | Search engine with natural language-based robust parsing for user query and relevance feedback learning |
US20020152202A1 (en) * | 2000-08-30 | 2002-10-17 | Perro David J. | Method and system for retrieving information using natural language queries |
US7752214B2 (en) | 2000-09-01 | 2010-07-06 | Op40, Inc. | Extended environment data structure for distributed digital assets over a multi-tier computer network |
US20020059220A1 (en) * | 2000-10-16 | 2002-05-16 | Little Edwin Colby | Intelligent computerized search engine |
US20020083170A1 (en) * | 2000-10-26 | 2002-06-27 | Metilinx | System-wide optimization integration model |
US8176563B2 (en) * | 2000-11-13 | 2012-05-08 | DigitalDoors, Inc. | Data security system and method with editor |
US20030028564A1 (en) | 2000-12-19 | 2003-02-06 | Lingomotors, Inc. | Natural language method and system for matching and ranking documents in terms of semantic relatedness |
US7644057B2 (en) * | 2001-01-03 | 2010-01-05 | International Business Machines Corporation | System and method for electronic communication management |
WO2002063493A1 (en) * | 2001-02-08 | 2002-08-15 | 2028, Inc. | Methods and systems for automated semantic knowledge leveraging graph theoretic analysis and the inherent structure of communication |
US20040030741A1 (en) * | 2001-04-02 | 2004-02-12 | Wolton Richard Ernest | Method and apparatus for search, visual navigation, analysis and retrieval of information from networks with remote notification and content delivery |
US6654740B2 (en) | 2001-05-08 | 2003-11-25 | Sunflare Co., Ltd. | Probabilistic information retrieval based on differential latent semantic space |
US6633742B1 (en) | 2001-05-15 | 2003-10-14 | Siemens Medical Solutions Usa, Inc. | System and method for adaptive knowledge access and presentation |
AU2002321795A1 (en) | 2001-07-27 | 2003-02-17 | Quigo Technologies Inc. | System and method for automated tracking and analysis of document usage |
US7284191B2 (en) | 2001-08-13 | 2007-10-16 | Xerox Corporation | Meta-document management system with document identifiers |
US7526425B2 (en) | 2001-08-14 | 2009-04-28 | Evri Inc. | Method and system for extending keyword searching to syntactically and semantically annotated data |
NO316480B1 (no) | 2001-11-15 | 2004-01-26 | Forinnova As | Fremgangsmåte og system for tekstuell granskning og oppdagelse |
US7072883B2 (en) | 2001-12-21 | 2006-07-04 | Ut-Battelle Llc | System for gathering and summarizing internet information |
US6978264B2 (en) * | 2002-01-03 | 2005-12-20 | Microsoft Corporation | System and method for performing a search and a browse on a query |
EP1473639A1 (en) * | 2002-02-04 | 2004-11-03 | Celestar Lexico-Sciences, Inc. | Document knowledge management apparatus and method |
US7249117B2 (en) * | 2002-05-22 | 2007-07-24 | Estes Timothy W | Knowledge discovery agent system and method |
JP3960530B2 (ja) | 2002-06-19 | 2007-08-15 | 株式会社日立製作所 | テキストマイニングプログラム、方法、及び装置 |
US7277879B2 (en) | 2002-12-17 | 2007-10-02 | Electronic Data Systems Corporation | Concept navigation in data storage systems |
US20040123233A1 (en) * | 2002-12-23 | 2004-06-24 | Cleary Daniel Joseph | System and method for automatic tagging of ducuments |
US7174507B2 (en) | 2003-02-10 | 2007-02-06 | Kaidara S.A. | System method and computer program product for obtaining structured data from text |
JP4001283B2 (ja) * | 2003-02-12 | 2007-10-31 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 形態素解析装置および自然言語処理装置 |
US7730407B2 (en) | 2003-02-28 | 2010-06-01 | Fuji Xerox Co., Ltd. | Systems and methods for bookmarking live and recorded multimedia documents |
JP2004280488A (ja) * | 2003-03-17 | 2004-10-07 | Hitachi Ltd | 文書管理方法及び文書管理装置 |
US20040193520A1 (en) * | 2003-03-27 | 2004-09-30 | Lacomb Christina | Automated understanding and decomposition of table-structured electronic documents |
JP2004310691A (ja) * | 2003-04-10 | 2004-11-04 | Mitsubishi Electric Corp | 文章情報処理装置 |
GB2406399A (en) | 2003-09-23 | 2005-03-30 | Ibm | Seaching within a computer network by entering a search term and optional URI into a web browser |
TWI369616B (en) | 2004-02-27 | 2012-08-01 | Eplus Capital Inc | System and method for user creation and direction of a rich-content life-cycle |
JP4242794B2 (ja) | 2004-03-10 | 2009-03-25 | 日本電信電話株式会社 | メタデータ生成装置 |
US20050234894A1 (en) * | 2004-04-05 | 2005-10-20 | Rene Tenazas | Techniques for maintaining collections of generated web forms that are hyperlinked by subject |
US20050246358A1 (en) | 2004-04-29 | 2005-11-03 | Gross John N | System & method of identifying and predicting innovation dissemination |
US7275049B2 (en) | 2004-06-16 | 2007-09-25 | The Boeing Company | Method for speech-based data retrieval on portable devices |
WO2006038924A2 (en) | 2004-06-18 | 2006-04-13 | Sap Ag | Consistent set of interfaces derived from a business object model |
US20060062470A1 (en) * | 2004-09-22 | 2006-03-23 | Microsoft Corporation | Graphical user interface for expression recognition |
US7599930B1 (en) * | 2004-10-19 | 2009-10-06 | Trovix, Inc. | Concept synonym matching engine |
US8108389B2 (en) | 2004-11-12 | 2012-01-31 | Make Sence, Inc. | Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms |
US8126890B2 (en) | 2004-12-21 | 2012-02-28 | Make Sence, Inc. | Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms |
WO2006057956A2 (en) | 2004-11-23 | 2006-06-01 | Core Relations Development Corporation | Techniques for magazine like presentation of advertisement using computers |
US7447683B2 (en) * | 2005-03-31 | 2008-11-04 | Jiles, Inc. | Natural language based search engine and methods of use therefor |
US20060242130A1 (en) * | 2005-04-23 | 2006-10-26 | Clenova, Llc | Information retrieval using conjunctive search and link discovery |
US8140559B2 (en) | 2005-06-27 | 2012-03-20 | Make Sence, Inc. | Knowledge correlation search engine |
US8024653B2 (en) | 2005-11-14 | 2011-09-20 | Make Sence, Inc. | Techniques for creating computer generated notes |
US8775224B2 (en) | 2006-01-04 | 2014-07-08 | International Business Machines Corporation | Method and apparatus for dynamic specification of a business value by a discovered resource |
US20070192319A1 (en) | 2006-01-27 | 2007-08-16 | William Derek Finley | Search engine application with ranking of results based on correlated data pertaining to the searcher |
-
2005
- 2005-11-14 US US11/273,568 patent/US8108389B2/en active Active
- 2005-11-14 CN CN2005800455345A patent/CN101124537B/zh not_active Expired - Fee Related
- 2005-11-14 WO PCT/US2005/041233 patent/WO2006053306A2/en active Application Filing
- 2005-11-14 JP JP2007541415A patent/JP2008538016A/ja active Pending
- 2005-11-14 EP EP05851627A patent/EP1825355A4/en not_active Ceased
-
2011
- 2011-12-14 US US13/325,368 patent/US9311601B2/en active Active
-
2016
- 2016-04-11 US US15/095,719 patent/US10467297B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0644074A (ja) * | 1991-09-06 | 1994-02-18 | Hitachi Ltd | 知識ベースおよび推論方法および説明文生成方法 |
JP2001282811A (ja) * | 2000-03-29 | 2001-10-12 | Computer Consultant Kk | 知識データ検索装置、知識データ検索方法及び知識データを検索するプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2002259429A (ja) * | 2001-01-17 | 2002-09-13 | Internatl Business Mach Corp <Ibm> | コンピュータベースの適合テキスト検索システムおよび方法 |
JP2003228580A (ja) * | 2002-02-04 | 2003-08-15 | Celestar Lexico-Sciences Inc | 文献知識管理装置、文献知識管理方法、プログラム、および、記録媒体 |
US20030163302A1 (en) * | 2002-02-27 | 2003-08-28 | Hongfeng Yin | Method and system of knowledge based search engine using text mining |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009528581A (ja) * | 2005-11-14 | 2009-08-06 | メイク センス インコーポレイテッド | 知識相関サーチエンジン |
JP4864095B2 (ja) * | 2005-11-14 | 2012-01-25 | メイク センス インコーポレイテッド | 知識相関サーチエンジン |
JP2008065543A (ja) * | 2006-09-06 | 2008-03-21 | Toshiba Corp | 構造化文書検索装置及び構造化文書検索方法 |
JP2008225997A (ja) * | 2007-03-14 | 2008-09-25 | Nippon Telegr & Teleph Corp <Ntt> | メタデータ管理方法、メタデータ管理システム、及び、メタデータ管理プログラム |
JP4689635B2 (ja) * | 2007-03-14 | 2011-05-25 | 日本電信電話株式会社 | メタデータ管理方法、メタデータ管理システム、及び、メタデータ管理プログラム |
JP2012511773A (ja) * | 2008-12-10 | 2012-05-24 | アリババ・グループ・ホールディング・リミテッド | 効率的なデータ同期化のための方法及びシステム |
JP2017215999A (ja) * | 2011-09-07 | 2017-12-07 | マイクロソフト テクノロジー ライセンシング,エルエルシー | 変換コンテンツ・アウェア・データー・ソース管理 |
KR20160088579A (ko) * | 2015-01-16 | 2016-07-26 | 한국과학기술정보연구원 | 에너지 관련 기술 분류 프레임 구축 시스템 및 방법 |
KR101683856B1 (ko) * | 2015-01-16 | 2016-12-09 | 한국과학기술정보연구원 | 에너지 관련 기술 분류 프레임 구축 시스템 및 방법 |
Also Published As
Publication number | Publication date |
---|---|
US8108389B2 (en) | 2012-01-31 |
US20120117053A1 (en) | 2012-05-10 |
WO2006053306A2 (en) | 2006-05-18 |
EP1825355A4 (en) | 2009-11-25 |
US20060253431A1 (en) | 2006-11-09 |
CN101124537A (zh) | 2008-02-13 |
US9311601B2 (en) | 2016-04-12 |
US10467297B2 (en) | 2019-11-05 |
WO2006053306A3 (en) | 2007-04-26 |
CN101124537B (zh) | 2011-01-26 |
EP1825355A2 (en) | 2007-08-29 |
US20160224669A1 (en) | 2016-08-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10467297B2 (en) | Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms | |
US8126890B2 (en) | Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms | |
US9330175B2 (en) | Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms | |
US10496722B2 (en) | Knowledge correlation search engine | |
US8140559B2 (en) | Knowledge correlation search engine | |
US20140279971A1 (en) | Method for resource decomposition and related devices | |
US20200065344A1 (en) | Knowledge correlation search engine | |
Freitas et al. | A Semantic Best-Effort Approach for Extracting Structured Discourse Graphs from Wikipedia. | |
Yang et al. | Ontology-supported FAQ processing and ranking techniques | |
JP4864095B2 (ja) | 知識相関サーチエンジン | |
WO2007075157A1 (en) | Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms | |
Ulusoy | Rule based entity-relationship diagram modelling | |
Vijayalakshmi et al. | Information Retrieval in Kannada using Ontology | |
Thos | Zoonosis Text Mining: Scraping infection data of rabies from scientific articles and integrating them into the Open Research Knowledge Graph | |
Nogueira | Identifying References to Legal Literature in Portuguese Superior Court Decisions | |
Aravind | An Integrated Set of Web Mining Tools for Research | |
Rheinländer | Scalable and Declarative Information Extraction in a Parallel Data Analytics System | |
Shah et al. | Context aware ontology based information extraction | |
Siau | A teachable semi-automatic web information extraction system based on evolved regular expression patterns | |
Stadler | Community-Driven Engineering of the DBpedia Infobox Ontology and DBpedia Live Extraction | |
Helešic | Extrakce znalostních grafů z projektové dokumentace | |
Tran et al. | Context-Aware Timeline for Entity Exploration | |
Kundin et al. | Bilingual Corpus Exploratory Workbench | |
Gupta | Web services query matchmaking with automated knowledge acquisition | |
Kozuka et al. | Design and implementation of a filter engine for semantic web documents |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080728 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20081212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100309 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100609 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100629 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110131 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20110131 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110307 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20110307 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110621 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20110621 |