JP4864095B2 - 知識相関サーチエンジン - Google Patents
知識相関サーチエンジン Download PDFInfo
- Publication number
- JP4864095B2 JP4864095B2 JP2008541146A JP2008541146A JP4864095B2 JP 4864095 B2 JP4864095 B2 JP 4864095B2 JP 2008541146 A JP2008541146 A JP 2008541146A JP 2008541146 A JP2008541146 A JP 2008541146A JP 4864095 B2 JP4864095 B2 JP 4864095B2
- Authority
- JP
- Japan
- Prior art keywords
- function
- node
- resources
- subject
- readable medium
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本出願は、(1)発明者Mark Bobick及びCarl Wimmerにより2005年11月14日に出願された米国出願第11/273,568号“Techniques For Knowledge Discovery By Constructing Knowledge Correlations Using Concepts or Terms”(代理人整理番号83071)と、(2)発明者Mark Bobick及びCarl Wimmerにより2005年12月21日に出願された米国出願第11/314,835号“Techniques For Knowledge Discovery By Constructing Knowledge Correlations Using Concepts or Terms”(代理人整理番号83071_CIP)の一部継続出願であり、それらについて優先権を主張するものであり、上記出願の内容は、参照することによりその全てが本出願に含まれる。
[発明の背景]
発明の分野
本発明は、情報技術に関し、より詳細には、知識相関の結果を利用して、デジタル情報オブジェクトの何れか所与のユーザ問い合わせ、主題又はトピックスに重要なネットワーク及び/又はインターネットリソースを特定するサーチエンジンに関する。
サーチエンジンは、知識の情報抽出(IR)領域の一部として広く認識されている。IRメソッドは、クエリと呼ばれる問い合わせに関連するリソース(典型的には、文書)を特定することに関する。このクエリは、単一の検索条件から英語などの自然言語により構成された複雑なセンテンスに至る各形式をとりうる。検索される可能性のあるリソースの集合体はコーパス(ボディ)と呼ばれ、各タイプのコーパスを検索するための各種技術が開発されてきた。例えば、デジタル化された百科事典に含まれる記事群を検索するのに利用される技術は、ウェブサーチエンジンにより利用される技術と異なっている。利用される技術に関係なく、IRにおける中核的な問題は関連性、すなわち、オリジナルクエリについて抽出される文書の関連性である。各種IRメソッドの有効性を比較するため、形式的なメトリックが適用される。通常のIR有効性メトリックは、抽出されたすべての文書に対する抽出された関連する文書の比率である精度、コーパスのすべての関連する文書に対する抽出された関連する文書の比率であるリコール、及びコーパスのすべての関連しない文書に対する抽出された関連しない文書の比率であるフォールアウト(fall−out)を含む。関連するとみなされる抽出後の文書には、(大部分のIRシステムでは)再び各種技術を利用してある関連性ランクが割り当てられ、結果が返される。クエリはユーザと呼ばれる人間により最も通常は提供されるが(結果が返される)、ユーザは他のソフトウェアプロセスでありうる。
[発明の概要]
本発明は、コンピュータにより実現される方法を利用して、デジタル情報オブジェクトの何れか所与のユーザ問い合わせ、主題又はトピックスに重要となるリソースの一意的なURI(Uniform Resource Identifier)又はURL(Uniform Resource Locator)により参照される少なくとも1つのリソースを特定するサーチエンジンの新規な形態を開示する。本発明では、ユーザの問い合わせ、主題又はトピックスが入力として機能する。この入力は、データオブジェクトの集合内の論理構造を構築又は検出しようとするソフトウェア関数により利用され、各データオブジェクトは、当該データオブジェクトに寄与したリソースに関連付けされ、構築又は検出された論理構造は、入力に強く関連付けされる。好適な実施例について、上記ソフトウェア関数は、出願第11/273,568号に記載されるような知識相関関数であり、上記論理構造は、パスのクイーバ(quiver)と呼ばれる有向非循環グラフの形態である。入力に強く関連付けされた上記論理構造が実際に構築又は検出された場合、このようなデータ構造のデータオブジェクトメンバーは、アンサースペースとなる。このアンサースペースを使用して、他のソフトウェア関数は、アンサースペースに寄与したリソースの何れがアンサースペースに最も重要な寄与をしたか高い信頼度により決定し、これにより、入力された問い合わせ、主題又はトピックスに最も重要なURL及びURIを特定することができる。最終的に、データオブジェクトをアンサースペースに寄与したURL及びURIにより参照された各リソースを入力に対する重要度によりランク付けするのに利用される。
[発明の説明]
図1は、相関関数110により受付される入力の3つの例のブロック図である。主題200は、主題評価関数220により評価される。デジタル情報オブジェクト230が、トピック検出モジュール240のアダプタ235によりトピックについて調べられる。標準形式問い合わせ生成関数250は、入力としての問い合わせ260を生成する。
(i)テキスト(平文)ファイル
(ii)Rich Text Format(RTF)(Microsoft,Inc.により開発された規格) 他の方法は、まずRTF/テキスト変換ユーティリティ(Pete Sergeantの製品であるRTF−Parser−1.09など)の中間的な利用によりRTFからクリアテキストを取得することである。
(iii)Extended Markup Language(XML)(ワールド・ワイド・ウェブコンソーシアムの製品)ファイル
(iv)限定されるものではないが、HyperText Markup Language(HTML)、Extensible HyperText Markup Language(XHTML(登録商標))(ワールド・ワイド・ウェブコンソーシアムのプロジェクト)、RuleML(RuleML Initiative のプロジェクト)、Standard Generalized Markup Language(SGML))国際規格)、Extensible Stylesheet Language(XSL)ワールド・ワイド・ウェブコンソーシアムのプロジェクト)を含むマークアップ言語ファイルの何れかの変形
(v)Portable Document Format(PDF)ファイル(Adobe,Inc.の専用フォーマット)(PDF・テキスト変換ユーティリティの中間的利用による)
(vi)MS WORD(Microsoft,Inc.のワープロソフトウェア製品)による文書を格納するのに使用されるDOCファイルなどのMS WORDファイル 本実施例は、MS Word・テキストパーサ(Apache.orgの製品であるApache POIプロジェクトなど)をプログラム的に利用する。POIプロジェクトAPIはまた、プログラム的に呼び出されたMicrosoft Excelスプレッドシートファイル(XLS)からのテキスト抽出を可能にする。MS Wordファイルはまた、XLSファイルは可能でないが、特殊文字を含むプレインテキストファイルとしてNLPにより処理可能である。
(vii)以下に限定されるものでないが、トランザクションログ、電話番号レコード、従業員タイムシート、コンピュータシステムイベントログを含むイベント情報キャプチャログファイル
(viii)ウェブページ
(ix)ブログページ
(x)リレーショナルデータベース行
(xi)リレーショナルデータベースビュー
(xii)リレーショナルデータベーステーブル
(xiii)リレーショナルデータベースアンサーシート(すなわち、関係代数演算から得られる行セット)
デジタル情報オブジェクト230のトピックは、ソフトウェア関数、トピック検出関数240、ソフトウェアプログラムコンポーネントにより決定される。このようなトピック検出ソフトウェアの具体例は、文献に十分に記載されている。(Chen,K.1995.Topic Identification in Disclosure.Morgan Kaufmanを参照されたい。)トピック検出関数240は、デジタル情報オブジェクト230の各形式を処理するソフトウェアアダプタ235により実現される。このようなソフトウェアアダプタ235は周知である。(例えば、http://www−306.ibm.com/software/integration/wbiadapters/frameworkなどを参照されたい。)トピック検出関数の出力は、その後に相関関数110に提供されるキーワード及び/又はフレーズである。
本発明は上述されるような相関関数535の成功に依存するため、可能性のあるソースに適用される関連性テスト(出願第11/278,568号の図1Aのアイテム125)が興味がある。上述されるような相関関数110の発見段階は、関連性テストを利用して(出願第11/278,568号の図1Aのアイテム125)、以降の取得のためのリソース(出願第11/278,568号の図1Aのアイテム128)を特定する。これらの関連性テスト(出願第11/278,568号の図1Aのアイテム125)は、関連技術に記載される関連性アプローチと類似し、共通部分を有する。リソース(出願第11/278,568号の図1Aのアイテム128)が相関関数110による取得を保証するのに十分な関連性を有しているとみなされる事実は、リソース(出願第11/278,568号の図1Aのアイテム128)がアンサースペース800に重要な方法により寄与することがわかることを意味するものでなく、また保証するものでもない。出願第11/278,568号に列記される関連性テスト(出願第11/278,568号の図1Aのアイテム125)が以下に列記される。本発明の一実施例では、出願第11/278,568号に列記されるすべての関連性テスト(出願第11/278,568号の図1Aのアイテム125)と共に、関連技術に記載されるすべての関連性アプローチが、相関関数110による取得のためのリソース(出願第11/278,568号の図1Aのアイテム128)を選択するのに利用される。
(i)可能性のあるソースが、関心のある項又はフレーズの単数形又は複数形とのマッチを含むこと。
(ii)可能性のあるソースが、関心のある項又はフレーズの同義語とのマッチを含むこと。
(iii)可能性のあるソースが、関心のある項又はフレーズに関連するワードとのマッチを含むこと(シソーラスにより提供されるように関連する)。
(iv)可能性のあるソースが、可能性のあるソースのコンテンツと関心のある項又はフレーズとの間の関係が信頼できるリファレンスソースにより確立されている関心のある項又はフレーズに関連するワードとのマッチを含むこと。
(v)サーチ中に特定された可能性のあるソースの何れかのコンテンツが関心のある項又はフレーズの同義語又は関連するか判断するため、Merriam−Webster’s Thesauraus(Merriam−Webster,Inc.の製品)などのシソーラスの利用。
(vi)可能性のあるソースが、関心のある項及び/又はフレーズの1つの信頼できるリファレンスの定義に現れるワードとのマッチを含むこと。
(vii)サーチ中に特定される可能性のあるソースの何れかのコンテンツが、関心のある項又はフレーズの辞書の定義に出現し、このため関連性があるか判断するため、Merriam−Webster’s Dictionary(Merriam−Webster,Inc.の製品)などの辞書の利用。
(viii)可能性のあるソースが、信頼できるリファレンスソースの関心のある項又はフレーズに関する説明に出現するワードとのマッチを含むこと。
(ix)サーチ中に特定された可能性のあるソースの何れかのコンテンツが、関心のある項又はフレーズの百科事典の説明に出現し、このため関心のある項又はフレーズに関連するか判断するため、the Encyclopedia Britannica(Encyclopedia Britannica,Inc.の製品)などの百科事典の利用。
(x)可能性のあるソースに含まれる項が、関心のある項又はフレーズと親子又は兄弟関係を有すること。
(xi)可能性のあるソースに含まれる項が、関心のある項又はフレーズと親子関係又は兄弟関係を有することを判断するためのタクソノミーの利用。本実施例では、関心のある項又はフレーズを含む頂点がタクソノミーに配置される。これが、関心のある頂点である。可能性のあるソースのコンテンツで特定された各ワードについて、タクソノミーの親、兄弟又は子供の頂点が、関心のある頂点から当該関心のある頂点の親、兄弟及び子供の頂点への関係(リンク)を追跡することによってサーチされる。親、兄弟又は子供の頂点の何れかが可能性のあるソースのコンテンツからのワードを含む場合、マッチが宣言され、ソースは関心のある項又はフレーズに関する情報の実際のソースとみなされる。本実施例では、グラフ探索関数と呼ばれるソフトウェア関数が、関心のある項又はフレーズの親、兄弟及び子供の頂点を特定及び検証するのに利用される。
(xii)関心のある項又はフレーズが、可能性のあるソースに含まれる項から次数(長さ)1の意味的距離を有すること。
(xiii)関心のある項又はフレーズが、可能性のあるソースに含まれる項から次数(長さ)2の意味的距離を有すること。
(xiv)次数(長さ)1の意味的距離が関心のある項又はフレーズからソースを分離することを判断するためのオントロジーの利用。本実施例では、関心のある項又はフレーズを含む頂点がオントロジーで特定される。これが、関心のある頂点である。可能性のあるソースのコンテンツにおいて特定された各ワードについて、オントロジーが、関心のある頂点から隣接するすべての頂点への関係(リンク)を追跡することによりサーチされる。隣接する頂点の何れかが可能性のあるソースのコンテンツからのワードを含む場合、マッチが宣言され、ソースが関心のある項又はフレーズに関する情報の実際のソースとみなされる。
(xv)次数(長さ)2の意味的距離が関心のある項又はフレーズからソースを分離することを判断するためのオントロジーの利用。本実施例では、関心のある項又はフレーズを含む頂点がオントロジーにおいて特定される。これが、関心のある頂点である。可能性のあるソースのコンテンツにおいて特定された各ワードについて、意味的に次数1の関連性テストが実行される。これが不成功であった場合、オントロジーが、関心のある頂点に隣接する頂点から各自のすべての隣接する頂点への関係(リンク)を追跡することによって、サーチされる。このような頂点は、関心のある頂点から意味的に次数2となる。意味的に次数2の頂点の何れかが可能性のあるソースのコンテンツからのワードを含む場合、マッチが宣言され、ソースが関心のある項又はフレーズに関する情報の実際のソースとみなされる。
(xvi)関心のある項及び/又はフレーズの1つからサーチ中に特定された可能性のあるソースの何れかのコンテンツへの意味的距離の次数(長さ)を決定するため、CYC Ontology(Cycorp,Inc.の製品)などの一般的なオントロジーの利用。
(xvii)関心のある項及び/又はフレーズの1つからサーチ中に特定された化膿し絵のあるソースの何れかのコンテンツへの意味的距離の次数(長さ)を決定するため、Gene Ontology(Gene Ontology Consortiumのプロジェクト)などの特殊なオントロジーの利用。
Claims (36)
- 少なくとも1つのユーザにより提供された入力に基づき複数のランク付けされたリソースを表示する方法であって、
前記少なくとも1つのユーザにより提供される入力から抽出された複数の入力を生成するステップと、
自然言語の構文解析を用いて単語分類を実行することによって、複数のリソースを複数のノードに分解するステップと、
前記抽出された複数の入力に基づきノードプールに対して少なくとも1つの知識相関関数を実行することによって、少なくとも1つのノードの連結を有するアンサースペースを生成するステップと、
前記アンサースペースに基づき複数の最上位のリソースを決定するステップと、
前記複数のランク付けされたリソースを生成するため、前記複数の最上位のリソースを重要性に関してランク付けするステップと、
前記複数のランク付けされたリソースを表示するステップと、
を有し、
前記ノードプールの各ノードは、主題と、属性とそれらの間の結び付きとを含み、
前記知識相関関数は、連結されたノードの属性と前記ノードプールの他の連結されていないノードの主題との間の一致について前記ノードプールを検索することによって、前記ノードプールからのノードをノードの連結のエンドに繰り返し追加することからなる方法。 - 前記抽出された複数の入力を生成するステップは、キーワード、フレーズ、センテンス、コンセプト、コンパウンド、コンプレックス若しくはオーソゴナル入力及びシンプルなウェブクエリの少なくとも1つから主題情報を抽出するための主題評価関数を実行するステップを有する、請求項1記載の方法。
- 前記キーワード及びフレーズの少なくとも1つに対して主題評価関数を実行するステップは、パススルー関数を実行するステップを有する、請求項2記載の方法。
- 前記センテンスに対して主題評価関数を実行するステップは、自然言語パーサ関数を実行するステップを有する、請求項2記載の方法。
- 前記コンセプトに対して主題評価関数を実行するステップは、主題、オブジェクト及びコンテクスト情報の少なくとも1つに対する評価を実行するステップを有する、請求項2記載の方法。
- 前記コンパウンド、コンプレックス又はオーソゴナル入力の少なくとも1つに対して主題評価関数を実行するステップは、クローズ認識関数と自然言語パーサ関数とを実行するステップを有する、請求項2記載の方法。
- 前記シンプルなウェブクエリに対して主題評価関数を実行するステップは、フレーズ認識関数を実行するステップを有する、請求項2記載の方法。
- 前記ユーザにより提供される入力は、デジタル情報オブジェクトから構成される、請求項1記載の方法。
- 前記抽出された複数の入力を生成するステップはさらに、前記トピック検出モジュールから下流の自然言語パーサを利用するステップを有する、請求項8記載の方法。
- クエリを定義するために、前記ユーザにより提供される入力を取得するための問い合わせ生成関数を実行するステップをさらに有する、請求項1記載の方法。
- 前記問い合わせ生成関数を実行するステップは、問い合わせの静的なメニューを生成するステップを有する、請求項10記載の方法。
- 前記問い合わせ生成関数を実行するステップは、問い合わせの動的なメニューを生成するステップを有する、請求項10記載の方法。
- 前記クエリは、標準形式による、請求項10記載の方法。
- 前記最上位のリソースは、前記アンサースペースから特定されるリソースに強く関連付けされる、請求項1記載の方法。
- 前記最上位のリソースは、前記アンサースペースを生成するのに使用されるリソースに強く関連付けされる、請求項1記載の方法。
- 前記最上位のリソースは、前記アンサースペースを生成するのに使用されるリソースを介し前記少なくとも1つのユーザにより提供される入力に一時的に関連付けされる、請求項1記載の方法。
- 前記複数のランク付けされたリソースの関連性は、アンサースペースの存在により保証される、請求項1記載の方法。
- 前記複数の最上位のリソースを決定するステップは、類似性指標を使用しない、請求項1記載の方法。
- コンピュータにより実行されると、前記コンピュータに情報抽出方法を実行させる命令を格納する物理的なコンピュータ可読媒体であって、
前記方法は、
少なくとも1つのユーザにより提供される入力から抽出された複数の入力を生成するステップと、
自然言語の構文解析を用いて単語分類を実行することによって、複数のリソースを複数のノードに分解するステップと、
前記抽出された複数の入力に基づきノードプールに対して少なくとも1つの知識相関関数を実行することによって、少なくとも1つのノードの連結を有するアンサースペースを生成するステップと、
前記アンサースペースに基づき複数の最上位のリソースを決定するステップと、
前記複数のランク付けされたリソースを生成するため、前記複数の最上位のリソースを重要性に関してランク付けするステップと、
前記複数のランク付けされたリソースを表示するステップと、
を有し、
前記ノードプールの各ノードは、主題と、属性とそれらの間の結び付きとを含み、
前記知識相関関数は、連結されたノードの属性と前記ノードプールの他の連結されていないノードの主題との間の一致について前記ノードプールを検索することによって、前記ノードプールからのノードをノードの連結のエンドに繰り返し追加することからなるコンピュータ可読媒体。 - 前記抽出された複数の入力を生成するステップは、キーワード、フレーズ、センテンス、コンセプト、コンパウンド、コンプレックス若しくはオーソゴナル入力及びシンプルなウェブクエリの少なくとも1つから主題情報を抽出するための主題評価関数を実行するステップを有する、請求項19記載のコンピュータ可読媒体。
- 前記キーワード及びフレーズの少なくとも1つに対して主題評価関数を実行するステップは、パススルー関数を実行するステップを有する、請求項20記載のコンピュータ可読媒体。
- 前記センテンスに対して主題評価関数を実行するステップは、自然言語パーサ関数を実行するステップを有する、請求項20記載のコンピュータ可読媒体。
- 前記コンセプトに対して主題評価関数を実行するステップは、主題、オブジェクト及びコンテクスト情報の少なくとも1つに対する評価を実行するステップを有する、請求項20記載のコンピュータ可読媒体。
- 前記コンパウンド、コンプレックス又はオーソゴナル入力の少なくとも1つに対して主題評価関数を実行するステップは、クローズ認識関数と自然言語パーサ関数とを実行するステップを有する、請求項20記載のコンピュータ可読媒体。
- 前記シンプルなウェブクエリに対して主題評価関数を実行するステップは、フレーズ認識関数を実行するステップを有する、請求項20記載のコンピュータ可読媒体。
- クエリを定義するために、前記ユーザにより提供される入力を取得するための問い合わせ生成関数を実行するステップをさらに有する、請求項19記載のコンピュータ可読媒体。
- 前記最上位のリソースは、前記アンサースペースから特定されるリソースに強く関連付けされる、請求項19記載のコンピュータ可読媒体。
- 前記最上位のリソースは、前記アンサースペースを生成するのに使用されるリソースに強く関連付けされる、請求項19記載のコンピュータ可読媒体。
- 前記最上位のリソースは、前記アンサースペースを生成するのに使用されるリソースを介し前記少なくとも1つのユーザにより提供される入力に一時的に関連付けされる、請求項19記載のコンピュータ可読媒体。
- 前記複数の最上位のリソースを決定するステップは、類似性指標を使用しない、請求項19記載のコンピュータ可読媒体。
- 少なくとも1つのユーザにより提供された入力に基づき複数のランク付けされたリソースを表示する方法であって、
前記少なくとも1つのユーザにより提供される入力から抽出された複数の入力を生成するステップと、
複数のリソースのクローズの構文解析を用いて、前記複数のリソースを複数のノードに分解するステップと、
前記抽出された複数の入力に基づきノードプールに対して少なくとも1つの知識相関関数を実行することによって、少なくとも1つのノードの連結を有するアンサースペースを生成するステップと、
前記アンサースペースに基づき複数の最上位のリソースを決定するステップと、
前記複数のランク付けされたリソースを生成するため、前記複数の最上位のリソースを重要性に関してランク付けするステップと、
前記複数のランク付けされたリソースを表示するステップと、
を有し、
前記ノードプールの各ノードは、主題と、属性とそれらの間の結び付きとを含み、
前記知識相関関数は、連結されたノードの属性と前記ノードプールの他の連結されていないノードの主題との間の一致について前記ノードプールを検索することによって、前記ノードプールからのノードをノードの連結のエンドに繰り返し追加することからなる方法。 - 前記抽出された複数の入力を生成するステップは、キーワード、フレーズ、センテンス、コンセプト、コンパウンド、コンプレックス若しくはオーソゴナル入力及びシンプルなウェブクエリの少なくとも1つから主題情報を抽出するための主題評価関数を実行するステップを有する、請求項31記載の方法。
- 前記キーワード及びフレーズの少なくとも1つに対して主題評価関数を実行するステップは、パススルー関数を実行するステップを有する、請求項32記載の方法。
- コンピュータにより実行されると、前記コンピュータに情報抽出方法を実行させる命令を格納する物理的なコンピュータ可読媒体であって、
前記方法は、
少なくとも1つのユーザにより提供される入力から抽出された複数の入力を生成するステップと、
複数のリソースのクローズの構文解析を用いて、前記複数のリソースを複数のノードに分解するステップと、
前記抽出された複数の入力に基づきノードプールに対して少なくとも1つの知識相関関数を実行することによって、少なくとも1つのノードの連結を有するアンサースペースを生成するステップと、
前記アンサースペースに基づき複数の最上位のリソースを決定するステップと、
前記複数のランク付けされたリソースを生成するため、前記複数の最上位のリソースを重要性に関してランク付けするステップと、
前記複数のランク付けされたリソースを表示するステップと、
を有し、
前記ノードプールの各ノードは、主題と、属性とそれらの間の結び付きとを含み、
前記知識相関関数は、連結されたノードの属性と前記ノードプールの他の連結されていないノードの主題との間の一致について前記ノードプールを検索することによって、前記ノードプールからのノードをノードの連結のエンドに繰り返し追加することからなるコンピュータ可読媒体。 - 前記抽出された複数の入力を生成するステップは、キーワード、フレーズ、センテンス、コンセプト、コンパウンド、コンプレックス若しくはオーソゴナル入力及びシンプルなウェブクエリの少なくとも1つから主題情報を抽出するための主題評価関数を実行するステップを有する、請求項34記載のコンピュータ可読媒体。
- 前記キーワード及びフレーズの少なくとも1つに対して主題評価関数を実行するステップは、パススルー関数を実行するステップを有する、請求項35記載のコンピュータ可読媒体。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/273,568 | 2005-11-14 | ||
US11/273,568 US8108389B2 (en) | 2004-11-12 | 2005-11-14 | Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms |
US11/314,835 US8126890B2 (en) | 2004-12-21 | 2005-12-21 | Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms |
US11/314,835 | 2005-12-21 | ||
PCT/US2006/025101 WO2007061451A1 (en) | 2005-11-14 | 2006-06-28 | A knowledge correlation search engine |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009528581A JP2009528581A (ja) | 2009-08-06 |
JP4864095B2 true JP4864095B2 (ja) | 2012-01-25 |
Family
ID=38067518
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008541146A Expired - Fee Related JP4864095B2 (ja) | 2005-11-14 | 2006-06-28 | 知識相関サーチエンジン |
Country Status (4)
Country | Link |
---|---|
EP (1) | EP1974292A4 (ja) |
JP (1) | JP4864095B2 (ja) |
CN (1) | CN101310274B (ja) |
WO (1) | WO2007061451A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9104779B2 (en) * | 2005-03-30 | 2015-08-11 | Primal Fusion Inc. | Systems and methods for analyzing and synthesizing complex knowledge representations |
CN102662923A (zh) * | 2012-04-23 | 2012-09-12 | 天津大学 | 一种基于机器学习的本体实例学习方法 |
CN112650838B (zh) * | 2020-12-31 | 2023-07-14 | 南京视察者智能科技有限公司 | 一种基于历史案件大数据的智能问答方法及系统 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04252375A (ja) * | 1991-01-28 | 1992-09-08 | Nippon Telegr & Teleph Corp <Ntt> | 情報提供方法 |
JPH10124522A (ja) * | 1996-10-22 | 1998-05-15 | Fujitsu Ltd | 情報検索装置 |
JP2000112938A (ja) * | 1998-10-08 | 2000-04-21 | Canon Inc | 自然言語処理装置及びその方法、及び自然言語認識装置 |
US20020059220A1 (en) * | 2000-10-16 | 2002-05-16 | Little Edwin Colby | Intelligent computerized search engine |
US20020152202A1 (en) * | 2000-08-30 | 2002-10-17 | Perro David J. | Method and system for retrieving information using natural language queries |
US20030050921A1 (en) * | 2001-05-08 | 2003-03-13 | Naoyuki Tokuda | Probabilistic information retrieval based on differential latent semantic space |
JP2003228580A (ja) * | 2002-02-04 | 2003-08-15 | Celestar Lexico-Sciences Inc | 文献知識管理装置、文献知識管理方法、プログラム、および、記録媒体 |
US20030163302A1 (en) * | 2002-02-27 | 2003-08-28 | Hongfeng Yin | Method and system of knowledge based search engine using text mining |
JP2004021763A (ja) * | 2002-06-19 | 2004-01-22 | Hitachi Ltd | テキストマイニングプログラム、方法、及び装置 |
US20050086212A1 (en) * | 2003-09-23 | 2005-04-21 | International Business Machines Corporation | Method, apparatus and computer program for key word searching |
JP2005258659A (ja) * | 2004-03-10 | 2005-09-22 | Nippon Telegr & Teleph Corp <Ntt> | メタデータ生成装置 |
WO2006053306A2 (en) * | 2004-11-12 | 2006-05-18 | Make Sence, Inc | Knowledge discovery by constructing correlations using concepts or terms |
US20060167931A1 (en) * | 2004-12-21 | 2006-07-27 | Make Sense, Inc. | Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms |
-
2006
- 2006-06-28 CN CN200680042357XA patent/CN101310274B/zh not_active Expired - Fee Related
- 2006-06-28 JP JP2008541146A patent/JP4864095B2/ja not_active Expired - Fee Related
- 2006-06-28 WO PCT/US2006/025101 patent/WO2007061451A1/en active Application Filing
- 2006-06-28 EP EP06774152A patent/EP1974292A4/en not_active Withdrawn
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04252375A (ja) * | 1991-01-28 | 1992-09-08 | Nippon Telegr & Teleph Corp <Ntt> | 情報提供方法 |
JPH10124522A (ja) * | 1996-10-22 | 1998-05-15 | Fujitsu Ltd | 情報検索装置 |
JP2000112938A (ja) * | 1998-10-08 | 2000-04-21 | Canon Inc | 自然言語処理装置及びその方法、及び自然言語認識装置 |
US20020152202A1 (en) * | 2000-08-30 | 2002-10-17 | Perro David J. | Method and system for retrieving information using natural language queries |
US20020059220A1 (en) * | 2000-10-16 | 2002-05-16 | Little Edwin Colby | Intelligent computerized search engine |
US20030050921A1 (en) * | 2001-05-08 | 2003-03-13 | Naoyuki Tokuda | Probabilistic information retrieval based on differential latent semantic space |
JP2003228580A (ja) * | 2002-02-04 | 2003-08-15 | Celestar Lexico-Sciences Inc | 文献知識管理装置、文献知識管理方法、プログラム、および、記録媒体 |
US20030163302A1 (en) * | 2002-02-27 | 2003-08-28 | Hongfeng Yin | Method and system of knowledge based search engine using text mining |
JP2004021763A (ja) * | 2002-06-19 | 2004-01-22 | Hitachi Ltd | テキストマイニングプログラム、方法、及び装置 |
US20050086212A1 (en) * | 2003-09-23 | 2005-04-21 | International Business Machines Corporation | Method, apparatus and computer program for key word searching |
JP2005258659A (ja) * | 2004-03-10 | 2005-09-22 | Nippon Telegr & Teleph Corp <Ntt> | メタデータ生成装置 |
WO2006053306A2 (en) * | 2004-11-12 | 2006-05-18 | Make Sence, Inc | Knowledge discovery by constructing correlations using concepts or terms |
US20060253431A1 (en) * | 2004-11-12 | 2006-11-09 | Sense, Inc. | Techniques for knowledge discovery by constructing knowledge correlations using terms |
JP2008538016A (ja) * | 2004-11-12 | 2008-10-02 | メイク センス インコーポレイテッド | 概念または項目を用いて知識相関を構成することによる知識発見技術 |
US20060167931A1 (en) * | 2004-12-21 | 2006-07-27 | Make Sense, Inc. | Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms |
Also Published As
Publication number | Publication date |
---|---|
CN101310274A (zh) | 2008-11-19 |
CN101310274B (zh) | 2013-04-17 |
JP2009528581A (ja) | 2009-08-06 |
EP1974292A1 (en) | 2008-10-01 |
WO2007061451A1 (en) | 2007-05-31 |
EP1974292A4 (en) | 2009-04-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10496722B2 (en) | Knowledge correlation search engine | |
US8140559B2 (en) | Knowledge correlation search engine | |
JP5816936B2 (ja) | 質問に対する解答を自動的に生成するための方法、システム、およびコンピュータ・プログラム | |
Varma et al. | IIIT Hyderabad at TAC 2009. | |
WO2012040356A1 (en) | Providing question and answers with deferred type evaluation using text with limited structure | |
CN105760462B (zh) | 基于关联数据查询的人机交互方法及装置 | |
Dima | Intui2: A Prototype System for Question Answering over Linked Data. | |
US11216520B2 (en) | Knowledge correlation search engine | |
Freitas et al. | A Semantic Best-Effort Approach for Extracting Structured Discourse Graphs from Wikipedia. | |
Al-Smadi et al. | Leveraging linked open data to automatically answer Arabic questions | |
JP4864095B2 (ja) | 知識相関サーチエンジン | |
Kalender et al. | THINKER-entity linking system for Turkish language | |
Abebe et al. | Supporting concept location through identifier parsing and ontology extraction | |
Gelbukh et al. | Multiword expressions in nlp: General survey and a special case of verb-noun constructions | |
Vickers | Ontology-based free-form query processing for the semantic web | |
Keyvanpour et al. | A useful framework for identification and analysis of different query expansion approaches based on the candidate expansion terms extraction methods | |
Hoque et al. | A content-aware hybrid architecture for answering questions from open-domain texts | |
Maree et al. | Coupling semantic and statistical techniques for dynamically enriching web ontologies | |
Kahlawi | An ontology-driven DBpedia quality enhancement to support Entity Annotation for Arabic Text | |
Vargas-Vera et al. | AQUA: hybrid architecture for question answering services | |
Rajaraman et al. | A Survey on Text Question Responsive Systems in English and Indian Languages | |
Rajpal et al. | A Novel Techinque For Ranking of Documents Using Semantic Similarity | |
Nethravathi et al. | Multisource Keyword Extraction and Graph Construction for Privacy Preservation | |
Kleb et al. | Disambiguating entity references within an ontological model | |
Klyuev | An approach to implementing an intelligent web search |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20090528 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101021 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101026 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110126 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110202 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110517 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110817 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111018 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111108 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141118 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4864095 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |