JP5925769B2 - 検索方法、検索システム及びコンピュータプログラム - Google Patents

検索方法、検索システム及びコンピュータプログラム Download PDF

Info

Publication number
JP5925769B2
JP5925769B2 JP2013515642A JP2013515642A JP5925769B2 JP 5925769 B2 JP5925769 B2 JP 5925769B2 JP 2013515642 A JP2013515642 A JP 2013515642A JP 2013515642 A JP2013515642 A JP 2013515642A JP 5925769 B2 JP5925769 B2 JP 5925769B2
Authority
JP
Japan
Prior art keywords
search
words
semantic
word
string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013515642A
Other languages
English (en)
Other versions
JP2013529805A (ja
JP2013529805A5 (ja
Inventor
スウィーニー,ピーター,ジョーゼフ
グッド,ロバート,チャールズ
カーン,ナイン
Original Assignee
プライマル フュージョン インコーポレイテッド
プライマル フュージョン インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by プライマル フュージョン インコーポレイテッド, プライマル フュージョン インコーポレイテッド filed Critical プライマル フュージョン インコーポレイテッド
Publication of JP2013529805A publication Critical patent/JP2013529805A/ja
Publication of JP2013529805A5 publication Critical patent/JP2013529805A5/ja
Application granted granted Critical
Publication of JP5925769B2 publication Critical patent/JP5925769B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0277Online advertisement

Description

本願により開示される発明は一般にコンテンツのセマンティック検索(semantic search)を実行するための技術分野に関連する。
インターネットは、膨大な情報を含む相互に接続されたコンピュータネットワークのグローバルシステムである。ワールドワイドウェブ(WWW)はインターネット上で行われる情報共有モデルであり、特定のプロトコル(例えば、ハイパーテキストトランスファプロトコル及びその派生プロトコル)を用いて、相互にリンクしたハイパーテキスト文書のシステムにアクセスする。
WWW及びインターネットを介して利用可能な情報は膨大な量に上ることに起因して、及び利用可能な情報は、膨大な数に及ぶ独自に所有及び運営されているネットワーク及びサーバを介して分散していることに起因して、WWW及びインターネット上で所望のコンテンツを発見することは必ずしも容易でない。
ユーザがインターネット上で所望のコンテンツを発見することを支援する目的でサーチエンジンが開発されている。サーチエンジンは、ユーザが望むコンテンツを表す検索文字列又はサーチクエリ(search query)を(例えば、一群のキーワードの形式で)ユーザから受信しかつユーザの検索文字列に関連していることがサーチエンジンにより判定された情報及び/又はその情報に対するハイパーリンクを返すコンピュータプログラムである。
サーチエンジンは、一般的には、自動的にウェブを閲覧するウェブクローラ(WebCrawler)と呼ばれるコンピュータプログラムを用いて多数のWWWウェブページ及び/又はその他のコンテンツを抽出することで機能する(例えば、閲覧したウェブページ各々の中で発見した全てのハイパーリンクが後に続いている)。取得されたウェブページ及び/又はコンテンツは分析され、そのウェブページ又はコンテンツについての情報がインデックスに保存される。ユーザがサーチエンジンに対して検索文字列を発行した場合、サーチエンジンは、そのインデックスを用いて、ユーザの検索文字列に最も合致すると判定されたウェブページ及び/又はコンテンツを特定又は同定し、最も合致するウェブページ及び/又はコンテンツと共に結果のリストを返す。しばしば、このリストは、ユーザの検索文字列に最も合致すると判定されたウェブページ及び/又はコンテンツに至る一群のハイパーリンクが含まれている1つ以上のウェブページの形式を有する。
開示される発明の課題は、改善されたセマンティック検索を実行できるようにする装置及び方法等を提供することである。
一実施形態による方法は、
第1の検索文字列を受信するステップと、
前記第1の検索文字列の意味の曖昧さを減らす曖昧性除去語を取得するステップと、
プロセッサが、前記第1の検索文字列及び前記曖昧性除去語に少なくとも部分的に基づいて第2の検索文字列を作成するステップと、
前記第2の検索文字列に少なくとも部分的に基づいて行われた検索から取得された検索結果を出力すること、及び検索結果を出力する検索サービス部に前記第2の検索文字列を与えることのうちの少なくとも一方を実行するステップと
を有するセマンティック検索方法である。
本発明の実施の形態によるセマンティック検索を実行する方法を示すフローチャート。 ユーザの検索文字列をサーバに提供する本発明の実施の形態によるクライアント/サーバアーキテクチャを示すブロック図。 検索文字列の1つ以上の意味表現を生成する本発明の実施の形態による方法を示すフローチャート。 本発明による実施の形態を実現するのに使用されるクライアント/サーバアーキテクチャを示すブロック図。 一群の曖昧性除去語をユーザに提示するのに使用される本発明の実施の形態によるディスプレイを示す図。 本発明の実施の形態が使用されるコンピュータ装置のブロック図。 セマンティック検索を実行する本発明の実施の形態によるシステムを示す図。 実際の概念に関連する概念を分類する本発明の実施の形態による方法を示す図。 実際の概念に関連する概念を分類する本発明の実施の形態による方法を示す図。 実際の概念に関連する概念を分類する本発明の実施の形態による方法を示す図。 実際の概念に関連する概念を分類する本発明の実施の形態による方法を示す図。 本発明の実施の形態による収益化評価カテゴリ(monetization categories)のマトリクスを示す図。 宣伝広告を行う本発明の実施の形態による方法を示すフローチャート。 結果のランキング/注釈を決定する本発明の実施の形態による方法を示すフローチャート。
<要約>
(A) 一実施形態では、セマンティック検索方法が与えられる。本方法は、
第1の検索文字列を受信するステップと、
前記第1の検索文字列の意味の曖昧さをなくす曖昧性除去語を取得するステップと、
前記第1の検索文字列及び前記曖昧性除去語に少なくとも部分的に基づいて第2の検索文字列を作成するステップと、
前記第2の検索文字列に少なくとも部分的に基づいて行われた検索から取得された検索結果を出力すること、及び検索結果を出力する検索サービス部に前記第2の検索文字列を与えることのうちの少なくとも一方を実行するステップと
を有する方法である。
(B) 一実施形態では、セマンティック検索システムが与えられる。本システムは、検索方法を実行するプロセッサを有し、検索方法は、
第1の検索文字列を受信するステップと、
前記第1の検索文字列の意味の曖昧さをなくす曖昧性除去語を取得するステップと、
前記第1の検索文字列及び前記曖昧性除去語に少なくとも部分的に基づいて第2の検索文字列を作成するステップと、
前記第2の検索文字列に少なくとも部分的に基づいて行われた検索から取得された検索結果を出力すること、及び検索結果を出力する検索サービス部に前記第2の検索文字列を与えることのうちの少なくとも一方を実行するステップと
を有するシステムである。
(C) 一実施形態では、コンピュータで読み取ることが可能な記憶媒体が与えられる。本記憶媒体は、セマンティック検索方法をプロセッサに実行させる命令(ソフトウェア又はコンピュータプログラム)を保存し、セマンティック検索方法は、
第1の検索文字列を受信するステップと、
前記第1の検索文字列の意味の曖昧さをなくす曖昧性除去語を取得するステップと、
前記第1の検索文字列及び前記曖昧性除去語に少なくとも部分的に基づいて第2の検索文字列を作成するステップと、
前記第2の検索文字列に少なくとも部分的に基づいて行われた検索から取得された検索結果を出力すること、及び検索結果を出力する検索サービス部に前記第2の検索文字列を与えることのうちの少なくとも一方を実行するステップと
を有する記憶媒体である。
(D) 一実施形態では、トレンディ語を同定する方法が与えられる。本方法は、
複数の言葉を含むタイムスタンプが付されているコンテンツを受信するステップと、
プロセッサが、減衰関数(decay function)に少なくとも部分的に基づいて前記複数の言葉に属する各々の言葉についてトレンドスコアを計算するステップと、
計算された前記トレンドスコアに基づいてトレンディ語として同定された1つ以上の言葉に基づく結果を出力するステップと
を有する方法である。
(E) 一実施形態では、宣伝広告を行う方法が与えられる。本方法は、
プロセッサが、情報コンテンツの本体に登場する言葉を、該言葉について計算した1つ以上のトレンド語に少なくとも部分的に基づいて、複数のカテゴリのうちの1つ以上に分類するステップと、
前記言葉が分類された前記複数のカテゴリのうちの1つ以上のカテゴリに基づいて、前記言葉に関する宣伝広告を行うステップと
を有する方法である。
(F) 一実施形態では方法が提供される。本方法は、
第1の検索文字列を受信するステップと、
プロセッサが、前記第1の検索文字列の意味表現(semantic representation)を作成するステップと、
前記第1の検索文字列に少なくとも部分的に基づいて行われた検索の検索結果を取得するステップと、
前記検索結果及び前記意味表現の双方に含まれている言葉に少なくとも部分的に基づいて前記検索結果のランキングを決定する又は注釈を付けるステップと
を有する方法である。
(G) 一実施形態では、システムが提供される。本システムは、ある方法を実行するプロセッサを有し、その方法は、
第1の検索文字列を受信するステップと、
前記第1の検索文字列の意味表現(semantic representation)を作成するステップと、
前記第1の検索文字列に少なくとも部分的に基づいて行われた検索の検索結果を取得するステップと、
前記検索結果及び前記意味表現の双方に含まれている言葉に少なくとも部分的に基づいて前記検索結果のランキングを決定する又は注釈を付けるステップと
を有するシステムである。
(H) 一実施形態では、コンピュータで読み取ることが可能な記憶媒体が提供される。本記憶媒体は、ある方法をプロセッサに実行させる命令(ソフトウェア又はプログラム)を保存し、その方法は、
第1の検索文字列を受信するステップと、
前記第1の検索文字列の意味表現(semantic representation)を作成するステップと、
前記第1の検索文字列に少なくとも部分的に基づいて行われた検索の検索結果を取得するステップと、
前記検索結果及び前記意味表現の双方に含まれている言葉に少なくとも部分的に基づいて前記検索結果のランキングを決定する又は注釈を付けるステップと
を有する記憶媒体である。
<詳細な説明(原理)>
多くの従来のインターネットサーチエンジンは、ユーザの検索文字列に含まれている文字通りの言葉と、インデックスが付けられているコンテンツ(インデックスコンテンツ)内の文字通りの言葉との間でパターンマッチング又はパターンの照合を単に行うことによって、コンテンツのどの部分がユーザの検索文字列に関連しているかを決定していることを、発明者等は考察した。そのようなサーチエンジンは、一般に、ユーザの検索文字列の意味(semantic meanings)を表現しようとはせず、むしろインデックスコンテンツ内の用語、言葉及び語句の意味に着目していることに、発明者等は着目した。従って、意味が曖昧である言葉と共にユーザが検索文字列を入力すると、サーチエンジンは、ユーザが意図している言葉の意味と全く関連のない結果を返す傾向がある。
例えば、ユーザが「bark」という検索文字列を与えたとすると、犬が発する声に関する情報、木の外皮に関する情報、3本マストの小型帆船(barque)に関する情報又は「bark」に関する何らかの他の意味に関する情報の何れをユーザが探しているのか明確でない。ほとんどのサーチエンジンは、「bark」という言葉について可能性のあるいくつもの意味を特定し、それら可能性のある意味が混ざった結果を返す。
ユーザの検索文字列の意味を判定することで、ユーザが意図している情報を含む可能性が高い検索結果を取得して返せるかもしれないことに、発明者等は着目した。例えば、ユーザが「bark」という検索文字列を与えた場合に、その検索文字列におけるユーザの意図が、木に関する「bark」の情報の発見であることが判明している場合、木に関する「bark」に関連するコンテンツを返す一方、「bark」という言葉を含んではいるが「bark」の他の意味に関連する他のコンテンツ(例えば、犬や3本マストの小型帆船に関するコンテンツ)を返さないことが望ましい。
所定の言葉が単に登場しているだけでなくコンテンツ内の言葉の意味に基づいて、検索文字列に合致するコンテンツを同定しようとする多くの「セマンティック検索(semantic search)」技術が開発されている。しかしながら、これらの技術は、一般に、検索する大量の情報をなす文書又はコンテンツ各々の意味表現(semantic representation)を作成することを前提としている。
検索する大量のコンテンツをなす文書又はコンテンツ緒の大野の意味表現を生成することに基づくセマンティック検索技術は、いくつかの欠点を有することに、発明者等は着目した。具体的に言えば、WWW上にあるコンテンツは膨大な量に及ぶことに起因して、文書又はコンテンツ各々の意味表現を生成することは実用的ではない。この問題は、WWWで公開されている多数のコンテンツが直ぐに使用されるように意図されている(リアルタイムウェブとして言及される)という事実によって、悪化する。従って、そのようなコンテンツは、意味表現が生成される時点では古くなっている(又は陳腐化している)かもしれない。
コンテンツに意味のある注釈を付ける(semantic annotation)この問題は、ウェブスケールのリアルタイムセマンティック検索についての最も深刻かつコスト高となってしまう障壁の1つである。ユーザが入力したクエリ又は文字列の意味表現及びコンテンツを求める意図を提供することによって、検索されるコンテンツに事前に意味の注釈を付ける必要はなくなり、そのような方法は体系化されていないコンテンツソースでも効果的に機能することに、発明者等は着目した。
いくつもの実施の形態はセマンティック検索を実行する技術に関連する。これらの実施の形態の内のいくつかは従来の検索方法に関する上記の問題に対処するものであるが、全ての実施の形態が上記の問題の全てに対処するわけではなく、実施の形態によっては上記の問題の何れにも対処しないかもしれない。従って、本発明は従来の検索方法について議論された上記の全て又は何れかの問題に対処していることに限定されない点が、理解されるべきである。
<詳細な説明(具体例)>
図1は、本発明の実施の形態によるセマンティック検索を実行する方法100のフローチャートを示す。図1に示す方法はステップ101から始まり、ユーザが与えた検索文字列又は検索文字列を受信する。本方法は次にステップ103に続き、ユーザの検索文字列についての1つ以上の意味表現を生成する。例えば、以下において詳細に説明するように、ステップ103では1つ以上の概念定義(concept definition)が生成され、概念定義の各々はユーザの検索文字列についての可能性のある1つの意味(semantic meanings)を表す。
本方法はステップ105に続き、ステップ103で生成された意味表現から、ユーザの検索文字列で意図されている意味に関連する可能性のある一群の曖昧性除去語(disambiguation term)を生成する。この一群の言葉はユーザに提供され、ユーザの(彼又は彼女の)検索文字列で意図されている意味に関連する言葉、語句又はフレーズをユーザが選択できるようにする。言葉(term)は1つ以上のワード又は1つ以上の語句(又はフレーズ)を含んでよいことが理解されるべきである。本方法はステップ107に続き、ユーザが彼又は彼女の検索文字列に関連しているものとしてユーザが指定した曖昧性除去語を受信し、ユーザが選択したその曖昧性除去語に基づいて、検索文字列でユーザが意図している意味を取得できると思われるユーザの検索文字列の意味表現が、選択される。本方法はステップ109に続き、選択された意味表現について合成処理(synthesis operation)が実行される。この合成処理の結果として、拡張されたセマンティックネットワーク又は拡張された意味網(expanded semantic network)が生成されてもよい。本方法はステップ111に続き、拡張されたセマンティックネットワーク又は意味網に基づいて1つ以上の検索文字列が発行し、その1つ以上の検索文字列についての結果が受信されかつユーザに提示する一群の検索結果を生成するためにランキング及び/又は選別される。本方法は次にステップ113に続き、これらの検索結果がユーザに表示される。図1に示す方法の各ステップは任意の様々な方法で実行されてもよく、様々な実施の形態でこれらのステップを実行する方法の具体例が以下において詳細に説明される。
図1に示されている方法100及びその任意の変形例は、任意の多数の方法で実現されてもよい。例えば方法100はハードウェア、ソフトウェア又はそれらの組み合わせを用いて実現されてもよい。ソフトウェアで実現される場合、そのソフトウェアは適切な任意のプロセッサ又は一群のプロセッサで実行される。ソフトウェアはプロセッサで実行可能な命令及びコンフィギュレーションパラメータとして保存され、そのようなソフトウェアはコンピュータで読み取ることが可能な記憶媒体に保存される。
方法100を実行するソフトウェアは適切な任意の方法で構築されてよい。例えば、図7に示されているような複数のソフトウェアモジュールを含むソフトウェアシステム700として構築されてもよい。図示の具体例の場合、各々のソフトウェアモジュールは方法100の1つ以上のステップの少なくとも一部を実行する。しかしながら、実施の形態において、ソフトウェアシステム700の1つ以上のソフトウェアモジュールは方法100のステップに関連していない機能を発揮してもよく、本発明は図示の例に限定されない。
図示のソフトウェアシステム700は多数のソフトウェアモジュールを有し、ラベル-概念変換モジュール701、ユーザインターフェースモジュール702、セマンティック合成モジュール703、選別抽出エージェントモジュール705、セマンティック注釈モジュール707、情報抽出サービスモジュール709、時間的用語抽出モジュール711及び語彙モジュール713を含む。一実施形態では、方法100のステップ101、107及び113はユーザインターフェースモジュール702により実行され、方法100のステップ103及び105はラベル-概念変換モジュール701により実行され、方法100のステップ108はセマンティック合成モジュール703により実行され、方法100のステップ111は、選別抽出エージェントモジュール705及び情報抽出サービスモジュール709により実行されてもよい。
以下の説明は次の観点から行われる。
I.ユーザが生成した検索文字列を受信する
II.検索文字列について1つ以上の意味表現を生成する
III.曖昧性除去語のリストを生成する
IV.選択された曖昧性除去語に基づいて意図されている概念定義を特定する
V.拡張されたセマンティックネットワークを合成する
VI.検索文字列を発行し、結果を選別する
VII.検索結果をユーザに表示する
VIII.新たな言葉を抽出する
IX.トレンディ語を用いて実際の概念に関連する概念を特定する
X.セマンティック語彙を更新する
XI.トレンド語を用いた評価方法
XII.追加的な詳細
<I.ユーザが生成した検索文字列を受信する>
上述したように、方法100のステップ101では、人間のユーザが提供したサーチ空襟が受信される。図示のソフトウェアシステム700の場合、ステップ101はユーザインターフェースモジュール702により実行されてもよい。検索文字列は可能な任意の様々な方法で受信されてよい。例えば、一実施形態では、検索文字列は、ユーザのクライアントコンピュータから、方法100を実行するためのソフトウェアコードを実行するサーバコンピュータに提供されてもよい。すなわち、例えば、図2に示すように、ユーザはアプリケーションプログラム205を実行するクライアントコンピュータを操作してもよい。サーバ203は方法100を実行するコンピュータである。ユーザは検索文字列をアプリケーションプログラム205に入力し、アプリケーションプログラム205がその検索文字列をサーバ203に送信してもよい。こうして、サーバ203はクライアント201で動作しているアプリケーションプログラム205から検索文字列を受信する。
アプリケーションプログラム205は、サーバ203に情報を送信すること及びサーバ203から情報を受信することが可能な任意の様々なタイプのアプリケーションプログラムであってよい。例えば、一実施形態におけるアプリケーションプログラム205はインターネット又はWWWブラウザであってよい。
図2に示す例の場合、アプリケーションプログラム205はユーザが提供した検索文字列をサーバ203に直接的に送信するように示されている。しかしながらそれはユーザの検索文字列がクライアント201からサーバ203へどのように送信されるかを簡易に表現しているに過ぎず、ユーザの検索文字列がクライアント201からサーバ203へ直接的に創始されることは必須でないことが、理解されるべきである。例えば一実施形態ではユーザの検索文字列はネットワークを介してサーバ203に送信される。ネットワークはLAN、WAN又はインターネットのような適切な任意のネットワークであってよい。
<II.検索文字列について1つ以上の意味表現を生成する>
上述したように、方法100のステップ103において、ユーザの検索文字列に関する1つ以上の意味表現が生成される。図7に示す例示的なソフトウェアシステムの場合、この処理はラベル-概念変換モジュール702により実行されてもよい。意味表現の各々は、ユーザの検索文字列について可能性のある1つの意味に対応する。ユーザの検索文字列の意味表現を生成するために、多種多様な可能な任意の技法が使用されてよい。一実施形態で使用されてよいそのような技法の具体例が図3の方法300に示されている。図3に関連して以下で説明される具体例の場合、ユーザの検索文字列についての「概念定義(concept definition)」と呼ばれる複数の意味表現がセマンティック語彙(semantic lexicon)又は語彙データベースを用いて生成される。
米国特許出願番号第12/671,846号で説明されているように、概念又はコンセプト(concept)は、他の言葉との関連性による複合的な抽象度(compound levels of abstract)の観点から、及びキーワードや形態素(morpheme)のような他の多くの基礎的な情報表現要素 (more fundamental knowledge representation entity)の観点から構造的に決定されてもよい。そのような構造は「概念定義」と言及される。要するに、概念を含むキーワード及び形態素のようなより多くの基礎的な情報表現要素は、概念の属性と言及される。
セマンティック語彙は、ワード間の意味上の関連性を含むワードの集合である。実施の形態で使用されてよいセマンティック語彙の一例は、プリンストン大学のワールドネットセマンティック語彙(WorldNet semantic lexicon)である。図7に示すソフトウェアシステムの場合、セマンティック語彙は語彙モジュール713により示されている。
一実施形態において、セマンティック語彙の概念は時間が経過しても同じままである。しかしながら他の実施の形態の場合、以下のセクションVIII、IX及びXで説明されているように、セマンティック語彙の概念は時間経過と共に変化する。例えば、ワードがセマンティック語彙に追加される或いはワードがセマンティック語彙から削除される。
一実施形態において、セマンティック語彙は、複数のノード及びノード間のエッジ(edge)を有するグラフにより表現されてもよい。グラフはノードを1つ以上の言葉に関連付けることで語彙を表現する。2つのノード間のエッジは、それらのノードに関連する言葉同士の間の関連性を示す。例えば、関連性は、「〜は〜により規定される(defined-by)」という関係や、「〜は〜である(is-a)」という関係であってもよい。概念定義は、1つ以上のトークン化された言葉を含む隣接するノードに関連する言葉に基づいていてもよい。例えば、そのような隣接するノードは、1つ以上のトークン化された言葉を含むノードについて「define-by」又は「is-a」という関係を有する言葉を含む。
図3に示す方法300は、検索文字列(例えば、ユーザが入力したフリーテキスト検索文字列(free text search query))に関する1つ以上の概念定義(すなわち、意味表現)を生成する。本方法はステップ301から始まり、ユーザのクエリ(の文字列)が個々のワードにトークン化又は分割され、個々のワード各々がトークンとなる。例えば、「ラブアンドウォー(Love and war)」というユーザのクエリは、(1)「ラブ(Love)」、(2)「アンド(and)」及び(3)「ウォー(war)」という3つのトークンに分割される。
本方法は次にステップ303に進み、ストップワード又は停止語ではないトークンの各々について、そのトークンを含むセマンティック語彙の中のキーワードが特定される。ストップワードは、方法300において選別又は無視されるワード(例えば、「アンド(and)」や、「その(the)」等)である。
本方法は次にステップ305に進み、ステップ303で特定されたキーワードがランキングされ、特定されたキーワードの内の一部又はサブセットが、概念定義の生成に使用するために選択される。例えば、語彙は、「Love」というワードを使用している9000個のキーワードを有していてもよい。ステップ305では、それらのうちの全部又は一部(例えば、上位5%、或いは他の適切な一部分)が、概念定義の生成に使用するために選択される。
多種多様な可能性のある任意の方法又は基準が、特定されたキーワードをランキング、順序付け又は等級化するのに使用されてもよい。実施の形態で使用されてもよい基準の具体例は、以下の(a)−(c)の基準を含んでもよい。(a)複数のトークン化されたワードに厳密に一致するキーワードが、そうでないキーワードよりも高くランキングされる。例えば、トークン化されたワードが、「アメリカの(American)」及び「アルバム(Albums)」であったとすると、「アメリカのアルバム(American Albums)」というキーワードが、「アメリカの」というキーワードや、「アルバム」というキーワードよりも高くランキングされる。(b)トークン化されたワードに厳密に一致するキーワードが、そうでないキーワードよりも高くランキングされる。例えば、「Love」というワードの場合、「Love in politics」というキーワードよりも、「Love」というキーワードの方がより一致している。(c)1つより多いトークン化されたワードを使用するキーワードが、そうでないキーワードよりも高くランキングされる。例えば、トークン化されたワードが「アメリカの(American)」、「ポップ(Pop)」及び「アルバム(Albums)」であったとすると、「ポップアルバム(Pob Albums)」というキーワードは、「ポップ(Pop)」のみを含むキーワードや、「アルバム(Albums)」のみを含むキーワードよりも高くランキングされる。(a)−(c)の基準の各々は、他の任意の基準と任意の組み合わせで使用されてよい。
ステップ305の後に、本方法はステップ307に続き、ステップ305で選択されたキーワードに基づいて概念定義が生成される。例えば、ステップ103で生成されるキーワードは、愛(love)、戦争(war)、ラブソング(love song)、戦争と平和(war and peace)、軍事政治(war politics)、愛と皮肉(love and satire)、ある愛の詩(love story)、恋と愛(romance and love)、兵器(war machine)、軍艦(ships of war)、軍事会議(war council)、軍事大臣(war minister)、ラブバラード(love ballad)、戦争文学(war literature)、三角関係(love triangle)である。
概念定義はキーワード表現の関連性として生成されてもよい。或いは、概念定義は、ステップ305で登場した一群のキーワードを構文解析し、構文解析されたキーワードの関連するコンポーネントを結合し直すことで生成されてもよい。コンポーネントは、キーワードが、同じトークンから由来して構文解析されたものであるか否かに関連する。目下の例でキーワードから生成された概念定義は、(戦争(war)、平和(peace)、政治(politics))、(愛(love)、歌(songs))、(愛(love)、恋(romance)、バラード(ballad)、物語(story)、三角関係(triangle))、(戦争(war)、兵器(machine)、船(ships))、(戦争(war)、政治(politics)、会議(council)、大臣(minister))等を含む。上述したように、概念定義の各々はユーザの検索文字列について可能性のある意味の1つに対応する。
一実施形態では、概念定義の各々は、個々のトークンの中の唯一のキーワード(ただし、ストップワードや、キーワードが存在しないワードを除く)を有し、概念定義の各々は(たとえそれが複数のトークンに対応付けられていたとしても)高々1回各キーワードを使用する。
一実施形態において、ユーザのテキストクエリ又は検索文字列が1つ以上の未知のワード(すなわち、語彙に含まれているキーワードが存在しない何らかのワード)を含んでいた場合、ユーザのフルテキストクエリ(完全な検索文字列)と共にラベルとして新たなキーワードが生成されてもよい。新たなキーワードは如何なる祖先(ancestor)(由来したもの)も子孫(descendant)(由来するもの)も有していない。新たなキーワードは、変換処理の最後に破棄される、或いは将来の処理のためにセマンティック語彙に追加される。
例えば、ユーザのクエリが「German blitzkrieg」であった場合において、「blitzkrieg」というワードが現在の範囲内の如何なるキーワードによっても使用されていなかった場合、システムは「German blitzkrieg」というラベルと共に新たなキーワードを生成し、この単位で未知の意味を表現する。その後、クエリに関する概念定義は、「German blitzkrieg」というラベルの新たなキーワードと共に、語彙の中の既知のキーワードで構築される。或いは、新たなキーワード又は未知のワードを生成せずに、方法300はその未知のワードを無視してもよい。
ステップ307で生成された概念定義の各々はセマンティックネットワーク又は意味網の基礎となってもよい。セマンティックネットワーク又は意味網は有向グラフの形式をとる或る種の情報表現であり、概念を表す頂点(vertex)と、頂点同士の間のエッジ(edge)とを有し、エッジは概念同士の間の意味上の関係(semantic relation)を表現する。
例えば、「愛と戦争(love and war)」というクエリから得られた概念定義[愛(love)、戦争(war)、小説(novel)]という概念定義は、あるセマンティックネットワーク又は意味網と考えられ、セマンティックネットワークでは、「愛(love)」、「戦争(war)」、「愛と戦争(love and war)」及び「小説(novel)」の各々が頂点を表し、1つ以上の頂点を結ぶ有向エッジがある。概念定義は、グラフィカル語彙(graphical lexicon)であるセマンティック語彙を利用して生成されてもよい。グラフィカル語彙は、「愛と戦争(love and war)」というキー和戸に関連するノードを有する(なお、これらのキーワードは、関心のある2つのトークンに正確に一致するので、高くランキングされる傾向にある)。隣接ノードは「小説(novel)」という言葉を含む。
従って、[愛(love)、戦争(war)、小説(novel)]という概念定義は或るセマンティックネットワークと考えられ、セマンティックネットワークは、「愛と戦争(love and war)」のノードに関する1つの頂点と、「小説(novel)」に関する別の頂点とを有する。任意の所与のノードに関し、個々のトークン化された言葉及び構成要素の言葉は、「愛(love)」に関する頂点及び「戦争(war)」に関する頂点のような追加的な頂点を設定するための基礎となってもよい。
セマンティックネットワーク内の頂点はルートの頂点(root vertex)として指定されてもよい。目下の例の場合、「愛と戦争(love and war)」の頂点がルートの頂点として指定される。「愛と戦争(love and war)」は、セマンティック語彙の中で特定された最初のノードであるのでルートの頂点として指定され、セマンティック語彙は、隣接ノードからの「小説(novel)」を含むための基礎であり、かつ初期ノード及び対象のトークン化された言葉の構成要素として「愛(love)」及び「戦争(war)」を含む基礎である。概念定義のセマンティックネットワークでは、他の全ての頂点は、ルートの頂点から発せられ、ルートの頂点に直接的に隣接している。
<III.曖昧性除去語のリストを生成する>
上述したように、方法100のステップ105において、ステップ103で生成された意味表現又は概念定義が、ユーザに提供される一群の曖昧性除去語(disambiguation term)を生成するのに使用され、ユーザは、彼又は彼女が検索文字列で意図している意味に関連する曖昧性除去語を選択する。従って、曖昧性除去語は、検索文字列の意味の曖昧性を除去するために使用される。図示のソフトウェアシステム700では、ステップ105はラベル-概念変換モジュール701により実行されてもよいが、適切な他の任意のモジュールで実行されてよい。すなわち、例えば、ユーザのクエリが「bark」であった場合に、概念定義を使用して一群の曖昧性除去語を提供し、ユーザは「bark」というワードで彼又は彼女が意図している意味についての曖昧性を除去するために、一群の曖昧性除去語の中から選択する。
曖昧性除去語は適切な如何なる方法で生成されてもよい。例えば、ステップ103で生成された概念定義に含まれている1つ以上のキーワードが、曖昧性除去語としてユーザに提供されてもよい。一実施形態では、提供される曖昧性除去語はユーザの検索文字列内の何れのトークンにも一致していなくてもよいが、他の実施の形態では、提供されるキーワードは検索文字列内のトークンに一致している。
曖昧性除去語は、可能な様々な任意の方法でユーザに提供されてもよい。例えば、図4に示されているように、その言葉はサーバ203(すなわち、方法100を実行するコンピュータ)からクライアント201のアプリケーションプログラム205に提供され、ユーザはそのクライアントから検索文字列を発行している。
アプリケーションプログラム205がインターネット又はWWWブラウザである実施の形態の場合、曖昧性除去語はウェブページの形式で提供されてもよい。図5は「bark」というユーザクエリについての概念定義から生成された言葉を含むウェブページの一例を示す。図5の要素503に示されているように、ユーザは、「bark」という言葉について彼又は彼女が意図している意味の曖昧性を除去するために1つ以上の言葉を選択してよい。
<IV.選択された曖昧性除去語に基づいて意図されている概念定義を特定する>
上述したように、方法100のステップ107において、ユーザは一群の曖昧性除去語の中から1つ以上を選択し、ユーザが選択した曖昧性除去語を示す指標又はインジケータが受信される。例えば、ステップ105において生成された言葉のリストを受信したアプリケーションプログラムは、1つ以上の言葉を選択するユーザからの入力を受け入れ、ユーザが選択した言葉のインジケータを、方法100を実行するサーバに送信する。図示のソフトウェアシステム700の場合、ステップ107の一部分(例えば、ユーザからの入力を受け入れること)は、ユーザインターフェースモジュール702により実行されてもよい。
ユーザが選択した言葉に基づいて、ステップ103で生成された概念定義は、検索文字列についてユーザが意図している意味を示す概念定義として選択される。これは様々な任意の方法で行われてよい。例えば、一実施形態では、ユーザが選択した何れかの言葉を含む概念定義の各々が特定され、特定された概念定義を表現する複数のセマンティックネットワークは、検索文字列についてユーザが意図している意味を最良に示す概念定義として機能する1つのセマンティックネットワークに統合される。
概念定義の複数のセマンティックネットワークは多数の任意の方法で統合又は併合されてもよい。図形又はグラフを用いていないセマンティック語彙を使用する場合、選択された複数の概念定義であって共通する1つの言葉を共有する複数の概念定義が、1つのセマンティックネットワークを構築するために使用されてもよい。単一のセマンティックネットワークは複数の概念定義に基づいて個々のセマンティックネットワークを統合することで形成されてもよく、セマンティックネットワークの各々は共通する言葉を表す頂点の概念定義を表現する。
図形又はグラフを利用するセマンティック語彙を利用する場合、2つの異なる概念定義が、セマンティック語彙の中の個々のノードから導出され、単独のセマンティックネットワークに統合されてもよい。「愛(love)、戦争(war)、小説(novel)」の1つの概念定義は、「愛と戦争(love and war)」のノード及びそれに隣接する「小説(novel)」のノードから導出されてもよい。「愛(love)、戦争(war)、映画(movie)」の第2の概念定義は、「愛と戦争(love and war)」のノード及びそれに隣接する「映画(movie)」のノードから導出されてもよい。個々のセマンティックネットワークにより最初に表現されるこれらの概念定義は、「愛と戦争(love and war)」の頂点付近において、隣接する頂点である「小説(novel)」及び「映画(movie)」と一緒に統合されてもよい。従って、ユーザにとってカスタマイズされた新たなセマンティックネットワークが形成されてもよい。
<V.拡張されたセマンティックネットワークを合成する>
上述したように、方法100のステップ109において、セマンティックネットワークは、ステップ107で特定された概念定義を用いて、検索文字列についてユーザが意図した意味を示す概念定義として合成されてもよい。図7に示すソフトウェアシステム700の場合、このステップはセマンティック合成モジュール703により実行されてもよい。この場合において、(例えば、ユーザ入力に少なくとも部分的に基づいて)ステップ107で特定された概念定義は、合成処理(synthesis process)に関する実際の概念定義(active concept definition)と考えられてもよい。
ステップ109における合成処理は、実際の概念定義で規定される概念に関する概念を特定し、実際の概念定義で規定される概念についての拡張されたセマンティックネットワークを生成する。すなわち、例えば、合成処理は、実際の概念定義内の言葉に関連する言葉を特定し、実際の概念定義中の言葉と関連する言葉との双方を含む拡張されたセマンティックネットワークを生成する。
合成された拡張されたセマンティックネットワークの概念は、ステップ101で受信したユーザが提供した検索文字列から導出される1つ以上の検索文字列の基礎として機能する。拡張されたセマンティックネットワークは、ユーザのクエリ又は意図に合う大規模な一群の関連用語を提供し、体系的及び非体系的なコンテンツソース双方によるダウンストリーム検索処理を促進する。
セマンティックネットワークは任意の様々な方法で実行されてもよい。一実施形態で使用されてよいセマンティックネットワークを合成する可能な方法の1つが以下において説明される。この方法の場合、実際の概念定義により規定される概念に関する候補の一群の概念(又は一群の概念候補)が生成される。一群の概念候補は、実際の概念定義内のキーワード及びセマンティック語彙の中のキーワードを用いて生成されてもよい。上述したように、セマンティック語彙は、一群のキーワードをキーワード間の関連性(例えば、親子関係)と共に含む。この意味において、セマンティック語彙はキーワードの階層と考えられてもよい。図7に示すソフトウェアシステム700の場合、セマンティック語彙は語彙モジュール713により示されている。
一実施形態では、使用されるセマンティック語彙は、概念定義を生成する際にステップ103で使用したのと同じセマンティック語彙であってもよいが、別の実施形態では、異なるセマンティック語彙が使用されてもよい。上述したように、セマンティック語彙は修正又は増強されてもよい。一実施形態において、セマンティック語彙は、いわゆる「トレンディ(trendy)」語(例えば、所定の閾値より高い範囲である所定の範囲内のトレンドスコアを有する言葉)と共に修正又は増強されてもよい。従って、セマンティックネットワークは、セマンティック語彙の中の言葉及び1つ以上の「トレンディ」語に少なくとも部分的に基づいて生成され、「トレンディ」語はそれらのトレンドスコアに基づいて選択される。トレンディ語を特定し、関連するトレンドスコアを計算する方法については、以下のセクションVIIIで詳細に説明される。
実際の概念定義中の一群のキーワードは、明示的に関連する祖先及び子孫のキーワード群を発見するために、セマンティック語彙内のキーワード階層と比較される。実際の概念定義を形成するキーワード群中の要素の部分集合であって及び/又は実際の概念定義を形成するキーワード群の明示的な祖先であるセマンティック語彙の中のキーワード群は、実際の概念定義に関するキーワード群の中での可能性のある先祖のキーワード群として考えられてよい。先祖のキーワード群各々において、各キーワードは自身の一群の意味的に関連する概念を有する。所与のキーワード群に属する異なるキーワードから得られたこれらの意味的に関連する概念の組み合わせは、キーワード群に合致する関心のある概念を生成するのに使用され、かつ候補の概念群に関する概念を生成するのに使用されてもよい。例えば、実際の概念としての「オレンジの木」は、ある祖先のキーワード群として「柑橘類の果樹園(citrus orchard)」を有するかもしれない。更に「柑橘類の果樹園」は関連する概念として「ライムの茂み(lime bush)」というキーワード群を有し、「ライム(lime)」は「柑橘類」から導出され、「茂み」は「果樹園」から導出されている。従って、「ライムの茂み」は関心のある又は対象の概念であり、実際の概念定義の「オレンジの木」のキーワード群に合致している。
同様な処理が、実際の概念定義に関するキーワード群について子孫キーワード群を特定するために使用されてもよい。例えば、実際の概念定義についてのキーワード群に属する子孫の言葉を明示的に表す要素であって及び/又は上位集合(superset)であるセマンティック語彙の中のキーワード群は、可能性のある子孫概念を表す。例えば、概念の候補群が、実際の概念に関連するキーワード群の組み合わせを含んでいてもよい。例えば、「実際の概念としての「オレンジの木」は、「オレンジの樹木作物の収穫高(orange tree crop yield)」を子孫キーワード群として有し、「フロリダのオレンジの木」を別の子孫キーワード群として有していてもよい。「フロリダの樹木作物」のような「樹木作物」及び「フロリダ」の組み合わせは、関心のある対象でありかつ実際の概念定義の「オレンジの木」のキーワード群に合致している。更に、1つより多い子孫キーワード群の中で発見された言葉(例えば、複数のキーワード群の交わり)が、関心のあるもの又は対象であってもよい。1つより多い子孫キーワード群で生じるそのような言葉全ての統合又は取得された集まりは、一群の概念候補のキーワード群を表現する。
概念の階層形式でセマンティックネットワークを生成するために、ある一群の導出規則が、候補群の概念各々のキーワード群に適用されてもよい。実際の概念定義のキーワード群は、候補群の概念に関するキーワード群各々とペアをなすように関連付けられる。ペアの各々に関し、実際の概念定義に関するキーワード群を、ペアに関連付けられているキーワード群に変換する一連のキーワード群処理が導出されてもよい。「導出(derivation)」と言及されるこれらの処理は、候補の概念が実際の概念定義により規定される概念にどのように関連しているかを決定する。
任意の様々な可能な導出処理が実行されてよい。実施の形態で使用されてよい4つのタイプの導出処理の具体例が、以下に説明される表1に示されている。
表1:導出処理の類型
Figure 0005925769
全てのキーワードの関連性の方向性(directionality)は、潜在的な概念の関係性のペアにおけるものに一致している必要があることに留意を要する。キーワード群のペアはそれらのキーワードの間で祖先の関係又は子孫の関係を有するが、双方は有しない。セマンティックネットワーク合成処理は、祖先の処理(p,d)又は子孫の処理(a,c)の何れかのみを適用することで(双方は適用しない)、その方向性を確保し、概念同士の間の関係性を設定する。これは、概念が、関連しない概念に対応するもので置換された全てのキーワードを有しないようにする。
例えば、実際の概念定義が{A,B,C}というキーワードを有し、一群の概念候補に属する候補概念が{D,B,G,F}というキーワードを有していたとすると、これら3つのキーワードに対応する実際の概念定義に関する3つの軸が存在する。概念同士の間に関連性があるか否かを判定するために、先ず明示的な関係を使用し、例えばAからその明示的な子孫Dへの明示的な関係と、Cからその明示的な子孫Gへの別の関係とを使用してよい。(これらは共にcの処理であり、キーワードを子孫のキーワードで置換する)。最後に、子孫キーワード(すなわち、F)を追加する黙示的な処理aを使用することで、候補の子孫に合致する実際の概念定義のキーワード群が得られる。従って、その候補を実際の候補定義の子孫とすることができる。
実際の群(active set)及び候補のキーワード群をペアにする場合に、3つの可能なキーワード群が存在することを説明する。
・候補群のみに関連するもの(「候補のみ」のキーワード)
・候補群及び実際の群の双方に関連するもの(「双方」のキーワード)
・実際の群のみに関連するもの(「実際のみ」のキーワード)。
実際の群を候補群に変換することが、「実際のみ」のキーワードを除外する必要があった場合、その候補群は実際の群の祖先となる。実際の群が候補群と同数のキーワードを含みかつ如何なる候補キーワードとも親子関係を有していなかった場合、その候補群はその実際の群と兄弟姉妹の関係(sibling)にある。実際の群を候補群に変換することが「候補のみ」のキーワードを追加する必要があった場合、その候補群は実際の群の子孫になる。
2つの元々の群(original set)が既に共通するキーワードを有しているか否かによらず、「実際のみ」のキーワードを削除しかつ「候補のみ」のキーワードを追加することの双方により実際の群を候補群に変換することは、有効ではない。そのようなペアは関連しない(unrelated)と考えられる。これについての例外は、「のみ」の群におけるキーワードが語彙のキーワード階層の中で関連している場合である。そのような場合、1つ以上の処理が実行されてよい。
・実際の群のキーワードを親のキーワードで置換すること(実際の群の祖先である候補群で置換);又は
・実際の群のキーワードを子のキーワードで置換すること(実際の群の子孫である候補群で置換)。
従って、一群の概念候補内の概念の各々は、実際の概念定義に至る固有の導出系統(unique derivation series)を有する。合成処理における導出過程が保存される順序及び処理の順序は、結果の階層における概念の順序に影響を及ぼす。その階層における概念候補の優先度は、以下の表2に従って決定されてもよい。
表2:結果の階層を決定する際の導出の優先順位
Figure 0005925769
導出規則及び優先度の適用の結果は、概念の階層形式による拡張されたセマンティックネットワークとなる。
<VI.検索文字列を発行し、結果を選別する>
上述したように、方法100のステップ111においては、ステップ109で生成されたセマンティックネットワークが、1つ以上の検索サービスのために与えられる1つ以上の検索文字列を生成するのに使用される。例えば、セマンティックネットワークにおける1つ以上の概念の各々が検索文字列として検索サービス部に対して発行される。図7に示すソフトウェアシステム700の場合、クエリは選別抽出エージェントモジュール705における抽出エージェントによって発行され、検索文字列は情報抽出サービスモジュール709によって使用される。
検索サービスは任意の汎用サーチエンジンを使用してもよい。例えば、検索サービスはインターネットを通じて公にアクセス可能であってもよい。そのような検索エンジンの具体例は、グーグル(Google)(登録商標)、ビン(Bing)(登録商標)及びヤフーサーチ(Yahoo!Search)(登録商標)等を含む。別の例として、検索サービスは、インターネット以外の何らかのコンピュータネットワークを通じてアクセス可能なサーチエンジンを使用してもよい。そのような検索エンジンの具体例は、企業イントラネットワーク又はその他の任意のプライベートネットワークでの検索に使用されるサーチエンジンを含む。
検索サービス部に対して発行される検索文字列又は一群の検索文字列は、任意の様々な可能な方法でセマンティックネットワークから生成されてよい。例えば、一実施形態では、セマンティックネットワークの概念階層におけるルートノードが、検索文字列として検索サービス部に対して発行されてもよい。概念階層における残りの概念は、後述するように、検索結果を選別、フィルタリング、ランキング及び/又は順序付けするために使用されてよい。別の例として、検索文字列は、概念階層における概念各々を「AND」の論理演算により一緒にすることで形成され、その検索文字列を検索文字列として発行してもよい。
検索文字列を生成するために実施の形態で使用されてよい他の方法の具体例は、概念階層の中でユーザが明示的に入力した各々の言葉(すなわち、ステップ101で受信した検索文字列からのトークン及びステップ107で受信した曖昧性除去語)を「AND」の論理演算で結合すること、又はそれらの言葉に関する言葉を「OR」の論理演算で結合することである。従って、例えば、元々はユーザが「愛と戦争」の文字列を入力し、一群の曖昧性除去語の中から「小説」という言葉を選択していた場合、「愛」、「戦争」及び「小説」の言葉が「AND」の論理演算により検索文字列の中で結合される。また、これらの言葉の各々が「OR」の論理演算によって関連する言葉に結合されてもよい。例えば、「愛」に関連する言葉が「愛情」及び「結婚」であり、「戦争」に関連する言葉が「戦闘」及び「争い」であり、「小説」に関連する言葉が「本」及び「文学」であることを概念階層が示していた場合、結果の検索文字列は、「(愛OR愛情OR結婚)AND(戦争OR戦闘OR争い)AND(小説OR本OR文学)」となってもよい。この種の複合的な文字列をエンドユーザが構築することは希である。これは、検索文字列の意味の詳細な表現を作成できる。拡張されたセマンティックネットワークと共に生成された複合的な検索文字列は、元々の検索文字列において不要な文字通りの言葉である検索サービスでインデックスが付されているコンテンツ内の文字通りの言葉には一致しないので、たとえコンテンツについて意味が分析される前であったとしても(すなわち、構造化、組織化又は体系化されていないコンテンツであったとしても)、有効なセマンティック検索を行うことができる。
1つ以上の検索文字列を検索サービス部に対して発行したことに応じて、一群の検索結果が検索サービス部から受信される。検索結果における文書又はコンテンツの文字列(又は文字列を分割したもの)が、ステップ109で生成されたセマンティックネットワーク内の概念定義と比較され、返される検索結果は、それらが概念定義にどの程度一致しているかに基づいてランキング及び/又は選別されてもよい。図7に示すソフトウェアシステム700の場合、検索結果の選別、フィルタリング及びランキングは、選別抽出エージェントモジュール705の選別エージェントによって実行されてよい。
ランキング又は選別を行う任意の様々な可能な方法が使用されてよく、本発明は特定の方法に限定されない。検索サービス部は、名称、概要、説明、タグ、ハイパーリンク等のようないくつものテキスト属性を検索結果で提供してもよい。これらのテキスト属性は、拡張されたセマンティックネットワークを通じて提供された言葉に対して検索結果を選別(フィルタリング)するためのテキスト分析に使用され、例えば、それらの言葉と検索結果のテキスト属性内のワードとが比較される。完全に又は部分的に一致する言葉が、個々の検索結果を重み付けするのに使用されてもよい。
更に、一実施形態では、セマンティックネットワークを用いて文書又はコンテンツの各々に意味に基づく注釈又はタグが付され、文書又はコンテンツの意味を記述するセマンティックメタデータが文書等にメタデータとして組み込まれるようにしてもよい。図7に示されているように、モジュール707は、ソフトウェアシステム700においてコンテンツに意味に基づく注釈付け(semantic annotation)を行う。コンテンツに意味に基づく注釈を付ける任意の様々な方法が使用されてよい。例えば、一実施形態において、1つ以上のコンテンツノードがコンテンツ各々に対して特定され、コンテンツノードには、セマンティックネットワークに関して最も合致する概念定義と共にタグが付されてもよい。
更に、一実施形態では、ユーザが提供した文字列の意味を利用して、図11の方法例1100に示されているように検索結果をランキングする及び/又は注釈を付けてもよい。方法1100はステップ1102から始まり、ユーザが与えた検索文字列が受信される。本方法はステップ1104に続き、ユーザの検索文字列の意味表現が生成される。例えば、ユーザの検索文字列について可能性のある意味の1つを表す概念定義が、ステップ1104で生成される。
本方法はステップ1106に続き、ユーザが与えた検索文字列が発行され、ステップ1108において検索結果が受信される。次に、ステップ1110において、1つ以上の言葉が特定され、特定された言葉の各々が、検索結果とユーザの検索文字列の意味表現との双方に含まれるようにする。例えば、検索結果において検索サービス部が提供したテキスト属性は、ユーザの検索文字列の意味表現(例えば、概念定義)に含まれている言葉を有してもよい。
本方法はステップ1112に続き、ステップ1108で受信した検索結果が、ステップ1110で特定された言葉に少なくとも部分的に基づいてランキングされる。ランキングは、任意の適切なランキング方法を用いて実行されてよく、本発明は特定の方法に限定されない。例えば、検索結果は、検索文字列の意味表現と共通する言葉の数に比例してランキングされてもよい。追加的又は代替的に、検索結果に注釈が付けられてもよい。例えば、検索結果に関連するメタデータに、ステップ1110で特定された言葉に関する注釈が付けられてもよい。検索結果がランキングされ及び/又は注釈付けされた後、本方法1000は終了する。
一実施形態では、検索サービス部から返される検索結果が、特定されたコンテンツそのものを含んでおらず、コンテンツ各々自体ではなく、それらのコンテンツに至るハイパーリンクのリストを含んでいてもよい。そのような実施の形態の場合、むしろ、提示されたハイパーリンクを用いてコンテンツ各々を抽出し、ハイパーリンクのリストは、関連する抜粋部分を利用して選別又はランキングされ、その抜粋部分には意味に基づく注釈が付けられてもよい。
意味に基づいて注釈が付けられたコンテンツは汎用コンテンツストリーム部(例えば、意味に基づいて注釈が付けられたコンテンツのリポジトリ又は記憶部)に返され、コンテンツの意味情報が将来使用されてよいようにする。セマンティックウェブのような発明によれば、意味に基づいて注釈が付されたコンテンツを記憶及び抽出する手段を提供できる。
<VII.検索結果をユーザに表示する>
上述したように、方法100のステップ113では、検索結果が選別及び/又はランキングされると、検索結果がユーザに出力される(例えば、表示される)。例示のソフトウェアシステム700の場合、ステップ113はユーザインターフェースモジュール702により実行されてもよい。しかしながら別の実施の形態の場合、検索結果は、検索結果を取得した検索サービス部がユーザに出力してもよい。これは様々な方法で実行されてよい。例えば、一実施形態では、検索結果は、検索結果の中の文書又はコンテンツに至るハイパーリンクのリストを含むウェブページとしてユーザに表示されてもよく、そのリストはステップ111で決定されたランキングに基づいて並べられている。ユーザは、その対応するハイパーリンクを選択することで任意の文書又はコンテンツにアクセスできる。
<VIII.新たな言葉を抽出する>
一実施形態では、(セクションIIで説明したような)サーチクエリ又は検索文字列の意味表現を生成する場合及び(セクションVで説明したような)拡張されたセマンティックネットワークを合成する場合に使用されるセマンティック語彙(例えば、用語の語彙又は語彙データベース713)は、静的、不変的又は固定的であってもよいが、発明者等は、セマンティック語彙に新たな言葉を追加することで又はセマンティック語彙から言葉を削除することでセマンティック語彙を更新する処理は、よりいっそう関連する検索結果をユーザに提供することに寄与することを認識した。更に、さらに、リアルタイムウェブで言葉(例えば、キーワード)が頻繁に変化する環境の場合、最近使用頻度が増えた言葉を抽出することは、非常に流行っている言葉又はトレンド語(high-trending term)を突き止めること及び/又は他の恩恵をもたらす現在の語彙群を維持することに寄与する。
一実施形態では、インターネットのようなネットワーク又は適切な他の任意のソースからのタイムスタンプコンテンツ(タイムスタンプが付いているコンテンツ)が、言葉を使用する傾向又はトレンドを判定するために分析されてもよい。例えば、ブログ(タイムスタンプブログエントリ(タイムスタンプが付いたブログのエントリ))及び/又は(例えば、RSSフィードのような)リアルタイムインターネットストリームのようなインターネット情報ストリームが、ある時間的な期間にわたる言葉の使用傾向を分析するのに使用されてもよい。
言葉の使用傾向(trends in term use)は、時間の関数のようなターム頻度又は言葉の頻度(term frequency)に基づいて判定されてもよい。例えば、言葉の使用頻度は、時間の関数のような言葉の頻度の変化率に基づいて判定されてもよい(例えば、時間の関数としての言葉の頻度を時間で微分したものに基づいて判定されてもよい)。
言葉の使用傾向を判定する際に、考察されている言葉各々のトレンドスコア(trend score)を評価してもよい。言葉のトレンドスコアは、時間関数としてのその言葉の使用頻度に少なくとも部分的に基づいて算出されてもよい。一実施形態の場合、登場する言葉各々について、言葉の出現頻度が時間の関数として割り引かれる(discounted)又は低下させられる(decayed)ようにし、言葉が新しければそのトレンドスコアは高くなるが、言葉が主流になってくるとその言葉のトレンドスコアが減少するようにしてもよい。言葉の使用頻度が時間の関数として低下されられるので、言葉の使用頻度は時間の関数として変化し、任意の2つの時点において異なる値をとる。従ってトレンドスコアは時間tにおける「瞬時的な(instantaneous)」頻度に依存する。
言葉の使用頻度は、文書に含まれている言葉のトレンドスコアに基づいて文書の適時性(timeliness)を評価するのに使用されてもよい。ただし、言葉がコンテンツ(例えば、文書、フィード(feed)等)の中でどの程度頻繁に搭乗するかに基づいて文字列の傾向又はトレンドを検出することに加えて、何らかの時間に基づくデータの傾向が判定されもよいことが、認められるべきである。例えば、やり取りを行った時点がトレンドを検出するために使用されてもよく、例えば、1人又は何人ものユーザが文章中のリンクをクリックしたこと又はコンテンツに関する意図を通知したことが、トレンドを検出するのに使用されてもよい。ユーザがコンテンツに関する意図を通知する別の時間に基づく具体例は、ユーザが文字列を入力して検索を実行した時点である。
過去に高いトレンドスコアを持っていた言葉は、進行中の分析、又はコントロールされている言葉の語彙(例えば、上記のセマンティック語彙)に含めることについての歴史的根拠(historical base)をもたらす。言葉は、コントロールされた言葉の語彙に対して評価されてもよいし或いは選別されてもよい。
一実施形態で使用されてよい使用される言葉のトレンドを判定する方法の1つが以下に説明される。本方法は、入力の中の言葉を特定するステップと、各々の言葉についてトレンドスコアを計算するステップとを有する。各言葉のトレンドスコアを評価するステップにおいて、多数の中間的な量(a number of intermediate quantities)を評価し、選択的に、言葉に関連する時間に少なくとも基づいて1つ以上の中間的な量の値を修正する。例えば、本方法は、言葉についての使用頻度値を計算するステップを有し、本方法は劣化関数(decay function)に基づいて言葉の使用頻度値を修正するステップを有する。
一実施形態において、トレンド語を判定するために分析される文字列を生成する時間は既知である。例えば、文字列はタイムスタンプを有している。他の実施の形態では、文字列には、フィード(feed)が最初に生じた時間が分かるように、1つ以上のインターネット情報ストリームが与えられてもよい。図7に示すソフトウェアシステムの場合、トレンド語の判定は時間に基づく用語抽出モジュール711により実行されてもよい。
入力された文字列サンプルにおいて、複数のトークンは任意の様々な方法を利用して区切られ、言語依存法(language-dependent manner)により区別されてもよい。言葉がスペース又は空白で区切られている言語の場合(例えば、英語、フランス語、スペイン語等の場合)、ワードは、ワード間の空白に基づいて文字列を分割することで判定されてもよい。分析される言語タイプを特定するために、ユニコードポイント値(Unicode point value)が使用されてもよい。ユニコードポイント値は、世界中の多くの表記法で表現される文字を、一貫した方法で符号化、表現及び処理するための標準使用に基づく値である。これらの値は分析された言語のタイプを判定するのに使用される。なぜなら、空白で区切られた文字列の長さは言語毎に異なるが、特定のカテゴリの言語の中では一致度が維持されるからである。従って、空白で区切られた特定の文字列についての平均的なユニコードポイント値が閾値を超えていた場合、それは表意文字(例えば、中国語、日本語等)を使用している言語であることが示唆される。従って、文字列はヌルストリング(null string)に再び分割される或いは個々の文字に分割され、結果のトークンがワードとして処理される。
1つの言葉、2つの言葉、3つの言葉及び4つの言葉による語句又はフレーズの各々が保存され、その後にトレンドスコアに基づいてランキングされる。ランキングはセマンティック語彙に追加する多数の言葉を特定するのに使用されてもよい。例えば、最上位にランクされた言葉(例えば、最上位の1つ、上位5個、上位10個、上位100個の言葉)がセマンティック語彙に追加されてもよい。場合によっては、トレンドスコアが所定の範囲内にある言葉(例えば、所定の閾値を超えている言葉)がセマンティック語彙に追加されてもよい。
入力されたフレーズの出現総数に基づいて、nワードフレーズ(すなわち、n個のワードが含まれているフレーズ又は語句)の各々についてランニングカウントが維持されてもよい。従って、例えば、システムは、入力された文字列の中にある1ワードフレーズの総数のカウント値、入力された文字列の中にある2ワードフレーズの総数のカウント値、入力された文字列の中にある3ワードフレーズの総数のカウント値、及び入力された文字列の中にある4ワードフレーズの総数のカウント値を維持してもよい。更に、固有のフレーズ各々について、システムは、そのフレーズの出現総数のカウント値を維持してもよい。例えば、「特許(patent)」というフレーズが入力文字列の中に500回登場していた場合、システムはそのフレーズについて500回というカウント値を維持する。同様に、「特許出願(patent application)」というフレーズが入力文字列の中に300回登場していた場合、システムは素のフレーズについて300回というカウント値を維持する。
フレーズの各々について、システムは言葉の頻度又はターム頻度(term frequency)を算出し、ターム頻度は、そのフレーズの出現総数をその長さのフレーズの総数で除算したものである。例えば、「特許(patent)」というフレーズが入力文字列の中に500回登場していた場合であって、入力文字列に登場した1ワードフレーズの総数が百万であった場合、ターム頻度は500を百万で除算したもの(0.0005)となる。同様に、「特許出願(patent application)」というフレーズが入力文字列の中に300回登場していた場合であって、入力文字列に登場した2ワードフレーズの総数が500000であった場合、ターム頻度は300を500000で除算したもの(0.0006)となる。
フレーズの総数のみに基づいてターム頻度を判定する場合、カウント数が大きくなるにつれて、特定のフレーズの新たな出現は、そのフレーズについてのターム頻度にほとんど影響しないことを、発明者等は認識した。この問題は、固有のフレーズ各々についてのカウント数及び総フレーズカウント数を適切に修正することで解決できることを、発明者等は認識した。特に、発明者等は総フレーズカウント数及び固有のフレーズカウント数はそれぞれ時間の関数として低下することを認識した。
カウント数は適切な如何なる方法で低下させられてもよい。一実施形態では、低下(decay)は低下率パラメータ(rate of decay parameter)の値の関数として規定されてもよい。低下率パラメータは指数関数的な低下率を示す。従って低下率パラメータ値は半減期パラメータ(half life parameter)であってもよい。1日、2日、3日、5日、1週間、2週間等のような又はその他の任意の適切な半減期の値が使用されてよい。一実施形態において、半減期パラメータの値は、入力文字列を与えるインターネットフィードから新た案文字列が受信されるレートに依存してもよい。
低下させたターム頻度(decayed term frequency)は、低下させたフレーズのカウント値を、低下させたフレーズの総数で除算するようにして算出されてもよい。表3に示されているように、時間t1における低下させたカウント値は、時間t0における低下させたカウント値に、eのA乗を乗算したものに等しく、Aは時間t1マイナスt0に定数kを乗算したものである。この数式は、特定のフレーズについての低下したカウント数及びフレーズ総数についての低下した総カウント数を得るのに使用されてもよい。
表3
Figure 0005925769
定数kは選択された半減期パラメータに基づいて決定され、kの値を決定するための数式は表4に示されている。以下の表4に示されているように、kの値は0.5の自然対数を選択された半減期(half)マイナスlifeの値で除算したものである。
表4
Figure 0005925769
表3の数式では、特定の現時点の低下したカウント数は、より早期の時点における低下したカウント値に基づいて算出される。しかしながら、システムが起動した最初の時点では、現在の低下したカウント値を算出するための先行する低下した値が存在しない。従って一実施形態では最初の低下した値を計算する場合には「低下していない(undecayed)」ターム頻度(すなわち、如何なるカウント値も低下させずに算出される言葉の頻度)が、ある値dct0として使用される。
上述したように、低下した頻度は、ワード各々から、そのワードについて低下したターム頻度を、低下したワードの総数で除算したものを利用することで算出されてよい。その後に、低下したターム頻度の合計値(SDTF)が、1ワードフレーズ、2ワードフレーズ、3ワードフレーズ及び4ワードフレーズの各々について算出される。フレーズ各々のSDTFの値は、フレーズ中の全てのワードの低下した頻度を合計することで算出される。フレーズが3つのワードを有していた場合、そのワードのSDTFは、フレーズ中の第1のワードの低下した頻度と、フレーズ中の第2のワードの低下した頻度と、フレーズ中の第3のワードの低下した頻度とを一緒に加算することで算出される。
次に、マルコフスコア(Markof Score)が各フレーズについて算出される。複数のワードフレーズについてのマルコフスコアは「インナーTF(innerTF)」/「エンドTF(endsTF)」に等しい。シングルワードフレーズの場合、マルコフスコアは1/「エンドTF」に等しい。
「エンドターム頻度(ends term frequency)」又は「エンドTF」は、フレーズの最初のワードに先行する入力文字列中の固有の言葉の数と、フレーズの最後のワードの後に続く入力文字列中の固有の言葉の数との和である。例えば、2ワードフレーズがワードw1及びw2を有する場合、ワードw1に先行する入力文字列中に異なるワードがいくつ存在するか及びワードw2に続く入力文字列中に異なるワードがいくつ存在するかを判定する。「エンドTF」の値は、ワードw1に先行する入力文字列中に存在する異なるワードの数とワードw2に続く入力文字列中に存在する異なるワードの数との総和である。
「インナーターム頻度(inner term frequency)」又は「インナーTF」はフレーズをワードのペアに分割することで判定される。この点に関し、1ワードフレーズは「インナーTF」の値を有しないことに留意を要する。マルチワードフレーズの場合、フレーズ中の各々のワードとそれに先行するワードとを組にすることで、ペアが生成される。例えば、ワードw1及びw2を含む2ワードフレーズの場合、(w1,w2)という唯一のペアが生成される。ワードw1、w2及びw3を含む3ワードフレーズの場合、生成されるペアは(w1,w2)及び(w2,w3)である。ワードw1、w2、w3及びびw4を含む4ワードフレーズの場合、生成されるペアは(w1,w2)、(w2,w3)及び(w3,w4)である。生成されるワードのペア各々について、入力文字列中にワードのペアが登場する回数が判定され、ワードのペア各々について出現回数を生成する。「インナーTF」の値を生成するために、フレーズ中の全てのペアについての出現カウント数が合計される。
各フレーズについてのマルコフスコアに基づいて、以下に説明されるようにフェーズ各々についてマルコフスコア因子(Markov Score Factor:MSF)が算出される。あるフェーズについてのマルコフスコアが0であった場合、そのフェーズについてのMSFは、そのフレーズについてのSDTFに或る因子を乗算することで生成される。適切な任意の因子が使用されてよい。一実施形態では使用されるその因子は2である。しかしながら他の実施の形態では1-100の範囲内に含まれる任意の因子が使用されてよい。好ましくはその因子は10未満である。より好ましくはその因子は5未満である。
フェーズについてのマルコフスコアが0でなかった場合、そのフェーズについてのMSFは、そのフェーズについてのSDTFに、以下の表5に示されているようなマルコフスコア(Markov Score)のexp乗を乗算することで算出される。expは適切な値に設定される。一実施形態においては、expの値は1.5であってもよい。しかしながら他の実施の形態では1-100の範囲内の任意の値が使用されてよい。好ましくは、その値は10未満である。より好ましくはその値は5未満である。
表5
Figure 0005925769
各フレーズについてのMSFは、以下に示すように、各フレーズについて「マルコフスコア因子ロングタームバイアス(Markov Score Factor Long Term Bias:MSFLTB)を算出するために使用されてよい。あるフェーズについてのMSFLTBは、そのフェーズについてのMSFを、以下の表6に示されているようにそのフェーズ中のワード数nをexp乗したもので除算することによって算出され、nはMSFLTBが算出されているフェーズ内のワード数に等しい。expは適切な任意の値に設定される。一実施形態においては、expの値は2.5であってもよい。しかしながら他の実施の形態では1-100の範囲内の任意の値が使用されてよい。好ましくは、その値は10未満である。より好ましくはその値は5未満である。
表6
Figure 0005925769
フェーズについてのトレンドスコアは、以下の表7に示されている数式を用いて算出され、ここでdfはそのフェーズについての低下したターム頻度であり、tcはそのフェーズについての平均化されたトレンドカウント値である(これについては表8に関連して後述される)。expは適切な任意の一定値である。一実施形態においては、expの値は3であってもよい。しかしながら他の実施の形態では1-100の範囲内の任意の値が使用されてよい。好ましくは、その値は10未満である。より好ましくはその値は5未満である。
時刻t1における或るフェーズについての平均トレンドカウント値は、以下の表8に示されているように、時刻t0におけるそのフェーズの平均トレンドカウント値と、時刻t1におけるそのフェーズについての低下したターム頻度との重み付け加算値として算出される。図8に示されている数式の場合、zが重み付け因子である。適切な任意の重み付け因子が使用されてよい。例えば一実施形態ではzは0.85の値を有するが、0及び1の間に含まれる任意の因子が使用されてよい。
表7
Figure 0005925769
表8
Figure 0005925769
表7の数式を用いて算出されたフェーズのトレンドスコアに基づいて、フェーズ各々がランキングされ、トレンドスコアが低いほど高いランキングとなる。そして、上位にランキングされる言葉がセマンティック語彙に含められてもよい。例えば、ランキングにおける上位15個のフレーズ或いは他の任意の適切なフレーズの部分が、セマンティック語彙に含められ、この点については以下のセクションXで説明される。
<IX.トレンディ語を用いて実際の概念に関連する概念を特定する>
本発明による別の形態では、実際の概念に関する概念又はコンセプトが、様々な方法を用いて「トレンディ語又はトレンディターム(trendy terms)」のデータベースの中で特定される(例えば、トレンディスコアで測定されるトレンディタームの流行性、普及度又は重要性は、時間と共に増加する)。トレンディ語を特定する方法は上記のセクションVIIIで説明されており、セクションVで説明されているように、実際の概念に関連する概念が、セマンティック語彙及び/又はセマンティックネットワークを改善するために使用されてもよい。
リファレンスコーパス又はデータベース(例えば、ウィキペディア(登録商標)及び/又はリファレンスの他のソース)は、関連する概念を特定するために使用されてよい他のタイプのソースの具体例である。発明者等は、リファレンスコーパスが、「トレンディ語」データベース及び1つ以上のリファレンスコーパス双方を用いて関連する概念を特定するのに有用であることを認識した。更に、概念がトレンディ語データベース又はリファレンスコーパスから導出されているか否かに基づいて、実際の概念に関連していると判定される概念を分類し、関連する一群の概念をユーザに提示する場合に、関連する概念各々のカテゴリをユーザに通知することが有用であることを、発明者等は認識した。
一実施形態は、「実際の概念又はアクティブ概念(active concept)」と言及されるソース概念に関連する概念を判定する目的で使用される。一実施形態では、実際の概念は、ユーザが提供した検索文字列又はサーチクエリから導出されてもよい。上述したように、一実施形態では、関連する概念が特定され、その関連する概念がユーザに提示され、ユーザの検索文字列の曖昧性を排除、純化又は洗練するために使用される概念をユーザが選択できるようにし、その結果、ユーザが検索に意図しているものに非常に関連している傾向が強い検索結果をサーチエンジンが提示できるようにする。
一実施形態では、実際の概念に関連する概念は、以下の(1)-(4)の4つのカテゴリの内の何れかに分類されてもよい:(1)リアルタイムデータ中に存在する非常に流行っている言葉であると判定された関連概念(「ページキャスト(pagecast)」カテゴリと言及される)、(2)リアルタイムデータ中に存在するが、何れのリファレンスコーパスにも存在しない流行っていない言葉であると判定された関連概念(「オフキャスト(offcast)」カテゴリと言及される)、(3)リアルタイムデータ及びリファレンスコーパス双方の中で判定される概念であって、背景の内容のように見える概念(「リキャスト(recast)」と言及される)及び(4)あるリファレンスコーパスの中で判定されるが、利ありタイムデータには含まれていない概念(「ディープキャスト(deepcast)」と言及される)。
図8は、関連する概念を上記の4つのカテゴリの何れかに分類する方法を示す。図8A及び図8Bに示されているように、先ず、実際の概念又はアクティブ概念801が1つ以上のRSSフィードと比較される。1-12の番号が付いた各々のボックスは、リアルタイムデータ803を有すると考えられるRSSフィードを表す。実際の概念801内の各ラベルは一群のRSSフィードと比較され、合致するRSSフィードを判定する。この場合における合致(matching)は、RSSフィードが、実際の概念の中に見出される文字通りに又は意味的に関連する言葉を含んでいることを意味する。上記の例の場合、実際の概念に属する参照番号809で示されているラベル1は、参照番号805及び807でそれぞれ示されているRSSフィード#6及びRSSフィード#9の双方に合致している。図8Cでは12個のRSSフィードしか示されていないが、実際には、より多くのRSSフィードが分析され、実際の概念におけるラベルと比較される。関連する概念はリファレンスソース(例えば、Wiki)の中から特定されてもよい。
次に、合致するRSSフィードからの属性が、リファレンスソースから特定された関連する概念からの属性と比較されてもよい。例えば、図8A及び図8Cに示されているように、参照番号807で示されているRSSフィード#9からの属性が、Wiki811(すなわち、リファレンスコーパス)から取得された属性と比較される。同様に、参照番号805として示されているRSSフィード#6からの属性が、Wiki811からの属性と比較される。
図8Cに示されているように、属性x1,x2,x3,x4及びx5は合致するRSSフィード及びWiki811の双方に存在している。従ってこれらの属性は、リアルタイムデータ(例えば、RSSフィード)及びリファレンスコーパス(例えば、Wiki)から導出される関連する概念と考えられてよく、上記のカテゴリ(3)に分類される。属性x9及びx10はWiki811のみに存在し、何れのRSSフィードにも存在しておらず、従って上記のカテゴリ(4)に分類される。
属性x6,x7,x8,x19及びx16はリファレンスコーパスには存在せず、合致するRSSフィードにのみ存在している。これらの属性は、それらが非常に高い値のトレンド語であると考えられるか否かに依存して、カテゴリ(1)又はカテゴリ(2)の何れかに分類されてもよい。上記のセクションVIIIで説明したトレンド評価方法を用いることで、言葉が流行っているか否かが判定されてもよい。非常に流行っている又は人気のある言葉は第1のレベルの言葉を形成するが、流行っていない又は共通していない(non-intersecting)言葉は、図8Dに示されているように第2のレベルをなす。
以下、例示的な実際の概念(active concept)として「グリーン技術(Green Technology)」を使用する別の例を説明する。先ず、実際の概念が1つ以上のRSSフィード803と比較され、何れのRSSフィードが実際の概念であるかを判定する。実際の概念は以下の3つのRSSフィードに合致してよい。
・レベル1:www.ecoseed.orgのエコシード(ソーラーパネル、エネルギ液化システム(devolatilization system)、藻類バイオ燃料(algae biofuel)、維持可能なバイオマス電力(sustainable biomass power)、水力発電力、電気自動車、地熱)。
・レベル2:www.greenprogress.comのグリーンプログレス(ソーラーパネル、電気自動車、風力発電地帯、液体水素燃料セル、地熱、藻類バイオ燃料、維持可能な石膏ボード(sustainable gypsum board))。
・レベル3:www.ecofriendsnews.comのエコフレンド(風力発電地帯、ソーラーパネル、太陽光温水ヒータ、バイオマス加熱システム、オーロラ藻類バイオディーゼル(Aurora algae biodiesel)、潮汐エネルギ、廃熱エンジン)。
括弧内の言葉はRSSフィードに現れている言葉又はワードである。次に、リファレンスコーパス(例えば、Wiki)からの関連する属性が取得され、特定されたRSSフィードの属性と照合される。上記の例の場合、en.wikipedia.org/wiki/Environmental_Technology、Wikipediaの「グリーン技術(Green Technology)」がリファレンスコーパスとして使用される。以下に示されているように、「ソーラーパネル」、「バイオマス」及び「電気自動車」という言葉がフィード1及びWikiの双方に登場している。「ソーラーパネル」、「電気自動車」及び「液体水素燃料セル」という言葉がフィード2及びWikiの双方に登場している。「ソーラーパネル」及び「バイオマス」という言葉はフィード3及びWikiの双方に登場している。
・フィード1:エコシード(ソーラーパネル、エネルギ液化システム、藻類バイオ燃料、維持可能なバイオマス電力、水力発電力、電気自動車、地熱)。
Wiki:グリーン技術(ソーラーパネル、電気自動車、空気浄化、水浄化、固体廃棄物管理、液体水素燃料セル、生物ろ過、脱塩、バイオマス)。
・フィード2:グリーンプログレス(ソーラーパネル、電気自動車、風力発電地帯、液体水素燃料セル、地熱、藻類バイオ燃料、維持可能な石膏ボード)。
Wiki:グリーン技術(ソーラーパネル、電気自動車、空気浄化、水浄化、固体廃棄物管理、液体水素燃料セル、生物ろ過、脱塩、バイオマス)。
・フィード3:エコフレンド(風力発電地帯、ソーラーパネル、太陽光温水ヒータ、バイオマス加熱システム、オーロラ藻類バイオディーゼル(Aurora algae biodiesel)、潮汐エネルギ、廃熱エンジン)。
Wiki:グリーン技術(ソーラーパネル、電気自動車、空気浄化、水浄化、固体廃棄物管理、液体水素燃料セル、生物ろ過、脱塩、バイオマス)。
次に、4つのカテゴリの各々に属する属性が特定される。「ソーラーパネル」、「電気自動車」、「バイオマス」及び「液体水素燃料セル」という言葉はWiki及びリアルタイムフィードの双方に登場しているので、これらはカテゴリ(3)(「リキャスト」カテゴリ)に分類される。
3つのフィードからの合致する属性:
・フィード1:エコシード AND Wiki:グリーン技術(ソーラーパネル、電気自動車、バイオマス)。
・フィード2:グリーンプログレス AND Wiki:グリーン技術(ソーラーパネル、電気自動車、液体水素燃料セル)
・フィード3:エコフレンド AND Wiki:グリーン技術(ソーラーパネル、バイオマス)。
この具体例の場合、「ソーラーパネル」という言葉は、この言葉が3つの合致するフィード全てに登場しているという観点からは、非常に流行っている言葉(トレンド語)と願が得られる。しかしながら、何れの言葉が非常に「流行っている(trendy)」かを判定するために上記のセクションVIIIで説明された方法が使用されてもよい。非常に流行っている言葉(トレンディ語)と考えられる「ソーラーパネル」は、この言葉が「リキャスト」カテゴリであるカテゴリ(3)から、「ページキャスト」カテゴリであるカテゴリ(1)に再分類されるようにする。
Wikiの何れの属性にも合致しない及び/又は流行っていないフィード属性(すなわち、エネルギ液化システム、藻類バイオ燃料、水力発電力、地熱、風力発電、維持可能な石膏ボード、太陽光温水ヒータ、バイオマス加熱システム、オーロラ藻類バイオディーゼル、潮汐エネルギ、廃熱エンジン)は、「オフキャスト」カテゴリであるカテゴリ(2)に分類されてもよい。
何れのRSSフィードにも登場していないWikiの属性(すなわち、空気浄化、水浄化、固体廃棄物管理、生物ろ過、脱塩)は、「ディープキャスト」カテゴリであるカテゴリ(4)に分類されてもよい。
<X.セマンティック語彙を更新する>
一実施形態では、(セクションIIで説明したような)サーチクエリ又は検索文字列の意味表現を生成する場合及び(セクションVで説明したような)拡張されたセマンティックネットワークを合成する場合に使用されるセマンティック語彙は、静的、不変的又は固定的であってもよいが、発明者等は、新たな言葉と共にセマンティック語彙を更新する処理は、コンテンツ及びコンテンツを記述するのに使用される言葉の双方が素早く変化する動的なコンテンツ環境において有用であることを認識した。すなわち、一実施形態において、セマンティック語彙(例えば、用語の語彙又は語彙データベース713)は、上記のセクションVIIIにおける抽出方法を用いて「流行っている(trendy)」と判定された言葉を含めるように更新される。
新たな言葉、語句又はフレーズが、任意の数の情報抽出方法(例えば、セクションVIIIで説明されたもの)により抽出され、任意の様々な方法でセマンティック語彙に追加されてもよい。例えば、セマンティック語彙に含まれる言葉又はフレーズの各々について、全部又は一部が共通するワードがセマンティック語彙の中で判定される。フレーズ及び関連するワードの間の関連性又は対応関係が、セマンティック語彙の中で形成されてもよい(例えば、セクションVで説明されたセマンティック合成処理を用いて行われてもよい)。一実施形態の場合、同一の文書の中に登場する又は同一のインターネット情報ストリームに由来する関連性又は対応関係はセマンティック語彙に追加可能なフレーズ同士の間の関係を規定してもよい。
<XI.トレンド語を用いた評価方法>
本発明の他の形態は、提案される製品及び/又はサービスを促進する業務のためにインターネット宣伝広告が一般的な方法になりつつあるという事実に関連している。何らかのインターネットサーチエンジン及びその他のWWWサイトは広告主がキーワードを指定できるようにし、サーチエンジンのユーザが、広告主が指定したキーワードを有するサーチエンジンに検索文字列を提供した場合に、サーチエンジンが返す検索結果の一部として又はそれに加えて、広告主の広告が表示されるようにする。キーワードを含む検索文字列に応答して広告主の広告が表示される頻度と、検索結果を含むウェブページ上における広告主の広告の他の広告との位置関係とは、広告主がそのキーワードについて指定した金額と、他の広告主がそれらのキーワードについて指定した金額との関係に依存する。
広告主にとって、指定するキーワードを何れにするかを効率的に選択することは、広告キャンペーンを成功させるのに重要な要因であることを、発明者等は認識している。「流行っている言葉又はトレンド語」(すなわち、頻繁に使用されるワード、言葉又はフレーズ)を指定すると、広告キャンペーンを効果的にする可能性が増えることを、発明者等は認めている。更に、言葉がピーク的な人気に到達する前に何れの言葉が使用頻度を増加させるかを予想し、人気のある言葉の人気が減少するのはいつかを予想することは、有用であることも、発明者等は認めている。そのような予想は、キーワードについて投じる金額を増やす又は減らす時期及び/又は新たなキーワードに投じる時期又は特定のキーワードに投じることを止める時期を広告主が決定するのに有用である。
「流行(trendiness)」を測定する2つの異なる方法に基づいて言葉を評価し、それら2つの方法に基づいてその言葉を利用可能な4つのカテゴリの内の何れかに指定する方法を発明者等は開発した。
図9は2行2列のマトリクスを示す。図示されているように、このマトリクスは4つのセルを有し、これらのセルの各々は、言葉を分類するために利用可能な4つのカテゴリのうちの1つに対応する。これら4つのカテゴリは、図9では、カテゴリM1-901、カテゴリM2-903、カテゴリM3-905及びカテゴリM4-907として示されている。各々の言葉は、インターネットで公表されている及び公にアクセス可能なコンテンツ(例えば、ブログ、インターネット公表物、RSSフィード等)の中の言葉の「流行(trendiness)」に基づいて、マトリクスの何れかの列に分類される。各々の言葉は、サーチエンジンのユーザが指定した検索文字列中の言葉の「流行」に基づいてマトリクスの何れかの行に分類される。時間と共に変化する流行の追跡方法については上記のセクションVIIIにおいて説明されている。
従って、インターネットにおいて公開されかつ公にアクセス可能なコンテンツの中の言葉の流行に基づいて、各々の言葉に第1のトレンドスコアが指定されてもよい。この第1のトレンドスコアが第1の所定の閾値に合致する又は超える場合、その言葉は、マトリクスの左側の列に分類される一方、トレンドスコアが第1の閾値を下回る場合、その言葉はマトリクスの右側の列に分類されてもよい。
ユーザが指定した検索文字列内の言葉の流行に基づいて、各々の言葉に第2のトレンドスコアが指定される。この第2のトレンドスコアが所定の第2の閾値に合致している又は超えている場合、その言葉はマトリクスの上位の行に分類され、第2のトレンドスコアが所定の第2の閾値未満であった場合、その言葉はマトリクスの下位の行に分類されてもよい。このように各々の言葉が4つのセルの内の何れか(すなわち、4つのカテゴリの内の何れか)に分類される。
M1-901に該当する言葉は関心のある言葉である。なぜなら、その言葉について公表されている多数のコンテンツが存在し、かつユーザの文字列の流行から明らかであるようにその言葉について多大な関心があるからである。M2-903に該当する言葉は関心のある言葉である。なぜなら、その言葉について多大な関心があるが(すなわち、人々は文字列によりその話題について検索していないが)、その言葉についてはほとんど話されていない(すなわち、その言葉はコンテンツの中で流行度が低く、従ってその言葉について生成される新たな情報はほとんどない)。M2-903に該当する言葉は、好奇心が報われない言葉を表す。M3-905に該当する言葉は関心のある言葉である。なぜなら、その言葉について現在関心を有する人々はほとんどいないが(すなわち、人々は文字列によりその話題を検索していないが)、その言葉について話されていることが多い(すなわち、その言葉はコンテンツにおいて流行しており、その言葉について生成される新しい情報がたくさんある)。M4-907に該当する言葉にはほとんど関心がない。なぜなら、人々は検索を行っておらず、かつそれらの言葉について作成される新たな情報もないからである。上述したように、言葉が所属している現在のセルが関心の対象であるだけでなく、言葉が移動しつつある移動先のセル及び移動経路を横切るのに要する時間も、突き止められかつ関心の対象となってもよい。
カテゴリM1-901に分類される言葉は、インターネットで公開されているコンテンツ及びユーザが指定した検索文字列の双方において流行っているので、その言葉は、最も収益化可能であり(monetizable)かつ広告主が指定する最良の言葉であると考えてよい。カテゴリM2-903に分類される言葉は、インターネット上で公開されているコンテンツでは流行していないと考えられるが、ユーザが指定した検索文字列では流行しており、その言葉は、2番目に収益化可能でありかつ広告主にとって指定することが望ましい。カテゴリM2-903に該当する言葉は、いくらか過去に生じたイベントに関連する言葉である。例えば、2011年1月においては、「2010年FIFAワールドカップ」という言葉は、インターネット上で公開されているコンテンツの中では流行していない。なぜなら、2010年FIFAワールドカップに関する新たなコンテンツが書き込まれる見込みは非常に少ないからである。しかしながら、この言葉についてユーザが検索文字列に指定する可能性は依然として多い。なぜなら、そのイベントで何が起こったかを知りたいユーザが多数存在するかもしれないからである。
M3-905のカテゴリに分類される言葉は3番目に収益化できると考えられるが、ユーザが指定する検索文字列に頻繁には搭乗しないので、広告主が指定することは望まれない。このカテゴリに該当する言葉の具体例は、一般の人々にとっては高い関心がない現在のイベントに関連する言葉である。インターネット上で公開されているコンテンツの中でこれらの言葉の使用頻度は、イベントの発生に起因して大幅に増加するが、それについての関心はほとんどないので、そのイベントについて多くのユーザが検索文字列を指定することはない。
M4-907に分類される言葉は、インターネット上で公開されているコンテンツでは流行しておらずかつユーザが指定した検索文字列でも頻繁には指定されておらず、この言葉は広告主にとって関心がないものである。言葉は、日、時、分又は秒毎にマトリクスのセルを移動する可能性があり、そのような言葉を指定すると同じ時間スケールに応じて変化が生じるかもしれない。
言葉が分類されているカテゴリは、言葉が人気のあるセルに属するか否かに応じて時間と共に変化してもよい。時間と共に変化する言葉の流行又は人気は追跡され、言葉についての過去のスコアの変化は、それらの言葉のトレンドスコアの将来的な変化を予測するのに使用されてもよい。
図9の参照番号909は位置B3から位置B1へ言葉が移動していることを示す。その言葉は位置B3にあった場合は文字列として流行っていなかったが、その後、流行っている文字列のゾーンである位置B1に移動している。流行を突き止めるための方法については、関連する米国特許出願第12/555222号、12/555293号及び12/555341号等に見受けられ、それらの各々は本願のリファレンスに完全に組み込まれる。更に、これらの出願は、販売促進対象の/販売促進非対称のコンテンツを事前に処理するために使用されてもよい。同様に、参照番号911に沿う近似的な遅れ時間を予測するために同様な方法が使用されてもよく、図示の例では、言葉が文字列としては流行しているがコンテンツの中では流行していない位置C2から、言葉が双方において流行している位置C1へ移動している。
参照番号915は、A1、A3、A4の順に言葉が属するセルの位置が移動する様子を示し、その言葉は先ず流行しなくなり、その後、文字列及びコンテンツ双方に関して流行性が減少している。参照番号913はA1、A2、A4の順に言葉が属するセルの位置が移動する様子を示し、言葉はトレンド語として次第に消えてゆき、その後は検索文字列としても消えてゆく。言葉が4つのセルの内のセルM1からM2へ進む場合、その言葉の関心はなくなり、資金及び処理リソースを節約するため追跡は止められる。それらのステップを実行するために、米国特許出願第12/555222号、12/555293号及び12/555341号で説明されているデータ処理方法が使用されてもよい。
更に、本願において「ボット(bot)」と呼ばれる自動化されたソフトウェアプログラムを使用して、ある言葉が上記のカテゴリの内の何れかに当初分類されていたが異なるカテゴリに分類し直されたことに応じて自動的に何らかの処理を実行してもよいことを、発明者等は認識している。
例えば、言葉がカテゴリM1-901に分類されたことに応じて、ボット(bot)はその言葉についての販売促進コンテンツを自動的に蓄積してもよい。ボットは様々な方法で販売促進コンテンツを蓄積してもよい。例えば、ボットは、公開されたコンテンツ又はユーザ文字列において流行っている概念と共に広告を直接的に含めてもよい。そのような広告は、対象の言葉の流行性に基づく関連性を多く有する傾向があり、「バナー(banner)」広告の形式で第三者サイトで提示されてもよい。ボットは、検索エンジンのオペレータにとってどの言葉が収益を図るのに有用であるかについての情報を追加的又は代替的に提供し、それらのサーチエンジンのオペレータが、広告主が指定するのに望ましいと思われる有効なキーワードを広告主に示唆してもよい。更に、ボットはサーチエンジン又はその他の広告交換処理部(ad exchange)から、流行っているキーワードを自動的に購入してもよい。
一実施形態では、ある言葉がピーク的な高い評判に至る時点(例えば、カテゴリM1-901から他の何れかのカテゴリへ言葉が遷移すること)を予測することが可能であり、ボットは、その情報を用いて、特定のキーワードを指定するのに最良の時点を判定することができる。すなわち、言葉が図9の或るセル(すなわち、M1、M2、M3又はM4)から図9の何らかの別のセルへ移るのに要する時間又は期間の計算に基づいてもよい。例えば、ある言葉の評判が約2日後にピークに至ると判断された場合、ボットは2日後に表示するためにそのキーワードを購入する或いは広告を処理する。従ってこの方法は、言葉の評判が上昇する及び/又はピークに至る前に、最も人気のある及び最も検索される言葉又は概念を算出できるようにすることで、リアルタイムに行うだけでなく事前にもトレンド語に投資できるようにする。
同様に、言葉の評判の減少も予測できるので、ボットは、言葉の評判の減少が生じると予想される時期についての情報を利用して、言葉に関連するキーワードの指定を減らす又は削除し、その言葉に関連する事前に購入された広告を表示することを止める。
図10は実施の形態で使用されてよい広告処理を行う方法1000のフローチャートを示す。本方法1000はステップ1002から始まり、言葉が受信される。その言葉は情報コンテンツの本体又は本文に登場する言葉でもよいし、何らかの適切な方法で受信されたものでもよい。情報コンテンツの本体又は本文は、適切な任意の情報コンテンツを有し、公開されたインターネットコンテンツ及び/又は1つ以上のユーザが指定した検索文字列を含んでもよい。言葉を受信した後、本方法はステップ1004及び1006に進み、言葉の第1及び第2のトレンドスコアがそれぞれ算出される。第1のトレンドスコアは、公開されたインターネットコンテンツ内の言葉の出現頻度に少なくとも部分的に基づいて算出されてよい。第2のトレンドスコアはユーザが指定した1つ以上の文字列中の言葉の出現頻度に少なくとも部分的に基づいて算出されてよい。トレンドスコアはセクションVIIIで上述した方法を用いて算出されてもよい。
本方法はステップ1008に続き、第1及び第2のトレンドスコアが1つ以上の閾値と比較される。例えば、第1のトレンドスコアは第1の所定の閾値と比較され、第2のトレンドスコアは第2の所定の閾値と比較されてもよい。本方法は、比較の一部として、第1のトレンドスコアが所定の第1の閾値を超えているか否か及び第2のトレンドスコアが所定の第2の閾値を超えているか否かを判定する。比較結果に基づいて、ステップ1010において、言葉は、複数の収益化カテゴリ(monetization category)の内の1つ以上に分類される。
本方法はステップ1012に続き、言葉が分類された1つ以上のカテゴリに基づいて広告処理が行われる。広告処理は言葉及び言葉の収益化カテゴリに関連する何らかの適切な広告処理である。例えば、広告処理は、検索エンジン又は広告処理部からその言葉を購入する時期を予測すること、検索エンジン又は広告処理部からその言葉を購入すること、検索エンジン又は広告処理部から広告主が購入するのに有効な言葉として、黙示的又は明示的に言葉を示唆すること等を含んでよい。広告処理が行われた後、方法1000は終了する。
<XII.追加的な詳細>
上記のコンピュータ装置(例えば、図2及び図4に示されているクライアントコンピュータ及びサーバ)は、任意の様々な方法で実現されてよい。図6は上記の任意のコンピュータ装置を実現するのに使用されてよいコンピュータ装置600のブロック図を示す。
コンピュータ装置600は1つ以上のプロセッサ601及び1つ以上の有形の一時的でないコンピュータ読み取り可能な記憶媒体(例えば、メモリ603)を含んでよい。メモリ603は、有形の一時的でないコンピュータ読み取り可能な記憶媒体に、上記の何れかの機能を実現するコンピュータ命令を保存する。プロセッサ601は、メモリ603に結合され、そのようなコンピュータ命令を実行し、その機能が実現及び実行されるようにする。コンピュータ装置600はネットワーク入力/出力(I/O)インターフェース605も有し、そのネットワークI/Oインターフェースを介してコンピュータ装置は(例えば、ネットワークを介して)他のコンピュータと通信する。一実施形態において、コンピュータ装置は1つ以上のユーザI/Oインターフェースも有し、ユーザI/Oインターフェースを介してコンピュータ装置はユーザに出力を提供しかつユーザから入力を受信する。ユーザI/Oインターフェースは、キーボード、マウス、マイクロフォン、表示装置(例えば、モニタ又はタッチスクリーン等)、スピーカ、カメラ及び/又は他の様々なタイプのI/O装置のような装置を含んでよい。
本発明に関する上記の実施の形態は任意の様々な方法で実現可能である。例えば実施の形態はハードウェア、ソフトウェア又はそれらの組み合わせを用いて実現されてもよい。ソフトウェアで実現される場合、ソフトウェアコードは、単独のコンピュータ内に設けられるか又は複数のコンピュータに分散するかによらず、任意の適切なプロセッサ又は一群のプロセッサ(例えば、1つ又は複数のマイクロプロセッサ)で実行される保存されたプログラム命令として実現されてもよい。
コンピュータは、ラックマウント式コンピュータ、デスクトップコンピュータ、ラップトップコンピュータ又はタブレットコンピュータのような任意の様々な形式で実現されてもよいことに留意すべきである。更に、コンピュータは、コンピュータとして一般的に言及されていないが、適切な処理能力を有する装置に組み込まれてもよく、そのような装置は例えばパーソナルディジタルアシスタント(PDA)、スマートフォン、タブレット、リーダ又は任意の他の適切な携帯装置又は固定電子装置等を含む。
また、コンピュータは1つ以上の入力及び出力装置を有していてもよい。これらの装置は、特に、ユーザインターフェースを提供するように使用される。ユーザインターフェースを提供するのに使用されてよい出力装置の具体例は、出力の視覚的表示のためのプリンタ又は表示画面と、出力の聴覚的表現のためのスピーカ又はその他の音生成装置とを含む。ユーザインターフェースに使用されてよい入力装置の具体例は、キーボード、マイクロフォン及びポインティングデバイス(例えば、マウス、接触パッド、ディジタルタブレット等)等を含む。
そのようなコンピュータは適切な任意の形態で1つ以上のネットワークにより相互に接続され、ネットワークは、ローカルエリアネットワーク(LAN)又はワイドエリアネットワーク(WAN)、企業ネットワーク、インテリジェントネットワーク又はインターネットのようなネットワークを含む。そのようなネットワークは、何らかの適切な技術に基づいており、適切な何らかのプロトコルに従って動作し、無線ネットワーク、有線ネットワーク及び/又は光ファイバネットワークを含んでよい。
本願で説明された様々な方法又は処理は、任意の様々なオペレーティングシステム又はプラットフォームを使用する1つ以上のプロセッサで実行可能なソフトウェアとしてコード化されてもよい。また、そのようなソフトウェアは、任意の様々な適切なプログラミング言語及び/又はプログラミングツール又はスクリプトツールを用いて書かれてもよく、仮想マシン又は適切なフレームワークで実行可能なマシン言語コード又は中間コードとしてコンパイルされてもよい。
この点に関し、様々な発明概念は1つ以上のプログラムと共にエンコードされた少なくとも1つの一時的でないコンピュータ読み取り可能な媒体(例えば、コンピュータメモリ、1つ以上のフロッピディスク、コンパクトディスク、光ディスク、磁気テープ、フラッシュメモリ、フィールドプログラマブルゲートアレイ(FPGA)の回路配置、その他の半導体装置等)として実施されてもよく、1つ以上のプログラムは、1つ以上のコンピュータ又は他のプロセッサで実行された場合に、本発明の実施の形態による様々な処理を実行する。一時的でないコンピュータ読み取り可能な媒体又はメディアは携帯可能であってもよく、媒体に保存されている1つ以上のプログラムが任意の適切なコンピュータリソースにロードされ、上記の本発明による様々な形態を実現してもよい。
「プログラム」又は「ソフトウェア」という用語は、本願においては、上記の様々な実施の形態を実行するようにコンピュータ又は他のプロセッサをプログラムするのに使用可能である任意のタイプのコンピュータコード又はコンピュータにより実行可能な命令群を指す般的な意味で使用されている。更に、一形態では、1つ以上のコンピュータプログラムは、本発明による方法を実行する場合に単独のコンピュータ又はプロセッサ上に常駐する必要はなく、本発明による様々な実施の形態を実現するために、様々な複数のコンピュータ又はプロセッサにモジュラ形式で分散されてもよいことが、理解すべきである。
コンピュータで実行可能な命令は、1つ以上のコンピュータ又は他の装置で実行されるプログラムモジュールのような様々な形式をとってもよい。一般に、プログラムモジュールは、特定のタスクを実行する又は特定の抽象データ型(abstract data type)を処理する、ルーチン、プログラム、アイテム、コンポーネント、データ構造等を含む。典型的には、プログラムモジュールの機能は様々な実施の形態で望まれるように結合又は分散されてもよい。
また、データ構造は一時的なコンピュータ読み取り可能な記憶媒体製品に適切な任意の形式で保存されてもよい。簡明化のため、データ構造はデータ構造中の位置に関連したフィールドを有するものとしてよい。そのような関連性は、フィールド間の関連性を示す一時的でないコンピュータ読み取り可能な媒体においてロケーションと共にストレージのフィールドを指定することで、決定されてもよい。しかしながら任意の適切な手段がデータ構造のフィールドの情報同士の間の関連性を設定するのに使用されてよく、例えば、データ要素間の関連性を設定するポインタ、タグその他の手段を使用することが行われてもよい。
また、様々な発明概念は具体例が示されていた1つ以上の方法として実現されてもよい。本方法の一部として実行される処理は適切な任意の順序で実行されてよい。従って、図示の例では一連の処理として示されていたとしても、実施の形態は、処理が図示の例とは異なる順序で(幾つかの処理を同時に行うことを含む)行われるように構築されてもよい。
本願で規定及び使用されている全ての定義は、辞書による定義、リファレンスに組み込まれている文書での定義及び/又は規定された言葉の通常の意味を考慮するように理解されるべきである。
「或る」及び「ある」というが、別段の定めがない限り、「少なくとも1つ」を意味するものとして理解されるべきである。
本願で使用されているように、1つ以上の要素のリストを指す「少なくとも1つ」というフレーズは、要素のリスト中の任意の1つ以上の要素の中から選択された少なくとも1つの要素を意味するが、要素のリストに具体的に列挙されている要素各々の少なくとも1つ及び全てを含むことは必須でなく、かつ要素のリスト中の要素の任意の組み合わせを排除しないように理解されるべきである。この定義は、具体的に特定された要素に関連しているか否かによらず、「少なくとも1つ」というフレーズが付いている要素のリストの中で具体的に特定されている要素以外の要素が選択的に登場してよいことも許容する。例えば、非限定的な例として、「A及びBの少なくとも1つ」(あるいは、等価的に「A又はBの少なくとも1つ」あるいは等価的に「A及び/又はBの少なくとも1つ」)は、一例ではBが存在せずに(選択的にB以外の要素を含んでもよい)少なくとも1つのA(選択的に1つより多くを含んでもよい)を意味し、別の例ではAが存在せずに(選択的にA以外の要素を含んでもよい)少なくとも1つのB(選択的に1つより多くを含んでもよい)を意味し、更に別の例では少なくとも1つのA(選択的に1つより多くを含んでもよい)及び少なくとも1つのB(選択的に1つより多くを含んでもよい)等を意味する。
本願で使用されている「及び/又は」というフレーズは、そのように結合される要素(すなわち場合によっては連続して現れる要素及び場合によっては別々に登場する要素)の「何れか又は双方」を意味するように理解されるべきである。「及び/又は」と共に登場する複数の要素は、結合される要素の「1つ以上の」と同様に解釈されるべきである。具体的に指定された要素に関連するか否かによらず、「及び/又は」の語で具体的に特定された要素以外の他の要素は選択的に登場してよい。例えば、非限定的な例として、「A及び/又はB」は、「有する(comprising)」のような非限定語(open-ended language)と共に使用される場合、一例では、(B以外の要素を選択的に含んでよい)Aのみを示してよく、別の例では、(A以外の要素を選択的に含んでよい)Bのみを示してよく、更に別の例では(選択的に他の要素を含んでよい)A及びB双方を示してもよい。
本願で使用されているように、「又は」は上記の「及び/又は」と同様な意味を有するように解釈されるべきである。例えば、リストの中で分離する言葉「又は」或いは「及び/又は」は、包含的であり、すなわちメンバ又は要素のリストの少なくとも1つを含むが、1つより多くを含んでもよく、選択的に、列挙されていない要素を含んでもよい。
本願で使用されている言葉遣い及び使用法は、説明を目的としており、限定として解釈されるべきでない。「含む」、「備える」、「有する」、「包含する」、「取り込む」及び同様に使用される言葉は、列挙されている要素及び追加的な要素を包含することを意味する。
以上、本発明の幾つかの実施の形態を詳細に説明してきたが、様々な変形例及び改善例も当業者にとって明らかであろう。そのような変形例及び改善例は本発明の精神及び範囲に属するように意図されている。従って、上記の説明は単なる一例を示しているに過ぎず、限定的に解釈してはならない。
<関連出願>
本願は、「Method and Apparatus for Searching of Content Using Semantic Synthesis」と題する西暦2010年6月22日付けで出願された米国仮出願番号第61/357,512号、「Method and Apparatus for Presenting Concepts Related to an Active Concept」と題する西暦2011年1月5日付けで出願された米国仮出願番号第61/430,138号、「Method and Apparatus for Identifying Terms for Monetization」と題する西暦2011年1月5日付けで出願された米国仮出願番号第61/430,141号、「Methods and Apparatus for Taking an Advertising Action Using a Bot」と題する西暦2011年1月5日付けで出願された米国仮出願番号第61/430,143号に基づく優先的利益を享受し、それらの内容全体が本願のリファレンスに組み入れられる。本願は、本願の発明者及び/又は譲受人により出願された多くの先行する出願に開示されている概念を前提としており、先行する出願は例えば「Method System, and Computer Program for User-Driven Dynamic Generation of Semantic Networks and Media Synthesis」と題する西暦2010年2月2日付けで出願された米国出願番号第12/671,846号を含み、本発明に関する追加的な背景技術が説明されている。

Claims (18)

  1. クライアントコンピュータと通信するサーバコンピュータが実行する検索方法であって、
    複数の言葉(term)を含む第1の検索文字列を受信するステップと、
    第1の意味表現及び第2の意味表現を特定又は形成するステップであって、第1の意味表現は、前記複数の言葉のうちの1つの言葉に関連しており、第2の意味表現は、前記複数の言葉のうちの2つ以上の言葉に関連している、特定又は形成するステップと、
    前記第1の検索文字列が示す意味表現のうち、前記第1の検索文字列の曖昧さを減らすためにユーザにより特定された1つ以上の意味表現を示す曖昧性除去語を取得するステップと、
    前記曖昧性除去語に基づいて特定された意味表現に関連した概念階層を含むセマンティックネットワークを生成するステップと、
    前記第1の検索文字列及び前記生成されたセマンティックネットワークにおける前記概念階層の少なくとも1つの概念に基づいて第2の検索文字列を作成するステップと、
    前記第2の検索文字列に基づいて行われた検索による検索結果を取得するステップと、
    を有する検索方法。
  2. 前記検索結果をランキング及び/又は選別するステップを更に有する請求項1に記載の検索方法。
  3. 前記曖昧性除去語を取得するステップは、
    語彙データベースを用いて、前記第1の検索文字列が示す前記意味表現に含まれる複数の言葉をユーザに提示するステップと、
    前記複数の言葉のうちの1つ以上を特定するユーザ入力を受信するステップと、
    前記ユーザ入力が示す1つ以上の言葉を前記曖昧性除去語として特定するステップと、
    を有する、請求項1記載の検索方法。
  4. 前記第2の検索文字列を作成するステップが、
    前記第1の検索文字列が示す前記意味表現のうち前記曖昧性除去語に基づいて特定された意味表現同士の意味上の関係を示すセマンティックネットワークを生成するステップと、
    前記セマンティックネットワーク内の少なくとも1つの意味表現を用いて前記第2の検索文字列を生成するステップと、
    を有する、請求項1に記載の検索方法。
  5. 情報コンテンツの本文に登場している言葉のうち、該言葉が流行っていることを示すトレンドスコアが所定の閾値より高い言葉を特定するステップと、
    特定された言葉に基づいて前記セマンティックネットワークを生成するステップと、
    を更に有する請求項4に記載の検索方法。
  6. 前記セマンティックネットワークに基づいて前記検索結果に注釈を付けるステップを更に有する請求項4に記載の検索方法。
  7. 前記第2の検索文字列を前記検索を行う検索サービス部に送信したことに応じて、前記検索サービス部から前記検索結果を受信するステップと、
    受信した前記検索結果を前記クライアントコンピュータに送信するステップと、
    を更に有する請求項1に記載の検索方法。
  8. 前記曖昧性除去語を取得するステップにおいて、前記曖昧性除去語は語彙データベースを利用して取得され、
    当該検索方法は、
    複数の言葉を含むタイムスタンプが付されているコンテンツを受信するステップと、
    減衰関数を利用して前記複数の言葉各々についてトレンドスコアを計算するステップと、
    計算された前記トレンドスコアに基づいてトレンド語を表す1つ以上の言葉を特定するステップと、
    前記トレンド語を用いて前記語彙データベースを更新するステップと、
    を有する請求項1に記載の検索方法。
  9. 前記タイムスタンプが付されているコンテンツはブログ及び/又はインターネットストリームからのコンテンツを含む、請求項8に記載の検索方法。
  10. 前記トレンドスコアを計算する前記ステップにおいて、
    前記タイムスタンプが付されているコンテンツに登場する言葉の出現頻度と前記タイムスタンプが付されているコンテンツに登場する他の言葉の出現頻度とを計算し、
    前記減衰関数に基づいて前記言葉の出現頻度を修正する、請求項8に記載の検索方法。
  11. 前記減衰関数は崩壊速度パラメータに基づいて規定されている、請求項8に記載の検索方法。
  12. 前記1つ以上の言葉を特定するステップにおいて、前記計算されたトレンドスコアに基づいて前記複数の言葉をランキングし、相対的に上位にランキングされた1つ以上の言葉を、前記トレンド語を表す1つ以上の言葉として特定する、請求項8に記載の検索方法。
  13. 平均ユニコードポイント値に基づいて前記タイムスタンプが付されているコンテンツの言語を判定するステップを更に有する請求項8に記載の検索方法。
  14. 前記複数の言葉に属しかつ所定の範囲内のトレンドスコアを有する言葉を選択するステップと、
    ユーザが指定した1つ以上の文字列に属する言葉の出現頻度に基づいて前記言葉の第2のトレンドスコアを計算するステップと、
    前記第2のトレンドスコアに基づいて、選択された言葉を分類するステップと、
    前記の分類に基づいて、選択された前記言葉を広告用キーワードとして取得するステップと、
    を更に有する請求項8に記載の検索方法。
  15. 前記第1の検索文字列を受信するステップにおいて、前記クライアントコンピュータから直接的又は間接的に前記第1の検索文字列を受信する、請求項1に記載の検索方法。
  16. 前記検索結果を取得するステップにおいて、前記第2の検索文字列に基づいて行われた検索により、前記クライアントコンピュータのユーザに直接的又は間接的に提示される検索結果を取得する、請求項1に記載の検索方法。
  17. 複数の言葉(term)を含む第1の検索文字列を受信する手段と、
    第1の意味表現及び第2の意味表現を特定又は形成する手段であって、第1の意味表現は、前記複数の言葉のうちの1つの言葉に関連しており、第2の意味表現は、前記複数の言葉のうちの2つ以上の言葉に関連している、特定又は形成する手段と、
    前記第1の検索文字列が示す意味表現のうち、前記第1の検索文字列の曖昧さを減らすためにユーザにより特定された1つ以上の意味表現を示す曖昧性除去語を取得する手段と、
    前記曖昧性除去語に基づいて特定された意味表現に関連した概念階層を含むセマンティックネットワークを生成する手段と、
    前記第1の検索文字列及び前記生成されたセマンティックネットワークにおける前記概念階層の少なくとも1つの概念に基づいて第2の検索文字列を作成する手段と、
    前記第2の検索文字列に基づいて行われた検索による検索結果を取得する手段と、
    を有する検索システム。
  18. クライアントコンピュータと通信するサーバコンピュータに検索方法を実行させるコンピュータプログラムであって、前記検索方法は、
    複数の言葉(term)を含む第1の検索文字列を受信するステップと、
    第1の意味表現及び第2の意味表現を特定又は形成するステップであって、第1の意味表現は、前記複数の言葉のうちの1つの言葉に関連しており、第2の意味表現は、前記複数の言葉のうちの2つ以上の言葉に関連している、特定又は形成するステップと、
    前記第1の検索文字列が示す意味表現のうち、前記第1の検索文字列の曖昧さを減らすためにユーザにより特定された1つ以上の意味表現を示す曖昧性除去語を取得するステップと、
    前記曖昧性除去語に基づいて特定された意味表現に関連した概念階層を含むセマンティックネットワークを生成するステップと、
    前記第1の検索文字列及び前記生成されたセマンティックネットワークにおける前記概念階層の少なくとも1つの概念に基づいて第2の検索文字列を作成するステップと、
    前記第2の検索文字列に基づいて行われた検索による検索結果を取得するステップと、
    を有する、コンピュータプログラム。
JP2013515642A 2010-06-22 2011-06-22 検索方法、検索システム及びコンピュータプログラム Active JP5925769B2 (ja)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US35751210P 2010-06-22 2010-06-22
US61/357,512 2010-06-22
US201161430138P 2011-01-05 2011-01-05
US201161430143P 2011-01-05 2011-01-05
US201161430141P 2011-01-05 2011-01-05
US61/430,141 2011-01-05
US61/430,138 2011-01-05
US61/430,143 2011-01-05
PCT/CA2011/000718 WO2011160204A1 (en) 2010-06-22 2011-06-22 Methods and apparatus for searching of content using semantic synthesis

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2016084278A Division JP6416150B2 (ja) 2010-06-22 2016-04-20 検索方法、検索システム及びコンピュータプログラム

Publications (3)

Publication Number Publication Date
JP2013529805A JP2013529805A (ja) 2013-07-22
JP2013529805A5 JP2013529805A5 (ja) 2014-05-15
JP5925769B2 true JP5925769B2 (ja) 2016-05-25

Family

ID=45370778

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2013515642A Active JP5925769B2 (ja) 2010-06-22 2011-06-22 検索方法、検索システム及びコンピュータプログラム
JP2016084278A Active JP6416150B2 (ja) 2010-06-22 2016-04-20 検索方法、検索システム及びコンピュータプログラム

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2016084278A Active JP6416150B2 (ja) 2010-06-22 2016-04-20 検索方法、検索システム及びコンピュータプログラム

Country Status (6)

Country Link
US (2) US9361365B2 (ja)
JP (2) JP5925769B2 (ja)
AU (2) AU2011269675B2 (ja)
CA (2) CA3044181A1 (ja)
IL (1) IL223539B (ja)
WO (1) WO2011160204A1 (ja)

Families Citing this family (88)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10002325B2 (en) 2005-03-30 2018-06-19 Primal Fusion Inc. Knowledge representation systems and methods incorporating inference rules
US9177248B2 (en) 2005-03-30 2015-11-03 Primal Fusion Inc. Knowledge representation systems and methods incorporating customization
US9378203B2 (en) 2008-05-01 2016-06-28 Primal Fusion Inc. Methods and apparatus for providing information of interest to one or more users
US8849860B2 (en) 2005-03-30 2014-09-30 Primal Fusion Inc. Systems and methods for applying statistical inference techniques to knowledge representations
US7849090B2 (en) 2005-03-30 2010-12-07 Primal Fusion Inc. System, method and computer program for faceted classification synthesis
US9104779B2 (en) 2005-03-30 2015-08-11 Primal Fusion Inc. Systems and methods for analyzing and synthesizing complex knowledge representations
US8195447B2 (en) 2006-10-10 2012-06-05 Abbyy Software Ltd. Translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions
US9471562B2 (en) 2006-10-10 2016-10-18 Abbyy Infopoisk Llc Method and system for analyzing and translating various languages with use of semantic hierarchy
US9633005B2 (en) 2006-10-10 2017-04-25 Abbyy Infopoisk Llc Exhaustive automatic processing of textual information
US9053090B2 (en) 2006-10-10 2015-06-09 Abbyy Infopoisk Llc Translating texts between languages
US9495358B2 (en) 2006-10-10 2016-11-15 Abbyy Infopoisk Llc Cross-language text clustering
US9892111B2 (en) 2006-10-10 2018-02-13 Abbyy Production Llc Method and device to estimate similarity between documents having multiple segments
US9645993B2 (en) 2006-10-10 2017-05-09 Abbyy Infopoisk Llc Method and system for semantic searching
US9235573B2 (en) 2006-10-10 2016-01-12 Abbyy Infopoisk Llc Universal difference measure
US9588958B2 (en) 2006-10-10 2017-03-07 Abbyy Infopoisk Llc Cross-language text classification
US9098489B2 (en) 2006-10-10 2015-08-04 Abbyy Infopoisk Llc Method and system for semantic searching
US8892423B1 (en) 2006-10-10 2014-11-18 Abbyy Infopoisk Llc Method and system to automatically create content for dictionaries
US8145473B2 (en) 2006-10-10 2012-03-27 Abbyy Software Ltd. Deep model statistics method for machine translation
US9075864B2 (en) 2006-10-10 2015-07-07 Abbyy Infopoisk Llc Method and system for semantic searching using syntactic and semantic analysis
US9069750B2 (en) 2006-10-10 2015-06-30 Abbyy Infopoisk Llc Method and system for semantic searching of natural language texts
US8959011B2 (en) 2007-03-22 2015-02-17 Abbyy Infopoisk Llc Indicating and correcting errors in machine translation systems
US9361365B2 (en) * 2008-05-01 2016-06-07 Primal Fusion Inc. Methods and apparatus for searching of content using semantic synthesis
US8676732B2 (en) 2008-05-01 2014-03-18 Primal Fusion Inc. Methods and apparatus for providing information of interest to one or more users
CN102016887A (zh) 2008-05-01 2011-04-13 启创互联公司 用于用户驱动的语义网络和媒体合成的动态产生的方法、系统和计算机程序
US9262409B2 (en) 2008-08-06 2016-02-16 Abbyy Infopoisk Llc Translation of a selected text fragment of a screen
CA2734756C (en) 2008-08-29 2018-08-21 Primal Fusion Inc. Systems and methods for semantic concept definition and semantic concept relationship synthesis utilizing existing domain definitions
US9292855B2 (en) 2009-09-08 2016-03-22 Primal Fusion Inc. Synthesizing messaging using context provided by consumers
US9262520B2 (en) 2009-11-10 2016-02-16 Primal Fusion Inc. System, method and computer program for creating and manipulating data structures using an interactive graphical interface
US9047283B1 (en) * 2010-01-29 2015-06-02 Guangsheng Zhang Automated topic discovery in documents and content categorization
US10474647B2 (en) 2010-06-22 2019-11-12 Primal Fusion Inc. Methods and devices for customizing knowledge representation systems
US9235806B2 (en) 2010-06-22 2016-01-12 Primal Fusion Inc. Methods and devices for customizing knowledge representation systems
US8250077B2 (en) 2010-07-28 2012-08-21 Yahoo! Inc. System and method for television search assistant
CN102456058B (zh) * 2010-11-02 2014-03-19 阿里巴巴集团控股有限公司 类目信息提供方法及装置
AU2012203964A1 (en) * 2010-12-30 2013-07-18 Primal Fusion Inc. Methods and apparatus for providing information of interest to one or more users
US11294977B2 (en) 2011-06-20 2022-04-05 Primal Fusion Inc. Techniques for presenting content to a user based on the user's preferences
US9092516B2 (en) 2011-06-20 2015-07-28 Primal Fusion Inc. Identifying information of interest based on user preferences
US10031950B2 (en) * 2011-01-18 2018-07-24 Iii Holdings 2, Llc Providing advanced conditional based searching
US10223451B2 (en) * 2011-06-14 2019-03-05 International Business Machines Corporation Ranking search results based upon content creation trends
US9298816B2 (en) 2011-07-22 2016-03-29 Open Text S.A. Methods, systems, and computer-readable media for semantically enriching content and for semantic navigation
US8965750B2 (en) 2011-11-17 2015-02-24 Abbyy Infopoisk Llc Acquiring accurate machine translation
WO2013082177A1 (en) * 2011-11-28 2013-06-06 Relay Technology Management Inc. Pharmaceutical/life science technology evaluation and scoring
US8788340B2 (en) * 2011-12-16 2014-07-22 Facebook, Inc. Advertisement based on application-created social content
US20130212095A1 (en) * 2012-01-16 2013-08-15 Haim BARAD System and method for mark-up language document rank analysis
US8989485B2 (en) 2012-04-27 2015-03-24 Abbyy Development Llc Detecting a junction in a text line of CJK characters
US8971630B2 (en) 2012-04-27 2015-03-03 Abbyy Development Llc Fast CJK character recognition
US9594831B2 (en) 2012-06-22 2017-03-14 Microsoft Technology Licensing, Llc Targeted disambiguation of named entities
US9959340B2 (en) * 2012-06-29 2018-05-01 Microsoft Technology Licensing, Llc Semantic lexicon-based input method editor
US9081847B2 (en) * 2012-10-11 2015-07-14 Nuance Communications, Inc. Data store organizing data using semantic classification
US9684719B2 (en) * 2012-12-10 2017-06-20 Verint Systems Ltd. Object search by description
US9852477B2 (en) * 2013-03-20 2017-12-26 Kaptivating Technology Llc Method and system for social media sales
US20150100432A1 (en) * 2013-10-08 2015-04-09 Xerox Corporation Using semantic analysis to enhance personalized documents in a variable data marketing campaign
US9286410B2 (en) * 2013-11-07 2016-03-15 Ricoh Company, Ltd. Electronic document retrieval and reporting using pre-specified word/operator combinations
RU2592395C2 (ru) 2013-12-19 2016-07-20 Общество с ограниченной ответственностью "Аби ИнфоПоиск" Разрешение семантической неоднозначности при помощи статистического анализа
RU2586577C2 (ru) 2014-01-15 2016-06-10 Общество с ограниченной ответственностью "Аби ИнфоПоиск" Фильтрация дуг в синтаксическом графе
US9449052B1 (en) 2014-01-21 2016-09-20 Google Inc. Trend based distribution parameter suggestion
US9710451B2 (en) * 2014-06-30 2017-07-18 International Business Machines Corporation Natural-language processing based on DNA computing
KR102348084B1 (ko) * 2014-09-16 2022-01-10 삼성전자주식회사 영상표시장치, 영상표시장치의 구동방법 및 컴퓨터 판독가능 기록매체
US9805028B1 (en) * 2014-09-17 2017-10-31 Google Inc. Translating terms using numeric representations
US10915543B2 (en) 2014-11-03 2021-02-09 SavantX, Inc. Systems and methods for enterprise data search and analysis
US10360229B2 (en) 2014-11-03 2019-07-23 SavantX, Inc. Systems and methods for enterprise data search and analysis
US9626358B2 (en) 2014-11-26 2017-04-18 Abbyy Infopoisk Llc Creating ontologies by analyzing natural language texts
US9600273B2 (en) * 2014-12-16 2017-03-21 Google Inc. Efficient annotation system for distributed version control systems
US20170011445A1 (en) * 2015-03-03 2017-01-12 Go Daddy Operating Company, LLC Business asset search for recommending legal service providers
US10388404B2 (en) 2015-10-27 2019-08-20 International Business Machines Corporation Using machine-learning to perform linear regression on a DNA-computing platform
KR20180111979A (ko) 2016-02-11 2018-10-11 이베이 인크. 의미론적 카테고리 분류법
US11151653B1 (en) 2016-06-16 2021-10-19 Decision Resources, Inc. Method and system for managing data
JP6753190B2 (ja) * 2016-07-27 2020-09-09 富士ゼロックス株式会社 文書検索装置及びプログラム
US10635727B2 (en) 2016-08-16 2020-04-28 Ebay Inc. Semantic forward search indexing of publication corpus
KR102017853B1 (ko) * 2016-09-06 2019-09-03 주식회사 카카오 검색 방법 및 장치
US10453101B2 (en) * 2016-10-14 2019-10-22 SoundHound Inc. Ad bidding based on a buyer-defined function
EP3590053A4 (en) 2017-02-28 2020-11-25 SavantX, Inc. SYSTEM AND METHOD OF ANALYSIS AND DATA TRAVEL
US11328128B2 (en) 2017-02-28 2022-05-10 SavantX, Inc. System and method for analysis and navigation of data
US10565256B2 (en) 2017-03-20 2020-02-18 Google Llc Contextually disambiguating queries
US10223639B2 (en) 2017-06-22 2019-03-05 International Business Machines Corporation Relation extraction using co-training with distant supervision
US10229195B2 (en) * 2017-06-22 2019-03-12 International Business Machines Corporation Relation extraction using co-training with distant supervision
JP6963988B2 (ja) * 2017-12-19 2021-11-10 ヤフー株式会社 提供装置、提供方法および提供プログラム
US10762083B2 (en) * 2017-12-21 2020-09-01 Microsoft Technology Licensing, Llc Entity- and string-based search using a dynamic knowledge graph
JP6435467B1 (ja) * 2018-03-05 2018-12-12 株式会社テンクー 検索システム及び検索システムの動作方法
US11768804B2 (en) * 2018-03-29 2023-09-26 Konica Minolta Business Solutions U.S.A., Inc. Deep search embedding of inferred document characteristics
RU2692045C1 (ru) 2018-05-18 2019-06-19 Общество С Ограниченной Ответственностью "Яндекс" Способ и система для рекомендации свежих саджестов поисковых запросов в поисковой системе
US11698921B2 (en) 2018-09-17 2023-07-11 Ebay Inc. Search system for providing search results using query understanding and semantic binary signatures
US10891324B2 (en) 2018-09-21 2021-01-12 International Business Machines Corporation Weighting of unobserved terms in a language model for information retrieval using lexical resources
US10891445B2 (en) * 2019-02-28 2021-01-12 International Business Machines Corporation Using decay characteristics for natural language understanding output
US11176209B2 (en) * 2019-08-06 2021-11-16 International Business Machines Corporation Dynamically augmenting query to search for content not previously known to the user
CN110647826B (zh) * 2019-09-05 2022-04-29 北京百度网讯科技有限公司 商品训练图片的获取方法、装置、计算机设备和存储介质
US10963636B1 (en) * 2019-10-17 2021-03-30 Sap Se Sourcing object creation from natural language inputs
US20220414168A1 (en) * 2021-06-24 2022-12-29 Kyndryl, Inc. Semantics based search result optimization
CN113961765B (zh) * 2021-10-21 2023-12-19 北京百度网讯科技有限公司 基于神经网络模型的搜索方法、装置、设备和介质

Family Cites Families (247)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1407351A (en) 1973-02-06 1975-09-24 Standard Telephones Cables Ltd Injection lasers
US4532813A (en) 1984-01-03 1985-08-06 Alpha Gauge & Instrument Company Kinetic fluid sampler
US4972328A (en) 1988-12-16 1990-11-20 Bull Hn Information Systems Inc. Interactive knowledge base end user interface driven maintenance and acquisition system
US5369763A (en) 1989-02-01 1994-11-29 Kansas State University Research Foundation Data storage and retrieval system with improved data base structure
US5193185A (en) 1989-05-15 1993-03-09 David Lanter Method and means for lineage tracing of a spatial information processing and database system
US5056021A (en) 1989-06-08 1991-10-08 Carolyn Ausborn Method and apparatus for abstracting concepts from natural language
US5745910A (en) 1993-05-10 1998-04-28 Apple Computer, Inc. Frame structure which provides an interface between parts of a compound document
US5544352A (en) 1993-06-14 1996-08-06 Libertech, Inc. Method and apparatus for indexing, searching and displaying data
US6167390A (en) 1993-12-08 2000-12-26 3M Innovative Properties Company Facet classification neural network
JPH08171569A (ja) 1994-10-28 1996-07-02 Fuji Xerox Co Ltd 文書検索装置
US6460036B1 (en) 1994-11-29 2002-10-01 Pinpoint Incorporated System and method for providing customized electronic newspapers and target advertisements
JP3578498B2 (ja) 1994-12-02 2004-10-20 株式会社ソニー・コンピュータエンタテインメント 画像情報処理装置
US5794050A (en) * 1995-01-04 1998-08-11 Intelligent Text Processing, Inc. Natural language understanding system
US5835758A (en) 1995-02-28 1998-11-10 Vidya Technologies, Inc. Method and system for respresenting and processing physical and conceptual entities
US5822731A (en) * 1995-09-15 1998-10-13 Infonautics Corporation Adjusting a hidden Markov model tagger for sentence fragments
US5911145A (en) 1996-07-29 1999-06-08 Rae Technology, Inc. Hierarchical structure editor for web sites
US5966637A (en) * 1996-11-12 1999-10-12 Thomson Consumer Electronics, Inc. System and method for receiving and rendering multi-lingual text on a set top box
US5937400A (en) 1997-03-19 1999-08-10 Au; Lawrence Method to quantify abstraction within semantic networks
US6006222A (en) 1997-04-25 1999-12-21 Culliss; Gary Method for organizing information
US6233575B1 (en) 1997-06-24 2001-05-15 International Business Machines Corporation Multilevel taxonomy based on features derived from training documents classification using fisher values as discrimination values
US6098033A (en) 1997-07-31 2000-08-01 Microsoft Corporation Determining similarity between words
US6138085A (en) 1997-07-31 2000-10-24 Microsoft Corporation Inferring semantic relations
US6078916A (en) 1997-08-01 2000-06-20 Culliss; Gary Method for organizing information
US6772136B2 (en) 1997-08-21 2004-08-03 Elaine Kant System and method for financial instrument modeling and using Monte Carlo simulation
US6173276B1 (en) 1997-08-21 2001-01-09 Scicomp, Inc. System and method for financial instrument modeling and valuation
US6295066B1 (en) 1997-09-12 2001-09-25 Hitachi, Ltd. Method for generating virtual three-dimensional space
US5953726A (en) 1997-11-24 1999-09-14 International Business Machines Corporation Method and apparatus for maintaining multiple inheritance concept hierarchies
US6349275B1 (en) 1997-11-24 2002-02-19 International Business Machines Corporation Multiple concurrent language support system for electronic catalogue using a concept based knowledge representation
US6396864B1 (en) 1998-03-13 2002-05-28 Jds Uniphase Corporation Thermally conductive coatings for light emitting devices
US20070094222A1 (en) 1998-05-28 2007-04-26 Lawrence Au Method and system for using voice input for performing network functions
US7711672B2 (en) 1998-05-28 2010-05-04 Lawrence Au Semantic network methods to disambiguate natural language meaning
US8396824B2 (en) 1998-05-28 2013-03-12 Qps Tech. Limited Liability Company Automatic data categorization with optimally spaced semantic seed terms
EP0962873A1 (en) 1998-06-02 1999-12-08 International Business Machines Corporation Processing of textual information and automated apprehension of information
US6356899B1 (en) 1998-08-29 2002-03-12 International Business Machines Corporation Method for interactively creating an information database including preferred information elements, such as preferred-authority, world wide web pages
US6334131B2 (en) 1998-08-29 2001-12-25 International Business Machines Corporation Method for cataloging, filtering, and relevance ranking frame-based hierarchical information structures
US6460029B1 (en) * 1998-12-23 2002-10-01 Microsoft Corporation System for improving search text
US6292792B1 (en) 1999-03-26 2001-09-18 Intelligent Learning Systems, Inc. System and method for dynamic knowledge generation and distribution
DE19917592A1 (de) 1999-04-19 2000-10-26 Delphi 2 Creative Tech Gmbh Situationsabhängig operierendes semantisches Netz n-ter Ordnung
EP1185964A1 (en) 1999-05-05 2002-03-13 Accenture Properties (2) B.V. System, method and article of manufacture for creating collaborative simulations with multiple roles for a single student
US6401061B1 (en) 1999-05-13 2002-06-04 Yuri L. Zieman Combinatorial computational technique for transformation phrase text-phrase meaning
US6711585B1 (en) 1999-06-15 2004-03-23 Kanisa Inc. System and method for implementing a knowledge management system
AU763131B2 (en) 1999-07-09 2003-07-17 Acularo Pty Ltd Methods of organising information
US7200563B1 (en) 1999-08-20 2007-04-03 Acl International Inc. Ontology-driven information system
US6499024B1 (en) 1999-08-24 2002-12-24 Stream International, Inc. Method and system for development of a knowledge base system
US6539376B1 (en) 1999-11-15 2003-03-25 International Business Machines Corporation System and method for the automatic mining of new relationships
US6317700B1 (en) * 1999-12-22 2001-11-13 Curtis A. Bagne Computational method and system to perform empirical induction
US6556983B1 (en) 2000-01-12 2003-04-29 Microsoft Corporation Methods and apparatus for finding semantic information, such as usage logs, similar to a query using a pattern lattice data space
US6751621B1 (en) * 2000-01-27 2004-06-15 Manning & Napier Information Services, Llc. Construction of trainable semantic vectors and clustering, classification, and searching using trainable semantic vectors
US6976020B2 (en) 2000-01-27 2005-12-13 Poppet International, Inc. Software composition using graph types, graph, and agents
US6868525B1 (en) 2000-02-01 2005-03-15 Alberti Anemometer Llc Computer graphic display visualization system and method
US6571240B1 (en) 2000-02-02 2003-05-27 Chi Fai Ho Information processing for searching categorizing information in a document based on a categorization hierarchy and extracted phrases
US7412462B2 (en) * 2000-02-18 2008-08-12 Burnside Acquisition, Llc Data repository and method for promoting network storage of data
AU2001255806A1 (en) 2000-03-14 2001-09-24 Sony Electronics Inc. A method and device for forming a semantic description
US6539395B1 (en) 2000-03-22 2003-03-25 Mood Logic, Inc. Method for creating a database for comparing music
US6654744B2 (en) 2000-04-17 2003-11-25 Fujitsu Limited Method and apparatus for categorizing information, and a computer product
US7062483B2 (en) 2000-05-18 2006-06-13 Endeca Technologies, Inc. Hierarchical data-driven search and navigation system and method for information retrieval
US7035864B1 (en) 2000-05-18 2006-04-25 Endeca Technologies, Inc. Hierarchical data-driven navigation system and method for information retrieval
US20020091736A1 (en) 2000-06-23 2002-07-11 Decis E-Direct, Inc. Component models
US6785683B1 (en) 2000-07-06 2004-08-31 International Business Machines Corporation Categorization and presentation tool for code resources
WO2002005088A1 (en) 2000-07-06 2002-01-17 British Telecommunications Public Limited Company Method and apparatus for extracting knowledge from software code or other structured data
US20050010428A1 (en) 2000-07-27 2005-01-13 Bergeron Heather Ellen Processing transactions using a semantic network
US20030217052A1 (en) * 2000-08-24 2003-11-20 Celebros Ltd. Search engine method and apparatus
US7478089B2 (en) 2003-10-29 2009-01-13 Kontera Technologies, Inc. System and method for real-time web page context analysis for the real-time insertion of textual markup objects and dynamic content
US6768982B1 (en) 2000-09-06 2004-07-27 Cellomics, Inc. Method and system for creating and using knowledge patterns
US20100198724A1 (en) 2004-08-02 2010-08-05 Consumer And Merchant Awareness Foundation Pay yourself first with community knowledge
US20100223295A1 (en) 2000-12-06 2010-09-02 Io Informatics, Inc. Applied Semantic Knowledgebases and Applications Thereof
US7062466B2 (en) 2000-12-06 2006-06-13 The Belo Company Method and system for operating online classified advertisements
KR20020049164A (ko) 2000-12-19 2002-06-26 오길록 유전자 알고리즘을 이용한 카테고리 학습과 단어클러스터에 의한 문서 자동 분류 시스템 및 그 방법
US20020087532A1 (en) 2000-12-29 2002-07-04 Steven Barritz Cooperative, interactive, heuristic system for the creation and ongoing modification of categorization systems
EP1225517B1 (en) 2001-01-17 2006-05-17 International Business Machines Corporation System and methods for computer based searching for relevant texts
US7089237B2 (en) 2001-01-26 2006-08-08 Google, Inc. Interface and system for providing persistent contextual relevance for commerce activities in a networked environment
WO2002071267A2 (en) 2001-03-08 2002-09-12 International Business Machines Corporation System and method for personalized presentation of web pages
US7120646B2 (en) 2001-04-09 2006-10-10 Health Language, Inc. Method and system for interfacing with a multi-level data structure
WO2002084590A1 (en) 2001-04-11 2002-10-24 Applied Minds, Inc. Knowledge web
WO2002088989A1 (en) 2001-04-30 2002-11-07 Goraya Tanvir Y Adaptive dynamic personal modeling system and method
US20020194187A1 (en) 2001-05-16 2002-12-19 Mcneil John Multi-paradigm knowledge-bases
US6980984B1 (en) 2001-05-16 2005-12-27 Kanisa, Inc. Content provider systems and methods using structured data
US20030126136A1 (en) 2001-06-22 2003-07-03 Nosa Omoigui System and method for knowledge retrieval, management, delivery and presentation
CN1395193A (zh) 2001-07-05 2003-02-05 英业达股份有限公司 在网页上生成动态可编辑表格的方法
US7007074B2 (en) 2001-09-10 2006-02-28 Yahoo! Inc. Targeted advertisements using time-dependent key search terms
US7181465B2 (en) 2001-10-29 2007-02-20 Gary Robin Maze System and method for the management of distributed personalized information
US20090198561A1 (en) 2001-11-14 2009-08-06 Retaildna, Llc Self learning method and system for managing agreements to purchase goods over time
US7283992B2 (en) 2001-11-30 2007-10-16 Microsoft Corporation Media agent to suggest contextually related media content
US7225183B2 (en) 2002-01-28 2007-05-29 Ipxl, Inc. Ontology-based information management system and method
US20050154708A1 (en) 2002-01-29 2005-07-14 Yao Sun Information exchange between heterogeneous databases through automated identification of concept equivalence
US7716207B2 (en) 2002-02-26 2010-05-11 Odom Paul S Search engine methods and systems for displaying relevant topics
AU2003212463A1 (en) 2002-03-01 2003-09-16 Paul Jeffrey Krupin A method and system for creating improved search queries
US20030196094A1 (en) 2002-04-10 2003-10-16 Hillis W. Daniel Method and apparatus for authenticating the content of a distributed database
US7085771B2 (en) 2002-05-17 2006-08-01 Verity, Inc System and method for automatically discovering a hierarchy of concepts from a corpus of documents
US7249117B2 (en) 2002-05-22 2007-07-24 Estes Timothy W Knowledge discovery agent system and method
US6946715B2 (en) 2003-02-19 2005-09-20 Micron Technology, Inc. CMOS image sensor and method of fabrication
DE60318471T2 (de) 2002-10-15 2008-12-24 Definiens Ag Extraktion von wissen mittels eines objektbasierten semantischen netzes
US7440940B2 (en) 2002-12-02 2008-10-21 Sap Ag Web service agent
US7447667B2 (en) 2002-12-11 2008-11-04 International Business Machines Corporation Method and knowledge structures for reasoning about concepts, relations, and rules
WO2004063967A2 (en) 2003-01-10 2004-07-29 Cohesive Knowledge Solutions, Inc. Universal knowledge information and data storage system
AU2004213986A1 (en) 2003-02-14 2004-09-02 Nervana, Inc. Semantic knowledge retrieval management and presentation
US7051023B2 (en) 2003-04-04 2006-05-23 Yahoo! Inc. Systems and methods for generating concept units from search queries
US7152065B2 (en) 2003-05-01 2006-12-19 Telcordia Technologies, Inc. Information retrieval and text mining using distributed latent semantic indexing
WO2004097664A2 (en) 2003-05-01 2004-11-11 Axonwave Software Inc. A method and system for concept generation and management
JP2004348554A (ja) * 2003-05-23 2004-12-09 Nippon Telegr & Teleph Corp <Ntt> 検索キーワード情報提供装置、検索キーワード情報提供方法、及び検索キーワード情報提供プログラム
US7298906B2 (en) 2003-07-08 2007-11-20 Computer Associates Think, Inc. Hierarchical determination of feature relevancy for mixed data types
WO2005020091A1 (en) 2003-08-21 2005-03-03 Idilia Inc. System and method for processing text utilizing a suite of disambiguation techniques
EP2397954A1 (en) * 2003-08-21 2011-12-21 Idilia Inc. System and method for associating queries and documents with contextual advertisements
WO2005022403A1 (en) 2003-08-27 2005-03-10 Sox Limited Method of building persistent polyhierarchical classifications based on polyhierarchies of classification criteria
US20050223109A1 (en) 2003-08-27 2005-10-06 Ascential Software Corporation Data integration through a services oriented architecture
EP1510940A1 (en) 2003-08-29 2005-03-02 Sap Ag A method of providing a visualisation graph on a computer and a computer for providing a visualisation graph
US7240049B2 (en) * 2003-11-12 2007-07-03 Yahoo! Inc. Systems and methods for search query processing using trend analysis
US7281002B2 (en) 2004-03-01 2007-10-09 International Business Machine Corporation Organizing related search results
US20050210008A1 (en) 2004-03-18 2005-09-22 Bao Tran Systems and methods for analyzing documents over a network
WO2004061546A2 (fr) 2004-03-19 2004-07-22 Adsclick S.A. Dispositif de navigation et plate-forme de gestion et de diffusion en mode serveur, notamment pour l'affichage de liens publicitaires
US20050216335A1 (en) 2004-03-24 2005-09-29 Andrew Fikes System and method for providing on-line user-assisted Web-based advertising
JP4165426B2 (ja) 2004-03-26 2008-10-15 日本電信電話株式会社 話題抽出方法及び装置及びプログラム
US7716216B1 (en) 2004-03-31 2010-05-11 Google Inc. Document ranking based on semantic distance between terms in a document
US20070300142A1 (en) 2005-04-01 2007-12-27 King Martin T Contextual dynamic advertising based upon captured rendered text
US20050289524A1 (en) 2004-06-22 2005-12-29 Mcginnes Simon Systems and methods for software based on business concepts
EP1782285A1 (en) 2004-07-06 2007-05-09 Icosystem Corporation Methods and apparatus for query refinement using genetic algorithms
US20060020424A1 (en) * 2004-07-20 2006-01-26 Carl Quindel Apparatus and method for analyzing trends with values of interest
US7496962B2 (en) 2004-07-29 2009-02-24 Sourcefire, Inc. Intrusion detection strategies for hypertext transport protocol
WO2006011819A1 (en) 2004-07-30 2006-02-02 Eurekster, Inc. Adaptive search engine
US7685118B2 (en) * 2004-08-12 2010-03-23 Iwint International Holdings Inc. Method using ontology and user query processing to solve inventor problems and user problems
US20060053172A1 (en) 2004-09-03 2006-03-09 Biowisdom Limited System and method for creating, editing, and using multi-relational ontologies
US7496593B2 (en) 2004-09-03 2009-02-24 Biowisdom Limited Creating a multi-relational ontology having a predetermined structure
US20060074980A1 (en) 2004-09-29 2006-04-06 Sarkar Pte. Ltd. System for semantically disambiguating text information
US7475093B2 (en) 2004-10-15 2009-01-06 Microsoft Corporation Memory cache management in XML/relational data mapping
US7302418B2 (en) 2004-10-15 2007-11-27 Microsoft Corporation Trade-off/semantic networks
JP2006133955A (ja) 2004-11-04 2006-05-25 Nec Corp 移動通信端末内データのバックアップシステム及び方法並びにそれに用いられる移動通信端末及びバックアップ装置
US8001527B1 (en) 2004-12-21 2011-08-16 Zenprise, Inc. Automated root cause analysis of problems associated with software application deployments
FI20050017A0 (fi) 2005-01-07 2005-01-07 Nokia Corp Binääriluokkaan perustuva analysointi ja monitorointi
US7606168B2 (en) 2005-01-28 2009-10-20 Attenex Corporation Apparatus and method for message-centric analysis and multi-aspect viewing using social networks
JP4185059B2 (ja) * 2005-02-18 2008-11-19 大日本印刷株式会社 トレンド予測装置およびトレンド予測方法
US9378203B2 (en) 2008-05-01 2016-06-28 Primal Fusion Inc. Methods and apparatus for providing information of interest to one or more users
US20120166371A1 (en) 2005-03-30 2012-06-28 Primal Fusion Inc. Knowledge representation systems and methods incorporating data consumer models and preferences
US7606781B2 (en) 2005-03-30 2009-10-20 Primal Fusion Inc. System, method and computer program for facet analysis
US7844565B2 (en) 2005-03-30 2010-11-30 Primal Fusion Inc. System, method and computer program for using a multi-tiered knowledge representation model
US7596574B2 (en) 2005-03-30 2009-09-29 Primal Fusion, Inc. Complex-adaptive system for providing a facted classification
US7849090B2 (en) 2005-03-30 2010-12-07 Primal Fusion Inc. System, method and computer program for faceted classification synthesis
US10002325B2 (en) 2005-03-30 2018-06-19 Primal Fusion Inc. Knowledge representation systems and methods incorporating inference rules
US9104779B2 (en) * 2005-03-30 2015-08-11 Primal Fusion Inc. Systems and methods for analyzing and synthesizing complex knowledge representations
US8849860B2 (en) 2005-03-30 2014-09-30 Primal Fusion Inc. Systems and methods for applying statistical inference techniques to knowledge representations
US7502810B2 (en) 2005-05-24 2009-03-10 International Business Machines Corporation Tagging of facet elements in a facet tree
US20060271520A1 (en) 2005-05-27 2006-11-30 Ragan Gene Z Content-based implicit search query
US9286388B2 (en) 2005-08-04 2016-03-15 Time Warner Cable Enterprises Llc Method and apparatus for context-specific content delivery
US8027876B2 (en) 2005-08-08 2011-09-27 Yoogli, Inc. Online advertising valuation apparatus and method
US20070106499A1 (en) * 2005-08-09 2007-05-10 Kathleen Dahlgren Natural language search system
US20070061195A1 (en) 2005-09-13 2007-03-15 Yahoo! Inc. Framework for selecting and delivering advertisements over a network based on combined short-term and long-term user behavioral interests
US8472985B2 (en) 2005-09-21 2013-06-25 Buckyball Mobile, Inc Incentive marketing with a context-enriched message
US8023739B2 (en) 2005-09-27 2011-09-20 Battelle Memorial Institute Processes, data structures, and apparatuses for representing knowledge
US20070078889A1 (en) 2005-10-04 2007-04-05 Hoskinson Ronald A Method and system for automated knowledge extraction and organization
US7613690B2 (en) 2005-10-21 2009-11-03 Aol Llc Real time query trends with multi-document summarization
US8019752B2 (en) 2005-11-10 2011-09-13 Endeca Technologies, Inc. System and method for information retrieval from object collections with complex interrelationships
US20100285818A1 (en) 2009-05-08 2010-11-11 Crawford C S Lee Location based service for directing ads to subscribers
US20070143300A1 (en) 2005-12-20 2007-06-21 Ask Jeeves, Inc. System and method for monitoring evolution over time of temporal content
US7676485B2 (en) 2006-01-20 2010-03-09 Ixreveal, Inc. Method and computer program product for converting ontologies into concept semantic networks
US20070203865A1 (en) 2006-02-09 2007-08-30 Hirsch Martin C Apparatus and methods for an item retrieval system
US7580918B2 (en) 2006-03-03 2009-08-25 Adobe Systems Incorporated System and method of efficiently representing and searching directed acyclic graph structures in databases
US20070208764A1 (en) 2006-03-06 2007-09-06 John Edward Grisinger Universal information platform
WO2007106858A2 (en) 2006-03-15 2007-09-20 Araicom Research Llc System, method, and computer program product for data mining and automatically generating hypotheses from data repositories
US8380488B1 (en) * 2006-04-19 2013-02-19 Google Inc. Identifying a property of a document
US8024329B1 (en) 2006-06-01 2011-09-20 Monster Worldwide, Inc. Using inverted indexes for contextual personalized information retrieval
JP4946187B2 (ja) 2006-06-09 2012-06-06 富士ゼロックス株式会社 関連語表示装置、検索装置、その方法及びプログラム
US8108204B2 (en) 2006-06-16 2012-01-31 Evgeniy Gabrilovich Text categorization using external knowledge
WO2007149216A2 (en) * 2006-06-21 2007-12-27 Information Extraction Systems An apparatus, system and method for developing tools to process natural language text
US20080001948A1 (en) 2006-06-30 2008-01-03 Martin Christian Hirsch Method and apparatus for the collaborative knowledge-based creation and extension of an information graph
US8166029B2 (en) 2006-09-07 2012-04-24 Yahoo! Inc. System and method for identifying media content items and related media content items
US7752534B2 (en) 2006-09-19 2010-07-06 International Business Machines Corporation Method and apparatus for customizing the display of multidimensional data
US7716150B2 (en) * 2006-09-28 2010-05-11 Microsoft Corporation Machine learning system for analyzing and establishing tagging trends based on convergence criteria
US7672909B2 (en) * 2006-09-28 2010-03-02 Microsoft Corporation Machine learning system and method comprising segregator convergence and recognition components to determine the existence of possible tagging data trends and identify that predetermined convergence criteria have been met or establish criteria for taxonomy purpose then recognize items based on an aggregate of user tagging behavior
US20080086465A1 (en) 2006-10-09 2008-04-10 Fontenot Nathan D Establishing document relevance by semantic network density
US20080092044A1 (en) 2006-10-12 2008-04-17 International Business Machines Corporation Cascading clouds
JP4807880B2 (ja) 2006-10-19 2011-11-02 日本電信電話株式会社 蓄積文書分類装置、蓄積文書分類方法、プログラムおよび記録媒体
US20080137668A1 (en) 2006-12-08 2008-06-12 The Regents Of The University Of California Social semantic networks for distributing contextualized information
WO2008076438A1 (en) 2006-12-18 2008-06-26 Mind Fund Llc Augmenting individual and collective human thinking and knowledge navigation and creation
US20080154906A1 (en) 2006-12-22 2008-06-26 International Business Machines Corporation Selecting information for ad hoc exchange
US8930178B2 (en) 2007-01-04 2015-01-06 Children's Hospital Medical Center Processing text with domain-specific spreading activation methods
US7945555B2 (en) 2007-02-01 2011-05-17 Yume, Inc. Method for categorizing content published on internet
US7437370B1 (en) 2007-02-19 2008-10-14 Quintura, Inc. Search engine graphical interface using maps and images
US7529743B1 (en) 2007-02-26 2009-05-05 Quintura, Inc. GUI for subject matter navigation using maps and search terms
US20080208589A1 (en) * 2007-02-27 2008-08-28 Cross Charles W Presenting Supplemental Content For Digital Media Using A Multimodal Application
US20080228568A1 (en) 2007-03-16 2008-09-18 Microsoft Corporation Delivery of coupons through advertisement
US8244772B2 (en) * 2007-03-29 2012-08-14 Franz, Inc. Method for creating a scalable graph database using coordinate data elements
US20080243480A1 (en) 2007-03-30 2008-10-02 Yahoo! Inc. System and method for determining semantically related terms
CA2684397A1 (en) 2007-04-25 2008-11-06 Counsyl, Inc. Methods and systems of automatic ontology population
US7899666B2 (en) 2007-05-04 2011-03-01 Expert System S.P.A. Method and system for automatically extracting relations between concepts included in text
US8706704B2 (en) 2007-07-11 2014-04-22 International Business Machines Corporation Method and system for creating semantic relationships using hyperlinks
US20090024556A1 (en) 2007-07-16 2009-01-22 Semgine, Gmbh Semantic crawler
US20090024385A1 (en) 2007-07-16 2009-01-22 Semgine, Gmbh Semantic parser
US8688521B2 (en) 2007-07-20 2014-04-01 Yahoo! Inc. System and method to facilitate matching of content to advertising information in a network
US20090028164A1 (en) 2007-07-23 2009-01-29 Semgine, Gmbh Method and apparatus for semantic serializing
JP2010537323A (ja) 2007-08-20 2010-12-02 フェイスブック,インク. ソーシャルネットワークにおける広告のターゲット設定
US8041697B2 (en) 2007-08-31 2011-10-18 Microsoft Corporation Semi-automatic example-based induction of semantic translation rules to support natural language search
US9268849B2 (en) 2007-09-07 2016-02-23 Alexander Siedlecki Apparatus and methods for web marketing tools for digital archives—web portal advertising arts
US20090083140A1 (en) 2007-09-25 2009-03-26 Yahoo! Inc. Non-intrusive, context-sensitive integration of advertisements within network-delivered media content
US8838659B2 (en) 2007-10-04 2014-09-16 Amazon Technologies, Inc. Enhanced knowledge repository
US7392250B1 (en) 2007-10-22 2008-06-24 International Business Machines Corporation Discovering interestingness in faceted search
JP5088096B2 (ja) 2007-11-02 2012-12-05 富士通株式会社 情報抽出プログラムおよび情報抽出装置
US20100287011A1 (en) 2007-11-13 2010-11-11 Martec Corporation Method and System of Location-Based Game for Improving Mobile Operator's Profit
US7904399B2 (en) * 2007-11-15 2011-03-08 International Business Machines Corporation Method and apparatus for determining decision points for streaming conversational data
US8180637B2 (en) 2007-12-03 2012-05-15 Microsoft Corporation High performance HMM adaptation with joint compensation of additive and convolutive distortions
US20090150809A1 (en) 2007-12-05 2009-06-11 Semgine Gmbh Pinpoint browser
US20090157616A1 (en) 2007-12-12 2009-06-18 Richard Barber System and method for enabling a user to search and retrieve individual topics in a visual mapping system
US20090157442A1 (en) 2007-12-13 2009-06-18 Yahoo! Inc. System and Method for Improving the Performance of Digital Advertisements
WO2009079570A2 (en) * 2007-12-17 2009-06-25 Landmark Graphics Corporation, A Halliburton Company Systems and methods for optimization of real time production operations
US8402031B2 (en) 2008-01-11 2013-03-19 Microsoft Corporation Determining entity popularity using search queries
US20100100546A1 (en) 2008-02-08 2010-04-22 Steven Forrest Kohler Context-aware semantic virtual community for communication, information and knowledge management
US8676732B2 (en) 2008-05-01 2014-03-18 Primal Fusion Inc. Methods and apparatus for providing information of interest to one or more users
US9361365B2 (en) * 2008-05-01 2016-06-07 Primal Fusion Inc. Methods and apparatus for searching of content using semantic synthesis
US20110314382A1 (en) 2010-06-22 2011-12-22 Primal Fusion Inc. Systems of computerized agents and user-directed semantic networking
CN102016887A (zh) 2008-05-01 2011-04-13 启创互联公司 用于用户驱动的语义网络和媒体合成的动态产生的方法、系统和计算机程序
US8712926B2 (en) * 2008-05-23 2014-04-29 International Business Machines Corporation Using rule induction to identify emerging trends in unstructured text streams
US7865592B2 (en) 2008-06-26 2011-01-04 International Business Machines Corporation Using semantic networks to develop a social network
US8359191B2 (en) 2008-08-01 2013-01-22 International Business Machines Corporation Deriving ontology based on linguistics and community tag clouds
US8583574B2 (en) 2008-08-06 2013-11-12 Delfigo Corporation Method of and apparatus for combining artificial intelligence (AI) concepts with event-driven security architectures and ideas
US9317589B2 (en) 2008-08-07 2016-04-19 International Business Machines Corporation Semantic search by means of word sense disambiguation using a lexicon
US8386506B2 (en) 2008-08-21 2013-02-26 Yahoo! Inc. System and method for context enhanced messaging
CA2734756C (en) 2008-08-29 2018-08-21 Primal Fusion Inc. Systems and methods for semantic concept definition and semantic concept relationship synthesis utilizing existing domain definitions
US20100107094A1 (en) 2008-09-26 2010-04-29 Ryan Steelberg Advertising request and rules-based content provision engine, system and method
WO2010048430A2 (en) * 2008-10-22 2010-04-29 Fwix, Inc. System and method for identifying trends in web feeds collected from various content servers
US9396455B2 (en) 2008-11-10 2016-07-19 Mindjet Llc System, method, and software application for enabling a user to view and interact with a visual map in an external application
US8244224B2 (en) * 2008-11-20 2012-08-14 Research In Motion Limited Providing customized information to a user based on identifying a trend
US8352321B2 (en) 2008-12-12 2013-01-08 Microsoft Corporation In-text embedded advertising
US8335754B2 (en) 2009-03-06 2012-12-18 Tagged, Inc. Representing a document using a semantic structure
US20100250526A1 (en) 2009-03-27 2010-09-30 Prochazka Filip Search System that Uses Semantic Constructs Defined by Your Social Network
US20100257171A1 (en) 2009-04-03 2010-10-07 Yahoo! Inc. Techniques for categorizing search queries
US20100262456A1 (en) 2009-04-08 2010-10-14 Jun Feng System and Method for Deep Targeting Advertisement Based on Social Behaviors
WO2010120934A2 (en) 2009-04-15 2010-10-21 Evri Inc. Search enhanced semantic advertising
US8429287B2 (en) * 2009-04-29 2013-04-23 Rangecast Technologies, Llc Network audio distribution system and method
US20100280860A1 (en) 2009-04-30 2010-11-04 Adaptiveblue Inc. Contextual social network based on the semantic web
FR2947358B1 (fr) 2009-06-26 2013-02-15 Alcatel Lucent Un assistant-conseiller utilisant l'analyse semantique des echanges communautaires
US8180768B2 (en) 2009-08-13 2012-05-15 Politecnico Di Milano Method for extracting, merging and ranking search engine results
US9292855B2 (en) 2009-09-08 2016-03-22 Primal Fusion Inc. Synthesizing messaging using context provided by consumers
CN107403333B (zh) 2009-09-08 2021-04-09 启创互联公司 使用消费者提供的上下文同步消息传送
US20110060645A1 (en) 2009-09-08 2011-03-10 Peter Sweeney Synthesizing messaging using context provided by consumers
US20110060644A1 (en) 2009-09-08 2011-03-10 Peter Sweeney Synthesizing messaging using context provided by consumers
US8645372B2 (en) * 2009-10-30 2014-02-04 Evri, Inc. Keyword-based search engine results using enhanced query strategies
US9262520B2 (en) 2009-11-10 2016-02-16 Primal Fusion Inc. System, method and computer program for creating and manipulating data structures using an interactive graphical interface
US8281238B2 (en) 2009-11-10 2012-10-02 Primal Fusion Inc. System, method and computer program for creating and manipulating data structures using an interactive graphical interface
US20110173176A1 (en) 2009-12-16 2011-07-14 International Business Machines Corporation Automatic Generation of an Interest Network and Tag Filter
JP5921536B2 (ja) 2010-06-22 2016-05-24 プライマル フュージョン インコーポレイテッド コンピュータ化エージェントのシステムとユーザ指図セマンティックネットワーキング
US8725739B2 (en) * 2010-11-01 2014-05-13 Evri, Inc. Category-based content recommendation
US8620852B1 (en) * 2010-12-16 2013-12-31 The Boeing Company Systems, methods, and computer program products for predictive accuracy for strategic decision support
WO2012088591A1 (en) 2010-12-30 2012-07-05 Primal Fusion Inc. System and method for performing a semantic operation on a digital social network
WO2012088590A1 (en) 2010-12-30 2012-07-05 Primal Fusion Inc. System and method for using a knowledge representation to provide information based on environmental inputs
AU2012203964A1 (en) 2010-12-30 2013-07-18 Primal Fusion Inc. Methods and apparatus for providing information of interest to one or more users
CA3055137C (en) 2011-01-07 2023-09-12 Ihab Francis Ilyas Systems and methods for analyzing and synthesizing complex knowledge representations
US8818932B2 (en) * 2011-02-14 2014-08-26 Decisive Analytics Corporation Method and apparatus for creating a predictive model
CN103974950B (zh) * 2011-12-01 2016-12-21 凯莫森特里克斯股份有限公司 作为ccr(4)拮抗剂的取代的苯并咪唑类和苯并吡唑类
WO2013086431A1 (en) * 2011-12-09 2013-06-13 The Curators Of The University Of Missouri Inorganic pyrophosphate and uses thereof

Also Published As

Publication number Publication date
JP2013529805A (ja) 2013-07-22
IL223539B (en) 2019-10-31
AU2016222361A1 (en) 2016-09-15
US20160232238A1 (en) 2016-08-11
CA3044181A1 (en) 2011-12-29
CA2802909C (en) 2019-07-16
US11182440B2 (en) 2021-11-23
AU2011269675B2 (en) 2016-06-09
US20110314006A1 (en) 2011-12-22
AU2011269675A1 (en) 2013-01-10
JP6416150B2 (ja) 2018-10-31
CA2802909A1 (en) 2011-12-29
US9361365B2 (en) 2016-06-07
WO2011160204A1 (en) 2011-12-29
JP2016164800A (ja) 2016-09-08

Similar Documents

Publication Publication Date Title
JP6416150B2 (ja) 検索方法、検索システム及びコンピュータプログラム
Balog Entity-oriented search
Duan et al. An empirical study on learning to rank of tweets
Kang et al. Modeling user interest in social media using news media and wikipedia
US9798820B1 (en) Classification of keywords
Zhou et al. Query expansion with enriched user profiles for personalized search utilizing folksonomy data
US20130013616A1 (en) Systems and Methods for Natural Language Searching of Structured Data
CN102200975B (zh) 一种利用语义分析的垂直搜索引擎系统
US20060047649A1 (en) Internet and computer information retrieval and mining with intelligent conceptual filtering, visualization and automation
CN103455487B (zh) 一种搜索词的提取方法及装置
TWI695277B (zh) 自動化網站資料蒐集方法
US20080189268A1 (en) Mechanism for automatic matching of host to guest content via categorization
CN103049435A (zh) 文本细粒度情感分析方法及装置
KR100954842B1 (ko) 카테고리 태그 정보를 이용한 웹 페이지 분류 방법, 그 시스템 및 이를 기록한 기록매체
CN107330111A (zh) 基于通用形式化本体的领域本体的检索方法及装置
Wu et al. Keyword extraction for contextual advertisement
Magnani et al. Neural product retrieval at walmart. com
Wang et al. A semantic query expansion-based patent retrieval approach
Hu et al. Embracing information explosion without choking: Clustering and labeling in microblogging
Ren et al. Role-explicit query extraction and utilization for quantifying user intents
Meng A survey on query suggestion
Zhang et al. Automatic web news extraction based on DS theory considering content topics
Li et al. KREAG: Keyword query approach over RDF data based on entity-triple association graph
Kanwal et al. Urdu wikification and its application in urdu news recommendation system
Desai et al. User Feedback Session with Clicked and Unclicked Documents for Related Search Recommendation

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140328

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140328

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150127

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20150427

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150507

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151215

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160310

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160405

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160420

R150 Certificate of patent or registration of utility model

Ref document number: 5925769

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250