JP2005182817A - クエリレコグナイザ - Google Patents

クエリレコグナイザ Download PDF

Info

Publication number
JP2005182817A
JP2005182817A JP2004364893A JP2004364893A JP2005182817A JP 2005182817 A JP2005182817 A JP 2005182817A JP 2004364893 A JP2004364893 A JP 2004364893A JP 2004364893 A JP2004364893 A JP 2004364893A JP 2005182817 A JP2005182817 A JP 2005182817A
Authority
JP
Japan
Prior art keywords
query
input
recognizer
word
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004364893A
Other languages
English (en)
Inventor
Marcelo Calbucci
カルバッキ マルセロ
Sally Salas
サラス サリー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2005182817A publication Critical patent/JP2005182817A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3338Query expansion

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 分野別に分けられたデータを備える、リモートに配置されたデータソースを含むことができる複数のデータソースに対してクエリを実行するためのシステムを提供する。
【解決手段】 データソースは、小売り、旅行、娯楽などに関係するデータを含むことが可能である。データソースは、所定のコミュニティまたはコミュニティのグループのローカルデータのみを格納することもできる。本システムは、入力クエリを受け付け、そのフォームを修正して結果としてのクエリを出力するプリプロセッサを備える。この修正は、例えばスペルの訂正を含む。本システムは、クラシファイアタームおよび前回送信されたクエリまたはクエリ内の認識されたパターンからのユーザ指定分類データの存在に基いて、結果としてのクエリを分類する。本システムは、このクエリ分類に基づきクエリの実行対象となるデータソースのサブセットを選択する。
【選択図】 図2

Description

本発明は、クエリに対する回答を効率よく提示するための自動化クエリアナライザ(automated query analyzers)に関するものである。
クエリ検索エンジンの1つの目標は、クエリに対する高速応答を実現することである。オンラインユーザは応答の遅い検索エンジンに直面すると、検索要求の再送を試みて、検索を中止し、他の検索エンジンにアクセスするか、またはたぶん、結果がすぐに見つかるように検索条件を書き換える試みをすることで対処することができる。結果がユーザに十分素早く返されれば、ユーザが急いで結果を得ようと認知されている問題に対する解決策を試さなくてすみ望ましい。
Wen氏らによる刊行物(非特許文献1)は、検索エンジンの精度を高めることを目標とするプロセスについて説明している。Wen氏らの論文では、予め作成されているFAQ(よくある質問と回答)文書がクエリを問い合わせる人に提示されるようにクエリをクラスタ化する。例えば、クラスタ化プロセス(clustering process)で、クエリが「new car」について問い合わせ、その後、「new car」FAQ文書が「new car」クエリへの応答として返される。このアプローチでは、クエリクラスタ毎にFAQ文書の存在を前提とし、さらに検索エンジンに送信されるすべてのクエリについて一致するクラスタの存在を前提とする。Webサイト www.ask.com では、ユーザがクエリ結果を問い合わせるための手段を用意し、Wen氏らの論文で開示されているものと似た手法を使用することができる。
"Clustering User Queries of a Search engine", Wen等 RFC #791 Section 3.2
クエリ検索エンジン(query search engine)の一部を形成する解析ソフトウェア(analysis software)がそのカテゴリ分類に従ってクエリを正確に識別(identiyf)できる場合、検索エンジンはより迅速にクエリに応答することができる。
本発明の一実施形態によるシステムでは、ユーザからのクエリを解析(analyze)し、そのクエリに対しデータで応答する。クエリプロセッサ(query processor)は、クエリを評価(evaluate)し、クエリのフォーム(form)を他のデータソース(data source)に送信(transmit)してクエリの修正フォーム(modified form)に対する応答(response)を作成(create)する。本発明の一実施形態によるシステムでは、クエリまたはクエリの修正フォームを評価するレコグナイザコンポーネント(recognizer component)を構成(implement)し、クエリのタイプ(type)を識別(identify)する。本発明の一実施形態において、クエリプロセッサは、複数のレコグナイザ(recognizer)のうちの指定(specified)された1つまたは複数のレコグナイザに対してクエリを送信するためのレコグナイザブローカ(recognizer broker)を備えている。
このようなレコグナイザの1つは、ワード(word)またはトークン照合レコグナイザ(token match recognizer)である。本発明の一実施形態によるシステムは、クエリ入力ワード(query input word)またはトークン(token)をデータベースに格納されているワードと照合(match)し、それらのワードを信頼度レベル(confidence level)で分類(categorize)する。この信頼度レベルは、すでに送信されたクエリの使用についてユーザ格付け(user rating)の履歴(history)を定義(define)するデータベースレコード(database record)から求められる。
本発明の目的、利点、および特徴について、図面を参照して、以下に詳述する。
図2は、本発明の一実施例により構成されるクエリアナライザの概略を例示している。クエリアナライザ10は、ユーザからクエリ11を受け取るとその解析を開始する。アナライザは、ネットワークを介した他のサーバまたはコンピュータとの通信接続によりさらに結合されるサーバコンピュータなどのコンピュータシステム20(図1)上で実行するソフトウェアで構成されるのが最も一般的である。最も一般的な例では、ユーザは自分のコンピュータにログオンし、インターネットのワイドエリアネットワークを使ってサーバとして動作しているリモートコンピュータシステムと通信する。
サーバ20上に実行している検索エンジンソフトウェアは、場合によっては他の検索エンジンと連携して、クエリに対する高速応答を行う。応答は、検索結果12のフォームでユーザに送られるが、通常は、インターネットなどのネットワークを介してユーザに送り返される。この応答は、検索結果内に埋め込まれた記事またはWebサイトへのリンクを含む一連の記事またはWebサイトサマリとして形成されることができる。適当なクエリ応答コンピュータとして使用することができるコンピュータシステム20が図1に示されており、以下で詳細に説明される。
コンピュータシステム20は、クエリを評価するクエリプロセッサ10を定義するソフトウェアを含む。クエリ11を受信したことに対する1つの可能な応答は、クエリの修正されたフォームを、クエリの修正されたフォームに基づき検索を実行する他のサーバに再送することである。例えば、検索結果の他のソースとして、航空運賃、ホテルなどに関するデータを供給する流行Webサイトをホストするサーバとすることも可能である。ある国の教会のリストを保持する宗教Webサイトとすることも可能である。また、自動車販売店へのリンクを含む自動車情報専用のサイトとすることも可能である。他にも、ほんの一部であるが、もちろん、ニュース、ローカル、スポーツ、百科事典、歴史、本、映画、娯楽などのカテゴリがある。
図1に示されているサーバコンピュータシステム20は、さらに、直接、クエリを評価し、サーバ20により保持されているデータベースの内容に基づき応答または結果12を送ることもできる。このデータベースは、数千ものサイトにあるインターネット上のカタログ作成ページコンテンツを検索するウェブクローラ(web crawler)によって取得されたワードのインデックスの形態の情報を格納する。このスキャニングは、定期的に実行され、サイトのコンテンツのデータ表現にかなっていることを確認する。コンピュータシステム20がクエリ結果を検索するのか、検索要求を他のコンピュータに送信するのかに関係なく、結果12は、サーバ20により書式化され、ユーザに送り返されている。この結果はドキュメントまたは情報を含む他のサイトへのリンクのリストを含むため、ユーザがドキュメントをクリックすると、ユーザのWebブラウザは、そのリンクが指し示すインターネットアドレスにリダイレクトされる。
他の場所にある検索エンジンを効率よく利用するために、コンピュータシステム20は複数のレコグナイザ220(図3)を使用して、クエリまたはクエリの修正されたフォームを評価し、入力されたクエリの種類を識別する。クエリの種類が識別された後、アナライザフェデレーションプログラム(analyzer federation program)16は、どの代替えサイト検索エンジンにクエリを送信できるかを決定するか、またはクエリはさらに最初にクエリを受信したコンピュータシステム20により評価されるべきであるかを交互に決定する。
クエリ処理
サーバ20は、入力されたクエリに対し複数の機能を実行するクエリプロセッサコンポーネント14を含む。図4は、クエリプロセッサ10のオペレーションを示す流れ図である。クエリプロセッサは、入力されたクエリを受け取り(110)、クエリの地理的な、またインターネット(Webページ)上の発信源など特定のユーザに関するクエリコンテキスト情報、ユーザによって最近閲覧されたWebサイト、およびユーザによって最近入力されたクエリとユーザによって選択されたそれらのクエリへの結果にアクセスする(120)。クエリコンテキスト情報の一部は、クエリの発信元であるソースコンピュータのアドレスに埋め込まれた情報に含まれる。このアドレスは、複数のフィールドに分割された32ビットのキャラクタ列である。IETFにより発布されているRFC #791 Section 3.2には、IPアドレス指定システムの詳細が説明されている。
それぞれのインターネットサービスプロバイダ(または国もしくは会社)は、IP範囲クラスA、B、またはCを取得し、その特有の必要条件について利用可能な32ビットを分割する。ほとんどの場合、会社のインターネット接続場所が存在しているためIPを市に対応付けることが可能である。この逆ルックアップは、必ずしも正確ではなく、例えば、すべてのAOLユーザのIPアドレスは、バージニアを発信地とする。
次に、クエリプロセッサは複数の機能をクエリに対し実行し、クエリの解析結果が最適になるようにクエリを修正するか、または補う。このように補うのは、この特定のユーザに最も関連性の高い結果を素早く返せるようにするためである。
ステージ130において、クエリプロセッサは、クエリに対しスペルチェックを実行し、スペルに誤りがあるクエリ内のターム(term)のスペルを変更するか、またはスペルの正しいタームでクエリを補う。クエリプロセッサは、フレーズ135としてグループ化すべきタームについて正しいスペルのクエリをスキャンする。クエリプロセッサは、通常実行されるクエリに関する情報を使用して、どのタームをフレーズとしてグループ化すべきかを決定する。
ステップ140において、クエリプロセッサは、場所に敏感なローカルクエリまたは購入する商品を検索しているクエリなどの特定のタイプであることを示す指標として使用されるフレーズ内のワードを識別または認識する。これらのワードまたはタームを識別することで、クエリプロセッサは、クエリの発信元である地理的発信源に基づき郵便番号または市外局番情報などのコンテキスト固有の情報でクエリを補うことが可能である。
このステージでは、クエリの各フレーズは、クエリパーサー(query parser)200およびレコグナイザブローカ(recognizer broker)210により分解(broken)され、語幹を取り出(stemmed)され、解析(analyzed)され、コンセプト(concept)またはカテゴリの照合(category matching)が行われる。コンテンツに厳密に基づくこれらのコンセプトは、特定のユーザについて集められた過去のデータとともに、可能なフェデレーション結果(possible federation result)、つまり、最も効率のよい解析を行えるようにクエリを仲介する場所を識別する。フェデレーション(federation)とは、クエリに関係するデータを供給しクエリに対する結果を生成するためにクエリを別のサービス(内部または外部)に「ハンドオフ(handing of)」することと定義される。認識フェーズ(recognition phase)の期間中、多数のクエリレコグナイザ221、222、223、224などはクエリを評価し、クエリがレコグナイザブローカ210について定義済みカテゴリ群(predefined set of categories)のうちの1つに属す確率(probability)を求める。
クエリ前処理(query pre-processing)のパーサーレベル(parser level)で3つの別々のモジュールまたはコンポーネントが使用される。ワードブレーカ(word breaker)は、クエリの各フレーズを別々の複数のワードに分け、それらのワードを出力アレイまたはリスト内に格納する。ステマーコンポーネント(stemmer component)は、ワードブレーカの出力アレイから各ワードのルート(root)を見つけようとし、ルートワード(root word)の対応するアレイ(corresponding array)を作成(create)する。最後に、レコグナイザコンポーネント(recognizer component)は、ルートワード(またはルート(root)を持たないワードに対する実際のワード(actual word))をデータベース230に格納されているインテントリスト(intent lists)と照合(match)し、ワードのインテント(intent of word)を発見(discover)する。レコグナイザコンポーネントは、さらに、アルゴリズム的クエリインテントレコグナイザ(algorithmic query intent recognizer)を使用してパターンを検索する。この解析の結果から、カテゴリ(category)および信頼度のパーセンテージ(degree of confidence as a percentage)が得られる。いまユーザによって「compare price Buick and Satturn」というフォームのクエリが入力されたとする。
以下の表1は、このクエリに対するレコグナイザ221のこの解析結果の一覧である。
Figure 2005182817
ステージ150(図4)において、ユーザのあり得そうなインテントは、修正されたクエリに基づき、過去のクエリに照らして、決定される。例えば、ユーザが最近自動車を検索するために多数のクエリを入力した場合、またはカーポイントWebページ上のWeb検索ボックスにクエリが入力された場合、タームSaturnの意味として「car」が最も適しており、「car」が結果を得るために使用される。
仕上げられたクエリおよび決定されたクエリタイプに基づき、クエリプロセッサはステップ160でクエリの実行対象となる一組のデータソースを選択する。クエリは、「compare price Saturn and Buick cat:cars:80」というフォームの修正クエリ(modified query)である。このフォームのクエリは、プリプロセッサ14がワード「Saturn」のスペルを訂正し、クエリがカテゴリ「cars」に関係するという80%の信頼度レベルでクエリを補ったことを示す。
ステージ170において、クエリ(レコグナイザにより強化された)がデータソース上で同時に実行されるか、または好ましいデータソースが最初にアクセスされ、他のデータソースは好ましいデータソースが十分な結果をもたらさないか、またはオーバーロードしたかまたは技術的に困難であるため「タイムアウト(time out)」になった場合に使用されることができる。
データソースまたはプロバイダは、Webサーバ20上で実行されている内部プロバイダまたはEncarta、Expedia、Overture、Inktomi、Yellow Pagesなどの外部プロバイダであってもよい。データソースは、米国を発信元とする英語のクエリを意味する「en−us」などに基づき、強化された(enhanced)クエリおよびクエリ構成(query configuration)が与えられる。可能なすべてのデータソースのリストから、2つのリストが強化されたクエリおよびクエリ構成に基づいて構築される。第1のリストは、他のデータソースに依存しないソースのリストであり、第2のリストは、他のソースに依存するソースのリストである。最初に第1のリストに載っているソースが並行して呼び出され、その後、第1のリストに載っているソースに依存するソースが呼び出される。
ポピュラーなクエリへの結果を高速に供給するために、クエリプロセッサ10は結果をポピュラーなクエリにキャッシュする。結果がキャッシュされたクエリに似た結果を求めるクエリは、最初に、適切なキャッシュに送られる。キャッシュは、キャッシュされた情報の変化の速さに応じて異なる間隔で、つまり、毎日または毎時間、更新することができる。ローカルクエリとして識別されたクエリは、職業別電話帳タイプのデータソースに送られる。自動車クエリとして識別されたクエリは、自動車販売データソースに送られる。
返された結果(returned result)は、重複を取り除かれ(de-duplicated)、後処理コンポーネント(post processing component)18によりランク付け(ranked)される。その結果は、コンテキスト情報およびクエリタイプに基づいてユーザに提示される。ランク付けされた結果の提示(presentation on the ranked result)は、記録されているユーザ設定に基づいて個人化されることができる。ランク付けされた結果は、さらに、元のクエリ、結果として得られたクエリ、結果、およびどの結果がユーザによって選択されたかを記録する計測データベースに記録されることもできる。計測データベースは、検索エンジンが成功したかどうかを監視するために使用される。
レコグナイザブローカ(recognizer broker)210
レコグナイザブローカ210に多数のポイントを返すことがハイライト表示される。多数のレコグナイザ221、222などがある。本発明の一実施形態において、ブローカ210は、単に、各レコグナイザがクエリの修正されたフォームを評価し、クエリの予測されたカテゴリを返すようにするだけである。他の実施形態では、ブローカ210は、クエリのソースから導出された他の情報に基づきレコグナイザを選択する。例えば、ユーザのアドレスが発信国を「Spain」であると示している場合、英語ワード(English language word)のリスト照合レコグナイザ(list match recognizer)にクエリを送信するのは不効率であり、ブローカは利用可能な情報を使用して利用するレコグナイザに関して賢明な選択を行う。ブローカのいくつかは、ワードベースではなく、アルゴリズム的であり、発見的手法ルールを使用して認識されたパターンなどのインテントを検索する。例えば、5つの数字の列がクエリの中に現れた場合、郵便番号を識別するレコグナイザは、これはその国の特定の地域に関する検索に関係するローカル検索クエリであると、高い信頼度レベルで応答する。類似の方法で、レコグナイザは電話パターンも検索する。
本発明の実施形態では、レコグナイザは、アルゴリズム(algorithmic)タイプとリスト照合(list match)タイプの2種類がある。アルゴリズム的クエリインテントレコグナイザ(algorithmic query intent recognizer)は、発見的手法ルール(heuristic rule)を使用して、ユーザが自分のタイプしたワードで何を意味しようとしたかを判別する。一例として電話番号がある。電話番号がタイプされたかどうかを検出するルールは、3つの数字の後にセパレータがあり、その後に7つの数字もしくは3つの数字が並び、その後にセパレータが来て、その後にさらに4つの数字が並ぶ、というものである。したがって、ユーザが「(425)882−8080」とタイプした場合、レコグナイザブローカはこのクエリに高い信頼度で、電話番号であるというフラグを立てる。これは、どのソースまたはプロバイダとコンタクトをとるかについてフェデレーションブローカを補助することが可能である。アルゴリズム的クエリインテントレコグナイザの他の例として以下のものがある。
・ 電話番号−例、「find name of (425) 880-8080」
・ 郵便番号−例、「Chinese Restaurant 98052」
・ 電子メールアドレス−例、「Developer mcalb@microsoft.com」
・ URL−例、「how to go to yahoo.com」
・ UPS番号−「Track Z9857103753300」
上述のように、リスト照合クエリインテントレコグナイザ(list match query intent recognizer)は、辞書検索スキーマ(dictionary lookup schemes)に基づく。データベースは、辞書内のエントリ毎に、自動的にワードまたはフレーズを持ち、さらに候補カテゴリ(candidate category)および一致の確率(probability of a match)を格納する。データベース230内のエントリのある部分集合は、以下のエントリを含むことが可能である。
・ Paris−city(80%);hotel(40%)
・ Las Vegas−city(90%)
・ Hotel−travel(80%)
・ Jaguar−car(50%)
・ Window−car(30%)
・ Jaguar−animal(50%)
・ Restaurant−local(60%)
・ Hair Cut−local(50%)
ユーザが「Paris Hotel in Las Vegas」のようなクエリを入力した場合、該当するクエリレコグナイザは、クエリの特定の部分がcity(Paris,Las Vegas)を含み、hotel(Paris)を含み、travel(Hotel)を含むことを指示する。レコグナイザは、各ワードまたはフレーズがどのようなカテゴリに属しているかだけでなく、フレーズ上の位置をも報告する。上の例では、「Paris Hotel in Las Vegas」というこのクエリの結果は以下のようになる。
・ キャラクタ1−5:Hotel(40%)
・ キャラクタ1−5:City(80%)
・ キャラクタ7−11:Travel(80%)
・ キャラクタ16−24:City(90%)
レコグナイザブローカは、これをフェデレーションプロセッサに返し、クエリの割り当てに関する特定のアクションを実行させる。
レコグナイザ221、例えば英語リスト照合レコグナイザ(English language list match recognizer)によりクエリ内でワードに割り当てられた信頼度レベル(confidence level)は、前回検索の履歴に基づく。データベース230は、データベースに保持されている検索履歴に基づくワードのリストおよびワードのカテゴリを保持する。上記の例から、データベースは、ユーザがワード「Saturn」を含むクエリから結果を提示されたときにユーザがそのときの「Car」カテゴリ68%に関心を持つ可能性がある、というのもユーザがワード「Saturn」を含むクエリの結果を提示されたときにその頻度でそのようなカテゴリへのリンクをクリックしたからである、ということを過去の経験から知る。
表1の結果は、クエリのワードに基づく複合信頼度レベル(combined confidence level based on the words of the query)を持つ結果として要約されている。2つのワードは、carsについて比較的高い信頼度レベルを持っており、2つのワードは、shoppingについて高い信頼度レベルを持っていた。フェデレーションコンポーネント(federation component)16は、クエリを2つの特化した検索エンジンに送信することができ、1つはshoppingに関係し、もう1つはcarsに関係する。「car shopping」に適した特別な検索サイトがあることも知ることができる。
クエリインテント認識フェーズ(Query Intent Recognition phase)の他の使い方は、クエリインテントレコグナイザを実行しているWebサーバが特定のカテゴリが出現した場合に広告を選択的に表示する(または表示しない)ようにすることが可能である場合である。例えば、サーバは、クエリのカテゴリが「cars」の場合に「Results」Webページ上に「Toyota ad」を表示することが可能である。他の応答は、コンテンツを表示しないという選択である。例えば、レコグナイザがクエリを解析し、それが、「live sex」などの「adult term」を含んでいる場合、ソフトウェアがこの情報を使用して、特定のフェデレーション(specific federation)を抑制(suppress)するか、または検索結果ページの結果の要素を抑制することが可能である。現在では、サーバソフトウェアプレゼンテーションおよびプロモーションは、クエリの一部をキャラクタ通り抽出し、それらの抽出された部分をそのようなサービスの支払いをする広告主向けに追加することができる。レコグナイザを使用すると、クエリ内に含まれない自動的追加コンテンツを使用してそのようなサービスを強化し、さらにクエリが攻撃的な言葉を含む場合に特定の顧客に対する広告を抑制することが可能である。
他の実施形態は、クエリ分類(query categorization)に限定されず、クエリを補う(query augmentaion)ことに関する。以下の2つの例を考察する。
例1:ユーザは、自分のブラウザの検索テキストボックスを使用して「Restaurants in Redmond,WA」というフレーズを入力する。レコグナイザは、クエリを補い「Restaurants in Redmond,WA zip:98052:90 cat:local:60」というフレーズを形成するが、ただし、「zip:98052:90」は90%の確率でこれが郵便番号98052、検索エンジンの情報の有用な断片を参照することを意味する。さらに、local:60の分類は、これが60%の信頼度で、ローカル検索内容の要求であることを意味する。
例2:ユーザが「News about Iraq」とタイプすると、レコグナイザは「News about Iraq cat:news:80 ranking:date:30」と補う、つまり、「cat:news:80」はニュースカテゴリである確率が80%であることを意味し、「ranking:date:30」はランク付け者(ranker)がこのデータフィールドに対して30%の重みを使用すべきであることを意味する。
コンピュータシステム20
図1を参照するとわかるように、本発明を実施する際に使用する代表的なコンピュータシステム20は、1つまたは複数の処理ユニット21、システムメモリ22、およびシステムメモリを含むさまざまなシステムコンポーネントを処理ユニット21に結合するシステムバス23を備える。システムバス23には、メモリバスまたはメモリコントローラ、周辺機器バス、およびさまざまなバスアーキテクチャを使用するローカルバスを含む数種類のバス構造がありえる。
システムメモリは、読み取り専用メモリ(ROM)24およびランダムアクセスメモリ(RAM)25を含む。起動時などにコンピュータ20内の要素間の情報伝送を助ける基本ルーチンを含む基本入出力システム26(BIOS)は通常、ROM24に格納される。
コンピュータ20は、さらに、図に示されていないハードディスクへの読み書きを行うためのハードディスクドライブ27、取り外し可能磁気ディスク29への読み書きを行うための磁気ディスクドライブ28、およびCD−ROMまたはその他の光媒体などの取り外し可能光ディスク31への読み書きを行うための光ディスクドライブ30を備える。ハードディスクドライブ27、磁気ディスクドライブ28、および光ディスクドライブ30は、ハードディスクドライブインターフェース32、磁気ディスクドライブインターフェース33、および光ドライブインターフェース34によりそれぞれシステムバス23に接続される。ドライブおよび関連コンピュータ可読媒体は、コンピュータ20用のコンピュータ可読命令、データ構造体、プログラムモジュール、およびその他のデータを格納する不揮発性記憶装置を実現する。本発明で説明されている環境例ではハードディスク、取り外し可能磁気ディスク29、および取り外し可能光ディスク31を採用しているが、当業者であれば、磁気カセット、フラッシュメモリカード、デジタルビデオディスク、ベルヌーイカートリッジ、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)などのコンピュータからアクセス可能なデータを格納できる他のタイプのコンピュータ可読媒体もこの動作環境で使用できることを理解するであろう。
オペレーティングシステム35、1つまたは複数のアプリケーションプログラム36、その他のプログラムモジュール37、およびプログラムデータ38をはじめとする、データマイニングソフトウェアコンポーネント12を含む多くのプログラムモジュールは、ハードディスク、磁気ディスク29、光ディスク31、ROM24、またはRAM25に格納することができる。ユーザはキーボード40およびポインティングデバイス42などの入力デバイスを通じてコンピュータ20にコマンドおよび情報を入力することができる。他の入力デバイス(図に示されていない)としては、マイク、ジョイスティック、ゲームパッド、衛星放送受信アンテナ、スキャナなどがある。これらの入力デバイスやその他の入力デバイスは、システムバスに結合されているシリアポートインターフェース46を介して処理ユニット21に接続されることが多いが、パラレルポート、ゲームポート、またはユニバーサルシリアルバス(USB)などの他のインターフェースにより接続することもできる。モニタ47またはその他の種類の表示デバイスも、ビデオアダプタ48などのインターフェースを介してシステムバス23に接続される。パーソナルコンピュータは、通常、モニタの他に、スピーカおよびプリンタなど、他の周辺出力装置(図に示されていない)を備える。
コンピュータ20は、リモートコンピュータ49などの1つまたは複数のリモートコンピュータへの論理接続を使用してネットワーク環境で動作することもできる。リモートコンピュータ49は、他のパーソナルコンピュータ、サーバ、ルータ、ネットワークPC、ピアデバイス、またはその他の共通ネットワークノードでもよく、通常は、コンピュータ20に関係する上述の要素の多くまたはすべてを含むが、メモリ記憶デバイス50だけが図1に示されている。図1で説明されている論理接続は、ローカルエリアネットワーク(LAN)51とワイドエリアネットワーク(WAN)52を含む。このようなネットワーキング環境は、オフィス、企業全体にわたるコンピュータネットワーク、イントラネット、およびインターネットでは一般的なものである。
LANネットワーキング環境で使用する場合、コンピュータ20はネットワークインターフェースまたはアダプタ53を介してローカルネットワーク51に接続される。WANネットワーキング環境で使用される場合、コンピュータ20は、通常、モデム54またはインターネットなどのワイドエリアネットワーク52上で通信を確立するためのその他の手段を備える。モデム54は、内蔵でも外付けでもよいが、シリアルポートインターフェース46を介してシステムバス23に接続される。ネットワーク接続環境では、コンピュータ20またはその一部に関して示されているプログラムモジュールは、リモートメモリ記憶デバイスに格納されることができる。図に示されているネットワーク接続は例示的なものであり、コンピュータ間の通信リンクを確立するのに他の手段が使用可能であることは理解されるであろう。
中間クエリ結果(intermediate query result)に基づいて統計情報を構築し維持すると、より効率的なクエリプラン(query plan)を作成できることは、前述の説明からわかるであろう。本発明はある程度の詳しさで説明されているが、本発明は請求項の精神または範囲に収まる開示されている設計に対するすべての修正形態および変更形態を含むことが意図されている。
本発明を実施するのに好適なコンピュータシステムを示すブロック構成図である。 本発明の一実施形態により構成されるクエリレコグナイザを示すブロック図である。 クエリプリプロセッサにおけるサブコンポーネントを示すブロック図である。 図2に示したクエリレコグナイザの処理手順を示す流れ図である。
符号の説明
11 ユーザクエリ
14 クエリ前処理
12 結果
18 後処理
16 フェデレーション
200 クエリパーサー
210 レコグナイザブローカ
230 データベース

Claims (30)

  1. ユーザからのクエリを解析し、前記クエリに応答するシステムであって、
    a)入力されたクエリを評価し、前記クエリの修正されたフォームをデータソースに送信し、前記クエリの修正フォームへの応答を作成するクエリプロセッサと、
    b)前記クエリまたは前記クエリの修正フォームを評価し、前記クエリ内のデータを識別する複数のクエリレコグナイザと
    を備え、
    c)前記クエリプロセッサは、前記複数のレコグナイザのうちの指定された1つまたは複数のレコグナイザに対して前記クエリを送信するためにレコグナイザブローカを備える、
    ことを特徴とするシステム。
  2. 前記レコグナイザブローカは、前記クエリを、ある確実性の程度が設定されている特定タイプのクエリとして分類する、ことを特徴とする請求項1に記載のシステム。
  3. 前記クエリレコグナイザは、情報を付加することにより、前記クエリ内で識別されたデータに基づいて前記入力されたクエリの修正フォームを作成する、ことを特徴とする請求項1に記載のシステム。
  4. 前記クエリレコグナイザは、前記入力されたクエリにカテゴリを付加する、ことを特徴とする請求項3に記載のシステム。
  5. 前記クエリレコグナイザは、前記入力されたクエリに含まれる情報に関連した情報を付加する、ことを特徴とする請求項3に記載のシステム。
  6. ドキュメントを検索して前記ドキュメントを分類するウェブクローラと、前記クエリプロセッサからの入力に基づいた結果を供給するデータベースと、をさらに備える、ことを特徴とする請求項1に記載のシステム。
  7. 前記クエリプロセッサは、前記修正クエリをデータソースに送信する前に、前記クエリを修正してカテゴリを含ませる、ことを特徴とする請求項1に記載のシステム。
  8. 前記クエリプロセッサは、前記クエリ内のスペルが間違っているワードについてスペルを変更する、ことを特徴とする請求項1に記載のシステム。
  9. 前記レコグナイザのうちの1つは、クエリ入力ワードをデータベースに格納されているワードと照合し、前記ワードをある信頼度レベルで分類する、ことを特徴とする請求項1に記載のシステム。
  10. 前記データベースは、前記信頼度レベルを設定する際に使用するユーザ格付けの履歴を含む、ことを特徴とする請求項9に記載のシステム。
  11. 前記ユーザ格付けの履歴は、すでに送信されたクエリに基づいて提示されている前回結果に対するユーザの選択に基づく、ことを特徴とする請求項9に記載のシステム。
  12. 前記データベースは、ワードのインデックス、および、前記ワードについて複数のカテゴリが存在する場合に前記ワードのクエリのカテゴリを示す指標を含む、ことを特徴とする請求項10に記載のシステム。
  13. 前記クエリを分類するため入力されたクエリ内のキャラクタパターンを認識するパターンレコグナイザを備える、ことを特徴とする請求項1に記載のシステム。
  14. 1つまたは複数の前記パターンレコグナイザは、該レコグナイザで識別するための指定言語におけるタームのデータベースを備える、ことを特徴とする請求項13に記載のシステム。
  15. ユーザからのクエリを解析し、データを有する前記クエリに応答するシステムであって、
    a)前記クエリを評価し、前記クエリのフォームをデータソースに送信し、前記クエリの修正フォームに対する応答を作成するクエリプロセッサと、
    b)前記クエリまたは前記クエリの修正フォームを評価し、前記クエリで識別されたトークンに基づいてクエリタイプを識別するクエリレコグナイザと、
    c)トークンを格納し、前記トークンを含むあるタイプのクエリについて信頼度レベルを対応付け、入力されたクエリ内のトークンと前記データベース内のトークンとの一致が確認された場合に、前記クエリレコグナイザに対して信頼度レベルを与えるデータベースと、
    を具備したことを特徴とするシステム。
  16. 前記クエリプロセッサは、前記クエリのフォームを修正してから、クエリインジケータのカテゴリを含む修正フォームを前記データソースに送信する、ことを特徴とする請求項15に記載のシステム。
  17. クエリを評価する方法であって、
    a)入力されたクエリを評価し、前記クエリの修正フォームをデータソースに送信し、前記クエリ内のトークンを評価して前記クエリの修正フォームを生成する複数のクエリレコグナイザのうちの、指定された1つまたは複数のクエリレコグナイザを使用することによって前記クエリの評価することにより、前記クエリの修正フォームに対する応答を作成する、
    ことを特徴とする方法。
  18. 前記入力されたクエリは、ある確実性の程度が設定されている特定タイプのクエリとして識別される、ことを特徴とする請求項17に記載の方法。
  19. 前記入力されたクエリ内で識別されたデータに基づいて前記入力されたクエリの修正フォームを作成するために、情報を付加すること、を含むことを特徴とする請求項17に記載の方法。
  20. 前記入力されたクエリに対してカテゴリを付加すること、を含むことを特徴とする請求項17に記載の方法。
  21. 前記入力されたクエリに含まれる情報に関連する情報を付加する、ことを含むことを特徴とする請求項17に記載の方法。
  22. ドキュメントを検索し、前記ドキュメントを分類し、前記入力されたクエリの内容に基づいて前記クエリプロセッサから導かれた入力に基づき確率を与えるデータベースを保持すること、をさらに含むことを特徴とする請求項17に記載の方法。
  23. 前記クエリのプロセッサは、前記入力されたクエリ内のスペルが間違っているワードのスペルを変更する、ことを特徴とする請求項17に記載の方法。
  24. 前記クエリレコグナイザのうちの1つは、クエリ入力ワードをデータベースに格納されているワードと照合し、前記ワードをある信頼度レベルで分類する、ことを特徴とする請求項17に記載の方法。
  25. 前記データベースは、前記信頼度レベルを設定する際に使用するユーザ格付けの履歴を含む、ことを特徴とする請求項24に記載の方法。
  26. 前記ユーザ格付けの履歴は、すでに送信された入力クエリに基づいて提示されている前回結果に対するユーザの選択に基づく、ことを特徴とする請求項25に記載の方法。
  27. 前記データベースは、ワードのインデックス、および、前記ワードについて複数のカテゴリが存在する場合に前記ワードのクエリのカテゴリを示す指標を含む、ことを特徴とする請求項26に記載の方法。
  28. 前記クエリを修正するため入力されたクエリ内におけるキャラクタのパターンを認識する、ことを含むことを特徴とする請求項17に記載の方法。
  29. 1つまたは複数のパターンレコグナイザは、前記レコグナイザで識別するための指定言語におけるタームのデータベースを備える、ことを特徴とする請求項28に記載の方法。
  30. 複数のデータソースに対してクエリを実行するための命令を格納したコンピュータ可読媒体であって、前記命令は、
    前記クエリを前処理し、結果としてのクエリを形成する命令と、
    クラシファイアターム、および、前回送信されたクエリからのユーザ指定分類データの存在に基づいて前記結果としてのクエリを分類する命令と、
    クエリ分類に基づいて前記クエリの実行対象となるデータソースのサブセットを選択する命令と、
    を含むことを特徴とするコンピュータ可読媒体。
JP2004364893A 2003-12-16 2004-12-16 クエリレコグナイザ Pending JP2005182817A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/736,915 US20050131872A1 (en) 2003-12-16 2003-12-16 Query recognizer

Publications (1)

Publication Number Publication Date
JP2005182817A true JP2005182817A (ja) 2005-07-07

Family

ID=34620623

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004364893A Pending JP2005182817A (ja) 2003-12-16 2004-12-16 クエリレコグナイザ

Country Status (8)

Country Link
US (1) US20050131872A1 (ja)
EP (1) EP1555625A1 (ja)
JP (1) JP2005182817A (ja)
KR (1) KR20050061369A (ja)
CN (1) CN1629845A (ja)
BR (1) BRPI0405683A (ja)
CA (1) CA2490202A1 (ja)
MX (1) MXPA04012757A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008165737A (ja) * 2006-10-26 2008-07-17 Mobile Content Networks Inc クエリに応答して、関連性のある広告を決定する技術
JP2013528881A (ja) * 2010-06-18 2013-07-11 アリババ・グループ・ホールディング・リミテッド 検索語重み付けの決定および利用
JP2016516252A (ja) * 2013-04-08 2016-06-02 フェイスブック,インク. バーティカルベースのクエリのオプション化
KR20170021246A (ko) * 2014-06-17 2017-02-27 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 쿼리 명확화를 위해 문맥에 따른 콘텐츠 검색 규칙의 학습 및 사용 기법
US11392595B2 (en) 2006-10-26 2022-07-19 EMB Partners, LLC Techniques for determining relevant electronic content in response to queries

Families Citing this family (195)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050149499A1 (en) * 2003-12-30 2005-07-07 Google Inc., A Delaware Corporation Systems and methods for improving search quality
US7296013B2 (en) * 2004-01-08 2007-11-13 International Business Machines Corporation Replacing an unavailable element in a query
US8375048B1 (en) * 2004-01-20 2013-02-12 Microsoft Corporation Query augmentation
US7536382B2 (en) * 2004-03-31 2009-05-19 Google Inc. Query rewriting with entity detection
US7996419B2 (en) * 2004-03-31 2011-08-09 Google Inc. Query rewriting with entity detection
JP4719684B2 (ja) * 2004-09-07 2011-07-06 インターマン株式会社 情報検索提供装置および情報検索提供システム
US7996208B2 (en) 2004-09-30 2011-08-09 Google Inc. Methods and systems for selecting a language for text segmentation
US8051096B1 (en) * 2004-09-30 2011-11-01 Google Inc. Methods and systems for augmenting a token lexicon
US7680648B2 (en) 2004-09-30 2010-03-16 Google Inc. Methods and systems for improving text segmentation
US7680771B2 (en) * 2004-12-20 2010-03-16 International Business Machines Corporation Apparatus, system, and method for database provisioning
US7574436B2 (en) * 2005-03-10 2009-08-11 Yahoo! Inc. Reranking and increasing the relevance of the results of Internet searches
WO2006124027A1 (en) * 2005-05-16 2006-11-23 Ebay Inc. Method and system to process a data search request
US20070043736A1 (en) * 2005-08-22 2007-02-22 Microsoft Corporation Smart find
US7624099B2 (en) * 2005-10-13 2009-11-24 Microsoft Corporation Client-server word-breaking framework
US20070162481A1 (en) * 2006-01-10 2007-07-12 Millett Ronald P Pattern index
US20070198514A1 (en) * 2006-02-10 2007-08-23 Schwenke Derek L Method for presenting result sets for probabilistic queries
US8386469B2 (en) * 2006-02-16 2013-02-26 Mobile Content Networks, Inc. Method and system for determining relevant sources, querying and merging results from multiple content sources
US8195683B2 (en) 2006-02-28 2012-06-05 Ebay Inc. Expansion of database search queries
US8266152B2 (en) 2006-03-03 2012-09-11 Perfect Search Corporation Hashed indexing
US8176052B2 (en) * 2006-03-03 2012-05-08 Perfect Search Corporation Hyperspace index
US8438170B2 (en) * 2006-03-29 2013-05-07 Yahoo! Inc. Behavioral targeting system that generates user profiles for target objectives
US8745226B2 (en) * 2006-05-02 2014-06-03 Google Inc. Customization of content and advertisements in publications
US8788517B2 (en) * 2006-06-28 2014-07-22 Microsoft Corporation Intelligently guiding search based on user dialog
US7620634B2 (en) * 2006-07-31 2009-11-17 Microsoft Corporation Ranking functions using an incrementally-updatable, modified naïve bayesian query classifier
US7996487B2 (en) * 2006-08-23 2011-08-09 Oracle International Corporation Managing searches on mobile devices
US7590626B2 (en) * 2006-10-30 2009-09-15 Microsoft Corporation Distributional similarity-based models for query correction
US8745041B1 (en) * 2006-12-12 2014-06-03 Google Inc. Ranking of geographic information
US8005822B2 (en) 2007-01-17 2011-08-23 Google Inc. Location in search queries
US7966309B2 (en) 2007-01-17 2011-06-21 Google Inc. Providing relevance-ordered categories of information
AU2012216475B2 (en) * 2007-01-17 2015-03-12 Google Llc Presentation of location related and category related search results
US7966321B2 (en) 2007-01-17 2011-06-21 Google Inc. Presentation of local results
US7870026B2 (en) * 2007-06-08 2011-01-11 Yahoo! Inc. Selecting and displaying advertisement in a personal media space
US7917490B2 (en) * 2007-07-09 2011-03-29 Google Inc. Interpreting local search queries
US7774353B2 (en) * 2007-08-30 2010-08-10 Perfect Search Corporation Search templates
US7912840B2 (en) * 2007-08-30 2011-03-22 Perfect Search Corporation Indexing and filtering using composite data stores
US7774347B2 (en) 2007-08-30 2010-08-10 Perfect Search Corporation Vortex searching
US20090083255A1 (en) * 2007-09-24 2009-03-26 Microsoft Corporation Query spelling correction
US9268856B2 (en) * 2007-09-28 2016-02-23 Yahoo! Inc. System and method for inclusion of interactive elements on a search results page
US20090132646A1 (en) * 2007-11-16 2009-05-21 Iac Search & Media, Inc. User interface and method in a local search system with static location markers
US20090132514A1 (en) * 2007-11-16 2009-05-21 Iac Search & Media, Inc. method and system for building text descriptions in a search database
US7809721B2 (en) * 2007-11-16 2010-10-05 Iac Search & Media, Inc. Ranking of objects using semantic and nonsemantic features in a system and method for conducting a search
US20090132513A1 (en) * 2007-11-16 2009-05-21 Iac Search & Media, Inc. Correlation of data in a system and method for conducting a search
US7921108B2 (en) * 2007-11-16 2011-04-05 Iac Search & Media, Inc. User interface and method in a local search system with automatic expansion
US20090132484A1 (en) * 2007-11-16 2009-05-21 Iac Search & Media, Inc. User interface and method in a local search system having vertical context
US20090132953A1 (en) * 2007-11-16 2009-05-21 Iac Search & Media, Inc. User interface and method in local search system with vertical search results and an interactive map
US8090714B2 (en) * 2007-11-16 2012-01-03 Iac Search & Media, Inc. User interface and method in a local search system with location identification in a request
US20090132643A1 (en) * 2007-11-16 2009-05-21 Iac Search & Media, Inc. Persistent local search interface and method
US20090132486A1 (en) * 2007-11-16 2009-05-21 Iac Search & Media, Inc. User interface and method in local search system with results that can be reproduced
US20090132572A1 (en) * 2007-11-16 2009-05-21 Iac Search & Media, Inc. User interface and method in a local search system with profile page
US20090132927A1 (en) * 2007-11-16 2009-05-21 Iac Search & Media, Inc. User interface and method for making additions to a map
US8732155B2 (en) * 2007-11-16 2014-05-20 Iac Search & Media, Inc. Categorization in a system and method for conducting a search
US20090132573A1 (en) * 2007-11-16 2009-05-21 Iac Search & Media, Inc. User interface and method in a local search system with search results restricted by drawn figure elements
US20090132505A1 (en) * 2007-11-16 2009-05-21 Iac Search & Media, Inc. Transformation in a system and method for conducting a search
US20090132645A1 (en) * 2007-11-16 2009-05-21 Iac Search & Media, Inc. User interface and method in a local search system with multiple-field comparison
US20090132485A1 (en) * 2007-11-16 2009-05-21 Iac Search & Media, Inc. User interface and method in a local search system that calculates driving directions without losing search results
US20090132929A1 (en) * 2007-11-16 2009-05-21 Iac Search & Media, Inc. User interface and method for a boundary display on a map
US8145703B2 (en) * 2007-11-16 2012-03-27 Iac Search & Media, Inc. User interface and method in a local search system with related search results
US20090132236A1 (en) * 2007-11-16 2009-05-21 Iac Search & Media, Inc. Selection or reliable key words from unreliable sources in a system and method for conducting a search
US9128945B1 (en) * 2008-05-16 2015-09-08 Google Inc. Query augmentation
US8032495B2 (en) * 2008-06-20 2011-10-04 Perfect Search Corporation Index compression
US20100114878A1 (en) * 2008-10-22 2010-05-06 Yumao Lu Selective term weighting for web search based on automatic semantic parsing
US8515762B2 (en) * 2009-01-22 2013-08-20 Microsoft Corporation Markup language-based selection and utilization of recognizers for utterance processing
WO2010104970A1 (en) * 2009-03-10 2010-09-16 Ebrary, Inc. Method and apparatus for real time text analysis and text navigation
CN102033877A (zh) * 2009-09-27 2011-04-27 阿里巴巴集团控股有限公司 检索方法和装置
WO2011079415A1 (en) * 2009-12-30 2011-07-07 Google Inc. Generating related input suggestions
US9223838B2 (en) 2010-04-19 2015-12-29 Facebook, Inc. Sponsored search queries on online social networks
US8782080B2 (en) 2010-04-19 2014-07-15 Facebook, Inc. Detecting social graph elements for structured search queries
US9275101B2 (en) 2010-04-19 2016-03-01 Facebook, Inc. Search queries with previews of search results on online social networks
US8732208B2 (en) 2010-04-19 2014-05-20 Facebook, Inc. Structured search queries based on social-graph information
US8180804B1 (en) 2010-04-19 2012-05-15 Facebook, Inc. Dynamically generating recommendations based on social graph information
US9092485B2 (en) 2010-04-19 2015-07-28 Facebook, Inc. Dynamic suggested search queries on online social networks
US8244848B1 (en) 2010-04-19 2012-08-14 Facebook, Inc. Integrated social network environment
US10402419B1 (en) 2010-04-19 2019-09-03 Facebook, Inc. Search queries with previews of search results on online social networks
US9262482B2 (en) 2010-04-19 2016-02-16 Facebook, Inc. Generating default search queries on online social networks
US8868603B2 (en) 2010-04-19 2014-10-21 Facebook, Inc. Ambiguous structured search queries on online social networks
US9275119B2 (en) 2010-04-19 2016-03-01 Facebook, Inc. Sharing search queries on online social network
US8751521B2 (en) 2010-04-19 2014-06-10 Facebook, Inc. Personalized structured search queries for online social networks
US8185558B1 (en) 2010-04-19 2012-05-22 Facebook, Inc. Automatically generating nodes and edges in an integrated social graph
US9633121B2 (en) 2010-04-19 2017-04-25 Facebook, Inc. Personalizing default search queries on online social networks
US8918418B2 (en) 2010-04-19 2014-12-23 Facebook, Inc. Default structured search queries on online social networks
US8572129B1 (en) * 2010-04-19 2013-10-29 Facebook, Inc. Automatically generating nodes and edges in an integrated social graph
US8554756B2 (en) * 2010-06-25 2013-10-08 Microsoft Corporation Integrating social network data with search results
TWI486799B (zh) * 2010-08-27 2015-06-01 Alibaba Group Holding Ltd A method and a device for determining a weight value of a search word, a search result generating method, and a device
WO2013002771A1 (en) * 2011-06-28 2013-01-03 Hewlett-Packard Development Company, L.P. Capturing intentions within online text
US9304984B2 (en) 2012-03-26 2016-04-05 Hewlett Packard Enterprise Development Lp Intention statement visualization
US8935255B2 (en) 2012-07-27 2015-01-13 Facebook, Inc. Social static ranking for search
CN103678365B (zh) 2012-09-13 2017-07-18 阿里巴巴集团控股有限公司 数据的动态获取方法、装置及系统
US9105068B2 (en) 2012-11-12 2015-08-11 Facebook, Inc. Grammar model for structured search queries
US8892597B1 (en) * 2012-12-11 2014-11-18 Google Inc. Selecting data collections to search based on the query
US9398104B2 (en) 2012-12-20 2016-07-19 Facebook, Inc. Ranking test framework for search results on an online social network
EP2750056A1 (en) * 2012-12-31 2014-07-02 Facebook, Inc. Structuring ambiguous structured search queries on online social networks
US9367607B2 (en) 2012-12-31 2016-06-14 Facebook, Inc. Natural-language rendering of structured search queries
US9361363B2 (en) 2012-12-31 2016-06-07 Facebook, Inc. Modifying structured search queries on online social networks
US9703844B2 (en) 2012-12-31 2017-07-11 Facebook, Inc. Search result snippets for structured search queries
US9223826B2 (en) 2013-02-25 2015-12-29 Facebook, Inc. Pushing suggested search queries to mobile devices
US9910887B2 (en) 2013-04-25 2018-03-06 Facebook, Inc. Variable search query vertical access
US9367625B2 (en) 2013-05-03 2016-06-14 Facebook, Inc. Search query interactions on online social networks
US9367536B2 (en) 2013-05-03 2016-06-14 Facebook, Inc. Using inverse operators for queries on online social networks
US9367880B2 (en) 2013-05-03 2016-06-14 Facebook, Inc. Search intent for queries on online social networks
US9330183B2 (en) 2013-05-08 2016-05-03 Facebook, Inc. Approximate privacy indexing for search queries on online social networks
US9223898B2 (en) 2013-05-08 2015-12-29 Facebook, Inc. Filtering suggested structured queries on online social networks
US9305322B2 (en) 2013-07-23 2016-04-05 Facebook, Inc. Native application testing
US9317614B2 (en) * 2013-07-30 2016-04-19 Facebook, Inc. Static rankings for search queries on online social networks
US9514230B2 (en) 2013-07-30 2016-12-06 Facebook, Inc. Rewriting search queries on online social networks
CN103617239A (zh) * 2013-11-26 2014-03-05 百度在线网络技术(北京)有限公司 命名实体的识别方法、装置及分类模型的创建方法、装置
US9367629B2 (en) 2013-12-19 2016-06-14 Facebook, Inc. Grouping recommended search queries on online social networks
US9336300B2 (en) 2014-01-17 2016-05-10 Facebook, Inc. Client-side search templates for online social networks
US9477760B2 (en) 2014-02-12 2016-10-25 Facebook, Inc. Query construction on online social networks
US9798832B1 (en) 2014-03-31 2017-10-24 Facebook, Inc. Dynamic ranking of user cards
US9794359B1 (en) 2014-03-31 2017-10-17 Facebook, Inc. Implicit contacts in an online social network
US9646055B2 (en) 2014-04-03 2017-05-09 Facebook, Inc. Blending search results on online social networks
US9679078B2 (en) 2014-05-21 2017-06-13 Facebook, Inc. Search client context on online social networks
US10268763B2 (en) 2014-07-25 2019-04-23 Facebook, Inc. Ranking external content on online social networks
US9871714B2 (en) 2014-08-01 2018-01-16 Facebook, Inc. Identifying user biases for search results on online social networks
US10255244B2 (en) 2014-08-01 2019-04-09 Facebook, Inc. Search results based on user biases on online social networks
US9792364B2 (en) 2014-08-08 2017-10-17 Facebook, Inc. Blending search results on online social networks
US10120909B2 (en) 2014-08-22 2018-11-06 Facebook, Inc. Generating cards in response to user actions on online social networks
US9703859B2 (en) 2014-08-27 2017-07-11 Facebook, Inc. Keyword search queries on online social networks
US9754037B2 (en) 2014-08-27 2017-09-05 Facebook, Inc. Blending by query classification on online social networks
US10671929B2 (en) * 2014-08-29 2020-06-02 International Business Machines Corporation Question correction and evaluation mechanism for a question answering system
US10255365B2 (en) 2014-08-29 2019-04-09 Facebook, Inc. Priming search results on online social networks
US10740412B2 (en) 2014-09-05 2020-08-11 Facebook, Inc. Pivoting search results on online social networks
KR101648961B1 (ko) * 2014-09-19 2016-08-18 네이버 주식회사 검색 질의 내 지식 오류 교정 방법 및 시스템
US9507876B2 (en) 2014-10-06 2016-11-29 Facebook, Inc. Constructing queries using query filters on online social networks
US9703870B2 (en) 2014-11-05 2017-07-11 Facebook, Inc. Social-based optimization of web crawling for online social networks
US10409873B2 (en) 2014-11-26 2019-09-10 Facebook, Inc. Searching for content by key-authors on online social networks
US9679024B2 (en) 2014-12-01 2017-06-13 Facebook, Inc. Social-based spelling correction for online social networks
US10552759B2 (en) 2014-12-01 2020-02-04 Facebook, Inc. Iterative classifier training on online social networks
US9990441B2 (en) 2014-12-05 2018-06-05 Facebook, Inc. Suggested keywords for searching content on online social networks
US10409909B2 (en) * 2014-12-12 2019-09-10 Omni Ai, Inc. Lexical analyzer for a neuro-linguistic behavior recognition system
US10102273B2 (en) 2014-12-30 2018-10-16 Facebook, Inc. Suggested queries for locating posts on online social networks
US10061856B2 (en) * 2015-01-29 2018-08-28 Facebook, Inc. Multimedia search using reshare text on online social networks
US10997257B2 (en) 2015-02-06 2021-05-04 Facebook, Inc. Aggregating news events on online social networks
US10095683B2 (en) 2015-04-10 2018-10-09 Facebook, Inc. Contextual speller models on online social networks
US10049099B2 (en) 2015-04-10 2018-08-14 Facebook, Inc. Spell correction with hidden markov models on online social networks
US10628636B2 (en) 2015-04-24 2020-04-21 Facebook, Inc. Live-conversation modules on online social networks
US10298535B2 (en) 2015-05-19 2019-05-21 Facebook, Inc. Civic issues platforms on online social networks
US10397167B2 (en) 2015-06-19 2019-08-27 Facebook, Inc. Live social modules on online social networks
US10509832B2 (en) 2015-07-13 2019-12-17 Facebook, Inc. Generating snippet modules on online social networks
US10268664B2 (en) 2015-08-25 2019-04-23 Facebook, Inc. Embedding links in user-created content on online social networks
US10810217B2 (en) 2015-10-07 2020-10-20 Facebook, Inc. Optionalization and fuzzy search on online social networks
US10270868B2 (en) 2015-11-06 2019-04-23 Facebook, Inc. Ranking of place-entities on online social networks
US10795936B2 (en) 2015-11-06 2020-10-06 Facebook, Inc. Suppressing entity suggestions on online social networks
US9602965B1 (en) 2015-11-06 2017-03-21 Facebook, Inc. Location-based place determination using online social networks
US10534814B2 (en) 2015-11-11 2020-01-14 Facebook, Inc. Generating snippets on online social networks
US10387511B2 (en) 2015-11-25 2019-08-20 Facebook, Inc. Text-to-media indexes on online social networks
US10740368B2 (en) 2015-12-29 2020-08-11 Facebook, Inc. Query-composition platforms on online social networks
US10019466B2 (en) 2016-01-11 2018-07-10 Facebook, Inc. Identification of low-quality place-entities on online social networks
US10262039B1 (en) 2016-01-15 2019-04-16 Facebook, Inc. Proximity-based searching on online social networks
US10162899B2 (en) 2016-01-15 2018-12-25 Facebook, Inc. Typeahead intent icons and snippets on online social networks
US10740375B2 (en) 2016-01-20 2020-08-11 Facebook, Inc. Generating answers to questions using information posted by users on online social networks
US10157224B2 (en) 2016-02-03 2018-12-18 Facebook, Inc. Quotations-modules on online social networks
US10242074B2 (en) 2016-02-03 2019-03-26 Facebook, Inc. Search-results interfaces for content-item-specific modules on online social networks
US10270882B2 (en) 2016-02-03 2019-04-23 Facebook, Inc. Mentions-modules on online social networks
US10216850B2 (en) 2016-02-03 2019-02-26 Facebook, Inc. Sentiment-modules on online social networks
US10452671B2 (en) 2016-04-26 2019-10-22 Facebook, Inc. Recommendations from comments on online social networks
US11200217B2 (en) 2016-05-26 2021-12-14 Perfect Search Corporation Structured document indexing and searching
US10659299B1 (en) 2016-06-30 2020-05-19 Facebook, Inc. Managing privacy settings for content on online social networks
US10635661B2 (en) 2016-07-11 2020-04-28 Facebook, Inc. Keyboard-based corrections for search queries on online social networks
US10282483B2 (en) 2016-08-04 2019-05-07 Facebook, Inc. Client-side caching of search keywords for online social networks
US10223464B2 (en) 2016-08-04 2019-03-05 Facebook, Inc. Suggesting filters for search on online social networks
US10726022B2 (en) 2016-08-26 2020-07-28 Facebook, Inc. Classifying search queries on online social networks
US10534815B2 (en) 2016-08-30 2020-01-14 Facebook, Inc. Customized keyword query suggestions on online social networks
US10102255B2 (en) 2016-09-08 2018-10-16 Facebook, Inc. Categorizing objects for queries on online social networks
US10645142B2 (en) 2016-09-20 2020-05-05 Facebook, Inc. Video keyframes display on online social networks
US10026021B2 (en) 2016-09-27 2018-07-17 Facebook, Inc. Training image-recognition systems using a joint embedding model on online social networks
US10083379B2 (en) 2016-09-27 2018-09-25 Facebook, Inc. Training image-recognition systems based on search queries on online social networks
US10268734B2 (en) 2016-09-30 2019-04-23 International Business Machines Corporation Providing search results based on natural language classification confidence information
US10579688B2 (en) 2016-10-05 2020-03-03 Facebook, Inc. Search ranking and recommendations for online social networks based on reconstructed embeddings
US10311117B2 (en) 2016-11-18 2019-06-04 Facebook, Inc. Entity linking to query terms on online social networks
US10650009B2 (en) 2016-11-22 2020-05-12 Facebook, Inc. Generating news headlines on online social networks
US10313456B2 (en) 2016-11-30 2019-06-04 Facebook, Inc. Multi-stage filtering for recommended user connections on online social networks
US10162886B2 (en) 2016-11-30 2018-12-25 Facebook, Inc. Embedding-based parsing of search queries on online social networks
US10235469B2 (en) 2016-11-30 2019-03-19 Facebook, Inc. Searching for posts by related entities on online social networks
US10185763B2 (en) 2016-11-30 2019-01-22 Facebook, Inc. Syntactic models for parsing search queries on online social networks
US10607148B1 (en) 2016-12-21 2020-03-31 Facebook, Inc. User identification with voiceprints on online social networks
US11223699B1 (en) 2016-12-21 2022-01-11 Facebook, Inc. Multiple user recognition with voiceprints on online social networks
US10535106B2 (en) 2016-12-28 2020-01-14 Facebook, Inc. Selecting user posts related to trending topics on online social networks
US10489472B2 (en) 2017-02-13 2019-11-26 Facebook, Inc. Context-based search suggestions on online social networks
US10614141B2 (en) 2017-03-15 2020-04-07 Facebook, Inc. Vital author snippets on online social networks
US10769222B2 (en) 2017-03-20 2020-09-08 Facebook, Inc. Search result ranking based on post classifiers on online social networks
US11379861B2 (en) 2017-05-16 2022-07-05 Meta Platforms, Inc. Classifying post types on online social networks
US10248645B2 (en) 2017-05-30 2019-04-02 Facebook, Inc. Measuring phrase association on online social networks
US10268646B2 (en) 2017-06-06 2019-04-23 Facebook, Inc. Tensor-based deep relevance model for search on online social networks
US11580115B2 (en) * 2017-06-29 2023-02-14 Ebay Inc. Identification of intent and non-intent query portions
US10489468B2 (en) 2017-08-22 2019-11-26 Facebook, Inc. Similarity search using progressive inner products and bounds
US10776437B2 (en) 2017-09-12 2020-09-15 Facebook, Inc. Time-window counters for search results on online social networks
US10678786B2 (en) 2017-10-09 2020-06-09 Facebook, Inc. Translating search queries on online social networks
US10810214B2 (en) 2017-11-22 2020-10-20 Facebook, Inc. Determining related query terms through query-post associations on online social networks
US10963514B2 (en) 2017-11-30 2021-03-30 Facebook, Inc. Using related mentions to enhance link probability on online social networks
US10129705B1 (en) 2017-12-11 2018-11-13 Facebook, Inc. Location prediction using wireless signals on online social networks
US11604968B2 (en) 2017-12-11 2023-03-14 Meta Platforms, Inc. Prediction of next place visits on online social networks
US11853306B2 (en) * 2018-06-03 2023-12-26 Apple Inc. Techniques for personalizing app store recommendations
US11429789B2 (en) 2019-06-12 2022-08-30 International Business Machines Corporation Natural language processing and candidate response identification
US11163953B2 (en) * 2019-06-12 2021-11-02 International Business Machines Corporation Natural language processing and candidate response evaluation

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000137738A (ja) * 1998-11-03 2000-05-16 Nec Corp 複数の細分度のインデックス付けとクエリ―処理を効果的に用いてクエリ―の拡張を支援する方法、及び装置

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5682539A (en) * 1994-09-29 1997-10-28 Conrad; Donovan Anticipated meaning natural language interface
US5940821A (en) * 1997-05-21 1999-08-17 Oracle Corporation Information presentation in a knowledge base search and retrieval system
US6009422A (en) * 1997-11-26 1999-12-28 International Business Machines Corporation System and method for query translation/semantic translation using generalized query language
US6144958A (en) * 1998-07-15 2000-11-07 Amazon.Com, Inc. System and method for correcting spelling errors in search queries
US6513031B1 (en) * 1998-12-23 2003-01-28 Microsoft Corporation System for improving search area selection
US6678681B1 (en) * 1999-03-10 2004-01-13 Google Inc. Information extraction from a database
US6393415B1 (en) * 1999-03-31 2002-05-21 Verizon Laboratories Inc. Adaptive partitioning techniques in performing query requests and request routing
US7685311B2 (en) * 1999-05-03 2010-03-23 Digital Envoy, Inc. Geo-intelligent traffic reporter
US6757740B1 (en) * 1999-05-03 2004-06-29 Digital Envoy, Inc. Systems and methods for determining collecting and using geographic locations of internet users
WO2000079436A2 (en) * 1999-06-24 2000-12-28 Simpli.Com Search engine interface
US6963867B2 (en) * 1999-12-08 2005-11-08 A9.Com, Inc. Search query processing to provide category-ranked presentation of search results
US6615209B1 (en) * 2000-02-22 2003-09-02 Google, Inc. Detecting query-specific duplicate documents
US20010037328A1 (en) * 2000-03-23 2001-11-01 Pustejovsky James D. Method and system for interfacing to a knowledge acquisition system
US20010054087A1 (en) * 2000-04-26 2001-12-20 Michael Flom Portable internet services
JP2004513413A (ja) * 2000-06-30 2004-04-30 トロイ シュルツ リアルタイムの広告を使用するgisベースの検索エンジンのための方法および装置
US6529903B2 (en) * 2000-07-06 2003-03-04 Google, Inc. Methods and apparatus for using a modified index to provide search results in response to an ambiguous search query
US7136854B2 (en) * 2000-07-06 2006-11-14 Google, Inc. Methods and apparatus for providing search results in response to an ambiguous search query
AU2001271940A1 (en) * 2000-07-28 2002-02-13 Easyask, Inc. Distributed search system and method
US7007008B2 (en) * 2000-08-08 2006-02-28 America Online, Inc. Category searching
US20030217052A1 (en) * 2000-08-24 2003-11-20 Celebros Ltd. Search engine method and apparatus
US6728705B2 (en) * 2000-09-01 2004-04-27 Disney Enterprises, Inc. System and method for selecting content for displaying over the internet based upon some user input
US6631367B2 (en) * 2000-12-28 2003-10-07 Intel Corporation Method and apparatus to search for information
US6658423B1 (en) * 2001-01-24 2003-12-02 Google, Inc. Detecting duplicate and near-duplicate files
US6526440B1 (en) * 2001-01-30 2003-02-25 Google, Inc. Ranking search results by reranking the results based on local inter-connectivity
US8001118B2 (en) * 2001-03-02 2011-08-16 Google Inc. Methods and apparatus for employing usage statistics in document retrieval
US7567953B2 (en) * 2002-03-01 2009-07-28 Business Objects Americas System and method for retrieving and organizing information from disparate computer network information sources
US7437349B2 (en) * 2002-05-10 2008-10-14 International Business Machines Corporation Adaptive probabilistic query expansion
US20030220913A1 (en) * 2002-05-24 2003-11-27 International Business Machines Corporation Techniques for personalized and adaptive search services
US20040143644A1 (en) * 2003-01-21 2004-07-22 Nec Laboratories America, Inc. Meta-search engine architecture
US20040260677A1 (en) * 2003-06-17 2004-12-23 Radhika Malpani Search query categorization for business listings search
GB2405001A (en) * 2003-08-13 2005-02-16 Whereonearth Ltd Determining a likely geographical location
US7606798B2 (en) * 2003-09-22 2009-10-20 Google Inc. Methods and systems for improving a search ranking using location awareness

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000137738A (ja) * 1998-11-03 2000-05-16 Nec Corp 複数の細分度のインデックス付けとクエリ―処理を効果的に用いてクエリ―の拡張を支援する方法、及び装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008165737A (ja) * 2006-10-26 2008-07-17 Mobile Content Networks Inc クエリに応答して、関連性のある広告を決定する技術
US11392595B2 (en) 2006-10-26 2022-07-19 EMB Partners, LLC Techniques for determining relevant electronic content in response to queries
US11995090B2 (en) 2006-10-26 2024-05-28 EMB Partners, LLC Techniques for determining relevant electronic content in response to queries
JP2013528881A (ja) * 2010-06-18 2013-07-11 アリババ・グループ・ホールディング・リミテッド 検索語重み付けの決定および利用
JP2016516252A (ja) * 2013-04-08 2016-06-02 フェイスブック,インク. バーティカルベースのクエリのオプション化
KR20170021246A (ko) * 2014-06-17 2017-02-27 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 쿼리 명확화를 위해 문맥에 따른 콘텐츠 검색 규칙의 학습 및 사용 기법
JP2017518578A (ja) * 2014-06-17 2017-07-06 マイクロソフト テクノロジー ライセンシング,エルエルシー クエリー曖昧性除去のための文脈に応じたコンテンツ取得ルールの学習と使用
US10579652B2 (en) 2014-06-17 2020-03-03 Microsoft Technology Licensing, Llc Learning and using contextual content retrieval rules for query disambiguation
KR102473471B1 (ko) * 2014-06-17 2022-12-01 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 쿼리 명확화를 위해 문맥에 따른 콘텐츠 검색 규칙의 학습 및 사용 기법

Also Published As

Publication number Publication date
MXPA04012757A (es) 2005-06-20
BRPI0405683A (pt) 2005-08-30
EP1555625A1 (en) 2005-07-20
KR20050061369A (ko) 2005-06-22
US20050131872A1 (en) 2005-06-16
CA2490202A1 (en) 2005-06-16
CN1629845A (zh) 2005-06-22

Similar Documents

Publication Publication Date Title
JP2005182817A (ja) クエリレコグナイザ
JP4726528B2 (ja) マルチセンスクエリについての関連語提案
US7472113B1 (en) Query preprocessing and pipelining
US8078601B1 (en) Determining unambiguous geographic references
US8417695B2 (en) Identifying related concepts of URLs and domain names
US8346770B2 (en) Systems and methods for clustering search results
JP5117379B2 (ja) オンライン会話コンテンツを用いて表示のために広告コンテンツ及び/又は他の関連情報を選択するシステム及び方法
JP5255766B2 (ja) 対話形サーチクエリー改良のためのシステム及び方法
US6564210B1 (en) System and method for searching databases employing user profiles
US6850934B2 (en) Adaptive search engine query
US8271480B2 (en) Search system using search subdomain and hints to subdomains in search query statements and sponsored results on a subdomain-by-subdomain basis
US7783644B1 (en) Query-independent entity importance in books
US7676745B2 (en) Document segmentation based on visual gaps
US8335787B2 (en) Topic word generation method and system
US8375048B1 (en) Query augmentation
US20050222989A1 (en) Results based personalization of advertisements in a search engine
US20040049499A1 (en) Document retrieval system and question answering system
US20070250501A1 (en) Search result delivery engine
US20110047151A1 (en) Local item extraction
WO2006083939A2 (en) Prioritization of search responses system and method
JP2005302041A (ja) キーワードとWebサイトのコンテンツとの間の関連性の検証
JP2000348041A (ja) 文書検索方法及びその装置並びにプログラムを記録した機械読み取り可能な記録媒体
US20130110626A1 (en) Folksonomy Weighted Search and Advertisement Placement System and Method
EP2306333A1 (en) Offline software library
US8843536B1 (en) Methods and systems for providing relevant advertisements or other content for inactive uniform resource locators using search queries

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100709

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110408