JP4722051B2 - 傾向分析を用いる検索クエリ処理のためのシステムおよび方法 - Google Patents

傾向分析を用いる検索クエリ処理のためのシステムおよび方法 Download PDF

Info

Publication number
JP4722051B2
JP4722051B2 JP2006539831A JP2006539831A JP4722051B2 JP 4722051 B2 JP4722051 B2 JP 4722051B2 JP 2006539831 A JP2006539831 A JP 2006539831A JP 2006539831 A JP2006539831 A JP 2006539831A JP 4722051 B2 JP4722051 B2 JP 4722051B2
Authority
JP
Japan
Prior art keywords
query
dimension
information
user
trend
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006539831A
Other languages
English (en)
Other versions
JP2007511016A (ja
Inventor
カプール,シャム
Original Assignee
ヤフー! インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ヤフー! インコーポレイテッド filed Critical ヤフー! インコーポレイテッド
Publication of JP2007511016A publication Critical patent/JP2007511016A/ja
Application granted granted Critical
Publication of JP4722051B2 publication Critical patent/JP4722051B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99942Manipulating data structure, e.g. compression, compaction, compilation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

関連出願への相互参照
本開示は下記の共通に譲受された係属中の米国特許出願に関する。「汎用検索インターフェースシステムおよび方法」と題され、2003年4月4日に出願された、仮出願番号第60/460,222号、および「ユニットのクラスタリングを用いる検索処理のためのシステムおよび方法」と題され、2003年10月9日に出願された、仮出願番号第60/510,220号である。これらの出願のそれぞれの開示は、あらゆる目的のために引用にて本願明細書に援用される。
発明の背景
インターネットならびにワールドワイドウェブ(ウェブ)上でユーザに利用可能である多数のウェブページおよび媒体コンテンツの到来によって、ウェブをフィルタして所望の情報を得るための能率化されたアプローチをユーザに与える必要が出てきた。所望の情報を得るというユーザの必要を満たすため、検索システムおよびプロセスが開発されている。そのような技術の例は、ヤフー(Yahoo!)、グーグル(Google)および他のサイトを通してアクセスすることができる。典型的には、ユーザが1つのクエリを入力すると、検索プロセスが(ウェブ探索の場合)1つ以上のリンク、文書、および/または(異なる検索コーパスの場合)クエリと関連する参照を返す。返されたリンクはユーザが実際に捜していたものと密接に関連しているかもしれず、または全く無関係かもしれない。クエリ結果の「関連性」は、ある部分において、入力された実際のクエリの関数(function)であり得るのと同様に、用いられる検索システム(基礎となる収集システム)のロバスト性の関数(function)でもあり得る。関連性は、ユーザによって主観的に判断されても、またはユーザが捜していたであろうものにより客観的に判断されてもよい。
ユーザが入力するクエリは、典型的には1つ以上の単語でできている。例えば、「ハワイ(hawaii)」はクエリであり、「ニューヨーク市(new york city)」も、「ニューヨーク市の法執行(new york city law enforcement)」もクエリである。このように、クエリ全体が人間の脳に組み込まれているわけではない。換言すれば、人間は当然にはクエリによって考えることをしない。クエリは、ある部分において、検索エンジンに問合せたりライブラリカタログを調べたりする必要に迫られて押付けられた、人為的な構成体である。人間はまた、当然には1つの単語によって考えることをしない。人間が考えるのは自然な概念である。例えば、「ハワイ」および「ニューヨーク市」は、単語の数によって測定された場合は長さにおいて大いに異なるクエリであるが、それらは1つの重要な特性を共有する。それらは各々1つの概念から構成されるのである。しかしながら「ニューヨーク市の法執行」は違う。なぜならそれは2つの別個の概念「ニューヨーク市」および「法執行」から構成されるからである。
人間はさらに、概念間の論理関係によって考える。例えば、警察が法執行の重要な機関であるので、「法執行」と「警察」とは関連のある概念である。これらの概念のうち一方を入力するユーザは、他方の概念に関連するサイトがたとえユーザがたまたま入力した特定の単語または句を含まないサイトであったとしても、そのサイトに興味を持つかもしれない。このような発想パターンの結果、人間は単にさまざまな長さの単一の単語の連続ではなく、1つ以上の自然な概念を入力することによって自然にクエリを構築する。そして一般にクエリは、ユーザが認識しているであろう関連概念のすべてを含んでいるわけではない。また、ユーザの意図はクエリの個々の単語に必ずしも反映されていない。例えば、「法執行」は1つの概念である一方で、別個の単語「法」および「執行」はそれらの単語
が組み合わされた場合と同じユーザ意思を独立して伝えるわけではない。
現在の技術は、主な検索プロバイダ、例えばMSN、グーグルまたは他の主な検索エンジンサイトのいずれにおいても、人間がクエリを作成するのと同じやり方でクエリを理解するわけではない。例えば、既存の検索エンジンは一般にユーザが入力した単語または句そのままを捜索し、ユーザが実際に思い描いていた、根底にある自然な概念または関連概念を検索するわけではない。これは恐らく、検索プロバイダがユーザの意図を識別し、最適な検索結果およびコンテンツを与えるのを妨げる、最も重要な理由である。
これからわかるように、ユーザが興味を持っているであろう実際の概念により合致した結果を与えることを助け、ユーザの経験を向上させるような、改善された検索およびインターフェース技術の必要がある。
発明の概略
本発明の実施例は、求められている情報についてさらに高度な理解を与えるために受取ったクエリを分析することを含む、検索リクエストの処理のためのシステムおよび方法を与える。クエリは解析されてユニットに分解され、ユニットは例えばクエリの1つ以上の単語またはトークンを含んでもよい。異なるクエリにおいて用いられるユニットの類似の組合せなどのパターンを検知するために、クエリのユニット表示においてさらさらなる分析が行なわれる。類似する二次ユニットの集合に関連してクエリに現れるユニットはクラスタにグループ化され、各々に関連付けられた二次ユニットの類似の程度に基づいて、2つのクラスタメンバの間の関連に重みが割り当てられてもよい。
本発明の1つの局面によれば、異なるクエリサブセットについてクラスタリングが繰り返され、クエリは1つ以上の次元(dimension)に沿ったサブセットに仕分けられる。1つの実施例では、次元は、時間、ユーザの個人的特性もしくはデモグラフィック(demographics)(例えば年齢、性別、わかっている関心事、もしくはユーザプロファイル)、地理的次元(例えば物理的位置もしくはIPアドレス)またはクエリの前のユーザの活動もしくはコンテキストを表わす縦の次元(vertical dimension)(例えばクエリが入力されたときユーザがいるウェブサイト上の場所)を含む。これは、各クエリサブセットについてサブセット固有のクラスタ(または概念ネットワーク)を生成する。あるユニットまたはクラスタに関する傾向情報は、少なくとも2つのサブセットの対応するサブセット固有の概念ネットワークを比較することによって生成される。
添付の図面を伴った以下の詳細な説明は、本発明の性質および利点についてのよりよい理解を与えるであろう。
発明の詳細な説明
図1は、本発明の実施例によるクライアントシステム20を含む、情報検索および通信ネットワーク10の一般的概観を示す。コンピュータネットワーク10では、クライアントシステム20は、インターネット40または他の通信ネットワーク、例えば任意のLANまたはWAN接続によって、50から50の任意の数のシステムサーバに結合される。本願明細書に記載されるように、クライアントシステム20は、本発明によって50から50のいずれのシステムサーバとも通信するよう構成され、例えば媒体コンテンツおよびウェブページなどの他の情報にアクセスし、受け取り、検索し、表示する。
図1に示されるシステムのいくつかの要素は、本願明細書に詳細に説明される必要のない従来の周知の要素を含む。例えば、クライアントシステム20は、デスクトップパーソナルコンピュータ、ワークステーション、ラップトップ、PDA、携帯電話もしくは任意のWAP対応装置、またはインターネットに直接もしくは間接にインターフェースすることができる他の計算装置を含み得る。典型的にはクライアントシステム20が、ブラウジングプログラム、例えばマイクロソフトのインターネットエクスプローラ(登録商標)ブラウザ、ネットスケープナビゲータ(登録商標)ブラウザ、モジラ(登録商標)ブラウザ、オペラ(登録商標)ブラウザ、または携帯電話の場合はWAP対応ブラウザ、PDAまたは他の無線装置などを実行することにより、クライアントシステム20のユーザは、インターネット40を介して50から50のサーバシステムから利用可能な情報およびページにアクセスし、処理および閲覧ができる。クライアントシステム20はさらに、典型的にはキーボード、マウス、タッチスクリーン、ペンなどの1つ以上のユーザインターフェース装置22を含み、50から50のサーバシステムまたは他のサーバによって与えられるページ、フォームおよび他の情報に関連してブラウザによって表示(例えばモニタ画面、LCD表示など)上に与えられるグラフィカルユーザインターフェース(GUI)と対話する。本発明は、ネットワークのうち特定のグローバルインターネットワークを指すインターネットを用いた使用に適する。しかしながら、例えばイントラネット、エクストラネット、仮想プライベートネットワーク(VPN)、非TCP/IPベースのネットワーク、任意のLANまたはWANなどの他のネットワークを、インターネットの代わりに、またはインターネットに加えて用い得ることが理解されよう。
1つの実施例によれば、クライアントシステム20およびそのすべての構成要素は、インテルペンティアム(Intel Pentium)(登録商標)プロセッサ、AMDアスロン(Athlon)(登録商標)プロセッサなどの中央処理装置または複数のプロセッサを用いて実行されるコンピュータコードを含むアプリケーションを用いてオペレータ構成可能である。本願明細書に記載されるように、データおよび媒体コンテンツを通信し、処理し、表示するようにクライアントシステム20を動作し構成するためのコンピュータコードは、好ましくはダウンロードされ、ハードディスクに記憶されるが、そのプログラムコード全体または部分もROMまたはRAMなどとして周知である任意の他の揮発性もしくは不揮発性メモリ媒体または装置に記憶されてもよく、または、コンパクトディスク(CD)媒体、デジタル多機能ディスク(DVD)媒体、フロッピー(登録商標)ディスクなどのプログラムコードを記憶することができる任意の媒体で与えられてもよい。さらに、プログラムコード全体または部分は、ソフトウェアソース、例えばサーバシステム50から50の1つからクライアントシステム20にインターネットを通じて送信されダウンロードされてもよく、またはいずれの通信媒体およびプロトコル(例えばTCP/IP、HTTP、HTTPS、イーサネット(登録商標)または他の従来の媒体およびプロトコル)を用いて他のネットワーク接続(例えばエクストラネット、VPN、LANまたは他の従来のネットワーク)を通じて送信されてもよい。
本発明の局面を実現するためのコンピュータコードは、C、C++、HTML、XML、Java(登録商標)、JavaScript(登録商標)などのコード、または他の適切なスクリプト言語(例えば、VBScript)、または他の適切なプログラミング言語であってクライアントシステム20上で実行することができるか、クライアントシステム20上で実行するためにコンパイルすることができるコードであり得ることが認識されるべきである。いくつかの実施例では、コードはクライアントシステム20にダウンロードされず、必要なコードはサーバによって実行され、またはクライアントシステム20で既に示されたコードが実行される。
図2は、本発明の実施例による、媒体コンテンツを通信するための別の情報検索および通信ネットワーク110を示す。示されるように、ネットワーク110は、クライアント
システム120、1つ以上のコンテンツサーバシステム150、および検索サーバシステム160を含む。ネットワーク110では、クライアントシステム120は、インターネット140または他の通信ネットワークを通じてサーバシステム150および160に通信可能に結合される。上述のように、クライアントシステム120およびその構成要素は、インターネット140または他の通信ネットワークを通じてサーバシステム150および160、ならびに他のサーバシステムと通信するよう構成される。
(0021) 1つの実施例によれば、クライアントシステム120上で実行されるクライアントアプリケーション(モジュール125として表わされる)は、サーバシステム150および160と通信し、かつそこから受け取ったデータコンテンツを処理し表示するために、クライアントシステム120およびその構成要素を制御する命令を含む。上述のように、クライアントアプリケーションモジュール125は、フロッピー(登録商標)ディスク、CD、DVDなどの任意のソフトウェア記憶媒体で与えることができるが、好ましくはクライアントアプリケーション125は、リモートサーバシステム(例えばサーバシステム150、サーバシステム160または他のリモートサーバシステム)などのソフトウェアソースからクライアントシステム120に送信され、ダウンロードされる。例えば、1つの局面では、クライアントアプリケーションモジュール125は、例えば埋込型JavaScriptまたはアクティブX制御などの様々な制御を含むHTMLラッパ(wrapper)において、データを操作し、データをさまざまなオブジェクト、フレームおよびウインドウに図示するために、インターネット140を通じてクライアントシステム120に与えられてもよい。
さらに、クライアントアプリケーションモジュール125は、検索リクエストおよび検索結果データを処理するための専門化された検索モジュール126などのデータおよび媒体コンテンツの処理のための様々なソフトウェアモジュールと、データおよび媒体コンテンツをテキスト、データフレーム、ならびにブラウザウィンドウおよびダイアログボックスなどのアクティブウィンドウに図示するためのユーザインターフェースモジュール127と、クライアント120上で実行する様々なアプリケーションとインターフェースし通信するためのアプリケーションインターフェースモジュール128とを含む。アプリケーションインターフェースモジュール128が本発明の1つの局面によってインターフェースするよう好ましくは構成される、クライアントシステム120上で実行する様々なアプリケーションの例としては、様々な電子メールアプリケーション、インスタントメッセージング(IM)アプリケーション、ブラウザアプリケーション、文書管理アプリケーションなどを含む。さらに、インターフェースモジュール127は、クライアントシステム120または異なるブラウザ上に構成されるデフォルトブラウザなどのブラウザを含んでもよい。いくつかの実施例では、クライアントアプリケーションモジュール125は、上記に参照された仮出願番号第60/460,222号に記載されるような汎用検索インターフェースの特徴を与える。
1つの実施例によれば、検索サーバシステム160は、クライアントシステム120に検索結果データおよび媒体コンテンツを与えるよう構成され、コンテンツサーバシステム150は、例えばウェブページなどのデータおよび媒体コンテンツを、例えば検索サーバシステム160によって与えられる検索結果ページにおいて選択されたリンクに応答して、クライアントシステム120に与えるよう構成される。ある変形例では、検索サーバシステム160は、コンテンツへのリンクおよび/または他の参照とともに、あるいはその代わりに、コンテンツを返す。
1つの実施例における検索サーバシステム160は、1つ以上のページインデクスを、例えばページ、ページへのリンク、インデクスを付けられたページのコンテンツを表わすデータなどに関連付ける(populating)ための様々な収集技術を参照する。そのような収集技術は、手動または半自動の分類アルゴリズム、および階層構造内でウェブページを分
類し格付けするためのインターフェースととともに、自動ウェブクローラ、スパイダなどを含む。ある局面では、検索サーバシステム160はさらにウェブページを処理し格付けするための検索関連アルゴリズムで構成される。検索サーバシステム160はまた、クエリログファイルの形式でユーザクエリ活動を記録するよう、好ましくは構成される。
検索サーバシステム160は、クライアントシステム、特に検索モジュール126から受け取った様々な検索リクエストに反応するデータを与えるよう構成される。サーバシステム150および160は、ヤフー社(Yahoo! Inc.,)によりユーザに与えられる分散サーバシステムなどの単一組織の一部であるか、または異種の組織の一部であってもよい。コンテンツサーバシステム150および検索サーバシステム160は、各々少なくとも1つのサーバおよび関連するデータベースシステムを含んでおり、複数のサーバおよび関連するデータベースシステムを含んでもよく、単一のブロックとして示されるが地理的に分散されていてもよい。例えば、検索サーバシステム160のサーバはすべて互いのすぐ近く(例えば単一の建物またはキャンパスに位置するサーバファーム内)に位置してもよく、互いから遠い場所(例えば、A市にある1つ以上のサーバおよびB市にある1つ以上のサーバ)に分散されていてもよい。
本願明細書で用いられるように、「サーバシステム」は、典型的には1つ以上の論理的および/または物理的に接続された、局地的にまたは1つ以上の地理的場所にわたって分散されたサーバを含む。当該技術において周知のように、「サーバ」は、典型的にはコンピュータシステムおよび関連する格納方法およびデータベースアプリケーションを含む。
1つの実施例によれば、検索サーバシステム160は、ページインデクスにアクセスし、クライアントシステム120から受け取った検索クエリに応答してユーザに検索結果を与えるために、1つ以上のページインデクスおよびアルゴリズムで構成される。ある局面では、検索サーバシステム160は、クライアントシステム120からの検索リクエストに応答して向上した検索クエリ分析およびクラスタリング機能を与えるよう構成される。他の変形例では、検索サーバシステム160は、コンテンツサーバシステム150のコンテンツおよび機能のすべてを含む。
1つの実施例では、検索サーバシステム160上で実行するプロセスは、検索クエリおよび/または検索結果のコンテキスト解析を行ない、異なるコンテキストを反映するようグループ化された検索結果を伴って応答する。意図されたコンテキストに依存して異なる意味を有する検索語が多い。例えばあるユーザが用語「Java」を用いて検索を行なった場合、意図したコンテキストは明らかではない。ユーザはJavaコンピュータ言語に興味があるのか、インドネシアのジャワ島(Java)に興味があるのか、またはコーヒー(しばしば口語でジャワ(java)と称される)に興味を持っているのかもしれない。本発明は検索クエリおよび/または結果を有利に分析し、結果をコンテキストにグループ化して、ユーザのコンピュータ120で表示する。例えば、検索語「Java」に応答して、検索サーバシステム160のいくつかの実施例は、3つ(または他のコンテキストが識別されればさらに多く)のコンテキストまたは単語の意味にグループ化された検索結果を返す。コンピュータ言語としてのJava、ジャワ島、およびジャワコーヒーである。システムは各コンテキストと関連して与えられるリンクを備えた集合として結果を表示するよう構成されてもよく、またはシステムはリンクなしで単なるコンテキスト(コンテキストを識別するのに十分なユーザ向け情報を備える)を表示し、関連するリンクを表示するためにユーザが所望のコンテキストを選択することを可能にしてもよい。ヤフーネットワークシステムでは、例えば、1組のコンテキストは、各コンテキストが検索インデクスからのページ、スポンサードマッチ(sponsored match)に関連したリンク、ディレクトリマッチ(directory match)に関連したリンク、およびインサイドヤフー(IY)マッチ(Inside Yahoo! match)に関連したリンクに、1セットのリンクを有して表示され
てもよい。
本発明のシステムは、1つの実施例において、「Java」のような曖昧な意味がある単語または句に加え、必ずしも曖昧でない検索語について結果をコンテキストにグループ化するよう構成される。検索語「ハワイ」に返された結果が一例である。用語「ハワイ」自体は本来曖昧でないかもしれないが、このような用語に返される結果の性質は、ハワイについて述べたり単に言及したりするすべてのサイトに関連し、極めて広範になり得る。本発明のシステムは、より有用な結果をユーザに与えるために、結果が実際には何に関連するのかについての知識を活用することにより、好ましくは検索結果をコンテキストに体系づける。例えばハワイについては、システムは、「ハワイへの旅行」「ハワイの気候」「ハワイの地理」「ハワイの文化」などの様々なコンテキストグループにおいて結果を返し得る。
いくつかの実施例では、コンテキスト識別子はインデクス中にページリンクと関連付けられて記憶され、その結果、検索が行なわれるとリンクは識別子に従ってグループ化されることができる。ページリンクは複数のコンテキスト識別子と関連付けられてもよい。そのような識別子は、ユーザが関連する検索を行なう間、好ましくはシステムによって自動的に関連付けられるが、識別子もまた、1人以上のインデクスエディタのチームによって手動で修正され、リンクに関連付けられてもよい。このような態様で、多数の検索から収集された知識はシステムにフィードバックされ、リクエストしているユーザにとって表示された検索結果がさらに価値があって有益なものになるようコンテキストを規定し、再規定する。
1つの実施例では、より意味のある結果をユーザに与えるために、検索サーバシステム160のアルゴリズムは検索語の概念の発見または概念分析を行なう。例えば、検索句「ニューヨーク市」については、ユーザがニューヨーク州の他の都市にではなくニューヨーク市(都市または地域)に関連するサイトに興味を持っていることが極めて明らかである。同様に、「ニューヨーク市の法執行」については、ユーザがニューヨーク市における法執行(例えば労働分野)に関連するサイトに興味を持っていることは明らかである。しかしながら、ほとんどの検索エンジンは単純に個々の用語「ニュー(New)」「ヨーク(York)」「市(city)」「法(law)」および「執行(enforcement)」を用い、用語が検索句に現れる順序にかかわらず探索する。検索句のうち最長のサブストリングであって、かつインデクスにも現れるものを見つけようとする検索エンジンもあるかもしれない。例えば、インデクスが「ニューヨーク」「ニューヨーク市」「ニューヨーク市法令」を含むが「ニューヨーク市の法執行」を含まない場合、検索エンジンは「ニューヨーク市法令」および「執行」を用いて探索し、それは必ずしもユーザが意図したものではない。
本発明の実施例は、検索句の用語を有利に分析し、検索クエリを構成する1つ以上の概念(ユニット)を識別する。
図3は、本発明の1つの実施例によって、傾向分析を含む概念発見または概念分析を行なうためのシステム300のブロック図である。1つ以上のクエリログファイル302(または実際のクエリ)が、クエリ処理エンジン(クエリエンジンとも呼ばれる)304によって受け取られ、それは後述されるユニット辞書306を生成する。クエリログファイル(または実際のクエリ)は、インターネットまたは様々なネットワーク接続、例えばLAN、WAN、ダイレクトリンク、頒布媒体(例えば、CD、DVD、フロッピィディスク)などを通じて様々なソースから受け取られてもよい。ソースの例は、検索サーバシステム160(図1)、または検索サーバの分散ネットワークの複数の検索サーバ160、および1つ以上のコンテンツサーバ150を含む。クエリログファイルソースは、典型的には、例えばヤフーサーバなどの同じ組織またはエンティティに関連付けられるが、必須
ではない。クエリログファイル(クエリログとも呼ばれる)は、クエリエンジン304によって、情報理論で用いられ得るような統計的方法または相互情報などの概念を用いて処理される。好ましい局面では日ごとのクエリログが用いられるが、時間ごと、週ごとなど異なる期間のログが所望に応じて用いられてもよい。クエリログは典型的にはユーザが提示した実際のクエリを含んでおり、さらにいくつかまたはすべてのクエリに対する追加情報をも含んでもよい。例えば問い合わせているユーザの地理的場所、タイムスタンプ、クライアントシステムのIPアドレス、クッキー、クライアントのタイプ(例えばブラウザタイプ)などである。クエリ処理エンジン304は様々なクエリログを処理し、そこからユニットを生成する。ユニットおよび出現頻度などの関連する統計は、本願明細書でユニット辞書306と呼ばれるメモリまたはデータベースファイルに記憶される。後述のように、検索エンジンは、続くクエリに応答するのにユニットの辞書306を用いることができる。
1つの実施例では、クエリプロセッサ304はユニット分析モジュール310およびクラスタリングモジュール312を含む。ユニット分析モジュールはクエリを処理し、ユニットを生成する。好ましい実施例では、システムは、クエリを構成するユニットを識別するために検索語が示される順序を用いる。ユニットは、単語(例えば「java」)またはしばしば互いに隣接して現れる一群の単語(例えば「ニューヨーク市」)であり得る。ユニットの識別については、上記で参照された仮出願番号60/460,222号に詳細に記載されている。ユニット分析モジュールによって生成されたユニットは、ユニット辞書306に記憶される。いくつかの実施例では、統計情報(例えば出現頻度または1つ以上の他のユニットと連動しての出現頻度)も含まれていてよい。検索エンジンは、ユニット辞書306に記憶された情報を続くクエリに応答するのに用いることができる。
クラスタリングモジュール312は、ユニット分析モジュールによって識別されたユニットを用いてクエリのさらなる分析を行ない、異なるユニット間の類似性を示すクラスタまたはすなわち概念ネットワークを生成する。当該技術で一般に公知であるように、概念ネットワークは、各概念がノードに対応し、概念の関係がノードを接続するライン(またはエッジ)によって表わされるような関係を表わすための構造である。エッジは異なる重みを割り当てられてもよく、その結果、エッジの重みは概念(ノード)間の類似性の強さまたは近さを反映する。本発明の実施例によれば、クラスタは、「シグネチャ」ユニットの1つ以上の同一グループと一緒にクエリに現れる傾向がある、異なるユニット(クラスタの「メンバ」)を識別することによって、ユニットから生成される。メンバユニットは概念ネットワークにおいてノードとして機能してもよい。異なるユニットまたは概念間の接続もしくは関係の他の表現もまた用いられてもよく、本願明細書に用いられる「概念ネットワーク」は代替的な表現を包含することが理解される。
例えば、複数のユーザが自分の好きなポップミュージック活動に関する情報を検索すると仮定する。典型的にはこれらのユーザは、活動の名称(例えば「アヴリル・ラヴィーン(Avril Lagvigne)」または「セリーヌ・ディオン(Celine Dion)」および求める情報の種類を反映する他のいくつかの単語、例えば「歌詞」「mp3」「ギタータブ」「ディスコグラフィー」などをも含むクエリを構築する。クラスタリングモジュール312はこれらのクエリを分析し、「歌詞」「mp3」「ギタータブ」「ディスコグラフィー」などが、そのメンバがさまざまなポップミュージック活動の名称を含むあるクラスタの「シグネチャ」ユニットであると判断する。クラスタリングモジュール312で実現され得るクラスタ生成のための特定の手法の例は、上記で参照された仮出願番号第60/510,220号に記載されている。クラスタリングモジュール312は、ユニット辞書306のメンバユニットとシグネチャとに関連するデータを含むクラスタ情報を有利に記憶する。したがって、ユニット辞書306において利用可能な情報は、そのユニットおよびその「近隣」(すなわち所与のユニットを伴ってクエリに現れる他のユニット)に関する情報とと
もに、同様の近隣を有し得る他のユニットとの関係を含む。
(0037)クラスタは、たとえクエリ処理エンジン304が特定のユニットまたはクエリに関する現実世界の知識または言語情報を与えられる必要がないにもかかわらず、現実世界の概念関係(例えば共通カテゴリに属するユニットのグループ化)を反映する傾向がある。例えば、1つのクラスタは「ニューヨーク市」「サンフランシスコ(San Francisco)」および「シカゴ(Chicago)」を含むことができ、そのクラスタのシグネチャは「ホテル」「レストラン」および「ナイトクラブ」を含み得る。そのようなクラスタは、ニューヨーク市、サンフランシスコおよびシカゴがすべて旅行の目的地(または都市)であると考えるが、クエリエンジン304(図3)は、「目的地」(または「都市」)という概念のいかなる予備知識も有することを要求されない。この概念的知識は、クエリのパターンを分析することから自動的に発展し得る。本願明細書において人間に言語的な意味を伝える用語をクラスタにラベル付けする場合、本開示についての理解を容易にするのに便宜であることが理解される。実際上、クエリエンジン304またはユニット辞書306によって用いられるいかなるクラスタのラベル付けスキームもこの特性を有する必要はない。例えば、クラスタラベルは単純に、数字、クラスタについてのシグネチャへのポインタなどであり得る。
1ユニットが複数のクラスタに属してもよい。例えば、「java」などの曖昧なユニットは、「コンピュータプログラミング」クラスタ、「飲食」クラスタ、および「旅行」または「土地」クラスタになってもよい。いくつかの実施例では、いかなるクラスタにも属さないユニットがあってもよい。
本発明の実施例によれば、クエリ処理エンジン304は、時間、地理、ユーザデモグラフィック、ユーザ履歴、またはコンテキスト(本願明細書で「縦の」次元と呼ばれる)などの様々な次元に沿ってクエリにおける傾向を捜す、傾向分析モジュール320をさらに含む。傾向分析モジュール320は、ユニット分析モジュール310およびクラスタリングモジュール312の機能を有利に活用して、異なるクエリサブセットの概念分析および/または概念発見を実行し、次に結果をコンパイルする。結果として生じた傾向情報はユニット辞書306に有利に加えられる。
ユニット辞書306は任意のフォーマットで実現され、磁気ディスクまたはテープを含む任意の適切な記憶媒体、コンパクトディスク(CD)などの光学的記憶媒体などに記憶されてもよい。ユニット辞書306のコンテンツはユニットを有利に含み、同様にユニット分析モジュール310によって生成される統計データ、クラスタリングモジュール312によって決定されるクラスタ情報、および傾向分析モジュール320によって生成される傾向情報などの各ユニットに関する追加情報をも含む。ユニット、クラスタ、傾向に関連する情報は、検索エンジンが続くクエリに応答するために用いることができる。
図4は、傾向分析モジュール320の実施例によって実行され得るプロセス400のフローチャートである。ステップ402で、クエリログに包含されるクエリは選択された次元に沿ってサブセットに仕分けられる。次元は、ログファイルが与えるクエリに関する任意の情報に基づいて規定され、クエリは所与の次元に沿って任意の数のサブセットに分割されてもよい。
一例として、クエリログが様々なクエリについて提示時刻に関連する情報を与える場合、「時間」次元が用いられ得ることが知られる。クエリは、ユーザの関心事における傾向を経時的に分析するために、例えば週ごとまたは月ごとなど、時間次元に沿って分割することができる。クエリはまた、時刻ごと(例えば午前、午後、夜、深夜)、平日対週末または休日、季節ごとなどに基づいて分割することができる。多数の変形例が可能である。単に一例としては、午前8時から午前10時の間に受け取られたクエリについて、週、月
または別の所望の期間ごとに集計することができる。いくつかの実施例では、時刻は検索サーバの現地時間によって決定される。検索サービスが異なる地理的地域にサービスするために複数のサーバを与える場合は、サーバの現地時間がほぼユーザの現地時間を表す。他の実施例では、ユーザの現地時間が用いられてもよい。
別の例として、クエリログがクエリの地理的起源に関する情報を与える場合に「地理」次元が用いられてもよい。地理は物理的な地理に関連してもよい。例えば、クエリの適当な原産国(country of origin)を識別するために用いられるIPアドレスがあってもよく、ユーザがどこに存在するか判断するためにクエリを提示したユーザのユーザプロファイルが用いられてもよい。または、クエリは、異なる場所にあるミラーサイトで受取られたか、異なる場所に関連付けられたリージョナル(regional)/ナショナル(national)サイトで受け取られたかによって仕分けられてもよい。代替的に、ユーザのIPアドレス(またはIPアドレスから決定されるドメイン)が地理的起源として扱われる場合、地理的次元は「サイバージオグラフィ(cyber geography)」を表わしてもよい。物理的次元およびサイバー地理次元は組合わされてもよい。
第3の例として、クエリログが年齢、性別などのユーザデモグラフィック特性に関する情報を与える場合、「デモグラフィック」次元が用いられてもよい。傾向分析のためにデモグラフィック次元を規定するのに、いかなる数および組合せでデモグラフィックデータが用いられてもよい。例えばデモグラフィック次元は、「25歳以上で持ち家を有する女性ユーザ」というグループ、「35歳以上で賃貸住宅に住む男性ユーザ」の別のグループ、「25歳未満で車を所有するユーザ」のグループなどを含んでもよい。
第4の例として、クエリログがクエリの入力前のユーザ活動に関する情報(本願明細書で「ユーザ履歴」または「ユーザコンテキスト」と呼ばれる)を与える場合、「縦」次元または「ユーザ履歴」次元が用いられてもよい。例えば、ポータルサイト(例えば、www.yahoo.comのヤフーサイト)が、様々な領域またはショッピングプロパティ、一般的ウェブディレクトリ、音楽プロパティなどの「プロパティ」を含み、各プロパティがユーザがクエリを入力することができる検索インターフェースを含むと仮定する。クエリが入力された時ユーザがこれらのプロパティのいずれを訪れていたかに関する情報が保存され、「縦の」次元として用いられることができる。したがって、1つの実施例では、縦の次元は、「ショッピング」プロパティにおいてユーザから来た1つのクエリサブセット、および「一般的ディレクトリ」プロパティにおいてユーザから来た別のクエリサブセットなどを含む。他の実施例において、ユーザがいつでも検索クエリを入力するために実質的に連続してダイアログボックスにアクセスを有する場合(そのようなダイアログボックスの一例は上述の参照された仮出願番号第60/460,222号に記載される)、ユーザ履歴情報は、ユーザがクエリを入力した時表示されていたウェブページのURLまたは他の識別子をも含んでもよい。縦の次元は、URL、その一部(例えばドメインネーム)、またはページのコンテンツに関する情報(例えばページインデクスに維持され得る情報)に従ってクエリを選別してもよい。
当業者は、次元およびサブセットの先の例が例示的であって制限的ではないことを認識するであろう。所与の次元に沿って、いかなる数の次元およびクエリサブセットが用いられてもよい。次元に沿ったクエリの仕分けは、関連する次元の「不明」および/または「その他」の値のサブセットを含んでもよく、このサブセットは、システム構成に依存して分析されたりされなかったりする。
ステップ404で、1つ以上のサブセット固有の(subset-specific)概念ネットワークを生成するために、各クエリサブセットがクラスタリングモジュール312に与えられる。いくつかの実施例では、既存のユニット辞書306が用いられる。他の実施例では、
サブセット固有のユニットの集合を生成するために、サブセットがユニット分析モジュール310にも与えられてもよい。ユニット分析およびクラスタリング分析は、上記で参照された仮出願番号第60/510,220号に詳細に記載されている。クラスタリング分析は、各クエリサブセットに対して有利に独立に実行され、その結果、各サブセットについて概念ネットワークの集合が生成される。結果として生じたサブセット固有の概念ネットワークが傾向分析モジュール320に返される。
ステップ408で、傾向分析モジュール320はサブセット固有の概念ネットワークを用いて傾向分析を実行し、次元に沿ってユーザ行動のさまざまなパターンを反映する類似性および差異を検知する。これらのさまざまなパターンは、本願明細書で「傾向」と呼ばれ、傾向分析は、一般にそのような差異を発見するためにクラスタ(例えば概念ネットワーク)および/またはさまざまなサブセットから生成されたシグネチャを比較することを含む。傾向および傾向分析は多様な形式をとることができる。
一例として傾向分析は、異なる期間中の、または異なるユーザデモグラフィックについて、特定の検索語またはユニットの相対的な頻度を比較してもよい。比較されるユニットは、例えばあるクラスタの異なるメンバユニットまたはあるクラスタについての異なるシグネチャユニットであってもよい。例えば「歌手」のクラスタがあると仮定すると、このクラスタについての1つの傾向分析により、21歳未満のユーザにとって「アヴリル・ラヴィーン」が「セリーヌ・ディオン」よりさらに人気のあるクエリ用語であり、その一方で、35歳以上のユーザにとってはその逆が真であることを明らかにすることができる。あるいは「都市」のクラスタがあり、このクラスタのシグネチャが「雇用」および「ホテル」のユニットを含むと仮定すると、このシグネチャについての1つの傾向分析により、平日には「雇用」が検索される方がより頻繁である一方、週末は「ホテル」がより頻繁に検索されることを明らかにすることができる。(これは例えば、ユーザが平日に職探しをし、週末に休暇の計画を立てる傾向があることを反映し得る。)
いくつかの実施例では、傾向分析はまた、ユーザの関心事および行動におけるより微妙な傾向を検知するためにも用いられ得る。例えば、ある分野(例えば音楽)で周知の有名人が別の分野(例えば政治)に入ろうと決意すると仮定する。その有名人に対する興味のレベル総計はあまり変わらないかもしれないが、その有名人に関して求められる情報の種類には動きがあり得る。例えば、その有名人の名前プラス「曲」または「アルバム」の検索頻度が減少する一方、その有名人の名前プラス「政治」または「税」などの用語の検索頻度が増加するかもしれない。さまざまな期間にわたるその有名人の名前の近隣の比較によってそのような傾向が明らかになるであろう。
ステップ410で、傾向情報は続くクエリに応答して使用されるように、例えばユニット辞書306に記憶される。情報は、情報が属する特定のユニットおよび/またはクラスタと関連して、またはユニットもしくはクラスタに関連付けられたシグネチャもしくは提案などと関連して記憶されてもよい。
本願明細書に記載されるシステムおよびプロセスは例示的であって、変形および修正が可能であることが認識されるであろう。連続するよう記載された処理ステップは並行して実行されてもよく、ステップの順序は変えてもよく、ステップは修正され、組み合わされてもよい。傾向分析は、任意の数の次元にわたって同時に(例えば「ショッピング」領域から来た21歳未満のユーザ、など)起こってもよく、次元に沿った仕分けは所望により粗くても細かくてもよい。1つのサブセット固有の概念ネットワークが別のサブセット固有の概念ネットワークと比較されてもよく、異なるサブセット固有の概念ネットワークの各々が、仕分けられていないクエリから生成された「グローバルな」概念ネットワークと比較されてもよい。傾向分析は、ある概念ネットワーク、例えば、有意義なデータを生成するのに十分な数のクエリにおいて用いられるユニット、または関連する検索を示唆する
根拠として用いられるユニットに関連する概念ネットワークに限定されてもよい。傾向分析は、ユニット、クラスタ、シグネチャ、またはそれらの任意の組合せにおいて実行されてもよい。
ユニットおよびクラスタのデータと同様に、傾向情報は、ユーザの関心事の変化を反映するユーザの行動の変化(例えば、所与のポップミュージックパフォーマの人気の上昇または下降、職探しと旅行とを対比した関心の増加または減少)を捉えるために、有利にしばしば更新され、または再生成される。
発明の別の実施例では、関連のある傾向を考慮に入れることによって特定のユーザの関心事に対いて検索応答を合わせるよう支援するために傾向情報が用いられる。図5は、図2のシステム110がクエリに応答するために用いることのできる方法論を示す。クライアント120は検索サーバシステム160にクエリを送信する。検索サーバシステム160は、クエリおよび/またはその構成ユニットを概念サーバ180へ送り、概念サーバ180はユニット辞書306にアクセスする。概念サーバ180は、様々なユニットについての統計およびクラスタ情報によってクエリから識別された1つ以上のユニットなどのクエリに関連する概念データを、ユニットに関連する傾向情報とともに返す。この情報は、例えばそこに包含されるユニットを識別するためにクエリを切り刻み、識別された各ユニットについてのエントリを検索するためにユニット辞書306にアクセスすることによって派生してもよい。1つの実施例では、返された情報は、ユニット、統計、クラスタ、およびクエリに関連付けられた傾向に関する情報、1つ以上の構成ユニット、または構成ユニットのうちのいずれかに関連した1つ以上のクラスタを含む。
検索サーバシステム160は、クエリに応答する際に概念サーバ180から受け取った概念データを有利に用いる。検索サーバシステム160によって有利に返される結果はユーザのクエリに応答する結果と共に他の関連情報を含み、それは例えば、ユニットとその延長および関連事項において捉えられたユーザのニーズについての理解に基づいた、ユーザが次に何を調査したいかに関するヒントおよび情報(tips)などであって、クラスタとユニットおよび/またはクラスタに関連した傾向とを含む。
例えば、クエリが1つ以上のコンテキストで用いられ得る「Java」などの曖昧な用語を含むと仮定する。そのような用語は複数のクラスタ、例えば「飲食」クラスタ、「コンピュータ」クラスタおよび「場所」クラスタに属することがある。いくつかの実施例では、検索サーバシステム160は、例えばどのクラスタが最も重要な位置付けを与えられるべきかを選択することによって、応答を調整するために傾向データを用いることができる。例えば、平日に「Java」を検索するユーザがコンピュータ言語に興味を持っている可能性が最も高い一方で、週末に「Java」を検索するユーザはコーヒーに興味を持っている可能性が最も高い場合、検索結果が示され得る順序は週の曜日に依存することがある。例えば平日であればコンピュータ言語に関連する結果が最も顕著に示され得る一方で、週末であればコーヒーと関連する結果が最も顕著に示され得る。(異なるクラスタへの関連に基づいて検索結果をグループ化するためのいくつかの手法は、上記で参照した仮出願番号第60/510,220号に記載されている。)
第2の例として、ラップグループの名前であり、かつ何らかの会社の株価表示機の記号でもある連続した4文字(「WXYZ」)があると仮定する。株式市場が開いているときに受け取ったクエリに基づいた概念ネットワークまたはクラスタを、株式市場が閉鎖されてから受け取ったクエリに対して比較すると、WXYZ会社が前者の場合によりしばしば探索されており、ラップグループWXYZは後者の場合によりしばしば探索されていることが明らかになり得る。したがって、クエリが受け取られたときに株式市場が開いているか閉じた後かに依存して、会社関連の検索結果をラップグループ関連の結果の前または後に置くことができる。
第3の例として、コンテキストに依存して社交イベントをも政治をも意味するであろう「party(パーティー、政党)」という用語を考える。用語「party」を含むクエリのうち、曖昧さを解決する別の用語(例えば、「共和党(Republican party)」または「パーティーゲーム(party games)」)をさらに含むものもあるかもしれないが、そのような用語を含んでいないクエリもあり得る。傾向分析は、曖昧なクエリに対する応答を形成するのに用いることができる。例えば、図6は、時刻次元(4時間刻み)に沿って用語「party」を含むクエリの頻度(任意のユニットで)を示す傾向データのグラフである。そのような傾向データは、上述のプロセス400によってクエリのある集合を分析することにより得られる。傾向データ集合602(「X」記号)は、「party」が明らかに社交イベントに関連する別の用語(例えば「ゲーム」「好み」「道具」)と一緒に現れるクエリに対応する。傾向データ集合604(「O」記号)は、「party」が明らかに政治に関連する別の用語(例えば「共和党員」「民主党員」「候補者」)と一緒に現れるクエリに対応する。傾向データセット606(三角記号)は、クエリの他の用語を参照しても曖昧さが解決され得ないような「party」を含むクエリに対応する。
本発明によって曖昧さを解決する1つのやり方は、異なる傾向の形状(例えば図6に示されるデータ集合の第1および/または第2の派生語)を比較すること、および、曖昧なクエリ集合についての傾向が、曖昧でない集合のうちの一方と、他方よりさらに近接して一致するか否かを判断することである。図6に示される例では、曖昧な傾向データ606は、明らかに「政治的」傾向データ604に対してよりも「社交イベント」傾向データ602の方により近似している。ここから、「party」を含む曖昧なクエリを入力するユーザが政治よりも社交イベントに興味を持っていそうであることが推論され得、それに従って、例えば、政治に関連する結果よりも先に社交イベントに関連する結果を示すことによって検索結果が示される。
2つの傾向データ集合間の近似性の程度も考慮され、用いられて、推論された意図について信頼性レベルが確立できることに注意されるべきである。図6に示される例では、曖昧な傾向データ606は「社交イベント」傾向データ602とかなり近接して一致し、そのため推論に対する信頼性レベルが高い。他の例では、ユーザの行動に依存して、信頼性レベルがより低いか、またはより高いこともある。そのような信頼性レベルはクエリに対する応答を生成する際の別の要因となりうる。例えば、十分に高い信頼性レベルが与えられたとすると、社交イベントに関連する結果のみが最初に示されてもよい。そのような場合には、ユーザが政治に関連する結果を検索するオプションが与えられてもよい。
この例は例示的であって、変形および修正が可能である。例えば、近似性を決定する際、複数の次元(例えば時刻およびユーザ年齢)に沿った傾向がともに考慮され得る。傾向比較は、2つの曲線の近似性のいかなる適切な測定、例えば実際の頻度値、派生語(変化の速さ)、高位派生語、またはそれらの任意の組合せなどに基づいてもよい。
第4の例として、有害物質またはヘビーメタルバンドを指し得る「poison(毒、ポイズン)」という用語を考えてみる。ここでも、曖昧さを解決する他の用語を含むクエリがあるであろう。例えば、「ポイズンの歌詞(poison lyrics)」または「ポイズンmp3(poison mp3)」がバンドに関連する一方、「殺鼠剤(rat poison)」または「中毒管理(poison control)」などのクエリは有害物質に関連する。しかしながら、他のクエリは単に曖昧である。
曖昧さを解決するために「party」の例で上述されたような分析が用いられてもよい。別のアプローチは、バンド名である「ポイズン」が音楽パフォーマのクラスタに属することと、このクラスタが比較的明らかな名前の他のパフォーマを含むことを認識するこ
ととを伴う。(例えば、クエリとして「ブリトニー・スピアーズ(Britney Spears)」を入力するすべてのユーザは、実際この有名な歌手に興味を持っている。)明らかな音楽パフォーマの名前を含むクエリは「制御」グループとして用いることができ、そこから音楽パフォーマに関する情報を捜しているユーザの行動についての推論が引出せる。その後この行動は、パフォーマを指すかもしれないし、指さないかもしれない曖昧な用語(例えば「poison」)がパフォーマを指すつもりである可能性を推定するために、その曖昧な用語を入力するユーザの行動と比較することができる。
(64)制御グループと曖昧な用語を含むクエリとの間で多くの比較が可能である。例えば、曖昧な用語「poison」を含むクエリの部分であってさらに音楽に明らかに関連した用語(例えば「歌詞」)をも含む部分が計算され、また明白な名前(例えばブリトニー・スピアーズ)を含むクエリの対応する「制御」部分が同様に計算されてもよい。制御部分は、音楽に興味のあるユーザが潜在的に曖昧なクエリを入力する可能性に接近していると見なすことができる。これを「poison」を含む明らかに音楽に関連したクエリの頻度と比較することによって、クエリ「poison」を入力するユーザがこのバンドに興味を持っている可能性を推論することができる。
この例をより具体的にするために、用語「poison」を含んでさらに「歌詞」をも含むクエリの部分が0.1であり、用語「ブリトニー・スピアーズ」を含んでさらに「歌詞」を含むクエリの部分が0.2であると仮定する。このことから、用語「poison」を入力するユーザの半分が恐らくバンドを指すつもりではないことが推論され得る。この場合、バンドに関連する結果も毒に関連する結果も顕著に表示される。有害物質を検索しているユーザが曖昧さを解決する用語を含まない可能性を推定するために、有毒の「毒」を含むクラスタ(例えば医学関連クラスタ)に基づいて制御部分を用いた同様の分析をなすことができる。医学関連クラスタの用語についての曖昧なクエリの可能性が小さければ、それは曖昧なクエリ「poison」がバンドを指す可能性がより大きいことを示唆する。
さらに、音楽に興味があるユーザから潜在的に曖昧なクエリを受け取る可能性と、対照的に医学に興味があるユーザから受け取る可能性とを比較することにより、ユーザの意図を推論することができる。例えば、音楽に興味があるユーザからのクエリの29%がパフォーマの名前のみを含む単一ユニットのクエリである一方で、医学に興味があるユーザからのクエリの2%しか単一ユニットを含まないと仮定する。単一ユニットクエリ「poison」を入力するユーザについてはバンドに興味を持っていることの方がより可能性が高そうであることが推論され得る。
この分析のより高度な変形例が用いられ得ることが認識される。例えば、制御部分を計算するために1人のパフォーマのみではなく、より多くのパフォーマ(例えばブリトニー・スピアーズだけではなく「マッチボックス・トゥエンティー」(matchbox twenty)」、「ジョニー・キャッシュ(Johnny Cash)」など)が用いられ得る。同様に、曖昧さを解決する用語を1つだけ考慮するのではなく、複数の用語が用いられてもよい。(例えば「歌詞」だけでなく、「mp3」「ツアー」「アルバム」など。)他の曖昧な用語および他のクラスタに同様の分析を適用することができる。
第5の例として、ユーザが「デジタルカメラ」クエリを入力すると仮定する。ユーザは、デジタルカメラを売るサイト、またはデジタルカメラに関する情報(製品の評価など)を捜しているかもしれない。様々な次元(例えばユーザプロファイルおよび/または縦の次元)に沿った以前のクエリの傾向分析は、それにしたがって結果を調整できるよう、どれが最も可能性が高いかを判断するのに用いられることができる。
第6の例として、いくつかの実施例では、検索サーバシステム160が傾向情報に基づ
いた関連する検索を提示する。例えば、21歳未満であるとわかっているユーザが歌手の名前を含むクエリを入力すれば、検索サーバシステム160は、その歌手に関連するサイトのリストの表示に加えて、21歳未満のユーザに人気があるとして傾向分析によって特定された1人以上の他の歌手(例えば「アヴリル・ラヴィーン」)と関連する検索を提示する。35歳のユーザのためには、異なる歌手(例えば「セリーヌ・ディオン」)が提示されてもよい。別の場合には、「ニューヨーク市」のクエリが平日に入力された場合、「ホテル」の提示よりも「雇用」の提示の方が(それが傾向データと一致している場合)より顕著に行われる一方で、同じクエリが週末に入力された場合、逆の順序が用いられ得る。
いくつかの実施例では、ユーザのあり得る性別、年齢、または地理的場所などの特定のユーザに関する情報を推論するために、検索サーバシステム160によって傾向データが用いられてもよい。そのような推論は、異なる次元についてユーザの行動を合致させるよう、同じユーザによって入力された複数のクエリを傾向データに対して比較することを含み得る。これらの推論の正確さが保証されるわけではないことが理解される。それらは、ユーザがどのように行動するかを反映するのであって必ずしもユーザが誰であるかを反映するわけではない。特定のユーザに関してなされたいかなる推論も、可能性のあるユーザ意図の1つの表示として傾向データを再び用い、そのユーザが入力した他のクエリへの応答を調整するために用いることができる。このように、傾向データは、クエリを入力する特定のユーザに対する検索サーバの応答をカスタマイズするために用いられてもよい。
傾向データはまた、ある特定の広告掲載に際して、ある具体的な場面および/または料金においてどの広告を掲示するかといった広告上の判断と関連して、検索サーバシステム160のプロバイダによって用いられてもよい。
本発明は具体的な実施例に関して記載されているが、当業者は多くの変形が可能であることを認識するだろう。例えば、傾向分析に用いられる次元ならびにクエリサブセットの数および特異性は変動してもよく、受取ったクエリ全部を傾向分析に用いる必要はない。クラスタ、シグネチャおよび傾向情報は動的に規定することができ、傾向分析は、ユーザ行動の変化に応じて傾向情報を更新するために、頻繁に(例えば毎日または毎週)実行することができる。さらなる他の実施例において、クラスタ、シグネチャおよび傾向データが実質的にリアルタイムに更新されるように、クエリが受け取られるとすぐにクエリが処理されてもよい。本願明細書に記載された自動システムおよび方法は、クラスタ、シグネチャ、およびユニット、クラスタ、シグネチャなどのいずれかまたはすべてに関連する傾向情報などを含む、結果として生じるユニット辞書の部分またはすべてについて人間が検討することで増大され、補足されてもよい。
本願明細書に記載された実施例は、ウェブサイト、リンク、および、ワールドワイドウェブ(またはそのサブセット)が検索コーパスとして機能する場合に特有の他の専門用語を参照することができる。本願明細書に記載されたシステムおよびプロセスは、異なる検索コーパス(電子データベースまたはドキュメントリポジトリなど)とともに使用するために適合されることができ、結果はコンテンツとともにコンテンツが見つかるかもしれない場所へのリンクまたは参照をも含み得ることが理解される。
このように、本発明は具体的な実施例に関して記載されているが、本発明が添付の請求項の範囲内のすべての修正および等価物を包含するよう意図されることが認識される。
本発明の実施例による、情報検索および通信システムの単純化された高レベルのブロック図である。 本発明の実施例による、媒体コンテンツを通信するための情報検索および通信ネットワークの単純化されたブロック図である。 本発明の実施例によるクエリ処理エンジンの単純化されたブロック図である。 発明の実施例による傾向分析を実行するプロセスのフローチャートである。 本発明の実施例による、いくつかの局面のクエリ処理エンジンを含む、ユニット辞書および関連する処理知能(processing intelligence)を含むシステムの単純化されたブロック図である。 時刻の関数としてクエリの頻度を示す傾向データのグラフである。

Claims (25)

  1. クエリを処理するための、1つ以上のプロセッサとメモリをそれぞれが含む1つ以上のコンピューティング装置によって実行される方法であって、
    次元に沿ってクエリを複数のサブセットに仕分けるステップを含み、複数のサブセットは第1のサブセットおよび第2のサブセットを含み、さらに、
    クエリの前記第1のブセットに対して第1の概念ネットワークを生成するステップと、
    クエリの前記第2のブセットに対して第2の概念ネットワークを生成するステップと、
    第1の概念ネットワークと第2の概念ネットワークとの比較を実行するステップと、
    前記比較に基づいて、前記次元にわたってユーザの行動のパターンにおける相違を示す傾向情報を生成するステップと
    前記傾向情報を使用して表示のためのコンテンツを生成するステップと、を含む、方法。
  2. 前記次元は時間次元である、請求項1に記載の方法。
  3. 前記次元は、ユーザの1つ以上のデモグラフィック特性への参照によって規定される、請求項1に記載の方法。
  4. 前記次元は地理的次元である、請求項1に記載の方法。
  5. 前記次元はクエリのユーザコンテキストを表わす縦の次元である、請求項1に記載の方法。
  6. 比較を実行するステップは、ユニットに関連する第1の概念ネットワークからの情報と、同じユニットに関連する第2の概念ネットワークからの情報との比較を実行するステップを含む、請求項1に記載の方法。
  7. 傾向情報を生成するステップは、前記次元に関連する前記ユニットについて傾向情報を生成するステップを含む、請求項に記載の方法。
  8. 第1のクエリを受取るステップをさらに含み、第1のクエリは1つ以上の用語を含み、前記傾向情報を使用して表示のためのコンテンツを生成するステップは、第1のクエリへの応答を生成するのに前記傾向情報を用いるステップを含み、前記第1のクエリに対する前記応答は1つ以上のレコードを含む、請求項1に記載の方法。
  9. 第1のクエリの曖昧な用語を解決するのに前記傾向情報を用いるステップをさらに含む、請求項8に記載の方法。
  10. 第2のクエリを提示するために前記傾向情報を用いるステップをさらに含み、第2のクエリは前記第1のクエリとは異なる用語を少なくとも1つ含む、請求項8に記載の方法。
  11. 第1のクエリに対する応答における1つ以上のレコードをグループ化するために前記傾向情報を用いるステップをさらに含む、請求項8に記載の方法。
  12. 前記傾向情報を使用して表示のためのコンテンツを生成するステップは、掲示用広告を選択するために前記傾向情報を用いるステップをさらに含む、請求項8に記載の方法。
  13. クエリを処理するためのシステムであって、
    1つ以上のプロセッサと、
    プロセッサに動作的に結合されるメモリと、
    メモリに格納され、1つ以上のプロセッサに1組のクエリを次元に沿って複数のサブセットに仕分けさせるよう構成される傾向分析モジュールとを含み、複数のサブセットは第1のサブセットおよび第2のサブセットを含み、さらに、
    メモリに格納され、1つ以上のプロセッサにクエリの前記第1のブセットについて第1の概念ネットワークを、クエリの前記第2のブセットについて第2の概念ネットワークを生成させるよう構成されるクラスタリングモジュールを含み、
    傾向分析モジュールはさらに、1つ以上のプロセッサに、少なくとも2つのサブセットについての第1の概念ネットワークと第2の概念ネットワークとの比較を実行させるよう構成され、それにより傾向情報を生成するものであり前記傾向情報は前記次元にわたってユーザの行動のパターンにおける相違を示すものであり、さらに、
    前記メモリに記憶され、前記1つ以上のプロセッサに、前記傾向情報を使用して表示のためのコンテンツを生成させる応答モジュールを含むシステム。
  14. 前記次元は時間次元である、請求項13に記載のシステム。
  15. 前記次元はユーザの1つ以上のデモグラフィック特性への参照によって規定される、請求項13に記載のシステム。
  16. 前記次元は地理的次元である、請求項13に記載のシステム。
  17. 前記次元はクエリのユーザコンテキストを表わす縦の次元である、請求項13に記載のシステム。
  18. 前記傾向分析モジュールはさらに、1つ以上のプロセッサに、ユニットに関連する第1の概念ネットワークからの情報と、同じユニットに関連する第2の概念ネットワークからの情報との比較を実行させるよう構成される、請求項13に記載システム。
  19. 前記傾向分析モジュールはさらに、次元に関連する前記ユニットについての傾向情報を1つ以上のプロセッサに生成させるよう構成される、請求項18に記載のシステム。
  20. 前記応答モジュールは、前記1つ以上のプロセッサに第1のクエリを受取らせるようにさらに構成され、前記第1のクエリは1つ以上の用語を含み、前記傾向情報を使用して表示のためのコンテンツを生成するステップは、少なくとも部分的に前記傾向情報に基づいて前記第1のクエリに対する応答を生成するために前記傾向情報を使用することを含み、前記第1のクエリに対する前記応答は1つ以上のレコードを含む、請求項13に記載のシステム。
  21. 前記応答モジュールはさらに、1つ以上のプロセッサに、第1のクエリの曖昧な用語を解決するために前記傾向情報を用いらせるよう構成される、請求項20に記載のシステム。
  22. 前記応答モジュールはさらに、1つ以上のプロセッサに第2のクエリを提示するために傾向情報を用いらせるよう構成され、第2のクエリは前記第1のクエリとは異なる用語を少なくとも1つ含む、請求項20に記載のシステム。
  23. 前記応答モジュールはさらに、1つ以上のプロセッサに、第1のクエリに対する応答における1つ以上のレコードをグループ化するために前記傾向情報を用いらせるよう構成される、請求項20に記載のシステム。
  24. 前記傾向情報を使用して表示のためのコンテンツを生成するステップは、掲示用広告を選択するために前記傾向情報を用いることを含む、請求項20に記載のシステム。
  25. 1つ以上のプロセッサによって実行されたときに、請求項1から12のいずれかに記載の方法を実行させる命令を含んだ、1つ以上のコンピュータ読み取り可能記録媒体。
JP2006539831A 2003-11-12 2004-11-12 傾向分析を用いる検索クエリ処理のためのシステムおよび方法 Active JP4722051B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US10/712,307 US7240049B2 (en) 2003-11-12 2003-11-12 Systems and methods for search query processing using trend analysis
US10/712,307 2003-11-12
PCT/US2004/037571 WO2005050367A2 (en) 2003-11-12 2004-11-12 Systems and methods for search query processing using trend analysis

Publications (2)

Publication Number Publication Date
JP2007511016A JP2007511016A (ja) 2007-04-26
JP4722051B2 true JP4722051B2 (ja) 2011-07-13

Family

ID=34552670

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006539831A Active JP4722051B2 (ja) 2003-11-12 2004-11-12 傾向分析を用いる検索クエリ処理のためのシステムおよび方法

Country Status (6)

Country Link
US (2) US7240049B2 (ja)
EP (1) EP1690169A4 (ja)
JP (1) JP4722051B2 (ja)
KR (1) KR101031449B1 (ja)
CN (1) CN100401292C (ja)
WO (1) WO2005050367A2 (ja)

Families Citing this family (299)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8706747B2 (en) 2000-07-06 2014-04-22 Google Inc. Systems and methods for searching using queries written in a different character-set and/or language from the target pages
US6832220B1 (en) * 2000-08-03 2004-12-14 Microsoft Corporation Method and apparatus for file searching, accessing file identifiers from reference page
US7693830B2 (en) 2005-08-10 2010-04-06 Google Inc. Programmable search engine
US7743045B2 (en) 2005-08-10 2010-06-22 Google Inc. Detecting spam related and biased contexts for programmable search engines
US7716199B2 (en) 2005-08-10 2010-05-11 Google Inc. Aggregating context data for programmable search engines
US7831476B2 (en) * 2002-10-21 2010-11-09 Ebay Inc. Listing recommendation in a network-based commerce system
US8255417B2 (en) * 2003-05-20 2012-08-28 Google Inc. System and method for providing definitions
US7693827B2 (en) * 2003-09-30 2010-04-06 Google Inc. Personalization of placed content ordering in search results
US7660400B2 (en) * 2003-12-19 2010-02-09 At&T Intellectual Property Ii, L.P. Method and apparatus for automatically building conversational systems
US8954420B1 (en) 2003-12-31 2015-02-10 Google Inc. Methods and systems for improving a search ranking using article information
US7158966B2 (en) * 2004-03-09 2007-01-02 Microsoft Corporation User intent discovery
US8386728B1 (en) 2004-03-31 2013-02-26 Google Inc. Methods and systems for prioritizing a crawl
US8631076B1 (en) 2004-03-31 2014-01-14 Google Inc. Methods and systems for associating instant messenger events
US8346777B1 (en) 2004-03-31 2013-01-01 Google Inc. Systems and methods for selectively storing event data
US7941439B1 (en) 2004-03-31 2011-05-10 Google Inc. Methods and systems for information capture
US7409383B1 (en) 2004-03-31 2008-08-05 Google Inc. Locating meaningful stopwords or stop-phrases in keyword-based retrieval systems
US7333976B1 (en) 2004-03-31 2008-02-19 Google Inc. Methods and systems for processing contact information
US8275839B2 (en) 2004-03-31 2012-09-25 Google Inc. Methods and systems for processing email messages
US8099407B2 (en) 2004-03-31 2012-01-17 Google Inc. Methods and systems for processing media files
US8161053B1 (en) 2004-03-31 2012-04-17 Google Inc. Methods and systems for eliminating duplicate events
US20060010029A1 (en) * 2004-04-29 2006-01-12 Gross John N System & method for online advertising
US20050246358A1 (en) * 2004-04-29 2005-11-03 Gross John N System & method of identifying and predicting innovation dissemination
US20050246391A1 (en) * 2004-04-29 2005-11-03 Gross John N System & method for monitoring web pages
US8250065B1 (en) * 2004-05-28 2012-08-21 Adobe Systems Incorporated System and method for ranking information based on clickthroughs
US9626437B2 (en) * 2004-06-10 2017-04-18 International Business Machines Corporation Search scheduling and delivery tool for scheduling a search using a search framework profile
US7565630B1 (en) 2004-06-15 2009-07-21 Google Inc. Customization of search results for search queries received from third party sites
US8972444B2 (en) * 2004-06-25 2015-03-03 Google Inc. Nonstandard locality-based text entry
US8392453B2 (en) * 2004-06-25 2013-03-05 Google Inc. Nonstandard text entry
US9223868B2 (en) * 2004-06-28 2015-12-29 Google Inc. Deriving and using interaction profiles
US7562069B1 (en) * 2004-07-01 2009-07-14 Aol Llc Query disambiguation
US8078607B2 (en) * 2006-03-30 2011-12-13 Google Inc. Generating website profiles based on queries from webistes and user activities on the search results
US8620915B1 (en) 2007-03-13 2013-12-31 Google Inc. Systems and methods for promoting personalized search results based on personal information
US7555524B1 (en) * 2004-09-16 2009-06-30 Symantec Corporation Bulk electronic message detection by header similarity analysis
US8874570B1 (en) 2004-11-30 2014-10-28 Google Inc. Search boost vector based on co-visitation information
US7962461B2 (en) 2004-12-14 2011-06-14 Google Inc. Method and system for finding and aggregating reviews for a product
US9092523B2 (en) 2005-02-28 2015-07-28 Search Engine Technologies, Llc Methods of and systems for searching by incorporating user-entered information
US9378203B2 (en) 2008-05-01 2016-06-28 Primal Fusion Inc. Methods and apparatus for providing information of interest to one or more users
US20060224583A1 (en) * 2005-03-31 2006-10-05 Google, Inc. Systems and methods for analyzing a user's web history
US20060224608A1 (en) * 2005-03-31 2006-10-05 Google, Inc. Systems and methods for combining sets of favorites
US9256685B2 (en) 2005-03-31 2016-02-09 Google Inc. Systems and methods for modifying search results based on a user's history
US20060224579A1 (en) * 2005-03-31 2006-10-05 Microsoft Corporation Data mining techniques for improving search engine relevance
US7403767B2 (en) * 2005-04-29 2008-07-22 Siemens Aktiengesellschaft Cellular telephone network with record keeping for missed calls
US20060253423A1 (en) * 2005-05-07 2006-11-09 Mclane Mark Information retrieval system and method
US7647312B2 (en) * 2005-05-12 2010-01-12 Microsoft Corporation System and method for automatic generation of suggested inline search terms
US8103659B1 (en) * 2005-06-06 2012-01-24 A9.Com, Inc. Perspective-based item navigation
US8200687B2 (en) 2005-06-20 2012-06-12 Ebay Inc. System to generate related search queries
US10769215B2 (en) * 2005-07-14 2020-09-08 Conversant Wireless Licensing S.A R.L. Method, apparatus and computer program product providing an application integrated mobile device search solution using context information
US7844599B2 (en) * 2005-08-24 2010-11-30 Yahoo! Inc. Biasing queries to determine suggested queries
US7747639B2 (en) * 2005-08-24 2010-06-29 Yahoo! Inc. Alternative search query prediction
US7672932B2 (en) 2005-08-24 2010-03-02 Yahoo! Inc. Speculative search result based on a not-yet-submitted search query
US8989718B2 (en) 2005-09-14 2015-03-24 Millennial Media, Inc. Idle screen advertising
US10911894B2 (en) 2005-09-14 2021-02-02 Verizon Media Inc. Use of dynamic content generation parameters based on previous performance of those parameters
US9471925B2 (en) 2005-09-14 2016-10-18 Millennial Media Llc Increasing mobile interactivity
US8302030B2 (en) 2005-09-14 2012-10-30 Jumptap, Inc. Management of multiple advertising inventories using a monetization platform
US7912458B2 (en) 2005-09-14 2011-03-22 Jumptap, Inc. Interaction analysis and prioritization of mobile content
US10592930B2 (en) 2005-09-14 2020-03-17 Millenial Media, LLC Syndication of a behavioral profile using a monetization platform
US8311888B2 (en) 2005-09-14 2012-11-13 Jumptap, Inc. Revenue models associated with syndication of a behavioral profile using a monetization platform
US9703892B2 (en) 2005-09-14 2017-07-11 Millennial Media Llc Predictive text completion for a mobile communication facility
US7660581B2 (en) 2005-09-14 2010-02-09 Jumptap, Inc. Managing sponsored content based on usage history
US8364540B2 (en) 2005-09-14 2013-01-29 Jumptap, Inc. Contextual targeting of content using a monetization platform
US8156128B2 (en) 2005-09-14 2012-04-10 Jumptap, Inc. Contextual mobile content placement on a mobile communication facility
US8819659B2 (en) 2005-09-14 2014-08-26 Millennial Media, Inc. Mobile search service instant activation
US7860871B2 (en) 2005-09-14 2010-12-28 Jumptap, Inc. User history influenced search results
US8832100B2 (en) 2005-09-14 2014-09-09 Millennial Media, Inc. User transaction history influenced search results
US8805339B2 (en) 2005-09-14 2014-08-12 Millennial Media, Inc. Categorization of a mobile user profile based on browse and viewing behavior
US8503995B2 (en) 2005-09-14 2013-08-06 Jumptap, Inc. Mobile dynamic advertisement creation and placement
US8812526B2 (en) 2005-09-14 2014-08-19 Millennial Media, Inc. Mobile content cross-inventory yield optimization
US8364521B2 (en) 2005-09-14 2013-01-29 Jumptap, Inc. Rendering targeted advertisement on mobile communication facilities
US8131271B2 (en) 2005-11-05 2012-03-06 Jumptap, Inc. Categorization of a mobile user profile based on browse behavior
US7769764B2 (en) 2005-09-14 2010-08-03 Jumptap, Inc. Mobile advertisement syndication
US7752209B2 (en) 2005-09-14 2010-07-06 Jumptap, Inc. Presenting sponsored content on a mobile communication facility
US20110313853A1 (en) 2005-09-14 2011-12-22 Jorey Ramer System for targeting advertising content to a plurality of mobile communication facilities
US7577665B2 (en) 2005-09-14 2009-08-18 Jumptap, Inc. User characteristic influenced search results
US8615719B2 (en) 2005-09-14 2013-12-24 Jumptap, Inc. Managing sponsored content for delivery to mobile communication facilities
US8290810B2 (en) 2005-09-14 2012-10-16 Jumptap, Inc. Realtime surveying within mobile sponsored content
US7676394B2 (en) 2005-09-14 2010-03-09 Jumptap, Inc. Dynamic bidding and expected value
US8103545B2 (en) 2005-09-14 2012-01-24 Jumptap, Inc. Managing payment for sponsored content presented to mobile communication facilities
US7702318B2 (en) 2005-09-14 2010-04-20 Jumptap, Inc. Presentation of sponsored content based on mobile transaction event
US10038756B2 (en) 2005-09-14 2018-07-31 Millenial Media LLC Managing sponsored content based on device characteristics
US8666376B2 (en) 2005-09-14 2014-03-04 Millennial Media Location based mobile shopping affinity program
US8229914B2 (en) 2005-09-14 2012-07-24 Jumptap, Inc. Mobile content spidering and compatibility determination
US8209344B2 (en) 2005-09-14 2012-06-26 Jumptap, Inc. Embedding sponsored content in mobile applications
US8238888B2 (en) 2006-09-13 2012-08-07 Jumptap, Inc. Methods and systems for mobile coupon placement
US9058406B2 (en) 2005-09-14 2015-06-16 Millennial Media, Inc. Management of multiple advertising inventories using a monetization platform
US8027879B2 (en) 2005-11-05 2011-09-27 Jumptap, Inc. Exclusivity bidding for mobile sponsored content
US9201979B2 (en) 2005-09-14 2015-12-01 Millennial Media, Inc. Syndication of a behavioral profile associated with an availability condition using a monetization platform
US8195133B2 (en) 2005-09-14 2012-06-05 Jumptap, Inc. Mobile dynamic advertisement creation and placement
US8688671B2 (en) 2005-09-14 2014-04-01 Millennial Media Managing sponsored content based on geographic region
US8660891B2 (en) 2005-11-01 2014-02-25 Millennial Media Interactive mobile advertisement banners
US9076175B2 (en) 2005-09-14 2015-07-07 Millennial Media, Inc. Mobile comparison shopping
EP1934843A2 (en) * 2005-10-04 2008-06-25 Thomson Global Resources Systems, methods, and software for assessing ambiguity of medical terms
US10698939B2 (en) 2005-10-26 2020-06-30 Cortica Ltd System and method for customizing images
US9466068B2 (en) 2005-10-26 2016-10-11 Cortica, Ltd. System and method for determining a pupillary response to a multimedia data element
US9558449B2 (en) 2005-10-26 2017-01-31 Cortica, Ltd. System and method for identifying a target area in a multimedia content element
US10621988B2 (en) 2005-10-26 2020-04-14 Cortica Ltd System and method for speech to text translation using cores of a natural liquid architecture system
US10848590B2 (en) 2005-10-26 2020-11-24 Cortica Ltd System and method for determining a contextual insight and providing recommendations based thereon
US10691642B2 (en) 2005-10-26 2020-06-23 Cortica Ltd System and method for enriching a concept database with homogenous concepts
US10635640B2 (en) 2005-10-26 2020-04-28 Cortica, Ltd. System and method for enriching a concept database
US9477658B2 (en) 2005-10-26 2016-10-25 Cortica, Ltd. Systems and method for speech to speech translation using cores of a natural liquid architecture system
US9767143B2 (en) 2005-10-26 2017-09-19 Cortica, Ltd. System and method for caching of concept structures
US8326775B2 (en) 2005-10-26 2012-12-04 Cortica Ltd. Signature generation for multimedia deep-content-classification by a large-scale matching system and method thereof
US10380623B2 (en) 2005-10-26 2019-08-13 Cortica, Ltd. System and method for generating an advertisement effectiveness performance score
US11604847B2 (en) 2005-10-26 2023-03-14 Cortica Ltd. System and method for overlaying content on a multimedia content element based on user interest
US11361014B2 (en) 2005-10-26 2022-06-14 Cortica Ltd. System and method for completing a user profile
US9747420B2 (en) 2005-10-26 2017-08-29 Cortica, Ltd. System and method for diagnosing a patient based on an analysis of multimedia content
US10193990B2 (en) 2005-10-26 2019-01-29 Cortica Ltd. System and method for creating user profiles based on multimedia content
US8312031B2 (en) 2005-10-26 2012-11-13 Cortica Ltd. System and method for generation of complex signatures for multimedia data content
US9396435B2 (en) 2005-10-26 2016-07-19 Cortica, Ltd. System and method for identification of deviations from periodic behavior patterns in multimedia content
US9372940B2 (en) 2005-10-26 2016-06-21 Cortica, Ltd. Apparatus and method for determining user attention using a deep-content-classification (DCC) system
US10535192B2 (en) 2005-10-26 2020-01-14 Cortica Ltd. System and method for generating a customized augmented reality environment to a user
US9031999B2 (en) 2005-10-26 2015-05-12 Cortica, Ltd. System and methods for generation of a concept based database
US10360253B2 (en) 2005-10-26 2019-07-23 Cortica, Ltd. Systems and methods for generation of searchable structures respective of multimedia data content
US11003706B2 (en) 2005-10-26 2021-05-11 Cortica Ltd System and methods for determining access permissions on personalized clusters of multimedia content elements
US10191976B2 (en) 2005-10-26 2019-01-29 Cortica, Ltd. System and method of detecting common patterns within unstructured data elements retrieved from big data sources
US10380267B2 (en) 2005-10-26 2019-08-13 Cortica, Ltd. System and method for tagging multimedia content elements
US11620327B2 (en) 2005-10-26 2023-04-04 Cortica Ltd System and method for determining a contextual insight and generating an interface with recommendations based thereon
US11032017B2 (en) 2005-10-26 2021-06-08 Cortica, Ltd. System and method for identifying the context of multimedia content elements
US9529984B2 (en) 2005-10-26 2016-12-27 Cortica, Ltd. System and method for verification of user identification based on multimedia content elements
US10585934B2 (en) 2005-10-26 2020-03-10 Cortica Ltd. Method and system for populating a concept database with respect to user identifiers
US10614626B2 (en) 2005-10-26 2020-04-07 Cortica Ltd. System and method for providing augmented reality challenges
US9256668B2 (en) 2005-10-26 2016-02-09 Cortica, Ltd. System and method of detecting common patterns within unstructured data elements retrieved from big data sources
US8818916B2 (en) * 2005-10-26 2014-08-26 Cortica, Ltd. System and method for linking multimedia data elements to web pages
US10180942B2 (en) 2005-10-26 2019-01-15 Cortica Ltd. System and method for generation of concept structures based on sub-concepts
US8266185B2 (en) 2005-10-26 2012-09-11 Cortica Ltd. System and methods thereof for generation of searchable structures respective of multimedia data content
US11216498B2 (en) 2005-10-26 2022-01-04 Cortica, Ltd. System and method for generating signatures to three-dimensional multimedia data elements
US9953032B2 (en) 2005-10-26 2018-04-24 Cortica, Ltd. System and method for characterization of multimedia content signals using cores of a natural liquid architecture system
US11403336B2 (en) 2005-10-26 2022-08-02 Cortica Ltd. System and method for removing contextually identical multimedia content elements
US8509750B2 (en) 2005-11-05 2013-08-13 Jumptap, Inc. System for targeting advertising content to a plurality of mobile communication facilities
US8175585B2 (en) 2005-11-05 2012-05-08 Jumptap, Inc. System for targeting advertising content to a plurality of mobile communication facilities
KR100809415B1 (ko) * 2005-12-08 2008-03-05 한국전자통신연구원 온톨로지를 활용한 정보질의 확장 시스템 및 그 방법
US7680775B2 (en) * 2005-12-13 2010-03-16 Iac Search & Media, Inc. Methods and systems for generating query and result-based relevance indexes
US7627559B2 (en) * 2005-12-15 2009-12-01 Microsoft Corporation Context-based key phrase discovery and similarity measurement utilizing search engine query logs
US9262446B1 (en) 2005-12-29 2016-02-16 Google Inc. Dynamically ranking entries in a personal data book
US7685144B1 (en) 2005-12-29 2010-03-23 Google Inc. Dynamically autocompleting a data entry
US7634463B1 (en) 2005-12-29 2009-12-15 Google Inc. Automatically generating and maintaining an address book
US7725417B2 (en) * 2006-02-09 2010-05-25 Ebay Inc. Method and system to analyze rules based on popular query coverage
US8380698B2 (en) * 2006-02-09 2013-02-19 Ebay Inc. Methods and systems to generate rules to identify data items
US7739226B2 (en) * 2006-02-09 2010-06-15 Ebay Inc. Method and system to analyze aspect rules based on domain coverage of the aspect rules
US7640234B2 (en) * 2006-02-09 2009-12-29 Ebay Inc. Methods and systems to communicate information
US7739225B2 (en) 2006-02-09 2010-06-15 Ebay Inc. Method and system to analyze aspect rules based on domain coverage of an aspect-value pair
US7849047B2 (en) * 2006-02-09 2010-12-07 Ebay Inc. Method and system to analyze domain rules based on domain coverage of the domain rules
US9443333B2 (en) 2006-02-09 2016-09-13 Ebay Inc. Methods and systems to communicate information
US7689554B2 (en) * 2006-02-28 2010-03-30 Yahoo! Inc. System and method for identifying related queries for languages with multiple writing systems
US7571162B2 (en) * 2006-03-01 2009-08-04 Microsoft Corporation Comparative web search
US9953097B2 (en) 2006-03-16 2018-04-24 Ebay Inc. System and method for managing network traffic routing
US7716229B1 (en) * 2006-03-31 2010-05-11 Microsoft Corporation Generating misspells from query log context usage
KR100754768B1 (ko) * 2006-04-06 2007-09-03 엔에이치엔(주) 사용자별 맞춤 추천어를 제공하는 시스템, 방법 및 상기방법을 실행하기 위한 프로그램이 기록된 컴퓨터에서 판독가능한 기록 매체
US8126874B2 (en) * 2006-05-09 2012-02-28 Google Inc. Systems and methods for generating statistics from search engine query logs
US7523108B2 (en) * 2006-06-07 2009-04-21 Platformation, Inc. Methods and apparatus for searching with awareness of geography and languages
US7814112B2 (en) * 2006-06-09 2010-10-12 Ebay Inc. Determining relevancy and desirability of terms
US20080016157A1 (en) * 2006-06-29 2008-01-17 Centraltouch Technology Inc. Method and system for controlling and monitoring an apparatus from a remote computer using session initiation protocol (sip)
US8688485B2 (en) * 2006-07-06 2014-04-01 Google Inc. Low fare search for ticket changes using married segment indicators
US20080010101A1 (en) * 2006-07-06 2008-01-10 Todd Williamson Determining reissue methods for ticket changes
US20080010102A1 (en) * 2006-07-06 2008-01-10 Todd Williamson Database for storing historical travel information
US20080041945A1 (en) * 2006-07-06 2008-02-21 Todd Williamson Ticket reconstruction
US8731980B2 (en) * 2006-07-06 2014-05-20 Google Inc. Low fare search for ticket changes
US7664744B2 (en) * 2006-07-14 2010-02-16 Yahoo! Inc. Query categorizer
WO2008030568A2 (en) * 2006-09-07 2008-03-13 Feedster, Inc. Feed crawling system and method and spam feed filter
US7979425B2 (en) * 2006-10-25 2011-07-12 Google Inc. Server-side match
US10733326B2 (en) 2006-10-26 2020-08-04 Cortica Ltd. System and method for identification of inappropriate multimedia content
US7937403B2 (en) * 2006-10-30 2011-05-03 Yahoo! Inc. Time-based analysis of related keyword searching
US9110975B1 (en) * 2006-11-02 2015-08-18 Google Inc. Search result inputs using variant generalized queries
US20080109752A1 (en) * 2006-11-07 2008-05-08 Yahoo! Inc. Expanding search query input box to support livesearch interaction
US8635203B2 (en) * 2006-11-16 2014-01-21 Yahoo! Inc. Systems and methods using query patterns to disambiguate query intent
US7630970B2 (en) * 2006-11-28 2009-12-08 Yahoo! Inc. Wait timer for partially formed query
US7941436B2 (en) * 2006-11-30 2011-05-10 Yahoo, Inc. Keyword bidding strategy for novel concepts
US7822734B2 (en) * 2006-12-12 2010-10-26 Yahoo! Inc. Selecting and presenting user search results based on an environment taxonomy
US7630972B2 (en) * 2007-01-05 2009-12-08 Yahoo! Inc. Clustered search processing
US20090012841A1 (en) * 2007-01-05 2009-01-08 Yahoo! Inc. Event communication platform for mobile device users
US7912847B2 (en) * 2007-02-20 2011-03-22 Wright State University Comparative web search system and method
US8738606B2 (en) * 2007-03-30 2014-05-27 Microsoft Corporation Query generation using environment configuration
CN101286150B (zh) * 2007-04-10 2010-09-15 阿里巴巴集团控股有限公司 生成更新参数的方法和装置、展示相关关键词的方法和装置
US7672937B2 (en) * 2007-04-11 2010-03-02 Yahoo, Inc. Temporal targeting of advertisements
KR20080096005A (ko) * 2007-04-26 2008-10-30 엔에이치엔(주) 키워드 제공 범위에 따라 키워드 제공 방법 및 그 시스템
US7895227B1 (en) * 2007-04-27 2011-02-22 Intuit Inc. System and method for detecting trends in network-based content
CN101179472B (zh) * 2007-05-31 2011-05-11 腾讯科技(深圳)有限公司 一种网络资源搜索方法及搜索系统
US8019742B1 (en) 2007-05-31 2011-09-13 Google Inc. Identifying related queries
US7644075B2 (en) * 2007-06-01 2010-01-05 Microsoft Corporation Keyword usage score based on frequency impulse and frequency weight
US8051040B2 (en) 2007-06-08 2011-11-01 Ebay Inc. Electronic publication system
US8290921B2 (en) * 2007-06-28 2012-10-16 Microsoft Corporation Identification of similar queries based on overall and partial similarity of time series
US20090006311A1 (en) * 2007-06-28 2009-01-01 Yahoo! Inc. Automated system to improve search engine optimization on web pages
US7685100B2 (en) 2007-06-28 2010-03-23 Microsoft Corporation Forecasting search queries based on time dependencies
US8090709B2 (en) 2007-06-28 2012-01-03 Microsoft Corporation Representing queries and determining similarity based on an ARIMA model
US7693908B2 (en) * 2007-06-28 2010-04-06 Microsoft Corporation Determination of time dependency of search queries
US7693823B2 (en) * 2007-06-28 2010-04-06 Microsoft Corporation Forecasting time-dependent search queries
US7689622B2 (en) * 2007-06-28 2010-03-30 Microsoft Corporation Identification of events of search queries
US7685099B2 (en) * 2007-06-28 2010-03-23 Microsoft Corporation Forecasting time-independent search queries
US20090043749A1 (en) * 2007-08-06 2009-02-12 Garg Priyank S Extracting query intent from query logs
US7966341B2 (en) * 2007-08-06 2011-06-21 Yahoo! Inc. Estimating the date relevance of a query from query logs
US7428522B1 (en) * 2007-09-27 2008-09-23 Yahoo! Inc. Real-time search term popularity determination, by search origin geographic location
US20090089169A1 (en) * 2007-09-28 2009-04-02 Google Inc. Event Based Serving
US8903756B2 (en) * 2007-10-19 2014-12-02 Ying Zhao System and method for knowledge pattern search from networked agents
KR100893129B1 (ko) * 2007-10-24 2009-04-15 엔에이치엔(주) 멀티 미디어 컨텐츠의 추천 키워드 추출 시스템 및 그 방법
US7853475B2 (en) * 2007-11-09 2010-12-14 Motorola Mobility, Inc. Intelligent advertising based on mobile content
US7415460B1 (en) * 2007-12-10 2008-08-19 International Business Machines Corporation System and method to customize search engine results by picking documents
US8612409B2 (en) * 2007-12-18 2013-12-17 Yahoo! Inc. Method and apparatus for detecting and explaining bursty stream events in targeted groups
CA2710421A1 (en) * 2007-12-21 2009-07-09 Marc Light Entity, event, and relationship extraction
US9501467B2 (en) 2007-12-21 2016-11-22 Thomson Reuters Global Resources Systems, methods, software and interfaces for entity extraction and resolution and tagging
US20090164266A1 (en) * 2007-12-21 2009-06-25 Microsoft Corporation Category aggregated opinion data
EP2240873A1 (en) * 2007-12-31 2010-10-20 Thomson Reuters Global Resources Systems, methods and sofstware for evaluating user queries
US8402031B2 (en) * 2008-01-11 2013-03-19 Microsoft Corporation Determining entity popularity using search queries
US10049100B2 (en) * 2008-01-30 2018-08-14 Thomson Reuters Global Resources Unlimited Company Financial event and relationship extraction
US9746985B1 (en) 2008-02-25 2017-08-29 Georgetown University System and method for detecting, collecting, analyzing, and communicating event-related information
US8881040B2 (en) 2008-08-28 2014-11-04 Georgetown University System and method for detecting, collecting, analyzing, and communicating event-related information
US9489495B2 (en) 2008-02-25 2016-11-08 Georgetown University System and method for detecting, collecting, analyzing, and communicating event-related information
US9529974B2 (en) 2008-02-25 2016-12-27 Georgetown University System and method for detecting, collecting, analyzing, and communicating event-related information
US20090222321A1 (en) * 2008-02-28 2009-09-03 Microsoft Corporation Prediction of future popularity of query terms
US20090276414A1 (en) * 2008-04-30 2009-11-05 Microsoft Corporation Ranking model adaptation for searching
US10198503B2 (en) 2008-05-01 2019-02-05 Primal Fusion Inc. System and method for performing a semantic operation on a digital social network
US9361365B2 (en) * 2008-05-01 2016-06-07 Primal Fusion Inc. Methods and apparatus for searching of content using semantic synthesis
US9798807B2 (en) * 2008-05-06 2017-10-24 Excalibur Ip, Llc Algorithmically generated topic pages
US8126930B2 (en) * 2008-05-06 2012-02-28 Yahoo! Inc. Micro-bucket testing for page optimization
EP2304544A4 (en) * 2008-06-13 2011-08-24 Ebay Inc METHOD AND SYSTEM OF GROUPING
US10922363B1 (en) * 2010-04-21 2021-02-16 Richard Paiz Codex search patterns
US11048765B1 (en) 2008-06-25 2021-06-29 Richard Paiz Search engine optimizer
US9183323B1 (en) 2008-06-27 2015-11-10 Google Inc. Suggesting alternative query phrases in query results
US9740986B2 (en) * 2008-09-30 2017-08-22 Excalibur Ip, Llc System and method for deducing user interaction patterns based on limited activities
US20100114887A1 (en) * 2008-10-17 2010-05-06 Google Inc. Textual Disambiguation Using Social Connections
US7949647B2 (en) 2008-11-26 2011-05-24 Yahoo! Inc. Navigation assistance for search engines
US8631007B1 (en) * 2008-12-09 2014-01-14 Google Inc. Disambiguating keywords and other query terms used to select sponsored content
US8452791B2 (en) 2009-01-16 2013-05-28 Google Inc. Adding new instances to a structured presentation
US8615707B2 (en) * 2009-01-16 2013-12-24 Google Inc. Adding new attributes to a structured presentation
US8412749B2 (en) 2009-01-16 2013-04-02 Google Inc. Populating a structured presentation with new values
US20100185651A1 (en) * 2009-01-16 2010-07-22 Google Inc. Retrieving and displaying information from an unstructured electronic document collection
US8977645B2 (en) * 2009-01-16 2015-03-10 Google Inc. Accessing a search interface in a structured presentation
US20100191758A1 (en) * 2009-01-26 2010-07-29 Yahoo! Inc. System and method for improved search relevance using proximity boosting
US8700630B2 (en) * 2009-02-24 2014-04-15 Yahoo! Inc. Algorithmically generated topic pages with interactive advertisements
US8190601B2 (en) * 2009-05-22 2012-05-29 Microsoft Corporation Identifying task groups for organizing search results
US20100306235A1 (en) * 2009-05-28 2010-12-02 Yahoo! Inc. Real-Time Detection of Emerging Web Search Queries
US20110106819A1 (en) * 2009-10-29 2011-05-05 Google Inc. Identifying a group of related instances
US8768938B2 (en) * 2009-06-25 2014-07-01 Hewlett-Packard Development Company, L.P. Histogram processing by trend and pattern removal
US20110010378A1 (en) * 2009-07-07 2011-01-13 John Dukes Trend charting system and method
US11113299B2 (en) 2009-12-01 2021-09-07 Apple Inc. System and method for metadata transfer among search entities
US20130304818A1 (en) * 2009-12-01 2013-11-14 Topsy Labs, Inc. Systems and methods for discovery of related terms for social media content collection over social networks
US8515975B1 (en) * 2009-12-07 2013-08-20 Google Inc. Search entity transition matrix and applications of the transition matrix
US8849785B1 (en) 2010-01-15 2014-09-30 Google Inc. Search query reformulation using result term occurrence count
WO2011090036A1 (ja) * 2010-01-19 2011-07-28 日本電気株式会社 動向情報検索装置、動向情報検索方法および記録媒体
US8983989B2 (en) * 2010-02-05 2015-03-17 Microsoft Technology Licensing, Llc Contextual queries
US8150859B2 (en) * 2010-02-05 2012-04-03 Microsoft Corporation Semantic table of contents for search results
US8903794B2 (en) * 2010-02-05 2014-12-02 Microsoft Corporation Generating and presenting lateral concepts
US8260664B2 (en) * 2010-02-05 2012-09-04 Microsoft Corporation Semantic advertising selection from lateral concepts and topics
US20110231395A1 (en) * 2010-03-19 2011-09-22 Microsoft Corporation Presenting answers
US20110258017A1 (en) * 2010-04-15 2011-10-20 Ffwd Corporation Interpretation of a trending term to develop a media content channel
US8380723B2 (en) * 2010-05-21 2013-02-19 Microsoft Corporation Query intent in information retrieval
US8560562B2 (en) 2010-07-22 2013-10-15 Google Inc. Predictive query suggestion caching
US11386510B2 (en) 2010-08-05 2022-07-12 Thomson Reuters Enterprise Centre Gmbh Method and system for integrating web-based systems with local document processing applications
US8731939B1 (en) 2010-08-06 2014-05-20 Google Inc. Routing queries based on carrier phrase registration
JP5542017B2 (ja) * 2010-09-15 2014-07-09 アルパイン株式会社 名称検索装置
US20120095997A1 (en) * 2010-10-18 2012-04-19 Microsoft Corporation Providing contextual hints associated with a user session
US20120265784A1 (en) 2011-04-15 2012-10-18 Microsoft Corporation Ordering semantic query formulation suggestions
US20120271844A1 (en) * 2011-04-20 2012-10-25 Microsoft Corporation Providng relevant information for a term in a user message
US20120290612A1 (en) * 2011-05-10 2012-11-15 Ritoe Rajan V N-dimensional data searching and display
US10776431B2 (en) * 2011-10-26 2020-09-15 Oath Inc. System and method for recommending content based on search history and trending topics
US9069880B2 (en) * 2012-03-16 2015-06-30 Microsoft Technology Licensing, Llc Prediction and isolation of patterns across datasets
US9916396B2 (en) 2012-05-11 2018-03-13 Google Llc Methods and systems for content-based search
US8620925B1 (en) 2012-05-17 2013-12-31 Google Inc. System and method for identifying advertising opportunities
US8954438B1 (en) 2012-05-31 2015-02-10 Google Inc. Structured metadata extraction
US10275525B2 (en) * 2012-06-14 2019-04-30 Excalibur Ip, Llc Method and system for mining trends around trending terms
US20130339136A1 (en) * 2012-06-18 2013-12-19 Ebay Inc. Detection of events from bursts of activity indicators
US9471606B1 (en) 2012-06-25 2016-10-18 Google Inc. Obtaining information to provide to users
CN103516583B (zh) * 2012-06-28 2017-09-29 北京奇虎科技有限公司 一种用于即时通讯中进行消息交互的方法及装置
US9536528B2 (en) 2012-07-03 2017-01-03 Google Inc. Determining hotword suitability
US9424233B2 (en) 2012-07-20 2016-08-23 Veveo, Inc. Method of and system for inferring user intent in search input in a conversational interaction system
US9110852B1 (en) 2012-07-20 2015-08-18 Google Inc. Methods and systems for extracting information from text
US9465833B2 (en) 2012-07-31 2016-10-11 Veveo, Inc. Disambiguating user intent in conversational interaction system for large corpus information retrieval
US9390174B2 (en) 2012-08-08 2016-07-12 Google Inc. Search result ranking and presentation
US9529867B1 (en) * 2012-10-11 2016-12-27 Google Inc. System and method for providing a dynamic dashboard
US9256682B1 (en) 2012-12-05 2016-02-09 Google Inc. Providing search results based on sorted properties
US11741090B1 (en) 2013-02-26 2023-08-29 Richard Paiz Site rank codex search patterns
US11809506B1 (en) 2013-02-26 2023-11-07 Richard Paiz Multivariant analyzing replicating intelligent ambience evolving system
US9218819B1 (en) 2013-03-01 2015-12-22 Google Inc. Customizing actions based on contextual data and voice-based inputs
US20140250116A1 (en) * 2013-03-01 2014-09-04 Yahoo! Inc. Identifying time sensitive ambiguous queries
US9342503B1 (en) * 2013-03-12 2016-05-17 Amazon Technologies, Inc. Correlation across languages
US10055462B2 (en) 2013-03-15 2018-08-21 Google Llc Providing search results using augmented search queries
US10108700B2 (en) 2013-03-15 2018-10-23 Google Llc Question answering to populate knowledge base
US9477759B2 (en) 2013-03-15 2016-10-25 Google Inc. Question answering using entity references in unstructured data
US8965915B2 (en) 2013-03-17 2015-02-24 Alation, Inc. Assisted query formation, validation, and result previewing in a database having a complex schema
US10121493B2 (en) 2013-05-07 2018-11-06 Veveo, Inc. Method of and system for real time feedback in an incremental speech input interface
WO2014183035A1 (en) 2013-05-10 2014-11-13 Veveo, Inc. Method and system for capturing and exploiting user intent in a conversational interaction based information retrieval system
US9311406B2 (en) 2013-06-05 2016-04-12 Microsoft Technology Licensing, Llc Discovering trending content of a domain
KR102016545B1 (ko) 2013-10-25 2019-10-21 한화테크윈 주식회사 검색 시스템 및 그의 동작 방법
US9336300B2 (en) 2014-01-17 2016-05-10 Facebook, Inc. Client-side search templates for online social networks
US9785661B2 (en) 2014-02-07 2017-10-10 Microsoft Technology Licensing, Llc Trend response management
MY184201A (en) 2014-05-19 2021-03-25 Mimos Berhad A system and method for analyzing concept evolution using network analysis
US9465831B2 (en) * 2014-07-18 2016-10-11 Wipro Limited System and method for optimizing storage of multi-dimensional data in data storage
JP6162664B2 (ja) * 2014-08-13 2017-07-12 ヤフー株式会社 抽出装置、検索サーバ、情報処理装置、抽出システム、抽出方法及び抽出プログラム
US10210214B2 (en) 2014-08-27 2019-02-19 International Business Machines Corporation Scalable trend detection in a personalized search context
US20160103861A1 (en) * 2014-10-10 2016-04-14 OnPage.org GmbH Method and system for establishing a performance index of websites
US9852136B2 (en) 2014-12-23 2017-12-26 Rovi Guides, Inc. Systems and methods for determining whether a negation statement applies to a current or past query
US9854049B2 (en) 2015-01-30 2017-12-26 Rovi Guides, Inc. Systems and methods for resolving ambiguous terms in social chatter based on a user profile
US9629033B2 (en) * 2015-06-16 2017-04-18 Cisco Technology, Inc. System and method to facilitate service hand-outs using user equipment groups in a network environment
US10528632B2 (en) 2016-07-19 2020-01-07 Microsoft Technology Licensing, Llc Systems and methods for responding to an online user query
US11416535B2 (en) 2018-04-20 2022-08-16 Microsoft Technology Licensing, Llc User interface for visualizing search data
CN110033156B (zh) * 2018-12-14 2023-05-09 创新先进技术有限公司 一种业务活动效果的确定方法及装置
US11256992B2 (en) 2019-06-25 2022-02-22 Google Llc Developing event-specific provisional knowledge graphs
WO2020263226A1 (en) 2019-06-25 2020-12-30 Google Llc Using live data streams and/or search queries to determine information about developing events
US20210065019A1 (en) * 2019-08-28 2021-03-04 International Business Machines Corporation Using a dialog system for learning and inferring judgment reasoning knowledge
CN111159248B (zh) * 2019-12-12 2023-04-28 北京字节跳动网络技术有限公司 信息检索方法、装置和电子设备
US20230230109A1 (en) * 2022-01-19 2023-07-20 Martin A. Alpert Trend prediction

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6363373B1 (en) * 1998-10-01 2002-03-26 Microsoft Corporation Method and apparatus for concept searching using a Boolean or keyword search engine
US20030014399A1 (en) * 2001-03-12 2003-01-16 Hansen Mark H. Method for organizing records of database search activity by topical relevance

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5619709A (en) * 1993-09-20 1997-04-08 Hnc, Inc. System and method of context vector generation and retrieval
AU6849196A (en) * 1995-08-16 1997-03-19 Syracuse University Multilingual document retrieval system and method using semantic vector matching
US6076088A (en) * 1996-02-09 2000-06-13 Paik; Woojin Information extraction system and method using concept relation concept (CRC) triples
US6460034B1 (en) 1997-05-21 2002-10-01 Oracle Corporation Document knowledge base research and retrieval system
US6006321A (en) 1997-06-13 1999-12-21 Malleable Technologies, Inc. Programmable logic datapath that may be used in a field programmable device
AU3292699A (en) * 1998-02-13 1999-08-30 Yahoo! Inc. Search engine using sales and revenue to weight search results
WO2000005664A1 (en) * 1998-07-24 2000-02-03 Jarg Corporation Search system and method based on multiple ontologies
WO2000011576A1 (en) * 1998-08-24 2000-03-02 Virtual Research Associates, Inc. Natural language sentence parser
US6317722B1 (en) * 1998-09-18 2001-11-13 Amazon.Com, Inc. Use of electronic shopping carts to generate personal recommendations
US6189002B1 (en) * 1998-12-14 2001-02-13 Dolphin Search Process and system for retrieval of documents using context-relevant semantic profiles
US6327590B1 (en) * 1999-05-05 2001-12-04 Xerox Corporation System and method for collaborative ranking of search results employing user and group profiles derived from document collection content analysis
US6772150B1 (en) * 1999-12-10 2004-08-03 Amazon.Com, Inc. Search query refinement using related search phrases
US6675159B1 (en) * 2000-07-27 2004-01-06 Science Applic Int Corp Concept-based search and retrieval system
AU2001288469A1 (en) * 2000-08-28 2002-03-13 Emotion, Inc. Method and apparatus for digital media management, retrieval, and collaboration
US20020087346A1 (en) * 2000-11-28 2002-07-04 Harkey Scott T. Utilization of competencies as drivers in a learning network
US6766316B2 (en) * 2001-01-18 2004-07-20 Science Applications International Corporation Method and system of ranking and clustering for document indexing and retrieval
US6584470B2 (en) * 2001-03-01 2003-06-24 Intelliseek, Inc. Multi-layered semiotic mechanism for answering natural language questions using document retrieval combined with information extraction
US7403938B2 (en) * 2001-09-24 2008-07-22 Iac Search & Media, Inc. Natural language query processing
US7406459B2 (en) * 2003-05-01 2008-07-29 Microsoft Corporation Concept network
US20040260677A1 (en) 2003-06-17 2004-12-23 Radhika Malpani Search query categorization for business listings search

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6363373B1 (en) * 1998-10-01 2002-03-26 Microsoft Corporation Method and apparatus for concept searching using a Boolean or keyword search engine
US20030014399A1 (en) * 2001-03-12 2003-01-16 Hansen Mark H. Method for organizing records of database search activity by topical relevance

Also Published As

Publication number Publication date
US20050102259A1 (en) 2005-05-12
EP1690169A2 (en) 2006-08-16
US20070226198A1 (en) 2007-09-27
JP2007511016A (ja) 2007-04-26
WO2005050367A3 (en) 2006-08-24
WO2005050367A2 (en) 2005-06-02
KR101031449B1 (ko) 2011-04-26
US7562076B2 (en) 2009-07-14
CN100401292C (zh) 2008-07-09
EP1690169A4 (en) 2008-12-17
CN1930566A (zh) 2007-03-14
US7240049B2 (en) 2007-07-03
KR20070007031A (ko) 2007-01-12

Similar Documents

Publication Publication Date Title
JP4722051B2 (ja) 傾向分析を用いる検索クエリ処理のためのシステムおよび方法
US9971842B2 (en) Computerized systems and methods for generating a dynamic web page based on retrieved content
JP4994243B2 (ja) クエリの自動的カテゴリ化による検索処理
US8032508B2 (en) System and method for URL based query for retrieving data related to a context
US9805123B2 (en) System and method for data privacy in URL based context queries
US8060492B2 (en) System and method for generation of URL based context queries
JP5461360B2 (ja) スーパーユニットを用いた検索処理のためのシステム及び方法
TWI493367B (zh) 搜尋結果之先進過濾方法
US20180063266A1 (en) Method for click-stream analysis using web directory reverse categorization
US7340460B1 (en) Vector analysis of histograms for units of a concept network in search query processing
US20100125569A1 (en) System and method for autohyperlinking and navigation in url based context queries
US20060167896A1 (en) Systems and methods for managing and using multiple concept networks for assisted search processing
CN112868003A (zh) 使用用户互动度的基于实体的搜索系统
Madadipouya A location-based movie recommender system using collaborative filtering
KR20240015280A (ko) 트렌드 분석을 이용한 검색 쿼리 처리 시스템 및 방법
Waller How do virtual visitors get to the library?
Saxena Improving Web Recommendations Using Web Usage Mining and Web Semantics
JP2003076714A (ja) 情報価値を用いたデータ処理システム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070118

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070219

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071025

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20090916

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20090916

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20090929

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090929

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100705

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101005

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110307

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110405

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140415

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4722051

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350