JP5543020B2 - リサーチミッション識別 - Google Patents
リサーチミッション識別 Download PDFInfo
- Publication number
- JP5543020B2 JP5543020B2 JP2013513189A JP2013513189A JP5543020B2 JP 5543020 B2 JP5543020 B2 JP 5543020B2 JP 2013513189 A JP2013513189 A JP 2013513189A JP 2013513189 A JP2013513189 A JP 2013513189A JP 5543020 B2 JP5543020 B2 JP 5543020B2
- Authority
- JP
- Japan
- Prior art keywords
- research
- mission
- queries
- user
- topic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011160 research Methods 0.000 title claims description 229
- 238000010801 machine learning Methods 0.000 claims description 76
- 238000001514 detection method Methods 0.000 claims description 70
- 238000000034 method Methods 0.000 claims description 54
- 239000002131 composite material Substances 0.000 claims description 24
- 230000004044 response Effects 0.000 claims description 16
- 230000000699 topical effect Effects 0.000 claims description 3
- 239000000203 mixture Substances 0.000 claims 1
- 230000006870 function Effects 0.000 description 35
- 238000012549 training Methods 0.000 description 19
- 238000004891 communication Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 4
- 230000000644 propagated effect Effects 0.000 description 4
- 230000001960 triggered effect Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 102000003712 Complement factor B Human genes 0.000 description 2
- 108090000056 Complement factor B Proteins 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 239000013065 commercial product Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 235000014510 cooky Nutrition 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/16—Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- Computational Mathematics (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Computing Systems (AREA)
- Mathematical Analysis (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Algebra (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Testing Of Engines (AREA)
Description
本明細書は、本発明の特徴を組み込む1つ又はそれよりも多くの実施形態を開示している。開示する実施形態は、単に本発明を例示するものである。本発明の範囲は、開示する実施形態に制限されない。本発明は、本明細書に添付される特許請求の範囲によって定められる。
図3は、検索エンジン(検索エンジン106など)のユーザが本発明の実施形態による特定のトピックに関するリサーチミッションを実行していることを自動的に判断する方法の流れ図300を示している。流れ図300の方法をシステム100の要素に関して説明する。しかし、本方法は、この実施に制限されないことに注意されたい。また、流れ図300の方法は、他の実施形態を得るために当業者によって修正することができる。また、図示のものとは異なる順序で段階を実行することができ、一部の段階は、同時に実行することができ、一部の段階は、他の段階に結合することができ、及び/又は必要に応じて一部の段階を排除することができる。
リサーチミッション識別システム116について、図4に関して以下に詳しく説明する。リサーチミッション識別システム116は、検索エンジン106のような検索エンジンのユーザが特定のトピックに向けられたリサーチミッションを実行していることを自動的に検出する方法300を実行することができる。図4のブロック図は単に例示的であることに注意されたい。更に、図4の様々なブロック/ユニットは、図示のものとは異なる順序で存在することができ、又は必要に応じて存在しなくてもよい。また、様々な付加的なブロック/ユニットを必要に応じて含むことができる。
ここで図4の説明に戻って、リサーチ検出器406は、実行される実際の検索へのユーザの関わりのレベルを試験することによって2つの連続した問合せが複合リサーチの一部であるか否かを試験することができる。例えば、ユーザは、1つ又はそれよりも多くのリサーチセッション中に検索エンジン106のような検索エンジンを使用することができる。リサーチセッションは、様々な理由のために実行することができ、従って、様々な関連の及び関係のないトピックに対する検索問合せを含むことができる。リサーチ検出器406は、1対の問合せに対して特徴の第1の部分集合を調べ、ユーザの関わりに基づいて(機械学習規則を特徴の第1の部分集合に適用することによって判断されるように)、問合せの対が複合リサーチの一部であるか否かを判断するために機械学習規則を適用することができる。リサーチ検出器406に対する機械学習規則は、実際の検索へのユーザの関わりのレベルのレベルを示すセッションに基づく特徴のような特徴を調べることができる。例えば、リサーチ検出器406に対する機械学習規則は、受信した特徴が、ユーザクリックの大きな数、検索セッションの開始からの多数の問合せ、及び/又は実際の問合せの長さが長い(例えば、長い問合せは複雑な問合せを示すことができる)を示す場合、複合リサーチを検出することができる。リサーチ検出器406は、主に、ユーザの関わりのレベル、例えば、検索処理中にユーザによって行われた努力を試験する。
ミッション検出器408は、2つの連続した問合せ(すなわち、1対の問合せ)が、実行される検索における連続した問合せ間のトピックの一貫性を試験することによって同じミッションの一部であるか否かを試験することができる。例えば、リサーチセッションは、様々な理由のために実行することができ、従って、様々な関連の及び関係のないトピックに対する検索問合せを含むことができる。ミッション検出器408は、問合せの対に対する特徴の第1の部分集合を調べることができ、トピックの一貫性に基づいて(特徴の第2の部分集合に学習規則を適用することによって判断されたように)ユーザが特定の情報の必要性に関連したミッションを実行していることを問合せの対が示すか否かを判断するために、機械学習規則を適用することができる。ミッション検出器408に対する機械学習規則は、問合せの対における第1及び第2の問合せ間のテキストの類似性を示すテキストに基づく特徴、並びに第1及び第2の問合せが時間においてどのくらい近いかを示すことができる時間関連の特徴のような特徴を調べることができる。例えば、ミッション検出器408に対する機械学習規則は、問合せq1 502及びq2 504間のテキストの類似性がある場合にユーザが特定の情報の必要性に関連するミッションを実行していることを検出することができる。一実施形態では、ミッション検出器408はまた、2つの問合せq1 502及びq2 504が近い時間に行われたか否かを調べるために時間関連の特徴を使用することができる。
任意的な方法段階308に関して上述したように、トピック分類器410はまた、セッションユニット402から一連の問合せ/検索結果/文書を受信することができ、一連の問合せ500における第1及び第2の連続した問合せ(例えば、それぞれ第1の問合せ502及び第2の問合せ504)に対する第1及び第2のトピックを判断することができる。次に、トピック分類器410は、第1及び第2のトピックの間に類似性があるか否かを判断することができ、それによって第1の問合せ502と第2の問合せ504間にトピックの類似性があるか否かを判断する。
次に、混合器412は、一連の問合せ500に対するリサーチ検出器406、ミッション検出器408、及び(任意的な)トピック分類器410の各々からの結果を受信することができる。混合器412はまた、特徴ユニット404からの特徴、並びに各検出器406及び408から(並びに任意的なトピック分類器410から)の結果に関連付けられた信頼性レベルを受信することができる。混合器412は、ユーザが、少なくとも複合リサーチ検出及びミッション検出に基づいてかつ任意的にトピック分類器検出に基づいて、リサーチミッションを実行しているか否かを機械学習規則の別の組を使用して判断することができる(310)。一実施形態では、混合器412は、2つの連続した問合せの対を使用して判断310を実行することができる。他の実施形態では、混合器412は、判断310を実行する時に、3つ、4つ、又はそれよりも多くの問合せの連続した対を使用することができる。代替的に、混合器412は、判断310を実行する時に連続していない問合せの対を使用することができる。
一連の問合せ500を分析して特徴付けるために適用される複数の特徴機能を使用する特徴ユニット404によって複数の特徴を生成することができる。例えば、問合せ対(第1の問合せ502及び第2の問合せ504など)に基づいて一連の問合せ500を分析するために特徴機能を適用することができる。特徴ユニット404は、各問合せ対に対する複数の特徴を生成することができる。各検出器406及び408は、そのそれぞれの検出に対して必要に応じて複数の特徴の異なる部分集合を使用することができる。
一実施形態では、テキストの特徴に向けられた特徴機能(テキスト特徴機能)が、2つ又はそれよりも多くの連続した問合せ間のテキストの類似性を計算するために適用される。例えば、第1の問合せq1 502及び第2の問合せq2 504に対してテキストの特徴を計算することができる。テキストの特徴は、とりわけ、2つの連続した問合せq1及びq2の各々における問合せ用語の長さ及び/又は数、2つの連続した問合せq1及びq2間のコサイン類似性、2つの連続した問合せq1及びq2に対するジャカール係数、2つの連続した問合せq1及びq2に対する文字の共通部分のサイズ、及び/又は2つの連続した問合せq1及びq2間のレベンシュタイン編集距離を含むことができる。一連の問合せにおける問合せ用語間のテキストの類似性の尺度は、同じく2つの問合せ502及び504に対する様々なワード又はワードのストリング間のテキストの類似性を測定するための当業技術で公知の様々な技術のいずれかを含むことができる。例えば、このような技術は、様々なワード又はワードのストリング内の共通の用語又は元になる概念を識別する段階を含むことができる。
一実施形態では、第1の問合せ502及び第2の問合せ504のような2つ又はそれよりも多くの連続した問合せに対するセッション特性を計算するために、セッション特徴に向けられた特徴機能(セッション特徴機能)が適用される。例えば、セッション特徴は、とりわけ、現在の検索セッションにおけるユーザクリック及び/又は問合せの数、及び/又は最後のユーザクリックからのユーザクリック及び/又は問合せの数を含むことができる。他のセッション特徴は、情報検索セッション中にアクセスされた文書の数を含むことができる。文書は、例えば、ユーザが検索エンジン106によって提供された検索結果ページにおける文書へのリンクを作動させた時にアクセスすることができる。アクセスされた文書の数は、単独で、文書が識別された特定の問合せに関して、又はユーザによって提出された問合せの総数に関して分析することができる。
一実施形態では、時間関連の特徴に向けられた特徴機能(時間関連の特徴機能)は、第1の問合せ502及び第2の問合せ504のような2つ又はそれよりも多くの連続した問合せに対する時間特性を計算するように構成される。例えば、時間関連の特徴は、とりわけ、ユーザが掲載した第1の問合せ502及び第2の問合せ504の間に経過した時間、2つの問合せ間に経過した時間の逆数、及び2つの問合せ502及び504を含むセッション(すなわち、情報検索セッション)に対する総セッション時間を含む。
一実施形態では、特徴機能は、2つの連続した問合せ502及び504の各々の受信に応答して検索エンジン106によって識別された文書間の類似性を測定することができる。これらの文書関連の特徴はまた、ユーザ側のリサーチミッション意図を見分けるために使用することができる。文書の比較は、2つの連続した問合せ502及び504に応答して検索エンジン106によって識別された文書の部分集合のみを比較する段階を含むことができる。例えば、2つの連続した問合せ502及び504の各々に最も関連があるとして識別された事前に定義された数の文書だけを比較することができる。代替的に、2つの連続した問合せ502及び504を含む情報検索セッション中にユーザによってアクセスされる文書だけを比較に使用することができる。
一実施形態では、システム管理者は、混合器412及び/又は混合器判断ユニット418などを調節することにより、リサーチミッション識別システム116のトリガ感度を調節することができる。例えば、混合器412のトリガ閾値は、例えば、イベントが直ちにトリガされるか又は直ちにはトリガされないか否かの現実世界のトリガデータに応答して高く又は低く設定することができる。現実世界トリガデータは、使用可能性スタディ、市場スタディ、ユーザの特定の必要性、並びに地理的考慮事項から収集することができる。例えば、トリガ閾値Tは、精度又はリコールに照らして修正することができる。高い精度は、リサーチミッションを実行するユーザの高い確率を示すが、高いリコールは、トリガの高い確率を示す。一部の地理的領域は、リサーチミッションが起こっているという信頼の高レベルを有するまでイベントがトリガされず、又は換言すると、偽陽性の小さな確率が存在することを意味する精度を支持することができる。反対に、他の地理的範囲は、リサーチミッション識別システム116がリサーチミッションが起こっているという信頼を抑制している場合でもイベントがトリガされ、又は換言すると、偽陽性の高い確率が存在することを意味するリコールを支持することができる。
図7に示すように、一実施形態では、リサーチミッション識別システム116は、セッションユニット702、特徴ユニット704、検出器706、及び機械学習システム708を含むことができる。セッションユニット702は、図4のセッションユニット402と実質的に類似とすることができ、類似の機能を有することができる。特徴ユニット704はまた、図4の特徴ユニット404に実質的に類似とすることができ、類似の機能を有することができる。検出器706は、リサーチ検出器406、ミッション検出器408、及び任意的にトピック分類器410の機能を実行するように構成することができる。例えば、検出器706は、特徴ユニット704から複数の特徴を受信し、関連付けられた信頼性レベルを備えた2つ又はそれよりも多くの個別の結果を作成するために機械学習規則(又は1組のハードコード規則)を適用するように構成することができる。従って、検出器706は、ユーザが複合リサーチを行っているか否かを検出し、ユーザが特定の情報の必要性に関連するミッションを実行しているか否かを判断し、かつ任意的に、生成された特徴に基づいて一連の問合せにおける2つ又はそれよりも多くの連続した問合せ間にトピックの類似性があるか否かを検出する。
一実施形態では、リサーチミッション識別システム116は、モジュラーシステムとすることができる。モジュラー性により、リサーチミッション識別システム116の様々な部分をリサーチミッション識別システム116の他の部分に影響を与える必要なく追加、削除、及び/又は修正することができる。ある一定の状況では、混合器412及び/又は1つ又はそれよりも多くの検出器406及び408の機械学習規則は、再訓練する必要がある場合がある。
一実施形態では、リサーチミッションの一部であると識別された問合せに対する検索結果を改善するために、リサーチミッション識別システム116を使用することができる。例えば、一連の問合せにおける3つの連続した問合せがリサーチミッションの一部であると識別される(すなわち、識別するのに使用される)場合、リサーチミッション識別システム116は、一連の問合せにおける第4の問合せを推測することができる。ユーザが第4の問合せを実際に出すことができる前に、結果を見出し検索エンジン106のユーザに提案するために、専用検索アプリケーション(及び/又は検索エンジン106のいずれかの構成要素)のようなアプリケーション118によって第4の問合せを使用することができる。換言すると、出される前にユーザの次の問合せを推測して使用するようにリサーチミッション識別システム116を構成することができる。一実施形態では、混合器412は、一連の問合せにおける次の問合せを推測するために機械学習規則を使用することができるが、リサーチミッション識別システム116の他の構成要素を代わりに使用することもできる。
システム、方法/処理、及び/又は装置を含む本明細書に説明する実施形態は、図8に示されているコンピュータ800のような公知のサーバ/コンピュータを使用して実施することができる。例えば、図1の検索エンジン106及びリサーチミッション識別システム116、図3に示されている流れ図で説明した方法、及び図4及び/又は7のリサーチミッション識別システム116は、1つ又はそれよりも多くのコンピュータ800を使用して実施することができる。
本発明の様々な実施形態を上述したが、これらは単に例示的に示されており制限ではないことを理解すべきである。形式及び詳細における様々な変更を特許請求の範囲に定められる本発明の精神及び範囲から逸脱することなく上述の実施形態に行うことができることは、当業者には明らかであろう。従って、本発明の広さ及び範囲は、上述の例示的な実施形態のいずれによっても制限すべきではなく、以下の特許請求の範囲及びその均等物に従ってのみ定められるべきである。
302 一連の問合せに対する特徴を生成する段階
304 複合リサーチを行っているか否かを検出する段階
306 ミッションを実行しているか否かを検出する段階
308 連続した問合せ間のトピックの類似性を判断する段階
Claims (20)
- 検索エンジンのユーザがリサーチミッションを実行しているかを判断するコンピュータ実施式方法であって、
検索エンジンにユーザによって提出された一連の問合せに関連する複数の特徴を生成する段階と、
前記複数の特徴の第1の部分集合に基づいて、前記ユーザが第1の機械学習検出器を使用して複合リサーチを行っているかを検出する段階と、
前記複数の特徴の第2の部分集合に基づいて、前記ユーザが第2の機械学習検出器を使用して特定の情報の必要性に関連するミッションを実行しているかを検出する段階と、
前記ユーザが少なくとも前記複合リサーチ検出及び前記ミッション検出に基づいてリサーチミッションを実行しているかを判断する段階であって、前記複合リサーチ検出及び前記ミッション検出は、問合わせの2つの連続した対に少なくとも部分的に基づくものであり、前記2つの連続した対の第1の対の第2の問合せと前記2つの連続した対の第2の対の第1の問合せとが同じである段階と、 を含むことを特徴とする方法。 - 前記一連の問合せにおける第1の問合せの第1のトピックを判断する段階と、
前記一連の問合せにおける第2の問合せの第2のトピックを判断する段階と、
少なくとも前記第1のトピック及び前記第2のトピック間にトピック類似性があるかを検出する段階と、
を更に含み、
前記ユーザがリサーチミッションを実行しているかを判断する前記段階は、前記トピック類似性の検出に更に基づく、
ことを特徴とする請求項1に記載の方法。 - 前記第1の問合せの前記第1のトピックを判断する段階が、トピックカテゴリの階層的に編成された分類からの第1のトピックカテゴリを該第1の問合せに割り当てる段階を含み、
前記第2の問合せの前記第2のトピックを判断する段階が、前記トピックカテゴリの階層的に編成された分類からの第2のトピックカテゴリを該第2の問合せに割り当てる段階を含み、
少なくとも前記第1のトピックと前記第2のトピック間にトピック類似性があるかを検出する前記段階は、前記トピックカテゴリの階層的に編成された分類における前記第1のトピックカテゴリと前記第2のトピックカテゴリ間の距離を判断する段階を含む、
ことを特徴とする請求項2に記載の方法。 - 前記ユーザが少なくとも前記複合リサーチ検出及び前記ミッション検出に基づいてリサーチミッションを実行しているかを判断する前記段階は、
前記ユーザが少なくとも前記複合リサーチ検出及び前記ミッション検出に基づいてリサーチミッションを実行している確率を計算する段階と、
前記確率が事前定義の閾値を超えるかを判断する段階と、
を含む、
ことを特徴とする請求項1に記載の方法。 - 前記一連の問合せにおける該問合せの少なくとも1つのトピックを判断する段階と、
前記トピックが所定の一般的なリサーチトピックを含む場合、該所定の一般的なリサーチトピックに関連付けられたブースト係数だけ前記事前定義の閾値を下げる段階と、
を更に含むことを特徴とする請求項4に記載の方法。 - 前記一連の問合せにおける該問合せの少なくとも1つのトピックを判断する段階と、
前記トピックがブラックリストリサーチトピックを含む場合、前記ユーザがリサーチミッションを実行していないと判断する段階と、
を更に含むことを特徴とする請求項4に記載の方法。 - 前記ユーザが第1の機械学習検出器を使用して複合リサーチを行っているかを検出する前記段階は、
前記第1の機械学習検出器が、前記一連の問合せの2つ又はそれよりも多くの連続した問合せに対する前記複数の特徴の前記第1の部分集合を受信する段階と、
前記第1の機械学習検出器が、前記複数の特徴の前記第1の部分集合に1つ又はそれよりも多くの機械学習規則を適用し、検索へのユーザの関わりのレベルを示す複合リサーチ検出結果と関連の信頼性レベルとを生成する段階と、
含み、
前記複数の特徴の前記第1の部分集合は、セッション特徴及び時間関連の特徴を含む、 ことを特徴とする請求項1に記載の方法。 - 前記セッション特徴は、様々なクリック可能イベントを前記2つ又はそれよりも多くの連続した問合せが行われたセッションに関連するとして示し、
前記時間関連の特徴は、前記様々なクリック可能イベント及び前記セッションに対する様々な時間特性を示す、
ことを特徴とする請求項7に記載の方法。 - 前記ユーザが第2の機械学習検出器を使用して特定の情報の必要性に関連するミッションを行っているかを検出する前記段階は、
前記第2の機械学習検出器が、前記一連の問合せの2つ又はそれよりも多くの連続した問合せに対する前記複数の特徴の前記第2の部分集合を受信する段階と、
前記第2の機械学習検出器が、前記複数の特徴の前記第2の部分集合に1つ又はそれよりも多くの機械学習規則を適用し、前記2つ又はそれよりも多くの連続した問合せ間のトピックの一貫性を示すミッション検出結果と関連の信頼性レベルとを生成する段階と、
を含み、
前記複数の特徴の前記第2の部分集合は、前記2つ又はそれよりも多くの連続した問合せ間のテキストの類似性を示すテキストの特徴を有する、
ことを特徴とする請求項1に記載の方法。 - 前記判断する段階に基づいて、
1つ又はそれよりも多くのリサーチツール、
1つ又はそれよりも多くの専用検索、
1つ又はそれよりも多くのターゲット広告、及び
1つ又はそれよりも多くの市場イベント、
のうちの1つ又はそれよりも多くをトリガする段階、
を更に含むことを特徴とする請求項1に記載の方法。 - 前記ユーザがリサーチセッションを実行しているかの以前の判断、
前記複合リサーチ検出、
前記ミッション検出、及び
前記ユーザによって提出された前記一連の問合せの少なくとも一部分、
のうちの1つ又はそれよりも多くの状態データを維持する段階、
を更に含み、
前記ユーザがリサーチミッションを実行しているかを判断する前記段階は、前記状態データに更に基づく、
ことを特徴とする請求項1に記載の方法。 - 前記複合リサーチ検出及び前記ミッション検出のうちの1つ又はそれよりも多くが、関連の信頼性レベルを有し、
前記ユーザがリサーチミッションを実行しているかを判断する前記段階は、前記複合リサーチ検出及び前記ミッション検出のうちの1つ又はそれよりも多くに対するそれぞれの関連の信頼性レベルを使用する、
ことを特徴とする請求項1に記載の方法。 - 前記ユーザが少なくとも前記複合リサーチ検出及び前記ミッション検出に基づいてリサーチミッションを実行しているかを判断する前記段階は、機械学習システムを使用する段階を含み、
前記機械学習システムは、前記複合リサーチ検出及び前記ミッション検出に1つ又はそれよりも多くの機械学習規則を適用し、リサーチミッション判断と関連のリサーチミッション判断信頼性とを生成する、
ことを更に含むことを特徴とする請求項1に記載の方法。 - リサーチミッションを検出するためのシステムであって、
ユーザによって提出された一連の問合せを受信し、かつ該一連の問合せにおける各問合せに応答して1つ又はそれよりも多くの文書を識別するように構成された検索エンジンと、
前記一連の問合せを受信し、かつ一連の構造化された問合せを生成するように構成されたセッションユニット、
前記一連の構造化された問合せの分析に基づいてそこから複数の特徴を生成するように構成された特徴ユニット、
前記ユーザが第1の機械学習規則を使用して前記複数の特徴の第1の部分集合に基づいて複合リサーチを行っているかを検出するように構成されたリサーチ検出器、
前記ユーザが第2の機械学習規則を使用して前記複数の特徴の第2の部分集合に基づいて特定の情報の必要性に関連するミッションを行っているかを検出するように構成されたミッション検出器、及び
前記ユーザが少なくとも前記複合リサーチ検出及び前記ミッション検出に基づいてリサーチミッションを実行しているかを判断するように構成され、前記複合リサーチ検出及び前記ミッション検出は、問合わせの2つの連続した対に少なくとも部分的に基づくものであり、前記2つの連続した対の第1の対の第2の問合せと前記2つの連続した対の第2の対の第1の問合せとが同じである混合器、
を含むリサーチミッション識別システムと、
を含むことを特徴とするシステム。 - 前記リサーチミッション識別システムは、
前記一連の構造化された問合せに基づいて前記一連の問合せにおける2つ又はそれよりも多くの連続した問合せ間にトピックの類似性があるかを検出するように構成されたトピック分類器、
を更に含み、
前記混合器は、前記ユーザが前記トピック類似性の検出に基づいてリサーチミッションを実行しているかを判断するように構成される、
ことを特徴とする請求項14に記載のシステム。 - 前記リサーチ検出器は、
前記一連の問合せのうちの2つ又はそれよりも多くの連続した問合せに対する前記複数の特徴の前記第1の部分集合を受信し、かつ
1つ又はそれよりも多くの機械学習規則を前記複数の特徴の前記第1の部分集合に適用し、検索へのユーザの関わりのレベルを示す複合リサーチ検出結果と関連の信頼性レベルとを生成する、
ように更に構成され、
前記複数の特徴の前記第1の部分集合は、セッション特徴及び時間関連の特徴を有する、
ことを特徴とする請求項14に記載のシステム。 - 前記ミッション検出器は、
前記一連の問合せのうちの2つ又はそれよりも多くの連続した問合せに対する前記複数の特徴の前記第2の部分集合を受信し、かつ
1つ又はそれよりも多くの機械学習規則を前記複数の特徴の前記第2の部分集合に適用し、前記2つ又はそれよりも多くの連続した問合せ間のトピックの一貫性を示すミッション検出結果と関連の信頼性レベルとを生成する、
ように更に構成され、
前記複数の特徴の前記第2の部分集合は、前記2つ又はそれよりも多くの連続した問合せ間のテキストの類似性を示すテキストの特徴を有する、
ことを特徴とする請求項14に記載のシステム。 - リサーチミッションを検出するためのシステムであって、
ユーザによって提出される一連の問合せを受信し、かつ該一連の問合せにおける各問合せに応答して1つ又はそれよりも多くの文書を識別するように構成された検索エンジンと、
前記一連の問合せに対して複数の特徴を生成するように構成された特徴ユニット、
検索へのユーザの関わりのレベルを測定することにより、該ユーザが前記複数の特徴に基づいて複合リサーチを行っているかを検出し、かつ
連続した問合せの間のトピックの一貫性を測定することにより、前記ユーザが前記複数の特徴に基づいて特定の情報の必要性に関連するミッションを行っているかを判断する、 ように構成された検出器、及び
前記ユーザが少なくとも前記複合リサーチ検出及び前記ミッション検出に基づいてリサーチミッションを実行しているかを判断するように構成され、前記複合リサーチ検出及び前記ミッション検出は、問合わせの2つの連続した対に少なくとも部分的に基づくものであり、前記2つの連続した対の第1の対の第2の問合せと前記2つの連続した対の第2の対の第1の問合せとが同じである機械学習システム、
を含むリサーチミッション識別システムと、
を含むことを特徴とするシステム。 - 前記検出器は、
前記一連の問合せにおける2つ又はそれよりも多くの連続した問合せ間にトピックの類似性があるかを検出する、
ように更に構成され、
前記機械学習システムは、前記トピック類似性の検出にも基づいて前記ユーザがリサーチミッションを実行しているかを前記判断するように構成される、
ことを特徴とする請求項18に記載のシステム。 - 前記判断に基づいて、1つ以上の専用検索、1つ以上のターゲット広告、1つ以上の市場イベント、の内の1つ以上をトリガする段階をさらに含む請求項1に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/790,895 US8768861B2 (en) | 2010-05-31 | 2010-05-31 | Research mission identification |
US12/790,895 | 2010-05-31 | ||
PCT/US2011/036065 WO2011152971A2 (en) | 2010-05-31 | 2011-05-11 | Research mission identification |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013528873A JP2013528873A (ja) | 2013-07-11 |
JP5543020B2 true JP5543020B2 (ja) | 2014-07-09 |
Family
ID=45022905
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013513189A Active JP5543020B2 (ja) | 2010-05-31 | 2011-05-11 | リサーチミッション識別 |
Country Status (6)
Country | Link |
---|---|
US (1) | US8768861B2 (ja) |
EP (1) | EP2577522A4 (ja) |
JP (1) | JP5543020B2 (ja) |
KR (1) | KR101452082B1 (ja) |
CN (1) | CN102934110A (ja) |
WO (1) | WO2011152971A2 (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8768861B2 (en) | 2010-05-31 | 2014-07-01 | Yahoo! Inc. | Research mission identification |
US9489457B2 (en) * | 2011-07-14 | 2016-11-08 | Nuance Communications, Inc. | Methods and apparatus for initiating an action |
US20150248454A1 (en) * | 2012-09-28 | 2015-09-03 | Nec Corporation | Query similarity-degree evaluation system, evaluation method, and program |
US9594837B2 (en) * | 2013-02-26 | 2017-03-14 | Microsoft Technology Licensing, Llc | Prediction and information retrieval for intrinsically diverse sessions |
US20160078087A1 (en) * | 2013-03-29 | 2016-03-17 | Hewlett-Packard Development Company, L.P. | Query features and questions |
CN105564670B (zh) * | 2015-11-24 | 2017-06-30 | 沈阳航空航天大学 | 一种空间站动力学与控制实验平台设计方法 |
US10146815B2 (en) | 2015-12-30 | 2018-12-04 | Oath Inc. | Query-goal-mission structures |
US10769547B2 (en) | 2015-12-30 | 2020-09-08 | Oath Inc. | Mobile searches utilizing a query-goal-mission structure |
US10430451B2 (en) * | 2016-02-22 | 2019-10-01 | Arie Rota | System and method for aggregating and sharing accumulated information |
JP6584613B1 (ja) * | 2018-09-19 | 2019-10-02 | ヤフー株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
JP6679683B2 (ja) * | 2018-09-20 | 2020-04-15 | ヤフー株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
JP7258988B2 (ja) * | 2019-02-08 | 2023-04-17 | ヤフー株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
JP6982017B2 (ja) * | 2019-02-08 | 2021-12-17 | ヤフー株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6269362B1 (en) * | 1997-12-19 | 2001-07-31 | Alta Vista Company | System and method for monitoring web pages by comparing generated abstracts |
JP4363868B2 (ja) * | 2002-08-23 | 2009-11-11 | 株式会社東芝 | 検索キーワード分析プログラム及びシステム並びに方法 |
US7231375B2 (en) | 2003-10-10 | 2007-06-12 | Microsoft Corporation | Computer aided query to task mapping |
US7480667B2 (en) | 2004-12-24 | 2009-01-20 | Microsoft Corporation | System and method for using anchor text as training data for classifier-based search systems |
US7565345B2 (en) * | 2005-03-29 | 2009-07-21 | Google Inc. | Integration of multiple query revision models |
JP2007156932A (ja) | 2005-12-06 | 2007-06-21 | Just Syst Corp | 学習方法、学習装置、および検索方法、検索装置 |
CN100462969C (zh) * | 2006-08-29 | 2009-02-18 | 深圳市我炫网络科技有限公司 | 利用互联网为公众提供和查询信息的方法 |
US7860886B2 (en) * | 2006-09-29 | 2010-12-28 | A9.Com, Inc. | Strategy for providing query results based on analysis of user intent |
US7603348B2 (en) | 2007-01-26 | 2009-10-13 | Yahoo! Inc. | System for classifying a search query |
JP2009169519A (ja) * | 2008-01-11 | 2009-07-30 | Nec Corp | 情報提示装置、情報提示方法、および情報提示用プログラム |
US8768861B2 (en) | 2010-05-31 | 2014-07-01 | Yahoo! Inc. | Research mission identification |
-
2010
- 2010-05-31 US US12/790,895 patent/US8768861B2/en not_active Expired - Fee Related
-
2011
- 2011-05-11 CN CN2011800257617A patent/CN102934110A/zh active Pending
- 2011-05-11 EP EP11790166.0A patent/EP2577522A4/en not_active Withdrawn
- 2011-05-11 KR KR1020127033741A patent/KR101452082B1/ko active IP Right Grant
- 2011-05-11 JP JP2013513189A patent/JP5543020B2/ja active Active
- 2011-05-11 WO PCT/US2011/036065 patent/WO2011152971A2/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2011152971A3 (en) | 2012-04-12 |
US20110295776A1 (en) | 2011-12-01 |
WO2011152971A2 (en) | 2011-12-08 |
JP2013528873A (ja) | 2013-07-11 |
CN102934110A (zh) | 2013-02-13 |
US8768861B2 (en) | 2014-07-01 |
EP2577522A4 (en) | 2015-06-17 |
EP2577522A2 (en) | 2013-04-10 |
KR20130029787A (ko) | 2013-03-25 |
KR101452082B1 (ko) | 2014-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5543020B2 (ja) | リサーチミッション識別 | |
US10102254B2 (en) | Confidence ranking of answers based on temporal semantics | |
US7590619B2 (en) | Search system using user behavior data | |
Clough et al. | Evaluating the performance of information retrieval systems using test collections | |
TWI471737B (zh) | 具搜尋結果之蹤跡識別系統與方法 | |
US7877389B2 (en) | Segmentation of search topics in query logs | |
CN103064956B (zh) | 用于搜索电子内容的方法、计算系统和计算机可读介质 | |
US7580926B2 (en) | Method and apparatus for representing text using search engine, document collection, and hierarchal taxonomy | |
Calegari et al. | Personal ontologies: Generation of user profiles based on the YAGO ontology | |
US7702671B2 (en) | Systems and methods for discovery of data that needs improving or authored using user search results diagnostics | |
US20080313115A1 (en) | Behavioral Profiling Using a Behavioral WEB Graph and Use of the Behavioral WEB Graph in Prediction | |
US20050125390A1 (en) | Automated satisfaction measurement for web search | |
US9760828B2 (en) | Utilizing temporal indicators to weight semantic values | |
US20090299964A1 (en) | Presenting search queries related to navigational search queries | |
Ali et al. | An overview of Web search evaluation methods | |
US20100185623A1 (en) | Topical ranking in information retrieval | |
Huang et al. | Kb-enabled query recommendation for long-tail queries | |
Jansen et al. | The effect of specialized multimedia collections on web searching | |
Berendt | Web usage mining, site semantics, and the support of navigation | |
Lindemann et al. | Classification of web sites at super-genre level | |
Serdyukov et al. | Being omnipresent to be almighty: The importance of the global web evidence for organizational expert finding | |
CN111222918A (zh) | 关键词挖掘方法、装置、电子设备及存储介质 | |
Hoeber et al. | Automatic topic learning for personalized re-ordering of web search results | |
Jolhe et al. | An ontology based personalised mobile search engine | |
Gill et al. | Natural Language Processing with Semantic Measurement |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131126 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131202 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140303 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140407 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140507 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5543020 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |