JP2008541228A5 - - Google Patents

Download PDF

Info

Publication number
JP2008541228A5
JP2008541228A5 JP2008510024A JP2008510024A JP2008541228A5 JP 2008541228 A5 JP2008541228 A5 JP 2008541228A5 JP 2008510024 A JP2008510024 A JP 2008510024A JP 2008510024 A JP2008510024 A JP 2008510024A JP 2008541228 A5 JP2008541228 A5 JP 2008541228A5
Authority
JP
Japan
Prior art keywords
search engine
query
queries
engine queries
bit string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008510024A
Other languages
English (en)
Other versions
JP2008541228A (ja
Filing date
Publication date
Priority claimed from US11/119,667 external-priority patent/US7577646B2/en
Application filed filed Critical
Publication of JP2008541228A publication Critical patent/JP2008541228A/ja
Publication of JP2008541228A5 publication Critical patent/JP2008541228A5/ja
Pending legal-status Critical Current

Links

Claims (15)

  1. 2つの検索エンジンクエリの間の意味的関係を判定する方法であって、
    (a)第1検索エンジンクエリを受信するステップと、
    (b)メモリ内に格納された第2検索エンジンクエリを識別するステップと、
    (c)複数の時間間隔にわたって第1及び第2検索エンジンクエリの累積的な密度を決定するステップと、所与の時間間隔にわたる前記2つの検索エンジンクエリの各々の前記密度とはその時間間隔内の検索エンジンクエリの合算された数に比較しての各々の検索エンジンクエリの頻度であり、前記第1及び第2検索エンジンクエリの前記累積的な密度とは前記複数の時間間隔中の全ての時間間隔にわたっての前記第1及び第2検索エンジンクエリの密度であり、
    (d)前記ステップ(c)で決定された前記2つの検索エンジンクエリの前記密度に基づいて前記2つの検索エンジンクエリの間の意味的相関を識別するステップと、
    (e)前記ステップ(d)で識別された前記意味的相関が閾値のレベルよりも上と決定された場合はメモリ内の前記第1検索エンジンクエリとのリンキング関連性を含むように
    前記第2検索エンジンクエリを修正するステップと、
    (f)前記ステップ(d)で識別された前記意味的相関が閾値のレベルよりも上と決定された場合はユーザに前記第2検索エンジンクエリと関連した結果を表示するステップと、
    を含むことを特徴とする方法。
  2. 前記2つの検索エンジンクエリの第1クエリは、入力クエリであり、前記2つの検索エンジンクエリの第2クエリは、格納されたクエリであり、前記方法は、閾レベルを超える意味的関係が前記入力クエリと前記格納されたクエリとの間に存在することが判定される場合に、ユーザまたは広告主に前記格納されたクエリを提案するステップをさらに含むことを特徴とする請求項1に記載の2つの検索エンジンクエリの間の意味的関係を判定する方法。
  3. 前記2つのクエリの間の意味的相関の識別の前記ステップ()は、ビットストリングによって前記2つの検索エンジンクエリ頻度の前記データを表し、前記2つの検索エンジンクエリを表す前記ビットストリング内の対応するビットが互いに一致する度合を調べるステップを含むことを特徴とする請求項1に記載の2つの検索エンジンクエリの間の意味的関係を判定する方法。
  4. 前記2つのクエリの間の意味的相関の識別の前記ステップ()は、前記第1クエリの正規化された頻度を表す第1ベクトルと前記第2クエリの正規化された頻度を表す第2ベクトルとのドット積を計算するステップを含むことを特徴とする請求項1に記載の2つの検索エンジンクエリの間の意味的関係を判定する方法。
  5. 2つの検索エンジンクエリの間の意味的関係を判定する方法であって、
    (a)第1検索エンジンクエリを受信するステップと、
    (b)メモリ内に格納された第2検索エンジンクエリを識別するステップと、
    (c)前記第1クエリを第1ビットストリング中で解決し、前記第2クエリを第2ビットストリング中で解決することにより、前記第1及び第2検索エンジンクエリの各々に対するクエリ密度関数を得るステップと、前記第1及び第2検索エンジンクエリに対する前記クエリ密度関数とは複数の時間間隔内での検索エンジンクエリの合算された数に比較しての各々の検索エンジンクエリの頻度に基づいたものであり、
    (d)前記第1ビットストリングと前記第2ビットストリングが互いに一致した対応するビットの度合いに基づいた前記2つの検索エンジンクエリの間の意味的相関を識別するステップと、
    (e)前記ステップ(d)で識別された前記意味的相関が閾値のレベルよりも上と決定された場合はメモリ内の前記第1検索エンジンクエリとのリンキング関連性を含むように
    前記第2検索エンジンクエリを修正するステップと、
    (f)前記ステップ(d)で識別された前記意味的相関が閾値のレベルよりも上と決定された場合はユーザに前記第2検索エンジンクエリと関連した結果を表示するステップと、
    を含むことを特徴とする方法。
  6. 前記第1及び第2の検索エンジンクエリのそれぞれのクエリ密度関数を前記第1及び第2クエリを第1ビットストリング及び第2ビットストリングによって解決することにより得る前記ステップ()は、128ビットストリングによって前記2つの検索エンジンクエリについての各々のクエリ密度関数を表すステップを含むことを特徴とする請求項に記載の2つの検索エンジンクエリの間の意味的関係を判定する方法。
  7. 前記2つの検索エンジンクエリの間の相関係数を計算するステップをさらに含み、前記相関係数は、前記2つの検索エンジンクエリの間の意味的関係の度合を示すことを特徴とする請求項に記載の2つの検索エンジンクエリの間の意味的関係を判定する方法。
  8. 前記第1及び第2の検索エンジンクエリのそれぞれのクエリ密度関数を前記第1及び第2クエリをビットストリングによって解決することにより得る前記ステップ()は、複数の超平面を生成するステップと、前記2つの検索エンジンクエリの第1検索エンジンクエリの前記ビットストリング内のビットを生成するステップとを含み、前記ビットは、前記超平面の1つに直交する第1ベクトルと前記第1検索エンジンクエリを表す第2ベクトルとのドット積によって決定されることを特徴とする請求項に記載の2つの検索エンジンクエリの間の意味的関係を判定する方法。
  9. )第1および第2のビットストリングの分数内の対応するビットのある部分が互いに一致するかどうかを識別するために、前記ビットストリングのそれぞれのビットの前記分数をスキャンするステップと、
    )前記ステップ()で、前記第1および第2のビットストリングの前記分数内の対応するビットのある部分が互いに一致すると判定される場合に、対応について前記ビットストリング内の残りのビットをスキャンするステップと
    をさらに含むことを特徴とする請求項に記載の2つの検索エンジンクエリの間の意味的関係を判定する方法。
  10. (a)複数の検索エンジンクエリの各々についての累積的な密度を決定するステップと、前記複数の検索エンジンクエリは入力クエリと複数の格納されたクエリとを含み、前記複数の検索エンジンクエリの各々の前記密度とは複数の離散した時間間隔の内の各離散した時間間隔中の検索エンジンクエリの合算された数に比較しての各々の前記検索エンジンクエリの頻度であり、前記検索エンジンクエリの各々についての前記累積的な密度とは前記複数の時間間隔中の全ての離散した時間間隔にわたっての前記検索エンジンクエリの各々の密度であり、
    (b)前記ステップ(a)で決定されたクエリ密度データを、前記複数の検索エンジンクエリの各々について1つのビットストリングがある、めいめいのビットストリングとして表すステップと、
    (c)前記複数の検索エンジンクエリのうちで、前記複数の検索エンジンクエリの入力クエリにする第1閾レベルを超える相関係数を有する1つまたは複数の検索エンジンクエリを選択するステップと、
    (d)前記ステップ(c)で選択された1つまたは複数の検索エンジンクエリをメモリ内の前記入力とのリンキング関連性を含むように修正するステップと、
    (e)前記相関係数が前記第1閾レベルを超えるものを有する前記検索エンジンクエリをユーザに表示するステップと、
    を含むことを特徴とするコンピュータ実行可能命令を有するコンピュータ可読記録媒体。
  11. 選択の前記ステップ(c)は、
    (i)互いに一致する前記ビットストリングの分数内の対応するビットのある部分を有する前記1つまたは複数の検索エンジンクエリを識別するために、前記複数の検索エンジンクエリに関連する前記ビットストリングのそれぞれのビットの前記分数をスキャンするステップと、
    (ii)前記入力クエリに対する前記第1閾レベルを超える相関を有する前記1つまたは複数の検索エンジンクエリを識別するために前記1つまたは複数の検索エンジンクエリをスキャンするステップと
    を含むことを特徴とする請求項10に記載のコンピュータ実行可能命令を有するコンピュータ可読記録媒体。
  12. 前記複数の検索エンジンクエリに関連する前記ビットストリングのそれぞれのビットの分数をスキャンする前記ステップ(i)は、前記ビットストリングのそれぞれの20ビットをスキャンするステップを含むことを特徴とする請求項11に記載のコンピュータ実行可能命令を有するコンピュータ可読記録媒体。
  13. 前記ステップ(a)で正規化された前記クエリデータをめいめいのビットストリングとして表す前記ステップ(b)は、複数の超平面を生成するステップと、前記複数の検索エンジンクエリの第1検索エンジンクエリの前記ビットストリング内のビットを生成するステップとを含み、前記ビットは、前記超平面の1つに直交する第1ベクトルと前記入力クエリを表す第2ベクトルとのドット積によって決定されることを特徴とする請求項10に記載のコンピュータ実行可能命令を有するコンピュータ可読記録媒体。
  14. 前記1つまたは複数の検索クエリをユーザに提案するステップをさらに含むことを特徴とする請求項10に記載のコンピュータ実行可能命令を有するコンピュータ可読記録媒体。
  15. 前記入力クエリと前記1つまたは複数の格納された検索エンジンクエリとの間の相関係数を計算するステップをさらに含み、前記相関係数は、前記入力及び1つまたは複数の検索エンジンクエリの間の意味的関係の度合を示すことを特徴とする請求項10に記載のコンピュータ実行可能命令を有するコンピュータ可読記録媒体。
JP2008510024A 2005-05-02 2006-04-21 意味的に関係する検索エンジンクエリを見つける方法 Pending JP2008541228A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/119,667 US7577646B2 (en) 2005-05-02 2005-05-02 Method for finding semantically related search engine queries
PCT/US2006/014975 WO2006118814A2 (en) 2005-05-02 2006-04-21 Method for finding semantically related search engine queries

Publications (2)

Publication Number Publication Date
JP2008541228A JP2008541228A (ja) 2008-11-20
JP2008541228A5 true JP2008541228A5 (ja) 2009-07-09

Family

ID=37235665

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008510024A Pending JP2008541228A (ja) 2005-05-02 2006-04-21 意味的に関係する検索エンジンクエリを見つける方法

Country Status (6)

Country Link
US (1) US7577646B2 (ja)
EP (1) EP1877895A4 (ja)
JP (1) JP2008541228A (ja)
CN (1) CN101171568A (ja)
BR (1) BRPI0610429A2 (ja)
WO (1) WO2006118814A2 (ja)

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050071217A1 (en) * 2003-09-30 2005-03-31 General Electric Company Method, system and computer product for analyzing business risk using event information extracted from natural language sources
US20070005588A1 (en) * 2005-07-01 2007-01-04 Microsoft Corporation Determining relevance using queries as surrogate content
US8965874B1 (en) 2006-08-04 2015-02-24 Google Inc. Dynamic aggregation of users
US7814086B2 (en) * 2006-11-16 2010-10-12 Yahoo! Inc. System and method for determining semantically related terms based on sequences of search queries
US8321448B2 (en) * 2007-02-22 2012-11-27 Microsoft Corporation Click-through log mining
US8244750B2 (en) * 2007-03-23 2012-08-14 Microsoft Corporation Related search queries for a webpage and their applications
US20080243826A1 (en) * 2007-03-30 2008-10-02 Yahoo! Inc. System and method for determining semantically related terms
US20080243480A1 (en) * 2007-03-30 2008-10-02 Yahoo! Inc. System and method for determining semantically related terms
US7860859B2 (en) * 2007-06-01 2010-12-28 Google Inc. Determining search query statistical data for an advertising campaign based on user-selected criteria
US7693908B2 (en) * 2007-06-28 2010-04-06 Microsoft Corporation Determination of time dependency of search queries
US7685100B2 (en) * 2007-06-28 2010-03-23 Microsoft Corporation Forecasting search queries based on time dependencies
US8090709B2 (en) 2007-06-28 2012-01-03 Microsoft Corporation Representing queries and determining similarity based on an ARIMA model
US7693823B2 (en) * 2007-06-28 2010-04-06 Microsoft Corporation Forecasting time-dependent search queries
US8290921B2 (en) * 2007-06-28 2012-10-16 Microsoft Corporation Identification of similar queries based on overall and partial similarity of time series
US7685099B2 (en) * 2007-06-28 2010-03-23 Microsoft Corporation Forecasting time-independent search queries
US7689622B2 (en) * 2007-06-28 2010-03-30 Microsoft Corporation Identification of events of search queries
US20090037408A1 (en) * 2007-08-04 2009-02-05 James Neil Rodgers Essence based search engine
KR100913051B1 (ko) * 2007-09-18 2009-08-20 엔에이치엔(주) 연관 급상승어 검색 방법 및 그 시스템
WO2009096523A1 (ja) * 2008-01-30 2009-08-06 Nec Corporation 情報分析装置、検索システム、情報分析方法及び情報分析用プログラム
US8140562B1 (en) 2008-03-24 2012-03-20 Google Inc. Method and system for displaying real time trends
US9135583B2 (en) * 2008-07-16 2015-09-15 Business Objects S.A. Systems and methods to create continuous queries associated with push-type and pull-type data
US8447739B2 (en) 2008-07-16 2013-05-21 SAP France S.A. Systems and methods to create continuous queries via a semantic layer
US8156129B2 (en) * 2009-01-15 2012-04-10 Microsoft Corporation Substantially similar queries
US8239333B2 (en) * 2009-03-03 2012-08-07 Microsoft Corporation Media tag recommendation technologies
US8516013B2 (en) * 2009-03-03 2013-08-20 Ilya Geller Systems and methods for subtext searching data using synonym-enriched predicative phrases and substituted pronouns
US8447789B2 (en) * 2009-09-15 2013-05-21 Ilya Geller Systems and methods for creating structured data
US8219539B2 (en) * 2009-04-07 2012-07-10 Microsoft Corporation Search queries with shifting intent
JP5292250B2 (ja) * 2009-10-13 2013-09-18 日本電信電話株式会社 文書検索装置、文書検索方法、文書検索プログラム
US8260664B2 (en) * 2010-02-05 2012-09-04 Microsoft Corporation Semantic advertising selection from lateral concepts and topics
US8903794B2 (en) 2010-02-05 2014-12-02 Microsoft Corporation Generating and presenting lateral concepts
US8150859B2 (en) * 2010-02-05 2012-04-03 Microsoft Corporation Semantic table of contents for search results
US8983989B2 (en) * 2010-02-05 2015-03-17 Microsoft Technology Licensing, Llc Contextual queries
US8560562B2 (en) * 2010-07-22 2013-10-15 Google Inc. Predictive query suggestion caching
EP2479686B1 (en) * 2011-01-24 2014-09-17 AOL Inc. Systems and methods for analyzing and clustering search queries
WO2012111226A1 (ja) * 2011-02-15 2012-08-23 日本電気株式会社 時系列文書要約装置、時系列文書要約方法およびコンピュータ読み取り可能な記録媒体
JP5729001B2 (ja) * 2011-02-18 2015-06-03 ソニー株式会社 情報提供システム、情報提供方法およびプログラム
CN103136210A (zh) * 2011-11-23 2013-06-05 北京百度网讯科技有限公司 一种挖掘具有相似需求的查询的方法及装置
US8972399B2 (en) * 2012-06-22 2015-03-03 Microsoft Technology Licensing, Llc Ranking based on social activity data
US20140074812A1 (en) * 2012-06-25 2014-03-13 Rediff.Com India Limited Method and apparatus for generating a suggestion list
US10628496B2 (en) * 2017-03-27 2020-04-21 Dell Products, L.P. Validating and correlating content

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4471459A (en) * 1981-09-30 1984-09-11 System Development Corp. Digital data processing method and means for word classification by pattern analysis
US5619709A (en) * 1993-09-20 1997-04-08 Hnc, Inc. System and method of context vector generation and retrieval
US5987446A (en) * 1996-11-12 1999-11-16 U.S. West, Inc. Searching large collections of text using multiple search engines concurrently
US6182068B1 (en) * 1997-08-01 2001-01-30 Ask Jeeves, Inc. Personalized search methods
US6144958A (en) * 1998-07-15 2000-11-07 Amazon.Com, Inc. System and method for correcting spelling errors in search queries
US6571225B1 (en) * 2000-02-11 2003-05-27 International Business Machines Corporation Text categorizers based on regularizing adaptations of the problem of computing linear separators
US6564211B1 (en) * 2000-10-04 2003-05-13 Lsi Logic Corporation Fast flexible search engine for longest prefix match

Similar Documents

Publication Publication Date Title
JP2008541228A5 (ja)
JP5420243B2 (ja) 所望リポジトリの判定
JP4708436B2 (ja) 信頼性のある文書の識別
US8150859B2 (en) Semantic table of contents for search results
TWI396984B (zh) 使用網路文件的偏擊距離之排序功能
US20160034471A1 (en) Entity detection and extraction for entity cards
JP2008515107A5 (ja)
JP2011511341A5 (ja)
US8977625B2 (en) Inference indexing
CN104462126A (zh) 一种实体链接方法及装置
US20110184811A1 (en) Providing contextual advertisements for electronic books
DE602006016846D1 (de) System und verfahren zum durchsuchen und vergleichen von daten mit ideogrammatischem inhalt
CN105280170A (zh) 一种乐谱演奏的方法和装置
DK200800740A (da) Fremgangsmåde til præsentation af et datasæt ved brug af sögning,computerlæsbart medium og computer
KR101818717B1 (ko) 컨셉 키워드 확장 데이터 셋을 이용한 검색방법, 장치 및 컴퓨터로 판독 가능한 기록매체
CN104239570B (zh) 论文的搜索方法及装置
WO2010008488A1 (en) Method and system for dynamically generating a search result
JP4737564B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP2008084193A (ja) インスタンス選択装置、インスタンス選択方法及びインスタンス選択プログラム
JP4819628B2 (ja) ドキュメントデータを検索する方法、サーバ、およびプログラム
JP5844824B2 (ja) Sparqlクエリ最適化方法
JP5787941B2 (ja) トリガクエリ取得装置、トリガクエリ取得方法、およびプログラム
CN110209780A (zh) 一种问题模板生成方法、装置、服务器及存储介质
US20100169334A1 (en) Peer-to-peer web search using tagged resources
US8447736B2 (en) Grammar compression