JP5255055B2 - クエリ統計プロバイダ - Google Patents

クエリ統計プロバイダ Download PDF

Info

Publication number
JP5255055B2
JP5255055B2 JP2010509523A JP2010509523A JP5255055B2 JP 5255055 B2 JP5255055 B2 JP 5255055B2 JP 2010509523 A JP2010509523 A JP 2010509523A JP 2010509523 A JP2010509523 A JP 2010509523A JP 5255055 B2 JP5255055 B2 JP 5255055B2
Authority
JP
Japan
Prior art keywords
search
query
search query
queries
computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010509523A
Other languages
English (en)
Other versions
JP2010530566A5 (ja
JP2010530566A (ja
Inventor
ウェイペン・ヤン
ニコラス・シー・フォックス
ロベルト・ジェイ・ベイアード
デビッド・チェン・チャン
モニカ・ディー・チャワテ
Original Assignee
グーグル・インコーポレーテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by グーグル・インコーポレーテッド filed Critical グーグル・インコーポレーテッド
Publication of JP2010530566A publication Critical patent/JP2010530566A/ja
Publication of JP2010530566A5 publication Critical patent/JP2010530566A5/ja
Application granted granted Critical
Publication of JP5255055B2 publication Critical patent/JP5255055B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • G06Q30/0256User search
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Theoretical Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Databases & Information Systems (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)

Description

本願は、2007年5月21日に出願された米国仮出願No.60/939345を基礎とする優先権主張を伴い、その内容は、参照によって本明細書中に組込まれている。
本願は一般に、広告に関する。
検索結果および他の情報、およびそれら広告の順序のようなものを用いて、プレゼンテーション(例えば、表示)する広告を選択することは、各種手法によって達成されることができる。1つの例示的な手法では、初期の決定は、適用された検索タームまたは他のクエリタームまたは情報に対して一致または一致に近い全ての広告を識別するために行われる。一致は、例えば1つまたは複数のクエリワードと、キャンペーンのような、広告主によって識別され、特定の広告または1群の広告に関連付けられるキーワードとの間で行うことができる。
例えば、釣り道具販売会社は、一連の大きなルアーを有することができるので、そのような大きなルアーに関する広告に関連付けるキーワードである“lunker(特別に大きなもの)”、“sturgeon(チョウザメ)”および“muskie fever(アメリカカワカマス熱)”のようなタームを識別することができる。それら広告はその後、検索結果がそのようなタームを入力するユーザに表示される時、システムによって表示が考慮されうる。会社はまた、検索またはクエリと、広告のテキストまたは広告のハイパーリンク対象のテキストとの間、またはキーワード、対象テキストおよび広告テキストに対して、他の可能な手法の間で行うことができる。例えば、システムは、キーワードとして広告からタームを効率的に選択できるので、広告は、キーワードに関する検索または他のユーザアクションが提供される時に起こりうる表示のために選択される。広告は、“近い”一致がさらにある場合、例えばクエリが広告に関するキーワードタームに対する既知の同義語またはタイプミス/複数のスペルミスであるタームを含む場合、起こりうる表示のために選択されることができる。1群の一致広告は、候補グループと称することができる。
いくつかのシステムでは、ユーザが広告をクリック或いは選択する時、広告主の現在の(landing)ウェブページは、ユーザに表示される。広告主のウェブサイトでは、ユーザは、購入、文書またはファイルのダウンロード、またはいくつかの他の可測なアクションをとることができる。複数の数的指標は、広告キャンペーンの成績を測定するために使用されることができる。例えば、クリック率は、広告がユーザに対する閲覧のために配信または提供された回数(即ち、インプレッション)で、ウェブページ上の広告をクリックしたユーザ数を割ることによって得られる。変換率は、所望のアクション(例えば、ウェブサイトの訪問)をとる固有の訪問者のパーセンテージである。所望のアクションは例えば、フォームへの書き込み、所定のページへの訪問、または取引若しくは購入の完了でもよい。成績の数的指標は、広告キャンペーンを改善するために広告主に提供されることができる。
1つの実施形態では一般に、コンピュータ実装可能な方法は、検索クエリ情報のリクエストを受信し、所定の時間長さにわたって検索サービスに提供される検索クエリを含む検索クエリログから1組の検索クエリを識別し、1組の検索クエリを提供することを含み、各1組の検索クエリは、少なくとも所定数の固有識別子に関連付けられる。
方法の実装は、1つまたは複数の以下の特徴を含むことができる。各識別子は、検索クエリを含む検索リクエストを提供したクライアント装置に関連付けられることができる。識別子は、クッキー識別子を含むことができる。1組の検索クエリを識別することは、広告に関連付けられる検索クエリを識別することを含むことができる。方法は、広告のスポンサに1組の検索クエリを提供することを含むことができる。方法は、各検索クエリと広告に関連付けられるキーワードとの間の類似レベルに基づき2つまたは複数のカテゴリに1組の検索クエリをカテゴリ化することを含むことができる。方法は、広告のスポンサに検索クエリの2つまたは複数のカテゴリを提供することを含むことができる。方法は、広告の表示を引起す検索クエリを識別することを含むことができる。方法は、広告のクリックに関連付けられる検索クエリを識別することを含むことができる。方法は、検索クエリを正規化することを含むことができる。検索クエリの正規化は、検索クエリのクエリタームを識別してクエリタームの順序を保護することを含むことができる。
もう1つの実施形態では一般に、コンピュータ実装可能な方法は、検索クエリ情報のリクエストを受信し、検索クエリを提供したユーザの個人情報を含む可能性の低い一つまたは複数の検索クエリを識別し、1組の検索クエリを提供することを含む。識別は、各々が少なくとも所定数の固有識別子である1組の検索クエリを識別するために所定の時間長さにわたって検索サービスのユーザによって提供される検索クエリを処理することを含む。
方法の実装は、1つまたは複数の以下の特徴を含むことができる。各固有識別子は、検索クエリを含む検索リクエストを提供した固有のクライアント装置に関連付けられることができる。各固有識別子は、固有のクッキー識別子を含むことができる。検索クエリの識別は、広告に関連付けられる検索クエリを識別することを含むことができる。方法は、広告のスポンサに1組の検索クエリを提供することを含むことができる。方法は、各検索クエリと広告に関連付けられるキーワードまたはキーフレーズとの間の類似レベルに基づき2つまたは複数のカテゴリに1組の検索クエリをカテゴリ化することを含むことができる。
もう1つの実施形態では一般に、コンピュータ実装可能な方法は、検索クエリ情報のリクエストを広告のスポンサから受信し、広告に一致する検索クエリをスポンサに提供し、検索クエリがユーザの個人情報を含む可能性を低減することを含み、検索クエリは、検索サービスのユーザによって提供される。これは、所定の時間長さにわたって検索サービスに提供された検索クエリをスポンサに提供することを含み、スポンサに提供される各検索クエリは、少なくとも所定数の固有識別子に関連付けられる。
方法の実装は、1つまたは複数の以下の特徴を含むことができる。各識別子は、検索クエリを含む検索リクエストを提供したクライアント装置に関連付けられることができる。識別子は、クッキー識別子を含むことができる。
もう1つの実施形態では一般に、装置は、検索クエリを提供したユーザの個人データを含む可能性の低い1組の検索クエリを自動的に識別するクエリ統計エンジンと、1組の検索クエリを格納するデータ格納装置とを含む。クエリ統計エンジンは、所定の時間長さにわたって検索サービスに提供される検索クエリを含む検索クエリログから1組の検索クエリを識別し、各1組の検索クエリは、少なくとも所定数の固有識別子に関連付けられる。
装置の実装は、1つまたは複数の以下の特徴を含むことができる。装置は、検索クエリを含む検索リクエストを受信し、データ格納装置に検索クエリを格納するために、検索サーバを含むことができる。各識別子は、検索クエリを含む検索リクエストを提供したクライアント装置に関連付けられることができる。識別子は、クッキー識別子を含むことができる。クエリ統計エンジンは、検索クエリを正規化することができる。クエリ統計エンジンは、検索クエリのクエリタームを識別してクエリタームの順序を保護することによって、検索クエリを正規化することができる。
もう1つの実施形態では一般に、装置は、検索クエリ情報のリクエストを受信する手段と、所定の時間長さにわたって検索サービスに提供される検索クエリを含む検索クエリログから1組の検索クエリを識別する手段とを含む。各1組の検索クエリは、検索サービスの少なくとも所定数の固有のユーザによって提供される。装置は、1組の検索クエリを提供する手段を含む。
もう1つの実施形態では一般に、コンピュータ実装方法は、広告に関連付けられる少なくとも1つのクエリキーワードに基づき検索クエリ情報のリクエストを受信し、少なくとも1つのクエリキーワードに関連付けられる検索クエリログから、所定の時間長さにわたって検索サービスに提供される検索クエリを含む1組の検索クエリを識別し、広告および少なくとも1つのクエリキーワードに1組の検索クエリを関連付けることを含み、各1組の検索クエリは、少なくとも所定数の固有識別子に関連付けられる。
方法の実装は、1つまたは複数の以下の特徴を含むことができる。検索クエリログからの検索クエリと少なくとも1つのクエリキーワードとの間の関係は、完全一致、拡張一致または広義一致を含むことができる。検索クエリログからの検索クエリと少なくとも1つのクエリキーワードとの間の関係は、少なくとも2つの完全一致、拡張一致または広義一致の組合せを含むことができる。方法は、各検索クエリおよびクエリキーワード間の類似レベルに基づき2つまたは複数のカテゴリに1組の検索クエリをカテゴリ化することを含むことができる。方法は、広告のスポンサに検索クエリの2つまたは複数のカテゴリを提供することを含むことができる。識別子は、クッキー識別子を含むことができる。方法は、広告スポンサに広告を関連付け、1組の検索クエリを広告のスポンサに提供することを含むことができる。
もう1つの実施形態では一般に、コンピュータ実装方法は、広告スポンサに関連付けられる広告に関連付けられる少なくとも1つのクエリキーワードに基づき検索クエリ情報のリクエストを受信し、検索クエリを提供したユーザの個人情報を自動的に除外する1つまたは複数の検索クエリを識別することを含み、識別は、各々が少なくとも所定数の固有識別子に関連付けられる1組の検索クエリを識別するために、所定の時間長さにわたって検索サービスのユーザによって提供される検索クエリを処理することを含む。方法は、少なくとも1つのクエリキーワードに1つまたは複数の検索クエリを関連付け、少なくとも1つのクエリキーワードに関連付けられる1組の検索クエリを広告のスポンサに提供することを含む。
方法の実装は、1つまたは複数の以下の特徴を含むことができる。方法は、各検索クエリと広告に関連付けられる少なくとも1つのクエリキーワードとの間の類似レベルに基づき2つまたは複数のカテゴリに1組の検索クエリをカテゴリ化することを含むことができる。カテゴリ化は、少なくとも1つの完全一致、拡張一致および広義一致を含む一致方法を含むことができる。
もう1つの実施形態では一般に、コンピュータ実装方法は、広告設置情報のリクエストを広告のスポンサから受信し、広告に一致する検索クエリをスポンサに提供し、検索クエリは、検索サービスのユーザによって提供され、検索クエリは、各検索クエリが所定の人気閾値を上回る複数の固有のユーザによって提供される時に提供される。方法は、検索クエリがユーザの個人情報を含む可能性を低減し、所定の時間長さにわたって検索サービスに提供されたスポンサ検索クエリに提供することを含み、スポンサに提供される各検索クエリは、少なくとも所定数の固有識別子に関連付けられる。
方法の実装は、1つまたは複数の以下の特徴を含むことができる。方法は、少なくとも1つの完全一致、拡張一致および広義一致を介して広告に検索クエリを一致させることを含むことができる。
もう1つの実施形態では一般に、装置は、データ格納装置と、検索クエリを含む検索リクエストを受信してデータ格納装置に検索クエリを格納する検索サーバと、広告の設置のために広告スポンサから広告を受信する広告サーバとを含む。装置は、検索クエリを提供したユーザの個人データを含む可能性の低い検索サーバから1組の検索クエリを自動的に識別するクエリ統計エンジンを含み、クエリ統計エンジンは、所定の時間長さにわたって検索サーバに提供される検索クエリを含む検索クエリログから1組の検索クエリを識別し、各1組の検索クエリは、少なくとも所定の最小数の固有のユーザ識別子に関連付けられる。装置は、広告スポンサからの広告に1組の検索クエリを一致させる一致エンジンを含む。
方法の実装は、1つまたは複数の以下の特徴を含むことができる。一致エンジンは、少なくとも1つの完全一致エンジン、拡張一致エンジンおよび広義一致エンジンを含むことができる。各識別子は、検索クエリを含む検索リクエストを提供したクライアント装置に関連付けられることができる。識別子は、クッキー識別子を含むことができる。クエリ統計エンジンは、検索クエリを正規化することができる。クエリ統計エンジンは、検索クエリのクエリタームを識別してクエリタームの順序を保護することによって検索クエリを正規化することができる。
装置および方法の利点は、1つまたは複数の以下を含むことができる。利点は、その広告に関連する検索クエリに関するさらなる情報を得て、その広告キャンペーンを改善するために情報を使用することができる。情報はまた、広告が対象の聴衆に届くかを広告主が評価することを助けるのに役立つ。さらなる利益は、ユーザ検索リクエストに広告を一致させる検索サービスおよび広告主の両方によって生成されることができる。ユーザは、改善された広告キャンペーンとしてさらなる関連広告を受信することができる。1つまたは複数の実施形態の詳細は、添付図面および以下の説明に記載される。本発明の他の特徴、目的および利点は、詳細な説明、図面および特許請求の範囲から明らかである。
図1は、例示的情報検索システムの図である。 図2は、例示的グラフィカルユーザインタフェースの図である。 図3は、検索クエリ統計の例示的レポートである。 図4は、プライバシ安全検索クエリおよび関連情報を広告主に提供する例示的過程のフロー図である。 図5は、汎用計算装置の概略図である。 図6は、汎用携帯計算装置の概略図である。
図1は、ユーザ104によって提供される検索クエリに一致する情報(例えば、ウェブ文書)およびコンテンツ(以下、広告と称する)を検索および表示するための例示的な情報検索システム100の概略図である。システム100は、トランスペアレンシを提供するために、および広告主106が広告キャンペーンの成績を改善できるようにするために、広告主106(広告のスポンサ)に検索クエリ情報を示す。いくつかの例では、システム100は、検索クエリが個人情報(例えば、自宅の住所または社会保障番号)を含む可能性がかなり低い(例えば、0に近い)、システム100によって受信される検索クエリの生クエリターム(raw query term)を広告主106に提供する。
システム100が例えば1週間に何百万もの検索クエリを受信して、どの検索クエリが個人情報を含んでいないか手動で発見することは、困難であって時間の無駄である。システム100の特徴は、個人情報を含むのがかなり低い確率(例えば、0に近い)を有する検索クエリを自動的に識別できることである。この手法は、異なる人々が検索クエリを提供する時、同一の特定の個人情報を問合せる見込みはないという洞察に基づく。例えば、何十人の人々が正確に同一な社会保障番号を含む検索クエリを提供する見込みはない。検索クエリが期間にわたって収集される時、複数のユーザによって提供されている各検索クエリが個人情報を含む見込みはないだけでなく、それら検索クエリが特定のユーザを追跡できる見込みもない。
システム100のもう1つの特徴は、システム100によって受信された全検索クエリの1部分を広告主106に示す一方、広告主106に関する検索クエリの大部分に及ぶことである。広告主106は、どの検索クエリがクリックされている自分の広告をもたらすのか感心がある。クリックされる広告の大部分は、各々が複数のユーザ104によって提供された検索クエリによって引起される。特定の広告をクリックしたユーザ104は、同一の検索タームを打ち込んだので、特定の広告が示された可能性がある。例えば、特定の携帯音楽プレイヤの広告に対するクリックの大部分は、その特定の携帯音楽プレイヤの名前を打ち込んだユーザから来るので、同一または類似の検索クエリを有することができる。例えば、システム100は、期間にわたって受信された全ての固有の検索クエリのうち1%未満を広告主106に示し、広告に対するクリックを引起した検索クエリのうち50%より高い部分に及ぶことができる。
システム100は、例えばユーザがキーワード検索を用いて情報を検索できるようにする検索サーバ108を含む。いくつかの例では、ユーザ104は、ネットワーク124(例えば、インターネット)を介して検索サーバ108にアクセスするために、クライアントマシン122(例えば、個人コンピュータ)上で実行するウェブブラウザ120を使用することができる。ユーザ104は、検索サーバ108に検索クエリを含む検索リクエストを送信する。検索クエリは、1つまたは複数の検索ターム(例えば、キーワードまたはキーフレーズ)を含むことができる。それに応じて、検索サーバ108は、インデクス110を検索し、ユーザ104によって提供された検索クエリに一致するページのリストを戻し、ページのランクスコアに従う順序でページのリストを提供する。検索サーバ108はまた、戻されたページのリストと同時に広告を表示することができる。広告は、広告サーバ126によって提供されることができる。
システム100は、ユーザ104によって提供された検索クエリと検索クエリに関連付けられた情報とを格納する検索クエリログ112を含む。情報は、例えば検索クエリが提供された時を識別するタイムスタンプと、検索クエリを提供するユーザのIPアドレスと、固有のクッキー識別子とを含むことができる。検索クエリに関する情報はまた、例えばどの広告が検索クエリによって引起された時に表示および/またはクリックされたかを示すことができる。
ターム“検索リクエスト”は、ユーザ104から検索サーバ108に送信された情報の要求に言及し、ターム“検索クエリ”は、検索リクエストに含まれた検索タームおよび演算子(ブール演算子)に言及する。異なるユーザ104からの検索リクエストは、同一の検索クエリを含むことができる。以下に説明するように、異なるユーザ104は、クッキー識別子のような異なる識別子に関連付けることができる。故に、検索クエリは、複数のユーザ104が同一の検索クエリを提供する場合、複数の固有の識別子に関連付けられることができる。
システム100は、検索クエリログ112からの検索クエリ116を処理し、広告主106に検索クエリ116の情報を提供するクエリ統計エンジン114を含む。広告主106は、自分の広告キャンペーンを向上させるために、およびどの自分の広告が対象顧客に達しているかを判断するために、検索クエリ116の情報を使用することができる。
いくつかの実施形態では、クエリ統計エンジン114は、広告主106がどの統計を見るかを選択できるようにするために、グラフィカルユーザインタフェース200(図2参照)を提供する。例えば、広告主106は、特定のアクション、例えば広告の表示、クリックまたは変換を引起した検索クエリを見ることをリクエストできる。それに応じて、クエリ統計エンジン114は、特定の広告およびアクションに関連付けられる検索クエリ116を識別する。クエリ統計エンジン114は、広告主106に検索クエリ116の生クエリターム(例えば、ユーザ104によって提供された実際のキーワード)を提供することができる。クエリ統計エンジン114は、個人情報で検索クエリ116を示さないために、内蔵保護手段を有する。
ユーザ104によって提供された検索クエリ116は、個人情報を含むことができる。例えば、いくつかのユーザ104がローカル情報の検索をする検索情報に自分の自宅住所を含めることができる。いくつかのユーザ104は、自分の社会保障番号が公文書にリストされているかを見るために、検索クエリ116に自分の社会保障番号を入力できる。ユーザ104は、他の理由で検索クエリに個人情報を入力することができる。ユーザ104のプライバシを保護するために、クエリ統計エンジン114は、“プライバシ安全”クエリ134として言及される、個人情報を含まない検索クエリ116を識別し、プライバシ安全クエリログ118にそれらクエリを格納する。クエリ統計エンジン114は、広告主106にプライバシ安全検索クエリ134のみ提供する。
いくつかの実施形態では、クエリ統計エンジン114は、所定の長さ期間にわたって、少なくとも所定数の固有のユーザによって提供された検索クエリ116を識別することによってプライバシ安全クエリ134を識別する。例えば、同一の検索クエリ116が1ヶ月またはそれより長くにわたって何十人の固有のユーザ104によって提供される場合、何十人の固有のユーザ104は、同一の特定の個人情報を問合せている見込みがない。検索クエリ116が少なくとも所定数の固有のユーザによって提供される要件は、人気閾値として見ることができ、ここで、異なるユーザ間で人気な検索クエリ116のみが、プライバシ安全のようである。
所定数は、例えば10より多くてもよく、所定の時間長さは、例えば1ヶ月より長くてもよい。プライバシ安全検索クエリ134を識別するためにクエリ統計エンジン114によって使用される基準(例えば、固有のユーザ数および時間長さ)は、例えば検索サーバ108によって提供される検索サービスの種類に依存して異なってもよい。
いくつかの実施形態では、クエリ統計エンジン114は、プライバシ安全検索クエリ134を識別する時、検索クエリ116を集約するためにクエリ正規化を実行することができる。クエリ正規化は、検索クエリを検索ターム(またはトークン)に分けることによって実行され、検索タームの順序を保護する。例えば、検索クエリにおける2つのキーワード間の2つまたはそれより多いスペースは、1つの余白に低減されることができる。特定の演算子、ネガティブタームおよび特定の接続シンボルは、検索クエリから除去されることができる。
例えば、検索クエリ“apple juice”(“apple”および“juice”間に2つまたはそれより多い余白)および検索クエリ“apple juice”(“アップル”および“ジュース”間に1つの余白)は、同一の検索クエリであると判断できる。検索クエリ“apple −orange juice”および“apple and juice”はまた、“apple juice”と同一の検索クエリであると判断できる。故に、検索クエリ“apple juice”、“apple juice”、“apple −orange juice”および“apple and juice”が4人の異なるユーザによって提供される場合、クエリ統計エンジン114は、検索クエリ“apple juice”が4人の固有のユーザによって提供されたと判断することができる。これは、クエリ(例えば、“apple juice”、“apple juice”、“apple −orange juice”または“apple and juice”)は、余分な空白および特定の接続シンボルが任意の個人情報を開示しないまま、プライバシを害することなく、プライバシ安全クエリとして特徴付けられる可能性を高める。
いくつかの実施形態では、クエリ統計エンジン114は、検索クエリ116が、ユーザ104に関連付けられたクッキーに基づき固有のユーザ104によって提供されるかを判断するために、プロキシ方法を使用する。ユーザ104が検索サーバ108にアクセスするためにウェブブラウザ120を使用する時、検索サーバ108は、ユーザ104が先ず検索サーバ108にアクセスする際、ウェブブラウザ120がクライアント装置122にクッキーを格納させるよう構成される。各クッキーは、識別子を含むことができるが、ユーザ104の個人情報を含むことができない。ユーザ104が検索サーバ108に検索リクエストを送信する時、クッキー識別子はまた、検索サーバ108に提供されることができる。異なるクライアント装置122に格納されたクッキーは、異なる識別子を有することができる。
クエリ統計エンジン114は、異なるクッキー識別子に関連付けられた検索クエリ138を見つけることによって固有のユーザ104によって提供された、正規化された検索クエリ116を識別する。複数のユーザ104は、同一のクライアント装置122を有することができるので、異なるユーザによって提供された検索クエリ116が同一のクッキー識別子に関連付けられている可能性がある。これは通常、プライバシ安全検索クエリ134を識別する検索統計エンジン114の機能に影響しない。なぜなら、クエリ統計エンジン114が少なくともn個の固有のクッキー識別子に関連付けられる検索クエリ116を識別するよう構成され、各クッキー識別子が1人または複数の固有のユーザ104に関連付けられる時、プライバシ安全検索クエリ134は、n人または複数の固有のユーザ104に関連付けることができるからである。ユーザ104は、検索サーバ108にアクセスするために複数のクライアント装置122を使用し、複数のクッキー識別子に関連付けできるが、同一の個人情報を含む同一の検索クエリを提供するために複数のクライアント装置122をユーザ104が使用する可能性は低く、そのようなアクションの頻度は低いので、クエリ毎の固有のユーザ数は、固有のユーザ閾値を下回る可能性が高い。
いくつかの実施形態では、ユーザ104は、クッキーを無効にするオプションを有する。ユーザ104がウェブブラウザ120でクッキーを無効にする時、検索サーバ108は依然、ウェブブラウザ120にクッキーを割り当てるが、ウェブブラウザ120は、クッキーを格納することができない。ウェブブラウザ120が検索サーバ108に検索リクエストを送信する時、検索サーバ108は、クッキーが生成されたときの第1のタイムスタンプと、クッキーがウェブブラウザ120によって送信された時の第2のタイムスタンプとを含むクッキーを受信する。検索サーバ108は、例えば第1および第2のタイムスタンプの比較に基づきクッキーの新しさ(freshness)を判断することによって、ユーザ104がクッキーを無効にしたかを判断することが出来る。2つのタイムスタンプ間の差が例えば10秒を下回る場合、クッキーは、新しいと考えられ、クエリ統計エンジン114は、クッキーがユーザ104によって無効にされたと判断する。
いくつかの実施形態では、無効のクッキーを備えた同一の検索クエリを提供したユーザ104は、一括して扱われ、クエリ統計エンジン114によって1人の固有のユーザであると考えられる。故に、固有のユーザの閾値が、検索クエリ116がプライバシ安全であるかを判断するpである場合、検索クエリ116は、検索クエリ116を提供したがクッキーを無効にしてない少なくともp−1人の固有のユーザと、検索クエリ116を提供したがクッキーを無効にした1人または複数のユーザ104とが存在する時、プライバシ安全であると考えることができる。
クエリ統計エンジン114は、検索タームと広告に関連付けられたキーワードとの類似レベルに基づき異なるカテゴリにプライバシ安全検索クエリ134をカテゴリ化することができる。例えば、検索クエリ134は、完全一致カテゴリ128、フレーズ一致カテゴリ130および広義一致カテゴリ132の、3つのカテゴリにカテゴリ化されることができる。完全一致カテゴリ128は、検索タームが広告キーワードと完全に同一な検索クエリ134を含む。拡張一致カテゴリとしてさらに言及されるフレーズ一致カテゴリ130は、広告キーワードが検索タームの一部(または従属)である検索クエリ134を含む。広義一致カテゴリ132は、検索タームが一般に広告キーワードに一致する、例えば、広告キーワードの一部が検索タームに一致、広告キーワードが検索クエリに現れるが異なる順序または広告キーワードが検索タームの同義語である検索クエリ134を含む。
例えば、広告がキーワード“plasma hdtv”に関連付けられる場合、検索ターム“plasma hdtv”を有する検索クエリ134は、完全一致カテゴリ128に置かれることができる。検索ターム“cheap plasma hdtv”を有する検索クエリ134は、広告キーワードが検索タームの一部なので、フレーズ一致カテゴリ130に置かれることができる。検索ターム“hdtv plasma”または“LCD hdtv”を有する検索クエリ134は、広義一致カテゴリ132に置かれることができる。
システム100は、広告に一組の検索クエリを一致させる一致エンジン(図示せず)を含むことができる。一致エンジンは例えば、完全一致エンジン、拡張一致またはフレーズ一致エンジンおよび広義一致エンジンを含むことができる。
クエリ統計エンジン114および一致エンジンは例えば、専用ハードウェア、汎用目的コンピュータ上で実行するソフトウェアモジュール、またはカスタム化されたハードウェアおよびソフトウェアの組合せを用いて実装されることができる。
図2は、広告主106が各種レポートを生成し、どのクエリ統計を見るかを決めることを可能にするために、クエリ統計エンジン114によって提供されるグラフィカルユーザインタフェース(GUI)200の一例の図である。GUI200は、広告主106がどういうレポートを生成するかを決定可能にするために部分202を含むことができる。この例では、検索クエリ成績のレポートが選択された。GUI200は、広告主106がどの情報をレポートで見るかを決定可能にするために部分204を含むことができる。この例では、項目“キャンペーン”、“広告キーワード”、“検索クエリ”、“一致タイプ”、“インプレッション数”、“クリック数”および“変換数”が選択された。GUI200は、広告主106がレポートを定期的に生成するスケジュールを立てること、およびレポートが生成される毎に広告主106に電子メール通知を送信することを可能にするために、部分206を含む。GUI200は、広告主106がさらに選択できるようにするために追加部分を含むことができる。広告主106が自分の選択を終了した後、レポートを生成するために“create report(レポート作成)”ボタン208をクリックすることができる。
図3は、広告主106へクエリ統計エンジン114によって提供されることができる検索クエリ統計のレポート300の一例である。レポート300は、各種列、例えばキャンペーン数302、広告キーワード304、検索クエリ306、一致タイプ308、インプレッション数310、クリック数312および変換数314を含むことができる。レポート300の列は、図2のGUI200における広告主の選択に基づき修正されることができる。
図4は、プライバシ安全検索クエリと関連情報とを広告主106に提供するための例示的な過程400のフロー図である。過程400は、広告のクエリ統計のために広告主からリクエストを受信する(402)。リクエストは、表示、クリックまたは変換のようなある種類のアクションを特定することができる。例えば、広告主は、図1の広告主106でもよく、クエリ統計エンジン114は、広告主106からのリクエストを受信するために使用されてもよい。過程400は、広告を引起したある時間期間の間に提供された検索クエリを見つけるために、検索クエリログにアクセスする(404)。例えば、検索クエリログは、図1の検索クエリログ112でもよく、検索クエリは、検索クエリ116でもよく、クエリ統計エンジン114は、広告を引起したある時間期間の間に提供された検索クエリを見つけるために使用されることができる。
過程400は、検索クエリを正規化する(406)。例えば、クエリ統計エンジン114は、検索クエリを正規化するために使用されることができる。過程400は、少なくとも所定数の固有ユーザに関連付けられる検索クエリを識別する(408)。例えば、クエリ統計エンジン114は、各々が少なくとも所定数の固有ユーザ104に関連付けられる検索クエリ116を見つけるために使用されることができる。クエリ統計エンジン114は、各々が少なくとも所定数の固有のクッキー識別子に関連付けられる検索クエリ116を識別することによってプロキシ方法を使用することができる。過程400は、プライバシ安全クエリと関連情報とを広告主に提供する(410)。例えば、クエリ統計エンジン114は、プライバシ安全クエリ134と関連情報とを広告主106に提供することができる。
図5は、例えば検索サーバ108、広告サーバ126またはクエリ統計エンジン114として使用されることができる汎用計算装置500の一例の概略図である。計算装置500は、ラップトップ、デスクトップ、ワークステーション、個人デジタル装置、サーバ、ブレードサーバ、メインフレームおよび他の適当なコンピュータのような、各種形式のデジタルコンピュータを示すために意図される。本明細書に示す要素、その接続および関係、およびその機能は、単なる例示であって、本願に記載および/または請求される発明の実施形態を限定することを意味しない。
計算装置500は、プロセッサ502、メモリ504、格納装置506、メモリ504および高速拡張ポート510に接続する高速インタフェース508、および低速バス514および格納装置506に接続する低速インタフェース512を含む。要素502、504、506、508、510および512の各々は、各種バスを用いて相互接続され、必要に応じて共通マザーボード上または他の方法で搭載されることができる。プロセッサ502は、高速インタフェース508に接続されたディスプレイ516のような外部入力/出力装置上のGUIにグラフィカル情報を表示するために、メモリ504または格納装置506に格納された命令を含む、計算装置500内での実行のための命令を処理することができる。他の実施形態では、複数のプロセッサおよび/または複数のバスは、複数のメモリおよびメモリの種類に従い、必要に応じて使用されてもよい。また、複数の計算装置500は、必要な動作の一部を提供する各装置(例えば、サーババンク、一群のブレードサーバ、マルチプロセッサシステム、ピアツーピアネットワーク、グリッドコンピューティングインフラストラクチャまたはアドホックピアツーピアネットワーク)に接続されることができる。
メモリ504は、計算装置500内に情報を格納する。1つの実施形態では、メモリ504は、揮発性メモリユニットまたは複数のユニットである。もう1つの実施形態では、メモリ504は、非揮発性メモリユニットまたは複数のユニットである。メモリ504はまた、磁気または光学ディスクのような他の形式のコンピュータ読取可能な媒体でもよい。
格納装置506は、計算装置500に大容量記憶を提供することができる。1つの実施形態では、格納装置506は、格納エリアネットワークまたは他の構成の装置を含む、フロッピー(登録商標)ディスク装置、ハードディスク装置、光学ディスク装置またはテープ装置、フラッシュメモリまたは他の類似の固体メモリ装置またはアレイ装置のような、コンピュータ読取可能な媒体であり、またはそれを含んでもよい。コンピュータプログラム製品は、情報キャリアに明白に具現化されることができる。コンピュータプログラム製品はまた、実行される時、上記のような一つまたはそれ以上の方法を実行する命令を含むことができる。情報キャリアは、メモリ504、格納装置506、プロセッサ502上のメモリのようなコンピュータまたは機械読取可能な媒体、または伝搬信号である。
高速コントローラ508は、計算装置500の帯域幅集中動作を管理する一方、低速コントローラ512は、比較的低い帯域幅集中動作を管理する。そのような機能の割り当ては、単なる例示である。1つの実施形態では、高速コントローラ508は、メモリ504、ディスプレイ516(例えば、グラフィクスプロセッサまたはアクセラレータを介して)と、各種拡張カード(図示せず)を受けることができる高速拡張ポート510とに接続される。実施形態では、低速コントローラ512は、格納装置506および低速拡張ポート514に接続される。低速拡張ポートは、各種通信ポート(例えば、USB、IEEE1394、ブルートゥース、イーサネット(登録商標)、ワイヤレスイーサネット(登録商標))を含むことができ、キーボード、ポインティングデバイス、スキャナまたはスイッチ若しくはルータ等のネットワーキング装置のような、1つまたはそれ以上の入力/出力装置に、例えばネットワークアダプタを介して接続されることができる。
計算装置500は、図示のような複数の異なる形式で実装されることができる。例えば、標準サーバ520、または一群のそのようなサーバにおいて何回も実装されることができる。また、ラックサーバシステム524の一部として実装されることができる。また、ラップトップコンピュータ522のような個人コンピュータで実装されることができる。そのような装置の各々(例えば、標準サーバ、ラックサーバシステム、個人コンピュータ、ラップトップコンピュータ)は、1つまたは複数の計算装置500を含むことができ、全システムは、互いに接続する複数の計算装置500から作成されてもよい。
いくつかの例では、クライアント装置122は、例えばラップトップ、デスクトップ、ワークステーション、個人デジタル装置、携帯電話または他の携帯計算装置でもよい。
図6は、特にプロセッサ552、メモリ564、ディスプレイ554のような入力/出力装置、接続インタフェース566および送受信器568を含む汎用携帯計算装置550の一例の概略図である。装置550はまた、追加の格納装置を提供するために、マイクロドライブまたは他の装置のような格納装置を備えることができる。各要素550、552、564、554、566および568は、各種バスを用いて相互接続され、いくつかの要素は、必要に応じて共通マザーボード上または他の方法で搭載されてもよい。
プロセッサ552は、メモリ564に格納された命令を含む、計算装置550内で命令を実行することができる。プロセッサは、セパレートおよび複数のアナログおよびデジタルプロセッサを含む1組のチップとして実装されてもよい。プロセッサは例えば、ユーザインタフェースの制御、装置550によって実行されるアプリケーション、および装置550による無線通信のような、装置550の他の要素の調整を提供することができる。
プロセッサ552は、制御インタフェース558とディスプレイ554に接続されたディスプレイインタフェース556とを介してユーザと通信することができる。ディスプレイ554は例えば、TFT(薄膜トランジスタ液晶ディスプレイ)ディスプレイまたはOLED(有機発光ダイオード)ディスプレイまたは他の適当なディスプレイ技術でもよい。ディスプレイインタフェース556は、グラフィックおよび他の情報をユーザに提供するために、ディスプレイ554を駆動する適当な回路を含むことができる。制御インタフェース558は、ユーザからコマンドを受信し、それらをプロセッサ552に提供するために変換することができる。また、外部インタフェース562は、プロセッサ552への通信を提供できるので、装置550の他の装置への近距離通信を可能にする。外部インタフェース562は、いくつかの実施形態では有線通信、または他の実施形態では無線通信を提供でき、複数のインタフェースも使用可能である。
メモリ564は、計算装置550内に情報を格納する。メモリ564は、1つまたは複数のコンピュータ読取可能な媒体またはメディア、揮発性メモリユニットまたは複数のユニット、または非揮発性ユニットまたは複数のユニットとして実装されることができる。拡張メモリ574も提供され、例えばSIMM(シムインラインメモリモジュール)カードインタフェースを含むことができる拡張インタフェース572を介して装置550に接続されることができる。そのような拡張メモリ574は、装置550に対して外部格納空間を提供することができ、また装置550に対してアプリケーションまたは他の情報を格納することができる。特に、拡張メモリ574は、上記プロセッサを実行または補足する命令を含むことができ、さらにセキュア情報を含むことができる。故に例えば、拡張メモリ574は、装置550に対してセキュリティモジュールとして提供されることができ、装置550の安全な使用を許容する命令でプログラムされてもよい。また、セキュアアプリケーションは、ハッキング不可能な方法でSIMMカード上に識別情報を置く等、追加の情報と共にSIMMカードを介して提供されることができる。
メモリは、例えば以下に記載のフラッシュメモリおよび/またはNVRAMメモリを含むことができる。1つの実施形態では、コンピュータプログラム製品は、情報キャリアに明白に具現化される。コンピュータプログラム製品は、実行される時、上記のような1つまたは複数の方法を実行する命令を含む。情報キャリアは、メモリ564、拡張メモリ574、プロセッサ552上のメモリのようなコンピュータまたは機械読取可能な媒体、または例えば送受信器568若しくは外部インタフェース562にわたって受信されうる伝搬信号である。
装置550は、必要に応じてデジタル信号処理回路を含むことができる、通信インタフェース566を介して無線通信することができる。通信インタフェース566は特に、GSM音声呼、SMS、EMSまたはMMSメッセージ、CDMA、TDMA、PDC、WCDMA、CDMA2000またはGPRSのような各種モードまたはプロトコル下で通信を提供することができる。そのような通信は、例えば無線周波数送受信器568を介して発生しうる。また、短距離通信は、ブルートゥース、WiFiまたは他のそのような送受信器(図示せず)を用いる等で発生しうる。また、GPS(地球測位システム)受信モジュール570は、装置550に追加のナビゲーションおよび位置関連無線データを提供でき、装置550上で実行するアプリケーションによって適宜使用されてもよい。
装置550はまた、オーディオコーデック560を用いて音声認識可能に通信でき、ユーザからの音声情報を受信し、それを使用可能なデジタル情報に変換することができる。オーディオコーデック560は同様に、例えば装置550の端末にあるスピーカを介して等、ユーザに関する音声認識可能なサウンドを生成することができる。そのようなサウンドは、音声電話呼からのサウンドを含むことができ、受信されたサウンド(例えば、音声メッセージ、音楽ファイル等)を含むことができ、装置550上で動作するアプリケーションによって生成されたサウンドを含むこともできる。
計算装置550は、図示の通り、複数の異なる形式で実装されることができる。例えば、携帯電話580として実装されてもよい。また、スマート電話582、個人デジタル装置または他の類似の携帯装置の一部として実装されてもよい。
本明細書に記載のシステムおよび手法の各種実施形態は、デジタル電子回路、集積回路、専用設計ASIC(特定用途集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、および/またはそれら組合せで実現されることができる。これらの各種実施形態は、専用または汎用目的でもよく、格納システム、少なくとも1つの入力装置および少なくとも1つの出力装置に対してデータおよび命令を送受信するよう接続され、少なくとも1つのプログラマブルプロセッサを含むプログラマブルシステム上で実行可能および/または解釈可能な1つまたは複数のコンピュータプログラムにおける実施形態を含むことができる。
これらコンピュータプログラム(またプログラム、ソフトウェア、ソフトウェアアプリケーションまたはコードとして知られている)は、プログラマブルプロセッサのための機械命令を含み、高水準手続の、および/またはオブジェクト指向プログラミング言語、および/またはアセンブリ/機械言語で実装されることができる。本明細書で使用されるターム“機械読取可能な媒体”“コンピュータ読取可能な媒体”は、機械読取可能な信号として機械命令を受信する機械読取可能な媒体を含む、プログラマブルプロセッサに機械命令および/またはデータを提供するために使用される任意のコンピュータプログラム製品、装置および/またはデバイス(例えば、磁気ディスク、光学ディスク、メモリ、プログラマブル論理装置(PLD))に言及する。ターム“機械読取可能な信号”は、プログラマブルプロセッサに機械命令および/またはデータを提供するために使用される任意の信号に言及する。
ユーザに命令を提供するために、本明細書に記載のシステムおよび手法は、ユーザに情報を表示するためのCRT(陰極線管)またはLCD(液晶ディスプレイ)のようなディスプレイ装置と、ユーザがコンピュータに入力を提供できるキーボードおよびポインティングデバイス(例えば、マウス、トラックボール、タッチ画面またはiDrive-like要素)とを有するコンピュータ上で実装されることができる。他の種類の装置は、同様にユーザに命令を提供するために使用されることができ、例えば、ユーザに提供されるフィードバックは、任意形式のセンサフィードバック(例えば、視覚フィードバック、音声フィードバックまたは触知フィードバック)でもよく、ユーザからの入力は、音響、発話または触知入力を含む任意形式で受信されることができる。
本明細書に記載のシステムおよび手法は、バックエンド要素(例えば、データサーバ)を含むか、またはミドルウェア要素(例えば、アプリケーションサーバ)を含むか、またはフロントエンド要素(例えば、ユーザが本明細書に記載のシステムおよび手法の実施形態と相互作用可能なグラフィカルユーザインタフェースまたはウェブブラウザを有するクライアントコンピュータ)を含むか、またはそのようなバックエンド、ミドルウェアまたはフロントエンド要素の任意の組合せを含む計算システムで実装されることができる。システムの要素は、デジタルデータ通信(例えば、通信ネットワーク)の任意形式または媒体によって相互接続されることができる。通信ネットワークの例は、ローカルエリアネットワーク(“LAN”)、広域ネットワーク(“WAN”)およびインターネットを含む。
計算システムは、クライアントおよびサーバを含むことができる。クライアントおよびサーバは通常、互いに離間し、一般に通信ネットワークを介して相互作用する。クライアントおよびサーバの関係は、各コンピュータ上で実行され、互いにクライアント−サーバ関係を有するコンピュータプログラムによって生じる。
本発明の複数の実施形態が説明された。しかし、各種修正は、本発明の精神および範囲から逸脱することなく可能であることが分かる。例えば、プライバシ安全クエリ134は、上記カテゴリと異なるカテゴリに分類可能である。広告主106に提供される検索クエリ統計は、上記統計と異なってもよい。2つまたは複数の検索サーバ108、広告サーバおよびクエリ統計エンジン114は、同一の機械、例えばサーバコンピュータによって実行されることができる。検索クエリは、異なる言語で書き込まれたクエリタームを含むことができる。異なる言語で書き込まれた検索クエリは、同一の意味を有していても、異なる検索クエリであると考えることができる。検索クエリの正規化は、上記正規化と異なって実行されてもよい。
人口知能またはパターン一致方法は、プライバシ安全クエリを識別するための処理を増強するために使用されてもよい。例えば、所定の時間期間にわたって提供された少なくとも所定数の固有識別子に関連付けられた検索クエリ116を識別することによってクエリ統計エンジン114がプライバシ安全検索クエリ134を識別した後、クエリ統計エンジン114は、プライバシ安全クエリ134があるタイプの個人情報に類似するパターンを含むかどうかを確かめるために、人口知能またはパターン一致を用いてプライバシ安全クエリ134を検査することができる。例えば、クエリ統計エンジン114は、検索クエリ134を検査して、社会保障番号、またはクレジットカード番号または銀行口座番号に類似するパターンでもよいタイプ“xxx-xx-xxxx”のパターンを含むかを判断することができる。クエリ統計エンジン114は、プライバシ安全クエリログ118からそのような問題あるパターンを含む検索クエリを除外することができる。
例えば、少なくとも所定数の固有識別子は、いくつかの実施形態では、少なくとも10、50または100人の固有のユーザに対応してもよい。他の所定数も使用可能である。所定の時間期間は、例えば所定数のユーザに対応する固有識別子にクエリが一致するスループットを満たすのに必要な時間に基づき、1時間、1日、1週間または他の時間期間でもよい。本明細書に記載の所定値は故に、全体として広告スポンサまたは広告ネットワークが望むクエリのスループットおよび検出レベルに基づき調整可能である。
上記示したフローの各種形式は、ステップを変更、追加または削除して使用されてもよい。また、いくつかの用途および方法が説明されたが、多くの他の用途が考えられることが分かる。また、図示の論理フローは、所望の結果を達成するために、図示された特定の順番または順次的な順番を要しない。他のステップが提供されてもよく、又はステップは、説明したフローから除去されてもよく、他の要素は、説明されたシステムに対して追加または除去されてもよい。従って、他の実施形態は、添付の特許請求の範囲内にある。
本発明の1つまたはそれ以上の実施形態の詳細は、以下の添付図面および詳細な説明で提供される。本発明の他の特徴、目的および利点は、詳細な説明、図面および特許請求の範囲から明らかである。
108 検索サーバ
112 検索クエリログ
126 広告サーバ

Claims (27)

  1. 広告主に提供するためのプライバシ保護されたクエリを判断するコンピュータ実装方法であって:
    広告主から提供された広告に関するクエリ統計のリクエストを広告主から受信する過程と
    所定の時間長さにわたって検索サービスに提供される検索クエリを含む検索クエリログから検索クエリの第1の集合を識別する過程であって、検索クエリログは、ユーザが広告上をクリックすることをもたらした広告の少なくとも1つの表示を検索クエリの第1の集合の各クエリが引起したことを示す、識別する過程と;
    検索クエリの第1の集合から検索クエリの第2の集合を識別する過程であって、識別する過程は、検索クエリの第1の集合から検索クエリを選択する過程を含み、選択された検索クエリ毎に、
    選択された検索クエリに関連付けられる複数の固有識別子を判断し、各固有識別子は、検索クエリを含む検索リクエストを提供した固有のクライアント装置に関連付けられ、
    固有識別子の数が所定数の固有識別子を超える判断に応じて、検索クエリの第2の集合において選択された検索クエリを含み、所定数の固有識別子が1より大きい値を有し、プライバシ保護された検索クエリの第2の集合に含まれる各検索クエリをもたらし、検索クエリの第2の集合に含まれる各検索クエリが個人情報を含まない識別する過程と
    リクエストに応じて広告主に対して、検索クエリの第2の集合の各クエリに関するクエリ統計と、検索クエリの第2の集合とを提供する過程と
    を具備することを特徴とするコンピュータ実装方法。
  2. 固有識別子は、クッキー識別子を具備することを特徴とする請求項1に記載のコンピュータ実装方法。
  3. 各検索クエリと広告に関連付けられたキーワードとの間の類似レベルに基づき、2つまたは複数のカテゴリに検索クエリの第2の集合をカテゴリ化する過程をさらに具備することを特徴とする請求項に記載のコンピュータ実装方法。
  4. 広告主に検索クエリの2つまたは複数のカテゴリを提供する過程をさらに具備することを特徴とする請求項に記載のコンピュータ実装方法。
  5. 検索クエリを正規化する過程をさらに具備することを特徴とする請求項1に記載のコンピュータ実装方法。
  6. 検索クエリを正規化する過程は、検索クエリのクエリタームを識別し、クエリタームの順序を保護することを特徴とする請求項に記載のコンピュータ実装方法。
  7. 広告主に提供するためのプライバシ保護されたクエリを判断するコンピュータ実装方法であって:
    広告主から提供された広告に関するクエリ統計のリクエストを広告主から受信する過程と
    所定の時間長さにわたって検索サービスに提供される検索クエリを含む検索クエリログから1つまたは複数の第1の検索クエリを識別する過程であって、検索クエリログは、ユーザが広告上をクリックすることをもたらした広告の少なくとも1つの表示を第1の検索クエリの各々が引起したことを示す、識別する過程と;
    検索クエリを提供したユーザの個人情報を含む可能性の低い1つまたは複数の第2の検索クエリを第1の検索クエリから識別する過程であって、識別する過程は、第1の検索クエリから検索クエリを選択する過程を含み、選択された検索クエリ毎に、
    選択された検索クエリに関連付けられる複数の固有識別子を判断し、各固有識別子は、検索クエリを含む検索リクエストを提供した固有のクライアント装置に関連付けられ、
    固有識別子の数が所定数の固有識別子を超える判断に応じて、第2の検索クエリとともに選択された検索クエリを含み、所定数の固有識別子が1より大きい値を有し、プライバシ保護された第2の検索クエリに含まれる各検索クエリをもたらし、第2の検索クエリに含まれる各検索クエリが個人情報を含まない識別する過程と
    リクエストに応じて広告主に対して、第2の検索クエリの各々に関するクエリ統計と、第2の検索クエリを提供する過程と
    を具備する過程を具備することを特徴とするコンピュータ実装方法。
  8. 各固有識別子は、固有のクッキー識別子を具備することを特徴とする請求項に記載のコンピュータ実装方法。
  9. 各検索クエリと広告に関連付けられたキーワードまたはキーフレーズとの間の類似レベルに基づき2つまたは複数のカテゴリに1組の検索クエリをカテゴリ化する過程をさらに具備することを特徴とする請求項に記載のコンピュータ実装方法。
  10. 広告主に提供するためのプライバシ保護されたクエリを判断する装置であって:
    検索クエリを提供したユーザの個人データを含む可能性の低い検索クエリの第1および第2の集合を自動的に識別し、所定の時間長さにわたって検索サービスに提供される検索クエリを含む検索クエリログから検索クエリの第1の集合を識別するクエリ統計エンジンであって、クエリ統計エンジンは、ユーザが広告上をクリックすることをもたらした広告の少なくとも1つの表示を検索クエリの第1の集合の各クエリが引起したことを検索クエリログが示すことを判断し、クエリ統計エンジンは、検索クエリの第1の集合から検索クエリを選択し、選択された検索クエリ毎に、
    選択された検索クエリに関連付けられる複数の固有識別子を判断し、各固有識別子は、検索クエリを含む検索リクエストを提供した固有のクライアント装置に関連付けられ、
    固有識別子の数が所定数の固有識別子を超える判断に応じて、検索クエリの第2の集合において選択された検索クエリを含み、所定数の固有識別子が1より大きい値を有し、プライバシ保護された検索クエリの第2の集合に含まれる各検索クエリをもたらし、検索クエリの第2の集合に含まれる各検索クエリが個人情報を含まない、クエリ統計エンジンと
    広告に関連して検索クエリの第2の集合を格納するデータ格納装置と
    を具備することを特徴とする装置。
  11. 検索クエリを含む検索リクエストを受信し、データ格納装置に検索クエリを格納する検索サーバをさらに具備することを特徴とする請求項10に記載の装置。
  12. 固有識別子は、クッキー識別子を具備することを特徴とする請求項10に記載の装置。
  13. クエリ統計エンジンは、検索クエリを正規化することを特徴とする請求項10に記載の装置。
  14. クエリ統計エンジンは、検索クエリのクエリタームを識別してクエリタームの順序を保護することによって検索クエリを正規化することを特徴とする請求項13に記載の装置。
  15. 広告主に提供するためのプライバシ保護されたクエリを判断するコンピュータ実装方法であって:
    広告に関連付けられる少なくとも1つのクエリキーワードに基づき検索クエリ情報のリクエストを受信する過程と、
    所定の時間長さにわたって検索サービスに提供される検索クエリを含む検索クエリの第1の集合を、少なくとも1つのクエリキーワードに関連付けられる検索クエリログから識別する過程であって、検索クエリログは、ユーザが広告上をクリックすることをもたらした広告の少なくとも1つの表示を検索クエリの第1の集合の各クエリが引起したことを示す、識別する過程と;
    検索クエリの第1の集合から検索クエリの第2の集合を識別する過程であって、識別する過程は、検索クエリの第1の集合から検索クエリを選択する過程を含み、選択された検索クエリ毎に、
    選択された検索クエリに関連付けられる複数の固有識別子を判断し、各固有識別子は、検索クエリを含む検索リクエストを提供した固有のクライアント装置に関連付けられ、
    固有識別子の数が所定数の固有識別子を超える判断に応じて、検索クエリの第2の集合において選択された検索クエリを含み、所定数の固有識別子が1より大きい値を有し、プライバシ保護された検索クエリの第2の集合に含まれる各検索クエリをもたらし、検索クエリの第2の集合に含まれる各検索クエリが個人情報を含まない識別する過程と
    広告および少なくとも1つのクエリキーワードに1組の検索クエリを関連付ける過程と
    を具備することを特徴とするコンピュータ実装方法。
  16. 検索クエリログからの検索クエリと少なくとも1つのクエリキーワードとの間の関係は、完全一致を具備することを特徴とする請求項15に記載のコンピュータ実装方法。
  17. 検索クエリログからの検索クエリと少なくとも1つのクエリキーワードとの間の関係は、拡張一致を具備することを特徴とする請求項15に記載のコンピュータ実装方法。
  18. 検索クエリログからの検索クエリと少なくとも1つのクエリキーワードとの間の関係は、広義一致を具備することを特徴とする請求項15に記載のコンピュータ実装方法。
  19. 検索クエリログからの検索クエリと少なくとも1つのクエリキーワードとの間の関係は、少なくとも2つの完全一致、拡張一致または広義一致の組合せを具備することを特徴とする請求項15に記載のコンピュータ実装方法。
  20. 各検索クエリとクエリキーワードとの間の類似レベルに基づき2つまたは複数のカテゴリに1組の検索クエリをカテゴリ化する過程をさらに具備することを特徴とする請求項19に記載のコンピュータ実装方法。
  21. 広告主に検索クエリの2つまたは複数のカテゴリを提供する過程をさらに具備することを特徴とする請求項20に記載のコンピュータ実装方法。
  22. 固有識別子は、クッキー識別子を具備することを特徴とする請求項15に記載のコンピュータ実装方法。
  23. データ格納装置と
    検索クエリを含む検索リクエストを受信し、データ格納装置に検索クエリを格納する検索サーバと
    広告の設置のために広告スポンサから広告を受信する広告サーバと
    検索クエリを提供したユーザの個人データを含む可能性の低い検索クエリの第1および第2の集合検索サーバから自動的に識別し、所定の時間長さにわたって検索サーバに提供される検索クエリを含む検索クエリログから検索クエリの第1の集合を識別するクエリ統計エンジンであって、クエリ統計エンジンは、ユーザが第1の広告上をクリックしたことをもたらした第1の広告スポンサからの第1の広告の少なくとも1つの表示を検索クエリの第1の集合の各クエリが引起したことを検索クエリログが示すことを判断し、クエリ統計エンジンは、検索クエリの第1の集合から検索クエリを選択し、選択された検索クエリ毎に、
    選択された検索クエリに関連付けられる複数の固有識別子を判断し、各固有識別子は、検索クエリを含む検索リクエストを提供した固有のクライアント装置に関連付けられ、
    固有識別子の数が所定数の固有識別子を超える判断に応じて、検索クエリの第2の集合において選択された検索クエリを含み、所定数の固有識別子が1より大きい値を有し、プライバシ保護された検索クエリの第2の集合に含まれる各検索クエリをもたらす、クエリ統計エンジンと
    第1の広告スポンサからの第1の広告に検索クエリの第2の集合を一致させる一致エンジンと
    を具備することを特徴とする装置。
  24. 一致エンジンは、少なくとも1つの完全一致エンジン、拡張一致エンジンおよび広義一致エンジンを具備することを特徴とする請求項23に記載の装置。
  25. 固有識別子は、クッキー識別子を具備することを特徴とする請求項23に記載の装置。
  26. クエリ統計エンジンは、検索クエリを正規化することを特徴とする請求項23に記載の装置。
  27. クエリ統計エンジンは、検索クエリのクエリタームを識別してクエリタームの順序を保護することによって検索クエリを正規化することを特徴とする請求項26に記載の装置。
JP2010509523A 2007-05-21 2008-05-21 クエリ統計プロバイダ Active JP5255055B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US93934507P 2007-05-21 2007-05-21
US60/939,345 2007-05-21
PCT/US2008/064367 WO2008144732A1 (en) 2007-05-21 2008-05-21 Query statistics provider

Publications (3)

Publication Number Publication Date
JP2010530566A JP2010530566A (ja) 2010-09-09
JP2010530566A5 JP2010530566A5 (ja) 2011-07-07
JP5255055B2 true JP5255055B2 (ja) 2013-08-07

Family

ID=40073346

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010509523A Active JP5255055B2 (ja) 2007-05-21 2008-05-21 クエリ統計プロバイダ

Country Status (7)

Country Link
US (1) US8099412B2 (ja)
EP (1) EP2171621B1 (ja)
JP (1) JP5255055B2 (ja)
CN (1) CN101796515B (ja)
AU (1) AU2008254644B2 (ja)
ES (1) ES2428546T3 (ja)
WO (1) WO2008144732A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9871813B2 (en) 2014-10-31 2018-01-16 Yandex Europe Ag Method of and system for processing an unauthorized user access to a resource
US9900318B2 (en) 2014-10-31 2018-02-20 Yandex Europe Ag Method of and system for processing an unauthorized user access to a resource

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7937383B2 (en) * 2008-02-01 2011-05-03 Microsoft Corporation Generating anonymous log entries
JP4739364B2 (ja) * 2008-04-08 2011-08-03 株式会社日立製作所 サービス使用経路出力システム、管理サーバ、サービス使用経路出力方法、およびサービス使用経路出力プログラム
US9002732B2 (en) * 2008-04-14 2015-04-07 Ebay Inc. Keeping popular advertisements active
US10192235B2 (en) * 2009-05-29 2019-01-29 Red Hat, Inc. Collaborative optimization of online advertisement return on investment
US8601024B2 (en) * 2009-06-16 2013-12-03 Microsoft Corporation Synopsis of a search log that respects user privacy
US9026542B2 (en) * 2009-07-25 2015-05-05 Alcatel Lucent System and method for modelling and profiling in multiple languages
US8250059B2 (en) * 2009-09-14 2012-08-21 International Business Machines Corporation Crawling browser-accessible applications
US8566408B2 (en) * 2010-08-13 2013-10-22 Intuit Inc. Method and system for providing a stateful experience while accessing content using a global textsite platform
US9015244B2 (en) * 2010-08-20 2015-04-21 Bitvore Corp. Bulletin board data mapping and presentation
US8775606B2 (en) * 2010-12-02 2014-07-08 Yahoo! Inc. System and method for counting network users
US9727892B1 (en) 2011-10-28 2017-08-08 Google Inc. Determining related search terms for a domain
CN102760156B (zh) * 2012-06-05 2016-01-13 百度在线网络技术(北京)有限公司 一种用于生成与关键词相对应的发布信息的方法、装置与设备
US20130332290A1 (en) * 2012-06-11 2013-12-12 Rory W. Medrano Personalized online shopping network for goods and services
CN102779192B (zh) * 2012-07-04 2015-11-25 小米科技有限责任公司 一种关联用户的方法和装置
US9043302B1 (en) * 2012-07-25 2015-05-26 Google Inc. Campaign and competitive analysis and data visualization based on search interest data
CN103020141B (zh) * 2012-11-21 2016-06-08 北京百度网讯科技有限公司 一种用于提供搜索结果的方法和设备
US9378517B2 (en) 2013-07-03 2016-06-28 Google Inc. Methods and systems for providing potential search queries that may be targeted by one or more keywords
CN104573043A (zh) * 2015-01-19 2015-04-29 郑州悉知信息技术有限公司 一种电子商务网站的数据分析方法及系统
US20170068720A1 (en) * 2015-09-04 2017-03-09 Google Inc. Systems and methods for classifying data queries based on responsive data sets
US9953185B2 (en) * 2015-11-24 2018-04-24 Google Llc Identifying query patterns and associated aggregate statistics among search queries
US10496686B2 (en) * 2016-06-13 2019-12-03 Baidu Usa Llc Method and system for searching and identifying content items in response to a search query using a matched keyword whitelist
JP7006013B2 (ja) * 2017-08-22 2022-01-24 富士通株式会社 データ提供プロラム、データ提供方法、及びデータ提供装置
CN107798556A (zh) * 2017-09-26 2018-03-13 上海连尚网络科技有限公司 用于更新状况记录的方法、设备和存储介质
JP6980666B2 (ja) * 2017-11-09 2021-12-15 グーグル エルエルシーGoogle LLC オンデマンドの位置訪問コンバージョンメトリック
US11372871B1 (en) * 2020-02-21 2022-06-28 Rapid7, Inc. Programmable framework for distributed computation of statistical functions over time-based data
CN111782611B (zh) * 2020-06-30 2024-01-23 北京百度网讯科技有限公司 预测模型建模方法、装置、设备及存储介质
CN115988245B (zh) * 2022-12-12 2024-04-16 四川启睿克科技有限公司 基于安全多方计算隐私信息检索的智能电视广告推荐方法

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5640553A (en) * 1995-09-15 1997-06-17 Infonautics Corporation Relevance normalization for documents retrieved from an information retrieval system in response to a query
US6519585B1 (en) * 1999-04-27 2003-02-11 Infospace, Inc. System and method for facilitating presentation of subject categorizations for use in an on-line search query engine
US6438537B1 (en) 1999-06-22 2002-08-20 Microsoft Corporation Usage based aggregation optimization
US6701309B1 (en) * 2000-04-21 2004-03-02 Lycos, Inc. Method and system for collecting related queries
US20030187739A1 (en) * 2001-06-07 2003-10-02 Powers Arthur C. System and method of providing an interface to the internet
US7283951B2 (en) * 2001-08-14 2007-10-16 Insightful Corporation Method and system for enhanced data searching
US6938035B2 (en) * 2001-10-03 2005-08-30 International Business Machines Corporation Reduce database monitor workload by employing predictive query threshold
US20050222901A1 (en) 2004-03-31 2005-10-06 Sumit Agarwal Determining ad targeting information and/or ad creative information using past search queries
US20030208594A1 (en) * 2002-05-06 2003-11-06 Urchin Software Corporation. System and method for tracking unique visitors to a website
WO2004038547A2 (en) * 2002-10-21 2004-05-06 Ebay Inc. Listing recommendation in a network-based commerce system
US20040244029A1 (en) * 2003-05-28 2004-12-02 Gross John N. Method of correlating advertising and recommender systems
US7617202B2 (en) * 2003-06-16 2009-11-10 Microsoft Corporation Systems and methods that employ a distributional analysis on a query log to improve search results
JP2006079454A (ja) * 2004-09-10 2006-03-23 Fujitsu Ltd 検索キーワード分析方法、検索キーワード分析プログラムおよび検索キーワード分析装置
US20060064411A1 (en) * 2004-09-22 2006-03-23 William Gross Search engine using user intent
US20060123001A1 (en) * 2004-10-13 2006-06-08 Copernic Technologies, Inc. Systems and methods for selecting digital advertisements
US8364670B2 (en) * 2004-12-28 2013-01-29 Dt Labs, Llc System, method and apparatus for electronically searching for an item
US20060149625A1 (en) * 2004-12-30 2006-07-06 Ross Koningstein Suggesting and/or providing targeting information for advertisements
US20060173744A1 (en) * 2005-02-01 2006-08-03 Kandasamy David R Method and apparatus for generating, optimizing, and managing granular advertising campaigns
US7810142B2 (en) * 2005-03-21 2010-10-05 International Business Machines Corporation Auditing compliance with a hippocratic database
US7788131B2 (en) * 2005-12-15 2010-08-31 Microsoft Corporation Advertising keyword cross-selling
US7752190B2 (en) * 2005-12-21 2010-07-06 Ebay Inc. Computer-implemented method and system for managing keyword bidding prices
CN1848168A (zh) * 2006-03-27 2006-10-18 杨智晟 由广告费决定目标受众人数的互联网分类广告电子商务系统
US8126874B2 (en) * 2006-05-09 2012-02-28 Google Inc. Systems and methods for generating statistics from search engine query logs
US7975150B1 (en) * 2006-06-28 2011-07-05 Hewlett-Packard Development Company, L.P. Method and system for protecting queryable data
US7693805B2 (en) * 2006-08-01 2010-04-06 Yahoo, Inc. Automatic identification of distance based event classification errors in a network by comparing to a second classification using event logs
US20080104021A1 (en) * 2006-10-30 2008-05-01 Yigang Cai Systems and methods for controlling access to online personal information
US7941436B2 (en) * 2006-11-30 2011-05-10 Yahoo, Inc. Keyword bidding strategy for novel concepts
US20090112805A1 (en) * 2007-10-31 2009-04-30 Zachary Adam Garbow Method, system, and computer program product for implementing search query privacy

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9871813B2 (en) 2014-10-31 2018-01-16 Yandex Europe Ag Method of and system for processing an unauthorized user access to a resource
US9900318B2 (en) 2014-10-31 2018-02-20 Yandex Europe Ag Method of and system for processing an unauthorized user access to a resource

Also Published As

Publication number Publication date
CN101796515B (zh) 2013-09-18
ES2428546T3 (es) 2013-11-08
JP2010530566A (ja) 2010-09-09
US8099412B2 (en) 2012-01-17
EP2171621B1 (en) 2013-09-04
CN101796515A (zh) 2010-08-04
WO2008144732A1 (en) 2008-11-27
AU2008254644A1 (en) 2008-11-27
AU2008254644B2 (en) 2013-11-21
EP2171621A4 (en) 2012-05-30
US20080294630A1 (en) 2008-11-27
EP2171621A1 (en) 2010-04-07

Similar Documents

Publication Publication Date Title
JP5255055B2 (ja) クエリ統計プロバイダ
JP6334696B2 (ja) ハッシュタグおよびコンテンツ提示
JP5810452B2 (ja) インパクト分析や影響追跡を含むマルチメディアのためのデータ収集、追跡及び分析手法
US11164208B2 (en) Presenting options for content delivery
US9767183B2 (en) Method and system for enhanced query term suggestion
US20120054440A1 (en) Systems and methods for providing a hierarchy of cache layers of different types for intext advertising
US20090204598A1 (en) Ad retrieval for user search on social network sites
US20210406685A1 (en) Artificial intelligence for keyword recommendation
JP2014519074A (ja) キーワードのローカライズ翻訳
WO2014120869A1 (en) Content sequencing
US11860955B2 (en) Method and system for providing alternative result for an online search previously with no result
JP6733037B2 (ja) アプリケーション情報をトリガすること
US20170228462A1 (en) Adaptive seeded user labeling for identifying targeted content
WO2014011866A1 (en) Predicting visibility of content items
US8538946B1 (en) Creating model or list to identify queries
US9720983B1 (en) Extracting mobile application keywords
US9092463B2 (en) Keyword generation
US10497031B1 (en) Conditional bids in an auction
US20160055203A1 (en) Method for record selection to avoid negatively impacting latency
RU2589856C2 (ru) Способ обработки целевого сообщения, способ обработки нового целевого сообщения и сервер (варианты)
US9767196B1 (en) Content selection
JP2010272082A (ja) 情報共有システム、情報共有方法、および情報共有プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110517

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110517

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121114

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121120

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130219

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130319

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130418

R150 Certificate of patent or registration of utility model

Ref document number: 5255055

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160426

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250