JP5542812B2 - クエリ識別および関連付け - Google Patents

クエリ識別および関連付け Download PDF

Info

Publication number
JP5542812B2
JP5542812B2 JP2011516497A JP2011516497A JP5542812B2 JP 5542812 B2 JP5542812 B2 JP 5542812B2 JP 2011516497 A JP2011516497 A JP 2011516497A JP 2011516497 A JP2011516497 A JP 2011516497A JP 5542812 B2 JP5542812 B2 JP 5542812B2
Authority
JP
Japan
Prior art keywords
query
candidate
candidate query
page
landing page
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011516497A
Other languages
English (en)
Other versions
JP2011525678A (ja
JP2011525678A5 (ja
Inventor
ラマナタン・ヴィ・グハ
シヴァクマール・ヴェンカタラーマン
ヴィニート・グプタ
ゴーカイ・バリス・グールテキン
プラッドニヤ・カルブハリー
アビナヴ・ジャラン
Original Assignee
グーグル・インコーポレーテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by グーグル・インコーポレーテッド filed Critical グーグル・インコーポレーテッド
Publication of JP2011525678A publication Critical patent/JP2011525678A/ja
Publication of JP2011525678A5 publication Critical patent/JP2011525678A5/ja
Application granted granted Critical
Publication of JP5542812B2 publication Critical patent/JP5542812B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • G06Q30/0256User search
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising

Description

本文書は情報処理に関する。
本出願は、参照により本明細書に組込まれる、2008年6月23日に出願された「QUERY IDENTIFICATION AND ASSOCIATION」という名称の米国仮特許出願第61/074,945号の米国特許法第119条(e)の下での利益を主張する。
インターネットは、いろいろなウェブ文書、たとえば、ビデオおよび/またはオーディオファイル、特定の主題についてのウェブページ、ニュース記事などに対するアクセスを可能にする。これらのウェブ文書に対するこうしたアクセスは、ターゲット広告(targeted advertizing)について同じように利用可能な機会(likewise enabled opportunity)を有する。たとえば、ユーザにとって特に関心があるウェブ文書は、ユーザのクエリに応答して検索エンジンによって識別され得る。クエリは、1つまたは複数の検索用語を含むことができ、また、検索エンジンは、クエリ内の検索用語に基づいてウェブ文書を識別する、また任意選択で、ランク付けし、(たとえば、ランクに従って)ウェブ文書をユーザに提示することができる。このクエリはまた、ユーザにとって関心のある情報のタイプのインジケータであり得る。ユーザのクエリを、広告主によって指定されたクエリおよびキーワードのリストと比較することによって、ユーザにターゲット広告を提供することが可能である。ターゲット広告は、ランディングページに対するリンクを含むことができ、リンクの選択は、ランディングページを、ウェブブラウジングデバイス上で表示させることができる。
広告主は、通常、提供される広告主の製品またはサービスに関連する可能性がある、ユーザによって提示される特定のクエリを予測しようと試みる。広告主によって指定されるキーワードは、広告主によって提供される製品またはサービスに関連するキーワードを含み得る。これらのキーワードは、広い意味で、広告主によって提供される製品またはサービスに一致し得る。たとえば、キーワード「花(flower)」は、広い意味で、ウェブ文書内の「花屋(florist)」に一致する可能性がある。しかし、こうした広い意味での一致は、望ましいものには程遠い結果(たとえば、より少数のコンバージョン)を生じ得る。さらに、広告主は、特に関連性があるキーワードを識別しない可能性がある(「抜けているキーワード(missing keyword)」と呼ばれる)。そのため、抜けているキーワードを含むクエリは、広告主のコンテンツに対して関連性が少ないと見なされてもよい。したがって、製品についての特定のクエリは、時として、そのクエリに著しく関連性があるランディングページにリンクする広告の選択をもたらさない可能性がある。
米国特許第6,285,999号
S. BrinおよびL. Page著「The Anatomy of a Large-Scale Hypertextual Search Engine」Seventh International World Wide Web Conference, Brisbane, Australia(1998)
一般に、本明細書で述べる主題の一態様は、クエリログに格納されたクエリから候補クエリを識別するアクションと、複数のウェブ文書について関連性スコアを生成するアクションであって、各関連性スコアは、対応するウェブ文書に関連付けられ、かつ、ウェブ文書に対する候補クエリの関連性の尺度である、生成するアクションと、関連性閾値を超える関連付けられた関連性スコアを有するウェブ文書を選択するアクションと、選択されたウェブ文書を候補クエリに関連付けるアクションとを含む方法において具現化され得る。この態様の他の実施形態は、対応するシステム、装置、およびコンピュータプログラム製品を含む。
本明細書で述べる主題の別の態様は、クエリ抽出基準を規定するアクションであって、クエリ抽出基準は、主題関連性に関連したクエリを識別するように構成される、規定するアクションと、抽出基準に従って、クエリログに格納されたクエリから候補クエリを識別するアクションと、ウェブ文書の第1のセットについて関連性スコアを生成するアクションであって、各関連性スコアは、ウェブ文書の第1のセット内の対応するウェブ文書に関連付けられ、かつ、ウェブ文書に対する候補クエリの関連性の尺度である、生成するアクションと、関連性閾値を超える関連付けられた関連性スコアを有するウェブ文書を選択するアクションと、選択されたウェブ文書および候補クエリからクエリ-ページ候補タプルを生成するアクションとを含む方法において具現化され得る。この態様の他の実施形態は、対応するシステム、装置、およびコンピュータプログラム製品を含む。
本明細書で述べる主題の1つまたは複数の実施形態の詳細は、添付図面および以下の説明で述べられる。主題の他の特徴、態様、および利点は、説明、図面、および特許請求の範囲から明らかになるであろう。
例示的なオンライン環境のブロック図である。 例示的なオペレーションプロセスを示すブロック図である。 例示的な抽出プロセスを示すブロック図である。 例示的な候補クエリ-ページプロセスを示すブロック図である。 例示的なフィルタリングプロセスを示すブロック図である。 広告に関するクエリ-ページタプルの例示的な関連付けを示すブロック図である。 既存の広告に関するクエリ-ページタプルの例示的な関連付けを示すブロック図である。 広告に関するクエリ-ページタプルの別の例示的な関連付けを示すブロック図である。 広告に関するクエリ-ページタプルの別の例示的な関連付けを示すブロック図である。 クエリカテゴリに関するクエリ-ページタプルの例示的な関連付けを示すブロック図である。 クエリ-ページ候補タプルを識別する例示的なプロセスのフローチャートである。 クエリ抽出のための例示的なプロセスのフローチャートである。 クエリ-ページ候補タプルをフィルタリングする例示的なプロセスのフローチャートである。 クエリ-ページタプルを広告グループに関連付ける例示的なプロセスのフローチャートである。 クエリをカテゴリに関連付ける例示的なプロセスのフローチャートである。 例示的なコンピュータシステムの図である。
種々の図面における同様な参照数字および指定は、同様な要素を示す。
図1は、例示的なオンライン環境100のブロック図である。オンライン環境100は、ウェブ文書、たとえば、ウェブページ、広告などの識別およびユーザに対するサービス提供を容易にし得る。ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、インターネット、またはその組合せなどのコンピュータネットワーク110は、広告主102、検索エンジン112、発行者106、およびユーザデバイス108を接続する。例示的なユーザデバイス108は、パーソナルコンピュータ、移動体通信デバイス、テレビジョンセットトップボックスなどを含む。オンライン環境100は、何千もの広告主、発行者、およびユーザデバイスを含んでもよい。
§1.0 検索処理
ユーザデバイス108aなどのユーザデバイスは、検索エンジン112に検索クエリ109を提示することができ、検索結果ページ111は、検索クエリ109に応答してユーザデバイス108aに提供され得る。検索結果ページ111は、発行者106によって提供されるウェブ文書に対する1つまたは複数のリンクを含み得る。
一部の実施態様では、検索クエリ109は、1つまたは複数の検索用語を含み得る。検索用語は、応答性がある検索結果を取り出すために使用される検索エンジン112を通して検索クエリの一部として提示される1つまたは複数のキーワードの形態であり得る。たとえば、ユーザデバイス108aのユーザは、星形状ケーキパンを購入するために、オンラインストアを検索することができる。提示される検索クエリ109は、「星ケーキパン(star cake pan)」のためのものであり得る。この例の検索用語は、「星(star)」、「ケーキ(cake)」、および「パン(pan)」であり得る。
発行者106は、一般的なコンテンツサーバを含むことができ、一般的なコンテンツサーバは、コンテンツ(たとえば、記事に関連するウェブ文書、議論スレッド(discussion thread)、音楽、ビデオ、グラフィック、他のウェブ文書リスト、情報フィード、製品レビューなど)について検索クエリ109の形態で要求を受信し、検索クエリ109に応答して、検索結果ページ111上でコンテンツに対するリンクを取り出す。たとえば、ニュースコンテンツプロバイダ、小売業者、独立系ブロブ、ソーシャルネットワークサイト、販売用の製品に関連するコンテンツサーバ、または、ネットワーク110を通じてコンテンツを提供する任意の他のエンティティは、発行者であり得る。
クエリに応答するコンテンツの識別を容易にするために、検索エンジン112は、クエリに関連性がある検索結果118の後での検索および取出しのために、発行者106および広告主102によって提供されるコンテンツにインデックス(たとえば、ウェブインデックス120などのキャッシュされたウェブ文書のインデックス)を付け得る。例示的な検索エンジン112は、非特許文献1および特許文献1に記載される。探索結果は、識別され、種々の関連性スコア、たとえば、キャッシュされかつインデックス付けされたウェブ文書のテキスト、識別された文書の特徴ベクトル、および他の検索処理技法に基づく情報取出し(information retrieval)(「IR」)スコアによってランク付けされ得る。一部の実施態様では、IRスコアは、たとえば、クエリおよび文書に対応する特徴ベクトルのドット積、ページランクスコア、および/またはIRスコアとページランクスコアの組合せなどから計算され得る。
検索結果118は、たとえば、ウェブ文書表題、これらのウェブ文書から抽出されるテキストのスニペット、およびこれらのウェブ文書に対するハイパーリンクのリストを含むことができ、また、所定の数(たとえば、10)の検索結果にグループ分けされてもよい。検索結果118はまた、検索エンジン112によってランク付けされ、検索結果ページ111上でコンテンツとして提示され得る。
検索クエリ109内の検索用語は、検索結果ページ111を通して検索エンジン112によって提供される検索結果118をコントロールする。検索結果118の実際のランク付けは、検索エンジン112によって使用されるランク付けアルゴリズムに基づいて変わるが、検索エンジン112は、検索クエリ109を通して提示される検索用語に基づいて検索結果118を取り出し、ランク付けし得る。たとえば、「星ケーキパン」についての検索クエリは、検索用語「星」、「ケーキ」、および「パン」に基づいてケーキパンのオンライン小売業者に関連する検索結果を生じ得る。
§2.0 スポンサがついたコンテンツ
一部の実施態様では、検索結果ページ111は、広告116を含み得る、または、ネットワークを通じて広告116を要求する、ユーザデバイス108aにおいて実行され得る実行可能命令、たとえば、Java(登録商標)Script命令を含み得る。広告116は、バナー広告などのグラフィカルな広告、テキストだけの広告、イメージ広告、オーディオ広告、ビデオ広告、こうしたコンポーネントの任意の1つまたは複数を組合せる広告、あるいは、任意の他のタイプの電子広告文書の形態であり得る。広告116はまた、ランディングページに対するリンクなどの埋め込み情報を含む。
任意のウェブ文書は、ランディングページとすることができ、ランディングページは、別のウェブ文書、広告、または検索結果からリンクされるか、または、リンクされ得る任意のウェブ文書である。たとえば、ランディングページは、販売のために広告主の製品またはサービスを記述する、かつ/または、提供するウェブ文書であり得る。ランディングページはまた、たとえば、広告主用のホームページ、たとえば、会社のホームページであり得る。
広告116は、検索エンジン112に対して提示された検索クエリのキーワードに基づいて広告管理システム104によって選択され得る。一部の実施態様では、広告116は、キーワードに関連付けられ、特定のキーワードが検索クエリ内で識別されると、これらのキーワードに関連付けられる広告116は、検索結果ページ111上での表示のために選択され得る。
広告が検索クエリに基づいて選択されることに加えて、広告はまた、オークションから選択され得る。一実施態様では、広告との各相互作用について広告主102が喜んで支払う意思のある総額、たとえば、ユーザが広告をクリックするときに広告主が支払うコストパークリック(cost-per-click)総額を選択する、または、値付けし得る。コストパークリックは、最大コストパークリック、たとえば、キーワードに基づく広告の各クリックについて広告主が喜んで支払う意思のある最大総額を含み得る。表示される広告のランクは、広告についての最大コストパークリックを広告の品質スコアで乗算することによって決定することができ、広告の品質スコアは、クエリのキーワードに対する広告の関連性によって部分的に決定することができる。広告は、その後、ランクを上げるかまたは下げるために、他の広告の間に配置され得る。
広告管理システム104は、広告データ124内に広告情報を格納することができる。広告管理システム104はまた、キャンペーンデータ126内に広告キャンペーンに関連する情報を格納することができる。キャンペーンデータ126は、たとえば、広告のための広告予算を指定し、キーワードを広告およびランディングページに関連付け、いつ、どこで、またどのような条件下で、特定の広告が、提示のためにサービス提供されてもよいかを指定し得る。
広告主102、発行者106、ユーザデバイス108、および/または検索エンジン112はまた、使用状況情報を広告管理システム104に提供し得る。この使用状況情報は、たとえば、広告116に関連するコンバージョンまたは選択が起こったか否かなどの、サービス提供された広告116に関連する、測定されるかまたは観測されるユーザ挙動を含み得る。広告管理システム104は、使用状況情報に基づいて、発行者106に貸付を行うことおよび広告主102に課金することなど、財務トランザクションを実施する。こうした使用状況情報はまた、クリックスルーレート(click-through rate)(「CTR」)、コンバージョンレートなどのような性能メトリックを測定するために処理され得る。
クリックスルーは、たとえば、ユーザデバイスのユーザが、発行者または広告管理システムによって返送されたウェブ文書に対するリンクを選択する、または、「クリックする(click)」ときに起こり得る。CTRは、ウェブ文書、たとえば、ランディングページに対するリンク、広告116、または検索結果118をクリックしたユーザの数を、ウェブ文書が送出された回数で割ることによって得られる性能メトリックである。「コンバージョン(conversion)」は、以前にサービス提供された広告116に関連するトランザクションをユーザが完了するときに起こる。コンバージョンを構成するものは、事例ごとに変わる可能性があり、種々の方法で決定することができる。たとえば、コンバージョンは、ユーザが、広告116をクリックし、広告主のランディングページへ案内され、そのランディングページを去る前にそこで購入を完了するときに起こる可能性がある。コンバージョンを構成する他のアクションもまた使用され得る。
§3.0 広告に関するクエリ関連付け
広告主102が広告に関連付けるキーワードは、広告されている商業的提供(commercial offering)に関連する情報を検索するときにユーザが使用する可能性があるキーワードに基づいて選択され得る。商業的提供は、トランザクション、たとえば、製品またはサービスの販売のためのランディングページ上での任意の機会であり得る。そのため、広告管理システム104の使用によって、広告主102は、商業的提供のための広告主102の広告116をクエリのキーワードに関連付けることができる。たとえば、ケーキパンの小売業者は、ケーキパンを検索するユーザが、おそらく検索クエリ内に検索用語「ケーキ」および「パン」を含むことになることを予測し得る。そのため、ケーキパンの小売業者は、その広告を、キーワード「ケーキ」および「パン」に関連付け得る。キーワード、ケーキおよびパンを含む検索は、ケーキパンの小売業者によって提供される広告の提示をもたらし得る。
しかし、厳密にまたは広い意味で一致するキーワードの使用は、ユーザの関心に関連性があるランディングページにリンクする広告の識別を常にもたらす可能性はない。そのため、代替法は、クエリを処理し、全体としてのクエリ、任意選択で、クエリの個々のキーワードを、広告および/またはランディングページに関連付けることである。しかし、ユーザによって提示され、かつ、クエリログ128に格納された何百万もの検索クエリが存在するため、プロセスは、非常に難しい。
そのため、一部の実施態様では、広告管理システム104は、クエリ-ページ識別子114を使用することができ、クエリ-ページ識別子114は、特定のランディングページに関連性があると判定される格納されたクエリをクエリログ128から識別し得る。クエリ-ページ識別子114は、まず、クエリログ128から候補クエリを識別し、次に、検索エンジン112の使用によって候補クエリに関連するランディングページを識別する。一部の実施態様では、検索エンジン112は、ウェブインデックス120内で、インデックス付けされたウェブ文書の適切なサブセットを検索する。適切なサブセットは、商業関連ランディングページである。各クエリについて、関連性閾値を超える識別されたランディングページは、クエリ-ページ識別子114によって候補クエリに関連付けられ、クエリ-ページ識別子114は、その後、これらの関連付けをクエリ-ページタプル122として格納する。
例として、クエリ-ページ識別子114は、クエリ「トレーンケーキパン(train cake pan)」が、「トレーンケーキパン」製品を提供するオンラインストアAについて特定のランディングページの識別をもたらす可能性があると判定し得る。こうして、クエリ-ページ識別子114は、オンラインストアAのトレーンケーキパンについてのランディングページを、候補クエリ「トレーンケーキパン」に関連付けることになる。その後、クエリ「トレーンケーキパン」、または、たとえば、用語、トレーン、ケーキ、およびパンの並べ換えを含む任意のクエリを、ユーザが提示すると、ランディングページにリンクする広告が、識別され、検索結果ページ111内で提供され得る。
図2は、例示的なオペレーションプロセスを示すブロック図200である。3つのフェーズは、抽出フェーズ、候補クエリ-ページフェーズ、およびフィルタリングフェーズを含む。これらのフェーズは、例証に過ぎず、より多くのまたはより少ないフェーズが使用され得る。
抽出フェーズでは、候補クエリが、クエリログ128から識別される。候補クエリ-ページフェーズでは、検索エンジン112が、候補クエリに関連するランディングページ(たとえば、ウェブインデックス120)を検索し、候補クエリ-ページタプルを生成するために使用され得る。フィルタリングフェーズでは、識別された候補クエリ-ページタプルが、種々の関連性基準に基づいて(たとえば、フィルタ208によって)フィルタリングされ得る。フィルタ208によって削除されない候補クエリ-ページタプルは、広告データ212内で広告に関連付けされるか、広告との関連付けのための提案を規定する提案データ210に格納されるか、または、何らかの他のデータ解析または他のプロセスで使用され得る。
一部の実施態様では、候補クエリを識別するために、クエリ-ページ識別子114は、1つまたは複数の抽出基準を満たすクエリをクエリログ128から識別する。一部の実施態様では、抽出基準は、商業に関するクエリ、たとえば、商業的に関連性があるクエリを識別するために使用される。一部の実施態様では、クエリ-ページ識別子114は、ある期間の間にクエリが少なくとも最小回数で提示され、かつ、最大回数未満でなければ、クエリを、商業的に関連性があると考えない。クエリが、商業的に関連性があるかどうかを判定する他の方法も使用され得る。これらの商業的に関連性があるクエリは、候補クエリとして識別される。たとえば、クエリ-ページ識別子114は、クエリログ128が、「トレーンケーキパン」についてのクエリを含むことを識別し得る。「トレーンケーキパン」についてのクエリは、最小提示頻度閾値を超えて提示された場合で、かつ、最大提示頻度閾値を超えて提示されなかった場合に、商業的に関連性があると考えられ得る。
先の例の候補クエリ-ページフェーズ中に、ウェブインデックス120が、識別された候補クエリを使用して検索される。一部の実施態様では、商業的提供を含むランディングページのセットを含むウェブインデックス120の適切なサブセットは、候補クエリを使用して検索される。たとえば、ウェブインデックス120の適切なサブセットは、販売用の製品またはサービスを挙げるランディングページのサブセットを含み得る。たとえば、ケーキパンを販売し、また、全てがランディングページを有する5つの異なるオンラインストアは、ウェブインデックス120の適切なサブセットの一部であり得る。逆に、政府サイトは、ウェブインデックスに含まれるウェブ文書を有する可能性があるが、政府サイトからのウェブ文書は、ウェブインデックスの適切なサブセットの一部であると考えられない可能性がある。
クエリ-ページ識別子114は、各候補クエリに関連するランディングページを見出すために、ウェブインデックス120の適切なサブセットを検索する検索エンジン112を使用し得る。一部の実施態様では、各候補クエリについて、検索エンジン112は、適切なサブセット内の各ウェブ文書に関連性スコアを割当てることができ、関連性スコアは、そのウェブ文書に対する候補クエリの関連性を測定する。たとえば、5つのオンラインストアのうちの2つ、オンラインストアAおよびオンラインストアBは、トレーンケーキパンを販売し、それぞれが、トレーンケーキパンを対象とする(directed to)ランディングページを有し、一方、他の3つのオンラインストアは、より従来的なケーキパンを販売するだけである。そのため、オンラインストアAおよびオンラインストアBについて「トレーンケーキパン」を含むランディングページは、クエリ「トレーンケーキパン」についての他の3つのオンラインストア用のランディングページに比べてより高い関連性スコアを有することになる。
クエリ-ページ識別子114は、ランディングページの関連性スコアに基づいて、識別されたランディングページのセットから候補ランディングページを選択し得る。一部の実施態様では、検索エンジン112は、関連性閾値を越える関連性スコアを割当てられたランディングページだけを選択する。たとえば、検索エンジン112は、オンラインストアAおよびオンラインストアBがそれぞれ、関連性閾値を越える関連性スコアを有する場合、候補クエリ「トレーンケーキパン」に関する関連付けのために、オンラインストアAおよびオンラインストアB用のランディングページを選択し得る。他の3つのストア用のランディングページは、それらの関連性スコアが関連性閾値より小さい場合、選択されない可能性がある。選択されたランディングページは、候補クエリと対形成され、一部の実施態様では、クエリ-ページ候補タプルに格納される。
フィルタリングフェーズ中に、候補(たとえば、クエリ-ページ候補タプル)が、(たとえば、クエリ-ページタプルを生成するために)フィルタリングされる。クエリ-ページタプルは、1つまたは複数のフィルタリング基準を満たすクエリ-ページ候補タプルのサブセットを表す。一部の実施態様では、フィルタ208は、タプルが商業的提供に関連性がない場合のクエリ-ページ候補タプル、たとえば、1つまたは複数の統計的プロセスによって測定して識別可能な意図を有していないページをウェブインデックス120全体から識別することになるクエリ、ならびに/または、ウェブインデックス全体からの識別されたランディングページの意図尺度から意図尺度が異なるクエリ-ページ候補タプルを除去することができる。一部の実施態様では、提案ベクトルおよび/またはクエリ意図ベクトルは、候補タプルが商業的提供に関連性があるかどうかを判定するために使用され得る。
フィルタリングフェーズに続いて、フィルタリングされた選択物(たとえば、クエリ-ページタプル)は、広告に関連付けられ得る。クエリ-ページタプルは、クエリを広告に関連付け、広告をタプルのランディングページにリンクすることによって広告に関連付けられ得る。これらの関連付けは、広告グループ212に格納されてもよく、広告グループ212は、一部の実施態様では、キーワード、広告、およびランディングページの関連付けの集合体である。たとえば、「トレーンケーキパン」の候補クエリは、オンラインストアAの場合、トレーンケーキパンを提供するランディングページにリンクする広告に関連付けられ得る。
一部の実施態様では、タプルと広告との間の関連付けは、自動的でなく、また、提案データ210として格納される。提案データ210は、たとえば、広告主フロントエンド214、たとえば広告主102用のクライアントインタフェースを通して広告管理システム104に入るように広告主に提示され得る。広告主は、提案された広告に関するクエリ-ページタプルについての提案された関連付けを受容するために、広告主フロントエンド214を使用し得る。
§3.1 候補クエリの識別
図3は、(たとえば、クエリ-ページ識別子114に関連付けられた)例示的な抽出プロセスを示すブロック図300である。クエリ抽出器302は、クエリログ128から、1つまたは複数の抽出基準308を満たす候補クエリのセットを識別する。抽出基準308は、クエリの提示の頻度、クエリのタイミング、クエリのタイプに関する基準、および他の基準を含み得る。
一部の実施態様では、提示基準によって指定される頻度は、少なくとも最小回数だけ起こり、かつ、最大回数未満で起こるクエリを識別するように選択され得る。下限閾値は、ユーザプライバシを保護し、将来、再び提示される可能性があるクエリを識別するように選択され得る。たとえば、1年について50回未満で提示されるクエリは、商業的に関連性がない可能性があり、代わりに、それは、1人のユーザによって提示された的を絞ったクエリである可能性がある。同様に、上限閾値は、頻繁に提示されるクエリをフィルタリングするように選択され得る。その理由は、これらのクエリが、一般的なクエリ(たとえば、「クレジットカード」)であるか、あるいは、時事的なまたはポップカルチャの関心事(たとえば、有名な人の名前)であるクエリである傾向があるからである。
クエリ抽出器302はまた、クエリが、商業的に関連性があるかどうかを判定するためにクエリのタイミングを解析するためのタイミング基準を使用してもよい。クエリは、異なる時間に同じレベルの商業的関連性を有しない可能性がある。たとえば、「パイレーツアイパッチ(pirate eye patch)」についてのクエリは、人々がハロウィン中に衣装を検索する可能性がより高いため、ハロウィン中に商業的に関連性がある可能性がある。その同じクエリは、ハロウィンでない期間中、商業的に関連性がない可能性がある。
クエリ抽出器302はまた、クエリが、商業的に関連性があるかどうかを判定するためにクエリのタイプを解析するためのタイプ基準を使用してもよい。一部の実施態様では、クエリは、商業的提供を対象としていない場合、商業的に関連性がない。そのため、抽出基準308は、教育的であるか、ニュースに関するか、またはそうでなければ、商業的提供を対象としていないクエリを削除するために使用され得る。たとえば、抽出基準308は、教育的ウェブサイト、ニュースサイト、現在進行中の事象、および(「〜する方法(how to…)」クエリ、「〜の歴史(history of…)」クエリなどのような)クエリフレーズを、商業的提供を対象としていないクエリのタイプとして識別し得る。
他の抽出基準308もまた、候補クエリを識別するために使用され得る。一部の実施態様では、クエリは、そのクエリに関連付けられた広告が既に存在する場合、商業的に関連性がない。クエリはまた、低クリックスルーレートを有する、または、抽出基準308に従って既に選択されたステムクエリの拡張である、などの場合、商業的に関連性がない可能性がある。
例として、候補クエリを識別するプロセスでは、クエリ抽出器302は、潜在的な候補クエリである、表1に示す一連の関連のないクエリに遭遇する可能性がある。
Figure 0005542812
抽出基準308は、50という1カ月期間における提示の最小回数、および、50,000という同じ1カ月期間中の提示の最大回数を指定してもよい。第1のクエリ「セレブリティ氏(Mr. Celebrity)」は、必要な最小回数を超えて提示された非常に一般的なクエリである。しかし、第1のクエリに関する提示の頻度はまた、最大回数を超える。そのため、クエリ抽出器302は、「セレブリティ氏」を候補クエリとして識別しない。
他の3つのクエリ「赤い箱(red box)」、「トレーンケーキパン(train cake pans)」、および「戦略(Battle Tactics)」は、提示の頻度の範囲内で提示されるクエリである。そのため、これらはそれぞれ、候補クエリとして識別される。
§3.2 候補クエリランディングページおよびクエリ-ページ候補タプルの識別
図4は、(たとえば、クエリ-ページ識別子114に関連付けられた)例示的な候補クエリ-ページプロセスのブロック図である。一部の実施態様では、候補クエリ検索評価器408は、候補クエリ306に関連するランディングページを識別するために、検索エンジン112、適切なサブセット基準406、および候補クエリを使用し得る。ランディングページは、クエリ-ページ候補タプル410を識別するために、候補クエリ検索評価器408によって使用される。
候補クエリに関連するランディングページを識別するために、検索エンジン112は、候補クエリ306を使用して、ウェブインデックス120の適切なサブセットを検索することができる。クエリ-ページ識別子114は、適切なサブセットを識別するために、適切なサブセット基準406を使用し得る。一部の実施態様では、適切なサブセット基準406は、商業的提供を含むかまたは含む可能性があるページだけを、ウェブインデックス120から識別する。
一部の実施態様では、適切なサブセット基準406は、ウェブページのタイプを識別することによって、商業的提供を有するウェブページを識別する。ニュースページ、ブログ、フォーラムなどのようなページは、適切なサブセットに含まれず、一方、会社または小売業者に関連するページは、検索される適切なサブセットに含まれる。これらのページは、たとえば、ドメイン名のリスト、.biz、.com、.org、.eduなどのトップレベルドメイン拡張子、またはウェブサイトによって識別されかつ区別され得る。
一部の実施態様では、適切なサブセット基準406は、商業的提供を示し得るデータを識別する。一部の実施態様では、適切なサブセット基準406は、商業的意図についての一般的なフレーズ、たとえば、「購入(purchase)」、「販売(sale)」、「ショッピングカート(shopping cart)」を含み得る。ウェブページが商業的提供を有するかどうかを判定する他の基準もまた使用され得る。たとえば、商業的提供を有するページにリンクするウェブページは、商業的提供として考えることができ、適切なサブセットに含まれ得る。一部の実施態様では、他の(すなわち、商業的提供以外の)考慮事項が、サブセットを評価するために使用され得る。
一部の実施態様では、適切なサブセット基準406は、ウェブページが検索されることを要求した広告主102のウェブページを識別する。たとえば、広告主は、適切なサブセット基準406に含めるために、そのドメインのサイトマップを提供し得る。
候補クエリ検索評価器408は、候補クエリ306に関連するランディングページについて、適切なサブセット基準406によって規定されるウェブインデックス120の適切なサブセットを、検索エンジン112に検索させることができる。一部の実施態様では、検索エンジン112は、各候補クエリについて、ウェブインデックス120の適切なサブセットから返送される各ランディングページに関連性スコアを割当てることができる。たとえば、候補クエリ306は、クエリ「トレーンケーキパン」を含み得る。検索エンジン112は、候補クエリ「トレーンケーキパン」に応答してランディングページについて適切なサブセットを検索することができる。「トレーンケーキパン」に応答する全てのランディングページは、表2に示す関連性スコアを割当てられ得る。
Figure 0005542812
候補クエリ検索評価器408は、ランディングページの関連性スコアに基づいて、適切なサブセットから識別されたランディングページを選択し得る。一部の実施態様では、候補クエリ検索評価器408は、関連性閾値を超える関連性スコアを有するランディングページだけを選択する。たとえば、関連性閾値が85である場合、候補クエリ「トレーンケーキパン」について、ストアA、B、およびCの挙げられたランディングページ(それぞれが85の関連性閾値を上回る関連性スコアが割当てられる)は、十分に関連性があるため、候補クエリ検索評価器408によって選択される。
これらの選択されたランディングページは、その後、クエリ-ページ候補タプル410において対応する候補クエリに関連付けられる。たとえば、85の関連性閾値に基づいて、T表3は、候補クエリ「トレーンケーキパン」についてクエリ-ページ候補タプルを挙げる。
Figure 0005542812
ストアDおよびストアEのランディングページは85の関連性閾値を超えないため、これらのストアについてのランディングページは、候補クエリ「トレーンケーキパン」を有する候補タプルに含まれない。
一部の実施態様では、検索エンジン112は、クエリ-ページ候補タプルを識別するときに、ウェブインデックス120の適切なサブセットに関して修正検索を実施するように構成され得る。たとえば、予測されるクリックスルーレートなどクエリの推定される性能を、ランク付けプロセスにおいて省略することができ、ランク付けは、候補クエリがウェブ文書のコンテンツにどれだけ関連性があるかにのみ依存することができる。他の検索アルゴリズム修正、たとえば、キーワード付け値を無視すること、地理的因子を無視することなどが行われ得る。
§3.3 クエリ-ページ候補タプルのフィルタリング
図5は、(たとえば、クエリ-ページ識別子114に関連付けられた)例示的なフィルタリングプロセスのブロック図である。一部の実施態様では、フィルタ502は、クエリ-ページ候補タプル410から、1つまたは複数のフィルタリング基準を満たすクエリ-ページタプルを選択するために使用され得る。フィルタリング基準は、たとえば、主要な意図尺度、クエリ-ページ意図尺度、一般的クエリリスト、および/または、商業的に実行可能な広告提案をもたらさないクエリ-ページ候補タプルを削除するように選択される他の基準を含み得る。
一部の実施態様では、フィルタ502は、候補タプル410から、広告主によりよい広告機会を提示する可能性があるタプルを選択し得る。一部の実施態様では、候補タプルは、候補クエリの主要な意図が、候補タプル410の選択されたランディングページの意図に一致する場合にだけ、見込みがある広告機会を提示する。そのため、候補クエリの主要な意図が存在しない場合、または、候補クエリの主要な意図が、選択されたランディングページの意図に一致しない場合、候補タプル410は、見込みがある広告機会を提示しない。
§3.3.1 主要な意図フィルタリング
一部の実施態様では、候補クエリの主要な意図は、候補クエリについて意図ベクトルを使用することによって測定され得る。意図ベクトルは、候補クエリを使用して、ウェブインデックス120全体を検索することに応答して返送される検索結果のベクトル表現である。一部の実施態様では、意図ベクトルは、識別されたランディングページからの一般的に関連付けられた用語、たとえば、10の最も高くランク付けされたランディングページからの用語を含む。
一部の実施態様では、フィルタ502は、意図尺度を計算するために、意図ベクトル内の用語を使用し得る。意図尺度は、候補クエリが主要な意図を有するかどうかを識別する。一部の実施態様では、ランディングページが、それについて高い意図尺度を有する意図ベクトルを生成する候補クエリは、主要な意図を有し、逆に、ランディングページが、それについて低い意図尺度を有する意図ベクトルを生成する候補クエリは、主要な意図を有さない。低い意図尺度は、候補クエリが一般的なクエリである可能性があること、または、ユーザの関心の不十分な表現であるクエリである可能性があることを示す。
たとえば、表4は、候補クエリ「トレーンケーキパン」を使用することによって識別されたランディングページから一般に関連付けられた用語を識別する。
Figure 0005542812
候補クエリ「トレーンケーキパン」の主要な意図は、表4の解析によって決定することができる。候補クエリ「トレーンケーキパン」は、高い意図尺度を有することになる。その理由は、候補クエリに一般的に関連付けられる用語が全て、「トレーンケーキパン」についての候補クエリの主要な意図が、ベーキングパンに関連するものとしてカテゴリ分類され(categorized)得ることを提案するからである。候補クエリ「トレーンケーキパン」は、高い意図尺度を有するため、見込みがある広告機会を提示する可能性がある。
逆に、表5は、候補クエリ「赤い箱」に一般的に関連付けられる用語を識別する。
Figure 0005542812
候補クエリ「赤い箱」は、候補クエリに関連付けられた用語によって識別された主要な意図が存在しないため、高い意図尺度を有しないことになる。候補クエリ「赤い箱」の低い意図尺度は、「赤い箱」が一般的な用語であり、一般的に関連付けられた用語が互いに関連しないことを示す。主要な意図が存在しないため、候補クエリ「赤い箱」は、見込みがある広告機会を提示しない。
§3.3.2 オフトピック(Off-Topic)フィルタリング
一部の実施態様では、フィルタ502はまた、候補クエリの主要な意図が、提案されたランディングページの意図に一致するかどうか、または、候補クエリが、クエリ-ページ候補タプル内のランディングページからオフトピックであるランディングページをウェブインデックス120全体から識別することになるクエリであるかどうかを判定するために提案ベクトルを使用し得る。一部の実施態様では、候補タプル410の一部であるランディングページのベクトル表現である提案ベクトルは、候補タプル410の一部であるランディングページの意図を測定するために使用され得る。提案ベクトルは、候補クエリを使用してウェブインデックス120全体を検索することに応答して返送される検索結果に基づく意図ベクトルと比較され得る。
一部の実施態様では、ランディングページのそれぞれについての提案ベクトルは、ランディングページ上で(たとえば、ランディングページの表題、ランディングページのURL内で)ワードを、また、ランディングページ全体を通してフレーズを識別しながら生成される。たとえば、表6は、クエリ「トレーンケーキパン」と対形成されたランディングページについて、提案ベクトルを識別する。
Figure 0005542812
表6では、各ランディングページの代表的なワードが識別される。ケーキパンストアAの代表的なワードは、ランディングページが、ケーキパンおよびベーキングサプライ用品を対象としていることを示す。同様に、ストアBおよびストアCランディングページの代表的なワードは、ランディングページがそれぞれ、ベーキング製品およびキッチンサプライ用品を対象としていることを示す。そのため、ランディングページのそれぞれについての提案ベクトルは、ベーキング製品およびキッチンツールを対象とする。
一部の実施態様では、候補クエリの主要な意図が、ランディングページについての意図と同じでない場合、広告主は、おそらく候補クエリについてランディングページ上で広告したいと思わないことになる。そのため、一部の実施態様では、フィルタ502は、類似性尺度を生成するために、候補クエリの提案ベクトルを候補クエリの意図ベクトルと比較する。提案ベクトルに対する意図ベクトルの類似性尺度は、ウェブインデックス120の適切なサブセットを検索するのに使用されるときの意図に対する、ウェブインデックス120全体を検索するのに使用されるときの候補クエリの意図の類似性のレベルを識別する。類似性閾値を超える類似性尺度を有する候補タプル410は、オントピック(on-topic)であると判定され、クエリ-ページタプルに格納され、一方、類似性閾値を超える類似性尺度を有さない候補タプル410は、オフトピックであると判定され、クエリ-ページタプル504に格納されない。他のデータ構造が使用され得る。
たとえば、候補クエリ「トレーンケーキパン」の意図ベクトルは、候補クエリの主要な意図としてベーキングパンを識別した。さらに、候補タプル410からのランディングページの提案ベクトルは、ランディングページがベーキング製品を対象にしていることを識別する。そのため、「トレーンケーキパン」クエリ-ページ候補タプル410は、クエリ-ページタプル504として格納される。
一部の実施態様では、候補クエリの意図が、タプルのランディングページの意図に一致しない候補タプル410は、クエリ-ページタプル504として格納されない。たとえば、表7は、候補クエリ「戦略(Battle Tactics)」に一般に関連付けられる用語を識別する。
Figure 0005542812
候補クエリ「戦略」の主要な意図は、表7の解析によって決定することができる。候補クエリに一般的に関連付けられる全ての用語は、軍事戦略および戦争の研究に関連する。そのため、候補クエリ「戦略」は、軍事戦略および戦争の研究に関連する高い意図尺度を有する。
表8は、同様に「戦略」候補タプル410の一部であるランディングページ、すなわち、クエリ「戦略」によってウェブインデックス120の適切なサブセットを検索することによって識別されたページに一般的に関連付けられた用語を識別する。
Figure 0005542812
クエリ「トレーンケーキパン」候補タプルについての意図の類似性と対照的に、候補クエリ「戦略」の主要な意図は、「戦略」候補クエリ-ページタプルに基づく提案ベクトルの意図に一致しない。候補クエリ「戦略」の提案意図ベクトルは、ビデオゲームを、候補クエリの主要な意図として識別する。したがって、クエリ「戦略」が検索エンジンに提示されると、軍史に関連する識別されたウェブ文書は、ビデオゲームに関連性がない可能性がある。そのため、識別された検索結果からオフトピックであることになる広告のサービス提供を排除するために、「戦略」候補タプル410は、クエリ-ページタプル504として格納されない。
§3.4 広告に関するクエリ-ページタプルの関連付け
クエリ-ページタプル504は、識別された後、広告に関連付けされる。図6aは、広告グループ212に格納された広告に関してのクエリ-ページタプル504の例示的な関連付けを示すブロック図600である。一部の実施態様では、広告グループ212は、キーワード、広告、およびランディングページの関連付けの集合体であり、たとえば、広告キャンペーンを実施し、規定するために使用され得る。通常、広告グループ212は、広告主が値付けするキーワードおよびこれらのキーワードに関連付けられた広告を識別する。広告グループ212内のキーワードの1つまたは複数を有するクエリを受信することに応答して行われるオークションなどのオークション内の広告スロットを、広告主が勝取る場合、関連付けされた広告は、検索結果と共に表示される。一部の実施態様では、クエリ-ページ識別子114は、広告グループ212内にクエリおよび/またはキーワードならびに関連付けられたランディングページを含むよう、広告グループ212を増大させるために使用され得る。
一部の実施態様では、広告グループ分類器602は、クエリ-ページタプル504の候補クエリからのキーワードを、広告グループ212内の広告に関連付けられたキーワードと比較する。たとえば、分類器602は、候補クエリのキーワードを、既存の広告に関連付けられたキーワードと比較し得る。候補クエリのキーワードの同意語はまた、広告に関連付けられたキーワードの同意語と比較され得る。候補クエリを広告と比較する他の方法も使用され得る。
この比較に基づいて、広告グループ分類器602は、クエリ-ページタプル504を広告と対形成する提案された広告グループ化を識別する。広告とクエリ-ページタプル504との対形成は、提案606として、関連付けのために提案され得る、または、対形成は、互いに自動的に関連付けられ、広告グループ212内に入れられ得る。提案606は、広告主フロントエンド608を通して広告主に提示され得る。
図6bは、広告グループ212内での既存の広告に関するクエリ-ページタプル504の例示的な関連付けを示すブロック図625である。この例では、広告グループ212は、ランディングページに対するリンクを含む広告を含む。ランディングページはまた、クエリ-ページ識別子114によってクエリ-ページタプル内で識別された。広告グループ分類器602は、クエリを広告グループ212に付加することによって、クエリ-ページタプル内のランディングページに関連付けられるクエリを広告グループ212に関連付け得る。一部の実施態様では、クエリは、キーワードストリングとして付加され、広告グループ212は、クエリが受信されると、ランディングページにリンクした広告を選択するように構成される。したがって、次にクエリがユーザによって提示されるとき、広告管理システム104は、ランディングページに対するリンクを含む広告を、オークションのために広告グループから選択することになる。
例として、ケーキパンストアAについてのランディングページは、広告グループ212内で広告に既に関連付けられている。しかし、クエリ「トレーンケーキパン」は、ケーキパンストアAによって広告されない。そのため、広告グループ分類器602は、クエリ「トレーンケーキパン」を、広告グループ212内のケーキパンストアAランディングページについての広告に関連付ける。
図6cは、広告に関するクエリ-ページタプル504の例示的な関連付けを示すブロック図650である。この例では、クエリ-ページタプルからのクエリは、広告グループ212のキーワードに関連するものとして識別されており、たとえば、クエリは、広告グループ212内にあるキーワードを含んでもよい。そのため、クエリは、自動的に、または、そうするという提案を広告主が受容することに応答して、広告グループ212に含まれ得る。広告グループ212は、クエリに関連付けられたランディングページにリンクした広告を含まないが、広告グループ分類器602は、クエリ-ページタプルの候補クエリをクエリ-ページタプルのランディングページに関連付ける新しい広告を生成し得る。新しく生成された広告は、広告グループに含まれ得る。
例として、キッチン製品ストアBケーキパンについてのランディングページは、「トレーンケーキパン」に関連する商業的提供を含む。キッチン製品ストアBケーキパンのランディングページは、「トレーンケーキパン」についての商業的提供を含むランディングページであるが、広告グループ212内のキーワードによっていずれの広告にも関連付けられない、または、広告されない。そのため、広告グループ分類器602は、キッチン製品ストアBケーキパンのランディングページにリンクする別の広告を生成し、候補クエリ、たとえば、「トレーンケーキパン」を、ランディングページ用の広告に関連付ける。したがって、次にクエリがユーザによって提示されるとき、広告管理システム104は、ランディングページに対するリンクを含む広告を、オークションのために広告グループから選択することになる。
図6dは、広告に関するクエリ-ページタプルの例示的な関連付けを示す別のブロック図675である。この例では、広告主は、既存の広告キャンペーンを有さない可能性があり、したがって、クエリ-ページタプルに関連付けられ得る既存の広告データ212は存在しない。
図6bおよび6cは、選択された候補クエリおよび関連付けられたウェブ文書を含むクエリ-ページタプルが、広告グループ212に関連付けられる2つの例示的なプロセスを示す。他の関連付けプロセスもまた使用され得る。
一部の実施態様では、クエリ-ページタプル504は、広告主102のための広告を提案するために使用され得る。たとえば、広告管理システム104を使用することによって、広告主102は、そのランディングページおよびクエリ-ページタプル504によって規定された1つまたは複数の提案されたクエリの一方についての広告機会の通知を受信する可能性がある。広告主102がその提案を受容する場合、対応する広告データ212が、広告主について生成され得る。たとえば、広告主102は、クエリ-ページタプル504によって示されるランディングページについての広告提供を始めるために、創造的な付け値情報および予算を広告管理システム104に提供し得る。
一部の実施態様では、広告グループ分類器602は、広告主102のウェブサイトのサイトマップを処理し、子ランディングページがクエリ-ページタプル504に含まれるサイトマップの内部ノードについての広告データを提案し得る。たとえば、クロージングアパレルを販売する小売業者は、ノード「靴(Shoes)」を含むサイトマップを有する可能性があり、そのサイトマップは、次に、子ノード「女性の靴(Women's Shoes)」および「男性の靴(Men's Shoes)」を含む。小売業者は、「女性の靴」および「男性の靴」ノードの子である対応するウェブ文書において、靴製造業者によって売りに出される(marketed)特定のブランドの女性の靴および男性の靴を、カジュアルでかつ心地よい靴であるとして提供してもよい。クエリ-ページ識別子は、これらのウェブ文書のそれぞれについて、クエリ-ページタプル504を識別し、これらの提案を小売業者に提供してもよい。クエリ-ページタプル504の使用によって、小売業者は、特定の靴について、広告キャンペーンを形成し得る。
§3.5 クエリ-ページタプルについての他の使用法
クエリ-ページタプル504は、ターゲット広告を容易にすることに加えて他の使用法を有する。たとえば、クエリ-ページタプル504は、あるカテゴリのための関連性があるユーザクエリを記述するクエリ-カテゴリマップ704を生成するために使用され得る。図7は、クエリカテゴリに関するクエリ-ページタプル504の例示的な関連付けを示すブロック図700である。一実施態様では、クエリカテゴライザ702は、クエリ-カテゴリマップ704を生成するためにクエリ-ページタプルおよびウェブディレクトリ706にアクセスし得る。ウェブディレクトリ706は、階層的カテゴリに従って分類されたウェブ文書の既存のディレクトリであり得る。例示的なウェブディレクトリは、オープンディレクトリプロジェクト(Open Directory Project)、グーグルディレクトリ(Google Directory)、または、ウェブ文書が複数のカテゴリに編成される任意の他のディレクトリを含む。
クエリカテゴライザ702は、クエリ-ページタプルの選択されたウェブ文書が属するカテゴリディレクトリ内でカテゴリを識別し、識別されたカテゴリの選択に応答して候補クエリが提示され得るように、候補クエリを識別されたカテゴリに関連付け得る。
一部の実施態様では、クエリ-ページ識別子114は、各カテゴリについて異なる抽出基準、適切なサブセット基準、およびフィルタリング基準を使用し得る。たとえば、上述した抽出基準およびフィルタリング基準は、商業的提供を含むウェブプロパティのために、ウェブインデックス120およびクエリログ128を処理するときに使用され得る。逆に、商業的提供の主題に関連しないウェブプロパティ、たとえば、政府サイト、.eduサイト、および.orgサイトなどの場合、他の抽出基準およびフィルタリング基準が、他の主題関連性について関連性があるコンテンツを識別するために使用され得る。たとえば、フレーズ「研究論文(research paper)」を含むクエリおよび/またはページは、教育的主題関連性についてクエリ-ページタプル504を識別するときに含まれ得り、用語「ショッピングカート」を含むクエリおよび/またはページは、教育的主題関連性について排除され得る。同様に、適切なサブセット基準もまた、主題関連性に関連するウェブインデックス120のサブセットを識別するために調節され得る。
一部の実施態様では、適切なサブセット基準は、各カテゴリに含まれるウェブプロパティに基づいてウェブプロパティの適切なサブセットを規定することができ、クエリ-ページタプル504を識別する後続の処理は、各カテゴリサブセット内のページに制限され得る。
クエリ-ページタプルのランディングページが、ウェブディレクトリ706内に存在しない場合、一部の実施態様では、クエリカテゴリ702は、ランディングページの考えられるカテゴリ分類に基づいて、候補クエリに関連付けるカテゴリを識別し得る。クエリカテゴライザ702は、たとえば、ランディングページ内のキーワードに基づいてランディングページの考えられるカテゴリ分類を識別し得る。
ターゲット広告およびクエリのカテゴリ分類を容易にすることは、クエリ-ページタプル504がどのように使用され得るかについての2の例である。上述したプロセスを使用して、クエリ-ページタプル504は、任意のタイプの(たとえば、商業的、教育的、宗教的、政治的などの)関連性因子について生成され、関連性がある情報のより有効でかつ効率的な配信を容易にするために生成され得る。たとえば、税の申告(tax filing)に関連する、また、政府機関の税金関連ウェブ文書に関連性があるクエリが識別され得り、これらのウェブ文書が、これらのクエリについての検索結果ページに立ち上げられ得る。
§4.0 例示的なプロセスフロー
図8は、クエリ-ページ候補タプルを識別する例示的なプロセス800のフローチャートである。プロセス800は、たとえば、図1のクエリ-ページ識別子114によって、また、図2〜4で述べるように実施され得る。
ステージ802は、候補クエリを識別する。候補クエリは、クエリ-ページ識別子114またはクエリ抽出器302によってクエリログから識別され得る。一部の実施態様では、商業的に関連性があるクエリだけが、候補クエリとして識別される。しかし、教育的に関連性があるクエリ、財政的に関連性があるクエリなどのような、選択のための他の基準もまた使用され得る。
ステージ804は、複数のウェブ文書について関連性スコアを生成する。関連性スコアは、複数のウェブ文書のそれぞれに対する候補クエリの関連性を測定する。たとえば、クエリ-ページ識別子114または候補クエリ検索評価器408は、ステージ802で識別された候補クエリのそれぞれについて、ウェブ文書のためのウェブ文書のインデックスを、検索エンジン112に検索させることができる。候補クエリに応答して返送されるウェブ文書はそれぞれ、候補クエリについての関連性スコアを含む。検索されるウェブ文書は、ウェブインデックス120に格納され、かつ、適切なサブセット基準406によって規定されるウェブ文書の適切なサブセットであり得る。
ステージ806は、ウェブ文書を選択する。たとえば、クエリ-ページ識別子114または候補クエリ検索評価器408は、ウェブ文書の関連性スコアに基づいて、ステージ804で識別されたウェブ文書のセットからウェブ文書を選択し得る。一部の実施態様では、関連性閾値を超える関連性スコアを有するウェブ文書だけが、クエリ-ページ識別子114によって選択される。
ステージ808は、ウェブ文書を候補クエリに関連付ける。たとえば、クエリ-ページ識別子114または候補クエリ検索評価器408は、ウェブ文書の関連性スコアが関連性閾値を超える場合、クエリ-ページ候補タプル410として、ウェブ文書を候補クエリに関連付け得る。
図9は、クエリ抽出のためのプロセス900のフローチャートである。プロセス900は、たとえば、図1のクエリ-ページ識別子114および/または図3のクエリ抽出器302によって実施され得る。プロセス900は、たとえば、図8のステージ802を実施するために使用され得る。
ステージ902は、クエリを識別する。たとえば、クエリ-ページ識別子114またはクエリ抽出器302は、クエリログ128からクエリを識別し得る。
ステージ904は、クエリが最小回数を超えて提示されたかどうかを判定する。たとえば、クエリ-ページ識別子114またはクエリ抽出器302は、クエリが、ある期間にわたって最小回数を超えて、たとえば、1カ月にわたって50回を超えて提示されたかどうかを、クエリログ128の解析から判定し得る。
クエリが最小回数を超えて提示されたと判定された場合、ステージ906は、クエリが最大回数未満で提示されたかどうか判定する。たとえば、クエリ-ページ識別子114またはクエリ抽出器302は、クエリが、ある期間にわたって最大回数を超えて、たとえば、1カ月にわたって50,000回を超えて提示されたかどうかを、クエリログ128の解析から判定し得る。
クエリが最大回数未満で提示されたと判定された場合、ステージ908は、クエリを候補クエリとして識別する。たとえば、クエリ-ページ識別子114またはクエリ抽出器302は、選択されたクエリを候補クエリとして識別し、候補クエリを候補クエリストア306に格納することができる。
他のアルゴリズム的抽出プロセスもまた、候補クエリを識別するために使用され得る。これらの他のアルゴリズム的抽出プロセスは、図9の最小提示閾値および最大提示閾値に加えて、または、その代わりに使用され得る。
適切なサブセット基準406は、検索結果の第1のセットを生成するためウェブインデックス120の適切なサブセットを識別するために使用され得り、ウェブインデックス120全体が、検索結果の第2のセットを識別するために検索され得る。
図10は、クエリ-ページ候補タプルをフィルタリングする例示的なプロセス1000のフローチャートである。プロセス1000は、たとえば、図1のクエリ-ページ識別子114および/または図4の候補クエリ検索評価器408ならびに図5のフィルタ502によって実施され得る。プロセス1000は、プロセス800によって生成されたクエリ-ページ候補タプルをフィルタリングするために使用され得る。
ステージ1002は、候補クエリ-ページタプルを選択する。たとえば、図1のクエリ-ページ識別子114および/または候補クエリ検索評価器408は、クエリ-ページ候補タプル410から候補クエリ-ページタプルを選択し得る。
ステージ1004は、文書の集合体を検索する。たとえば、クエリ-ページ識別子114または候補クエリ検索評価器408は、選択されたクエリ-ページ候補タプルの候補クエリを用いて、ウェブインデックス120全体を検索エンジンに検索させることができる。
ステージ1006は、第1のベクトルを生成する。たとえば、クエリ-ページ識別子114またはフィルタ502は、クエリ-ページ候補タプルで識別されたウェブ文書について提案ベクトルを生成し得る。
ステージ1008は、第2のベクトルを生成する。たとえば、クエリ-ページ識別子114またはフィルタ502は、ステージ1004で行われたウェブインデックス120全体の検索に応答して識別されたウェブ文書について意図ベクトルを生成し得る。
ステージ1010は、第2ベクトルに対する第1ベクトルの類似性尺度を決定する。たとえば、クエリ-ページ識別子114またはフィルタ502は、提案ベクトルと意図ベクトルとの間の類似性尺度を決定することができる。
ステージ1012は、第2ベクトルに対する第1ベクトルの類似性尺度が閾値を超えるかどうかを判定する。たとえば、クエリ-ページ識別子114またはフィルタ502は、第2ベクトルに対する第1ベクトルの類似性尺度が閾値を超えるかどうかを判定する。
第2ベクトルに対する第1ベクトルの類似性尺度が閾値を超えたと、ステージ1012が判定する場合、ステージ1014は、クエリ-ページ候補タプルをクエリ-ページタプルとして格納する。たとえば、クエリ-ページ識別子114またはフィルタ502は、選択されたクエリ-ページ候補タプル410をクエリ-ページタプル504として格納することができる。
第2ベクトルに対する第1ベクトルの類似性尺度が閾値を超えたと、ステージ1012が判定する場合、プロセス1000はステージ1002に戻る。プロセス1000は、その後、処理されるべきクエリ-ページ候補タプル410が残らなくなるまで繰返される。
図11は、クエリ-ページタプルを広告グループに関連付ける例示的なプロセス1100のフローチャートである。プロセス1100は、たとえば、クエリ-ページ識別子114または図6の広告グループ分類器602によって実施され得る。
ステージ1102は、候補クエリおよび関連付けられたウェブ文書を広告グループと比較する。たとえば、クエリ-ページ識別子114または広告グループ分類器602は、クエリ-ページタプルのキーワードを、広告グループ212内で広告に関連付けられたキーワードと比較し得る。クエリ-ページタプルのキーワードは、候補クエリのキーワード、関連付けされたウェブ文書のキーワードなどを含み得る。広告グループのキーワードは、広告が関連付けされる検索用語からのキーワード、広告の表題からのキーワード、および広告に関連付けられたランディングページのキーワードなどを含む。
ステージ1104は、候補クエリおよび関連付けされたウェブ文書が、広告グループに関連性があるかどうかを判定する。たとえば、ステージ1102の比較に基づいて、広告グループ分類器602は、クエリ-ページタプルが広告グループ212に関連性があるかどうかを判定し得る。たとえば、広告グループに関連付けられたキーワードが、候補クエリのキーワードの1つまたは複数を含むとき、候補クエリおよび関連付けされたウェブ文書が、広告グループに関連性があると、広告グループ分類器602が判定する。
候補クエリが、広告グループに関連性があると判定された場合、ステージ1106は、候補クエリおよびウェブ文書を広告グループに関連付ける。たとえば、クエリ-ページタプルが広告グループに関連性があると、クエリ-ページ識別子114または広告グループ分類器602が判定する場合、候補クエリは広告グループに関連付けられ得る。広告グループ分類器602は、候補クエリを既存の広告に関連付け得る、または、既存の広告に基づいて新しい広告を生成し得る。
図12は、クエリをカテゴリに関連付ける例示的なプロセス1200のフローチャートである。プロセス1200は、たとえば、図1のクエリ-ページ識別子114および/または図7のクエリカテゴライザ702によって実施され得る。
ステージ1202は、クエリ-ページタプルを識別する。たとえば、クエリ-ページ識別子114および/またはクエリカテゴライザ702は、クエリ-ページタプル504からあるクエリ-ページタプルを識別し得る。
ステージ1204は、関連付けられたランディングページが属するカテゴリを、カテゴリディレクトリ内で識別する。たとえば、クエリ-ページ識別子114および/またはクエリカテゴライザ702は、選択されたクエリ-ページタプルの関連付けられたランディングページが属するカテゴリを、ウェブディレクトリ内で識別し得る。
ステージ1204は、候補クエリを識別されたカテゴリに関連付ける。たとえば、クエリ-ページ識別子114および/またはクエリカテゴライザ702は、選択されたクエリ-ページタプルの候補クエリを、ステージ1204で識別されたカテゴリに関連付けし得る。
特定のタイプのウェブプロパティが、種々の例において上述されたが、本明細書の主題は、これらの特定の例に限定されない。本明細書の主題は、コンテンツのより大きなセットの適切なサブセットに分類され得、かつ、コンテンツのより大きなセットを検索するために使用されたクエリを使用して、それについて適切なサブセットが検索され得る、任意のタイプの選択可能なコンテンツに拡張され得る。こうしたコンテンツの例は、音楽コンテンツ、オーディオコンテンツ、ビデオコンテンツ、プリントコンテンツ、ラジオコンテンツ、記事、ブログなどを含む。
§5.0 例示的なコンピュータシステム
図13は、例示的なコンピュータシステム1300のブロック図である。システム1300は、図1〜7の、クエリ-ページ識別子114および/またはクエリ抽出器302、候補クエリ検索評価器408、フィルタ502、広告グループ分類器602、およびクエリカテゴライザ702を実施するために使用され得る。しかし、他のコンピュータシステムもまた使用され得る。システム1300は、プロセッサ1310、メモリ1320、記憶デバイス1330、および入力/出力デバイス1340を含む。コンポーネント1310、1320、1330、および1340はそれぞれ、たとえば、システムバス1350を使用して相互接続され得る。プロセッサ1310は、システム1300内での実行用の命令を処理することが可能である。一実施態様では、プロセッサ1310は、シングルスレッド式プロセッサである。別の実施態様では、プロセッサ1310は、マルチスレッド式プロセッサである。プロセッサ1310は、メモリ1320内にまたは記憶デバイス1330上に格納された命令を処理することが可能である。
メモリ1320は、システム1300内で情報を格納する。一実施態様では、メモリ1320は、コンピュータ読取り可能媒体である。一実施態様では、メモリ1320は、揮発性メモリユニットである。別の実施態様では、メモリ1320は、不揮発性メモリユニットである。
記憶デバイス1330は、システム1300用の大容量記憶装置を提供することが可能である。一実施態様では、記憶デバイス1330は、コンピュータ読取り可能媒体である。種々の異なる実施態様では、記憶デバイス1330は、たとえば、ハードディスクデバイス、光ディスクデバイス、または何らかの他の大容量記憶デバイスを含み得る。
入力/出力デバイス1340は、システム1300の入力/出力オペレーションを提供する。一実施態様では、入力/出力デバイス1340は、ネットワークインタフェースデバイス(たとえば、イーサネット(登録商標)カード)、シリアル通信デバイス(たとえば、RS-232Cポート)、および/または無線インタフェースデバイス(たとえば、802.11カード)のうちの1つまたは複数を含み得る。別の実施態様では、入力/出力デバイスは、他の入力/出力デバイス、たとえば、キーボード、プリンタ、およびディスプレイデバイス1360に対して入力データを受信し、出力データを送出するように構成されたドライバデバイスを含み得る。
本明細書で述べる主題の実施形態および機能的オペレーションは、デジタル電子回路要素で、あるいは、本明細書で開示される構造およびその構造的均等物を含む、コンピュータソフトウェア、ファームウェア、またはハードウェアで、あるいは、それらの1つまたは複数の組合せで実施され得る。本明細書で述べる主題の実施形態は、1つまたは複数のコンピュータプログラム製品、すなわち、データ処理装置によって実行されるため、または、データ処理装置のオペレーションを制御するために、触知可能プログラムキャリア上で符合化されたコンピュータプログラム命令の1つまたは複数のモジュールとして実施され得る。触知可能プログラムキャリアは、コンピュータ読取り可能媒体であり得る。コンピュータ読取り可能媒体は、機械読取り可能記憶デバイス、機械読取り可能記憶基板、メモリデバイス、機械読取り可能伝播信号に影響を及ぼす構成物(composition of matters)、または、それらの1つまたは複数の組合せであり得る。
本明細書で開示される処理デバイスは、データを処理する全ての装置、デバイス、および機械を包含し、例として、プログラマブルプロセッサ、コンピュータ、あるいは複数のプロセッサまたはコンピュータを含む。装置は、ハードウェアに加えて、対象となるコンピュータプログラム用の実行環境を生成するコード、たとえば、プロセッサファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステム、または、それらの1つまたは複数の組合せを構成するコードを含み得る。
(プログラム、ソフトウェア、ソフトウェアアプリケーション、スクリプト、またはコードとしても知られている)コンピュータプログラムは、コンパイルされた言語またはインタープリトされた言語あるいは宣言型言語または手続き型言語を含む、任意の形態のプログラミング言語で書くことができ、また、独立型プログラム、あるいは、モジュール、コンポーネント、サブルーチン、またはコンピューティング環境で使用するのに適した他のユニットを含む任意の形態で配備され得る。コンピュータプログラムは、必ずしもファイルシステム内のファイルに対応しない。プログラムは、他のプログラムまたはデータ(たとえば、マークアップ言語文書に格納される1つまたは複数のスクリプト)を保持するファイルの一部分内か、対象となるプログラムに専用の単一ファイル内か、あるいは、複数の協調したファイル(たとえば、コードの1つまたは複数のモジュール、サブプログラム、または部分を格納するファイル)内に格納され得る。コンピュータプログラムは、1つのコンピュータ上で、あるいは、1つのサイトに位置するかまたは複数のサイトにわたって分散され、かつ、通信ネットワークによって相互接続された複数のコンピュータ上で実行されるように配備され得る。
さらに、本特許文書で述べるロジックフローおよび構造ブロック図(特定の方法および/またはステップを支持する対応する行為ならびに開示される構造手段を支持する対応する機能を述べる)はまた、対応するソフトウェア構造およびアルゴリズムならびにその均等物を実施するために利用されてもよい。本明細書で述べるプロセスおよびロジックフローは、入力データに作用し、出力を生成することによって複数の機能を実施する1つまたは複数のコンピュータプログラムを実行する1つまたは複数のプログラマブルプロセッサによって実施され得る。
コンピュータプログラムの実行に適したプロセッサは、例を挙げると、汎用マイクロプロセッサと専用マイクロプロセッサの両方および任意の種類のデジタルコンピュータの1つまたは複数のプロセッサを含む。一般に、プロセッサは、命令およびデータを、読取り専用メモリか、ランダムアクセスメモリか、またはその両方から受信することになる。コンピュータの本質的な要素は、命令を実行するプロセッサならびに命令およびデータを格納する1つまたは複数のメモリデバイスである。一般に、コンピュータはまた、データを格納する1つまたは複数の大容量記憶装置、たとえば、磁気ディスク、光磁気ディスク、または光ディスクを含むか、あるいは、それらからデータを受信するか、それらにデータを転送するか、またはその両方を行うために、それらに動作可能に結合することになる。
コンピュータプログラム命令およびデータを格納するのに適したコンピュータ読取り可能媒体は、例として、半導体メモリデバイス(たとえば、EPROM、EEPROM、およびフラッシュメモリデバイス)、磁気ディスク(たとえば、内部ハードディスクまたは取外し可能ディスク)、光磁気ディスク、ならびにCD ROMおよびDVD ROMディスクを含む、あらゆる形態の不揮発性メモリ、媒体、およびメモリデバイスを含む。プロセッサおよびメモリは、専用ロジック回路要素によって補われ得るか、または、専用ロジック回路要素内に組込まれ得る。
本明細書は、多くの特定の実施態様の詳細を含むが、これらは、任意の発明のまたは特許請求される可能性があるものの範囲に関する制限としてではなく、むしろ特定の発明の特定の実施形態に固有である可能性がある特徴の説明として解釈されるべきである。別個の実施形態の文脈において本明細書で述べられるある特徴はまた、単一の実施形態において組合せて実施され得る。逆に、単一の実施形態の文脈で述べられる種々の特徴はまた、複数の実施形態で別々に、または、任意の適したサブコンビネーションで実施され得る。さらに、特徴は、ある組合せで作用するものとして上述され、さらにそのように最初に特許請求されてもよいが、特許請求される組合せからの1つまたは複数の特徴は、場合によっては、組合せから取り出すことができ、特許請求される組合せは、サブコンビネーションまたはサブコンビネーションの変形形態を対象としてもよい。
同様に、オペレーションが、図面において特定の順序で示されるが、これは、こうしたオペレーションが、示す特定の順序でまたは順番に実施されること、あるいは、全ての示すオペレーションが、望ましい結果を達成するために実施されることを要求するものとして理解されるべきでない。ある状況では、マルチタスクおよび並列処理が有利である可能性がある。さらに、上述した実施形態における種々のシステムコンポーネントの分離は、全ての実施形態におけるこうした分離を要求するものとして理解されるべきでなく、述べるプログラムコンポーネントおよびシステムは、一般に、単一ソフトウェア製品に統合されるか、または、複数のソフトウェア製品にパッケージされ得ることが理解されるべきである。
本明細書で述べる主題の特定の実施形態が述べられた。他の実施形態が、添付特許請求項の範囲内にある。たとえば、特許請求項で列挙するアクションは、異なる順序で実施され、依然として望ましい結果を達成し得る。一例として、添付図に示すプロセスは、望ましい結果を達成するために、示す特定の順序または順番を必ずしも必要としない。ある実施態様では、マルチタスクおよび並列処理が有利である可能性がある。
102 広告主
104 広告管理システム
106 発行者
108、108a ユーザデバイス
109 検索クエリ
111 検索結果ページ
112 検索エンジン
114 クエリ-ページ識別子
116 広告
118 検索結果
120 ウェブインデックス
122 クエリ-ページタプル
124 広告データ
126 キャンペーンデータ
128 クエリログ
208 フィルタ
210 提案データ
212 広告データ、広告グループ
214 広告主フロントエンド
302 クエリ抽出器
306 候補クエリ
308 抽出基準
402 検索エンジン
406 適切なサブセット基準
408 候補クエリ検索評価器
410 クエリ-ページ(QP)候補タプル
502 フィルタ
504 QPタプル
602 広告グループ分類器
606 提案
608 広告主フロントエンド
702 クエリカテゴライザ
704 クエリ-カテゴリマップ
706 ウェブディレクトリ
1310 プロセッサ
1320 メモリ
1330 記憶デバイス
1340 入力/出力
1360 入力/出力デバイス

Claims (17)

  1. コンピュータによって実施される方法であって、
    クエリログに格納されたクエリから候補クエリを識別するステップを含み、前記候補クエリを識別するステップは、
    クエリログに格納された前記クエリからあるクエリを識別するステップと、
    前記クエリが、ある期間の間に少なくとも最小回数提示されたかどうかを判定するステップと、
    前記クエリが、前記期間の間に最大回数未満で提示されたかどうかを判定するステップと、
    前記クエリが、前記期間の間に、少なくとも前記最小回数、かつ、前記最大回数未満で提示された場合、1つまたは複数のコンピュータプロセッサにより、前記クエリを前記候補クエリとして識別するステップと、を含み、
    前記方法は、
    複数のウェブ文書について関連性スコアを生成するステップを含み、各関連性スコアは、対応するウェブ文書に関連付けられ、かつ、前記ウェブ文書に対する前記候補クエリの前記関連性の尺度であり、
    前記方法は、
    関連性閾値を超える関連付けられた関連性スコアを有するウェブ文書を選択するステップと、
    前記選択されたウェブ文書を前記候補クエリに関連付けるステップとを含む、方法。
  2. 前記方法は、
    前記候補クエリおよび前記関連付けられたウェブ文書を広告グループと比較するステップをさらに含み、前記広告グループは、キーワードおよび広告の関連付けであり、
    前記方法は、
    前記比較に基づいて、前記候補クエリおよび前記関連付けられたウェブ文書が前記広告グループに対して関連性があるどうかを判定するステップと、
    前記候補クエリおよび前記関連付けられたウェブ文書が前記広告グループに対して関連性がある場合、前記候補クエリおよび前記ウェブ文書を前記広告グループに関連付けるステップとをさらに含む請求項1に記載の方法。
  3. 前記候補クエリおよび前記ウェブ文書を前記広告グループに関連付けるステップは、
    前記候補クエリを前記広告に関連付けるステップと、
    前記ウェブ文書を前記広告に関連付けるステップとを含み、当該関連付けは、前記候補クエリに一致するクエリに応答して前記広告が提供されるときに、前記広告に、前記ウェブ文書に対するリンクを含ませるように動作する、請求項2に記載の方法。
  4. 複数のウェブ文書について関連性スコアを生成するステップは、前記候補クエリによって、ウェブ文書の集合体の適切なサブセットだけを検索するステップを含み、ウェブ文書の前記集合体の適切なサブセットは、複数のウェブ文書である請求項1に記載の方法。
  5. 前記選択されたウェブ文書を前記候補クエリに関連付けるステップは、
    前記候補クエリによって文書の前記集合体を検索するステップと、
    ウェブ文書の集合体の前記適切なサブセットだけの前記検索の結果から1つまたは2つ以上の用語からなる第1のベクトルを生成するステップと、
    文書の前記集合体の前記検索の結果から1つまたは2つ以上の用語からなる第2のベクトルを生成するステップと、
    記第2のベクトルに対する前記第1のベクトルの類似性尺度を決定するステップと、
    前記類似性尺度が類似性閾値を超える場合、前記選択されたウェブ文書を前記候補クエリに関連付けるステップとを含む請求項4に記載の方法。
  6. 前記選択されたウェブ文書を前記候補クエリに関連付けるステップは、
    前記候補クエリによって文書の前記集合体を検索するステップと、
    文書の前記集合体の前記検索の結果から1つまたは2つ以上の用語からなる第1のベクトルを生成するステップと、
    記第1のベクトルから、前記候補クエリが主要な意図を有するかどうかを識別する意図尺度を決定するステップと、
    前記意図尺度が意図閾値を超える場合、前記選択されたウェブ文書を前記候補クエリに関連付けるステップとを含む請求項4に記載の方法。
  7. 候補クエリを識別するステップは、商業的提供を対象とするクエリを識別するステップを含む請求項1に記載の方法。
  8. カテゴリディレクトリ内で、前記選択されたウェブ文書が属するカテゴリを識別するステップと、
    前記識別されたカテゴリの選択に応答して、前記候補クエリが提示されるように、前記候補クエリを前記識別されたカテゴリに関連付けるステップとをさらに含む請求項1に記載の方法。
  9. 前記ウェブ文書は、ランディングページである請求項1に記載の方法。
  10. コンピュータによって実施される方法であって、
    クエリログに格納されたクエリから候補クエリを識別するステップを含み、前記候補クエリを識別するステップは、
    クエリログに格納された前記クエリからあるクエリを識別するステップと、
    前記クエリが、ある期間の間に少なくとも最小回数提示されたかどうかを判定するステップと、
    前記クエリが、前記期間の間に最大回数未満で提示されたかどうかを判定するステップと、
    前記クエリが、前記期間の間に、少なくとも前記最小回数、かつ、前記最大回数未満で提示された場合、1つまたは複数のコンピュータプロセッサにより、前記クエリを前記候補クエリとして識別するステップと、を含み、
    前記方法は、各候補クエリについて、
    ランディングページの集合体について関連性スコアを受信するステップを含み、ランディングページの前記集合体は、複数のランディングページの適切なサブセットであり、各関連性スコアは、ランディングページに関連付けられ、かつ、前記ランディングページに対する前記候補クエリの前記関連性の尺度であり、
    前記方法は、各候補クエリについて、
    関連性閾値を超える、関連付けられた関連性スコアを有する前記ランディングページを識別するステップと、
    前記候補クエリを、識別されたランディングページに関連付けるステップとを含む、方法。
  11. 各候補クエリについて、
    前記候補クエリおよび前記関連付けられたランディングページを、キーワードおよび広告の関連付けと比較するステップと、
    前記比較に基づいて、前記候補クエリまたは前記関連付けられたランディングページの少なくとも1つが、キーワードおよび広告の前記関連付けに対して関連性があるかどうかを判定するステップと、
    肯定的な判定に応答して、前記候補クエリおよび前記関連付けられたランディングページを前記広告に関連付けるステップとをさらに含む請求項10に記載の方法。
  12. 前記候補クエリを、識別されたランディングページに関連付けるステップは、各候補クエリについて、
    ランディングページの前記集合体の適切なサブセットだけの検索の検索結果から1つまたは2つ以上の用語からなる第1のベクトルを生成するステップと、
    ランディングページの前記集合体の検索の検索結果から1つまたは2つ以上の用語からなる第2のベクトルを生成するステップと、
    記第2のベクトルに対する前記第1のベクトルの類似性尺度を決定するステップと、
    前記類似性尺度が類似性閾値を超える場合、前記候補クエリを前記ランディングページに関連付けるステップとを含む請求項10に記載の方法。
  13. 前記候補クエリを、識別されたランディングページに関連付けるステップは、各候補クエリについて、
    ランディングページの前記集合体の検索の検索結果から1つまたは2つ以上の用語からなる第1のベクトルを生成するステップと、
    記第1のベクトルから、前記候補クエリが主要な意図を有するかどうかを識別する意図尺度を決定するステップと、
    前記意図尺度が意図閾値を超える場合、前記候補クエリを前記ランディングページに関連付けるステップとを含む請求項10に記載の方法。
  14. クエリログに格納されたクエリから候補クエリを識別するクエリ抽出器を備えるシステムであって、前記クエリ抽出器は、
    クエリログに格納された前記クエリからあるクエリを識別し、
    前記クエリが、ある期間の間に少なくとも最小回数提示されたかどうかを判定し、
    前記クエリが、前記期間の間に最大回数未満で提示されたかどうかを判定し、
    前記クエリが、前記期間の間に、少なくとも前記最小回数、かつ、前記最大回数未満で提示された場合、前記クエリを前記候補クエリとして識別し、
    前記システムは、
    各候補クエリについて、ランディングページの集合体について関連性スコアを受信する候補クエリ検索評価器を備え、ランディングページの前記集合体は、複数のランディングページの適切なサブセットであり、各関連性スコアは、ランディングページに関連付けられ、かつ、前記ランディングページに対する前記候補クエリの前記関連性の尺度であり、前記候補クエリ検索評価器は、前記関連性スコアを関連性閾値と比較し、かつ、前記関連性閾値を超える関連性スコアを有する前記ランディングページを、前記候補クエリに関連付ける、システム。
  15. 前記候補クエリおよび関連付けられたランディングページを受信し、各候補クエリおよび関連付けられたランディングページについて、関連性基準に基づいて、前記クエリに対するランディングページの関連付けをフィルタリングするフィルタをさらに備える請求項14に記載のシステム。
  16. 各候補クエリについて、前記関連付けられたランディングページが属するカテゴリを、カテゴリディレクトリ内で識別し、前記識別されたカテゴリの選択された1つのカテゴリに応答して、前記候補クエリが提示されるように、前記候補クエリを前記識別されたカテゴリに関連付けるクエリカテゴライザをさらに備える請求項14に記載のシステム。
  17. 広告グループアナライザをさらに備え、前記広告グループアナライザは、各候補クエリについて、
    前記候補クエリおよび前記関連付けられたランディングページを、広告グループと比較し、前記広告グループは、キーワードおよび広告の関連付けであり、
    前記広告グループアナライザは、各候補クエリについて、
    前記比較に基づいて、前記候補クエリおよび前記関連付けられたランディングページが、前記広告グループに関連性があるかどうかを判定し、
    前記候補クエリおよび前記関連付けられたウェブ文書が前記広告グループに対して関連性があると判定された場合、前記候補クエリおよび前記関連付けられたランディングページを前記広告グループに関連付ける請求項14に記載のシステム。
JP2011516497A 2008-06-23 2009-06-22 クエリ識別および関連付け Active JP5542812B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US7494508P 2008-06-23 2008-06-23
US61/074,945 2008-06-23
PCT/US2009/048159 WO2010008800A2 (en) 2008-06-23 2009-06-22 Query identification and association

Publications (3)

Publication Number Publication Date
JP2011525678A JP2011525678A (ja) 2011-09-22
JP2011525678A5 JP2011525678A5 (ja) 2012-08-09
JP5542812B2 true JP5542812B2 (ja) 2014-07-09

Family

ID=41432301

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011516497A Active JP5542812B2 (ja) 2008-06-23 2009-06-22 クエリ識別および関連付け

Country Status (8)

Country Link
US (2) US8171021B2 (ja)
EP (1) EP2313839A4 (ja)
JP (1) JP5542812B2 (ja)
CN (1) CN102124462B (ja)
AU (1) AU2009271386A1 (ja)
BR (1) BRPI0914623A2 (ja)
CA (1) CA2729067A1 (ja)
WO (1) WO2010008800A2 (ja)

Families Citing this family (70)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8073681B2 (en) 2006-10-16 2011-12-06 Voicebox Technologies, Inc. System and method for a cooperative conversational voice user interface
US8060503B2 (en) * 2006-12-22 2011-11-15 Fujitsu Limited Ranking nodes for session-based queries
US7818176B2 (en) 2007-02-06 2010-10-19 Voicebox Technologies, Inc. System and method for selecting and presenting advertisements based on natural language processing of voice-based input
US8140335B2 (en) 2007-12-11 2012-03-20 Voicebox Technologies, Inc. System and method for providing a natural language voice user interface in an integrated voice navigation services environment
US9305548B2 (en) 2008-05-27 2016-04-05 Voicebox Technologies Corporation System and method for an integrated, multi-modal, multi-device natural language voice services environment
US8171021B2 (en) 2008-06-23 2012-05-01 Google Inc. Query identification and association
US8886636B2 (en) * 2008-12-23 2014-11-11 Yahoo! Inc. Context transfer in search advertising
US8326637B2 (en) 2009-02-20 2012-12-04 Voicebox Technologies, Inc. System and method for processing multi-modal device interactions in a natural language voice services environment
US8812362B2 (en) * 2009-02-20 2014-08-19 Yahoo! Inc. Method and system for quantifying user interactions with web advertisements
US9171541B2 (en) * 2009-11-10 2015-10-27 Voicebox Technologies Corporation System and method for hybrid processing in a natural language voice services environment
US20110166928A1 (en) * 2010-01-06 2011-07-07 Sharitable, Llc Method of Sharing Possessions among Friends Connected through a Social Network
US20110238686A1 (en) * 2010-03-24 2011-09-29 Microsoft Corporation Caching data obtained via data service interfaces
US8392435B1 (en) * 2010-04-14 2013-03-05 Google Inc. Query suggestions for a document based on user history
US8533044B2 (en) * 2010-04-14 2013-09-10 Microsoft Corporation Considering user-relevant criteria when serving advertisements
US9129300B2 (en) * 2010-04-21 2015-09-08 Yahoo! Inc. Using external sources for sponsored search AD selection
US20110295678A1 (en) * 2010-05-28 2011-12-01 Google Inc. Expanding Ad Group Themes Using Aggregated Sequential Search Queries
US20120016741A1 (en) * 2010-07-19 2012-01-19 Google Inc. Targeting content without keywords
US8515968B1 (en) * 2010-08-13 2013-08-20 Google Inc. Tie breaking rules for content item matching
CN102479193B (zh) * 2010-11-22 2015-04-01 百度在线网络技术(北京)有限公司 一种基于匹配出价系数进行匹配搜索推广的方法和设备
US20120150657A1 (en) * 2010-12-14 2012-06-14 Microsoft Corporation Enabling Advertisers to Bid on Abstract Objects
US9519714B2 (en) * 2010-12-22 2016-12-13 Microsoft Technology Licensing, Llc Presenting list previews among search results
US9495461B2 (en) * 2011-03-22 2016-11-15 Excalibur Ip, Llc Search assistant system and method
US10643355B1 (en) 2011-07-05 2020-05-05 NetBase Solutions, Inc. Graphical representation of frame instances and co-occurrences
CN102890685B (zh) * 2011-07-21 2015-09-23 阿里巴巴集团控股有限公司 一种信息重定向的方法及设备
US8756218B1 (en) * 2011-08-16 2014-06-17 Google Inc. Query classification based on search engine results
US8190609B1 (en) * 2011-08-18 2012-05-29 Google Inc. Identifying alternative products
US9104751B2 (en) * 2011-10-12 2015-08-11 Microsoft Technology Licensing, Llc Supplemental search results having social connection endorsement data on a SERP
US9075799B1 (en) * 2011-10-24 2015-07-07 NetBase Solutions, Inc. Methods and apparatus for query formulation
US9727892B1 (en) * 2011-10-28 2017-08-08 Google Inc. Determining related search terms for a domain
US8983996B2 (en) 2011-10-31 2015-03-17 Yahoo! Inc. Assisted searching
US9164985B1 (en) 2011-11-29 2015-10-20 Google Inc. Techniques for detecting poor machine translations of key terms
US9858313B2 (en) * 2011-12-22 2018-01-02 Excalibur Ip, Llc Method and system for generating query-related suggestions
US20130211905A1 (en) * 2012-02-13 2013-08-15 Microsoft Corporation Attractiveness-based online advertisement click prediction
CN103365842B (zh) * 2012-03-26 2016-08-24 阿里巴巴集团控股有限公司 一种页面浏览推荐方法及装置
US20130282481A1 (en) * 2012-04-20 2013-10-24 Increase Visibility Mexico, S. De R.L. De C.V. System and methods for electronic advertising management
US8849799B1 (en) * 2012-05-09 2014-09-30 Google Inc. Content selection using boolean query expressions
US9158857B2 (en) * 2012-06-05 2015-10-13 Google Inc. Identifying landing pages for images
US20140025657A1 (en) * 2012-07-21 2014-01-23 Trulia, Inc. Automated landing page generation and promotion for real estate listings
US10192238B2 (en) * 2012-12-21 2019-01-29 Walmart Apollo, Llc Real-time bidding and advertising content generation
US9536259B2 (en) * 2013-03-05 2017-01-03 Google Inc. Entity-based searching with content selection
US10860557B2 (en) 2013-03-13 2020-12-08 Salesforce.Com, Inc. Systems, methods, and apparatuses for implementing change value indication and historical value comparison
US20140280098A1 (en) * 2013-03-15 2014-09-18 Quixey, Inc. Performing application search based on application gaminess
US9418114B1 (en) 2013-06-19 2016-08-16 Google Inc. Augmenting a content item using search results content
US9305307B2 (en) 2013-07-15 2016-04-05 Google Inc. Selecting content associated with a collection of entities
US9342839B2 (en) 2013-07-16 2016-05-17 Google Inc. Combining content with a search result
US9298779B1 (en) 2013-07-16 2016-03-29 Google Inc. Combining content with a search result
EP2833307A1 (en) 2013-07-30 2015-02-04 Google, Inc. Handling search queries
US9436946B2 (en) 2013-07-31 2016-09-06 Google Inc. Selecting content based on entities present in search results
US9367529B1 (en) 2013-07-31 2016-06-14 Google Inc. Selecting content based on entities
CN103455552A (zh) * 2013-08-01 2013-12-18 百度在线网络技术(北京)有限公司 基于兴趣词的兴趣点挖掘方法及装置
US20150088648A1 (en) * 2013-09-24 2015-03-26 Google Inc. Determining commercial intent
US9299028B2 (en) * 2013-11-04 2016-03-29 Adobe Systems Incorporated Identifying suggestive intent in social posts
US10311364B2 (en) 2013-11-19 2019-06-04 Salesforce.Com, Inc. Predictive intelligence for service and support
EP2884444A1 (en) * 2013-12-10 2015-06-17 Google, Inc. Handling search queries
US9672288B2 (en) 2013-12-30 2017-06-06 Yahoo! Inc. Query suggestions
US9652508B1 (en) * 2014-03-05 2017-05-16 Google Inc. Device specific adjustment based on resource utilities
US20150379074A1 (en) * 2014-06-26 2015-12-31 Microsoft Corporation Identification of intents from query reformulations in search
WO2016044321A1 (en) 2014-09-16 2016-03-24 Min Tang Integration of domain information into state transitions of a finite state transducer for natural language processing
CN107003996A (zh) 2014-09-16 2017-08-01 声钰科技 语音商务
CN107003999B (zh) 2014-10-15 2020-08-21 声钰科技 对用户的在先自然语言输入的后续响应的系统和方法
US10614799B2 (en) 2014-11-26 2020-04-07 Voicebox Technologies Corporation System and method of providing intent predictions for an utterance prior to a system detection of an end of the utterance
US10431214B2 (en) 2014-11-26 2019-10-01 Voicebox Technologies Corporation System and method of determining a domain and/or an action related to a natural language input
US10817519B2 (en) * 2016-06-06 2020-10-27 Baidu Usa Llc Automatic conversion stage discovery
WO2018023106A1 (en) 2016-07-29 2018-02-01 Erik SWART System and method of disambiguating natural language processing requests
CN109992764B (zh) * 2017-12-29 2022-12-16 阿里巴巴集团控股有限公司 一种文案生成方法及装置
US11314794B2 (en) * 2018-12-14 2022-04-26 Industrial Technology Research Institute System and method for adaptively adjusting related search words
CN110555165B (zh) * 2019-07-23 2023-04-07 平安科技(深圳)有限公司 信息识别方法、装置、计算机设备和存储介质
US20220035675A1 (en) * 2020-08-02 2022-02-03 Avatar Cognition Barcelona S.L. Pattern recognition system utilizing self-replicating nodes
CN115037739B (zh) * 2022-06-13 2024-02-23 深圳乐播科技有限公司 文件传输方法、装置、电子设备及存储介质
US20240004947A1 (en) * 2022-06-30 2024-01-04 Citrix Systems, Inc. Systems and Methods of Determining Web Resource Relevance

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6772150B1 (en) * 1999-12-10 2004-08-03 Amazon.Com, Inc. Search query refinement using related search phrases
CN1826596A (zh) * 2002-09-24 2006-08-30 Google公司 用于提供相关广告服务的方法和装置
US7197497B2 (en) 2003-04-25 2007-03-27 Overture Services, Inc. Method and apparatus for machine learning a document relevance function
US20050033771A1 (en) 2003-04-30 2005-02-10 Schmitter Thomas A. Contextual advertising system
US20040249808A1 (en) * 2003-06-06 2004-12-09 Microsoft Corporation Query expansion using query logs
US7260568B2 (en) 2004-04-15 2007-08-21 Microsoft Corporation Verifying relevance between keywords and web site contents
AU2005259861C1 (en) * 2004-06-30 2012-08-30 Google, Inc. Local area advertisements
JP2006079454A (ja) * 2004-09-10 2006-03-23 Fujitsu Ltd 検索キーワード分析方法、検索キーワード分析プログラムおよび検索キーワード分析装置
US7739708B2 (en) * 2005-07-29 2010-06-15 Yahoo! Inc. System and method for revenue based advertisement placement
US7962479B2 (en) * 2005-11-09 2011-06-14 Yahoo! Inc. System and method for generating substitutable queries
US7788131B2 (en) * 2005-12-15 2010-08-31 Microsoft Corporation Advertising keyword cross-selling
US20070192293A1 (en) * 2006-02-13 2007-08-16 Bing Swen Method for presenting search results
US7689554B2 (en) * 2006-02-28 2010-03-30 Yahoo! Inc. System and method for identifying related queries for languages with multiple writing systems
US7818315B2 (en) * 2006-03-13 2010-10-19 Microsoft Corporation Re-ranking search results based on query log
US7577643B2 (en) * 2006-09-29 2009-08-18 Microsoft Corporation Key phrase extraction from query logs
KR100851041B1 (ko) * 2006-11-08 2008-08-12 엔에이치엔(주) 유알엘 입력을 통한 광고 키워드 추천 방법 및 그 시스템
US7739264B2 (en) * 2006-11-15 2010-06-15 Yahoo! Inc. System and method for generating substitutable queries on the basis of one or more features
US7827172B2 (en) * 2007-03-14 2010-11-02 Yahoo! Inc. “Query-log match” relevance features
US20090192983A1 (en) * 2008-01-28 2009-07-30 Yahoo! Inc. Method and system for mining, ranking and visualizing lexically similar search queries for advertisers
US8171021B2 (en) * 2008-06-23 2012-05-01 Google Inc. Query identification and association
JP2010059671A (ja) 2008-09-03 2010-03-18 Chugoku Electric Power Co Inc:The コンクリート構造物の型枠の固定装置

Also Published As

Publication number Publication date
BRPI0914623A2 (pt) 2015-10-20
CN102124462A (zh) 2011-07-13
WO2010008800A3 (en) 2010-03-25
EP2313839A2 (en) 2011-04-27
JP2011525678A (ja) 2011-09-22
EP2313839A4 (en) 2012-12-19
US8631003B2 (en) 2014-01-14
CN102124462B (zh) 2015-04-01
US8171021B2 (en) 2012-05-01
CA2729067A1 (en) 2010-01-21
AU2009271386A1 (en) 2010-01-21
WO2010008800A2 (en) 2010-01-21
US20120215776A1 (en) 2012-08-23
US20090319517A1 (en) 2009-12-24

Similar Documents

Publication Publication Date Title
JP5542812B2 (ja) クエリ識別および関連付け
US8694362B2 (en) Taxonomy based targeted search advertising
US20100030647A1 (en) Advertisement selection for internet search and content pages
US8886636B2 (en) Context transfer in search advertising
CN105765573B (zh) 网站通信量优化方面的改进
US8655727B2 (en) Method and system for generating and placing keyword-targeted advertisements
JP6343035B2 (ja) 広告キャンペーンの生成
US20070214050A1 (en) Delivery of internet ads
US20050278309A1 (en) System and method for mining and searching localized business-marketing and informational data
US20140258002A1 (en) Semantic model based targeted search advertising
US20100057577A1 (en) System And Method For Providing Topic-Guided Broadening Of Advertising Targets In Social Indexing
TW200917070A (en) System and method to facilitate matching of content to advertising information in a network
EP1678573A2 (en) Automatically targeting web-based advertisements
JP2013524382A (ja) ユーザー行為に基づく検索広告の選択
Hasan et al. Query suggestion for e-commerce sites
WO2010138861A2 (en) Contextual content targeting
US20110258034A1 (en) Hierarchically-structured indexing and retrieval
Bulut Lean Marketing: Know who not to advertise to!
JP6703592B1 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
Tavşanoğlu Decision support system for search engine advertising campaign management by determining negative keywords
JP6731469B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
CA2550853C (en) Method and system for placing advertisements based on selection of links that are not prominently displayed
Ergezer New method for reaching consumers over the internet:" search engine marketing”
US20090094117A1 (en) Natural targeted advertising engine
Cristo et al. Search advertising

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120621

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120621

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130704

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130716

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20131016

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20131023

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140407

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140507

R150 Certificate of patent or registration of utility model

Ref document number: 5542812

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250