JP6211605B2 - クリックスルー率に基づく検索結果の順位付け - Google Patents

クリックスルー率に基づく検索結果の順位付け Download PDF

Info

Publication number
JP6211605B2
JP6211605B2 JP2015517480A JP2015517480A JP6211605B2 JP 6211605 B2 JP6211605 B2 JP 6211605B2 JP 2015517480 A JP2015517480 A JP 2015517480A JP 2015517480 A JP2015517480 A JP 2015517480A JP 6211605 B2 JP6211605 B2 JP 6211605B2
Authority
JP
Japan
Prior art keywords
query
user
ctr
data
click data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015517480A
Other languages
English (en)
Other versions
JP2015537259A (ja
Inventor
ウェイ フイ
ウェイ フイ
ソン チャオ
ソン チャオ
ハン シアオメイ
ハン シアオメイ
チェン チャオ
チェン チャオ
フェン ジオン
フェン ジオン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Publication of JP2015537259A publication Critical patent/JP2015537259A/ja
Application granted granted Critical
Publication of JP6211605B2 publication Critical patent/JP6211605B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3349Reuse of stored results of previous queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Probability & Statistics with Applications (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

関連特許出願の相互参照
この出願は、2012年6月18日に出願され「Method and Apparatus of Ranking Search Results Based on Click Through Rates」と題された中国特許出願第201210206502.0号に対する外国優先権を主張するものであり、その出願は、その全体が参照によって本明細書に組み込まれる。
本開示は、検索技術の分野に関するものであり、より詳細には、クリックスルー率に基づく検索順位付け方法および装置に関するものである。
インターネットの絶え間ない開発で、ますます多くのユーザが、ネットワーク経由で情報を取得し、ユーザは、対応する検索結果を取得するためにクエリを入力することによって検索を行うことができる。一般に、クエリに対応する1つ以上のクエリ対象に関して、クエリとクエリ対象との間の一致度合いが、一定の順位付けルールに従って測定され得、クエリ対象は、一致度合いに基づいて順位付けられ、順位付けられたクエリ対象は、ユーザに表示されることになる検索結果を成し、それによって、ユーザが必要とされた結果を迅速に取得することを可能にする。
しかしながら、そのような従来の技法は、一定の欠点を有する。順位付けルールは、適用シナリオの変化に従って変化し得る。換言すれば、クエリ対象が異なる場合、対応する順位付けルールもまた異なることになる。その結果、従来の技法は、各適用シナリオについて対応する順位付けルールを必要とし、それは、再使用可能性をほとんど有さない。
例えば、クエリ対象は、企業クエリにおける企業であり得る。それ故、クエリに一致する企業は、企業のサイズなどの順位付けルールに従って順位付けられる。別の例の場合、製品クエリにおいて、クエリに一致する製品は、価格または発売時期に従って順位付けられ得る。それ故、従来の技法の再使用可能性は非常に低い。
その上、ユーザ要求が変化する場合、適用シナリオもまた変化する。順位付けルールは、順位付けルールが適用シナリオまたはユーザ要求の変化に従って変化されるとき、再構成される。例えば、ユーザは、冬と夏に異なる製品を必要とする。それ故、順位付けルールは再構成されなければならないし、検索順位付け方法は書き換えられなければならず、それは、非常に面倒である。
要約すれば、従来の技法が検索結果を順位付けるために適用されるとき、再使用可能性は低く、方法は面倒なものである。
この概要は、発明を実施するための形態において以下に更に記載される簡単化された形態で概念の選択を導入するために提供される。この概要は、特許請求された主題の全ての重要な特徴または必須の特徴を識別することを意図されず、また、特許請求された主題の範囲を決定するのを助けるものとして単独で使用されることも意図されない。用語「技法」は、例えば、上記文脈によっておよび本開示の全体にわたって許容されるような、(複数の)装置、(複数の)システム、(複数の)方法および/またはコンピュータで読み取り可能な命令のことを言い得る。
本開示は、再使用可能性を改善し順位付け工程を簡単化するためのクリックスルー率(CTR)に基づく検索順位付け方法および装置を提供する。
本開示は、CTRに基づく検索順位付け方法を提供する。検索順位付けの前に、事前設定した期間内のユーザのクリックデータが取得され、各特性のそれぞれの重みは、クリックデータに基づいて決定される。
検索順位付けは、以下の動作を含み得る。
クエリおよびクエリに一致する1つ以上のクエリ対象が取得される。各クエリおよびクエリ対象のそれぞれの特性が抽出される。各クエリ対象に関して、クエリおよびクエリ対象の特性ならびに各特性に対応するそれぞれの重みに基づいて、それぞれのCTRは、回帰モデルなどの1つ以上のモデルに基づいて取得される。
クエリ対象は、各クエリ対象のそれぞれのCTRに基づいて順位付けられ、ユーザに表示される。
例えば、クエリおよびクエリ対象のそれぞれの特性が抽出された後、以下の動作があり得る。クエリおよびクエリ対象のそれぞれの特性は、特性値に定量化される。
例えば、各クエリ対象に関して、クエリおよびクエリ対象の特性ならびに各特性に対応するそれぞれの重みに基づいて、それぞれのCTRは、以下の動作によって回帰モデルに基づいて取得される。各特性に対応するそれぞれの重みが取得される。それぞれの特性値および重みは、各クエリ対象について重み付け結果を計算するために使用される。重み付け結果は、それぞれのクエリ対象のそれぞれのCTRを予測するために回帰モデルに使用される。
例えば、検索順位付けの前に、事前設定した期間内のユーザのクリックデータが取得され得、各特性のそれぞれの重みは、以下の動作によってクリックデータに基づいて決定され得る。事前設定した期間内のユーザのクリックデータが取得される。それぞれの後のCTRが、クリックデータに基づいて計算される。クエリおよびクエリ対象の特性値が取得される。各特性のそれぞれの重みが、後のCTRおよび特性値に基づいて計算される。
例えば、各クエリ対象についての事前設定した期間内のユーザのクリックデータが取得された後および後のCTRがクリックデータに基づいて計算される前に、クリックデータにおける異常データが、フィルタリングされたクリックデータを取得するためにフィルタリングされる動作があり得る。
例えば、それぞれの後のCTRは、以下の動作によってクリックデータに基づいて計算され得る。フィルタリングされたクリックデータは、ページの各位置でクエリ対象のCTRを取得するための統計のために使用される。各位置でのCTRは、対応する後のCTRを取得するための重み付け計算のために使用される。
例えば、各クエリおよびクエリ対象のそれぞれの特性が抽出された後、以下の動作があり得る。
クエリを入力するユーザに関して、ユーザの1つ以上の挙動特性が抽出される。ユーザの1つ以上の挙動特性は、以下の、期間内のユーザのクリックデータ、期間内のユーザのカテゴリデータ、および期間内のユーザの地理データの少なくとも1つを含み得る。カテゴリデータは、例えば、クリックのカテゴリデータおよび/または検索のカテゴリデータを含み得る。
検索順位付け方法例はまた、以下の動作を更に含み得る。クエリ、クエリ対象、およびユーザの相関特性が抽出される。例えば、クエリ対象は、製品、企業、または産業を含み得る。
本開示はまた、CTRに基づく検索順位付け装置を提供する。装置は、重み決定モジュール、取得および抽出モジュール、CTR予測モジュール、ならびに順位付けおよび表示モジュールを含み得る。
重み決定モジュールは、検索順位付けの前に、事前設定した期間内のユーザのクリックデータを取得し、クリックデータに基づいて各特性のそれぞれの重みを決定する。
取得および抽出モジュールは、クエリおよびクエリに一致する1つ以上のクエリ対象を取得し、各クエリおよびクエリ対象のそれぞれの特性が抽出される。
CTR予測モジュールは、各クエリ対象に関して、クエリおよびクエリ対象の特性ならびに各特性に対応するそれぞれの重みに基づいて、回帰モデルなどの1つ以上のモデルに基づくそれぞれのCTRを取得する。
順位付けおよび表示モジュールは、各クエリ対象のそれぞれのCTRに基づいてクエリ対象を順位付け、順位付けられたクエリ対象をユーザに表示する。
従来の技法と比較して、本技法は、以下の利点を有し得る。
第1に、従来の技法では、クエリと各クエリ対象との間の一致度合いが、一定の順位付けルールに従って測定される。しかしながら、順位付けルールは、適用シナリオの変化に従って変化する。換言すれば、クエリ対象が異なる場合、対応する順位付けルールもまた異なることになる。例えば、クエリ対象は、会社クエリにおける会社であり、それ故、クエリに一致する会社は、会社のサイズなどの順位付けルールにだけ従って順位付けられることになる。別の例の場合、製品クエリにおいて、クエリに一致する製品は、価格または発売時期にだけ従って順位付けられ得、それ故、再使用可能性は非常に低い。
しかしながら、本技法は、検索順位付けの前に事前設定した期間内のユーザのクリックデータを取得することによって各特性の重みを決定する。特定の検索順位付けが実行されるとき、適用シナリオやクエリ対象に関わらず、クエリおよびクエリ対象の対応する特性は、それらが取得された後に抽出され、検索順位付けにおけるクエリ対象のCTRは、特性および特性に対応する重みに基づいて回帰モデルなどの1つ以上のモデルによって予測される。
本技法は、異なるクエリ対象の異なる特性および異なる特性に対応する重みに基づいて様々な適用シナリオにおける様々なクエリ対象のCTRを予測する。それ故、本技法は、様々な適用シナリオに適用可能であり得、高い再使用可能性を有する。
加えて、従来の技法では、ユーザが冬と夏に異なる製品を必要とするようにユーザ要求が変化すると、順位付けルールは再構成されなければならず、検索順位付け方法は書き換えられなければならない。本技法は、検索順位付けを実行する前に事前設定した期間内のクリックデータに基づいて各特性の重みを決定し、各特性の重みは、別個の手動構成無しに、少なくともほぼ実時間にユーザ要求の変化で調整される。本技法は簡単化された方法を適用し、それ故、重みに基づいて予測されたクエリ対象のCTRはまた、少なくともほぼ実時間に調整されることになり、高い精度を有する。
第2に、本技法は、事前設定した期間内のクリックデータを取得し、クリックデータをフィルタリングし、次いで、統計によって後のCTRを取得する。次いで、各特性の重みが、後のCTRおよび各特性の特性値に基づいて計算される。従って、本技法は、クリックデータに基づいて重みを更新する。検索するとき、同じクエリに関してさえ、ユーザは異なる時間に検索するので、対応する検索結果はまた、異なり得る。
第3に、本技法は、重み計算やCTR予測が、多次元的特性を抽出することによって正確に行われるように、クエリおよびクエリ対象の特性のみならずユーザの特性もまた抽出し、それによって、合理的な予測モデルを確立し、合理的な誘導をユーザに提供し、挙動の不正行為によってもたらされる不利点を削減する。その一方で、同じクエリに関して、対応する検索結果は、異なるユーザの場合には異なり得る。それ故、本技法はまた、ユーザの個々のニーズをかなえる。
本開示の実施形態をより良く例示するために、以下は、実施形態の記載に使用されることになる図面の簡単な導入である。以下の図面は、本開示のいくつかの実施形態にだけ関連することは、明白である。当業者は、創造的な努力無しで、本開示における図面に従って他の図面を得ることができる。
本開示に従うCTRに基づく検索順位付け方法例のフローチャートを示す。 本開示に従うCTRに基づく検索順位付け方法例において後のCTRを計算するための方法例のフローチャートを示す。 本開示に従うCTRに基づく別の検索順位付け方法例のフローチャートを示す。 本開示に従うCTRに基づく検索順位付け装置例の図を示す。
以下の記載は、図面といくつかの実施形態例を参照にして説明される。
一般に、クエリに対応する検索結果について、クエリと検索結果との間の一致度合いは、一定の順位付けルールに従って測定され得る。次いで、検索結果は、一致度合いに基づいて順位付けられ、順位付けられた検索結果はユーザに表示され、それによって、ユーザが、最も求めた結果を迅速に取得することを可能にする。しかしながら、検索結果を順位付けるために順位付けルールを適用する場合、再使用可能性は低く、従来の技法は面倒である。
本開示は、CTRに基づく検索順位付け方法を提供する。本技法は、検索順位付けを実行する前に事前設定した期間内のクリックデータに基づいて各特性の重みを決定し、次いで、クエリ対象を順位付けるときに重みを用いる。それ故、本技法は、再構成無しで、ユーザのクリックデータに基づいて少なくともほぼ実時間に重みを調整する。その上、本技法は、回帰モデルによってCTRを予測し得、様々な適用シナリオに適しており、高い再使用可能性を有する。
図1は、本開示に従うCTRに基づく検索順位付け方法例のフローチャートを示す。
102で、事前設定した期間内のユーザのクリックデータは、検索順位付けの前に取得され、各特性の重みは、クリックデータに基づいて決定される。
従来の技法では、ユーザ要求の変化は、順位付けルールの変化を導くことになる。例えば、ユーザは、冬と夏に異なる製品を必要とし、それ故、順位付けルールは再構成されなければならず、検索順位付け方法は、異なる時間に書き換えられなければならない。それ故、従来の技法は非常に面倒である。
事前設定した期間内のユーザのクリックデータは、検索順位付けの前に取得される。例えば、事前設定した期間が24時間である場合、24時間以内のユーザのクリックデータが取得され、各特性の重みは、クエリ対象のCTRの後続の予測を準備するためにクリックデータに基づいて決定される。
本技法では、各特性の重みは、別個の手動構成無しで、ユーザ要求の変化と少なくともほぼ実時間に調整されることになり、方法は簡単化される。それ故、重みに基づいて予測されたクエリ対象のCTRはまた、高い精度で少なくともほぼ実時間に調整されることになる。
例えば、検索順位付けは、以下の動作を含み得る。
104で、クエリおよびクエリに一致する1つ以上のクエリ対象が取得され、クエリおよびクエリ対象の特性がそれぞれ抽出される。
まず、ユーザによって入力されたクエリが取得され、クエリに一致するクエリ対象は、事前設定した一致方法によって取得される。その後、クエリの特性およびクエリ対象の特性が抽出される。特性は、クエリのキーワードおよびクエリのカテゴリを含み得る。例えば、クエリがiPhoneである場合、クエリの特性は移動電話である。本開示は、本明細書において何の制限も課さない。
クエリ対象の特性は、特定の対象に依存する。例えば、クエリ対象が製品である場合、クエリ対象の特性は、製品のカテゴリであり得る。別の例の場合、クエリ対象が企業である場合、クエリ対象の特性は企業の主製品であり得る。
106で、各クエリ対象に関して、クエリおよびクエリ対象の特性ならびに各特性に対応するそれぞれの重みに基づいて、それぞれのCTRが、回帰モデルなどの1つ以上のモデルに基づいて取得される。
クエリに一致するクエリ対象が取得された後、各クエリ対象に関して、クエリおよびクエリ対象の特性ならびに各特性に対応するそれぞれの重みに基づいて、それぞれのCTRは、回帰モデルに基づいて取得される。
CTRは、ウェブページにおけるそれぞれのコンテンツの表示回数に対するクリック回数の比率を表す。CTRは、ウェブページにおけるそれぞれのコンテンツの人気の度合いを反映する。クリック回数と非クリック回数の合計が、表示回数である。
本技法では、異なるクエリ対象は異なる特性に対応し、一方、異なる特性は異なる重みに対応する。しかしながら、本技法では、適用シナリオおよびクエリ対象に関係なく、検索順位付けにおけるクエリ対象のCPRは、クエリおよびクエリ対象の対応する特性ならびに各特性に対応する重みに基づいて回帰モデルによって予測され得る。それ故、本技法は、様々な適用シナリオに適しており、より高い再使用可能性を有する。
108で、クエリ対象は、それらのそれぞれのCTRに基づいて順位付けられ、ユーザに表示される。
各クエリ対象のそれぞれのCTRが予測された後、クエリ対象は、それらのそれぞれのCTRに基づいて順位付けられ、次いで、順位付けられた結果は、ユーザに表示される。
従来の技法では、クエリおよび各クエリ対象のそれぞれの一致度合いは、一定の順位付けルールに従って測定される。しかしながら、順位付けルールは、適用シナリオの変化に従って変化される必要がある。換言すれば、クエリ対象が異なる場合、対応する順位付けルールもまた異なることになる。例えば、クエリ対象は、会社クエリにおける会社であり、それ故、クエリに一致する会社は、会社のサイズなどの順位付けルールにだけ従って順位付けられることになる。別の例の場合、製品クエリにおいて、クエリに一致する製品は、価格または発売時期にだけ従って順位付けられ得、それ故、再使用可能性は非常に低い。
しかしながら、本技法は、検索順位付けの前に事前設定した期間内のユーザのクリックデータを取得することによって各特性の重みを決定する。特定の検索順位付けが実行されるとき、適用シナリオやクエリ対象に関わらず、クエリおよびクエリ対象の対応する特性は、それらが取得された後に抽出され、検索順位付けにおけるクエリ対象のCTRは、特性および特性に対応する重みに基づいて回帰モデルなどの1つ以上のモデルによって予測される。
本開示では、クエリ対象は、製品、企業、産業などを含み得る。
電子商取引ウェブサイトで、ユーザが検索を行うとき、クエリ対象は、電子商取引ウェブサイトにおける販売元によって販売された衣類および電子製品などの製品情報であり得る。クエリ対象はまた、電子商取引ウェブサイトにおける販売元の企業情報であり得る。例えば、クエリが移動電話であるとき、クエリ対象は、移動電話の販売元である。クエリ対象はまた、電子商取引ウェブサイトにおける様々な産業の関連情報であり得る。
本技法はまた、広告の検索順位付けに適用可能であり得る。それぞれの重みは、表示された広告のクリックデータに基づいて決定される。次いで、ユーザが検索するときにクエリに一致する広告クエリ対象が取得され、それらのCTRは、特性および重みに基づいて予測される。広告クエリ対象は、順位付けられ、表示される。
例えば、広告は、電子商取引ウェブサイトでの検索の間に見付けられる販売元によって発売された製品情報であり得る。広告はまた、クエリに一致するクエリ対象の広告であり得、ユーザが検索を行うと検索結果ページの端に表示される。例えば、ユーザがスカートの画像を検索すると、スカートに関連した製品またはスカートの販売元が、検索結果ページの端に表示され得る。
例えば、クエリの特性は、キーワード、クエリのカテゴリなどを含み得る。クエリ対象はまた、それぞれの特性を含み得る。例えば、クエリ対象が製品である場合、対応する特性は、製品名におけるキーワード、カテゴリ、製造企業などを含み得る。クエリ対象が企業である場合、対応する特性は、企業名におけるキーワード、企業の一次製品のキーワード、企業の一次産業などを含み得る。
特性はまた、クエリおよびクエリ対象の相関特性を含み得る。企業を例に取ると、相関特性は、クエリのカテゴリが、企業の一次産業、企業名に一致するクエリにおける多数のキーワードまたは企業名に一致するクエリにおけるキーワード割合、企業の一次製品に一致するクエリにおける多数のキーワードまたは企業の一次製品に一致するクエリにおけるキーワードの割合などに一致するかどうかを含み得る。
例えば、クエリおよびクエリ対象の特性が抽出された後、検索順位付け方法例は、以下の動作を更に含み得る。
クエリおよびクエリ対象の特性は、それぞれ、特性値に定量化される。例えば、クエリおよびクエリ対象のそれぞれの特性が抽出された後、クエリおよびクエリ対象の特性は定量化され、定量化された特性値が取得される。
各クエリ対象に関して、クエリおよびクエリ対象の特性ならびに各特性に対応するそれぞれの重みに基づいて、それぞれのCTRは、以下の動作による回帰モデルに基づいて取得される。
第1のステップで、各特性に対応するそれぞれの重みが取得される。各特性に対応する重みは、検索順位付けの前にクリックデータに基づいて決定され得る。それ故、各特性に対応する重みは、CTRの予測前に取得され得る。
第2のステップで、それぞれの特性値および重みは、各クエリ対象についての重み付け結果を計算するために使用される。各特性の特性値および各特性に対応する重みは、各クエリ対象について取得される。それ故、特性値およびそれらのそれぞれの重みは、重み付け演算のために使用され得る。
第3のステップで、重み付け結果は、それぞれのクエリ対象のそれぞれのCTRを予測するために回帰モデルにおいて使用される。
重み付け結果は回帰モデルに代入され、次いで、クエリ対象のCTRが予測される。
例えば、CTRは、ロジスティック回帰モデルを使用してフィッティングされ得、
は、予測されたCTRを表し、
は、k番目の特性の特性値を表し、
は、k番目の特性の重みを表す。式の例は以下のようなものである。
例えば、検索順位付けの前に、事前設定した期間内のユーザのクリックデータが取得され、各特性の重みは、以下の動作によってクリックデータに基づいて決定される。
第1のステップで、事前設定した期間内のユーザのクリックデータが取得され、後のCTRは、クリックデータに基づいて計算される。
事前設定した期間内のユーザのクリックデータが取得される。例えば、事前設定した期間が24時間である場合、24時間以内のユーザのクリックデータが取得される。その後、クリックデータは統計のために使用され、後のCTRは、統計を通して取得される。
図2は、本開示に従うCTRに基づく検索順位付け方法例において、後のCTRを計算するための方法例のフローチャートを示す。
202で、事前設定した期間内のユーザのクリックデータが取得される。
例えば、各クエリ対象について事前設定した期間内のユーザのクリックデータが取得された後および後のCTRがクリックデータに基づいて計算される前に、後のCTRを計算するための方法例はまた、以下の動作を含み得る。
204で、クリックデータにおける異常データは、フィルタリングされたクリックデータを取得するためにフィルタリングされる。
事前設定した期間内のユーザのクリックデータが取得された後および後のCTRがクリックデータに基づいて計算される前に、クリックデータにおける異常データは、フィルタリングされたクリックデータを取得するためにフィルタリングされる。
実際的な処理では、様々なウェブサイトで異なるフローボリュームの不正行為やクリックの不正行為があり得る。不正行為からのクリックデータは、異常データとして取り扱われる。例えば、一部のユーザは、それぞれのクエリ対象が高いCTRを取得するように、いくつかの不正行為ツールを使用することによってそれぞれのクエリ対象を連続的に検索する。従って、不正行為からのクリックデータなどの異常データは、フィルタリングされたクリックデータを取得するためにフィルタリングされなければならない。
例えば、クリックデータに基づく後のCTRの計算は、以下の動作を含み得る。
206で、フィルタリングされたクリックデータは、ページの各位置でクエリ対象のCTRを取得するための統計のために使用される。
例えば、現実の適用シナリオにおいてクエリ対象について多くの位置があり得る。それ故、各クエリ対象について事前設定した期間内に取得されたクリックデータに関して、クリックデータは、異なる位置でクエリ対象のクリックを含み得る。例えば、クエリ対象は、第1の位置で100回表示され5回クリックされ得、第3の位置で50回表示され3回クリックされ得る。
従って、フィルタリングされたクリックデータは、ページにおける各位置でのクエリ対象のCTRを取得するための統計のために使用される。上記例では、クエリ対象は、ページにおける第1の位置で0.05のCTRと、第3の位置で0.06のCTRと、を有する。
208で、各位置の事前設定した重みに従って、各位置でのCTRは、対応する後のCTRを取得するために重み付けられる。
クエリ対象は、ページにおける異なる位置に表示され得、それは、クエリ対象のCTRに影響を及ぼし得る。例えば、第1の位置に表示されたクエリ対象は、一般に、ユーザによって最も容易に見られ、ユーザによって最も容易にクリックされる。その結果、本技法は、各位置についてそれぞれの重みを事前設定し得、クエリ対象の後のCTRを取得するために各位置で上記取得されたCTRおよび各位置についてのそれぞれの重みを使用することによって重み付け演算を行い得る。
例えば、各位置についての重みは、第1の位置について重みを正規化することによって決定され得る。例えば、第1の位置についての重みは1であり、第2の位置についての重みは1.5であり、第3の位置についての重みは2である、などである。従って、上記例では、クエリ対象の後のCTRは0.05×1+0.06×2=0.17である。
第2のステップで、クエリおよびクエリ対象のそれぞれの特性値が取得される。
例えば、クエリおよびクエリ対象の特性値
が抽出され得る。
第3のステップで、各特性の重みは、後のCTRおよびそれらのそれぞれの特性値に基づいて計算される。
後のCTRおよび特性値に基づいて、各特性の重みは取得される。例えば、各特性の重みは、以下のような最小二乗法によって計算され得る。
数式において、nは訓練サンプルの数を表し、mは特性の数を表し、Cはペナルティ項の係数を表し、ペナルティ項は、モデルの尺度を定義するために使用され、ectrは、各訓練サンプルの後のCTRを表し、それは、履歴曝露クリックデータの統計によって取得され、ectr=クリック回数/曝露回数である。
数式において、サンプルはiとラベル付けられ、特性はjとラベル付けられ、ωは、j番目の特性の重みであり、xは、j番目の特性の値である。
本技法は、事前設定した期間内のクリックデータを取得し、クリックデータをフィルタリングし、次いで、統計によって後のCTRを取得する。各特性の重みは、次いで、後のCTRおよび各特性の特性値に基づいて計算される。従って、本技法は、クリックデータに基づいて重みを更新する。検索するとき、ユーザは、同じクエリについて異なる検索時間を有し得、それ故、異なる対応する検索結果を有し得る。
クエリおよびクエリ対象の特性がそれぞれ抽出された後、本技法はまた、以下の動作を含み得る。
クエリを入力するユーザに関して、ユーザの1つ以上の挙動特性が抽出される。ユーザの挙動特性は、以下の少なくとも1つを含み得る。
(1)ある期間内のユーザのクリックデータ
すなわち、ユーザの履歴CTRが取得される。CTRは、ユーザの履歴データから直接的に計算される。
例えば、広告のCTRに適用されるとき、この特性は、買い手が広告をクリックすることを好むかどうかを測定し得る。それ故、広告をクリックすることを好む買い手に関して、いくつかのより多くの広告が、ユーザの要求をかなえるために表示され得る。しかしながら、広告をクリックすることを嫌う買い手に関して、広告は、ユーザの検索経験を改善するために出来る限り少なく表示され得る。
(2)期間内のユーザのカテゴリデータ
カテゴリデータは、クリックされたカテゴリデータおよび/または検索されたカテゴリデータを含み得る。例えば、ユーザのカテゴリデータを取り出すために2つのアプローチがあり得る。
1.ユーザによって検索されたカテゴリデータ
期間内にユーザによって検索された1つ以上のクエリは、統計による検索ログなどのログから取得される。クエリは、ユーザの検索のカテゴリ分布を取得するためにカテゴリにマップ化される。トップのn個のカテゴリは、ユーザの検索されたカテゴリデータの特性として使用され得、nは、任意の正の整数であり得る。
2.ユーザによってクリックされたカテゴリデータ
期間内にユーザによってクリックされた1つ以上のクエリ対象は、統計によるログから取得される。例えば、企業の一次ビジネスカテゴリの分布は、クエリ対象の例として、ユーザによってクリックされたカテゴリ分布を取得するために取得され得る。トップのm個のカテゴリは、ユーザのクリックされたカテゴリデータの特性として使用され得、mは、任意の正の整数であり得る。
ユーザによって検索されたカテゴリデータおよびユーザによってクリックされたカテゴリデータは、ユーザのカテゴリデータを取得するために組み合わされ得る。例えば、ユーザによって検索されたカテゴリデータおよびユーザによってクリックされたカテゴリデータからの冗長データは、除去され得る。
(3)期間内のユーザの地理データ
ユーザの地理データを取り出すために2つのアプローチがあり得る。
1.クリックされた地理範囲
期間内にユーザによってクリックされたクエリ対象の地理分布は、ログからの統計によって取得される。地理範囲は、それらの発生頻度に基づいて順位付けられ、トップのp個の地理範囲が、買い手によって好まれた範囲として使用される。
2.位置する地理範囲
例えば、ログ内に記録されたIPアドレスが取得され、IPアドレスは特定の範囲にマップ化される。それ故、ユーザが位置する都市や州などの地理データが取得される。
上述のように、クエリおよびクエリ対象の相関特性が抽出され得る。それ故、例えば、クエリ、クエリ対象、およびユーザの相関特性が、抽出され得る。
相関特性は、ユーザが位置する地理範囲がクエリ対象に一致するかどうか、ユーザのカテゴリデータがクエリ対象のカテゴリに一致するかどうかなどを含み得る。
本技法は、クエリおよびクエリ対象の特性のみならず、ユーザの特性もまた抽出する。重み計算およびCTR予測は、多次元的特性を抽出することによってより正確に行われ、それによって、より合理的な予測モデルを確立し、より合理的な誘導をユーザに提供し、挙動の不正行為によってもたらされる不利点を削減する。その一方で、同じクエリについてでさえ異なるユーザについて異なる検索結果があり得、それによって、ユーザの個々のニーズをかなえる。
図3は、本開示に従うCTRに基づく別の検索順位付け方法例のフローチャートを示す。
302で、ユーザによって入力されたクエリが取得される。304で、1つ以上の対応する特性が抽出される。特性は、クエリの特性、クエリ対象の特性、ユーザの特性などを含み得る。306で、CTRは、重みに基づいて予測され、順位付けられる。308で、検索結果ページがユーザに表示される。310で、ユーザフィードバックが取得され、クリックデータが統計のために取得される。312で、重みがクリックデータに基づいて決定され、それは、その後、CTRを予測するために306における演算に代入される。
図4は、本開示に従うCTRに基づく検索順位付け装置例400の図を示す。
CTRに基づく装置400は、1つ以上の(複数の)プロセッサ402およびメモリ404を含み得る。メモリ404は、コンピュータで読み取り可能な媒体の例である。本明細書において使用される際、「コンピュータで読み取り可能な媒体」は、コンピュータ記憶媒体および通信媒体を含む。
コンピュータ記憶媒体は、コンピュータで実行可能な命令、データ構造、プログラムモジュール、または他のデータなどの情報の記憶のための任意の方法あるいは技術に実装される、揮発性や不揮発性の、取り外し可能および取り外し不可能な媒体を含む。対照的に、通信媒体は、コンピュータで読み取り可能な命令、データ構造、プログラムモジュール、または搬送波などの変調データ信号における他のデータを具体化し得る。本明細書において定義されるように、コンピュータ記憶媒体は、通信媒体を含まない。メモリ404は、その中にプログラム単位またはモジュールおよびプログラムデータを記憶し得る。
図4の例では、メモリ404は、その中に重み決定モジュール406、取得および抽出モジュール408、CTR予測モジュール410、ならびに順位付けおよび表示モジュール412を記憶し得る。
重み決定モジュール406は、検索順位付けの前に、事前設定した期間内にユーザのクリックデータを取得し、クリックデータに基づいて各特性のそれぞれの重みを決定する。
検索順位付けは、以下のモジュールおよび動作によって行われ得る。
取得および抽出モジュール408は、クエリおよびクエリに一致する1つ以上のクエリ対象を取得し、各クエリおよびクエリ対象のそれぞれの特性を抽出する。
CTR予測モジュール410は、各クエリ対象に関して、クエリおよびクエリ対象の特性ならびに各特性に対応するそれぞれの重みに基づいて、回帰モデルなどの1つ以上のモデルに基づいてそれぞれのCTRを取得する。
順位付けおよび表示モジュール412は、各クエリ対象のそれぞれのCTRに基づいてクエリ対象を順位付け、順位付けられたクエリ対象をユーザに表示する。
例えば、重み決定モジュール406はまた、それぞれ、クエリおよびクエリ対象の特性を特性値に定量化し得る。
例えば、CTR予測モジュール410はまた、取得サブモジュール、重み付けサブモジュール、および予測サブモジュールを含み得る。取得サブモジュールは、各特性に対応する重みを取得する。重み付けサブモジュールは、各クエリ対象について重み付け結果を取得するために特性値および重みに基づいて重み付け演算を行う。予測サブモジュールは、重み付け結果を回帰モデルに代入し、クエリ対象のCTRを予測する。
例えば、重み決定モジュール406はまた、第1の取得サブモジュール、第2の取得サブモジュール、および重み付け計算サブモジュールを含み得る。第1の取得サブモジュールは、事前設定した期間内のユーザのクリックデータを取得し、クリックデータに基づいて後のCTRを計算する。
第2の取得サブモジュールは、クエリおよびクエリ対象の特性値を取得する。重み付け計算サブモジュールは、後のCTRおよび特性値に基づいて各特性の重みを計算する。
例えば、第1の取得サブモジュールは、フィルタリング部、統計部、および後のCTR決定部を更に含み得る。フィルタリング部は、フィルタリングされたクリックデータを取得するためにクリックデータから異常データをフィルタリングする。統計部は、ページの各位置でクエリ対象のCTRを取得するためにフィルタリングされたクリックデータの統計を取る。後のCTR決定部は、対応する後のCTRを取得するために各位置の事前設定した重みに基づいて各位置でCTRの重み付け演算を行う。
例えば、装置400は、挙動特性抽出モジュールおよび相関特性抽出モジュールを更に含み得る。挙動特性抽出モジュールは、クエリを入力するユーザの1つ以上の挙動特性を抽出する。ユーザの挙動特性は、以下の、ある期間内のユーザのクリックデータおよびその期間内のユーザのカテゴリデータの少なくとも1つを含み得る。カテゴリデータは、期間内のクリックされたカテゴリデータ、検索されたカテゴリデータ、および/またはユーザの地理データを含み得る。
相関特性抽出モジュールは、クエリ、クエリ対象、およびユーザの相関特性を抽出する。例えば、クエリ対象は、製品、企業、産業などを含み得る。
装置例の実施形態における本技法は、方法例の実施形態におけるものに類似し、それ故、簡潔に記載される。装置例の実施形態における関連部分は、方法例の実施形態における対応する部分に参照され得る。
本開示の様々な実施形態は、様々な実施形態間の同じまたは類似の部分が互いに参照され得るように、漸進的なやり方で記載され、実施形態のそれぞれは、他の実施形態からの差異に焦点を合わせる。
本開示は、コンピュータで実行可能な命令、例えば、1つ以上のプロセッサを含むコンピュータによって実行される、プログラムモジュールとの一般的な関連において記載され得る。一般に、プログラムモジュールは、特定のタスクを実行するか特定の抽象データ種類を実現化するルーチン、プログラム、オブジェクト、アセンブリ、データ構造および同様のものを含む。本開示はまた、分散型のコンピューティング環境において実装され得る。分散型のコンピューティング環境において、タスクは、通信ネットワーク経由で接続された1つ以上の遠隔処理デバイスによって実行される。分散型のコンピューティング環境において、プログラムモジュールは、記憶デバイスを含むローカルおよび遠隔のコンピュータ記憶媒体に記憶され得る。
当業者は、本開示の実施形態が、方法、システム、またはコンピュータのプログラミング製品であり得ることを理解するべきである。従って、本開示は、ハードウェア、ソフトウェアによって、または両方を組み合わせて、実装され得る。加えて、本開示は、コンピュータで実行可能なコードを含有する1つ以上のコンピュータプログラムの形態にあり得、それは、(限定されるものではないが、ディスク、CD−ROM、光ディスクなどを含む)コンピュータで実行可能な記憶媒体に実装され得る。
本開示は、本開示の実施形態の方法、デバイス(システム)およびコンピュータプログラムのフローチャートならびに/あるいはブロック図を参照することによって記載される。フローチャートならびに/あるいはブロック図の各フローおよび/またはブロックとフローおよび/またはブロックの組み合わせは、コンピュータプログラム命令によって実装され得ることが理解されるべきである。これらのコンピュータプログラム命令は、フローチャートの1つ以上のフローおよび/またはブロック図の1つ以上のブロックを実装するデバイスが、コンピュータまたは他のプログラム可能なデータプロセッサによって操作される命令を通して生成され得るように、マシンを生成するために、汎用コンピュータ、特殊コンピュータ、埋め込み型プロセッサまたは他のプログラム可能なデータプロセッサに提供され得る。
この文書における「第1の」および「第2の」などの任意の相関的な用語は、1つの実体を別の実体からまたは1つの動作を別の動作から区別することだけを意味するが、これらの実体もしくは動作間の任意の現実世界の関係または順序の存在を必ずしも要求するか暗示するものではないことに留意する。その上、「含む」、「有する」または任意の他の変形などの用語は、非排他的に「備える」ことを意味することが意図される。従って、特徴の集合を個々に含む工程、方法、物品またはデバイスは、それらの特徴のみを含み得るのではなく、リスト化されていない他の特徴、あるいはこれらの工程、方法、物品またはデバイスの任意の固有の特徴もまた含み得る。任意の更なる限定無しに、文言「(1つの)〜を含む」において定義される特徴は、その特徴を規定する工程、方法、物品またはデバイスが他の等価の特徴を有し得る可能性を排除しない。
実施形態例の上記は、CTRに基づく検索順位付け方法および装置の例を例示する。実施形態例は、本開示に従って原理およびそれらの実施態様を例示する。実施形態は、本開示の方法および核心の概念を単に例示するためのものであり、本開示の範囲を限定することを意図されない。一定の修正、置き換え、および改善が、行われ得、本開示の原理から逸脱すること無く、本開示の保護の下で考えられるべきであることは、当業者によって理解されるべきである。本明細書における記載は、本開示を制限するものと理解されないものとする。

Claims (19)

  1. 事前設定した期間内にユーザのクリックデータを取得することと、前記クリックデータに基づいてそれぞれの特性のそれぞれの重みを決定することと、
    クエリおよび前記クエリに一致する1つ以上のクエリ対象を取得することと、
    前記クエリおよび前記1つ以上のクエリ対象のそれぞれのクエリ対象から1つ以上の特性を抽出することと、
    前記それぞれのクエリ対象に関して、前記クエリおよび前記それぞれのクエリ対象の前記1つ以上の特性ならびに前記それぞれの特性に対応する前記それぞれの重みに基づいて、前記それぞれのクエリ対象のクリックスルー率(CTR)を計算することと、を含む、方法。
  2. 前記クエリ対象のそれぞれのCTRに基づいて前記1つ以上のクエリ対象を順位付けることを更に含む、請求項1に記載の方法。
  3. 前記順位付けられた1つ以上のクエリ対象を前記ユーザに表示することを更に含む、請求項2に記載の方法。
  4. 前記それぞれのクエリ対象の前記CTRを前記計算することは、前記CTRを予測するための回帰モデルを使用することを含む、請求項1に記載の方法。
  5. 前記クエリおよび前記それぞれのクエリ対象から前記特性を抽出した後に、前記それぞれの特性をそれぞれの特性値に定量化することを更に含む、請求項1に記載の方法。
  6. 前記それぞれのクエリ対象の前記CTRを前記計算することは、
    前記それぞれの特性の前記それぞれの重みを取得することと、
    前記それぞれのクエリ対象に関して、重み付け結果を取得するために前記それぞれの特性値および前記それぞれの特性の前記それぞれの重みに基づいて重み付け演算を行うことと、
    前記それぞれのクエリ対象の前記CTRを予測するために前記重み付け結果を回帰モデルに代入することと、を含む、請求項5に記載の方法。
  7. 前記事前設定した期間内に前記ユーザの前記クリックデータを取得することと、前記クリックデータに基づいて前記それぞれの特性の前記それぞれの重みを決定することとは、
    前記事前設定した期間内に前記ユーザの前記クリックデータを取得することと、
    前記クリックデータに基づいて後のCTRを計算することと、
    前記クエリおよび前記クエリ対象の特性値を取得することと、
    前記後のCTRおよび前記特性値に基づいて、前記それぞれの特性の前記それぞれの重みを計算することと、を含む、請求項6に記載の方法。
  8. 前記事前設定した期間内に前記ユーザの前記クリックデータを取得した後および前記クリックデータに基づいて前記後のCTRを計算する前に、フィルタリングされたクリックデータを取得するために前記クリックデータから異常データをフィルタリングすることを更に含む、請求項7に記載の方法。
  9. 前記クリックデータに基づいて前記後のCTRを前記計算することは、
    ページにおける各位置で前記クエリ対象のCTRを取得するために前記フィルタリングされたクリックデータの統計を取ることと、
    それぞれの位置の事前設定した重みに従って、前記対応する後のCTRを取得するために各位置で前記CTRの重み付け演算を行うことと、を含む、請求項8に記載の方法。
  10. 前記クエリを入力する前記ユーザに関して、前記ユーザの1つ以上の挙動特性を抽出することを更に含む、請求項1に記載の方法。
  11. 前記ユーザの前記1つ以上の挙動特性は、以下の、
    前記事前設定した期間内の前記ユーザのクリックデータ、
    前記事前設定した期間内の前記ユーザのカテゴリデータ、および
    前記事前設定した期間内の前記ユーザの地理データの少なくとも1つを含む、請求項10に記載の方法。
  12. 前記カテゴリデータは、前記事前設定した期間内に前記ユーザによって検索されたカテゴリデータを含む、請求項11に記載の方法。
  13. 前記カテゴリデータは、前記事前設定した期間内に前記ユーザによってクリックされたカテゴリデータを含む、請求項11に記載の方法。
  14. 前記ユーザの特性が、前記クエリまたは前記それぞれのクエリ対象の特性に一致することを決定するために、前記クエリ、前記それぞれのクエリ対象、および前記ユーザの1つ以上の相関特性を抽出することを更に含む、請求項1に記載の方法。
  15. 前記クエリ、前記クエリ対象、および前記ユーザの前記1つ以上の相関特性を抽出することは、
    前記ユーザが位置する地理範囲または前記ユーザの好ましい地理範囲を決定することと、
    前記ユーザが位置する前記地理範囲または前記ユーザの前記好ましい地理範囲が、前記クエリ対象に一致するかどうかを決定することと、を含む、請求項14に記載の方法。
  16. 前記それぞれのクエリ対象は、製品、企業、または産業を含む、請求項1に記載の方法。
  17. 事前設定した期間内にユーザのクリックデータを取得することと、
    前記クリックデータに基づいて後のクリックスルー率(CTR)を計算することであって、
    フィルタリングされたクリックデータを取得するために前記クリックデータから異常データをフィルタリングすることと、
    ページのそれぞれの位置でクエリ対象のそれぞれのCTRを取得するために、前記フィルタリングされたデータの統計を取ることと、
    前記後のCTRを取得するために、前記それぞれの位置のそれぞれの事前設定した重みおよび前記それぞれの位置における前記クエリ対象の前記それぞれのCTRに基づいて重み付け演算を行うことと、を含む、計算することと、
    クエリおよび前記クエリ対象の特性値を取得することと、
    前記後のCTRおよび前記特性値に基づいてそれぞれの特性の重みを計算することと、を含む、方法。
  18. 前記後のCTRおよび前記特性値に基づいて前記それぞれの特性の前記重みを前記計算することは、最小二乗法を使用することを含む、請求項17に記載の方法。
  19. 事前設定した期間内にユーザのクリックデータを取得し、前記クリックデータに基づいて各特性のそれぞれの重みを決定する、重み決定モジュールと、
    クエリおよび前記クエリに一致する1つ以上のクエリ対象を取得し、各前記クエリおよび前記クエリ対象のそれぞれの特性を抽出する、取得および抽出モジュールと、
    各クエリ対象に関して、前記クエリおよび前記クエリ対象の前記特性ならびに各特性に対応する前記それぞれの重みに基づいて、回帰モデルを含む1つ以上のモデルに基づいてそれぞれのCTRを取得するクリックスルー率(CTR)予測モジュールと、
    各クエリ対象の前記それぞれのCTRに基づいて前記クエリ対象を順位付け、前記順位付けられたクエリ対象を前記ユーザに表示する、順位付けおよび表示モジュールと、を備える、装置。
JP2015517480A 2012-06-18 2013-06-17 クリックスルー率に基づく検索結果の順位付け Active JP6211605B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201210206502.0 2012-06-18
CN201210206502.0A CN103514178A (zh) 2012-06-18 2012-06-18 一种基于点击率的搜索排序方法及装置
PCT/US2013/046160 WO2013192101A1 (en) 2012-06-18 2013-06-17 Ranking search results based on click through rates

Publications (2)

Publication Number Publication Date
JP2015537259A JP2015537259A (ja) 2015-12-24
JP6211605B2 true JP6211605B2 (ja) 2017-10-11

Family

ID=48703927

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015517480A Active JP6211605B2 (ja) 2012-06-18 2013-06-17 クリックスルー率に基づく検索結果の順位付け

Country Status (6)

Country Link
US (1) US20130339350A1 (ja)
EP (1) EP2862105A1 (ja)
JP (1) JP6211605B2 (ja)
CN (1) CN103514178A (ja)
TW (1) TW201401089A (ja)
WO (1) WO2013192101A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108390883A (zh) * 2018-02-28 2018-08-10 武汉斗鱼网络科技有限公司 刷人气用户的识别方法、装置及终端设备

Families Citing this family (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9262532B2 (en) * 2010-07-30 2016-02-16 Yahoo! Inc. Ranking entity facets using user-click feedback
CN104052714B (zh) * 2013-03-12 2019-02-26 腾讯科技(深圳)有限公司 多媒体信息的推送方法及服务器
CN104750713A (zh) * 2013-12-27 2015-07-01 阿里巴巴集团控股有限公司 一种对搜索结果进行排序的方法及装置
CN105095625B (zh) * 2014-05-14 2018-12-25 阿里巴巴集团控股有限公司 点击率预估模型建立方法、装置及信息提供方法、系统
US20150347414A1 (en) * 2014-05-30 2015-12-03 Linkedln Corporation New heuristic for optimizing non-convex function for learning to rank
RU2580516C2 (ru) 2014-08-19 2016-04-10 Общество С Ограниченной Ответственностью "Яндекс" Способ формирования персонализированной модели ранжирования, способ формирования модели ранжирования, электронное устройство и сервер
CN105447045B (zh) * 2014-09-02 2019-06-07 阿里巴巴集团控股有限公司 信息排序方法、装置及信息提供方法、系统
CN105740276B (zh) * 2014-12-10 2020-11-03 深圳市腾讯计算机系统有限公司 适用于商业化搜索的点击反馈模型的估算方法和装置
CN104462412A (zh) * 2014-12-11 2015-03-25 北京国双科技有限公司 用于网络关键词投放的关键词检测方法和装置
CN105808541B (zh) * 2014-12-29 2019-11-08 阿里巴巴集团控股有限公司 一种信息匹配处理方法和装置
CN104699846B (zh) * 2015-03-31 2017-05-03 北京奇元科技有限公司 相关性可改善的搜索词的识别方法及装置
CN106295832B (zh) * 2015-05-12 2020-05-19 阿里巴巴集团控股有限公司 产品信息推送方法及装置
CN106296254B (zh) * 2015-06-09 2021-06-25 腾讯科技(深圳)有限公司 一种曝光行为数据的管理方法及装置
CN106708817B (zh) * 2015-07-17 2020-11-06 腾讯科技(深圳)有限公司 信息搜索方法及装置
CN105205098B (zh) * 2015-08-18 2018-11-20 北京金山安全软件有限公司 一种点击到达率ctr的确定方法及装置
CN105117491B (zh) * 2015-09-22 2018-12-25 北京百度网讯科技有限公司 页面推送方法和装置
CN106682926A (zh) * 2015-11-06 2017-05-17 北京奇虎科技有限公司 搜索广告的投放方法及装置
CN105678335B (zh) * 2016-01-08 2019-07-02 车智互联(北京)科技有限公司 预估点击率的方法、装置及计算设备
CN105678586B (zh) 2016-01-12 2020-09-29 腾讯科技(深圳)有限公司 一种信息扶持方法和装置
CN107153656B (zh) * 2016-03-03 2020-12-01 阿里巴巴集团控股有限公司 一种信息搜索方法和装置
CN106327266B (zh) * 2016-08-30 2021-05-25 北京京东尚科信息技术有限公司 数据挖掘方法及装置
CN108021574A (zh) * 2016-11-02 2018-05-11 北京酷我科技有限公司 一种搜索方法及装置
CN110147488B (zh) * 2017-10-23 2023-05-16 腾讯科技(深圳)有限公司 页面内容的处理方法、处理装置、计算设备及存储介质
JP6476395B1 (ja) * 2018-01-22 2019-03-06 データ・サイエンティスト株式会社 検索語の評価装置、評価システム、及び評価方法
CN108335137B (zh) * 2018-01-31 2021-07-30 北京三快在线科技有限公司 排序方法及装置、电子设备、计算机可读介质
CN108509499A (zh) * 2018-02-27 2018-09-07 北京三快在线科技有限公司 一种搜索方法及装置,电子设备
CN110309431A (zh) * 2018-03-09 2019-10-08 北京搜狗科技发展有限公司 一种数据处理方法、装置和电子设备
US11086865B2 (en) * 2018-03-14 2021-08-10 Colossio, Inc. Sliding window pattern matching for large data sets
CN110149540B (zh) * 2018-04-27 2021-08-24 腾讯科技(深圳)有限公司 多媒体资源的推荐处理方法、装置、终端及可读介质
CN110737816A (zh) * 2018-07-02 2020-01-31 北京三快在线科技有限公司 排序方法、装置、电子设备及可读存储介质
CN109858942B (zh) * 2018-11-06 2023-12-15 三六零科技集团有限公司 推广信息展示方法、装置、电子设备及可读存储介质
CN109558544B (zh) * 2018-12-12 2021-04-27 拉扎斯网络科技(上海)有限公司 排序方法及装置、服务器和存储介质
CN110019750A (zh) * 2019-01-04 2019-07-16 阿里巴巴集团控股有限公司 呈现两个以上标准文本问题的方法和装置
CN109962983B (zh) * 2019-03-29 2021-11-23 北京搜狗科技发展有限公司 一种点击率统计方法及装置
CN110020206B (zh) * 2019-04-12 2021-10-15 北京搜狗科技发展有限公司 一种搜索结果排序方法及装置
CN110209927B (zh) * 2019-04-25 2020-12-04 北京三快在线科技有限公司 个性化推荐方法、装置、电子设备及可读存储介质
CN110706015B (zh) * 2019-08-21 2023-06-13 北京大学(天津滨海)新一代信息技术研究院 一种面向广告点击率预测的特征选取方法
CN110674400B (zh) * 2019-09-18 2022-05-10 北京字节跳动网络技术有限公司 排序方法、装置、电子设备及计算机可读存储介质
CN110909182B (zh) * 2019-11-29 2023-05-09 北京达佳互联信息技术有限公司 多媒体资源搜索方法、装置、计算机设备及存储介质
CN111259272B (zh) * 2020-01-14 2023-06-20 口口相传(北京)网络技术有限公司 搜索结果排序方法及装置
CN113536156B (zh) * 2020-04-13 2024-05-28 百度在线网络技术(北京)有限公司 搜索结果排序方法、模型构建方法、装置、设备和介质
CN111597470A (zh) * 2020-05-19 2020-08-28 北京字节跳动网络技术有限公司 一种搜索结果展示位置的确定方法及确定装置
CN111708944A (zh) * 2020-06-17 2020-09-25 北京达佳互联信息技术有限公司 多媒体资源识别方法、装置、设备及存储介质
CN112019649B (zh) * 2020-08-20 2023-01-31 北京明略昭辉科技有限公司 Ip地址的校正方法及装置、系统、存储介质、电子设备
CN112612951B (zh) * 2020-12-17 2022-07-01 上海交通大学 一种面向收益提升的无偏学习排序方法
CN112966577B (zh) * 2021-02-23 2022-04-01 北京三快在线科技有限公司 一种模型训练以及信息提供的方法及装置
CN113094604B (zh) * 2021-04-15 2022-05-03 支付宝(杭州)信息技术有限公司 搜索结果排序方法、搜索方法及装置
CN113343130B (zh) * 2021-06-15 2022-07-15 北京三快在线科技有限公司 一种模型训练的方法、信息展示的方法及装置
CN113595874B (zh) * 2021-07-09 2023-03-24 北京百度网讯科技有限公司 即时通讯群组的搜索方法、装置、电子设备和存储介质
CN113724016A (zh) * 2021-09-09 2021-11-30 北京有竹居网络技术有限公司 获取多媒体资源关注度的方法、装置、介质及设备

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3925447B2 (ja) * 2003-03-28 2007-06-06 ブラザー工業株式会社 通信システム、通信装置、端末装置およびプログラム
US7904337B2 (en) * 2004-10-19 2011-03-08 Steve Morsa Match engine marketing
US7743048B2 (en) * 2004-10-29 2010-06-22 Microsoft Corporation System and method for providing a geographic search function
US10510043B2 (en) * 2005-06-13 2019-12-17 Skyword Inc. Computer method and apparatus for targeting advertising
WO2007038714A2 (en) * 2005-09-27 2007-04-05 Looksmart, Ltd. Collection and delivery of internet ads
US20070156887A1 (en) * 2005-12-30 2007-07-05 Daniel Wright Predicting ad quality
US7827060B2 (en) * 2005-12-30 2010-11-02 Google Inc. Using estimated ad qualities for ad filtering, ranking and promotion
US7788276B2 (en) * 2007-08-22 2010-08-31 Yahoo! Inc. Predictive stemming for web search with statistical machine translation models
US8229915B1 (en) * 2007-10-08 2012-07-24 Google Inc. Content item arrangement
US8311875B1 (en) * 2007-10-30 2012-11-13 Google Inc. Content item location arrangement
US8548925B2 (en) * 2008-01-15 2013-10-01 Apple Inc. Monitoring capabilities for mobile electronic devices
US8682839B2 (en) * 2008-06-02 2014-03-25 Microsoft Corporation Predicting keyword monetization
US20110191315A1 (en) * 2010-02-04 2011-08-04 Yahoo! Inc. Method for reducing north ad impact in search advertising
US20110196733A1 (en) * 2010-02-05 2011-08-11 Wei Li Optimizing Advertisement Selection in Contextual Advertising Systems
US20110258033A1 (en) * 2010-04-15 2011-10-20 Microsoft Corporation Effective ad placement
US8515980B2 (en) * 2010-07-16 2013-08-20 Ebay Inc. Method and system for ranking search results based on categories
CN102339296A (zh) * 2010-07-26 2012-02-01 阿里巴巴集团控股有限公司 一种查询结果的排序方法和装置
US8364525B2 (en) * 2010-11-30 2013-01-29 Yahoo! Inc. Using clicked slate driven click-through rate estimates in sponsored search
CN102542474B (zh) * 2010-12-07 2015-10-21 阿里巴巴集团控股有限公司 查询结果排序方法及装置
CN102073699B (zh) * 2010-12-20 2016-03-02 百度在线网络技术(北京)有限公司 用于基于用户行为来改善搜索结果的方法、装置和设备
US8527483B2 (en) * 2011-02-04 2013-09-03 Mikko VÄÄNÄNEN Method and means for browsing by walking
CN102346899A (zh) * 2011-10-08 2012-02-08 亿赞普(北京)科技有限公司 一种基于用户行为的广告点击率预测方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108390883A (zh) * 2018-02-28 2018-08-10 武汉斗鱼网络科技有限公司 刷人气用户的识别方法、装置及终端设备
CN108390883B (zh) * 2018-02-28 2020-08-04 武汉斗鱼网络科技有限公司 刷人气用户的识别方法、装置及终端设备

Also Published As

Publication number Publication date
WO2013192101A1 (en) 2013-12-27
US20130339350A1 (en) 2013-12-19
EP2862105A1 (en) 2015-04-22
CN103514178A (zh) 2014-01-15
TW201401089A (zh) 2014-01-01
JP2015537259A (ja) 2015-12-24

Similar Documents

Publication Publication Date Title
JP6211605B2 (ja) クリックスルー率に基づく検索結果の順位付け
JP6582085B2 (ja) ウェブページコンテンツを生成するための方法および装置
CN105989004B (zh) 一种信息投放的预处理方法和装置
CN107862022B (zh) 文化资源推荐系统
US9576251B2 (en) Method and system for processing web activity data
CN106446005B (zh) 因子分解模型
CN105469263A (zh) 一种商品推荐方法及装置
US11170027B2 (en) Error factor and uniqueness level for anonymized datasets
WO2015192667A1 (zh) 推荐广告的方法及广告推荐服务器
JP6964689B2 (ja) サンプル重み設定方法及び装置、電子装置
US20120143883A1 (en) Ranking product information
US20160210321A1 (en) Real-time content recommendation system
CN105678335B (zh) 预估点击率的方法、装置及计算设备
CN106874335B (zh) 行为数据处理方法、装置及服务器
CN107644036A (zh) 一种数据对象推送的方法、装置及系统
EP3639163A1 (en) Systems and methods for optimizing and simulating webpage ranking and traffic
CN111079014A (zh) 基于树结构的推荐方法、系统、介质和电子设备
CN106656741A (zh) 一种信息推送方法和系统
US20230093756A1 (en) Systems and methods for generating recommendations
CN105894310A (zh) 一种个性化推荐方法
CN111931069B (zh) 用户兴趣确定方法、装置及计算机设备
CN111680213A (zh) 信息推荐方法、数据处理方法及装置
WO2015149550A1 (zh) 确定网站内链接等级的方法及装置
JP2012133694A (ja) 需要予測方法
CN116485503A (zh) 商品组合推荐方法及其装置、设备、介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160531

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170512

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170523

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170728

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170815

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170913

R150 Certificate of patent or registration of utility model

Ref document number: 6211605

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250