JP2016505993A - 検索語句を構成し、広告を配信し、製品情報を検索するための方法および装置 - Google Patents

検索語句を構成し、広告を配信し、製品情報を検索するための方法および装置 Download PDF

Info

Publication number
JP2016505993A
JP2016505993A JP2015551860A JP2015551860A JP2016505993A JP 2016505993 A JP2016505993 A JP 2016505993A JP 2015551860 A JP2015551860 A JP 2015551860A JP 2015551860 A JP2015551860 A JP 2015551860A JP 2016505993 A JP2016505993 A JP 2016505993A
Authority
JP
Japan
Prior art keywords
search
product
phrase
bid
original
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015551860A
Other languages
English (en)
Other versions
JP6301958B2 (ja
Inventor
スン ヤオ
スン ヤオ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Publication of JP2016505993A publication Critical patent/JP2016505993A/ja
Application granted granted Critical
Publication of JP6301958B2 publication Critical patent/JP6301958B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • G06Q30/0256User search
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • G06Q30/0625Directed, with specific intent or strategy

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本開示は、コンピュータを使用して、検索語句を構成し、検索可能な広告を配信し、そして、製品情報を検索するための方法および装置を提供する。コンピュータは、検索行動データを獲得し、そして、検索行動データにおいて見出される元々の検索語句、製品カテゴリ選択肢、および製品属性に基づいて、検索語句を構成する。構成した検索語句は、包括的であり、また、元々の検索語句だけでなく、製品カテゴリ選択肢および製品属性に関連する情報も含む。コンピュータは、同じ様式で構成した入札語句と関連付けられる広告を配信し、また、構成した検索語句および構成した入札語句を照合することによって、配信される広告を検索することを可能にする。本技法は、製品情報検索、特に構造化検索をより良好に行い、また、より正確で関連する統計によって、その結果により良いインデックスを付け、該結果を追跡することを可能にする。

Description

本出願は、インターネット技術に関し、より具体的には、インターネット上で検索語句を構成し、広告を配信し、そして、製品情報を検索することに関する。
インターネット上で製品情報を配信するための最も効果的な技法の1つは、検索エンジンによって駆動される検索キーワードに関連する広告である。検索エンジン広告は、通常、検索キーワードに対する価格の入札に基づいてランク付けされる広告のペイドリスティングを含む。広告主(広告に出資する企業または個人)が、検索エンジンの結果の上位に広告コンテンツをリストさせたいと望む場合、該広告主は、関連する検索キーワードに対して比較的高い価格を入札する。入札価格が高くなるほど、検索エンジンの結果のリスティングにおける広告のランク付けがより高くなる。
広告のペイド検索リスティングの例は、以下の通りである。各広告主は、キーワードに対してある特定の価格を入札するが、これが、基本入札単位である。広告主は、1つ以上の広告(各広告が製品情報の部分である)をキーワードと関連付け得る。各キーワードは、そのキーワードに対して異なる価格を入札する異なる広告主によって、異なる広告と関連付けられ得る。検索ユーザが、広告主によって支払われるキーワードに一致するか、またはそれを含む検索語句を入力することによって、検索エンジンを使用して情報を検索するときに、検索エンジンは、そのキーワードに一致する広告を見出し、関連するキーワードに対して広告主によって支払われる入札価格に従ってその広告をランク付けし、そして、関連する広告を、検索エンジンによるランク付けの順序で検索ユーザに表示することを可能にする。
上で説明される例において、入札の基本単位は、キーワードである。検索エンジンによって使用されるときに、この方法は、いくつかの欠点を有する。
第1に、検索エンジンの観点から、この方法は、低い検索効率を被る。検索ユーザが、検索を行うために、携帯電話のカテゴリの下で「Apple」というキーワードを入力することを想定すると、「apple」というキーワードを含む全ての広告がペイドリスティングに対する入札に関与し、果物としてapple(リンゴ)を販売する広告主によって提供されるものも含まれる。結果的に、全てのリスティングが表示される前に、検索エンジンは、携帯電話とは関係のない製品情報をフィルタ除去するために、関連性の解析を行う必要があり、よって、携帯電話カテゴリの下の広告だけが列記され得る。この過程は、サーバによるコンピュータ処理の量を増加させ、また、検索効率を低下させる。
第2に、広告主の観点から、検索エンジンのフィルタ処理を伴ったとしても、広告は、しばしば、意図していない検索ユーザに表示され、無効なクリックを受け取り、その結果、不必要な負担をもたらす。
これは、構造化クエリのコンテキストで例示され得る。構造化クエリは、一般的に、複数の階層、例えば、3階層の構造化検索において、カテゴリ、属性、および検索キーワードを含む。第1の階層、カテゴリは、例えば「婦人服」であり得、第2の階層、属性は、例えば、色、材料、またはブランドであり得、そして、第3の階層、キーワードは、「2011年の流行スタイル」であり得る。完全な構造化クエリは、3つ全ての階層のコンテンツで構成される。
このような検索技法において、入札単位は、通常、検索キーワードであり、構造化クエリの第3の階層のキーワード構成要素だけであり、構造化検索クエリ全体を表さない。広告主に対して、入札単位は、入札の下層のオブジェクトである。広告主は、検索トラフィックに基づいて入札を行う。しかしながら、従来技術の検索トラフィックは、複数のコンテキストにおける検索要求を組み合わせた結果であり、該コンテキストのいくつかは、広告主によって促進されている製品情報を見出そうとするユーザの意図とは無関係であり得る。
特に、広告主は、所望されるトラフィックのある特定の結果に対して正確に入札することができない。サーバは、構造化クエリを受け取り、処理するが、広告主は、構造化クエリのキーワード構成要素に関してだけ入札を行うことができる。また、広告主が認識できる販売促進の質はまた、キーワード構成要素だけにも結び付けられる。
例えば、以下のような構造化クエリの例、「スカート(検索キーワード)+白(属性)」、「スカート(検索キーワード)+半袖(属性)」、および「スカート(検索キーワード)+子供服(カテゴリ)」を考える。現在の検索エンジンキーワード入札に基づくペイドリスティング広告において、広告主は、「スカート」という検索キーワードに対してだけ入札し得るが、上の構造化クエリの3つ全ての例が、同じ「スカート」という検索キーワードにマージされる。広告主は、「スカート」という検索キーワードに関する広告主の入札価格に対してだけ調整を行い得るが、どの構造化クエリがより良好な販売促進効果を有するのかを知るためのいかなる手掛かりも伴わない。
別の例として、Apple携帯電話の広告主が「Apple」という検索キーワードに対して入札を提出した場合、広告主は、次の3つのシナリオ、すなわち、「Apple(検索キーワード)」、「Apple(検索キーワード)+携帯電話(カテゴリ)」、および「Apple(検索キーワード)+通信事業者が後援するプリペイド式テレホンカード(属性)」等の、検索キーワードとして「Apple」を有する全ての構造化クエリに対するペイドリスティング入札に参加せざるを得ない。
しかしながら、広告主は、通信事業者と関連付けられていないApple携帯電話を販売促進している可能性がある。例えば、香港を通して投入され、中国本土で販売されるApple携帯電話は、通信事業者が後援するプリペイド式テレホンカードとともに販売されない場合があり、したがって、この属性が欠如する。しかし、現在のCPC(コストパークリック)検索エンジン広告モデルによれば、検索ユーザが「Apple」という検索キーワードを含む検索に由来する広告をクリックしたということであれば、その広告について、広告主のアカウントに対して料金の引き落としが行われる。すなわち、この例において、香港を通して中国本土に投入されるApple携帯電話を販売する広告主について、上の第3のシナリオに対する全てのクリックは、無効なクリックとなるが、それでも、広告主には広告料金がかかる。いくつかの事例において、これは、間違った検索結果が検索ユーザに提供され得るので、広告主の経済的損失につながるだけでなく、不十分なユーザエクスペリエンスおよびネットワークリソースの浪費ももたらし得る。
第3に、検索ユーザの観点から、不正確な検索結果はまた、不十分なユーザエクスペリエンスにつながる。例えば、Apple携帯電話の購入を所望する検索ユーザは、「Apple携帯電話(検索キーワード)」、「携帯電話(カテゴリ)+Apple(検索キーワード)」、および「携帯電話(カテゴリ)+Apple(属性)」、といった構造化クエリのうちのいずれかを使用し得る。検索エンジンは、検索キーワードに従ってだけしか広告にインデックスを付けないので、上の3つの構造化クエリは、同じ検索キーワードを有しないので、異なる検索結果を返し得る。一方で、上の構造化クエリのうちのいずれかを使用した検索ユーザは、全員が、Apple携帯電話を見出すという同じ意図を共有する。したがって、同じ検索意図が、検索結果の中に異なる検索製品情報を有することにつながり得る。これは、望ましいユーザエクスペリエンスではない場合がある。
要約すれば、この現在の広告の配信および製品情報の検索は全て、ユーザが入力した検索キーワードに基づき、検索エンジン、広告主、および検索ユーザに問題を生じさせる。
この発明の概要は、発明を実施するための形態において下でさらに説明される概念の選択したものを簡略形態で紹介するために提供される。本発明の概要は、特許請求された主題のあらゆる主要な特徴または本質的な特徴を確認することが意図されておらず、特許請求された主題の範囲を決定する上での支援として単独に用いられることも意図されていない。
本開示は、特に構造化検索環境において、コンピュータを使用して検索語句を構成し、検索可能な広告を配信し、そして、製品情報を検索するための方法および装置を提供する。コンピュータは、ユーザによる検索中に収集される検索行動データを獲得し、検索行動データにおいて見出された元々の検索語句、製品カテゴリ選択肢、および製品属性に基づいて、検索語句を構成する。構成した検索語句は、包括的であり、また、元々の検索語句だけでなく、製品カテゴリ選択肢および製品属性に関連する情報も含む。コンピュータは、コンピュータで構成した検索語句を使用して、自動検索を行う。コンピュータはまた、検索語句が構成されるのと同じ様式で構成される入札語句と関連付けられる広告も配信し、また、構成した検索語句および構成した入札語句を照合することによって、配信される広告を検索することを可能にする。
本開示の一態様は、検索語句を構成する方法である。本方法は、コンピュータを使用して、検索過程で入力された元々の検索語句、検索過程で選択された製品カテゴリ選択肢、および検索される製品属性を含む、検索行動データを獲得する。コンピュータは、獲得した検索行動データから、元々の検索語句、製品カテゴリ選択肢、および製品属性を抽出し、そして、元々の検索語句、製品カテゴリ選択肢、および製品属性をマージすることによって、推奨される検索語句を自動的に構成する。このように構成された推奨される検索語句は、元々の検索語句、製品カテゴリ選択肢、および製品属性の要素を包括する。
検索行動データをマージするために、コンピュータは、元々の検索語句、製品カテゴリ選択肢、および製品属性をトークン化して、複数のトークン化された単語を取得し、さらに、複数のトークン化された単語のスペルを正規化し得る。いくつかの実施形態において、コンピュータは、重複する単語または同義語を取り除くことによって、および/または同義語もしくは類義語をマージすることによって、検索行動データから冗長な情報を取り除く。これを行うために、2つのトークン化された単語の類似性を計算して、該類似性を予め設定された閾値と比較することによって、2つのトークン化された単語が、重複する単語であるか、同義語であるか、または類義語であるかを決定し得る。コンピュータは、2つのトークン化された単語が重複する単語または同義語である場合に、2つのトークン化された単語のうちのいずれか1つを保持し、もう1つを破棄するか、または2つのトークン化された単語が類義語である場合に、予め設定された条件に従って、2つのトークン化された単語のうちの1つを保持し、もう1つを破棄する。
いくつかの実施形態において、コンピュータは、より良く定義された検索語句を有するために、検索行動データのキーコンテンツを見出す。例えば、各トークン化された単語について、コンピュータは、トークン化された単語の重み因子および/またはトークン化された単語のクリック率を含む、解析パラメータを獲得する。重み因子の値は、トークン化された単語が、検索語句、カテゴリ選択肢、または製品属性のどれに由来するのかに依存する。コンピュータは、次いで、それぞれの解析パラメータに従って、各トークン化された単語の有意水準を決定し、さらに、トークン化された単語の有意水準に従って、キーコンテンツを決定する。コンピュータは、キーコンテンツを最適化するために、トークン化された単語の有意水準に従って、トークン化された単語を再順序付けし得る。
本開示の別の態様によれば、広告を配信する方法は、コンピュータを使用して、検索過程で入力された元々の検索語句、検索過程で選択された製品カテゴリ選択肢、および検索される製品属性を含む、検索行動データを獲得する。コンピュータは、獲得した検索行動データから、元々の検索語句、製品カテゴリ選択肢、および製品属性を抽出し、そして、元々の検索語句、製品カテゴリ選択肢、および製品属性をマージすることによって、入札語句を自動的に構成する。コンピュータは、次いで、広告主から、入札語句に対する複数の入札価格および入札語句と関連付けられる複数の広告を受け取る。各広告は、複数の入札価格のうちの1つと関連付けられる。複数の広告は、関連付けられた入札語句に従って、インデックスが付けられ、それぞれの入札価格に従って、ランク付けされる。コンピュータは、次いで、インデックスが付けられ、ランク付けされた複数の広告を広告データベースに追加して、検索に利用できるようにする。
検索語句を受け取った時点で、コンピュータは、検索語句を入札語句と照合し、そして、それぞれの入札価格に従って選択される複数の広告のうちの少なくともいくつかを表示することを可能にする。いくつかの実施形態において、検索語句は、本明細書で開示される検索語句を構成するための方法を使用して、少なくとも部分的に機械で構成される。
コンピュータは、入札語句と関連付けられる広告の広告有効性データの統計を記録し、そして、入札語句に従ってインデックスが付けられた統計を広告主に提供し得る。広告有効性データは、ウェブページ上の広告を閲覧するユーザのデータ、広告をクリックするユーザのデータ、および広告によって広告される製品またはサービスのトランザクションを完了するユーザのデータ、のうちの少なくとも1つを含み得る。
本開示のさらに別の態様は、製品情報を検索するための方法である。コンピュータは、本明細書で開示される検索語句を構成する方法を使用して、検索行動データをマージすることによって、推奨される検索語句を自動的に構成する。コンピュータは、次いで、推奨される検索語句を製品情報データベースに記憶された入札語句と照合し、そして、推奨される検索語句と一致する入札語句と関連付けられる複数の広告のうちの少なくともいくつかを表示することを可能にする。推奨される検索語句を入札語句と照合するために、コンピュータは、最初に、厳密な照合ルールに従って、推奨される検索語句を入札語句と照合し得、そして、厳密な照合ルールに従った照合に失敗した場合に、ファジー照合ルールに従って、推奨される検索語句を入札語句と照合し得る。ファジー照合ルールは、元々の検索語句と入札語句の一部との一致を必要とし得る。厳密な照合ルールに従った照合が失敗した場合に、コンピュータはまた、新しい入札語句として、推奨される検索語句を製品情報データベースに加え得る。
いくつかの実施形態において、入札語句自体は、以前の検索行動データの情報をマージすることによって、少なくとも部分的に機械で構成される。
検索語句を構成する方法を実現するために、コンピュータは、本明細書で開示される方法によって必要とされる機能を行うための、データ獲得モジュール、データ抽出モジュール、および検索語句構成モジュールを有するようにプログラムされる。例えば、データ獲得モジュールは、検索過程で入力された元々の検索語句、検索過程で選択された製品カテゴリ選択肢、および検索される製品属性を含む、検索行動データを獲得するように構成される。データ抽出モジュールは、獲得した検索行動データから、元々の検索語句、製品カテゴリ選択肢、および製品属性を抽出するように構成される。検索語句構成モジュールは、検索行動データをマージすることによって、推奨される検索語句を自動的に構成するように構成される。
広告を配信するための方法を実現するために、コンピュータは、データ獲得モジュール、データ抽出モジュール、語句構成モジュール、広告情報受け取りモジュール、ランク付けモジュール、および製品情報配信モジュールを有するようにプログラムされる。モジュールは、本明細書で開示される広告を配信するための方法の機能を行うようにプログラムされる。
製品情報を検索するための方法を実現するために、コンピュータは、データ獲得モジュール、データ抽出モジュール、検索語句構成モジュール、および照合モジュールを有するようにプログラムされる。モジュールは、本明細書で開示される製品情報を検索するための方法の機能を行うようにプログラムされる。例えば、照合モジュールは、推奨される検索語句を、製品情報データベースに記憶された入札語句と照合するように構成され、推奨される検索語句と一致する入札語句と関連付けられる複数の広告のうちの少なくともいくつかを表示することを可能にするように構成される。
開示される技法は、構造化検索が、より良くインデックスが付けられること、ならびにより正確でより関連性のある統計によってより良く追跡されることを可能にする。
本開示の他の特徴および利点は、以下の説明に記載され、説明から部分的に明らかになるか、または本出願の実践によって理解されるであろう。本出願の目的および他の利点は、本明細書、特許請求の範囲、および特に指摘され、実現され、および達成される構造の図面によって得ることができる。
本開示に従う、検索語句を構成するための方法のフローチャートである。 本開示に従う、広告を配信するための方法のフローチャートである。 本開示に従う、製品情報を検索するための方法のフローチャートである。 本開示に従う、検索語句を構成するように構成される、コンピュータに基づく装置を表すブロック図である。 本開示に従う、広告を配信するように構成される、コンピュータに基づく装置を表すブロック図である。 本開示に従う、製品情報を検索するように構成される、コンピュータに基づく装置を表すブロック図である。
上の本開示の目的、特徴、および利点の理解を促進にするために、本開示は、添付図および例示的な実施形態と合わせてさらに詳細に説明される。例えば、「技法(複数可)」という用語は、上の文脈によって、および本開示の全体を通して容認される、方法、装置デバイス、システム、および/またはコンピュータ読み出し可能な命令を指し得る。
図1は、本開示に従う、検索語句を構成するための方法のフローチャートである。本方法は、以下のようにブロックで説明される。
ブロック100で、コンピュータは、検索過程で入力された元々の検索語句、検索過程で選択された製品カテゴリ選択肢、および検索される製品属性を含む、検索行動データを獲得する。
検索行動データは、クエリログから取得され得る。元々の検索語句は、検索を行っている検索ユーザによって入力される1つ以上のクエリ単語である。検索語句の一例としては、「スリムトップス」が挙げられる。製品カテゴリ選択肢は、複数階層カテゴリのメニュー項目であり得る。例えば、第1の階層のカテゴリは、「婦人服」という名称であり得、第2の階層のカテゴリは、「Tシャツ」という名称であり得、第3の階層のカテゴリは、「長袖のTシャツ」という名称であり得る。検索ユーザは、製品情報の検索を行うときに、3階層のカテゴリを選択している場合がある。製品属性は、属性名および属性値を含み得る。属性名は、製品の特性または製品のタイプを示すか、または説明する。例えば、「長袖のTシャツ」というカテゴリの下で、姿勢名の例は、「色」であり、そのカテゴリにおいて製品の色を示し、一方で、属性値は、「白」、「赤」、「青」、または「黄」等であり得る。製品または製品のカテゴリは、それぞれが複数の値を有する、複数の属性を有し得る。例えば、「色」に加えて、属性名の他の例としては、「材料」および「サイズ」等が挙げられ得る。異なる製品カテゴリは、同じ属性名を有する共通の属性を共有し得るが、同じ属性名は、各カテゴリにおいて、さらには異なるカテゴリ全体にわたって異なる属性値を有し得る。
ブロック102で、コンピュータは、獲得した検索行動データから、元々の検索語句、製品カテゴリ選択肢、および製品属性を抽出する。
例えば、このブロックでは、ブロック100で獲得した検索行動データの上の例から、「スリムトップス」という元々の検索語句、「婦人服>Tシャツ>長袖のTシャツ」という製品カテゴリ選択肢、および「白」という製品の色に関する製品属性等の情報が抽出され得る。
ブロック104で、コンピュータは、元々の検索語句、製品カテゴリ選択肢、および製品属性をマージすることによって、推奨される検索語句を自動的に構成する。このように構成された推奨される検索語句は、元々の検索語句、製品カテゴリ選択肢、および製品属性のうちの少なくともいくつかの要素を包括する。
推奨される検索語句に含まれる要素は、コンピュータが検索行動データを処理した後に取得される。コンピュータは、検索行動データを処理するために、種々の動作を行い得る。処理動作の例としては、トークン化、重複する単語および同義語の除去、類義語のマージ、キーコンテンツの解析、および単語の再順序付けが挙げられ、これらは、下で別々に説明される。
(1)トークン化
検索行動データを処理するために、コンピュータは、トークン化された単語を取得するために、元々の検索語句、製品カテゴリ選択肢、および製品属性をトークン化する。
トークン化は、1組の言語ルールに従って、一連の文字またはアルファベット(または単語および語句よりも小さい他の単位)を分離し、再度組み合わせることによって、一連の単語および語句を形成する過程である。過程はまた、他の文脈では、より広義に単語のセグメント化とも称される。本出願において、トークン化と単語のセグメント化との間にはいかなる区別もなされない。
文字列(またはアルファベット列)アルゴリズム、意味アルゴリズム、および統計アルゴリズム等の、様々なトークン化アルゴリズムが存在する。本開示の目的には、任意の現実的なトークン化アルゴリズムが使用され得、本明細書の説明は、そのようなアルゴリズムの選択を限定しない。
例えば、「スリムトップス」は、2つの要素または単位、すなわち、「スリム」および「トップス」にトークン化され得る。
(2)冗長性の除去および同義語のマージ
いくつかの実施形態において、コンピュータは、検索行動データから、冗長な情報を取り除く。例えば、コンピュータは、重複する単語または同義語を取り除き得、および/または同義語または類義語をマージし得る。これを行うために、コンピュータは、トークン化された単語の中の任意の対の2つのトークン化された単語間の類似性を算出する。2つの単語間の類似性を算出する(または推定する)には様々な方法がある。例えば、2つのトークン化された単語間の類似性は、2つのトークン化された単語のテキストの類似性に基づいて推定され得る。異なる言語における2つのトークン化された単語間の類似性は、翻訳後のテキストの類似性に基づいて推定され得る。ある言語から別の言語への翻訳は、翻訳ツールを使用してコンピュータによって自動的に、または手動で予め設定される単語の相関関係に基づいて行われ得る。例えば、「ping’guo」という中国語は、翻訳に基づいて、英語の「Apple」という単語との高い類似性を有すると考えられ得る。類似性はまた、ユーザによって入力される検索単語と、同じユーザによって行われる対応するクリックとの相関に従っても推定され得る。例えば、ユーザが「大柄な女子」という検索語句を入力し、「プラスサイズ」という製品カテゴリを選択した場合、コンピュータは、「大柄な女子」および「プラスサイズ」が比較的高い類似性を有すると推定し得る。
コンピュータは、次いで、2つのトークン化された単語が、算出した類似性を予め設定された閾値と比較することによって、重複する単語であるか、同義語であるか、または類似語であるかどうか決定し得る。例えば、同義語には95%という類似性の閾値が設定され得、95%閾値以上の類似性を有する任意の2つのトークン化された単語は、同義語とみなされ得る。類義語には85%という類似性の閾値が設定され得、85%以上かつ95%閾値未満の類似性を有する任意の2つのトークン化された単語は、類義語とみなされ得る。
2つのトークン化された単語が重複する単語または同義語である場合、コンピュータは、2つのトークン化された単語のいずれか1つを保持し、もう1つを破棄する。同一である単語、ほぼ同一である単語、または高い類似性を有する同義語について、それらのうちの1つだけを保持する必要があり、その選択は、任意に、または任意の予め設定されたルールに従って行うことができる。この点に関しては、いかなる限定もない。
2つのトークン化された単語が類義語である場合、コンピュータは、予め設定された条件に従って、2つのトークン化された単語のうちの1つを保持し、もう1つを破棄し得る。保持される作業の選択は、好ましくは、任意ではなく、所望の条件に基づく。例えば、「大柄の女子」および「プラスサイズ」という同義語に関して、「大柄の女子」は、ユーザが入力した語句であり、一方で、「プラスサイズ」は、製品カテゴリの下の属性であるので、「プラスサイズ」を保持し、「大柄の女子」を破棄することが好ましくなり得るが、その理由は、システムにおける属性が、共通の使用について、個々のユーザの入力よりも高い一般度を有するからである。
(3)キーコンテンツの解析
いくつかの実施形態において、コンピュータは、より良く定義された検索語句を有するために、元々の検索語句、製品カテゴリ選択肢、および製品属性のキーコンテンツを見出す。
例えば、冗長性の除去および類義語のマージの後に、コンピュータは、各トークン化された単語について、トークン化された単語の重み因子および/またはトークン化された単語のクリック率を含む、解析パラメータを獲得し得る。重み因子の値は、トークン化された単語が検索語句からであるか、カテゴリ情報からであるか、または製品属性からであるかに依存し得る。
各トークン化された単語の重み因子の値は、トークン化された単語の有意水準に影響を及ぼす。検索語句、多層の製品カテゴリ、および製品属性は、それぞれが1つのクラスとして異なる重みを持ち得る。電子商取引環境において、例えば、製品カテゴリは、製品のタイプまたは分類を決定し、したがって、最も重要であり、また、例えば3つ星の格付けによって表され得る。製品属性は、通常、標準化され、また、製品の重要な特性を説明することができ、したがって、製品カテゴリほど重要ではないかもしれないが、同じく重要であり、また、例えば2つ星の格付けによって表され得る。検索語句は、検索エンジン環境においては非常に重要であるが、電子商取引環境においては製品カテゴリほど重要ではなく、おそらく、属性の重要性と同等の重要性を有し、したがって、例えば同じく2つ星の格付けによって表される。
加えて、各トークン化された単語のクリック率もまた、ある程度、トークン化された単語の重要性に影響を及ぼす。通常、より頻繁にユーザによってクリックされる単語は、あまり頻繁にクリックされない単語よりも重要である。本明細書で説明される例に加えて、トークン化された単語の重要性に影響を及ぼす他の因子があり得る。
次に、各トークン化された単語について、コンピュータは、次いで、それぞれの解析パラメータ(重み因子および/またはクリック率)に従って、有意水準を決定し、また、トークン化された単語の有意水準に従って、キーコンテンツを決定する。
全般的に、最も高い重要性を有するトークン化された単語は、最初に、キーコンテンツに含まれると考えられるべきである。例えば、「白、スカート、婦人服、フリーサイズ」といった抽出された情報から、「スカート」という単語が最も高い重要性を有すると決定された場合、抽出された情報のキーメッセージは「スカート」であり、一方で、「白」、「婦人服」、および「フリーサイズ」は、キーに加えられる修飾語にすぎない。
(4)再順序付け
各トークン化された単語について、それぞれの解析パラメータに従って有意水準を決定した時点で、コンピュータは、トークン化された単語の有意水準に従って、トークン化された単語を再順序付けし得る。
例えば、中国語の語順の一般的なパターンを考えると、より高い有意水準を有する単語が、より低い有意水準を有する単語の後に配置され得る。本明細書で説明されるように、製品カテゴリを示すトークン化された単語は、高い有意水準を有し、したがって、他の単語の後に配置されるべきである。対照的に、より少ない重要性を有する修飾語にすぎない単語は、より重要な単語の後に配置される。
上で説明されるトークン化された単語処理は、実施例を使用して下でさらに例示される。
元々の検索語句が「スリムトップス」である、上のブロック102で説明される実施例を使用すると、多層の製品カテゴリは、「婦人服>Tシャツ>長袖のTシャツ」であり、製品属性は、「白」であり、全ての抽出された情報は、下でさらに説明されるように、トークン化、同義語の除去、類義語のマージ、キーコンテンツの解析、および再順序付けを使用してマージされる。
1.トークン化:「スリムトップス」という元々の検索語句、「婦人服>Tシャツ>長袖のTシャツ」という多層の製品カテゴリ、および「白」という製品属性は、{(スリム、トップス)+(婦人服、Tシャツ、長袖、Tシャツ)+(白)}によって表されるトークン化された単語群にトークン化される。
2.同義語の除去:同義語の類似性閾値が95%であると想定して、上でトークン化された単語群の中のトークン化された単語の全ての対の類似性を計算した時点で、第1の「Tシャツ」および第2の「Tシャツ」が95%の類似性閾値よりも高い100%の類似性を有するので、「Tシャツ」というトークン化された単語が群の中に2度現れることが発見され、したがって、重複する単語または同義語として取り扱われる。進めると、第1の「Tシャツ」が取り除かれ、「長袖のTシャツ」に由来する第2の「Tシャツ」が保持される。その結果、同義語を取り除いた後の更新されたトークン化された単語群は、{(スリム、トップス)+(婦人服、長袖、Tシャツ)+(白)}である。
3.類義語のマージ:類義語の類似性閾値が80%である場合、上でトークン化された単語の中で、「トップス」と「Tシャツ」との類似性は、85%であり、類義語閾値の80%より大きいが、同義語閾値の95%よりも小さい。したがって、これら2つのトークン化された単語は、類義語とみなされ、「トップス」というトークン化された単語が取り除かれ、一方で、「Tシャツ」というトークン化された単語が保持される。その結果、類義語をマージした後の更新されたトークン化された単語群は、{(スリム)+(婦人服、長袖、Tシャツ)+(白)}である。
4.キーコンテンツの解析:上の更新されたトークン化された単語は、以下の解析パラメータを有し、
「スリム」は、2つ星の重み因子およびクリック率50%を有する検索単語という解析パラメータに対応し、
「婦人服」は、3つ星の重み因子およびクリック率60%を有する第1の階層カテゴリという解析パラメータに対応し、
「長袖」は、3つ星の重み因子およびクリック率20%を有する第2の階層カテゴリという解析パラメータに対応し、
「Tシャツ」は、3つ星の重み因子およびクリック率35%を有する第3の階層カテゴリという解析パラメータに対応し、そして、
「白」は、2つ星の重み因子およびクリック率40%を有する属性という解析パラメータに対応する。
本実施例において、製品カテゴリを示すトークン化された単語の有意水準は、製品属性を示すトークン化された単語、または検索単語であるトークン化された単語のいずれかの有意水準よりも高く、一方で、製品属性を示すトークン化された単語の有意水準は、検索単語であるトークン化された単語の有意水準と同等である。
残りのトークン化された単語のうち、「婦人服」、「長袖」、および「Tシャツ」は、全て製品カテゴリであるが、「長袖」のクリック率は、「婦人服」および「Tシャツ」のクリック率よりもかなり低い。その結果、「長袖」というトークン化された単語の有意水準は、「婦人服」および「Tシャツ」の有意水準未満になるように調整され得る。
上で論じられる解析パラメータに基づいて、各トークン化された単語の調整された有意水準は、
「スリム」:2つ星、
「婦人服」:3つ星、
「長袖」:2つ星、
「Tシャツ」:2つ星、
「白」:2つ星、のように列記される。
上の解析に基づいて、キーコンテンツが「婦人服Tシャツ」であると決定される。
5.再順序付け:トークン化された単語(複数可)の有意水準に従って、該トークン化された単語を順序正しく配置した後に、該トークン化された単語の結果として生じる順序は、
「スリム」、「長袖」、「白」、「婦人服」、「Tシャツ」である。
元々の検索意図および従来のルールを考慮すると、トークン化された単語はさらに、「白いスリムな長袖の婦人用Tシャツ」という検索語句に調整され得る。
上で示されるように、最終的な検索語句は、3つ全ての部分、すなわち、元々の検索語句部分、製品カテゴリ、およびカテゴリの下の製品属性の包括的な統合に基づいて、コンピュータによって構成され、検索コンテキストにおけるユーザの元々の検索意図をより正確に反映する。
トークン化の後、かつ同義語の除去および類義語のマージの前に、コンピュータはさらに、複数のトークン化された単語のスペルを正規化し得る。例えば、異なる言語(例えば、中国語および英語)のトークン化された単語は、標準語または共通語に正規化され得る。また、大文字および小文字も正規化され得る。名詞化は、テキストの類似性の算出に有益であり、したがって、同義語の除去および類義語のマージの過程を補助する。
上で説明される過程に基づいて、例示される実施例において、検索行動データが{白いスカート(元々の検索語句)}である場合、結果として生じるコンピュータで構成した推奨される検索語句は、「白いスカート」となり、検索行動データが{スカート(元々の検索語句)+白(属性)}である場合、結果として生じるコンピュータで構成した推奨される検索語句もやはり「白いスカート」となる。その結果、{白いスカート(元々の検索語句)}に基づく検索および{スカート(元々の検索語句)+白(属性)}に基づく検索のためのトラフィックがともにマージされる。
要約すると、上の実施形態による方法は、検索過程で入力された元々の検索語句、ユーザによって選択された製品カテゴリ、およびユーザによって選択された製品属性を包括的に統合することによって、推奨される検索語句を構成する。結果として生じる推奨される検索語句は、実際の検索意図をより良く反映し、構造化検索コンテキスト(例えば、検索語句、検索カテゴリ、製品属性)に含まれる情報を統合するという目的を達成し、そして、構造化検索を「非構造化すること」を可能にする。
このように構成される推奨される検索語句はまた、広告主による入札精度を向上させるために、図2で例示されるような広告を配信するための方法において、入札語句としても使用され得る。推奨される検索語句はまた、検索エンジンの精度および検索結果の関連性を向上させるために、図3で例示されるように、製品情報を検索するための方法において、検索語句としても使用され得る。
図2は、本開示に従う、広告を配信するための方法のフローチャートである。本方法は、以下のようにブロックで説明される。
ブロック200で、コンピュータは、検索過程で入力された元々の検索語句、検索過程で選択された製品カテゴリ選択肢、および検索される製品属性を含む、検索行動データを獲得する。検索行動データは、クエリログから獲得され得る。
ブロック202で、コンピュータは、獲得した検索行動データから、元々の検索語句、製品カテゴリ選択肢、および製品属性を抽出する。
ブロック204で、コンピュータは、元々の検索語句、製品カテゴリ選択肢、および製品属性をマージすることによって、入札語句を自動的に構成する。マージする過程は、図1で例示される実施形態において本明細書で説明されるように、抽出した情報のトークン化を含み得、さらに、同義語の除去、類義語のマージ、キーコンテンツの解析、およびトークン化した単語の再順序付けを含み得る。
ブロック206で、コンピュータは、広告主から、入札語句に対する複数の入札価格および入札語句と関連付けられる複数の広告を受け取る。各広告は、入札価格の1つと関連付けられ得る。
各広告主は、1つ以上の入札語句を選択し得、各選択した入札語句に対するそれぞれの入札価格を選択または提供し得、また、各選択した入札語句と関連付けられる製品情報の一部(広告)を提供し得る。複数の広告主は、同じ入札語句を選択し得、異なる広告を入札語句と関連付け得る。
ブロック208で、コンピュータは、関連付けられた入札語句に従って、広告にインデックスを付け、そして、それぞれの入札価格に従って、広告をランク付けする。通常、より高い入札価格を有する広告がより高くランク付けされる。ランク付けは、後ほどブロック210の後の検索時に行い得ることに留意されたい。
ブロック210で、コンピュータは、インデックスが付けられ、ランク付けされた複数の広告を広告データベースに追加する。例えば、広告データベースに追加された広告は、下でおよび下の図3で説明されるような広告を検索するための方法を使用して、容易に検索される準備ができている。
ユーザが選択された入札語句の1つを検索する場合(または選択された入札語句の1つに一致する検索語句を使用して検索が行われた場合)、関連付けられた広告が、ランク付けに従って検索結果に列記される。検索語句自体は、図1の検索語句を構成する方法で例示されるように、少なくとも部分的に機械で構成され得る。そのような検索語句を構成する過程は、別の検索過程において入力されたそれ自体の元々の検索語句、それ自体の製品カテゴリ選択肢、およびその検索過程で検索される製品属性を含む、別の検索行動データを獲得することを含み得る。図1で説明されるように、そのような検索語句を構成するために、コンピュータは、この獲得した検索行動データから、それぞれの元々の検索語句、製品カテゴリ選択肢、および製品属性を抽出し、そして、その中に含まれる情報をマージすることによって検索語句を自動的に構成する。
一実施形態において、広告を配信するための方法は、入札語句と関連付けられる広告の広告有効性データの統計を記録する。広告自体と同様に、それぞれの広告有効性データは、関連付けられた入札語句に従ってインデックスが付けられ得る。広告有効性データは、ウェブページ上の広告を閲覧するユーザのデータ、広告をクリックするユーザのデータ、および広告によって広告される製品またはサービスのトランザクションを完了するユーザのデータ、のうちの1つ以上を含み得る。本方法はさらに、解析のために、入札語句に従ってインデックスが付けられた統計を広告主に提供する。
広告有効性データは、広告主が、広告主の入札価格、および入札語句と関連付けられる広告のコンテンツに対して調整を行うことを補助する。例えば、広告主が、広告有効性データから、「白いスカート」という入札語句と関連付けられる広告が効果的であることを見出した場合、広告主は、検索における広告主の広告のランク付けを向上させるために、「白いスカート」という入札語句と関連付けられる入札価格を増加させることを望み得る。
入札語句に従って広告有効性データにインデックスを付けることは、広告有効性と入札語句とのより明白な関係を伝え、また、広告主が、特定のおよび関連する統計に基づいて、各入札語句の有効性を評価すること、ならびに価格および広告コンテンツの調整を行うことを補助する。広告主が広告主の入札価格および広告を調整すると、それに応じて、変更が製品情報データベースに追加される。
機械で構成された推奨される検索語句を入札語句と解釈することはさらに、検索トラフィックを、入札語句に従って分割する(仕切る)またはマージすることを可能にし、また、広告主が、向上した入札精度を有するその入札語句に対して特に調整した関連するトラフィック情報に基づいて、各入札語句に対して入札することを可能にする。これは、下でさらに例示される。
最初に、本方法は、検索トラフィックのマージを可能にする。例えば、ユーザがApple携帯電話を購入したい場合、ユーザは、検索のために「Apple携帯電話」という検索語句を入力する、「携帯電話」というカテゴリの下の「Apple」という検索語句を入力する、または属性として「Apple」を有する「携帯電話」というカテゴリの下で検索する、といった検索シナリオのうちのいずれかを使用し得る。従来技術は、単にユーザによって入力される検索語句に基づく平凡な入札語句を使用するので、ユーザは、異なる検索語句を有する上の3つの異なる検索シナリオの検索結果において異なる製品情報を受け取る。さらに、異なるシナリオにおいて、関与する広告主も異なり得る。この意味では、従来技術は、入札を検索トラフィックの裏で深く分割し過ぎる。その結果、広告主は、全ての検索ユーザが検索を行う際に同じ意図を有する場合であっても、上の3つの異なる検索シナリオにおける実質的に広告を最適化するために、3つの異なる入札語句を購入することが必要である。
対照的に、本明細書で開示される方法は、複数の検索要素(すなわち、該要素は、ユーザによって入力された元々の検索語句、製品カテゴリ情報、および製品属性情報)を統合する構造化入札語句を使用するので、上の3つの異なる検索シナリオは全て、「Apple携帯電話」という同じ検索語句につながる。その結果、広告主は、3つ全ての異なる検索シナリオにおいて広告の入札リストに関与することを可能にするために、「Apple携帯電話」という1つの入札語句を購入することだけしか必要としない。これは、3つの異なる検索シナリオから、トラフィックの有益なマージをもたらす。
別の例について、「白いスカート」という単一の入札語句を購入することは、広告主が、以下の検索シナリオにおいてその広告の入札リストに関与することを可能にし得る。
1.白いスカート(検索語句)
2.スカート(検索語句)+白(属性)
3.白(検索語句)+スカート(カテゴリ)
4.スカート(カテゴリ)+白(属性)
上の4つ全ての異なる検索シナリオの広告の表示(閲覧)、クリック、クリック価格、およびクリック後のトランザクションは、「白いスカート」という単一の入札語句の下で記録され、報告され得、したがって、ユーザの同じ検索意図を共有する全ての検索トラフィックについて、広告主に対するパッケージ化された広告価格オークションを可能にする。同じ検索意図の下でトラフィックをマージすることは、広告主の経済状態を向上させ、また、入札を有意義な深さでマージすることによって、入札語句のオークションをより容易にする。
第2に、本方法はまた、トラフィックの分割も可能にする。例えば、従来技術の平凡な入札語句によって、広告主は、以下の検索シナリオを把握するのに十分に幅の広い「スカート」という入札語句を購入しなければならない場合があり、検索ユーザは、それぞれ、「スカート(検索語句)+白(属性)」、「スカート(検索語句)+青(属性)」、「スカート(検索語句)+半袖(属性)」、または「スカート(検索語句)+子供服(カテゴリ)を入力する。しかしながら、従来技術では、これら全ての検索シナリオのトラフィックは、「スカート」という入札語句にマージされ、広告主は、これらの検索シナリオにおける広告効果の差を認識することができず、また、各シナリオにおける実際の購入トランザクションから、シナリオ固有の情報を学習するためのいかなる方法も有しない。
対照的に、本明細書で開示される方法を使用することで、上の4つの検索シナリオは、4つの異なる推奨される検索語句、すなわち、それぞれ、「白いスカート」、「青いスカート」、「半袖のスカート」、および「子供用スカート」をもたらす。その結果、異なる製品の異なる広告効果に基づいて、正確な情報を広告主に提供して、それに従って入札価格を調整するために、各検索シナリオに対応するトラフィックが別々に記録される。
上の図2の入札語句は、図1で説明されるような推奨される語句を構成するための方法によって作成される、推奨される検索語句であり得、その結果、図2の方法の結果は、図1の方法と組み合わせられ得ることに留意されたい。
図3は、本開示に従う、製品情報を検索するための方法のフローチャートである本方法は、以下のようにブロックで説明される。
ブロック300で、コンピュータは、検索過程で入力された元々の検索語句、検索過程で選択された製品カテゴリ選択肢、および検索される製品属性を含む、検索行動データを獲得する。
ブロック302で、コンピュータは、獲得した検索行動データから、元々の検索語句、製品カテゴリ選択肢、および製品属性を抽出する。
ブロック304で、コンピュータは、元々の検索語句、製品カテゴリ選択肢、および製品属性をマージすることによって、推奨される検索語句を自動的に構成する。推奨される検索語句を構成する過程は、検索語句を構成する方法において図1を参照して説明されており、繰り返されない。
ブロック306で、コンピュータは、推奨される検索語句を製品情報データベースに記憶された入札語句と照合する。
製品情報データベースは、複数の入札語句を記憶し、複数の広告がそれぞれ入札語句と関連付けられる。コンピュータは、現在の推奨される検索語句と一致する入札語句を見出すために、製品情報データベースを検索する。
ブロック308で、コンピュータは、推奨される検索語句と一致する入札語句と関連付けられる広告の少なくともいくつかを、検索ユーザに表示することを可能にする。具体的には、推奨される検索語句に一致する入札語句を見出した時点で、コンピュータは、検索ユーザに表示されるように、一致する入札語句と関連付けられる広告を提供する。表示は、通常、広告主によって提供される広告の入札価格に従ったランク付けに基づく。
推奨される検索語句は、検索コンテキストの複数の態様(すなわち、元々の検索語句、製品のカテゴリ情報、および製品の属性情報)を統合することによって構成されるので、推奨される検索語句は、ユーザの検索意図をより正確に反映し、より良い検索精度をもたらす。
推奨される検索語句を入札語句と照合するために、コンピュータは、最初に、厳密な照合ルールに従って、推奨される検索語句を入札語句と照合し得る。代表的な厳密な照合ルールは、正確なまたはほぼ正確な一致を必要とし得る。厳密な一致が見出された場合、見出された一致する入札価格と関連付けられる広告が表示される。しかし、厳密な照合ルールに従った照合に失敗した場合、コンピュータは、ファジー照合ルールに従って、推奨される検索語句を入札語句と照合する。ファジー照合ルールは、完全な一致ではないが、現在の推奨される検索語句に関連する入札語句を見出すためのものである。例えば、ファジー照合ルールは、元々の検索語句と入札語句の一部との一致を必要とし得る。ファジー照合ルールに基づいて、関連する入札語句が見出された場合、コンピュータは、該関連する入札語句と関連付けられる広告を表示することを可能にする。
加えて、厳密な照合ルールに従った照合が失敗した場合、コンピュータは、新しい入札語句として、推奨される検索語句を製品情報データベースに加えて、製品情報データベースを常時更新することを可能にする。
例示されるような本方法は、検索ユーザの検索行動データを、検索ユーザの実際の意図をより良く反映する推奨される検索語句に変換することができる。製品情報データベースの入札語句も機械で構成された検索語句に基づく実施形態では、製品情報データベースを検索するために同じまたは類似する機械で構成された検索語句を使用することが、より効率的な検索エンジン性能、より正確な検索結果、およびより良い検索ユーザエクスペリエンスをもたらす。
例えば、入札語句として平凡な検索語句を使用する従来技術では、ユーザが「携帯電話」というカテゴリの下の「Apple」を検索する場合、果物の販売業者である広告主による広告さえも入札に関与し得る。関連する製品情報を検索ユーザに表示するために、システムは、しばしば、携帯電話に関係のないappleに対する広告をフィルタ除去するために、広告をさらに処理する必要がある。換言すれば、本システムは、本質的に、現在のコンテキストに関連する製品情報を表示するために、最初に、「apple」というキーワードを使用する全ての製品情報を検索し、次いで、関連するコンテキストに基づいて、検索結果をフィルタ処理する。これは、コンピュータおよびネットワークリソースの非常に無駄の多い使用を引き起こす。
対照的に、本明細書で開示される照合で構成された検索語句が入札語句として使用されるときに、ユーザが「携帯電話」というカテゴリの下の「Apple」を検索する場合、コンピュータによって「Apple携帯電話」という入札語句が生成され、「Apple携帯電話」という推奨される検索語句を使用して検索が行われ、したがって、果物の販売業者による広告は、推奨される検索語句と一致しなくなり、結果的に、入札に関与しない。検索エンジンは、最初に全ての情報を見出し、次いでそれをフィルタ除去する必要はなく、その代わりに、その過程においてそのような情報を完全に回避することができる。これは、検索エンジンの効率を向上させ、不必要な動作コストを回避する。加えて、この状況においてコンピュータによって実際に使用される検索語句は、「Apple携帯電話」であり、ユーザの意図をより正確に反映し、より正確な検索結果につながる。
この説明において、過程が説明される順序は、限定するものとして解釈されることを意図したものではなく、任意の数の説明される過程ブロックを任意の順序で組み合わせて、該方法または代替の方法を実現し得ることに留意されたい。実施形態は、例示の便宜のためだけに、逐次的ステップで説明される。さらに、実施形態で説明される全てのステップが、本方法によって必要とされるわけではない。
上で説明される技法は、コンピュータ実行可能な命令を含む1つ以上の非一時的なコンピュータ読み出し可能な媒体の補助を用いて実現され得る。非一時的なコンピュータ実行可能な命令は、コンピュータプロセッサが、本明細書で説明される技法に従ってアクションを行うことを可能にする。コンピュータ読み出し可能な媒体は、コンピュータデータを記憶するための適切なメモリデバイスのいずれかであり得ることを認識されたい。そのようなメモリデバイスとしては、ハードディスク、フラッシュメモリデバイス、光データ記憶装置、およびフロッピーディスクが挙げられるが、それらに限定されない。さらに、コンピュータ実行可能な命令を含むコンピュータ読み出し可能な媒体は、ローカルシステムの中の構成要素(複数可)、または複数のリモートシステムのネットワークを通じて分散される構成要素で構成され得る。コンピュータ実行可能な命令のデータは、有形の物理メモリデバイスで送達され得るか、または電子的に伝送され得る。
本明細書で開示される方法に関連して、本開示はまた、オンライントランザクションを処理するためのコンピュータに基づく装置も提供する。
本開示において、「モジュール」は、全般に、特定のタスクまたは機能を行うように設計された機能を指す。モジュールは、特定のタスクまたは機能と関連付けられる目的を達成するための、ハードウェア、ソフトウェア、計画もしくはスキームの一部、またはそれらの組み合わせとすることができる。加えて、別個のモジュールの描写は、必ずしも物理的に別個のデバイスが使用されることを示唆するわけではない。代わりに、描写は、機能的なだけであり得、いくつかのモジュールの機能は、単一の組み合わせたデバイスまたは構成要素によって行われ得る。コンピュータに基づくシステムで使用されるときに、プロセッサ、記憶装置、およびメモリ等の標準的なコンピュータ構成要素は、種々のそれぞれの機能を行うために、1つ以上のモジュールとして機能するようにプログラムされ得る。
図4は、図1を参照して本明細書で示される第1の例示的な方法に基づいて、推奨される検索語句を構成するための方法を実現するように構成される、コンピュータに基づく装置の概略的なブロック図である。コンピュータに基づく装置は、1つ以上のプロセッサ(複数可)490、I/Oデバイス492、およびアプリケーションプログラム(複数可)480を記憶するメモリ494を有する、サーバ400を含む。サーバ400は、以下で説明されるような機能モジュールを有するようにプログラムされる。
データ獲得モジュール410は、検索過程で入力された元々の検索語句、検索過程で選択された製品カテゴリ選択肢、および検索される製品属性を含む、検索行動データを獲得するように構成される。検索行動データは、クエリログから取得され得る。
データ抽出モジュール412は、獲得した検索行動データから、元々の検索語句、製品カテゴリ選択肢、および製品属性を抽出するように構成される。例えば、データ抽出モジュール412は、データ獲得モジュール410によって取得した検索行動データから、「スリムトップス」という元々の検索語句、「婦人服>Tシャツ>長袖のTシャツ」という多層の製品カテゴリ選択肢、および「白」という製品属性を抽出し得る。
検索語句構成モジュール414は、検索行動データをマージすることによって、推奨される検索語句を自動的に構成するように構成される。結果として生じる推奨される検索語句は、元々の検索語句、製品カテゴリ選択肢、および製品属性の要素を包括する。
一実施形態において、検索語句構成モジュール410は、以下のように説明される他の機能を行うために、サブモジュールを含むようにプログラムされ得る。
トークン化サブモジュール4141は、検索行動データをトークン化するように構成される。名詞化サブモジュール4142は、言語の違いならびに大文字および小文字の違い等の相違を排除するために、トークン化された単語を正規化するように構成される。冗長除去サブモジュール4143は、トークン化された単語群の中の2つのトークン化された単語の任意の対の類似性を計算し、それぞれの所定の閾値を使用して2つのトークン化された単語の各対が同義語であるか類義語であるかを決定し、そして、対の中の同義語の1つを取り除くか、または対の中の類義語のどちらの1つを取り除くべきかを決定するように構成される。
キーコンテンツ解析サブモジュール4144は、より良く定義された検索語句を有するために、検索シナリオ(元々の検索語句、製品カテゴリ選択肢、および製品属性を含む)のキーコンテンツを見出すように構成される。例えば、冗長性の除去および類義語のマージの後に、キーコンテンツ解析サブモジュール4144は、各トークン化された単語について、トークン化された単語の重み因子および/またはトークン化された単語のクリック率を含む、解析パラメータを獲得し得る。重み因子の値は、トークン化された単語が検索語句からであるか、カテゴリ情報からであるか、または製品属性からであるかに依存し得る。各トークン化された単語について、キーコンテンツ解析サブモジュール4144は、次いで、それぞれの解析パラメータに従って、有意水準を決定する。キーコンテンツ解析サブモジュール4144は、次いでさらに、トークン化された単語の有意水準に従って、キーコンテンツを決定する。
単語再順序付けサブモジュール4145は、キーコンテンツ解析サブモジュール4144が、各トークン化された単語について、それぞれの解析パラメータに従って有意水準を決定した後に、トークン化された単語の有意水準に従って、トークン化された単語を再順序付けするように構成される。
サーバ400の機能モジュールによって行われる機能は、推奨される検索語句を構成する方法において図1を参照して説明されており、したがって、繰り返されない。上の実施形態によるコンピュータに基づく装置は、検索シナリオの複数の情報要素を包括的に統合することによって、推奨される検索語句を構成する。結果として生じる推奨される検索語句は、実際の検索意図をより良く反映し、検索語句、製品カテゴリ、および製品属性を統合するという目的を達成し、そして、構造化検索を「非構造化すること」を可能にする。
このように作成される推奨される検索語句は、広告主が製品を販売促進するために、図2で説明される広告を配信する方法にあるように、入札語句として使用され得る。
図5は、本開示に従う、広告を配信するように構成される、コンピュータに基づく装置を表すブロック図である。コンピュータに基づく装置は、1つ以上のプロセッサ(複数可)590、I/Oデバイス592、およびアプリケーションプログラム(複数可)580を記憶するメモリ594を有する、サーバ500を含む。サーバ500は、以下で説明されるような機能モジュールを有するようにプログラムされる。
データ獲得モジュール510は、検索過程で入力された元々の検索語句、検索過程で選択された製品カテゴリ選択肢、および検索される製品属性を含む、検索行動データを獲得するように構成される。
データ抽出モジュール512は、獲得した検索行動データから、元々の検索語句、製品カテゴリ選択肢、および製品属性を抽出するように構成される。
語句構成モジュール514は、元々の検索語句、製品カテゴリ選択肢、および製品属性をマージすることによって、入札語句を自動的に構成するように構成される。入札語句は、図4で説明されるような推奨される語句を構成するための装置によって作成される、推奨される検索語句であり、その結果、図5の語句構成モジュール514は、検索語句構成モジュール414と同じであり、特有の機能を行う別個のモジュールではない場合があることに留意されたい。
広告情報受け取りモジュール516は、広告主から、入札語句に対する複数の入札価格および入札語句と関連付けられる複数の広告を受け取るように構成される。各広告は、入札価格の1つと関連付けられる。
ランク付けモジュール518は、関連付けられた入札語句に従って、広告にインデックスを付け、それぞれの入札価格に従って、広告をランク付けするように構成される。
インデックスが付けられ、ランク付けされた広告を広告データベースに追加するように構成される広告配信モジュール520。
図5でさらに示されるように、いくつかの実施形態において、サーバ500は、統計モジュール522、および表示モジュール524をさらに含むようにプログラムされ得る。統計モジュール522は、統計にインデックスを付けるために入札語句を使用して、入札語句と関連付けられる広告の広告有効性データの統計を記録する。広告有効性データは、ウェブページ上の広告を閲覧するユーザのデータ、広告をクリックするユーザのデータ、および広告によって広告される製品またはサービスのトランザクションを完了するユーザのデータ、のうちの1つ以上を含み得る。統計モジュール522はさらに、入札語句に従ってインデックスが付けられた統計を広告主に提供し得る。表示モジュール524は、提供された統計および有効性メトリクスを広告主に表示することを可能にする。
コンピュータで構成した入札語句に従ってインデックスが付けられ広告を配信することは、広告有効性と入札語句とのより明白な関係を伝える、広告有効性データをもたらし、また、広告主が、特定のおよび関連する情報に基づいて、各入札語句の有効性を評価すること、ならびに価格および広告コンテンツの調整を行うことを補助する。広告主が広告主の入札価格および広告を調整すると、それに応じて、変更が製品情報データベースに追加される。
さらに、機械で構成された推奨される検索語句を入札語句と解釈することは、検索トラフィックを、入札語句に従って分割する(仕切る)またはマージすることを可能にし、また、広告主が、向上した入札精度を有するその入札語句に対して特に調整した関連するトラフィック情報に基づいて、各入札語句に対して入札することを可能にする。
サーバ500の機能モジュールによって行われる機能は、広告を配信する方法において図2を参照して説明されており、したがって、繰り返されない。
下でさらに例示されるように、製品情報を検索するための方法は、図1および図4で説明される方法および装置を使用して構成される推奨される検索語句と、入札語句によってインデックスが付けられ、図2および図5で説明される方法および装置を使用して配信される広告との組み合わせに基づいて形成される。
図6は、本開示に従う、製品情報を検索するように構成される、コンピュータに基づく装置を表すブロック図である。コンピュータに基づく装置は、1つ以上のプロセッサ(複数可)690、I/Oデバイス692、およびアプリケーションプログラム(複数可)680を記憶するメモリ694を有する、サーバ600を含む。サーバ600は、以下で説明されるような機能モジュールを有するようにプログラムされる。
データ獲得モジュール610は、検索過程で入力された元々の検索語句、検索過程で選択された製品カテゴリ選択肢、および検索される製品属性を含む、検索行動データを獲得するように構成される。
データ抽出モジュール612は、獲得した検索行動データから、元々の検索語句、製品カテゴリ選択肢、および製品属性を抽出するように構成される。
検索語句構成モジュール614は、元々の検索語句、製品カテゴリ選択肢、および製品属性をマージすることによって、推奨される検索語句を自動的に構成するように構成される。
照合モジュール616は、推奨される検索語句を製品情報データベースに記憶された入札語句と照合し、推奨される検索語句と一致する入札語句と関連付けられる広告のうちの少なくともいくつかを表示することを可能にするように構成される。
いくつかの実施形態において、照合モジュール616は、厳密な照合サブモジュールおよびファジー照合サブモジュールを有するようにプログラムされる。厳密な照合モジュールは、厳密な照合ルールに従って、推奨される検索語句を入札語句と照合するように構成される。代表的な厳密な照合ルールは、正確なまたはほぼ正確な一致を必要とし得る。厳密な一致が見出された場合、見出された一致する入札価格と関連付けられる広告が表示される。しかし、厳密な照合ルールに従った照合に失敗した場合、ファジー照合サブモジュールは、ファジー照合ルールに従って、推奨される検索語句を入札語句と照合する。ファジー照合ルールに基づいて、関連する入札語句が見出された場合、ファジー照合サブモジュールは、該関連する入札語句と関連付けられる広告を表示することを可能にする。
サーバ600の機能モジュールによって行われる機能は、広告を配信する方法において図3を参照して説明されており、したがって、繰り返されない。
上の装置の実施形態は、本明細書で説明される方法の実施形態に関連し、該方法の実施形態の詳細な説明もまた、該装置の実施形態に適用することができ、したがって、繰り返されない。
本開示の方法および装置は、構造化検索の設定に良く適しており、また、大部分の電子商取引ウェブサイトおよび数多くの他のデータベースに基づく商業ウェブサイトは、構造化検索を有するので、本開示は、幅広い実際の応用範囲を有することにさらに留意されたい。
本開示で説明される技法は、汎用コンピューティング装置もしくは環境、または特殊コンピューティング装置もしくは環境で実現され得、該装置もしくは環境としては、パーソナルコンピュータ、サーバコンピュータ、ハンドヘルドデバイスもしくはポータブルデバイス、タブレットデバイス、マルチプロセッサシステム、マルチプロセッサに基づくシステム、セットトップボックス、プログラム可能な消費者デバイス、ネットワークPC、マイクロコンピュータおよび大型メインフレームコンピュータ、または上の例の1つ以上を含む任意の分散環境が挙げられるが、それらに限定されない。
モジュールは、具体的には、機械実行可能なコマンドおよびコードに基づいて、コンピュータプログラムモジュールを使用して実現され得る。全般的に、コンピュータプログラムモジュールは、特定のタスクを行い得るか、または特定の抽象データ型のルーチン、プログラム、オブジェクト、構成要素、データ構造等を実現し得る。本開示で説明される技法はまた、分散コンピューティング環境、通信ネットワークを通して接続されるリモート処理デバイスによってタスクを行うような分散コンピューティング環境で実践することもできる。分散コンピューティング環境において、プログラムモジュールは、メモリデバイスを含む、ローカルおよびリモートいずれかのコンピュータ記憶媒体の中に位置し得る。
本明細書で論じられる可能な利益および利点は、添付の特許請求の範囲を限定または制限するものと解釈するべきではないことを認識されたい。
情報を検証する方法および装置を、本開示において上で詳細に説明してきた。例示的な実施形態は、本開示において本発明の概念および実現形態を例示するために用いられる。例示的な実施形態は、本開示の方法および中核となる概念をより良く理解するためにだけ使用される。この開示の概念に基づいて、当業者は、例示的な実施形態および適用分野を変更してもよい。

Claims (20)

  1. 検索語句を構成するための方法であって、
    検索過程で入力された元々の検索語句、前記検索過程で選択された製品カテゴリ選択肢、および検索される製品属性を含む、検索行動データを獲得することと、
    前記獲得した検索行動データから、前記元々の検索語句、前記製品カテゴリ選択肢、および前記製品属性を抽出することと、
    前記元々の検索語句、前記製品カテゴリ選択肢、および前記製品属性をマージすることによって、推奨される検索語句を自動的に構成することであって、前記推奨される検索語句は、前記元々の検索語句、前記製品カテゴリ選択肢、および前記製品属性の要素を包括する、自動的に構成することと、を含む、方法。
  2. 請求項1に記載の方法であって、
    前記元々の検索語句、前記製品カテゴリ選択肢、および前記製品属性をマージすることは、
    複数のトークン化された単語を取得するために、前記元々の検索語句、前記製品カテゴリ選択肢、および前記製品属性をトークン化することを含む、方法。
  3. 請求項2に記載の方法であって、
    前記元々の検索語句、前記製品カテゴリ選択肢、および前記製品属性をマージすることはさらに、
    前記複数のトークン化された単語のスペルを正規化することを含む、方法。
  4. 請求項1に記載の方法であって、
    前記元々の検索語句、前記製品カテゴリ選択肢、および前記製品属性をマージすることは、
    前記元々の検索語句、前記製品カテゴリ選択肢、および前記製品属性から冗長な情報を取り除くことであって、前記冗長な情報は、1つ以上の重複する単語、同義語、および類義語を含む、取り除くことを含む、方法。
  5. 請求項4に記載の方法であって、
    冗長な情報を取り除くことは、
    前記元々の検索語句、前記製品カテゴリ選択肢、および前記製品属性をトークン化することによって、2つのトークン化された単語の類似性を計算することと、
    前記類似性を予め設定された閾値と比較することによって、前記2つのトークン化された単語が、重複する単語であるか、同義語であるか、または類義語であるかを決定することと、
    前記2つのトークン化された単語が重複する単語または同義語である場合に、前記2つのトークン化された単語のうちの1つを保持し、もう1つを破棄するか、または前記2つのトークン化された単語が類義語である場合に、予め設定された条件に従って、前記2つのトークン化された単語のうちの1つを保持し、もう1つを破棄することと、を含む、方法。
  6. 請求項1に記載の方法であって、
    前記元々の検索語句、前記製品カテゴリ選択肢、および前記製品属性をマージすることは、
    前記元々の検索語句、前記製品カテゴリ選択肢、および前記製品属性のキーコンテンツを見出すことを含む、方法。
  7. 請求項6に記載の方法であって、
    前記キーコンテンツを見出すことは、
    トークン化された単語を取得するために、前記元々の検索語句、前記製品カテゴリ選択肢、および前記製品属性をトークン化することと、
    各トークン化された単語について、前記トークン化された単語の重み因子および/または前記トークン化された単語のクリック率を含む、解析パラメータを獲得することであって、前記重み因子は、前記トークン化された単語が検索語句からであるか、カテゴリ情報からであるか、または製品属性からであるかに依存する、獲得することと、
    各トークン化された単語について、前記それぞれの解析パラメータに従って有意水準を決定することと、
    前記トークン化された単語の前記有意水準に従って、前記キーコンテンツを決定することと、を含む、方法。
  8. 請求項1に記載の方法であって、
    前記元々の検索語句、前記製品カテゴリ選択肢、および前記製品属性をマージすることは、
    1つ以上のトークン化された単語を取得するために、前記元々の検索語句、前記製品カテゴリ選択肢、および前記製品属性をトークン化することと、
    各トークン化された単語について、前記トークン化された単語の重み因子および/または前記トークン化された単語のクリック率を含む、解析パラメータを獲得することであって、前記重み因子は、前記トークン化された単語が検索語句からであるか、カテゴリ情報からであるか、または製品属性からであるかに依存する、獲得することと、
    各トークン化された単語について、前記それぞれの解析パラメータに従って有意水準を決定することと、
    前記トークン化された単語の前記有意水準に従って、前記トークン化された単語を再順序付けすることと、を含む、方法。
  9. 広告を配信するための方法であって、
    検索過程で入力された元々の検索語句、前記検索過程で選択された製品カテゴリ選択肢、および検索される製品属性を含む、検索行動データを獲得することと、
    前記獲得した検索行動データから、前記元々の検索語句、前記製品カテゴリ選択肢、および前記製品属性を抽出することと、
    前記元々の検索語句、前記製品カテゴリ選択肢、および前記製品属性をマージすることによって、入札語句を自動的に構成することと、
    広告主から、前記入札語句に対する複数の入札価格および前記入札語句と関連付けられる複数の広告を受け取ることであって、各広告は、前記複数の入札価格のそれぞれ1つと関連付けられる、受け取ることと、
    前記関連付けられた入札語句に従って、前記複数の広告にインデックスを付け、前記それぞれの入札価格に従って、前記複数の広告をランク付けすることと、
    前記インデックスが付けられ、ランク付けされた複数の広告を広告データベースに追加することと、を含む、方法。
  10. 請求項9に記載の方法であって、
    検索語句を獲得することと、
    前記検索語句を前記入札語句と照合することと、
    前記それぞれの入札価格に従って選択される前記複数の広告のうちの少なくともいくつかを表示することと、をさらに含む、方法。
  11. 請求項10に記載の方法であって、
    前記検索語句は、少なくとも部分的に機械で構成され、前記検索語句を獲得することは、
    第2の検索過程で入力された第2の元々の検索語句、前記第2の検索過程で選択された第2の製品カテゴリ選択肢、および前記第2の検索過程で検索される第2の製品属性を含む、第2の検索行動データを獲得することと、
    前記獲得した第2の検索行動データから、前記第2の元々の検索語句、前記第2の製品カテゴリ選択肢、および前記第2の製品属性を抽出することと、
    前記第2の元々の検索語句、前記第2の製品カテゴリ選択肢、および前記第2の製品属性をマージすることによって、前記検索語句を自動的に構成することと、を含む、方法。
  12. 請求項10に記載の方法であって、
    前記方法はさらに、
    前記入札語句と関連付けられる前記広告の広告有効性データの統計を記録することであって、前記広告有効性データは、前記入札語句に従ってインデックスが付けられ、また、ウェブページ上の前記広告を閲覧するユーザのデータ、前記広告をクリックするユーザのデータ、および前記広告によって広告される製品またはサービスのトランザクションを完了するユーザのデータを含む、1つ以上のタイプのデータを有する、記録することと、
    前記入札語句に従ってインデックスが付けられた前記統計を前記広告主に提供することと、を含む、方法。
  13. 製品情報を検索するための方法であって、
    検索過程で入力された元々の検索語句、前記検索過程で選択された製品カテゴリ選択肢、および検索される製品属性を含む、検索行動データを獲得することと、
    前記獲得した検索行動データから、前記元々の検索語句、前記製品カテゴリ選択肢、および前記製品属性を抽出することと、
    前記元々の検索語句、前記製品カテゴリ選択肢、および前記製品属性をマージすることによって、推奨される検索語句を自動的に構成することと、
    前記推奨される検索語句を製品情報データベースに記憶された入札語句と照合することと、
    前記推奨される検索語句と一致する前記入札語句と関連付けられる前記複数の広告のうちの少なくともいくつかを表示することと、を含む、方法。
  14. 請求項13に記載の方法であって、
    前記推奨される検索語句を前記入札語句と照合することは、
    厳密な照合ルールに従って、前記推奨される検索語句を前記入札語句と照合することと、
    前記厳密な照合ルールに従った前記照合に失敗した場合に、ファジー照合ルールに従って、前記推奨される検索語句を前記入札語句と照合することと、を含む、方法。
  15. 請求項14に記載の方法であって、
    前記ファジー照合ルールは、前記元々の検索語句と前記入札語句の少なくとも一部との一致を必要とする、方法。
  16. 請求項13に記載の方法であって、
    前記推奨される検索語句を前記入札語句と照合することは、
    厳密な照合ルールに従って、前記推奨される検索語句を前記入札語句と照合することと、
    前記厳密な照合ルールに従った前記照合が失敗した場合に、新しい入札語句として、前記推奨される検索語句を前記製品情報データベースに加えることと、を含む、方法。
  17. 請求項13に記載の方法であって、
    前記入札語句は、以前の検索過程で入力された以前の元々の検索語句、前記以前の検索過程で選択された以前の製品カテゴリ選択肢、および前記以前の検索過程で検索される以前の製品属性を含む、以前の検索行動データの情報をマージすることによって、少なくとも部分的に機械で構成される、方法。
  18. 検索語句を構成するためのコンピュータに基づく装置であって、
    プロセッサ、コンピュータ読み出し可能なメモリおよび記憶媒体、ならびにI/Oデバイスを有するコンピュータを備え、前記コンピュータは、
    検索過程で入力された元々の検索語句、前記検索過程で選択された製品カテゴリ選択肢、および検索される製品属性を含む、検索行動データを獲得するように構成されるデータ獲得モジュール、
    前記獲得した検索行動データから、前記元々の検索語句、前記製品カテゴリ選択肢、および前記製品属性を抽出するように構成されるデータ抽出モジュール、および
    前記元々の検索語句、前記製品カテゴリ選択肢、および前記製品属性をマージすることによって、推奨される検索語句を自動的に構成するように構成される検索語句構成モジュールであって、前記推奨される検索語句は、前記元々の検索語句、前記製品カテゴリ選択肢、および前記製品属性の要素を包括する、検索語句構成モジュール、を含む機能モジュールを有するようにプログラムされる、コンピュータに基づく装置。
  19. 広告を配信するためのコンピュータに基づく装置であって、
    プロセッサ、コンピュータ読み出し可能なメモリおよび記憶媒体、ならびにI/Oデバイスを有するコンピュータを備え、前記コンピュータは、
    検索過程で入力された元々の検索語句、前記検索過程で選択された製品カテゴリ選択肢、および検索される製品属性を含む、検索行動データを獲得するように構成されるデータ獲得モジュール、
    前記獲得した検索行動データから、前記元々の検索語句、前記製品カテゴリ選択肢、および前記製品属性を抽出するように構成されるデータ抽出モジュール、
    前記元々の検索語句、前記製品カテゴリ選択肢、および前記製品属性をマージすることによって、入札語句を自動的に構成するように構成される語句構成モジュール、
    広告主から、前記入札語句に対する複数の入札価格および前記入札語句と関連付けられる複数の広告を受け取るように構成される広告情報受け取りモジュールであって、各広告は、前記複数の入札価格のそれぞれの1つと関連付けられる、広告情報受け取りモジュール、
    前記関連付けられた入札語句に従って、前記複数の広告にインデックスを付け、前記それぞれの入札価格に従って、前記複数の広告をランク付けするように構成されるランク付けモジュール、および
    前記インデックスが付けられ、ランク付けされた複数の広告を広告データベースに追加するように構成される製品情報配信モジュール、を含む機能モジュールを有するようにプログラムされる、コンピュータに基づく装置。
  20. 製品情報を検索するためのコンピュータに基づく装置であって、
    プロセッサ、コンピュータ読み出し可能なメモリおよび記憶媒体、ならびにI/Oデバイスを有するコンピュータを備え、前記コンピュータは、
    検索過程で入力された元々の検索語句、前記検索過程で選択された製品カテゴリ選択肢、および検索される製品属性を含む、検索行動データを獲得するように構成されるデータ獲得モジュール、
    前記獲得した検索行動データから、前記元々の検索語句、前記製品カテゴリ選択肢、および前記製品属性を抽出するように構成されるデータ抽出モジュール、および
    前記元々の検索語句、前記製品カテゴリ選択肢、および前記製品属性をマージすることによって、推奨される検索語句を自動的に構成するように構成される検索語句構成モジュール、および
    前記推奨される検索語句を製品情報データベースに記憶された入札語句と照合すること、および前記推奨される検索語句と一致する前記入札語句と関連付けられる前記複数の広告のうちの少なくともいくつかを表示することを可能にするように構成される照合モジュール、を含む機能モジュールを有するようにプログラムされる、コンピュータに基づく装置。
JP2015551860A 2013-01-09 2014-01-08 検索語句を構成し、広告を配信し、製品情報を検索するための方法および装置 Active JP6301958B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201310008041.0A CN103914492B (zh) 2013-01-09 2013-01-09 查询词融合方法、商品信息发布方法和搜索方法及系统
CN201310008041.0 2013-01-09
PCT/US2014/010695 WO2014110141A2 (en) 2013-01-09 2014-01-08 Method and apparatus for composing search phrases, distributing ads and searching product information

Publications (2)

Publication Number Publication Date
JP2016505993A true JP2016505993A (ja) 2016-02-25
JP6301958B2 JP6301958B2 (ja) 2018-03-28

Family

ID=50029262

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015551860A Active JP6301958B2 (ja) 2013-01-09 2014-01-08 検索語句を構成し、広告を配信し、製品情報を検索するための方法および装置

Country Status (6)

Country Link
US (2) US20140195348A1 (ja)
EP (1) EP2943921A2 (ja)
JP (1) JP6301958B2 (ja)
CN (1) CN103914492B (ja)
TW (1) TWI640878B (ja)
WO (1) WO2014110141A2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170055145A1 (en) * 2015-08-20 2017-02-23 Google Inc. Device-based filtering of content items associated with mobile applications
JP2020173493A (ja) * 2019-04-08 2020-10-22 株式会社Shirofune 情報処理装置、情報処理方法、情報処理プログラム
JP2021535457A (ja) * 2019-10-16 2021-12-16 クーパン コーポレイション 製品の推奨を提供するためのコンピュータ化されたシステムおよびコンピュータ化された方法

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9582537B1 (en) * 2014-08-21 2017-02-28 Google Inc. Structured search query generation and use in a computer network environment
JP6365195B2 (ja) * 2014-10-03 2018-08-01 富士通株式会社 命令履歴分析プログラム、命令履歴分析装置、および、命令履歴分析方法
US9690851B2 (en) * 2014-11-20 2017-06-27 Oracle International Corporation Automatic generation of contextual search string synonyms
CN105653562B (zh) * 2014-12-02 2019-03-15 阿里巴巴集团控股有限公司 一种文本内容与查询请求之间相关性的计算方法及装置
CN104484431B (zh) * 2014-12-19 2017-07-21 合肥工业大学 一种基于领域本体的多源个性化新闻网页推荐方法
CN104731926B (zh) * 2015-03-27 2018-03-09 百度在线网络技术(北京)有限公司 推荐词的展现方法和装置
CN106294456B (zh) * 2015-05-29 2019-11-12 华为技术有限公司 机器学习的方法和设备
CN105069086B (zh) * 2015-07-31 2017-07-11 焦点科技股份有限公司 一种优化电子商务商品搜索的方法及系统
CN105069168A (zh) * 2015-08-28 2015-11-18 百度在线网络技术(北京)有限公司 搜索词推荐方法和装置
CN105138690B (zh) * 2015-09-18 2018-11-06 北京博雅立方科技有限公司 确定关键词的方法和装置
CN105447158A (zh) * 2015-12-02 2016-03-30 北京信息科技大学 一种基于图的专利搜索日志中同义词集自动挖掘方法
CN105426535A (zh) * 2015-12-18 2016-03-23 北京奇虎科技有限公司 基于搜索提示的搜索方法及装置
US10580064B2 (en) 2015-12-31 2020-03-03 Ebay Inc. User interface for identifying top attributes
CN105808685B (zh) * 2016-03-02 2021-09-28 腾讯科技(深圳)有限公司 推广信息的推送方法及装置
EP3465537A2 (en) * 2016-05-25 2019-04-10 Metail Limited Method and system for predicting garment attributes using deep learning
CN106446027A (zh) * 2016-08-30 2017-02-22 五八同城信息技术有限公司 信息推荐方法及装置
CN107818487B (zh) * 2016-09-12 2022-03-04 阿里巴巴集团控股有限公司 一种产品信息处理方法、装置、设备及客户端
CN107862532B (zh) * 2016-09-22 2021-11-26 腾讯科技(深圳)有限公司 一种用户特征提取方法及相关装置
CN106528631A (zh) * 2016-10-10 2017-03-22 中国银行股份有限公司 一种银行汇入款电文受益方信息的处理方法及装置
CN108536664A (zh) * 2017-03-01 2018-09-14 华东师范大学 商品领域的知识融合方法
CN107291835B (zh) * 2017-05-31 2020-12-22 北京京东尚科信息技术有限公司 一种搜索词的推荐方法和装置
US10943286B1 (en) * 2017-06-06 2021-03-09 Amazon Technologies, Inc. Determining product attribute sequences using quantitative values
CN107463600B (zh) * 2017-06-12 2020-12-29 百度在线网络技术(北京)有限公司 广告投放关键词推荐方法及装置、广告投放方法及装置
CN109213921A (zh) * 2017-06-29 2019-01-15 广州涌智信息科技有限公司 一种商品信息的搜索方法及装置
CN109325182B (zh) * 2018-10-12 2024-05-14 平安科技(深圳)有限公司 基于会话的信息推送方法、装置、计算机设备及存储介质
CN109919651A (zh) * 2019-01-17 2019-06-21 阿里巴巴集团控股有限公司 对象的推送方法及装置
JP7211901B2 (ja) * 2019-06-07 2023-01-24 株式会社日立製作所 情報処理装置および情報処理方法
CN110347920A (zh) * 2019-07-02 2019-10-18 北京纵横无双科技有限公司 一种健康信息的检索匹配方法及装置
CN111400339B (zh) * 2020-03-04 2023-04-07 广州大学 产品数据库标识反向解析的检索方法及系统
CN113297452A (zh) * 2020-05-26 2021-08-24 阿里巴巴集团控股有限公司 多级检索方法、多级检索装置及电子设备
CN111651477B (zh) * 2020-05-27 2022-05-17 福建博思软件股份有限公司 基于语义相似度的多源异构商品一致性判别方法和装置
BR112022023901A2 (pt) * 2020-05-28 2022-12-27 Jfe Steel Corp Sistema de busca de informações
CN111784456A (zh) * 2020-06-30 2020-10-16 广东奥园奥买家电子商务有限公司 一种电商商家的信誉评价方法和装置以及计算机设备
CN112115704B (zh) * 2020-09-11 2024-06-04 深圳市菲尔兹数据分析师事务所有限公司 基于电商平台的产品查询方法、装置和计算机设备
US11210596B1 (en) 2020-11-06 2021-12-28 issuerPixel Inc. a Nevada C. Corp Self-building hierarchically indexed multimedia database
CN112966177B (zh) * 2021-03-05 2022-07-26 北京百度网讯科技有限公司 咨询意图的识别方法、装置、设备以及存储介质
CN112966178B (zh) * 2021-03-05 2024-01-23 北京百度网讯科技有限公司 咨询结果的分发方法、装置、设备以及存储介质
CN113240487A (zh) * 2021-05-11 2021-08-10 北京沃东天骏信息技术有限公司 流量调控方法和装置
CN113570428B (zh) * 2021-07-23 2024-02-02 上海普洛斯普新数字科技有限公司 一种用于线上商品一致性筛选的系统
CN113538062B (zh) * 2021-07-28 2024-05-07 福州果集信息科技有限公司 一种反推商品推广笔记所购买竞价词的方法
CN114610971A (zh) * 2022-03-11 2022-06-10 北京百度网讯科技有限公司 搜索关键词的生成方法、装置及电子设备
CN114723073B (zh) * 2022-06-07 2023-09-05 阿里健康科技(杭州)有限公司 语言模型预训练、产品搜索方法、装置以及计算机设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0973455A (ja) * 1995-09-01 1997-03-18 Toshiba Corp 文書検索装置及び文書検索方法
JP2003016085A (ja) * 2001-06-29 2003-01-17 Nippon Telegraph & Telephone West Corp コンテンツ検索システム、コンテンツ検索方法、コンテンツ検索プログラムおよび記録媒体
US20060282328A1 (en) * 2005-06-13 2006-12-14 Gather Inc. Computer method and apparatus for targeting advertising
WO2010061538A1 (ja) * 2008-11-28 2010-06-03 日本電気株式会社 情報検索装置、情報検索方法、及び記録媒体
JP2011014032A (ja) * 2009-07-03 2011-01-20 Fujitsu Ltd 携帯端末装置、情報検索方法および情報検索プログラム
US20120323953A1 (en) * 2005-07-22 2012-12-20 Ortega Ruben E Predictive selection of item attributes likely to be useful in refining a search

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5590325A (en) * 1991-06-11 1996-12-31 Logical Information Machines, Inc. System for forming queries to a commodities trading database using analog indicators
US20050222987A1 (en) * 2004-04-02 2005-10-06 Vadon Eric R Automated detection of associations between search criteria and item categories based on collective analysis of user activity data
US20060282430A1 (en) * 2005-06-10 2006-12-14 Diamond David L Fuzzy matching of text at an expected location
US8255383B2 (en) * 2006-07-14 2012-08-28 Chacha Search, Inc Method and system for qualifying keywords in query strings
CN101145153B (zh) * 2006-09-13 2011-03-30 阿里巴巴集团控股有限公司 一种搜索信息的方法及系统
CN101436186B (zh) * 2007-11-12 2012-09-05 北京搜狗科技发展有限公司 一种提供相关搜索的方法及系统
US7983963B2 (en) * 2007-12-28 2011-07-19 Overstock.Com, Inc. System, program product, and method of electronic communication network guided navigation
US20090248627A1 (en) * 2008-03-27 2009-10-01 Yahoo! Inc. System and method for query substitution for sponsored search
US20090254512A1 (en) * 2008-04-03 2009-10-08 Yahoo! Inc. Ad matching by augmenting a search query with knowledge obtained through search engine results
US8606627B2 (en) * 2008-06-12 2013-12-10 Microsoft Corporation Sponsored search data structure
US20100076979A1 (en) * 2008-09-05 2010-03-25 Xuejun Wang Performing search query dimensional analysis on heterogeneous structured data based on relative density
US8676827B2 (en) * 2009-02-04 2014-03-18 Yahoo! Inc. Rare query expansion by web feature matching
CN101515360A (zh) * 2009-04-13 2009-08-26 阿里巴巴集团控股有限公司 向用户推荐网络目标信息的方法和服务器
TWI446191B (zh) * 2009-07-06 2014-07-21 Alibaba Group Holding Ltd Word matching and information query method and device
TW201118603A (en) * 2009-11-30 2011-06-01 Yu-Chieh Wu A computer system of template-based term entity-relation mining algorithm
TWI471739B (zh) * 2010-01-07 2015-02-01 Alibaba Group Holding Ltd A method for identifying a synonym, a device, and a method and apparatus for searching it
US20110238486A1 (en) * 2010-03-29 2011-09-29 Weiguo Liu Optimizing Sponsored Search Ad Placement for Online Advertising
US8650186B2 (en) * 2010-07-30 2014-02-11 Accenture Global Services Limited Systems and methods for analyzing requirements
CN102486781A (zh) * 2010-12-03 2012-06-06 阿里巴巴集团控股有限公司 一种搜索排序方法和装置
CN102542474B (zh) * 2010-12-07 2015-10-21 阿里巴巴集团控股有限公司 查询结果排序方法及装置
CN103314371B (zh) * 2010-12-31 2017-12-15 肖岩 一种检索的方法和系统
US9171088B2 (en) * 2011-04-06 2015-10-27 Google Inc. Mining for product classification structures for internet-based product searching
CN102799591B (zh) * 2011-05-26 2015-03-04 阿里巴巴集团控股有限公司 一种提供推荐词的方法及装置
CN102609433B (zh) * 2011-12-16 2013-11-20 北京大学 基于用户日志进行查询推荐的方法及系统
US20140058833A1 (en) * 2012-08-22 2014-02-27 Myworld, Inc. Commerce System and Method of Controlling the Commerce System Using Bidding and Value Based Messaging

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0973455A (ja) * 1995-09-01 1997-03-18 Toshiba Corp 文書検索装置及び文書検索方法
JP2003016085A (ja) * 2001-06-29 2003-01-17 Nippon Telegraph & Telephone West Corp コンテンツ検索システム、コンテンツ検索方法、コンテンツ検索プログラムおよび記録媒体
US20060282328A1 (en) * 2005-06-13 2006-12-14 Gather Inc. Computer method and apparatus for targeting advertising
US20120323953A1 (en) * 2005-07-22 2012-12-20 Ortega Ruben E Predictive selection of item attributes likely to be useful in refining a search
WO2010061538A1 (ja) * 2008-11-28 2010-06-03 日本電気株式会社 情報検索装置、情報検索方法、及び記録媒体
JP2011014032A (ja) * 2009-07-03 2011-01-20 Fujitsu Ltd 携帯端末装置、情報検索方法および情報検索プログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170055145A1 (en) * 2015-08-20 2017-02-23 Google Inc. Device-based filtering of content items associated with mobile applications
JP2018519566A (ja) * 2015-08-20 2018-07-19 グーグル エルエルシー モバイル・アプリケーションに関連付けられたコンテンツ・アイテムのデバイスベースのフィルタリング
JP2020173493A (ja) * 2019-04-08 2020-10-22 株式会社Shirofune 情報処理装置、情報処理方法、情報処理プログラム
JP7227606B2 (ja) 2019-04-08 2023-02-22 株式会社Shirofune 情報処理装置、情報処理方法、情報処理プログラム
JP2021535457A (ja) * 2019-10-16 2021-12-16 クーパン コーポレイション 製品の推奨を提供するためのコンピュータ化されたシステムおよびコンピュータ化された方法

Also Published As

Publication number Publication date
WO2014110141A2 (en) 2014-07-17
TWI640878B (zh) 2018-11-11
US20140195348A1 (en) 2014-07-10
EP2943921A2 (en) 2015-11-18
CN103914492B (zh) 2018-02-27
TW201428513A (zh) 2014-07-16
CN103914492A (zh) 2014-07-09
JP6301958B2 (ja) 2018-03-28
WO2014110141A3 (en) 2014-10-23
US20180165712A1 (en) 2018-06-14

Similar Documents

Publication Publication Date Title
JP6301958B2 (ja) 検索語句を構成し、広告を配信し、製品情報を検索するための方法および装置
US9171088B2 (en) Mining for product classification structures for internet-based product searching
CN105765573B (zh) 网站通信量优化方面的改进
JP5449628B2 (ja) マルチステージを使用したカテゴリ情報の決定
JP6022056B2 (ja) 検索結果の生成
JP5693746B2 (ja) 製品情報のランク付け
US8725717B2 (en) System and method for identifying topics for short text communications
US8631003B2 (en) Query identification and association
US8700621B1 (en) Generating query suggestions from user generated content
JP2016503914A (ja) 商品評価の分析
US9727906B1 (en) Generating item clusters based on aggregated search history data
CN104217031B (zh) 一种根据服务器搜索日志数据进行用户分类的方法和装置
WO2015135110A1 (en) Systems and methods for keyword suggestion
JP5577385B2 (ja) コンテンツ配信装置
US20150046290A1 (en) Method for determining relevant search results
CN108229990B (zh) 一种广告标题生成方法、装置和设备
US20120072281A1 (en) Method and system to monetize domain queries in sponsored search
CN105608183A (zh) 一种提供聚合类型回答的方法和装置
US20140344114A1 (en) Methods and systems for segmenting queries
US9646094B2 (en) System and method for performing a multiple pass search
EP2778980A1 (en) Attribute-based document searching
US20160019588A1 (en) System and Method for Displaying Search Results

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171024

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171027

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180112

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180130

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180301

R150 Certificate of patent or registration of utility model

Ref document number: 6301958

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250