JP5916959B2 - 動的データ取得方法およびシステム - Google Patents

動的データ取得方法およびシステム Download PDF

Info

Publication number
JP5916959B2
JP5916959B2 JP2015532016A JP2015532016A JP5916959B2 JP 5916959 B2 JP5916959 B2 JP 5916959B2 JP 2015532016 A JP2015532016 A JP 2015532016A JP 2015532016 A JP2015532016 A JP 2015532016A JP 5916959 B2 JP5916959 B2 JP 5916959B2
Authority
JP
Japan
Prior art keywords
threshold
search term
score
search
characteristic factor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015532016A
Other languages
English (en)
Other versions
JP2015528611A (ja
Inventor
ジャーン・リンフオン
ホワーン・プォン
ワーン・シイプゥ
ジュヨン・ウエンビン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Publication of JP2015528611A publication Critical patent/JP2015528611A/ja
Application granted granted Critical
Publication of JP5916959B2 publication Critical patent/JP5916959B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

[他の出願の相互参照]
本出願は、すべての目的のために参照により本明細書に組み込まれる、発明の名称を「DYNAMIC ACQUISITION METHOD,DEVICE AND SYSTEM FOR DATA(データの動的取得方法、装置およびシステム)」とする、2012年9月13日に出願された中華人民共和国特許出願第201210339669.4号に基づく優先権を主張する。
本出願は、動的データ取得方法およびシステムに関するものである。
従来、関連製品を表示するためのプロモーションプラットフォームの実施において、ユーザは、まず入札管理サーバシステムで検索語によって入札処理を行う。ウェブサイトのフロントエンド検索ページで検索語が入力されると、その検索語に関連した製品データの情報が表示される。検索語と、検索語に対応するいくつかの製品データ情報には、それぞれ固定閾値が設定される。表示される結果は静的である。
具体的な実施プロセスでは、売り手ユーザは、最初に、入札管理サーバシステムにおいて、キーワードと、キーワードに対応するプロモーション製品を選択する。続いて、アルゴリズムモジュールによって、キーワードと製品データ情報との相関度が計算されて、相関閾値スコアが取得される。この算出された相関閾値スコアは、データベースに保存される。エンジンサーバは、データベースから相関閾値スコアをダウンロードして、インデックスデータベースを構築する。フロントエンド・クライアントのユーザが検索語を用いて検索を行うと、それらの検索語に対応する製品データ情報の閾値スコアがインデックスデータベースから取得されて、それぞれの閾値スコアは、既定の静的閾値と比較される。静的閾値スコアよりも大きい閾値スコアを有する製品データ情報が、表示用に選択される。このフィルタリング方法では、すべての検索語を一律基準に従って扱うので、多くの場合に、このフィルタリング方法は、あまりにも単純で静的である。キーワードと製品データ情報との相関閾値スコアが動的な変化を受ける場合、このフィルタリング方法では、より柔軟かつ正確な検索結果を得られないことが多い。
上記の製品データ情報のための方法では、検索語によって表示される製品データ情報は、多くの場合、質が低く、検索語との相関が一般に低いものである。さらには、表示されるプロモーション製品と検索語との相関は、ナチュラル検索の結果よりも劣る場合がある。ウェブサイトでの製品検索は、2つの検索エンジン(製品検索エンジンと広告検索エンジン)への要求を伴う。ナチュラル検索とは、製品検索エンジンからの結果を指すが、ナチュラル検索で見つかる製品の前に、広告検索エンジンの検索結果が表示されるので、これが、ユーザエクスペリエンスおよびクリック率に影響を与える。
本発明の種々の実施形態について、以下の詳細な説明および添付の図面において開示する。
動的データ取得システムの一実施形態の構成図である。
図1の動的データ取得システムの実施形態の詳細な構成図である。
第1の閾値計算サーバの一実施形態の構成図である。
動的データ取得方法の一実施形態のフローチャートである。
動的閾値スコア・ルックアップ方法の一実施形態のフローチャートである。
動的閾値スコア計算方法の一実施形態のフローチャートである。
動的閾値スコア取得方法の一実施形態のフローチャートである。
入札管理プロセスの一実施形態のビジネスサービス・フローチャートである。
動的データ取得システムの一実施形態の構成図である。
本発明は、数多くの方法で実施することが可能であり、それには、プロセス、装置、システム、組成物、コンピュータ可読記憶媒体上で実現されるコンピュータプログラム・プロダクトとしての実施、および/または、プロセッサに結合されたメモリに記憶された命令および/もしくはそれにより提供される命令を実行するように構成されたプロセッサなど、プロセッサとしての実施が含まれる。本明細書では、このような実施の形態、または本発明が取り得るその他の形態を、技術と呼ぶ場合がある。一般的に、開示されるプロセスのステップの順序は、本発明の範囲内で変更することができる。特に明記しない限り、タスクを実行するように構成されたものとして記載されるプロセッサまたはメモリなどのコンポーネントは、所与の時間に一時的にそのタスクを実行するように構成された汎用コンポーネント、またはそのタスクを実行するように作製された専用コンポーネントとして実現することができる。本明細書で使用される場合の「プロセッサ」という用語は、コンピュータプログラム命令などのデータを処理するように構成された1つまたは複数のデバイス、回路、および/または処理コアを指す。
図1は、動的データ取得システムの一実施形態の構成図である。図2Aは、図1の動的データ取得システムの実施形態の詳細な構成図である。
図1を参照して、動的データ取得システム100は、クライアント110と、検索エンジンサーバ130と、を含む。
クライアント110は、検索要求文字列を送信する。クライアント110と接続を確立した検索エンジンサーバ130が、検索要求文字列を受信して、検索要求文字列から検索語を読み取る。検索エンジンサーバ130は、それらの検索語を閾値辞書でルックアップすることで、検索語に対応する動的閾値スコアを取得して、検索語をクエリ条件とみなし、検索語に対応する動的閾値スコアを、インデックスデータテーブルのフィルタリングのためのフィルタ条件とみなす。一部の実施形態では、インデックスデータテーブルがフィルタ条件に基づいてフィルタリングされることで、検索語がインデックスデータテーブル内のキーワードと同じで、かつそれらのキーワードの閾値スコアが検索語の動的閾値スコア以上の大きさである場合に、1つ以上の対応するインデックス情報が取得される。動的閾値スコアとは、フィルタリングのために、異なるクエリに異なる閾値スコアが用いられることを意味する。すなわち、フィルタリングのために、すべてのクエリに同じ閾値スコアが割り当てられるのではなく、クエリに閾値スコアが動的に割り当てられる。一部の実施形態では、動的閾値スコアは特性因子に基づいて変化し、そして、検索エンジンサーバ130は、インデックス情報に基づいて、検索語に対応するデータ情報を取得して、そのデータ情報を、表示のためにウェブサイトのフロントエンドページに返送する。一部の実施形態では、閾値辞書は、検索語と、各検索語に対応する動的閾値スコアとを含み、インデックスデータテーブルは、キーワードと、それらのキーワードと各データ情報との間の閾値スコアと、を含み、また、特性因子には、テキスト特性因子およびデータ解析特性因子が含まれる。一部の実施形態では、閾値辞書は、クエリ、製品特性、クリック・フィードバックに基づいて計算されて、オンライン検索用のスコアを提供し、そして閾値辞書は、リアルタイムで調整される。各キーワードは、閾値辞書内にスコアを有する。テキスト特性因子およびデータ解析特性因子は、上述のようにリアルタイムで変化するので、動的閾値スコアも、特性因子の変化に基づいてリアルタイムで変化する。上記のキーワードは、インデックスデータテーブルの索引語に相当する。すなわち、キーワードは、インデックスデータテーブル内のインデックス情報に対応している。
一例として、q=mp3プレーヤ&スコア=1000〜最大整数というクエリを用いる。検索語が読み取られて、検索エンジンに送られる。1000というスコアによって、1000以下である結果は除外される。ユーザがMP3プレーヤを検索し、1000というスコアは、動的閾値辞書から得られる。検索エンジンが検索語を受け取ると、検索エンジンは、インデックス情報から、mp3プレーヤに完全に(mp3とプレーヤの両方が)マッチする製品を見つけ出し、見つけた製品を、それらの製品の閾値スコアに基づいてフィルタリングして、1000以上の大きさのスコアを有するすべての製品を返す。
検索エンジンサーバ130は、閾値辞書で検索語を用いて得られた動的閾値スコアを、インデックスデータテーブルのフィルタリングのためのフィルタ条件とみなす。閾値辞書に保存されている動的閾値スコアは、特性因子のリアルタイム更新に基づいて動的に変化するので、現在の検索語に対応して取得されるデータ情報は、比較される動的閾値スコアの変化によって動的に更新される。ウェブサイトのフロントエンド・ウェブページに最終的に表示される結果も、更新されることになる。従来、検索エンジンで実現される製品データのプロモーション方法は、適応性がなく、制限されたものであり、その結果、対応性のない検索結果が得られる。これに代えて、システム100では、製品データ情報のリアルタイムな動的プロモーションを実現することができる。
一例では、上記インデックスデータテーブル内のデータ情報は、構造化データ情報である。構造化データとは、ウェブサイトに保存される製品情報が構造化されていることを意味する。すなわち、データはすべて、データベースに、例えば、名称、概要、企業名、価格、製品特性がすべて構造化されて、個々のフィールドとして保存され、検索エンジンは、検索目的で、それらのフィールドのインデックスを構築する。いくつかの実施形態において、インデックスデータテーブル内のデータ情報には、製品名称、製品属性、製品企業情報、製品と対応する入札フレーズ、製品と対応する価格、製品と入札フレーズとの相関スコア、またはそれらの任意の組み合わせ、が含まれる。一部の実施形態では、インデックスデータテーブルの具体的なフォーマットは、検索エンジン構造に類似している。検索エンジン構造に類似しているということは、その構造化データによって、検索エンジン用のインデックス作成が容易となることを示唆している。検索エンジンは、フィールドをインデックスとして用いることで、検索を実行して、対応する製品を返す。いくつかの実施形態において、インデックスデータテーブルの構造は、転置インデックスまたは通常インデックスの構造形式に相当する。
特性因子には、テキスト特性因子、データ解析特性因子、またはそれらの組み合わせが含まれる。いくつかの実施形態において、テキスト特性因子には、検索語と製品自体のテキスト情報マッチングパラメータが含まれ、データ解析特性因子には、検索語のクリック率、対応する各製品のクリック率、検索語自体の人気度、ユーザのプロモーション製品エリア情報、検索語にバインドされた製品数(ユーザ数)、その他の因子、またはそれらの任意の組み合わせが含まれる。その他の因子には、買い手およびウェブサイトのプロモーションデータの情報マイニング、ウェブサイト製品の履歴クリック率(CTR)情報、売り手の競争度、プロモーション製品のフレーズ相関とナチュラル検索結果との比較、またはそれらの任意の組み合わせが含まれる。例えば、検索語のクリック率およびエリア情報は、実際の状況に応じて変化する。従って、データ解析特性因子は動的に変化し、動的閾値スコアは、動的に変化するデータ解析特性因子に基づいてリアルタイムで更新される。
一部の実施形態では、動的閾値スコアは、処理サーバにおける閾値サービスによって計算される。すなわち、閾値サービスは、検索語と、ログ辞書に既に記録された特性因子とを用いて、動的閾値スコアを得るための閾値計算を実行する。さらに、閾値サービスは、すべての検索語と、検索語に対応する動的閾値スコアとを、フィルタリングのためのフィルタ条件として、閾値辞書に保存する。クライアントによって送信された検索要求を、検索エンジンサーバ130が受信すると、検索エンジンサーバ130は、今回の検索語に対応する製品データ情報を取得する。ログ辞書に記録される特性因子は、履歴状況に応じてリアルタイムで変化し得るデータ解析特性因子を含むので、算出される動的閾値スコアも、リアルタイムで変化する。結果的に、フィルタ条件は、特性因子の変化に基づいて調整される。従来、検索エンジンで実現される製品データのプロモーション方法は、適応性がなく、制限されたものであり、その結果、柔軟性のない検索結果が得られる。一方、本出願では、製品データ情報の動的プロモーションが実現され、柔軟なプロモーションデータ情報結果が得られる。さらに、データ解析特性因子に、クリック率、および検索語の質を具現化する他の因子を含むことによって、検索結果の精度が向上する。
一部の実施形態では、クライアント110は、検索要求文字列を検索エンジンサーバ130に送信する。検索要求文字列は、複数の条件のセットを含む。検索エンジンサーバ130は、検索要求文字列を解析して、既に計算された動的閾値スコアを閾値辞書140から呼び出し、得られた動的閾値スコアを、インデックスデータテーブル内のキーワードのフィルタリングのためのフィルタ条件として用いる。その後、検索エンジンサーバ130は、検索結果データを返送し、クライアント110のブラウザアプリケーションまたはSearchwebに検索結果を表示させる。Searchwebは、クライアントに返されて表示されるデータを参照する。
一部の実施形態では、システム100は、入札管理サーバ150と、ログサーバ170と、第1の閾値計算サーバ190と、を備える。
入札管理サーバ150は、テキスト特性因子を提供する。
ログサーバ170は、データ解析特性因子、テキスト特性因子、またはそれらの組み合わせを提供するために、ログ辞書を保存している。
第1の閾値計算サーバ190は、個々の検索語のテキスト特性因子およびデータ解析特性因子をログ辞書から取得し、取得したテキスト特性因子および取得したデータ解析特性因子に基づいて、閾値計算を実行することで、各検索語の動的閾値スコアを得る。続いて、第1の閾値計算サーバ190は、各検索語と、各検索語に対応した動的閾値スコアを、データ辞書形式で、閾値辞書に保存する。
テキスト特性因子は、検索語とデータ情報のマッチング特性重みを含み、データ解析特性因子は、検索語に対応する解析パラメータ特性重みである。
一部の実施形態では、図2Aに示すように、第1の閾値計算サーバ190は、検索語、および検索語に対応したデータ情報(テキスト特性因子を含む)を、入札管理サーバ150から抽出し、また、ウェブサイトの検索要求完了後のログ情報を、ログサーバ170のログ辞書から取得する。いくつかの実施形態において、ログ情報は、データ解析データベース175から取得されるデータ解析特性因子、テキスト特性因子、またはそれらの組み合わせで構成される。第1の閾値計算サーバ190が、検索語と、すべてのテキスト特性因子およびデータ解析特性因子を取得したら、第1の閾値計算サーバ190は、各検索語の動的閾値スコアを算出する。
例えば、第1の閾値計算サーバ190は、クエリの各検索語とユーザのプロモーション製品との相関閾値を計算する。同時に、第1の閾値計算サーバ190は、検索語とウェブサイトのナチュラル検索結果の最初の20製品との相関閾値を計算する。いくつかの実施形態において、ナチュラル検索結果とは、製品検索エンジンまたは非広告検索エンジンからの結果を指す。計算プロセスでは、検索語と製品とのテキスト特性因子を考慮して、動的閾値スコアを計算することに加えて、さらに、製品の履歴クリック率(CTR)、検索語自体の人気度、プロモーション製品エリア情報、検索語にバインドされた製品数(ユーザ数)、その他の商業的因子、またはそれらの任意の組み合わせを考慮して、第2の閾値スコアを計算し、最終的に、第1の閾値スコアおよび第2の閾値スコアに基づいて、検索語に対応した動的閾値スコアを得る。テキスト特性因子は、名称、概要などを含む製品説明に関連している。テキスト特性因子は、ワードと製品情報がテキストでマッチしている程度に関連している。例えば、ユーザがmp3を検索する場合、mp3検索に関連してユーザが購入する製品の製品説明は、mp3に関係していなければならず(例えば、製品名称にmp3を含む)、そうでなければ、相関が良好ではないとみなされる。いくつかの実施形態において、他の商業的因子として、検索語自体の人気度、ユーザのリコメンデーション、製品ロケーション情報、検索語にバインドされた製品数/ユーザ数、などが含まれる。第1の閾値計算サーバ190は、さらに、検索語および検索語の閾値スコアのすべてを閾値辞書140に保存する。一部の実施形態では、売り手ユーザは、入札管理サーバ150を介して、テキスト特性因子を閾値処理システム100に供給する。テキスト特性因子は、検索語とデータ情報との相関閾値スコアを算出するために用いられる。
例えば、買い手が、フロントエンド・クライアントのブラウザアプリケーションを使用して、検索語を入力することで、売り手データ情報のオンライン要求を行う。例えば、買い手は、「MP3」というワードで検索する。ブラウザアプリケーションは、検索語「MP3」を含む検索要求文字列を生成して、検索エンジンサーバ130にアクセスする。検索エンジンサーバ130が検索要求文字列を得ると、検索エンジンサーバ130は、アルゴリズムのインタフェース関数を呼び出し、これにより、動的閾値スコアおよび動的広告位置数nを取得する。そして、このスコアを用いて、フィルタ条件をリライトする。例えば、「product?q=MP3&filter=bidword.mlrScore:9399999〜2147483647&n=4」の場合、「product?q」は、データ情報(例えば、製品情報)に関し、「MP3」は、検索語に関し、「filter」は、フィルタ条件に関し、「bidword.mlrScore」は、動的閾値スコアに関し、「n」は、広告位置数に関する。一部の実施形態では、検索エンジンサーバ130は、内部で、バインドされているウェブサイト上の製品とキーワードとの間の相関スコア(mlrScore)をデータベース(DB)から読み取り、それらのmlrScoreについて特定のインデックスを構築する。いくつかの実施形態において、検索エンジンサーバ130は、そのような要求文字列を解析して、フィルタ条件を満たすデータ情報を返送する。
図2Bは、第1の閾値計算サーバの一実施形態の構成図である。一部の実施形態において、第1の閾値計算サーバ190は、第1の計算モジュール193と、第2の計算モジュール196と、処理モジュール199と、を有する。
第1の計算モジュール193は、検索語の第1の閾値スコアScore0を取得するためのフィッティング計算を実行するために、線形回帰モデルScore0=F0(f1,f2,...,fi)を採用する。fiは、この検索語に対応するテキスト特性因子に相当し、iは、N以下の大きさの整数に相当し、Nは自然数である。
第2の計算モジュール196は、検索語の第2の閾値スコアScore1を取得するためのフィッティング計算を実行するために、線形回帰モデルScore1=F1(f’1,...,f’k)を採用する。f’kは、この検索語に対応するデータ解析特性因子に相当し、kは、M以下の大きさの整数に相当し、Mは自然数である。
処理モジュール199は、線形回帰モデルScore=F(score0,score1)×p1×p2に基づいて、検索語の動的閾値スコアを取得するためのフィッティング計算を実行する。一部の実施形態では、p1は、第1の閾値スコアの占有率に相当し、p2は、第2の閾値スコアの占有率に相当する。
いくつかの実施形態において、検索語と製品とに対応するテキスト相関の計算は、以下の因子に基づいている。f1は、製品説明における同じワードの表題の長さに対する検索語の比に相当し、f2は、検索語を含む表題に対する検索語の比に相当し、f3は、検索語を含むキーワードに対する検索語の比に相当し、f4は、製品説明における表題に対する検索語の文字マッチ率に相当し、f5は、製品説明におけるキーワード文字列に対する検索語の文字マッチ率に相当する。一部の実施形態では、f4およびf5として、クエリの検索語とデータ情報との文字のマッチが考慮されるだけではなく、文字列としてのマッチも考慮される。すなわち、f4を、検索語と製品説明の表題との順序マッチ率とし、f5を、検索語と製品説明のキーワードとの順序マッチ率として、f4およびf5で、検索語と製品情報との文字のマッチを考慮するだけではなく、文字順序のマッチを考慮する。文字列が完全にマッチし、文字列全体が同じである場合には、最終的なスコアは最も高いスコアとなり、そうでなければ、最終的なスコアは、スコア0となる。これらの特性のフィッティングのために、つまり、特性値の重みを決定するために、線形回帰モデルが採用される。相関スコアScore0=F0(f1,...,f5)において、f1,f2,...,f5は、これら5つの因子に基づいている。F0は、線形回帰モデルによって学習させたモデル関数に相当する。上記の特性のフィッティング後に得られるスコア(Score0)は、相関スコアに相当する。
検索語の履歴状況に対応する閾値スコアが、Score1=F1(f’1,...,f’k)に相当すると仮定すると、キーワードの履歴状況スコアは、学習および予測における相関スコアと類似している。この関数Score=F(score0,score1)×p1×p2は、テキスト特性因子に対応するテキスト相関スコアと、データ解析特性因子に対応するキーワードの履歴状況スコアを、共に適合させる。このスコアが、語句と製品との最終的なスコア閾値である。このスコアは、製品のテキストマッチスコアと商業的規則スコアを反映している。Fは、同様に、線形回帰モジュールを指す。
本例では、システム100は、さらに、第2の閾値計算サーバ160を備えている。
第2の閾値計算サーバ160は、検索要求文字列を受け取ると、キーワードと、検索語にバインドされた各データ情報のテキスト特性因子とを、入札管理サーバ150またはログ辞書から取得する。インデックスデータテーブルにおいて、キーワードと検索語が同じであり、かつそれらのキーワードの閾値スコアが、検索語の動的閾値スコア以上の大きさである場合に、第2の閾値計算サーバ160は、テキスト特性因子に基づいて閾値計算を実行することで、各検索語に対応する1つ以上の閾値スコアを取得し、その後、各キーワード、および各キーワードに対応する閾値スコアを、閾値データベース120に保存する。一部の実施形態では、第2の閾値計算サーバ160によって実現される機能は、入札管理サーバ150に組み込まれる。すなわち、入札管理サーバ150が、テキスト特性因子に基づいて閾値計算を実行することで、各キーワードの閾値を取得する。
一部の実施形態では、キーワードとデータ情報との間のバインド関係は、バックグラウンドで予め設定される。例えば、いくつかの異なる製品とのバインド関係が、同じキーワードに設定される。それぞれのバインド関係のキーワードとデータ情報とのテキスト特性因子は、閾値計算のために、入札管理サーバ150に送られる。キーワードと、各キーワードに関連した各製品との間の閾値スコアが取得される。取得された閾値スコアはすべて、閾値データベース120に保存される。検索エンジンサーバ130が検索動作を開始する前に、検索エンジンサーバ130は、閾値データベース120内の閾値スコアに基づいて、インデックステーブルを作成する。一部の実施形態では、検索の前段階として、クライアント110から検索エンジンサーバ130に検索要求が送信されると、検索エンジンサーバ130は、閾値辞書140において検索語に対応する計算済みの動的閾値スコアを、インデックステーブルのインデックスのフィルタリングのためのフィルタ条件とみなし、閾値スコアが動的閾値スコア以上の大きさであるかどうかに基づいて、検索語に対応する情報を取得する。すなわち、動的閾値スコアを超える閾値スコアに対応するデータ情報のみが、検索語のフィルタ条件に適合するデータ情報である。
一部の実施形態において、図2Aの第2の閾値計算サーバ160は、第3の計算モジュール163を有する。
第3の計算モジュール163は、線形回帰モデルScore’=F’(f1,f2,...,fj)を採用して、フィッティング計算を実行することで、キーワードの閾値スコアを取得する。fjは、キーワードに対応したテキスト特性因子に相当し、jは、J以下の大きさの整数に相当し、Jは自然数である。
一部の実施形態では、検索エンジンサーバ130が検索語を受信すると、検索エンジンサーバ130は、閾値を算出するために、動的データベースインタフェースプログラムを呼び出す。さらに、検索語に対応する動的閾値スコアが、閾値辞書から取得される。そして、検索エンジンサーバ130は、受信した検索語に対応する動的閾値スコアを返される。動的閾値スコアは、現在、ウェブサイトページの異なる領域を識別するために使用される様々なPID(ページID)への自己適応をサポートしている。検索エンジンサーバ130が、計算された検索語の動的閾値スコアを取得すると、動的閾値スコア(フィルタ条件)は、要求文字列と組み合わされる。次に、組み合わされた要求文字列が、既に構築されたインデックステーブルの閾値スコアと比較される。この場合、動的閾値スコア未満である閾値スコアに対応するプロモーションデータ情報は、表示されない。一部の実施形態では、閾値フィルタに適う製品が表示される位置の最大数は、アルゴリズムモジュールによって動的に算出された位置数の上限以下である。位置の最大数を制限することによって、ウェブサイトのナチュラル検索への影響が最小限となる。例えば、広告スペースが、ナチュラル検索結果または非広告検索結果に大きく影響しないように、広告を表示するためのウェブサイトのスペースは制限される。この場合、一部の実施形態では、製品の広告が最も多くても上限を超えないことが保証されるように、アルゴリズムモジュールによって、広告表示の上限値が返される。すなわち、あまりにも多くの広告が表示されることを避けるために、位置の最大数が用いられる。
一例として、電子製品を販売する売り手ユーザを用いて、動的閾値スコアが取得されるビジネスプロセスフローについて説明する。まず最初に、売り手ユーザは、入札するために、入札管理サーバ150において、キーワード「MP3」を選択する。そして、入札管理サーバ150で、キーワード「MP3」に関して、売り手ユーザが販売している500品の製品を、ユーザがプロモーションしているデータ情報として設定する。例えば、売り手ユーザは、mp3という語句に対して500品の製品をバインドする。すなわち、mp3の検索に対して、500品の製品が返される。この場合、500の異なるデータ情報が、同じキーワード「MP3」にバインドされる。いくつかの実施形態において、500のデータ情報と「MP3」との相関は様々である。入札管理サーバ150は、閾値サービスにアクセスするために、キーワード「MP3」と500のバインド関係(キーワードとデータ情報)を、要求の形式(例えば、ハイパーテキスト転送プロトコル(HTTP)サーバのユニフォームリソースロケータ(URL)要求文字列)で、第1の閾値計算サーバ190に送る。一部の実施形態では、閾値サービスは、各バインド関係について、閾値スコアを算出する。一部の実施形態では、閾値スコアを用いて、キーワード「MP3」と各データ情報との相関の大きさが特定される。さらに、第1の閾値計算サーバ190は、ログサーバ170のログ情報を読み取ることによって閾値を算出し、これにより、キーワード「MP3」のテキスト相関の閾値スコアを得る。次の段階で、閾値スコアは、入札管理サーバ150に返送されて、入札管理サーバ150は、それらの閾値スコアを、それらが保存される閾値データベース(DB)に送る。閾値スコアは、これによって、オンラインシステムにおいて無駄なデータによるリソース利用を削減するために、検索エンジンサービスに提供される。
一部の実施形態では、システム100は、監視装置105を備える。
監視装置105は、ログ辞書の整合性を監視するためのリアルタイムメッセージを受け取り、特性因子が変化したことを検出すると、ログ辞書を更新する。監視装置105とは、リアルタイム情報更新通知システムのセットを指す。ユーザの製品情報が変更されると、ウェブサイトのデータが変わり、ユーザ行動も変化するので、監視装置105は、リアルタイムで閾値辞書を修正する。このように、監視装置105は、閾値がより現実的であるように、閾値辞書の情報がリアルタイムで変更されることを保証する。一部の実施形態において、監視装置105は、リアルタイム通知メッセージを送信する。例えば、入札管理サーバ150において、売り手ユーザが、データ情報を変更するか、またはデータ情報に製品を追加する。監視装置105は、関連するアクションをキャプチャして、その関連するアクションをメッセージに変換する。そして、監視装置105は、インデックスデータテーブルの更新のために、対応する変更フィールド情報、または新しいデータエントリ情報を、検索エンジンサーバ130に伝送する。このように、閾値インデックスデータテーブルは、ウェブサイトのプロモーション活動情報、ユーザのリアルタイムの閲覧行動およびクリック情報、プロモーション製品のクリック率、他のかかる情報に基づいて、リアルタイムで更新される。その結果、人手の介入および全計算の実行を必要とすることなく、各検索語クエリの表示の閾値がリアルタイムで調整される。一部の実施形態において、システム100は、新しいキーワードクエリに対して、その新しいキーワードがログ辞書にない場合に、デフォルト値を与える。
いくつかの実施形態において、システムが検索エンジンサーバ130および入札管理サーバ150に提供するログ辞書インデックスデータは、整合性が維持されなければならない。一例として、システムは、リアルタイム通知メッセージが送信された後に、ファイルサイズ、ファイルのMD5値、ディスク容量、他のかかるデータを検証する。システムが不整合および異常な状況(例えば、ディスク容量が不十分で、データの一部のみが送信された)を検出した場合、システムは、手動で行われるべき処理を示すアラームを発する。例えば、辞書データを同期させるために用いられるタスクの一元管理がある。タスクは、毎日一定の時刻に、辞書データを多岐に分散させることを伴い、それは、分散された辞書のMD5値の検証を含む。システムは、最初に、伝送された辞書が新しいこと、およびシステムによる後続処理の前に状況が一致していること、を確認する。システムが不整合を検出した場合、システムは、人手の介入および問題の修復を求めて、アラームを発する。さらに、一部の実施形態では、ウェブサイトのデータ変更に伴って、増分更新が同期的に実行される。そうでなければ、バックグラウンドシステムでユーザが得る語句のバインド状況と、検索エンジンサーバ130から返されて表示されるものとが、一致しないという問題が生じ得る。例えば、プロモーションプラットフォームでユーザが語句によって得る製品が高質であり、それが展示されるとユーザは信じている。ところが、検索エンジンにより誤って除外されるので、それが展示される機会はなく、同様の不整合が生じる。そこで、ログ辞書のデータの整合性を実現するために、いくらかの検証タスクが実行される。検証タスクは、プロセスフローを停止させるが、実行されなければ、ログ辞書のデータに不整合が生じて、ユーザの苦情につながる。
一例として、プロモーションが必要な広告製品とキーワードとの間のテキスト特性因子を、ユーザが入札管理サーバ150において設定した後に、入札管理サーバ150は、キーワードクエリによって、閾値サービスを要求して、対応する相関閾値情報を取得する。そして、入札管理サーバ150は、それらの閾値情報に基づいて、それらのキーワードとデータ情報とのバインド関係および良好な状態を判断する。バインドされた製品が、あまり効果的に展示される機会がないことを、売り手ユーザが気付いた場合に、売り手ユーザは、入札管理サーバ150において、製品情報、およびそれらの製品のプロモーションスキームを最適化する。さらに、売り手ユーザは、様々なキーワードについて、プロモーション競争の激しさに基づいてプロモーション戦略を決定し、これにより、ウェブサイト全体での製品プロモーションの質を向上させて、長期的に積極的なビジネスを展開する。
本例およびその他の例では、説明のために、別々のサーバ190、150、160、130を示しているが、様々な実施形態において、2つ以上のサーバの機能を統合して、単一のサーバによって実行することができる。
図3は、動的データ取得方法の一実施形態のフローチャートである。一部の実施形態において、方法300は、図1の検索エンジンサーバ130で実施され、以下のステップを含んでいる。
ステップ310において、検索エンジンサーバ130は、検索要求文字列を受信して、検索要求文字列の中の検索語を読み取る。
ステップ320において、検索エンジンサーバ130は、それらの検索語を閾値辞書でルックアップして、検索語に対応する動的閾値スコアを取得する。一部の実施形態では、閾値辞書から動的閾値スコアを取得するために、動的閾値インタフェース関数が用いられる。
ステップ330において、検索エンジンサーバ130は、検索語をクエリ条件とみなし、検索語に対応する動的閾値スコアを、インデックスデータテーブルのフィルタリングのためのフィルタ条件とみなして、キーワードと検索語が同じで、かつそれらのキーワードの閾値スコアが検索語の動的閾値スコア以上の大きさである場合に、1つ以上の対応するインデックス情報を取得する。いくつかの実施形態において、動的閾値スコアは、特性因子に応じて変化する。キーワードは、インデックスデータテーブルの索引語であり、キーワードは、インデックス情報に対応している。
ステップ340において、検索エンジンサーバ130は、インデックス情報に基づいて、検索語に対応するデータ情報を取得し、そのデータ情報を、動的に表示するためにウェブサイトのフロントエンドページに返送する。一部の実施形態では、閾値辞書は、検索語と、各検索語に対応した動的閾値スコアとを含み、インデックスデータテーブルは、キーワードと、キーワードと各データ情報との間の閾値スコアと、を含み、また、特性因子には、リアルタイムで変化するテキスト特性因子およびデータ解析特性因子が含まれる。
一部の実施形態では、検索語を用いて閾値辞書から取得した動的閾値スコアは、インデックスデータテーブルのフィルタリングのためのフィルタ条件として用いられる。閾値辞書に保存されている動的閾値スコアは、特性因子のリアルタイム更新に基づいて動的に変更され、従って、現在の検索語に対応して取得されるデータ情報は、動的閾値スコアの変更によって動的に更新される。このため、最終的にウェブサイトのフロントエンドページに表示される結果も更新される。従来、検索エンジンで実現される製品データのプロモーション方法は、適応性がなく、制限されたものであり、その結果、対応性のない検索結果が得られる。一方、本出願では、製品データ情報のリアルタイムな動的プロモーションを実現する。
いくつかの実施形態において、特性因子には、テキスト特性因子およびデータ解析特性因子が含まれる。テキスト特性因子には、検索語と製品自体のテキスト情報マッチングパラメータが含まれる。データ解析特性因子には、検索語のクリック率、対応する各製品のクリック率、検索語自体の人気度、ユーザのプロモーション製品エリア情報、検索語にバインドされた製品数(ユーザ数)、他のかかる因子(例えば、買い手およびウェブサイトのプロモーションデータの情報マイニング、ウェブサイト製品の履歴CTR情報、売り手の競争度、プロモーション製品のフレーズ相関とナチュラル検索結果との比較、など)、が含まれる。例えば、検索語のクリック率およびエリア情報は、実際の状況に応じて動的に変化する。従って、データ解析特性因子は動的に変化し、よって、動的閾値スコアは、動的に変化するデータ解析特性因子に基づいてリアルタイムで更新される。
一例として、クライアント110は、検索要求文字列を検索エンジンサーバ130に送信する。検索要求文字列は、複数の条件で編成されている。検索エンジンサーバ130は、検索要求文字列を解析して、バックグラウンドで既に計算済みの動的閾値スコアを閾値辞書140から呼び出し、得られた動的閾値スコアを、インデックスデータテーブル145内のキーワードのフィルタリングのためのフィルタ条件として用いる。その後、検索エンジンサーバ130は、検索結果データを返送し、最終的に、クライアント110のブラウザアプリケーションに検索結果を表示させる。
図4Aは、動的閾値スコア・ルックアップ方法の一実施形態のフローチャートである。一部の実施形態において、方法400は、図3の320で実施され、以下のステップを含んでいる。
検索エンジンサーバ130は、クライアント110から検索要求文字列を受信すると、ステップ410において、要求文字列をリライトする。
次にステップ420において、検索エンジンサーバ130は、動的閾値インタフェース処理クラス::initを呼び出し、閾値計算サーバで実現されるバックグラウンドのアルゴリズムモジュールで、要求文字列の中の検索語と、ログ辞書内でそれらの検索語に対応する特性因子について、閾値を計算する。
ステップ430において、検索エンジンサーバ130は、要求文字列の検索語と特性因子について計算された閾値に基づいて、検索語の動的閾値スコアを取得する。それらの動的閾値スコアは、キーワードとデータ情報との間の動的な総合的相関状況を表す。一部の実施形態では、それらの動的閾値スコアが、フィルタ条件に加えられる。さらに、返される結果数がリライトされる。リライトされた要求文字列を用いて、検索エンジンサーバ130のカーネルのクエリモジュールに対して、クエリタスクの完了を要求し、そして、対応する検索結果を、表示のためにクライアント110のブラウザアプリケーションに返送する。
図4Bは、動的閾値スコア計算方法の一実施形態のフローチャートである。一部の実施形態において、方法450は、図3の320の前に実施され、以下のステップを含んでいる。
ステップ460において、検索エンジンサーバ130は、ログ辞書から、テキスト特性因子およびデータ解析特性因子を取得する。
ステップ470において、検索エンジンサーバ130は、テキスト特性因子およびデータ解析特性因子に基づいて閾値計算を実行することで、各検索語の動的閾値スコアを取得する。
ステップ480において、検索エンジンサーバ130は、各検索語と、各検索語の動的閾値スコアを、データ辞書形式で、閾値辞書に保存する。一部の実施形態では、テキスト特性因子は、検索語とデータ情報のマッチング特性重みに相当し、データ解析特性因子は、検索語に対応する解析パラメータ特性重みに相当する。
一例では、第1の閾値計算サーバ190は、検索語、および検索語に対応したデータ情報を、入札管理サーバ150から抽出し、また、ウェブサイトの検索要求完了後のログ情報を、ログサーバ170のログ辞書から取得する。いくつかの実施形態において、ログ情報は、データ解析データベース175から取得されるデータ解析特性因子およびテキスト特性因子で構成される。第1の閾値計算サーバ190が、検索語と、テキスト特性因子およびデータ解析特性因子を取得したら、第1の閾値計算サーバ190は、各検索語の動的閾値スコアを算出する。例えば、第1の閾値計算サーバ190は、クエリの各検索語とユーザのプロモーション製品との相関閾値を計算する。同時に、第1の閾値計算サーバ190は、検索語とウェブサイトのナチュラル検索結果の最初の20製品との相関閾値を計算する。計算プロセスでは、上述のように、検索語と製品との相関閾値を考慮して、動的閾値スコアを計算することに加えて、さらに、製品の履歴クリック率、検索語自体の人気度、プロモーション製品エリア情報、検索語にバインドされた製品数(ユーザ数)、その他の商業的因子を考慮して、第2の閾値スコアを計算し、最終的に、第1の閾値スコアおよび第2の閾値スコアに基づいて、検索語に対応した動的閾値スコアを得る。第1の閾値計算サーバ190は、さらに、検索語およびそれらの閾値スコアのすべてを閾値辞書に保存する。一部の実施形態では、売り手ユーザは、検索語とデータ情報との相関閾値スコアの算出に用いられるテキスト特性因子を、入札管理サーバ150を介して、第1の閾値計算サーバ190に供給する。
図5は、動的閾値スコア取得方法の一実施形態のフローチャートである。一部の実施形態において、方法500は、図4Bの470で実施され、以下のステップを含んでいる。
ステップ510において、検索エンジンサーバ130は、線形回帰モデルScore0=F0(f1,f2,...,fi)を採用して、検索語の第1の閾値スコアScore0を取得するためのフィッティング計算を実行する。fiは、この検索語に対応するテキスト特性因子に相当し、iは、N以下の大きさの整数に相当し、Nは自然数である。
ステップ520において、検索エンジンサーバ130は、線形回帰モデルScore1=F1(f’1,...,f’k)を採用して、検索語の第2の閾値スコアScore1を取得するためのフィッティング計算を実行する。f’kは、この検索語に対応するデータ解析特性因子に相当し、kは、M以下の大きさの整数に相当し、Mは自然数である。
ステップ530において、検索エンジンサーバ130は、線形回帰モデルScore=F(score0,score1)×p1×p2に基づいて、検索語の動的閾値スコアを取得するためのフィッティング計算を実行する。p1は、第1の閾値スコアの占有率に相当し、p2は、第2の閾値スコアの占有率に相当する。
一例では、検索語と製品とに対応するテキスト相関の計算において考慮される因子には、以下のものが含まれる。f1は、製品説明における同じワードの表題の長さに対する検索語の比に相当し、f2は、検索語を含む表題に対する検索語の比に相当し、f3は、検索語を含むキーワードに対する検索語の比に相当し、f4は、製品説明における表題に対する検索語の文字マッチ率に相当し、f5は、製品説明におけるキーワード文字列に対する検索語の文字マッチ率に相当する。一部の実施形態では、f4およびf5として、クエリの検索語とデータ情報との文字のマッチが考慮されるだけではなく、文字列としてのマッチも考慮される。文字列が完全にマッチし、文字列全体が同じである場合には、f4およびf5は最も高いスコアとなり、そうでなければ、f4およびf5は、スコア0となる。これらの特性のフィッティングのために、つまり、特性値の重みを決定するために、線形回帰モデルが採用される。相関スコアScore0=F0(f1,...,f5)において、f1,f2,...,f5は、これら5つの特性を表しており、F0は、線形回帰モデルによって学習させたモデル関数を表している。上記の特性のフィッティング後に得られるスコア(Score0)が、相関スコアである。
検索語の履歴状況に対応する閾値スコアが、Score1=F1(f’1,...,f’k)に相当すると仮定すると、検索語の履歴状況に対応した閾値は、学習および予測における相関スコアと類似している。
この関数Score=F(score0,score1)×p1×p2は、テキスト特性因子に対応するテキスト相関スコアと、データ解析特性因子に対応するキーワードの履歴状況閾値スコアを、共に適合させる。このスコアが、語句と製品との最終的なスコア閾値である。このスコアは、製品のテキストマッチスコアと商業的規則スコアを反映している。Fは、同様に、線形回帰モジュールを指す。
図6は、入札管理プロセスの一実施形態のビジネスサービス・フローチャートである。一部の実施形態において、プロセスは、図1の入札管理サーバ150で実施され、以下のステップを含んでいる。
ステップ610において、売り手ユーザは、入札管理サーバ150において、プロモーション情報を設定する。プロモーション情報には、プロモーションが必要なキーワードとデータ情報との関係のリストが含まれる。
ステップ620において、キーワードと製品自体のテキスト情報マッチングパラメータが設定され、入札管理サーバ150は、プロモーション情報を得る。
ステップ630において、入札管理サーバ150は、そのプロモーション情報を、第1の閾値計算サーバ190に送る。第1の閾値計算サーバ190が、ログ辞書から各検索語のテキスト特性因子およびデータ解析特性因子を取得した後に、第1の閾値計算サーバ190は、テキスト特性因子およびデータ解析特性因子に基づいて閾値計算を実行することで、各検索語の動的閾値スコアを取得する。その後、第1の閾値計算サーバ190は、各検索語と、各検索語の動的閾値スコアを、データ辞書形式で、閾値辞書に保存する。一部の実施形態では、テキスト特性因子は、検索語とデータ情報のマッチング特性重みであり、データ解析特性因子は、検索語に対応する解析パラメータ特性重みである。
ステップ640において、入札管理サーバ150は、予め設定されたバインド結果を取得するために、第1の閾値計算サーバ190内の閾値スコアに基づくクエリを実行する。バインド結果とは、各検索語と製品情報との相関スコアである。
ステップ650において、入札管理サーバ150は、検索語に対応する製品情報を編集する。
検索語をクエリ条件とみなし、検索語に対応する動的閾値スコアを、インデックスデータテーブルでクエリを実行するためのフィルタ条件とみなすことに先立って、第1の閾値計算サーバ190は、バックグラウンド・クライアントの入札管理サーバまたはログ辞書から、キーワードと、キーワードにバウンドされた各製品データ情報とのテキスト特性因子を取得して、これらのテキスト特性因子に基づいて閾値計算を実行することで、各キーワードに対応した1つ以上の閾値スコアを取得し、各キーワード、および各キーワードに対応した1つ以上の閾値スコアを、閾値データベースに保存して、閾値データベース内の各キーワードと、それに対応する閾値スコアに基づいて、インデックステーブルを作成する。一部の実施形態では、第2の閾値サーバ160が、各キーワードに対応する1つ以上の閾値スコアを取得するために、テキスト特性因子に基づいて閾値計算を実行し、それは、線形回帰モデルScore’=F’(f1,f2,...,fj)を採用して、フィッティング計算を実行することで、キーワードの閾値スコアを取得することを含む。fjは、キーワードに対応したテキスト特性因子であり、jは、J以下の大きさの整数であり、Jは自然数である。
検索要求文字列を受信し、検索要求文字列の検索語を読み取ることに先立って、第1の閾値計算サーバ190は、クライアント110またはユーザの入札プラットフォームから、ログ辞書の整合性を監視するためのリアルタイムメッセージを受信し、特性因子が変化したことが検出された場合には、ログ辞書を更新する。
図7は、動的データ取得システムの一実施形態の構成図である。一部の実施形態において、システム700は、受信モジュール710と、クエリモジュール720と、フィルタリングモジュール730と、処理モジュール740と、を備えている。
受信モジュール710は、検索要求文字列を受信して、検索要求文字列の中の検索語を読み取る。
クエリモジュール720は、閾値辞書で検索語をルックアップすることで、検索語に対応した動的閾値スコアを取得する。
フィルタリングモジュール730は、検索語をクエリ条件とみなし、検索語に対応した動的閾値スコアを、インデックスデータテーブルにおけるフィルタリングのためのフィルタ条件とみなして、キーワードと検索語が同じであり、かつそれらのキーワードの閾値スコアが、検索語の動的閾値スコア以上の大きさである場合に、1つ以上の対応するインデックス情報を取得する。一部の実施形態では、動的閾値スコアは、特性因子に応じて変化する。
処理モジュール740は、インデックス情報に基づいて、検索語に対応するデータ情報を取得し、そのデータ情報を、表示のためにウェブサイトのフロントエンドページに返送する。閾値辞書は、検索語と、各検索語に対応した動的閾値スコアとを含み、インデックスデータテーブルは、キーワードと、それらのキーワードと各データ情報との間の閾値スコアと、を含み、また、特性因子には、テキスト特性因子およびデータ解析特性因子が含まれる。
上記のシステムは、閾値辞書で検索語を用いて得られる動的閾値スコアを、インデックスデータテーブルにおけるフィルタリングのためのフィルタ条件として使用する。閾値辞書に保存される動的閾値スコアは、特性因子のリアルタイム更新に応じて動的に変更されるので、現在の検索語に対応して取得される製品データ情報は、動的閾値スコアの変更によって動的に更新される。これによって、ウェブサイトのフロントエンド・ウェブページに最終的に表示される結果も更新される。本システムは、このように、製品データ情報のリアルタイムな動的プロモーションを実現する。
本出願は、以下の技術的効果を達成するものである。本出願により提供される動的な製品プロモーションによって、入札管理サーバ150プラットフォームと検索エンジンサーバ130との間の結合が減少する。ユーザが入札管理サーバ150を通して入札プロモーションアクションを実行するときに、ユーザは、製品プロモーションの質および表示の状況を知ることができる。様々に異なる検索語に対して、動的で多様なプロモーション製品情報を提示することができ、プロモーション情報は、ウェブサイト・トラフィックのリアルタイムな変化に応じて動的に変更されることが可能である。このような方法は、ユーザが、最適化および入札においてイニシアチブを取るために有効であり、これによって、ビジネスサービス入札の有利な展開が促される。
上記のユニットは、1つまたは複数の汎用プロセッサ上で実行されるソフトウェア・コンポーネントとして、プログラマブル・ロジック・デバイスおよび/もしくは特定の機能を実行するように設計された特定用途向け集積回路などのハードウェアとして、またはそれらの組み合わせにより、実現することができる。一部の実施形態では、これらのユニットは、ソフトウェア・プロダクトの形態で実現することができ、これらは不揮発性記憶媒体(光ディスク、フラッシュ記憶装置、モバイル・ハードディスクなど)に記憶することが可能であって、本発明の実施形態で記載した方法をコンピュータ装置(パーソナルコンピュータ、サーバ、ネットワーク装置など)に実行させるための多くの命令を含むものである。これらのユニットは、単一の装置に、または複数の装置に分散させて、実装することができる。ユニットの機能は相互に併合させることができ、あるいは複数のサブユニットにさらに分割することができる。
本明細書で開示した実施形態を参照して記載された方法またはアルゴリズムステップは、ハードウェア、またはプロセッサで実行されるソフトウェアモジュール、または両方の組み合わせを用いて実装することができる。ソフトウェアモジュールは、ランダムアクセスメモリ(RAM)、メモリ、読み取り専用メモリ(ROM)、電気的プログラマブルROM、電気的消去可能プログラマブルROM、レジスタ、ハードドライブ、リムーバブルディスク、CD−ROM、または当該技術分野で周知の他のいずれかの形式の記憶媒体にインストールすることができる。
上記の実施形態は、明確な理解を目的として、ある程度詳細に記載しているが、本発明は、提示した詳細に限定されるものではない。本発明を実施する多くの代替的方法がある。開示された実施形態は、例示であって、限定するものではない。
適用例1:動的データ取得方法であって、
受信された検索要求文字列から検索語を抽出し、
前記検索語に対応する動的閾値スコアを取得するために、閾値辞書で前記検索語をルックアップし、
インデックスデータテーブルにおいて、1つ以上の対応するインデックス情報を取得するために、前記検索語をクエリ条件として使用し、前記検索語に対応する前記動的閾値スコアであって、特性因子に基づいて変化する前記動的閾値スコアをフィルタ条件として使用し、
前記インデックスデータテーブル内の前記インデックス情報に基づいて、前記検索語に対応するデータ情報を取得し、
ウェブサイトのページに表示させるために、前記データ情報を送信することと、を備える、方法。
適用例2:適用例1に記載の方法において、インデックスデータテーブルにおいて、1つ以上の対応するインデックス情報を取得するために、前記検索語をクエリ条件として使用し、前記検索語に対応する前記動的閾値スコアをフィルタ条件として使用することは、
前記検索語とマッチするキーワードが前記インデックスデータテーブル内に存在し、前記インデックスデータテーブルにおける前記キーワードの閾値スコアが、前記検索語の前記動的閾値スコア以上の大きさである場合に、1つ以上の対応するインデックス情報を取得することを含む、方法。
適用例3:適用例1に記載の方法において、前記閾値辞書は、複数の検索語と、対応する複数の動的閾値スコアと、を含む、方法。
適用例4:適用例1に記載の方法において、前記インデックスデータテーブルは、複数のキーワードと、対応する複数の、前記キーワードと前記データ情報との間の閾値スコアと、を含む、方法。
適用例5:適用例1に記載の方法において、前記特性因子は、テキスト特性因子と、データ解析特性因子と、を含む、方法。
適用例6:適用例1に記載の方法はさらに、前記閾値辞書を構築することを備え、前記閾値辞書を構築することは、
各検索語のテキスト特性因子およびデータ解析特性因子をログ辞書から取得し、
各検索語の前記動的閾値スコアを取得するために、前記テキスト特性因子および前記データ解析特性因子に基づいて閾値計算を実行し、
前記検索語および各検索語の前記動的閾値スコアを、データ辞書形式で、前記閾値辞書に保存すること、を含み、
前記テキスト特性因子は、前記検索語と前記データ情報のマッチング特性重みであり、
前記データ解析特性因子は、前記検索語に対応する解析パラメータ特性重みである、方法。
適用例7:適用例6に記載の方法において、各検索語の前記動的閾値スコアを取得するために、前記テキスト特性因子および前記データ解析特性因子に基づいて閾値計算を実行することは、
フィッティング計算を実行し、前記検索語の第1の閾値スコアScore 0 を取得するために、線形回帰モデルScore 0 =F0(f 1 ,f 2 ,...,f i )を採用し、ここで、f i は前記検索語に対応するテキスト特性因子であり、iはN以下の大きさの整数であり、Nは自然数であり、
フィッティング計算を実行し、前記検索語の第2の閾値スコアScore 1 を取得するために、線形回帰モデルScore 1 =F1(f’ 1 ,...,f’ k )を採用し、ここで、f’ k は前記検索語に対応するデータ解析特性因子であり、kはM以下の大きさの整数であり、Mは自然数であり、
前記検索語の前記動的閾値スコアを取得するために、p 1 は前記第1の閾値スコアの占有率であり、p 2 は前記第2の閾値スコアの占有率であるとして、線形回帰モデルScore=F(score 0 ,score 1 )×p 1 ×p 2 に基づいて、フィッティング計算を実行すること、を備える、方法。
適用例8:適用例1に記載の方法はさらに、前記インデックスデータテーブルを構築することを備え、前記インデックスデータテーブルを構築することは、
キーワードと、前記キーワードにバインドされた各データ情報のテキスト特性因子とを、入札管理サーバまたはログ辞書から取得し、
各キーワードに対応する1つ以上の閾値スコアを取得するために、前記テキスト特性因子に基づいて閾値計算を実行し、
前記キーワードと、各キーワードに対応する前記1つ以上の閾値スコアとを、閾値データベースに保存し、
前記閾値データベース内のキーワードおよび対応する前記1つ以上の閾値スコアに基づいて、前記インデックスデータテーブルを作成すること、を備え、
各キーワードに対応する1つ以上の閾値スコアを取得するために、前記テキスト特性因子に基づいて前記閾値計算を実行することは、前記キーワードの閾値スコアを取得するためのフィッティング計算を実行するために、fjは前記キーワードに対応する前記テキスト特性因子であり、jはJ以下の大きさの整数であり、Jは自然数であるとして、線形回帰モデルScore’=F’(f1,f2,...,fj)を採用することを備える、方法。
適用例9:適用例1に記載の方法はさらに、
前記検索要求文字列を受信すること、および前記検索要求文字列から検索語を抽出することの前に、
ログ辞書の整合性を監視するためのリアルタイムメッセージを受信し、
前記特性因子が変化したことが検出された場合に、前記ログ辞書を更新すること、を備える、方法。
適用例10:動的データ取得システムであって、
少なくとも1つのプロセッサであって、
受信された検索要求文字列から検索語を抽出し、
前記検索語に対応する動的閾値スコアを取得するために、閾値辞書で前記検索語をルックアップし、
インデックスデータテーブルにおいて、1つ以上の対応するインデックス情報を取得するために、前記検索語をクエリ条件として使用し、前記検索語に対応する前記動的閾値スコアであって、特性因子に基づいて変化する前記動的閾値スコアをフィルタ条件として使用し、
前記インデックスデータテーブル内の前記インデックス情報に基づいて、前記検索語に対応するデータ情報を取得し、
ウェブサイトのページに表示させるために、前記データ情報を送信する、ように構成されている少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサに接続され、前記少なくとも1つのプロセッサに命令を供給するように構成されているメモリと、を備えるシステム。
適用例11:適用例10に記載のシステムにおいて、インデックスデータテーブルで、1つ以上の対応するインデックス情報を取得するために、前記検索語をクエリ条件として使用し、前記検索語に対応する前記動的閾値スコアをフィルタ条件として使用することは、
前記検索語とマッチするキーワードが前記インデックスデータテーブル内に存在し、前記インデックスデータテーブルにおける前記キーワードの閾値スコアが、前記検索語の前記動的閾値スコア以上の大きさである場合に、1つ以上の対応するインデックス情報を取得することを備える、システム。
適用例12:適用例10に記載のシステムにおいて、前記閾値辞書は、複数の検索語と、対応する複数の動的閾値スコアと、を含む、システム。
適用例13:適用例10に記載のシステムにおいて、前記インデックスデータテーブルは、複数のキーワードと、対応する複数の、前記キーワードと前記データ情報との間の閾値スコアと、を含む、システム。
適用例14:適用例10に記載のシステムにおいて、前記特性因子は、テキスト特性因子と、データ解析特性因子と、を含む、システム。
適用例15:適用例10に記載のシステムにおいて、前記少なくとも1つのプロセッサは、さらに、
前記閾値辞書を構築するように構成されており、前記閾値辞書を構築することは、
各検索語のテキスト特性因子およびデータ解析特性因子をログ辞書から取得し、
各検索語の前記動的閾値スコアを取得するために、前記テキスト特性因子および前記データ解析特性因子に基づいて閾値計算を実行し、
前記検索語および各検索語の前記動的閾値スコアを、データ辞書形式で、前記閾値辞書に保存すること、を含み、
前記テキスト特性因子は、前記検索語と前記データ情報のマッチング特性重みであり、
前記データ解析特性因子は、前記検索語に対応する解析パラメータ特性重みである、システム。
適用例16:適用例15に記載のシステムにおいて、各検索語の前記動的閾値スコアを取得するために、前記テキスト特性因子および前記データ解析特性因子に基づいて閾値計算を実行することは、
フィッティング計算を実行し、前記検索語の第1の閾値スコアScore 0 を取得するために、線形回帰モデルScore 0 =F0(f 1 ,f 2 ,...,f i )を採用し、ここで、f i は前記検索語に対応するテキスト特性因子であり、iはN以下の大きさの整数であり、Nは自然数であり、
フィッティング計算を実行し、前記検索語の第2の閾値スコアScore 1 を取得するために、線形回帰モデルScore 1 =F1(f’ 1 ,...,f’ k )を採用し、ここで、f’ k は前記検索語に対応するデータ解析特性因子であり、kはM以下の大きさの整数であり、Mは自然数であり、
前記検索語の前記動的閾値スコアを取得するために、p 1 は前記第1の閾値スコアの占有率であり、p 2 は前記第2の閾値スコアの占有率であるとして、線形回帰モデルScore=F(score 0 ,score 1 )×p 1 ×p 2 に基づいて、フィッティング計算を実行すること、を備える、システム。
適用例17:適用例10に記載のシステムにおいて、前記少なくとも1つのプロセッサは、さらに、
前記インデックスデータテーブルを構築するように構成されており、前記インデックスデータテーブルを構築することは、
キーワードと、前記キーワードにバインドされた各データ情報のテキスト特性因子とを、入札管理サーバまたはログ辞書から取得し、
各キーワードに対応する1つ以上の閾値スコアを取得するために、前記テキスト特性因子に基づいて閾値計算を実行し、
前記キーワードと、各キーワードに対応する前記1つ以上の閾値スコアとを、閾値データベースに保存すること、を備える、システム。
適用例18:適用例17に記載のシステムにおいて、各キーワードに対応する1つ以上の閾値スコアを取得するために、前記テキスト特性因子に基づいて前記閾値計算を実行することは、前記キーワードの閾値スコアを取得するためのフィッティング計算を実行するために、fjは前記キーワードに対応する前記テキスト特性因子であり、jはJ以下の大きさの整数であり、Jは自然数であるとして、線形回帰モデルScore’=F’(f1,f2,...,fj)を採用することを含む、システム。
適用例19:適用例10に記載のシステムにおいて、前記少なくとも1つのプロセッサは、さらに、
前記検索要求文字列を受信すること、および前記検索要求文字列から検索語を抽出することの前に、
ログ辞書の整合性を監視するためのリアルタイムメッセージを受信し、
前記特性因子が変化したことが検出された場合に、前記ログ辞書を更新する、ように構成されている、システム。
適用例20:データを動的に取得するためのコンピュータプログラム・プロダクトであって、前記コンピュータプログラム・プロダクトは、有形の非一時的コンピュータ可読記憶媒体内に具現化されており、
受信された検索要求文字列から検索語を抽出するためのコンピュータ命令と、
前記検索語に対応する動的閾値スコアを取得するために、閾値辞書で前記検索語をルックアップするためのコンピュータ命令と、
インデックスデータテーブルにおいて、1つ以上の対応するインデックス情報を取得するために、前記検索語をクエリ条件として使用し、前記検索語に対応する前記動的閾値スコアであって、特性因子に基づいて変化する前記動的閾値スコアをフィルタ条件として使用するためのコンピュータ命令と、
前記インデックスデータテーブル内の前記インデックス情報に基づいて、前記検索語に対応するデータ情報を取得するためのコンピュータ命令と、
ウェブサイトのページに表示させるために、前記データ情報を送信するためのコンピュータ命令と、を備える、コンピュータプログラム・プロダクト。

Claims (20)

  1. 動的データ取得方法であって、
    受信された検索要求文字列から検索語を抽出し、
    前記検索語に対応する動的閾値スコアを取得するために、閾値辞書で前記検索語をルックアップし、
    インデックスデータテーブルにおいて、1つ以上の対応するインデックス情報を取得するために、前記検索語をクエリ条件として使用し、前記検索語に対応する前記動的閾値スコアであって、特性因子に基づいて変化する前記動的閾値スコアをフィルタ条件として使用し、
    前記インデックスデータテーブル内の前記インデックス情報に基づいて、前記検索語に対応するデータ情報を取得し、
    ウェブサイトのページに表示させるために、前記データ情報を送信することと、を備える、方法。
  2. 請求項1に記載の方法において、インデックスデータテーブルにおいて、1つ以上の対応するインデックス情報を取得するために、前記検索語をクエリ条件として使用し、前記検索語に対応する前記動的閾値スコアをフィルタ条件として使用することは、
    前記検索語とマッチするキーワードが前記インデックスデータテーブル内に存在し、前記インデックスデータテーブルにおける前記キーワードの閾値スコアが、前記検索語の前記動的閾値スコア以上の大きさである場合に、1つ以上の対応するインデックス情報を取得することを含む、方法。
  3. 請求項1に記載の方法において、前記閾値辞書は、複数の検索語と、対応する複数の動的閾値スコアと、を含む、方法。
  4. 請求項1に記載の方法において、前記インデックスデータテーブルは、複数のキーワードと、対応する複数の、前記キーワードと前記データ情報との間の閾値スコアと、を含む、方法。
  5. 請求項1に記載の方法において、前記特性因子は、テキスト特性因子と、データ解析特性因子と、を含む、方法。
  6. 請求項1に記載の方法はさらに、前記閾値辞書を構築することを備え、前記閾値辞書を構築することは、
    各検索語のテキスト特性因子およびデータ解析特性因子をログ辞書から取得し、
    各検索語の前記動的閾値スコアを取得するために、前記テキスト特性因子および前記データ解析特性因子に基づいて閾値計算を実行し、
    前記検索語および各検索語の前記動的閾値スコアを、データ辞書形式で、前記閾値辞書に保存すること、を含み、
    前記テキスト特性因子は、前記検索語と前記データ情報のマッチング特性重みであり、
    前記データ解析特性因子は、前記検索語に対応する解析パラメータ特性重みである、方法。
  7. 請求項6に記載の方法において、各検索語の前記動的閾値スコアを取得するために、前記テキスト特性因子および前記データ解析特性因子に基づいて閾値計算を実行することは、
    フィッティング計算を実行し、前記検索語の第1の閾値スコアScore0を取得するために、線形回帰モデルScore0=F0(f1,f2,...,fi)を採用し、ここで、fiは前記検索語に対応するテキスト特性因子であり、iはN以下の大きさの整数であり、Nは自然数であり、
    フィッティング計算を実行し、前記検索語の第2の閾値スコアScore1を取得するために、線形回帰モデルScore1=F1(f’1,...,f’k)を採用し、ここで、f’kは前記検索語に対応するデータ解析特性因子であり、kはM以下の大きさの整数であり、Mは自然数であり、
    前記検索語の前記動的閾値スコアを取得するために、p1は前記第1の閾値スコアの占有率であり、p2は前記第2の閾値スコアの占有率であるとして、線形回帰モデルScore=F(score0,score1)×p1×p2に基づいて、フィッティング計算を実行すること、を備える、方法。
  8. 請求項1に記載の方法はさらに、前記インデックスデータテーブルを構築することを備え、前記インデックスデータテーブルを構築することは、
    キーワードと、前記キーワードにバインドされた各データ情報のテキスト特性因子とを、入札管理サーバまたはログ辞書から取得し、
    各キーワードに対応する1つ以上の閾値スコアを取得するために、前記テキスト特性因子に基づいて閾値計算を実行し、
    前記キーワードと、各キーワードに対応する前記1つ以上の閾値スコアとを、閾値データベースに保存し、
    前記閾値データベース内のキーワードおよび対応する前記1つ以上の閾値スコアに基づいて、前記インデックスデータテーブルを作成すること、を備え、
    各キーワードに対応する1つ以上の閾値スコアを取得するために、前記テキスト特性因子に基づいて前記閾値計算を実行することは、前記キーワードの閾値スコアを取得するためのフィッティング計算を実行するために、fjは前記キーワードに対応する前記テキスト特性因子であり、jはJ以下の大きさの整数であり、Jは自然数であるとして、線形回帰モデルScore’=F’(f1,f2,...,fj)を採用することを備える、方法。
  9. 請求項1に記載の方法はさらに、
    前記検索要求文字列を受信すること、および前記検索要求文字列から検索語を抽出することの前に、
    ログ辞書の整合性を監視するためのリアルタイムメッセージを受信し、
    前記特性因子が変化したことが検出された場合に、前記ログ辞書を更新すること、を備える、方法。
  10. 動的データ取得システムであって、
    少なくとも1つのプロセッサであって、
    受信された検索要求文字列から検索語を抽出し、
    前記検索語に対応する動的閾値スコアを取得するために、閾値辞書で前記検索語をルックアップし、
    インデックスデータテーブルにおいて、1つ以上の対応するインデックス情報を取得するために、前記検索語をクエリ条件として使用し、前記検索語に対応する前記動的閾値スコアであって、特性因子に基づいて変化する前記動的閾値スコアをフィルタ条件として使用し、
    前記インデックスデータテーブル内の前記インデックス情報に基づいて、前記検索語に対応するデータ情報を取得し、
    ウェブサイトのページに表示させるために、前記データ情報を送信する、ように構成されている少なくとも1つのプロセッサと、
    前記少なくとも1つのプロセッサに接続され、前記少なくとも1つのプロセッサに命令を供給するように構成されているメモリと、を備えるシステム。
  11. 請求項10に記載のシステムにおいて、インデックスデータテーブルで、1つ以上の対応するインデックス情報を取得するために、前記検索語をクエリ条件として使用し、前記検索語に対応する前記動的閾値スコアをフィルタ条件として使用することは、
    前記検索語とマッチするキーワードが前記インデックスデータテーブル内に存在し、前記インデックスデータテーブルにおける前記キーワードの閾値スコアが、前記検索語の前記動的閾値スコア以上の大きさである場合に、1つ以上の対応するインデックス情報を取得することを備える、システム。
  12. 請求項10に記載のシステムにおいて、前記閾値辞書は、複数の検索語と、対応する複数の動的閾値スコアと、を含む、システム。
  13. 請求項10に記載のシステムにおいて、前記インデックスデータテーブルは、複数のキーワードと、対応する複数の、前記キーワードと前記データ情報との間の閾値スコアと、を含む、システム。
  14. 請求項10に記載のシステムにおいて、前記特性因子は、テキスト特性因子と、データ解析特性因子と、を含む、システム。
  15. 請求項10に記載のシステムにおいて、前記少なくとも1つのプロセッサは、さらに、
    前記閾値辞書を構築するように構成されており、前記閾値辞書を構築することは、
    各検索語のテキスト特性因子およびデータ解析特性因子をログ辞書から取得し、
    各検索語の前記動的閾値スコアを取得するために、前記テキスト特性因子および前記データ解析特性因子に基づいて閾値計算を実行し、
    前記検索語および各検索語の前記動的閾値スコアを、データ辞書形式で、前記閾値辞書に保存すること、を含み、
    前記テキスト特性因子は、前記検索語と前記データ情報のマッチング特性重みであり、
    前記データ解析特性因子は、前記検索語に対応する解析パラメータ特性重みである、システム。
  16. 請求項15に記載のシステムにおいて、各検索語の前記動的閾値スコアを取得するために、前記テキスト特性因子および前記データ解析特性因子に基づいて閾値計算を実行することは、
    フィッティング計算を実行し、前記検索語の第1の閾値スコアScore0を取得するために、線形回帰モデルScore0=F0(f1,f2,...,fi)を採用し、ここで、fiは前記検索語に対応するテキスト特性因子であり、iはN以下の大きさの整数であり、Nは自然数であり、
    フィッティング計算を実行し、前記検索語の第2の閾値スコアScore1を取得するために、線形回帰モデルScore1=F1(f’1,...,f’k)を採用し、ここで、f’kは前記検索語に対応するデータ解析特性因子であり、kはM以下の大きさの整数であり、Mは自然数であり、
    前記検索語の前記動的閾値スコアを取得するために、p1は前記第1の閾値スコアの占有率であり、p2は前記第2の閾値スコアの占有率であるとして、線形回帰モデルScore=F(score0,score1)×p1×p2に基づいて、フィッティング計算を実行すること、を備える、システム。
  17. 請求項10に記載のシステムにおいて、前記少なくとも1つのプロセッサは、さらに、
    前記インデックスデータテーブルを構築するように構成されており、前記インデックスデータテーブルを構築することは、
    キーワードと、前記キーワードにバインドされた各データ情報のテキスト特性因子とを、入札管理サーバまたはログ辞書から取得し、
    各キーワードに対応する1つ以上の閾値スコアを取得するために、前記テキスト特性因子に基づいて閾値計算を実行し、
    前記キーワードと、各キーワードに対応する前記1つ以上の閾値スコアとを、閾値データベースに保存すること、を備える、システム。
  18. 請求項17に記載のシステムにおいて、各キーワードに対応する1つ以上の閾値スコアを取得するために、前記テキスト特性因子に基づいて前記閾値計算を実行することは、前記キーワードの閾値スコアを取得するためのフィッティング計算を実行するために、fjは前記キーワードに対応する前記テキスト特性因子であり、jはJ以下の大きさの整数であり、Jは自然数であるとして、線形回帰モデルScore’=F’(f1,f2,...,fj)を採用することを含む、システム。
  19. 請求項10に記載のシステムにおいて、前記少なくとも1つのプロセッサは、さらに、
    前記検索要求文字列を受信すること、および前記検索要求文字列から検索語を抽出することの前に、
    ログ辞書の整合性を監視するためのリアルタイムメッセージを受信し、
    前記特性因子が変化したことが検出された場合に、前記ログ辞書を更新する、ように構成されている、システム。
  20. データを動的に取得するためのコンピュータプログラムであって
    受信された検索要求文字列から検索語を抽出するための機能と、
    前記検索語に対応する動的閾値スコアを取得するために、閾値辞書で前記検索語をルックアップするための機能と、
    インデックスデータテーブルにおいて、1つ以上の対応するインデックス情報を取得するために、前記検索語をクエリ条件として使用し、前記検索語に対応する前記動的閾値スコアであって、特性因子に基づいて変化する前記動的閾値スコアをフィルタ条件として使用するための機能と、
    前記インデックスデータテーブル内の前記インデックス情報に基づいて、前記検索語に対応するデータ情報を取得するための機能と、
    ウェブサイトのページに表示させるために、前記データ情報を送信するための機能と、をコンピュータによって実現させる、コンピュータプログラム。
JP2015532016A 2012-09-13 2013-09-11 動的データ取得方法およびシステム Active JP5916959B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
CN201210339669.4 2012-09-13
CN201210339669.4A CN103678365B (zh) 2012-09-13 2012-09-13 数据的动态获取方法、装置及系统
US14/022,634 US10025807B2 (en) 2012-09-13 2013-09-10 Dynamic data acquisition method and system
US14/022,634 2013-09-10
PCT/US2013/059212 WO2014043200A2 (en) 2012-09-13 2013-09-11 Dynamic data acquisition method and system

Publications (2)

Publication Number Publication Date
JP2015528611A JP2015528611A (ja) 2015-09-28
JP5916959B2 true JP5916959B2 (ja) 2016-05-11

Family

ID=50234435

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015532016A Active JP5916959B2 (ja) 2012-09-13 2013-09-11 動的データ取得方法およびシステム

Country Status (6)

Country Link
US (1) US10025807B2 (ja)
EP (1) EP2895969A4 (ja)
JP (1) JP5916959B2 (ja)
CN (1) CN103678365B (ja)
TW (1) TWI567572B (ja)
WO (1) WO2014043200A2 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10346769B1 (en) * 2014-03-14 2019-07-09 Walmart Apollo, Llc System and method for dynamic attribute table
US10565538B1 (en) 2014-03-14 2020-02-18 Walmart Apollo, Llc Customer attribute exemption
US10733555B1 (en) 2014-03-14 2020-08-04 Walmart Apollo, Llc Workflow coordinator
US9785712B1 (en) * 2014-06-20 2017-10-10 Amazon Technologies, Inc. Multi-index search engines
CN104504134B (zh) * 2014-12-31 2017-10-27 北京国双科技有限公司 推广信息属性数据的获取方法和装置
CN105512232B (zh) * 2015-11-30 2020-02-28 北京金山安全软件有限公司 数据存储方法及装置
CN105512230B (zh) * 2015-11-30 2020-05-22 北京金山安全软件有限公司 数据存储方法及装置
CN106022163A (zh) * 2016-05-17 2016-10-12 上海凭安网络科技有限公司 一种基于第三方自动混淆的查询方法及系统
US11200217B2 (en) * 2016-05-26 2021-12-14 Perfect Search Corporation Structured document indexing and searching
CN106021562B (zh) * 2016-05-31 2019-05-24 北京京拍档科技有限公司 用于电商平台的基于主题相关的推荐方法
CN109934631B (zh) * 2019-03-13 2022-03-25 联想(北京)有限公司 问答信息处理方法、装置及计算机设备
CN111897840A (zh) * 2020-08-14 2020-11-06 北京字节跳动网络技术有限公司 一种数据搜索方法、装置、电子设备及存储介质
CN112000479B (zh) * 2020-08-24 2022-11-25 辽宁省中科知产高新产业技术研究有限公司 一种基于大数据的处理方法、系统及服务器平台
CN112883225B (zh) * 2021-02-02 2022-10-11 聚好看科技股份有限公司 一种媒体资源搜索、显示方法及设备

Family Cites Families (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04262460A (ja) 1991-02-15 1992-09-17 Ricoh Co Ltd 情報検索装置
US6714933B2 (en) 2000-05-09 2004-03-30 Cnet Networks, Inc. Content aggregation method and apparatus for on-line purchasing system
US7082426B2 (en) 1993-06-18 2006-07-25 Cnet Networks, Inc. Content aggregation method and apparatus for an on-line product catalog
US5946678A (en) 1995-01-11 1999-08-31 Philips Electronics North America Corporation User interface for document retrieval
JPH09101991A (ja) 1995-07-31 1997-04-15 Toshiba Corp 情報フィルタリング装置
US6012053A (en) 1997-06-23 2000-01-04 Lycos, Inc. Computer system with user-controlled relevance ranking of search results
JP3607462B2 (ja) 1997-07-02 2005-01-05 松下電器産業株式会社 関連キーワード自動抽出装置及びこれを用いた文書検索システム
US6675159B1 (en) 2000-07-27 2004-01-06 Science Applic Int Corp Concept-based search and retrieval system
US20020078045A1 (en) 2000-12-14 2002-06-20 Rabindranath Dutta System, method, and program for ranking search results using user category weighting
US7398461B1 (en) * 2002-01-24 2008-07-08 Overture Services, Inc. Method for ranking web page search results
US7216121B2 (en) * 2002-12-31 2007-05-08 International Business Machines Corporation Search engine facility with automated knowledge retrieval, generation and maintenance
JP2005018530A (ja) 2003-06-27 2005-01-20 Toshiba Corp 情報処理装置、情報処理プログラム及び情報処理方法
US7836010B2 (en) 2003-07-30 2010-11-16 Northwestern University Method and system for assessing relevant properties of work contexts for use by information services
WO2005017682A2 (en) 2003-08-05 2005-02-24 Cnet Networks, Inc. Product placement engine and method
US7346615B2 (en) * 2003-10-09 2008-03-18 Google, Inc. Using match confidence to adjust a performance threshold
US20050131872A1 (en) 2003-12-16 2005-06-16 Microsoft Corporation Query recognizer
US7562068B2 (en) 2004-06-30 2009-07-14 Microsoft Corporation System and method for ranking search results based on tracked user preferences
US7603349B1 (en) 2004-07-29 2009-10-13 Yahoo! Inc. User interfaces for search systems using in-line contextual queries
US7580926B2 (en) 2005-12-01 2009-08-25 Adchemy, Inc. Method and apparatus for representing text using search engine, document collection, and hierarchal taxonomy
US7657506B2 (en) 2006-01-03 2010-02-02 Microsoft International Holdings B.V. Methods and apparatus for automated matching and classification of data
US7814112B2 (en) 2006-06-09 2010-10-12 Ebay Inc. Determining relevancy and desirability of terms
US20080059458A1 (en) 2006-09-06 2008-03-06 Byron Robert V Folksonomy weighted search and advertisement placement system and method
US20080097982A1 (en) 2006-10-18 2008-04-24 Yahoo! Inc. System and method for classifying search queries
US20080104101A1 (en) * 2006-10-27 2008-05-01 Kirshenbaum Evan R Producing a feature in response to a received expression
US7966309B2 (en) 2007-01-17 2011-06-21 Google Inc. Providing relevance-ordered categories of information
US20080263009A1 (en) 2007-04-19 2008-10-23 Buettner Raymond R System and method for sharing of search query information across organizational boundaries
US20080313142A1 (en) 2007-06-14 2008-12-18 Microsoft Corporation Categorization of queries
CN101378187B (zh) 2007-08-29 2012-07-18 鸿富锦精密工业(深圳)有限公司 电源保护电路
CN100557612C (zh) 2007-11-15 2009-11-04 深圳市迅雷网络技术有限公司 一种基于搜索引擎的搜索结果排序方法及装置
US7895206B2 (en) 2008-03-05 2011-02-22 Yahoo! Inc. Search query categrization into verticals
US7877404B2 (en) 2008-03-05 2011-01-25 Microsoft Corporation Query classification based on query click logs
US20100138402A1 (en) 2008-12-02 2010-06-03 Chacha Search, Inc. Method and system for improving utilization of human searchers
US8396742B1 (en) * 2008-12-05 2013-03-12 Covario, Inc. System and method for optimizing paid search advertising campaigns based on natural search traffic
US20100153366A1 (en) 2008-12-15 2010-06-17 Motorola, Inc. Assigning an indexing weight to a search term
WO2010144671A2 (en) * 2009-06-11 2010-12-16 Dolby Laboratories Licensing Corporation Trend analysis in content identification based on fingerprinting
CN102612691B (zh) * 2009-09-18 2015-02-04 莱克西私人有限公司 给文本评分的方法和系统
CN102053983B (zh) * 2009-11-02 2013-09-25 阿里巴巴集团控股有限公司 一种垂直搜索的查询方法、系统和装置
CN102054008A (zh) * 2009-11-05 2011-05-11 北京四维图新科技股份有限公司 网络信息获取方法和装置
CN102289436B (zh) * 2010-06-18 2013-12-25 阿里巴巴集团控股有限公司 确定搜索词权重值方法及装置、搜索结果生成方法及装置
CN102339296A (zh) 2010-07-26 2012-02-01 阿里巴巴集团控股有限公司 一种查询结果的排序方法和装置
CN102385585A (zh) * 2010-08-27 2012-03-21 阿里巴巴集团控股有限公司 网页数据库的建立方法、网页搜索方法以及相关装置
CN102411583B (zh) * 2010-09-20 2013-09-18 阿里巴巴集团控股有限公司 一种文本匹配方法及装置
US10275782B2 (en) * 2010-12-28 2019-04-30 Excalibur Ip, Llc Variation of minimum advertisement relevance quality threshold based on search query attributes
US8977640B2 (en) * 2011-02-28 2015-03-10 Yahoo! Inc. System for processing complex queries

Also Published As

Publication number Publication date
JP2015528611A (ja) 2015-09-28
EP2895969A2 (en) 2015-07-22
CN103678365A (zh) 2014-03-26
EP2895969A4 (en) 2016-06-08
WO2014043200A2 (en) 2014-03-20
CN103678365B (zh) 2017-07-18
TWI567572B (zh) 2017-01-21
US20140074851A1 (en) 2014-03-13
TW201411380A (zh) 2014-03-16
US10025807B2 (en) 2018-07-17
WO2014043200A3 (en) 2014-07-31

Similar Documents

Publication Publication Date Title
JP5916959B2 (ja) 動的データ取得方法およびシステム
US10534781B2 (en) Website traffic optimization
US20140195893A1 (en) Method and Apparatus for Generating Webpage Content
US20160171589A1 (en) Personalized application recommendations
US10248732B2 (en) Identifying related entities
US20110258054A1 (en) Automatic Generation of Bid Phrases for Online Advertising
US10607271B1 (en) Search platform with data driven search relevancy management
US20180096067A1 (en) Creation and optimization of resource contents
US20170024776A1 (en) Externality-based advertisement bid and budget allocation adjustment
CN106447419B (zh) 基于特征选择的拜访者标识
US20110131093A1 (en) System and method for optimizing selection of online advertisements
US20110196690A1 (en) Method and system of selecting landing pages and optimizing routing efficiency
JP2019519840A (ja) ランディングページ生成の改良
US20130179418A1 (en) Search ranking features
US20180114156A1 (en) Computer-based automatic tagging of user multimedia data to generate commercial sales lead
US10936675B2 (en) Developing an item data model for an item
JP2015022528A (ja) トリガクエリ取得装置、トリガクエリ取得方法、およびプログラム
US20160055203A1 (en) Method for record selection to avoid negatively impacting latency
US20180039643A1 (en) Analysis and management of resources in a network
US9390139B1 (en) Presentation of content items in view of commerciality
JP5696113B2 (ja) 情報推薦装置及び方法及びプログラム
KR101684582B1 (ko) 키워드 광고 관리 방법, 장치, 및 컴퓨터 프로그램
CN112307019B (zh) 数据处理方法、装置及非瞬时性计算机可读存储介质
US20140122257A1 (en) Apparatus and method for interfacing with a plurality of publishers
US9064230B2 (en) Ranking keywords for product types with manual curation

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150512

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150406

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160322

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160405

R150 Certificate of patent or registration of utility model

Ref document number: 5916959

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250