JP2010524099A - 更新パラメータを生成および相関するキーワードを表示するための方法および装置 - Google Patents

更新パラメータを生成および相関するキーワードを表示するための方法および装置 Download PDF

Info

Publication number
JP2010524099A
JP2010524099A JP2010502405A JP2010502405A JP2010524099A JP 2010524099 A JP2010524099 A JP 2010524099A JP 2010502405 A JP2010502405 A JP 2010502405A JP 2010502405 A JP2010502405 A JP 2010502405A JP 2010524099 A JP2010524099 A JP 2010524099A
Authority
JP
Japan
Prior art keywords
keyword
feature value
search
keywords
main
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010502405A
Other languages
English (en)
Other versions
JP5238800B2 (ja
Inventor
レイ パン
ユアンフ ヤオ
ツェン ヤン
ティアンジ チャン
Original Assignee
アリババ グループ ホールディング リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アリババ グループ ホールディング リミテッド filed Critical アリババ グループ ホールディング リミテッド
Publication of JP2010524099A publication Critical patent/JP2010524099A/ja
Application granted granted Critical
Publication of JP5238800B2 publication Critical patent/JP5238800B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90324Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

更新パラメータ生成方法が提供される。この方法では、所定の期間内にユーザーが使った検索キーワードを取得し、それらの検索キーワードをカウントして、主キーワード、関連キーワード、各主キーワードとその関連キーワードのそれぞれとが一緒に検索された連携検索頻度、および各主キーワードが単独で検索された検索頻度を求める。また、主キーワードが単独で検索された検索頻度に基づいて第1特徴値を算定し、これらの第1特徴値と、主キーワードとそれぞれの関連キーワードとの連携検索頻度に基づいて第2特徴値を算定する。これらの第2特徴値が、関連キーワードの表示モードを決定するための更新パラメータとして使用される。さらに、更新パラメータ生成装置と、更新パラメータに従って関連キーワードを表示する方法および装置も提供される。本発明の解決手段は、絶えずユーザーの動向に合わせることでユーザーが高い満足感を得られるようにするとともに、計算性能と効率を向上させる。サービス提供者にとっても、何ら特別な秘密アルゴリズムを必要とせず、簡単に操作でき、開発コストも低くてすむ。

Description

この出願は、中国特許庁に2007年4月10日付けで出願された、「更新パラメータを生成する方法および装置、ならびに関連キーワードを表示する方法および装置」という名称の中国特許出願第200710095848.7号に基づく優先権を主張しており、この中国特許出願の全内容を参照によって組み込むものである。
本発明はデータ処理の分野に関し、詳しくは、更新パラメータを生成する方法および装置ならびに関連キーワードを表示する方法および装置に関する。
インターネットなどのデータネットワークやデータシステム上でテキストやマルチメディアを使用する機会が急速に増えるにつれて、ユーザーが必要な情報を見つけ出すためにキーボードベースの検索ツールに頼ることが益々多くなってきた。通常ユーザーは、探したい情報文書のキーワードを検索ツールや検索エンジンに入力する。すると検索ツールまたはエンジンは、インデックス付きのデータベースにて検索を行い、検索結果をユーザーに示す。一般的に、既存の検索ツールまたはエンジンは、現ウェブページ上または現検索結果ページ上に、ユーザーの入力したキーワード(つまり主キーワード)に対応する関連キーワードも1つ以上表示することができる。
周知のように、殆どのユーザーは、検索エンジンでオンライン情報検索を開始し、キーワードを入力して必要な情報を検索するのが一般的である。社会の急速な変化と文化の継続的な発展に伴い、多くの固定的キーワードではユーザーの多様なニーズに応えられなくなってきている。特に、爆発的に増えた情報量ゆえに、既存のキーワード検索方法は、もはやユーザーの多様なニーズに応えられなくなっている。キーワードの記録は固定されており、かなり以前に作られ、まれにしか更新されないこともあるので、変化するオンラインコンテンツの要求を満たせなくなっている。例えば「衣類」というキーワードが主キーワードである場合を例に取ると、通常は、この主キーワードの関連キーワードとして既存の技術で得られる単語は、「活動着」とか「ダウンコート」などである。しかし季節の変化とともに、ユーザーが本当に欲しい関連キーワードは、「春のファッション」であったり「夏のファッション」であったり「Tシャツ」であったりするかもしれない。しかし既存の技術では、得られるキーワードをユーザーの使用傾向に適応させられない。
このように、現行技術によるキーワード検索は、殊に、使用されるキーワードをユーザーの使用傾向に適応させられないという点で、ユーザーのニーズを満たせない。
本発明は、使用するキーワードをユーザーの使用傾向に適応するよう更新するパラメータを生成する方法および装置を提供することを目的とする。
これに対応して、本発明の他の目的は、ユーザーが関連キーワードを簡単且つ包括的に得ることを確実にする関連キーワード表示方法および装置を提供することにある。
上記目的を達成するために、本発明の実施例は、更新パラメータ生成方法を開示する。この方法では、所定の期間内にユーザーが使った検索キーワードを収集し、これらの検索キーワードをカウントして、主キーワード、関連キーワード、各主キーワードとその関連キーワードのそれぞれとが一緒に検索された連携検索頻度、および各主キーワードが単独で検索された検索頻度を求め、主キーワードが単独で検索された検索頻度に基づいて第1特徴値を算定し、これらの第1特徴値および主キーワードとそれぞれの関連キーワードとの連携検索頻度に基づいて第2特徴値を算定する。そして、これらの第2特徴値を関連キーワードの表示モードを決定するための更新パラメータとして使用する。
前記方法において、更に主キーワードと関連キーワードと第2特徴値を記録することでキーワード情報テーブルを作成することが望ましい。
検索キーワードの計数と、第1特徴値の算定と、第2特徴値の算定とを、マルチスレッド方式で同時に実行することが望ましい。
前記方法が、第1特徴値を算定する前に、フィルタリング規則に合う検索キーワードを除外するステップを更に含むことが望ましい。
前記方法において、第2特徴値を算定するために、各主キーワードとその関連キーワードのそれぞれとの相関度を、これらが一緒に検索された頻度に基づき算定し、キャッシュメモリから第1特徴値を取り出して、これらの第1特徴値および相関度に基づいて第2特徴値を算定することが望ましい。
前記キーワード情報テーブルに、主キーワードに対応する第1特徴値も記録されていることが望ましい。
検索キーワードには、検索側ユーザーによって使われる検索キーワードと、広告側ユーザーによって掲示される広告キーワードとが含まれることが望ましい。
本発明の実施例は、更に更新パラメータ生成装置を開示している。この装置において、取得ユニットは、所定の期間内にユーザーが使った検索キーワードを取得するためのものであり、統計ユニットは、各検索キーワードをカウントして、主キーワードと、関連キーワードと、各主キーワードとそれぞれの関連キーワードが共に検索された連携検索頻度と、各主キーワードが単独で検索された単独検索頻度とを算定するためのものであり、第1計算ユニットは、主キーワードの単独検索頻度に基づいて第1特徴値を算定するためのものであり、第2計算ユニットは、これらの第1特徴値と、各主キーワードとそれぞれの関連キーワードの連携検索頻度とに基づいて、第2特徴値を算定するためのものである。これらの第2特徴値が、関連キーワードの表示モードを決定する更新パラメータとして用いられる。
前記装置は、更に、主キーワードと関連キーワードと第2特徴値を記録することでキーワード情報テーブルを作成する記録ユニットを備えていることが望ましい。
前記装置は、更に、統計ユニットに接続された、フィルタリング規則に当てはまる検索キーワードを除外するためのフィルタリングユニットを備えていることが望ましい。
前記第2計算ユニットは、各主キーワードと関連キーワードのそれぞれとが一緒に検索された頻度に基づき各々の相関度を算定する相関度計算部と、キャッシュメモリから第1特徴値を読み出して、これらの第1特徴値および相関度に基づいて第2特徴値を算定する取得/計算部とを備えていることが望ましい。
前記装置は、記録ユニットに接続された、第1特徴値をキーワード情報テーブルに記録するために用いられる追加ユニットを更に備えていることが望ましい。
本発明の実施例は、更に、関連キーワード表示方法を開示している。この方法では、ユーザーにより入力された主キーワードに対応する関連キーワードの取得要求を行う。この要求に基づき、第2特徴値が閾値以上の関連キーワードが取得される。第2特徴値は、第1特徴値と、主キーワードが関連キーワードと一緒に検索された連携検索頻度とに基づいて算定され、第1特徴値は主キーワードの単独検索頻度に基づいて算定される。主キーワードと関連キーワードの連携検索頻度および主キーワードの単独検索頻度は、検索キーワードをカウントすることによって求められる。こうして取得された関連キーワードが表示される。
この方法において、閾値未満の第2特徴値を有する関連キーワードも表示することが望ましい。
第2特徴値が閾値以上の関連キーワードは、主キーワードと関連キーワードと第2特徴値とを保有するキーワード情報テーブルから取得することが望ましい。
本発明の実施例は、更に、関連キーワード表示装置を開示している。この装置は、ユーザーにより入力された主キーワードに対応する関連キーワードの取得要求を行うためのインターフェースユニットを備えている。また、この要求に応じて閾値以上の第2特徴値を有する関連キーワードを取得するための関連キーワード取得ユニットを備えている。第2特徴値は、第1特徴値と、主キーワードが関連キーワードと一緒に検索された連携検索頻度とに基づいて求められ、第1特徴値は主キーワードの単独検索頻度に基づいて求められる。主キーワードと関連キーワードの連携検索頻度および主キーワードの単独検索頻度は、検索キーワードをカウントすることにより求められる。この装置は、更に、取得された関連キーワードを表示するための第1表示ユニットを備えている。
前記表示装置が、閾値未満の第2特徴値を有する関連キーワードを表示するための第2表示ユニットを更に備えていることが望ましい。
このように、本発明の実施例では、キーワードを常に時流に乗ったものにするために、所定の期間内にユーザーが使用した検索キーワードの統計分析を行う。第2特徴値を関連キーワードの表示モード決定のためのパラメータとして用いることで、最近の使用傾向に合った関連キーワードが優先的にユーザーに提供されるので、ユーザーが満足できる検索結果が得られるようになる。
本発明による更新パラメータ生成方法の実施例のフローチャートを示す図である。 本発明による更新パラメータ生成装置の実施例の構造を示す図である。 本発明による関連キーワード表示方法の実施例のフローチャートを示す図である。 本発明による関連キーワード表示装置の実施例の構造を示す図である。
本発明の目的、特徴および利点をより明確かつ容易に理解するために、以下の実施例で本発明を更に詳細に説明する。
本発明の実施例は、主キーワードとこれに対応する関連キーワードとの間の相関パラメータを更新すること、および更新された相関パラメータに従って各関連キーワードのアウトプットを制御することによって、ユーザーの検索要求をより満足させる関連キーワードを提供する。
図1は、本発明による更新パラメータの生成方法の実施例のフローチャートを示す。この方法は、以下に述べる手順を含む。
ブロック101では、所定の期間内にユーザーが使った検索キーワードを取得する。
所定の期間は、当業者が必要に応じて予め定めてよい。例えば、ショッピング用ウェブサイトで、ユーザーの最近の使用傾向に合った関連製品のキーワードを得るためには、上記所定の期間を一週間から一ヶ月位に設定するとよい。検索キーワードは、データベース、スクリプトプログラム、ローカルプログラム、ユーザーの入力履歴、ユーザーのクライアント端末、サーバーまたは他の装置の記憶装置などから取り込むことができる。つまり本発明は、この方法を限定するものではない。
ブロック102では、検索キーワードをカウントして、主キーワードと関連キーワードを求め、各主キーワードとその関連キーワードのそれぞれとが一緒に検索された連携検索頻度および各主キーワードが単独で検索された単独検索頻度を算定する。
現行技術において、キーワードは固定されており、かなり以前に作られ、まれにしか更新されないので、これらの技術は、アクティブなオンラインコンテンツの即時的更新と使用には適しておらず、したがってユーザーの要求を満たせなくなっている。ここに提供する解決法は、主キーワードと関連キーワードの統計分析を用いて、変化する使用傾向に合った関連キーワードをユーザーが確実に得られるようにするものである。実施に当たり、主キーワードと関連キーワードを求め、各主キーワードとそれぞれの関連キーワードが一緒に検索された連携検索頻度と、各主キーワードが単独で検索された単独検索頻度とを算定する方法としては、利用可能であればどのような方法を用いてもよい。例えば、1つの検索キーワードを主キーワードとみなし、この主キーワードと共に検索されたキーワードを、この主キーワードの関連キーワードとみなす。それから、各主キーワードとその関連キーワードのそれぞれが一緒に検索された連携検索頻度と、各主キーワードが単独で検索された頻度とを別々に算定する。
以下に述べる算定方法は、アプリオリアルゴリズムに基づいており、一例として説明するものである。アプリオリアルゴリズムは基本的に次のようなプロセスを含む:(1)トランザクション型データベースを走査して、最低支持レベル以上の支持のある全ての項目を見つけ出し、高頻度項目セットL1を作り、(2)L1の項目をリンク付けし、(3)L1の項目のフィルタリングによりトランザクション型データベースを走査して、別の最低支持レベル以上の支持のある項目のセットL2を取り出し、(4)L2の項目をリンク付けし、(5)L2の項目のフィルタリングによりトランザクション型データベースを走査して、さらに別の最低支持レベル以上の支持のある項目のセットL3を取り出す、といったプロセスを繰り返す。表1は、この方法を用いて取得した検索キーワードを示す。表2は、主キーワードと、これらの主キーワードが単独で検索された各単独検索頻度を示す。表3は、主キーワードと共に検索された各関連キーワードの総計と、それぞれの連携検索頻度を示す。
Figure 2010524099
Figure 2010524099
Figure 2010524099
このように、上記の頻度計数規則を用いて、主キーワードと関連キーワード、各主キーワードとそれぞれの関連キーワードの連携検索頻度、各主キーワードの単独検索頻度を検出することができる。
なお上記の方法は、本発明を説明するための一例にすぎず、経験や必要に応じて、相関ルールマイニングのような別の方法を用いることもできる。つまり本発明は、上記の方法に限定されるものではない。
本発明の好ましい実施例では、更に、フィルタリング規則に当てはまる検索用語を取り除く作業が行なわれる。フィルタリング規則は、当業者が経験や必要に基づいて予め定めることができる。例えば、表4に、一緒に検索された頻度が2回より少ない主キーワードと関連キーワードの項目を取り除くというフィルタリング規則を適用した場合に得られる結果を示す。
Figure 2010524099
あるいは、フィルタリング規則として、無効ないし不正なキーワードである検索キーワードや、無効ないし不正な記号や語句を含んだ検索キーワードを除去する設定をしてもよい。すなわち、本発明は、このやり方についても限定しない。
ブロック103では、主キーワードの単独検索頻度に基づいて第1特徴値を算定する。
キーワードの使用傾向をユーザーの検索需要を更に満足させるものに合わせる目的で、第1特徴値は、各キーワードの人気を表すものとして求められる。このため、第1特徴値は、主キーワードの単独検索頻度と所定の人気度との比較によって求められる。したがって、第1特徴値の算定式の一例は次のようになる:
第1特徴値=主キーワードの単独検索頻度/所定の人気度基準値
表5に一例を示す。
Figure 2010524099
上の表において、所定の人気度基準値が20とすると、「バイク」についての第1特徴値は2/20=0.1となり、「Eバイク」についての第1特徴値は1/20=0.05となる。人気度基準値は、主キーワードの単独検索頻度の中央値とすることが望ましい。例えば、主キーワードの10%がそれぞれ単独で10回検索され、主キーワードの80%がそれぞれ単独で20回検索され、主キーワードの10%がそれぞれ単独で50回検索された場合、20という値が、人気度基準値として用いられる。人気度基準値は、予め経験や必要に基づいて決めてもよく、本発明は、このやり方について限定するものではない。
第1特徴値とその算定方法を、経験や必要に基づいて決めてもよい。つまり、上記の方法は、本発明を説明するためだけのものであり、本発明は、この方法に限定されるものではない。
ブロック104では、第1特徴値と、各主キーワードがそれぞれの関連キーワードと共に検索された頻度である連携検索頻度とに基づいて第2特徴値を算定する。第2特徴値は、関連キーワードの表示モードを決定する更新パラメータとして用いられる。
上記の実施例から、実際に適用する当たり、主キーワードと関連キーワードとの間の相関パラメータを求める必要があることが分かる。この実施例においては、第1特徴値と、各主キーワードとそれぞれの関連キーワードの連携検索頻度とに基づいて求められる第2特徴値が、そのような相関パラメータの代表例である。第2特徴値がキーワードの使用傾向を十分反映するようにするために、本実施例において以下のような手順で第2特徴値を算定するのが望ましい。
サブブロックA1で、各主キーワードとその関連キーワードのそれぞれとの相関度を、これらが一緒に検索された頻度に基づき算定する。
サブブロックA2で、キャッシュメモリから第1特徴値を取り出して、これらの第1特徴値および相関度に基づいて第2特徴値を算定する。
詳しくは、先ず、各主キーワードがその関連キーワードのそれぞれと一緒に検索された頻度に基づいて、次のような算定式の一例により相関度を算定する:
相関度=1つの主キーワードと1つの関連キーワードが一緒に検索された頻度/相関度の所定の基準値
表5のデータを用いた場合、相関度の所定の基準値が10だとすると、「バイク」という主キーワードと「Eバイク」という関連キーワードとの間の相関度は、表における「バイク」および「Eバイク」の共出現頻度を10で割った値、すなわち2/10=0.2に相当する。相関度の所定の基準値は、各主キーワードとそれぞれの関連キーワードとの連携検索頻度の中央値であることが望ましい。相関度の基準値を予め経験や必要に基づいて決めてもよく、本発明は、相関度の基準値の決め方について限定を設けない。
計算効率を高めるために、本実施例において、第1特徴値をキャッシュメモリに保存し、第2特徴値を算定するときに、第1特徴値を直接キャッシュメモリから取り出すとよい。そして第2特徴値を第1特徴値と相関度とに基づいて算定する。キャッシュメモリからのデータ読出しが、データベースや他の装置からのデータ読出しより遙かに高速であることは自明である。したがって、本発明の好ましい実施例は計算性能を向上させるものである。また、キャッシュメモリにデータを保存する場合、ハッシュ形式で保存することができ、ファイル形式やその他の形式で保存することもできる。第1特徴値の読み出しを容易にするために、主キーワードの分類や等級付けといった動作を設定して最適化するとよい。最適化の方法について、本発明はいかなる限定も行わない。
ユーザーの必要により密接した第2特徴値を得るために、第1特徴値と相関度とを別々に重み付けして、重み付けされた結果を第2特徴値とすることが望ましい。例えば、先の例の「Eバイク」というキーワードの第1特徴値0.05を0.4で重み付けし、「バイク」という主キーワードと「Eバイク」という関連キーワードとの間の相関度0.2を0.6で重み付けした場合、「バイク」という主キーワードと「Eバイク」という関連キーワードに対する第2特徴値は、0.05×0.4+0.2×0.6=0.14となる。
重み付け値は、経験や必要に基づいて予め定めてもよいし、ユーザーの必要に基づいて任意に変更することもできる。つまり本発明は、このやり方について限定を加えるものではない。計算結果の一貫性を保つために、重み付け値の合計を1または別の1つの値に設定するとよい。
なお当業者にとって、第2特徴値を算定するために他の方式を用いてもよいことは自明であり、本発明は、これについても制限を設けない。
第2特徴値は、関連キーワードの表示モードを決定する更新パラメータとみなされる。例えば、閾値以上の第2特徴値を有する関連キーワードを優先的または常に表示し、閾値未満の第2特徴値を有する関連キーワードは順番に表示するかまたは表示しない。第2特徴値に基づいて関連キーワードをどのように表示するかは、当業者が経験と必要に基づき任意に設定してよく、本発明は、このやり方についても限定しない。
システムの計算性能と計算効率を高めるために、検索キーワードの計数処理と、第1特徴値の算定および第2特徴値の算定をおこなう処理とを、マルチスレッド方式で同時に実行することが望ましい。
マルチスレッド処理のメカニズムは、各命令ストリームを1つのスレッドとして複数の命令ストリームを同時に実行することを可能とする。各スレッドは、それぞれに独立している。複数のスレッドが同時に、つまり論理上同時進行で実行される。つまりマルチスレッド動作とは、N個の実行すべきことが同時に存在し、いくつかの異なる実行スレッドにしたがって同時進行で実行されている状況を指す。実施例では、計算性能と計算効率を高めるために、検索キーワードを計数するスレッドと、特徴値(第1特徴値および第2特徴値を含む)を算定するスレッドとを同時に実行して、対応する関連キーワードを順番に処理する。
さらに実施例では、主キーワードと関連キーワードと第2特徴値を記録することが望ましい。記録は、ある種の記録表、ファイル形式または他の適当な形式で行ってよい。主キーワードと関連キーワードと第2特徴値を記録することでキーワード情報テーブルを作成することが更に望ましい。これにより、次の更新の際に、キーワード情報テーブルの元のデータを削除して、本発明の実施例の方法により更新されたデータを新たに書き込めばよくなる。更新は、定期的またはリアルタイムで、あるいはこれら2つの方法を交互に用いて行ってよい。例えば、更新を月に1回行うようにしてもよく、あるいは、当業者が自由に更新を行なってもよい。本発明は、更新の仕方を制限するものではない。
検索時にユーザーに検索のヒントを直に与えるような、より直感的な表示を行うために、本発明の実施例では、更に、関連する第1特徴値をキーワード情報テーブルに記録して、検索ツールの知能を更に高めるようにすることが望ましい。
実際的適用例として、異なるタイプのユーザーには異なるキーワードを提供するという設定が考えられる。例えば、ショッピングウェブサイトに関して、ユーザーには一般的に購入側と販売側のユーザーがある。このため、検索キーワードにも、検索側ユーザーによって使われる検索キーワードと、広告側ユーザーによって掲示される広告キーワードとが含まれることになる。
本発明をより明確に理解できるようにするために、検索キーワードが検索側ユーザーによって使われる検索キーワード(以下第1検索キーワードと称する)と、広告側ユーザーによって掲示される広告キーワード(以下第2検索キーワードと称する)とを含む例について、本発明を詳細に説明する。すなわち、この実施例は次のような手順を含む。
手順Aでは、所定の期間内に、第1スクリプトプログラムにおいて第1検索キーワードを取得する。第1検索キーワードは、ユーザーがブラウザーを開いてから、そのブラウザーを閉じるまでの間に検索に用いた検索キーワードから収集される。例えば、ブラウザーを使用したときに、ユーザーが検索フィールドを用いて多重検索を行って複数のキーワードを入力したとする。この場合、これらのキーワードは第1検索キーワードとしてカウントされる。表6は、第1検索キーワードである第1主キーワードと第1関連キーワード、第1主キーワードと第1関連キーワードとが一緒に検索された頻度、および第1主キーワードが単独で検索された頻度を示し、これらは統計的に求められる。
Figure 2010524099
手順Bでは、所定の期間内に、第2スクリプトプログラムにおいて第2検索キーワードを取得する。第2検索キーワードは、製品を掲示するユーザーが入力したキーワードから収集される。これらのキーワードは、通常4個以上のキーワードが掲示されるので、取得可能である。表7は、第2検索キーワードである第2主キーワードと第2関連キーワード、第2主キーワードと第2関連キーワードとが共に検索された頻度と、第2主キーワードが単独で検索された頻度とを示し、これらは統計的に求められる。
Figure 2010524099
手順Cでは、第1特徴値が次のようにして算定される。すなわち、所定の人気度基準値が20とすると、第1主キーワードのうち「バイク」の人気度により表される第1特徴値は2/20=0.1となり、第1関連キーワードのうち「Eバイク」の人気度により表される第1特徴値は1/20=0.05となる。第2主キーワードと第2関連キーワードに対する第1特徴値も、上記同様に算定される。
手順Dでは、相関度が次のようにして算定される。すなわち、相関度の所定の基準値を10とすると、「バイク」という主キーワードと「Eバイク」という関連キーワードとの間の第1相関度および第2相関度は、それぞれ、2/10=0.2と、1/10=0.1になる。経験に基づいて、それぞれ別の重み付け値を割り当てる。第1特徴値の重み付け値を0.2とし、第1相関度の重み付け値を0.3とし、第2相関度の重み付け値を0.5とする。したがって、主キーワードである「バイク」と関連キーワードである「Eバイク」に対する第2特徴値は、0.2×0.05+0.3×0.2+0.5×0.1=0.12となる。
上記の例では第1キーワードの第1特徴値と第2キーワードの第1特徴値が同じなので、計算効率を高めるために、計算には第1特徴値の1つだけを用いる。もちろん、2つの第1特徴値を用い、それぞれ異なる重み付けをおこなって計算結果を得てもよいことはいうまでもない。
手順Eでは、主キーワードと関連キーワードと第2特徴値を記録して、表8に示すようなキーワード情報テーブルを作成する。
Figure 2010524099
図2は、本発明による更新パラメータの生成装置の実施例の概略構造を示す図である。この装置において、取得ユニット201は、所定の期間内にユーザーが使った検索キーワードを取得するために用いられる。統計ユニット202は、検索キーワードをカウントして、主キーワードと関連キーワードを求め、且つ各主キーワードとそれぞれの関連キーワードが共に検索された連携検索頻度と、各主キーワードが単独で検索された単独検索頻度とを算定するために用いられる。第1計算ユニット203は、主キーワードの単独検索頻度に基づいて第1特徴値を算定するために用いられ、第2計算ユニット204は、第1特徴値と、各主キーワードとそれぞれの関連キーワードの連携検索頻度とに基づいて第2特徴値を算定するために用いられる。第2特徴値は、関連キーワードの表示モードを決定する更新パラメータとして用いられる。
装置は、更に、主キーワードと関連キーワードと第2特徴値を記録することでキーワード情報テーブルを作成する記録ユニットを備えていることが望ましい。
統計ユニットと、第1計算ユニットと、第2計算ユニットとを同時的マルチスレッド動作の処理に用いることが望ましい。
装置は、更に、フィルタリング規則に当てはまる検索キーワードのふるい分けのためのフィルタリングユニットを備えていることが望ましい。
第2計算ユニットは、各主キーワードと関連キーワードのそれぞれとが一緒に検索された頻度に基づき相関度を算定する相関度計算部と、キャッシュメモリから第1特徴値を取り出して、これらの第1特徴値および相関度に基づいて第2特徴値を算定する取得/計算部とを備えていることが望ましい。
装置は、関連する第1特徴値をキーワード情報テーブルに記録するための追加ユニットを更に備えていることが望ましい。
検索キーワードには、検索側ユーザーによって使われる検索キーワードと、広告側ユーザーによって掲示される広告キーワードとが含まれることが望ましい。
図2に示す更新パラメータの生成装置の実施例は、先に述べた更新パラメータの生成方法に対応するものといえるので、装置の説明は比較的簡略にした。省略されている詳細については、本発明の上記の関連する箇所の説明を参照されたい。
図3は、本発明による関連キーワードの追加方法を示す。この方法は次のような手順を含む。
ブロック301では、ユーザーにより入力された主キーワードに対応する関連キーワードの取得要求を行う。
ブロック302では、この取得要求に応じて、閾値以上の第2特徴値を有する関連キーワードを取得する。第2特徴値は、第1特徴値と、主キーワードおよび関連キーワードが一緒に検索された連携検索頻度とに基づき算定される。第1特徴値は、主キーワードの単独検索頻度に基づいて算定される。主キーワードが関連キーワードと共に検索された連携検索頻度および各主キーワードの単独検索頻度は、検索キーワードをカウントすることによって求められる。
ブロック303では、取得された関連キーワードを表示する。
検索ツールや検索エンジンを用いるときは、ユーザーは、キーボードや手書きパッドなどの入力手段を使って主キーワードを検索ボックスやツールバーに入力し、その後、確定のためにクリックするか、Enterキーを押すか、Tabキーを押すか、または他のトリガ方法でローカルプログラムまたは検索ページのスクリプトプログラムをトリガすることで、当該主キーワードに対応する関連キーワードの取得要求を行う。
第2特徴値は、一種の相関パラメータである。第2特徴値がキーワードの使用傾向を十分反映するようにするために、本実施例においては、先ず、主キーワードと関連キーワードが一緒に検索された頻度に基づいて相関度を算定するのが望ましい。例えば、次のような算定式の一例により相関度を算定することができる:
相関度=1つの主キーワードと1つの関連キーワードが一緒に検索された頻度
/相関度の所定の基準値
相関度の所定の基準値は、その主キーワードとそれぞれの関連キーワードとの連携検索頻度の中央値であることが望ましいが、当業者が予め経験や必要に基づいて決めてもよく、本発明は、これについて限定するものではない。
第1特徴値と相関度に基づいて算定された結果を第2特徴値として用いることができる。
別の実施例として、第1特徴値と相関度とを別々に重み付けして、重み付けされた結果を第2特徴値とすることもできる。重み付け値は、経験や必要に基づいて予め定めてもよいし、必要に基づいて任意に変更することもできる。つまり本発明は、これについて限定を加えるものではない。計算結果の一貫性を保つために、重み付け値の合計を1に設定するとよい。
当業者にとって、第2特徴値を算定するために他の方式を用いてもよいことは自明であり、本発明は、この算定方法ついても制限を設けない。
実施に当たり、主キーワードに対応する関連キーワードを表示するときに、閾値以上の第2特徴値を有する関連キーワードは常に表示するようにするとよい。閾値以上の第2特徴値を有するということは、これらの関連キーワードの主キーワードに対する相関性が高いということである。このため、関連キーワードが表示される度に、ユーザーの使用習慣に密接に繋がり、ユーザーの使用傾向に合ったお勧めの項目が常にユーザーに提供されるようになる。この結果、ユーザーの満足感が高まる。例えば、「バイク」という主キーワードに対して閾値(例えば0.2)以上の第2特徴値を有する関連キーワードが、電動バイク、マウンテンバイク、Eバイク、電動自転車、サスペンションバイク、スクーター、オートバイ、電動スクーター、ガススクーター、乗り物であるとする。固定された関連キーワードを用いる検索ツールの場合、これらの10個の関連キーワードが、「バイク」という主キーワードで検索する度に常に関連ウェブページに表示されることになる。関連キーワードを順番に表示する検索ツールの場合、これらの10個の関連キーワードが、交替表示される関連キーワードグループのいずれでも表示されるようにする。これにより、ユーザーが「バイク」に対応する関連キーワードを取得するよう要求したときに、要求の頻度に応じていずれかの関連キーワードグループがユーザーに表示されるが、どの関連キーワードグループの中にも、これらの10個の関連キーワードが含まれるようになる。
閾値未満の第2特徴値を有する関連キーワードは、任意の規則に従って表示するか、全く表示しないのが望ましい。例えば、決まった数の関連キーワードしか表示しない検索ツールでは、閾値以上の第2特徴値を有する関連キーワードを決まった数のみ表示するようにし、閾値未満の第2特徴値を有する関連キーワードは全く表示しない。関連キーワードを順番にまたは一覧表示する検索ツールでは、これらの関連キーワードを任意の規則に従って表示するとよい。しかし本発明は、これらの方法に限定されるものではない。
図4は、本発明による関連キーワード追加装置の実施例の概略構成を示す図である。この装置において、インターフェースユニット401は、ユーザーにより入力された主キーワードに対応する関連キーワードの取得要求を行うためのものである。関連キーワード取得ユニット402は、この取得要求に応じて、閾値以上の第2特徴値を有する関連キーワードを取得するためのものである。第2特徴値は、第1特徴値と、主キーワードおよび関連キーワードが一緒に検索された連携検索頻度とに基づき求められる。第1特徴値は、主キーワードの単独検索頻度に基づいて求められる。主キーワードと関連キーワードが一緒に検索された連携検索頻度および各主キーワードの単独検索頻度は、検索キーワードをカウントすることによって求められる。第1表示ユニット403は、取得された関連キーワードを表示するためのものである。
好ましい実施例において、装置には、閾値未満の第2特徴値を有する関連キーワードを表示するための第2表示ユニットを更に設けてもよい。
図4に示す関連キーワード表示装置の実施例は、図3の関連キーワード表示方法の実施例に対応するものといえるので、この装置の説明は比較的簡略にした。省略されている詳細については、本発明の上記の関連する箇所の説明を参照されたい。
このように、本発明の実施例では、所定の期間内にユーザーが使用した検索キーワードの統計分析を行うことで、キーワードを常に時季に即したものにしている。第2特徴値を関連キーワードの表示モード決定のための相関パラメータとして用いることで、ユーザーに対して最近の使用傾向に合った関連キーワードが提供されるので、ユーザーにとって良好な検索結果が得られるようになる。
また、ここに開示した方法および装置では、キーワード情報テーブルが作成される。更新時には、このテーブルのデータを適宜に更新しさえすればよいので、システムの処理効率が向上する。
さらに、検索キーワードの計数処理と特徴値の算定処理とをマルチスレッド方式で同時に実行してもよく、これによりシステムの計算性能と効率を高めることができる。
その上、第1特徴値をキャッシュメモリに保存することで、ここに開示した方法および装置は、システムの計算性能と効率を更に高めている。第1特徴値を記録することで、ここに開示した方法および装置は、主キーワードを表示する際に、その第1特徴値をユーザーが参照できるようにすることもできる。
そして、サービス提供者の観点からみても、本発明の実施例は、実施導入にあたり何ら特別な秘密アルゴリズムを必要とせず、簡単に操作でき、開発コストも低くてすむ。
以上、本発明の更新パラメータ生成方法および装置ならびに関連キーワード表示方法および装置を詳細に説明してきたが、上記実施例は、本発明の概念と実施形態を説明するためのものであって、本発明の方法および装置をより良く理解してもらうために用いたにすぎない。ここに開示した概念に基づいて本発明の実施例を変形応用することは、当業者にとって可能であろう。つまり、本発明の内容は、ここに開示した方法および装置に限定されるものと解釈されるべきではない。

Claims (17)

  1. 更新パラメータ生成方法であって、
    所定の期間内にユーザーが使った検索キーワードを取得すること、
    前記検索キーワードをカウントして、主キーワード、関連キーワード、各主キーワードとその関連キーワードのそれぞれとが一緒に検索された連携検索頻度、および各主キーワードが単独で検索された検索頻度を求めること、
    主キーワードが単独で検索された検索頻度に基づいて第1特徴値を算定すること、
    前記第1特徴値および前記主キーワードとそれぞれの関連キーワードとの連携検索頻度に基づいて第2特徴値を算定することを含み、
    前記第2特徴値は前記関連キーワードの表示モードを決定するための更新パラメータとして機能することを特徴とする方法。
  2. 前記主キーワードと関連キーワードと第2特徴値とを記録してキーワード情報テーブルを作成することを更に含む、請求項1に記載の方法。
  3. 検索キーワードの計数と、第1特徴値の算定と、第2特徴値の算定とを、マルチスレッド方式で同時に実行する、請求項1に記載の方法。
  4. 前記第1特徴値を算定する前に、フィルタリング規則に合う検索キーワードを除外することを更に含む、請求項1、2または3に記載の方法。
  5. 前記第2特徴値を算定することが、
    各主キーワードとその関連キーワードのそれぞれとの相関度を、これらが一緒に検索された頻度に基づき算定することと、
    キャッシュメモリから第1特徴値を取り出して、これらの第1特徴値および前記相関度に基づいて第2特徴値を算定することを含む、請求項1に記載の方法。
  6. 前記キーワード情報テーブルが、主キーワードに対応する第1特徴値を有する、請求項2に記載の方法。
  7. 検索キーワードには、検索側ユーザーによって使われる検索キーワードと、広告側ユーザーによって掲示される広告キーワードとが含まれる、請求項1、2、3、5または6に記載の方法。
  8. 更新パラメータ生成装置であって、
    所定の期間内にユーザーが使った検索キーワードを取得するための取得ユニットと、
    前記検索キーワードをカウントして、主キーワード、関連キーワード、各主キーワードとその関連キーワードのそれぞれとが一緒に検索された連携検索頻度、および各主キーワードが単独で検索された検索頻度を求めるための統計ユニットと、
    主キーワードが単独で検索された検索頻度に基づいて第1特徴値を算定するための第1計算ユニットと、
    前記第1特徴値および前記各主キーワードとそれぞれの関連キーワードとの連携検索頻度に基づいて第2特徴値を算定するための第2計算ユニットとを備えており、前記第2特徴値が、前記関連キーワードの表示モードを決定するための更新パラメータとして使用される装置。
  9. 主キーワードと関連キーワードと第2特徴値とを記録してキーワード情報テーブルを作成するための記録ユニットを更に備える、請求項8に記載の装置。
  10. 前記統計ユニットに接続され、フィルタリング規則に合う検索キーワードをふるい分けるためのフィルタリングユニットを更に備える、請求項8または9に記載の装置。
  11. 前記第2計算ユニットが、
    各主キーワードとその関連キーワードのそれぞれとの相関度を、これらが一緒に検索された頻度に基づき算定する相関度計算部と、
    キャッシュメモリから前記第1特徴値を取り出し、前記第1特徴値および前記相関度に基づいて前記第2特徴値を算定するための取得/計算部を備える、請求項8に記載の装置。
  12. 前記記録ユニットに接続され、前記第1特徴値を前記キーワード情報テーブルに記録するための追加ユニットを更に備える、請求項9に記載の装置。
  13. 関連キーワード表示方法であって、
    ユーザーにより入力された主キーワードに基づいて関連キーワードの取得要求を行うこと、
    この要求に応じて、閾値以上の第2特徴値を有する関連キーワードを取得すること、
    取得した関連キーワードを表示することを含み、
    前記第2特徴値は、第1特徴値と、主キーワードが関連キーワードと一緒に検索された連携検索頻度とに基づいて算定され、前記第1特徴値は主キーワードの単独検索頻度に基づいて算定され、前記主キーワードが関連キーワードと一緒に検索される連携検索頻度および前記主キーワードの単独検索頻度は、検索キーワードをカウントすることによって求められる方法。
  14. 閾値未満の第2特徴値を有する関連キーワードを表示することを更に含む、請求項13に記載の方法。
  15. 前記閾値以上の第2特徴値を有する前記関連キーワードを取得することは、
    前記主キーワードと前記関連キーワードと前記第2特徴値とを保有するキーワード情報テーブルから、第2特徴値が閾値以上の前記関連キーワードを取得することを含む、請求項13に記載の方法。
  16. 関連キーワード表示装置であって、
    ユーザーにより入力された主キーワードに対応する関連キーワードの取得要求を行うためのインターフェースユニットと、
    この要求に応じて閾値以上の第2特徴値を有する関連キーワードを取得するための関連キーワード取得ユニットと、
    前記取得された関連キーワードを表示するための第1表示ユニットとを備えており、
    前記第2特徴値は、第1特徴値と、主キーワードが関連キーワードと一緒に検索された連携検索頻度とに基づいて求められ、前記第1特徴値は前記主キーワードの単独検索頻度に基づいて求められ、前記主キーワードと関連キーワードの連携検索頻度および前記主キーワードの単独検索頻度は、検索キーワードをカウントすることにより求められる装置。
  17. 閾値未満の第2特徴値を有する関連キーワードを表示する第2表示ユニットを更に備える、請求項16に記載の装置。
JP2010502405A 2007-04-10 2007-08-28 更新パラメータを生成および相関するキーワードを表示するための方法および装置 Expired - Fee Related JP5238800B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN2007100958487A CN101286150B (zh) 2007-04-10 2007-04-10 生成更新参数的方法和装置、展示相关关键词的方法和装置
CN200710095848.7 2007-04-10
PCT/CN2007/070573 WO2008122181A1 (en) 2007-04-10 2007-08-28 Method and device for generating updating parameter, and method and device for showing related keyword

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2013076189A Division JP6066077B2 (ja) 2007-04-10 2013-04-01 更新パラメータを生成および相関するキーワードを表示するための方法および装置

Publications (2)

Publication Number Publication Date
JP2010524099A true JP2010524099A (ja) 2010-07-15
JP5238800B2 JP5238800B2 (ja) 2013-07-17

Family

ID=39830463

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2010502405A Expired - Fee Related JP5238800B2 (ja) 2007-04-10 2007-08-28 更新パラメータを生成および相関するキーワードを表示するための方法および装置
JP2013076189A Active JP6066077B2 (ja) 2007-04-10 2013-04-01 更新パラメータを生成および相関するキーワードを表示するための方法および装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2013076189A Active JP6066077B2 (ja) 2007-04-10 2013-04-01 更新パラメータを生成および相関するキーワードを表示するための方法および装置

Country Status (6)

Country Link
US (3) US8676811B2 (ja)
EP (1) EP2136302A4 (ja)
JP (2) JP5238800B2 (ja)
CN (1) CN101286150B (ja)
HK (1) HK1120897A1 (ja)
WO (1) WO2008122181A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014112445A (ja) * 2014-03-14 2014-06-19 Yahoo Japan Corp 広告主向け参考情報提供装置

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101286150B (zh) 2007-04-10 2010-09-15 阿里巴巴集团控股有限公司 生成更新参数的方法和装置、展示相关关键词的方法和装置
CN102033886B (zh) * 2009-09-25 2012-07-04 香港纺织及成衣研发中心 一种织物检索方法及系统
US9262482B2 (en) * 2010-04-19 2016-02-16 Facebook, Inc. Generating default search queries on online social networks
CN102654862B (zh) * 2011-03-01 2016-02-17 腾讯科技(深圳)有限公司 信息相关性分析方法和装置
TW201322022A (zh) * 2011-11-24 2013-06-01 Alibaba Group Holding Ltd 分散式資料流處理方法及其系統
CN103455487B (zh) * 2012-05-29 2018-07-06 腾讯科技(深圳)有限公司 一种搜索词的提取方法及装置
US20160306887A1 (en) * 2013-12-03 2016-10-20 Beijing Qihoo Technology Company Limited Methods, apparatuses and systems for linked and personalized extended search
JP6114707B2 (ja) * 2014-02-28 2017-04-12 富士フイルム株式会社 商品検索装置、商品検索システム、サーバシステム及び商品検索方法
US9754037B2 (en) 2014-08-27 2017-09-05 Facebook, Inc. Blending by query classification on online social networks
US9703859B2 (en) * 2014-08-27 2017-07-11 Facebook, Inc. Keyword search queries on online social networks
US9990441B2 (en) * 2014-12-05 2018-06-05 Facebook, Inc. Suggested keywords for searching content on online social networks
CN105302879B (zh) * 2015-10-12 2019-03-08 百度在线网络技术(北京)有限公司 用于确定用户需求的方法与装置
CN105302894A (zh) * 2015-10-21 2016-02-03 中国石油大学(华东) 一种基于并行关联规则的舆情热点跟踪方法与跟踪装置
CN105354185B (zh) * 2015-10-30 2018-05-18 上海智臻智能网络科技股份有限公司 用于问答系统挖掘关联问句的方法及装置
CN107291707A (zh) * 2016-03-30 2017-10-24 阿里巴巴集团控股有限公司 确定词组关联度的方法、品牌竞争度的方法及其装置
CN106970952A (zh) * 2017-03-09 2017-07-21 浙江中诚工程管理科技有限公司 报表生成方法及系统
CN107330672B (zh) * 2017-07-03 2021-02-26 北京拉勾科技有限公司 一种基于相似度的信息处理方法、装置及计算设备
EP3679488A4 (en) * 2017-09-08 2021-05-19 Open Text SA ULC SYSTEM AND METHOD FOR RECOMMENDING TERMS, INCLUDING RECOMMENDING SEARCH TERMS IN A SEARCH SYSTEM
CN110489652B (zh) * 2019-08-23 2022-06-03 重庆邮电大学 基于用户行为检测的新闻推荐方法、系统及计算机设备
CN111191119B (zh) * 2019-12-16 2023-12-12 绍兴市上虞区理工高等研究院 一种基于神经网络的科技成果自学习方法及装置
CN111324804B (zh) * 2020-02-21 2023-09-22 抖音视界有限公司 搜索关键词推荐模型生成方法、关键词推荐方法与装置
US11016980B1 (en) * 2020-11-20 2021-05-25 Coupang Corp. Systems and method for generating search terms
CN112835919B (zh) * 2021-02-24 2022-04-26 武汉联影医疗科技有限公司 医学数据库更新方法、装置、计算机设备和存储介质
CN113221004A (zh) * 2021-05-21 2021-08-06 珠海金山网络游戏科技有限公司 一种关键词展示方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06314296A (ja) * 1993-03-02 1994-11-08 Fujitsu Ltd 情報検索システム
JPH09319767A (ja) * 1996-05-29 1997-12-12 Oki Electric Ind Co Ltd 類義語辞書登録方法
JP2002007450A (ja) * 2000-06-16 2002-01-11 Matsushita Electric Works Ltd 検索支援システム
JP2002507794A (ja) * 1998-03-16 2002-03-12 エヌビーシーアイ・ニュ−ジーランド・エルエルシー 改良されたサーチエンジン

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0756948A (ja) * 1993-08-09 1995-03-03 Fuji Xerox Co Ltd 情報検索装置
US6006225A (en) * 1998-06-15 1999-12-21 Amazon.Com Refining search queries by the suggestion of correlated terms from prior searches
US6144958A (en) 1998-07-15 2000-11-07 Amazon.Com, Inc. System and method for correcting spelling errors in search queries
US6523028B1 (en) * 1998-12-03 2003-02-18 Lockhead Martin Corporation Method and system for universal querying of distributed databases
JP3563682B2 (ja) 2000-09-12 2004-09-08 日本電信電話株式会社 次検索候補単語提示方法および装置と次検索候補単語提示プログラムを記録した記録媒体
AU2003212463A1 (en) * 2002-03-01 2003-09-16 Paul Jeffrey Krupin A method and system for creating improved search queries
JP2003323433A (ja) * 2002-05-07 2003-11-14 Hitachi Ltd 情報端末およびサーバ
US7853557B2 (en) * 2002-06-14 2010-12-14 Siebel Systems, Inc. Method and computer for responding to a query according to the language used
US7240049B2 (en) * 2003-11-12 2007-07-03 Yahoo! Inc. Systems and methods for search query processing using trend analysis
CN1922605A (zh) * 2003-12-26 2007-02-28 松下电器产业株式会社 辞典制作装置以及辞典制作方法
US8572233B2 (en) * 2004-07-15 2013-10-29 Hewlett-Packard Development Company, L.P. Method and system for site path evaluation using web session clustering
US7440947B2 (en) 2004-11-12 2008-10-21 Fuji Xerox Co., Ltd. System and method for identifying query-relevant keywords in documents with latent semantic analysis
US7406465B2 (en) 2004-12-14 2008-07-29 Yahoo! Inc. System and methods for ranking the relative value of terms in a multi-term search query using deletion prediction
US8185523B2 (en) * 2005-03-18 2012-05-22 Search Engine Technologies, Llc Search engine that applies feedback from users to improve search results
US8135728B2 (en) 2005-03-24 2012-03-13 Microsoft Corporation Web document keyword and phrase extraction
JP4774806B2 (ja) * 2005-05-25 2011-09-14 セイコーエプソン株式会社 ファイル検索装置、印刷装置、ファイル検索方法及びそのプログラム
US7739708B2 (en) 2005-07-29 2010-06-15 Yahoo! Inc. System and method for revenue based advertisement placement
US7558787B2 (en) * 2006-07-05 2009-07-07 Yahoo! Inc. Automatic relevance and variety checking for web and vertical search engines
US7779003B2 (en) 2006-07-17 2010-08-17 Siemens Medical Solutions Usa, Inc. Computerized search system for medication and other items
US7937403B2 (en) * 2006-10-30 2011-05-03 Yahoo! Inc. Time-based analysis of related keyword searching
CA2674294C (en) 2006-12-29 2017-03-07 Thomson Reuters Global Resources Information-retrieval systems, methods, and software with concept-based searching and ranking
US8285745B2 (en) 2007-03-01 2012-10-09 Microsoft Corporation User query mining for advertising matching
CN101286150B (zh) 2007-04-10 2010-09-15 阿里巴巴集团控股有限公司 生成更新参数的方法和装置、展示相关关键词的方法和装置
CN101477542B (zh) * 2009-01-22 2013-02-13 阿里巴巴集团控股有限公司 一种抽样分析方法、系统和设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06314296A (ja) * 1993-03-02 1994-11-08 Fujitsu Ltd 情報検索システム
JPH09319767A (ja) * 1996-05-29 1997-12-12 Oki Electric Ind Co Ltd 類義語辞書登録方法
JP2002507794A (ja) * 1998-03-16 2002-03-12 エヌビーシーアイ・ニュ−ジーランド・エルエルシー 改良されたサーチエンジン
JP2002007450A (ja) * 2000-06-16 2002-01-11 Matsushita Electric Works Ltd 検索支援システム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG200000931021; 大久保 雅且: 'WWW検索ログに基づく情報ニーズの抽出' 情報処理学会論文誌 第39巻 第7号, 19980715, 2250-2258ページ, 社団法人情報処理学会 *
JPN6012032838; 大久保 雅且: 'WWW検索ログに基づく情報ニーズの抽出' 情報処理学会論文誌 第39巻 第7号, 19980715, 2250-2258ページ, 社団法人情報処理学会 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014112445A (ja) * 2014-03-14 2014-06-19 Yahoo Japan Corp 広告主向け参考情報提供装置

Also Published As

Publication number Publication date
CN101286150A (zh) 2008-10-15
US8874588B2 (en) 2014-10-28
JP6066077B2 (ja) 2017-01-25
WO2008122181A1 (en) 2008-10-16
US9135370B2 (en) 2015-09-15
HK1120897A1 (en) 2009-04-09
US8676811B2 (en) 2014-03-18
US20140136551A1 (en) 2014-05-15
JP2013152744A (ja) 2013-08-08
CN101286150B (zh) 2010-09-15
EP2136302A1 (en) 2009-12-23
US20100121860A1 (en) 2010-05-13
US20150106391A1 (en) 2015-04-16
EP2136302A4 (en) 2010-11-24
JP5238800B2 (ja) 2013-07-17

Similar Documents

Publication Publication Date Title
JP5238800B2 (ja) 更新パラメータを生成および相関するキーワードを表示するための方法および装置
CN107145496B (zh) 基于关键词将图像与内容项目匹配的方法
TWI508011B (zh) Category information providing method and device
TWI496015B (zh) Text matching method and device
JP5693630B2 (ja) 広告抽出装置、広告抽出方法及び広告抽出プログラム
US8725717B2 (en) System and method for identifying topics for short text communications
US9177341B2 (en) Determining search relevance from user feedback
CN106682144A (zh) 页面展示方法和装置
JP2015191655A (ja) 推奨ページを生成するための方法及び装置
US8868570B1 (en) Selection and display of online content items
KR20110009198A (ko) 최다 클릭된 다음 객체들을 갖는 검색 결과
TWI539306B (zh) Information delivery method, processing server and merge server
US11748365B2 (en) Multi-dimensional search
TW201301064A (zh) 搜尋方法及設備
JP2014006757A (ja) コンテンツ配信装置
CN110442616B (zh) 一种针对大数据量的页面访问路径分析方法与系统
JP4834118B2 (ja) ファセットクエリを利用したサービス誘導入札装置及び方法
JP2014096119A (ja) Webサイト利用状況解析装置及び方法及びプログラム
JP2017167829A (ja) 検出装置、検出方法及び検出プログラム
CN104504156A (zh) 一种基于压缩感知理论的文本数据流抽样方法
JP6167029B2 (ja) レコメンド情報生成装置およびレコメンド情報生成方法
JP2016040719A (ja) 収益指標値生成システム及び収益指標値生成方法
JP6228425B2 (ja) 広告生成装置および広告生成方法
JP5903370B2 (ja) 情報検索装置、情報検索方法、及びプログラム
JP2023016661A (ja) 情報処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100830

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120629

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121001

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130301

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130401

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5238800

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160405

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees