JP6247292B2 - クエリ拡張 - Google Patents

クエリ拡張 Download PDF

Info

Publication number
JP6247292B2
JP6247292B2 JP2015523263A JP2015523263A JP6247292B2 JP 6247292 B2 JP6247292 B2 JP 6247292B2 JP 2015523263 A JP2015523263 A JP 2015523263A JP 2015523263 A JP2015523263 A JP 2015523263A JP 6247292 B2 JP6247292 B2 JP 6247292B2
Authority
JP
Japan
Prior art keywords
query
target
similarity
determining
correlation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015523263A
Other languages
English (en)
Other versions
JP2015526809A (ja
Inventor
ジュー リー
ジュー リー
ドン ジン
ドン ジン
ホアン ユンピン
ホアン ユンピン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Publication of JP2015526809A publication Critical patent/JP2015526809A/ja
Application granted granted Critical
Publication of JP6247292B2 publication Critical patent/JP6247292B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3338Query expansion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

(関連出願の相互参照)
本出願は、2012年7月20日に出願された中国特許出願第201210254810.0号、名称「Query Expansion Method and System」に対する外国優先権を主張するものであり、参照によりその全体が本明細書に組み込まれる。
本開示は、コンピュータデータ処理の分野に関し、より具体的には、クエリ拡張方法およびシステムに関する。
ネットワーク技術の発展によって、検索エンジンは、間断なく改良され、検索エンジンを通してインターネットから種々の情報が取得され得る。検索エンジンは、ユーザがインターネットで迅速に情報を取得するのを補助するための中心的な方法の1つになる。ユーザは、クエリ用語(クエリ)を検索エンジンに提出し、検索エンジンは、クエリに対応する検索結果をユーザに返す。
電子商取引用ウェブサイトで、より具体的には、大規模電子商取引用ウェブサイトで、ユーザは、通常、自分の所望する製品を検索し、見つけるためにクエリを使用する必要がある。ユーザによって入力されたクエリは、通常、ユーザの所望に従って形成されるので、大体クエリに対応する結果をもたらし得、それによって、低い精度の検索結果および頻繁な検索がもたらされる。したがって、検索エンジンは、通常、クエリ情報を強化し、ユーザによって入力されたクエリを知的に最適化するために、クエリを拡張または書き直し得、それによって、検索結果の精度を向上させ、同時に、ユーザによる頻繁な検索に起因してサーバにもたらされる圧力を低減させる。
従来のクエリ拡張方法は、クエリの終了時およびインデックスの終了時の拡張を含む。クエリ終了時の拡張は、主に、クエリの追加、置換、および削除を含む。すなわち、ユーザによって入力されたクエリから、ある文字またはある部分が加えられるか、置換されるか、または削除される。例えば、ユーザによって入力されたクエリが「Nokia(商標)携帯電話」である場合、それを「Nokia(商標)N95携帯電話」に変更するために、追加演算をクエリに適用し得るか、それを「Nokia(商標)」もしくは「携帯電話」に変更するために、削除演算をクエリに適用し得るか、またはそれを「Samsung(商標)携帯電話」もしくは「Apple(商標)携帯電話」に変更するために、置換演算をクエリに適用し得る、等である。インデックス終了時の拡張は、主に、インデックス終了時のクエリの同義語拡張を指す。同義語セットは、通常、従来のデータマイニングを通して取得される。ある用語が現れたときに、拡張のために、同義語セットからその同義語が抽出される。検索結果およびクエリの精度を確保するために、クエリ終了時およびインデックス終了時の同時拡張が採用され得る。換言すれば、クエリは、クエリ終了時およびインデックス終了時の双方でそれぞれ拡張され、同じ拡張用語に対応する結果が拡張結果として選択される。
実際の処理中に、検索エンジンは、通常、ある順序に従って検索するために、クエリ終了時に1つずつ拡張用語を選択し、その拡張用語をインデックス終了時の拡張用語とマッチさせ、そして、拡張用語間にマッチがあった場合に、拡張用語の検索結果を返し得る。この過程中に、クエリ終了時には複数の拡張用語がある一方で、インデックス終了時には1つの拡張用語だけしかない可能性がある。したがって、順序に従って、クエリ終了時の最後の拡張用語は、インデックス終了時のクエリ用語にマッチする。検索エンジンは、クエリ終了時の最後の拡張用語がインデックス終了時の拡張用語にマッチするまで、複数回検索する必要がある。したがって、検索エンジンの無効な検索回数、ならびにシステムが検索結果を返すまでの時間が増加し、システムの応答速度が低下し、また、システムリソースの占有期間が増加する。
本要約は、下段の発明を実施するための形態にさらに記述されている単純化された形式で一連の概念を紹介するために提供されている。本要約は、主張されている主題のあらゆる主要な特徴または重要な特徴を確認することが意図されておらず、主張されている主題の範囲を決定する上での支援として単独に用いられることも意図されていない。例えば、「手法」という用語は、上の文脈によって、および本開示の全体を通して容認される、装置(複数可)、システム(複数可)、方法(複数可)、および/またはコンピュータ読み出し可能な命令を指し得る。
本開示は、例示的なクエリ拡張方法を提供する。例えば、本手法は、検索エンジンによるクエリの検索およびマッチングの繰り返しに起因する、システムの応答速度および効率にも影響を及ぼす、過剰な検索回数およびシステムソースの占有期間の問題を解決し得る。
本開示は、例示的なクエリ拡張方法を開示する。ユーザによって入力されたクエリを受け取る。クエリに従って、クエリの正規化クエリを決定する。クエリ拡張を実行するために、クエリの拡張用語として、正規化クエリを使用する。
クエリの正規化クエリは、以下の方法を使用することによって決定され得る。ユーザの検索ログのセッション情報を取得する。単一のセッションに現れる全てのクエリを取得し、各クエリについて票数を計算するか、または数える。単一のセッションにおいて、各クエリの出現順序に従って、特定のクエリの前に現れる任意のクエリを(特定のクエリに対する)1票として数える。
全てのセッションにおける目標クエリの総票数、および目標クエリに対する単一のクエリの票数に従って、単一のクエリと目標クエリとの間の票類似度を決定する。票類似度に従って、単一のクエリと目標クエリとの間の相関度を決定する。単一のクエリと目標クエリとの間の相関度に従って、目標クエリの正規化クエリを決定する。
例えば、全てのセッションにおける目標クエリの総票数は、以下のように計算され得るか、または数えられ得る。目標クエリを含む1つ以上のセッションを取得する。各セッションにおける目標クエリの票数を計算する。目標クエリの総票数を取得するために、各セッションにおける目標クエリの票数を累算する。
例えば、目標クエリに対する単一のクエリの票数は、以下のように計算され得るか、または数えられ得る。単一のクエリおよび目標クエリを含む1つ以上のセッションを取得する。それぞれのセッションにおいて、単一のクエリが目標クエリに投票したかどうかを判定する。判定結果が肯定である場合、それぞれのセッションを選択する。目標クエリに対する単一のクエリの票数を取得するために、選択されたセッションにおける票数を計算する。
例えば、単一のクエリと目標クエリとの間の票類似度は、以下のように決定され得る。単一のクエリと目標クエリとの間の票類似度として、目標クエリに対する単一クエリの総票数と、(単一の製品に関して)目標クエリに対する全クエリの総票スコア数との割合。
別の例について、単一のクエリと目標クエリとの間の票類似度はまた、以下のようにも決定され得る。目標クエリに対する各票の重みおよび基数を決定する。重みおよび基数に従って、各票のスコアを計算する。単一のクエリと目標クエリとの間の票類似度として、目標クエリに対する単一クエリの総票スコアと、目標クエリに対する全クエリの総票スコアとの割合を使用する。
例えば、目標クエリの正規化クエリは、単一のクエリと目標クエリとの間の相関度に従って、以下のように決定され得る。正規化クエリの閾値を設定する。単一のクエリと目標クエリとの間の相関度値の値が正規化クエリの閾値を超えている場合、単一のクエリを目標クエリの正規化クエリとして決定する。
別の例について、目標クエリの正規化クエリはまた、単一のクエリと目標クエリのとの間の相関度に従って、以下のようにも決定され得る。正規化クエリのカテゴリは、同義語正規化クエリ、相関正規化クエリ、および拡張正規化クエリに分けられる。3つのカテゴリの値範囲は、それぞれ、降順で、相関度値に従って設定される。単一のクエリと目標クエリとの間の相関度が属する値範囲に対応するカテゴリを、単一のクエリおよび目標クエリの詳細なカテゴリとして決定する。
例えば、票類似度に従って、単一のクエリと目標クエリとの間の相関度を決定する前に、本方法はさらに、以下の演算を含み得る。ユーザの検索ログの検索結果のクリック情報を取得する。クリック情報から、目標クエリを含む検索結果を抽出する。目標クエリを含む検索結果の総クリック数、および目標クエリを含み、かつ単一のクエリに対応する検索結果の総クリック数に従って、単一のクエリと目標クエリ間のクリック類似度を決定する。
例えば、単一のクエリと目標クエリとの間の相関度は、票類似度およびクリック類似度に従って決定され得る。
例えば、単一のクエリと目標クエリとの間の相関度は、票類似度およびクリック類似度に従って、以下のように決定され得る。票類似度とクリック類似度との間の大きい方の値を、単一のクエリと目標クエリとの間の相関度として使用する。
あるいは、票類似度およびクリック類似度の重みを決定する。票類似度およびクリック類似度、ならびに1つ以上の予め設定された規則に従うそれらのそれぞれの重みに基づいて、単一のクエリと目標クエリとの間の相関度を計算する。
例えば、票類似度に従って、単一のクエリと目標クエリとの間の相関度を決定する前に、本方法はさらに、以下の演算を含む。サーバに記憶された販売者データを取得する。販売者データは、販売者が製品を記述するときの、決定された製品の記述情報を含む。販売者データを解析し、販売者データから、クエリおよびクエリの特性用語を抽出する。単一のクエリおよび目標クエリの特性用語に従って、特性類似度を決定する。
例えば、単一のクエリと目標クエリとの間の相関度は、以下のように決定され得る。単一のクエリと目標クエリとの間の相関度は、票類似度および特性類似度に従って決定され得る。
例えば、単一のクエリと目標クエリとの間の相関度は、票類似度および特性類似度に従って、以下のように決定され得る。各特性用語の特性値を計算する。特性用語およびその対応するクエリのクリック情報に従って、特性値を計算する。特性値に従って、単一のクエリと目標クエリとの間の特性類似度を計算する。
例えば、単一のクエリと目標クエリとの間の相関度に従って、目標クエリの正規化クエリを決定する前に、本方法はさらに、以下の演算を含み得る。単一のクエリと目標クエリとの間の意味的類似度および/またはカテゴリ類似度を決定する。
目標クエリの正規化クエリは、単一のクエリと目標クエリとの間の相関度に従って、以下のように決定され得る。目標クエリの正規化クエリは、単一のクエリと目標クエリとの間の相関度および意味的類似に従って決定され得る。あるいは、目標クエリの正規化クエリは、単一のクエリと目標クエリとの間の相関度およびカテゴリ類似に従って決定され得る。あるいは、目標クエリの正規化クエリは、単一のクエリと目標クエリとの間の相関度、意味的類似、およびカテゴリ類似に従って決定され得る。
例えば、単一のクエリと目標クエリとの間の意味的類似の決定は、以下の演算を含み得る。単一のクエリと目標クエリとの間の編集距離を決定する。編集距離は、ある用語を別の用語に変換するための、最も少ない編集演算数を指す。相関度と同じ定量的レベルを有する意味的類似度を取得するために、編集距離を正規化する。
本開示はまた、例示的なクエリ拡張システムも提供する。本システムは、クエリ入力モジュールと、正規化クエリ決定モジュールと、クエリ拡張モジュールとを含み得る。
クエリ入力モジュールは、ユーザによって入力されたクエリを取得する。正規化クエリ決定モジュールは、クエリに従って、クエリの正規化クエリを決定する。クエリ拡張モジュールは、クエリ拡張を実行するために、正規化クエリを、クエリの拡張用語として使用する。
正規化クエリ決定モジュールは、セッション情報取得モジュールと、クエリ票計算モジュールと、票類似度決定モジュールと、相関度決定モジュールと、正規化クエリ決定モジュールとを含み得る。
セッション情報取得モジュールは、ユーザの検索ログから、セッション情報を取得する。
クエリ票計算モジュールは、単一のセッションに現れる全てのクエリを取得し、各クエリについて票を数える。単一のセッションにおいて、各クエリの出現順序に従って、特定のクエリの前に現れる任意のクエリを(特定のクエリに対する)1票として数える。
票類似度決定モジュールは、全てのセッションにおける目標クエリの総票数、および目標クエリに対する単一のクエリの票数に従って、単一のクエリと目標クエリとの間の票類似度を決定する。
相関度決定モジュールは、票類似度に従って、単一のクエリと目標クエリとの間の相関度を決定する。
正規化クエリ決定モジュールは、単一のクエリと目標クエリとの間の相関度に従って、目標クエリの正規化クエリを決定する。
例えば、票類似度決定モジュールは、基数および重み決定ユニットと、スコア計算ユニットと、割合計算ユニットとを含み得る。基数および重み決定ユニットは、目標クエリに対する各票の重みおよび基数を決定する。スコア計算ユニットは、重みおよび基数に従って、各票のスコアを計算する。割合計算ユニットは、目標クエリに対する単一クエリの総票数スコアと、目標クエリに対する全クエリの総票数スコアとの割合を、単一のクエリと目標クエリとの間の票類似度として使用する。
例えば、正規化クエリ決定モジュールは、正規化クエリ閾値設定ユニットを含み得、該ユニットは、正規化クエリの閾値を設定し、単一のクエリと目標クエリとの間の相関度値が正規化クエリの閾値を超えている場合に、単一のクエリを目標クエリの正規化クエリとして決定する。
別の例について、正規化クエリ決定モジュールは、正規化クエリカテゴリ分類ユニットと、値範囲設定ユニットと、カテゴリ決定ユニットとを含み得る。正規化クエリカテゴリ分類ユニットは、正規化クエリカテゴリを、同義語正規化クエリ、相関正規化クエリ、および拡張正規化クエリに分ける。
値範囲設定ユニットは、降順で、相関度値に従って、3つのカテゴリの値範囲を設定する。
カテゴリ決定ユニットは、単一のクエリと目標クエリとの間の相関度が属する値範囲に対応するカテゴリを、単一のクエリおよび目標クエリの詳細なカテゴリとして決定する。
例えば、正規化クエリ決定モジュールは、クリック情報取得モジュールと、検索結果抽出モジュールと、クリック類似度決定モジュールとを含み得る。クリック情報取得モジュールは、ユーザの検索ログから、検索結果のクリック情報を取得する。検索結果抽出モジュールは、クリック情報から、目標クエリを含む検索結果を抽出する。クリック類似度決定モジュールは、目標クエリを含む検索結果の総クリック数、および目標クエリを含み、かつ単一のクエリに対応する検索結果の総クリック数に従って、単一のクエリと目標クエリとの間のクリック類似度を決定する。相関度決定モジュールは、票類似度およびクリック類似度に従って、単一のクエリと目標クエリとの間の相関度を決定する。
例えば、正規化クエリ決定モジュールはまた、販売者データ取得モジュール、データ解析モジュール、および特性類似度決定モジュールも含み得る。
販売者データ取得モジュールは、サーバに記憶された販売者データを取得する。販売者データは、販売者が製品を記述するときの、決定された製品の記述情報を含む。
データ解析モジュールは、販売者データを解析し、販売者データから、クエリならびにクエリの特性用語を抽出する。特性類似度決定モジュールは、単一のクエリおよび目標クエリの特性用語に従って、特性類似を決定する。相関度決定モジュールは、票類似度および特性類似度に従って、単一のクエリと目標クエリとの間の相関度を決定する。
例えば、特性類似度決定モジュールは、特性値計算ユニットを含み得、該ユニットは、各特性用語の特性値を計算し、特性値に従って、単一のクエリと目標クエリとの間の特性類似を計算する。特性値は、特性用語およびその対応するクエリのクリック情報に従って計算される。
別の例について、正規化クエリ決定モジュールはまた、単一のクエリと目標クエリとの間の意味的類似度および/またはカテゴリ類似度をそれぞれ決定する、意味的類似度決定モジュールおよび/またはカテゴリ類似度決定モジュールも含み得る。
正規化クエリ決定モジュールは、単一のクエリと目標クエリとの間の相関度および意味的類似度に従って、目標クエリの正規化クエリを決定する。あるいは、正規化クエリ決定モジュールは、単一のクエリと目標クエリとの間の相関度およびカテゴリ類似度に従って、目標クエリの正規化クエリを決定する。あるいは、正規化クエリ決定モジュールは、単一のクエリと目標クエリとの間の相関度、意味的類似度、およびカテゴリ類似度に従って、目標クエリの正規化クエリを決定する。
例えば、意味的類似度決定モジュールは、編集距離決定ユニットと、正規化処理ユニットとを含み得る。編集距離決定ユニットは、単一のクエリと目標クエリとの間の編集距離を決定する。編集距離は、ある用語を別の用語に変換するための、最も少ない編集演算数を指す。正規化処理ユニットは、相関度と同じ量的レベルを有する意味的類似度を取得するために、編集距離を正規化する。
本開示のクエリ拡張方法およびシステムは、ユーザの検索ログのセッション情報を利用することによってクエリを正規化し、同一または同様の意味を有するクエリを、同一または同様のクエリとして扱う。クエリを取得した後に、本手法は同時に、クエリを自動的に正規化し、検索を拡張し、検索結果の範囲を拡大するときに検索結果の精度を保証する。本手法は、正規化を行い、各セッションに含まれるクエリを抽出し、そしてクエリの順序に従ってユーザ行動を解析するために、ユーザの検索ログのセッション情報を使用し得、それによって、検索中の各ユーザに対するクエリの変更過程を取得する。単一のセッションは、より短い連続的な時間でユーザ検索情報を記録するので、単一セッションにおけるクエリ間の相関度がより高くなり得る。したがって、正規化処理効果を高め、正規化後の2つのクエリ間の十分に高い相関度を保証するために、そのようなセッション情報の特性に基づいて拡張クエリ処理が行われ、それによって、最終検索結果の精度を保証し、検索回数を低減させる。したがって、システムリソース占有期間が低減され、また、システム応答速度およびクエリ拡張効率が高められる。
加えて、セッション情報の特性に基づいて、同じセッションに現れる小さい相関度でクエリを行う確立が低減される。したがって、正規化処理のためのデータ範囲が低減される。処理速度が高められ、また、処理時間が節約される。
さらに、処理のためにセッション情報を考慮することに加えて、本手法はさらに、正規化処理の精度をさらに高めるために、ユーザクリック情報および販売者データ等の他の側面を考慮し得る。
もちろん、本開示の任意の製品が上の特性の全てを保有している必要はない。
本開示の実施形態をより良好に例示するために、以下は、実施形態を説明する際に使用される図面の簡単な紹介である。以下の図面は、本開示のいくつかの実施形態に関連しているに過ぎないことは明白である。当業者は、創造的な努力をせずに、本開示の図面に従って他の図面を得ることができる。
本開示の第1の例示的な実施形態に従う、例示的なクエリ拡張方法のフローチャートを例示する図である。 本開示の第1の例示的な実施形態に従ってクエリの正規化クエリを決定するための、例示的な方法のフローチャートを例示する図である。 本開示の第2の例示的な実施形態に従ってクエリの正規化クエリを決定するための、別の例示的な方法のフローチャートを例示する図である。 本開示の第3の例示的な実施形態に従ってクエリの正規化クエリを決定するための、別の例示的な方法のフローチャートを例示する図である。 本開示に従う例示的なクエリ拡張システムの図表を例示する図である。 本開示に従う第1の例示的な正規化クエリ決定モジュールの図表を例示する図である。 本開示に従う第2の例示的な正規化クエリ決定モジュールの図表を例示する図である。 本開示に従う第3の例示的な正規化クエリ決定モジュールの図表を例示する図である。
本開示の目的、特性、および利点をより明確に、かつより理解し易くするために、以下の説明は、図面およびいくつかの例示的な実施形態を参照することによって説明される。
本開示のクエリは、クエリを行い、期待される結果を取得するために、ユーザによって入力される主要な用語であり得る。例えば、クエリは、製品名称、製品ブランド、製品モデル、または他の用語を含み得る。特別な分野において、クエリは、特別なカテゴリの用語であり得る。例えば電子商取引用ウェブサイトを使用すると、クエリは、携帯電話、ドレス等の製品名称またはカテゴリを表す製品用語であり得る。製品用語は、検索結果とユーザの期待との間のマッチ度を相対的かつ効率的に高め得るような、共通クエリである。
例えば、ユーザの検索ログを解析することによって、クエリの約57パーセントが、製品用語を利用することによって検索され、また、クエリのほぼ88パーセントが、製品用語を含む。加えて、電子商取引用ウェブサイトの製品プロバイダは、製品を記述し、記述をサーバに記憶し得る。記述は、製品の製品名称および詳細な記述を含み得る。全般的な検索方法において、電子商取引用ウェブサイトの検索エンジンは、ユーザによって入力された製品用語をサーバの製品名称とマッチさせて、マッチ結果に従って、検索結果を取得する。したがって、ユーザによって入力された製品用語を、製品プロバイダによってサーバに記憶させた製品名称等の情報と相関させることが、検索結果の精度を高めるための重要な前提である。
加えて、いくつかの大規模なウェブサイトの情報データボリュームは、膨大である。しかしながら、情報データに含まれるクエリは、総情報データよりもはるかに少ない。したがって、クエリが正規化され、同一または同様の意味を表すクエリが相関され、クエリ中に同一または同様のものとみなされれば、データの冗長性がさらに低減され得、検索エンジンの応答速度が高められ得る。例えば、大規模な電子商取引用ウェブサイトを使用すると、その製品用語は、総情報データよりもはるかに少なくなり得る。
したがって、本開示は、クエリの正規化処理を現実化するための、例示的なクエリ拡張方法およびシステムを提供する。
図1および図2は、本開示の第1の例示的な実施形態に従う、例示的なクエリ拡張方法を例示する。
102で、ユーザによって入力されたクエリを取得する。
104で、クエリに従って、クエリの正規化クエリを決定する。
106で、クエリ拡張を実行するために、正規化クエリを、クエリの拡張用語として使用する。
例えば、104で、演算は、以下を含み得る。
1020で、ユーザの検索ログのセッション情報を取得する。
セッション情報は、ウェブサイトでの連続的な期間(通常、数分〜数時間)における一連のユーザの行動を表す情報を指す。ウェブサイトページを閲覧することに始まり、閲覧を止めるまでのユーザの全過程中に、ウェブサイトサーバは、セッションIDをユーザに自動的に割り当て、その期間中のユーザ行動を記録し得る。ユーザが、長い間隔の後に再度ウェブサイトページを閲覧するときに、ウェブサイトサーバは、別のセッションIDをユーザに割り当て、ユーザ行動を記録し得る。全般に、連続的なブラウジング期間におけるユーザ行動は、通常、ある相関を有する。すなわち、1つのセッションにおけるユーザ行動は、相関すると考えられる。よって、セッションにおいて記録され、検索およびクエリを行っている間にユーザによって使用されるクエリもまた、ある相関を有し得る。したがって、本開示は、例えば、セッション情報に基づくクエリへの正規化処理を実行し得る。
ウェブサイトサーバは、セッション情報を含むユーザの検索ログを記憶するための、特定のデータベースを含み得る。データボリュームを低減させるために、ある期間のユーザの検索ログが取得され得る。あるいは、様々な期間のユーザの検索ログが取得され得、それによって、データの客観性を高める。
1022で、単一のセッションに現れる全てのクエリを取得し、各クエリの票数を数える。単一のセッションにおいて、各クエリの出現順序に従って、特定のクエリの前に現れる任意のクエリを(特定のクエリに対する)1票として数える。
1つのセッションにおいて、ユーザは、複数回検索し得、セッション情報は、複数のクエリを含み得る。セッション情報は、ユーザの検索順序を記録し得、これは、クエリの出現順序である。クエリの出現順序は、セッション情報に記録された各クエリ回に従って決定され得る。
各クエリに対する票を数える例示的な詳細な過程は、以下の通りである。
クエリは、クエリの出現順序に従って順序付けられる。それぞれのクエリに対する票は、クエリの前に現れるクエリの総数である。
例えば、5つのクエリa、b、c、d、およびeが1つのセッションに含まれ、それらの出現順序に従って、a、b、c、d、およびeとして配列される。上の定義に従って、それぞれのクエリの前の任意のクエリが、それぞれのクエリに対する票として数えられる。すなわち、クエリbについて、その票は、1、すなわち、aからbである。クエリcについて、票は、2、すなわち、aからcおよびbからcである。クエリeについて、票は、4、すなわち、a、b、c、およびdそれぞれからの票である。すなわち、それぞれのクエリに対する票は、それぞれのクエリの前に現れるクエリの総数を指す。
1024で、全てのセッションにおける目標クエリの総票数、および目標クエリに対する単一のクエリの票数に従って、単一のクエリと目標クエリとの間の票類似度を決定する。
複数のユーザが同じ期間にウェブサイトを訪問し得るので、複数のセッションが存在し得る。他のセッションにおける各クエリに対する票を数えるための方法は、1022で説明される方法と同じであり得る。
全てのセッションにおける目標クエリの総票数は、以下のように数えられ得る。
A1で、目標クエリを含むセッションを取得する。
A2で、各セッションにおける目標クエリの票数を数える。
A3で、目標クエリの総票数を取得するために、各セッションにおける目標クエリの票数を累算する。
上の票の定義によれば、各セッションにおいて目標クエリの前に現れる任意のクエリが、目標クエリに1回投票する。例えば、各セッションにおける各クエリは、目標クエリについて最大で1つの票として数え得る。クエリが目標クエリの前に現れた場合、クエリは、目標クエリに1回投票し、そうでない場合、クエリは、目標クエリに投票しない。したがって、目標クエリに対する単一のクエリの票数を決定するとき、それは、単一のクエリおよび目標クエリの双方を含み、かつ目標クエリの前に単一のクエリが現れるセッション数を決定することによって決定され得る。例示的な詳細な演算は、以下の通りである。
B1で、単一のクエリおよび目標クエリの双方を含むセッションを取得する。
B2で、それぞれのセッションにおいて、単一のクエリが目標クエリに投票したかどうかを判定する。判定結果が肯定である場合、それぞれのセッションを選択する。
B3で、目標クエリに対する単一のクエリの票数を取得するために、全ての選択されたセッション数を数える。
目標クエリを含むセッション、または単一のクエリおよび目標クエリの双方を含むセッションを取得することは、マッチングによって実行され得る。すなわち、目標クエリおよび/または単一のクエリを最初に決定し、決定された用語を、セッションに含まれる全てのクエリとマッチさせる。用語がマッチした場合、セッションは、目標クエリを含むか、または単一のクエリおよび目標クエリの双方をそれぞれ含むものと決定される。
特定の数が決定され得るのであれば、総票数、および目標クエリに対する単一のクエリの票数を数えるために、他の方法が使用され得る。
例えば、目標クエリに対する各セッションにおける各クエリの票は、ルート様式によって表され得る。総票数は、総ルートを数えることによって数えられ得る。目標クエリに対する単一のクエリの票は、同じルート様式によって数えられ、表され得、ルートは、全ての以前に数えたルートとマッチされる。ルートが完全にマッチした場合、1票が数えられる。完全にマッチしたルート数は、目標クエリに対する単一のクエリの票数である。
単一のクエリと目標クエリとの間の票類似度は、目標クエリに対する単一のクエリの票数と、目標クエリの総票数との割合に従って、直接決定され得る。すなわち、特定の割合値が票類似度の値である。目標クエリに対する単一のクエリの票と、目標クエリの総票数との割合が高くなるほど、より多くのユーザが単一のクエリから目標クエリへのルート変更を採用し、また、単一のクエリと目標クエリとの間の票類似度が高くなる。
目標クエリに対する単一のクエリの票は、様々なセッションにおいて様々であり得る。例えば、単一のクエリは、目標クエリに直接切り替えられ得るか、または複数回によって目標クエリに切り替えられ得る。例えば、あるセッションにおけるクエリは、a、b、およびcであり得、別のセッションにおけるクエリは、aおよびcであり得る。数えるときに、どちらのセッションもa〜cの票を含む。しかしながら、一方のセッションは、bによって離間されるが、もう一方は離間されない。したがって、a〜cの2つの票cには、ある違いがある。より客観的に単一のクエリと目標クエリとの間の相関度を計算するために、例示的な演算は、以下のように実行され得る。
目標クエリに対する各票の重みおよび基数を決定する。重みおよび基数に従って、各票のスコアを計算する。目標クエリに対する単一クエリの総票スコア数と、目標クエリに対する全クエリの総票スコア数との割合を、単一のクエリと目標クエリとの間の票類似度として使用する。
特定の計算中に、各票のスコアを計算するために、各票の基数に重みを掛ける様式を採用し得、最後に、総スコアを取得するために、スコアを加える。例えば、各票の基数が1であると仮定すると、あるセッションにおいて1つのクエリが目標クエリに直接切り替えられた場合、あるクエリの重みが1に設定され、よって、票の最終計算結果は、1のままである。別の用語を通した後に、別のセッションにおけるあるクエリが目標クエリに切り替えられた場合、あるクエリの重みは、0.9に設定され得、よって、票の最終計算結果は0.9である。別の例について、あるクエリから目標クエリへの各切り替えがステップ長として記録された場合、重みは、ステップ長の逆数として決定され得る。
様々な票間の違いを示すことができるのであれば、重みを決定するために任意の他の方法が使用され得る。
1026で、票類似度に従って、単一のクエリと目標クエリとの間の相関度を決定する。
1つの例示的な実施形態において、単一のクエリと目標クエリとの間の票類似度は、2つの間の相関度である。
この例示的な実施形態は、相関度を決定するときに、票類似度である1つの側面だけを考慮する。いくつかの例示的な実施形態では、相関度を決定するときに、他の何らかの側面を考慮する必要があり得る。他の側面の票類似度の値および数値は、比較的正確な相関度を決定するために、同じ量的レベルを有するように正規化され得る。
1028で、単一のクエリと目標クエリとの間の相関度に従って、目標クエリの正規化クエリを決定する。
正規化クエリの閾値が予め設定され得る。すなわち、単一のクエリと目標クエリとの間の相関度値が正規化クエリの閾値を超えている場合、単一のクエリを目標クエリの正規化クエリとして決定する。
さらに、単一のクエリが目標クエリの正規化クエリとして決定された後、それはさらに、特定の相関度値に従って詳細化され得る。例えば、正規化クエリは、同義語正規化クエリ、相関正規化クエリ、拡張正規化クエリ等に詳細化され得る。カテゴリの値範囲がそれぞれ決定され得る。相関度値がある値範囲内にあるときに、ある値範囲に対応するカテゴリを、正規化クエリの詳細なカテゴリとして決定する。例えば、単一のクエリと目標クエリとの間の相関度が同義語正規化クエリに対応する値範囲内にある場合、単一のクエリは、目標クエリの同義語正規化クエリとして決定され、単一のクエリと目標クエリとの間の相関度が相関正規化クエリに対応する値範囲内にある場合、単一のクエリは、目標クエリの相関正規化クエリとして決定され、単一のクエリと目標クエリとの間の相関度が拡張正規化クエリに対応する値範囲内にある場合、単一のクエリは、目標クエリの拡張正規化クエリとして決定される。
上の方法は、セッションの情報に基づいて、クエリに対する正規化処理を実行する。セッションは、1つのクエリ過程における様々なユーザのクエリのルート変更または切り替えを記録し得る。ユーザ行動の客観的解析は、客観的で正確な正規化処理結果を取得し得る。
より良好なクエリの正規化処理を実行するために、解析はさらに、セッションにおける情報に加えて、他の側面から実行され得る。正規化処理結果は、セッションにおける情報および他の側面を通して取得される結果を参照することによって包括的に取得され得、それによって、処理結果の客観性を高める。例えば、ユーザのクリック行動が解析され得るか、または、システムに記憶されたクエリの記述情報が解析され得る。
図3は、本開示の第2の例示的な実施形態に従う、別の例示的なクエリ拡張方法を例示する。第1の例示的な実施形態の104での演算に対応して、1026(図3の308に対応する)の前には、以下の演算がある。
302で、ユーザの検索ログの検索結果のクリック情報を取得する。
ユーザは、あるクエリを使用して検索結果セットを検索し、取得した後に、通常、検索結果セットの中のある検索結果をクリックし得る。検索結果のクリック情報は、クリックした検索結果、クリックした検索結果のタイトルおよび記述情報等を含み得る。
304で、クリック情報の目標クエリを含む検索結果を抽出する。
検索結果は、販売される製品を表すクエリを結果の中に含み得る。したがって、各検索結果に対するクエリは、クリック情報の各検索結果のタイトルおよび記述情報を解析することによって決定され得る。よって、目標クエリは、実際のニーズに従って抽出され得る。例えば、ユーザは、一連の検索結果を検索し、取得するために、クエリ「携帯電話」を使用する一方で、各検索結果に対するクエリは、「iPhone(商標)」、「Samsung(商標)携帯電話」、「Nokia(商標)携帯電話」等であり得る。「iPhone(商標)」が目標クエリとして使用される場合、「iPhone(商標)」を含む全ての検索結果が抽出され得る。
306で、目標クエリを含む全ての検索結果の総クリック数、ならびに目標クエリを含み、かつ単一のクエリに対応する検索結果のクリック数に従って、単一のクエリと目標クエリとの間のクリック類似を決定する。
目標クエリを含み、かつ単一のクエリに対応する検索結果のクリック数は、検索のために単一のクエリを使用した後に取得された検索結果セットの中に目標クエリを含む検索結果のクリック数を指す。
目標クエリを含む全ての検索結果の総クリック数は、全てのクエリに対応し、かつ目標クエリを含む全ての検索結果の総クリック数を指す。
例えば、「iPhone(商標)」が目標クエリである場合は、「携帯電話」および「スマートフォン」が、それぞれ、検索のためのクエリとして使用される。検索のためにクエリ「携帯電話」を使用した後に、1つの検索結果セットが取得され、「iPhone(商標)」を含む検索結果のクリック数は、5である。単一のクエリ「携帯電話」に対応し、かつ目標クエリ「iPhone(商標)」を含む検索結果のクリック数は、5である。加えて、検索のためにクエリ「スマートフォン」を使用した後に、別の検索結果セットが取得され、「iPhone(商標)」を含む検索結果のクリック数は、20である。単一のクエリ「スマートフォン」に対応し、かつ目標クエリ「iPhone(商標)」を含む検索結果のクリックの数は、20である。よって、目標クエリ「iPhone(商標)」を含む全ての検索結果の総クリック数は、25である。
目標クエリを含む全ての検索結果の総クリック数、ならびに単一のクエリに対応し、かつ目標クエリを含む検索結果のクリックは、以下のように処理され得る。単一のクエリに対応し、かつ目標クエリを含む検索結果のクリック数と、目標クエリを含む全ての検索結果の総クリック数との割合を計算する。
この例示的な実施形態は、2つの側面を考慮する。したがって、単一のクエリと目標クエリとの間の相関度を決定するときに、2つの側面の下で類似値を考慮する必要がある。故に、図3の308に対応する、図2の1026の演算は、それに応じて、票類似度およびクリック類似度に従って単一のクエリと目標クエリとの間の相関度を決定するように修正する必要がある。
例えば、票類似度とクリック類似度との間の大きい方の値が、単一のクエリと目標クエリとの間の相関度として使用され得る。
別の例について、票類似度の重みおよびクリック類似度の重みがそれぞれ決定される。単一のクエリと目標クエリとの間の相関度は、票類似度およびクリック類似度、ならびに1つ以上の予め設定された規則に従うそれらのそれぞれの重みを計算することによって取得される。
図4は、本開示の第3の例示的な実施形態に従う、別の例示的なクエリ拡張方法を例示する。第1の例示的な実施形態の104での演算、および対応する第2の例示的な実施形態における演算に関して、図2の1026(図4の408に対応する)での演算の前には、以下の演算がある。
402で、サーバで記憶された販売者データを取得する。販売者データは、販売者が製品を記述するときの、決定された製品の記述情報を指す。
404で、販売者データを解析し、クエリならびにクエリの特性用語を抽出する。クエリの特性用語は、クエリの特性を記述する用語を指す。
406で、単一のクエリの特性用語および目標クエリの特性用語に従って、特性類似度を決定する。
例えば、特性類似度は、以下のように決定され得る。
各特性用語の特性値を決定する。特性値に従って、単一のクエリと目標クエリとの間の特性類似を決定する。
各特性用語の特性値は、特性用語と対応するクエリとの間の相互情報を計算することによって取得され得る。例示的な計算式は、以下の通りである。
CPは、クエリを表し、Wordは、記述用語を表す。P(CP)およびP(Word)は、それぞれ、2つの用語のそれぞれが1つのデータセットに独立して現れる確率を表す。P(CP&Word)は、2つの用語がともにデータセットに現れる確率を表す。C(CP)およびC(Word)は、それぞれ、データセットに独立して現れる2つの用語のそれぞれの情報数を表す。C(CP&Word)は、データセットにともに現れる2つの用語の情報数を表す。Nは、データセットにおける総情報数を表す。
特性値に従った単一のクエリと目標クエリとの間の特性類似度の計算は、特性類似度を取得するための、単一のクエリおよび目標クエリの各側面の特性用語間の類似度の計算とみなされ得る。例えば、特性類似度を計算するために、コサイン類似度が使用され得る。最終値が高くなるほど、2つの間の類似が高くなる。
上の説明によれば、販売者データが新しい側面として加えられると、単一のクエリと目標クエリとの間の相関度を決定するときに、加えられた側面を考慮する必要がある。
新しい側面は、第1の実施形態と組み合わせられ得るか、または第2の実施形態と組み合わせられ得ることが理解できる。すなわち、2つの側面および3つの側面の双方が考慮され得る。新しい側面が第1の実施形態と組み合わせられるとき、408での演算に対応する第1の実施形態の1026での演算は、それに応じて以下のように修正され得る。票類似度および特性類似度に従って、単一のクエリと目標クエリとの間の相関度を決定する。
3つの側面が組み合わせられるとき、408の演算に対応する第1の実施形態の1026での演算は、それに応じて以下のように修正され得る。票類似度、クリック類似度、および特性類似度に従って、単一のクエリと目標クエリとの間の相関度を決定する。
単一のクエリと目標クエリとの間の相関度を決定するために、第2の実施形態に類似する方法が参照され得る。例えば、より高い類似値を有するものが相関度として選択され得る。あるいは、各類似度の重みがそれぞれ決定され得、次いで、重みおよび値に基づく計算のために、直線フィッティング等の所定の方法が使用され得る。簡潔にする目的で、詳細は、本明細書で論じられない。
別の例について、正規化処理が実行されるときに、相関度に加えて、他の因子がさらに考慮され得、それによって、処理結果をより正確にする。例えば、単一のクエリと目標クエリとの間の意味的類似度、または単一のクエリと目標クエリとの間のカテゴリ類似度等が、さらに考慮され得る。
したがって、第1の例示的な実施形態、第2の例示的な実施形態、および/または第3の例示的な実施形態での演算1028の前に、以下の演算が行われ得る。
単一のクエリと目標クエリとの間の意味的類似を決定する。例えば、単一のクエリと目標クエリとの間の意味的類似は、編集距離に従って決定され得る。編集距離は、ある文字列を別の文字列(またはクエリ)に変換するために、最も少ない編集演算数を指す。レーベンシュタイン距離は、例示的な編集距離である。レーベンシュタインにおける編集演算は、1文字を別の文字に置換すること、1文字挿入すること、および1文字削除することを含む。2つの文字列間の編集距離は、動的計画法によって計算され得る。編集距離を計算した後に、意味的類似が相関度と同じ量的レベルを有するように意味的類似度を取得するために、正規化処理が編集距離に適用され、それによって、以降の処理に対する便宜を提供する。
あるいは、第1の例示的な実施形態、第2の例示的な実施形態、および/または第3の例示的な実施形態での演算1028の前に、以下の演算が行われ得る。
単一のクエリと目標クエリとの間のカテゴリ類似を決定する。
例えば、電子商取引用ウェブサイトでは、製品を分類し、管理するために、カテゴリが予め設定され得る。各クエリは、それが属するカテゴリを有する。全般的に、カテゴリは、複数のレベルに分けられ得る。すなわち、1つの第1のレベルのカテゴリは、複数の第2のレベルのカテゴリを含み得、各第2のレベルのカテゴリはさらに、複数の第3のレベルのカテゴリに分けられ得る、等である。カテゴリ類似度は、クエリが、同じ第1のレベルのカテゴリ、第2のレベルのカテゴリ、第3のレベルのカテゴリ、等に属するかどうかを判断することによって決定され得る。同様に、カテゴリ類似度が相関度と同じ量的レベルを有するように、決定過程中に、正規化処理がカテゴリ類似度に適用される。
1つ以上の新しい因子を考慮するので、上の3つの実施形態の1028での演算は、それに応じて修正され得る。
相関度および意味的類似度を考慮する場合、1028での演算は、単一のクエリと目標クエリとの間の相関度および意味的類似度に従って、目標クエリの正規化クエリを決定するように修正され得る。
相関度およびカテゴリ類似度を考慮する場合、1028での演算は、単一のクエリと目標クエリとの間の相関度およびカテゴリ類似度に従って、目標クエリの正規化クエリを決定する用に修正され得る。
3つ全てを同時に考慮する場合、1028での演算は、単一のクエリと目標クエリとの間の相関度、意味的類似度、およびカテゴリ類似度に従って、目標クエリの正規化クエリを決定するように修正され得る。
例えば、詳細な処理中に、単一のクエリおよび目標クエリの正規化スコアを取得するために、直線フィッティングが2つまたは3つの因子に適用され得、正規化スコアに従って、目標クエリの正規化クエリが決定される。
例えば、第1の例示的な実施形態を参照することによって、閾値が実行形態に使用され得る。すなわち、正規化クエリの閾値が予め設定される。正規化スコアが閾値を超えている場合、単一のクエリが目標クエリの正規化クエリとして決定される。さらに、正規化クエリは、さらにカテゴリ化され得る。すなわち、様々なカテゴリに対応する様々な値範囲がそれぞれ設定される。正規化スコアがある値範囲にあるとき、値範囲に対応するカテゴリが正規化クエリの詳細なカテゴリとして決定される。第1の実施形態の具体的な方法が参照され得る。簡潔にする目的で、詳細は、本明細書で論じられない。
ある例示的な実施形態のある特定の演算の前に加えられる上の演算に関して、そのような加えられる演算は、ある特定の演算から相互に独立しているので、そのような加えられる演算は、特定の演算の前に実行され得るか、または、特定の演算の前のそのような演算と同時に、もしくは特定の演算の前のそのような演算の前に実行され得ることが理解できる。本開示は、本明細書でいかなる制限も課さない。例えば、第2の例示的な実施形態において加えられる302から306の演算に関して、それらは、1024での演算と1028での演算との間に実行され得る。あるいは、それらは、1020から1024の演算と同時に実行され得る。あるいは、それらは、1020での演算の前に実行され得る。本開示は、本明細書でいかなる制限も課さない。他の例示的な実施形態は、類似する処理を有し得るが、本明細書では詳述されない。
図5は、本開示に従う、第1の例示的なクエリ拡張システム500を例示する。システム500は、1つ以上のプロセッサ502と、メモリ504とを含み得る。メモリ504は、コンピュータ読み出し可能な媒体の一例である。本明細書で使用される「コンピュータ読み出し可能な媒体」としては、コンピュータ記憶媒体および通信媒体が挙げられる。
コンピュータ記憶媒体としては、コンピュータで実行される命令、データ構造、プログラムモジュール、または他のデータ等の情報を格納するための任意の方法または技術で実行される、揮発性および不揮発性媒体、リムーバブルおよび非リムーバブル媒体が挙げられる。対照的に、通信媒体は、コンピュータ読み出し可能な命令、データ構造、プログラムモジュール、または他のデータを、搬送波等の変調データ信号に具体化する。本明細書で定義されるように、コンピュータ記憶媒体は、通信媒体を含まない。メモリ204は、プログラムユニットまたはモジュール、およびプログラムデータをその中に記憶し得る。
図5の実施例において、メモリ504は、その中に、クエリ入力モジュール506と、正規化クエリ決定モジュール508と、クエリ拡張モジュール510とを記憶し得る。クエリ入力モジュール506は、ユーザによって入力されたクエリを取得する。正規化クエリ決定モジュール508は、クエリに従って、クエリの正規化クエリを決定する。クエリ拡張モジュール510は、クエリ拡張を実行するために、正規化クエリを、クエリの拡張用語として使用する。
図6は、例示的な正規化クエリ決定モジュール600を例示する。例示的な正規化クエリ決定モジュール600は、セッション情報取得モジュール602と、クエリ票計算モジュール604と、票類似度決定モジュール606と、相関度決定モジュール608と、正規化クエリ決定モジュール610とを含み得る。
セッション情報取得モジュール602は、ユーザの検索ログから、セッション情報を取得する。
クエリ票計算モジュール604は、単一のセッションに現れる全てのクエリを取得し、各クエリについて票を数える。単一のセッションにおいて、各クエリの出現順序に従って、特定のクエリの前に現れる任意のクエリを(特定のクエリに対する)1票として数える。
票類似度決定モジュール606は、全てのセッションにおける目標クエリの総票数、および目標クエリに対する単一のクエリの票数に従って、単一のクエリと目標クエリとの間の票類似度を決定する。例えば、票類似度決定モジュール606は、基数および重み決定ユニットと、スコア計算ニットと、割合計算ユニットとを含み得る。基数および重み決定ユニットは、目標クエリに対する各票の重みおよび基数を決定する。スコア計算ユニットは、重みおよび基数に従って、各票のスコアを計算する。割合計算ユニットは、目標クエリに対する単一クエリの総票数スコアと、目標クエリに対する全クエリの総票数スコアとの割合を、単一のクエリと目標クエリとの間の票類似度として使用する。
相関度決定モジュール608は、票類似度に従って、単一のクエリと目標クエリとの間の相関度を決定する。
正規化クエリ決定モジュール610は、単一のクエリと目標クエリとの間の相関度に従って、目標クエリの正規化クエリを決定する。
例えば、正規化クエリ決定モジュール610は、正規化クエリ閾値設定ユニットを含み得、該ユニットは、正規化クエリの閾値を設定し、単一のクエリと目標クエリとの間の相関度値が正規化クエリの閾値を超えている場合に、単一のクエリを目標クエリの正規化クエリとして決定する。
別の例について、正規化クエリ決定モジュール610はまた、正規化クエリカテゴリ分類ユニットと、値範囲設定ユニットと、カテゴリ決定ユニットとも含み得る。正規化クエリカテゴリ分類ユニットは、正規化クエリカテゴリを、同義語正規化クエリ、相関正規化クエリ、および拡張正規化クエリに分ける。値範囲設定ユニットは、降順で、相関度値に従って、3つのカテゴリの値範囲を設定する。カテゴリ決定ユニットは、単一のクエリと目標クエリとの間の相関度が属する値範囲に対応するカテゴリを、単一のクエリおよび目標クエリの詳細なカテゴリとして決定する。
図7は、第2の例示的な正規化クエリ決定モジュール700を含む、第2の例示的なクエリ拡張システムを例示する。セッション情報取得モジュール602、クエリ票計算モジュール604、票類似度決定モジュール606、相関度決定モジュール608、および正規化クエリ決定モジュール610に加えて、正規化クエリ決定モジュール700はさらに、クリック情報取得モジュール702と、検索結果抽出モジュール704と、クリック類似度決定モジュール706とを含み得る。クリック情報取得モジュール702は、ユーザの検索ログから、検索結果のクリック情報を取得する。検索結果抽出モジュール704は、クリック情報から、目標クエリを含む検索結果を抽出する。クリック類似度決定モジュール706は、目標クエリを含む検索結果の総クリック数、および目標クエリを含み、かつ単一のクエリに対応する検索結果の総クリック数に従って、単一のクエリと目標クエリとの間のクリック類似度を決定する。相関度決定モジュール610は、票類似度およびクリック類似度に従って、単一のクエリと目標クエリとの間の相関度を決定する。
図8は、第3の例示的な正規化クエリ決定モジュール800を含む、第3の例示的なクエリ拡張システムを例示する。セッション情報取得モジュール602、クエリ票計算モジュール604、票類似度決定モジュール606、相関度決定モジュール608、および正規化クエリ決定モジュール610に加えて、正規化クエリ決定モジュール800はまた、販売者データ取得モジュール802、データ解析モジュール804、および特性類似度決定モジュール806も含み得る。
販売者データ取得モジュール802は、サーバに記憶された販売者データを取得する。販売者データは、販売者が製品を記述するときの、決定された製品の記述情報を含む。
データ解析モジュール804は、販売者データを解析し、販売者データから、クエリならびにクエリの特性用語を抽出する。
特性類似度決定モジュール806は、単一のクエリおよび目標クエリの特性用語に従って、特性類似を決定する。例えば、特性類似度決定モジュール806は、特性値計算ユニットを含み得、該ユニットは、各特性用語の特性値を計算する。特性値は、特性用語およびその対応するクエリの相互情報に従って計算される。
相関度決定モジュール608は、票類似度および特性類似度に従って、単一のクエリと目標クエリとの間の相関度を決定する。
第2の例示的な実施形態および第3の例示的な実施形態において説明される関連データはさらに、処理のために同時に考慮され得ることが理解できる。すなわち、相関度決定モジュール608はさらに、票類似度、クリック類似度、および特性類似度に従って、単一のクエリと目標クエリとの間の相関度を決定し得る。詳細な相関度の決定中に、3つの中で最も大きいものが相関度として使用され得る。あるいは、相関度として最終値を取得するために、直線フィッティングが3つに適用され得る。
票類似度がクリック類似度または特性類似度と組み合わせられるとき、2つ間で大きい方が相関度として選択され得ることが理解できる。あるいは、相関度として最終値を取得するために、直線フィッティングが2つに適用され得る。
別の例について、例示的なシステムの1つ以上はさらに、単一のクエリと目標クエリとの間の意味的類似度および/またはカテゴリ類似をそれぞれ決定する、意味的類似度決定モジュールおよび/またはカテゴリ類似度決定モジュールを含み得る。
それに応じて、正規化クエリ決定モジュール610は、単一のクエリと目標クエリとの間の相関度および意味的類似度に従って、目標クエリの正規化クエリを決定し得るか、単一のクエリと目標クエリとの間の相関度およびカテゴリ類似度に従って、目標クエリの正規化クエリを決定し得るか、または単一のクエリと目標クエリとの間の相関度、意味的類似度、およびカテゴリ類似度に従って、目標クエリの正規化クエリを決定し得る。
例えば、意味的類似度決定モジュールは、編集距離決定ユニットと、正規化処理ユニットとを含み得る。編集距離決定ユニットは、単一のクエリと目標クエリとの間の編集距離を決定する。編集距離は、ある用語を別の用語に変換するために、最も少ない編集演算数を指す。正規化処理ユニットは、相関度と同じ量的レベルを有する意味的類似度を取得するために、編集距離の正規化処理を実行する。
本開示の例示的な実施形態は、全て段階的に説明される。各例示的な実施形態は、他の例示的な実施形態とのその違いを強調する。例示的な実施形態の同一または同様の部分は、相互に参照され得る。例示的なシステムの実施形態は、例示的な方法の実施形態と基本的に類似しているので、例示的なシステムの実施形態は詳細に説明されない。関連する部分は、例示的な方法の実施形態の部分が参照され得る。
本開示のいくつかの例示的なクエリ拡張方法およびシステムは、本明細書で詳述されない。本開示は、いくつかの実施例を使用することによって本手法の原則および実行形態を説明する。例示的な実施形態は、単に、本開示の方法および核となる概念を理解するのを補助することを意図しているに過ぎない。一方で、当業者は、本開示の概念に従って、例示的な実施形態または適用範囲を修正または変更し得るが、それでも本開示の保護範囲に入るものとする。本開示は、本手法に対する制限として理解されないものとする。

Claims (20)

  1. 方法であって、
    クエリを取得することと、
    前記クエリに従って、前記クエリの正規化クエリを決定することであって、
    検索ログのセッション情報を取得することと、
    前記セッション情報に基づいて、単一のクエリと目標クエリとの間の票類似度を決定することと、
    前記単一のクエリと前記目標クエリとの間の相関度を決定することと、
    前記単一のクエリと前記目標クエリとの間の前記相関度に基づいて、前記目標クエリの前記正規化クエリを決定することと、を含む、方法。
  2. 前記正規化クエリを、前記クエリの拡張用語として使用することをさらに含む、請求項1に記載の方法。
  3. 前記セッション情報に基づいて、前記単一のクエリと前記目標クエリとの間の前記票類似度を前記決定することは、
    単一のセッションに現れる全てのクエリを取得することと、
    各クエリについて票数を計算することであって、前記単一のセッションにおいて特定のクエリの前に現れるそれぞれのクエリを、前記それぞれのクエリから前記特定のクエリへの票として数えることを含む、計算することと、
    全てのセッションにおける前記目標クエリの総票数、および前記目標クエリに対する前記単一のクエリの票数に従って、前記単一のクエリと前記目標クエリとの間の前記票類似を決定することと
    含む、請求項1に記載の方法。
  4. 全てのセッションにおける前記目標クエリの前記総票数を計算することをさらに含み、前記計算することは、
    前記目標クエリを含む1つ以上のセッションを取得することと、
    各セッションにおける前記目標クエリの票数を数えることと、
    前記目標クエリの前記総票数を取得するために、各セッションにおける前記票数を累算することと、を含む、請求項3に記載の方法。
  5. 前記目標クエリに対する前記単一のクエリの前記票数を計算することをさらに含み、前記計算することは、
    前記単一のクエリおよび前記目標クエリを含む、1つ以上のセッションを取得することと、
    それぞれのセッションにおいて、前記単一のクエリが前記目標クエリに投票したかどうかを判定することと、
    前記それぞれのセッションにおいて、前記単一のクエリが前記目標クエリに投票したと判定することに応じて、前記それぞれのセッションを選択することと、
    前記目標クエリに対する前記単一のクエリの前記票数を取得するために、選択されたセッション数を数えることと、を含む、請求項3に記載の方法。
  6. 前記単一のクエリと前記目標クエリとの間の前記票類似度を前記決定することは、前記目標クエリに対する前記単一のクエリの総票数と、前記目標クエリの総票数との割合を、前記単一のクエリと前記目標クエリとの間の前記票類似として使用することを含む、請求項1に記載の方法。
  7. 前記単一のクエリと前記目標クエリとの間の前記票類似度を前記決定することは、
    前記目標クエリに対する各票の重みおよび基数を決定することと、
    前記重みおよび前記基数に従って、各票のスコアを計算することと、
    前記目標クエリに対する前記単一のクエリの総票スコアと、前記目標クエリに対する全てのクエリの総票スコアとの割合を、前記単一のクエリと前記目標クエリとの間の前記票類似度として使用することと、を含む、請求項1に記載の方法。
  8. 前記単一のクエリと前記目標クエリとの間の前記相関度に基づいて、前記目標クエリの前記正規化クエリを前記決定することは、
    正規化クエリの閾値を設定することと、
    前記単一のクエリと前記目標クエリとの間の前記相関度が前記正規化クエリの閾値を超えていると判定することに応じて、前記単一のクエリを、前記目標クエリの前記正規化クエリとして決定することと、を含む、請求項1に記載の方法。
  9. 前記単一のクエリと前記目標クエリとの間の前記相関度に基づいて、前記目標クエリの前記正規化クエリを前記決定することは、
    前記正規化クエリのカテゴリを、同義語正規化クエリ、相関正規化クエリ、および拡張正規化クエリに分けることと、
    前記同義語正規化クエリ、前記相関正規化クエリ、前記拡張正規化クエリのそれぞれの値の範囲を、降順で、相関度値に従って設定することと、
    前記単一のクエリおよび前記目標クエリの詳細なカテゴリとして、前記単一のクエリと前記目標クエリとの間の前記相関度が属する値範囲に対応するカテゴリを使用することと、を含む、請求項1に記載の方法。
  10. 前記票類似度に従って、前記単一のクエリと前記目標クエリとの間の前記相関度を前記決定することの前に、
    前記検索ログの検索結果のクリック情報を取得することと、
    前記クリック情報に従って、前記目標クエリを含む1つ以上の検索結果を抽出することと、
    前記目標クエリを含む検索結果の総クリック数、および前記単一のクエリに対応し、かつ前記目標クエリを含む検索結果のクリック数に従って、前記単一のクエリと前記目標クエリとの間のクリック類似度を決定することと、
    前記票類似度および前記クリック類似度に従って、前記単一のクエリと前記目標クエリとの間の前記相関度を決定することと、をさらに含む、請求項1に記載の方法。
  11. 前記票類似度および前記クリック類似度に従って、前記単一のクエリと前記目標クエリとの間の前記相関度を前記決定することは、前記票類似度と前記クリック類似度との間の大きい方の値を、前記単一のクエリと前記目標クエリとの間の前記相関度として使用することを含む、請求項10に記載の方法。
  12. 前記票類似度および前記クリック類似度に従って、前記単一のクエリと前記目標クエリとの間の前記相関度を前記決定することは、
    前記票類似および前記クリック類似の重みをそれぞれ決定することと、
    前記票類似度および前記クリック類似度、ならびに1つ以上の予め設定された規則に従うそれらのそれぞれの重みに従って、前記単一のクエリと前記目標クエリとの間の前記相関度を計算することと、を含む、請求項10に記載の方法。
  13. 前記票類似度に従って、前記単一のクエリと前記目標クエリとの間の前記相関度を前記決定することの前に、
    サーバに記憶された販売者データを取得することであって、前記販売者データは、製品記述情報を含む、販売者データを取得することと、
    クエリおよび前記クエリの特性用語を抽出するために、前記販売者データを解析することと、
    前記単一のクエリおよび前記目標クエリの前記特性用語に従って、特性類似度を決定することと、
    前記票類似度および前記特性類似度に従って、前記単一のクエリと前記目標クエリとの間の前記相関度を決定することと、をさらに含む、請求項1に記載の方法。
  14. 前記単一のクエリおよび前記目標クエリの前記特性用語に従って、前記特性類似度を前記決定することは、
    前記特性用語とその対応するクエリとの間の相互情報に基づいて、各特性用語の特性値を計算することと、
    前記特性値に従って、前記単一のクエリと前記目標クエリとの間の前記特性類似度を計算することと、を含む、請求項13に記載の方法。
  15. 前記単一のクエリと前記目標クエリとの間の前記相関度に従って、前記目標クエリの前記正規化クエリを前記決定することの前に、
    前記単一のクエリと前記目標クエリとの間の意味的類似度を決定することと、
    前記単一のクエリと前記目標クエリとの間の前記相関度および前記意味的類似度に従って、前記目標クエリの前記正規化クエリを決定することと、をさらに含む、請求項1に記載の方法。
  16. 前記単一のクエリと前記目標クエリとの間の前記相関度に従って、前記目標クエリの前記正規化クエリを前記決定することの前に、
    前記単一のクエリと前記目標クエリとの間のカテゴリ類似度を決定することと、
    前記単一のクエリと前記目標クエリとの間の前記相関度および前記カテゴリ類似度に従って、前記目標クエリの前記正規化クエリを決定することと、をさらに含む、請求項1に記載の方法。
  17. 前記単一のクエリと前記目標クエリとの間の前記相関度に従って、前記目標クエリの前記正規化クエリを前記決定することの前に、
    前記単一のクエリと前記目標クエリとの間の意味的類似度を決定することと、
    前記単一のクエリと前記目標クエリとの間のカテゴリ類似度を決定することと、
    前記単一のクエリと前記目標クエリとの間の前記相関度、前記意味的類似度、および前記カテゴリ類似度に従って、前記目標クエリの前記正規化クエリを決定することと、をさらに含む、請求項1に記載の方法。
  18. 方法であって、
    検索ログのセッション情報を取得することと、
    前記セッション情報に基づいて、単一のクエリと目標クエリとの間の票類似度を決定することと、
    前記票類似度に基づいて、前記単一のクエリと前記目標クエリとの間の相関度を決定することと、
    前記単一のクエリと前記目標クエリとの間の意味的類似度を決定することと、
    前記単一のクエリと前記目標クエリとの間の前記相関度および前記意味的類似度に基づいて、前記目標クエリの正規化クエリを決定することと、を含む、方法。
  19. 前記単一のクエリと前記目標クエリとの間の前記意味的類似度を前記決定することは、
    前記単一のクエリと前記目標クエリとの間の編集距離を決定することであって、前記編集距離は、ある用語を別の用語に変更するための、最も少ない編集演算回数である、編集距離を決定することと、
    前記相関度と同じ量的レベルを有する前記意味的類似度を取得するために、前記編集距離を正規化することと、を含む、請求項18に記載の方法。
  20. システムであって、
    クエリを取得する、クエリ入力モジュールと、
    前記クエリに従って、前記クエリの正規化クエリを決定する、正規化クエリ決定モジュールであって、前記クエリの正規化クエリを決定することは、
    検索ログのセッション情報を取得することと、
    前記セッション情報に基づいて、単一のクエリと目標クエリとの間の票類似度を決定することと、
    前記単一のクエリと前記目標クエリとの間の相関度を決定することと、
    前記単一のクエリと前記目標クエリとの間の前記相関度に基づいて、前記目標クエリの前記正規化クエリを決定することと、
    を含む、正規化クエリ決定モジュールと、
    備える、システム。
JP2015523263A 2012-07-20 2013-07-18 クエリ拡張 Active JP6247292B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201210254810.0 2012-07-20
CN201210254810.0A CN103577416B (zh) 2012-07-20 2012-07-20 扩展查询方法及系统
PCT/US2013/051140 WO2014015176A1 (en) 2012-07-20 2013-07-18 Query expansion

Publications (2)

Publication Number Publication Date
JP2015526809A JP2015526809A (ja) 2015-09-10
JP6247292B2 true JP6247292B2 (ja) 2017-12-13

Family

ID=48916206

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015523263A Active JP6247292B2 (ja) 2012-07-20 2013-07-18 クエリ拡張

Country Status (6)

Country Link
US (1) US9317550B2 (ja)
JP (1) JP6247292B2 (ja)
KR (1) KR102080362B1 (ja)
CN (1) CN103577416B (ja)
TW (1) TWI544351B (ja)
WO (1) WO2014015176A1 (ja)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8756241B1 (en) * 2012-08-06 2014-06-17 Google Inc. Determining rewrite similarity scores
US11461319B2 (en) * 2014-10-06 2022-10-04 Business Objects Software, Ltd. Dynamic database query efficiency improvement
CN104346480B (zh) * 2014-11-27 2018-06-26 百度在线网络技术(北京)有限公司 信息挖掘方法和装置
KR101612635B1 (ko) * 2014-12-12 2016-04-14 경희대학교 산학협력단 외부 리소스를 이용하여 증거 적응을 위한 임상의사결정지원 시스템 및 방법
US9824385B2 (en) 2014-12-29 2017-11-21 Ebay Inc. Method for performing sequence labelling on queries
CN104615680B (zh) 2015-01-21 2016-11-02 广州神马移动信息科技有限公司 网页质量模型的建立方法及装置
CN104715022B (zh) * 2015-02-28 2018-07-31 北京奇艺世纪科技有限公司 一种相关搜索方法和装置
CN104933183B (zh) * 2015-07-03 2018-02-06 重庆邮电大学 一种融合词向量模型和朴素贝叶斯的查询词改写方法
CN105260084A (zh) * 2015-11-03 2016-01-20 百度在线网络技术(北京)有限公司 输入序列的处理方法及装置
TWI567577B (zh) * 2015-11-05 2017-01-21 英業達股份有限公司 解決方案搜尋系統之操作方法及解決方案搜尋系統
US10339135B2 (en) 2015-11-06 2019-07-02 International Business Machines Corporation Query handling in search systems
US10762583B2 (en) * 2016-03-10 2020-09-01 Microsoft Technology Licensing, Llc Generating content feeds based on expanded network engagement
JP6856466B2 (ja) * 2017-07-14 2021-04-07 ヤフー株式会社 情報処理システム、情報処理方法、およびプログラム
US10878473B1 (en) * 2017-11-16 2020-12-29 Amazon Technologies, Inc. Content modification
CN107885875B (zh) * 2017-11-28 2022-07-08 北京百度网讯科技有限公司 检索词的同义变换方法、装置及服务器
CN108256070B (zh) * 2018-01-17 2022-07-15 北京百度网讯科技有限公司 用于生成信息的方法和装置
CN109493166B (zh) * 2018-10-23 2021-12-28 深圳智能思创科技有限公司 一种针对电子商务导购场景任务型对话系统的构建方法
CN112115335B (zh) * 2019-06-20 2024-05-28 百度(中国)有限公司 数据融合处理方法、装置、设备和存储介质
CN110674087A (zh) * 2019-09-03 2020-01-10 平安科技(深圳)有限公司 文件查询方法、装置及计算机可读存储介质
US11188512B2 (en) 2020-01-03 2021-11-30 International Business Machines Corporation Rewriting corpus content in a search index and processing search queries using the rewritten search index
US11249996B2 (en) 2020-01-03 2022-02-15 International Business Machines Corporation Query adaptation for a search service in a content management system

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7287025B2 (en) 2003-02-12 2007-10-23 Microsoft Corporation Systems and methods for query expansion
US20050149499A1 (en) 2003-12-30 2005-07-07 Google Inc., A Delaware Corporation Systems and methods for improving search quality
US7565345B2 (en) * 2005-03-29 2009-07-21 Google Inc. Integration of multiple query revision models
US8438142B2 (en) * 2005-05-04 2013-05-07 Google Inc. Suggesting and refining user input based on original user input
KR100544514B1 (ko) * 2005-06-27 2006-01-24 엔에이치엔(주) 검색 쿼리 연관성 판단 방법 및 시스템
US7552112B2 (en) * 2006-09-18 2009-06-23 Yahoo! Inc. Discovering associative intent queries from search web logs
US7689548B2 (en) 2006-09-22 2010-03-30 Microsoft Corporation Recommending keywords based on bidding patterns
US8321448B2 (en) 2007-02-22 2012-11-27 Microsoft Corporation Click-through log mining
US8145660B2 (en) * 2007-10-05 2012-03-27 Fujitsu Limited Implementing an expanded search and providing expanded search results
KR100893129B1 (ko) 2007-10-24 2009-04-15 엔에이치엔(주) 멀티 미디어 컨텐츠의 추천 키워드 추출 시스템 및 그 방법
TWI393018B (zh) 2009-02-06 2013-04-11 Inst Information Industry 關鍵詞彙即時擴展方法與系統以及儲存關鍵詞彙即時擴展程式的電腦可讀寫記錄媒體
US20110145226A1 (en) 2009-12-10 2011-06-16 Microsoft Corporation Product similarity measure
US20110258212A1 (en) * 2010-04-14 2011-10-20 Microsoft Corporation Automatic query suggestion generation using sub-queries
US20120010996A1 (en) 2010-07-07 2012-01-12 Microsoft Corporation Recommendations and targeted advertising based upon directions requests activity and data
WO2012040872A1 (en) 2010-09-29 2012-04-05 Yahoo! Inc. Training search query intent classifier using wiki article titles and search click log
JP5426526B2 (ja) * 2010-12-21 2014-02-26 日本電信電話株式会社 確率的情報検索処理装置、確率的情報検索処理方法および確率的情報検索処理プログラム
CN102567408B (zh) 2010-12-31 2014-06-04 阿里巴巴集团控股有限公司 推荐搜索关键词的方法和装置

Also Published As

Publication number Publication date
WO2014015176A1 (en) 2014-01-23
TW201405342A (zh) 2014-02-01
KR102080362B1 (ko) 2020-02-21
US9317550B2 (en) 2016-04-19
TWI544351B (zh) 2016-08-01
KR20150036117A (ko) 2015-04-07
CN103577416A (zh) 2014-02-12
CN103577416B (zh) 2017-09-22
JP2015526809A (ja) 2015-09-10
US20140025701A1 (en) 2014-01-23

Similar Documents

Publication Publication Date Title
JP6247292B2 (ja) クエリ拡張
CN108829858B (zh) 数据查询方法、装置及计算机可读存储介质
US9436747B1 (en) Query generation using structural similarity between documents
KR100544514B1 (ko) 검색 쿼리 연관성 판단 방법 및 시스템
US8402031B2 (en) Determining entity popularity using search queries
CN105765573B (zh) 网站通信量优化方面的改进
JP4920023B2 (ja) オブジェクト間競合指標計算方法およびシステム
US9251292B2 (en) Search result ranking using query clustering
CN107180093B (zh) 信息搜索方法及装置和时效性查询词识别方法及装置
US8805755B2 (en) Decomposable ranking for efficient precomputing
WO2017000610A1 (zh) 一种网页分类的方法和装置
CN104252456B (zh) 一种权重估计方法、装置及系统
WO2021082123A1 (zh) 信息推荐方法及装置、电子设备
JP6355840B2 (ja) ストップワード識別方法および装置
JP6105599B2 (ja) 情報の検索
US9971828B2 (en) Document tagging and retrieval using per-subject dictionaries including subject-determining-power scores for entries
CN105512333A (zh) 基于情感倾向的产品评论主题搜索方法
TW201426357A (zh) 搜索資料排序的方法和裝置,資料搜索的方法和裝置
CN116450772A (zh) 一种检索结果智能推荐方法、装置及统一检索方法
CN105608183A (zh) 一种提供聚合类型回答的方法和装置
TWI639093B (zh) Object set and processing method and device thereof
JP6332035B2 (ja) 文書分析装置、文書分析方法及び文書分析プログラム
TWI484356B (zh) Retrieval methods, devices and systems
CN110737851A (zh) 超链的语义化方法、装置、设备及计算机可读存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160623

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170622

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170627

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170922

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171017

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171116

R150 Certificate of patent or registration of utility model

Ref document number: 6247292

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250