JP6966158B2 - 検索データを処理するための方法、装置及びプログラム - Google Patents

検索データを処理するための方法、装置及びプログラム Download PDF

Info

Publication number
JP6966158B2
JP6966158B2 JP2020114011A JP2020114011A JP6966158B2 JP 6966158 B2 JP6966158 B2 JP 6966158B2 JP 2020114011 A JP2020114011 A JP 2020114011A JP 2020114011 A JP2020114011 A JP 2020114011A JP 6966158 B2 JP6966158 B2 JP 6966158B2
Authority
JP
Japan
Prior art keywords
entity information
search query
candidate entity
query history
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020114011A
Other languages
English (en)
Other versions
JP2020170538A (ja
Inventor
シエ、ペンジュン
ジョウ、シン
ラング、ジュン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Publication of JP2020170538A publication Critical patent/JP2020170538A/ja
Application granted granted Critical
Publication of JP6966158B2 publication Critical patent/JP6966158B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

[関連出願との相互参照]
本願は、2014年12月23日に出願された中国特許出願第201410836116.9号及び2015年12月15日に出願されたPCT出願第PCT/CN2015/097481号の優先権による利益を主張し、これらは、その全体が参照により本明細書に組み込まれる。
本開示は、通信及びコンピュータ分野に関し、具体的には、検索データを処理するための方法及び装置に関する。
eコマースの適用がますます普及してきたことに伴い、オンラインショッピングが、ユーザの日常生活に徐々に浸透してきている。オンライン検索は、多くのユーザにとって、ショッピングの通常の開始点となっている。ユーザは、彼らの関心を引き付ける様々な検索クエリを、検索ボックスに入力することができる。ユーザから検索クエリを受信すると、ショッピングウェブサイトは、通常、ユーザの購入決定を補助する関連ショッピングガイド情報を提供する。検索結果ページに対する2つの一般的なショッピングガイド方法(ナビゲーション及び関連検索)が、以下説明される。
1.ナビゲーション
ナビゲーションエリアにより、ユーザは、スクリーニングを介して、購入しようとする商品を段階的に決定することが可能となる。これは、ユーザをその購入決定について補助するにあたり、効果的な方法であった。例えば、発明の名称を「eコマースウェブサイトナビゲーションの方法及びシステム」とする特許出願公開第CN103218719A号に見られるように、検索されたコンテンツに最も関連するカテゴリ(又は特性)は、正確なナビゲーションによるカテゴリのクリック及び商品カテゴリのナビゲーション頻度を抽出することによって、かつ、クエリキーワードに対応するクリック及び購入商品、検索用語に関連する商品量情報等のような、履歴要因を考慮することによって提供される。このタイプのナビゲーションにより、ユーザは、その購入決定の明確化及び実行を支援される。
2.関連検索
「関連検索」は、ユーザの最初の入力クエリと同様の又はこれに関連する、かつ、検索をリダイレクトするためにユーザに提供される、絞り込みクエリを指す。発明の名称を「関連検索を提供するための方法及びデバイス」とする特許出願公開第CN103279486A号において、推奨されるクエリが、ユーザに以下の通り提供される。すなわち、現在のクエリと同じセッションに出現する他のクエリは、現在のクエリの推奨候補とみなされ、推奨候補は、次に、入力クエリに対するこれらの意味的類似性に基づいてクラスタリングされ、推奨候補クラスタを生成する。オンラインによる推奨の間、クエリは、クラスタにおける各候補の検索頻度に従って、ユーザに最終的に推奨される。
既存の解決手段、すなわちナビゲーション及び関連検索の両方は、クエリが単純かつ具体的な場合には、ユーザに十分なショッピングガイド情報を提供することができる。しかしながら、クエリが知識条件を含む場合には、ナビゲーション及び関連検索のいずれも、ユーザをその購入決定について大いに補助できない。
1.ナビゲーションの短所
現在のナビゲーション技術(例えば、商品ナビゲーション)の要点は、以下の通りである。すなわち、クエリされたキーワードに応じて結果(例えば、商品)を読み出し、異なるCPV(カテゴリ、特性、特性の値)の重要度を、読み出し結果(例えば、商品のセットのCPV)に対するユーザのクリックのフィードバックに従って算出し、算出された重要度に基づいて、ユーザへの推奨を実行する。この方法の欠点は、読み出し結果のセット(例えば、商品)及び結果(例えば、商品)のカテゴリ特性に対するその絶対的依存である。ナビゲーションエリアにおいて提供されるショッピングガイド情報は、知識条件を含むクエリの長さがより長く、読み出し結果(例えば、商品)がより少ないという結果をもたらす場合、又は、結果(例えば、商品)のカテゴリ特性が一般的過ぎる場合には、情報価値が低くなる。例えば、図1に示されるように、知識条件として「ボーイフレンドへのプレゼント」を用いたクエリは、読み出される商品のカテゴリ特性が広範であるという結果をもたらす。さらに、図2に示されるように、知識条件として「杭州の名産品は何か」を用いたクエリは、読み出される商品がより少ないという結果をもたらす。従って、ナビゲーションエリアのショッピングガイドにおいて提供される情報は、情報価値が低い。
2.関連検索の短所
関連検索の推奨候補は、ユーザによるクエリ入力から得られ、従って、ユーザの知識によって限定される。図3に示されるように、知識条件を含むクエリ入力が検索された場合(例えば、「ボーイフレンドへのプレゼント」)、関連検索は、クエリ入力と同様のクエリをユーザに提示するが、ユーザのニーズを満たす回答を見出すことはできない。
[簡潔な概要]
本開示の目的は、検索データを処理するための方法及び装置を提供することである。知識条件を含む検索クエリ履歴に対して、方法及び装置は、検索クエリ履歴に対するエンティティ情報をマイニングし、ユーザへの推奨回答として機能することができる。従って、ユーザへの推奨エンティティ情報の正確性が向上し、知識条件を含む検索クエリ履歴に対する検索結果が好ましくないという現在の問題、例えば、ショッピングガイド情報の情報価値が低いという問題が解決される。
従って、本開示は、検索データを処理するための方法を提供する。方法は、知識条件を含む複数の検索クエリ履歴に対応する検索結果情報を取得する段階と、検索結果情報から、複数の検索クエリ履歴に対応する候補エンティティ情報を抽出する段階と、候補エンティティ情報に従って、各検索クエリ履歴に対応するエンティティ情報を決定する段階と、を含む。
さらに、検索結果情報から、検索クエリ履歴から候補エンティティ情報を抽出する段階は、対応する検索クエリ履歴のタイプに従って、対応する検索クエリ履歴から候補エンティティ情報を抽出する方法を決定する段階と、決定された方法に従って、対応する検索クエリ履歴に関連付けられた検索結果情報から候補エンティティ情報を抽出する段階と、を含む。
さらに、候補エンティティ情報に従って、各検索クエリ履歴に対応するエンティティ情報を決定する段階は、対応する検索クエリ履歴に対応するエンティティ情報として、各検索クエリ履歴に対応する全ての候補エンティティ情報を特定する段階を含む。
さらに、一実施形態において、検索結果情報は、検索クエリ履歴に対応する回答のテキストコンテンツ、ウェブサイト、支持数、及び反対数を含む。
さらに、検索結果情報から、複数の検索クエリ履歴に対応する候補エンティティ情報を抽出する段階は、検索クエリ履歴に対応する回答のテキストコンテンツから、検索クエリ履歴に対応する候補エンティティ情報を抽出する段階を含む。
さらに、候補エンティティ情報に従って、各検索クエリ履歴に対応するエンティティ情報を決定する段階は、検索クエリ履歴に対応する候補エンティティ情報をスクリーニングし、検索クエリ履歴に対応するエンティティ情報を選択する段階を含む。
さらに、検索結果情報から、複数の検索クエリ履歴に対応する候補エンティティ情報を抽出する段階の後で、方法は、候補エンティティ情報のスコアを算出する段階をさらに含む。
さらに、一実施形態において、検索クエリ履歴に対応する候補エンティティ情報のスコアは、以下の式に従って算出される。
Figure 0006966158
entity1は、エンティティワードを示し、mは、ウェブサイトの合計数を示し、iは、m個のウェブサイトのうち選択されたウェブサイトを示し、nは、ウェブサイトiの合計回答数を示し、jは、n個の回答の中の回答を示し、Eijは、entity1がウェブサイトiの回答jに出現するか否かを示し、entity1が回答jに出現する場合、Eijは1に等しく、entity1が回答jに出現しない場合、Eijは0に等しく、Weight1は、ウェブサイトiの重みを示し、Weight2は、回答jの重みを示し、Weight2の値は、回答jの支持数及び反対数によって決定され、Weight2は、1より大きい又はこれに等しい正の整数であって、かつ、デフォルト値1を有する。
さらに、検索クエリ履歴に対応する候補エンティティ情報をスクリーニングし、検索クエリ履歴に対応するエンティティ情報を選択する段階は、各候補エンティティ情報のスコアに従って、検索クエリ履歴に対応する候補エンティティ情報から検索クエリ履歴に対応するエンティティ情報を選択する段階を含む。
さらに、検索クエリ履歴に対応する候補エンティティ情報をスクリーニングし、検索クエリ履歴に対応するエンティティ情報を選択する段階の後で、方法は、各候補エンティティ情報のスコアに従って、対応するエンティティ情報のスコアを取得する段階をさらに含む。
さらに、候補エンティティ情報に従って、各検索クエリ履歴に対応するエンティティ情報を決定する段階の後で、方法は、知識条件を含む現在の検索クエリに従って、対応する検索クエリ履歴を特定する段階と、対応する検索クエリ履歴に対応するエンティティ情報を取得する段階と、をさらに含む。
さらに、対応する検索クエリ履歴に対応するエンティティ情報を取得する段階の後で、方法は、対応する検索クエリ履歴に対応するエンティティ情報のスコアを取得し、対応する検索クエリ履歴に関連付けられた各エンティティ情報のスコアに従って、エンティティ情報をランク付けする段階をさらに含む。
他の態様において、本開示は、検索データを処理するための装置をさらに提供する。装置は、知識条件を含む複数の検索クエリ履歴に対応する検索結果情報を取得するように構成される第1のデバイスと、検索結果情報から、複数の検索クエリ履歴に対応する候補エンティティ情報を抽出するように構成される第2のデバイスと、候補エンティティ情報に従って、各検索クエリ履歴に対応するエンティティ情報を決定するように構成される第3のデバイスと、を含む。
さらに、第2のデバイスは、対応する検索クエリ履歴のタイプに従って、対応する検索クエリ履歴から候補エンティティ情報を抽出する方法を決定するように構成される第1のユニットと、決定された方法に従って、対応する検索クエリ履歴に関連付けられた検索結果情報から、候補エンティティ情報を抽出するように構成される第2のユニットと、を含む。
さらに、第3のデバイスは、対応する検索クエリ履歴に対応するエンティティ情報として、各検索クエリ履歴に対応する全ての候補エンティティ情報を特定するように構成される。
さらに、一実施形態において、第1のデバイスによって取得された検索結果情報は、検索クエリ履歴に対応する回答のテキストコンテンツ、ウェブサイト、支持数、及び反対数を含む。
さらに、第2のデバイスは、検索クエリ履歴に対応する回答のテキストコンテンツから、検索クエリ履歴に対応する候補エンティティ情報を抽出する。
さらに、第3のデバイスは、検索クエリ履歴に対応する候補エンティティ情報をスクリーニングし、検索クエリ履歴に対応するエンティティ情報を選択する。
さらに、装置は、候補エンティティ情報のスコアを算出するように構成される第4のデバイスをさらに含む。
さらに、第4のデバイスは、検索クエリ履歴に対応する候補エンティティ情報のスコアを、以下の式に従って算出する。
Figure 0006966158
entity1は、エンティティワードを示し、mは、ウェブサイトの合計数を示し、iは、m個のウェブサイトのうち選択されたウェブサイトを示し、nは、ウェブサイトiの合計回答数を示し、jは、n個の回答の中の回答を示し、Eijは、entity1がウェブサイトiの回答jに出現するか否かを示し、entity1が回答jに出現する場合、Eijは1に等しく、entity1が回答jに出現しない場合、Eijは0に等しく、Weight1は、ウェブサイトiの重みを示し、Weight2は、回答jの重みを示し、Weight2の値は、回答jの支持数及び反対数によって決定され、Weight2は、1より大きい又はこれに等しい正の整数であって、かつ、デフォルト値1を有する。
さらに、第3のデバイスは、各候補エンティティ情報のスコアに従って、各検索クエリ履歴に対応する候補エンティティ情報をスクリーニングし、各検索クエリ履歴に対応するエンティティ情報を選択するように構成される。
さらに、第3のデバイスは、各候補エンティティ情報のスコアに従って、対応するエンティティ情報のスコアを取得するようにさらに構成される。
さらに、装置は、知識条件を含む現在の検索クエリに従って、対応する検索クエリ履歴を特定するように構成される第5のデバイスと、対応する検索クエリ履歴に対応するエンティティ情報を取得するように構成される第6のデバイスと、をさらに含む。
さらに、第6のデバイスは、対応する検索クエリ履歴に対応するエンティティ情報のスコアを取得し、対応する検索クエリ履歴に関連付けられた各エンティティ情報のスコアに従って、エンティティ情報をランク付けするようにさらに構成される。
現在の技術と比較すると、知識条件を含む検索クエリ履歴に対して、本開示は、検索クエリ履歴に対するエンティティ情報をマイニングすることができ、ユーザへの推奨回答としてこれを用いる。従って、ユーザへの推奨エンティティ情報の正確性が向上し、知識条件を含む検索クエリ履歴に対する検索結果が好ましくないという現在の問題が解決される。
さらに、本開示は、各検索クエリ履歴に対応する候補エンティティ情報をスクリーニングし、検索クエリ履歴に対応するエンティティ情報を選択する。このように、不正確な又は正確性の低い候補エンティティ情報は削除され、スクリーニングを介して、正確な候補エンティティ情報が選択され、エンティティ情報として機能する。さらに、最適化されたより正確なエンティティ情報が取得され、従って、ユーザに提供されてよい。
さらに、本開示は、各検索クエリ履歴に対応する候補エンティティ情報のスコアを算出する。スコアは、候補エンティティ情報からエンティティ情報をさらにスクリーニング及び選択するために用いられる。代替的に、本開示は、選択されたエンティティ情報をランク付けし、次に、エンティティ情報をユーザに提供し、これにより、より正確な推奨結果を提供する。
本開示の他の機能、目的、及び利点は、以下の添付図面を参照してなされる非限定的な実施形態の詳細な説明から、より明らかとなろう。
既存のナビゲーションシステムの検索結果図である。
既存のナビゲーションシステムの検索結果図である。
既存の関連検索システムの検索結果図である。
本開示の一実施形態に係る検索データを処理するための方法のフロー図である。
本開示の一実施形態に係る検索結果ユーザインタフェースである。
本開示の一実施形態に係る検索結果ユーザインタフェースである。
本開示の一実施形態に係る検索データを処理するための方法のフロー図である。
本開示の一実施形態に係る検索データを処理するための方法のフロー図である。
本開示の一実施形態に係る検索データを処理するための装置の図である。
本開示の一実施形態に係る検索データを処理するための装置の図である。
本開示の一実施形態に係る検索データを処理するための装置の図である。
本開示の一実施形態に係る検索データを処理するための装置の図である。
添付図面における同じ又は同様の参照番号は、同じ又は同様の構成要素を表す。
開示される実施形態の典型的な構成において、端末、サービスネットワークのデバイス、及び信頼されるパーティの各々は、1つ又は複数のプロセッサ(CPU)、入力/出力インタフェース、ネットワークインタフェース、及びメモリを含む。
メモリは、非永続的メモリ、ランダムアクセスメモリ(RAM)及び/又は不揮発性メモリ等の形式のコンピュータ可読媒体を含んでよい。その例は、リードオンリメモリ(ROM)又はフラッシュメモリ(フラッシュRAM)を含む。メモリは、コンピュータ可読媒体の例である。
コンピュータ可読媒体は、任意の方法又は技術による情報格納を実現可能な永続的及び非永続的、移動可能及び移動不可能媒体を含む。情報は、コンピュータ可読命令、データ構造、プログラムモジュール、又は他のデータであってよい。例えば、コンピュータの記憶媒体は、限定されるものではないが、相変化メモリ(PRAM)、静的ランダムアクセスメモリ(SRAM)、動的ランダムアクセスメモリ(DRAM)、他のタイプのランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、電気的消去可能プログラマブルリードオンリメモリ(EEPROM)、フラッシュメモリもしくは他のメモリ技術、コンパクトディスクリードオンリメモリ(CD−ROM)、デジタル多用途ディスク(DVD)もしくは他の光学ストレージ、カセットテープ、磁気テープ/磁気ディスクストレージもしくは他の磁気ストレージデバイス、又はコンピューティングデバイスにアクセス可能な情報を格納するために用いられる任意の他の非送信媒体を含む。この文書の定義によれば、コンピュータ可読媒体は、変調データ信号又はキャリアのような非一時的媒体を含まない。
図4に示されるように、本開示は、以下のステップを含む、検索データを処理するための方法を提供する。
ステップS1:知識条件を含む各検索クエリ履歴に対応する検索結果情報を取得する。
ステップS2:各検索クエリ履歴に対応する検索結果情報から、検索クエリ履歴に対応する候補エンティティ情報を抽出する。
ステップS3:各検索クエリ履歴に対応する候補エンティティ情報に従って、検索クエリ履歴に対応するエンティティ情報を決定する。
具体的には、知識条件を含む検索クエリ履歴に対して、開示される実施形態は、検索クエリ履歴に対するエンティティ情報をマイニングし、ユーザへの推奨回答として、エンティティ情報を用いてよく、このように、推奨されるエンティティ情報の正確性を向上し、知識条件を含む検索クエリ履歴の検索結果が好ましくないという現在の問題を解決する。開示される実施形態は、知識条件を含む履歴クエリが最初に特定され、次に、知識条件を含む履歴クエリに関連する検索結果情報がグローバルコミュニティデータから抽出され、望ましいエンティティ情報が検索結果情報からマイニングされ、知識ベースに格納される回答として機能する、情報抽出方法を用いてよい。従って、ユーザが知識条件を含む現在の検索クエリに従って、対応する検索クエリ履歴のオンライン検索を実行する場合に、見出された検索クエリ履歴に対応するエンティティ情報は、知識ベースに基づいて、ユーザに推奨されてよい。
本明細書で用いられる「エンティティ情報」は、互いに区別可能な物理的に存在するオブジェクトについての情報を含んでよい。前述の内容と代替的に、又はこれと併せて、エンティティ情報は、具体的な人物、イベント、もしくはオブジェクトについての情報であってよく、又は、アイテムの概念もしくはこれらの間における関係についての情報であってよい。例としてショッピングの適用を用いて、知識条件を含む検索クエリ履歴は、図5における「両親への実用的なプレゼント」又は図6における「ボーイフレンドへのプレゼント」のような情報に対するショッピングクエリを含んでよい。開示される実施形態の方法により、エンティティ情報は、ウェブサイトのコミュニティデータからマイニングし、ユーザへの推奨回答として機能してよい。このように、ユーザへの推奨エンティティ情報の正確性は、適宜取得されるエンティティ情報がユーザに相応しい推奨商品であるように向上し、これにより、知識条件を含む現在のショッピングクエリのショッピングガイド情報が好ましくないという問題を解決する。
他の例において、ユーザは、連続するN個のレベルのエンティティ情報を取得してよい。ここで、Nは、正の整数である。次のレベルのエンティティ情報は、前のレベルのエンティティ情報に応じて取得される。例えば、対応する第1(N−1)レベルに対して取得されたエンティティ情報は、知識条件を含む新たな検索クエリ履歴であってよい。このように、次のレベルのエンティティ情報は、前のレベルの検索クエリ履歴に従って取得される。第Nレベルのエンティティ情報に加えて、次のレベルのエンティティ情報も、検索クエリ履歴であってよい。第Nレベルの具体的なエンティティ情報(例えば、具体的な商品情報)が第(N−1)レベルのエンティティ情報(この時点における検索クエリ履歴)に従って取得されるまで、次のレベルのエンティティ情報に従って、さらに次のレベルのエンティティ情報が取得される等が行われる。第1(N−1)レベルに対応する取得されたエンティティ情報は、マルチレベルの推奨ラベル形式で、ユーザに提示されてよい。ユーザが特定のレベルの推奨ラベルをクリックした場合、ユーザは、具体的な商品情報のような、最後の第Nレベルの具体的なエンティティ情報が取得されるまで、次のレベルの推奨ラベルにリダイレクトされてよい。この段階的リダイレクト方法により、ユーザは、所望の具体的なエンティティ情報を取得するようにガイドされてよい。当業者であれば、具体的な適用シナリオの前述の説明が例示に過ぎないことを理解することができよう。他の既存の適用シナリオ又は将来出現し得るシナリオが開示される実施形態に適用可能である場合、これらも開示される実施形態の範囲に属するものである。
図7は、本開示の一実施形態に係る検索データを処理するための方法のフロー図である。具体的には、図7は、図4のステップS2において実行される追加的なサブステップを示す。
ステップS21:各検索クエリ履歴のタイプに従って、検索クエリ履歴に対応する候補エンティティ情報を抽出するための方法を決定する。
ステップS22:各検索クエリ履歴に対応する候補エンティティ情報を抽出する決定された方法に従って、検索クエリ履歴に対応する検索結果情報から検索クエリ履歴に対応する候補エンティティ情報を抽出する。
一実施形態において、ステップS21の前に、全ての検索クエリ履歴は、知識条件を含む異なるタイプの検索クエリ履歴を抽出するように、分析及び要約されてよい。次に、ステップS21において、各検索クエリ履歴のタイプに従って、検索クエリ履歴に対応する候補エンティティ情報を抽出する方法が決定される。例えば、知識条件を含む検索クエリ履歴のタイプは、以下のnグラム及びパターンのセットに分類される。
(1)地名+「名産品」:ユーザが、具体的な場所に対して、名産品についての知識取得を望んでいたことを示す。
(2)「贈る」+タイトル+プレゼント:ユーザが、プレゼントを贈ることについてのショッピングガイド知識の取得を希望していたことを示す。
(3)カテゴリワード+「ブランド」:ユーザが、カテゴリのベストセラーブランドの取得を希望していたことを示す。
(4)カテゴリワード+「アクセサリ」:ユーザが、カテゴリの他のアクセサリの取得を希望していたことを示す。
地名+「名産品」という検索クエリ履歴に対して、このタイプの検索クエリ履歴に対応する候補エンティティ情報を抽出する方法は、エンティティ情報として機能するように名産品の名称を抽出することと決定されてよい。「贈る」+タイトル+「プレゼント」という検索クエリ履歴に対して、このタイプの検索クエリ履歴に対応する候補エンティティ情報を抽出する方法は、エンティティ情報としてプレゼントの名称を抽出することと決定される。カテゴリワード+「ブランド」という検索クエリ履歴に対して、このタイプの検索クエリ履歴に対応する候補エンティティ情報を抽出する方法は、エンティティ情報としてブランドの名称を抽出することと決定されてよい。カテゴリワード+「アクセサリ」という検索クエリ履歴に対して、このタイプの検索クエリ履歴に対応する候補エンティティ情報を抽出する方法は、エンティティ情報としてアクセサリの名称を抽出することと決定されてよい。
当業者であれば、候補エンティティ情報を抽出する具体的な方法の前述の説明が例示に過ぎないことを理解することができよう。候補エンティティ情報を抽出する他の既存の方法又は将来出現し得る方法が本開示に適用可能である場合、これらも本開示の範囲に属するものである。
一実施形態において、図4において説明される方法のステップS3において、各検索クエリ履歴に対応する全ての候補エンティティ情報は、検索クエリ履歴に対応するエンティティ情報として用いられる。ここで、候補エンティティ情報のデータ量が大き過ぎず、かつ、候補エンティティ情報が十分に正確な場合、全ての候補エンティティ情報は、一切スクリーニングをすることなく、ユーザへの推奨エンティティ情報として直接用いられてよい。このようなメカニズムにより、データ処理の負荷が軽減され、推奨スピードが向上する。
一実施形態において、図4において説明される方法のステップS1において、方法は、検索クエリ履歴に対応するウェブサイトのテキストコンテンツ内に含まれる回答のテキストコンテンツ、ウェブサイト識別子、支持数、及び反対数を含む各検索クエリ履歴に対応する検索結果情報を取得する。ここで、ウェブクローラは、百度知道、捜捜問答、及び淘宝問答のようなコミュニティウェブサイトから、知識条件を含む検索クエリ履歴に対応する検索結果情報を捕捉するために用いられてよい。ウェブページデータのような、検索クエリ履歴に対応する捕捉された検索結果情報は、次に、分析される。ウェブページデータの回答のテキストコンテンツを分析することに加えて、回答のウェブサイト、支持数、及び反対数のような情報も、分析されてよい。分析は、次に、候補エンティティ情報の後続の抽出及び候補エンティティ情報の格付けに用いられる。捕捉された結果データの例が、表1に示される。
Figure 0006966158
当業者であれば、検索結果情報の前述の説明が例示に過ぎないことを理解することができよう。他の既存の検索結果情報又は将来出現し得る検索結果情報は、本開示に適用可能である場合、これらも本開示の範囲に属し、参照により本明細書に組み込まれるものである。
一実施形態において、図4において説明される方法のステップS2において、方法は、各検索クエリ履歴に対応する回答のテキストコンテンツから、検索クエリ履歴に対応する候補エンティティ情報を抽出する。表1に示される情報と同様の各クエリの検索結果情報を取得した後で、さらなるステップは、検索結果情報から必要とされる候補エンティティ情報を抽出することである。ここで、検索クエリ履歴に対応する候補エンティティ情報は、各検索クエリ履歴に対応する回答のテキストコンテンツから抽出されてよい。ルールベースの方法、隠れマルコフモデルをベースとた方法、及び条件付きランダム場をベースとした方法等のような、回答のテキストコンテンツから候補エンティティ情報を特定する多くの方法が利用可能である。回答のテキストコンテンツから抽出された候補エンティティ情報は、様々な形式をとってよい。具体的な適用シナリオにおいて、例えば、知識条件を有するショッピングクエリに関する問題が解決対象であり、かつ、カテゴリエンティティのスクリーニングが必要な場合、候補エンティティ情報の結果は、表2に示されるもののように提示されてよい。
Figure 0006966158
図4に開示される方法の一実施形態において、ステップS3は、各検索クエリ履歴に対応する候補エンティティ情報をスクリーニングし、検索クエリ履歴に対応するエンティティ情報を選択する段階を含むサブステップS31をさらに含んでよい。ここで、候補エンティティ情報は、検索クエリ履歴に従ってチェック及びスクリーニングされ、不正確な候補エンティティ情報又は十分に正確ではない候補エンティティ情報を削除してよい。正確な候補エンティティ情報は、次に、エンティティ情報として機能するように選択され、これにより、ユーザに提供されるようにさらに最適化された、より正確なエンティティ情報を取得する。
一実施形態において、図4のステップS3の後で、方法は、各検索クエリ履歴に対応する候補エンティティ情報のスコアを算出する段階をさらに含む。ここで、表1に示される情報と同様の各クエリの検索結果情報を取得し、検索結果情報から、表2に示されるものと同様の候補エンティティ情報を抽出した後で、候補エンティティ情報は、さらに格付けされてよい。格付けからのスコアは、候補エンティティ情報からのエンティティ情報の後続のスクリーニングに用いられる。又は、スクリーニングされたエンティティ情報は、ランク付けされ、ユーザに提供される。例えば、各検索クエリ履歴に対応する候補エンティティ情報のスコアは、例として、表3に提供される。
Figure 0006966158
候補エンティティ情報の格付けは、回答が出現するウェブサイト品質及び回答の支持度(重み)と共に、取得された候補エンティティ情報を考慮することによって実行される。具体的には、支持度は、支持数から反対数を差し引いたものに等しい。一実施形態において、各検索クエリ履歴に対応する候補エンティティ情報のスコアは、以下の式に従って算出されてよい。
Figure 0006966158
entity1は、エンティティワードを示し、mは、ウェブサイトの合計数を示し、iは、m個のウェブサイトからのウェブサイトを示し、nは、ウェブサイトiの合計回答数を示し、jは、n個の回答からの回答を示し、Eijは、entity1がウェブサイトiからの回答jに出現するか否かを示し、entity1が出現する場合は1、entity1が出現しない場合は0となり、Weight1は、ウェブサイトiの重みを示し、Weight2は、回答jの重みを示し、Weight2の値は、回答jの支持数及び反対数によって決定され、Weight2は、1より大きい又はこれに等しい正の整数であり、Weight2のデフォルト値は、1である。例えば、Weight2の値は、賛成数から反対数を減算することによって取得される。賛成数から反対数を減算した結果がゼロより小さい又はこれに等しい場合、Weight2のデフォルト値は1である。式において、Weight1は、予め設定されたプロセスによって取得されてよく、又は、ページランクアルゴリズムに基づいて取得されてよい。
当業者であれば、各検索クエリ履歴に対応する候補エンティティ情報のスコアの算出についての前述の説明が、例示に過ぎないことを理解することができよう。各検索クエリ履歴に対応する候補エンティティ情報のスコアを算出するための他の既存の方法又は任意の将来出現し得る方法は、本開示に適用可能である場合、これらも本開示の範囲に属し、参照により本明細書に組み込まれるものである。
従って、本開示の一実施形態のステップS31において、各検索クエリ履歴に対応する候補エンティティ情報は、スクリーニングされ、検索クエリ履歴に対応するエンティティ情報は、各候補エンティティ情報のスコアに従って選択される。ここで、より高いスコアを有するエンティティ情報が、各検索クエリ履歴に対応する候補エンティティ情報から選択され、検索クエリ履歴に対応するエンティティ情報として用いられてよい。
本開示の一実施形態において、ステップS31の後で、方法は、各候補エンティティ情報のスコアに従って、選択された対応するエンティティ情報のスコアを取得する段階をさらに含む。具体的には、表3に示されるように、候補エンティティ情報及びこれらのスコアは、「腕時計:55、財布:46、ライター:32、ウエストバンド:22、スカーフ:22、剃刀:20、ブレスレット:18、ベルト:18、ネクタイ:18」であり、エンティティ情報及びスクリーニング後のこれらのスコアは、「腕時計:55、財布:46、ライター:32、ウエストバンド:22、スカーフ:22、剃刀:20」である。換言すると、保存された候補エンティティ情報及びこれらのスコアは、選択されたエンティティ情報及びこれらのスコアとして用いられる。
検索結果情報、候補エンティティ情報、エンティティ情報、及びスコアを取得する段階は、大規模データ処理を含み、大規模並列演算を必要とする。本開示の実施形態において、演算は、クラウドコンピューティングプラットフォームによって実装されてよい。
図8は、ステップS3の後で、方法が以下のステップをさらに含む本開示の一実施形態を示す。
ステップS4:知識条件を含む現在の検索クエリに従って、対応する検索クエリ履歴を検索する。
ステップS5:見出された検索クエリ履歴に対応するエンティティ情報を取得する。
ここで、ステップS4及びステップS5のプロセスは、オンラインサーバによって実装されてよい。検索クエリ履歴及び対応するエンティティ情報は、(前述されたように)知識ベースに予め格納されている。ユーザは、対応する検索クエリ履歴を見出すべく、知識条件を含む現在の検索クエリを検索する要求を、端末を介してオンラインサーバに提出してよい。対応する検索クエリ履歴が知識ベースから見出された場合、オンラインサーバは、ナビゲーションエリアにおけるユーザに、対応するエンティティ情報をラベルとして直接提示する。ユーザは、ラベルをクリックし、オンラインショッピングのようなネットワークオペレーションを継続してよい。さらに、オンラインサーバは、知識条件を含む現在の検索クエリを複数の連続キーワードに分割し、次に、複数の連続キーワードに従って、対応する検索クエリ履歴を検索してよい。そこで、検索クエリ履歴のヒット率が向上する。
本開示の一実施形態において、図8のステップS5の後で、方法は、見出された検索クエリ履歴に対応するエンティティ情報のスコアを取得し、各エンティティ情報のスコアに従って、エンティティ情報をランク付けする段階をさらに含む。例えば、より高いスコアを有するエンティティ情報は、最上位に提示されてよく、これに対して、より低いスコアを有するエンティティ情報は、最下位に配置されてよい。そこで、エンティティ情報の選択におけるユーザの効率が向上する。
本開示の一実施形態において、対応する検索クエリ履歴及び対応するエンティティ情報を検索するプロセスは、リアルタイムなクエリを支持するキーバリューシステムを用いて実装されてよい。
図9に示されるように、本開示の他の態様によれば、以下のデバイスを含む、検索データを処理するための装置100が、さらに提供される。
第1のデバイス1は、知識条件を含む各検索クエリ履歴に対応する検索結果情報を取得するように構成される。
第2のデバイス2は、各検索クエリ履歴に対応する検索結果情報から、検索クエリ履歴に対応する候補エンティティ情報を抽出するように構成される。
第3のデバイス3は、各検索クエリ履歴に対応する候補エンティティ情報に従って、検索クエリ履歴に対応するエンティティ情報を決定するように構成される。
具体的には、知識条件を含む検索クエリ履歴に対して、本開示は、ユーザへの推奨回答として機能するように、検索クエリ履歴に対するエンティティ情報をマイニングしてよい。このように、ユーザへの推奨エンティティ情報の正確性が向上し、知識条件を含む検索クエリ履歴に対する検索結果が好ましくないという現在の問題が解決される。本開示は、知識条件を含む履歴クエリが最初に特定され、次に、知識条件を含む履歴クエリに関連する検索結果情報がコミュニティデータから抽出され、望ましいエンティティ情報が検索結果情報からマイニングされ、知識ベースに格納される回答として機能する、情報抽出方法を用いてよい。従って、ユーザが知識条件を含む現在の検索クエリに従って、対応する検索クエリ履歴のオンライン検索を実行する場合に、見出された検索クエリ履歴に対応するエンティティ情報は、知識ベースに基づいて、ユーザに推奨されてよい。
一実施形態において、エンティティ情報は、互いに区別可能な物理的に存在するオブジェクトについての情報であってよく、エンティティ情報は、具体的な人物、イベント、及びオブジェクトについての情報であってよく、又は、要約の概念又は関係であってよい。ショッピングの適用シナリオにおいて、知識条件を含む検索クエリ履歴は、図5における「両親への実用的なプレゼント」又は図6における「ボーイフレンドへのプレゼント」のような情報に対するショッピングクエリであってよい。本開示の方法により、エンティティ情報は、ウェブサイトのコミュニティデータからマイニングし、ユーザへの推奨回答として機能してよい。このように、ユーザへの推奨エンティティ情報の正確性は、適宜取得されるエンティティ情報がユーザに相応しい推奨商品であるように向上し、これにより、知識条件を含む現在のショッピングクエリのショッピングガイド情報が好ましくないという問題を解決する。他の適用シナリオにおいて、ユーザは、連続するN個のレベルのエンティティ情報を取得してよい。ここで、Nは、正の整数である。次のレベルのエンティティ情報は、前のレベルのエンティティ情報に応じて取得される。例えば、対応する第1(N−1)レベルに対して取得されたエンティティ情報は、知識条件を含む新たな検索クエリ履歴であってよい。このように、次のレベルのエンティティ情報は、前のレベルの検索クエリ履歴に従って取得される。第Nレベルのエンティティ情報に加えて、次のレベルのエンティティ情報も、検索クエリ履歴であってよい。具体的な商品情報のような第Nレベルの具体的なエンティティ情報が第(N−1)レベルのエンティティ情報(この時点における検索クエリ履歴)に従って取得されるまで、次のレベルのエンティティ情報に従って、さらに次のレベルのエンティティ情報が取得される等が行われる。第1(N−1)レベルに対応する取得されたエンティティ情報は、マルチレベルの推奨ラベル形式で、ユーザに提示されてよい。ユーザが特定のレベルの推奨ラベルをクリックした場合、ユーザは、具体的な商品情報のような、最後の第Nレベルの具体的なエンティティ情報が取得されるまで、次のレベルの推奨ラベルにリダイレクトされてよい。この段階的リダイレクト態様により、ユーザは、所望の具体的なエンティティ情報を取得するようにガイドされてよい。当業者であれば、適用シナリオについての前述の説明が例示に過ぎないことを理解することができよう。他の既存の適用シナリオ又は将来出現し得るシナリオは、本開示に適用可能である場合、これらも本開示の範囲に属し、参照により本明細書に組み込まれるものである。
図10に示されるように、本開示の一実施形態において、第2のデバイス2は、以下のデバイスを含む。
第1のデバイス21は、各検索クエリ履歴のタイプに従って、検索クエリ履歴に対応する候補エンティティ情報を抽出する方法を決定するように構成される。
第2のデバイス22は、各検索クエリ履歴に対応する候補エンティティ情報を抽出する方法に従って、検索クエリ履歴に対応する検索結果情報から、検索クエリ履歴に対応する候補エンティティ情報を抽出するように構成される。
ここで、全ての検索クエリ履歴は、最初に分析及び要約されてよく、その後、知識条件を含む異なるタイプの検索クエリ履歴を抽出する。次に、第1のデバイス21は、各検索クエリ履歴のタイプに従って、検索クエリ履歴に対応する候補エンティティ情報を抽出する方法を決定する。例えば、知識条件を含む検索クエリ履歴のタイプは、以下に分類されてよい。
(5)地名+「名産品」:具体的な場所に対して、名産品についての知識取得が希望されていることを示す。
(6)「贈る」+タイトル+プレゼント:プレゼントを贈ることについてのショッピングガイド知識の取得が希望されていることを示す。
(7)カテゴリワード+「ブランド」:カテゴリのベストセラーブランドの取得が希望されていることを示す。
(8)カテゴリワード+「アクセサリ」:カテゴリの他のアクセサリの取得が希望されていることを示す。
地名+「名産品」という検索クエリ履歴に対して、このタイプの検索クエリ履歴に対応する候補エンティティ情報を抽出する方法は、エンティティ情報として機能するように名産品の名称を抽出することと決定される。「贈る」+タイトル+「プレゼント」という検索クエリ履歴に対して、このタイプの検索クエリ履歴に対応する候補エンティティ情報を抽出する方法は、エンティティ情報としてプレゼントの名称を抽出することと決定される。カテゴリワード+「ブランド」という検索クエリ履歴に対して、このタイプの検索クエリ履歴に対応する候補エンティティ情報を抽出する方法は、エンティティ情報としてブランドの名称を抽出することと決定される。カテゴリワード+「アクセサリ」という検索クエリ履歴に対して、このタイプの検索クエリ履歴に対応する候補エンティティ情報を抽出する方法は、エンティティ情報としてアクセサリの名称を抽出することと決定される。当業者であれば、候補エンティティ情報を抽出する方法についての前述の説明が例示に過ぎないことを理解することができよう。候補エンティティ情報を抽出する他の既存の方法又は将来出現し得る方法が本開示に適用可能である場合、これらも本開示の範囲に属し、参照により本明細書に組み込まれるものである。
本開示の一実施形態において、第3のデバイス3は、検索クエリ履歴に対応するエンティティ情報として、各検索クエリ履歴に対応する全ての候補エンティティ情報を用いるように構成される。図4は、ステップS3が、各検索クエリ履歴に対応する全ての候補エンティティ情報が検索クエリ履歴に対応するエンティティ情報として用いられることを説明する、本開示の一実施形態を示す。ここで、候補エンティティ情報のデータ量が大き過ぎず、かつ、候補エンティティ情報が十分に正確な場合、全ての候補エンティティ情報は、一切スクリーニングをすることなく、ユーザへの推奨エンティティ情報として直接用いられてよい。このようなメカニズムにより、データ処理の負荷が軽減され、推奨スピードが向上する。
本開示の一実施形態において、第1のデバイス1によって取得された各検索クエリ履歴に対応する検索結果情報は、検索クエリ履歴に対応する回答のテキストコンテンツ、ウェブサイト、支持数、及び反対数を含む。ここで、ウェブクローラは、百度知道、捜捜問答、及び淘宝問答のようなコミュニティウェブサイトから、知識条件を含む検索クエリ履歴に対応する検索結果情報を捕捉するために用いられてよい。ウェブページデータのような、検索クエリ履歴に対応する捕捉された検索結果情報は、次に、分析される。ウェブページデータの回答のテキストコンテンツを分析することに加えて、回答のウェブサイト、支持数、及び反対数のような情報も、分析されてよい。分析は、次に、候補エンティティ情報の後続の抽出及び候補エンティティ情報の格付けに用いられる。捕捉された結果データの例が、表1に示される。
Figure 0006966158
当業者であれば、検索結果情報の前述の説明が例示に過ぎないことを理解することができよう。他の既存の検索結果情報又は将来出現し得る検索結果情報は、本開示に適用可能である場合、これらも本開示の範囲に属し、参照により本明細書に組み込まれるものである。
これに応じて、本開示の一実施形態において、第2のデバイス2は、各検索クエリ履歴に対応する回答のテキストコンテンツから、検索クエリ履歴に対応する候補エンティティ情報を抽出する。表1に示される情報と同様に、各クエリの検索結果情報を取得した後で、さらなるステップは、検索結果情報から必要とされる候補エンティティ情報を抽出することである。ここで、検索クエリ履歴に対応する候補エンティティ情報は、各検索クエリ履歴に対応する回答のテキストコンテンツから抽出されてよい。ルールベースの方法、隠れマルコフモデルをベースとた方法、及び条件付きランダム場をベースとした方法等のような、回答のテキストコンテンツから候補エンティティ情報を特定する多くの方法が利用可能である。回答のテキストコンテンツから抽出された候補エンティティ情報は、様々な形式をとってよい。具体的な適用シナリオにおいて、例えば、知識条件を有するショッピングクエリに関する問題が解決対象であり、かつ、カテゴリエンティティのスクリーニングが必要な場合、候補エンティティ情報の結果は、表2に示されるもののように提示されてよい。
Figure 0006966158
本開示の一実施形態において、第3のデバイス3は、各検索クエリ履歴に対応する候補エンティティ情報をスクリーニングし、検索クエリ履歴に対応するエンティティ情報を選択する。ここで、候補エンティティ情報は、検索クエリ履歴に従ってチェック及びスクリーニングされ、不正確な候補エンティティ情報又は十分に正確ではない候補エンティティ情報を削除してよい。正確な候補エンティティ情報は、次に、エンティティ情報として機能するように選択され、これにより、ユーザに提供されるようにさらに最適化された、より正確なエンティティ情報を取得する。
本開示の一実施形態において、図11に示されるように、装置は、各検索クエリ履歴に対応する候補エンティティ情報のスコアを算出するように構成される第4のデバイス4をさらに含む。ここで、表1に示される情報と同様の各クエリの検索結果情報を取得し、検索結果情報から、表2に示されるものと同様の候補エンティティ情報を抽出した後で、候補エンティティ情報は、さらに格付けされてよい。格付けからのスコアは、候補エンティティ情報からのエンティティ情報の後続のスクリーニングに用いられる。又は、スクリーニングされたエンティティ情報は、ランク付けされ、ユーザに提供される。例えば、各検索クエリ履歴に対応する候補エンティティ情報のスコアは、例として、表3に提供される。
Figure 0006966158
候補エンティティ情報の格付けは、回答が出現するウェブサイト品質及び回答の支持度(重み)と共に、取得された候補エンティティ情報を考慮することによって実行される。具体的には、支持度は、支持数から反対数を差し引いたものに等しい。一実施形態において、第4のデバイス4は、以下の式に従って、各検索クエリ履歴に対応する候補エンティティ情報のスコアを算出する。
Figure 0006966158
entity1は、エンティティワードを示し、mは、ウェブサイトの合計数を示し、iは、m個のウェブサイトからのウェブサイトを示し、nは、ウェブサイトiの合計回答数を示し、jは、n個の回答からの回答を示し、Eijは、entity1がウェブサイトiからの回答jに出現するか否かを示し、entity1が出現する場合は1、entity1が出現しない場合は0となり、Weight1は、ウェブサイトiの重みを示し、Weight2は、回答jの重みを示し、Weight2の値は、回答jの支持数及び反対数によって決定され、Weight2は、1より大きい又はこれに等しい正の整数であり、Weight2のデフォルト値は、1である。例えば、Weight2の値は、賛成数から反対数を減算することによって取得される。賛成数から反対数を減算した結果がゼロより小さい又はこれに等しい場合、Weight2のデフォルト値は1である。式において、Weight1は、予め設定されたプロセスによって取得されてよく、又は、ページランクアルゴリズムに基づいて取得されてよい。
当業者であれば、各検索クエリ履歴に対応する候補エンティティ情報のスコアの算出についての前述の説明が、例示に過ぎないことを理解することができよう。各検索クエリ履歴に対応する候補エンティティ情報のスコアを算出するための他の既存の方法又は任意の将来出現し得る方法は、本開示に適用可能である場合、これらも本開示の範囲に属し、参照により本明細書に組み込まれるものである。
本開示の一実施形態において、第3のデバイス3は、各検索クエリ履歴に対応する候補エンティティ情報をスクリーニングし、各候補エンティティ情報のスコアに従って、検索クエリ履歴に対応するエンティティ情報を選択するように構成される。ここで、より高いスコアを有するエンティティ情報が、各検索クエリ履歴に対応する候補エンティティ情報から選択され、検索クエリ履歴に対応するエンティティ情報として用いられてよい。
さらに、本開示の一実施形態において、第3のデバイス3は、各候補エンティティ情報のスコアに従って、選択された対応するエンティティ情報のスコアを取得するようにさらに構成される。具体的には、表3に示されるように、候補エンティティ情報及びこれらのスコアは、「腕時計:55、財布:46、ライター:32、ウエストバンド:22、スカーフ:22、剃刀:20、ブレスレット:18、ベルト:18、ネクタイ:18」であり、エンティティ情報及びスクリーニング後のこれらのスコアは、「腕時計:55、財布:46、ライター:32、ウエストバンド:22、スカーフ:22、剃刀:20」である。換言すると、保存された候補エンティティ情報及びこれらのスコアは、選択されたエンティティ情報及びこれらのスコアとして用いられる。
検索結果情報、候補エンティティ情報、エンティティ情報、及びスコアを取得する段階は、大規模データ処理を含み、大規模並列演算を必要とする。本開示の実施形態において、演算は、クラウドコンピューティングプラットフォームによって実装されてよい。
図12は、装置が、以下のデバイスをさらに含む本開示の一実施形態を示す。
第5のデバイス5は、知識条件を含む現在の検索クエリに従って、対応する検索クエリ履歴を検索するように構成される。
第6のデバイス6は、見出された検索クエリ履歴に対応するエンティティ情報を取得するように構成される。ここで、第5のデバイス5及び第6のデバイス6の機能は、オンラインサーバによって実装されてよい。検索クエリ履歴及び対応するエンティティ情報は、(前述されたように)知識ベースに予め格納されている。ユーザは、対応する検索クエリ履歴を見出すべく、知識条件を含む現在の検索クエリを検索する要求を、端末を介してオンラインサーバに提出してよい。対応する検索クエリ履歴が知識ベースから見出された場合、オンラインサーバは、ナビゲーションエリアにおけるユーザに、対応するエンティティ情報をラベルのフォーマットで直接提示する。ユーザは、ラベルをクリックし、ショッピングのようなネットワークオペレーションを継続してよい。さらに、オンラインサーバは、知識条件を含む現在の検索クエリを複数の連続キーワードに分割し、次に、複数の連続キーワードに従って、対応する検索クエリ履歴を検索してよい。そこで、検索クエリ履歴のヒット率が向上する。
さらに、本開示の一実施形態において、第6のデバイス6は、見出された検索クエリ履歴に対応するエンティティ情報のスコアを取得し、各エンティティ情報のスコアに従って、エンティティ情報をランク付けするようにさらに構成される。例えば、より高いスコアを有するエンティティ情報は、最上位に提示されてよく、これに対して、より低いスコアを有するエンティティ情報は、最下位に配置されてよい。そこで、エンティティ情報の選択におけるユーザの効率が向上する。
本開示の実施形態において、第5のデバイス5及び第6のデバイス6によって、対応する検索クエリ履歴及び対応するエンティティ情報を検索するプロセスは、リアルタイムなクエリを支持するキーバリューシステムを用いて実装されてよい。
本開示において説明される検索データを処理するための方法及び装置は、具体的な適用の実施形態を参照して、さらに示される。
具体的な適用シナリオにおいて、知識条件を有する現在のショッピングクエリに対するショッピングガイド情報が好ましくないという問題を解決すべく、表1に示されるように、「ボーイフレンドへのプレゼント」のような知識条件を有する検索クエリ履歴に対応する「ウェブサイト」、「回答のテキスト」、「支持数」及び「反対数」のような検索結果情報は、百度知道、捜捜問答、及び淘宝問答のようなコミュニティウェブサイトから最初に捕捉されてよい。検索クエリ履歴に対応する「シャツ、ネクタイ、ベルト、腕時計、ブリーフケース、ペン」のような候補エンティティ情報は、表1の検索結果情報の「回答のテキスト」から抽出される。そこで、候補エンティティ情報は、それぞれ格付けされてよい。「シャツ、ネクタイ、ベルト、腕時計、ブリーフケース、ペン」という候補エンティティ情報は、これらのスコアに従ってスクリーニングされる。例えば、ペンのスコアが低いと、「ペン」は削除される。表3に示されるもののように、エンティティ情報及びスクリーニング後のこれらのスコアが取得される。例えば、エンティティ情報は、「シャツ、ネクタイ、ベルト、腕時計、ブリーフケース」であってよい。エンティティ情報は、その後、「シャツ、ネクタイ、ベルト、腕時計、ブリーフケース」のスコアに従って、ランク付けされてよい。より高いスコアを有するエンティティ情報は、最上位に提示され、これにより、ユーザは、これを容易に参照及び選択することができ、このように、適応の正確性を向上させる。
上述の観点から、知識条件を含む検索クエリ履歴に対して、本開示は、検索クエリ履歴に対するエンティティ情報をマイニングし、ユーザへの推奨回答として用いてよい。このように、ユーザへの推奨エンティティ情報の正確性が向上し、知識条件を有する検索クエリ履歴に対する検索結果が好ましくないという現在の問題が解決される。
さらに、本開示は、各検索クエリ履歴に対応する候補エンティティ情報をスクリーニングし、検索クエリ履歴に対応するエンティティ情報を選択する。不正確な又は正確性の低い候補エンティティ情報をスクリーニング及び削除することによって、このようなメカニズムは、正確な候補エンティティ情報を取得し、これをエンティティ情報として用いることを可能とし、これにより、ユーザに提供されるべき、さらに最適化されたより正確なエンティティ情報を取得する。
さらに、本開示は、各検索クエリ履歴に対応するエンティティ情報のスコアを算出する。候補エンティティ情報は、スクリーニングされ、エンティティ情報は、スコアに従って選択される。代替的に、本開示は、選択されたエンティティ情報をランク付けし、エンティティ情報をユーザに提供し、これにより、より正確な推奨結果を提供する。
当業者であれば、本開示の主旨及び範囲から逸脱することなく、本開示に様々な変形及び変更をなすことができることは、明らかである。従って、本開示の変形及び変更が本開示の特許請求の範囲及びこれらの均等技術に属する場合、本開示は、これらの変形及び変更を組み込むことをさらに意図するものである。
本開示は、ソフトウェア及び/又はソフトウェア及びハードウェアの組み合わせで実装されてよく、例えば、特定用途向け集積回路(ASIC)、汎用コンピュータ又は任意の他の同様のハードウェアデバイスが、本開示を実装するために用いられてよいことに留意されたい。一実施形態において、本開示のソフトウェアプログラムは、プロセッサによって実行され、上述されたステップ又は機能を実現してよい。同様に、本開示のソフトウェアプログラム(関連するデータ構造を含む)は、コンピュータ可読記録媒体、例えば、RAMメモリ、磁気もしくは光学ドライブ又はフロッピディスク(登録商標)及び同様のデバイスに格納されてよい。さらに、本開示のいくつかのステップ又は機能は、ハードウェア、例えば、プロセッサと連携して様々なステップ又は機能を実行する回路によって実装されてよい。
さらに、本開示の一部は、コンピュータプログラム製品、例えば、コンピュータプログラム命令として適用されてよく、コンピュータによって実行された場合に、本開示に係る方法及び/又は技術的解決手段は、コンピュータのオペレーションによって呼び出され又は提供されてよい。本開示の方法を呼び出すプログラム命令は、固定又は取り外し可能の記録媒体に格納されてよく、及び/又は、他の信号ベアラ媒体においてブロードキャストもしくはデータストリーミングにより送信されてよく、及び/又は、プログラム命令に従って実行するコンピュータデバイスの動作メモリに格納されてよい。本明細書において、本開示に係る実施形態は、デバイスを含む。デバイスは、コンピュータプログラム命令を格納するように構成されるメモリと、プログラム命令を実行するように構成されるプロセッサと、を含む。コンピュータプログラム命令は、プロセッサによって実行され、デバイスは、本開示の複数の実施形態に基づいて、方法及び/又は技術的解決手段を実行するようにトリガされる。
当業者にとって、本開示が前述された例示的実施形態の詳細に限定されるものではなく、本開示は、本開示の主旨又は基本的特徴から逸脱することなく、他の具体的な形式で実装可能であることは明らかである。従って、いずれにせよ、実施形態は、例示的かつ非限定的とみなされるべきである。本開示の範囲は、上述の説明の代わりに、添付の特許請求の範囲によって定義される。従って、本開示は、特許請求の範囲の均等な要素の意味及び範囲に属する全ての変更を包含することが意図される。特許請求の範囲における参照符号は、これらが含まれるクレームを限定するものとみなされるべきではない。さらに、「含む/備える」という用語は、他のユニット又はステップを排除するものではなく、単数形は複数形を排除するものではないことは明らかである。デバイスクレームに記載された複数のユニット又はデバイスは、ソフトウェア又はハードウェアによって、1つのユニット又はデバイスによって実装されてもよい。第1及び第2のような用語は、名称を示すために用いられるものであるが、何らかの特定の連続を示すものではない。
[項目1]
検索データを処理するための方法であって、
知識条件を含む複数の検索クエリ履歴に対応する検索結果情報を取得する段階と、
上記検索結果情報から、上記複数の検索クエリ履歴に対応する候補エンティティ情報を抽出する段階と、
上記候補エンティティ情報に従って、各検索クエリ履歴に対応するエンティティ情報を決定する段階と、
を備える方法。
[項目2]
上記検索結果情報から、検索クエリ履歴から候補エンティティ情報を抽出する段階は、
検索クエリ履歴のタイプに従って、上記検索クエリ履歴から上記候補エンティティ情報を抽出する方法を決定する段階と、
上記決定された方法に従って、上記検索クエリ履歴に関連付けられた上記検索結果情報から上記候補エンティティ情報を抽出する段階と、
を含む、項目1に記載の方法。
[項目3]
上記候補エンティティ情報に従って、各検索クエリ履歴に対応するエンティティ情報を決定する段階は、検索クエリ履歴に対応する上記エンティティ情報として、各検索クエリ履歴に対応する全ての候補エンティティ情報を特定する段階を含む、項目1又は2に記載の方法。
[項目4]
上記検索結果情報は、検索クエリ履歴に対応する回答のテキストコンテンツ、ウェブサイト、支持数、及び反対数を含む、項目1から3のいずれかに記載の方法。
[項目5]
上記検索結果情報から、上記複数の検索クエリ履歴に対応する候補エンティティ情報を抽出する段階は、上記検索クエリ履歴に対応する回答のテキストコンテンツから、検索クエリ履歴に対応する候補エンティティ情報を抽出する段階を含む、項目4に記載の方法。
[項目6]
上記候補エンティティ情報に従って、各検索クエリ履歴に対応するエンティティ情報を決定する段階は、検索クエリ履歴に対応する上記候補エンティティ情報をスクリーニングし、上記検索クエリ履歴に対応するエンティティ情報を選択する段階を含む、項目4又は5に記載の方法。
[項目7]
上記検索結果情報から、上記複数の検索クエリ履歴に対応する候補エンティティ情報を抽出する段階の後で、上記方法は、上記候補エンティティ情報のスコアを算出する段階をさらに備える、項目6に記載の方法。
[項目8]
検索クエリ履歴に対応する上記候補エンティティ情報の上記スコアは、式
Figure 0006966158
に従って算出され、entity1は、エンティティワードを示し、mは、ウェブサイトの合計数を示し、iは、m個の上記ウェブサイトのうち選択されたウェブサイトを示し、nは、ウェブサイトiの合計回答数を示し、jは、n個の上記回答の中の回答を示し、Eijは、entity1が上記ウェブサイトiの上記回答jに出現するか否かを示し、
entity1が上記回答jに出現する場合、Eijは1に等しく、entity1が上記回答jに出現しない場合、Eijは0に等しく、Weight1は、上記ウェブサイトiの重みを示し、Weight2は、上記回答jの重みを示し、上記Weight2の値は、上記回答jの支持数及び反対数によって決定され、Weight2は、1より大きい又はこれに等しい正の整数であって、かつ、デフォルト値1を有する、項目7に記載の検索データを処理するための方法。
[項目9]
検索クエリ履歴に対応する上記候補エンティティ情報をスクリーニングし、上記検索クエリ履歴に対応するエンティティ情報を選択する段階は、各候補エンティティ情報の上記スコアに従って、上記検索クエリ履歴に対応する上記候補エンティティ情報から検索クエリ履歴に対応するエンティティ情報を選択する段階を含む、項目7又は8に記載の方法。
[項目10]
検索クエリ履歴に対応する上記候補エンティティ情報をスクリーニングし、上記検索クエリ履歴に対応するエンティティ情報を選択する段階の後で、上記方法は、各候補エンティティ情報の上記スコアに従って、上記対応するエンティティ情報のスコアを取得する段階をさらに備える、項目9に記載の方法。
[項目11]
上記候補エンティティ情報に従って、各検索クエリ履歴に対応するエンティティ情報を決定する段階の後で、上記方法は、知識条件を含む現在の検索クエリに従って、対応する検索クエリ履歴を特定する段階と、
上記対応する検索クエリ履歴に対応するエンティティ情報を取得する段階と、
をさらに備える、項目10に記載の方法。
[項目12]
上記対応する検索クエリ履歴に対応するエンティティ情報を取得する段階の後で、上記方法は、上記対応する検索クエリ履歴に対応する上記エンティティ情報のスコアを取得し、上記対応する検索クエリ履歴に関連付けられた各エンティティ情報のスコアに従って、上記エンティティ情報をランク付けする段階をさらに備える、項目11に記載の方法。
[項目13]
検索データを処理するための装置であって、
知識条件を含む複数の検索クエリ履歴に対応する検索結果情報を取得するように構成される第1のデバイスと、
上記検索結果情報から、上記複数の検索クエリ履歴に対応する候補エンティティ情報を抽出するように構成される第2のデバイスと、
上記候補エンティティ情報に従って、各検索クエリ履歴に対応するエンティティ情報を決定するように構成される第3のデバイスと、
を備える装置。
[項目14]
上記第2のデバイスは、
対応する検索クエリ履歴のタイプに従って、上記対応する検索クエリ履歴から上記候補エンティティ情報を抽出する方法を決定するように構成される第1のユニットと、
上記決定された方法に従って、上記対応する検索クエリ履歴に関連付けられた上記検索結果情報から、上記候補エンティティ情報を抽出するように構成される第2のユニットと、
を含む、項目13に記載の装置。
[項目15]
上記第3のデバイスは、対応する検索クエリ履歴に対応する上記エンティティ情報として、各検索クエリ履歴に対応する全ての候補エンティティ情報を特定するように構成される、項目13又は14に記載の装置。
[項目16]
上記第1のデバイスによって取得された上記検索結果情報は、検索クエリ履歴に対応する回答のテキストコンテンツ、ウェブサイト、支持数、及び反対数を含む、項目13から15のいずれかに記載の装置。
[項目17]
上記第2のデバイスは、上記検索クエリ履歴に対応する回答のテキストコンテンツから、検索クエリ履歴に対応する候補エンティティ情報を抽出する、項目16に記載の装置。
[項目18]
上記第3のデバイスは、検索クエリ履歴に対応する上記候補エンティティ情報をスクリーニングし、上記検索クエリ履歴に対応するエンティティ情報を選択する、項目16又は17に記載の装置。
[項目19]
上記候補エンティティ情報のスコアを算出するように構成される第4のデバイスをさらに備える、項目18に記載の装置。
[項目20]
上記第4のデバイスは、式
Figure 0006966158
に従って、検索クエリ履歴に対応する上記候補エンティティ情報の上記スコアを算出し、entity1は、エンティティワードを示し、mは、ウェブサイトの合計数を示し、iは、m個の上記ウェブサイトのうち選択されたウェブサイトを示し、nは、ウェブサイトiの合計回答数を示し、jは、n個の上記回答の中の回答を示し、Eijは、entity1が上記ウェブサイトiの上記回答jに出現するか否かを示し、entity1が上記回答jに出現する場合、Eijは1に等しく、entity1が上記回答jに出現しない場合、Eijは0に等しく、Weight1は、上記ウェブサイトiの重みを示し、Weight2は、上記回答jの重みを示し、上記Weight2の値は、上記回答jの支持数及び反対数によって決定され、Weight2は、1より大きい又はこれに等しい正の整数であって、かつ、デフォルト値1を有する、項目19に記載の装置。
[項目21]
上記第3のデバイスは、各候補エンティティ情報の上記スコアに従って、各検索クエリ履歴に対応する上記候補エンティティ情報をスクリーニングし、上記検索クエリ履歴に対応するエンティティ情報を選択するように構成される、項目19又は20に記載の装置。
[項目22]
上記第3のデバイスは、各候補エンティティ情報の上記スコアに従って、上記対応するエンティティ情報のスコアを取得するようにさらに構成される、項目21に記載の装置。
[項目23]
知識条件を含む現在の検索クエリに従って、対応する検索クエリ履歴を特定するように構成される第5のデバイスと、
上記対応する検索クエリ履歴に対応するエンティティ情報を取得するように構成される第6のデバイスと、
をさらに備える、項目22に記載の装置。
[項目24]
上記第6のデバイスは、上記対応する検索クエリ履歴に対応する上記エンティティ情報のスコアを取得し、上記対応する検索クエリ履歴に関連付けられた各エンティティ情報のスコアに従って、上記エンティティ情報をランク付けするようにさらに構成される、項目23に記載の装置。

Claims (20)

  1. プロセッサにより、検索クエリ履歴に関連付けられた検索結果情報を取得する段階であって、前記検索クエリ履歴は知識条件を含み、前記知識条件は、情報に対するショッピングクエリを含み、前記検索結果情報は、テキストコンテンツ及びウェブサイト識別子を含み、前記テキストコンテンツは、前記ショッピングクエリに対する回答の支持数及び反対数を含む、段階と、
    前記プロセッサにより、前記ショッピングクエリの前記検索結果情報から候補エンティティ情報を抽出する段階であって、前記候補エンティティ情報は、前記検索結果情報に関連付けられた前記検索クエリ履歴に対応する、段階と、
    前記プロセッサにより、前記検索結果情報に基づいて、前記候補エンティティ情報のサブセットが前記検索クエリ履歴に関連付けられたエンティティ情報であると決定する段階と、
    を備える方法。
  2. 前記プロセッサにより、ユーザからの現在の検索クエリをネットワークを介して受信する段階であって、前記現在の検索クエリは前記知識条件を含む、段階と、
    前記プロセッサにより、前記現在の検索クエリに対応する前記検索クエリ履歴を特定する段階と、
    前記プロセッサにより、前記現在の検索クエリに応答して、前記ユーザに前記検索クエリ履歴に対応する前記エンティティ情報を前記ネットワークを介して送信する段階と
    をさらに備える、請求項1に記載の方法。
  3. 検索クエリ履歴に関連付けられた検索結果情報を取得する段階は、
    前記検索クエリ履歴に含まれるテキストコンテンツに基づいて、前記検索クエリ履歴のタイプを特定する段階と、
    前記検索クエリ履歴の前記タイプに基づいて、候補エンティティ情報を抽出するための方法を特定する段階と、
    候補エンティティ情報を抽出するための前記方法を用いて、候補エンティティ情報を抽出する段階と、
    を含む、請求項1又は2に記載の方法。
  4. 前記検索クエリ履歴に含まれるテキストコンテンツに基づいて、前記検索クエリ履歴のタイプを特定する段階は、1つ又は複数の予め定められたnグラム又はパターンの出現を特定する段階を含む、請求項3に記載の方法。
  5. 前記検索結果情報から候補エンティティ情報を抽出する段階は、前記テキストコンテンツ内に含まれる前記回答から候補エンティティ情報を抽出する段階を含む、請求項1から4のいずれか一項に記載の方法。
  6. 前記検索結果情報から候補エンティティ情報を抽出する段階は、前記候補エンティティ情報をスクリーニングし、前記候補エンティティ情報のサブセットを選択する段階をさらに含む、請求項1から5のいずれか1項に記載の方法。
  7. 前記検索結果情報から候補エンティティ情報を抽出する段階は、前記候補エンティティ情報にスコアを付与する段階と、前記候補エンティティ情報の最も高いスコアのサブセットを前記エンティティ情報として選択する段階とをさらに含む、請求項1から6のいずれか一項に記載の方法。
  8. 前記候補エンティティ情報にスコアを付与する段階は、ウェブサイトのテキストコンテンツ内の回答内に現れるエンティティワードの出現と、前記ウェブサイトに関連付けられる重みと、前記回答に関連付けられる重みとに基づいて、前記候補エンティティ情報にスコアを付与する段階を含む、請求項7に記載の方法。
  9. 前記回答に関連付けられる前記重みは、前記回答の支持数及び前記回答の反対数に基づいて決定される、請求項8に記載の方法。
  10. 装置であって、
    プロセッサと、
    前記プロセッサによって実行された場合に、
    検索クエリ履歴に関連付けられた検索結果情報を取得する工程であって、前記検索クエリ履歴は知識条件を含み、前記知識条件は、情報に対するショッピングクエリを含み、前記検索結果情報は、テキストコンテンツ及びウェブサイト識別子を含み、前記テキストコンテンツは、前記ショッピングクエリに対する回答の支持数及び反対数を含む、工程と、
    前記ショッピングクエリの前記検索結果情報から候補エンティティ情報を抽出する工程であって、前記候補エンティティ情報は、前記検索結果情報に関連付けられた前記検索クエリ履歴に対応する、工程と、
    前記検索結果情報に基づいて、前記候補エンティティ情報のサブセットが前記検索クエリ履歴に関連付けられたエンティティ情報であると決定する工程と
    を前記装置に実行させるコンピュータ実行可能命令を格納する非一時的メモリと、
    を備える装置。
  11. ネットワークを介してユーザから現在の検索クエリを受信する工程であって、前記現在の検索クエリは前記知識条件を含む、工程と、
    前記現在の検索クエリに対応する前記検索クエリ履歴を特定する工程と、
    前記現在の検索クエリに応答して、前記ネットワークを介して前記ユーザに前記検索クエリ履歴に対応する前記エンティティ情報を送信する工程と
    をさらに備える、請求項10に記載の装置。
  12. 検索クエリ履歴に関連付けられた検索結果情報を取得する工程は、
    前記検索クエリ履歴に含まれるテキストコンテンツに基づいて、前記検索クエリ履歴のタイプを特定する工程と、
    前記検索クエリ履歴の前記タイプに基づいて、候補エンティティ情報を抽出するための方法を特定する工程と、
    候補エンティティ情報を抽出するための前記方法を用いて、候補エンティティ情報を抽出する工程と
    を含む、請求項10又は11に記載の装置。
  13. 前記検索クエリ履歴に含まれるテキストコンテンツに基づいて、前記検索クエリ履歴のタイプを特定する工程は、1つ又は複数の予め定められたnグラム又はパターンの出現を特定する工程を含む、請求項12に記載の装置。
  14. 前記検索結果情報から候補エンティティ情報を抽出する工程は、前記テキストコンテンツ内に含まれる前記回答から候補エンティティ情報を抽出する工程を含む、請求項10から13のいずれか一項に記載の装置。
  15. 前記検索結果情報から候補エンティティ情報を抽出する工程は、前記候補エンティティ情報をスクリーニングし、前記候補エンティティ情報のサブセットを選択する工程をさらに含む、請求項10から14のいずれか一項に記載の装置。
  16. 前記検索結果情報から候補エンティティ情報を抽出する工程は、前記候補エンティティ情報にスコアを付与する工程と、前記候補エンティティ情報の最も高いスコアが付与されたサブセットを前記エンティティ情報として選択する工程とをさらに含む、請求項10から15のいずれか一項に記載の装置。
  17. 前記候補エンティティ情報にスコアを付与する工程は、ウェブサイトのテキストコンテンツ内の回答内に現れるエンティティワードの出現と、前記ウェブサイトに関連付けられる重みと、前記回答に関連付けられる重みとに基づいて、前記候補エンティティ情報にスコアを付与する工程を含む、請求項16に記載の装置。
  18. 前記回答に関連付けられる前記重みは、前記回答の支持数及び前記回答の反対数に基づいて決定される、請求項17に記載の装置。
  19. プロセッサに、
    検索クエリ履歴に関連付けられた検索結果情報を取得する手順であって、前記検索クエリ履歴は知識条件を含み、前記知識条件は、情報に対するショッピングクエリを含み、前記検索結果情報は、テキストコンテンツ及びウェブサイト識別子を含み、前記テキストコンテンツは、前記ショッピングクエリに対する回答の支持数及び反対数を含む、手順と、
    前記ショッピングクエリの前記検索結果情報から候補エンティティ情報を抽出する手順であって、前記候補エンティティ情報は、前記検索結果情報に関連付けられた前記検索クエリ履歴に対応する、手順と、
    前記検索結果情報に基づいて、前記候補エンティティ情報のサブセットが前記検索クエリ履歴に関連付けられたエンティティ情報であると決定する手順と
    を実行させるためのプログラム。
  20. 前記プロセッサに、
    ネットワークを介して現在の検索クエリを、ユーザから受信する手順であって、前記現在の検索クエリは前記知識条件を含む、手順と、
    前記現在の検索クエリに対応する前記検索クエリ履歴を特定する手順と、
    前記現在の検索クエリに応答して、前記ユーザに前記検索クエリ履歴に対応する前記エンティティ情報を前記ネットワークを介して送信する手順と
    をさらに実行させる、請求項19に記載のプログラム。
JP2020114011A 2014-12-23 2020-07-01 検索データを処理するための方法、装置及びプログラム Active JP6966158B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201410836116.9A CN105786936A (zh) 2014-12-23 2014-12-23 用于对搜索数据进行处理的方法及设备
CN201410836116.9 2014-12-23
JP2017532636A JP6728178B2 (ja) 2014-12-23 2015-12-15 検索データを処理するための方法及び装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2017532636A Division JP6728178B2 (ja) 2014-12-23 2015-12-15 検索データを処理するための方法及び装置

Publications (2)

Publication Number Publication Date
JP2020170538A JP2020170538A (ja) 2020-10-15
JP6966158B2 true JP6966158B2 (ja) 2021-11-10

Family

ID=56149237

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2017532636A Active JP6728178B2 (ja) 2014-12-23 2015-12-15 検索データを処理するための方法及び装置
JP2020114011A Active JP6966158B2 (ja) 2014-12-23 2020-07-01 検索データを処理するための方法、装置及びプログラム

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2017532636A Active JP6728178B2 (ja) 2014-12-23 2015-12-15 検索データを処理するための方法及び装置

Country Status (4)

Country Link
US (2) US10635678B2 (ja)
JP (2) JP6728178B2 (ja)
CN (1) CN105786936A (ja)
WO (1) WO2016101812A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106383865B (zh) * 2016-09-05 2020-03-27 北京百度网讯科技有限公司 基于人工智能的推荐数据的获取方法及装置
KR102676115B1 (ko) 2016-12-12 2024-06-19 삼성전자주식회사 위치 데이터를 제공하는 전자 장치 및 그 방법
CN107180098B (zh) * 2017-05-16 2019-11-12 武汉斗鱼网络科技有限公司 一种信息搜索中关键词淘汰方法及装置
CN107454613A (zh) * 2017-09-06 2017-12-08 上海斐讯数据通信技术有限公司 一种无线网络的优化方法和系统
CN108256970A (zh) * 2018-01-15 2018-07-06 北京值得买科技股份有限公司 一种基于购物需求进行产品推荐的方法
CN109033140B (zh) * 2018-06-08 2020-05-29 北京百度网讯科技有限公司 一种确定搜索结果的方法、装置、设备和计算机存储介质

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6963867B2 (en) 1999-12-08 2005-11-08 A9.Com, Inc. Search query processing to provide category-ranked presentation of search results
US20030217052A1 (en) * 2000-08-24 2003-11-20 Celebros Ltd. Search engine method and apparatus
JP2003296628A (ja) * 2002-04-01 2003-10-17 Knowledgescience Corp 電子商取引システムにおける知識ベースを利用した購買支援方法
JP4654776B2 (ja) * 2005-06-03 2011-03-23 富士ゼロックス株式会社 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
KR100721406B1 (ko) 2005-07-27 2007-05-23 엔에이치엔(주) 카테고리별 검색 로직을 이용한 상품 검색 시스템 및 방법
US20070050332A1 (en) 2005-08-26 2007-03-01 Grenzberg Christopher G Method and apparatus for providing a comparative product information of related products
US7668823B2 (en) 2007-04-03 2010-02-23 Google Inc. Identifying inadequate search content
US8200663B2 (en) * 2007-04-25 2012-06-12 Chacha Search, Inc. Method and system for improvement of relevance of search results
CN100552680C (zh) * 2007-05-17 2009-10-21 腾讯科技(深圳)有限公司 一种知识共享系统及问题搜索方法、问题发布方法
WO2009057205A1 (ja) * 2007-10-31 2009-05-07 Pioneer Corporation 施設検索装置、施設検索方法、施設検索プログラム、および記録媒体
US7877389B2 (en) 2007-12-14 2011-01-25 Yahoo, Inc. Segmentation of search topics in query logs
US8346701B2 (en) * 2009-01-23 2013-01-01 Microsoft Corporation Answer ranking in community question-answering sites
US8458171B2 (en) * 2009-01-30 2013-06-04 Google Inc. Identifying query aspects
US9639609B2 (en) * 2009-02-24 2017-05-02 Microsoft Technology Licensing, Llc Enterprise search method and system
JP5096411B2 (ja) * 2009-05-22 2012-12-12 ヤフー株式会社 ネットショッピング管理装置
US20110106895A1 (en) * 2009-10-30 2011-05-05 Google Inc. Social search engine
US8725717B2 (en) 2009-12-23 2014-05-13 Palo Alto Research Center Incorporated System and method for identifying topics for short text communications
US8150859B2 (en) 2010-02-05 2012-04-03 Microsoft Corporation Semantic table of contents for search results
US9317613B2 (en) * 2010-04-21 2016-04-19 Yahoo! Inc. Large scale entity-specific resource classification
US8606739B2 (en) * 2010-06-30 2013-12-10 Microsoft Corporation Using computational engines to improve search relevance
EP2622592A4 (en) 2010-09-28 2017-04-05 International Business Machines Corporation Providing answers to questions using multiple models to score candidate answers
US9098569B1 (en) * 2010-12-10 2015-08-04 Amazon Technologies, Inc. Generating suggested search queries
US8775431B2 (en) 2011-04-25 2014-07-08 Disney Enterprises, Inc. Systems and methods for hot topic identification and metadata
US9098600B2 (en) 2011-09-14 2015-08-04 International Business Machines Corporation Deriving dynamic consumer defined product attributes from input queries
JP2013077056A (ja) * 2011-09-29 2013-04-25 Ntt Docomo Inc アプリケーション推薦装置及びアプリケーション推薦方法
US9665643B2 (en) * 2011-12-30 2017-05-30 Microsoft Technology Licensing, Llc Knowledge-based entity detection and disambiguation
CN103218719B (zh) 2012-01-19 2016-12-07 阿里巴巴集团控股有限公司 一种电子商务网站导航方法及系统
US8620951B1 (en) 2012-01-28 2013-12-31 Google Inc. Search query results based upon topic
US8768910B1 (en) 2012-04-13 2014-07-01 Google Inc. Identifying media queries
US9129020B2 (en) 2012-12-21 2015-09-08 Microsoft Technology Licensing, Llc Search results through interest circles
US10394816B2 (en) 2012-12-27 2019-08-27 Google Llc Detecting product lines within product search queries
US9251474B2 (en) * 2013-03-13 2016-02-02 International Business Machines Corporation Reward based ranker array for question answer system
US9213748B1 (en) 2013-03-14 2015-12-15 Google Inc. Generating related questions for search queries
US9336269B1 (en) * 2013-03-14 2016-05-10 Google Inc. Determining question and answer alternatives
US10394901B2 (en) 2013-03-20 2019-08-27 Walmart Apollo, Llc Method and system for resolving search query ambiguity in a product search engine
CN103279486B (zh) 2013-04-24 2019-03-08 百度在线网络技术(北京)有限公司 一种提供相关搜索的方法和装置
CN103294814A (zh) * 2013-06-07 2013-09-11 百度在线网络技术(北京)有限公司 搜索结果推荐方法、系统和搜索引擎
CN103914543B (zh) * 2014-04-03 2017-12-26 北京百度网讯科技有限公司 搜索结果的展现方法和装置
CN103914554A (zh) * 2014-04-14 2014-07-09 百度在线网络技术(北京)有限公司 搜索推荐方法和装置

Also Published As

Publication number Publication date
US10635678B2 (en) 2020-04-28
JP6728178B2 (ja) 2020-07-22
US11347758B2 (en) 2022-05-31
WO2016101812A1 (zh) 2016-06-30
US20200226142A1 (en) 2020-07-16
US20180011857A1 (en) 2018-01-11
JP2020170538A (ja) 2020-10-15
JP2018504686A (ja) 2018-02-15
CN105786936A (zh) 2016-07-20

Similar Documents

Publication Publication Date Title
JP6966158B2 (ja) 検索データを処理するための方法、装置及びプログラム
US10140368B2 (en) Method and apparatus for generating a recommendation page
JP5984917B2 (ja) 提案される語を提供するための方法および装置
US11762926B2 (en) Recommending web API's and associated endpoints
US20170154116A1 (en) Method and system for recommending contents based on social network
US7685200B2 (en) Ranking and suggesting candidate objects
US8793270B2 (en) System and method for providing personalized recommended word and computer readable recording medium recording program for implementing the method
CN107180093B (zh) 信息搜索方法及装置和时效性查询词识别方法及装置
JP5661200B2 (ja) 検索情報の提供
JP2017157192A (ja) キーワードに基づいて画像とコンテンツアイテムをマッチングする方法
CN108595642A (zh) 一种搜索应用程序内信息的方法及设备
CN102855309B (zh) 一种基于用户行为关联分析的信息推荐方法及装置
JP2017220203A (ja) 類似性スコアに基づきコンテンツアイテムと画像とのマッチングを評価する方法、およびシステム
JP2017220205A (ja) 検索クエリに応答してコンテンツとマッチングしようとする画像を動的にランキングする方法及びシステム
CN108090104B (zh) 用于获取网页信息的方法和装置
US9710456B1 (en) Analyzing user reviews to determine entity attributes
CN111061954B (zh) 搜索结果排序方法、装置及存储介质
JP6363682B2 (ja) 画像とコンテンツのメタデータに基づいてコンテンツとマッチングする画像を選択する方法
US11392589B2 (en) Multi-vertical entity-based search system
JP6185379B2 (ja) レコメンド装置およびレコメンド方法
JP2019522852A (ja) 文脈情報を提供するためのシステムおよび方法
JP2017220204A (ja) 検索クエリに応答してホワイトリストとブラックリストを使用し画像とコンテンツをマッチングする方法及びシステム
JP6203304B2 (ja) 情報処理装置、情報処理方法および情報処理プログラム
WO2018022333A1 (en) Cross-platform computer application query categories
CN111353075A (zh) 信息处理装置、记录媒体及信息处理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200702

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210601

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210826

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210921

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211018

R150 Certificate of patent or registration of utility model

Ref document number: 6966158

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150