JP5615932B2 - 検索方法およびシステム - Google Patents

検索方法およびシステム Download PDF

Info

Publication number
JP5615932B2
JP5615932B2 JP2012538819A JP2012538819A JP5615932B2 JP 5615932 B2 JP5615932 B2 JP 5615932B2 JP 2012538819 A JP2012538819 A JP 2012538819A JP 2012538819 A JP2012538819 A JP 2012538819A JP 5615932 B2 JP5615932 B2 JP 5615932B2
Authority
JP
Japan
Prior art keywords
score
search
search results
search result
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012538819A
Other languages
English (en)
Other versions
JP2013511085A (ja
Inventor
リー ツァン
リー ツァン
ジンホイ リー
ジンホイ リー
リュイジエ グオ
リュイジエ グオ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Publication of JP2013511085A publication Critical patent/JP2013511085A/ja
Application granted granted Critical
Publication of JP5615932B2 publication Critical patent/JP5615932B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

関連出願の相互参照
本願は、中国特許出願第200910211788.X号(2009年11月12日出願)である題名「SEARCH METHOD AND SYSTEM」の優先権を主張するものであり、その全体は参照により本明細書に組み込まれる。
本開示は、ネットワークデータ処理の分野に関するものであり、より詳細には、検索方法およびシステムに関するものである。
検索エンジンを利用した検索処理では、検索結果はいくつかの属性(地域、ソースまたは主題など)に従い第2にランク付けされ得るため、上位n(nは1以上)の検索結果は、これらの属性に関する区分の多様性を示す。これは検索結果の多様性と呼ばれる。電子商取引検索に関して言えば、検索結果は多くの場合に、関連性または時間に従いランク付けされる。それ故、販売会社が既定の製品を検索結果のトップページに表示することを目的として、その製品の情報を継続的に公表することにより、1つ以上の他の販売会社が製品を表示する機会を不当に奪い、一般ユーザが他の販売会社の製品を探すことが困難になる。
このような問題を避けるために、現在の技術は関連性に基づく検索結果を抽出および類別する検索方法を提供している。詳細な実行プロセスは下記するように、その検索結果を関連性に基づいて事前に類別し、類似する関連スコアを有する検索結果を同一カテゴリに分類し、次に、各カテゴリから検索結果を抽出する。抽出は、例えば、uid(販売会社固有の識別番号)などの、多様性に関する基準としてフィールドの選択を含む。この結果、検索結果には、多様性のある販売会社の製品が含まれる。実際には、検索結果をuidスコアに従う多くのサブセットに分類する。同一のuidに関する検索結果を同一のサブセットに分類し、同一のサブセット内の関連スコアの高低に従いランク付けする。各サブセット内のm(mは1以上)個の最も関連性のある検索結果を抽出し、検索結果の上位数ページに表示する。それ故、上位数ページの検索結果は、種々のuidまたは販売会社の製品を含み得る。
現在の技術に基づく前述の処理には、uidに従うサブセットの分類およびランク付けが要求される。このような処理は検索結果をある程度多様化し得るが、現在の技術は、抽出および分類処理における全ての検索結果を再編成する必要がある。これはシステムメモリに検索結果をコピーする必要があるため、ハードウェアシステムの処理時間および消費量などの、検索エンジンサーバにおける大量の資源を消費する。そして検索エンジンの性能を低下させる可能性がある。さらに、各サブセットのランク付けは、実際には必ずしも必要な訳ではない。それ故、現在の技術は一部の余計な計算を実行することもあり、このような計算のためのシステム資源を無駄に消費する。さらに、現在の技術は関連性に基づいて分類し、検索結果の多様性と関連性とのバランスをある程度保つが、全ての検索結果を正確に分類するための固定された分類区間を利用できない。図1に示すように、区間分類はクエリAでは適切であるが、クエリBでは適切ではない。クエリAでは、類似する関連性を有する検索結果が同一区間に分類されることを示す。しかしながら、クエリBでは、類似する関連性を有する検索結果は通常、同一区間には分類されない。それ故、現在の技術には柔軟性が欠如している。
概して、当業者が直面する未解決の課題は、サーバ資源の過剰消費の問題を解決する検索方法を独創的に提示することである。
本開示は、現在の技術に基づく、サーバ資源の過剰消費に起因する検索エンジンサーバの性能低下の問題を解決する検索方法を提供する。検索方法はさらに、検索の柔軟性を向上する。
本開示はまた、前述の方法の実施および利用を保証する検索システムを提供する。
一態様では、検索方法は、クライアントが提示するクエリデータに従い、クエリデータに関連する第1の検索結果の第1の検索結果セットを取得することと、第1の検索結果セット内の第1の検索結果各々の第1の関連スコアおよび第1の検索結果各々の属性カテゴリを表すプリセット多様性フィールドに従い、第1の検索結果各々の第2の関連スコアを計算することと、第1の関連スコアおよび第2の関連スコアに従い、第1の検索結果各々に関する関連パラメータスコアを生成することと、第2の検索結果のプリセット数および関連パラメータスコアに従い、第1の検索結果セットから第2の検索結果の存在数を抽出し、クライアントに表示することと、を含み得る。一実施形態では、第1の検索結果各々の第2の関連スコアの計算は、第1の検索結果セット内の第1の検索結果各々のプリセット多様性フィールドに従い第1の検索結果セットを分類して、第1の検索結果セットの各属性カテゴリに対応する各サブセットを取得することと、各サブセットの第1の関連スコアに従い第1の検索結果各々に対応するランキング位置を取得することと、第1の検索結果各々のランキング位置と第2の関連スコアとのプリセット関係に従い、第1の検索結果各々の第2の関連スコアを取得することと、を含み得る。
一実施形態では、第1の検索結果セットからの第2の検索結果のプリセット数の抽出、およびそれのクライアントへの表示は、第1の検索結果の分類後に、関連パラメータスコアに従い各サブセットをランク付けすることと、ランキング順位に従いランク付けされたサブセット各々から、多様性値の数と反復抽出の数との積である第2の検索結果のプリセット数を抽出することと、を含み得る。
一実施形態では、この方法は、クエリデータ、第2の検索結果のプリセット数、およびクエリデータと第2の検索結果のプリセット数との対応関係をデータベースに記憶することをさらに含み得る。
一実施形態では、クエリデータに関連する第1の検索結果の第1の検索結果セットの取得は、第1の関連スコアに従いクライアントが提示するクエリデータに基づいて検索を実行することと、プリセット多様性フィールドに従いその検索の検索結果から第1の検索結果を抽出することと、を含み得る。
一実施形態では、この方法は、第2の検索結果のプリセット数をクライアントに表示することをさらに含み得る。
一実施形態では、第1の検索結果各々の関連パラメータスコアの生成は、第1の関連スコアと第2の関連スコアとを合計して、第1の検索結果各々に関する関連パラメータスコアを算出することを含み得る。
別の態様では、検索システムは、クライアントが提示するクエリデータに従い、クエリデータに関連する第1の検索結果の第1の検索結果セットを取得する読み出しユニットと、第1の検索結果セット内の第1の検索結果各々の第1の関連スコアおよび第1の検索結果各々の属性カテゴリを表すプリセット多様性フィールドに従い、第1の検索結果各々の第2の関連スコアを算出する演算ユニットと、第1の関連スコアおよび第2の関連スコアに従い、第1の検索結果各々の関連パラメータスコアを生成する設定ユニットと、第2の検索結果のプリセット数および関連パラメータスコアに従い、第1の検索結果セットから第2の検索結果の存在数を抽出して、クライアントに表示する抽出ユニットと、を含み得る。
一実施形態では、演算ユニットは、プリセット多様性フィールドに従い第1の検索結果セットを分類して、第1の検索結果セットの各属性カテゴリに対応する各サブセットを取得する第1の読み出しサブユニットと、各サブセットの第1の関連スコアに従い第1の検索結果各々に対応するランキング位置を取得する第2の読み出しサブユニットと、第1の検索結果各々のランキング位置と第2の関連スコアとのプリセット関係に従い、第1の検索結果各々の第2の関連スコアを取得する照合ユニットと、を含み得る。
一実施形態では、抽出ユニットは、関連パラメータスコアに従い第1の検索結果各々をランク付けするランク付けサブユニットと、ランキング順位に従いランク付けされたサブセットから多様性値の数と反復抽出の数との積である第2の検索結果のプリセット数を抽出する第1の抽出サブユニットと、を含み得る。
一実施形態では、システムは、クエリデータ、第2の検索結果のプリセット数、およびクエリデータと第2の検索結果のプリセット数との対応関係をデータベースに記憶する記憶ユニットをさらに含み得る。
一実施形態では、読み出しユニットは、第1の関連スコアに従いクライアントが提示するクエリデータに基づいて検索を実行する検索サブユニットと、プリセット多様性フィールドに従いその検索の検索結果から第1の検索結果を抽出する第2の抽出サブユニットと、を含み得る。
一実施形態では、システムは、第2の検索結果のプリセット数をクライアントに表示する表示ユニットをさらに含み得る。
一実施形態では、設定ユニットは、第1の関連スコアと第2の関連スコアとを合計して、第1の検索結果各々の関連パラメータスコアを算出し得る。
現在の技術と比較した本開示の利点を下記する。
本開示は関連パラメータとして、現在の技術に基づく第1の関連スコアに加えて、算出した第2の関連スコアを用いる。本開示は関連パラメータを用いて検索結果の第2の抽出を実行することにより、検索結果をさらに多様化する。本開示はまた、多様化処理における最適化をさらに実行し、システム資源の消費量の低減、計算の高速化、および柔軟性の向上を保証することにより、検索エンジンサーバの性能を向上する。本開示の全ての実施形態が、前述の全ての利点を必ずしも有する訳では無いことが理解される。
本開示の実施形態または現在の技術手法をよりよく説明するために、実施形態の記述に用いられる図面の簡単な説明を以下に記述する。以下の図面は、本開示の一部の実施形態のみに関連する。当業者は、独創的な努力をせずとも、本開示の図面に準じる他の図面を取得できる。
現在の技術における分類境界を示す図である。 本開示に従う検索方法の第1の実施形態を説明する例示のフローチャートである。 本開示に従う検索方法の第2の実施形態を説明する例示のフローチャートである。 本開示に従う検索方法の第3の実施形態を説明する例示のフローチャートである。 本開示に従う検索システムの第1の実施形態を示す図である。 本開示に従う検索システムの第2の実施形態を示す図である。 本開示に従う検索システムの第3の実施形態を示す図である。
本開示は、示す図面を参照して、実施形態の方法を明確かつ十分に説明する。本開示の全ての実施形態ではなく、いくつかの実施形態のみに関連する図面を示す。当業者は、独創的な努力をせずとも、本開示の実施形態に準じた他の実施形態を実現できる。全てのこのような実施形態は本開示の範囲内に含まれる。
本開示は、汎用または専門のコンピュータシステム環境または設定において用いられ得る。この例には、パーソナルコンピュータ、サーバコンピュータ、携帯用デバイスまたは携帯機器、タブレットデバイス、マルチプロセッサシステム、および前述のあらゆるシステムまたはデバイスを含む分散コンピューティング環境が含まれる。
本開示は、プログラムモジュールなどの、コンピュータが実行するコンピュータ実行可能命令における一般状況の範囲内で記述され得る。通常、プログラムモジュールは、特定タスクを実行または特定の抽象データ型を実施するためのルーティン、プログラム、オブジェクト、モジュール、およびデータ構造などを含む。本開示はまた、分散コンピューティング環境においても実行され得る。分散コンピューティング環境では、通信ネットワークを通じて接続された遠隔処理デバイスを用いてタスクが実行され得る。分散コンピューティング環境では、プログラムモジュールは、1つ以上のローカルおよび/またはリモートコンピュータの1つ以上の(記憶装置を含む)記憶媒体に配置され得る。
本開示の一主題を以下に要約する。現在の技術は、クライアントが提示するクエリデータに従い、クエリデータに関連する第1の検索結果セットを取得するために用いられ得る。第1の検索結果セット内の第1の検索結果各々の第1の関連スコアおよびプリセット多様性フィールドに従い、第1の検索結果各々の第2の関連スコアを算出する。プリセット多様性フィールドは第1の検索結果各々の属性カテゴリを表し、これは本発明概念の重要な手段である。第1の関連スコアおよび第2の関連スコアに従い、第1の検索結果各々の関連スコアを生成する。最後に、1つ以上の第2の検索結果のプリセット数および関連スコアに従い、第1の検索結果セットから1つ以上の第2の検索結果を抽出して、クライアントに表示する。
このようにして抽出した第2の検索結果は検索結果の多様性を示し得、ハードウェアシステムの処理時間および消費などの、検索エンジンサーバにおける多くの資源の消費を回避することにより、検索エンジンサーバの性能を向上する。本開示の方法はさらに、より多くの検索結果セットの区分にも適応するため、柔軟性が向上する。
図2は本開示に従う第1の実施形態の例示の方法を説明する。この方法を以下に記述する。
この方法は201において、クライアントが提示するクエリデータに従い、クエリデータに関連する第1の検索結果セットを取得する。
検索エンジンに関連する技術分野では、ユーザのクエリは、通常、記号クエリまたはQueryを照合した結果がDocとして表されるQueryとして表され、Queryを照合した結果セットは、「Doc」として表されるDocセットである。
このステップでは、クライアントがQueryを提示した後に、検索エンジンサーバの内部処理手順の第1のステップにおいて、例えば、記号「→」がマッピングを表すQuery→「Doc」において、「Doc」におけるQueryをマッピングし得る。その間の時間に、検索エンジンサーバは、「Doc」内のDocごとの第1の関連スコア(スコア1)を算出する。スコア1は、最新のDocと最新のQueryとを照合する範囲を表すのに用いられ、例えば、記号型「Doc」→「Doc,スコア1」である。マッピング処理はQueryに基づいて検索結果を照合する処理である。スコア1の算出には、伝統的な用語頻度−逆文書頻度(TF−IDF)アルゴリズムなどの関連する任意のアルゴリズムを用いてもよい。情報利得(IG)、相互情報量(MI)、およびエントロピなどのいくつかの他の方法を用いてもよい。
第1の検索結果を取得するための任意のアルゴリズムを検索エンジンサーバが規定し得ることに留意されたい。本開示は、第1の検索結果セットを取得するための特定のアルゴリズムを、検索エンジンサーバが選択することを制限しない。それ故、このステップにおいて関連するアルゴリズムが相違する場合には、後に取得される第1の検索結果もまた相違し得る。本開示は第1の検索結果の多様性を目的としているため、この相違はこの方法のその後のステップに影響を及ぼさず、第1の検索結果の取得方法を制限しない。
この方法は202において、第1の検索結果セット内の第1の検索結果各々の第1の関連スコアおよび第1の検索結果各々の属性カテゴリを表すプリセット多様性フィールドに従い、第1の検索結果各々の第2の関連スコアを算出する。
第1の検索結果セット内の第1の検索結果各々のスコア1の計算後、プリセット多様性フィールドおよびスコア1に基づいて第2の関連スコア(スコア2)を算出する。プリセット多様性フィールドは、例えば、電子商取引のバーティカル検索における各検索結果のuid(販売会社の識別番号)または地理的位置情報などの、第1の検索結果各々の属性カテゴリを表す。スコア2は第1の検索結果各々のスコア1と多様性フィールドに基づくランク付けに基づくスコアを表すのに用いられる。実際の適用では、スコア2にはプリセット関数が用いられ得、スコア1および第1の検索結果各々のランキング位置としてプリセット関数に関するパラメータが設定される。関数の戻り値はスコア2の値である。関数において設定されたランキング位置は、スコア2に特に関連する。例えば、第1の検索結果のランク付けをより高くすると、スコア2の値はより大きくなる。種々の状況に基づいて、当業者はランキング位置とスコア2との他の関連性を示す方法を利用することができる。
この方法は203において、第1の関連スコアおよび第2の関連スコアに従い、第1の検索結果各々の関連パラメータスコアを生成する。
このステップにおける現在の技術との相違点は、スコア1および202において算出したスコア2に基づいて関連パラメータスコアを生成することである。一実施形態における、第1の検索結果各々の関連パラメータスコアを生成する詳細な方法を下記する。すなわち、第1の検索結果各々の関連パラメータスコアとして、スコア1とスコア2との合計値を用いるか、スコア1と、スコア2と加重値とを乗算した積との合計と関連パラメータスコアが等しくなるように加重値を設定する。例えば、仮に加重値を2に設定すると、関連するパラメータ値はスコア1+2×スコア2の値である。本開示は、スコア1およびスコア2に基づいて、第1の検索結果各々の関連パラメータスコアを生成する方法を制限しない。本開示の主題に従うあらゆる変更は本開示の範囲内に含まれる。この実施形態では、第1の検索結果セットは、単にスコア1に従い分類されず、スコア1およびスコア2のパラメータから生成された新規のパラメータによりさらに処理される。
この方法は204において、1つ以上の第2の検索結果のプリセット数および関連スコアに従い、第1の検索結果セットから1つ以上の第2の検索結果を抽出して、クライアントに表示する。
このステップでは、多様性フィールドをuidとして仮にプリセットすると、この実施形態に必要なパラメータには、第2の検索結果の存在数も含まれる。第2の検索結果の詳細なプリセット数は、多様性値の数と反復抽出の数をプリセットすることにより、例えば、抽出される第2の検索結果の数を取得するための、多様性値のプリセット数と反復抽出の数との積を計算することにより取得できる。多様性値の数は、その後抽出される第2の検索結果において抽出される種々のuidの第1の検索結果の数を表すのに用いられる。例えば、多様性値の数が3である場合には、uidが異なる3個の検索結果を抽出されることを示す。反復抽出の数は、抽出された第2の検索結果を後にクライアントに表示するときの数を表す。これをより具体的に言うと、反復抽出の数が1である場合には、3個の第2の検索結果をクライアントに戻し、反復抽出の数が2である場合には、6個の第2の検索結果を戻し、以下も同様である。このような抽出された第2の検索結果は、種々のuidに関連する検索結果を含む。
図3は本開示に従う第2の実施形態の例示の方法を説明する。この方法を以下に記述する。
この方法は301において、クライアントが提示するクエリデータに従い、クエリデータに関連する第1の検索結果セットを取得する。
実際の適用では、検索エンジンサーバの検索結果が多様性を有していない場合に、本実施形態が利用される。換言すれば、取得された第1の検索結果が第1の関連スコアに従いランク付けされた後でも、なおも同一の属性を有する検索結果が集中しているときに利用される。例えば、検索エンジンサーバが提供する上位いくつかの検索結果が全て同一の販売会社に関連する場合である。301の次に、第1の検索結果セットはさらに処理されるか、例えば、第1の検索結果セットの上位いくつかの結果が同一カテゴリに属するか否かが決定される。第1の検索結果セットの上位いくつかの結果が同一カテゴリに属する場合には、次のステップが実行され得る。
この方法は302において、プリセット多様性フィールドに従い第1の検索結果セットを分類して、第1の検索結果セットの各カテゴリに対応する各サブセットを取得する。
この実施形態では、下の表1に示すように、受信したプリセット多様性フィールドをuidとして仮に設定し、この多様性フィールドであるuidは3つの値「A,B,C」がある。この実施形態では、第1の検索結果セットであるuidに関連する「Doc」のサブセットは、「A1,A2,A3」、「B1,B2,B3」および「C1,C2,C3」を含む。A1〜A3のuidはAであり、A1〜A3は販売会社Aに関する検索結果である。B1〜B3のuidはBであり、B1〜B3は販売会社Bに関する検索結果である。C1〜C3のuidはCであり、C1〜C3は販売会社Cに関する検索結果である。
この方法は303において、各サブセットの第1の関連スコアに従い第1の検索結果に対応する位置を取得する。
この実施形態では、各サブセットにおける第1の検索結果は、スコア1に従いランク付けされる。表1に、第1の検索結果セット「Doc」、対応するuid、および各Docの第1の関連スコア(スコア1)を示す。
この方法は304において、第2の関連スコアと各サブセットにおける第1の検索結果各々の位置とのプリセット関係に従い、第1の検索結果各々の第2の実在スコアを取得するための照合を実行する。
実際の適用では、各サブセットにおける第1の検索結果各々の位置とスコア2との関係は、プリセット関数により表され得る。例えば、第1の検索結果各々の第2の関連スコアは、第2の関連スコアのプリセット読み出し関数を用いた計算により取得され得る。読み出し関数パラメータは、各サブセットおよび第2の関連スコアにより分類した後の、第1の検索結果各々の位置である。各サブセットにおける第1の検索結果各々の位置と第2の関連スコアとの関係は、第1の関連スコアに従いランク付けした後の各サブセットにおける各検索結果の位置と、多様性フィールドおよび第2の関連スコアに従う分類との関係として理解され得る。このような関係は関数f(Position,Score1)により表すことができる。このような関数は、ユーザの要求または実際の状況に応じて、いかなる形態および容量にも適応し得る。本開示は、関数形の詳細な実施を制限しない。例えば、実際の関数の例を以下に示す。
floatf(int position,float score){
if(position==1)
return300.0f;
else
return0.0f;
前述の関数の意図は、サブセットにおける第1の検索結果のランキング位置が1である場合には、300が戻るか、スコア2の値が300であり、そして他のランキング位置における第1の検索結果のスコア2は0である。
この方法は305において、第1の関連スコアおよび第2の関連スコアに従い、サブセットにおける第1の検索結果各々の関連パラメータスコアを生成する。
一実施形態では、第1の検索結果各々の関連パラメータスコアを生成する本開示に基づく詳細な方法は、304において取得した第2の関連スコアと、第1の検索結果の第1の関連スコアとの合計値を、第1の検索結果各々の関連パラメータスコアとして利用することを含み得る。下の表2に、サブセットにおける第1の関連スコア、第2の関連スコア、および第1の検索結果各々の関連パラメータスコアを示す。本開示は関連パラメータスコアを生成する方法を制限しない。本開示の主題に従うあらゆる簡単な変更が本開示の範囲内に含まれる。
この方法は306において、第1の検索結果の分類後に、関連パラメータスコアに従いサブセットをランク付けする。
第1の検索結果の分類後に、305において取得した新規のパラメータスコアに従い各サブセットをランク付けする。新規のランク付け後に、各サブセットにおける各検索結果の新規の順位を取得する。この実施形態では、第1の検索結果の新規のランク付け後の各サブセットの上位3つはA1、B1およびC1である。
この方法は307において、ランキング順位に従いランク付けされたサブセットから第2の検索結果のプリセット数を抽出し、第2の検索結果をクライアントに戻す。
第2の検索結果のプリセット数は、多様性値の数と反復抽出の数とのプリセットすることにより、例えば、抽出される第2の検索結果の数を取得するための、多様性値のプリセット数と反復抽出の数との積を計算することにより取得できる。
多様性フィールドは第1の検索結果の属性を示すために用いられる。多様性フィールド値は第1の検索結果の属性値を表す。この実施形態では、多様性フィールドはuidであり、多様性値はA、BおよびCである。第1の検索結果は、多様性フィールドに従いA、BおよびCなどの3つのサブセットに分類され得る。抽出される第2の検索結果の数は、直接プリセットするか、多様性値の数および反復抽出の数をプリセットすることにより取得され得る。多様性値の数は、その後抽出される第2の検索結果において抽出される種々のuidの第1の検索結果の数を表すのに用いられる。例えば、多様性値の数が3である場合には、販売会社A、BおよびC各々に関する3個の第1の検索結果を抽出したことを表す。この実施形態では、第2の検索結果は、反復抽出の数にも基づいて抽出され得る。反復抽出の数は、各カテゴリに関して反復的に抽出される第2の検索結果の数を表す。例えば、この実施形態では、反復抽出の数(distinct_times)は、それが1である場合には、第2の検索結果として各販売会社の検索結果から3個のみが抽出され、それが2である場合には、第2の検索結果として各販売会社の検索結果から6個(3×2)が抽出されたとして理解され得る。抽出数が2である場合などの抽出方法は、抽出数が1である場合と同じであり、以下同様に行われる。
distinct_countが1であり、かつdistinct_timesが1である設定に従い第2の検索結果を抽出すると、最終的に取得される第2の検索結果は、A1〜B1〜C1である。distinct_countが1であり、かつdistinct_timesが3である設定に従い第2の検索結果を抽出すると、最終的に取得される第2の検索結果は、A1〜B1〜C1〜A2〜A3〜B2〜B3〜C2〜C3である。当業者は、異なるdistinct_count、distinct_times、およびf(Position,Score1)を設定することにより、種々の多様化効果を達成し得、これにより、検索結果の多様性と関連性とのバランスを保ち得ることを理解する。
この実施形態に示す方法では、第2の検索結果の上位3つの履歴が、uidがそれぞれA、BおよびCである3つの検索結果を含むことが示される。それ故、クライアントに最終的に戻される第2の検索結果は多様性を有し得、検索結果に関する多様化要求を満たす。多様化処理はさらに最適化を実行する。それ故、この実施形態に示す方法では、システム資源の消費量の低減、計算の高速化、および柔軟性の向上が達成される。
図4は本開示に従う検索方法の第3の実施形態を説明する。この実施形態は、本開示の検索方法に適用できる詳細な例示として理解され得る。この方法を以下に記述する。
この方法は401において、第1の関連スコアに従いクライアントが提示するクエリデータに基づいて検索を実行する。
この実施形態では、検索エンジンサーバは第1の検索結果を取得した後に、第1の関連スコアに従い最新クエリデータの検索を実行する。
この方法は402において、プリセット多様性フィールドに従い検索結果から第1の検索結果セットを抽出する。
多様性フィールドはプリセットする必要がある。例えば、第2の実施形態では、多様性フィールドはuidとしてプリセットされる。
この方法は403において、プリセット多様性フィールド値に従い第1の検索結果セットを分類して、第1の検索結果セットの各カテゴリに対応する各サブセットを取得する。
第1の検索結果セットにおいて選択されたuidに従い、販売会社A、BおよびCに関連する全ての検索結果が、第1の検索結果のuidに関連するサブセットとして用いられる。
この方法は404において、第1の関連スコアに従い各サブセットにおける第1の検索結果に対応する位置を取得する。
この方法は405において、各サブセットの分類後、第2の関連スコアと第1の検索結果各々の位置とのプリセット関係に従い、第1の検索結果各々の第2の関連スコアを取得するための照合を実行する。
この方法は406において、第1の関連スコアと第2の関連スコアとを合計して、第1の検索結果各々の関連パラメータスコアを算出する。
この方法は407において、第1の検索結果の分類後に、関連パラメータスコアに従いサブセットをランク付けする。
この方法は408において、ランキング順位に従いランク付けされたサブセットから第2の検索結果のプリセット数を抽出する。
ステップ404〜408の間の実行プロセスは、第2の実施形態における記述を参照できる。
この方法は409において、クエリデータ、第2の検索結果、およびクエリデータと第2の検索結果との対応関係をデータベースに記憶する。
この実施形態では、この方法は、ユーザの最新クエリデータ、第2の検索結果、およびクエリデータと第2の検索結果との対応関係の取得後に、このような情報をデータベースに記憶する。このようなデータを記憶する形態として、例えば、データ表または任意の他の不変のデータ構造が用いられてもよい。
この方法は410において、第2の検索結果をクライアントに表示する。
その間の時間に、第2の検索結果をクライアントに示す。例えば、第2の実施形態における第2の検索結果の上位3個、例えば、A1、B2およびC2のみを示し得る。代替的に、サブセットにおける全ての検索結果、例えば、A1〜B1〜C1〜A2〜A3〜B2〜B3〜C2〜C3を示してもよい。
簡潔さのために、前述の方法各々は一連の動作の組み合わせとして記述した。しかしながら、本開示に従ういくつかのステップが他の順序または同時に実行され得、本開示が動作のいかなる特定の順序を制限しないことを当業者は理解する。当業者はさらに、本開示における実施形態が好ましい実施形態であり、いくつかの関連ステップまたはモジュールが、本開示では必ずしも必須ではないことを理解する。
図5を参照して、本開示の第1の実施形態として開示する方法に対応する検索システムの第1の実施形態を説明する。このシステムは、読み出しユニット501、演算ユニット502、設定ユニット503、および抽出ユニット504を含み得る。
読み出しユニット501は、クライアントが提示するクエリデータに従い、クエリデータに関連する第1の検索結果セットを取得するように構成される。
検索エンジンに関連する技術分野では、ユーザのクエリは、通常、記号Queryとして表され、Queryを照合した結果はDocとして表され、Queryを照合した結果セットは、「Doc」として表されるDocセットである。
演算ユニット502は、第1の検索結果セット内の第1の検索結果各々の第1の関連スコアおよび第1の検索結果各々の属性カテゴリを表すプリセット多様性フィールドに従い、第1の検索結果各々の第2の関連スコアを算出するように構成される。プリセット多様性フィールドは、第1の検索結果各々の属性カテゴリを表す。
第1の検索結果セット内の第1の検索結果各々のスコア1の計算後、プリセット多様性フィールドおよびスコア1に基づいて、第2の関連スコア(スコア2)を算出する。プリセット多様性フィールドは、各検索結果のuid(販売会社の識別番号)または地理的位置情報などの第1の検索結果各々の属性カテゴリを表す。スコア2はスコア1に基づくスコアを表し、多様性フィールドに基づいて第1の検索結果各々をランク付けするのに用いられる。
設定ユニット503は、第1の関連スコアおよび第2の関連スコアに従い、第1の検索結果各々の関連パラメータスコアを生成するように構成される。
第1の検索結果各々の関連パラメータスコアを生成する詳細な方法は、スコア1とスコア2とを合計した値を、第1の検索結果各々の関連パラメータスコアとして用いることを含み得る。
抽出ユニット504は、1つ以上の第2の検索結果のプリセット数および関連スコアに従い、第1の検索結果セットから1つ以上の第2の検索結果を抽出して、クライアントに表示するように構成される。
ここで、多様性フィールドを仮にuidとしてプリセットすると、この実施形態に必要なパラメータは、第2の検索結果のプリセット数をさらに含み得る。第2の検索結果の詳細なプリセット数は、多様性値の数と反復抽出の数とのプリセット、例えば、抽出される第2の検索結果の数を取得するための、多様性値のプリセット数と反復抽出の数との積を計算することにより取得できる。多様性値の数は、その後抽出される第2の検索結果において抽出される種々のuidの第1の検索結果の数を表すのに用いられる。例えば、多様性値の数が3である場合には、uidが異なる3個の検索結果が抽出されることを示す。
本実施形態に記述するシステムは、検索エンジンサーバに組み込まれてもよいし、検索エンジンサーバに接続されて独立して存在してもよい。本開示に示す方法またはシステムがソフトウェアで実行される場合には、それは検索エンジンサーバの追加機能でもよく、それ固有の対応するコーディングを有してもよいことに留意されたい。本開示は、開示する方法またはシステムを実施する構造を制限しない。
図6を参照して、本開示の第2の実施形態として開示する方法に対応する検索装置のさらなる第2の好ましい実施形態を説明する。装置は、読み出しユニット501、第1の読み出しサブユニット601、第2の読み出しサブユニット602、照合サブユニット603、設定ユニット503、ランク付けサブユニット604、および第1の抽出サブユニット605を含み得る。
読み出しユニット501は、クライアントが提示するクエリデータに従い、クエリデータに関連する第1の検索結果セットを取得するように構成される。
第1の読み出しサブユニット601は、プリセット多様性フィールドに従い第1の検索結果セットを分類して、第1の検索結果セットの各カテゴリに対応する各サブセットを取得するように構成される。
第2の読み出しサブユニット602は、各サブセットにおける第1の関連スコアに従い、第1の検索結果に対応する位置各々を取得するように構成される。
照合ユニット602は、第2の関連スコアと各サブセットにおける第1の検索結果各々の位置とのプリセット関係に従い、第1の検索結果各々の第2の実在スコアを取得するための照合を実行するように構成される。
設定ユニット503は、第1の関連スコアおよび第2の関連スコアに従い、第1の検索結果各々の関連パラメータスコアを生成するように構成される。
第1の検索結果各々の関連パラメータスコアを生成する詳細な方法は、第1の関連スコアと第2の関連スコアとを合計して、第1の検索結果各々の関連パラメータスコアを算出することを含み得る。
ランク付けサブユニット604は、第1の検索結果の分類後に、関連パラメータスコアに従い各サブセットをランク付けするように構成される。
第1の抽出サブユニット605は、ランキング順位に従いランク付けされたサブセットから第2の検索結果のプリセット数を抽出して、第2の検索結果をクライアントに戻すように構成される。
図7を参照して、本開示の第3の実施形態として開示する方法に対応する検索システムのさらなる類似の実施形態を説明する。システムは、検索サブユニット701、第2の抽出サブユニット702、第1の読み出しサブユニット601、第2の読み出しサブユニット602、照合サブユニット603、設定ユニット503、ランク付けサブユニット604、第1の抽出サブユニット605、記憶ユニット703、および表示ユニット704を含み得る。
検索サブユニット701は、第1の関連スコアに従いクライアントが提示するクエリデータを検索するように構成される。
第2の抽出サブユニット702は、プリセット多様性フィールドに従い検索結果から第1の検索結果を抽出するように構成される。
第1の読み出しサブユニット601は、プリセット多様性フィールド値に従い第1の検索結果セットを分類して、第1の検索結果セットの各カテゴリに対応する各サブセットを取得するように構成される。
第2の読み出しサブユニット602は、各サブセットの第1の関連スコアに従い第1の検索結果に対応する位置を取得するように構成される。
照合サブユニット603は、各サブセットの分類後、第2の関連スコアと第1の検索結果各々の位置とのプリセット関係に従い、第1の検索結果各々の第2の関連スコアを取得するための照合を実行するように構成される。
設定ユニット503は、第1の関連スコアおよび第2の関連スコアに従い、第1の検索結果各々の関連パラメータスコアを生成するように構成される。
第1の検索結果各々の関連パラメータスコアを生成する詳細な方法は、第1の関連スコアと第2の関連スコアとを合計して、第1の検索結果各々の関連パラメータスコアを算出することを含み得る。
ランク付けサブユニット604は、第1の検索結果の分類後に、関連パラメータスコアに従い各サブセットをランク付けするように構成される。
第1の抽出サブユニット605は、ランキング順位に従いランク付けされたサブセットから第2の検索結果のプリセット数を抽出して、第2の検索結果をクライアントに戻すように構成される。
記憶ユニット703は、クエリデータ、第2の検索結果、およびクエリデータと第2の検索結果との対応関係をデータベースに記憶するように構成される。
表示ユニット704は、第2の検索結果をクライアントに表示するように構成される。
種々の例示的な実施形態を本開示に進歩的に記述する。例示的な実施形態における同一または類似する部分は相互に参照され得る。各例示的な実施形態は、他の例示的な実施形態とは焦点が相違する。例えば、例示の装置の実施形態は、その原理が例示の方法と一致するため比較的単純な方法で記述した。その詳細は、例示の方法の対応する部分を参照されたい。
最後に、この文書における「第1の」および「第2の」などの関係性を示すあらゆる用語が、ある構成要素と他の構成要素との区別、またはある工程と他の工程との区別を単に意味するものであり、いかなる実際の関係性の存在、またはこれらの構成要素または工程間の序列を必ずしも要求または暗示しないことに留意されたい。さらに、「含む」、「有する」または任意の他の変形用語が、非独占的に「備える」ことが意図される。それ故、一群の特性を個々に含む処理、方法、部材またはデバイスは、これらの特性に限定されず、記述しない他の特性、またはこれらの処理、方法、部材またはデバイスに任意の固有の特性をさらに含み得る。いかなるさらなる限定無しに、「〜を含む」という句に規定された特性は、特性を列挙する処理、方法、部材またはデバイスが他の同等の特性を有し得る可能性を排除しない。
本開示に示す検索方法およびシステムを前に詳細に記述した。前述の例示的な実施形態は、本開示の概念および実施を説明するのに用いられる。例示的な実施形態は、本開示の技術および個々の中心概念の理解を容易にするために提供される。当業者は本開示の概念に基づいて、実際の実施および利用範囲に応じて変更できる。要するに、本開示の内容は、本開示を限定するものとして解釈されない。

Claims (14)

  1. クエリデータに関連する第1の検索結果セットを取得することと、
    前記第1の検索結果セット内の複数の第1の検索結果の第1の関連スコアおよび第1の検索結果各々の属性カテゴリを表すプリセット多様性フィールドに少なくとも部分的に基づいて前記複数の第1の検索結果の第2の関連スコアを計算することと、
    前記第1の関連スコアおよび前記第2の関連スコアに少なくとも部分的に基づいて前記複数の第1の検索結果に関する関連パラメータスコアを生成することと、
    第2の検索結果のプリセット数および前記複数の第1の検索結果の前記関連パラメータスコアに少なくとも部分的に基づいて、前記第1の検索結果セットから前記第2の検索結果のプリセット数を抽出することと、を含
    前記複数の第1の検索結果の前記第2の関連スコアを計算することは、
    前記複数の第1の検索結果の前記プリセット多様性フィールドに少なくとも部分的に基づいて前記複数の第1の検索結果を分類して、前記第1の検索結果セットの1つまたは複数の属性カテゴリに対応する1つまたは複数のサブセットを取得することと、
    サブセット内の対応する1つまたは複数の第1の関連スコアに少なくとも部分的に基づいて、前記サブセット内で1つまたは複数の第1の検索結果の1つまたは複数のランキング位置を取得することと、
    前記1つまたは複数のランキング位置と1つまたは複数の第2の関連スコアとの間のプリセット関係に従い、前記1つまたは複数の第1の検索結果の前記1つまたは複数の第2の関連スコアを取得することと、を含む、検索方法。
  2. 前記第1の検索結果セットからの第2の検索結果の前記プリセット数抽出することは
    前記1つまたは複数のサブセットをランク付けすることと、
    ランキング順位に従い前記ランク付けされたサブセット各々から、多様性値の数と反復抽出の数との積である第2の検索結果の前記プリセット数を抽出することと、を含む、請求項に記載の方法。
  3. 前記クエリデータ、第2の検索結果の前記プリセット数、および前記クエリデータと第2の検索結果の前記プリセット数との対応関係をデータベースに記憶することをさらに含む、請求項1に記載の方法。
  4. 前記クエリデータに関連する前記第1の検索結果セット取得することは、
    前記第1の関連スコアに従い前記クエリデータに基づいて検索を実行することと、
    前記プリセット多様性フィールドに従い前記検索の検索結果から前記第1の検索結果セットを抽出することと、を含む、請求項1に記載の方法。
  5. 第2の検索結果の前記プリセット数を表示のためにクライアントに提供することをさらに含む、請求項1に記載の方法。
  6. 前記関連パラメータスコア生成することは、
    第1の検索結果の第1の関連スコアと第2の関連スコアとを合計して、前記第1の検索結果関連パラメータスコアを算出することを含む、請求項1に記載の方法。
  7. クエリデータに関連する第1の検索結果セットを取得する読み出しユニットと、
    前記第1の検索結果セット内の第1の検索結果各々の第1の関連スコアおよび第1の検索結果各々の属性カテゴリを表すプリセット多様性フィールドに従い、第1の検索結果各々の第2の関連スコアを算出する演算ユニットと、
    前記第1の関連スコアおよび前記第2の関連スコアに従い、第1の検索結果各々の関連パラメータスコアを生成する設定ユニットと、
    第2の検索結果のプリセット数および前記関連パラメータスコアに従い、前記第1の検索結果セットから前記第2の検索結果のプリセット数を抽出する抽出ユニットと、を備え、
    前記演算ユニットは、
    前記プリセット多様性フィールドに従い前記第1の検索結果セットを分類して、前記第1の検索結果セットの各属性カテゴリに対応する各サブセットを取得する第1の読み出しサブユニットと、
    各サブセットの前記第1の関連スコアに従い、第1の検索結果各々の対応するランキング位置を取得する第2の読み出しサブユニットと、
    前記第1の検索結果各々のランキング位置と前記第2の関連スコアとの間のプリセット関係に従い、前記第1の検索結果各々の前記第2の関連スコアを取得する照合ユニットと、を備えている、検索システム。
  8. 前記抽出ユニットは、
    前記関連パラメータスコアに従い第1の検索結果各々をランク付けするランク付けサブユニットと、
    ランキング順位に従い前記ランク付けされたサブセットから多様性値の数と反復抽出の数との積である第2の検索結果の前記プリセット数を抽出する第1の抽出サブユニットと、を備えている、請求項に記載のシステム。
  9. 前記クエリデータ、第2の検索結果の前記プリセット数、および前記クエリデータと第2の検索結果の前記プリセット数との対応関係をデータベースに記憶する記憶ユニットをさらに備えている、請求項に記載のシステム。
  10. 前記読み出しユニットは、
    前記第1の関連スコアに従い前記クエリデータに基づいて検索を実行する検索サブユニットと、
    前記プリセット多様性フィールドに従い前記検索の検索結果から前記第1の検索結果セットを抽出する第2の抽出サブユニットと、を備えている、請求項に記載のシステム。
  11. 表示のために、第2の検索結果の前記プリセット数を前記クエリデータが取得されたクライアントに提供する表示ユニットをさらに備えている、請求項に記載のシステム。
  12. 前記設定ユニットは、前記第1の関連スコアと前記第2の関連スコアとを合計して、第1の検索結果各々の前記関連パラメータスコアを算出する、請求項に記載のシステム。
  13. 1つまたは複数のプロセッサによって実行されると、前記1つまたは複数のプロセッサに請求項1乃至6のいずれかに記載の方法を実行させるコンピュータ実行可能命令を記憶した1つまたは複数のコンピュータ読み取り可能記憶媒体。
  14. 1つまたは複数のプロセッサと、
    請求項1乃至6のいずれかに記載の方法を実行する1つまたは複数のユニットを記憶したメモリと
    を備えたシステム。
JP2012538819A 2009-11-12 2010-10-04 検索方法およびシステム Expired - Fee Related JP5615932B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN200910211788.X 2009-11-12
CN200910211788XA CN102063432A (zh) 2009-11-12 2009-11-12 一种检索方法和系统
PCT/US2010/051332 WO2011059595A1 (en) 2009-11-12 2010-10-04 Search method and system

Publications (2)

Publication Number Publication Date
JP2013511085A JP2013511085A (ja) 2013-03-28
JP5615932B2 true JP5615932B2 (ja) 2014-10-29

Family

ID=43991931

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012538819A Expired - Fee Related JP5615932B2 (ja) 2009-11-12 2010-10-04 検索方法およびシステム

Country Status (5)

Country Link
US (3) US8583640B2 (ja)
EP (1) EP2499564A4 (ja)
JP (1) JP5615932B2 (ja)
CN (1) CN102063432A (ja)
WO (1) WO2011059595A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10878049B2 (en) 2017-07-21 2020-12-29 Fuji Xerox Co., Ltd. Search apparatus and search system

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9600568B2 (en) * 2006-01-23 2017-03-21 Veritas Technologies Llc Methods and systems for automatic evaluation of electronic discovery review and productions
CN102063432A (zh) 2009-11-12 2011-05-18 阿里巴巴集团控股有限公司 一种检索方法和系统
CN102968413B (zh) * 2011-08-31 2017-12-26 北京百度网讯科技有限公司 一种用于提供搜索结果的方法与设备
US9195758B2 (en) * 2011-10-21 2015-11-24 Ebay, Inc. System and method for multi-dimensional personalization of search results
CN103136213B (zh) * 2011-11-23 2017-04-12 阿里巴巴集团控股有限公司 一种提供相关词的方法及装置
US8886639B2 (en) * 2012-04-19 2014-11-11 Sap Ag Semantically enriched search of services
CN103377240B (zh) * 2012-04-26 2017-03-01 阿里巴巴集团控股有限公司 信息提供方法、处理服务器及合并服务器
US10032234B2 (en) * 2013-01-29 2018-07-24 Facebook, Inc. Ranking search results using diversity groups
US9336211B1 (en) 2013-03-13 2016-05-10 Google Inc. Associating an entity with a search query
US20140279190A1 (en) * 2013-03-14 2014-09-18 SimpleRelevance Inc. Recommended content generation and distribution
US10592781B2 (en) * 2014-07-18 2020-03-17 The Boeing Company Devices and method for scoring data to quickly identify relevant attributes for instant classification
US10019523B2 (en) * 2014-11-21 2018-07-10 Ebay Inc. Diversifying search results
US9632676B1 (en) * 2015-10-14 2017-04-25 Twiggle Ltd. Systems and methods for navigating a set of data objects
CN105677769B (zh) 2015-12-29 2018-01-05 广州神马移动信息科技有限公司 一种基于潜在狄利克雷分配(lda)模型的关键词推荐方法和系统
US10409824B2 (en) * 2016-06-29 2019-09-10 International Business Machines Corporation System, method and recording medium for cognitive proximates
CN108536709B (zh) * 2017-03-03 2021-04-30 北京明略软件系统有限公司 一种搜索优化方法及装置
US10475105B1 (en) * 2018-07-13 2019-11-12 Capital One Services, Llc Systems and methods for providing improved recommendations
US11609919B2 (en) 2019-07-30 2023-03-21 Walmart Apollo, Llc Methods and apparatus for automatically providing personalized search results
US11216519B2 (en) * 2019-07-30 2022-01-04 Walmart Apollo, Llc Methods and apparatus for automatically providing personalized search results

Family Cites Families (82)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3060456A (en) 1959-06-09 1962-10-30 Donald Colvin Detergent dispenser for flush valve fixtures
US4817050A (en) 1985-11-22 1989-03-28 Kabushiki Kaisha Toshiba Database system
JPS62121576A (ja) 1985-11-22 1987-06-02 Toshiba Corp デ−タベ−スシステム
US6961712B1 (en) 1996-10-25 2005-11-01 Ipf, Inc. Consumer product information request (CPIR) enabling servlets and web-based consumer product information catalogs employing the same
US6167397A (en) 1997-09-23 2000-12-26 At&T Corporation Method of clustering electronic documents in response to a search query
US7177825B1 (en) 1999-05-11 2007-02-13 Borders Louis H Integrated system for ordering, fulfillment, and delivery of consumer products using a data network
US6963867B2 (en) 1999-12-08 2005-11-08 A9.Com, Inc. Search query processing to provide category-ranked presentation of search results
US6785671B1 (en) 1999-12-08 2004-08-31 Amazon.Com, Inc. System and method for locating web-based product offerings
JP2002032401A (ja) * 2000-07-18 2002-01-31 Mitsubishi Electric Corp 文書検索方法及び文書検索装置及び文書検索方法をコンピュータに実現させるためのプログラムを記録したコンピュータで読取可能な記録媒体
US6631367B2 (en) 2000-12-28 2003-10-07 Intel Corporation Method and apparatus to search for information
US6766316B2 (en) 2001-01-18 2004-07-20 Science Applications International Corporation Method and system of ranking and clustering for document indexing and retrieval
US7620622B1 (en) 2001-03-08 2009-11-17 Yahoo! Inc. Method and system for indexing information and providing results for a search including objects having predetermined attributes
US7058643B2 (en) 2002-05-22 2006-06-06 Agilent Technologies, Inc. System, tools and methods to facilitate identification and organization of new information based on context of user's existing information
US7797271B1 (en) 2001-06-18 2010-09-14 Versata Development Group, Inc. Custom browse hierarchies for subsets of items in a primary hierarchy
US7127416B1 (en) 2001-06-18 2006-10-24 I2 Technologies Us, Inc. Distributed processing of sorted search results in an electronic commerce system and method
JP2003186912A (ja) * 2001-12-21 2003-07-04 Nippon Telegr & Teleph Corp <Ntt> Webページ検索の適合度計算方法とその装置、Webページ検索の検索結果表示方法とその装置、並びにそれらの方法の実行プログラムとそれらの方法の実行プログラムを記録した記録媒体
US6944612B2 (en) 2002-11-13 2005-09-13 Xerox Corporation Structured contextual clustering method and system in a federated search engine
FI20022123A (fi) 2002-12-02 2004-06-03 Stockway Oy Hajautettu tuotetiedon hallinta
US7451130B2 (en) * 2003-06-16 2008-11-11 Google Inc. System and method for providing preferred country biasing of search results
US20040210491A1 (en) 2003-04-16 2004-10-21 Pasha Sadri Method for ranking user preferences
US7219090B2 (en) * 2003-04-25 2007-05-15 Overture Services, Inc. Method and system for blending search engine results from disparate sources into one search result
US20050010484A1 (en) 2003-07-11 2005-01-13 Scott Bohannon Apparatus for and method of facilitating fulfillment of buyer's/seller's desire
US7124148B2 (en) 2003-07-31 2006-10-17 Sap Aktiengesellschaft User-friendly search results display system, method, and computer program product
US7440964B2 (en) * 2003-08-29 2008-10-21 Vortaloptics, Inc. Method, device and software for querying and presenting search results
US7281002B2 (en) * 2004-03-01 2007-10-09 International Business Machine Corporation Organizing related search results
JP2005327225A (ja) * 2004-05-12 2005-11-24 Asuya Eto 文書管理システム、文書管理方式、文書管理プログラム及びプログラム記録媒体
US20050289158A1 (en) 2004-06-25 2005-12-29 Jochen Weiss Identifier attributes for product data stored in an electronic database
US7725463B2 (en) * 2004-06-30 2010-05-25 Microsoft Corporation System and method for generating normalized relevance measure for analysis of search results
US7519595B2 (en) 2004-07-14 2009-04-14 Microsoft Corporation Method and system for adaptive categorial presentation of search results
US8364670B2 (en) 2004-12-28 2013-01-29 Dt Labs, Llc System, method and apparatus for electronically searching for an item
US7571157B2 (en) * 2004-12-29 2009-08-04 Aol Llc Filtering search results
US7523099B1 (en) 2004-12-30 2009-04-21 Google Inc. Category suggestions relating to a search
US7792811B2 (en) 2005-02-16 2010-09-07 Transaxtions Llc Intelligent search with guiding info
US20060190425A1 (en) 2005-02-24 2006-08-24 Yuan-Chi Chang Method for merging multiple ranked lists with bounded memory
US7617193B2 (en) * 2005-03-28 2009-11-10 Elan Bitan Interactive user-controlled relevance ranking retrieved information in an information search system
US20060287980A1 (en) 2005-06-21 2006-12-21 Microsoft Corporation Intelligent search results blending
US20100299222A1 (en) 2005-08-19 2010-11-25 Hamilton Iv George B Online purchasing method
US20070078758A1 (en) 2005-09-23 2007-04-05 Susskind Robert A Risk assessment-based shopping of internet auctions
WO2007038713A2 (en) * 2005-09-28 2007-04-05 Epacris Inc. Search engine determining results based on probabilistic scoring of relevance
US7962402B2 (en) 2005-09-29 2011-06-14 Lev Eydelman On-line system for buyer seller matching and negotiation
US7840558B2 (en) 2005-11-04 2010-11-23 Microsoft Corporation Geo-tagged based listing service and mapping engine
US9135304B2 (en) 2005-12-02 2015-09-15 Salesforce.Com, Inc. Methods and systems for optimizing text searches over structured data in a multi-tenant environment
US7680697B2 (en) 2006-01-25 2010-03-16 Kelkoo Sas Searching for a seller of a product
US7814099B2 (en) 2006-01-31 2010-10-12 Louis S. Wang Method for ranking and sorting electronic documents in a search result list based on relevance
US7814112B2 (en) * 2006-06-09 2010-10-12 Ebay Inc. Determining relevancy and desirability of terms
US7761464B2 (en) * 2006-06-19 2010-07-20 Microsoft Corporation Diversifying search results for improved search and personalization
US8135709B2 (en) 2006-07-05 2012-03-13 BNA (Llesiant Corporation) Relevance ranked faceted metadata search method
US7921106B2 (en) 2006-08-03 2011-04-05 Microsoft Corporation Group-by attribute value in search results
US20080059429A1 (en) 2006-09-05 2008-03-06 Go Kojima Integrated search processing method and device
US8407229B2 (en) 2006-09-19 2013-03-26 Iac Search & Media, Inc. Systems and methods for aggregating search results
US20080140641A1 (en) 2006-12-07 2008-06-12 Yahoo! Inc. Knowledge and interests based search term ranking for search results validation
US20080140625A1 (en) 2006-12-08 2008-06-12 Electronics And Telecommunications Research Institute System and method for providing geospatial information processing services using web service technologies
US7630972B2 (en) 2007-01-05 2009-12-08 Yahoo! Inc. Clustered search processing
US7958126B2 (en) * 2006-12-19 2011-06-07 Yahoo! Inc. Techniques for including collection items in search results
CN103020106B (zh) * 2007-01-24 2016-05-18 谷歌公司 混合移动搜索结果
US7765227B1 (en) 2007-03-30 2010-07-27 A9.Com, Inc. Selection of search criteria order based on relevance information
US8352454B2 (en) 2007-04-11 2013-01-08 Travelport Development Llc System and method for performing data searches using multiple data search providers
US7917493B2 (en) 2007-04-19 2011-03-29 Retrevo Inc. Indexing and searching product identifiers
US8468083B1 (en) * 2007-08-10 2013-06-18 Google Inc. Advertisement topic diversification and ranking
US20090048943A1 (en) 2007-08-17 2009-02-19 Hardigree John W Internet based customer driven purchase method and apparatus
EP2570945A1 (en) * 2007-09-21 2013-03-20 Google Inc. Cross-language search
US8103676B2 (en) 2007-10-11 2012-01-24 Google Inc. Classifying search results to determine page elements
US8862608B2 (en) * 2007-11-13 2014-10-14 Wal-Mart Stores, Inc. Information retrieval using category as a consideration
CA2623796A1 (en) 2008-03-03 2009-09-03 David A. Wassmann Product information system for aggregating and classifying information from multiple sources with update ability
US8024332B2 (en) 2008-08-04 2011-09-20 Microsoft Corporation Clustering question search results based on topic and focus
US9727628B2 (en) 2008-08-11 2017-08-08 Innography, Inc. System and method of applying globally unique identifiers to relate distributed data sources
US8060456B2 (en) * 2008-10-01 2011-11-15 Microsoft Corporation Training a search result ranker with automatically-generated samples
US20100094723A1 (en) 2008-10-14 2010-04-15 Johnson Brian M Systems and methods to intialize a data source based on a compatibility with an application
US8903816B2 (en) * 2009-04-08 2014-12-02 Ebay Inc. Methods and systems for deriving a score with which item listings are ordered when presented in search results
US8626784B2 (en) 2009-05-11 2014-01-07 Microsoft Corporation Model-based searching
US10055786B2 (en) 2009-07-28 2018-08-21 Ebay Inc. System and method enabling searching for items, listings, or products based on listing activity
US8180768B2 (en) 2009-08-13 2012-05-15 Politecnico Di Milano Method for extracting, merging and ranking search engine results
US20110072023A1 (en) 2009-09-21 2011-03-24 Yahoo! Inc. Detect, Index, and Retrieve Term-Group Attributes for Network Search
US20110082770A1 (en) 2009-10-06 2011-04-07 Prabhakaran Krishnamoorthy User-Initiated Buyer-Vendor Match Search
CN102063432A (zh) 2009-11-12 2011-05-18 阿里巴巴集团控股有限公司 一种检索方法和系统
US10140339B2 (en) 2010-01-26 2018-11-27 Paypal, Inc. Methods and systems for simulating a search to generate an optimized scoring function
US8788371B2 (en) 2010-05-26 2014-07-22 Ebay Inc. Personalized search widgets for customized user interface
US8463805B2 (en) 2010-09-15 2013-06-11 Cbs Interactive, Inc. Mapping product identification information to a product
US8626604B1 (en) 2011-05-19 2014-01-07 Google Inc. Aggregating product endorsement information
CN102968418A (zh) 2011-09-01 2013-03-13 阿里巴巴集团控股有限公司 网站信息检索方法和系统
US20130197971A1 (en) 2011-10-30 2013-08-01 Martin J Wilke Motor vehicle dealer analysis marketing system and method with aftermarket accessories
CN103377240B (zh) 2012-04-26 2017-03-01 阿里巴巴集团控股有限公司 信息提供方法、处理服务器及合并服务器

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10878049B2 (en) 2017-07-21 2020-12-29 Fuji Xerox Co., Ltd. Search apparatus and search system

Also Published As

Publication number Publication date
US20140025672A1 (en) 2014-01-23
US20120221562A1 (en) 2012-08-30
US8583640B2 (en) 2013-11-12
WO2011059595A1 (en) 2011-05-19
US9870408B2 (en) 2018-01-16
CN102063432A (zh) 2011-05-18
EP2499564A4 (en) 2018-01-03
US9460158B2 (en) 2016-10-04
JP2013511085A (ja) 2013-03-28
EP2499564A1 (en) 2012-09-19
US20160364393A1 (en) 2016-12-15

Similar Documents

Publication Publication Date Title
JP5615932B2 (ja) 検索方法およびシステム
WO2021068610A1 (zh) 资源推荐的方法、装置、电子设备及存储介质
WO2020237856A1 (zh) 基于知识图谱的智能问答方法、装置及计算机存储介质
JP2017157192A (ja) キーワードに基づいて画像とコンテンツアイテムをマッチングする方法
US20170039198A1 (en) Visual interactive search, scalable bandit-based visual interactive search and ranking for visual interactive search
CN110390044B (zh) 一种相似网络页面的搜索方法及设备
JP2019533205A (ja) ユーザキーワード抽出装置、方法、及びコンピュータ読み取り可能な記憶媒体
WO2019085327A1 (zh) 电子装置、产品推荐方法、系统和计算机可读存储介质
CN104077415B (zh) 搜索方法及装置
US20150170333A1 (en) Grouping And Presenting Images
CN108664515B (zh) 一种搜索方法及装置,电子设备
US20180046721A1 (en) Systems and Methods for Automatic Customization of Content Filtering
US11455485B2 (en) Content prediction based on pixel-based vectors
JP6363682B2 (ja) 画像とコンテンツのメタデータに基づいてコンテンツとマッチングする画像を選択する方法
CN104537341A (zh) 人脸图片信息获取方法和装置
WO2020258481A1 (zh) 个性化文本智能推荐方法、装置及计算机可读存储介质
WO2015077942A1 (en) Relationship extraction
CN103631889B (zh) 一种图像识别方法和装置
WO2016171709A1 (en) Text restructuring
JP2017220204A (ja) 検索クエリに応答してホワイトリストとブラックリストを使用し画像とコンテンツをマッチングする方法及びシステム
Sergieh et al. Geo-based automatic image annotation
Xu et al. Efficient summarization framework for multi-attribute uncertain data
US20170286522A1 (en) Data file grouping analysis
CN110909130B (zh) 文本主题提取分析方法、装置及计算机可读存储介质
US11106737B2 (en) Method and apparatus for providing search recommendation information

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20131002

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140311

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140611

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140812

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140910

R150 Certificate of patent or registration of utility model

Ref document number: 5615932

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees