JP2013545189A - マルチステージを使用したカテゴリ情報の決定 - Google Patents

マルチステージを使用したカテゴリ情報の決定 Download PDF

Info

Publication number
JP2013545189A
JP2013545189A JP2013537652A JP2013537652A JP2013545189A JP 2013545189 A JP2013545189 A JP 2013545189A JP 2013537652 A JP2013537652 A JP 2013537652A JP 2013537652 A JP2013537652 A JP 2013537652A JP 2013545189 A JP2013545189 A JP 2013545189A
Authority
JP
Japan
Prior art keywords
search keyword
current
category information
unit
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013537652A
Other languages
English (en)
Other versions
JP5449628B2 (ja
Inventor
チエン・ジエンピーン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Publication of JP2013545189A publication Critical patent/JP2013545189A/ja
Application granted granted Critical
Publication of JP5449628B2 publication Critical patent/JP5449628B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【解決手段】カテゴリ情報の提供は、複数のユーザによって事前に入力された複数の検索キーワード集合を受信することと、複数の検索キーワード集合に対応するカテゴリ情報を取得することと、複数の検索キーワード集合のそれぞれを検索キーワード単位に分割することと、検索キーワード単位を結合し、複数のステージに対応する複数の検索キーワード単位群を形成することと、複数の検索キーワード単位群に特に対応するカテゴリ情報を決定することと、複数のステージに対応する複数の検索キーワード表を確立することであって、各ステージは、上記各ステージの検索キーワード単位群と上記複数の検索キーワード単位群に特に対応するカテゴリ情報との間の対応関係を含む対応する検索キーワード表を有する、ことと、を含む。
【選択図】図6

Description

[関連出願の相互参照]
本出願は、あらゆる目的のために、参照によって本明細書に組み込まれる、発明の名称を「A DEVICE AND METHOD FOR PROVIDING CATEGORY INFORMATION(カテゴリ情報を提供するためのデバイス及び方法)」とする、2010年11月2日に出願された中国特許出願第201010530231.5号に基づく優先権を主張する。
本出願は、情報処理技術の分野に関し、特に、カテゴリ情報の提供に関する。
電子商取引ウェブサイトは、オンラインで購入又は販売される商品の商品情報をユーザに提供する。ユーザは、検索キーワードを入力することによって、電子商取引ウェブサイト上で関連商品の検索を行うのが一般的である。電子商取引ウェブサイトは、ユーザによって入力された検索キーワードにしたがって、関連商品ページへのリンクをユーザのために出力し、ユーザにとって適したカテゴリを推薦する。したがって、ユーザは、自分が必要とする商品を、ユーザが選択したカテゴリに含まれる商品の中から容易に見つけることができる。このような誘導検索は、ユーザにとって、より効率的であるのに役立つ。
先行技術では、ユーザに提供されるカテゴリ情報を、リアルタイム照会を通じて提供することができる。図1は、カテゴリ情報を提供するために既存のシステムによって使用されているプロセスの一例を示すフローチャートである。
ステップ11:ユーザ入力キーワード集合が受信される。一例として、ユーザによって入力されたキーワード集合は、「無地帽子」である。
ステップ12:全商品についての商品識別子の中から、これらのキーワードを含む商品識別子の探索を行う。一例として、キーワード「無地帽子」を含む商品識別子が、計508個見つかったと想定する。
ステップ13:商品識別子に対応する種々のカテゴリ情報を決定する。508個の商品識別子に対応するカテゴリ情報が「帽子」及び「婦人服」を含む場合、決定されるカテゴリ情報は、「帽子」及び「婦人服」を含む。このようなカテゴリ情報は、事前設定することが可能である。例えば、販売主は、所定のウェブサイト上で販売するために或る商品を設定する時点で、その商品についてのカテゴリ情報をセットすることができる。
ステップ14:見つかった商品識別子のなかで、決定された各カテゴリ情報に対応する商品識別子の量を決定する。例えば、見つかった508個の商品識別子のうち、192個の商品識別子のカテゴリ情報が「帽子」であり、それ以外の316個の商品識別子のカテゴリ情報が「婦人服」であるならば、カテゴリ情報「帽子」について決定される量は、192であり、カテゴリ情報「婦人服」について決定される量は、316である。
ステップ15:決定された各カテゴリ情報を、対応する決定された量とあわせてユーザに提供する。例えば、ユーザは、「帽子」(192)及び「婦人服」(316)を提供される。
しかしながら、上述された方法では、電子商取引ウェブサイトは、ユーザによって入力されたキーワードに基づいて、商品識別子の検索とカテゴリ情報の決定とをリアルタイムで行う必要がある。この技術は、多くの処理リソースを消費し、処理効率は、低くなる。
上述された問題に対処するために、一部のシステムは、参照ワード表の形態を使用する。図2は、参照ワード表を使用した、カテゴリ情報を提供するためのプロセスの一例を示すフローチャートである。
ステップ21:ユーザが、検索結果のリストのなかの商品リンクをクリックすると、ユーザによって入力されたカレントキーワードと、その商品についてのカテゴリ情報とが格納される。
ステップ22:格納されたキーワードとカテゴリ情報とに対し、単純な収集手順を実施し、指定の期間内における検索頻度が指定の閾値を超えるキーワードを決定する。例えば、このステップは、どのキーワードが一週間で30回を超えて検索されたかを決定する。
ステップ23:キーワードとカテゴリ情報との間で決定された対応関係を基にして、ワード参照表を作成する。この表では、各キーワードが、少なくとも1つのカテゴリ情報に対応している。
ステップ24:ユーザが引き続き、商品を検索するためにキーワードを入力したときに、ユーザによって入力されたキーワードに基づいて、そのユーザによって入力されたキーワードに対応するカテゴリ情報の探索を、格納された参照ワード表の中で行う。
ステップ25:見つかったカテゴリ情報をユーザに提供する。
上記のプロセスにおいて、参照ワード表に基づいてカテゴリ情報をユーザに提供するときに、参照ワード表は、ユーザ検索頻度が高いキーワードとカテゴリ情報との間の対応関係のみを含む。ユーザ検索頻度が低いキーワードは、低頻度検索キーワード、又はロングテールキーワードと呼ばれる。参照ワード表は、ロングテールキーワード及びそれらに対応するカテゴリ情報を格納しないので、ユーザによって入力されたキーワードがロングテールキーワードであるときは、関連のあるカテゴリ情報で応答することが困難である。
以下の詳細な説明及び添付の図面では、発明の様々な実施形態が開示される。
リアルタイム照会を通じてユーザにカテゴリ情報を提供するための先行技術の方法のフローチャートである。
参照ワード表を通じてユーザにカテゴリ情報を提供するための先行技術の方法のフローチャートである。
カテゴリ情報を提供するためのプロセスの一実施形態を示すフローチャートである。
各検索キーワード単位の重量度を決定するためのプロセスの一実施形態を示すフローチャートである。
カテゴリ情報を提供するためのプロセスの別の一実施形態を示すフローチャートである。
カテゴリ情報を提供するためのシステムを示すシステム図である。
カテゴリ情報を提供するためのシステムの別の一実施形態を示すシステム図である。
発明は、プロセス、装置、システム、合成物、コンピュータによって読み取り可能なストレージ媒体に実装されたコンピュータプログラム製品、並びに/又は結合先のメモリに記憶された命令及び/若しくは結合先のメモリによって提供される命令を実行するように構成されたプロセッサのようなプロセッサなどの、数々の形態で実現することができる。本明細書では、これらの実現形態、又は発明がとりうるその他のあらゆる形態を、技術と称することができる。総じて、開示されるプロセスのステップの順序は、発明の範囲内で可変であることができる。別途明記されない限り、タスクを実施するように構成されるものとして説明されているプロセッサ又はメモリなどの構成要素は、所定時にタスクを実施するように一時的に構成される汎用の構成要素として、又はタスクを実施するように製造された特殊な構成要素として実装することができる。本明細書で使用される「プロセッサ」という用語は、コンピュータプログラム命令などのデータを処理するように構成された1つ以上のデバイス、回路、及び/又は処理コアを言う。
発明の原理を例示している添付の図面とともに、以下で、発明の1つ以上の実施形態の詳細な説明が提供される。発明は、このような実施形態との関連で説明されているが、いかなる実施形態にも限定されない。発明の範囲は、特許請求の範囲によってのみ限定され、発明は、数々の代替形態、変更形態、及び均等物を網羅している。以下の説明では、発明の完全な理解を与えるために、数々の具体的詳細が明記されている。これらの詳細は、例示を目的として提供されるものであり、発明は、これらの詳細の一部又は全部を伴わずとも、特許請求の範囲にしたがって実施することができる。明瞭さを期するために、発明に関係する技術分野で知られる技術的要素は、発明が不必要に不明瞭にされないように、詳細な説明を省略されている。
カテゴリ情報の提供が開示される。この技術は、ユーザの検索クエリに応答して商品のカテゴリ情報を提供するために、電子商取引プラットフォームによって使用することができる。一部の実施形態では、この技術は、複数のユーザによって事前に入力された複数の検索キーワード集合を受信し、複数の検索キーワード集合に対応するカテゴリ情報を取得す、このカテゴリ情報は、複数のユーザ選択に少なくとも部分的に基づいて決定され、複数の検索キーワード集合のそれぞれを検索キーワード単位に分割し、検索キーワード単位を結合し、複数のステージに対応する複数の検索キーワード単位群を形成し、この検索キーワード単位群は、同じ数の検索キーワード単位を有する同じステージに対応し、上記複数の検索キーワード集合に対応するカテゴリ情報に少なくとも部分的に基づいて、複数の検索キーワード単位群に特に対応するカテゴリ情報を決定し、複数の検索キーワード単位群に特に対応するカテゴリ情報に少なくとも部分的に基づいて、複数のステージに対応する複数の検索キーワード表を確立し、各ステージは、各ステージの検索キーワード単位群と複数の検索キーワード単位群に特に対応するカテゴリ情報との間の対応関係を含む対応する検索キーワード表を有することを含む。複数の検索キーワード表は、ユーザによって入力されたカレント検索キーワード集合のカレントカテゴリ情報を提供するために使用される。
図3は、カテゴリ情報を提供するためのプロセスの一実施形態を示すフローチャートである。プロセスは、以下で説明される500のようなシステム上で実施することができる。
ステップ31では、或る期間中にユーザによって入力された検索キーワード集合と、これらの検索キーワード集合に対応するカテゴリ情報とが取得される。
一部の実施形態では、カテゴリ情報は、ユーザ選択に基づいて、より具体的には検索キーワード集合への応答に対するユーザ選択に基づいて決定される。この例では、ブラウザは、検索キーワードを電子商取引ウェブサイトに入力するためのインターフェースをユーザに提供する。ブラウザを通じてユーザが検索キーワード集合を入力した後、サーバは、応答として検索結果のリストを返信し、このリストは、ユーザのブラウザに表示される。表示された検索結果リストは、ユーザによって入力された検索キーワードに基づいて見つかった様々なタイプの商品へのリンクを含む。ユーザが、検索結果リストの中のリンクの1つをクリック(選択)すると、ブラウザは、このユーザによるクリック行為を選択ログの形で記録し、ログサーバに送信する。各選択ログは、ユーザによって入力された検索キーワードと、選択された商品に対応するカテゴリ情報(例えば、販売主によって入れられたカテゴリの名前又は識別子)と、ユーザ識別子とを含む。この場合、ユーザは、電子商取引ウェブサイトの訪問者に等しく、したがって、ユーザ識別子は、訪問者の識別子でもある。選択ログのフォーマットの一例が、以下に示される。
Figure 2013545189
検索キーワード集合は、2つ以上のカテゴリに対応してもよく、この場合、選択ログのフォーマットとして、以下で示されるものが挙げられるが、これに限定はされない。
Figure 2013545189
一部の実施形態では、選択ログは、固定間隔でログサーバから取得される。この固定間隔は、一日、一週間、一か月などであってよく、ただし、これらに限定はされない。したがって、検索キーワードに対応するカテゴリ情報は、対応する時間間隔で得ることが可能である。
一部の実施形態では、選択ログの代わりに、アップロードログが使用される。アップロードログは、販売主によってアップロードされた商品識別子と、その商品についてのカテゴリ情報と、販売業者識別子とを含む。販売業者によってアップロードされた商品識別子は、選択ログのなかの検索キーワードと同じやり方で処理され、販売業者識別子は、選択ログのなかの訪問者識別子と同じやり方で処理される。
ステップ32では、各検索キーワード集合が、検索キーワード単位に分割される。一部の実施形態では、検索キーワード単位は、意味論的意味を表現している最小のワード結合である。
一部の実施形態では、システムは、選択ログが取得された後に、全ての選択ログを解析する。先ず、選択ログのなかの検索キーワードが、正規化を経る。正規化は、例えば、不必要なワード及び余分なスペースの排除(大文字と小文字との間の変換、全角文字と半角文字との間の変換、及び簡体字と繁体字との間の変換)や、句読点の排除、数値フォーマットの変換などを含む。正規化が完了した後は、各検索キーワード集合が、検索キーワード単位に分割される。区切り文字(例えばスペース)を含む英語などの言語では、検索キーワード単位は、区切り文字を使用することによって見つかるワードだと考えられる。区切り文字が使用されない中国語などの言語では、統計的な分割技術を使用することができる。一部の技術では、コーパスが使用される。検索キーワードは、コーパスのなかの各分割ワードと突き合わされ、一致した分割ワードは、分割検索キーワード単位として確定される。例えば、受信された検索キーワード「無地長袖シャツ」が分割された後に、結果として得られる検索キーワード単位は、「無地」、「長袖」、及び「シャツ」である。
この例では、検索キーワードが検索キーワード単位に分割された後に、随意として、検索キーワード単位が順序付けられる。その結果、順序付けられた検索キーワード単位が得られる。順序付けは、アルファベット順(例えば英語若しくは中国語ピンイン(ローマ字化体系)の場合)又は筆順(例えば中国語若しくは日本語)にしたがって行うことができる。順序付けは、最終的に形成される検索キーワード表のサイズを小さくし、検索キーワード表のための処理ステップを確立することができる。例えば、検索キーワード「長袖無地シャツ」及び「長袖シャツ無地」に対して実施される検索キーワード単位分割の結果は、「長袖」、「無地」、及び「シャツ」であり、いずれの場合も、順序付けられた検索キーワード単位は、「長袖^シャツ^無地」である。その結果、処理される必要があるのは、順序付けられた検索キーワード「長袖^シャツ^無地」のみである。
ステップ33では、各検索キーワード集合から分割された検索キーワード単位が結合され、幾つかのステージに対応する検索キーワード単位群を形成する。各ステージは、どのグルーブ構成員も同じ数の検索キーワード単位を有する検索キーワード単位群の集合に対応している。
この例では、システムは、N≧1として、指定の量Nを事前にセットし、ステージ1からステージNまでの検索キーワード表を確立する。各検索キーワード集合が検索キーワード単位に分割されたときは、分割された検索キーワード単位の数は、Pで示される。P>Nであるならば、ステージ1からNの検索キーワード単位群を形成することができる。P≦Nであるならば、ステージ1からPの検索キーワード単位群を形成することができる。各検索キーワード単位群に含まれる検索キーワード単位の数は、ステージ番号と同じである。
以下の例は、ステージ1、ステージ2、及びステージ3の検索キーワード単位群がどのように形成されるかを示している。ステージ1検索キーワード単位群を形成するために、順序付けられた各検索キーワードのなかの各検索キーワード単位が、そのまま、ステージ1検索キーワード単位群に含められる。例えば、「長袖無地シャツ」及び「長袖シャツ無地」から分割される検索キーワード単位は、いずれの場合も、「長袖」、「シャツ」、及び「無地」である。言い換えると、対応する順序付けられた検索キーワードは、「長袖^シャツ^無地」であり、この場合は、ステージ1検索キーワード単位群は、「長袖」、「シャツ」、及び「無地」を含む。
ステージ2検索キーワード単位群を形成するためには、順序付けられた各検索キーワードから2つの検索キーワード単位毎に組み合わされて、ステージ2検索キーワード単位群を形成する。上述されたものと同じ例を使用し、順序付けられた検索キーワードが「長袖^シャツ^無地」であるならば、ペアをなすキーワード単位が結合され、ステージ2検索キーワード単位群「長袖^シャツ」、「長袖^無地」、及び「シャツ^無地」を形成する。
ステージ3検索キーワード単位群を形成するためには、順序付けられた各検索キーワードから3つの検索キーワード単位毎に組み合わされて、ステージ3検索キーワード単位群を形成する。例えば、「長袖無地ファッションシャツ」及び「長袖シャツ無地ファッション」から分割される検索キーワード単位は、いずれの場合も、「長袖」、「シャツ」、「ファッション」、及び「無地」である。言い換えると、対応する順序付けられた検索キーワードは、「長袖^シャツ^無地^ファッション」である。これら4つの検索されたキーワード単位からは、4つのステージ3検索キーワード単位群「長袖^シャツ^無地」、「長袖^シャツ^ファッション」「長袖^無地^ファッション」、及び「シャツ^無地^ファッション」が形成される。
同様な技術が、ステージN検索キーワード単位群を形成するために適用される。
この例では、各種ステージの検索キーワード単位群が形成された後に、随意として、各検索キーワード単位群の中の検索キーワード単位がアルファベット順又は筆順にしたがって順序付けられる。その結果、順序付けられた検索キーワード単位が得られる。例えば、順序付けられた検索キーワード「長袖無地シャツ」の中の検索キーワード単位は、結合され、3つのステージ2検索キーワード単位群「長袖^シャツ」、「長袖^無地」、及び「シャツ^無地」を形成することができる。順序付けは、最終的に形成される検索キーワード表のサイズを小さくし、検索キーワード表の確立に伴われる処理ステップを減らすことができる。例えば、ステージ2検索キーワード単位群「長袖^シャツ」及び「シャツ^長袖」が順序付けられた後に、結果として得られるステージ2検索キーワード単位群は、ともに、「長袖^シャツ」である。後続のステップでは、順序付けられた検索キーワード単位群「長袖^シャツ」のみが、処理されればよい。
ステップ34では、取得された検索キーワード単位に対応するカテゴリ情報に少なくとも部分的に基づいて、形成された検索キーワード単位群に特に対応するカテゴリ情報を決定する。
検索キーワード単位群に対応するカテゴリ情報を決定するときに、システムは、検索キーワード単位群のなかの検索キーワード単位を含む検索キーワードに対応するカテゴリを識別し、その識別されたカテゴリを検索キーワード単位群に関係付けることができる。一例として、ステージ2検索キーワード単位群「長袖^シャツ」を含む検索キーワードが、「長袖無地シャツ」、「長袖シャツ無地」、及び「婦人長袖シャツ」であると想定する。「長袖無地シャツ」及び「長袖シャツ無地」に対応するカテゴリは、「紳士服ファッション」及び「婦人服ファッション」である。「婦人長袖シャツ」に対応するカテゴリは、「婦人服ファッション」である。この情報は、以下の表に示されている。
Figure 2013545189
したがって、ステージ2検索キーワード単位群「長袖^シャツ」に対応するカテゴリは、「紳士服ファッション」及び「婦人服ファッション」である。
ステップ35では、決定されたカテゴリ情報(すなわち、検索キーワード単位群に特に対応するカテゴリ情報)に基づいて、各種ステージの検索キーワード表が確立される。各ステージの検索キーワード表は、そのステージの検索キーワード単位群とそれらの検索キーワード単位群についてのカテゴリ情報との間の対応関係を含む。具体的に言うと、事前にセットされた指定のステージ数がNであるならば、ステージ1からNのための検索キーワード表が確立される。
ステップ36では、各検索キーワード単位の重要度が決定される。
この例では、各検索キーワード単位の重要度が事前に決定され、重要度表が確立される。次いで、取得されたカレントキーワードをカレントキーワード単位に分割した後、確立された重要度表のなかのカレントキーワード単位の重要度が直接決定される。
図4は、各検索キーワード単位の重要度を決定するためのプロセスの一実施形態を示すフローチャートである。その他のプロセスを使用することも可能である。
ステップ350では、検索キーワード集合に対応するカテゴリ情報に基づいて、分割された検索キーワード単位に特に対応するカテゴリ情報(例えば、カテゴリの名前及び/又は識別子)を決定する。各検索キーワード単位に関係付けられる検索キーワードに特に対応するカテゴリは、その検索キーワード単位に対応するカテゴリである。例えば、検索キーワード単位「無地」を導出される2つの検索キーワード集合、すなわち「無地帽子」及び「無地長袖シャツ」があり、検索キーワード「無地帽子」に対応するカテゴリが「婦人服ファッション」及び「帽子」であり、検索キーワード「無地長袖シャツ」に対応するカテゴリが「紳士服ファッション」及び「婦人服ファッション」であると想定する。したがって、以下の表に示されるように、検索キーワード単位「無地」のカテゴリは、「婦人服ファッション」、「帽子」、及び「紳士服ファッション」である。
Figure 2013545189
ステップ352では、選択ログのなかの訪問者識別子に基づいて、対応するカテゴリ下における検索キーワード単位についての固有訪問者(UV)量を決定する。UV量は、重複(例えば、同じ訪問者識別子を持つユーザによる繰り返し訪問)を除かれた後における、訪問者識別子に基づくウェブページの訪問回数である。各検索キーワード単位に関係付けられる検索キーワードの全てのカテゴリ下におけるUV量の和が、それらのカテゴリ下におけるその検索キーワード単位のUV量である。例えば、「婦人服ファッション」及び「帽子」のカテゴリ下における「無地帽子」のUV量が、それぞれ205及び300であると想定し、「婦人服ファッション」及び「紳士服ファッション」のカテゴリ下における「無地長袖シャツ」のUV量が、それぞれ459及び902であると想定する。この場合は、以下の表に示されるように、「婦人服ファッション」のカテゴリ下における検索キーワード単位「無地」のUV量は、205+459=664であり、「帽子」のカテゴリ下におけるそのUV量は、300であり、「紳士服ファッション」のカテゴリ下におけるそのUV量は、902である。
Figure 2013545189
一部の実施形態では、随意として、尚且つ既定のルールにしたがって、各検索キーワードから分割された検索キーワード単位が順序付けられ、その結果、順序付けられた検索キーワードに対応するカテゴリとその対応するカテゴリ下におけるUV量とが得られる。カテゴリ下における検索キーワード単位のUV量が決定される。
ステップ354では、決定されたUV量に基づいて、各種カテゴリ下における各検索キーワード単位のカテゴリエントリピが決定される。
一部の実施形態では、各種カテゴリ下における検索キーワード単位のカテゴリエントロピを、次式を通じて決定することができる。
Figure 2013545189
ここで、Hiは、検索キーワード単位iのカテゴリエントロピであり、Kは、検索キーワード単位iのUVが存在するカテゴリの量であり、Pijは、第j番目のカテゴリ下における検索キーワード単位のUV量であり、Piは、全てのカテゴリ下における検索キーワード単位iのUV量、すなわち、全てのカテゴリ下におけるUV量の和である。
ステップ356では、決定されたカテゴリエントロピに基づいて、各検索キーワード単位の重要度がカテゴリエントロピに少なくとも部分的に基づいて決定される。
一部の実施形態では、カテゴリエントロピの逆数をとることによって、重要度を決定することができる。ただし、その他の適切な技術を適用することもできる。要するに、検索キーワード単位iのカテゴリエントロピがHiであり、重要度がZiであるならば、Zi=1/Hiである。重要度とカテゴリエントロピとの間の関係性は、逆数関係に限定されない。ただし、カテゴリエントロピは、重要度に対して逆相関していることが望ましく、言い換えると、カテゴリエントロピが高いほど、重要度は低く、その逆もまた同様である。
図3に戻り、ステップ37では、決定された重要度に基づいて、検索キーワード単位と重要度との間の対応関係を含む重要度表が確立される。
検索キーワード単位の重要度を決定した後は、検索キーワード単位及び決定された重要度を重要度表に格納することができる。
一部の実施形態では、カテゴリエントロピに基づいて検索キーワード単位の重要度を決定することに加えて又は代わって、単語頻度−逆文書頻度(TF−IDF)方法を随意として使用し、検索キーワード単位の重要度を決定することができる。この技術は、以下のステップを伴う。
第1に、検索キーワード単位の単語頻度が計算される。これは、得られた選択ログに基づいて、決定された各カテゴリ情報に対応する検索キーワードを決定することと、各検索キーワードを検索キーワード単位に分割することと、全ての検索キーワード単位の中での各検索キーワード単位の単語頻度を決定することとを含む。
次に、各検索キーワード単位の文書頻度が計算される。
次に、検索キーワード単位の加重TF−IDF値が計算される。各検索キーワード単位について、検索キーワード単位の加重TF−IDF値を得るために、計算された単語頻度が文書頻度で割り算される。
最後に、計算された加重TF−IDF値に基づいて、各検索キーワード単位の重要度が決定される。ここで、加重TF−IDF値は、重要度に正に相関している。すなわち、加重TF−IDF値が大きいほど、重要度は高く、加重TF−IDF値が小さいほど、重要度は低い。
ステップ38では、ユーザによって入力されたカレントキーワード集合が受信された後に、該カレントキーワード集合がカレントキーワード単位に分割される。
ユーザは、商品情報を検索する必要があるときは、ブラウザを通じてカレントキーワード集合を入力する。カレントキーワード集合は、サーバによって受信されると正規化される。正規化が完了された後は、キーワードとカテゴリ情報との間の対応関係が参照ワード表に格納され、カレントキーワードに対応するカテゴリ情報の探索が行われる。カテゴリを見つることができたならば、カレントキーワード集合は、非ロングテールキーワード集合であると確定される。この時点で、見つかったカテゴリ情報は、ユーザに直接提供される。しかしながら、カテゴリを見つけることができないならば、カレントキーワード集合は、ロングテールキーワード集合であると見なされる。
ロングテールキーワード集合であると見なされたカレントキーワード集合は、幾つかのカレントキーワード単位に分割される。一部の実施形態では、統計をベースにしたワード分割アルゴリズムが使用されるが、その他の任意の適切な技術を適用することもできる。
ステップ39では、確立された重要度表のなかで、分割されたカレントキーワード単位の重要度が決定される。
ステップ310では、カレントキーワード単位の中から、前提条件を満足する重要度に対応する選択的キーワード単位が選択される。一部の実施形態では、前提条件は、指定の閾値である。言い換えると、選択されたキーワード単位は、その重要度が指定の閾値を満たすようなキーワード単位である。一部の実施形態では、キーワード単位は、それらの重要度にしたがって順番に並べられ、前提条件は、順番に並べられたキーワード単位のうちのどれが選択されるか(例えば重要度が高い順に3つのキーワード単位)を指定する。
ステップ311では、確立された各種ステージの検索キーワード表のなかで、選択的カレントキーワード単位に対応するカテゴリ情報が決定される。
選択されたカレントキーワード単位に対応するカテゴリ情報を決定するには、幾つかのやり方が存在する。一部の実施形態では、以下のプロセスが使用される。
選択されたカレントキーワード単位の量がSであり、SがN以下(事前に指定されたステージの数)であると想定する。また、既定のルールが、選択されたS個のカレントキーワード単位をとりあげ、それらを順序付けて、結合し、ステージSカレントキーワード単位群を形成することを要求すると想定する。ステージSカレントキーワード表の中で、ステージSカレントキーワード単位群に対応するカテゴリ情報の探索が行われる。情報を見つけることができない場合には、プロセスは、繰り返される、すなわち、S個のカレントキーワード単位からS−1個のカレントキーワード単位が選択され、上述されたステップが再実行される。プロセスは、対応するカテゴリ情報が見つかるまで、カレントキーワード単位の数を一度に1つずつ減らすことによって繰り返される。
SがNよりも大きい場合には、S個のカレントキーワード単位の中から、重要度が高い順にN個のカレントキーワード単位が選択される。次いで、選択されたN個のカレントキーワード単位は、順序付けられた後に、結合されて、ステージNカレントキーワード単位群を形成する。ステージN検索キーワード表のなかで、上記ステージNカレントキーワード単位群に対応するカテゴリ情報の探索が行われる。情報が見つからない場合には、N個のカレントキーワードの中から、N−1個のカレントキーワード単位が選択される。プロセスは、対応するカテゴリ情報が見つかるまで、N−1、N−2などに対して繰り返される。
例えば、選択されたカレントキーワード単位の数が3、すなわちS=3であり、尚且つN=3であるならば、最初の3つのカレントキーワード単位が選択され、アルファベット順又は筆順にしたがって順序付けられて、ステージ3カレントキーワード単位群を形成する。次いで、ステージ3検索キーワード表のなかで、上記ステージ3カレントキーワード単位群に対応するカテゴリ情報の探索が行われる。カテゴリ情報が見つかったならば、それは、サーバからブラウザへ送信され、ブラウザは、そのカテゴリ情報をユーザに対して表示する。カテゴリ情報が見つからなかったならば、3つのカレントキーワード単位の中から、重要度が高い順に2つのカレントキーワード単位が選択される。選択された2つのカレントキーワード単位をアルファベット順又は筆順にしたがって順序付けした後、それらは、結合されて、ステージ2カレントキーワード単位群を形成する。次いで、ステージ2検索キーワード表のなかで、上記ステージ2カレントキーワード単位群に対応するカテゴリ情報の探索が行われる。カテゴリ情報が見つかったならば、それは、サーバからブラウザへ送信され、ブラウザは、そのカテゴリ情報をユーザに対して表示する。カテゴリ情報が見つからなかったならば、2つのカレントキーワード単位の中から、重要度が最も高いカレントキーワード単位が選択される。選択されたカレントキーワード単位は、ステージ1カレントキーワード単位群と見なすことができる。次いで、ステージ1検索キーワード表のなかで、ステージ1カレントキーワード単位群に対応するカテゴリ情報の探索が行われる。見つけられたカテゴリ情報は、ウェブブラウザに返信され、ブラウザは、その情報をユーザに対して表示する。ステージ1検索キーワード表は、出現した全てのキーワード単位を網羅しているので、ステージ1検索キーワード表のなかでは、対応するカテゴリ情報を見つけることが常に可能である。
ステップ312では、決定されたカテゴリ情報が送信される。一部の実施形態では、カテゴリ情報は、サーバからユーザのデバイスに送信される。
一部の実施形態では、非ロングテールキーワードとカテゴリ情報との間の対応関係を含むワード参照表のなかの非ロングテールキーワードが、予め、分割を経ていることが可能である。それらは、検索キーワード単位に分割され、次いで、各非ロングテールキーワードから分割されたそれらのキーワード単位は、順序付けられた非ロングテールキーワードを得るために、アルファベット順又は筆順にしたがって順序付けられる。次いで、順序付けられた非ロングテールキーワードとカテゴリ情報との間の対応関係が、ワード参照表に格納される。その後、カレントキーワードが入力された後は、得られたカレントキーワードをカレントキーワード単位に分割することができ、これらのユニットは、次いで、順序付けられたカレントキーワードを作成するために、アルファベット順又は筆順にしたがって順序付けられる。参照ワード表のなかで、これらの順序付けられたカレントキーワードに対応するカテゴリ情報の探索が行われる。もし、見つからなかったならば、得られたカレントキーワードは、ロングテールキーワードであると確定される。次いで、前提条件を満足する重要度を持つカレントキーワード単位が選択され、対応するカテゴリ情報が決定され、ユーザに提供される。一部の実施形態では、ユーザによって入力されたカレントキーワードが得られた後、ワード参照表のなかで探索を行う必要なしに、上述されたプロセスにしたがって、直接、カテゴリ情報を提供することができる。言い換えると、受信されたものがロングテールキーワードであるか又は非ロングテールキーワードであるかを決定するステップは、随意である。
上述されたプロセスでは、指定の期間中に入力された各検索キーワードが、検索キーワード単位に分割され、各検索キーワードから分割された検索キーワード単位は、結合されて、各種ステージの検索キーワード単位群を形成し、形成された検索キーワード単位群に対応するカテゴリ情報が決定され、決定されたカテゴリ情報に基づいて、各種のステージの検索キーワード表が確立され、各種ステージ用に確立された検索キーワード表のなかで、入力されたカレントキーワードに基づいて、選択されたカレントキーワード単位に対応するカテゴリ情報が決定され、このようにして決定されたカテゴリ情報は、送り返される。全てのステージを含む検索キーワード表が、予め確立されており、これは、確立された検索キーワード表に基づいて、カレントキーワードに対応するカテゴリ情報の探索を行うことを可能にし、そうして、先行技術における問題、すなわち、ロングテールキーワードについてのカテゴリ情報をユーザに提供することができないという問題を解決することができる。この方式は、ユーザに提供されるカテゴリ情報の範囲及び柔軟性を効果的に高める。
図5は、カテゴリ情報を提供するためのプロセスの別の実施形態を示すフローチャートである。プロセスは、システム500などのシステム上で実施することができる。
ステップ41では、ユーザによって入力されたカレントキーワード集合が受信される。
ステップ42では、カレントキーワード集合が正規化され、カレントキーワード単位に分割される。
ステップ43では、順序付けられたカレントキーワードを取得するために、分割されたカレントキーワード単位がアルファベット順又は筆順にしたがって順序付けられる。
ステップ44では、格納されたワード参照表のなかで、順序付けられたカレントキーワードに対応するカテゴリ情報の探索が行われる。カテゴリ情報が見つかったならば、ステップ45に進む。そうでなければ、ステップ415に飛ぶ。
ステップ45では、重要度表のなかで、分割されたカレントキーワード単位の重要度の探索が行われる。
ステップ46では、重要度が高い順に、カレントキーワード単位が順序付けられ、3つのカレントキーワード単位が選択される。
ステップ47では、選択された3つのカレントキーワード単位が、アルファベット順又は筆順にしたがって順序付けられ、次いで、結合されて、ステージ3カレントキーワード単位群を形成する。
ステップ48では、ステージ3検索キーワード表のなかで、上記ステージ3カレントキーワード単位群に対応するカテゴリ情報の探索が行われる。見つからなかったならば、ステップ49に進む。そうでなければ、ステップ415に飛ぶ。
ステップ49では、重要度が高い順に、3つのカレントキーワード単位が順序付けられ、最初の2つのカレントキーワード単位が選択される。
ステップ410では、選択された2つのカレントキーワード単位が、アルファベット順又は筆順にしたがって順序付けられた後に、結合されて、ステージ2カレントキーワード単位群を形成する。
ステップ411では、ステージ2検索キーワード表のなかで、ステージ2カレントキーワード単位群に対応するカテゴリ情報の探索が行われる。カテゴリ情報が見つからなかったならば、ステップ412に進む。そうでなければ、ステップ415に飛ぶ。
ステップ412では、重要度が高い順に、これらの2つのカレントキーワード単位が順序付けられ、最初のカレントキーワード単位が選択される。
ステップ413では、選択されたカレントキーワード単位群が、ステージ1カレントキーワード単位群に形成される。
ステップ414では、ステージ1検索キーワード表のなかで、このステージ1カレントキーワード単位群に対応するカテゴリ情報の探索が行われる。
ステップ415では、見つかったカテゴリ情報がユーザに送信される。
図6は、カテゴリ情報を提供するためのシステムを示すシステム図である。システム500は、検索キーワード取得ユニット51と、検索キーワード分割ユニット52と、検索キーワード単位結合ユニット53と、第1のカテゴリ情報決定ユニット54と、検索キーワード表確立ユニット55と、第2のカテゴリ情報決定ユニット56と、通信インターフェース57とを含む。
検索キーワード取得ユニット51は、指定の期間内に入力された検索キーワードと、該検索キーワードに対応するカテゴリ情報とを取得するように構成されている。
検索キーワード分割ユニット52は、検索キーワード取得ユニット51によって取得された各検索キーワードを検索キーワード単位に分割するように構成されている。
検索キーワード単位結合ユニット53は、検索キーワード分割ユニット52によって分割された、各検索キーワードからの検索キーワード単位を結合し、各種ステージの検索キーワード単位群を形成するように構成されている。
第1のカテゴリ情報決定ユニット54は、検索キーワード取得ユニット51によって取得された検索キーワードに対応するカテゴリ情報に基づいて、検索キーワード単位結合ユニット53によって形成された検索キーワード単位群に対応する特定のカテゴリ情報を決定するように構成されている。
検索キーワード表確立ユニット55は、第1のカテゴリ情報決定ユニット54によって決定されたカテゴリ情報に基づいて、各種ステージの検索キーワード表を確立するように構成されている。各ステージの検索キーワード表は、そのステージの検索キーワード単位群の、カテゴリ情報との対応関係を含む。
第2のカテゴリ情報決定ユニット56は、入力されたカレントキーワードに基づいて、検索キーワード表確立ユニット55によって確立された各種ステージの検索キーワード表の中で、選択されたカレントキーワード単位に対応するカテゴリ情報を決定するように構成されている。
通信インターフェース57は、第2のカテゴリ情報決定ユニット56によって決定されたカテゴリ情報を返信するように構成されている。
随意として、システムは、更に、重要度決定ユニットと重要度表確立ユニットとを含む。重要度決定ユニットは、検索キーワード表確立ユニット55によって各種ステージの検索キーワード表が確立された後に、分割された検索キーワード単位の重要度をそれぞれ決定するように構成されている。重要度表確立ユニットは、重要度決定ユニットによって決定された重要度に基づいて、検索キーワード単位と重要度との間の対応関係を含む重要度表を確立するように構成されている。
第2のカテゴリ情報決定ユニット56は、カレントキーワード取得サブユニットと、カレントキーワード分割サブユニットと、第1の重要度決定サブユニットと、カレントキーワード選択サブユニットと、第1のカテゴリ情報決定サブユニットとを含む。カレントキーワード取得サブユニットは、入力されたカレントキーワードを取得するように構成されている。カレントキーワード分割サブユニットは、カレントキーワード取得サブユニットによって取得されたカレントキーワードをカレントキーワード単位に分割するように構成されている。第1の重要度決定ユニットは、重要度表確立ユニットによって決定された重要度表の中で、カレントキーワード分割サブユニットによって分割されたカレントキーワード単位の重要度を決定するように構成されている。カレントキーワード単位選択サブユニットは、カレントキーワード分割サブユニットによって分割されたカレントキーワード単位の中から、前提条件を満足する重要度を持つカレントキーワード単位を選択するように構成されている。第1のカテゴリ情報決定サブユニットは、検索キーワード表確立ユニット55によって確立された各種ステージの検索キーワード表の中で、カレントキーワード単位選択サブユニットによって選択されたカレントキーワード単位に対応するカテゴリ情報を決定するように構成されている。
一部の実施形態では、第1のカテゴリ情報決定ユニット54は、特に、第2のカテゴリ情報決定サブユニットと、第3のカテゴリ情報決定サブユニットとを含む。第2のカテゴリ情報決定サブユニットは、検索キーワード取得ユニット51によって取得された検索キーワードに対応するカテゴリ情報に基づいて、検索キーワード単位結合ユニット53によって形成された各検索キーワード単位群の検索キーワード単位を含む検索キーワードに対応するカテゴリ情報を決定するように構成されている。第3のカテゴリ情報決定サブユニットは、第2のカテゴリ情報決定サブユニットによって決定された、検索キーワードに対応するカテゴリ情報を、上記検索キーワード単位群に対応するカテゴリ情報であるとして決定するように構成されている。
一部の実施形態では、重要度決定ユニットは、特に、固有訪問者量決定サブユニットと、カテゴリエントロピ決定サブユニットと、第2の重要度決定サブユニットとを含む。固有訪問者量決定サブユニットは、カテゴリ情報下における各検索キーワード単位の固有訪問者(UV)量を決定するように構成されている。カテゴリエントロピ決定サブユニットは、固有訪問者量決定サブユニットによって決定されたUV量に基づいて、各種カテゴリ情報下における各検索キーワード単位のカテゴリエントロピを決定するように構成されている。第2の重要度決定サブユニットは、カテゴリエントロピ決定サブユニットによって決定されたカテゴリエントロピに基づいて、各検索キーワード単位の重要度を決定するように構成されている。
一部の実施形態では、システムは、更に、検索キーワード単位順序付けユニットと、カテゴリ情報探索ユニットと、第2のカテゴリ情報返信ユニットとを含む。検索キーワード単位順序付けユニットは、検索キーワード表確立ユニット55によって確立された各種ステージの検索キーワード表のなかで、尚且つ前提条件にしたがった選択されたカレントキーワード単位に対応するカテゴリ情報を決定する前に、各検索キーワードから分割された検索キーワード単位を順序付け、順序付けられた検索キーワード単位を取得するように構成されている。カテゴリ情報探索ユニットは、非ロングテールキーワードとカテゴリ情報との間の対応関係を格納された参照ワード表の中で、検索キーワード単位順序付けユニットによって順序付けられた検索キーワード単位のなかの各順序付けられた検索キーワード単位に対応するカテゴリ情報の探索を行うように構成されている。第2のカテゴリ情報返信ユニットは、カテゴリ情報探索ユニットによって見つかったカテゴリ情報を、それが見つかったときに返信するように構成されている。
第2のカテゴリ情報決定ユニット56は、カテゴリ情報探索ユニットによってカテゴリ情報が見つからなかったときに、確立された各種ステージの検索キーワード表の中で、選択されたカレントキーワード単位に対応するカテゴリ情報を決定するように構成されている。
図7は、カテゴリ情報を提供するためのシステムの別の実施形態を示すシステム図である。この例では、システム600は、オフライン解析デバイス61と、オンライン決定デバイス62とを含む。図7に示されるように、ブラウザは、ユーザによって入力された検索キーワードを取得した後、選択ログを作成し、ログサーバに送信する。オフライン解析デバイス61は、ログサーバから間隔をおいて選択ログを取得し、各種ステージの検索キーワード表と、重要度表とを確立する。次いで、確立された、各種ステージの検索キーワード表と、重要度表とを、オンライン決定デバイス62に送信する。ブラウザは、カレントキーワードを取得した後、それを、オンライン決定デバイス62に送信する。オンライン決定デバイス62は、各種ステージの検索キーワード表と、重要度表とに基づいて、上記カレントキーワード単位に対応するカテゴリ情報を決定し、次いで、それを、ユーザに返信するためにブラウザに送信する。
オフライン解析デバイス61は、検索キーワード取得ユニット51と、検索キーワード分割ユニット52と、検索キーワード単位結合ユニット53と、第1のカテゴリ情報決定ユニット54と、検索キーワード表確立ユニット55と、オンライン決定デバイス62に含まれる第2のカテゴリ情報決定ユニット56と、通信インターフェース57とを含む。
また、オフライン解析デバイス61は、更に、重要度決定ユニットと、重要度表確立ユニットとを含む。オンライン決定デバイス62は、更に、検索キーワード単位順序付けユニットと、カテゴリ情報探索ユニットと、第2のカテゴリ情報返信ユニットとを含む。
システム500及び600は、コンピュータ、マルチプロセッサシステム、マイクロプロセッサベースのシステム、特殊用途向けデバイス、上記のシステム若しくはデバイスの任意を含む分散コンピューティング環境、又は1つ以上のプロセッサと該プロセッサにつながれて該プロセッサに命令を提供するように構成されたメモリとを含むその他のハードウェア/ソフトウェア/ファームウェアの組み合わせなどの、1つ以上のコンピューティングデバイスを使用して実装することができる。
上述されたユニットは、1つ以上の汎用プロセッサ上で実行されるソフトウェアコンポーネントとして、プログラマブルロジックデバイス及び/若しくは特定の機能を実施するように設計された特殊用途向け集積回路などのハードウェアとして、又はそれらの組み合わせとして実装することができる。一部の実施形態では、ユニットは、本発明の実施形態で説明される方法を(パソコン、サーバ、ネットワーク機器などの)コンピュータデバイスに実行させるための幾つかの命令を含み尚且つ(光ディスク、フラッシュストレージデバイス、モバイルハードディスクなどの)不揮発性のストレージ媒体に記憶させることができるソフトウェア製品の形で具現化することができる。ユニットは、1つのデバイスに実装する又は複数のデバイスに分散させることができる。ユニットの機能は、互いに合体させる又は複数のサブユニットに更に分けることができる。
当業者ならば、本出願の実施形態が、方法、デバイス(機器)、又はコンピュータソフトウェア製品として提供されうることがわかる。したがって、本出願は、完全にハードウェア若しくはソフトウェアである実施形態、又はハードウェアとソフトウェアとの組み合わせである実施形態を活用することができる。更に、本出願は、コンピュータプログラムコードを含む1つ以上のコンピュータ操作可能なストレージ媒体(磁気ディスクストレージデバイス、CD−ROM、及び光ストレージデバイスを非限定的な例として含む)に実装されたコンピュータプログラムの形態をとることができる。
本出願は、方法、デバイス(機器)、及びコンピュータプログラム製品に基づくフローチャート及び/又はブロック図を参照にして説明されている。フローチャート及び/又はブロック図のなかの各プロセス及び/又は各ブロック、並びにフローチャート及び/又はブロック図のなかのプロセス及び/又はブロックの組み合わせは、それぞれ、コンピュータプログラムコマンドを通じて達成されうることがわかる。これらのコンピュータプログラムコマンドは、汎用コンピュータ、特殊用途コンピュータ、埋め込みプロセッサ、又はその他のプログラマブルデータ機器のプロセッサに提供されて、マシンを作動させることができ、その結果、コンピュータ、又はその他のプログラマブルデータ機器のプロセッサを通じて実行されるコマンドは、フローチャートのなかの1つ以上のプロセス及び/又はブロック図のなかの1つ以上のブロックによって指定された機能を実現するために使用されるデバイスを作動させる。
これらのコンピュータプログラムコマンドは、また、コンピュータ又はその他のプログラマブルデータ機器を誘導することができる特殊作業用コンピュータ読み取り可能なストレージデバイスに記憶させることもでき、その結果、これらのコンピュータ読み取り可能ストレージデバイスに記憶されているコマンドは、コマンドデバイスを含む製品をもたらす。これらのコマンドデバイスは、フローチャートのなかの1つ以上のプロセス及び/又はブロック図のなかの1つ以上のブロックに指定される機能を実現する。
これらのコンピュータプログラムコマンドは、コンピュータ又はその他のプログラマブルデータ機器に取り込むこともでき、その結果、コンピュータ又はその他のプログラマブル機器で一連の作業ステップが実行されて、コンピュータ処理が引き起こされる。このようにして、コンピュータ又はその他のプログラマブル機器で実行されるコマンドは、フローチャートのなかの1つ以上のプロセス及び/又はブロック図のなかの1つ以上のブロックで指定される機能を実現するためのステップを提供する。
本出願の好ましい実施形態が既に説明されてきたが、当業者ならば、ひとたび基本的な発明的概念を捉えられれば、これらの実施形態に対してその他の変更又は修正を加えることができる。したがって、添付の特許請求の範囲は、好ましい実施形態のみならず、あらゆる変更及び修正も、本出願の範囲内に入るものとして含むとして解釈される。明らかに、当業者ならば、本発明の趣旨及び範囲から逸脱することなく本出願を変更及び多様化することができる。したがって、本出願のこれらの変更及びヴァリエーションが、特許請求の範囲及びその等価技術の範囲内であるならば、本出願は、これらの変更及びヴァリエーションも網羅することを意図される。
以上の実施形態は、理解を明瞭にする目的で幾らか詳細に説明されてきたが、本発明は、提供された詳細に限定されない。本発明を実現するには、多くの代替的手法がある。開示された実施形態は、例示的なものであり、限定を目的としたものではない。
ステップ354では、決定されたUV量に基づいて、各種カテゴリ下における各検索キーワード単位のカテゴリエントピが決定される。
第2のカテゴリ情報決定ユニット56は、カレントキーワード取得サブユニットと、カレントキーワード分割サブユニットと、第1の重要度決定サブユニットと、カレントキーワード単位選択サブユニットと、第1のカテゴリ情報決定サブユニットとを含む。カレントキーワード取得サブユニットは、入力されたカレントキーワードを取得するように構成されている。カレントキーワード分割サブユニットは、カレントキーワード取得サブユニットによって取得されたカレントキーワードをカレントキーワード単位に分割するように構成されている。第1の重要度決定サブユニットは、重要度表確立ユニットによって決定された重要度表の中で、カレントキーワード分割サブユニットによって分割されたカレントキーワード単位の重要度を決定するように構成されている。カレントキーワード単位選択サブユニットは、カレントキーワード分割サブユニットによって分割されたカレントキーワード単位の中から、前提条件を満足する重要度を持つカレントキーワード単位を選択するように構成されている。第1のカテゴリ情報決定サブユニットは、検索キーワード表確立ユニット55によって確立された各種ステージの検索キーワード表の中で、カレントキーワード単位選択サブユニットによって選択されたカレントキーワード単位に対応するカテゴリ情報を決定するように構成されている。
以上の実施形態は、理解を明瞭にする目的で幾らか詳細に説明されてきたが、本発明は、提供された詳細に限定されない。本発明を実現するには、多くの代替的手法がある。開示された実施形態は、例示的なものであり、限定を目的としたものではない。
適用例1:方法であって、複数のユーザによって事前に入力された複数の検索キーワード集合を受信することと、前記複数の検索キーワード集合に対応するカテゴリ情報を取得することと、前記カテゴリ情報は、前記複数のユーザ選択に少なくとも部分的に基づいて決定されることと、前記複数の検索キーワード集合のそれぞれを検索キーワード単位に分割することと、前記検索キーワード単位を結合し、複数のステージに対応する複数の検索キーワード単位群を形成することと、前記検索キーワード単位群は、同じ数の検索キーワード単位を有する同じステージに対応することと、前記複数の検索キーワード集合に対応するカテゴリ情報に少なくとも部分的に基づいて、前記複数の検索キーワード単位群に特に対応するカテゴリ情報を決定することと、前記複数の検索キーワード単位群に特に対応するカテゴリ情報に少なくとも部分的に基づいて、前記複数のステージに対応する複数の検索キーワード表を確立することと、各ステージは、前記各ステージの検索キーワード単位群と前記複数の検索キーワード単位群に特に対応するカテゴリ情報との間の対応関係を含む対応する検索キーワード表を有することと、を備え、前記複数の検索キーワード表は、ユーザによって入力されたカレント検索キーワード集合のカレントカテゴリ情報を提供するために使用される、方法。
適用例2:適用例1に記載の方法であって、更に、前記複数の検索キーワード集合の中から、前記複数の検索キーワード単位群の前記検索キーワード単位を含む選択的検索キーワード集合を決定することと、前記複数の検索キーワード集合に対応するカテゴリ情報に基づいて、前記選択的検索キーワード集合のカテゴリ情報を、前記複数の検索キーワード単位群に特に対応するカテゴリ情報として提供することと、を備える方法。
適用例3:適用例1に記載の方法であって、更に、前記検索キーワード単位の複数の重要度を決定することを備える方法。
適用例4:適用例3に記載の方法であって、前記複数の重要度を決定することは、記録されたログ情報に基づいて、対応するカテゴリ下における前記複数の検索キーワード単位の複数の固有訪問者(UV)量を決定することを含む、方法。
適用例5:適用例4に記載の方法であって、更に、前記複数の検索キーワード単位のそれぞれについて、その対応するカテゴリ下におけるカテゴリエントロピを決定することを備える方法。
適用例6:適用例5に記載の方法であって、前記検索キーワード単位の複数の重要度を決定することは、カテゴリエントロピを決定することを含む、方法。
適用例7:適用例6に記載の方法であって、前記カテゴリエントロピは、
Figure 2013545189
によって決定され、ここで、
i は、検索キーワード単位iのカテゴリエントロピであり、Kは、前記検索キーワード単位iのUVが存在するカテゴリの量であり、P ij は、第j番目のカテゴリ下における前記検索キーワード単位のUV量であり、P i は、全てのカテゴリ下における前記検索キーワード単位iのUV量である、方法。
適用例8:適用例1に記載の方法であって、更に、前記カレント検索キーワード集合を受信することと、前記カレント検索キーワード集合をカレント検索キーワード単位に分割することと、前記カレント検索キーワード単位を結合し、複数のカレントステージに対応する複数のカレント検索キーワード単位群を形成することと、各カレントステージは、カレント検索キーワード単位群の集合に対応し、前記集合のなかの各カレント検索キーワード単位群は、同じ数のカレント検索キーワード単位を有することと、前記複数の検索キーワード表を使用して、前記複数のカレント検索キーワード単位群に対応するカレントカテゴリ情報を識別することと、を備える方法。
適用例9:適用例8に記載の方法であって、更に、前記検索キーワード単位の複数の重要度を決定することと、前記検索キーワード単位の前記複数の重要度に少なくとも部分的に基づいて、前記カレント検索キーワード単位の複数のカレント重要度を決定することと、前記カレントキーワード単位の中から、前提条件を満足する重要度を持つ選択的カレントキーワード単位を選択することと、前記複数のステージに対応する前記複数の検索キーワード表を使用して、前記選択的カレントキーワード単位に対応するカテゴリ情報を前記カレントカテゴリ情報として決定することと、を備える方法。
適用例10:適用例9に記載の方法であって、前記カレントキーワード単位の中から、前提条件を満足する重要度を持つ選択的カレントキーワード単位を選択することは、指定の閾値を満たす重要度を持つカレントキーワード単位を選択することを含む、方法。
適用例11:適用例9に記載の方法であって、前記カレントキーワード単位の中から、前提条件を満足する重要度を持つ選択的カレントキーワード単位を選択することは、前記カレントキーワード単位をそれらのそれぞれの重要度にしたがって順番に並べることと、順位が高いほうか順に所定の数のカレントキーワード単位を前記選択的カレントキーワード単位として選択することとを含む、方法。
適用例12:システムであって、1つ以上のプロセッサであって、複数のユーザによって事前に入力された複数の検索キーワード集合を受信し、前記複数の検索キーワード集合に対応するカテゴリ情報を取得し、前記カテゴリ情報は、前記複数のユーザ選択に少なくとも部分的に基づいて決定され、前記複数の検索キーワード集合のそれぞれを検索キーワード単位に分割し、前記検索キーワード単位を結合し、複数のステージに対応する複数の検索キーワード単位群を形成し、前記検索キーワード単位群は、同じ数の検索キーワード単位を有する同じステージに対応し、前記複数の検索キーワード集合に対応するカテゴリ情報に少なくとも部分的に基づいて、前記複数の検索キーワード単位群に特に対応するカテゴリ情報を決定し、前記複数の検索キーワード単位群に特に対応するカテゴリ情報に少なくとも部分的に基づいて、前記複数のステージに対応する複数の検索キーワード表を確立するように構成されている1つ以上のプロセッサと、各ステージは、前記各ステージの検索キーワード単位群と前記複数の検索キーワード単位群に特に対応するカテゴリ情報との間の対応関係を含む対応する検索キーワード表を有し、前記プロセッサと接続され、前記プロセッサに命令を提供するように構成されている1つ以上のメモリと、を備え、前記複数の検索キーワード表は、ユーザによって入力されたカレント検索キーワード集合のカレントカテゴリ情報を提供するために使用される、システム。
適用例13:適用例12に記載のシステムであって、前記1つ以上のプロセッサは、更に、前記複数の検索キーワード集合の中から、前記複数の検索キーワード単位群の前記検索キーワード単位を含む選択的検索キーワード集合を決定し、前記複数の検索キーワード集合に対応するカテゴリ情報に基づいて、前記選択的検索キーワード集合のカテゴリ情報を、前記複数の検索キーワード単位群に特に対応するカテゴリ情報として提供するように構成されている、システム。
適用例14:適用例12に記載のシステムであって、前記1つ以上のプロセッサは、更に、前記検索キーワード単位の複数の重要度を決定するように構成されている、システム。
適用例15:適用例14に記載のシステムであって、前記複数の重要度を決定することは、記録されたログ情報に基づいて、対応するカテゴリ下における前記複数の検索キーワード単位の複数の固有訪問者(UV)量を決定することを含む、システム。
適用例16:適用例13に記載のシステムであって、前記1つ以上のプロセッサは、更に、前記複数の検索キーワード単位のそれぞれについて、その対応するカテゴリ下におけるカテゴリエントロピを決定するように構成されている、システム。
適用例17:適用例16に記載のシステムであって、前記検索キーワード単位の複数の重要度を決定することは、カテゴリエントロピを決定することを含む、システム。
適用例18:適用例17に記載のシステムであって、前記カテゴリエントロピは、
Figure 2013545189
によって決定され、ここで、
i は、検索キーワード単位iのカテゴリエントロピであり、Kは、前記検索キーワード単位iのUVが存在するカテゴリの量であり、P ij は、第j番目のカテゴリ下における前記検索キーワード単位のUV量であり、P i は、全てのカテゴリ下における前記検索キーワード単位iのUV量である、システム。
適用例19:適用例12に記載のシステムであって、前記1つ以上のプロセッサは、更に、前記カレント検索キーワード集合を受信し、前記カレント検索キーワード集合をカレント検索キーワード単位に分割し、前記カレント検索キーワード単位を結合し、複数のカレントステージに対応する複数のカレント検索キーワード単位群を形成し、各カレントステージは、カレント検索キーワード単位群の集合に対応し、前記集合のなかの各カレント検索キーワード単位群は、同じ数のカレント検索キーワード単位を有し、前記複数の検索キーワード表を使用して、前記複数のカレント検索キーワード単位群に対応するカレントカテゴリ情報を識別するように構成される、システム。
適用例20:適用例19に記載のシステムであって、前記1つ以上のプロセッサは、更に、前記検索キーワード単位の複数の重要度を決定し、前記検索キーワード単位の前記複数の重要度に少なくとも部分的に基づいて、前記カレント検索キーワード単位の複数のカレント重要度を決定し、前記カレントキーワード単位の中から、前提条件を満足する重要度を持つ選択的カレントキーワード単位を選択し、前記複数のステージに対応する前記複数の検索キーワード表を使用して、前記選択的カレントキーワード単位に対応するカテゴリ情報を前記カレントカテゴリ情報として決定するように構成される、システム。
適用例21:適用例20に記載のシステムであって、前記カレントキーワード単位の中から、前提条件を満足する重要度を持つ選択的カレントキーワード単位を選択することは、指定の閾値を満たす重要度を持つカレントキーワード単位を選択することを含む、システム。
適用例22:適用例20に記載のシステムであって、前記カレントキーワード単位の中から、前提条件を満足する重要度を持つ選択的カレントキーワード単位を選択することは、前記カレントキーワード単位をそれらのそれぞれの重要度にしたがって順番に並べることと、順位が高いほうから順に所定の数のカレントキーワード単位を前記選択的カレントキーワード単位として選択することとを含む、システム。

Claims (22)

  1. 方法であって、
    複数のユーザによって事前に入力された複数の検索キーワード集合を受信することと、
    前記複数の検索キーワード集合に対応するカテゴリ情報を取得することと、前記カテゴリ情報は、前記複数のユーザ選択に少なくとも部分的に基づいて決定されることと、
    前記複数の検索キーワード集合のそれぞれを検索キーワード単位に分割することと、
    前記検索キーワード単位を結合し、複数のステージに対応する複数の検索キーワード単位群を形成することと、前記検索キーワード単位群は、同じ数の検索キーワード単位を有する同じステージに対応することと、
    前記複数の検索キーワード集合に対応するカテゴリ情報に少なくとも部分的に基づいて、前記複数の検索キーワード単位群に特に対応するカテゴリ情報を決定することと、
    前記複数の検索キーワード単位群に特に対応するカテゴリ情報に少なくとも部分的に基づいて、前記複数のステージに対応する複数の検索キーワード表を確立することと、各ステージは、前記各ステージの検索キーワード単位群と前記複数の検索キーワード単位群に特に対応するカテゴリ情報との間の対応関係を含む対応する検索キーワード表を有することと、
    を備え、前記複数の検索キーワード表は、ユーザによって入力されたカレント検索キーワード集合のカレントカテゴリ情報を提供するために使用される、方法。
  2. 請求項1に記載の方法であって、更に、
    前記複数の検索キーワード集合の中から、前記複数の検索キーワード単位群の前記検索キーワード単位を含む選択的検索キーワード集合を決定することと、
    前記複数の検索キーワード集合に対応するカテゴリ情報に基づいて、前記選択的検索キーワード集合のカテゴリ情報を、前記複数の検索キーワード単位群に特に対応するカテゴリ情報として提供することと、
    を備える方法。
  3. 請求項1に記載の方法であって、更に、
    前記検索キーワード単位の複数の重要度を決定することを備える方法。
  4. 請求項3に記載の方法であって、
    前記複数の重要度を決定することは、記録されたログ情報に基づいて、対応するカテゴリ下における前記複数の検索キーワード単位の複数の固有訪問者(UV)量を決定することを含む、方法。
  5. 請求項4に記載の方法であって、更に、
    前記複数の検索キーワード単位のそれぞれについて、その対応するカテゴリ下におけるカテゴリエントロピを決定することを備える方法。
  6. 請求項5に記載の方法であって、
    前記検索キーワード単位の複数の重要度を決定することは、カテゴリエントロピを決定することを含む、方法。
  7. 請求項6に記載の方法であって、
    前記カテゴリエントロピは、
    Figure 2013545189
    によって決定され、ここで、
    iは、検索キーワード単位iのカテゴリエントロピであり、Kは、前記検索キーワード単位iのUVが存在するカテゴリの量であり、Pijは、第j番目のカテゴリ下における前記検索キーワード単位のUV量であり、Piは、全てのカテゴリ下における前記検索キーワード単位iのUV量である、方法。
  8. 請求項1に記載の方法であって、更に、
    前記カレント検索キーワード集合を受信することと、
    前記カレント検索キーワード集合をカレント検索キーワード単位に分割することと、
    前記カレント検索キーワード単位を結合し、複数のカレントステージに対応する複数のカレント検索キーワード単位群を形成することと、各カレントステージは、カレント検索キーワード単位群の集合に対応し、前記集合のなかの各カレント検索キーワード単位群は、同じ数のカレント検索キーワード単位を有することと、
    前記複数の検索キーワード表を使用して、前記複数のカレント検索キーワード単位群に対応するカレントカテゴリ情報を識別することと、
    を備える方法。
  9. 請求項8に記載の方法であって、更に、
    前記検索キーワード単位の複数の重要度を決定することと、
    前記検索キーワード単位の前記複数の重要度に少なくとも部分的に基づいて、前記カレント検索キーワード単位の複数のカレント重要度を決定することと、
    前記カレントキーワード単位の中から、前提条件を満足する重要度を持つ選択的カレントキーワード単位を選択することと、
    前記複数のステージに対応する前記複数の検索キーワード表を使用して、前記選択的カレントキーワード単位に対応するカテゴリ情報を前記カレントカテゴリ情報として決定することと、
    を備える方法。
  10. 請求項9に記載の方法であって、
    前記カレントキーワード単位の中から、前提条件を満足する重要度を持つ選択的カレントキーワード単位を選択することは、指定の閾値を満たす重要度を持つカレントキーワード単位を選択することを含む、方法。
  11. 請求項9に記載の方法であって、
    前記カレントキーワード単位の中から、前提条件を満足する重要度を持つ選択的カレントキーワード単位を選択することは、前記カレントキーワード単位をそれらのそれぞれの重要度にしたがって順番に並べることと、順位が高いほうか順に所定の数のカレントキーワード単位を前記選択的カレントキーワード単位として選択することとを含む、方法。
  12. システムであって、
    1つ以上のプロセッサであって、
    複数のユーザによって事前に入力された複数の検索キーワード集合を受信し、
    前記複数の検索キーワード集合に対応するカテゴリ情報を取得し、前記カテゴリ情報は、前記複数のユーザ選択に少なくとも部分的に基づいて決定され、
    前記複数の検索キーワード集合のそれぞれを検索キーワード単位に分割し、
    前記検索キーワード単位を結合し、複数のステージに対応する複数の検索キーワード単位群を形成し、前記検索キーワード単位群は、同じ数の検索キーワード単位を有する同じステージに対応し、
    前記複数の検索キーワード集合に対応するカテゴリ情報に少なくとも部分的に基づいて、前記複数の検索キーワード単位群に特に対応するカテゴリ情報を決定し、
    前記複数の検索キーワード単位群に特に対応するカテゴリ情報に少なくとも部分的に基づいて、前記複数のステージに対応する複数の検索キーワード表を確立するように構成されている1つ以上のプロセッサと、各ステージは、前記各ステージの検索キーワード単位群と前記複数の検索キーワード単位群に特に対応するカテゴリ情報との間の対応関係を含む対応する検索キーワード表を有し、
    前記プロセッサと接続され、前記プロセッサに命令を提供するように構成されている1つ以上のメモリと、
    を備え、
    前記複数の検索キーワード表は、ユーザによって入力されたカレント検索キーワード集合のカレントカテゴリ情報を提供するために使用される、システム。
  13. 請求項12に記載のシステムであって、
    前記1つ以上のプロセッサは、更に、
    前記複数の検索キーワード集合の中から、前記複数の検索キーワード単位群の前記検索キーワード単位を含む選択的検索キーワード集合を決定し、
    前記複数の検索キーワード集合に対応するカテゴリ情報に基づいて、前記選択的検索キーワード集合のカテゴリ情報を、前記複数の検索キーワード単位群に特に対応するカテゴリ情報として提供するように構成されている、システム。
  14. 請求項12に記載のシステムであって、
    前記1つ以上のプロセッサは、更に、
    前記検索キーワード単位の複数の重要度を決定するように構成されている、システム。
  15. 請求項14に記載のシステムであって、
    前記複数の重要度を決定することは、記録されたログ情報に基づいて、対応するカテゴリ下における前記複数の検索キーワード単位の複数の固有訪問者(UV)量を決定することを含む、システム。
  16. 請求項13に記載のシステムであって、
    前記1つ以上のプロセッサは、更に、
    前記複数の検索キーワード単位のそれぞれについて、その対応するカテゴリ下におけるカテゴリエントロピを決定するように構成されている、システム。
  17. 請求項16に記載のシステムであって、
    前記検索キーワード単位の複数の重要度を決定することは、カテゴリエントロピを決定することを含む、システム。
  18. 請求項17に記載のシステムであって、
    前記カテゴリエントロピは、
    Figure 2013545189
    によって決定され、ここで、
    iは、検索キーワード単位iのカテゴリエントロピであり、Kは、前記検索キーワード単位iのUVが存在するカテゴリの量であり、Pijは、第j番目のカテゴリ下における前記検索キーワード単位のUV量であり、Piは、全てのカテゴリ下における前記検索キーワード単位iのUV量である、システム。
  19. 請求項12に記載のシステムであって、
    前記1つ以上のプロセッサは、更に、
    前記カレント検索キーワード集合を受信し、
    前記カレント検索キーワード集合をカレント検索キーワード単位に分割し、
    前記カレント検索キーワード単位を結合し、複数のカレントステージに対応する複数のカレント検索キーワード単位群を形成し、各カレントステージは、カレント検索キーワード単位群の集合に対応し、前記集合のなかの各カレント検索キーワード単位群は、同じ数のカレント検索キーワード単位を有し、
    前記複数の検索キーワード表を使用して、前記複数のカレント検索キーワード単位群に対応するカレントカテゴリ情報を識別するように構成される、システム。
  20. 請求項19に記載のシステムであって、
    前記1つ以上のプロセッサは、更に、
    前記検索キーワード単位の複数の重要度を決定し、
    前記検索キーワード単位の前記複数の重要度に少なくとも部分的に基づいて、前記カレント検索キーワード単位の複数のカレント重要度を決定し、
    前記カレントキーワード単位の中から、前提条件を満足する重要度を持つ選択的カレントキーワード単位を選択し、
    前記複数のステージに対応する前記複数の検索キーワード表を使用して、前記選択的カレントキーワード単位に対応するカテゴリ情報を前記カレントカテゴリ情報として決定するように構成される、システム。
  21. 請求項20に記載のシステムであって、
    前記カレントキーワード単位の中から、前提条件を満足する重要度を持つ選択的カレントキーワード単位を選択することは、指定の閾値を満たす重要度を持つカレントキーワード単位を選択することを含む、システム。
  22. 請求項20に記載のシステムであって、
    前記カレントキーワード単位の中から、前提条件を満足する重要度を持つ選択的カレントキーワード単位を選択することは、前記カレントキーワード単位をそれらのそれぞれの重要度にしたがって順番に並べることと、順位が高いほうから順に所定の数のカレントキーワード単位を前記選択的カレントキーワード単位として選択することとを含む、システム。
JP2013537652A 2010-11-02 2011-10-28 マルチステージを使用したカテゴリ情報の決定 Active JP5449628B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
CN201010530231.5 2010-11-02
CN201010530231.5A CN102456058B (zh) 2010-11-02 2010-11-02 类目信息提供方法及装置
US13/317,789 2011-10-27
US13/317,789 US8583685B2 (en) 2010-11-02 2011-10-27 Determination of category information using multiple stages
PCT/US2011/001831 WO2012060866A1 (en) 2010-11-02 2011-10-28 Determination of category information using multiple stages

Publications (2)

Publication Number Publication Date
JP2013545189A true JP2013545189A (ja) 2013-12-19
JP5449628B2 JP5449628B2 (ja) 2014-03-19

Family

ID=45997813

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013537652A Active JP5449628B2 (ja) 2010-11-02 2011-10-28 マルチステージを使用したカテゴリ情報の決定

Country Status (7)

Country Link
US (2) US8583685B2 (ja)
EP (1) EP2635960A4 (ja)
JP (1) JP5449628B2 (ja)
CN (1) CN102456058B (ja)
HK (1) HK1166527A1 (ja)
TW (1) TWI508011B (ja)
WO (1) WO2012060866A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018070026A1 (ja) * 2016-10-13 2018-04-19 楽天株式会社 商品情報表示システム、商品情報表示方法、及びプログラム

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102841946B (zh) * 2012-08-24 2016-05-25 北京国政通科技有限公司 商品数据检索排序及商品推荐方法和系统
CN103902545B (zh) * 2012-12-25 2018-10-16 北京京东尚科信息技术有限公司 一种类目路径识别方法及系统
US9201969B2 (en) * 2013-01-31 2015-12-01 Lexisnexis, A Division Of Reed Elsevier Inc. Systems and methods for identifying documents based on citation history
US9609050B2 (en) 2013-01-31 2017-03-28 Facebook, Inc. Multi-level data staging for low latency data access
CN103336806B (zh) * 2013-06-24 2016-08-10 北京工业大学 一种基于词出现间距的内在与外在模式熵差的关键词排序方法
CN104301353B (zh) * 2013-07-18 2019-10-08 腾讯科技(深圳)有限公司 一种订阅长尾类信息的方法、装置和系统
CN103825952B (zh) * 2014-03-04 2017-07-04 百度在线网络技术(北京)有限公司 细胞词库推送方法和服务器
CN104268233B (zh) * 2014-09-26 2018-07-13 北京国双科技有限公司 组合关键词的生成方法及装置
CN105589853B (zh) 2014-10-20 2017-09-15 阿里巴巴集团控股有限公司 一种类目目录确定方法及装置、自动分类方法及装置
CN105262812A (zh) * 2015-10-16 2016-01-20 浪潮(北京)电子信息产业有限公司 一种基于云计算平台的日志数据处理方法、装置及系统
CN106815228B (zh) * 2015-11-27 2020-03-03 北京国双科技有限公司 搜索关键词的类名选取方法和装置
CN105808641A (zh) * 2016-02-24 2016-07-27 百度在线网络技术(北京)有限公司 线下资源的挖掘方法和装置
CN105893592B (zh) * 2016-04-12 2019-06-21 Oppo广东移动通信有限公司 一种搜索方法和装置
CN106874492B (zh) * 2017-02-23 2021-01-26 北京京东尚科信息技术有限公司 搜索方法和装置
US11397558B2 (en) 2017-05-18 2022-07-26 Peloton Interactive, Inc. Optimizing display engagement in action automation
US10929613B2 (en) 2017-12-29 2021-02-23 Aiqudo, Inc. Automated document cluster merging for topic-based digital assistant interpretation
US10963499B2 (en) 2017-12-29 2021-03-30 Aiqudo, Inc. Generating command-specific language model discourses for digital assistant interpretation
US10963495B2 (en) * 2017-12-29 2021-03-30 Aiqudo, Inc. Automated discourse phrase discovery for generating an improved language model of a digital assistant
CN111127060B (zh) * 2018-10-31 2023-08-08 百度在线网络技术(北京)有限公司 确定业务的推广用户的方法和装置
CN110413645A (zh) * 2019-06-19 2019-11-05 平安普惠企业管理有限公司 数据搜索方法、装置、终端及计算机可读存储介质
CN112650914A (zh) * 2020-12-30 2021-04-13 深圳市世强元件网络有限公司 一种长尾关键词识别方法、关键词搜索方法及计算机设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000222431A (ja) * 1999-02-03 2000-08-11 Mitsubishi Electric Corp 文書分類装置
US20050222987A1 (en) * 2004-04-02 2005-10-06 Vadon Eric R Automated detection of associations between search criteria and item categories based on collective analysis of user activity data
US20090265317A1 (en) * 2008-04-21 2009-10-22 Microsoft Corporation Classifying search query traffic
JP2009294836A (ja) * 2008-06-04 2009-12-17 Yahoo Japan Corp Web検索において選択的に擬似フィードバック処理を適用する検索処理装置、方法及びプログラム
US7792858B2 (en) * 2005-12-21 2010-09-07 Ebay Inc. Computer-implemented method and system for combining keywords into logical clusters that share similar behavior with respect to a considered dimension

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3648051B2 (ja) 1998-02-02 2005-05-18 富士通株式会社 関連情報検索装置及びプログラム記録媒体
US6826568B2 (en) 2001-12-20 2004-11-30 Microsoft Corporation Methods and system for model matching
CN1267838C (zh) * 2002-12-31 2006-08-02 程松林 一种语音检索方法及采用该方法的音像信息检索系统
US20040260677A1 (en) 2003-06-17 2004-12-23 Radhika Malpani Search query categorization for business listings search
KR100452086B1 (ko) 2003-12-22 2004-10-13 엔에이치엔(주) 카테고리 별 키워드의 입력 순위를 제공하기 위한 검색서비스 시스템 및 그 방법
KR100520428B1 (ko) 2005-01-13 2005-10-11 엔에이치엔(주) 사용자 인증에 따라 다양한 종류의 키워드를 연동하여관리하는 방법 및 그 시스템
KR100785352B1 (ko) 2006-04-21 2007-12-18 엔에이치엔(주) 검색결과리스트 생성 방법 및 검색결과리스트 생성 시스템
US7996393B1 (en) * 2006-09-29 2011-08-09 Google Inc. Keywords associated with document categories
JP4327899B2 (ja) 2006-11-08 2009-09-09 株式会社シリウステクノロジーズ 広告情報提供方法、広告情報提供システム及び広告情報提供プログラム
US8131722B2 (en) * 2006-11-20 2012-03-06 Ebay Inc. Search clustering
US8862608B2 (en) * 2007-11-13 2014-10-14 Wal-Mart Stores, Inc. Information retrieval using category as a consideration
US8620910B2 (en) 2008-02-27 2013-12-31 Nec Corporation Search system, search method, and program
US9361365B2 (en) * 2008-05-01 2016-06-07 Primal Fusion Inc. Methods and apparatus for searching of content using semantic synthesis
US20100257171A1 (en) 2009-04-03 2010-10-07 Yahoo! Inc. Techniques for categorizing search queries
US20100306198A1 (en) 2009-06-02 2010-12-02 Cbs Interactive, Inc. System and method for determining categories associated with searches of electronic catalogs and displaying category information with search results
CN101593200B (zh) * 2009-06-19 2012-10-03 淮海工学院 基于关键词频度分析的中文网页分类方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000222431A (ja) * 1999-02-03 2000-08-11 Mitsubishi Electric Corp 文書分類装置
US20050222987A1 (en) * 2004-04-02 2005-10-06 Vadon Eric R Automated detection of associations between search criteria and item categories based on collective analysis of user activity data
US7792858B2 (en) * 2005-12-21 2010-09-07 Ebay Inc. Computer-implemented method and system for combining keywords into logical clusters that share similar behavior with respect to a considered dimension
US20090265317A1 (en) * 2008-04-21 2009-10-22 Microsoft Corporation Classifying search query traffic
JP2009294836A (ja) * 2008-06-04 2009-12-17 Yahoo Japan Corp Web検索において選択的に擬似フィードバック処理を適用する検索処理装置、方法及びプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018070026A1 (ja) * 2016-10-13 2018-04-19 楽天株式会社 商品情報表示システム、商品情報表示方法、及びプログラム
JPWO2018070026A1 (ja) * 2016-10-13 2019-04-18 楽天株式会社 商品情報表示システム、商品情報表示方法、及びプログラム

Also Published As

Publication number Publication date
HK1166527A1 (en) 2012-11-02
US20140074831A1 (en) 2014-03-13
US9087108B2 (en) 2015-07-21
US20120109946A1 (en) 2012-05-03
WO2012060866A1 (en) 2012-05-10
TWI508011B (zh) 2015-11-11
EP2635960A4 (en) 2014-09-10
JP5449628B2 (ja) 2014-03-19
TW201220233A (en) 2012-05-16
CN102456058A (zh) 2012-05-16
EP2635960A1 (en) 2013-09-11
US8583685B2 (en) 2013-11-12
CN102456058B (zh) 2014-03-19

Similar Documents

Publication Publication Date Title
JP5449628B2 (ja) マルチステージを使用したカテゴリ情報の決定
JP6301958B2 (ja) 検索語句を構成し、広告を配信し、製品情報を検索するための方法および装置
US8700621B1 (en) Generating query suggestions from user generated content
US11580168B2 (en) Method and system for providing context based query suggestions
JP5693746B2 (ja) 製品情報のランク付け
JP5661200B2 (ja) 検索情報の提供
CN109325182B (zh) 基于会话的信息推送方法、装置、计算机设备及存储介质
CN107193987B (zh) 获取与页面相关的搜索词的方法、装置和系统
US20160188619A1 (en) Method and system for enhanced query term suggestion
WO2016078533A1 (zh) 搜索方法、装置、设备及非易失性计算机存储介质
JP6932360B2 (ja) オブジェクト検索方法、装置およびサーバ
CN109829073B (zh) 一种图像搜索的方法及装置
JP5256273B2 (ja) 意図抽出装置、方法及びプログラム
CN103984754A (zh) 一种搜索系统和搜索方法
US9785678B1 (en) Determining taxonomy nodes for browsing
JP5622880B2 (ja) アイテム推薦システム、アイテム推薦方法およびアイテム推薦プログラム
CN110990701B (zh) 书籍搜索方法、计算设备及计算机存储介质
CN106844406B (zh) 检索方法和检索装置
CN111666417A (zh) 生成同义词的方法、装置、电子设备以及可读存储介质
US11256703B1 (en) Systems and methods for determining long term relevance with query chains
CN111881255B (zh) 同义文本获取方法、装置、电子设备及存储介质
CN112597760A (zh) 文档中的领域词提取方法和装置
EP3432154A1 (en) Method and apparatus for providing search recommendation information
CN113360765B (zh) 事件信息的处理方法、装置、电子设备和介质
CN104778251A (zh) 一种文献热度的获取方法及装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131003

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20131003

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20131018

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131126

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131224

R150 Certificate of patent or registration of utility model

Ref document number: 5449628

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250