JP2016131045A - オンライン取引プラットフォームのための検索方法、装置およびサーバ - Google Patents

オンライン取引プラットフォームのための検索方法、装置およびサーバ Download PDF

Info

Publication number
JP2016131045A
JP2016131045A JP2016082971A JP2016082971A JP2016131045A JP 2016131045 A JP2016131045 A JP 2016131045A JP 2016082971 A JP2016082971 A JP 2016082971A JP 2016082971 A JP2016082971 A JP 2016082971A JP 2016131045 A JP2016131045 A JP 2016131045A
Authority
JP
Japan
Prior art keywords
web page
product
keywords
keyword
product identifier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016082971A
Other languages
English (en)
Other versions
JP6346218B2 (ja
Inventor
シャオ ウェン パン
xiao wen Pan
シャオ ウェン パン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Publication of JP2016131045A publication Critical patent/JP2016131045A/ja
Application granted granted Critical
Publication of JP6346218B2 publication Critical patent/JP6346218B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions

Abstract

【課題】オンライン取引プラットフォームにおける検索時の負荷を低減させるための、ウェブページデータベースをセットアップする方法を提供する。【解決手段】本発明に係るウェブページデータベースをセットアップする方法は、ウェブページをフェッチすることと、前記ウェブページにおいて参照される製品キーワードを取得するために、前記ウェブページのキーワードを解析することと、前記ウェブページに関連する少なくとも1つの製品識別子を取得するために、所定のルールに基づいて前記製品キーワードを解析することと、前記ウェブページと、前記少なくとも1つの製品識別子と、前記少なくとも1つの製品識別子に関連付けられた販売量の情報と、前記ウェブページおよび前記少なくとも1つの製品識別子の関係を所定のデータベース内に格納することを含む。【選択図】図1

Description

本出願は、2010年11月1日に出願された、中国特許出願第201010529419.8号、表題「Search Method, Apparatus And Server For Online Trading Platform」の優先権を主張し、これは、参照することによりその全体が本明細書に組み込まれる。
本開示は、ネットワークデータ処理の分野に関し、特に、オンライン取引プラットフォームのための検索方法、装置およびサーバに関する。
ユーザから入力された質問語の受信に応答して、オンライン取引プラットフォームにおける検索は、通常、ユーザに対して、質問語を含むいくつかの製品を表示する。質問語を含むこれらの製品は、ユーザの関心を引く可能性のある製品である。概して、これらの製品をキーワードに関連させることにより、それに関連するキーワードが入力される場合に、キーワードに関連する製品が取得され得る。
ユーザが具体的な製品を検索する場合、概して、既存の技術は、名前、カテゴリおよび/または製品属性に基づいてキーワードマッチングを実行するというアプローチを採用する。しかしながら、この種類の検索アプローチは、単純な製品カテゴリ用語または製品名および製品属性といったキーワードに適用可能であるにすぎない。ユーザによって入力される質問語が具体的な製品名または製品属性を含まない場合、その種類の製品が存在する場合であっても結果が見つからない場合がある。その一例が、「女性に適した携帯電話」というキーワードである。データベースに格納されるデータは、通常、単に記述的であるキーワード情報は格納せず、製品名、カテゴリおよび属性等のキーワードに基づいて構築されているため、ユーザの求める結果が見つからない場合がある。例えば、「Phillips588」が、概して女性に適した携帯電話と考えられているとする。しかしながら、ユーザは、オンライン取引プラットフォーム上で「女性に適した携帯電話」という用語を使用し検索する時この携帯電話を見つけることはできない。
上記の既存技術の解析から、既存の技術ではオンライン取引プラットフォーム上での検索を実現する際にユーザのニーズに完全に一致することはできないため、ユーザは、ユーザの関心を引く結果が返らない場合、引き続き検索を行うには質問語を変更する必要がある。これにより、ユーザと関連付けられたサーバとの間のインタラクション数が増加することになる。サーバ側においては、質問語を一致させるプロセス、ひいてはサーバの負荷が増加することから、オンライン取引プラットフォームのサーバの動作速度およびパフォーマンスがさらに影響を受けることになる。
つまり、当業者によって解決する必要がある緊急の技術的な問題とは、ユーザの求める結果を探すことができないためにオンライン取引プラットフォームのサーバの動作速度およびパフォーマンスが影響を受けるという既存の技術の技術的な問題を解決するために、オンライン取引プラットフォームの検索方法をいかに革新的に発展させるかということである。
本開示によって解決されるべき技術的な問題とは、ユーザの求める結果を見つけることができないためにオンライン取引プラットフォームのサーバの動作速度およびパフォーマンスが影響を受けるという既存の技術の技術的な問題を解決するために、オンライン取引プラットフォームの検索方法を提供することである。
本開示は、実施される上述の方法の実装および適用を確実にするために、オンライン取引プラットフォームの検索装置およびサーバをさらに提供する。
上述の問題を解決するために、本開示は、ウェブページデータベースをセットアップする方法を開示する。一実施形態では、当方法は、ウェブページをフェッチする。ウェブページをフェッチする際に、当方法は、ウェブページにおいて参照される製品キーワードを取得するためにウェブページのキーワードを解析してもよい。いくつかの実施形態において、当方法は、さらに、ウェブページに関連する少なくとも1つの製品識別子を取得するために、所定のルールに基づいて製品キーワードを解析してもよい。一実施形態では、当方法は、さらに、ウェブページと、少なくとも1つの製品識別子と、ウェブページと少なくとも1つの製品識別子との間の関係とを所定のデータベースに格納してもよい。
一実施形態では、本開示は、さらに、オンライン取引プラットフォームの検索方法を開示する。一実施形態では、検索方法は、ブラウザから現在送信されている質問語に基づいて、所定のウェブページデータベースから、質問語に一致する最初のウェブページを取得してもよい。所定のデータベースは、ウェブページと、それぞれのウェブページにおいて参照される少なくとも1つの製品識別子と、製品識別子とそれぞれのウェブページとの間の関係とを格納するように構成されてもよい。最初のウェブページの取得に応答して、検索方法は、所定の基準を満たす関連するウェブページを取得するために、最初のウェブページの関連性処理をさらに実行してもよい。加えて、検索方法は、関連するウェブページにおいて参照される製品識別子に対応する少なくとも1つの製品について関連性処理を実行してもよい。少なくとも1つの製品の関連性処理の実行に応答して、検索方法は、それぞれの関連性スコアに従ってクライアントへ関連性処理が行われた少なくとも1つの製品を表示してもよい。
いくつかの実施形態において、本開示は、オンライン取引プラットフォームの検索装置をさらに開示する。検索装置は、最初のウェブページ検索モジュールを含んでもよい。質問語に基づいて、最初のウェブページ検索モジュールは、所定のデータベースから質問語に一致する最初のウェブページを取得する。所定のデータベースは、ウェブページと、ウェブページに含まれる少なくとも1つの製品識別子と、ウェブページとそれぞれの製品識別子との間の関係とを格納するように構成される。
検索装置は、さらに、所定の基準を満たす関連するウェブページを取得するために、最初のウェブページについて関連性処理を実行するように構成される関連するウェブページ獲得モジュールを含んでもよい。さらに、検索装置は、製品関連性処理モジュールを含んでもよい。一実施形態では、製品関連性処理モジュールは、関連するウェブページにおいて参照される製品識別子に対応する少なくとも1つの製品について関連性処理を実行するように構成されてもよい。いくつかの実施形態において、検索装置は、それぞれの関連性スコアに従ってクライアントへ関連性処理が行われた少なくとも1つの製品を表示するように構成される表示順序付けモジュールをさらに含んでもよい。
既存の技術と比較して、本開示は、以下の例示的な利点を含んでもよい。
本開示において、ウェブページ内に表示される製品情報は、事前にウェブページに関連付けられる。したがって、オンライン取引プラットフォーム上でユーザによって入力されるキーワードに基づいて検索が実行される場合に、製品のウェブ情報が考慮される。具体的には、フォーラムまたはウェブページがある製品について述べている限り、製品とウェブページとの間のこの関係に基づいて、製品検索中に関連する製品を見つけることができる。これは、ユーザによって入力された質問語が具体的な製品名または製品属性を含まない場合に、検索が製品を返さないというシナリオを回避し、一方で、製品のウェブページ情報が、質問語に関する情報を含むため、それにより、ユーザ検索の効率は向上する。本開示により、ユーザは関連する製品について繰り返し検索する必要がないことから、ユーザと検索エンジンサーバとの間のインタラクション数は減少する。これにより、検索エンジンサーバ内の重複動作数が減少するため、検索エンジンサーバの動作速度、作業効率および作業パフォーマンスは向上する。当然ながら、本開示を実装するいずれの製品も、上記の利点の全てを一度に実現する必要はない。
本開示の例示的な実施形態の技術的なスキームをより明確に理解するために、例示的な実施形態の記述のために必要な添付の図面を以下に簡潔に導入する。当然ながら、以下の図面は、本開示のいくつかの例示的な実施形態を構成するにすぎない。当業者は、これらの添付の図面に基づき、創造的な努力なしに他の図を得ることができる。
本開示の第1の例示的な実施形態に従う、所定のデータベースのセットアップのフローチャートを示す。 本開示の第1の例示的な実施形態に従う、オンライン取引プラットフォームの検索方法のフローチャートを示す。 本開示の第2の例示的な実施形態に従う、オンライン取引プラットフォームの検索方法のフローチャートを示す。 本開示の第2の例示的な実施形態に従う、検索結果の表示の概略図を示す。 本開示の第3の例示的な実施形態に従う、オンライン取引プラットフォームの検索装置の構造図を示す。 本開示の第4の例示的な実施形態に従う、オンライン取引プラットフォームの検索装置の構造図を示す。 図5および図6に記載される例示的な検索装置をより詳細に示す。
本開示の例示的な実施形態における技術的なスキームが、例示的な実施形態の添付の図面を用いて、以下に明確かつ完全に記載される。当然ながら、本明細書に記載される例示的な実施形態は、本開示の例示的な実施形態の一部のみを構成するものであり、その全てを構成するものではない。本開示の例示的な実施形態に基づき、当業者は、本開示の範囲内である全ての他の例示的な実施形態を取得することができる。
開示された方法およびシステムは、普遍的または専門的なコンピュータシステムの環境または構成で使用されてもよい。例として、パーソナルコンピュータ、サーバコンピュータ、ハンドヘルドデバイスまたはポータブルデバイス、タブレットデバイス、マルチプロセッサシステム、および上記のいずれかのシステムまたはデバイスを含む分散コンピューティング環境を含む。
開示された方法およびシステムは、コンピュータで実行可能な命令の一般的なコンテクスト、例えばプログラムモジュールにおいて、説明することができる。概して、プログラムモジュールは、特定の機能を実行するまたは特定の抽象データタイプを実装するルーチン、プログラム、オブジェクト、コンポーネント、データ構造等を含むことができる。開示された方法およびシステムは、通信ネットワークを介してリンクされるリモート処理デバイスによって機能が実行される分散コンピューティング環境で実施することもできる。分散コンピューティング環境では、プログラムモジュールは、メモリ格納デバイスを含むローカルおよび/またはリモートコンピュータ格納媒体に配置されてもよい。
本開示の例示的な実施形態では、ウェブクローラによってフェッチされるウェブページが事前処理される。例えば、フェッチされたウェブページについて、ウェブページのコンテンツにおいて主に参照されるある数の具体的な製品が認識される。これらの製品の製品識別子は、ウェブページに関連してもよいまたは関連付けられてもよい。これらの関係、さらに、関係に含まれるウェブページおよび製品識別子は、ウェブページデータベースによる将来の関係の実施のために、事前にセットアップされているウェブページデータベースに格納されてもよい。上述の事前処理のプロセスは、オフラインで実行されてもよい。具体的には、ウェブページがウェブページデータベースを構築するためにクローラによってフェッチされる限り、同じ事前処理のプロセスを実行してもよい。ブラウザから送信されている質問語の受信に応答して、検索エンジンサーバは、質問語に基づいて、事前設定されたデータベースから質問語に一致する最初のウェブページを見つけてもよい。検索エンジンサーバは、所定の基準を満たす関連するウェブページを取得するために、見つかった最初のウェブページについて関連性処理を実行してもよく、関連するウェブページにおいて参照される製品識別子に対応する少なくとも1つの製品について関連性処理を実行してもよい。さらに、検索エンジンサーバは、それぞれの関連性スコアに従って関連性処理が実行されている少なくとも1つの製品の順序付けをしてもよく、製品の価格または販売量等の情報の表示等、複数の順序付けされた製品をクライアントに表示してもよい。
以上のように、本開示の実施形態を使用して検索から最終的に取得される製品は、ユーザによって入力される質問語に関連するだけでなく、製品があるウェブページにおいて参照されるかどうかにも関連する。本明細書に記載される技術は、ユーザが記述的な質問語を入力し、質問語上に直接基づく関連する結果を見つけることができないというシナリオを回避することができる。例えば、「女性に適した携帯電話」の質問語について、「女性に適した携帯電話」を記載するコンテンツがあるフォーラムまたはウェブページに表示される場合、および「Philips588」を含む女性に適したいくつかの携帯電話がコンテンツ内で参照される場合、データベースは、ウェブページと「Philips588」との間の関係を格納する。検索エンジンサーバが将来的に女性に適した携帯電話を検索する場合、「Phillips588」の製品販売に関するウェブページが表示される。この製品情報が表示されると、ユーザは関連する製品について繰り返し検索を行う必要がない。したがって、これにより、ユーザと検索エンジンサーバとの間のインタラクション数が減少し、検索エンジンサーバ内の重複する動作数が減少し、検索エンジンサーバの動作速度、作業効率性および作業パフォーマンスが増加する。
図1は、ウェブページデータベースをセットアップする例示的な方法のフローチャートを示す。
101において、方法は、ウェブページをフェッチする。
本明細書のウェブページは、クローラサーバによってフェッチされたウェブページを参照する。クローラサーバはトリガ条件を必要とせず、一度開始すると、ウェブページのフェッチを継続する。
102において、方法は、ウェブページにおいて参照される製品キーワードを取得するためにウェブページのキーワードを解析する。
クローラがインターネットからウェブページをフェッチする場合、フェッチされたウェブページが解析される。具体的には、ウェブページコンテンツに表示される製品キーワードを発見するためにウェブページ内のコンテンツが抽出される。例えば、「女性に適した携帯電話」を記載するポストがあるフォーラムに表示される場合、この現行のブロックは、ユーザが記載した結果から、女性に適した携帯電話を取得する。
実際の応用において、ブロック102の詳細は、以下のアプローチによって実装されてもよい。
まず、ウェブページのテキストのコンテンツが抽出される。
クローラサーバによってフェッチされたウェブページは、テキストの情報を含むだけでなく、イメージまたはビデオ広告等の他の情報を含んでもよい。したがって、現行のブロックは、まず、ウェブページのテキストのコンテンツ、例えばフォーラム内のある製品の記載についての情報を抽出する。
第2に、ウェブページの関連するキーワードを取得するためにテキストのコンテンツが解析される。
テキストのコンテンツを構文解析するために言語パーサーを使用してもよい。言語パーサーによって取得される種々のキーワードは、ウェブページの関連するキーワードとしてレンダリングされる。当然ながら、ウェブページのテキストのコンテンツを構文解析するために、このブロックは他のツールを使用してもよく、構文解析の方法が本開示の実装に影響することはない。
製品に関連する第3の製品キーワードは、関連するキーワードから取得される。
製品に関連する製品キーワードを見つけるために、テキストのコンテンツから取得される全ての関連するキーワードが解析される。例えば、ブロックA2において取得される関連するキーワードが「〜の」、「そのため」、「Nokia5530」、「Lenovoグループ」等を含む場合、この現行のブロックは、「Nokia5530」および「Lenovoグループ」を製品キーワードとして取得してもよい。
103において、当方法は、ウェブページに関連する少なくとも1つの製品識別子を取得するために、所定のルールに基づいて製品キーワードを解析する。
具体的には、実際の応用において、ブロック103は、ウェブページに関連する少なくとも1つの製品識別子を取得するために、以下のアプローチを使用してもよい。
第1に、出現確率が所与の閾値よりも大きい候補キーワードが、製品キーワードから決定または取得される。
この段階において、ウェブページに複数の製品キーワードが表示されてもよい。例えば、それぞれの出現確率が10、5および1である、「Nokia5530」、「Lenovoグループ」および「Samsung」等の製品キーワードが同時に表示されてもよい。所定の閾値が2である場合、このブロックは、「Nokia5530」および「Lenovoグループ」を候補キーワードとして選択する。
第2に、候補キーワードがウェブページのテキストのコンテンツに関連するかどうかが決定される。
この段階において、現行のウェブページが携帯電話のパフォーマンスを記載するポストである場合、2つの候補キーワード「Nokia5530」および「Lenovoグループ」は共に携帯電話に関連するため、ブロックB1において取得される候補キーワードは、ウェブページに関連するこれらの製品識別子である。しかしながら、携帯電話のパフォーマンスに明確に関連するわけではない「Proctor&Gamble」の候補キーワードが表示される場合、「Proctor&Gamble」は、ウェブページに関連する製品識別子としてレンダリングされない。
104において、当方法は、ウェブページと、少なくとも1つの製品識別子と、ウェブページと製品識別子との間の関係とを、事前設定されたデータベースに格納する。質問語に基づいてデータベースを検索し、質問語に一致するウェブページを見つけると、一致されたウェブページと製品識別子との間の関係に基づいて製品識別子が出力される。
この段階において、取得された製品に基づいて、対応する製品識別子が、製品が表示されるウェブページに関連する。本明細書における関係は、ある関係、その後、ウェブページおよび対応する製品識別子として理解することができる。ウェブページの取得の際に製品識別子が取得されてもよい。
ウェブページに複数の製品が表示される場合、ウェブページにおけるそれぞれの出現数およびそれぞれの製品の出現位置等の情報に基づいて、製品およびウェブページを関連する場合に、重みが設定されてもよい。例えば、ある製品が、ウェブページにおいて最多の出現数を有する、あるいはウェブページのテンプレートの比較的重要なプレートに表示される場合、その製品の製品識別子とウェブページとの間の関係についてより大きな重みが設定されてもよい。したがって、ウェブページは、複数の製品に関連してもよく、これらの複数の製品は、それぞれの重み付けされた関係に従って、順序付けされてもよい。
ウェブページを製品に関連させる際に、ウェブページと少なくとも1つの製品識別子との間の関係を、データベースに格納してもよい。格納する際に、ウェブページの関連するコンテンツおよび製品情報を、将来の実施におけるウェブページコンテンツおよび価格および販売量等の製品情報の取り出しに役立つように、データベースにさらに格納してもよい。
図2は、本開示の第1の例示的な実施形態に従う、オンライン取引プラットフォームの例示的な検索方法のフローチャートを示す。
201において、ブラウザから現在送信されている質問語に基づいて、当方法は、事前設定されたデータベースから質問語に一致する最初のウェブページを取得する。事前設定されたデータベースは、ウェブページと、本明細書において参照されたそれぞれの少なくとも1つの製品識別子と、ウェブページとそれぞれの製品識別子との間の関係とを格納するように構成される。
この例示的な実施形態では、ユーザがオンライン取引プラットフォームによって提供される入力ボックス内に質問語を入力した後、関連付けられたブラウザが、質問語をバックエンド検索エンジンシステムに送信する。検索エンジンシステムは、事前設定されたデータベースから質問語に一致する最初のウェブページを見つける。ここで、既存の技術を使用してキーワードとウェブページとの間の関係のマッピングが実装されてもよい。具体的には、ウェブページおよびキーワードの既存の一致の技術が、この現行のブロックにおいて質問語に基づいて最初のウェブページの検索を実装するために使用される。
ここで、事前設定されたデータベースに格納されるウェブページにおいて参照されるウェブページおよびそれぞれの少なくとも1つの製品識別子は、本開示によって解決される技術的な問題を解決するための鍵である。ここで、製品の識別子(pid)は、製品に対応する一意の数字のIDである。
202において、当方法は、所定の基準を満たす関連するウェブページを取得するために、最初のウェブページの関連性処理を実行する。
このブロックにおいて、事前設定されたデータベースから取得された最初のウェブページについて関連性処理を実行する必要がある。ここで、ユーザのニーズを満たす関連するウェブページを見つけるために、関連性スコア付けの2つのプロセスを実行してもよい。例えば、BM25アルゴリズムは、第1の関連性スコア付けとして最初のウェブページに使用されてもよく、最初のウェブページは、それぞれのスコアの降順で順序付けられる。第1の関連性スコア付けの目的は、第2の関連性スコア付けのためのシステム動作量を低減させること、および第2の関連性スコア付けのためのより少ないならびにより多い(質問語に)関連するウェブページを選択することである。
第2の関連性スコア付けが行われる前に、第2の関連性スコア付けのためのシステム動作量を低減するために、順序付けされた最初のウェブページから取得されるいくつかの上位の最初のウェブページについて、第2の関連性スコア付けを実行してもよい。ここで、実際のニーズにより、取得される最初のウェブページ数は1000または800等のように異なっていてもよい。いくつかの上位の最初のウェブページの取得の際に、比較的高い第1のレベル関連性スコアを有するこれらの最初のウェブページについて、第2の関連性スコア付けを実行してもよい。関連するウェブページを取得するために、より複雑かつ高度な論理を有するアプローチを使用してもよい。例示のためであり、制限するものではないが、スコア付けルールは、キーワードを訳に立たない情報としてレンダリングし、このキーワードが繰り返しおよび継続的に表示される場合に、このキーワードが配置されるウェブページのスコアを所定の値だけ差し引くことを含んでもよい。
加えて、または代替として、スコア付けルールは、キーワードのカテゴリとウェブページに関連する製品識別子のカテゴリとの間の一致の度合いをフィルタし、例えば、キーワード内に記述されるブランドがウェブページに関連する製品識別子のブランドと一致しない場合に、キーワードが配置されるウェブページのスコアを所定の値だけ差し引くことを含んでもよい。加えて、または代替として、スコア付けルールは、キーワード内に記述されるモデル数がウェブページに関連する製品識別子のモデル数と一致しない場合に、キーワードが配置されるウェブページのスコアを所定の値だけ差し引くことを含んでもよい。
203において、当方法は、関連するウェブページにおいて参照されるそれぞれの製品識別子と対応する少なくとも1つの製品について関連性処理を実行する。
複数の関連するウェブページが存在し得るため、各関連するウェブページにおいて参照される製品識別子をスコア付けする必要がある。具体的には、異なる関連するウェブページにおいて参照される製品は同じであってもよいため、同じである最も大きく重みづけされた製品識別子を有するウェブページが、このブロックを実行する際に共に収集される。具体的には、それぞれの関連するウェブページにおいて最大の重みを有する製品識別子について比較され、同じ製品識別子を有する関連するウェブページが、その製品識別子のウェブページグループになる1つのグループに共に収集される。そのグループは、同じ製品識別子を有する複数の異なる関連するウェブページを含む。
種々のウェブページグループを取得する際に、製品識別子のこれらのグループのそれぞれ内の関連するウェブページがスコア付けされる。スコア付けプロセス中に、製品識別子は、その製品識別子と、それぞれのウェブページの第2の関連性スコアと、その製品識別子のある属性(価格および開始時間等)と、製品と質問語との間の関連性によって収集されたウェブページ数等のファクタとに基づいてスコア付けされてもよい。現行のブロックを実行する場合、このプロセスの実装の詳細に、例えば、取得された第2の関連性スコアの合計と、その結果から高い関連性スコアを有するいくつかの製品の選択と、これらの製品の価格に従うウェブページの構成と、構成の順序に従う参照された製品識別子のスコア付けとを含んでもよい。
このブロックにおいて、ウェブページグループは複数のウェブページを収集するため、そのウェブページグループの種々のウェブページに関連付けられた製品識別子スコアは同じである。これらの製品識別子スコアは、それぞれの関連するウェブページの属性としてレンダリングされてもよく、それぞれの関連するウェブページに格納されてもよい。
204において、当方法は、それぞれの関連性スコアに従い、クライアントに対して関連性処理が行われた少なくとも1つの製品を表示する。
製品識別子のスコア付けの際に、各ウェブページにおいて参照される製品を、それぞれの製品識別子スコアの降順で構成してもよい。ある数の上位の製品の情報がクライアントに表示されてもよい。このため、製品の表示された情報は、その製品に関する情報がウェブページにおいて参照されるかどうかに関連する。これは、したがって、あるオンラインセラーがあるキーワードをそれぞれの製品に関連させるためにオンライン広告を使用するというシナリオを回避し、ユーザによって入力された質問語の記述的な性質のために、関連する結果が見つからないというシナリオを回避する。この例示的な実施形態は製品を表示するプロセス中に製品のウェブページ情報を考慮し、したがって、製品のウェブページ情報が関連するキーワード情報を所有する一方で、ユーザによって入力された質問語が製品の特定の名前または属性を含まない場合に製品が見つからないという状態について、ユーザ検索効率を向上させる。例示的な本実施形態により、ユーザは、関連する製品について繰り返し検索する必要がなく、ユーザと検索エンジンサーバとの間のインタラクション数が減少し、検索エンジンサーバのいくつかの重複する動作、検索エンジンサーバの動作速度、作業効率および作業パフォーマンスが向上する。
図3は、本開示の第2の例示的な実施形態に従うオンライン取引プラットフォームの検索方法のフローチャートを示す。
301において、現在送信されているブラウザからの質問語に基づいて、当方法は、事前設定されたデータベースから質問語に一致する最初のウェブページを見つける。事前設定されたデータベースは、ウェブページと、ウェブページにおいて参照される少なくとも1つの製品識別子と、ウェブページとそれぞれの製品識別子との関係とを格納するように構成される。
この例示的な実施形態では、言語パーサー、品詞(part-of-speech)タグ付けツール等の既存のツールは、この実施形態の実装のコストを低減するために、ブラウザから送信されている質問語からキーワードを取得するために使用されてもよい。
このブロックは、上記の実施形態において詳細に記載されているため、本明細書では重ねて記載しない。事前設定されたデータベースのセットアップのプロセスにおいて、いくつかのウェブページは、「女性に適した携帯電話」という記載を有し、ウェブページとある製品識別子(例えば「Philips588」)との間に対応する関係が確立されてもよい。「女性に適した携帯電話」が表示されるウェブページ、およびウェブページと「Philips588」等の特定の製品との間の関係が、データベースに格納される。このため、「女性に適した携帯電話」の質問語について、ブラウザから送信されている質問語を受信する際に、かかるキーワードの記載を有する種々のウェブページが見つかり得る。
302において、当方法は、最初のウェブページについて第1の関連性スコア付けを実行するために所定のアルゴリズムを採用する。第1の関連性スコア付けのスコアは、最初のウェブページ内の指定された製品キーワードの第1のパラメータと比例するが、その第2のパラメータとは反比例する。第1のパラメータはこの最初のウェブページ内の出現確率に相当する。第2のパラメータはウェブページデータベース内の全てのウェブページにおける出現確率に相当する。
このブロックにおいて、BM25等の既存の技術におけるいくつかの関連性アルゴリズムを使用してもよい。このブロックは、全ての最初のウェブページについて関連性スコア付けを実行するために、既存の技術における関連性アルゴリズムのうちのいずれか1つを採用する。このため、各最初のウェブページは、対応する関連性スコアを有する。順序付けは、それぞれの関連性スコアの降順で、最初のウェブページについて実行されてもよい。
例としてBM25を使用する。BM25アルゴリズムに従ってウェブページを処理する際に、各ウェブページによって取得されたスコアは2つのパラメータに関連する。第1のパラメータは、ウェブページ内の指定された製品キーワードの出現確率である。第2のパラメータは、ウェブページデータベース内の全てのウェブページにおける出現確率である。第1のパラメータに関連付けられた確率が大きくなるほど、対応するウェブページの第1の関連性スコアは大きくなる。さらに、第2のパラメータに関連付けられた確率が低くなるほど、対応するウェブページの第1の関連性スコアは高くなる。例えば、「〜の」というキーワードは法助詞(modal particle)であるため、ウェブページ内の対応する出現確率は非常に高い。しかしながら、全てのウェブページ内のその出現確率も高い、つまり、比較的多数のウェブページはその出現確率が比較的高く、対応する第1の関連性スコアは比較的低い。この例示的な実施形態では、第1のパラメータおよび第2のパラメータとは別の第1の関連性スコアの指定された値の割合を、実際の応用のニーズに基づいて修正してもよい。
303において、当方法は、所定の閾値に基づいて第1の関連性スコア付けが行われた最初のウェブページからいくつかの上位スコア付けされたウェブページを取得し、さらに、ウェブページ内の製品キーワードの出現確率と、ウェブページ内に同時に出現する質問語の隣接するキーワードの間の距離と、質問語内の隣接するキーワードが所定のウィンドウ内のウェブページに同時に出現するかどうかとに基づいて、関連するウェブページを取得するために、これらの上位スコア付けされたウェブページについて第2の関連性スコア付けを実行する。
このブロックにおいて、最初のウェブページの順序付けの際に、所定の閾値に基づいていくつかの上位のウェブページが取得されてもよい。例えば、最初の1000の最初のウェブページのみが取得される。これらの1000の最初のウェブページの関連性スコアは、残りの最初のウェブページのものよりも高い。ここで、これらの1000の最初のウェブページの第2の関連性スコアを取得するために、これらの取得されたウェブページについて第2の関連性スコア付けを実行する必要がある。
このブロックにおいて、質問語が「祝日休日に出かける場所」である場合、この質問語の隣接するキーワードは「祝日」および「休日」であり得る。したがって、「祝日」および「休日」が「祝日休日」の形態でウェブページに表示される場合、ウェブページに表示される質問語のこれらの隣接するキーワードの間の距離は最短である。このため、このウェブページの第2の関連性スコア付けのスコアは比較的高い。さらに、「祝日」および「休日」が同時であるが「祝日休日」の形態で表示される場合、およびそのウェブページ内の所定のウィンドウのサイズが20である場合、質問語内の隣接するキーワードは、「祝日休日」のサイズが20未満である限り、ウェブページの所定のウィンドウ内に同時に表示されるものと考えられる。それに応じて、そのウェブページの第2の関連性スコア付けのスコアも比較的高い。
実際の応用には種々の状況が存在し得ることに留意されたい。したがって、当業者は、種々のニーズに従い、これらの3つのパラメータ以外の他のパラメータの設定を追加してもよい。これは、この開示の実施に影響するものではない。
304において、当方法は、それぞれ同じ製品識別子を有する複数のウェブページグループを取得するために、共に同じ製品識別子を有する関連するウェブページをグループ化する。
取得されている生成された1000の最初のウェブページについて、種々の最初のウェブページにおいて参照される製品識別子を比較してもよい。1つの製品識別子のみが参照されている最初のウェブページについて、その製品識別子のみを比較する必要がある。複数の製品識別子が参照されている最初のウェブページについて、出現数および製品識別子の出現の位置情報に基づいて、最大の重みを有する製品識別子を、比較のために選択してもよい。最後に、それぞれ同じ製品識別子を有する複数のウェブページを生成するために、同じ製品識別子を有するウェブページがウェブページグループにグループ化される。
305において、当方法は、それぞれのウェブページ数と、それぞれのウェブページの関連性スコアと、対応する製品属性とに基づいて、各グループ内の製品識別子に対応する製品について、関連性スコア付けを実行する。
このブロックにおいて、同じ製品識別子を有する各ウェブページグループにおいて参照される製品について関連性スコア付けを実行する必要がある。ここで、関連性処理を実行する場合、各ウェブページグループにおいて参照される製品は、それぞれのウェブページグループ内のウェブページ数と、それぞれのウェブページグループ内のウェブページの第2の関連性スコアと、製品自体の属性(例えば価格情報、販売量の情報等)と、製品とユーザによって入力された質問語との間の関連性スコアとに基づいてスコア付けされてもよい。本明細書に記載されるこれらのファクタのそれぞれの重みは、ユーザのニーズまたはネットワーク動作等の状況の考えられる差異のために、実際の応用のシナリオにおいては、関連性スコア付けのプロセス中において完全に同じでなくてもよいことに留意されたい。
上述のブロックは、ウェブページにおいて参照される製品の取得によって、全ての「女性に適した携帯電話」を見つけることに対応する。
306において、当方法は、それぞれのウェブページグループ内のウェブページ属性としてスコア付けの結果を格納する。
このブロックにおいて、ブロック305において関連性スコア付けを実行する際の製品スコアは、それぞれのウェブページグループのウェブページ属性として格納されてもよい。当然ながら、格納は、代替として実際の応用において実行されなくてもよい。ウェブページにおいて参照される製品の関連性スコアを格納するかどうかは、例示的な本実施形態に影響しない。このブロックは、この例示的な実施形態を実装する本質的なプロセスではない。
307において、当方法は、再順序付けされたウェブページを取得するために、製品のスコア付け結果に従ってウェブページを再順序付けする。
ブロック305において製品の関連性スコア付けを実行する際に、各ウェブページグループ内のウェブページは、それぞれのスコア付け結果の降順で再順序付けされる。
308において、順序付けの際に、当方法は、それぞれの製品の検索結果として、同じ製品識別子のそれぞれのウェブページグループ内に所定の数の上位のウェブページを設定する。
同じ製品識別子を有するウェブページグループについて、順序付けの際に、製品の検索結果として、所定の数の上位のウェブページが設定されてもよい。ユーザが関連するキーワードを検索する場合、キーワードを使用して、関連するウェブページが続いて見つかってもよい。関連するウェブページとそれぞれの製品との間の関係に基づいて、対応する製品が見つかってもよい。
309において、当方法は、クライアントに対し、検索結果をブラウザに表示する。
このブロックでは、見つかった製品の対応する情報がクライアントに表示される。実際の適用において、例えば、キーワードが「女性に適した携帯電話」である場合、検索結果内の製品は、図4に示されるように表示されてもよい。
説明のために、一連のアクションとして上記に記載される種々の実施形態が表示されている。当業者は、本開示は上記のアクションの順序によって解釈されるのではないことを理解すべきである。本開示に基づいて、異なる順序または平行にあるブロックが実行されてもよい。さらに、当業者は、本明細書に記載される例示的な実施形態は例示的な実施形態にすぎないことを理解すべきである。本明細書に伴うアクションおよびモジュールは、本開示にとって本質的ではなくてもよい。
オンライン取引プラットフォームの第1の例示的な検索方法に相当して、本開示は、図5に示されるように、第3の例示的な実施形態に従うオンライン取引プラットフォームの検索装置をさらに提供する。装置は、最初のウェブページ検索モジュール501を含んでもよい。ブラウザから現在送信されている質問語に基づいて、最初のウェブページ検索モジュール501は、所定のデータベースから質問語に一致する最初のウェブページを取得するように構成される。所定のデータベースは、ウェブページと、ウェブページに含まれる少なくとも1つの製品識別子と、ウェブページとそれぞれの製品識別子との間の関係とを格納する。一実施形態では、検索装置は、所定の基準を満たす関連するウェブページを取得するために、最初のウェブページについて関連性処理を実行するように構成される、関連するウェブページ獲得モジュール502をさらに含んでもよい。加えて、検索装置は、製品関連性処理モジュール503を含んでもよい。製品関連性処理モジュール503は、関連するウェブページにおいて参照される製品識別子に対応する少なくとも1つの製品について関連性処理を実行する。いくつかの実施形態において、検索装置は、それぞれの関連性スコアに従ってクライアントに対して関連性処理が行われた少なくとも1つの製品を表示するように構成される表示モジュール504をさらに含んでもよい。
本例示的な装置は、オンライン取引プラットフォームの検索エンジンサーバに統合されてもよい、または検索エンジンサーバと通信する個々の要素として別々であってもよい。さらに、ソフトウェアに実装される場合、開示された方法は、検索エンジンのサーバ、または個々の記述されたプログラムの新しい機能としてレンダリングされてもよいことに留意されたい。本開示は、開示された方法または装置の実装における制限を有するものではない。
この例示的な実施形態では、ユーザによって入力される質問語に基づいて製品を検索する場合に、その製品がウェブページに表示される状況、例えばBaiduウェブサイトにおいて具体的に記載される質問語に関連する製品等が考慮されてもよい。このため、製品の検索の際に、製品とウェブページとの間の関係に基づいて関連する製品が見つかってもよい。したがって、ユーザが本質的に記述的な質問語を入力しても、対応する記述を満たす製品を見つけることができるため、ユーザ検索効率が向上する。製品検索に本実施形態を使用して、通常の条件でユーザの求める製品を見つけることができる。さらに、ユーザは関連する製品の検索を繰り返し行う必要はないため、ユーザと検索エンジンサーバとの間のインタラクション数が減少する。これにより、検索エンジンサーバ内の重複する動作数が減少し、したがって検索エンジンサーバの動作速度、作業効率および作業パフォーマンスが向上する。
オンライン取引プラットフォームの第2の例示的な検索方法に相当して、本開示は、図6に示されるように、第4の例示的な実施形態に従うオンライン取引プラットフォームの検索装置をさらに提供する。装置は、最初のウェブページ検索モジュール501を含んでもよい。ブラウザから現在送信されている質問語に基づいて、最初のウェブページ検索モジュール501は、ウェブページと、ウェブページに含まれる少なくとも1つの製品識別子と、ウェブページとそれぞれの製品識別子との間の関係とを格納するように構成される所定のデータベースから質問語に一致する最初のウェブページを取得してもよい。加えて、検索装置は、第1の関連性処理サブモジュール601を含んでもよい。第1の関連性処理サブモジュール601は、所定のアルゴリズムを使用して、最初のウェブページの第1の関連性スコア付けを実行する。一実施形態では、第1の関連性スコア付けのスコアは、最初のウェブページ内の指定された製品キーワードに関連付けられた第1のパラメータと比例してもよい。加えて、または代替として、第1の関連性スコア付けのスコアは、例えば、最初のウェブページ内の製品キーワードに関連付けられた第2のパラメータと反比例してもよい。一実施形態では、第1のパラメータは、ウェブページ内の出現確率に対応する。第2のパラメータは、ウェブページデータベース内の全てのウェブページ内の出現確率に対応してもよい。
いくつかの実施形態において、検索装置は、第2の関連性処理サブモジュール602をさらに含んでもよい。第2の関連性処理サブモジュール602は、所定の閾値に基づいて第1の関連性スコア付けが行われた最初のウェブページから、比較的高いスコアを有するいくつかの上位のウェブページを取得してもよい。加えて、第2の関連性処理サブモジュール602は、1つ以上のファクタに基づいて関連するウェブページを取得するために、いくつかの上位のウェブページの第2の関連性スコア付けを実行してもよい。1つ以上のファクタは、ウェブページ内の製品キーワードの出現確率と、ウェブページ内に同時に出現する質問語の隣接するキーワードの間の距離と、質問語内の隣接するキーワードが所定のウィンドウ内のウェブページに同時に出現するかどうかとを含んでもよいが、これらには制限されない。
さらに、検索装置は、グループ化サブモジュール603を含んでもよい。グループ化サブモジュール603は、それぞれ同じ製品識別子を有する複数のウェブページグループを取得するために、共に同じ製品識別子を有する関連するウェブページをグループ化するように構成されてもよい。加えて、または代替として、検索装置は、各ウェブページグループ内の製品識別子に対応する製品について関連性スコア付けを実行するように構成される製品関連性処理サブモジュール604をさらに含んでもよい。製品関連性処理サブモジュール604は、例えば、それぞれのウェブページ数と、それぞれのウェブページの関連性スコアと、対応する製品属性とに基づいて、関連性スコア付けを実行してもよい。
一実施形態では、検索装置は、格納サブモジュール605をさらに含む。格納サブモジュール605は、それぞれのウェブページグループ内にウェブページ属性のスコア付けの結果を格納する。加えて、または代替として、検索装置は、再順序付けされたウェブページを取得するために、製品のスコア付け結果に従ってウェブページを再順序付けするように構成される再順序付けサブモジュール606を含んでもよい。加えて、または代替として、検索装置は、順序付けの際に、それぞれの製品の検索結果として、同じ製品識別子のそれぞれのウェブページグループ内の所定の数の上位のウェブページを設定する検索結果獲得サブモジュール607を含んでもよい。
上記のオンライン取引プラットフォームの検索方法および検索装置に相当して、本開示は、オンライン取引プラットフォームの例示的な検索エンジンサーバをさらに提供する。この例示的な実施形態では、サーバは、具体的には、上記の例示的な装置内に開示された装置のうちのいずれかの1つを含んでもよい。
種々の例示的な実施形態は本開示において累進的に(progressively)記載されることに留意されたい。各例示的な実施形態の主な点は他の例示的な実施形態とは異なっていてもよく、例示的な実施形態の同じまたは同様の部分が互いに参照されてもよい。これらの例示的な装置は例示的な方法のその相当する実施形態と同様であるため、例示的な装置の記載は、比較的単純である。関連する詳細は、例示的な方法の実施形態に記載されている。
最後に、本文書における「第1の」および「第2の」等のいずれの関連用語も、ある要素と別の要素またはある動作と他の動作を区別するためのものにすぎず、これらの要素または動作の間の現実の関係または順序付けの存在を必ずしも要求または示唆するものではないことが指摘されるべきである。さらに、「を含む(include)」、「を有する(have)」、またはいずれかの他の変形等の用語は、非排他的に「を含む(comprising)」を包含することを意図している。したがって、特徴の一群を個々に含むプロセス、方法、物品またはデバイスは、これらの特徴を含むのみではなく、列挙されていない他の特徴も含んでもよい、またはこれらのプロセス、方法、物品あるいはデバイスのいずれの固有の特徴を含んでもよい。さらなる制限なしに、「・・・を含む」というフレーズ内に定義される特徴は、その特徴を含むプロセス、方法、物品またはデバイスが他の同等の特徴を有し得る可能性を排除するものではない。
開示された方法、装置およびサーバは、コンピュータで実行可能な命令、例えばプログラムモジュールの一般的なコンテクストにおいて記載することができる。概して、プログラムモジュールは、特定の機能を実行するまたは特定の抽象データタイプを実装するルーチン、プログラム、オブジェクト、コンポーネント、データ構造等を含むことができる。開示された方法、装置およびサーバは、機能が通信ネットワークによってリンクされるリモート処理デバイスによって実行される分散コンピューティング環境において実施することもできる。分散コンピューティング環境において、プログラムモジュールは、メモリ格納デバイスを含む、ローカルおよび/またはリモートコンピュータ格納媒体に配置されてもよい。
例えば、図7は、より詳細な、上記の装置等の例示的な装置700を示す。一実施形態では、装置700は、1つ以上のプロセッサ701、ネット作業インタフェース702、メモリ703、および入力/出力インタフェース704を含むことができるが、これらに制限されない。
メモリ703は、ランダム‐アクセスメモリ(RAM)等の揮発メモリおよび/または読み込み専用メモリ(ROM)あるいはフラッシュRAM等の非揮発メモリの形態のコンピュータ可読媒体を含んでもよい。メモリ703はコンピュータ可読媒体の一例である。
コンピュータ可読媒体は、コンピュータ可読命令、データ構造、プログラムモジュール、または他のデータ等の情報の格納のためにいずれかの方法または技術において実装される揮発および非揮発、リムーバブルおよび非リムーバブル媒体を含む。コンピュータ格納媒体の例には、相変化メモリ(PRAM)、静的ランダムアクセスメモリ(SRAM)、動的ランダムアクセスメモリ(DRAM)、他の種類のランダムアクセスメモリ(RAM)、読み込み専用メモリ(ROM)、電子消去可能プログラム可能読み込み専用メモリ(EEPROM)、フラッシュメモリまたは他のメモリ技術、コンパクトディスク読み込み専用メモリ(CD−ROM)、デジタル多用途ディスク(DVD)または他の光学的格納、磁気カセット、磁気テープ、磁気ディスク格納または他の磁気格納デバイス、あるいはコンピューティングデバイスによるアクセスのために情報を格納するように使用可能ないずれかの他の非伝送媒体を含むが、これらに制限されない。本明細書中に記載されるように、コンピュータ可読媒体は、変調されたデータ信号および搬送波等の一時的媒体を含まない。
メモリ703は、プログラムモジュール705およびプログラムデータ706を含んでもよい。一実施形態では、プログラムユニット705は、最初のウェブページ検索モジュール707、関連するウェブページ獲得モジュール708、製品関連性処理モジュール709、および表示モジュール710を含んでもよい。加えて、または代替として、いくつかの実施形態において、プログラムモジュール705は、第1の関連性処理サブモジュール711、第2の関連性処理サブモジュール712、グループ化サブモジュール713、製品関連性処理サブモジュール714、格納サブモジュール715、再順序付けサブモジュール716および検索結果獲得サブモジュール717をさらに含んでもよい。これらのプログラムモジュールについての詳細は、上記の前述の実施形態において参照され得る。
オンライン取引プラットフォームの検索方法、装置および検索エンジンサーバを、本開示で詳細に記載した。この開示における本発明の概念および実装を図示するために例示的な実施形態が採用されている。例示的な実施形態は、本発明の方法および中心となる概念のより良い理解のために使用されているにすぎない。この開示の概念に基づいて、当業者は、例示的な実施形態および応用分野を修正してもよい。全体的に、開示された方法、装置およびサーバに対する制限として本開示の内容を解釈すべきではない。

Claims (20)

  1. コンピュータにより実行される、ウェブページデータベースをセットアップする方法であって、
    ウェブページをフェッチすることと、
    前記ウェブページにおいて参照される製品キーワードを取得するために、前記ウェブページのキーワードを解析することと、
    前記ウェブページに関連する少なくとも1つの製品識別子を取得するために、所定のルールに基づいて前記製品キーワードを解析することと、
    前記ウェブページと、前記少なくとも1つの製品識別子と、前記少なくとも1つの製品識別子に関連付けられた販売量の情報と、前記ウェブページおよび前記少なくとも1つの製品識別子の関係とを所定のデータベース内に格納することと
    を含む方法。
  2. 前記ウェブページにおいて参照される前記製品キーワードを取得するために、前記ウェブページの前記キーワードを解析することは、
    前記ウェブページのテキストのコンテンツを抽出することと、
    前記ウェブページの関連するキーワードを取得するために前記テキストのコンテンツを解析することと、
    前記関連するキーワードから製品に関連する前記製品キーワードを取得することと
    を含む、請求項1に記載の方法。
  3. 前記所定のルールに基づいて前記製品キーワードを解析することは、
    前記製品キーワードから所与の閾値よりも大きい出現確率を有する候補キーワードを判定することと、
    前記候補キーワードが前記ウェブページのテキストのコンテンツに関連するかどうかを判定することと
    を含む、請求項1に記載の方法。
  4. 前記所定のデータベース内に、前記ウェブページと前記少なくとも1つの製品識別子との間の関係に関連付けられた重みを格納することをさらに含む、請求項1に記載の方法。
  5. 前記重みは、前記ウェブページ内の前記少なくとも1つの製品識別子に関連付けられた製品の出現数に少なくとも部分的に基づいて判定される、請求項4に記載の方法。
  6. 前記重みは、前記ウェブページ内の前記少なくとも1つの製品識別子に関連付けられた製品の1つ以上の出現位置に少なくとも部分的に基づいて判定される、請求項4に記載の方法。
  7. 前記所定のデータベース内に前記少なくとも1つの製品識別子に関連付けられた製品の情報をさらに格納する、請求項1に記載の方法。
  8. 1つまたは複数のプロセッサと、
    メモリと、
    前記メモリに格納され、前記1つまたは複数のプロセッサにより、
    ウェブページをフェッチすることと、
    前記ウェブページにおいて参照される製品キーワードを取得するために、前記ウェブページのキーワードを解析することと、
    前記ウェブページに関連する少なくとも1つの製品識別子を取得するために、所定のルールに基づいて前記製品キーワードを解析することと、
    前記ウェブページと、前記少なくとも1つの製品識別子と、前記少なくとも1つの製品識別子に関連付けられた販売量の情報と、前記ウェブページおよび前記少なくとも1つの製品識別子の関係とを所定のデータベース内に格納することと
    を実行することが可能な、1つまたは複数のモジュールと
    を備えた装置。
  9. 前記ウェブページにおいて参照される前記製品キーワードを取得するために、前記ウェブページの前記キーワードを解析することは、
    前記ウェブページのテキストのコンテンツを抽出することと、
    前記ウェブページの関連するキーワードを取得するために前記テキストのコンテンツを解析することと、
    前記関連するキーワードから製品に関連する前記製品キーワードを取得することと
    を含む、請求項8に記載の装置。
  10. 前記所定のルールに基づいて前記製品キーワードを解析することは、
    前記製品キーワードから所与の閾値よりも大きい出現確率を有する候補キーワードを判定することと、
    前記候補キーワードが前記ウェブページのテキストのコンテンツに関連するかどうかを判定することと
    を含む、請求項8に記載の装置。
  11. 前記1つまたは複数のモジュールは、前記1つまたは複数のプロセッサにより、前記所定のデータベース内に、前記ウェブページと前記少なくとも1つの製品識別子との間の関係に関連付けられた重みを格納することをさらに実行することができる、請求項8に記載の装置。
  12. 前記重みは、前記ウェブページ内の前記少なくとも1つの製品識別子に関連付けられた製品の出現数に少なくとも部分的に基づいて判定される、請求項11に記載の装置。
  13. 前記重みは、前記ウェブページ内の前記少なくとも1つの製品識別子に関連付けられた製品の1つ以上の出現位置に少なくとも部分的に基づいて判定される、請求項11に記載の装置。
  14. 前記1つまたは複数のモジュールは、前記1つまたは複数のプロセッサにより、前記所定のデータベース内に前記少なくとも1つの製品識別子に関連付けられた製品の情報を格納することをさらに実行することができる、請求項8に記載の装置。
  15. 1つまたは複数のプロセッサにより実行されたときに、前記1つまたは複数のプロセッサに処理を実行させる実行可能命令を記憶する1つまたは複数のコンピュータ可読媒体であって、前記処理が
    ウェブページをフェッチすることと、
    前記ウェブページにおいて参照される製品キーワードを取得するために、前記ウェブページのキーワードを解析することと、
    前記ウェブページに関連する少なくとも1つの製品識別子を取得するために、所定のルールに基づいて前記製品キーワードを解析することと、
    前記ウェブページと、前記少なくとも1つの製品識別子と、前記少なくとも1つの製品識別子に関連付けられた販売量の情報と、前記ウェブページおよび前記少なくとも1つの製品識別子の関係とを所定のデータベース内に格納することと
    を含む、1つまたは複数のコンピュータ可読媒体。
  16. 前記ウェブページにおいて参照される前記製品キーワードを取得するために、前記ウェブページのキーワードを解析することは、
    前記ウェブページのテキストのコンテンツを抽出することと、
    前記ウェブページの関連するキーワードを取得するために前記テキストのコンテンツを解析することと、
    前記関連するキーワードから製品に関連する前記製品キーワードを取得することと
    を含む、請求項15に記載の1つまたは複数のコンピュータ可読媒体。
  17. 前記所定のルールに基づいて前記製品キーワードを解析することは、
    前記製品キーワードから所与の閾値よりも大きい出現確率を有する候補キーワードを判定することと、
    前記候補キーワードが前記ウェブページのテキストのコンテンツに関連するかどうかを判定することと
    を含む、請求項15に記載の1つまたは複数のコンピュータ可読媒体。
  18. 前記処理は、前記所定のデータベース内に、前記ウェブページと前記少なくとも1つの製品識別子との間の関係に関連付けられた重みを格納することをさらに含む、請求項15に記載の1つまたは複数のコンピュータ可読媒体。
  19. 前記重みは、前記ウェブページ内の前記少なくとも1つの製品識別子に関連付けられた製品の出現数および1つ以上の出現位置に基づいて判定される、請求項18に記載の1つまたは複数のコンピュータ可読媒体。
  20. 前記処理は、前記所定のデータベース内に前記少なくとも1つの製品識別子に関連付けられた製品の情報を格納することをさらに含む、請求項15に記載の1つまたは複数のコンピュータ可読媒体。
JP2016082971A 2010-11-01 2016-04-18 オンライン取引プラットフォームのための検索方法、装置およびサーバ Expired - Fee Related JP6346218B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201010529419.8A CN102456057B (zh) 2010-11-01 2010-11-01 基于网上交易平台的检索方法、装置和服务器
CN201010529419.8 2010-11-01

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2013536703A Division JP5923510B2 (ja) 2010-11-01 2011-10-24 オンライン取引プラットフォームのための検索方法、装置およびサーバ

Publications (2)

Publication Number Publication Date
JP2016131045A true JP2016131045A (ja) 2016-07-21
JP6346218B2 JP6346218B2 (ja) 2018-06-20

Family

ID=46024769

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2013536703A Expired - Fee Related JP5923510B2 (ja) 2010-11-01 2011-10-24 オンライン取引プラットフォームのための検索方法、装置およびサーバ
JP2016082971A Expired - Fee Related JP6346218B2 (ja) 2010-11-01 2016-04-18 オンライン取引プラットフォームのための検索方法、装置およびサーバ

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2013536703A Expired - Fee Related JP5923510B2 (ja) 2010-11-01 2011-10-24 オンライン取引プラットフォームのための検索方法、装置およびサーバ

Country Status (7)

Country Link
US (1) US20130290138A1 (ja)
EP (1) EP2635961A4 (ja)
JP (2) JP5923510B2 (ja)
CN (1) CN102456057B (ja)
HK (1) HK1166402A1 (ja)
TW (1) TWI549004B (ja)
WO (1) WO2012061076A1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103839004A (zh) * 2012-11-26 2014-06-04 腾讯科技(深圳)有限公司 检测恶意文件的方法和设备
CN104750692B (zh) * 2013-12-25 2018-05-15 中国移动通信集团公司 一种信息处理方法、信息检索方法及其对应的装置
CN104866483B (zh) * 2014-02-21 2020-02-07 腾讯科技(深圳)有限公司 一种信息检索的方法及装置
CN105005917A (zh) * 2015-07-07 2015-10-28 上海晶赞科技发展有限公司 一种通用的关联不同电商网站单品的方法
US10387568B1 (en) * 2016-09-19 2019-08-20 Amazon Technologies, Inc. Extracting keywords from a document
US20180197223A1 (en) * 2017-01-06 2018-07-12 Dragon-Click Corp. System and method of image-based product identification
CN107301253B (zh) * 2017-08-23 2020-02-04 杭州安恒信息技术股份有限公司 一种提高多站点搜索关键字准确性的方法及装置
JP7421726B2 (ja) 2020-02-27 2024-01-25 Ec認証株式会社 認証システム
US11016980B1 (en) 2020-11-20 2021-05-25 Coupang Corp. Systems and method for generating search terms

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006031108A (ja) * 2004-07-12 2006-02-02 Shinichiro Fujitani ウエブ上の商品・サービスの検索システム
JP2010134651A (ja) * 2008-12-03 2010-06-17 Yahoo Japan Corp 商品idサーバ装置、および商品idサーバ装置の制御方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5920854A (en) * 1996-08-14 1999-07-06 Infoseek Corporation Real-time document collection search engine with phrase indexing
US6484149B1 (en) * 1997-10-10 2002-11-19 Microsoft Corporation Systems and methods for viewing product information, and methods for generating web pages
US6785671B1 (en) * 1999-12-08 2004-08-31 Amazon.Com, Inc. System and method for locating web-based product offerings
US20040138946A1 (en) * 2001-05-04 2004-07-15 Markus Stolze Web page annotation systems
TW556103B (en) * 2001-05-04 2003-10-01 Ibm Web page annotation systems
JP4360167B2 (ja) * 2003-09-30 2009-11-11 ソニー株式会社 キーワード抽出装置、およびキーワード抽出方法、並びにコンピュータ・プログラム
JP4731896B2 (ja) * 2004-12-07 2011-07-27 新日鉄ソリューションズ株式会社 情報処理装置、情報検索方法及びプログラム
US9715542B2 (en) * 2005-08-03 2017-07-25 Search Engine Technologies, Llc Systems for and methods of finding relevant documents by analyzing tags
US8688521B2 (en) * 2007-07-20 2014-04-01 Yahoo! Inc. System and method to facilitate matching of content to advertising information in a network
CN101354706A (zh) * 2007-07-25 2009-01-28 阿里巴巴集团控股有限公司 一种收集网页信息的方法及装置
US8583633B2 (en) * 2007-11-30 2013-11-12 Ebay Inc. Using reputation measures to improve search relevance
US20090210890A1 (en) * 2008-02-15 2009-08-20 Yahoo! Inc. Real-time data collection via hierarchical web page parsing
US20100121790A1 (en) * 2008-11-13 2010-05-13 Dennis Klinkott Method, apparatus and computer program product for categorizing web content
JP5277941B2 (ja) * 2008-12-18 2013-08-28 大日本印刷株式会社 関連商品提示方法、関連商品提示システム、プログラム、記録媒体
JP2010205060A (ja) * 2009-03-04 2010-09-16 Nomura Research Institute Ltd 文書内画像検索方法および文書内画像検索システム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006031108A (ja) * 2004-07-12 2006-02-02 Shinichiro Fujitani ウエブ上の商品・サービスの検索システム
JP2010134651A (ja) * 2008-12-03 2010-06-17 Yahoo Japan Corp 商品idサーバ装置、および商品idサーバ装置の制御方法

Also Published As

Publication number Publication date
WO2012061076A1 (en) 2012-05-10
CN102456057A (zh) 2012-05-16
JP5923510B2 (ja) 2016-05-24
US20130290138A1 (en) 2013-10-31
HK1166402A1 (zh) 2012-10-26
TW201220097A (en) 2012-05-16
EP2635961A1 (en) 2013-09-11
JP6346218B2 (ja) 2018-06-20
TWI549004B (zh) 2016-09-11
JP2014500541A (ja) 2014-01-09
EP2635961A4 (en) 2016-06-01
CN102456057B (zh) 2016-08-17

Similar Documents

Publication Publication Date Title
JP6346218B2 (ja) オンライン取引プラットフォームのための検索方法、装置およびサーバ
JP6480925B2 (ja) 識別されたエンティティーに基づく属性値の取り出し
KR101793222B1 (ko) 어플리케이션 검색들을 가능하게 하기 위해 사용되는 검색 인덱스의 업데이트
JP5721818B2 (ja) 検索におけるモデル情報群の使用
CN103339623B (zh) 涉及因特网搜索的方法和设备
US20150278359A1 (en) Method and apparatus for generating a recommendation page
US20110282855A1 (en) Scoring relationships between objects in information retrieval
RU2696305C2 (ru) Браузинг изображений через интеллектуально проанализированные связанные гиперссылкой фрагменты текста
US10255363B2 (en) Refining search query results
US20140012840A1 (en) Generating search results
CN103136228A (zh) 一种图片搜索方法以及图片搜索装置
US9613131B2 (en) Adjusting search results based on user skill and category information
EP2729886A1 (en) Systems and methods for natural language searching of structured data
US20160117393A1 (en) Combinatorial Business Intelligence
JP7451747B2 (ja) コンテンツを検索する方法、装置、機器及びコンピュータ読み取り可能な記憶媒体
US8799257B1 (en) Searching based on audio and/or visual features of documents
US20130006979A1 (en) Enhancing cluster analysis using document metadata
CN111428100A (zh) 一种数据检索方法、装置、电子设备及计算机可读存储介质
US9152698B1 (en) Substitute term identification based on over-represented terms identification
CN114090877A (zh) 职位信息推荐方法、装置、电子设备及存储介质
CA3051919C (en) Machine learning (ml) based expansion of a data set
WO2016176932A1 (zh) 在信息展示页面上检索关键字的方法
JP5368900B2 (ja) 情報提示装置、情報提示方法およびプログラム
EP3065102A1 (en) Search engine optimization for category web pages
CN117407512A (zh) 问答方法、装置、电子设备以及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160517

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170317

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170404

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170622

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180402

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180424

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180524

R150 Certificate of patent or registration of utility model

Ref document number: 6346218

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees