JP2015518220A - オンライン商品検索方法およびシステム - Google Patents

オンライン商品検索方法およびシステム Download PDF

Info

Publication number
JP2015518220A
JP2015518220A JP2015509221A JP2015509221A JP2015518220A JP 2015518220 A JP2015518220 A JP 2015518220A JP 2015509221 A JP2015509221 A JP 2015509221A JP 2015509221 A JP2015509221 A JP 2015509221A JP 2015518220 A JP2015518220 A JP 2015518220A
Authority
JP
Japan
Prior art keywords
word
product
product word
candidate
key
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015509221A
Other languages
English (en)
Other versions
JP5916947B2 (ja
Inventor
チェン・チャオ
ハン・シャオメイ
ソーン・チャオ
ウェイ・ホゥイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Publication of JP2015518220A publication Critical patent/JP2015518220A/ja
Application granted granted Critical
Publication of JP5916947B2 publication Critical patent/JP5916947B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • G06Q30/0625Directed, with specific intent or strategy
    • G06Q30/0627Directed, with specific intent or strategy using item specifications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions
    • G06F16/3323Query formulation using system suggestions using document space presentation or visualization, e.g. category, hierarchy or range presentation and selection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3325Reformulation based on results of preceding query
    • G06F16/3326Reformulation based on results of preceding query using relevance feedback from the user, e.g. relevance feedback on documents, documents sets, document terms or passages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Abstract

【解決手段】商品検索方法を提供する。この方法は、クエリワード列を受信する工程と、クエリワード列に関連する複数の様々な商品情報エントリを検索する工程(110)と、クエリ列からの第1のコア商品ワードをメモリから抽出する工程(120)と、様々な商品情報エントリからの第2のコア商品ワードをメモリから抽出する工程(130)と、各第2のコア商品ワードに関して、キー商品ワードに関連する候補商品ワードリストに各第2のコア商品ワードが存在するか否かをチェックする工程と(140)と、各第2のコア商品ワードが存在する場合に、各第2のコア商品ワードに対応する商品情報エントリの重み付けを小さくする工程と、商品情報エントリの調整された重み付けに従って商品情報エントリをソートする工程と、を備える。【選択図】図1A

Description

本出願は、あらゆる目的のために参照により本明細書に組み込まれる、発明の名称を、A SEARCH METHOD AND SYSTEM(検索方法およびシステム)とする、2012年5月22日に出願された中国特許出願No.201210160827.Xに基づく優先権を主張する。
本出願は、検索方法およびシステムに関する。
検索処理、特に、商品(製品)に関する検索処理では、様々な組み合わせの商品ワードにより、かつ、ユーザによって入力された特定の商品ワードに応じて、サーチエンジンは、ユーザが入力した商品ワードに関連する商品にそれほど関係がない周辺商品を検索結果として返す場合がある。たとえば、MP3をユーザが入力した場合、MP3に対応する商品ワードの組み合わせは膨大な数にのぼる。たとえば、MP3ダウンロードケーブルやPM3スピーカー等の商品が検索結果として見つかることがありえるが、MP3ダウンロードケーブルやMP3スピーカーはMP3とは異なる商品である。従来の検索は、キー商品ワードマッチング法に基づく検索であるため、ユーザによって入力されたクエリワード列(単語列)に関連する商品との関連性が比較的低い周辺商品を検索結果として返すことが多々起こり得る。たとえば、上述したように、ユーザがクエリワード列としてMP3を入力した場合、サーチエンジンによって行われる検索では、MP3ダウンロードケーブルやMP3スピーカーは、検索結果で非常に高い重み付けとなる。言い換えると、サーチエンジンによって返されるソートされた商品情報エントリのトップ近くに、クエリワード列に対応する商品との相関性が低い多数の商品情報エントリが存在することになる。
上述したようなユーザによって入力されたクエリワード列に関連する商品との相関性が低い周辺商品による妨害を解決するために、2つの技術的方法が知られている。
第1の技術的方法では、カテゴリーを用いて、検索結果に、多数の重要性の低い結果が得られるのを避ける。第1の技術的方法は、一般的に以下の工程を含む。まず、ログ情報に基づいて、ユーザのクエリワード列に対応するカテゴリーのクリック率を表にする。次に、クエリワード列に関連する対応カテゴリーの傾向を求める。関連カテゴリーに属さない商品情報エントリの重み付けを小さくする。言い換えると、返された検索結果に含まれる商品情報エントリの中で関連カテゴリーに関係のない商品情報エントリの重み付けを小さくする。
この方法では、精度に関して大きな問題がある。たとえば、商品情報を配信する売り手による欺まんによって携帯電話のバッテリが携帯電話のカテゴリーに入れられた場合、携帯電話を検索すると、周辺商品(携帯電話のバッテリ)が出現することになる。さらに、あるクエリワード列が複数のカテゴリーに関連する場合、そのクエリワード列に関連するカテゴリーの傾向を分析する際に、そのクエリワード列に関係する特定のカテゴリーのクリック率が非常に低ければ、そのカテゴリーを見過ごす可能性が高くなる。したがって、サーチエンジンにとって、クエリワード列に関係するすべてのカテゴリーを網羅することは難しく、その結果、検索の精度が下がる。
第2の技術的方法では、検索結果をオンラインで手動で再検討する。手動再検討法を用いて、各商品ワードに対応する周辺ワード群を決定する。言い換えると、検索結果に周辺ワードが出現する場合に、この方法は、周辺ワードを含む商品情報エントリが検索結果に出現しないように決定することができる。
この手動再検討法の精度は非常に高いが、再検討を行うために膨大な工数を必要とし、結果として、人件費が高くなる。
本発明の様々な実施形態を、添付の図面と共に以下に詳細に記載する。
検索方法の一実施形態を示すプロセスフロー図。
候補商品ワードリストを設定する方法の一実施形態を示すプロセスフロー図。
様々なコア商品ワードを取得する方法の一実施形態を示すプロセスフロー図。
細かい粒度のセグメンテーションを行う方法の一実施形態を示すプロセスフロー図。
キー商品ワードの相関性を算出する方法の一実施形態を示すプロセスフロー図。
各キー商品ワードのベクトル化及び各候補商品ワードのベクトル化を行う方法の一実施形態を示すプロセスフロー図。
第1のベクトルと第2のベクトルとの間の角度値を算出する方法の一実施形態を示すプロセスフロー図。
各キー商品ワード及び各候補商品ワードのベクトル化を行う方法の一実施形態を示すプロセスフロー図。
キー商品ワードに対応するベクトルと候補商品ワードに対応するベクトルとの間の角度値を算出する方法の一実施形態を示すプロセスフロー図。
検索システムの一実施形態を示す構造概略図。
検索システムの一実施形態を示す概略図。
本発明は、プロセス、装置、システム、組成、コンピュータ読み取り可能な記憶媒体上に実現されるコンピュータプログラム製品、及び/又は、プロセッサに接続される記憶装置上に保存される、及び/又は、プロセッサに接続される記憶装置により提供される命令を実行するように構成されるプロセッサ等のプロセッサを含む、様々な態様で実施可能である。本明細書において、これらの態様又は本発明を実施する他のあらゆる形態を、手法とも称する。一般に、本明細書で開示する処理の各工程の順序は、本発明の要旨の範囲内で変更可能である。他に明記しない限り、あるタスクを実行するように構成されるものとして記載されるプロセッサまたは記憶装置等の構成要素は、任意の時点でそのタスクを実行するように一時的に構成される一般的な構成要素として実現されるものでもよいし、そのタスクを実行するように製造された専用の構成要素として実現されるものでもよい。本明細書において用いられる「プロセッサ」という用語は、コンピュータプログラム命令等のデータを処理するように構成される1つ以上のデバイス、回路及び/又は処理コアを示す。
本発明の1つ又は複数の実施形態の詳細を、本発明の原理を例示する添付の図面と共に、以下に記載する。本発明を実施形態に関連して説明するが、本発明はいかなる実施形態にも限定されるものではない。本発明の範囲は請求項によってのみ限定されるものであり、本発明には、多数の変形例、変更例及びそれらの等価物が包含される。以下、本発明が十分に理解されるように、数多くの具体的な詳細を説明するが、これらの詳細は例示に過ぎず、これらの具体的な詳細の一部または全部を省略した形態でも請求項に従って本発明を実施可能である。理解を容易にするために、本発明に関連する技術分野で周知の技術要素に関しては、本発明を不要に不明確にすることがないように、詳細に説明しない。
本出願は、キー商品ワード及び対応する候補商品ワードリストを事前に設定する。候補商品ワードリストには、候補商品ワードが含まれる。候補商品ワードとキー商品ワードとを組み合わせて得られた合成商品ワードとキー商品ワードとは、同じカテゴリーには属さない。たとえば、「携帯電話」がキー商品に相当し、「バッテリ」又は「充電器」が候補商品に相当する場合、合成商品は「携帯電話バッテリ」又は「携帯電話充電器」になる。したがって、キー商品と合成商品とは異なる商品カテゴリーに属する。次に、ユーザが入力したクエリワード列及びクエリワード列に基づいて見つかった様々な商品情報エントリに従って、クエリワード列のコア商品ワードをキー商品ワードとして抽出し、商品情報エントリのコア商品ワードをキー商品ワードに対応する候補商品ワードとして抽出する。さらに、キー商品ワード及び対応する候補商品ワードリストの中から候補商品ワードを検索する。候補商品ワードが見つかった場合に、関連する商品情報エントリの重み付けを小さくする。次に、個々の商品情報エントリの調整された重み付けに従って、商品情報エントリをソートし、出力する。このように、周辺商品情報の出現の確率を低くして、検索結果としての商品情報の精度と網羅性とを増大させる。
図1Aは、検索方法の一実施形態を示すプロセスフロー図である。方法100は、図2のシステム300によって実施可能である。方法100は、以下の工程(ステップ)を含む。
ステップ110では、サーバは、クエリワード列を受信し、クエリワード列に関連する複数の商品情報エントリを検索する。商品情報エントリは、商品の名称や商品の説明等に対応する。
ステップ120では、サーバは、クエリワード列から第1のコア商品ワードを抽出する。第1のコア商品ワードは、最も小さな意味的単位に相当する。たとえば、クエリワード列が「携帯電話バッテリ充電器」である場合に、抽出される第1のコア商品ワードは「充電器」である。もう一つの例として、クエリワード列が「長袖シフォンワンピース」である場合に、抽出される第1のコア商品ワードは「ワンピース」である。
ステップ130では、サーバは、検索された商品情報エントリから複数の第2のコア商品ワードを抽出する。第2のコア商品ワードは、最も小さな意味的単位に相当する。たとえば、商品情報エントリの名称が「携帯電話バッテリ充電器を提供する」である場合に、第2のコア商品ワードは「充電器」である。
ステップ140では、各第2のコア商品ワードに関して、サーバは、候補商品ワードリストに各第2のコア商品ワードが存在するか否かをチェックする。第1のコア商品ワードをキー商品ワードと合わせて、対応する候補商品ワードリストを抽出する。たとえば、キー商品ワードが「携帯電話」の場合に、携帯電話の周辺機器に関連する候補商品ワードリストには、バッテリ、保護カバー、充電器、デコレーション等が含まれる。候補商品ワードリスト内に各第2のコア商品ワードが存在する場合、サーバは、各第2のコア商品ワードに対応する商品情報エントリの重み付けを小さくするように構成される。候補商品ワードリストには、複数の候補商品ワードが含まれる。複数の候補商品ワードと複数のキー商品ワードとを組み合わせて複数の合成商品ワードを得た場合、得られた複数の合成商品ワードとキー商品ワードとは同じカテゴリーには属さない。たとえば、キー商品ワードが「携帯電話」で候補商品ワードが「バッテリ」又は「充電器」である場合に、対応する合成商品ワードは「携帯バッテリ」又は「携帯充電器」である。したがって、キー商品ワードと合成商品ワードとは、異なる商品カテゴリーに属する。
候補商品ワードリストは、通常、事前に設定されるものであり、候補商品ワードリストには候補商品ワードが含まれる。キー商品ワードは、対応する候補商品ワードリストを抽出するために用いられるワードである。ユーザのクエリワード列の第1のコア商品ワードが検索される場合には、第1のコア商品ワードをキー商品ワードと合わせて、対応する候補商品ワードリストを抽出する。ある実施形態において、ダブルアレイトライ(double array trie)によりキー商品ワードを用いて、対応する候補商品ワードリストを抽出するようにしてもよい。
候補商品ワードとキー商品ワードとは、同じカテゴリーに属さない。さらに、キー商品ワードは、候補商品ワードとキー商品ワードとを組み合わせて得られた合成商品サードと同じカテゴリーに属さない。
たとえば、MP3ダウンロードケーブルとMP3イヤホンに関して、MP3をキー商品ワードとして用いる一方で、ダウンロードケーブルとイヤホンとを候補商品ワードとして候補商品ワードリストに加える。MP3、ダウンロードケーブル及びイヤホンは、それぞれ、異なるカテゴリーに属する商品である。MP3とダウンロードとを組み合わせて得られたワードである「MP3ダウンロードケーブル」は、MP3とは違って、ダウンロードケーブルの関連カテゴリーに属する。MP3とイヤホンとを組み合わせて得られたワードである「MP3イヤホン」は、MP3とは違って、イヤホンカテゴリーに属する。
ステップ150では、個々の商品情報エントリの調整された重み付けに従って、サーバは、様々な商品情報エントリをソート及び出力する。クエリワード列から第1のコア商品ワードを抽出するという上述した対応関係を用いて、商品情報エントリの第2のコア商品ワードが候補商品ワードリストに存在する場合には、商品情報エントリとクエリワード列から抽出される第1のコア商品ワードとは同じカテゴリーに属さない。この場合には、商品情報エントリの重みを低くする。
ある実施形態において、キー商品ワードに対応する候補商品ワードリストのための候補規則辞書を事前に設定するようにしてもよい。ある実施形態において、キー商品ワード及び対応する候補商品ワードリストは以下のステップで設定するようにしてもよい。
ステップ210では、データベースに含まれる様々な商品情報エントリの各々に関して、サーバは、最も大きな意味的単位を用いて個々の各商品情報エントリに対する粗い粒度のセグメンテーションを実施して、セグメント化された各エントリに含まれる第3のコア商品ワードを抽出する。ここで、第3のコア商品ワードは第3のコア商品を指すものではないことに留意されたい。第3のコア商品ワードは、セグメンテーションの結果における商品ワード情報を指すものに過ぎない。
商品情報は、一般的に、構造化された情報である。たとえば、商品情報は、名称、概要及び説明のような構造化されたテキストを有するものでもよい。各商品情報エントリのテキスト情報をすべて分析して、テキスト情報からコア商品ワードを検索する。さらに、たとえば、名称、概要又は説明のような所定の構造のテキストから商品ワードを抽出する。ある実施形態において、名称の情報フィールドを分析するようにしてもよい。ある実施形態において、別のフィールドを分析するようにしてもよい。
たとえば、データベースから検索した商品情報エントリの名称情報フィールドに関して、最も大きな意味的単位を用いて名称情報に対するセグメンテーションを実施して、粗い粒度の解析ワードを取得する。最も大きな意味的単位は、フレーズと同様のものである。解析ワードを組み合わせて意味的単位を示す場合には、解析ワードはセグメント化されない。たとえば、「携帯電話バッテリ」は、携帯電話で用いられるバッテリを示す。この解析では、一般的に、辞書に基づいて最大マッチングを行う。意味論的意味を特定する最も小さな意味的単位から形成されるワードが辞書に含まれる場合、そのワードは、最も大きな意味的単位と見なされる。たとえば、「携帯電話バッテリ」は、携帯電話で用いられるバッテリを指すものであって、他の電気機器に用いられるバッテリを指すものではない。他の例として、「MP3ダウンロードケーブル」はPM3用のダウンロードケーブルを指すものであって、他の電気機器用のダウンロードケーブルを指すものではない。
最も大きな意味的単位を用いて粗い粒度の解析を実施した場合に得られたワードの中に、修飾語句、商品ワード、型番号ワード等、様々なワード特性が存在する場合がある。「とてもかわいいノキア携帯電話N99」という例では、「とてもかわいい」が修飾語句に相当し、「ノキア携帯電話」が商品ワードに相当し、「N99」が型番号ワードに相当する。抽出された情報が比較的長い場合には、セグメンテーションの結果として、多くの商品ワードが得られる場合がある。その言語の規則に基づいて、これらの商品ワードの中に一つのコア商品ワードが存在すると考えられる。たとえば、ワードは、商品が属するカテゴリーを確認できるものでもよい。したがって、様々なワードの中に含まれる抽出コア商品ワードは、上述した粗い粒度のセグメンテーションによって得られる。すなわち、第3のコア商品ワードである。
さらに、この例では、ワード特性には、CP_CORE (商品コアワード)、CP_MODIFIER(商品修飾語句)、XS(一般的な修飾語句)、PP(ブランドワード)、XH(型番号ワード)、QH(下位区分ワード)、BL(等位接続詞)及びPT(一般的なワード)が含まれる。たとえば、「mp3/mp4自動車送信機を供給する」という例を用いて、この例に含まれるワード特性を表1に示す。解析は、最も小さな意味的単位を用いて実施される。最も大きな意味的単位を用いて解析を実行した場合には、ワード特性ラベルが類似のものになってしまう可能性がある。
Figure 2015518220
実際の用途では、粗い粒度のセグメンテーションを既に実行済みの抽出情報から得られるワードに関して、ワード特性辞書と所定の判断規則とに基づいて、各ワードのワード特性を検索する。特定のワードがコア商品ワードである場合に、この特定のワードを第3のコア商品ワードとして残しておく一方で、他のワードに関するフォローアップ処理は実行しない。
220で、第3のコア商品ワードが存在する場合に、サーバは、最も小さな意味的単位を用いて第3のコア商品ワードに関する細かい粒度のセグメンテーションを実施する。細かい粒度のセグメンテーションによって得られた様々なワードのうち少なくとも2つが商品ワードである場合には、サーバは、これらのワードの組成配列を行って、最初の商品ワードをキー商品ワードとして用いるとともに、最後の商品ワードをキー商品ワードの候補商品ワードとして用いる。
ある実施形態において、粗い粒度のセグメンテーションの際に、サーバは、最も小さな意味的単位にセグメント化されるコア商品ワードを取得するものでもよく、コア商品ワードはそれ以上セグメント化できないものでもよい。得られた様々な第3のコア商品ワードに関して、最も小さな意味的単位のセグメンテーションを実施する。粗い粒度のセグメンテーションでは短い文字列Aをセグメント化できない(セグメンテーションの結果がAになる)が、細かい粒度のセグメンテーションで短い文字列AをA1/A2にセグメント化でき、かつ、セグメント化された各解析ワードが商品ワードである場合には、A1をA2の修飾要素と見なす。言い換えると、商品ワードA1は、候補ワードの候補A2を有する。
図1Dは、細かい粒度のセグメンテーションを行う方法の一実施形態を示すプロセスフロー図である。この方法は、ステップ220で実行される。この方法は、以下のステップを含む。
もう一つの例において、ステップ221において、サーバは、最も小さな意味的単位を用いて、第3のコア商品ワードをセグメント化して、最も小さな意味的単位のワードを取得する。
たとえば、取得されたワードである「携帯電話バッテリ」を「携帯電話」と「バッテリ」とにセグメント化し、取得されたワードである「MP3ダウンロードケーブル」を「MP3」と「ダウンロードケーブル」とにセグメント化する。
ステップ223では、サーバは、第3のコア商品ワードが少なくとも2つの最も小さな意味的単位にセグメント化されたか否かを判定する。
第3のコア商品ワードが少なくとも2つの最も小さな意味的単位にセグメント化された場合には、225で、サーバは、最も小さな意味的単位である各ワードのワード特性にラベル付けを行う。
第3のコア商品ワードをセグメント化することによって得られた最も小さな意味的単位であるワードの少なくとも一部に関して、各最も小さな意味的単位のワード特性にラベル付けを行う。たとえば、最も小さな意味的単位であるワードの一部に、型番号ワード、商品ワード等のラベル付けを行う。
ステップ227では、サーバは、最も小さな意味的単位である様々なワードに少なくとも2つの商品ワードが含まれるか否かを判定する。
ステップ229では、最も小さな意味的単位である様々なワードに少なくとも2つの商品ワードが含まれる場合には、サーバは、この少なくとも2つの商品ワードの組成配列を行って、最初の商品ワードをキー商品ワードとして用いるとともに、最後の商品ワードをキー商品ワードの候補商品ワードとして用いる。
たとえば、「携帯電話バッテリ」をセグメント化することによって得られた「携帯電話」及び「バッテリ」は、いずれも商品ワードである。「バッテリ」を候補商品ワードとして有するキー商品ワードとして「携帯電話」を設定する。「MP3ダウンロードケーブル」をセグメント化することによって得られた「MP3」及び「ダウンロードケーブル」は、いずれも商品ワードである。「ダウンロードケーブル」を候補商品ワードとして有するキー商品ワードとして「MP3」を設定する。
ステップ230では、サーバは、キー商品ワードと候補商品ワードとの相関性を算出し、閾値を超える相関性を有する候補商品ワードを選択する。
実際の用途において、最も小さな意味的単位から形成される商品ワードの中に新たな商品ワードが出現した場合、新たな商品ワードと最も小さな意味的単位である商品ワードとが、同じカテゴリーに属する場合がある。たとえば、「女性用衣服ワンピース」をセグメント化することによって得られた「女性用衣服」及び「ワンピース」は、いずれも「女性用衣服」カテゴリーに属する。したがって、「ワンピース」を「女性用衣服」の候補商品ワードとして用いると、コア商品ワードとして「女性用衣服」を用いる検索をユーザが行う場合に、商品情報エントリの重み付けが誤って低くされることになる。商品情報エントリの重み付けが低くなることによって、検索結果が不正確になる可能性がある。したがって、得られたキー商品ワードと候補商品ワードとの間の相関性を算出する。キー商品ワードと候補商品ワードとの間の相関性を所定の閾値と比較する。相関性が所定の閾値よりも高ければ、候補商品ワードを削除する。このように削除することによって、キー商品ワードと同じカテゴリーに属する候補商品ワードは、候補商品ワードリストに含まれなくなる。
図1Eは、キー商品ワードの相関性を算出する方法の一実施形態を示すプロセスフロー図である。この方法は、ステップ230で実行される。この方法は、以下のステップを含む。
ステップ232では、各キー商品ワードと各候補商品ワードとに関して、サーバは、各キー商品ワードの個々のカテゴリーに関するクリック率に基づいて各キー商品ワードをベクトル化するとともに、各候補商品ワードの個々のカテゴリーに関するクリック率に基づいて各候補商品ワードをベクトル化する。
ある実施形態において、クエリの記録はサーチエンジンのログ内にあり、この記録は、クエリワードとしてのキー商品ワードと候補商品ワードとに基づいて実施されるクエリの記録である。したがって、カテゴリークリック率は、各キー商品ワードと各候補商品ワードとに関して算出される。たとえば、キー商品ワードAに対するクリック総数をm、カテゴリーAに対するクリック数をm1、カテゴリーBに対するクリック数をm2、・・・、カテゴリーNに対するクリック数をmnとする。この場合、キー商品ワードAに関するクリック率はm1/mであり、カテゴリーBに関するクリック数はm2/m、カテゴリーNに関するクリック数はmn/mである。ある実施形態において、キー商品ワードAに対する重み付けリストは、
Figure 2015518220
のようにベクトル化される。
図1Fは、各キー商品ワードのベクトル化及び各候補商品ワードのベクトル化を行う方法の一実施形態を示すプロセスフロー図である。この方法は、ステップ232で実行される。この方法は、以下のステップを含む。
ステップ2322では、検索ログから得られる各キー商品ワードと各候補商品ワードとに関して、サーバは、各関連カテゴリーのクリック率をそれぞれ分析して表にすることにより、関連カテゴリーに関する重み付けリストを取得する。
検索ログを分析して、キー商品ワードがクエリワードである場合にクリックされた様々な商品情報エントリを取得する。個々の商品情報エントリのカテゴリーに基づいて、各カテゴリーに関するクリック率を表にする。個々のカテゴリーのクリック率から、関連カテゴリーに関する重み付けリストを構成する。検索ログを分析して、候補商品ワードがクエリワードである場合にクリックされた様々な商品情報エントリを取得する。個々の商品情報エントリのカテゴリーに基づいて、各カテゴリーに関するクリック率を表にする。個々のカテゴリーのクリック率から、関連カテゴリーに関する重み付けリストを構成する。キー商品ワードAに対するクリック総数がm、カテゴリーAに対するクリック数がm1、カテゴリーBに対するクリック数がm2、・・・、カテゴリーNに対するクリック数がmnである上述した例に基づくと、キー商品ワードのカテゴリーAに関するクリック率はm1/m、カテゴリーBに関するクリック数はm2/m、カテゴリーNに関するクリック率はmn/mとなる。したがって、重み付けリストは、m1/m、m2/m、・・・、mn/mのようになる。
ステップ2324では、サーバは、キー商品ワードの重み付けリストに含まれる個々の値を第1のベクトルに変換するとともに、候補商品ワードの重み付けリストに含まれる個々の値を第2のベクトルに変換する。
たとえば、キー商品ワードAに対する上述した重み付けリストをベクトル
Figure 2015518220
に変換する。同様な作業を、次に候補商品ワードに関して実行する。
ステップ234では、サーバは、各キー商品ワードに対応する第1のベクトルと各候補商品ワードに対応する第2のベクトルとの間の角度値を算出し、算出された角度値に基づいて閾値を満たす相関性を有する候補商品ワードを選択する。
図1Gは、第1のベクトルと第2のベクトルとの間の角度値を算出する方法の一実施形態を示すプロセスフロー図である。この方法は、ステップ234で実行される。この方法は、以下のステップを含む。
ステップ2342では、サーバは、第1のベクトルと第2のベクトルの余弦角度(cosine)値を算出する。第1のベクトルは、キー商品ワードに対応する。第2のベクトルは、候補商品ワードに対応する。
ステップ2344では、サーバは、余弦角度値が閾値よりも大きいか否かを判定する。
ステップ2346では、余弦角度値が閾値よりも大きい場合には、サーバは、候補商品ワードを削除する。なお、以下では、明細書の煩雑化を避けるためベクトルを示す英文字上の矢印を省略し、ベクトルの用語のみを用いてベクトルであることを示す場合がある。
たとえば、キー商品ワードに対応するベクトルがベクトルa、候補商品ワードに対応するベクトルがベクトルbの場合に、余弦角度値は
Figure 2015518220
.となる。量ベクトル間の角度値を相関性として用いる。言い換えると、相関性は、キー商品ワードと候補商品ワードとの類似性に対応する。サーバは、類似性が閾値を超えるか否かを判定する。類似性が閾値、たとえば、0.2を超える場合には、対応する候補商品ワードを削除する。
ある実施形態において、キー商品ワードと候補商品ワードとの間の相関性の算出、及び、閾値を満たす相関性を有する候補商品ワードの選択は、以下のように行われる。
ステップ236では、各キー商品ワードと各候補商品ワードとに関して、サーバは、各キー商品ワードのカテゴリークリック率、属性クリック率及び商品ワードクリック率の3つの次元に基づいてそれぞれ各キー商品ワードをベクトル化するとともに、各候補商品ワードのカテゴリークリック率、属性クリック率及び商品ワードクリック率の3つの次元に基づいてそれぞれ各候補商品ワードをベクトル化する。
ある実施形態において、キー商品ワードと候補商品ワードとは、それぞれクエリワードとして機能する。カテゴリー、属性及び商品ワードの3つの次元に基づいて、クエリワードをベクトル化する。たとえば、1つのクエリワードに対応して、n個の商品情報エントリがクリックされる場合を考える。各商品情報エントリは1つのカテゴリーに対応するため、商品情報エントリにm個の属性の記載が含まれ、商品情報のr個の名称にn個の商品ワードが出てくる。そのクエリワードに対する各カテゴリーのクリック率、各属性のクリック率及び各商品ワードのクリック率を取得する。各カテゴリー、各属性及び各商品ワードのクリック率を用いて、3つの次元の余弦角度値を算出して、相関性を取得する。
図1Hは、各キー商品ワード及び各候補商品ワードのベクトル化を行う方法の一実施形態を示すプロセスフロー図である。この方法は、ステップ236で実行される。この方法は、以下のステップを含む。
ステップ2362では、各キー商品ワードと各候補商品ワードとに関して、サーバは、検索ログをそれぞれ分析及び検索するとともに、キー商品ワードを介してクリックされた様々な商品情報エントリと各候補商品ワードを介してクリックされた様々な商品情報エントリとを検索する。
上述したように、多数のユーザクエリ動作に基づいて、サーチエンジンの過去の検索ログの中に、通常、キー商品ワードをクエリワードとして用いて又は候補商品ワードをクエリワードとして用いて実施したクエリのログの記録が存在する。検索ログをそれぞれ分析して検索するとともに、キー商品ワードを介してクリックされた様々な商品情報エントリと各候補商品ワードを介してクリックされた様々な商品情報エントリとを検索することができる。
ステップ2364では、サーバは、キー商品ワードに対応する第1のカテゴリークリック率リストと、様々な商品情報エントリの個々の属性に関する対応する第1の属性クリック率リストと、様々な商品情報エントリのコア商品ワードに関する対応する第1の商品ワードクリック率リストとをそれぞれ表に作成するとともに、候補商品ワードに対応する第2のカテゴリークリック率リストと、様々な商品情報エントリの個々の属性に関する対応する第2の属性クリック率リストと、様々な商品情報エントリのコア商品ワードに関する対応する第2の商品ワードクリック率リストとをそれぞれ表に作成する。
キー商品ワードを介し対応してクリックされた様々な商品情報エントリに基づいて、サーバは、キー商品ワードの個々のカテゴリーのクリック率を表にすることにより第1のカテゴリークリック率リストを得るとともに、様々な商品情報エントリの個々の属性のクリック率を表にすることにより第1の属性クリック率リストを得て、さらに、様々な商品情報エントリの個々の商品ワードのクリック率を表にすることにより第1の商品ワードクリック率リストを得る。候補商品ワードを介し対応してクリックされた様々な商品情報エントリに基づいて、サーバは、候補商品ワードの個々のカテゴリーのクリック率を表にすることにより第2のカテゴリークリック率リストを得るとともに、様々な商品情報エントリの個々の属性のクリック率を表にすることにより第2の属性クリック率リストを得て、さらに、様々な商品情報エントリの個々の商品ワードのクリック率を表にすることにより第2の商品ワードクリック率リストを得る。
2366で、サーバは、第1のカテゴリークリック率リストと、第1の属性クリック率リストと、第1の商品ワードクリック率リストと、第2のカテゴリークリック率リストと、第2の属性クリック率リストと、第2の商品ワードクリック率リストと、をそれぞれ対応するベクトルに変換する。
たとえば、第1のカテゴリークリック率リストa1, a2, ..., anは
Figure 2015518220
に変換される。ベクトル記号を省略して同様に示すと、第1の属性クリック率リストb1, b2, ..., bnはベクトルb=(b1, b2, …, bn)に変換され、第1の商品ワードクリック率リストc1, c2, ...,cnはベクトルc=(c1, c2, …, cn)に変換される。同様に、第2のカテゴリークリック率リストに対応して得られるベクトルはベクトルe、第2の属性クリック率リストに対応するベクトルはベクトルf、第2の商品ワードクリック率リストに対応するベクトルはベクトルgである。
ステップ238では、各次元に関して、サーバは、キー商品ワードに対応するベクトルと候補商品ワードに対応するベクトルとの間の角度値を算出し、得られた3つの次元の角度値に基づいて、閾値を満たす相関性を有する候補商品ワードを選択する。
カテゴリーの次元に関して、第1のカテゴリークリック率リストに対応するベクトルaと第2のカテゴリークリック率リストに対応するベクトルeとの間の角度値を算出する。同様に、属性の次元に関して、第1の属性クリック率リストに対応するベクトルbと第2の属性クリック率リストに対応するベクトルfとの間の角度値を取得する。同様に、商品ワードの次元に関して、第1の商品ワードクリック率リストに対応するベクトルcと第2の商品ワードクリック率リストに対応するベクトルgとの間の角度値を取得する。次に、上述した3つの次元の角度値に基づいて、閾値を満たす相関性を有する候補商品ワードを選択する。たとえば、カテゴリークリック率の相関性と属性クリック率の相関性と商品ワードクリック率の相関性の3つの次元に対して、それぞれ、6:3:1の比率で重み付けを行う。
図1Iは、キー商品ワードに対応するベクトルと候補商品ワードに対応するベクトルとの間の角度値を算出する方法の一実施形態を示すプロセスフロー図である。この方法は、ステップ238で実行される。この方法は、以下のステップを含む。
ステップ2382では、サーバは、それぞれ、第1のカテゴリークリック率リストに対応するベクトルと第2のカテゴリークリック率リストに対応するベクトルとの間の余弦角度値を算出してカテゴリークリック率の相関性を取得するとともに、第1の属性クリック率リストに対応するベクトルと第2の属性クリック率リストに対応するベクトルとの間の余弦角度値を算出して属性クリック率の相関性を取得し、さらに、第1の商品ワードクリック率リストに対応するベクトルと第2の商品ワードクリック率リストに対応するベクトルとの間の余弦角度値を算出して商品ワードクリック率の相関性を取得する。
たとえば、上述したように、得られたカテゴリー余弦値は
Figure 2015518220
であり、得られた属性余弦値は
Figure 2015518220
であり、得られた商品ワード余弦値は
Figure 2015518220
である。
ステップ2384では、サーバは、カテゴリークリック率の相関性と属性クリック率の相関性と商品ワードクリック率の相関性とに線形的に重み付けを行って、キー商品ワードと候補商品ワードとの全体的な類似性を取得する。全体的な類似性が閾値よりも大きい場合には、サーバは、候補商品ワードを削除する。たとえば、カテゴリークリック率の相関性と属性クリック率の相関性と商品ワードクリック率の相関性の3つの次元に対して、それぞれ、6:3:1の比率で重み付けを行う。
次に、サーバは、線形に重み付けを行った上述の3つの余弦値の平均化を行って、キー商品ワードと候補商品ワードとの間の相関性、すなわち、類似性を示す最終余弦値を取得する。たとえば、類似性が、閾値、たとえば、0.3よりも大きな場合に、サーバは、候補商品ワードを削除する。
ステップ240では、同じキー商品ワードに関して、サーバは、選択された様々な候補商品ワードに基づいて、候補商品ワードリストを作成する。
データベースに含まれる商品情報エントリに関して抽出及び分析を行って、キー商品ワードと候補商品ワードとの間の対応関係を取得した後、サーバは、候補商品ワードの関連リストを作成する。
たとえば、上述の処理に基づき、キー商品ワードMP3に対応して得られる候補商品ワードリストには、ダウンロードケーブル、マザーボード、伝送ケーブル、保護スリーブ、充電器、充電式バッテリ、シース(被覆)、包装、梱包箱、送信機、スピーカ、シェル(外殻)、サングラス、カバー、小型スピーカ、小型ステレオ、陳列棚、携帯ポーチ、スイッチ、カラーボックス、携帯電話、腕時計、アンプ、ステーションレポーター、携帯ストラップ、携帯コード、ラジオ、データケーブル、コネクタケーブル、保護フィルム、拡声器又はこれらの任意の組み合わせが含まれる。
この方法は、自然言語処理の使用と構造化された情報とを組み合わせる。データベースにおける商品情報エントリの混合粒度(粗い粒度のセグメンテーション及び細かい粒度のセグメンテーション)マイニングによって、この方法は、重要度の低い結果の再現率を増大させる。カテゴリークリックスルー情報の相関性を増大させるとともに、自然言語技術と構造化された情報との相関性を増大させることによって、この方法は、結果の精度を上げる。同時に、この方法は、人件費頼みから脱却して、重要度の低い結果を除外する領域において目覚ましい成果を挙げる。
キー商品ワードと関連する候補商品ワードとのリストを含む上述した候補規則辞書に基づく検索には、次のステップが含まれる。
ステップ110では、サーバは、クエリワード列を受信して、クエリワード列に関連する様々な商品情報エントリを検索する。
クエリワード列は、ユーザにより入力される。サーチエンジンは、クエリワード列を受信した後、クエリワード列に基づいて、クエリワード列に関連する様々な商品情報エントリを検索する。
ステップ120では、サーバは、クエリワード列から第1のコア商品ワードを抽出する。第1のコア商品ワードは、最も小さな意味的単位である。
ある実施形態において、サーバは、最も小さな意味的単位によりクエリワード列をセグメント化して、クエリワード列によって表される対象である商品の第1のコア商品ワードを取得する。
この処理でコアワードを抽出する順序は、必ずしも、クエリワード列に関連する様々な商品情報エントリを検索した後で実行する必要はない。ある実施形態において、コアワードを抽出する順序は、この検索と同時に実施されるものでもよいし、あるいは、この検索の前に実施されるものでもよい。コアワードを抽出する順序は、本出願の記載に限定されるものではない。
ステップ130では、サーバは、様々な商品情報エントリから様々な第2のコア商品ワードを抽出する。第2のコア商品ワードは、最も小さな意味的単位である。
サーバは、様々な商品情報エントリに関して最も小さな意味的単位によるセグメンテーションを行って、クエリワード列によって表される対象である商品の第1のコア商品ワードを取得する。ある実施形態において、セグメンテーションは、様々な商品情報エントリの名称に基づいて行われる。
図1Bは、候補商品ワードリストを設定する方法の一実施形態を示すプロセスフロー図である。この方法は、ステップ130で実行される。この方法は、以下のステップを含む。
ステップ132では、サーバは、最後の商品ワードを商品情報エントリからの第2のコア商品ワードとして設定し、第2のコア商品ワードが対応する商品情報エントリを保存する。
様々な商品情報エントリから様々な第2のコア商品ワードが抽出される場合には、この抽出は以下のステップを含む。
ステップ134では、サーバは、メモリにおける様々な商品情報エントリから第2のコア商品ワードを抽出する。
ステップ132及び134の方法を用いて様々な商品情報エントリから様々な第2のコア商品ワードを抽出する場合、必要なのは、様々な商品情報エントリの第2のコア商品ワードをメモリから抽出することだけである。ステップ132及び134は、サーチエンジンのセグメンテーション処理を減らして、サーチエンジンの効率を上げる。
ある実施形態において、サーチエンジンによって各商品情報エントリが検索される際に抽出を行うようにしてもよい。あるいは、すべての商品情報エントリの検索後に抽出を行うようにしてもよい。抽出は、本出願の記載に限定されるものではない。
ステップ140では、各第2のコア商品ワードに関して、サーバは、候補商品ワードリストに第2のコア商品ワードが存在するか否かをチェックする。第1のコア商品ワードをキー商品ワードと合わせて、対応する候補商品ワードリストを抽出する。第2のコア商品ワードが存在する場合には、サーバは、その第2のコア商品ワードに対応する商品情報エントリの重み付けを小さくする。候補商品ワードリストには、候補商品ワードが含まれる。サーバは、候補商品ワードをキー商品ワードと組み合わせた合成商品ワードを取得するが、この合成商品ワードとキー商品ワードとは同じカテゴリーに属さない。
たとえば、第1のコア商品ワード「MP3」に関して、対応する商品情報エントリのうちの一つの商品情報エントリの第2のコア商品ワードが「ダウンロードケーブル」である場合に、サーバは、「MP3」を関連キーワード「MP3」と合わせて、キーワード「MP3」に対応する候補ワードのリストに「ダウンロードケーブル」が存在するか否かをチェックする。「ダウンロードケーブル」が存在する場合に、サーバは、関連商品情報エントリの重み付けを小さくする。
ステップ150では、様々な商品情報エントリの調整された重み付けに従って、サーバは、様々な商品情報エントリをソートして出力する。
サーチエンジンは、通常、ワード列に基づいて検索を行う。たとえば、「MP3」に対して、検索によって「MP3ダウンロードケーブル」が見つかる可能性があるが、「MP3ダウンロードケーブル」と「MP3」とは同じカテゴリーに属さない。したがって、検索結果の精度を上げるためには、すなわち、検索結果が表示された場合に最初の数ページの精度を上げるためには、「MP3ダウンロードケーブル」に対応する商品情報エントリの重み付けを小さくすることが必要となる。この結果、「MP3ダウンロードケーブル」に関連する検索結果が、後ろへ追いやられる、又は、ソートされた結果において下のほうに表示される。「MP3」と同じカテゴリーに属する商品情報エントリの表示に、より高い優先度が与えられる。
ある実施形態において、様々な商品情報エントリとクエリワードとの間の相関性を、まず、相関性に基づくカテゴリーに分類する。カテゴリー内で、情報の質、予測されるCTR(クリック率:click through rate)、GMV(総流通額:gross merchandise volume)、他の市場原理(構成員の交代)やこれらの任意の組み合わせに基づいて重み付けを設定する。サーバは、調整された様々な商品情報エントリの重み付けを組み合わせて、様々な商品情報エントリをソートして出力する。
図1Cは、様々なコア商品ワードを取得する方法の一実施形態を示すプロセスフロー図である。この方法は、ステップ134で実行される。この方法は、以下のステップを含む。
ステップ1342では、サーバは、クエリワード列又は商品情報エントリのテキストを解析して、様々な解析ワードを取得するとともに、様々な解析ワードのワード特性をラベル付けする。
実際の用途では、ある商品情報エントリに関して、解析ワードのワード特性は、CP_CORE (商品コアワード)、CP_MODIFIER(商品修飾語句)、XS(一般的な修飾語句)、PP(ブランドワード)、XH(型番号ワード)、QH(下位区分ワード)、BL(等位接続詞)、PT(一般的なワード)又はこれらの任意の組み合わせを含むものでもよい。上述した表1に例を示す。
したがって、様々な商品情報エントリに関するクエリワード列又はクエリ商品情報エントリを解析することにより、サーバは、上述したワード特性に従って、各解析ワードのワード特性をラベル付けする。ステップ1344では、サーバは、演算子ワードのワード特性を有する文脈的に無関係なワードのリストをチェックして、その中に含まれる等位接続詞を識別するとともに、等位接続詞に基づいてクエリワード列または商品情報エントリをセグメント化する。
各解析ワードに関して、サーバは、演算子ワードのワード特性を有する文脈的に無関係なワードのリストをチェックして、その中に含まれる等位接続詞を識別する。その後、サーバは、等位接続詞に基づいて短い文字列をセグメント化し、各セグメントにおいて文脈的に関係するワード特性を算出する。たとえば、サーバは、前述した「mp3/mp4自動車送信機を供給する」を「mp3自動車送信機を供給する」と「mp4自動車送信機を供給する」とにセグメント化する。MP3、MP4及び送信機は商品ワードである。
ステップ1346では、そのセグメント内の少なくとも2つの解析ワードが商品ワードのワード特性を有する場合に、サーバは、解析ワードのうちの最後のワードをコア商品ワードとして設定する。
BLワード特性に基づいて、サーバは、短い文字列をセグメント化し、各セグメントの解析ワードのワード特性及び重要度を別々に算出する。各セグメントに関して、そのセグメント内の複数の解析ワードがCP(コア商品)ワード特性を有する場合には、サーバは、これらの解析ワードのうちの最後の解析ワードのワード特性をCP_COREに設定し、残りのワードのワード特性をCP_MODIFIERに設定する。サーバは、以下のように、ワード特性に基づいて、解析ワードの重要度のスコアを求める。
たとえば、サーバは、そのワードに関する独立スコアをIDF(独立:independent)辞書から検索する。そのワードが辞書にない場合には、スコアは0になる。
そのワードが最後のワードである場合には、サーバは10点を加えて、現在のスコアを算出する。
そのワードがコア商品ワードである場合には、サーバは100点を加える。
そのワードがブランドワードである場合には、サーバは80点を加える。
そのワードが型番号ワードである場合には、サーバは60点を加える。
そのワードが商品修飾語句である場合には、サーバは40点を加える。
そのワードが下位区分ワードである場合には、サーバは20点を加える。
そのワードが等位接続詞と見なされる場合、又は、左丸括弧又は右丸括弧である場合には、サーバは、直接、スコアを0点に設定する。
そのワードが一般的なワードである場合には、サーバは5点を加える。
さらに、商品情報に対応するカテゴリーID及び供給業者IDが商品情報内に与えられている場合には、多次元特性関連付け(供給業者レベル、カテゴリーレベル、購入者レベル、候補規則)判定を用いて、結果を最適化して、最終的な解析ワード特性と重要度の結果を取得する。
各々解析されたCP_COREワード及びCP_MODIFIERワードから、4つの特性、すなわち、解析ワードに対応するカテゴリークリックスルー、そのカテゴリーにおける商品情報の商品ワード分布、供給業者の主な業種及び供給業者の主要な製品を抽出する。そして、各解析された候補ワードに関して、これら4つの特性の性能を検証する。
Figure 2015518220
特性が適合する部分において、特性1)から特性4)までのすべての特性が関係している場合には、CP_MODIFIERをCP_COREにアップグレードする。特性1)から特性4)までのすべての特性が無関係な場合には、CP_COREをCP_MODIFIERにダウングレードする。特性1)から特性4)までのすべての特性が関係している場合には、解析ワードを信頼できるワードとして設定し、そのワードに対応する候補規則ワードをすべてCP_MODIFIERに設定する。さらに、その解析ワードに対応する重要度のスコアを修正して、最終的な結果を取得する。
図2は、検索システムの一実施形態を示す構造概略図である。システム300は、サーチエンジン305と、候補商品ワードリスト形成モジュール405と、を備える。
サーチエンジン305は、検索モジュール310と、第1のコア商品ワード検索モジュール320と、第2のコア商品ワード検索モジュール330と、判定モジュール340と、出力モジュール350と、を備える。
検索モジュール310は、クエリワード列を受信して、クエリワード列に関連する様々な商品情報エントリを検索する。
第1のコア商品ワード検索モジュール320は、クエリワード列から第1のコア商品ワードを抽出する。第1のコア商品ワードは、最も小さな意味的単位に対応する。
第1のコア商品ワード検索モジュール330は、様々な商品情報エントリから様々な第2のコア商品ワードを抽出する。第2のコア商品ワードは、最も小さな意味的単位に対応する。
判定モジュール340は、規則辞書における各第2のコア商品ワードに関して、キー商品ワードに対応する候補商品ワードリストに第2のコア商品ワードが存在するか否かをチェックする。第1のコア商品ワードがキー商品ワードにマッチ(照合)されて、対応する候補商品ワードリストを抽出する。第2のコア商品ワードが存在する場合には、判定モジュール340は、その第2のコア商品ワードに対応する商品情報エントリの重み付けを小さくする。候補商品ワードリストには候補商品ワードが含まれる。候補商品ワードをキー商品ワードと組み合わせて得られた合成ワードとキー商品ワードとは同じカテゴリーに属さない。
出力モジュール350は、様々な商品情報エントリの調整された重み付けに従って、様々な商品情報エントリをソートして出力する。
候補商品ワードリスト形成モジュール405は、粗粒度セグメンテーションモジュール410と、細粒度セグメンテーションモジュール420と、選択モジュール430と、リスト作成モジュール440と、を備える。
粗粒度セグメンテーションモジュール410は、データベースに含まれる様々な商品情報エントリの各々に関して、最も大きな意味的単位による粗い粒度のセグメンテーションを行って、セグメント化の結果を得るとともに、セグメント化の結果に含まれる第3のコア商品ワードを抽出する。
細粒度セグメンテーションモジュール420は、第3のコア商品ワードが抽出されたか否かを判定する。第3のコア商品ワードが抽出された場合には、各第3のコア商品ワードに関して、細かい粒度のセグメンテーションを行って、様々なワードを取得する。ここで、取得されたワードは、最も小さな意味的単位である。さらに、取得された様々なワードに少なくとも2つの商品ワードが含まれる場合には、ワードの組成配列に従って、最初のワードをキー商品ワードとして用いるとともに、最後のワードをキー商品ワードの候補商品ワードとして用いる。
選択モジュール430は、キー商品ワードと候補商品ワードとの間の相関性を算出して、閾値を満たす相関性を有する候補商品ワードを選択する。
リスト作成モジュール440は、同じキー商品ワードに関して、選択された様々な候補商品ワードに基づいて、そのキー商品ワードに対する候補商品ワードリストを作成する。
図3は、検索システムの一実施形態を示す概略図である。検索システム400は、ネットワーク550を介してサーバ600に接続されるクライアント500を備える。サーバ600は、システム300を実現するものでもよい。
上述したユニットは、1つ以上の汎用プロセッサ上で実行されるソフトウェア要素として、所定の機能を実行するように設計されたプログラム可能な論理デバイス及び/又は特定用途向け集積回路(ASIC)等のハードウェアとして、又は、その組み合わせとして、実現可能である。ある実施形態において、ユニットは、(光ディスク、フラッシュメモリ型記憶装置、可動式ハードディスク等の)不揮発性記憶媒体に保存可能であって、(パーソナルコンピュータ、サーバ、ネットワーク装置等の)コンピュータ装置に本発明の実施形態に記載した方法を実現させる多数の命令を含む、ソフトウェア製品の形態で実施されるものでもよい。ユニットは、単一の装置上で実現されるものでもよいし、あるいは、複数の装置に分散されるものでもよい。ユニットの機能を統合するようにしてもよいし、複数のサブユニットにさらに分割するようにしてもよい。
本出願で開示される実施例に照らして記載した方法又はアルゴリズムの工程は、ハードウェアを用いて実現することも、プロセッサが実行するソフトウェアモジュールを用いて実行することも、また、これらを組み合わせて実行することも可能である。ソフトウェアモジュールは、ランダムアクセスメモリ(RAM)、メモリ、リードオンリーメモリ(ROM)、電気的にプログラム可能なROM、電気的に消去可能なプログラマブルROM、レジスタ、ハードディスクドライブ、リムーバブルディスク、CD−ROM、又は、当該技術分野で周知の任意の他の形態の記憶媒体にインストールされるものでもよい。
以上、理解を助ける目的で実施形態を詳細に説明したが、本発明は上述した詳細に限定されるものではなく、本発明は多くの別の形態で実施可能である。上述した実施形態は例示に過ぎず、限定するものではない。
以上、理解を助ける目的で実施形態を詳細に説明したが、本発明は上述した詳細に限定されるものではなく、本発明は多くの別の形態で実施可能である。上述した実施形態は例示に過ぎず、限定するものではない。

適用例1:検索方法であって、クエリワード列を受信し、前記クエリワード列に関連する複数の商品情報エントリを検索し、メモリ内の前記クエリワード列から第1のコア商品ワードを抽出し、前記第1のコア商品ワードは最も小さな意味的単位であり、前記商品情報エントリからの複数の第2のコア商品ワードを前記メモリから抽出し、前記複数の第2のコア商品ワードは最も小さな意味的単位であり、各第2のコア商品ワードに関して、キー商品ワードに関連する候補商品ワードリストに前記各第2のコア商品ワードが存在するか否かをチェックし、前記第1のコア商品ワードは前記キー商品ワードとマッチされ、前記各第2のコア商品ワードが候補商品ワードリストに存在する場合には、前記各第2のコア商品ワードに対応する商品情報エントリの重み付けを小さくし、前記候補商品ワードリストは候補商品ワードを含み、前記候補商品ワードに前記キー商品ワードを組み合わせることにより得られる合成商品ワードと前記キー商品ワードとは同じカテゴリーに属さず、前記商品情報エントリの調整された重み付けに従って、前記商品情報エントリをソートして出力すること、を備える方法。
適用例2:適用例1に記載の方法において、さらに、前記候補商品ワードリストを設定することであって、データベースに含まれる前記商品情報エントリの各々に関して、最も大きな意味的単位による粗い粒度のセグメンテーションを実施して、前記セグメンテーションの結果に含まれる第3のコア商品ワードを抽出し、前記第3のコア商品ワードが前記セグメンテーションの結果から抽出されたか否かを判定することを含む、前記候補商品ワードリストを設定すること、前記第3のコア商品ワードが前記セグメンテーションの結果から抽出された場合に、最も小さな意味的単位による細かい粒度のセグメンテーションを実施して、取得されたワードのうち少なくとも2つが商品ワードであるか否かを判定し、取得されたワードのうち少なくとも2つが商品ワードである場合には、最初の商品ワードをキー商品ワードとして用いるとともに、最後の商品ワードを前記キー商品ワードの候補商品ワードとして用い、各キー商品ワードと各候補商品ワードとの相関性を算出し、前記各キー商品ワードと前記各候補商品ワードとの相関性が閾値を満たすか否かを判定し、前記閾値を満たす相関性を有する候補商品ワードを選択し、同じキー商品ワードに関して、前記選択された候補商品ワードに基づいて、候補商品ワードリストを作成すること、を備える、方法。
適用例3:適用例2に記載の方法において、前記各キー商品ワードと前記各候補商品ワードとの相関性を算出すること、前記各キー商品ワードと前記各候補商品ワードとの相関性が前記閾値を満たすか否かを判定すること、及び、前記閾値を満たす相関性を有する前記候補商品ワードを選択することは、前記各キー商品ワードと前記各候補商品ワードとについて、前記各キー商品ワードのカテゴリーに対するクリック率に基づいて前記各キー商品ワードをベクトル化してベクトルを取得し、前記各候補商品ワードのカテゴリーに対するクリック率に基づいて前記各候補商品ワードをベクトル化してベクトルを取得し、前記キー商品ワードに対応するベクトルと前記候補商品ワードに対応するベクトルとの間の角度値を算出し、前記角度値の間の相関性を算出し、角度値に基づいて、各候補商品ワードの相関性が閾値を満たすか否かを判定し、前記角度値に基づいて、前記閾値を満たす相関性を有する候補商品ワードを選択すること、を備える、方法。
適用例4:適用例3に記載の方法において、前記各キー商品ワードと前記各候補商品ワードとについて、前記キー商品ワードのカテゴリーに対する前記クリック率を用いて前記各キー商品ワードをベクトル化してベクトルを取得し、前記各候補商品ワードのカテゴリーに対する前記クリック率を用いて前記各候補商品ワードをベクトル化してベクトルを取得することは、前記各キー商品ワードと前記各候補商品ワードとについて、検索ログから、それぞれの関連カテゴリーのクリック率を別々に分析及び作表することにより、各関連カテゴリーに関する重み付けのリストを取得し、前記各キー商品ワードの重み付けのリストにおける個々の値をベクトルに変換し、前記各候補商品ワードの重み付けのリストにおける個々の値をベクトルに変換すること、を備える方法。
適用例5:適用例4に記載の方法において、前記各キー商品ワードに対応するベクトルと前記各候補商品ワードに対応するベクトルとの間の角度値を算出すること、及び、前記角度値に基づいて前記閾値を満たす相関性を有する候補商品ワードを選択することは、前記ベクトルの余弦角度値を算出し、前記余弦角度値が前記閾値よりも大きいか否かを判定し、前記余弦角度値が前記閾値よりも大きい場合に、候補商品ワードを削除すること、を備える方法。
適用例6:適用例2に記載の方法であって、前記各キー商品ワードと前記各候補商品ワードとの相関性を算出すること、及び、前記閾値を満たす相関性を有する前記候補商品ワードを選択することは、前記各キー商品ワードと前記各候補商品ワードとについて、各キー商品ワードのカテゴリークリック率、属性クリック率及び商品ワードクリック率の3つの次元を用いて前記各キー商品ワードを別々にベクトル化し、各候補商品ワードのカテゴリークリック率、属性クリック率及び商品ワードクリック率の3つの次元を用いて前記各候補商品ワードを別々にベクトル化し、各次元に関して、前記3つの次元の前記各キー商品ワードに対応するベクトルと前記各候補商品ワードに対応するベクトルとの間の角度値を算出し、前記3つの次元に関して得られた角度値に基づいて、前記各候補商品ワードの相関性が前記閾値を満たすか否かを判定し、前記閾値を満たす相関性を有する候補商品ワードを選択すること、を備える方法。
適用例7:適用例6に記載の方法において、前記各キー商品ワードと前記各候補商品ワードとについて、各キー商品ワードのカテゴリークリック率、属性クリック率及び商品ワードクリック率の3つの次元を用いて前記各キー商品ワードをベクトル化し、各候補商品ワードのカテゴリークリック率、属性クリック率及び商品ワードクリック率の3つの次元を用いて前記各候補商品ワードをベクトル化することは、前記各候補商品ワードと前記各候補商品ワードとについて、検索ログの分析及び検索を行い、前記各キー商品ワードを介してクリックされた商品情報エントリと前記候補商品ワードを介してクリックされた各商品情報エントリとを検索し、前記キー商品ワードに対応する第1のカテゴリークリック率リストと、前記商品情報エントリの属性に関する対応する第1の属性クリック率リストと、前記商品情報エントリのコア商品ワードに関する対応する第1の商品ワードクリック率リストとの表を作成し、前記候補商品ワードに対応する第2のカテゴリークリック率リストと、前記商品情報エントリの属性に関する対応する第2の属性クリック率リストと、前記商品情報エントリのコア商品ワードに関する対応する第2の商品ワードクリック率リストとの表を作成し、前記第1のカテゴリークリック率リストと、前記第1の属性クリック率リストと、前記第1の商品ワードクリック率リストと、前記第2のカテゴリークリック率リストと、前記第2の属性クリック率リストと、前記第2の商品ワードクリック率リストとを対応するベクトルに変換すること、を備える方法。
適用例8:適用例7に記載の方法であって、各次元に関して、前記各キー商品ワードに対応するベクトルと前記各候補商品ワードに対応するベクトルとの間の角度値を算出すること、及び、前記3つの次元に関して得られた角度値に基づいて前記閾値を満たす相関性を有する候補商品ワードを選択することは、カテゴリークリック率相関性を取得するために、前記第1のカテゴリークリック率に対応するベクトルと前記第2のカテゴリークリック率に対応するベクトルとの間の余弦角度値を算出し、属性クリック率相関性を取得するために、前記第1の属性クリック率に対応するベクトルと前記第2の属性クリック率に対応するベクトルとの間の余弦角度値を算出し、商品ワードクリック率相関性を取得するために、前記第1の商品ワードクリック率に対応するベクトルと前記第2の商品ワードクリック率に対応するベクトルとの間の余弦角度値を算出し、前記キー商品ワードと前記候補商品ワードとの全体的な類似性を取得するために、前記カテゴリークリック率相関性と、前記属性クリック率相関性と、前記商品ワードクリック率相関性との線形的重み付けを行い、前記全体的な類似性が閾値よりも大きいか否かを判定し、前記全体的な類似性が前記閾値よりも大きい場合に、候補商品ワードを削除すること、を備える方法。
適用例9:適用例2に記載の方法において、前記キー商品ワードの前記候補商品ワードとして最後の商品ワードを用いることは、前記最後の商品ワードを、関連商品情報エントリの第2のコア商品ワードとして設定し、前記対応する商品情報エントリを記憶させること、を備える方法。
適用例10:適用例9に記載の方法において、前記商品情報エントリに対応する第2のコア商品ワードを抽出することは、前記メモリから、前記商品情報エントリの前記第2のコア商品ワードを抽出すること、を備える方法。
適用例11:適用例1に記載の方法において、前記第2のコア商品ワードを抽出することは、解析ワードを取得するために、クエリワード列又は商品情報エントリのテキストを解析し、前記解析ワードのワード特性をラベル付けし、前記文脈的に無関係なワードのリストに含まれる等位接続詞を識別するために、演算子ワードのワード特性を有する文脈的に無関係なワードのリストをチェックし、前記等位接続詞に基づいて、前記クエリワード列又は商品情報エントリのテキストをセグメント化し、前記クエリワード列の各セグメントについて、ある商品ワードのワード特性を有する少なくとも2つの解析ワードが前記各セグメントに含まれるか否かを判定し、前記ある商品ワードのワード特性を有する少なくとも2つの解析ワードが前記各セグメントに含まれる場合に、前記解析ワードのうちの最後のワードのワード特性をコア商品ワードとして設定すること、を備える方法。
適用例12:検索するためのシステムであって、前記システムは、少なくとも1つのプロセッサであって、クエリワード列を受信し、前記クエリワード列に関連する複数の商品情報エントリを検索し、前記クエリワード列から第1のコア商品ワードを抽出し、前記第1のコア商品ワードは最も小さな意味的単位であり、前記商品情報エントリから複数の第2のコア商品ワードを抽出し、前記第2のコア商品ワードは最も小さな意味的単位であり、各第2のコア商品ワードについて、キー商品ワードに関連する候補商品ワードリストに前記各第2のコア商品ワードが存在するか否かをチェックし、前記第1のコア商品ワードは前記キー商品ワードとマッチされ、前記各第2のコア商品ワードが候補商品ワードリストに存在する場合には、前記各第2のコア商品ワードに対応する商品情報エントリの重み付けを小さくし、前記候補商品ワードリストは候補商品ワードを含み、前記候補商品ワードに前記キー商品ワードを組み合わせることにより得られる合成商品ワードと前記キー商品ワードとは同じカテゴリーに属さず、前記商品情報エントリの調整された重み付けに従って、前記商品情報エントリをソートして出力するように構成されている少なくとも1つのプロセッサと、前記少なくとも1つのプロセッサに接続され、前記少なくとも1つのプロセッサに命令を与えるように構成されているメモリと、を備え、システム。
適用例13:適用例12に記載のシステムにおいて、前記少なくとも1つのプロセッサは、さらに、前記候補商品ワードリストを設定することように構成され 前記候補商品ワードリストを設定することは、データベースに含まれる前記商品情報エントリの各々に関して、最も大きな意味的単位による粗い粒度のセグメンテーションを実施し、前記セグメンテーションの結果に含まれる第3のコア商品ワードを抽出し、前記第3のコア商品ワードが前記セグメンテーションの結果から抽出されたか否かを判定し、前記第3のコア商品ワードが前記セグメンテーションの結果から抽出された場合に、最も小さな意味的単位による細かい粒度のセグメンテーションを実施し、取得されたワードのうち少なくとも2つが商品ワードであるか否かを判定し、取得されたワードのうち少なくとも2つが商品ワードである場合には、最初の商品ワードをキー商品ワードとして用い、最後の商品ワードを前記キー商品ワードの候補商品ワードとして用い、各キー商品ワードと各候補商品ワードとの相関性を算出し、前記各キー商品ワードと前記各候補商品ワードとの相関性が閾値を満たすか否かを判定し、前記閾値を満たす相関性を有する候補商品ワードを選択し、同じキー商品ワードに関して、前記選択された候補商品ワードに基づいて、候補商品ワードリストを作成することを備える、システム。
適用例14:検索を行うためのコンピュータプログラム製品であって、前記コンピュータプログラム製品は、一時的でないコンピュータ読み取り可能な記憶媒体内に体現化され、クエリワード列を受信し、前記クエリワード列に関連する複数の商品情報エントリを検索し、メモリにおける、前記クエリワード列から第1のコア商品ワードを抽出し、前記第1のコア商品ワードは最も小さな意味的単位であり、前記メモリにおける、前記商品情報エントリから複数の第2のコア商品ワードを抽出し、前記第2のコア商品ワードは最も小さな意味的単位であり、各第2のコア商品ワードについて、キー商品ワードに関連する候補商品ワードリストに前記各第2のコア商品ワードが存在するか否かをチェックし、前記第1のコア商品ワードは前記キー商品ワードとマッチされ、前記各第2のコア商品ワードが候補商品ワードリストに存在する場合には、前記各第2のコア商品ワードに対応する商品情報エントリの重み付けを小さくし、前記候補商品ワードリストは候補商品ワードを含み、前記候補商品ワードに前記キー商品ワードを組み合わせることにより得られる合成商品ワードと前記キー商品ワードとは同じカテゴリーに属さず、前記商品情報エントリの調整された重み付けに従って、前記商品情報エントリをソートして出力すること、を行わせるコンピュータ命令を備えるコンピュータプログラム製品。

Claims (14)

  1. 検索方法であって、
    クエリワード列を受信し、
    前記クエリワード列に関連する複数の商品情報エントリを検索し、
    メモリ内の前記クエリワード列から第1のコア商品ワードを抽出し、前記第1のコア商品ワードは最も小さな意味的単位であり、
    前記商品情報エントリからの複数の第2のコア商品ワードを前記メモリから抽出し、前記複数の第2のコア商品ワードは最も小さな意味的単位であり、
    各第2のコア商品ワードに関して、キー商品ワードに関連する候補商品ワードリストに前記各第2のコア商品ワードが存在するか否かをチェックし、前記第1のコア商品ワードは前記キー商品ワードとマッチされ、
    前記各第2のコア商品ワードが候補商品ワードリストに存在する場合には、前記各第2のコア商品ワードに対応する商品情報エントリの重み付けを小さくし、前記候補商品ワードリストは候補商品ワードを含み、前記候補商品ワードに前記キー商品ワードを組み合わせることにより得られる合成商品ワードと前記キー商品ワードとは同じカテゴリーに属さず、
    前記商品情報エントリの調整された重み付けに従って、前記商品情報エントリをソートして出力すること、を備える方法。
  2. 請求項1に記載の方法において、さらに、
    前記候補商品ワードリストを設定することであって
    データベースに含まれる前記商品情報エントリの各々に関して、最も大きな意味的単位による粗い粒度のセグメンテーションを実施して、前記セグメンテーションの結果に含まれる第3のコア商品ワードを抽出し、
    前記第3のコア商品ワードが前記セグメンテーションの結果から抽出されたか否かを判定することを含む、前記候補商品ワードリストを設定すことを、
    前記第3のコア商品ワードが前記セグメンテーションの結果から抽出された場合に、最も小さな意味的単位による細かい粒度のセグメンテーションを実施して、取得されたワードのうち少なくとも2つが商品ワードであるか否かを判定し、取得されたワードのうち少なくとも2つが商品ワードである場合には、最初の商品ワードをキー商品ワードとして用いるとともに、最後の商品ワードを前記キー商品ワードの候補商品ワードとして用い、
    各キー商品ワードと各候補商品ワードとの相関性を算出し、
    前記各キー商品ワードと前記各候補商品ワードとの相関性が閾値を満たすか否かを判定し、
    前記閾値を満たす相関性を有する候補商品ワードを選択し、
    同じキー商品ワードに関して、前記選択された候補商品ワードに基づいて、候補商品ワードリストを作成すること、を備える、方法。
  3. 請求項2に記載の方法において、
    前記各キー商品ワードと前記各候補商品ワードとの相関性を算出すること、前記各キー商品ワードと前記各候補商品ワードとの相関性が前記閾値を満たすか否かを判定すること、及び、前記閾値を満たす相関性を有する前記候補商品ワードを選択することは、
    前記各キー商品ワードと前記各候補商品ワードとについて、前記各キー商品ワードのカテゴリーに対するクリック率に基づいて前記各キー商品ワードをベクトル化してベクトルを取得し、前記各候補商品ワードのカテゴリーに対するクリック率に基づいて前記各候補商品ワードをベクトル化してベクトルを取得し、
    前記キー商品ワードに対応するベクトルと前記候補商品ワードに対応するベクトルとの間の角度値を算出し、
    前記角度値の間の相関性を算出し、
    角度値に基づいて、各候補商品ワードの相関性が閾値を満たすか否かを判定し、
    前記角度値に基づいて、前記閾値を満たす相関性を有する候補商品ワードを選択すること、を備える、方法。
  4. 請求項3に記載の方法において、
    前記各キー商品ワードと前記各候補商品ワードとについて、前記キー商品ワードのカテゴリーに対する前記クリック率を用いて前記各キー商品ワードをベクトル化してベクトルを取得し、前記各候補商品ワードのカテゴリーに対する前記クリック率を用いて前記各候補商品ワードをベクトル化してベクトルを取得することは、
    前記各キー商品ワードと前記各候補商品ワードとについて、検索ログから、それぞれの関連カテゴリーのクリック率を別々に分析及び作表することにより、各関連カテゴリーに関する重み付けのリストを取得し、
    前記各キー商品ワードの重み付けのリストにおける個々の値をベクトルに変換し、
    前記各候補商品ワードの重み付けのリストにおける個々の値をベクトルに変換すること、を備える方法。
  5. 請求項4に記載の方法において、
    前記各キー商品ワードに対応するベクトルと前記各候補商品ワードに対応するベクトルとの間の角度値を算出すること、及び、前記角度値に基づいて前記閾値を満たす相関性を有する候補商品ワードを選択することは、
    前記ベクトルの余弦角度値を算出し、
    前記余弦角度値が前記閾値よりも大きいか否かを判定し、
    前記余弦角度値が前記閾値よりも大きい場合に、候補商品ワードを削除すること、を備える方法。
  6. 請求項2に記載の方法であって、
    前記各キー商品ワードと前記各候補商品ワードとの相関性を算出すること、及び、前記閾値を満たす相関性を有する前記候補商品ワードを選択することは、
    前記各キー商品ワードと前記各候補商品ワードとについて、各キー商品ワードのカテゴリークリック率、属性クリック率及び商品ワードクリック率の3つの次元を用いて前記各キー商品ワードを別々にベクトル化し、各候補商品ワードのカテゴリークリック率、属性クリック率及び商品ワードクリック率の3つの次元を用いて前記各候補商品ワードを別々にベクトル化し、
    各次元に関して、前記3つの次元の前記各キー商品ワードに対応するベクトルと前記各候補商品ワードに対応するベクトルとの間の角度値を算出し、
    前記3つの次元に関して得られた角度値に基づいて、前記各候補商品ワードの相関性が前記閾値を満たすか否かを判定し、
    前記閾値を満たす相関性を有する候補商品ワードを選択すること、を備える方法。
  7. 請求項6に記載の方法において、
    前記各キー商品ワードと前記各候補商品ワードとについて、各キー商品ワードのカテゴリークリック率、属性クリック率及び商品ワードクリック率の3つの次元を用いて前記各キー商品ワードをベクトル化し、各候補商品ワードのカテゴリークリック率、属性クリック率及び商品ワードクリック率の3つの次元を用いて前記各候補商品ワードをベクトル化することは、
    前記各候補商品ワードと前記各候補商品ワードとについて、検索ログの分析及び検索を行い、前記各キー商品ワードを介してクリックされた商品情報エントリと前記候補商品ワードを介してクリックされた各商品情報エントリとを検索し、
    前記キー商品ワードに対応する第1のカテゴリークリック率リストと、前記商品情報エントリの属性に関する対応する第1の属性クリック率リストと、前記商品情報エントリのコア商品ワードに関する対応する第1の商品ワードクリック率リストとの表を作成し、
    前記候補商品ワードに対応する第2のカテゴリークリック率リストと、前記商品情報エントリの属性に関する対応する第2の属性クリック率リストと、前記商品情報エントリのコア商品ワードに関する対応する第2の商品ワードクリック率リストとの表を作成し、
    前記第1のカテゴリークリック率リストと、前記第1の属性クリック率リストと、前記第1の商品ワードクリック率リストと、前記第2のカテゴリークリック率リストと、前記第2の属性クリック率リストと、前記第2の商品ワードクリック率リストとを対応するベクトルに変換すること、を備える方法。
  8. 請求項7に記載の方法であって、
    各次元に関して、前記各キー商品ワードに対応するベクトルと前記各候補商品ワードに対応するベクトルとの間の角度値を算出すること、及び、前記3つの次元に関して得られた角度値に基づいて前記閾値を満たす相関性を有する候補商品ワードを選択することは、
    カテゴリークリック率相関性を取得するために、前記第1のカテゴリークリック率に対応するベクトルと前記第2のカテゴリークリック率に対応するベクトルとの間の余弦角度値を算出し、
    属性クリック率相関性を取得するために、前記第1の属性クリック率に対応するベクトルと前記第2の属性クリック率に対応するベクトルとの間の余弦角度値を算出し、
    商品ワードクリック率相関性を取得するために、前記第1の商品ワードクリック率に対応するベクトルと前記第2の商品ワードクリック率に対応するベクトルとの間の余弦角度値を算出し、
    前記キー商品ワードと前記候補商品ワードとの全体的な類似性を取得するために、前記カテゴリークリック率相関性と、前記属性クリック率相関性と、前記商品ワードクリック率相関性との線形的重み付けを行い、
    前記全体的な類似性が閾値よりも大きいか否かを判定し、
    前記全体的な類似性が前記閾値よりも大きい場合に、候補商品ワードを削除すること、を備える方法。
  9. 請求項2に記載の方法において、
    前記キー商品ワードの前記候補商品ワードとして最後の商品ワードを用いることは、
    前記最後の商品ワードを、関連商品情報エントリの第2のコア商品ワードとして設定し、
    前記対応する商品情報エントリを記憶させること、を備える方法。
  10. 請求項9に記載の方法において、
    前記商品情報エントリに対応する第2のコア商品ワードを抽出することは、
    前記メモリから、前記商品情報エントリの前記第2のコア商品ワードを抽出すること、を備える方法。
  11. 請求項1に記載の方法において、
    前記第2のコア商品ワードを抽出することは、
    解析ワードを取得するために、クエリワード列又は商品情報エントリのテキストを解析し、
    前記解析ワードのワード特性をラベル付けし、
    前記文脈的に無関係なワードのリストに含まれる等位接続詞を識別するために、演算子ワードのワード特性を有する文脈的に無関係なワードのリストをチェックし、
    前記等位接続詞に基づいて、前記クエリワード列又は商品情報エントリのテキストをセグメント化し、
    前記クエリワード列の各セグメントについて、ある商品ワードのワード特性を有する少なくとも2つの解析ワードが前記各セグメントに含まれるか否かを判定し、前記ある商品ワードのワード特性を有する少なくとも2つの解析ワードが前記各セグメントに含まれる場合に、前記解析ワードのうちの最後のワードのワード特性をコア商品ワードとして設定すること、を備える方法。
  12. 検索するためのシステムであって、
    前記システムは、
    少なくとも1つのプロセッサであって、
    クエリワード列を受信し、
    前記クエリワード列に関連する複数の商品情報エントリを検索し、
    前記クエリワード列から第1のコア商品ワードを抽出し、前記第1のコア商品ワードは最も小さな意味的単位であり、
    前記商品情報エントリから複数の第2のコア商品ワードを抽出し、前記第2のコア商品ワードは最も小さな意味的単位であり、
    各第2のコア商品ワードについて、キー商品ワードに関連する候補商品ワードリストに前記各第2のコア商品ワードが存在するか否かをチェックし、前記第1のコア商品ワードは前記キー商品ワードとマッチされ、
    前記各第2のコア商品ワードが候補商品ワードリストに存在する場合には、前記各第2のコア商品ワードに対応する商品情報エントリの重み付けを小さくし、前記候補商品ワードリストは候補商品ワードを含み、前記候補商品ワードに前記キー商品ワードを組み合わせることにより得られる合成商品ワードと前記キー商品ワードとは同じカテゴリーに属さず、
    前記商品情報エントリの調整された重み付けに従って、前記商品情報エントリをソートして出力するように構成されている少なくとも1つのプロセッサと、
    前記少なくとも1つのプロセッサに接続され、前記少なくとも1つのプロセッサに命令を与えるように構成されているメモリと、を備え、システム。
  13. 請求項12に記載のシステムにおいて、
    前記少なくとも1つのプロセッサは、さらに、
    前記候補商品ワードリストを設定することように構成され 前記候補商品ワードリストを設定することは、
    データベースに含まれる前記商品情報エントリの各々に関して、最も大きな意味的単位による粗い粒度のセグメンテーションを実施し、前記セグメンテーションの結果に含まれる第3のコア商品ワードを抽出し、
    前記第3のコア商品ワードが前記セグメンテーションの結果から抽出されたか否かを判定し、
    前記第3のコア商品ワードが前記セグメンテーションの結果から抽出された場合に、最も小さな意味的単位による細かい粒度のセグメンテーションを実施し、取得されたワードのうち少なくとも2つが商品ワードであるか否かを判定し、取得されたワードのうち少なくとも2つが商品ワードである場合には、最初の商品ワードをキー商品ワードとして用い、最後の商品ワードを前記キー商品ワードの候補商品ワードとして用い、
    各キー商品ワードと各候補商品ワードとの相関性を算出し、
    前記各キー商品ワードと前記各候補商品ワードとの相関性が閾値を満たすか否かを判定し、
    前記閾値を満たす相関性を有する候補商品ワードを選択し、
    同じキー商品ワードに関して、前記選択された候補商品ワードに基づいて、候補商品ワードリストを作成することを備える、システム。
  14. 検索を行うためのコンピュータプログラム製品であって、
    前記コンピュータプログラム製品は、一時的でないコンピュータ読み取り可能な記憶媒体内に体現化され、
    クエリワード列を受信し、
    前記クエリワード列に関連する複数の商品情報エントリを検索し、
    メモリにおける、前記クエリワード列から第1のコア商品ワードを抽出し、前記第1のコア商品ワードは最も小さな意味的単位であり、
    前記メモリにおける、前記商品情報エントリから複数の第2のコア商品ワードを抽出し、前記第2のコア商品ワードは最も小さな意味的単位であり、
    各第2のコア商品ワードについて、キー商品ワードに関連する候補商品ワードリストに前記各第2のコア商品ワードが存在するか否かをチェックし、前記第1のコア商品ワードは前記キー商品ワードとマッチされ、
    前記各第2のコア商品ワードが候補商品ワードリストに存在する場合には、前記各第2のコア商品ワードに対応する商品情報エントリの重み付けを小さくし、前記候補商品ワードリストは候補商品ワードを含み、前記候補商品ワードに前記キー商品ワードを組み合わせることにより得られる合成商品ワードと前記キー商品ワードとは同じカテゴリーに属さず、
    前記商品情報エントリの調整された重み付けに従って、前記商品情報エントリをソートして出力すること、を行わせるコンピュータ命令を備えるコンピュータプログラム製品。
JP2015509221A 2012-05-22 2013-05-16 オンライン商品検索方法およびシステム Active JP5916947B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
CN201210160827.X 2012-05-22
CN201210160827.XA CN103425691B (zh) 2012-05-22 2012-05-22 一种搜索方法和系统
US13/894,827 2013-05-15
US13/894,827 US9563665B2 (en) 2012-05-22 2013-05-15 Product search method and system
PCT/US2013/041414 WO2013176961A1 (en) 2012-05-22 2013-05-16 On-line product search method and system

Publications (2)

Publication Number Publication Date
JP2015518220A true JP2015518220A (ja) 2015-06-25
JP5916947B2 JP5916947B2 (ja) 2016-05-11

Family

ID=49622409

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015509221A Active JP5916947B2 (ja) 2012-05-22 2013-05-16 オンライン商品検索方法およびシステム

Country Status (6)

Country Link
US (1) US9563665B2 (ja)
JP (1) JP5916947B2 (ja)
KR (1) KR101700585B1 (ja)
CN (1) CN103425691B (ja)
TW (1) TW201348991A (ja)
WO (1) WO2013176961A1 (ja)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9524520B2 (en) * 2013-04-30 2016-12-20 Wal-Mart Stores, Inc. Training a classification model to predict categories
US9524319B2 (en) 2013-04-30 2016-12-20 Wal-Mart Stores, Inc. Search relevance
CN103810241B (zh) * 2013-11-22 2017-04-05 北京奇虎科技有限公司 一种低频点击的过滤方法和装置
CN104008186B (zh) * 2014-06-11 2018-10-16 北京京东尚科信息技术有限公司 从目标文本中确定关键词的方法和装置
CN105653553B (zh) * 2014-11-14 2020-04-03 腾讯科技(深圳)有限公司 词权重生成方法和装置
CN105992178B (zh) * 2015-02-06 2019-06-25 中国移动通信集团公司 一种垃圾短信识别方法及装置
WO2016176099A1 (en) * 2015-04-28 2016-11-03 Alibaba Group Holding Limited Information search navigation method and apparatus
CN106156244B (zh) * 2015-04-28 2020-08-28 阿里巴巴集团控股有限公司 一种信息搜索导航方法及装置
CN106294481B (zh) * 2015-06-05 2019-10-22 阿里巴巴集团控股有限公司 一种基于图谱的导航方法及装置
CN104899322B (zh) * 2015-06-18 2021-09-17 百度在线网络技术(北京)有限公司 搜索引擎及其实现方法
US10846275B2 (en) * 2015-06-26 2020-11-24 Pure Storage, Inc. Key management in a storage device
CN105069086B (zh) * 2015-07-31 2017-07-11 焦点科技股份有限公司 一种优化电子商务商品搜索的方法及系统
CN106919603B (zh) * 2015-12-25 2020-12-04 北京奇虎科技有限公司 计算查询词模式中分词权重的方法和装置
CN106339510B (zh) * 2016-10-28 2019-12-06 北京百度网讯科技有限公司 基于人工智能的点击预估方法及装置
CN108062302B (zh) * 2016-11-08 2019-03-26 北京国双科技有限公司 一种文本信息的识别方法及装置
CN106649276B (zh) * 2016-12-29 2019-02-26 北京京东尚科信息技术有限公司 标题中核心产品词的识别方法以及装置
GB201713728D0 (en) * 2017-08-25 2017-10-11 Just Eat Holding Ltd System and method of language processing
CN110020157A (zh) * 2017-12-08 2019-07-16 北京京东尚科信息技术有限公司 数据处理方法、系统、计算机系统及存储介质
CN108804540B (zh) * 2018-05-08 2020-12-22 苏州闻道网络科技股份有限公司 搜索引擎链接分析系统及分析方法
CN111400577B (zh) * 2018-12-14 2023-06-30 阿里巴巴集团控股有限公司 一种搜索召回方法及装置
CN111488497B (zh) * 2019-01-25 2023-05-12 北京沃东天骏信息技术有限公司 字符串集合的相似度确定方法、装置、终端及可读介质
US11159679B2 (en) * 2019-02-26 2021-10-26 Cigna Taiwan Life Assurance Co. Ltd. Automated systems and methods for natural language processing with speaker intention inference
CN110263127A (zh) * 2019-06-21 2019-09-20 北京创鑫旅程网络技术有限公司 基于用户查询词进行文本搜索方法及装置
KR102358357B1 (ko) * 2019-09-10 2022-02-04 한국과학기술정보연구원 시장규모추정장치 및 그 동작 방법
EP3770840A1 (en) * 2020-02-07 2021-01-27 ChannelSight Limited Method and system for determining product similarity in digital domains
US20210295410A1 (en) * 2020-03-23 2021-09-23 Oath Inc. Computerized system and method for applying transfer learning for generating a multi-variable based unified recommendation
KR102456012B1 (ko) * 2022-06-10 2022-10-18 주식회사 애자일소다 인공지능 기반의 분류 모델링 장치 및 방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04262460A (ja) * 1991-02-15 1992-09-17 Ricoh Co Ltd 情報検索装置
JPH08129554A (ja) * 1994-05-25 1996-05-21 Fuji Xerox Co Ltd 関係表現抽出装置および関係表現検索装置
JPH1078969A (ja) * 1996-09-03 1998-03-24 Nippon Telegr & Teleph Corp <Ntt> 情報検索装置
US20090076927A1 (en) * 2007-08-27 2009-03-19 Google Inc. Distinguishing accessories from products for ranking search results

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01234975A (ja) 1988-03-11 1989-09-20 Internatl Business Mach Corp <Ibm> 日本語文章分割装置
US6202058B1 (en) * 1994-04-25 2001-03-13 Apple Computer, Inc. System for ranking the relevance of information objects accessed by computer users
US7133835B1 (en) 1995-08-08 2006-11-07 Cxn, Inc. Online exchange market system with a buyer auction and a seller auction
EP1204032A4 (en) * 1999-12-21 2008-06-11 Matsushita Electric Ind Co Ltd CREATION OF A VECTORIAL INDEX, SEARCH FOR SIMILAR VECTORS AND CORRESPONDING DEVICES
US7092871B2 (en) 2000-07-20 2006-08-15 Microsoft Corporation Tokenizer for a natural language processing system
US20020157116A1 (en) 2000-07-28 2002-10-24 Koninklijke Philips Electronics N.V. Context and content based information processing for multimedia segmentation and indexing
US7403938B2 (en) 2001-09-24 2008-07-22 Iac Search & Media, Inc. Natural language query processing
US7805302B2 (en) 2002-05-20 2010-09-28 Microsoft Corporation Applying a structured language model to information extraction
US7756847B2 (en) 2003-03-03 2010-07-13 Koninklijke Philips Electronics N.V. Method and arrangement for searching for strings
US8055669B1 (en) * 2003-03-03 2011-11-08 Google Inc. Search queries improved based on query semantic information
US7424421B2 (en) 2004-03-03 2008-09-09 Microsoft Corporation Word collection method and system for use in word-breaking
JP4754247B2 (ja) 2004-03-31 2011-08-24 オセ−テクノロジーズ ビーブイ 複合語を構成する単語を割り出す装置及びコンピュータ化された方法
US20080077570A1 (en) * 2004-10-25 2008-03-27 Infovell, Inc. Full Text Query and Search Systems and Method of Use
US8200687B2 (en) 2005-06-20 2012-06-12 Ebay Inc. System to generate related search queries
US20070067098A1 (en) 2005-09-19 2007-03-22 Zelentsov Oleg U Method and system for identification of geographic location
US8255383B2 (en) 2006-07-14 2012-08-28 Chacha Search, Inc Method and system for qualifying keywords in query strings
WO2008019007A2 (en) 2006-08-04 2008-02-14 Thefind, Inc. Method for relevancy ranking of products in online shopping
US7917493B2 (en) * 2007-04-19 2011-03-29 Retrevo Inc. Indexing and searching product identifiers
JP2008287406A (ja) 2007-05-16 2008-11-27 Sony Corp 情報処理装置および情報処理方法、プログラム、並びに、記録媒体
US8301633B2 (en) 2007-10-01 2012-10-30 Palo Alto Research Center Incorporated System and method for semantic search
US8019748B1 (en) * 2007-11-14 2011-09-13 Google Inc. Web search refinement
CN100557612C (zh) * 2007-11-15 2009-11-04 深圳市迅雷网络技术有限公司 一种基于搜索引擎的搜索结果排序方法及装置
CN101281525B (zh) * 2007-11-23 2010-06-02 北京九城网络软件有限公司 一种互联网上基于知识库的搜索系统和方法
JP5343861B2 (ja) 2007-12-27 2013-11-13 日本電気株式会社 テキスト分割装置とテキスト分割方法およびプログラム
US7895205B2 (en) * 2008-03-04 2011-02-22 Microsoft Corporation Using core words to extract key phrases from documents
CN101246472B (zh) 2008-03-28 2010-10-06 腾讯科技(深圳)有限公司 一种汉语文本的大、小粒度切分实现方法和装置
JP4979637B2 (ja) 2008-06-06 2012-07-18 ヤフー株式会社 複合語の区切り位置を推定する複合語区切り推定装置、方法、およびプログラム
US8862989B2 (en) 2008-06-25 2014-10-14 Microsoft Corporation Extensible input method editor dictionary
US8108406B2 (en) * 2008-12-30 2012-01-31 Expanse Networks, Inc. Pangenetic web user behavior prediction system
US8515966B2 (en) * 2009-01-09 2013-08-20 Ebay Inc. Analyzing queries to generate product intention rules
EP2259252B1 (en) 2009-06-02 2012-08-01 Nuance Communications, Inc. Speech recognition method for selecting a combination of list elements via a speech input
CN101957828B (zh) * 2009-07-20 2013-03-06 阿里巴巴集团控股有限公司 一种对搜索结果进行排序的方法和装置
CN102012900B (zh) 2009-09-04 2013-01-30 阿里巴巴集团控股有限公司 信息检索方法和系统
CN101655838B (zh) 2009-09-10 2011-12-14 复旦大学 一种粒度可量化的话题提取方法
US20110093331A1 (en) * 2009-10-19 2011-04-21 Donald Metzler Term Weighting for Contextual Advertising
US9348892B2 (en) 2010-01-27 2016-05-24 International Business Machines Corporation Natural language interface for faceted search/analysis of semistructured data
WO2011100573A1 (en) 2010-02-12 2011-08-18 Google Inc. Compound splitting
CN102236663B (zh) 2010-04-30 2014-04-09 阿里巴巴集团控股有限公司 一种基于垂直搜索的查询方法、系统和装置
US8515968B1 (en) * 2010-08-13 2013-08-20 Google Inc. Tie breaking rules for content item matching
CN102479191B (zh) * 2010-11-22 2014-03-26 阿里巴巴集团控股有限公司 提供多粒度分词结果的方法及其装置
CA2721498C (en) 2010-11-25 2011-08-02 Microsoft Corporation Efficient use of exceptions in text segmentation
US20120191745A1 (en) * 2011-01-24 2012-07-26 Yahoo!, Inc. Synthesized Suggestions for Web-Search Queries
US20120317088A1 (en) * 2011-06-07 2012-12-13 Microsoft Corporation Associating Search Queries and Entities

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04262460A (ja) * 1991-02-15 1992-09-17 Ricoh Co Ltd 情報検索装置
JPH08129554A (ja) * 1994-05-25 1996-05-21 Fuji Xerox Co Ltd 関係表現抽出装置および関係表現検索装置
JPH1078969A (ja) * 1996-09-03 1998-03-24 Nippon Telegr & Teleph Corp <Ntt> 情報検索装置
US20090076927A1 (en) * 2007-08-27 2009-03-19 Google Inc. Distinguishing accessories from products for ranking search results

Also Published As

Publication number Publication date
US9563665B2 (en) 2017-02-07
JP5916947B2 (ja) 2016-05-11
CN103425691A (zh) 2013-12-04
CN103425691B (zh) 2016-12-14
KR101700585B1 (ko) 2017-01-31
WO2013176961A1 (en) 2013-11-28
KR20150010740A (ko) 2015-01-28
US20130318101A1 (en) 2013-11-28
TW201348991A (zh) 2013-12-01

Similar Documents

Publication Publication Date Title
JP5916947B2 (ja) オンライン商品検索方法およびシステム
CN107729336B (zh) 数据处理方法、设备及系统
WO2020108608A1 (zh) 搜索结果处理方法、装置、终端、电子设备及存储介质
CN111008321B (zh) 基于逻辑回归推荐方法、装置、计算设备、可读存储介质
CN110633330B (zh) 事件发现方法、装置、设备及存储介质
US20180089316A1 (en) Seamless integration of modules for search enhancement
WO2018040069A1 (zh) 信息推荐系统及方法
US20100079464A1 (en) Information processing apparatus capable of easily generating graph for comparing of a plurality of commercial products
US20160239865A1 (en) Method and device for advertisement classification
CN103425687A (zh) 一种基于关键词的检索方法和系统
WO2021189951A1 (zh) 文本搜索方法、装置、计算机设备和存储介质
CN112307366B (zh) 一种信息展示的方法、装置及计算机存储介质
US20110302167A1 (en) Systems, Methods and Computer Program Products for Processing Accessory Information
CN103309869A (zh) 数据对象的展示关键词推荐方法及系统
CN110766486A (zh) 确定物品类目的方法和装置
CN107885717B (zh) 一种关键词提取方法及装置
CN111475725A (zh) 用于搜索内容的方法、装置、设备和计算机可读存储介质
CN110543484A (zh) 提示词的推荐方法及装置、存储介质和处理器
CN114756570A (zh) 采购场景的垂直搜索方法、装置和系统
CN104881446A (zh) 搜索方法及装置
CN111400436A (zh) 一种基于用户意图识别的搜索方法以及装置
CN111737607A (zh) 数据处理方法、装置、电子设备以及存储介质
CN111144122A (zh) 评价处理方法、装置和计算机系统及介质
CN114528378A (zh) 文本分类方法、装置、电子设备及存储介质
WO2015159702A1 (ja) 部分情報抽出システム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151013

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151020

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20160118

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160217

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160315

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160405

R150 Certificate of patent or registration of utility model

Ref document number: 5916947

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250