JP2015526831A - 製品識別子のラベル付けおよび製品のナビゲーション - Google Patents

製品識別子のラベル付けおよび製品のナビゲーション Download PDF

Info

Publication number
JP2015526831A
JP2015526831A JP2015530142A JP2015530142A JP2015526831A JP 2015526831 A JP2015526831 A JP 2015526831A JP 2015530142 A JP2015530142 A JP 2015530142A JP 2015530142 A JP2015530142 A JP 2015530142A JP 2015526831 A JP2015526831 A JP 2015526831A
Authority
JP
Japan
Prior art keywords
text
product
products
description information
subject
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015530142A
Other languages
English (en)
Other versions
JP6379093B2 (ja
Inventor
スン チャンロン
スン チャンロン
ゾン アンシアン
ゾン アンシアン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Publication of JP2015526831A publication Critical patent/JP2015526831A/ja
Application granted granted Critical
Publication of JP6379093B2 publication Critical patent/JP6379093B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/954Navigation, e.g. using categorised browsing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Machine Translation (AREA)

Abstract

本開示は、製品識別子をラベル付けする例となる方法および装置ならびに製品をナビゲートする方法を提供する。1つ以上の製品の記述情報が抽出される。製品の記述情報が、テキストにクラスタ化される。主題モデルに基づくテキスト分析法を使用することによって主題分析がテキストに適用され、1つ以上の主題およびその主題に対する定義名を取得する。製品の記述情報に関連付けられる主題は、製品にラベルを付けるために製品の識別子として使用される。本技術は、ユーザーが容易かつ直感的に彼らの所望の製品を見付けることができるように、製品を1つ以上のユーザー次元属性を有する識別子でラベルを付ける。

Description

(関連特許出願の相互参照)
本出願は、2012年9月5日に出願された「Method and Apparatus of Labeling Product Identifiers and Method of Navigating Products」と題される中国特許出願第201210326456.8号の外国優先権を主張するものであり、それは参照によってその全体が本明細書に組み込まれる。
本開示は、電子商取引のウェブサイトナビゲーションの分野に関し、より具体的には、製品識別子をラベル付けする方法および装置ならびに製品をナビゲートする方法に関する。
現在、電子商取引サイトは、基本的にカテゴリナビゲーションおよび属性ナビゲーションを使用して、ナビゲーション情報をユーザーに提供する。
ほとんどのカテゴリナビゲーションは、ツリー構造で表される。ユーザーは、検索を制限するためにカテゴリナビゲーションガイドのコンテンツをクリックし、次いで属性ナビゲーションを使用してユーザーの所望の製品を正確に見付ける。
他の型のナビゲーションと比較して、属性ナビゲーションはより多様である。しかしながら、それが一般的な属性ナビゲーションであるか、または個別の属性ナビゲーションであるかどうかに関わらず、従来の属性ナビゲーションによって表示される識別子は、製品の固定属性であり、またそのような識別子は、ユーザーがナビゲーションを通して製品を見付けることができるように製品上にラベル付けされる。識別子は、販売者が製品をアップロードする際に、販売者によって提供される情報に関する。識別子は、その後手動審査を通過し、最終的に製品上にラベル付けされる。属性ナビゲーションによって表示されるコンテンツもまた、製品の固定属性を記述する識別子である。衣料製品の例では、従来の属性ナビゲーションは、ブランド、材料、サイズ、基本的なスタイル等の衣類の固定属性の記述を表示することしかできない。
上記従来の技術において、製品ラベルの識別子の形式は、あまりに簡易化されているため、ユーザーが製品を選択するために役立たない。ナビゲーションガイドに表示されるコンテンツは、製品の固定属性を記述する識別子だけである。いくつかの識別子は、ユーザーが理解するのは容易ではなく、ユーザーの要望を直接反映することができない。現在のところ、ユーザーは、より多くの製品の観点から製品に注目している。より多くの製品の種類および数量も存在する。各製品の情報量もまた、ますます大きくなっている。ユーザーの注目する観点からそのような大量の製品情報を分類することが重要である。
本要約は、以下の発明を実施するための形態にさらに記述されている簡易化された形式で選択されたの概念を紹介するために提供される。本要約は、特許請求される発明の主題のすべての重要な特徴または必須の特徴を認定することは意図されておらず、特許請求される発明の主題の範囲を決定する上での支援として単独で用いられることも意図されていない。例えば、「技術」という用語は、上の文脈によって、および本開示の全体を通して容認される、装置(複数可)、システム(複数可)、方法(複数可)、および/またはコンピュータ可読命令を指し得る。
本開示は、製品識別子をラベル付けする方法および装置ならびにユーザーが製品を見付けるために製品をナビゲートする方法を提供する。
本開示は、製品識別子をラベル付けする一例となる方法を提供する。1つ以上の製品の記述情報が抽出される。製品の記述情報が、テキストにクラスタ化される。主題モデルに基づくテキスト分析法を使用することによって主題分析がテキストに適用され、1つ以上の主題を取得し、かつその主題に対して名前を定義する。それぞれの製品の記述情報に関連付けられる主題は、製品にラベルを付けるためにそれぞれの製品の識別子として使用される。
本開示はまた、製品をナビゲートする一例となる方法も提供する。1つ以上の製品の記述情報が抽出される。製品の記述情報が、テキストにクラスタ化される。主題モデルに基づくテキスト分析法を使用することによって主題分析がテキストに適用され、1つ以上の主題を取得する。製品は、主題に関連付けられる。製品は、それぞれの製品に関連付けられるそれぞれの主題によってナビゲートされる。
本開示は、製品識別子をラベル付けする一例となる装置を提供する。本装置は、抽出モジュール、生成モジュール、分析モジュール、および第1のラベル付けモジュールを含み得る。抽出モジュールは、1つ以上の製品の記述情報を抽出する。生成モジュールは、製品の記述情報をテキストにクラスタ化する。分析モジュールは、主題モデルに基づくテキスト分析法を使用することによって主題分析をテキストに適用し、1つ以上の主題を取得し、かつその主題に対して名前を定義する。第1のラベル付けモジュールは、それぞれの製品にラベルを付けるために製品の識別子としてそれぞれの製品の記述情報に関連付けられる主題を使用する。
このようにして、本技術は、製品の記述情報のクラスタ化されたテキストを分析し、製品にラベルを付けるためにユーザーの次元での観点から1つ以上のラベルを取得する。従来のナビゲーション技術とは異なり、本技術は、ユーザーが製品の情報を分類し、ナビゲートすることが容易であり、製品の情報をユーザーに提供する正確さおよび効率を向上し得る。本技術によって確立された製品のナビゲーションガイドまたは識別子は、ユーザーがより容易に所望の製品を見付けることができるように、より多様化されており、インテリジェントである。
本開示の実施形態をわかりやすく例示するため、実施形態の説明において使用される図面を以下簡単に導入する。以下の図面は、本開示のいくつかの実施形態に関するものに過ぎないことは明白である。当業者であれば、創造的な努力をせずに、本開示における図面に従って、他の図面を取得することができる。例となる実施形態およびそれらの明細は、本開示を例示するために用いられ、本開示に対する不適切な制限を構成するものではない。
本開示の一例となる実施形態に従って、製品識別子をラベル付けする一例となる方法を実装する一例となるシステムの略図である。 本開示の例となる実施形態に従って、製品識別子をラベル付けする一例となる方法の流れ図である。 本開示の例となる実施形態に従って、製品をナビゲートする一例となる方法の流れ図である。 本開示の例となる実施形態に従って、製品識別子をラベル付けする一例となる装置の略図である。 本開示の例となる実施形態に従って、製品識別子をラベル付けする別の例となる装置の略図である。
本技術は、図面および例となる実施形態を参照して以下詳細に記述される。
本開示は、製品識別子をラベル付けする一例となる方法を提供する。1つ以上の製品の記述情報が、抽出される。製品の記述情報が、テキストにクラスタ化される。1つ以上の主題モデルに基づくテキスト分析法を使用することによって主題分析がテキストに適用され、1つ以上の主題を取得し、かつその主題に対して名前を定義する。それぞれの製品の記述情報に関連付けられる主題は、それぞれの製品にラベルを付けるためにそれぞれの製品の識別子として使用される。
図1は、本開示の一例となる実施形態に従って、製品識別子をラベル付けする一例となる方法を実装する一例となるシステム100の略図である。システム100は、1つ以上の端末(複数可)102およびサーバ104を含む。端末(複数可)102は、例えば、購買者端末106、および販売者端末108を含み得る。販売者端末106を通して販売者が製品を公開すると、サーバ104は、インターネットを通して販売者から提供される製品の記述情報を受信する。記述情報は、表題情報および属性情報(これは製品の固定属性および製品のユーザー次元属性を含み得る)を含み得る。
例えば、販売者によって提供される製品は、1組の女性用靴である。販売者が製品を公開する際、販売者は材料、スタイル、高さ等のその女性用靴の表題情報および属性情報をアップロードする。サーバ104は、販売者によってアップロードされた製品の記述情報および/またはデータベースに事前に保存された製品の記述情報を抽出する。製品情報は、テキストにクラスタ化される。主題モデルに基づくテキスト分析法を使用することによって主題分析がテキストに適用され、1つ以上の主題を取得し、かつその主題に対して名前を定義する。製品の記述情報に関連付けられる主題は、製品にラベルを付けるために製品の識別子として使用される。
主題の名前は、製品の1つ以上のユーザー次元属性に従って定義される。製品のユーザー次元属性は、ユーザーの1つ以上の観点から製品を記述する。このため、ユーザー次元属性を有する主題の名前は、製品にラベルを付けるための識別子として使用される。そのような名前は、所望の製品を選択するユーザーの選択習慣に近く、ユーザーが直接および正確に所望の製品を見付けることを可能にする。
図2は、本開示の例となる実施形態に従って、製品識別子をラベル付けする一例となる方法の流れ図である。実行する実体は、サーバ等のハードウェア、ソフトウェア、またはそれらの組み合わせであり得る。製品識別子をラベル付けする例となる方法は、以下の202〜208の動作を含む。
202において、製品の記述情報が抽出される。記述情報は、販売者によってアップロードされた製品の記述情報および/またはデータベースに事前に保存された製品の記述情報を含み得る。
204において、製品の記述情報が、テキストにクラスタ化される。
例えば、同じモデルの製品等の同じ型の製品がクラスタ化される。例えば、同じモデル等の同じ型を有する製品は、製品の写真間の同一または類似の程度に従ってクラスタ化されてもよい。そのような製品の記述情報がクラスタ化される。クラスタ化された記述情報は、用語に分割される。クラスタ化された記述情報中の用語頻度が第1の閾値よりも高い1つ以上の用語が排除され、クラスタ化された記述情報中の用語頻度が第2の閾値よりも低い1つ以上の用語もまた排除される。(換言すると、クラスタ化された記述情報において高すぎるか、または低すぎる頻度を有する用語が排除される。)クラスタ化された記述情報は、そのような用語の排除後に、同じ型またはモデルの製品の汎用記述テキストとして使用される。第1の閾値は、第2の閾値よりも高い。製品の記述情報、特に製品の表題情報は、ユーザーの選択習慣に基づいて販売者によって一般的に定義される。記述情報において高すぎるか、または低すぎる頻度を有する用語の排除後、いくつかの一般的に使用されるカテゴリの製品の用語および製品の固定属性に関連するいくつかの用語もまた排除される。このため、上述の処理からの汎用記述テキストは、1つ以上のユーザー次元属性を有する1つ以上の用語を含む。
例えば、女性用衣類のカテゴリには、9千万を超える製品がある場合がある。同じモデル等の同じ型を持つ製品は、同一または類似の製品の写真に従ってクラスタ化されてもよい。異なる販売者が製品の表題の異なる記述を有し得るため、同じ型またはモデルの製品の表題は、製品を完全に説明するテキストを形成するようにクラスタ化される。クラスタ化された記述テキストは非常に複雑かつ長い場合があり、例えば、高すぎる、または低すぎる頻度を有する用語を分割および排除することによってさらに処理されてもよい。例えば、同じモデルを有する女性用衣類のクラスタ化された記述テキストは、「2012ミディアムおよびロングスタイル女性用衣類上品な女性伸縮性大きいサイズシフォンシャツ半袖シャツ柔らかいコウモリTシャツ」であり得る。この処理の後、「2012」、「女性用衣類」、「半袖シャツ」、「Tシャツ」等の高い用語頻度を有するいくつかの検索用語が削除される。女性用衣類の特定のモデルの汎用記述テキストは、「ミディアムおよびロングスタイル上品な女性伸縮性大きいサイズシフォンシャツ」である。上記方法に従って、それぞれ、女性用衣類の他のモデルの汎用記述テキストが取得される。女性用衣類の種々のモデルの汎用記述テキストは、新たなテキストを形成するためにさらにクラスタ化されてもよい。
206において、主題モデルに基づくテキスト分析法を使用することによって主題分析がテキストに適用され、1つ以上の主題を取得し、かつその主題に対して名前が定義される。
1つ以上の主題モデルに基づくテキスト分析法を使用することによってクラスタ化されたテキストに対して分析が適用され、大型の文書コレクションまたはコーパス内に隠された主題情報を識別する。任意に、確率的潜在意味解析(PLSA)または潜在的ディリクレ配分(LDA)法が分析のために使用されてもよい。
例えば、トレーニングモデルにおいて主題の数が設定されている。異なる製品の汎用記述テキストは、その主題の数に従って主題モデルに基づくテキスト分析法を使用することによって新たなテキストにクラスタ化される。PLSAまたはLDAが、新たなテキストに適用されてもよい。クラスタ化された新たなテキストの1組の用語は、その主題の数に対応する数のサブセットに分割される。各サブセットは、それらの意味類似性の程度に従う1組の用語であり得る。サブセット中の各用語は、同じまたは類似の意味論を有する。各サブセットは、それぞれの主題に対応する。それぞれのサブセットのクラスタ化された特性または一般的な属性に基づいて、それぞれのサブセットに対応する主題名が定義される。分析に使用されるテキストがユーザー次元属性を有する1組の用語であるため、定義された主題名もまた、ある特定のユーザー次元属性を有する。
例えば、主題モデルに基づくテキスト分析法が女性用衣類に関連するクラスタ化されたテキストに適用される際、トレーニングモデルにおける主題の数は、第1に決められる。女性用衣類の異なる型の汎用記述テキストがクラスタ化される。主題モデルに基づくテキスト分析法を使用することによって、複数のサブセットが取得される。例えば、第1の主題は、シースルー、豹柄等の用語をクラスタ化し得、このため、第1の主題はセクシーとして定義され得る。第2の主題は、付属品または波打つ布地(wave cloth)等の用語をクラスタ化し得、このため、第2の主題は非主流として定義され得る。同様に、別のそれぞれの主題の名前が、それぞれの主題に対応する別のサブセットに含まれる用語または単語の一般的な特性に基づいて定義される。
設定された主題の数は、各サブセットに含まれる用語の特性の正確さに影響し得る。好ましい主題の数を選択するために、主題モデルに対する主題の数は、そのような分布が閾値に集中するか、またはそこに達するまで、それぞれの主題の数未満で、各主題中の用語分布の算定およびトレーニングテキスト中の主題分布の算定に伴い徐々に増加し得る。そのときの対応する主題の数は、テキスト分析を行うために主題モデルに対して設定された主題の数である。
208において、製品の記述情報に関連付けられる主題は、製品にラベルを付けるために製品の識別子として使用される。
例えば、製品の記述情報中の用語がそれぞれの主題に対応するそれぞれのサブセットに含まれるかどうかが決定される。決定の結果が肯定である場合、製品の記述情報は、それぞれのサブセットに対応するそれぞれの主題に関連付けられる。関連付けられた主題名は、製品にラベルを付けるために識別子として使用される。
1つのカテゴリ下にある製品のユーザーの次元と、別のカテゴリ下にある製品のユーザーの次元との間には大きな違いがある。ユーザーは、1つのカテゴリ下にある製品のいくつかの特定のユーザー次元属性および別のカテゴリ下にある製品の他の特定のユーザー次元属性に注目し得る。同じカテゴリ下にある製品の記述情報は、より固有の相関関係または関連性を有してもよく、このため、主題分析を使用することによってユーザーの注意に関して同じカテゴリ下にあるユーザー次元属性を取得することが容易である。
例えば、主題モデルに基づく主題分析を使用することによって製品識別子のラベル付けの正確さを向上するために、主題分析のためのテキストは、同じカテゴリ下にある製品の記述情報であり得る。
このため、製品識別子をラベル付けする例となる方法は、202における動作の前に製品をカテゴリ化することを含んでもよい。202において、記述情報を抽出することは、同じカテゴリ下にある製品の記述情報を抽出することをさらに含む。204において、製品の記述情報をテキストにクラスタ化することは、同じカテゴリ下にある製品の記述情報をテキストにクラスタ化することをさらに含む。
別の例として、製品をクラスタ化する正確さに基づいて、同じカテゴリ下にある製品の記述情報をクラスタ化することは、同じカテゴリ下にある製品の一部の記述情報をクラスタ化することであり得る。
製品のカテゴリ化は、一般的なカテゴリ化方法を使用し得る。オンライン上で販売されている製品は、概して、それらの対応する主要カテゴリおよびサブカテゴリを既に有する。このため、本技術は、存在している製品の主要カテゴリおよび/またはサブカテゴリの情報を抽出し、製品のカテゴリを決定してもよい。
例えば、オンラインで販売者によって販売されている製品は、女性用Tシャツであってもよい。製品は、女性用衣類のカテゴリに属していると決定される。製品の表題は、「肥満および拡大した色付き半袖Tシャツ」である。女性用衣類のカテゴリ下にある種々の製品の表題情報は、主題分析を行うためにクラスタ化され、大きい、拡大した、特大の、超大型の、肥満、太った、肥満男性、大きいサイズ等の用語を含むサブセットを取得する。サブセットに対応する主題は、「大きいサイズ」として定義される。この例における女性用衣類の表題情報が「肥満および拡大した」を含むため、Tシャツおよびその記述情報は、主題「大きいサイズ」に関連付けられる。このため、「大きいサイズ」は、記述情報が「大きい、拡大した、特大の、超大型の、肥満、太った、肥満男性、大きいサイズ」中の少なくとも1つの用語を含む製品の識別子として使用され得る。この例において、女性用衣類の表題情報は、用語「肥満および拡大した」を含み、このため「大きいサイズ」は、製品識別子として使用され得る。各カテゴリ下にある製品は、同じまたは類似の方法を使用することによってラベル付けされる。
例えば、カテゴリは、標準カテゴリおよび非標準カテゴリを含み得る。製品の1つ以上の重要な固定属性がノードにクラスタ化され、同じ性質を有する製品を含むカテゴリを正確に見付ける場合、そのカテゴリは標準カテゴリである。例えば、携帯電話のカテゴリ下にある製品に関して、ブランドおよび型の組み合わせは、携帯電話のカテゴリ下にあるそのようなノードを満たす製品をクラスタ化し得る。このため、携帯電話のカテゴリは、標準カテゴリである。非標準カテゴリは、標準カテゴリとは対照的なコンセプトを有する。製品を正確に見付け、製品をカテゴリに正規化するために、製品の1つ以上の重要な固定属性がノードにクラスタ化されない場合は、そのようなカテゴリは非標準カテゴリである。例えば、女性用衣類のカテゴリ下にある製品に関して、製品のいくつかの重要な固定属性を使用してユーザーの所望の製品を正確に見付けることができない場合、女性用衣類のカテゴリは非標準カテゴリである。
したがって、標準カテゴリ下にある製品と比較して、非標準カテゴリ下にある製品の属性の特性および標準カテゴリ下にある製品の属性の特性に基づいて、本技術は、非標準カテゴリ下にある製品の識別子へのラベル付けにより適している場合がある。製品の識別子へのラベル付けに対する例となる実施形態において記載される例となる方法に加えて、いくつかの他の方法を使用して、非標準カテゴリ下にある製品の識別子をラベル付けしてもよい。
さらに、製品の記述情報中の表題情報は、製品の追加の識別子として使用されてもよい。
例えば、本技術は、製品の表題情報が製品のカテゴリに対して事前に確立された追加の識別子データベース中に追加の識別子を含むかどうかを決定する。決定の結果が肯定である場合、追加の識別子が取得され、識別される製品の識別子が取得される場合、製品のラベルとして使用される。
例えば、追加の識別子データベース中の追加の識別子は、現在人気のある製品を見付けることがユーザーにとって容易であるように、人気のある製品に対して定義され得る。
例えば、製品女性用Tシャツの表題情報は、「肥満および拡大した色付きの半袖Tシャツ」である。本技術は、女性用衣類のカテゴリ下にある追加の識別子データベースを検索し、表題情報中に含まれる追加の識別子データベース中にコンテンツが存在するかどうかを確認する。表題情報が追加の識別子データベース中に識別子「色付きの」を含むことが確認される場合、その製品は追加の識別子「色付きの」が割り当てられ、女性用Tシャツは識別子「色付きの」でラベル付けされる。
追加の識別子データベースは、事前に確立されていてもよい。例えば、高い照会頻度を有する1つ以上の照会用語は、1カ月等のある期間内の同じカテゴリ下にある製品のログファイル(例えば、製品のクリック数および閲覧数)に従って抽出される。抽出される照会用語は、分割される。カテゴリワードおよび停止ワードが削除された後、処理後の残りの単語は、キーワードとして使用される。キーワードを人気のある識別子または追加の識別子として使用して、各カテゴリ下にある追加の識別子データベースを確立する。照会用語は、種々の単語であり得る。このため、追加の識別子は、単語対する制限を有しない。製品外観、人名、フィルム名等を記述する単語が、すべて追加の識別子として使用され得る。
例えば、女性用衣類のカテゴリ下において、高い照会頻度を有する照会用語は、「シースルーブラウス」、「シースルー半袖」等を含み得る。分割の処理ならびにカテゴリワードおよび停止ワードを取り除いた後、取得されるキーワードは、「シースルー」である。このため、単語「シースルー」は、女性用衣類のカテゴリ下にある追加の識別子データベース中の追加の識別子として使用され得る。別の例として、ある有名人は、現在人気がある場合がある。有名人が着用した女性用衣類のモデルの検索ボリュームが高い。有名人の名前が、女性用衣類のカテゴリ下にある追加の識別子データベース中の追加の識別子として使用されてもよい。
本開示はまた、図3に示されるように、製品をナビゲートするための一例となる方法も提供する。
302において、製品の記述情報が抽出され、製品の記述情報がテキストにクラスタ化される。
例えば、製品の記述情報は、製品の表題情報および/または属性情報を含み得る。概して、製品の表題は、ユーザーの注目の観点から製品を記述する。このため、この表題は、ユーザーの興味を引き付け得る多くの用語または用語の組み合わせを含み得る。さらに、製品の属性を詳細に記述する製品の詳細の記述はまた、ユーザーの注目の観点からの記述も含み得る。製品の記述情報をテキストにクラスタ化することは、製品の1組の記述用語をテキストにクラスタ化することである。
304において、主題モデルに基づくテキスト分析法を使用することによって主題分析がテキストに適用され、1つ以上の主題を取得する。
1つ以上の主題モデルに基づくテキスト分析法を使用することによってクラスタ化されたテキストに対して分析が適用され、大型の文書コレクションまたはコーパス内に隠された主題情報を識別する。任意に、確率的潜在意味解析(PLSA)または潜在的ディリクレ配分(LDA)法が、トレーニングモデルを設定するために使用されてもよい。
例えば、1つ以上の主題モデルに主題の数が設定される。その主題の数に従う主題モデルに基づくテキスト分析法が、PLSAまたはLDAを通して製品の記述情報によってクラスタ化されたテキストに適用され、テキスト中に設定される用語をその主題の数に対応する数のサブセットに分割し得る。各サブセットは、それらの意味類似性の程度に従って近い、または類似の用語を含む1組の用語であってもよい。サブセット中の各用語は、同じまたは類似の意味論またはアプリケーションシナリオを有する。各サブセットは、1つの主題に対応する。それぞれのサブセットのクラスタ化された特性に基づいて、それぞれのサブセットに対応する主題が定義される。それぞれのサブセットの1つ以上の一般的な属性に基づいて、それぞれのサブセットに対応する主題名が定義される。主題名は、カテゴリ下にある製品の識別子として使用され得る。
306において、製品は、主題に関連付けられる。
サブセット中の各製品の記述情報内の用語の分布に従って、各製品と各サブセットとの間のマッピングが確立される。さらに、製品と主題との間のマッピングが確立される。
308において、製品の記述情報に関連付けられる主題は、分類によってナビゲートされる。
異なる製品は、異なる主題に関連付けられ得る。このため、ユーザーが製品を閲覧するとき、それらの主題に対応してそれぞれ製品が表示され得る。ユーザーは、それぞれの主題に対応するリンクまたは識別子またはラベルを選択し、それぞれの主題に関連付けられる製品を取得する。つまり、製品は、それらの主題の分類に従ってナビゲートされる。主題に対応する名前または識別子は、ナビゲーション中に表示されるコンテンツとして使用される。ユーザーが識別子をクリックすると、主題に関連付けられる製品が表示される。主題に対応する名前または識別子の表示順は、名前または識別子に従ってサブセット下の製品のクリック数に従って決定され得る。ナビゲーションガイドは、すべての主題に対応するすべての名前またはラベルを示す必要はない。異なるシナリオに基づいて、表示される主題に対応する名前またはラベルの数および順序が設定され得る。
ナビゲーションガイド中のそれぞれの主題が選択されると、それぞれの主題に関連付けられる製品がユーザーインターフェースに表示される。ナビゲーションガイド中の複数の主題が選択されると、複数の主題に関連付けられる製品がユーザーインターフェースに表示される。
例えば、製品をナビゲートするための例となる方法において、記述情報中の製品属性に関連しないカテゴリワードまたは用語を取り除くために、302における動作は、以下のものをさらに含んでもよい。同じモデル下の製品の記述情報が第1のテキストにクラスタ化される。第1のテキストが分割される。用語頻度が第1の設定閾値よりも高い1つ以上の用語ならびに用語頻度が第2の設定閾値よりも低い1つ以上の用語が取り除かれる。異なるモデルの第1のテキストが第2のテキストにクラスタ化される。304において、主題モデルに基づくテキスト分析に関する方法で主題分析に使用されるテキストは、第2のテキストであってもよい。
304での動作は、以下のものをさらに含んでもよい。主題モデルに主題の数が設定される。主題モデルを使用して、主題分析を第2のテキストに適用する。設定された主題の数に対応するサブセットが取得される。各サブセットに対する主題が定義される。記述情報中の用語が位置するサブセットに従って、カテゴリ下にある製品が、サブセットに対応する主題に関連付けられる。各サブセットの主題が定義されるとき、サブセット中の用語の一般的な意味論または一般的な属性が主題の名前として使用されてもよい。
例えば、主題分析において使用されたテキストは、同じカテゴリ下にある製品の記述情報であってもよい。製品識別子をラベル付けするための例となる方法はまた、製品をカテゴリ化するための以下の動作を含み得る。302において、製品の記述情報を抽出する動作は、同じカテゴリ下にある製品の記述情報を抽出することをさらに含んでもよい。304において、製品の記述情報をクラスタ化するための動作は、同じカテゴリ下にある製品の記述情報をクラスタ化することをさらに含んでもよい。
製品をクラスタ化する正確さの程度に従って、同じカテゴリ下にある製品の記述情報のクラスタ化は、同じカテゴリ下にある製品の記述情報の一部のクラスタ化であり得る。
それに応じて、本開示はまた、製品識別子をラベル付けするための装置を提供する。図4は、本開示の例となる実施形態に従って、製品識別子をラベル付けする一例となる装置400の略図である。装置400は、1つ以上のプロセッサ(複数可)402およびメモリ404を含み得る。メモリ404は、コンピュータ可読媒体の一例である。本明細書で使用する場合、「コンピュータ可読媒体」は、コンピュータ記憶媒体および通信媒体を含む。
コンピュータ記憶媒体は、コンピュータ実行可能命令、データ構造、プログラムモジュール、または他のデータ等の情報の記憶のために任意の方法および技術で実装される揮発性および不揮発性、取り外し可能および取り外し不可能な媒体を含む。対照的に、通信媒体は、搬送波等の変調データ信号内のコンピュータ可読命令、データ構造、プログラムモジュール、または他のデータを具体化してもよい。本明細書で定義される場合、コンピュータ記憶媒体は、通信媒体を含まない。メモリ404は、プログラムユニットまたはモジュールおよびプログラムデータをその中に記憶してもよい。
図4の例において、メモリ404は、カテゴリ化モジュール406、抽出モジュール408、生成モジュール410、分析モジュール412、および第1のラベル付けモジュール414をその中に記憶してもよい。カテゴリ化モジュール406は、製品をカテゴリ化する。カテゴリは、携帯電話、カメラ、女性用衣類、男性用衣類、本等の記録された製品データに基づいて分類される。
例えば、カテゴリ化モジュール406は、それぞれの製品の記述情報またはそれぞれの製品をアップロードするときに販売者によって選択されるカテゴリに基づいて、分類されるカテゴリ中のそれぞれの製品のカテゴリを決定する。
抽出モジュール408は、製品の記述情報を抽出する。例えば、抽出モジュール408は、同じカテゴリ下にある製品の記述情報を抽出し得る。記述情報は、販売者が製品をアップロードするときの製品の記述情報を含み得る。記述情報はまた、データベース中に記録されたカテゴリ下にある記述情報を含む得る。
生成モジュール410は、製品の記述情報をテキストにクラスタ化する。例えば、生成モジュール410は、製品の写真間の同一または類似の程度に従って、同じカテゴリ下にある同じモデルを有する製品にクラスタ化し得る。同じモデルを有する製品の記述情報がクラスタ化される。クラスタ化された記述情報が分割される。クラスタ化された記述情報中の用語頻度が第1の閾値よりも高い1つ以上の用語が排除され、かつクラスタ化された記述情報中の用語頻度が第2の閾値よりも低い1つ以上の用語も排除される。(換言すると、クラスタ化された記述情報において高すぎるか、または低すぎる頻度を有する用語が排除される。)クラスタ化された記述情報は、そのような用語の排除後に、同じ製品の汎用記述テキストとして使用される。第1の閾値は、第2の閾値よりも高い。製品の記述情報、特に製品の表題情報が、概して、ユーザーの選択習慣に基づいて販売者によって定義されるため、記述情報において高すぎるか、または低すぎる頻度を有する用語の排除後、いくつかの一般的に使用される製品に対するカテゴリワードおよび製品の固定属性に関連するいくつかの単語が削除される。このため、上述の処理後の汎用記述テキストは、1つ以上のユーザー次元属性を有する1つ以上の用語を含む。
分析モジュール412は、1つ以上の主題モデルに基づくテキスト分析法を使用することによって主題分析をテキストに適用し、1つ以上の主題を取得し、かつその主題に対して名前を定義する。分析されるテキストは第2のテキストである。
例えば、分析モジュール412は、1つ以上の主題モデルに基づくテキスト分析法をクラスタ化されたテキストに適用し、大型の文書コレクションまたはコーパス内に隠された主題情報を識別し得る。任意に、確率的潜在意味解析(PLSA)または潜在的ディリクレ配分(LDA)法が分析のために使用されてもよい。
例えば、分析モジュール412は、トレーニングモデル中の主題の数を設定し、その主題の数に従って主題モデルに基づくテキスト分析法を使用することによって、異なる製品の汎用記述テキストを新たなテキストにクラスタ化し得る。分析モジュール412は、PLSAまたはLDAを新たなテキストに適用し、クラスタ化されたテキスト中の1組の用語をその主題の数に対応する数のサブセットに分割し得る。各サブセットは、それらの意味同一性または類似性の程度に従ってクラスタ化された1組の用語であってもよい。サブセット中の各用語は、同じまたは類似の意味論を有する。各サブセットは、1つの主題に対応する。それぞれのサブセットのクラスタ化された特性または一般的な属性に基づいて、それぞれのサブセットに対応する主題名が定義される。分析に使用されるテキストがユーザー次元属性を有する1組の用語であるため、定義された主題名もまた、ある特定のユーザー次元属性を有する。
第1のラベル付けモジュール414は、製品の記述情報に関連付けられる主題を製品にラベルを付けるために製品の識別子として使用する。
例えば、第1のラベル付けモジュール414は、製品の記述情報中の用語が、それぞれの主題に対応するそれぞれのサブセット中に含まれるかどうかを決定する。決定の結果が肯定である場合、製品の記述情報は、それぞれのサブセットに対応するそれぞれの主題に関連付けられる。関連付けられた主題名は、製品にラベルを付けるために識別子として使用される。
図5は、本開示の例となる実施形態に従って、製品識別子をラベル付けする別の例となる装置500の略図である。装置400に基づいて、装置500は、メモリ404中に記憶される第2のラベル付けモジュール502および確立モジュール504をさらに含み得る。
第2のラベル付けモジュール502は、製品の表題情報が製品のカテゴリに対して事前に確立された追加の識別子データベース中に追加の識別子を含むかどうかを決定する。決定の結果が肯定である場合、追加の識別子が取得され、識別される製品の識別子が取得される場合、識別のために使用される。
確立モジュール504は、追加の識別子データベースを事前に確立する。確立モジュール504は、同じカテゴリ下にある製品を記録するログに従って、1カ月等のある期間内の高い照会頻度を有する1つ以上の照会用語を抽出し、抽出された照会用語を分割し、カテゴリワードおよび停止ワードを取り除き、1つ以上のキーワードを取得する。キーワードを追加の識別子として使用し、カテゴリ下にある追加の識別子データベースを確立する。
本開示に従って製品識別子をラベル付けする方法および装置ならびに製品をナビゲートする方法は、ユーザー次元属性を有する識別子を使用することによって製品をラベル付けし、製品をナビゲートするためにナビゲーションガイドを確立することができる。このため、ユーザーは、より容易におよび直感的に彼らの所望の製品を見付けることができる。
当業者であれば、本開示に記載されるモジュールおよび動作が、ハードウェア、コンピュータソフトウェア、またはそれらの組み合わせによって実装され得ることを理解するだろう。ハードウェアとソフトウェアとの間の互換性を例示するために、本開示は、概して、それらの機能性に従って各例となる実施形態においてコンポーネントおよび動作を説明する。そのような機能性がハードウェアまたはソフトウェアによって実装されるかどうかは、技術的解決策の特定の用途および設計制約に左右される。当業者であれば、異なる特定のアプリケーションシナリオのための異なる方法を使用して記載される機能性を実装できるだろう。そのような実装は、本開示の保護範囲外であるとみなされるものではない。
本技術は、ハードウェア、1つ以上のプロセッサによって実行されるソフトウェアモジュール、またはそれらの組み合わせを通して実装されてもよい。ハードウェアは、特定の論理回路で実装されてもよい。ソフトウェアモジュールは、ランダムアクセスメモリ(RAM)、メモリ、読み取り専用メモリ(ROM)、プログラマブル読み取り専用メモリ(PROM)、消去可能プログラマブル読み取り専用メモリ(EPROM)、レジスタ記憶装置、ハードディスク、可搬型ディスク、CD−ROM、または当該技術分野において周知の任意の他のコンピュータ記憶媒体に記憶されてもよい。
上記の説明は、本開示の目的、技術、および有益な効果に関連する本開示の例となる実施形態を例示している。上記の説明は、例となる実施形態を例示するためのものに過ぎず、本開示の範囲を制限するようには意図されない。当業者には、本開示の原理から逸脱することなく、ある特定の修正、置換、および改良が行われてもよく、依然として本開示の保護下であると見なされるべきであることを理解されたい。

Claims (20)

  1. 1つ以上の製品の記述情報を抽出することと、
    前記1つ以上の製品の前記記述情報をテキストにクラスタ化することと、
    1つ以上の主題を取得するために主題分析を前記テキストに適用することと、
    前記1つ以上の主題に対してそれぞれ1つ以上の名前を定義することと、
    それぞれの製品の記述情報に関連付けられるそれぞれの主題のそれぞれの名前を前記それぞれの製品の識別子として使用することと、
    前記識別子を使用して前記それぞれの製品にラベルを付けることと、を含む、方法。
  2. 前記1つ以上の製品の前記記述情報の前記抽出の前に、前記1つ以上の製品をカテゴリ化することをさらに含み、
    前記1つ以上の製品の前記記述情報の前記抽出が、特定のカテゴリ下にある1つ以上の製品の記述情報を抽出することを含み、
    前記テキストが、前記特定のカテゴリ下にある前記1つ以上の製品の前記記述情報を含む、請求項1に記載の方法。
  3. 前記1つ以上の製品の前記記述情報を前記テキストにクラスタ化することは、
    特定のモデルに属する複数の製品の記述情報を第1のテキストにクラスタ化することと、
    前記第1のテキストを処理することであって、
    前記第1のテキストを分割することと、
    用語頻度が第1の設定閾値よりも高い1つ以上の用語と、用語頻度が第2の設定閾値よりも低い1つ以上の用語とを取り除くことと、を含む、処理することと、
    前記処理の後に、異なるモデルに属する製品の第1のテキストを第2のテキストにクラスタ化することと、
    前記主題分析を適用するための前記テキストとして前記第2のテキストを使用することと、を含む、請求項1に記載の方法。
  4. 1つ以上の主題を取得するために前記主題分析を前記テキストに適用することは、
    1つ以上の主題モデルに主題の数を設定することと、
    前記1つ以上の主題モデルに基づくテキスト分析法を使用することによって、前記主題分析を前記テキストに適用することと、
    前記テキスト中の1組の用語から前記主題の数に対応する数のサブセットを取得することであって、前記サブセットの数が前記主題の数と同じであり、それぞれのサブセットがそれぞれの主題に対応する、取得することと、
    前記製品の前記記述情報中の1つ以上の用語が位置する前記それぞれのサブセットに従って、前記製品の前記記述情報を前記それぞれのサブセットに対応する前記それぞれの主題と関連付けることと、を含む、請求項1に記載の方法。
  5. 前記1つ以上の主題モデルが、確率的潜在意味解析(PLSA)または潜在的ディリクレ配分(LDA)を含む、請求項4に記載の方法。
  6. 前記1つ以上の製品の前記記述情報が、表題情報、属性情報、または前記表題情報および前記属性情報の組み合わせを含む、請求項1に記載の方法。
  7. 前記記述情報が、表題情報を含み、
    前記それぞれの製品の前記表題情報が、前記それぞれの製品が属する特定のカテゴリに対して事前に確立された追加の識別子データベース中に追加の識別子を含むかどうかを決定することと、
    前記それぞれの製品の前記表題情報が前記追加の識別子を含むことを決定することに応じて、
    前記追加の識別子を取得することと、
    前記追加の識別子を使用して前記それぞれの製品をラベルを付けることと、をさらに含む、請求項1に記載の方法。
  8. 前記追加の識別子データベースを確立することであって、
    前記特定のカテゴリ下にある製品のログに従って、照会頻度が事前設定閾値よりも高い1つ以上の照会用語を抽出することと、
    前記抽出された1つ以上の照会用語を分割することと、
    1つ以上のカテゴリワードおよび停止ワードを取り除き、1つ以上のキーワードを取得することと、
    追加の識別子として前記1つ以上のキーワードを使用して、前記追加の識別子データベースを確立することと、を含む、確立することをさらに含む、請求項7に記載の方法。
  9. 1つ以上の製品の記述情報を抽出することと、
    前記1つ以上の製品の前記記述情報をテキストにクラスタ化することと、
    1つ以上の主題を取得するために主題分析を前記テキストに適用することと、
    前記1つ以上の製品を前記1つ以上の主題と関連付けることと、
    それぞれの製品に関連付けられるそれぞれの主題に従って前記1つ以上の製品をナビゲートすることと、を含む、方法。
  10. 前記1つ以上の製品の前記記述情報の前記抽出の前に、前記1つ以上の製品をカテゴリ化することをさらに含み、
    前記1つ以上の製品の前記記述情報の前記抽出が、特定のカテゴリ下にある1つ以上の製品の記述情報を抽出することを含み、
    前記テキストが、前記特定のカテゴリ下にある前記1つ以上の製品の前記記述情報を含む、請求項9に記載の方法。
  11. 前記1つ以上の製品の前記記述情報を前記テキストにクラスタ化することは、
    特定のモデルに属する複数の製品の記述情報を第1のテキストにクラスタ化することと、
    前記第1のテキストを処理することであって、
    前記第1のテキストを分割することと、
    用語頻度が第1の設定閾値よりも高い1つ以上の用語と、用語頻度が第2の設定閾値よりも低い1つ以上の用語とを取り除くことと、を含む、処理することと、
    前記処理の後に、異なるモデルに属する製品の第1のテキストを第2のテキストにクラスタ化することと、
    前記主題分析を適用するための前記テキストとして前記第2のテキストを使用することと、を含む、請求項9に記載の方法。
  12. 1つ以上の主題の取得するために前記主題分析を前記テキストに適用することは、
    1つ以上の主題モデルに主題の数を設定することと、
    前記1つ以上の主題モデルに基づくテキスト分析法を使用することによって、前記主題分析を前記テキストに適用することと、
    前記テキスト中に含まれる1組の用語から前記主題の数に対応する数のサブセットを取得することであって、前記サブセットの数が前記主題の数と同じであり、それぞれのサブセットがそれぞれの主題に対応する、取得することと、
    前記製品の前記記述情報中の1つ以上の用語が位置する前記それぞれのサブセットに従って、前記製品の前記記述情報を前記それぞれのサブセットに対応する前記それぞれの主題と関連付けることと、を含む、請求項9に記載の方法。
  13. 前記1つ以上の製品の前記記述情報が、表題情報、属性情報、または前記表題情報および前記属性情報の組み合わせを含む、請求項9に記載の方法。
  14. 前記それぞれの製品に関連付けられる前記それぞれの主題に従って、前記1つ以上の製品をナビゲートすることは、
    前記主題に対応する前記製品のクリック数に従って、それぞれ前記1つ以上の主題の表示順を決定することと、
    前記表示順に従って、ユーザーインターフェースにおけるナビゲーションガイド内に前記1つ以上の主題を表示することと、を含む、請求項9に記載の方法。
  15. 前記1つ以上の主題モデルが、確率的潜在意味解析(PLSA)または潜在的ディリクレ配分(LDA)を含む、請求項12に記載の方法。
  16. 1つ以上の製品の記述情報を抽出する抽出モジュールと、
    前記1つ以上の製品の前記記述情報をテキストにクラスタ化する生成モジュールと、
    1つ以上の主題を取得するために主題分析を前記テキストに適用し、前記1つ以上の主題に対してそれぞれ1つ以上の名前を定義する分析モジュールと、
    それぞれの製品の記述情報に関連付けられるそれぞれの主題のそれぞれの名前を前記それぞれの製品の識別子として使用し、前記識別子を使用することによって前記それぞれの製品にラベルを付ける第1のラベル付けモジュールを備える、装置。
  17. 前記生成モジュールは、さらに
    特定のモデルに属する複数の製品の記述情報を第1のテキストにクラスタ化し、
    前記第1のテキストを処理し、前記を処理することは、
    前記第1のテキストを分割することと、
    用語頻度が第1の設定閾値よりも高い1つ以上の用語と、用語頻度が第2の設定閾値よりも低い1つ以上の用語とを取り除くことと、を含み、
    前記処理の後、異なるモデルに属する製品の第1のテキストを第2のテキストにクラスタ化し、
    前記主題分析を適用するための前記テキストとして前記第2のテキストを使用する、請求項16に記載の装置。
  18. 前記分析モジュールは、さらに、
    1つ以上の主題モデルに主題の数を設定し、
    前記1つ以上の主題モデルに基づくテキスト分析法を使用することによって前記主題分析を前記テキストに適用し、
    前記テキスト中に含まれる1組の用語から前記主題の数に対応する数のサブセットを取得し、前記サブセットの数が前記主題の数と同じであり、それぞれのサブセットがそれぞれの主題に対応し、
    前記製品の前記記述情報中の1つ以上の用語が位置する前記それぞれのサブセットに従って、前記製品の前記記述情報を前記それぞれのサブセットに対応する前記それぞれの主題と関連付ける、請求項16に記載の装置。
  19. 前記1つ以上の製品の前記記述情報が、表題情報を含み、
    前記装置が、前記それぞれの製品の前記表題情報が、前記それぞれの製品が属する特定のカテゴリに対して事前に確立された追加の識別子データベース中に追加の識別子を含むかどうかを決定し、肯定であることを決定する結果に応じて、前記追加の識別子を取得し、前記追加の識別子を前記識別子に加えて使用し、前記それぞれの製品にラベルを付ける、第2のラベル付けモジュールをさらに備える、請求項16に記載の装置。
  20. 前記特定のカテゴリ下にある製品のログに従って、照会時間が事前設定閾値よりも高い1つ以上の照会用語を抽出し、
    前記抽出された1つ以上の照会用語を分割し、
    1つ以上のカテゴリワードおよび停止ワードを取り除き、1つ以上のキーワードを取得し、
    追加の識別子として前記1つ以上のキーワードを使用して、前記追加の識別子データベースを確立する、確立モジュールをさらに備える、請求項19に記載の装置。
JP2015530142A 2012-09-05 2013-09-03 製品識別子のラベル付けおよび製品のナビゲーション Active JP6379093B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201210326456.8A CN103678335B (zh) 2012-09-05 2012-09-05 商品标识标签的方法、装置及商品导航的方法
CN201210326456.8 2012-09-05
PCT/US2013/057877 WO2014039450A2 (en) 2012-09-05 2013-09-03 Labeling product identifiers and navigating products

Publications (2)

Publication Number Publication Date
JP2015526831A true JP2015526831A (ja) 2015-09-10
JP6379093B2 JP6379093B2 (ja) 2018-08-22

Family

ID=49261733

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015530142A Active JP6379093B2 (ja) 2012-09-05 2013-09-03 製品識別子のラベル付けおよび製品のナビゲーション

Country Status (6)

Country Link
US (1) US9323838B2 (ja)
EP (1) EP2893469A4 (ja)
JP (1) JP6379093B2 (ja)
CN (1) CN103678335B (ja)
TW (1) TWI631474B (ja)
WO (1) WO2014039450A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019212308A (ja) * 2018-06-01 2019-12-12 ネイバー コーポレーションNAVER Corporation 動画サービス提供方法およびこれを用いるサービスサーバ

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107122980B (zh) * 2011-01-25 2021-08-27 阿里巴巴集团控股有限公司 识别商品所属类目的方法和装置
US9330167B1 (en) * 2013-05-13 2016-05-03 Groupon, Inc. Method, apparatus, and computer program product for classification and tagging of textual data
US9600576B2 (en) * 2013-08-01 2017-03-21 International Business Machines Corporation Estimating data topics of computers using external text content and usage information of the users
CN104951430B (zh) * 2014-03-27 2019-03-12 上海携程商务有限公司 产品特征标签的提取方法及装置
CN105335386B (zh) * 2014-07-01 2018-10-16 阿里巴巴集团控股有限公司 一种提供导航标签的方法及装置
CN106202105A (zh) * 2015-05-06 2016-12-07 阿里巴巴集团控股有限公司 一种电子商务网站导航方法及装置
CN106503002A (zh) * 2015-09-07 2017-03-15 张晓晔 一种以若干标签替代标题显示商品主要信息的方法
CN105320778B (zh) * 2015-11-25 2019-04-02 焦点科技股份有限公司 一种适用于电子商务中文网站商品标签化的方法
CN105608166A (zh) * 2015-12-18 2016-05-25 Tcl集团股份有限公司 一种标签提取方法及装置
CN106919543A (zh) * 2015-12-24 2017-07-04 阿里巴巴集团控股有限公司 确定商品对象标题文本的方法及装置
CN106919625B (zh) * 2015-12-28 2021-04-09 中国移动通信集团公司 一种互联网用户属性识别方法和装置
CN105824898A (zh) * 2016-03-14 2016-08-03 苏州大学 一种网络评论的标签提取方法和装置
CN107632984A (zh) * 2016-07-18 2018-01-26 阿里巴巴集团控股有限公司 一种聚类数据表的展现方法、装置和系统
US10229184B2 (en) 2016-08-01 2019-03-12 International Business Machines Corporation Phenomenological semantic distance from latent dirichlet allocations (LDA) classification
US10242002B2 (en) 2016-08-01 2019-03-26 International Business Machines Corporation Phenomenological semantic distance from latent dirichlet allocations (LDA) classification
CN107292365B (zh) * 2017-06-27 2021-01-08 百度在线网络技术(北京)有限公司 商品标签的绑定方法、装置、设备及计算机可读存储介质
CN109597973A (zh) * 2017-09-30 2019-04-09 阿里巴巴集团控股有限公司 一种文案信息的推荐、生成方法和装置
CN108460131B (zh) * 2018-03-02 2021-11-26 北京奇艺世纪科技有限公司 一种分类标签处理方法及装置
CN108427749B (zh) * 2018-03-12 2021-06-18 上海哔哩哔哩科技有限公司 商品标签管理方法、服务器及商品标签管理系统
CN110874534B (zh) * 2018-08-31 2023-04-28 阿里巴巴集团控股有限公司 数据处理方法和数据处理装置
US10956487B2 (en) 2018-12-26 2021-03-23 Industrial Technology Research Institute Method for establishing and processing cross-language information and cross-language information system
CN109739955A (zh) * 2019-01-24 2019-05-10 北京诸葛找房信息技术有限公司 基于分词与多模匹配的房源标签自动提取装置及其方法
KR102221122B1 (ko) * 2019-01-28 2021-02-25 네이버 주식회사 이미지 검색 장치 및 방법
CN110188203B (zh) * 2019-06-10 2022-08-26 北京百度网讯科技有限公司 文本聚合方法、装置、设备及存储介质
CN112395528B (zh) * 2019-08-13 2022-10-21 阿里巴巴集团控股有限公司 文本标签判别方法、装置、电子设备及存储介质
CN113743430A (zh) * 2020-05-29 2021-12-03 北京沃东天骏信息技术有限公司 标签匹配度检测模型的建立方法及装置、存储介质及设备
US20220253473A1 (en) * 2021-02-05 2022-08-11 Mercari, Inc. Machine generated ontology
CN114049142A (zh) * 2021-10-27 2022-02-15 创优数字科技(广东)有限公司 商品质量数据处理方法、装置、计算机设备和存储介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070118506A1 (en) * 2005-11-18 2007-05-24 Kao Anne S Text summarization method & apparatus using a multidimensional subspace
JP2009129087A (ja) * 2007-11-21 2009-06-11 Yahoo Japan Corp 商品情報分類装置、プログラム、商品情報分類方法
US20090177546A1 (en) * 2006-07-05 2009-07-09 Dijk Bob Van System and method for category-based contextual advertisement generation and management
JP2009545019A (ja) * 2006-05-19 2009-12-17 マイ バーチャル モデル インコーポレイテッド シミュレーション支援式検索
US7996282B1 (en) * 2006-09-29 2011-08-09 Amazon Technologies, Inc. Method and system for selecting and displaying items
WO2011112236A1 (en) * 2010-03-09 2011-09-15 Alibaba Group Holding Limited Categorizing products
JP2011530729A (ja) * 2008-06-19 2011-12-22 ワイズ テクノロジーズ インコーポレイテッド トピックに関する複数の製品にランクを付ける製品ランク付け方法及び製品ランク付けシステム
US20120066253A1 (en) * 2010-09-15 2012-03-15 Cbs Interactive, Inc. Mapping Product Identification Information To A Product
US20120095952A1 (en) * 2010-10-19 2012-04-19 Xerox Corporation Collapsed gibbs sampler for sparse topic models and discrete matrix factorization
WO2012061301A1 (en) * 2010-11-04 2012-05-10 Alibaba Group Holding Limited Data processing based on online transaction platform
WO2012082561A2 (en) * 2010-12-14 2012-06-21 Alibaba Group Holding Limitted Method and system of displaying cross-website information

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7483872B2 (en) * 2001-08-23 2009-01-27 Michael Meiresonne Supplier identification and locator system and method
AUPR958901A0 (en) * 2001-12-18 2002-01-24 Telstra New Wave Pty Ltd Information resource taxonomy
EP1493118A1 (en) 2002-04-10 2005-01-05 Accenture Global Services GmbH Determination of attributes based on product descriptions
US20030212640A1 (en) 2002-05-01 2003-11-13 Hans Magnus Andresen Universal product attribute modeler
EP1452997B1 (en) * 2003-02-25 2010-09-15 Canon Kabushiki Kaisha Apparatus and method for managing articles
US20060212287A1 (en) 2005-03-07 2006-09-21 Sight'up Method for data processing with a view to extracting the main attributes of a product
US20070106644A1 (en) 2005-11-08 2007-05-10 International Business Machines Corporation Methods and apparatus for extracting and correlating text information derived from comment and product databases for use in identifying product improvements based on comment and product database commonalities
US8738456B2 (en) 2006-11-14 2014-05-27 Xerox Corporation Electronic shopper catalog
TW200828139A (en) * 2006-12-18 2008-07-01 Webgenie Information Ltd Method for generating generic title
TW200933511A (en) * 2008-01-25 2009-08-01 Jui-Chu Lin System for on-line learning and knowledge transaction and the method of the same
JP2009187414A (ja) 2008-02-08 2009-08-20 Fujitsu Ltd 分析用属性項目抽出プログラム、分析用属性項目抽出方法、及び情報分析装置
US20090271293A1 (en) 2008-04-28 2009-10-29 Interactive Luxury Solutions Llc Methods and systems for dynamically generating personalized shopping suggestions
US8606796B2 (en) * 2008-09-15 2013-12-10 Kilac, LLC Method and system for creating a data profile engine, tool creation engines and product interfaces for identifying and analyzing files and sections of files
CN101685464B (zh) * 2009-06-18 2011-08-24 浙江大学 基于社群潜在主题挖掘的自动图像标注的方法
CN101706821B (zh) * 2009-12-10 2012-12-19 中兴通讯股份有限公司 基于标签的移动互联网页面设计系统及方法
CN102129424A (zh) * 2010-01-20 2011-07-20 神达电脑股份有限公司 利用个人导航装置定位到邻近商店的方法及个人导航装置
US20120000592A1 (en) 2010-07-01 2012-01-05 Sagent Pharmaceuticals, Inc. Label, labeling system and method of labeling for containers for drug products
CN102314654B (zh) * 2010-07-08 2017-10-17 阿里巴巴集团控股有限公司 一种信息推送方法及信息推送服务器
US8874581B2 (en) * 2010-07-29 2014-10-28 Microsoft Corporation Employing topic models for semantic class mining
WO2012064893A2 (en) 2010-11-10 2012-05-18 Google Inc. Automated product attribute selection
US20120197764A1 (en) 2011-02-02 2012-08-02 Ebay Inc. Method and process of using metadata associated with a digital media to search for local inventory
CN102156737B (zh) * 2011-04-12 2013-03-20 华中师范大学 一种中文网页主题内容的提取方法
CN102194013A (zh) * 2011-06-23 2011-09-21 上海毕佳数据有限公司 一种基于领域知识的短文本分类方法及文本分类系统

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070118506A1 (en) * 2005-11-18 2007-05-24 Kao Anne S Text summarization method & apparatus using a multidimensional subspace
JP2009545019A (ja) * 2006-05-19 2009-12-17 マイ バーチャル モデル インコーポレイテッド シミュレーション支援式検索
US20090177546A1 (en) * 2006-07-05 2009-07-09 Dijk Bob Van System and method for category-based contextual advertisement generation and management
US7996282B1 (en) * 2006-09-29 2011-08-09 Amazon Technologies, Inc. Method and system for selecting and displaying items
JP2009129087A (ja) * 2007-11-21 2009-06-11 Yahoo Japan Corp 商品情報分類装置、プログラム、商品情報分類方法
JP2011530729A (ja) * 2008-06-19 2011-12-22 ワイズ テクノロジーズ インコーポレイテッド トピックに関する複数の製品にランクを付ける製品ランク付け方法及び製品ランク付けシステム
WO2011112236A1 (en) * 2010-03-09 2011-09-15 Alibaba Group Holding Limited Categorizing products
US20120066253A1 (en) * 2010-09-15 2012-03-15 Cbs Interactive, Inc. Mapping Product Identification Information To A Product
US20120095952A1 (en) * 2010-10-19 2012-04-19 Xerox Corporation Collapsed gibbs sampler for sparse topic models and discrete matrix factorization
WO2012061301A1 (en) * 2010-11-04 2012-05-10 Alibaba Group Holding Limited Data processing based on online transaction platform
WO2012082561A2 (en) * 2010-12-14 2012-06-21 Alibaba Group Holding Limitted Method and system of displaying cross-website information

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
貞光 九月、外2名: "トピック教師なしデータからのトピック依存評価表現モデルの獲得", 電子情報通信学会技術研究報告, vol. 第107巻,第480号, JPN6017040010, 31 January 2008 (2008-01-31), JP, pages 57 - 62, ISSN: 0003664683 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019212308A (ja) * 2018-06-01 2019-12-12 ネイバー コーポレーションNAVER Corporation 動画サービス提供方法およびこれを用いるサービスサーバ

Also Published As

Publication number Publication date
CN103678335B (zh) 2017-12-08
WO2014039450A2 (en) 2014-03-13
CN103678335A (zh) 2014-03-26
JP6379093B2 (ja) 2018-08-22
US20140067815A1 (en) 2014-03-06
US9323838B2 (en) 2016-04-26
EP2893469A4 (en) 2016-06-22
EP2893469A2 (en) 2015-07-15
TWI631474B (zh) 2018-08-01
TW201411381A (zh) 2014-03-16
WO2014039450A3 (en) 2014-05-30

Similar Documents

Publication Publication Date Title
JP6379093B2 (ja) 製品識別子のラベル付けおよび製品のナビゲーション
WO2018014759A1 (zh) 一种聚类数据表的展现方法、装置和系统
JP7356206B2 (ja) コンテンツ推薦及び表示
Hsiao et al. Learning the latent" look": Unsupervised discovery of a style-coherent embedding from fashion images
KR102075833B1 (ko) 미술 작품 추천 큐레이션 방법 및 시스템
CN107748754B (zh) 一种知识图谱完善方法和装置
US10747826B2 (en) Interactive clothes searching in online stores
US9075825B2 (en) System and methods of integrating visual features with textual features for image searching
TWI522828B (zh) 建立詞素重要性分析模型的方法及裝置
US8589429B1 (en) System and method for providing query recommendations based on search activity of a user base
US20200342320A1 (en) Non-binary gender filter
WO2019056661A1 (zh) 一种搜索词推送方法、装置及终端
CN104298749A (zh) 一种图像视觉和文本语义融合商品检索方法
KR20200101068A (ko) 사용자의 체형 및 구매 이력을 이용하여 패션 아이템 추천 서비스를 제공하는 방법
KR20200045668A (ko) 스타일 추천 방법, 장치 및 컴퓨터 프로그램
CN110781307A (zh) 目标物品关键词和标题生成方法、搜索方法以及相关设备
JP2011221794A (ja) 画像選定装置
TW201830274A (zh) 對象搜索方法及裝置
WO2023142809A1 (zh) 文本分类、文本处理方法、装置、计算机设备及存储介质
KR20220039697A (ko) 코디네이션 패션 아이템을 추천하는 방법
Chen et al. iLike: integrating visual and textual features for vertical search
KR20220019737A (ko) 패션 상품 추천 방법, 장치 및 컴퓨터 프로그램
Lu et al. Browse-to-search: Interactive exploratory search with visual entities
KR20210131198A (ko) 추천 상품 광고 방법, 장치 및 컴퓨터 프로그램
CN116542737A (zh) 跨境电商平台的大数据处理方法及系统

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160808

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171024

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180116

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180703

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180730

R150 Certificate of patent or registration of utility model

Ref document number: 6379093

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250