JP7150090B2 - Product Attribute Extraction Method for Shopping Search - Google Patents
Product Attribute Extraction Method for Shopping Search Download PDFInfo
- Publication number
- JP7150090B2 JP7150090B2 JP2021075589A JP2021075589A JP7150090B2 JP 7150090 B2 JP7150090 B2 JP 7150090B2 JP 2021075589 A JP2021075589 A JP 2021075589A JP 2021075589 A JP2021075589 A JP 2021075589A JP 7150090 B2 JP7150090 B2 JP 7150090B2
- Authority
- JP
- Japan
- Prior art keywords
- product
- search
- user
- user query
- classification model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000605 extraction Methods 0.000 title claims description 121
- 238000013145 classification model Methods 0.000 claims description 104
- 230000015654 memory Effects 0.000 claims description 49
- 238000000034 method Methods 0.000 claims description 44
- 238000004891 communication Methods 0.000 claims description 33
- 238000004590 computer program Methods 0.000 claims description 10
- 239000000047 product Substances 0.000 description 451
- 238000010586 diagram Methods 0.000 description 14
- 239000013598 vector Substances 0.000 description 12
- 239000000284 extract Substances 0.000 description 9
- 238000012549 training Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 230000005291 magnetic effect Effects 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- WABPQHHGFIMREM-UHFFFAOYSA-N lead(0) Chemical compound [Pb] WABPQHHGFIMREM-UHFFFAOYSA-N 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 239000000706 filtrate Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0623—Item investigation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3346—Query execution using probabilistic model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9032—Query formulation
- G06F16/90332—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0639—Item locations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0641—Shopping interfaces
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Databases & Information Systems (AREA)
- General Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本開示は、ショッピング検索のための商品属性抽出方法及びシステムに関し、具体的には、ショッピング検索のために入力されたユーザクエリ(user query)又は検索クエリから商品属性を抽出して、商品検索順位に反映できる方法及びシステムに関する。 TECHNICAL FIELD The present disclosure relates to a method and system for extracting product attributes for shopping search, and more specifically, extracting product attributes from a user query or search query input for shopping search to determine product search ranking. It relates to a method and system that can reflect
最近、インターネットやモバイル環境においてショッピング、ゲーム、映画及び音楽などのような多様なサービスがオンラインで提供されている。特に、オンラインショッピングは、商品購買時間に対する制約がなく、直接的に商品販売店に訪問しなくても、商品の選択及び購買が可能であるため、多数のユーザにより利用されている。 Recently, various services such as shopping, games, movies, and music are provided online in the Internet and mobile environment. In particular, online shopping is used by a large number of users because there is no time limit for purchasing products and it is possible to select and purchase products without directly visiting a product store.
このようなオンラインショッピングの便宜により、オンラインショッピングを利用するユーザが増加することで、オンライン上で販売又は取り扱う商品の数や種類も幾何級数的に増加している。これにより、ユーザは、オンライン上で販売される多様な商品のうち、自分の意図と一致する商品を検索し難いという問題がある。 Due to the convenience of online shopping, the number of users who use online shopping is increasing, and the number and types of products sold or handled online are increasing exponentially. Accordingly, there is a problem that it is difficult for the user to search for a product that matches his/her intention among various products sold online.
一方、ユーザが、オンラインショッピングシステムに接続して、所望の商品を検索するためのクエリ(query)を入力すれば、当該クエリと関連する商品情報や購買先に関する接続情報などを含む商品検索結果のリストが提供できる。このようなオンラインショッピングシステムは、単にユーザクエリを商品データベースの商品情報と比較して検索結果を抽出するため、クエリに含まれたユーザの意図と一致する商品検索結果を導出し難い。 On the other hand, when a user connects to an online shopping system and inputs a query to search for a desired product, the product search results including product information related to the query and connection information regarding purchasers are displayed. A list can be provided. Since such an online shopping system simply compares a user query with product information in a product database to extract search results, it is difficult to derive product search results that match the intention of the user included in the query.
本開示は、前記問題点を解決するためになされたもので、ショッピング検索のための商品属性抽出方法、コンピュータプログラム及び装置(システム)を提供する。 The present disclosure has been made to solve the above problems, and provides a product attribute extraction method, a computer program, and an apparatus (system) for shopping search.
また、本開示は、ショッピング検索のための商品属性抽出のために、統計基盤分類モデルを利用することで、より正確な商品属性抽出が可能な方法及び装置(システム)を提供する。 In addition, the present disclosure provides a method and apparatus (system) capable of extracting more accurate product attributes by using a statistically-based classification model for product attribute extraction for shopping searches.
本開示は、方法、装置(システム)又はコンピュータプログラムを含む多様な方式により具現できる。 The present disclosure can be embodied in various forms including methods, apparatus (systems), and computer programs.
本開示の一実施例によれば、コンピュータシステムで実行されるショッピング検索のための商品属性抽出方法は、ユーザクエリを受信するステップ、商品データベースからユーザクエリに対する商品検索結果を抽出するステップ、統計基盤分類モデルにより、ユーザクエリ及び複数の商品属性の関連点数を算出するステップ、及び、算出された関連点数に基づいて前記商品検索結果による商品検索順位を調整するステップを含む。 According to an embodiment of the present disclosure, a product attribute extraction method for shopping search performed by a computer system comprises: receiving a user query; extracting product search results for the user query from a product database; According to the classification model, calculating the relevance score of the user query and the plurality of product attributes, and adjusting the product search ranking according to the product search result based on the calculated relevance score.
本開示の他の実施例によれば、ユーザ端末で実行されるショッピング検索のための商品属性抽出方法は、ユーザクエリを受信するステップ、ユーザクエリに基づき、統計基盤分類モデルにより算出された複数の商品属性の関連点数を受信するステップ、及び、算出された関連点数に基づき、ユーザクエリに対する商品検索順位を調整するステップを含む。 According to another embodiment of the present disclosure, a product attribute extraction method for shopping search performed on a user terminal comprises: receiving a user query; The method includes the steps of: receiving relevance scores of product attributes; and adjusting product search rankings for user queries based on the calculated relevance scores.
本開示のまた他の実施例によれば、前述したショッピング検索のための商品属性抽出方法をコンピュータで実行するためのコンピュータプログラムが提供される。 According to yet another embodiment of the present disclosure, there is provided a computer program for executing the product attribute extraction method for shopping search described above on a computer.
本開示のまた他の実施例によれば、コンピュータシステムで実行されるショッピング検索のための商品属性抽出の学習方法は、複数の第1のユーザクエリ及び複数の第1のユーザクエリと関連する複数の第1の商品属性を含む複数の第1の学習データを生成するステップ、及び、複数の第1の学習データに基づき、第2のユーザクエリに対応する一つ以上の商品属性の関連点数を算出するように統計基盤分類モデルを学習するステップを含む。 According to yet another embodiment of the present disclosure, a learning method for product attribute extraction for shopping search performed by a computer system comprises a plurality of first user queries and a plurality of queries associated with the plurality of first user queries. generating a plurality of first learning data including the first product attributes of and, based on the plurality of first learning data, determining the relevance score of the one or more product attributes corresponding to the second user query training a statistically-based classification model to compute.
本開示のまた他の実施例によれば、前述したショッピング検索のための商品属性抽出の学習方法をコンピュータで実行するためのコンピュータプログラムが提供される。 According to yet another embodiment of the present disclosure, there is provided a computer program for executing the above learning method for product attribute extraction for shopping search on a computer.
本開示のまた他の実施例によれば、ショッピング検索のための商品属性抽出システムは、ユーザクエリを受信する通信モジュール、メモリ、及び、メモリと連結し、メモリに含まれたコンピュータ読み取り可能な命令を実行するように構成された少なくとも一つのプロセッサを含む。少なくとも一つのプロセッサは、商品データベースからユーザクエリに対する商品検索結果を抽出し、統計基盤分類モデルを用いて、ユーザクエリ及び複数の商品属性の関連点数を算出し、算出された関連点数に基づいて前記商品検索結果による商品検索順位を調整する。 According to yet another embodiment of the present disclosure, a product attribute extraction system for shopping search includes a communication module for receiving a user query, a memory, and computer readable instructions coupled to the memory, comprising: at least one processor configured to execute At least one processor extracts product search results for user queries from a product database, calculates relevance scores of user queries and a plurality of product attributes using a statistically-based classification model, and calculates the relevance scores based on the calculated relevance scores. Adjust the product search ranking according to product search results.
本開示の多様な実施例によれば、ユーザクエリからユーザの意図した商品属性が反映された検索結果をユーザ端末に出力できる。また、本開示の多様な実施例によれば、ユーザクエリと関連する商品属性を持つ商品を検索結果の上部に表示することで、当該商品に対するユーザらのクリック率及び購買率を向上させることができる。 According to various embodiments of the present disclosure, it is possible to output to the user terminal a search result reflecting the product attributes intended by the user based on the user query. In addition, according to various embodiments of the present disclosure, by displaying products having product attributes related to user queries at the top of search results, users' click rate and purchase rate for the products can be improved. can.
本開示の多様な実施例によれば、ユーザクエリに対する複数の商品属性の関連点数を算出するために、統計基盤分類モデルを使用することで、ユーザクエリに対する商品属性の関連性の正確度を改善させることができる。 According to various embodiments of the present disclosure, improving the accuracy of the relevance of product attributes to user queries by using a statistically-based classification model to calculate relevance scores of multiple product attributes to user queries. can be made
本開示の多様な実施例によれば、ユーザクエリを音節及び/又は形態素の単位に分割して、統計基盤分類モデルにより商品属性に対する関連点数を算出することで、タイプミス又は学習データにないユーザクエリに対しても、商品属性の関連点数の算出の正確性を向上させることができる。また、統計基盤分類モデルの学習データのマッチングカバレッジ(matching coverage)が極大化し、ユーザクエリ及び複数の商品属性の関連点数の算出の正確度を一層向上させることができる。 According to various embodiments of the present disclosure, by dividing a user query into units of syllables and/or morphemes and calculating relevance scores for product attributes using a statistically-based classification model, it is possible to It is also possible to improve the accuracy of calculation of the associated score of product attributes for queries. In addition, the matching coverage of the learning data of the statistical-based classification model is maximized, and the accuracy of calculation of user queries and related scores of multiple product attributes can be further improved.
本開示の多様な実施例によれば、ユーザクエリに対する複数の商品属性の関連点数を算出する統計基盤分類モデルの学習に使用される学習データを、統合検索ログデータやショッピング又は商品検索ログデータなどのような多様な検索ログデータから生成できる。また、学習データは、検索ログデータのうちでユーザが入力したユーザクエリ、検索結果及び検索結果に応答するユーザの動作に基づいて自動生成できるので、統計基盤分類モデルの学習データを効率よく確保できる。 According to various embodiments of the present disclosure, the learning data used for learning a statistically-based classification model that calculates the relevance scores of multiple product attributes for a user query may be integrated search log data, shopping or product search log data, or the like. It can be generated from various search log data such as In addition, learning data can be automatically generated based on user queries, search results, and user actions in response to search results among search log data, so that learning data for the statistical-based classification model can be efficiently secured. .
本開示の多様な実施例によれば、商品属性を商品属性コードで表示することで、同一又は類似の商品属性が互いに異なる商品類型又はユーザクエリと関連することにより、商品属性抽出の結果の正確性を低下させるのを防止できる。すなわち、商品属性を商品属性コードで表示して統計基盤分類モデルを学習させることで、両義的商品属性及び範囲型商品属性に対しても関連点数の算出の正確性を向上させることができる。 According to various embodiments of the present disclosure, by displaying product attributes as product attribute codes, the same or similar product attributes are associated with different product types or user queries, thereby improving the accuracy of product attribute extraction results. It can prevent deterioration of performance. That is, by displaying product attributes as product attribute codes and learning a statistically-based classification model, it is possible to improve the accuracy of calculation of related points even for ambiguous product attributes and range-type product attributes.
本開示の実施例は、以下の添付図面に基づいて説明する。ここで、類似の参照番号は類似の要素を示すが、これに限定されるものではない。
以下、本開示の実施のための具体的な内容を添付図面に基づいて詳細に説明する。ただし、
以下の説明では、本開示の要旨を不要にぼやかす恐れがある場合、公知の機能や構成に関する具体的な説明は省略する。
Hereinafter, specific contents for carrying out the present disclosure will be described in detail based on the accompanying drawings. however,
In the following description, specific descriptions of well-known functions and configurations are omitted when they may unnecessarily obscure the subject matter of the present disclosure.
添付図面において、同一又は対応する構成要素には同一の参照符号が付与される。また、以下の実施例の説明において、同一又は対応する構成要素の重複記述は省略され得る。しかしながら、構成要素に関する記述が省略されても、そのような構成要素がある実施例に含まれないものと解してはならない。 In the accompanying drawings, the same or corresponding components are provided with the same reference numerals. Also, in the description of the embodiments below, duplicate descriptions of the same or corresponding components may be omitted. However, the omission of a description of an element should not be construed as omitting such element from being included in some embodiments.
開示の実施例の利点及び特徴、そしてそれらを達成する方法は、添付図面に基づいて後述する実施例を参照すれば明確になる。しかしながら、本開示は、以下で開示される実施例に限定されず、互いに異なる多様な形態で具現され得る。但し、本実施例は、本開示が完全になるようにし、本開示が通常の技術者に発明のカテゴリを正確に認識させるために提供されるだけである。 Advantages and features of the disclosed embodiments, and the manner in which they are achieved, will become apparent with reference to the embodiments described below with reference to the accompanying drawings. The present disclosure may, however, be embodied in various different forms and should not be construed as limited to the embodiments set forth below. However, the examples are provided only so that this disclosure will be complete and will enable those of ordinary skill in the art to accurately recognize the categories of the invention.
本明細書で使用される用語について簡略に説明し、開示の実施例について具体的に説明する。本明細書で使用される用語は、本開示での機能を考慮しつつ、可能な限り現在広く使用される一般的な用語を選択したが、これは関連分野に従事する技術者の意図又は判例、新技術の出現などにより変化し得る。また、特定の場合は出願人が任意で選定した用語もあり得るが、これらの意味は当該発明の説明の部分において詳細に記載する。よって、本開示で使用される用語は、単純な用語の名称ではなく、その用語が持つ意味と本開示の全般にわたった内容に基づいて定義されるべきである。 A brief description of terms used herein and a specific description of the disclosed embodiments are provided. The terms used in this specification have been selected as common terms that are currently widely used as much as possible while considering the function in this disclosure, but this is not the intention or precedent of an engineer engaged in the related field. , may change due to the emergence of new technologies. Also, certain terms may be arbitrarily chosen by the applicant, the meaning of which will be detailed in the description of the invention. Accordingly, terms used in this disclosure should be defined based on their meanings and overall context of this disclosure, rather than simply terminology.
本明細書では、文脈上において明確に特定しない限り、単数の表現は複数の表現を含み、複数の表現は単数の表現を含むことができる。 In this specification, singular expressions may include pluralities and plural expressions may include the singular unless the context clearly dictates otherwise.
明細書の全般に渡り、ある部分がある構成要素を「含む」とする際、これは特に反対の記載がない限り、他の構成要素を除くものではなく、他の構成要素をさらに含むこともできることを意味する。 Throughout the specification, when a part "includes" an element, this does not exclude or may include other elements, unless specifically stated to the contrary. means you can.
また、明細書で使用される「モジュール」又は「部」という用語は、ソフトウェアやハードウェア構成要素を意味し、「モジュール」又は「部」はある役割を遂行する。しかしながら、「モジュール」又は「部」はソフトウェアやハードウェアに限定される意味ではない。「モジュール」又は「部」は、アドレッシング可能な保存媒体にあるように構成してもよく、一つ又はそれ以上のプロセッサを再生させるように構成してもよい。したがって、一例として、「モジュール」又は「部」は、ソフトウェア構成要素、オブジェクト指向ソフトウェア構成要素、クラス構成要素、タスク構成要素のような構成要素、並びに、プロセス、関数、属性、プロシーザー、サブルーチン、プログラムコードのセグメント、ドライバー、ファームウェア、マイクロコード、回路、データ、データベース、データ構造、テーブル、アレイ又は変数のうちで少なくとも一つを含むことができる。構成要素と「モジュール」又は「部」は、内部で提供される機能はさらに小さい数の構成要素及び「モジュール」又は「部」で結合されたり、追加的な構成要素と「モジュール」又は「部」にさらに分離されたりできる。 Also, the term "module" or "unit" as used herein means a software or hardware component that performs a certain role. However, "module" or "unit" is not meant to be limited to software or hardware. A "module" or "unit" may be configured to reside on an addressable storage medium and configured to run on one or more processors. Thus, by way of example, a "module" or "part" may refer to components such as software components, object-oriented software components, class components, task components, as well as processes, functions, attributes, procedures, subroutines, It may include at least one of program code segments, drivers, firmware, microcode, circuits, data, databases, data structures, tables, arrays or variables. Components and "modules" or "sections" may be combined with a smaller number of components and "modules" or "sections" or may be combined with additional components and "modules" or "sections". ” can be further separated into
本開示の一実施例によれば、「モジュール」又は「部」はプロセッサ及びメモリで具現され得る。「プロセッサ」は汎用プロセッサ、中央処理装置(CPU)、マイクロプロセッサ、デジタル信号プロセッサ(DSP)、制御器、マイクロ制御器、状態マシンなどを含むように広く解釈されるべきである。いくつかの環境では、「プロセッサ」は特定用途向け半導体(ASIC)、プログラム可能なロジックデバイス(PLD)、フィールドプログラム可能なゲートアレイ(FPGA)等を指すこともできる。「プロセッサ」は、例えば、DSPとマイクロプロセッサの組合せ、複数のマイクロプロセッサの組合せ、DSPコアと結合した一つ以上のマイクロプロセッサの組合せ、若しくは、任意の他のそのような構成等の組合せのような処理デバイスの組合せを指すこともできる。また、「メモリ」は電子情報を保存可能な任意の電子コンポーネントを含むように広く解釈されるべきである。「メモリ」は、RAM(Random Access Memory)、ROM(Read Only Memory)、NVRAM(Non-Volatile Random Access Memory)、PROM(Programmable Read-Only Memory)、EPROM(Erasable Programmable Read-Only Memory)、EEPROM(Electrically Erasable Programmable Reda-Only Memory)、フラッシュメモリ、磁気又は光学データ保存装置、レジスターなどのようなプロセッサ-読み取り可能な媒体の多様な類型を指すこともできる。プロセッサがメモリから情報を読み取り/読み取ったりメモリに情報を記録できる場合、メモリはプロセッサと電子通信状態にあると言われる。プロセッサに集積されたメモリはプロセッサと電子通信状態にある。 According to one embodiment of the present disclosure, a "module" or "unit" may be embodied with a processor and memory. "Processor" should be interpreted broadly to include general purpose processors, central processing units (CPUs), microprocessors, digital signal processors (DSPs), controllers, microcontrollers, state machines, and the like. In some environments, a "processor" can also refer to an application specific semiconductor (ASIC), programmable logic device (PLD), field programmable gate array (FPGA), and the like. A "processor" may be, for example, a combination of a DSP and a microprocessor, a combination of multiple microprocessors, a combination of one or more microprocessors combined with a DSP core, or any other such configuration. It can also refer to any combination of processing devices. Also, "memory" should be interpreted broadly to include any electronic component capable of storing electronic information. "Memory" includes RAM (Random Access Memory), ROM (Read Only Memory), NVRAM (Non-Volatile Random Access Memory), PROM (Programmable Read-Only Memory), EPROM (Erasable Programmable Read-Only Memory), EEPROM ( It can also refer to various types of processor-readable media such as electrically erasable programmable reda-only memory), flash memory, magnetic or optical data storage devices, registers, and the like. Memory is said to be in electronic communication with a processor when the processor can read information from, or record information in, the memory. Memory integrated with the processor is in electronic communication with the processor.
本開示において、「ユーザクエリ」は、検索エンジンを用いて入力及び検索できるテキスト(例えば、単語、文句、文章等)を含むことのできるが、これに限定されるものではない。例えば、ユーザクエリは、ユーザがウェブブラウザ、検索アプリケーション又はショッピングアプリケーションのような検索プログラムの入力UIを介して入力するテキストを含んだり、ユーザが検索プログラムで提供するクエリリストからクリックにより選択できるテキストを含んだりできる。他の例において、ユーザクエリは、テキストに限定されず、イメージ、映像、音声、声などのようなマルチメディアコンテンツから抽出できるテキスト又は情報を含むことができる。 In the present disclosure, a "user query" can include, but is not limited to, text (eg, words, phrases, sentences, etc.) that can be entered and searched using a search engine. For example, a user query includes text that a user inputs through an input UI of a search program such as a web browser, search application, or shopping application, or text that a user can select from a query list provided by a search program by clicking on it. can contain In other examples, user queries are not limited to text, but can include text or information that can be extracted from multimedia content such as images, videos, sounds, voices, and the like.
本開示において、「商品属性」は、商品名、製品番号、規格又はサイズ、形態、色相、材質、性能、価格などを含む商品に関する多様な情報を示すことができる。例えば、商品属性は、ショッピング検索又は商品検索の結果として当該商品の購買先に関する接続情報(例えば、商品購買ウェブページに関するリンク情報)と共にユーザに提供され得る。 In the present disclosure, the 'product attribute' may indicate various information about the product, including product name, product number, standard or size, shape, color, material, performance, price, and the like. For example, the product attributes may be provided to the user as a result of a shopping search or product search along with connection information regarding the purchaser of the product (eg, link information regarding a product purchase web page).
本開示において、「統計基盤分類モデル」は、公知のラベル付き(labeling)データに対する関連性(relevance)に基づき、ラベル付きにならない新しい情報を分類するように学習さされた分類器(classifier)又は分類モデルを一般的に示すことができる。例えば、統計基盤分類モデルは、言語モデル(language model)、SVM(support vector machine)、最大エントロピーモデル(maximum entropy model)、CRFモデル(conditional random field model)、FFNN(feed-forward neural network)、RNN(recurrent neural network)、GRU(gated recurrent unit)、LSTM(long short-term memory)、トランスフォーマーモデル(transformer model)、BERTモデル(bidirectional encoder representations from transformers model)などのような多様な機械学習又は人工ニューラルネットワーク(neural network)モデルの何れか一つであり得る。 In the present disclosure, a “statistics-based classification model” is a classifier trained to classify new unlabeled information based on its relevance to known labeled data, or Classification models can be presented generically. For example, statistically based classification models include language model, SVM (support vector machine), maximum entropy model, CRF model (conditional random field model), FFNN (feed-forward neural network), RNN (recurrent neural network), GRU (gated recurrent unit), LSTM (long short-term memory), transformer model, BERT model (bidirectional encoder representations from transformers model), etc. It can be any one of a neural network model.
本開示において、「埋め込み(embedding)」は、カテゴリ変数又は離散変数(categorical or discrete variable)を連続ベクトル(continuous vector)に変換する技法を示すことができる。埋め込みは、ユーザクエリのようなカテゴリ変数を連続ベクトルに変換することにより、その情報の次元を縮小し、意味を導出するのに使用できる。また、ユーザクエリが埋め込みベクトル空間でベクトルとして表現される場合、そのベクトル空間上における近所のベクトル等は類似又は関連した特性を共有できる。例えば、ユーザクエリをベクトル空間に埋め込む方法は、人工ニューラルネットワークの学習により具現できる。 In this disclosure, "embedding" can refer to the technique of transforming a categorical or discrete variable into a continuous vector. Embedding can be used to reduce the dimensionality of information and derive meaning from categorical variables, such as user queries, by transforming them into continuous vectors. Also, if a user query is represented as a vector in an embedded vector space, neighborhood vectors, etc. on that vector space can share similar or related properties. For example, a method of embedding user queries in a vector space can be implemented by training an artificial neural network.
図1は、本開示の一実施例に係るショッピング検索のための商品属性抽出方法によりユーザクエリ110から抽出された商品属性を反映した検索結果130を表示する画面100を例示する図である。同図に示すように、ユーザがショッピングサイトの検索窓にユーザクエリ110を入力する場合、当該ユーザクエリ110から抽出した商品属性134、138を反映した検索結果130が表示され得る。検索結果130には、検索の商品を示すイメージや名称132、136及び商品属性134、138などが含まれる。例えば、ユーザが「ミニノートブック」を検索クエリとして入力した場合、当該クエリに含まれた商品である「ノートブック」コンピュータのサイズ又は規格に関する表現である「ミニ」と関連する商品132、136が、検索結果130の上部に表示されるように検索結果の順位が調整され得る。すなわち、検索結果130には、多様なノートブック(又はラップトップ)コンピュータ商品のうち、画面サイズが「10インチ」及び「11インチ」である商品132、136が、検索結果130の上部に優先的に表示され得る。したがって、ユーザは、検索結果130を介して、本人が入力した商品検索クエリから抽出できる商品属性134、138と関連する商品132、136の情報を容易且つ迅速に確認できる。また、ユーザは、必要に応じて、当該商品132、136の何れか一つを選択又はクリックすることで、選択の商品に関するより具体的な情報を取得したり、オンライン購買を実行したりできる。
FIG. 1 is a diagram illustrating a
さらに、画面100において、検索結果130の上部には、商品属性をフィルタリング又は選択できるユーザインタフェース120が表示され得る。したがって、ユーザは、ユーザインタフェース120から、商品カテゴリや製造社や画面サイズなどのように、ユーザクエリ110と関連する商品属性の一つ以上を選択して、検索結果130に表示された商品132、136の順序又は順位をさらに調整できる。例えば、ユーザが、ユーザインタフェース120から製造社フィルタリング項目のうちで「A社」を選択する場合、検索結果130には「A社」の生産商品等の情報が上部に表示され得る。
Further, in
一実施例において、ユーザクエリ110が入力された場合、商品属性抽出方法によりユーザクエリ110に対する複数の商品属性の関連性又は関連確率が算出できる。例えば、ノートブックコンピュータの商品属性は、色相、ケースの材質、CPUの性能、メモリの容量、画面サイズ及び解像度などを含むことができる。他の例として、家庭用TVの商品属性は、色相、ディスプレイの種類、サイズ、解像度及びインターネット接続機能可否などを含むことができる。商品属性抽出方法は、ユーザクエリ110が「ミニノートブック」である場合、ノートブックコンピュータの複数の商品属性だけでなく、家庭用TV、ファッション雑貨及び生活健康用品などの異なる種類の商品の複数の商品属性に対しても関連性が算出できる。ユーザクエリ110が「ミニノートブック」である場合、ノートブックコンピュータの商品属性のうち、小型の画面サイズ属性(例えば、「10インチ」)に対する関連性が最も高く算出されるのに対し、ノートブックコンピュータの異なる商品属性や異なる種類の商品の商品属性に対する関連性は低く算出され得る。
In one embodiment, when the
一方、ユーザクエリ110に対する商品検索結果130を商品データベースから得られる。ユーザクエリ110による商品検索は、商品データベースに保存された商品情報のうち、ユーザクエリ110と関連性が高い商品情報を抽出することにより実行できる。このように抽出された商品検索結果130には、ユーザクエリ110との関連性の高い商品情報の方が、関連性の低い商品情報よりも上位に表示され得る。また、前述したように算出されたユーザクエリ110に対する商品属性の関連性(又は関連点数)に基づき、商品検索結果130による商品検索順位が調整できる。これによれば、ユーザクエリ110が「ミニノートブック」である場合、商品検索結果130には、画面サイズが小さいノートブックコンピュータに関する商品132、136情報が上位に表示され得る。
On the other hand, a
また、ユーザクエリ110に対する商品属性抽出方法によれば、ユーザクエリ110を音節(syllable)及び/又は形態素(morpheme)の単位に分割して分析することで、ユーザクエリ110に対する複数の商品属性の関連点数が算出できる。一実施例において、商品属性抽出方法は、ユーザクエリ110を音節の単位に分割して分析することで、ユーザクエリ110に対する複数の商品属性の関連点数が算出できる。また、商品属性抽出方法は、ユーザクエリ110を形態素の単位に分割して分析することで、ユーザクエリ110に対する複数の商品属性の関連点数が算出できる。以上のように抽出された2つの関連点数は、合算又は結合により最終の関連点数として用いられる。
In addition, according to the product attribute extraction method for the
ユーザクエリ110に対する商品属性抽出方法は、統計基盤分類モデルにより商品属性の関連点数が算出できる。統計基盤分類モデルは、ユーザクエリ110が複数の商品属性と関連する確率を算出するように学習できる。一実施例において、統計基盤分類モデルは、音節及び/又は形態素の単位に分割されたユーザクエリ110を入力として、可能な全ての商品属性と関連する確率(又は関連点数)を算出するように学習できる。例えば、ユーザクエリ110として「ミニノートブック」が入力された場合、画面サイズが小さい「10インチ」又は「11インチ」の商品属性134、138に該当する確率値が、画面サイズが大きい「17インチ」の商品属性に該当する確率値よりも大きく算出され得る。
The product attribute extraction method for the
以上で説明した方法により、統計基盤分類モデルにより算出された商品属性の関連点数に基づき、検索結果130に含まれた商品132、136の検索順位が調整できる。商品検索順位(又は商品検索順位点数)は、ユーザクエリ110に対する商品名又は商品属性の語彙類似度、商品に対するユーザ人気度等に基づいて決定され得る。このとき、各商品132、136の検索順位点数に対して商品属性の関連点数が合算又は加重値として適用されて、最終の商品132、136の検索順位点数が決定され得る。一実施例において、ユーザクエリ110に対して算出された商品属性の関連点数のうち、最も高い関連点数に基づいて商品132、136の検索順位が調整できる。代案として、ユーザクエリ110に対して算出された商品属性の関連点数のうち、上位n個(nは1より大きい整数)の関連点数に基づいて商品132、136の検索順位が調整できる。
According to the method described above, the search rankings of the
他の実施例において、ユーザクエリ110に対する商品属性抽出方法は、商品データベースから商品情報の商品属性を生成又はアップデートするのに使用される。例えば、商品属性抽出方法は、商品データベースに保存された商品情報の商品名に基づき、可能な全ての商品属性の関連点数を算出し、最も高い関連点数と関連する商品属性を当該商品情報の商品属性として保存又はアップデートできる。
In another embodiment, the product attribute extraction method for
図1に示す例は、本開示のショッピング検索のための商品属性抽出方法によって決定された商品検索結果130又は商品検索順位が、商品検索又はショッピングのためのウェブサイトやアプリケーションを介して提供されることを示しているが、これに限定されるものではない。本開示の多様な実施例による方法は、統合検索サイトの検索サービス又はユーザ端末により実行される検索アプリケーションを介して提供されることもできる。
In the example shown in FIG. 1,
図2は、本開示の一実施例に係るショッピング検索のための商品属性抽出サービスを提供するために、複数のユーザ端末210_1、210_2、210_3及び商品属性抽出サーバ230が通信可能に連結したシステム200を示す概要図である。同図に示すように、システム200は、ショッピング検索のための商品属性抽出サービスを提供する商品属性抽出サーバ230と、商品属性抽出サーバ230にネットワーク220を介して連結した複数のユーザ端末210_1、210_2、210_3と、検索ログデータベース240とを含むことができる。一実施例によれば、商品属性抽出サーバ230は、商品属性抽出サービスを提供するためのコンピュータ実行可能なプログラム(例えば、ダウンロード可能なアプリケーション)や、データを保存、提供及び実行できる一つ以上のサーバ装置及び/又はデータベースや、クラウドコンピューティング(cloud computing)サービス基盤の一つ以上の分散コンピュータ装置及び/又は分散データベースを含むことができる。商品属性抽出サーバ230により提供される商品属性抽出サービスは、複数のユーザ端末210_1、210_2、210_3の各々に設置された検索アプリケーション又はウェブブラウザを介してユーザに提供され得る。
FIG. 2 illustrates a
複数のユーザ端末210_1、210_2、210_3は、ネットワーク220を介して商品属性抽出サーバ230と通信できる。ネットワーク220は、複数のユーザ端末210及び商品属性抽出サーバ230間の通信が可能であるように構成できる。ネットワーク220は、設置環境に応じて、例えば、イーサネット(Ethernet)、PLC(Power Line Communication)、電話線通信装置及びRS-serial通信などのような有線ネットワーク220、移動通信網、WLAN(Wireless LAN)、Wi-Fi、Bluetooth及びZigBeeなどのような無線ネットワーク220又はその組合せからなることができる。通信方式は制限されず、ネットワーク220を含むことができる通信網(例えば、移動通信網、有線インターネット、無線インターネット、放送網、衛星網等)を活用する通信方式だけでなく、ユーザ端末210_1、210_2、210_3間の近距離無線通信も含まれる。例えば、ネットワーク220は、PAN(personal area network)、LAN(local area network)、CAN(campus area network)、MAN(metropolitan area network)、WAN(wide area network)、BBN(broadband network)、インターネットなどのネットワークの何れか一つ以上を含むことができる。また、ネットワーク220は、バスネットワーク、スターネットワーク、リングネットワーク、メッシュネットワーク、スター-バスネットワーク、ツリー又は階層ネットワークなどを含むネットワークトポロジー(network topology)の何れかの一つ以上を含むことができるが、これに制限されるものではない。
A plurality of user terminals 210_1, 210_2, and 210_3 can communicate with the product
図2では、携帯電話やスマートフォン210_1、タブレットコンピュータ210_2及びラップトップ又はデスクトップコンピュータ210_3をユーザ端末の例として示したが、これに限定されず、ユーザ端末210_1、210_2、210_3は、有線及び/又は無線通信が可能であり、検索アプリケーション、モバイルブラウザアプリケーション又はウェブブラウザが設置されて実行できる任意のコンピュータ装置であり得る。例えば、ユーザ端末210は、スマートフォン、携帯電話、ナビゲーション端末機、デスクトップコンピュータ、ラップトップコンピュータ、デジタル放送用端末機、PDA(Personal Digital Assistants)、PMP(Portable Multimedia Player)、タブレットコンピュータ、ゲームコンソール(game console)、ウェアラブルデバイス(wearable device)、IoT(internet of things)デバイス、VR(virtual reality)デバイス及びAR(augmented reality)デバイスなどを含むことができる。また、図2では、3つのユーザ端末210_1、210_2、210_3がネットワーク220を介して商品属性抽出サーバ230と通信するものと示したが、これに限定されず、異なる数のユーザ端末がネットワーク220を介して商品属性抽出サーバ230と通信するように構成されることもできる。
In FIG. 2, a mobile phone or smart phone 210_1, a tablet computer 210_2, and a laptop or desktop computer 210_3 are shown as examples of user terminals, but the user terminals 210_1, 210_2, and 210_3 are wired and/or wireless. It can be any computing device capable of communication and on which a search application, mobile browser application or web browser can be installed and executed. For example, the
一実施例によれば、商品属性抽出サーバ230は、複数のユーザ端末210_1、210_2、210_3から入力された一つ以上のユーザクエリが受信できる。一実施例によれば、商品属性抽出サーバ230は、複数のデスクトップ又はラップトップコンピュータ210_3で実行中であるウェブブラウザにより表示された検索サイトの検索エンジンに入力されたユーザクエリが受信できる。他の実施例によれば、商品属性抽出サーバ230は、複数の携帯電話やスマートフォン及びタブレットコンピュータ210_1、210_2で実行中であるモバイルブラウザアプリケーションにより表示された検索サイトの検索エンジンに入力されたユーザクエリが受信できる。他の実施例によれば、商品属性抽出サーバ230は、商品を販売するオンラインショッピングサイトの検索エンジンに入力されたユーザクエリが受信できる。
According to one embodiment, the product
また、商品属性抽出サーバ230は、受信したユーザクエリに対する複数の商品属性の関連点数が算出できる。一実施例において、商品属性抽出サーバ230は、商品属性の関連点数を算出するように学習された統計基盤分類モデルを含むことができる。商品属性抽出サーバ230は、受信したユーザクエリを音節及び/又は形態素の単位に分割し、分割した音節及び/又は形態素の単位のユーザクエリを、関連点数を算出する統計基盤分類モデルの入力として使用できる。また、商品属性抽出サーバ230は、ネットワーク220を介して連結した検索ログデータベース240から統計基盤分類モデルを学習するための学習データが受信できる。例えば、検索ログデータベース240から受信された学習データは、ユーザクエリ及び当該ユーザクエリに対する商品検索結果のうち、ユーザが選択した商品情報(例えば、特定商品の属性情報)の対(pair)を含むことができる。
In addition, the product
商品属性抽出サーバ230は、複数の商品属性の一つ以上の上位関連点数と関連する商品属性を抽出し、商品データベース(図示せず)から当該商品属性を含む商品情報が検索できる。このように検索された商品情報の順位は、商品属性の関連点数に基づいて再調整できる。また、商品属性抽出サーバ230は、上位関連点数と関連する商品属性の重要度を決定する商品属性加重値及び当該関連点数に基づいて商品検索順位が調整できる。ここで、商品属性加重値は、商品検索結果に対するユーザの応答(例えば、上位商品検索結果に対するユーザの選択回数)によって変更できる。
The product
図3は、本開示の一実施例に係るユーザ端末210及び商品属性抽出サーバ230の内部構成を示すブロック図である。ユーザ端末210は、ウェブブラウザ又はアプリケーションが実行可能であり、有/無線通信が可能な任意のコンピュータ装置を示すことができ、例えば、ユーザ端末210は、図2に示す携帯電話やスマートフォン210_1、タブレットコンピュータ210_2、ラップトップ又はデスクトップコンピュータ210_3などを含むことができる。図3に示すように、ユーザ端末210は、メモリ312、プロセッサ314、通信モジュール316及び入出力インタフェース318を含むことができる。これと同様に、商品属性抽出サーバ230は、メモリ332、プロセッサ334、通信モジュール336及び入出力インタフェース338を含むことができる。図3に示すように、ユーザ端末210及び商品属性抽出サーバ230は、各々の通信モジュール316、336を用いて、ネットワーク220を介して情報及び/又はデータが通信できるように構成できる。また、入出力装置320は、入出力インタフェース318を介して、ユーザ端末210に情報及び/又はデータを入力したり、ユーザ端末210から生成された情報及び/又はデータを出力したりするように構成できる。
FIG. 3 is a block diagram showing internal configurations of the
メモリ312、332は、非一時的な任意のコンピュータ読取り可能な記録媒体を含むことができる。一実施例によれば、メモリ312、332は、RAM(random access memory)、ROM(read only memory)、ディスクドライブ、SSD(solid state drive)及びフラッシュメモリ(flash memory)などのような永久的な大容量記憶装置(permanent mass storage device)を含むことができる。他の例として、ROM、SSD、フラッシュメモリ及びディスクドライブなどのような永久的な大容量保存装置は、メモリ312、332とは区分される別途の永久保存装置としてユーザ端末210又は商品属性抽出サーバ230に含まれることができる。また、メモリ312、332には、運営体制と少なくとも一つのプログラムコード(例えば、ユーザ端末210又は商品属性抽出サーバ230に設置されて駆動される商品属性抽出方法を実行するためのコード)が保存され得る。
このようなソフトウェア構成要素は、メモリ312、332とは別途のコンピュータで読み取り可能な記録媒体からローディングできる。このような別途のコンピュータで読み取り可能な記録媒体は、このようなユーザ端末210及び商品属性抽出サーバ230に直接連結可能な記録媒体を含むことのできるが、例えば、フロッピードライブ、ディスク、テープ、DVD/CD-ROMドライブ及びメモリカードなどのようなコンピュータで読み取り可能な記録媒体を含むことができる。他の例として、ソフトウェア構成要素等は、コンピュータで読み取り可能な記録媒体でない、通信モジュール316、336を介してメモリ312、332にローディングできる。例えば、少なくとも一つのプログラムは、開発者又はアプリケーションの設置ファイルを配信するファイル配信システムが、ネットワーク220を介して提供するファイルにより設置されるコンピュータプログラム(例えば、ショッピング検索のための商品属性抽出サービスを提供するアプリケーション)に基づいてメモリ312、332にローディングできる。
Such software components can be loaded from a computer-readable medium separate from the memories 312,332. Such separate computer-readable recording media can include recording media directly connectable to the
プロセッサ314、334は、基本的な算術、ロジック及び入出力演算を遂行することで、コンピュータプログラムの命令を処理するように構成できる。命令は、メモリ312、332又は通信モジュール316、336によりプロセッサ314、334に提供され得る。例えば、プロセッサ314、334は、メモリ312、332のような記録装置に保存されたプログラムコードによって受信される命令を実行するように構成できる。
The
通信モジュール316、336は、ネットワーク220を介して、ユーザ端末210と商品属性抽出サーバ230とが互いに通信するための構成や機能が提供でき、ユーザ端末210及び/又は商品属性抽出サーバ230が、他のユーザ端末又は他のシステム(例えば、別途の検索エンジンシステム等)と通信するための構成や機能が提供できる。一例として、ユーザ端末210のプロセッサ314がメモリ312などのような記録装置に保存されたプログラムコードによって生成した要請やデータ(例えば、ユーザクエリに対する商品属性を考慮した検索結果出力要請)は、通信モジュール316の制御により、ネットワーク220を介して商品属性抽出サーバ230に伝達され得る。反対に、商品属性抽出サーバ230のプロセッサ334の制御により提供される制御信号や命令が、通信モジュール336及びネットワーク220を経て、ユーザ端末210の通信モジュール316を介してユーザ端末210に受信され得る。例えば、ユーザ端末210は、商品属性抽出サーバ230から通信モジュール316を介してユーザクエリに対する商品検索結果、複数の商品属性の関連点数、算出された関連点数が反映された商品検索結果などが受信できる。
入出力インタフェース318は、入出力装置320とのインタフェースのための手段であり得る。一例として、入力装置はイメージセンサを含むカメラ、キーボード、マイクロホン、マウスなどのような装置を含み、出力装置はディスプレイ、スピーカ、ハプティックフィードバックデバイス(haptic feedback device)などのような装置を含むことができる。他の例として、入出力インタフェース318は、タッチスクリーンなどのように入力及び出力を遂行するための構成及び機能が一つで統合された装置とのインタフェースのための手段であり得る。例えば、ユーザ端末210のプロセッサ314がメモリ312にローディングされたコンピュータプログラムの命令を処理する際に、商品属性抽出サーバ230や他のユーザ端末210が提供する情報及び/又はデータを用いて構成されるサービス画面や商品検索結果が、入出力インタフェース318を介してディスプレイに表示され得る。図3では、入出力装置320がユーザ端末210に含まれないように示したが、これに限定されず、ユーザ端末210と一体に構成することもできる。また、商品属性抽出サーバ230の入出力インタフェース338は、商品属性抽出サーバ230と連結するか、又は、商品属性抽出サーバ230が含むことができる入力や出力のための装置(図示せず)とのインタフェースのための手段であり得る。図3では、入出力インタフェース318、338をプロセッサ314、334と別途に構成された要素として示したが、これに限定されず、入出力インタフェース318、338をプロセッサ314、334に含まれるように構成することもできる。
Input/
ユーザ端末210及び商品属性抽出サーバ230は、図3に示す構成要素よりも多くの構成要素を含むことができる。しかしながら、大部分の従来技術的構成要素を明確に示す必要はない。一実施例によれば、ユーザ端末210は、前述した入出力装置320の少なくとも一部を含むように具現できる。また、ユーザ端末210は、トランシーバー(transceiver)、GPS(Global Positioning system)モジュール、カメラ、各種センサ及びデータベースなどのような他の構成要素をさらに含むことができる。例えば、ユーザ端末210がスマートフォンである場合、一般にスマートフォンが持つ構成要素を含むことができ、例えば、加速度センサ、ジャイロセンサ、カメラモジュール、各種物理的なボタン、タッチパネルを用いたボタン、入出力ポート及び振動のための振動器などのような多様な構成要素がユーザ端末210にさらに含まれるように具現できる。
The
一実施例によれば、ユーザ端末210のプロセッサ314は、商品検索又はショッピングサイトに接続可能な検索アプリケーション、モバイルブラウザアプリケーション又はウェブブラウザが動作するように構成できる。このとき、当該アプリケーション又はウェブブラウザと関連するプログラムコードがユーザ端末210のメモリ312にローディングできる。
According to one embodiment, the
ユーザ端末210のプロセッサ314は、入出力装置320から提供された情報及び/又はデータを入出力インタフェース318を介して受信したり、通信モジュール316を介して商品属性抽出サーバ230から情報及び/又はデータを受信したりでき、受信された情報及び/又はデータを処理してメモリ312に保存できる。また、このような情報及び/又はデータは、通信モジュール316を介して商品属性抽出サーバ230に提供できる。
The
一実施例によれば、プロセッサ314は、入出力インタフェース318と連結したタッチスクリーンやキーボードなどの入出力装置320により入力されたり、選択されたテキスト、イメージ及び動作などが受信したりできる。受信されたテキスト、イメージ及び/又は動作をメモリ312に保存したり、通信モジュール316及びネットワーク220を介して商品属性抽出サーバ230に提供したりできる。例えば、プロセッサ314は、タッチスクリーンやキーボードなどのような入出力装置により、一つ以上のユーザクエリ及び/又はユーザクエリに対応する商品属性などが受信でき、受信されたユーザクエリ及び/又は商品属性に対する入力などは、通信モジュール316及びネットワーク220を介して商品属性抽出サーバ230に提供できる。
According to one embodiment,
一実施例によれば、プロセッサ314は、入力装置により受信されたユーザクエリ又はユーザクエリに対する検索結果要請を、ネットワーク220及び通信モジュール316を介して商品属性抽出サーバ230に提供できる。ユーザクエリを受信した商品属性抽出サーバ230は、ユーザクエリから複数の商品属性の関連点数が算出できる。また、商品属性抽出サーバ230は、算出された商品属性の関連点数が反映された商品検索結果又は商品検索順位に関する情報が提供できる。
According to one embodiment, the
他の実施例によれば、プロセッサ314は、入力装置により受信されたユーザクエリ又はユーザクエリに対する検索結果要請を、ネットワーク220及び通信モジュール316を介して商品属性抽出サーバ230に提供できる。また、プロセッサ314は、ネットワーク220及び通信モジュール316を介して、商品属性抽出サーバ230又は商品データベースからユーザクエリによる商品検索結果が受信できる。プロセッサ334は、ユーザクエリ又はユーザクエリに対する検索結果要請に応じて、ユーザクエリに対する複数の商品属性の関連点数を算出し、算出された関連点数を商品検索結果に適用して商品検索順位が調整できる。
According to another embodiment, the
他の実施例によれば、商品属性抽出サーバ230は、ユーザ端末210からユーザクエリ及びユーザにより選択された商品属性を、ネットワーク220及び通信モジュール316を介して受信できる。代案として、商品属性抽出サーバ230は、検索ログデータベース(図2の240)からユーザクエリ及びユーザにより選択された商品属性のデータ対を、ネットワーク220を介して受信できる。商品属性抽出サーバ230は、受信したユーザクエリ及び商品属性のデータ対から学習データを生成し、生成された学習データを用いて、ユーザクエリ及び商品属性の関連点数を算出するための統計基盤分類モデルを学習させることができる。
According to another embodiment, the product
図4は、本開示の一実施例に係る統計基盤分類モデル420を用いてユーザクエリ410に対する商品属性の関連点数434、444、454を算出する構成を示す図である。統計基盤分類モデル420は、図2及び図3に示す商品属性抽出サーバ230又はユーザ端末210により生成、保存又は実行され得る。図4に示すように、統計基盤分類モデル420は、ユーザクエリ410を入力として、複数の商品属性430、440、450に対する関連点数434、444、454が出力できる。ここで、複数の商品属性430、440、450は、対応する複数の商品属性コード432、442、452で表現され得る。このとき、商品属性コード432、442、452は、両義的商品属性又は範囲型商品属性に対応するために既定されることができる。例えば、商品属性のうち、ノートブックの画面サイズを示す「10インチ」(430)と、家庭用TVの画面サイズを示す「10インチ」とは、互いに異なる商品属性を示すことができるので、互いに異なる商品コードで表現されることができる。また、関連点数434、444、454は、ユーザクエリ410が複数の商品属性430、440、450の各々と関連する確率値であり得る。例えば、ユーザクエリ410が「ミニノートブック」である場合、画面サイズが小さい「10インチ」(430)の商品属性と関連する確率値は「0.7」であり、画面サイズが中間である「12インチ」(440)の商品属性と関連する確率値は「0.17」であり、画面サイズが大きい「15インチ」(450)の商品属性と関連する確率値は「0.01」であり得る。
FIG. 4 is a diagram illustrating a configuration for calculating product attribute related
各々の商品属性430、440、450に対する関連点数434、444、454は、統計基盤分類モデル420により算出できる。統計基盤分類モデル420は、入力されたユーザクエリ410から複数の商品属性と関連する確率値を算出するように学習できる。この場合、商品属性抽出サーバ又はユーザ端末は、検索ログデータベース(例えば、図2の240)から統計基盤分類モデル420を学習するための学習データが受信できる。例えば、検索ログデータベースから受信された学習データは、ユーザクエリ410及び当該ユーザクエリ410に対する商品検索結果のうち、ユーザが選択した商品情報(例えば、特定商品の属性情報)の対を含むことができる。また、統計基盤分類モデル420は、ユーザクエリ410に対する複数の商品属性の関連性を決定するための機械学習又は人工ニューラルネットワークモデルであり得る。
Relevance scores 434 , 444 , 454 for each
図4では、1つの統計基盤分類モデル420を用いて、ユーザクエリ410に対する3つの商品属性430、440、450の関連点数434、444、454が算出されることを示したが、これに限定されるものではない。多様な具現方式により、統計基盤分類モデル420は、ユーザクエリ410に対して3つ未満又は4つ以上の商品属性の関連点数が算出されるように構成できる。また、ユーザクエリ410を前処理又は分析する方法により、2つ以上の統計基盤分類モデルが使用できる。一実施例において、ユーザクエリ410は、より小さな単位の複数のデータ(例えば、形態素及び/又は音節の単位のデータ)に分割され、分割されたデータは、対応する複数の統計基盤分類モデルに入力され得る。この場合、複数の統計基盤分類モデルから算出された関連点数を合算又は結合して、最終の関連点数が算出できる。
FIG. 4 shows that the association scores 434, 444, 454 of the three product attributes 430, 440, 450 for the
図5は、本開示の一実施例に係る前処理器510及び統計基盤分類モデ522、524を含む分類器520を用いて関連点数534、544、554を算出する構成を示す図である。前処理器510及び分類器520は、図2及び図3に示す商品属性抽出サーバ230又はユーザ端末210により生成、保存又は実行できる。図5に示すように、商品属性抽出サーバ又はユーザ端末は、ユーザクエリ410を分析して統計基盤分類モデル522、524の入力データを生成する前処理器510と、前処理器510から生成された入力データを用いて複数の商品属性に対する関連点数を算出する分類器520とを含むことができる。
FIG. 5 is a diagram illustrating a configuration for calculating
前処理器510は、ユーザクエリ410を音節の単位に分割する音節単位分割部512と、ユーザクエリ410を形態素の単位に分割する形態素単位分割部514とを含むことができる。一実施例において、音節単位分割部512及び形態素単位分割部514は、ユーザクエリ410のテキストを各々音節埋め込みベクトル及び形態素埋め込みベクトルに変換できる。音節単位分割部512及び形態素単位分割部514の各々は、ユーザクエリ410を連続ベクトル空間に埋め込むように学習された人工ニューラルネットワークで具現できる。
The
また、分類器520は、音節の単位に分割されたユーザクエリ410を入力とする第1の統計基盤分類モデル522と、形態素の単位に分割されたユーザクエリ410を入力とする第2の統計基盤分類モデル524と、各々の統計基盤分類モデル522、524から算出された関連点数を合算又は結合して、最終の関連点数534、544、554を算出する結合部526とを含むことができる。
In addition, the
一実施例において、商品属性抽出サーバ又はユーザ端末は、音節の単位に分割されたユーザクエリ410を入力とする第1の統計基盤分類モデル522と、形態素の単位に分割されたユーザクエリ410を入力とする第2の統計基盤分類モデル524とを用いて、関連点数534、544、554が算出できる。
In one embodiment, the product attribute extraction server or user terminal inputs the first statistically-based
分類器520に含まれた統計基盤分類モデル522、524は、音節及び形態素の単位に分割されたユーザクエリ410を入力として、複数の商品属性530、540、550に対する関連点数534、544、554が算出できる。統計基盤分類モデル522、524の各々は、検索ログデータベースから抽出された学習データを用いて、ユーザクエリ410に対する複数の商品属性530、540、550の関連点数534、544、554を算出するように学習できる。検索ログデータベースから抽出された学習データは、ユーザクエリ及び当該ユーザクエリに対する商品検索結果のうち、ユーザが選択した商品情報(例えば、特定商品の属性情報)の対を含むことができる。
Statistical-based
統計基盤分類モデル522、524は、ユーザクエリ410を構成するテキスト(例えば、文章、文句、単語等)をそのまま使用することなく、音節又は形態素の単位に分割して使用することで、ユーザクエリ410に誤字脱字が含まれた場合や、ユーザクエリ410が学習データになくて見慣れない場合にも対応できる。例えば、ユーザクエリ410が「ミニノートブック」である場合、「ミニノートブック」を音節の単位に分割した「ミ」、「ニ」、「ノー」、「ト」、「ブック」を統計基盤分類モデル522の入力として算出された関連点数と、ユーザクエリ410が「ミニナトブック」のように誤字脱字を含む場合、音節の単位に分割した「ミ」、「ニ」、「ナ」、「ト」、「ブック」を統計基盤分類モデル522の入力として算出された関連点数とは、同一又は類似する。他の例として、ユーザクエリ410が「ミニノートブック」である場合、「ミニノートブック」を形態素の単位に分割した「ミニ」、「ノートブック」を統計基盤分類モデル524の入力として算出された関連点数と、ユーザクエリ410が「ノートブックミニ」のように形態素の順序が変更された場合、形態素の単位に分割した「ノートブック」、「ミニ」を統計基盤分類モデル522の入力として算出された関連点数とは、同一又は類似する。
The statistically-based
統計基盤分類モデル522、524により算出された関連点数は、結合部526により合算又は結合できる。その結果、1つの統計基盤分類モデルを使用した場合よりも、正確度が高い最終の関連点数534、544、554が算出できる。前記のような構成により、統計基盤分類モデル522、524により使用される学習データのマッチングカバレッジを極大化し、ユーザクエリ及び複数の商品属性の関連点数の算出の正確度を向上させることができる。
The relevance scores calculated by the statistically-based
図6は、本開示の一実施例に係る多様な検索結果から商品属性抽出のための統計基盤分類モデルの学習データを生成する例を示す図である。統計基盤分類モデルの学習のために使用される学習データは、検索ログデータベース650から抽出できる。検索ログデータベース650は、例えば、ユーザがショッピング検索サービスを使用しながら入力したユーザクエリ(例えば、検索対象の商品名が含まれた文章、文句、単語等)、当該ユーザクエリによるショッピング検索結果(例えば、商品名や商品属性などが含まれた検索結果)、及び、ショッピング検索結果に対するユーザの応答(例えば、特定の商品名や商品属性などに対するユーザのクリック可否又は回数等)が保存できる。統計基盤分類モデルの学習データは、検索ログデータベース650から抽出されたユーザクエリ及び当該ユーザクエリと関連する商品属性の対を含むことができる。
FIG. 6 is a diagram illustrating an example of generating learning data of a statistical-based classification model for product attribute extraction from various search results according to an embodiment of the present disclosure. Training data used for training the statistical-based classification model can be extracted from the
同図に示すように、例えば、ユーザがショッピングサイト又は統合検索サイトの検索窓にユーザクエリ110を入力した場合、入力されたユーザクエリ110と関連する検索結果130が出力され得る。検索結果画面100は、ユーザクエリ110が入力された検索窓と、商品属性をフィルタリングするためのユーザインタフェース120と、検索の商品132、136及び検索の商品132、136と関連する商品属性134、138等を含む検索結果130とを含むことができる。
As shown in the figure, for example, when a user inputs a
一実施例において、ユーザクエリ110を入力したユーザが、ユーザインタフェース120に含まれた画面サイズ属性610をクリックする場合、当該ユーザクエリ110及びクリックされた画面サイズ属性610の対の学習データ640が検索ログデータベース650に保存できる。商品属性抽出サーバのプロセッサは、このようなユーザクエリ110及びクリックログ情報が保存された検索ログデータベース650からユーザクエリ110及び商品属性の対を含む学習データが抽出できる。例えば、ユーザが「ミニノートブック」をユーザクエリ110として入力し、ユーザインタフェース120を介して商品属性のうちで「12インチ」をクリックして検索ログデータが生成された場合、「ミニノートブック-12インチ」の対の学習データ640が生成できる。
In one embodiment, when a user who has entered a
他の実施例として、ユーザクエリ110を入力したユーザが、検索結果130として出力された商品132、136をクリックする場合、当該ユーザクエリ110及び当該商品132、136と関連する商品属性134、138の対の学習データ620、630が検索ログデータベース650に保存され得る。例えば、ユーザが「ミニノートブック」をユーザクエリ110として入力した後、検索結果130のうちで商品132、136をクリックした場合、クリックされた商品132と関連する商品属性である「10インチ」(134)及びユーザクエリ110の対の学習データ620と、クリックされた商品136と関連する商品属性である「11インチ」(138)及びユーザクエリ110の対の学習データ630とが生成され得る。追加又は代案として、ユーザクエリ110を入力したユーザが、商品と関連する商品属性134、138をクリックする場合、クリックされた商品属性134、138及びユーザクエリ110の対の学習データ620、630が生成され得る。
As another example, when a user who has entered a
図7は、本開示の一実施例に係る商品属性714、724、734を商品属性コード716、726、736で表現して学習データ710、720、730を生成する方法を例示する図である。同図に示すように、統計基盤分類モデルの学習のために使用される学習データは、ユーザクエリ712、722、732と、これに対応する商品属性714、724、734と、各々の商品属性714、724、734を表現した商品属性コード716、726、736とを含むことができる。一実施例において、ユーザクエリ712、722、732及び商品属性714、724、734は、図6に基づいて説明したように、ショッピングサイト又は統合検索サイトの検索窓にユーザクエリ712、722、732を入力したユーザが、検索結果に表示された商品又は商品属性をクリックする場合、生成される検索ログデータベースから抽出できる。また、商品属性714、724、734の各々は、これに対応する商品属性コード716、726、736で表現できる。このように、学習データに含まれる商品属性を商品属性コードで表現することで、異なる類型の商品が同一又は類似の商品属性を持つ場合(すなわち、両義的商品属性及び範囲型商品属性の場合)に対しても、統計基盤分類モデルが正確な関連点数が算出できる。
FIG. 7 is a diagram illustrating how product attributes 714, 724, 734 are represented by
例えば、ユーザがショッピングサイトの検索窓に「ミニノートブック」(712)を入力し、「10インチ」(714)の商品属性をクリックする場合、入力された「ミニノートブック」(712)のユーザクエリと、クリックされた「10インチ」(714)の商品属性と、「10インチ」(714)の商品属性コード「M10834726」(716)とを含む学習データ710が生成できる。また、ユーザがショッピングサイトの検索窓に「ミニノートブック」(722)を入力し、「12インチ」(724)の商品属性をクリックする場合、入力された「ミニノートブック」(722)のユーザクエリと、クリックされた「12インチ」(724)の商品属性と、「12インチ」(724)の商品属性コード「M10706689」(726)とを含む学習データ720が生成できる。 For example, when a user enters "mini-notebook" (712) in the search window of a shopping site and clicks the product attribute of "10 inches" (714), the entered "mini-notebook" (712) user Learning data 710 can be generated that includes the query, the item attribute of "10" (714) that was clicked, and the item attribute code "M10834726" (716) of "10" (714). Also, when the user enters 'mini-notebook' (722) in the search window of the shopping site and clicks the product attribute of '12 inches' (724), the user of the entered 'mini-notebook' (722) Learning data 720 can be generated that includes the query, the product attribute of "12" (724) that was clicked, and the product attribute code of "12" (724) "M10706689" (726).
他の実施例において、ユーザクエリを入力したユーザが、検索結果において2つ以上の商品属性をクリックする場合、入力されたユーザクエリ及びクリックされた商品属性を全部含む学習データが生成できる。例えば、ユーザがショッピングサイトの検索窓に「ミニノートブック」(732)を入力し、「13インチ及び12インチ」(734)の商品属性を各々クリックする場合、入力された「ミニノートブック」(732)のユーザクエリと、クリックされた「13インチ及び12インチ」(734)の商品属性と、これに対応する商品属性コード「M10835015及びM10706689」(736)とを含む学習データ730が生成できる。 In another embodiment, when a user who inputs a user query clicks two or more product attributes in a search result, learning data including both the input user query and the clicked product attributes can be generated. For example, when the user inputs 'mini-notebook' (732) in the search window of the shopping site and clicks on each of the product attributes of '13 inches and 12 inches' (734), the input 'mini-notebook' ( 732) and clicked product attributes of "13 inches and 12 inches" (734) and corresponding product attribute codes "M10835015 and M10706689" (736) can be generated.
図8は、本開示の一実施例に係る商品属性抽出サーバにより遂行されるショッピング検索のための商品属性抽出方法800を示すフローチャートである。一実施例において、ショッピング検索のための商品属性抽出方法800は、ユーザクエリの受信により開始できる(S810)。一実施例において、ユーザクエリは、ユーザ端末に表示されるショッピングサイト又は統合検索サイトの検索窓から受信され、商品属性抽出サーバのプロセッサに転送できる。
FIG. 8 is a flowchart illustrating a product
受信されたユーザクエリに基づき、商品データベースからユーザクエリに対する商品検索結果が抽出される(S820)。一実施例において、商品属性抽出サーバのプロセッサは、商品データベースからユーザクエリに対する商品検索結果が抽出できる。このとき、商品検索結果は、ユーザクエリ及び商品データベースに保存された商品名の語彙類似度、商品のユーザ人気度などの情報に基づいて決定された商品検索順位情報を含むことができる。例えば、ユーザクエリが「ミニノートブック」である場合、「ミニノートブック」の少なくとも一部を含む商品名を持つ商品のうち、ユーザによる購買率が高い商品、若しくは、ユーザによるクリック率が高い商品が、高順位を持つ商品検索結果として抽出できる。 Based on the received user query, a product search result corresponding to the user query is extracted from the product database (S820). In one embodiment, the processor of the product attribute extraction server can extract product search results for user queries from a product database. At this time, the product search result may include product search ranking information determined based on user queries, lexical similarity of product names stored in the product database, and user popularity of products. For example, if the user query is "mini-notebook", among the products whose product name includes at least a part of "mini-notebook", products with a high purchase rate by users or products with a high click-through rate by users can be extracted as product search results with high rank.
ユーザクエリは音節及び/又は形態素の単位に分割できる(S830)。一実施例において、商品属性抽出サーバのプロセッサは、ユーザクエリを音節及び/又は形態素の単位に分割して統計基盤分類モデルに入力できる。例えば、ユーザクエリは、音節埋め込みベクトル及び/又は形態素埋め込みベクトルに変換されて統計基盤分類モデルに入力できる。 The user query can be divided into units of syllables and/or morphemes (S830). In one embodiment, the processor of the product attribute extraction server can divide the user query into units of syllables and/or morphemes and input them into the statistically-based classification model. For example, a user query can be converted into a syllable embedding vector and/or a morpheme embedding vector and input to a statistically based classification model.
また、統計基盤分類モデルにより、ユーザクエリに対する複数の商品属性の関連点数が算出できる(S840)。一実施例において、商品属性抽出サーバのプロセッサは、統計基盤分類モデルを用いて、ユーザクエリが商品属性コードで表示された商品属性と関連する確率が算出できる。このように、商品属性を商品属性コードで表示することで、統計基盤分類モデルが両義的商品属性及び範囲型商品属性に対応して正確な関連点数が算出できる。ユーザクエリが音節又は形態素の単位に分割された場合、統計基盤分類モデルは、音節又は形態素の単位に分割されたユーザクエリが複数の商品属性と関連する確率値が算出できる。 In addition, the statistical-based classification model can be used to calculate the associated score of multiple product attributes with respect to the user query (S840). In one embodiment, the processor of the product attribute extraction server can use a statistically-based classification model to calculate the probability that the user query is associated with the product attributes indicated by the product attribute code. In this way, by displaying product attributes with product attribute codes, the statistics-based classification model can calculate accurate relevance scores corresponding to ambiguous product attributes and range-type product attributes. When a user query is divided into units of syllables or morphemes, the statistical-based classification model can calculate a probability value that the user query divided into units of syllables or morphemes is associated with a plurality of product attributes.
他の実施例において、商品属性抽出サーバのプロセッサは、ユーザクエリを音節及び形態素の単位に各々分割できる。プロセッサは、第1の統計基盤分類モデルを用いて、音節の単位に分割されたユーザクエリが複数の商品属性と関連する第1の確率を算出し、第2の統計基盤分類モデルを用いて、形態素の単位に分割されたユーザクエリが商品属性と関連する第2の確率が算出できる。その後、プロセッサは、第1の確率及び第2の確率を合算又は結合して、最終の商品属性の関連点数として算出できる。前述したように、ユーザクエリを音節及び/又は形態素の単位に分割して統計基盤分類モデルにより商品属性に対する関連点数を算出することで、タイプミスまたは学習データにないユーザクエリに対しても、商品属性の関連点数の算出の正確性を向上させることができる。 In another embodiment, the processor of the product attribute extraction server can divide the user query into units of syllables and morphemes, respectively. The processor uses a first statistically based classification model to calculate a first probability that the user query divided into syllable units is associated with a plurality of product attributes, and uses a second statistically based classification model to: A second probability that the morpheme-divided user query is associated with the product attribute can be calculated. The processor can then sum or combine the first and second probabilities to calculate a final item attribute relevance score. As described above, by dividing the user query into syllable and/or morpheme units and calculating the relevance score for the product attributes by the statistically-based classification model, it is possible to identify the product even if the user query is mistyped or not included in the training data. It is possible to improve the accuracy of calculation of attribute relevance scores.
算出された関連点数に基づき、ユーザクエリに対する商品検索結果による商品検索順位が調整できる(S850)。一実施例において、商品属性抽出サーバのプロセッサは、算出された一つ以上の関連点数を商品検索結果に反映して商品検索順位が調整できる。これにより、関連点数の高い商品属性を含む商品が検索結果の上部に表示され得る。ユーザクエリと関連する商品属性を持つ商品を検索結果の上部に表示することで、当該商品に対するユーザらのクリック率及び購買率を向上させることができる。 Based on the calculated relevance score, the product search ranking according to the product search result for the user query can be adjusted (S850). In one embodiment, the processor of the product attribute extraction server may adjust the product search ranking by reflecting the calculated one or more related scores in the product search result. As a result, products including product attributes with high related scores can be displayed at the top of the search results. By displaying products having product attributes related to the user query at the top of the search results, it is possible to improve the click rate and purchase rate of users for the products.
図9は、本開示の一実施例に係るショッピング検索のための商品検索順位調整方法900を示すフローチャートである。一実施例において、商品検索順位調整方法900は、ユーザクエリに対する複数の商品属性の関連点数の算出により開始できる(S910)。ユーザクエリに対する複数の商品属性の関連点数を算出する方法は、図8に基づいて説明した方法と同様に遂行できる。
FIG. 9 is a flowchart illustrating a product search ranking
次に、算出された関連点数のうち、最も高い関連点数である第1の関連点数と関連する第1の商品属性が抽出できる(S920)。一実施例において、商品属性抽出サーバ又はユーザ端末のプロセッサが、算出された関連点数のうち、最も高い関連点数である第1の関連点数と関連する第1の商品属性が抽出できる。また、抽出された第1の商品属性に基づき、商品データベースから第1の商品属性を含む第1の商品が検索できる(S930)。 Next, a first product attribute associated with a first related score, which is the highest related score, among the calculated related scores can be extracted (S920). In one embodiment, the product attribute extraction server or the processor of the user terminal can extract the first product attribute associated with the first related score, which is the highest related score among the calculated related scores. Also, based on the extracted first product attribute, the first product including the first product attribute can be searched from the product database (S930).
代案として、算出された関連点数のうち、関連点数が既定の閾値以上である第1の関連点数群(すなわち、一つ以上の第1の関連点数)と関連する第1の商品属性群(すなわち、一つ以上の第1の商品属性)が抽出できる。その後、商品データベースから第1の商品属性群に含まれた少なくとも一つの商品属性を含む商品が検索できる。 Alternatively, among the calculated relevance scores, a first product attribute group (i.e., , one or more first product attributes) can be extracted. After that, a product including at least one product attribute included in the first product attribute group can be retrieved from the product database.
第1の商品属性の重要度を決定する商品属性加重値が決定できる(S940)。商品属性加重値は、抽出された商品属性がこれと関連する商品の検索順位の調整に及ぼす影響の程度を示すことができる。一実施例において、商品属性加重値は商品属性別に既定の値であり得る。代案として、商品属性加重値は、商品検索結果に対するユーザの応答によって動的に変動できる。具体的に、商品属性抽出サーバ又はユーザ端末のプロセッサは、既定の商品属性加重値及び関連点数に基づいて調整された第1の商品が表示された検索結果画面を出力し、出力された商品検索結果画面でユーザによる第1の商品のクリック数が受信できる。第1の商品のクリック数が既定の閾値以上である場合、プロセッサは商品属性加重値が変更できる。 A product attribute weight that determines the importance of the first product attribute can be determined (S940). The product attribute weight value may indicate the degree of influence of the extracted product attribute on adjustment of the search ranking of related products. In one embodiment, the product attribute weight value may be a default value for each product attribute. Alternatively, the item attribute weights can vary dynamically depending on the user's response to the item search results. Specifically, the product attribute extraction server or the processor of the user terminal outputs a search result screen displaying the first product adjusted based on the predetermined product attribute weighting value and the related score, and outputs the product search The number of user clicks on the first product can be received on the results screen. If the number of clicks for the first item is greater than or equal to the predetermined threshold, the processor can change the item attribute weights.
第1の関連点数及び商品属性加重値に基づいて第1の商品の検索順位が調整できる(S950)。商品検索順位が調整された結果、抽出された第1の商品属性と関連する第1の商品の方が、抽出された第1の商品属性と関連しない他の商品よりも、商品検索結果の上部に表示され得る。これにより、ユーザクエリに基づいてユーザの意図した商品属性が反映された検索結果をユーザ端末に出力できる。 The search ranking of the first product may be adjusted based on the first relevance score and the product attribute weight (S950). As a result of adjusting the product search ranking, the first product related to the extracted first product attribute is higher in the product search results than other products not related to the first extracted product attribute. can be displayed in Thereby, based on the user query, it is possible to output to the user terminal a search result reflecting the product attributes intended by the user.
図10は、本開示の一実施例に係るユーザ端末により遂行されるショッピング検索のための商品属性抽出方法1000を示すフローチャートである。一実施例において、ユーザ端末により遂行されるショッピング検索のための商品属性抽出方法1000は、ユーザ端末のプロセッサがユーザクエリを受信することにより開始できる(S1010)。ユーザクエリは、ユーザ端末に表示されたショッピングサイト又は統合検索サイトの検索窓から受信できる。
FIG. 10 is a flowchart illustrating a product
ユーザ端末のプロセッサは、ユーザクエリに基づいて統計基盤分類モデルにより算出された複数の商品属性の関連点数が受信できる(S1020)。このとき、統計基盤分類モデルは、ユーザクエリに対する複数の商品属性の関連点数を算出するように予め学習できる。また、正確度の高い関連点数を算出するために、統計基盤分類モデルは、音節及び/又は形態素の単位に分割されたユーザクエリを受信して商品属性の関連点数を算出する2つ以上の統計基盤分類モデルを含むことができる。 The processor of the user terminal can receive the relevance scores of a plurality of product attributes calculated by the statistically based classification model based on the user query (S1020). At this time, the statistical-based classification model can be learned in advance to calculate the relevance score of a plurality of product attributes with respect to the user query. In addition, in order to calculate the relevance score with high accuracy, the statistical-based classification model receives a user query divided into units of syllables and/or morphemes and uses two or more statistics for calculating the relevance score of product attributes. A base classification model can be included.
ユーザ端末のプロセッサは、算出された関連点数に基づいてユーザクエリに対する商品検索順位を調整できる(S1030)。具体的に、プロセッサは、算出された関連点数のうち、最も高い関連点数である第1の関連点数と関連する第1の商品属性が抽出できる。その後、プロセッサは、商品データベースから検索された第1の商品属性を含む第1の商品を受信し、第1の関連点数によって検索された第1の商品の商品検索順位が調整できる。このとき、第1の商品の検索順位は、第1の商品属性の重要度を決定する商品属性加重値及び第1の関連点数に基づいて調整できる。 The processor of the user terminal may adjust the product search order for the user query based on the calculated relevance score (S1030). Specifically, the processor can extract a first product attribute associated with a first association score, which is the highest association score, among the calculated association scores. The processor can then receive the first item including the first item attribute retrieved from the item database, and adjust the item search ranking of the retrieved first item with the first relevance score. At this time, the search ranking of the first product may be adjusted based on the product attribute weighting value that determines the importance of the first product attribute and the first relevance score.
図11は、本開示の一実施例に係る商品属性抽出のための統計基盤分類モデルの学習方法1100を示すフローチャートである。同図に示すように、学習方法1100は、プロセッサが複数の第1のユーザクエリ及び複数の第1のユーザクエリと関連する複数の第1の商品属性に基づいて第1の学習データを生成するステップ(S1110)により開始できる。プロセッサは、複数の第1のユーザクエリと関連する検索ログデータベースから複数の第1の商品属性が抽出できる。検索ログデータベースは、ユーザクエリ及びこれにより抽出された商品検索結果からユーザが選択又はクリックした商品属性情報を含むことができる。例えば、プロセッサは、統合検索ログデータベース、ショッピング又は商品検索ログデータベースの少なくとも一つから複数のユーザクエリと関連する商品属性が抽出できる。また、プロセッサは、統計基盤分類モデルが両義的商品属性又は範囲型商品属性に対応できるように、複数の第1の商品属性を対応する複数の商品属性コードに変換できる。前記構成により、学習データは、ユーザが入力したユーザクエリ及びユーザクエリによって抽出された商品検索結果に対するユーザの動作(例えば、商品属性のフィルタリング、商品や商品属性の選択又はクリック等)によって生成された検索ログデータベースから得られるので、統計基盤分類モデルの学習データを効率よく確保できる。
FIG. 11 is a flowchart illustrating a
プロセッサは、複数の第1の学習データに基づき、第2のユーザクエリに対応する一つ以上の商品属性の関連点数を算出するように統計基盤分類モデルが学習できる(S1120)。一実施例において、プロセッサは、複数の第1のユーザクエリを形態素の単位に分割して統計基盤分類モデルが学習できる。具体的に、プロセッサは、形態素の単位に分割された複数の第1のユーザクエリに基づき、ユーザクエリに対応する一つ以上の商品属性の関連点数を算出するように統計基盤分類モデルが学習できる。追加又は代案として、プロセッサは、複数の第1のユーザクエリを音節の単位に分割して統計基盤分類モデルが学習できる。プロセッサは、音節の単位に分割された複数の第1のユーザクエリに基づき、ユーザクエリに対応する一つ以上の商品属性の関連点数を算出するように統計基盤分類モデルが学習できる。 The processor can learn a statistically-based classification model to calculate the relevance score of one or more product attributes corresponding to the second user query based on the plurality of first learning data (S1120). In one embodiment, the processor can divide the plurality of first user queries into units of morphemes to learn a statistically based classification model. Specifically, the processor can learn a statistically-based classification model to calculate relevance scores of one or more product attributes corresponding to user queries based on a plurality of first user queries divided into units of morphemes. . Additionally or alternatively, the processor can divide the plurality of first user queries into units of syllables to learn a statistically based classification model. The processor can learn a statistically-based classification model to calculate relevance scores of one or more product attributes corresponding to user queries based on a plurality of first user queries divided into syllable units.
他の実施例において、プロセッサは、複数の第1のユーザクエリを音節及び形態素の単位に分割して統計基盤分類モデルが学習できる。具体的に、プロセッサは、複数の第1のユーザクエリを形態素及び音節の単位に分割できる。その後、プロセッサは、形態素の単位に分割された複数の第1のユーザクエリに基づき、ユーザクエリに対応する一つ以上の商品属性の関連点数を算出するように第1の統計基盤分類モデルが学習できる。また、プロセッサは、音節の単位に分割された複数の第1のユーザクエリに基づき、ユーザクエリに対応する一つ以上の商品属性の関連点数を算出するように第2の統計基盤分類モデルが学習できる。前述したように、プロセッサは、ユーザクエリを分割する方式によって2つ以上の統計基盤分類モデルを使用することで、ユーザクエリ及び商品属性の関連点数をより正確に算出できる。 In another embodiment, the processor can divide the plurality of first user queries into units of syllables and morphemes to learn a statistically based classification model. Specifically, the processor can divide the plurality of first user queries into units of morphemes and syllables. Then, the processor learns the first statistical-based classification model to calculate the relevance score of one or more product attributes corresponding to the user query based on the plurality of first user queries divided into units of morphemes. can. In addition, the processor learns the second statistical-based classification model to calculate the relevance score of one or more product attributes corresponding to the user query based on the plurality of first user queries divided into units of syllables. can. As described above, the processor can more accurately calculate the relevance score of the user query and product attributes by using two or more statistically-based classification models according to the method of dividing the user query.
前述したショッピング検索のための商品属性抽出方法及び商品属性抽出の学習方法は、コンピュータで読み取り可能な記録媒体にコンピュータが読み取り可能なコードとして具現されることもできる。記録媒体は、コンピュータで実行可能なプログラムを継続的に保存したり、実行又はダウンロードのために一時保存したりするものであり得る。また、媒体は、単一又は多数のハードウェアが結合された形態の多様な記録手段又は保存手段であり得るが、あるコンピュータシステムに直接接続される媒体に限定されず、ネットワーク上に分散存在するものであり得る。媒体の例としては、ハードディスク、フロッピーディスク及び磁気テープのような磁気媒体、CD-ROMやDVDのような光記録媒体、フロプティカルディスク(floptical disk)のような磁気-光媒体(magneto-optical medium)、及び、ROM、RAM、フラッシュメモリなどを含み、プログラム命令語が保存されるように構成されたものが挙げられる。また、他の媒体の例としては、アプリケーションを流通するアプリストアやその他の多様なソフトウェアを供給乃至流通するサイト、サーバなどで管理する記録媒体乃至保存媒体も挙げられる。 The product attribute extraction method and product attribute extraction learning method for shopping search described above can also be embodied as computer-readable codes on a computer-readable recording medium. The recording medium may be of continuous storage or temporary storage for execution or download of the computer-executable program. In addition, the medium can be a variety of recording means or storage means in the form of a single or multiple pieces of hardware combined, but is not limited to a medium directly connected to a computer system, and is distributed over a network. can be Examples of media include magnetic media such as hard disks, floppy disks and magnetic tapes, optical recording media such as CD-ROMs and DVDs, and magneto-optical media such as floptical disks. medium), ROM, RAM, flash memory, etc., which are configured to store program instructions. Examples of other media include recording media and storage media managed by application stores that distribute applications, sites that supply and distribute various software, and servers.
本開示の方法、動作又は技法は多様な手段により具現できる。例えば、このような技法は、ハードウェア、ファームウェア、ソフトウェア、若しくはこれらの組合せで具現できる。本願の開示により説明された多様な例示的な論理的ブロック、モジュール、回路及びアルゴリズムステップは、電子ハードウェア、コンピュータソフトウェア、若しくは両方の組合せで具現できることを、通常の技術者であれば理解できるはずである。ハードウェア及びソフトウェアのこのような相互の代替を明確に説明するために、多様な例示的な構成要素、ブロック、モジュール、回路及びステップが、それらの機能的観点から一般的に前述された。そのような機能が、ハードウェアとして具現されるか、若しくは、ソフトウェアとして具現されるかは、特定アプリケーション及び全体システムに付加される設計要求事項によって変化する。通常の技術者は、各々の特定アプリケーションのために多様な方式により説明された機能を具現することもできるが、そのような具現は本開示の範囲から逸脱するものと解釈してはならない。 The methods, acts, or techniques of the disclosure may be embodied by various means. For example, such techniques may be implemented in hardware, firmware, software, or any combination thereof. A person of ordinary skill in the art should understand that the various exemplary logical blocks, modules, circuits and algorithm steps described in the present disclosure can be embodied in electronic hardware, computer software, or a combination of both. is. To clearly illustrate such mutual alternatives of hardware and software, various illustrative components, blocks, modules, circuits, and steps have been described above generally in terms of their functionality. Whether such functionality is implemented as hardware or software will vary depending on the particular application and design requirements imposed on the overall system. Skilled artisans may implement the described functionality in varying ways for each particular application, but such implementations should not be interpreted as departing from the scope of the present disclosure.
ハードウェアの具現において、技法の遂行に利用されるプロセッシングユニットは、一つ以上のASIC、DSP、デジタル信号処理デバイス(digital signal processing devices ; DSPD)、プログラム可能な論理デバイス(programmable logic devices ; PLD)、フィールドプログラム可能なゲートアレイ(field programmable gate arrays ; FPGA)、プロセッサ、制御器、マイクロ制御器、マイクロプロセッサ、電子デバイス、本開示に説明された機能を遂行するように設計された他の電子ユニット、コンピュータ、若しくはこれらの組合せ内で具現されることもできる。 In a hardware implementation, the processing unit utilized to perform the techniques may be one or more of ASICs, DSPs, digital signal processing devices (DSPDs), programmable logic devices (PLDs). , field programmable gate arrays (FPGAs), processors, controllers, microcontrollers, microprocessors, electronic devices, and other electronic units designed to perform the functions described in this disclosure , a computer, or a combination thereof.
したがって、本開示により説明された多様な例示的な論理ブロック、モジュール及び回路は、汎用プロセッサ、DSP、ASIC、FPGAや他のプログラム可能な論理デバイス、離散ゲートやトランジスタロジック、離散ハードウェアコンポーネント、若しくは、本願に説明された機能を遂行するように設計されたもの等の任意の組合せで具現又は遂行されることもできる。汎用プロセッサはマイクロプロセッサであり得るが、代案として、プロセッサは、任意の従来のプロセッサ、制御器、マイクロ制御器、若しくは状態マシンであり得る。プロセッサは、また、コンピューティングデバイスの組合せ、例えば、DSPとマイクロプロセッサ、複数のマイクロプロセッサ、DSPコアと関連する一つ以上のマイクロプロセッサ、若しくは任意の他の構成の組合せで具現されることもできる。 Thus, the various exemplary logic blocks, modules and circuits described by this disclosure may be general purpose processors, DSPs, ASICs, FPGAs or other programmable logic devices, discrete gate or transistor logic, discrete hardware components, or , may be embodied or performed in any combination, including those designed to perform the functions described herein. A general-purpose processor can be a microprocessor, but, in the alternative, the processor can be any conventional processor, controller, microcontroller, or state machine. A processor may also be embodied in a combination of computing devices, such as a DSP and a microprocessor, multiple microprocessors, one or more microprocessors associated with a DSP core, or any other combination of configurations. .
ファームウェア及び/又はソフトウェアの具現において、技法は、RAM(random access memory)、ROM(read-only memory)、NVRAM(non-volatile random access memory)、PROM(programmable read-only memory)、EPROM(erasable programmable read-only memory)、EEPROM(electrically erasable PROM)、フラッシュメモリ、CD(compact disc)、磁気又は光学データストレージデバイスなどのようなコンピュータ読み取り可能な媒体上に保存された命令で具現できる。命令は、一つ以上のプロセッサによって実行可能であり得、プロセッサが本開示に説明された機能の特定様態を遂行するようにできる。 In the implementation of firmware and/or software, the technique is random access memory (RAM), read-only memory (ROM), non-volatile random access memory (NVRAM), programmable read-only memory (PROM), erasable programmable memory (EPROM). It can be embodied by instructions stored on a computer-readable medium such as a read-only memory), electrically erasable PROM (EEPROM), flash memory, compact disc (CD), magnetic or optical data storage device, and the like. The instructions may be executable by one or more processors and may cause the processors to perform certain aspects of the functions described in this disclosure.
ソフトウェアで具現される場合、前記技法は、一つ以上の命令又はコードとしてコンピュータ読み取り可能な媒体上に保存されたり、コンピュータ読み取り可能な媒体を介して転送されたりできる。コンピュータ読み取り可能な媒体は、ある場所から他の場所にコンピュータプログラムの転送を容易にする任意の媒体を含み、コンピュータ保存媒体及び通信媒体の両方を含む。保存媒体は、コンピュータによってアクセスできる任意の利用可能な媒体であり得る。非制限的な例として、このようなコンピュータ読み取り可能な媒体は、RAM、ROM、EEPROM、CD-ROMや他の光学ディスクストレージ、磁気ディスクストレージや他の磁気ストレージデバイス、若しくは、所望のプログラムコードを命令又はデータ構造の形態に移送又は保存するために使用されることができ、コンピュータによってアクセスできる任意の他の媒体を含むことができる。また、任意の接続をコンピュータ読み取り可能な媒体として含むことができる。 When implemented in software, the techniques can be stored on or transferred over a computer-readable medium as one or more instructions or code. Computer-readable media includes both computer storage media and communication media that facilitates transfer of a computer program from one place to another. A storage media may be any available media that can be accessed by a computer. By way of non-limiting example, such computer readable media may include RAM, ROM, EEPROM, CD-ROM or other optical disk storage, magnetic disk storage or other magnetic storage devices, or any desired program code. It can also include any other computer-accessible medium that can be used to transport or store instructions or data structures in a form. Also, any connection may be included as a computer-readable medium.
例えば、ソフトウェアが同軸ケーブル、光繊維ケーブル、リード線、デジタル加入者回線(DSL)、又は、赤外線、無線及びマイクロ波のような無線技術を用いて、ウェブサイト、サーバ又は他の遠隔ソースから転送される場合、同軸ケーブル、光繊維ケーブル、リード線、デジタル加入者回線、又は、赤外線、無線及びマイクロ波のような無線技術は、媒体の定義内に含まれる。本願で使用されたディスク(disk)及びディスク(disc)は、CD、レーザーディスク、光ディスク、DVD(digital versatile disc)、フロッピーディスク及びブルーレイディスクを含み、ここで、通常、ディスク(disk)は磁気的にデータを再生するのに対し、ディスク(disc)はレーザーを用いて光学的にデータを再生する。前記組合せ等も、コンピュータ読み取り可能な媒体等の範囲内に含まれなければならない。 For example, software may be transferred from a website, server or other remote source using coaxial cable, fiber optic cable, lead wire, digital subscriber line (DSL), or wireless technologies such as infrared, radio and microwave. Coaxial cable, fiber optic cable, lead wire, digital subscriber line, or wireless technologies such as infrared, radio and microwave, where applicable, are included within the definition of medium. As used herein, disk and disc include CDs, laser discs, optical discs, DVDs (digital versatile discs), floppy discs and Blu-ray discs, where disk generally refers to a magnetic A disc reproduces data optically using a laser, whereas a disc reproduces data optically. Combinations and the like should also be included within the scope of computer-readable media and the like.
ソフトウェアモジュールは、RAMメモリ、フラッシュメモリ、ROMメモリ、EPROMメモリ、EEPROMメモリ、レジスタ、ハードディスク、移動式ディスク、CD-ROM、又は、公知の任意の異なる形態の保存媒体内に常駐することもできる。例示的な保存媒体は、プロセッサが保存媒体から情報を読み取る、或いは、保存媒体に情報を書き込むように、プロセッサに連結することができる。代案として、保存媒体はプロセッサに統合されることもできる。プロセッサ及び保存媒体はASIC内に存在することもできる。ASICはユーザ端末内に存在することもできる。代案として、プロセッサ及び保存媒体はユーザ端末で個別構成要素として存在することもできる。 A software module may reside in RAM memory, flash memory, ROM memory, EPROM memory, EEPROM memory, registers, hard disk, a removable disk, a CD-ROM, or any other form of storage medium known in the art. An exemplary storage medium may be coupled to the processor, such that the processor reads information from, and writes information to, the storage medium. Alternatively, the storage medium may be integrated into the processor. The processor and storage medium can also reside within an ASIC. The ASIC may also reside in a user terminal. Alternatively, the processor and storage medium may exist as separate components in the user terminal.
前述した実施例が一つ以上の独立型コンピュータシステムで現在開示された主題の様態を活用するものとして記述しているが、本開示はこれに限定されず、ネットワークや分散コンピューティング環境のような任意のコンピューティング環境によって具現できる。さらには、本開示における主題の様態は複数のプロセッシングチップや装置で具現されることもでき、ストレージは複数の装置に亘って類似に影響を受けることもできる。このような装置は、PC、ネットワークサーバ及び携帯用装置を含むこともできる。 Although the foregoing embodiments are described as utilizing aspects of the presently disclosed subject matter in one or more stand-alone computer systems, the disclosure is not so limited, and may be used in networked or distributed computing environments, such as. It can be embodied by any computing environment. Further, aspects of the subject matter of this disclosure may be embodied in multiple processing chips or devices, and storage may be similarly affected across multiple devices. Such devices may also include PCs, network servers and handheld devices.
本明細書では、本開示が一部の実施例によって説明されたが、本開示の発明が属する技術分野における通常の技術者が理解し得る本開示から逸脱しない範囲内で多様な変形や変更が可能である。また、そのような変形や変更は、本明細書に添付された特許請求の範囲内に属するものと理解されるべきである。 In the present specification, the present disclosure has been described with some embodiments, but various modifications and changes can be made without departing from the present disclosure that can be understood by a person of ordinary skill in the technical field to which the disclosed invention belongs. It is possible. Also, such variations and modifications should be understood to fall within the scope of the claims appended hereto.
100 画面
110 ユーザクエリ
120 ユーザインタフェース
130 検索結果
132、136 商品
134、138 商品属性
210 ユーザ端末
220 ネットワーク
230 商品属性抽出サーバ
240 検索ログデータベース
420 統計基盤分類モデル
510 前処理器
520 分類器
100
Claims (15)
ユーザクエリを受信するステップ;
商品データベースから前記ユーザクエリに対する商品検索結果を抽出するステップ;
統計基盤分類モデルにより、前記ユーザクエリ及び複数の商品属性の関連点数を算出するステップ;及び、
前記算出された関連点数に基づき、前記商品検索結果による商品検索順位を調整するステップを含み、
前記統計基盤分類モデルにより、前記ユーザクエリ及び前記複数の商品属性の関連点数を算出するステップは、
前記ユーザクエリを音節及び形態素の単位に分割するステップ;
第1の統計基盤分類モデルにより、前記音節の単位に分割された前記ユーザクエリが前記複数の商品属性と関連する第1の確率を算出するステップ;
第2の統計基盤分類モデルにより、前記形態素の単位に分割された前記ユーザクエリが前記複数の商品属性と関連する第2の確率を算出するステップ;及び、
前記第1の確率及び前記第2の確率に基づいて、前記複数の商品属性の関連点数として算出するステップを含む、
ショッピング検索のための商品属性抽出方法。 In a product attribute extraction method for shopping search performed by a computer system,
receiving a user query;
extracting product search results for the user query from a product database;
calculating a relevance score of the user query and a plurality of product attributes according to a statistically-based classification model; and
adjusting the product search ranking according to the product search results based on the calculated relevance score ;
The step of calculating relevance scores of the user query and the plurality of product attributes by the statistically-based classification model,
dividing the user query into units of syllables and morphemes;
calculating a first probability that the syllable-divided user query is associated with the plurality of product attributes according to a first statistically-based classification model;
calculating a second probability that the user query divided into morphemes is associated with the plurality of product attributes by a second statistically-based classification model; and
Based on the first probability and the second probability, calculating as the related score of the plurality of product attributes,
Product attribute extraction method for shopping search.
前記統計基盤分類モデルにより、前記ユーザクエリが各々商品属性コードで表示された前記複数の商品属性と関連する確率を算出するステップを含む、請求項1に記載のショッピング検索のための商品属性抽出方法。 The step of calculating relevance scores of the user query and the plurality of product attributes by the statistically-based classification model,
2. The product attribute extraction method for shopping search according to claim 1, comprising calculating a probability that the user query is associated with the plurality of product attributes each represented by a product attribute code, according to the statistically-based classification model. .
前記ユーザクエリを音節及び形態素の単位の少なくとも一つに分割するステップ;及び、
前記統計基盤分類モデルにより、前記音節及び前記形態素の単位の少なくとも一つに分割された前記ユーザクエリが前記複数の商品属性と関連する確率を算出するステップを含む、請求項1又は2に記載のショッピング検索のための商品属性抽出方法。 The step of calculating relevance scores of the user query and the plurality of product attributes by the statistically-based classification model,
dividing the user query into at least one of syllable and morpheme units; and
3. The method according to claim 1, further comprising calculating a probability that the user query divided into at least one of the syllable and the morpheme unit is associated with the plurality of product attributes by the statistically-based classification model. Product attribute extraction method for shopping search.
前記算出された関連点数のうち、最も高い関連点数である第1の関連点数と関連する第1の商品属性を抽出するステップ;
前記商品データベースから前記抽出された第1の商品属性を含む第1の商品を検索するステップ;及び、
前記第1の関連点数によって前記検索された第1の商品の前記商品検索順位を調整するステップを含む、請求項1乃至3の何れか一項に記載のショッピング検索のための商品属性抽出方法。 The step of adjusting the product search ranking according to the product search results based on the calculated relevance score,
a step of extracting a first product attribute associated with a first association score, which is the highest association score among the calculated association scores;
searching the product database for a first product that includes the extracted first product attribute; and
4. The product attribute extraction method for shopping search according to any one of claims 1 to 3 , comprising adjusting the product search order of the searched first product according to the first relevance score.
前記算出された関連点数のうち、関連点数が既定の閾値以上である第1の関連点数群と関連する第1の商品属性群を抽出するステップ;
前記商品データベースから前記抽出された第1の商品属性群に含まれた少なくとも一つの商品属性を含む商品を検索するステップ;及び、
前記第1の関連点数群によって前記検索された商品の前記商品検索順位を調整するステップを含む、請求項1乃至3の何れか一項に記載のショッピング検索のための商品属性抽出方法。 The step of adjusting the product search ranking according to the product search results based on the calculated relevance score,
a step of extracting a first product attribute group related to a first group of related scores having a related score greater than or equal to a predetermined threshold among the calculated related scores;
searching from the product database for products including at least one product attribute included in the extracted first product attribute group; and
4. The product attribute extraction method for shopping search according to any one of claims 1 to 3 , comprising a step of adjusting the product search order of the searched product according to the first related score group.
前記第1の商品属性の重要度を決定する商品属性加重値及び前記第1の関連点数に基づいて前記第1の商品の検索順位を調整するステップをさらに含む、請求項4に記載のショッピング検索のための商品属性抽出方法。 The step of adjusting the product search ranking according to the product search results based on the calculated relevance score,
5. The shopping search of claim 4 , further comprising adjusting a search ranking of the first product based on a product attribute weighting value for determining importance of the first product attribute and the first relevance score. Product attribute extraction method for
前記出力された検索結果画面で前記第1の商品のクリック数を受信するステップ;及び、
前記第1の商品のクリック数が既定の閾値以上である場合、前記商品属性加重値を変更するステップをさらに含む、請求項6に記載のショッピング検索のための商品属性抽出方法。 a step of outputting a search result screen on which the first product is displayed by adjusting the search ranking;
receiving the number of clicks of the first product on the output search results screen; and
7. The product attribute extraction method for shopping search as claimed in claim 6 , further comprising changing the product attribute weighting value when the number of clicks of the first product is greater than or equal to a predetermined threshold.
複数の第1のユーザクエリ及び前記複数の第1のユーザクエリと関連する複数の第1の商品属性を含む複数の第1の学習データを生成するステップ;及び、
前記複数の第1の学習データに基づき、第2のユーザクエリに対応する一つ以上の商品属性の関連点数を算出するように統計基盤分類モデルを学習するステップを含み、
前記統計基盤分類モデルを学習するステップは、
前記複数の第1のユーザクエリを形態素の単位に分割するステップ;
前記複数の第1のユーザクエリを音節の単位に分割するステップ;
前記形態素の単位に分割された前記複数の第1のユーザクエリに基づき、ユーザクエリに対応する一つ以上の商品属性の関連点数を算出するように第1の統計基盤分類モデルを学習するステップ;及び、
前記音節の単位に分割された前記複数の第1のユーザクエリに基づき、ユーザクエリに対応する一つ以上の商品属性の関連点数を算出するように第2の統計基盤分類モデルを学習するステップを含む、
ショッピング検索のための商品属性抽出の学習方法。 In a learning method of product attribute extraction for shopping search performed by a computer system,
generating a plurality of first learning data including a plurality of first user queries and a plurality of first product attributes associated with the plurality of first user queries; and
learning a statistically-based classification model to calculate relevance scores for one or more product attributes corresponding to a second user query based on the plurality of first learning data ;
The step of learning the statistically-based classification model includes:
dividing the plurality of first user queries into units of morphemes;
dividing the plurality of first user queries into units of syllables;
learning a first statistical-based classification model to calculate relevance scores of one or more product attributes corresponding to user queries based on the plurality of first user queries divided into morpheme units; as well as,
learning a second statistically-based classification model to calculate relevance scores of one or more product attributes corresponding to the user queries based on the plurality of first user queries divided into syllable units; include,
How to learn product attribute extraction for shopping search.
前記複数の第1のユーザクエリと関連する統合検索クリック情報、ショッピングクリック情報又は商品データベースの少なくとも一つから前記複数の第1の商品属性を抽出するステップを含む、請求項9に記載のショッピング検索のための商品属性抽出の学習方法。 The step of generating the plurality of first learning data includes:
10. The shopping search of claim 9 , comprising extracting the plurality of first product attributes from at least one of federated search click information, shopping click information, or a product database associated with the plurality of first user queries. How to learn product attribute extraction for
前記複数の第1の商品属性を両義的商品属性に対応できる複数の第1の商品属性コードに変換するステップを含む、請求項9又は10に記載のショッピング検索のための商品属性抽出の学習方法。 The step of generating the plurality of first learning data includes:
11. The learning method for product attribute extraction for shopping search according to claim 9 or 10 , comprising the step of converting said plurality of first product attributes into a plurality of first product attribute codes that can correspond to ambiguous product attributes. .
前記複数の第1のユーザクエリを形態素の単位に分割するステップ;及び、
前記形態素の単位に分割された前記複数の第1のユーザクエリに基づき、ユーザクエリに対応する一つ以上の商品属性の関連点数を算出するように前記統計基盤分類モデルを学習するステップを含む、請求項9乃至11の何れか一項に記載のショッピング検索のための商品属性抽出の学習方法。 The step of learning the statistically-based classification model includes:
dividing the plurality of first user queries into units of morphemes; and
Based on the plurality of first user queries divided into units of the morpheme, learning the statistical-based classification model to calculate the relevance score of one or more product attributes corresponding to the user query; The learning method for product attribute extraction for shopping search according to any one of claims 9 to 11 .
前記複数の第1のユーザクエリを音節の単位に分割するステップ;及び、
前記音節の単位に分割された前記複数の第1のユーザクエリに基づき、ユーザクエリに対応する一つ以上の商品属性の関連点数を算出するように前記統計基盤分類モデルを学習するステップを含む、請求項9乃至11の何れか一項に記載のショッピング検索のための商品属性抽出の学習方法。 The step of learning the statistically-based classification model includes:
dividing the plurality of first user queries into units of syllables; and
Based on the plurality of first user queries divided into syllable units, learning the statistically-based classification model to calculate the relevance score of one or more product attributes corresponding to the user query; The learning method for product attribute extraction for shopping search according to any one of claims 9 to 11 .
ユーザクエリを受信する通信モジュール;
メモリ;及び、
前記メモリと連結し、前記メモリに含まれたコンピュータ読み取り可能な命令を実行するように構成された少なくとも一つのプロセッサを含み、
前記少なくとも一つのプロセッサは、
商品データベースから前記ユーザクエリに対する商品検索結果を抽出し、統計基盤分類モデルを用いて、前記ユーザクエリ及び複数の商品属性の関連点数を算出し、前記算出された関連点数に基づいて前記商品検索結果による商品検索順位を調整し、
前記統計基盤分類モデルにより、前記ユーザクエリ及び前記複数の商品属性の関連点数の算出は、
前記ユーザクエリを音節及び形態素の単位に分割し、
第1の統計基盤分類モデルにより、前記音節の単位に分割された前記ユーザクエリが前記複数の商品属性と関連する第1の確率を算出し、
第2の統計基盤分類モデルにより、前記形態素の単位に分割された前記ユーザクエリが前記複数の商品属性と関連する第2の確率を算出し、
前記第1の確率及び前記第2の確率に基づいて、前記複数の商品属性の関連点数として算出することにより行われる、
ショッピング検索のための商品属性抽出システム。 In the product attribute extraction system for shopping search,
a communication module for receiving user queries;
memory; and
at least one processor coupled to the memory and configured to execute computer readable instructions contained in the memory;
The at least one processor
Extracting product search results for the user query from a product database, calculating the relation scores of the user query and a plurality of product attributes using a statistically-based classification model, and calculating the product search results based on the calculated relation scores Adjust the product search ranking by
According to the statistical-based classification model, calculating the user query and the related scores of the plurality of product attributes includes:
dividing the user query into units of syllables and morphemes;
calculating a first probability that the user query divided into syllables is associated with the plurality of product attributes by a first statistically based classification model;
calculating a second probability that the user query divided into morpheme units is associated with the plurality of product attributes by a second statistically-based classification model;
Based on the first probability and the second probability, by calculating as the related score of the plurality of product attributes,
Product attribute extraction system for shopping search.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200055675A KR102400995B1 (en) | 2020-05-11 | 2020-05-11 | Method and system for extracting product attribute for shopping search |
KR10-2020-0055675 | 2020-05-11 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021179979A JP2021179979A (en) | 2021-11-18 |
JP7150090B2 true JP7150090B2 (en) | 2022-10-07 |
Family
ID=78510322
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021075589A Active JP7150090B2 (en) | 2020-05-11 | 2021-04-28 | Product Attribute Extraction Method for Shopping Search |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7150090B2 (en) |
KR (1) | KR102400995B1 (en) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111737559B (en) * | 2020-05-29 | 2024-05-31 | 北京百度网讯科技有限公司 | Resource ordering method, method for training ordering model and corresponding device |
US20230316387A1 (en) * | 2022-03-29 | 2023-10-05 | Donde Fashion, Inc. | Systems and methods for providing product data on mobile user interfaces |
CN114706841B (en) * | 2022-04-18 | 2024-10-08 | 上海喜马拉雅科技有限公司 | Query content library construction method and device, electronic equipment and readable storage medium |
CN115563510B (en) * | 2022-12-01 | 2023-04-07 | 北京搜狐新动力信息技术有限公司 | Training method of click rate estimation model and related device |
KR102535399B1 (en) * | 2023-02-21 | 2023-05-30 | 주식회사 그린랩스 | Server, method and program for providing seller and buyer matching service based on agricultural product attribute data |
KR102590569B1 (en) * | 2023-05-12 | 2023-10-19 | 주식회사 어베어 | Apparatus and method for deriving product name based on commerce characteristic |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018156429A (en) | 2017-03-17 | 2018-10-04 | ヤフー株式会社 | Information processing device, information processing method, and program |
JP2020042402A (en) | 2018-09-07 | 2020-03-19 | Zホールディングス株式会社 | Information processing apparatus, learning device, information processing method, generation method and program |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101110030B1 (en) * | 2009-11-30 | 2012-02-29 | 전남대학교산학협력단 | System and method for providing recommended words using context in a mobile communication terminal |
KR101873873B1 (en) * | 2018-03-12 | 2018-07-03 | 미디어젠(주) | Multimedia content search device through attribute information analysis and Method |
KR102544781B1 (en) * | 2018-08-08 | 2023-06-19 | 삼성전자주식회사 | Method for providing information on merchandise based on priority and electronic device thereof |
-
2020
- 2020-05-11 KR KR1020200055675A patent/KR102400995B1/en active IP Right Grant
-
2021
- 2021-04-28 JP JP2021075589A patent/JP7150090B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018156429A (en) | 2017-03-17 | 2018-10-04 | ヤフー株式会社 | Information processing device, information processing method, and program |
JP2020042402A (en) | 2018-09-07 | 2020-03-19 | Zホールディングス株式会社 | Information processing apparatus, learning device, information processing method, generation method and program |
Also Published As
Publication number | Publication date |
---|---|
KR102400995B1 (en) | 2022-05-24 |
JP2021179979A (en) | 2021-11-18 |
KR20210137643A (en) | 2021-11-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7150090B2 (en) | Product Attribute Extraction Method for Shopping Search | |
CN109844767B (en) | Visual search based on image analysis and prediction | |
JP6446602B2 (en) | Method and system for categorizing data | |
US11100170B2 (en) | Domain-agnostic structured search query exploration | |
KR102354716B1 (en) | Context-sensitive search using a deep learning model | |
JP6745384B2 (en) | Method and apparatus for pushing information | |
US11301540B1 (en) | Refined search query results through external content aggregation and application | |
JP2022505237A (en) | Techniques for ranking content item recommendations | |
US9727906B1 (en) | Generating item clusters based on aggregated search history data | |
JP7108740B2 (en) | Product Category Extraction Method for Shopping Search | |
US20160078101A1 (en) | Enhanced search query suggestions | |
WO2018035110A1 (en) | Search of publication corpus with multiple algorithms | |
US9767417B1 (en) | Category predictions for user behavior | |
US9767204B1 (en) | Category predictions identifying a search frequency | |
US11210341B1 (en) | Weighted behavioral signal association graphing for search engines | |
US10474670B1 (en) | Category predictions with browse node probabilities | |
KR20180000166A (en) | System and method for providing interest contents | |
KR102649675B1 (en) | Method and system for providing information using full-text index integrated graph data structure and vector data | |
JP7012803B2 (en) | Soaring search term provision method and system | |
US10387934B1 (en) | Method medium and system for category prediction for a changed shopping mission | |
JP2023162154A (en) | Method, computer device and computer program for providing recommendation information based on local knowledge graph | |
CN107784061B (en) | Method and system for determining image-based content style and machine-readable medium | |
KR102611482B1 (en) | Method and system for providing marketing strategy model based on big data | |
US11709844B2 (en) | Computerized smart inventory search methods and systems using classification and tagging | |
WO2023225919A1 (en) | Visual search method and device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210428 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220420 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220510 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220810 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220906 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220927 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7150090 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |