JP2022173084A - 埋め込み類似度に基づく商品検索方法、コンピュータ装置、およびコンピュータプログラム - Google Patents
埋め込み類似度に基づく商品検索方法、コンピュータ装置、およびコンピュータプログラム Download PDFInfo
- Publication number
- JP2022173084A JP2022173084A JP2022066748A JP2022066748A JP2022173084A JP 2022173084 A JP2022173084 A JP 2022173084A JP 2022066748 A JP2022066748 A JP 2022066748A JP 2022066748 A JP2022066748 A JP 2022066748A JP 2022173084 A JP2022173084 A JP 2022173084A
- Authority
- JP
- Japan
- Prior art keywords
- product
- query
- search
- embedded
- products
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 64
- 238000004590 computer program Methods 0.000 title claims abstract description 10
- 238000012552 review Methods 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 5
- 238000013139 quantization Methods 0.000 claims description 3
- 239000000047 product Substances 0.000 description 225
- 230000008569 process Effects 0.000 description 20
- 238000010586 diagram Methods 0.000 description 15
- 238000004891 communication Methods 0.000 description 13
- 238000012545 processing Methods 0.000 description 10
- 239000000284 extract Substances 0.000 description 6
- 239000013598 vector Substances 0.000 description 5
- 239000012535 impurity Substances 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013442 quality metrics Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0623—Item investigation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24578—Query processing with adaptation to user needs using ranking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Finance (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Strategic Management (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
310:モデル学習部
320:モデルチューニング部
330:商品検索部
Claims (15)
- コンピュータ装置で実行される商品検索方法であって、
前記コンピュータ装置は、メモリに含まれるコンピュータ読み取り可能な命令を実行するように構成された少なくとも1つのプロセッサを含み、
当該商品検索方法は、
前記少なくとも1つのプロセッサにより、商品検索サービス上に出現するテキストを利用して、クエリと商品との埋め込みマッチングに基づいて商品を検索する埋め込み基盤の検索モデルを生成する段階、および
前記少なくとも1つのプロセッサにより、入力クエリに対して前記埋め込み基盤の検索モデルを利用して、前記入力クエリの埋め込みとマッチングする商品検索結果を提供する段階を含む、
商品検索方法。 - 前記商品検索結果を提供する段階は、
前記埋め込み基盤の検索モデルとともにクエリと商品のタームマッチングに基づいて商品を検索するタームマッチング検索モデルを連動して、埋め込みマッチング商品とタームマッチング商品を前記商品検索結果として提供することを特徴とする、
請求項1に記載の商品検索方法。 - 前記埋め込み基盤の検索モデルを生成する段階は、
商品情報を維持する商品データベースとユーザが登録した商品レビューやクエリのテキストで構成されたショッピングコーパスおよびショッピングドメインで出力するテキストで構成されたショッピング語彙辞書うちの少なくとも1つからテキストを抽出して前記埋め込み基盤の検索モデルを生成するための学習データとして利用するが、数値型フィールドの場合にはテキストに変換して前記学習データとして利用する段階を含む、
請求項1または2に記載の商品検索方法。 - 前記埋め込み基盤の検索モデルを生成する段階は、
クエリと商品との間のクリックログに基づいて関連度によるクエリ-商品ペアデータをファインチューニングデータとして生成する段階、および
前記ファインチューニングデータを利用して前記埋め込み基盤の検索モデルを追加学習する段階を含む、
請求項3に記載の商品検索方法。 - 前記ファインチューニングデータとして生成する段階は、
クエリと商品との関連度に対応するラベルを前記クエリ-商品ペアデータに付与する段階を含む、
請求項4に記載の商品検索方法。 - 前記ファインチューニングデータとして生成する段階は、
クエリと商品との関連度を示す指標に基づいて前記クエリ-商品ペアデータの重要度を差等適用する段階を含む、
請求項4に記載の商品検索方法。 - 前記ファインチューニングデータとして生成する段階は、
クエリに対するクリック商品と類似の商品のうちでクエリのタームとマッチングしない商品をネガティブサンプリングして、クエリと商品とに対して関連度が低いクエリ-商品ペアデータとして生成する段階を含む、
請求項4に記載の商品検索方法。 - 前記商品検索結果を提供する段階は、
商品埋め込み集合によって学習されたクラスタセントロイドから商品の埋め込みに対応するセントロイドとして商品を索引する段階、および
索引された商品のうち、前記入力クエリの埋め込みに対応するセントロイドと同じセントロイドの商品を検索する段階を含む、
請求項1に記載の商品検索方法。 - 前記商品検索結果を提供する段階は、
商品埋め込み集合によって学習された製品量子化(PQ)コードブックを利用して、前記入力クエリの埋め込みに対応するPQコードと同じPQコードの商品を検索する段階をさらに含む、
請求項8に記載の商品検索方法。 - 前記商品を検索する段階は、
前記入力クエリの埋め込みに対応するセントロイドの品質によって、前記商品検索結果から前記埋め込み基盤の検索モデルによる埋め込みマッチング商品を除外させる段階を含む、
請求項8に記載の商品検索方法。 - 前記商品検索結果を提供する段階は、
前記埋め込み基盤の検索モデルによる埋め込みマッチング商品の加重値と前記タームマッチング検索モデルによるタームマッチング商品の加重値とを前記入力クエリによって適応的に設定する段階を含む、
請求項2に記載の商品検索方法。 - 前記商品検索結果を提供する段階は、
前記埋め込み基盤の検索モデルによる前記入力クエリとの埋め込み類似度と前記タームマッチング検索モデルによる前記入力クエリとのターム類似度とを利用して、前記商品検索結果に対するランキングを提供する段階を含み、
前記商品検索結果に対するランキングを提供する段階は、
前記埋め込み類似度の加重値と前記ターム類似度の加重値とを前記入力クエリによって適応的に設定する段階を含む、
請求項2に記載の商品検索方法。 - 請求項1~12のうちのいずれか一項に記載の商品検索方法をコンピュータ装置に実行させるためのコンピュータプログラム。
- コンピュータ装置であって、
メモリに含まれるコンピュータ読み取り可能な命令を実行するように構成された少なくとも1つのプロセッサを含み、
前記少なくとも1つのプロセッサは、
商品検索サービス上に出現するテキストを利用して、クエリと商品との埋め込みマッチングに基づいて商品を検索する埋め込み基盤の検索モデルを生成し、
入力クエリに対して前記埋め込み基盤の検索モデルを利用して、前記入力クエリの埋め込みとマッチングする商品検索結果を提供することを特徴とする、
コンピュータ装置。 - 前記少なくとも1つのプロセッサは、
前記埋め込み基盤の検索モデルとともにクエリと商品のタームマッチングに基づいて商品を検索するタームマッチング検索モデルを連動して、埋め込みマッチング商品とタームマッチング商品とを前記商品検索結果として提供することを特徴とする、
請求項14に記載のコンピュータ装置。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2021-0058633 | 2021-05-06 | ||
KR20210058633 | 2021-05-06 | ||
KR10-2021-0087850 | 2021-07-05 | ||
KR1020210087850A KR102640369B1 (ko) | 2021-05-06 | 2021-07-05 | 임베딩 유사도에 기반한 상품 검색 방법, 컴퓨터 장치, 및 컴퓨터 프로그램 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022173084A true JP2022173084A (ja) | 2022-11-17 |
JP7343649B2 JP7343649B2 (ja) | 2023-09-12 |
Family
ID=84041759
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022066748A Active JP7343649B2 (ja) | 2021-05-06 | 2022-04-14 | 埋め込み類似度に基づく商品検索方法、コンピュータ装置、およびコンピュータプログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7343649B2 (ja) |
KR (1) | KR102640369B1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115544242A (zh) * | 2022-12-01 | 2022-12-30 | 深圳市智加云栖科技有限公司 | 基于大数据的同类商品选型推荐方法 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102593134B1 (ko) * | 2022-12-16 | 2023-10-24 | 고려대학교산학협력단 | 사용자 디바이스를 위한 임베딩 테이블 크기를 조절하는 방법 및 이를 위한 장치 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20180125746A (ko) * | 2017-05-16 | 2018-11-26 | 동아대학교 산학협력단 | 문장 임베딩 및 유사 질문 검색을 위한 장치 및 방법 |
CN111625619A (zh) * | 2019-02-28 | 2020-09-04 | 北京沃东天骏信息技术有限公司 | 查询省略方法、装置、计算机可读介质及电子设备 |
CN111737418A (zh) * | 2020-07-20 | 2020-10-02 | 北京每日优鲜电子商务有限公司 | 搜索词和商品的相关性预测方法、设备和存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101958729B1 (ko) * | 2017-04-06 | 2019-03-18 | 네이버 주식회사 | 주제별 질의의 서브토픽 자동 추출 및 구조화 |
KR102099561B1 (ko) * | 2019-04-25 | 2020-04-09 | 김진성 | 기계학습 기반 고도화된 매칭 알고리즘을 포함한 섬유제품 검색 서비스 제공 시스템 |
-
2021
- 2021-07-05 KR KR1020210087850A patent/KR102640369B1/ko active IP Right Grant
-
2022
- 2022-04-14 JP JP2022066748A patent/JP7343649B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20180125746A (ko) * | 2017-05-16 | 2018-11-26 | 동아대학교 산학협력단 | 문장 임베딩 및 유사 질문 검색을 위한 장치 및 방법 |
CN111625619A (zh) * | 2019-02-28 | 2020-09-04 | 北京沃东天骏信息技术有限公司 | 查询省略方法、装置、计算机可读介质及电子设备 |
CN111737418A (zh) * | 2020-07-20 | 2020-10-02 | 北京每日优鲜电子商务有限公司 | 搜索词和商品的相关性预测方法、设备和存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115544242A (zh) * | 2022-12-01 | 2022-12-30 | 深圳市智加云栖科技有限公司 | 基于大数据的同类商品选型推荐方法 |
CN115544242B (zh) * | 2022-12-01 | 2023-04-18 | 深圳市智加云栖科技有限公司 | 基于大数据的同类商品选型推荐方法 |
Also Published As
Publication number | Publication date |
---|---|
KR20220151521A (ko) | 2022-11-15 |
JP7343649B2 (ja) | 2023-09-12 |
KR102640369B1 (ko) | 2024-02-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107832414B (zh) | 用于推送信息的方法和装置 | |
US20200073953A1 (en) | Ranking Entity Based Search Results Using User Clusters | |
US11182433B1 (en) | Neural network-based semantic information retrieval | |
KR101754473B1 (ko) | 문서를 이미지 기반 컨텐츠로 요약하여 제공하는 방법 및 시스템 | |
US20200110842A1 (en) | Techniques to process search queries and perform contextual searches | |
US10606910B2 (en) | Ranking search results using machine learning based models | |
JP7343649B2 (ja) | 埋め込み類似度に基づく商品検索方法、コンピュータ装置、およびコンピュータプログラム | |
KR102569760B1 (ko) | 온라인 게이밍을 위한 사용자 입력 텍스트의 언어 감지 | |
US20230086966A1 (en) | Search systems and methods utilizing search based user clustering | |
JP7150090B2 (ja) | ショッピング検索のための商品属性抽出方法 | |
Heller et al. | Towards explainable interactive multi-modal video retrieval with vitrivr | |
WO2021196541A1 (zh) | 用于搜索内容的方法、装置、设备和计算机可读存储介质 | |
US11514054B1 (en) | Supervised graph partitioning for record matching | |
KR20140109729A (ko) | 의미기반 검색 시스템 및 이의 검색방법 | |
KR20190031536A (ko) | 어플리케이션 정보 트리거링 | |
Dwivedi et al. | Survey on fake news detection techniques | |
CN114490923A (zh) | 相似文本匹配模型的训练方法、装置、设备及存储介质 | |
JP2021179980A (ja) | ショッピング検索のための商品カテゴリ抽出方法 | |
Charalampous et al. | Classifying document types to enhance search and recommendations in digital libraries | |
JP2023162154A (ja) | 地域知識グラフに基づいて推薦情報を提供する方法、コンピュータ装置、およびコンピュータプログラム | |
US20230046851A1 (en) | Multi-model approach to natural language processing and recommendation generation | |
Dutta et al. | Automated Data Harmonization (ADH) using Artificial Intelligence (AI) | |
US11379669B2 (en) | Identifying ambiguity in semantic resources | |
US11709844B2 (en) | Computerized smart inventory search methods and systems using classification and tagging | |
JP2023164347A (ja) | 関連商品を推薦するための方法、コンピュータ装置、およびコンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220414 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230214 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230425 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230801 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230831 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7343649 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |